3SAS过程及常用统计分析2

上传人:仙*** 文档编号:54779305 上传时间:2022-02-15 格式:PPT 页数:34 大小:1.55MB
返回 下载 相关 举报
3SAS过程及常用统计分析2_第1页
第1页 / 共34页
3SAS过程及常用统计分析2_第2页
第2页 / 共34页
3SAS过程及常用统计分析2_第3页
第3页 / 共34页
点击查看更多>>
资源描述
3.3 简单描述统计分析简单描述统计分析3.3.1简单描述统计量的基本概念简单描述统计量的基本概念总体(总体(Population):一个统计问题所研究对:一个统计问题所研究对象的全体。象的全体。样体(样体(Sample):从总体中抽取一定数量的:从总体中抽取一定数量的个体进行研究,这部分个体称做样本。个体进行研究,这部分个体称做样本。随机抽样随机抽样(Random Sample):从总体中随机:从总体中随机抽取样本,使每个个体都有同等的机会进抽取样本,使每个个体都有同等的机会进入样本的抽样方法称为随机抽样。入样本的抽样方法称为随机抽样。( 样本推样本推断总体断总体)N:样本数量。统计学中,样本数量。统计学中,N30称为大样本。称为大样本。均值(均值(MEAN)中位数(中位数(Median)众数(众数(Mode)分位数(分位数(Quantiles):是对分布的详细研究,包:是对分布的详细研究,包括百分位数、四分位数及中值。括百分位数、四分位数及中值。Max & Min定位测量定位测量全距(全距(Range):样本中最大值和最小值之差:样本中最大值和最小值之差标准差(标准差(std dev):测量值对于均值的离散程度:测量值对于均值的离散程度方差(方差(var)均值标准误(均值标准误(STDERR)变异系数(变异系数(CV)自由度(自由度(df)离散程度测量离散程度测量偏度(偏度(SKewness):描述测量量是否对称地分布:描述测量量是否对称地分布在中心的两侧。正(右)偏态,在中心的两侧。正(右)偏态,SK0;负(左)负(左)偏态偏态SK0峰度(峰度(kurtosis):反映单峰分布,:反映单峰分布,K作为偏离正作为偏离正态分布的尺度;态分布的尺度;K=0正态分布正态分布.注意:一般用于大样本。注意:一般用于大样本。置信区间(置信区间(LCL,UCL)相关系数(相关系数(correlation):):r形状测量形状测量3.3.2 MEANS 过程过程 输出结果中统计量的命名方法:输出结果中统计量的命名方法:MEAN=X1-X3;MEAN=MEANX1 MEANX2 MEANX3;MEAN(X2)=MEANX2;说明:关键词后的变量名在输出文件中代说明:关键词后的变量名在输出文件中代表表VAR变量的统计量值,所以他们与变变量的统计量值,所以他们与变量的顺序是一一对应的。量的顺序是一一对应的。Data new;Data new; * *建立数据集建立数据集 Input y;Input y; * *输入变量,变量名为输入变量,变量名为y yCards;Cards; * *数据块开始数据块开始数据块数据块; * *数据块结束数据块结束Proc means n mean std var cv;Proc means n mean std var cv; * *调用调用meansmeans过程并过程并计算相应的统计数计算相应的统计数Var y;Var y; * *对变量对变量y y进行分析进行分析Run;Run; * *程序运行程序运行3.3.3 UNIVARIATE 过程过程1. UNIVARIATE过程简介过程简介 UNIVARIATE过程除了可以完成与过程除了可以完成与MEANS过程相过程相同的基本统计量外,还可以计算变量的极端值、同的基本统计量外,还可以计算变量的极端值、分位数,生成频率表,并支持对数据进行正态分位数,生成频率表,并支持对数据进行正态性检验。性检验。UNIVARIATE与与MEANS过程不同的功能包括:过程不同的功能包括:描述变量极端值的情况。描述变量极端值的情况。计算分位数,如中位数,计算分位数,如中位数,1/4和和3/4分位数。分位数。生成若干个描述变量分布的图。生成若干个描述变量分布的图。生成频率表。生成频率表。对数据进行正态性检验。对数据进行正态性检验。Proc univariate语句的选项语句的选项 NOPRINT 禁止统计报告在禁止统计报告在OUTPUT视窗中输出视窗中输出 PLOT 绘出茎叶图、箱式图和正态概率图绘出茎叶图、箱式图和正态概率图 FREQ 产生频数和累积频数分布表产生频数和累积频数分布表 NORMAL 对变量进行正态性检验对变量进行正态性检验 SASSAS中用关键字来指定所需要的统计量,事实中用关键字来指定所需要的统计量,事实上结果输出中用的就是各种关键字,常用上结果输出中用的就是各种关键字,常用的关键字有:的关键字有: 基本统计量基本统计量 N MEAN STD(N MEAN STD(标准误标准误) CV SUM VAR() CV SUM VAR(方方差差) RANGE ) RANGE 百分位数描述百分位数描述 MIN P1 P5 P10 Q1 MEDIAN Q3 P90 MIN P1 P5 P10 Q1 MEDIAN Q3 P90 P95 P99 MAX P95 P99 MAX 与假设检验有关的统计量与假设检验有关的统计量 STDERR(STDERR(标准误标准误) T ) T (实例讲解)(实例讲解)例例 已知患者中钙、磷和葡萄糖含量,存于已知患者中钙、磷和葡萄糖含量,存于blood.txtblood.txt中,试用中,试用UNIVERIATEUNIVERIATE过程对其中血磷进行统计描述。过程对其中血磷进行统计描述。程序:程序:LibnameLibname chap3 d:mysaschap3; chap3 d:mysaschap3;data chap3.blood;data chap3.blood; infileinfile : :sasdtsasdtblood.txt;blood.txt; input number calcium input number calcium phosphrsphosphrs glucose ; glucose ;PROC UNIVARIATE DATA=chap3.BLOOD PLOT PROC UNIVARIATE DATA=chap3.BLOOD PLOT NORMAL FREQ;NORMAL FREQ;VAR PHOSPHRS;VAR PHOSPHRS;RUN;RUN;结果:结果:结果:结果:结果:结果:3.3.4 FREQ 过程过程 (频数过程)(频数过程)例例 下数据为进行两因素两水平试验所得,每次测得活细胞数下数据为进行两因素两水平试验所得,每次测得活细胞数目为目为numbernumber。试生成列联表。试生成列联表。程序:程序:data freq3_2;data freq3_2; input x y number ; input x y number ;cards;cards; 1 1 12 1 2 15 1 1 12 1 2 15 2 1 9 2 2 12 2 1 9 2 2 12 ; ;proc freq data=freq3_2;proc freq data=freq3_2; weight number; weight number; tables x tables x* *y; y;run;run;5. WEIGHT语句语句统计计算中我们统称假设每条观测记录对频统计计算中我们统称假设每条观测记录对频数计算的贡献为数计算的贡献为 1,使用,使用WEIGHT语句可语句可以定义每个观测值出现的频数为这个观测以定义每个观测值出现的频数为这个观测对应的权重(权重不能为负)。对应的权重(权重不能为负)。6. BY语句语句对由对由BY变量定义的几组观测分别进行分析。变量定义的几组观测分别进行分析。但要求先按但要求先按BY变量排序。变量排序。频数表的编制(习题)频数表的编制(习题)FREQ过程步例 某地随机抽取正常成年男子120名,其红细胞数如下,试作该批样本的频数表。5.12 5.13 4.58 4.31 4.09 4.41 4.33 4.58 4.24 5.45 4.32 4.844.91 5.14 5.25 4.89 4.79 4.90 5.09 4.04 5.14 5.46 4.66 4.204.21 3.73 5.17 5.79 5.46 4.49 4.85 5.28 4.78 4.32 4.94 5.214.68 5.09 4.68 4.91 5.13 5.26 3.84 4.17 4.56 3.52 6.00 4.054.92 4.87 4.28 4.46 5.03 5.69 5.25 4.56 5.53 4.58 4.86 4.974.70 4.28 4.37 5.33 4.78 4.75 5.39 5.27 4.89 6.18 4.13 5.224.44 4.13 4.43 4.02 5.86 5.12 5.36 3.86 4.68 5.48 5.31 4.534.83 4.11 3.29 4.18 4.13 4.06 3.42 4.68 4.52 5.19 3.70 5.514.64 4.92 4.93 4.90 3.92 5.04 4.70 4.54 3.95 4.40 4.31 3.774.16 4.58 5.35 3.71 5.27 4.52 5.21 4.37 4.80 4.75 3.86 5.69u已知均值比较的已知均值比较的t检验检验例例1 药厂制剂车间用自动装瓶机封装药液,在装瓶药厂制剂车间用自动装瓶机封装药液,在装瓶机正常工作时,每瓶药液净重机正常工作时,每瓶药液净重500克。某日随机克。某日随机抽取了抽取了10瓶成品,称重为:瓶成品,称重为:504,498,487,496,509,476,482,510,469,472.问此时装瓶机工问此时装瓶机工作是否正常?作是否正常?MEANS过程执行过程执行t检验检验u配对比较的配对比较的t检验检验例例2 研究食物中维生素研究食物中维生素E与肝脏中维生素与肝脏中维生素A含量的关含量的关系。将大白鼠按性别、体重配对。每对随机分配,系。将大白鼠按性别、体重配对。每对随机分配,一个正常饲料,一个用缺乏维生素一个正常饲料,一个用缺乏维生素E的饲料。经的饲料。经过一个时期饲养,杀死动物测定肝中维生素过一个时期饲养,杀死动物测定肝中维生素A的的含量,结果下表。试分析含量,结果下表。试分析MEANS过程执行过程执行t检验检验大白鼠肝脏中维生素大白鼠肝脏中维生素A A含量含量配对号配对号1 12 23 34 45 56 67 78 8正常饲料正常饲料3550355020002000300030003950395038003800375037503450345030503050缺乏缺乏E E饲料饲料2450245024002400180018003200320032503250270027002500250017501750使用带有下列语句的使用带有下列语句的proc chart过程来绘制各种图表过程来绘制各种图表(1)垂直条形图()垂直条形图(Vbar语句);语句);(2)水平条形图()水平条形图(Hbar语句);语句);(3)立体直方图()立体直方图(Block语句);语句);(4)饼图()饼图(pie语句);语句);(5)星图()星图(star语句)语句)补:补:CHART过程过程 例:职工基本情况表例:职工基本情况表姓名姓名 性别性别 职称职称 年龄年龄 姓名姓名 性别性别 职称职称 年龄年龄Zhouli M P 50 Liping F AP 47 Wangfang F L 8 Yuhong F AP 40 Liulijun M L 30 Leiming M AP 32 Liuming M AP 36Yuke F AP 48Liuling M L 37Zhulin M P 44Liqing F AP 42 Wangfang F L 25Fangjin M L 26试绘制上表按照性别的图表试绘制上表按照性别的图表程序:程序:DATA employee;INPUT name $ sex $ title $ age ;DATALINES;Zhouli M P 50 Yuke F AP 48 Liping F AP 47 Liuling M L 37 Wangfang F L 28 Zhulin M P 44Yuhong F AP 40 Liqing F AP 42 Liulijun M L 30Wangfang F L 25 Leiming M AP 32 Fangjin M L 26Liuming M AP 36;options ps=30 ls=80;PROC CHART DATA=employee;VBAR sex;HBAR sex;VBAR sex/group title;RUN;结果:结果:
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 压缩资料 > 基础医学


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!