资源描述
,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,实验七,身高、体重与体育成绩,统计推断,第1页,第1页,引例:学生身高、体重与体育成绩,既有某高中高三学生中随机抽取100名男生身高、体重与体育成绩,(1)给出这些数据直观图形描述,(2)依据这些数据对全小学生平均身高和体重进行预计,(3)若普通中学同龄男生平均身高为168.3,cm,,平均体重为56.2,kg,,能否认为该中学男生身高和普通中学相比有明显区别?,(4)身高和体重对体育成绩有何影响?,第2页,第2页,数理统计基本概念,总体和样本,统计量,样本均值,样本中位数,样本方差,样本协方差,抽样分布及分位数,原则正态分布,t,分布,F,分布,2,分布,第3页,第3页,MATLAB,统计分析工具箱,正态分布,y=normpdf(x,mu,sigma):,返回参数为,mu,和,sigma,正态分布密度函数在,x,处值,p=normcdf(x,mu,sigma):,正态分布函数值,x=norminv(p,mu,sigma):,生成参数为,mu,和,sigma,正态分布,p,分位数,t,分布,,,2,分布,,,F,分布,x=tinv(p,n):,自由度为,n,t,分布,p,分位数,x=chi2inv(p,n):,自由度为,n,2,分布,p,分位数,x=finv(p,m,n):,自由度为,m,n,F,分布,p,分位数,第4页,第4页,统计推断办法,参数预计(依据样本对总体分布中参数,进行预计),点预计,:,直接给出参数,预计值,区间预计,:,给出参数,预计值区间,并附加一个概率(即每个区间置信度),置信区间,:,设总体分布中含有参数,,,若有区间,I,使得,位于,I,中概率为,1-,,,则称,I,为,1-,置信区间,第5页,第5页,对于均值,和原则差,均未知正态总体,,,能够用下面命令进行两个参量点预计,muhat,sigmahat,muci,sigmaci=normfit(x,alpha),其中,:,x,样本数据,,,alpha,置信度,,,muhat,点预计,,,sigmahat,点预计,,,muci,置信区间,,,sigmaci,置信区间,第6页,第6页,假设检查,零假设(原假设)备择假设(对立假设),明显性检查,单边检查,双边检查,已知原则差,正态总体均值检查:,z,办法,h,sig=ztest(x,m,sigma,alpha,tail),其中:,x,样本列向量,,m,0,,sigma,tail,值为0表示双边检查,值为1表示右边检查,值为-1表示左边检查,alpha,明显性水平(缺省为0.5),h,返回为1表示回绝原假设,返回0表示接受,sig,返回临界值回绝概率,,sigalpha,时,h=1,第7页,第7页,例:百分比检查,某外商称他所提供某种零件至少有95%是符合原则。现测试200台这种设备,发觉有15台是不符合规范。在明显性水平,=0.05,下,能否相信外商话?,第8页,第8页,线性回归,多元线性回归模型,y=b,1,x,1,+b,n,x,n,+,,,其中,服从,N(0,2,),分布,为回归系数构成向量,任务1:,对观测到,y,和,x,值求回归系数,任务2:判断模型有效性,regress,命令,b,bint,r,rint,stats=regress(y,x,alpha),Yy,数据向量,xx,数据矩阵,b,预计值,bint,置信区间,r,残差,rint,置信区间,stats1,3,检查统计量,第一个值为回归方程置信度,第二个值为,F,统计量值,第三个值是与,F,统计量相应,p,值,,p,值很小阐明回归方程系数不为0,使用,rcoplot(r,rint),能够作出残差图,第9页,第9页,试验例题,学生身高、体重与体育成绩分析,第10页,第10页,
展开阅读全文