应用统计复习课件

上传人:无*** 文档编号:241328324 上传时间:2024-06-18 格式:PPT 页数:71 大小:622.50KB
返回 下载 相关 举报
应用统计复习课件_第1页
第1页 / 共71页
应用统计复习课件_第2页
第2页 / 共71页
应用统计复习课件_第3页
第3页 / 共71页
点击查看更多>>
资源描述
1 1应应用用统统计计复复习习第一章第一章 数据与统计学数据与统计学统计学的产生和发展统计数据的来源统计数据的质量统计学的基本概念2 2应应用用统统计计复复习习统计调查的方式统计调查的方式全面调查全面调查全面调查全面调查非全面调查非全面调查非全面调查非全面调查抽样调查抽样调查典型调查典型调查重点调查重点调查普普 查查报表制度报表制度统计调查(主要用来取得社会经济数据)统计调查(主要用来取得社会经济数据)3 3应应用用统统计计复复习习统计数据的质量统计数据的质量数据误差数据误差抽样误差抽样误差非抽样误差非抽样误差回回答答误误差差无无回回答答误误差差汇汇总总误误差差调调查查员员误误差差4 4应应用用统统计计复复习习第二章第二章 统计数据的描述统计数据的描述数据的计量尺度统计数据的整理分布集中趋势的测度分布离散程度的测度分布偏态与峰度的测度统计表与统计图5 5应应用用统统计计复复习习第二章第二章 统计数据的描述统计数据的描述数据的计量尺度l列名尺度(nominal scale)l性别、民族l顺序尺度(ordinal scale)l产品等级、满意度 l间隔尺度(interval scale)l百分制成绩、温度、年龄l比例尺度(ratio scale)l产量、产值、利润 品质标志数量标志6 6应应用用统统计计复复习习第二章第二章 统计数据的描述统计数据的描述分布集中趋势的测度l众数l中位数l均值对分组数据进行计算的公式7 7应应用用统统计计复复习习样本方差和标准差样本方差和标准差(simple variance and standard deviation)未分组数据:组距分组数据:组距分组数据:未分组数据:未分组数据:组距分组数据:组距分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式8 8应应用用统统计计复复习习偏态是对分布偏斜方向及程度的测度。偏态是对分布偏斜方向及程度的测度。偏偏态态系系数数是是对对分分布布偏偏斜斜程程度度的的测测度度,其其计计算算公式为:公式为:式式中中:SK K表表示示偏偏态态系系数数,s3是是样样本本标标准准差差的的三次方三次方一、偏态及其测度9 9应应用用统统计计复复习习偏态系数的取值偏态系数的取值:SK0 右偏右偏|SK|越接近于越接近于0,偏斜程度越小,偏斜程度越小 0.5|SK|1 高度偏斜程度高度偏斜程度1010应应用用统统计计复复习习峰度系数是用离差四次方的平均数再除以标峰度系数是用离差四次方的平均数再除以标峰度系数是用离差四次方的平均数再除以标峰度系数是用离差四次方的平均数再除以标准差的四次方,其计算公式为准差的四次方,其计算公式为准差的四次方,其计算公式为准差的四次方,其计算公式为 式中:式中:s4是标准差的四次方是标准差的四次方1111应应用用统统计计复复习习峰度系数的取值:峰度系数的取值:正态分布时,峰度系数正态分布时,峰度系数K=0 K0时,为尖峰分布;时,为尖峰分布;K0时,为扁平分布时,为扁平分布1212应应用用统统计计复复习习某车间工人周加工零件折线图某车间工人周加工零件折线图某车间工人周加工零件折线图某车间工人周加工零件折线图 1313应应用用统统计计复复习习常用函数常用函数平均值 average(array)众数 mode(array)中位数 median(array)四分位数 quartile(array,n)n=01234几何平均数 geomean(array)切尾均值 trimmean(array,percent)偏态系数 skew(array)峰度系数 kurt(array)方差 (样本)var(array)标准差(样本)stdev(array)1414应应用用统统计计复复习习第三章第三章 概率分布与抽样分布概率分布与抽样分布概率分布常用抽样方法抽样分布中心极限定理的应用1515应应用用统统计计复复习习正态分布正态分布X XN(N(、2 2 ),其概率密度为:,其概率密度为:,其概率密度为:,其概率密度为:NORMDIST(X,0)NORMDIST(X,0)正态分布随机变量的均值和标准差正态分布随机变量的均值和标准差正态分布随机变量的均值和标准差正态分布随机变量的均值和标准差 均值均值均值均值 E(X)=E(X)=方差方差方差方差 D(X)=D(X)=2 2 -x x 1616应应用用统统计计复复习习正态分布曲线的主要特性正态分布曲线的主要特性关于关于关于关于x x=对称的钟形曲线对称的钟形曲线对称的钟形曲线对称的钟形曲线参数参数参数参数 决定正态曲线的中心位置决定正态曲线的中心位置决定正态曲线的中心位置决定正态曲线的中心位置参数参数参数参数 决定正态曲线的陡峭或扁平程度决定正态曲线的陡峭或扁平程度决定正态曲线的陡峭或扁平程度决定正态曲线的陡峭或扁平程度以以以以X X轴为渐近线,即当轴为渐近线,即当轴为渐近线,即当轴为渐近线,即当x x 时,时,时,时,f(xf(x)0 0相同而相同而不同的正态曲线不同的正态曲线 2 xf(x)相同而相同而不同的正态曲线不同的正态曲线f(x)较小较小较大较大 x1717应应用用统统计计复复习习标准正态分布标准正态分布 0 0、1 1的正态分布,记为的正态分布,记为的正态分布,记为的正态分布,记为N N(0,1)(0,1)其概率密度其概率密度其概率密度其概率密度(x(x)分布函数分布函数分布函数分布函数 (x x),),NORMSDIST(Z)X XN(N(、2 2),),则则则则 :Z ZN N(0(0,1 1 )若若若若 Z ZN N(0(0,1 1 ),则有:,则有:,则有:,则有:l l P P(|Z|a|Z|a)2(2(a a)1 1 l l(-a-a)=1)=1(a a)标准化标准化标准正态曲线标准正态曲线 -a 0 a(z)z z(a)1818应应用用统统计计复复习习正态分布正态分布常用的正态概率值常用的正态概率值(在一般正态分布及标准正态分布中)(在一般正态分布及标准正态分布中)-2.58 -1.96 -1.65 0 +1.65 +1.96+2.58 z -2.58 -1.96 -1.65 +1.65 +1.96 +2.58 x99%95%90%1919应应用用统统计计复复习习正态分布正态分布常用的正态概率值常用的正态概率值(在一般正态分布及标准正态分布中)(在一般正态分布及标准正态分布中)-3 -2 -1 0 +1 +2+3 z -3 -2 -+2 +3 x99.73%95.45%68.27%2020应应用用统统计计复复习习常用的抽样方法常用的抽样方法抽样调查是一种常用的统计技术,其目的在于用样本统计量推断我们所关心的总体参数。2121应应用用统统计计复复习习中心极限定理中心极限定理(central limit theorem)(central limit theorem)中心极限定理:中心极限定理:中心极限定理:中心极限定理:设从均值为设从均值为,方差为,方差为 2 2的一的一个个任意任意总体中抽取容量为总体中抽取容量为n n的样本,当的样本,当n n充分充分大时,样本均值的抽样分布近似服从均值为大时,样本均值的抽样分布近似服从均值为、方差为方差为 2 2/n n的正态分布的正态分布当样本容量足够大时(n 30),样本均值的抽样分布逐渐趋于正态分布一个任意分布的总体x x2222应应用用统统计计复复习习样本均值抽样分布的特征样本均值抽样分布的特征样本均值的数学期望样本均值的数学期望样本均值的数学期望样本均值的数学期望样本均值的方差样本均值的方差样本均值的方差样本均值的方差l l重复抽样重复抽样重复抽样重复抽样l l不重复抽样不重复抽样不重复抽样不重复抽样抽样平均误差抽样平均误差抽样标准误差抽样标准误差2323应应用用统统计计复复习习样本比例(率)抽样分布的特征样本比例(率)抽样分布的特征当样本容量很大时,样本比例的抽样分布可用正态当样本容量很大时,样本比例的抽样分布可用正态当样本容量很大时,样本比例的抽样分布可用正态当样本容量很大时,样本比例的抽样分布可用正态分布近似分布近似分布近似分布近似 样本比例的数学期望样本比例的数学期望样本比例的数学期望样本比例的数学期望样本比例的方差样本比例的方差样本比例的方差样本比例的方差l l重复抽样重复抽样重复抽样重复抽样l l不重复抽样不重复抽样不重复抽样不重复抽样2424应应用用统统计计复复习习第四章第四章 参数估计参数估计基本原理一个总体均值的区间估计一个总体比率的区间估计2525应应用用统统计计复复习习由样本统计量所构造的总体参数的区间估计,称为置信区间(confidence interval),其中区间的最小值称为置信下限,最大值称为置信上限。将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比率称为置信水平(confidence level),或称为置信系数(confidence coefficient)。一般将称为显著性水平,1-置信水平2626应应用用统统计计复复习习置信区间示意图置信区间示意图2727应应用用统统计计复复习习一个总体均值的区间估计一个总体均值的区间估计总体均值所在(1-a)置信水平下的置信区间为:za/2是标准正态分布上侧面积为/2时的z值。表5.3 常用置信水平的za/2值 99%95%0.05 置信水平 a a/2 za/21.645 90%0.100.05 0.01 0.025 1.96 0.005 2.58 允许误差2828应应用用统统计计复复习习不同情况总体均值的区间估计不同情况总体均值的区间估计 总体分布 样本容量 未知 大样本(n30)已知 正态分布小样本(n”或“0备择假设H1:0H0:03535应应用用统统计计复复习习两类错误与显著性水平两类错误与显著性水平两类错误与显著性水平当原假设为真时拒绝原假设,所犯的错误为第I类错误(type I error),又称为弃真错误。犯第I类错误的概率通常记为a。当原假设为假时没有拒绝原假设,所犯的错误称为第II类错误(type II error),又称为取伪错误。犯第II类错误的概率通常记为b。未拒绝H0实际情况决策结果H0为真正确决策第II类错误b正确决策第I类错误a 拒绝H0H0为假假设检验的结论与后果假设检验的结论与后果3636应应用用统统计计复复习习显著性水平、拒绝域和临界值显著性水平、拒绝域和临界值3737应应用用统统计计复复习习利用利用P值进行决策值进行决策如果原假设H0为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值(P-value),也称为观察到的显著性水平(observed significance level)。要测量出样本观测数据与原假设中假设的值0的偏离程度,则需要计算P值。如果仅根据显著性水平来检验假设,所有的可靠性都是一样的。3838应应用用统统计计复复习习显著性水平显著性水平如果事先确定了一个显著性水平a,也就意味着要求用于拒绝原假设H0的证据必须强到P值小于a的程度。l如果P值a,不拒绝H0传统的显著性水平,如1%、5%、10%等,已经被人们普遍接受为“拒绝原假设足够证据”的标准。lP0.10代表有“一些证据”不利于原假设;lP0.05代表有“适度证据”不利于原假设;lP0.01代表有“很强证据”不利于原假设。3939应应用用统统计计复复习习一个总体参数的检验一个总体参数的检验 5.2.1 总体均值的检验总体均值的检验在对总体均值进行假设检验时,采用什么检验步骤和检验统计量取决于所抽取的样本是大样本(n30)还是小样本(n30),此外还需要区分总体是否服从正态分布、总体方差2是否已知等几种情况。4040应应用用统统计计复复习习例例5.4 一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平a=0.05,检验该天生产的饮料容量是否符合标准要求。4141应应用用统统计计复复习习解:这里所关心的焦点是饮料容量是否符合要求,也就是是否为255ml。大于或小于255ml都不符合要求,因而属于双侧检验问题。提出的原假设和备择假设为:H0:=255,H1:255计算检验统计量的具体数值:检验统计量数值的含义是:样本均值与检验的总体均值相比,相差1.01个抽样标准差。4242应应用用统统计计复复习习根据给定的显著性水平a=0.05,查书后所附的标准正态分布表得za/2=z0.025=1.96。由于|z|=1.015200计算检验统计量的具体数值:4646应应用用统统计计复复习习根据给定的显著性水平a=0.05,查标准正态分布表得za=z0.05=1.645。由于z=3.75z0.05=1.645,所以拒绝原假设。检验结果表明:改良后的新品种产量有显著提高。计算P值为0.000088a=0.05,同样拒绝原假设。4747应应用用统统计计复复习习大样本情况下一个总体均值的检验大样本情况下一个总体均值的检验方法汇总方法汇总 已知:;未知:双侧检验 右侧检验 左侧检验 假设形式 检验统计量 a与拒绝域 P值决策准则 H0:=0,H1:0H0:0,H1:0zza/2zzaPa,拒绝H0 4848应应用用统统计计复复习习2.小样本的检验方法小样本的检验方法当总体方差2已知的时候,即使是在小样本情况下,检验统计量仍然服从标准正态分布。对于小样本,当总体方差2未知的时候,需要用样本方差s2代替总体方差2,检验统计量服从自由度为(n-1)的t分布。因此需要采用t分布来检验总体均值,通常称之为“t检验”。检验的统计量为:4949应应用用统统计计复复习习小样本情况下一个总体均值的检小样本情况下一个总体均值的检验方法验方法汇总汇总 未知:;已知:双侧检验 右侧检验 左侧检验 假设形式 检验统计量 a与拒绝域 P值决策准则 H0:=0,H1:0H0:0,H1:0tta/2(n-1)tta(n-1)Pa,拒绝H0 5050应应用用统统计计复复习习例例5.7一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验,结果如下:12.2 10.8 12.0 11.8 11.912.4 11.3 12.2 12.0 12.3假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?5151应应用用统统计计复复习习解:依题意建立如下原假设与备择假设:H0:=12,H1:12根据样本数据计算得:由于n30为小样本,计算检验统计量:根据自由度(n-1)=10-1=9,查t分布表得:ta/2(n-1)=t0.025(9)=2.262,TINV(0.05,9)由于|t|=0.70530.05,所以不拒绝原假设。5353应应用用统统计计复复习习5.2.2 总体比率的检验总体比率的检验总体比率检验的三种基本形式为:双侧检验:H0:p=p0,H1:pp0左侧检验:H0:pp0,H1:pp0 5454应应用用统统计计复复习习在构造检验统计量时,仍然利用样本比率p与总体比率p之间的距离等于多少个标准差p来衡量,因为在大样本情形下统计量p近似服从正态分布,而统计量则近似服从标准正态分布。5555应应用用统统计计复复习习大样本情况下一个总体比率的检验大样本情况下一个总体比率的检验方法方法 双侧检验 右侧检验 左侧检验 假设形式 检验统计量 a与拒绝域 P值决策准则 H0:p=p0,H1:pp0H0:pp0,H1:pp0zza/2zzaPFa,则拒绝原假设H0,即1=2=i=k不成立,表明i(i=1,2,k)之间的差异是显著的。若FFa,则不拒绝原假设H0,没有数据表明i(i=1,2,k)之间有显著差异,也就是说,还不能认为所检验的因素对观测值有显著影响。6464应应用用统统计计复复习习第七章第七章 相关与回归分析相关与回归分析相关关系的概念相关系数一元线性回归l回归系数的计算l回归分析工具的应用l回归系数的检验l预测6565应应用用统统计计复复习习第八章第八章 时间序列时间序列时间序列的速度分析时间序列趋势变动分析l移动平均l长期趋势的模型法(与一元回归相同)6666应应用用统统计计复复习习练习练习6767应应用用统统计计复复习习练习练习因为因为所以,直线趋势方程为:所以,直线趋势方程为:趋趋势势方方程程具具有有延延伸伸外外推推的的功功能能,可可用用于于对对未未来来时时期期现现象象的的趋趋势势值值作作出出预预测测。例例如如上上例例中中,可可预测该客运站预测该客运站1999年一季度的客运量为:年一季度的客运量为:Y1999=96.31+2.52113=126.4(万人公里)万人公里)6969应应用用统统计计复复习习第九章第九章 统计指数统计指数总指数的编制l综合指数l平均指数指数体系与因素分解7070应应用用统统计计复复习习个体指数体系销售额指数销售量指数销售额指数销售量指数销售价格指数销售价格指数销售量变化的影响:销售量变化的影响:价格变化的影响:价格变化的影响:两者的共同影响:两者的共同影响:7171应应用用统统计计复复习习总指数体系的因素分析总指数体系的因素分析当我们需要分析多个个体综合变动影响因素时需要采用综合指数形式。销售量变动影响额价格变动影响额销售额变动绝对额
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!