《公共行政研究方法》课件第九讲 描述性统计、正态分布与抽样分布

上传人:考试不挂****2941... 文档编号:242919248 上传时间:2024-09-11 格式:PPT 页数:19 大小:189.50KB
返回 下载 相关 举报
《公共行政研究方法》课件第九讲 描述性统计、正态分布与抽样分布_第1页
第1页 / 共19页
《公共行政研究方法》课件第九讲 描述性统计、正态分布与抽样分布_第2页
第2页 / 共19页
《公共行政研究方法》课件第九讲 描述性统计、正态分布与抽样分布_第3页
第3页 / 共19页
点击查看更多>>
资源描述
,*,Click to edit Master title style,-19-,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,统计分布,统计:统计是分析、表现和解释数据的工具。,描述统计,(descriptive statistics),推断统计,(inferential statistics),频率分布,集中趋势,离散趋势,正态分布与抽样分布,1,-19-,频率分布,频率分布显示所观察变量的每一个种类,(category),在全体被观察对象中出现的频数。,名义和顺序变量的频率分布,间距变量,分组的原则:,1,,各组间的显著差异以及组内的相对接近;,2,,围绕中心值展开;,3,,每组的区间并不必然相同,百分比分布:将频率转化成百分比,百分比,=,频数,/,总频数,2,-19-,频数分布的图解,1,,,饼图,(pie chart),:,反映频数或百分比分布,2,,,柱形图,(bar chart),:,频数或百分比的分布,可多个变量,3,,,直方图,(histogram),:适用于间距变量,3,-19-,1.,饼图,(Pie chart),4,-19-,2.,柱形图,(Bar chart),5,-19-,3.,直方图,(Histogram),双击横轴上的刻度点可以修改各栏的长度,6,-19-,集中趋势的测度,众数,(mode),:,频数最高的值,中位数,(median),:,顺序或更高测量水平的变量中,位于所有观察值最中间的值。,均值,(mean),:,所有观察值的算术平均值,=,X/N,7,-19-,基于集中趋势的几种分布,对称分布:众数,=,中间数,=,均值,正偏态分布,(positively skewed),:均值,中间数,负偏态分布,(negatively skewed),:均值,中间数,8,-19-,离散趋势,离散趋势就是离开平均值的一般趋势,对于名义变量,计算定性差异,计算所有差异,(,种类间差异,),数与最大可能差异数的比例。,所有差异,=,f,i,f,j,f,i,和,f,j,是不同种类的频数,最大可能差异,= n(n-1)/2 .(F/n),2,F,是总频数,,n,是种类的数目,判断标准:离散,趋势在,0 1,之间,,越接近,1,,越离散;越接近,0,,越集中。,对于间距变量,可以计算总范围,(range),,或者,1/4,与,3/4,值的距离。,9,-19-,基于均值的离散趋势,1,,测量离开平均值的趋势,即平均误差,,(X-,X,)/N,,没有意义。,2,,测量每个值与均值之差的绝对值的均值,|,(X-,X,)|/N,这恐怕是最好的一个指标,但是,难以进行数学运算。,3,,计算误差的平方的均值,即方差,.,S,2,=,(X-,X,),2,/N =,X,2,/N ,X,2,S,是标准差 (,Standard Deviation, SD),在一般计算中,实际采取,S,2,=,(X-,X,),2,/,(,N-1,),3,,标准差的优点:相对稳定,受抽样误差影响小;数学性能好,可 做统计推断,例子:,身高的离散趋势,4,,离散系数:对于两个可比较群体,当均值不同时,它们的标准差的大小不可以直接比较,这时要参看均值来比较离散趋势,离散系数,= S/,X,例子:,生活满意度调查,10,-19-,正态曲线,正态曲线,是自然界中的常见分布形态,适用于间距变量。,间距变量的分布概率以区间形式表现出来,正态曲线对应的分布函数,服从均值为,u,标准差为,的正态分布:,N (u,2,),特征:,1,,对称的钟型分布,2,,众数,=,中间数,=,均值,处在分布中心,3,,曲线基于无限次数的观察,4,,曲线下面的面积代表了被观察现象分布的比例,而在均值和固定单位的标准差之间的分布比例是确定的。,11,-19-,正态分布的概率分布与概率密度曲线,(,),12,-19-,上图中,从曲线上得到的是每一个值的概率密度,而不是概率。因为与离散变量不同,连续变量不能由每一个具体值的概率来描述,就像频率分布一样,因为这样的值无穷无尽,则这样的频数,n,相对于,N,来讲,微乎其微,几近于,0,,因此没有意义,.,概率分布函数,F(x,) = P (-, x),我们在意的是在两个具体值之间的概率,即累积概率,P (a x b) =,F(b,) ,F(a,),当面临不同的正态分布时(具有不同的均值与方差),标准正态分布可以简化对于概率的计算。,13,-19-,标准正态分布,(Standard Normal distribution),(,),14,-19-,标准正态分布数值表,(,表内的数值是从负无穷到所查,Z,值的正态分布曲线下的面积,),X,0.00,0.01,0.02,0.03,0.04,0.05,0.06,0.07,0.08,0.09,0.0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0,1.1,1.2,1.3,1.4,1.5,1.6,1.7,1.8,1.9,2.0,2.1,2.2,2.3,2.4,2.5,2.6,2.7,2.8,2.9,0.500 0,0.539 8,0.579 3,0.617 9,0.655 4,0.691 5,0.725 7,0.758 0,0.788 1,0.815 9,0.841 3,0.864 3,0.884 9,0.903 2,0.919 2,0.933 2,0.945 2,0.955 4,0.964 1,0.971 3,0.977 2,0.982 1,0.986 1,0.989 3,0.991 8,0.993 8,0.995 3,0.996 5,0.997 4,0.998 1,0.504 0,0.543 8,0.583 2,0.621 7,0.659 1,0.695 0,0.729 1,0.761 1,0.791 0,0.818 6,0.843 8,0.866 5,0.886 9,0.904 9,0.920 7,0.934 5,0.946 3,0.956 4,0.964 8,0.971 9,0.977 8,0.982 6,0.986 4,0.989 6,0.992 0,0.994 0,0.995 5,0.996 6,0.997 5,0.998 2,0.508 0,0.547 8,0.587 1,0.625 5,0.662 8,0.698 5,0.732 4,0.764 2,0.793 9,0.821 2,0.846 1,0.868 6,0.888 8,0.906 6,0.922 2,0.935 7,0.947 4,0.957 3,0.965 6,0.972 6,0.978 3,0.983 0,0.986 8,0.989 8,0.992 2,0.994 1,0.995 6,0.996 7,0.997 6,0.998 2,0.512 0,0.551 7,0.591 0,0.629 3,0.666 4,0.701 9,0.735 7,0.767 3,0.796 7,0.823 8,0.848 5,0.870 8,0.890 7,0.908 2,0.923 6,0.937 0,0.948 4,0.958 2,0.966 4,0.973 2,0.978 8,0.983 4,0.987 1,0.990 1,0.992 5,0.994 3,0.995 7,0.996 8,0.997 7,0.998 3,0.516 0,0.555 7,0.594 8,0.633 1,0.670 0,0.705 4,0.738 9,0.770 3,0.799 5,0.826 4,0.850 8,0.872 9,0.892 5,0.909 9,0.925 1,0.938 2,0.949 5,0.959 1,0.967 2,0.973 8,0.979 3,0.983 8,0.987 4,0.990 4,0.992 7,0.994 5,0.995 9,0.996 9,0.997 7,0.998 4,0.519 9,0.559 6,0.598 7,0.636 8,0.673 6,0.708 8,0.742 2,0.773 4,0.802 3,0.828 9,0.853 1,0.874 9,0.894 4,0.911 5,0.926 5,0.939 4,0.950 5,0.959 9,0.967 8,0.974 4,0.979 8,0.984 2,0.987 8,0.990 6,0.992 9,0.994 6,0.996 0,0.997 0,0.997 8,0.998 4,0.523 9,0.563 6,0.602 6,0.640 4,0.677 2,0.712 3,0.745 4,0.776 4,0.805 1,0.835 5,0.855 4,0.877 0,0.896 2,0.913 1,0.927 9,0.940 6,0.951 5,0.960 8,0.968 6,0.975 0,0.980 3,0.984 6,0.988 1,0.990 9,0.993 1,0.994 8,0.996 1,0.997 1,0.997 9,0.998 5,0.527 9,0.567 5,0.606 4,0.644 3,0.680 8,0.715 7,0.748 6,0.779 4,0.807 8,0.834 0,0.857 7,0.879 0,0.898 0,0.914 7,0.929 2,0.941 8,0.952 5,0.961 6,0.969 3,0.975 6,0.980 8,0.985 0,0.988 4,0.991 1,0.993 2,0.994 9,0.996 2,0.997 2,0.997 9,0.998 5,0.531 9,0.571 4,0.610 3,0.648 0,0.684 4,0.719 0,0.751 7,0.782 3,0.810 6,0.836 5,0.859 9,0.881 0,0.899 7,0.916 2,0.930 6,0.943 0,0.953 5,0.962 5,0.970 0,0.976 2,0.981 2,0.985 4,0.988 7,0.991 3,0.993 4,0.995 1,0.996 3,0.997 3,0.998 0,0.998 6,0.535 9,0.575 3,0.614 1,0.651 7,0.687 9,0.722 4,0.754 9,0.785 2,0.813 3,0.838 9,0.862 1,0.883 0,0.901 5,0.917 7,0.931 9,0.944 1,0.953 5,0.963 3,0.970 6,0.976 7,0.981 7,0.985 7,0.989 0,0.991 6,0.993 6,0.995 2,0.996 4,0.997 4,0.998 1,0.998 6,15,-19-,标准正态曲线及其运用,N (0, 1),如何将一般正态曲线,N(u,2,),转化为标准正态曲线,N(0, 1),1,,将所有值转化为,Z-score,,即标准值,Z= (X-u)/,2,,所有,Z-score,构成一个,N(0, 1),的分布,如何根据正态分布的值求分布概率,例如:对于,N(5, 1),的分布,取得大于,7,的值的概率是多少?,又如:对于,N(170, 25),的分布,身高处在,168,到,180,之间的人的概率?,再如,对于,N(170, 25),的分布,如果最高的,5%,人的身高是极端值,那么这个极端值的范围是多少?,16,-19-,总体分布、样本分布与抽样分布,总体分布:即所研究总体的所有数据构成的分布。其分布通常我们并不知道。总体分布的容量为,N,,均值,u,, 方差,.,样本分布:所抽取样本内的所有数据构成的分布。样本容量为,n,, 均值,X,, 方差,SD,,或,s.,根据样本的容量,一个总体可以有,C (n N),个可能样本。,样本容量越大,其样本统计量越近似于总体参数。,抽样分布:由样本容量为,n,的所有可能抽样的统计量(例如均值)所构成的分布。对于同样的总体,当样本容量,n,变化时,抽样分布也会变化。,17,-19-,抽样分布,案例,:,有,5,个人的每周收入分布为,500, 650, 400, 700,和,600,。如果抽样的样本容量为,2,, 可以得到,10,可能的样本;如果容量为,4,, 则,5,个可能的样本。,则如果我们使用这样样本的均值构成总体,对于第一种情形,抽样分布有,10,个数据点;,对于第二种情况,,5,个。,抽样分布与总体分布的关系:,中心极限定理:对于一个任意分布形式的总体,其平均值为,,方差为,2,。如果从该总体中抽出容量为,n,的样本,则当样本容量很大时,这些样本的均值,X,的分布近似服从正态分布,:,N(,,,2,/n,),所有样本均值的均值等于总体均值,所有样本均值的标准差(专用名称为标准误,,standard error,),=,总体标准差,/,sqrt(n,) =,/,sqrt(n,),当,N,很小时,标准误,Standard error =,s.e,. =,/,sqrt(n,)*,sqrt(N-n)/N,18,-19-,Sampling distribution of income (,n=2, N=5),Sample,(n=2),Sample mean (statistic),500,650,575,500,400,450,500,700,600,500,600,550,650,400,525,650,700,675,650,600,625,400,700,550,400,600,500,700,600,650,Population mean,:,(500+650+400+700+600)/5,570,120.4,Sampling distribution mean,570,Standard Error (se),69.5,19,-19-,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!