正态分布l课件_装配图网

资源描述

正态分布l常见概率分布常见概率分布和中心极限定理和中心极限定理正态分布l概率分布概率分布离散型概率分布连续型概率分布泊松分布均匀分布正态分布指数分布二项分布几何分布正态分布l 主要内容：主要内容：概率基础知识概率基础知识随机变量及其概率分布概述随机变量及其概率分布概述常用概率分布常用概率分布二项分布二项分布泊松分布泊松分布正态分布正态分布分布的偏度和峰度分布的偏度和峰度中心极限定理中心极限定理正态分布l一、概率基础知识一、概率基础知识1.1.事件事件（1 1）必然现象和随机现象）必然现象和随机现象客观世界中存在两类现象，一类是在一定条件下必然出现的现象，称为必然现象也称确定性现象，另一类是在一定条件下可能出现也可能不出现的现象，称为随机现象也称不确定性现象。例如：带异性电荷的小球必然相互吸引，这是必然现象。抛掷一枚硬币，它可能是正面朝上也可能是背面朝上，就是说，“正面朝上”这个结果可能出现也可能不出现；下一个交易日股市的指数可能上升也可能下跌；这都是随机现象。正态分布l随机现象或不确定性现象，有如下特点：在一定的条件实现时，有多种可能的结果发生，事前人们不能预言将出现哪种结果；对一次或少数几次观察或试验而言，其结果呈现偶然性、不确定性；但在相同条件下进行大量重复试验时，其试验结果却呈现出某种固有的特定的规律性频率的稳定性，通常称之为随机现象的统计规律性。正态分布l（2）随机试验与随机事件）随机试验与随机事件随机试验通常我们把根据某一研究目的，在一定条件下对自然现象所进行的观察或试验统称为试验（trial）。而一个试验如果满足下述三个特性，则称其为一个随机试验（random trial），简称试验：（1）试验可以在相同条件下多次重复进行；（2）每次试验的可能结果不止一个，并且事先知道会有哪些可能的结果；（3）每次试验总是恰好出现这些可能结果中的一个，但在一次试验之前却不能肯定这次试验会出现哪一个结果。例如在一定孵化条件下，孵化6枚种蛋，观察其出雏情况；又如观察两头临产妊娠母牛所产犊牛的性别情况，它们都具有随机试验的三个特征，因此都是随机试验。正态分布l随机事件随机试验的每个可能结果称为一个样本点，全体样本点所组成的集合称为样本空间，由部分样本点组成的试验结果为随机事件。例如：记录某电话机在一小时内呼唤次数，其样本点是非负整数。若以每小时是否达到5次呼唤来区分这台电话机是否太繁忙，那么“不太繁忙”即不足5次的呼唤。它由5个样本点0,1,2,3,4组成，由于它是由样本空间中的一部分样本点组成，在未来的一次试验中可能发生也可能不发生，故“不太繁忙”这一试验结果就是随机事件。（2）必然事件）必然事件把在一定条件下必然会发生的事件称为必然事件。（3）不可能事件）不可能事件把在一定条件下不可能发生的事件称为不可能事件。正态分布l2.概概率率（1）概率的统计定义）概率的统计定义在相同条件下进行n次重复试验，如果随机事件A发生的次数为m，那么m/n称为随机事件A的频率（frequency）；当试验重复数n逐渐增大时，随机事件A的频率越来越稳定地接近某一数值 p，那么就把p称为随机事件A的概率。这样定义的概率称为统计概率（statistics probability）。例如：为了确定抛掷一枚硬币发生正面朝上这个事件的概率，历史上有人作过成千上万次抛掷硬币的试验。在表1中列出了他们的试验记录。正态分布l表1 抛掷一枚硬币发生正面朝上的试验记录从表1可看出，随着实验次数的增多，正面朝上这个事件发生的频率越来越稳定地接近0.5，我们就把0.5作为这个事件的概率。（2）概率的性质）概率的性质 1、对于任何事件A，有0P（A）1；2、必然事件的概率为1，即P（）=1；3、不可能事件的概率为0，即P（）=0。正态分布l（3 3）频率与概率间的关系：）频率与概率间的关系：1.样本频率总是围绕概率上下波动 2.样本含量n越大，波动幅度越小，频率越接近概率。图1 抛硬币“正面”向上的频率摆动示意图正态分布l二、随机变量及其概率分布概述随机变量及其概率分布概述1.随机变量随机变量作一次试验，其结果有多种可能。每一种可能结果都可用一个数来表示，把这些数作为变量x的取值范围，则试验结果可用变量x来表示。例如：孵化一枚鸡蛋可能结果只有两种，即“孵出小鸡”与“未孵出小鸡”。若用变量x表示试验的两种结果，则可令x=0表示“未孵出小鸡”，x=1表示“孵出小鸡”。（1）离散型随机变量离散型随机变量：数据间有缝隙，其取值可以列举。例如：抛硬币10次，正面的可能取值x为0、1、2、3、4、5、6、7、8、9、10。（2）连续型随机变量连续型随机变量：数据间无缝隙，其取值充满整个区间，无法一一列举每一可能值。例如：身高、体重、血清胆固醇含量。正态分布l2.概率分布概率分布概率分布：描述随机变量值及这些值对应概率的表格、公式或图形。（1）.离散型随机变量的概率分布离散型随机变量的概率分布)(ixXPix)(ixXP表2 婴儿的性别情况正态分布l离散型随机变量的概率分布举例（图形）正态分布l（2）连续型随机变量的概率分布）连续型随机变量的概率分布一般将连续型随机变量整理成频数表，对频数作直方图，直方图的每个矩形顶端连接的阶梯形曲线来描述连续型变量的频数分布。图2-1 表2-4数据的直方图图2-1 表2-4数据的直方图051015202530352.73.13.53.94.34.75.15.55.96.3血清总胆固醇（mmol/L）人数正态分布l 如果样本量很大，组段很多，矩形顶端组成的阶梯型曲线可变成光滑的分布曲线。大多数情况下，可采用一个函数拟合这一光滑曲线。这种函数称为概率密度函数（probability density function）。正态分布l()baP axbfx dx概率密度函数定义：概率密度函数定义：设X为连续型随机变量，若存在非负实函数 f(x),使对任意实数 a 0，与x轴不相交；2.正态曲线关于直线x=对称，且在x=时位于最高点；当x 时，曲线下降并且当曲线向左、右两边无限延伸时，以x轴为渐近线，向它无限靠近；4.当一定时，曲线的形状由确定越大，曲线越“矮胖”，表示总体的分布越分散；越小，曲线越“瘦高”，表示总体的分布越集中 xCAB 和对正态曲线的影响正态分布l5.正态曲线下的总面积等于1；6.随机变量的概率由曲线下的面积给出。?d)()(baxxfbxaP正态分布l7.经验法则在正态分布中的应用：范围内的面积为68.27%1.96范围内的面积为95%2.58范围内的面积占99%正态分布l（5）标准正态分布标准正态分布)1,0(NXZ1.任何一个一般的正态分布，可通过下面的线性变换转化为标准正态分布2.标准正态分布的概率密度函数xxx,e21)(22XZ注：将一般的正态分布转化为标准正态分布，计算概率时只需要查一张表，更简单，便捷。正态分布l（6）二项、泊松和正态分布的联系：）二项、泊松和正态分布的联系：二项分布的正态近似当n 很大时，二项随机变量X近似服从正态分布N(np,np(1-p)。泊松分布的正态近似泊松分布的相当大（20）时，近似服从正态分布N(，)。正态分布l高高尔尔顿顿钉钉板板试试验验正态分布l四、分布的偏度和峰度四、分布的偏度和峰度1.统计动差统计动差统计动差：也称为距，反映分布偏斜或离散程度的指标。(1)原点动差原点动差：变量x关于原点的k阶距，一般形式：k=1时，即1阶的原点动差就是算术平均数。k=2时，即2阶的原点动差就是平方平均数。nxnikik1正态分布l(2)中心动差中心动差：变量x关于分布中心（平均数）的k阶距。一般形式为：当k=0时，即零阶中心动差 =1；当k=1时，即一阶中心动差 =0；当k=2时，即二阶中心动差 =。nxxnikik1)(0221正态分布l2.偏度偏度偏度：衡量频数分配不对称程度，或偏斜程度的指标。计算公式：（用距法测定）当 =0时，左右完全对称，为正态分布；当 0时为正偏斜；当 0)(0时，表示频数分布比正态分布更集中，分布呈尖峰状态，0)(=0)(0)正态分布lExcel具体操作（1）偏度系数）偏度系数1、手工输入函数：单击任一空白单元格，输入“=SKEW(B2:B31)”，回车后得到偏度系数0.366699。2、点击菜单“插入”，找“函数”，出现“插入函数”对话框，在对话框的“选择类别”中确定函数类别为“统计”，在选择函数中确定欲选择的函数名称“SKEW”。（2）峰度系数）峰度系数：函数为KURT，具体操作过程和偏度系数相同。正态分布l五、抽样推断的理论基础五、抽样推断的理论基础 1.大数定律大数定律（1）大数定律的实际意义：）大数定律的实际意义：大数定律是指在随机试验中，每次出现的结果不同，但是大量重复试验出现的结果的平均值却几乎总是接近于某个确定的值。其原因是，在大量的观察试验中，个别的、偶然的因素影响而产生的差异将会相互抵消，从而使现象的必然规律性显示出来。例如，观察个别或少数家庭的婴儿出生情况，发现有的生男，有的生女，没有一定的规律性，但是通过大量的观察就会发现，男婴和女婴占婴儿总数的比重均会趋于50%。正态分布l（2）切比雪夫大数定理切比雪夫大数定理设x1，x2 是一列两两相互独立的随机变量，服从同一分布，且存在有限的数学期望a和方差，则对任意小的正数，有：1limanxPni2切比雪夫大数定律的含义是：当n很大，服从同一分布的随机变量的算术平均数将依概率接近于这些随机变量的数学期望。将该定律应用于抽样调查，就会有如下结论：随着样本容量n的增加，样本平均数将接近于总体平均数。从而为统计推断中依据样本平均数估计总体平均数提供了理论依据。nxxx,21 正态分布l（1）辛钦中心极限定理辛钦中心极限定理设随机变量相互独立，服从同一分布且有有限的数学期望a和方差，则随机变量，在n无限增大时，服从参数为a和的正态分布。即n时 n2),(2naNxnxxx,21 2x将该定理应用到抽样调查，就有这样一个结论：如果抽样总体的数学期望a和方差是有限的，无论总体服从什么分布，从中抽取容量为n的样本时，只要n足够大，其样本平均数的分布就趋于数学期望为a，方差为的正态分布。2n22.中心极限定理中心极限定理

展开阅读全文

正态分布l课件

最新文档