多元统计应用分析课件

上传人:29 文档编号:241006050 上传时间:2024-05-24 格式:PPT 页数:145 大小:2.58MB
返回 下载 相关 举报
多元统计应用分析课件_第1页
第1页 / 共145页
多元统计应用分析课件_第2页
第2页 / 共145页
多元统计应用分析课件_第3页
第3页 / 共145页
点击查看更多>>
资源描述
多元统计分析研究的对象 一元统计分析是研究一个随机变量统计规律性的学科。多元统计分析是研究多个随机变量之间相互依赖关系以及内在统计规律性的一门统计学科。它的内容既包括一元统计学中某些方法的直接推广,也包括多个随机变量特有的一些问题。多元统计分析是一类范围很广的理论和方法。多元统计分析研究的对象 1多元统计分析研究的内容和方法简化数据结构(降维问题)箱式数据箱式数据平面数据平面数据变换主成分分析主成分分析Principle Analysis因子分析因子分析FactorAnalysis多元统计分析研究的内容和方法简化数据结构(降维问题)箱式数据2按观测点分类或按变量分组 分类比较是一切科学比较的基础和开端 对观测点分类:银行发放贷款 对各企业财务指标、信用状况进行分析 对变量分组:股票市场是宏观经济的晴雨表 经济指标与股票市场各种指标间的群组关系多元统计分析研究的内容和方法聚类分析聚类分析判别分析判别分析Cluster AnalysisDiscriminant Analysis按观测点分类或按变量分组多元统计分析研究的内容和方法聚类分析3多元统计分析研究的内容和方法变量间的依存关系、相互关系寻找变量间的依存关系是一切科学研究的主要内容寻找一般的规律:预测、控制回回回回归归分析分析分析分析Regression Analysis典型相关分析典型相关分析典型相关分析典型相关分析 Canonical correlatinal analysis多元统计分析研究的内容和方法变量间的依存关系、相互关系回归分4多元数据的统计推断关于参数估计和假设检验问题。特别是多元正态分布的均值向量及协方差阵的估计和假设检验等问题。多元统计分析的理论基础 包括多维随机向量及多维正态随机向量,及由此定义的各种多元统计量,推导其分布和性质,研究它们的抽样分布理论。多元统计分析研究的内容和方法多元数据的统计推断多元统计分析研究的内容和方法5多元统计分析的应用 多元统计分析是解决实际问题的有效的数据处理法。它已广泛地应用于自然科学、社会科学的各个方面。如:教育学、医学、气象学、环境科学、地质学、考古学、服装工业服装的定形分类问题、经济学、农业、社会科学、文学、体育科学、军事科学、心理学、生物学、生态学、火警预报、地震预报、保险科学等领域。多元统计分析的应用 多元统计分析是解决实际问题的有效的6内容提要多元正态分布与参数估计1多元正态总体参数的检验2 回归分析 3 判别分析45 主成分分析6 因子分析7 聚类分析 典型相关分析8内容提要多元正态分布与参数估计1多元正态总体参数的检验2 7教学内容结构多元正态参数估计、检验OneTwoThree回归分析聚类分析判别分析主成分分析因子分析多元统计分析典型相关分析教学内容结构多元正态参数OneTwoThree回归分析聚类分8参考书目应用多元统计分析应用多元统计分析应用多元统计分析应用多元统计分析(高惠旋 编著)北京大学出版社Applied Multivariate Statistical AnalysisApplied Multivariate Statistical Analysis Richard A.Johnson&Dean W.WichernRichard A.Johnson&Dean W.Wichern Prentice Hall.2001,(4th ed).多元统计分析引论多元统计分析引论多元统计分析引论多元统计分析引论(张尧庭 方开泰 编著)科学出版社参考书目应用多元统计分析(高惠旋 编著)9第一章多元正态分布与参数估计第一章10多元正态分布与参数估计1 1随机向量及其数字特征2 2多元正态分布的定义与基本性质3 3条件分布与独立性5 5多元正态分布的参数估计多元正态分布与参数估计1随机向量及其数字特征2多元正态分布的111 随机向量及其分布 P维随机向量 联合分布函数 联合密度函数1 随机向量及其分布 P维随机向量12特征函数一元随机变量 的特征函数:二元随机向量 的特征函数:P元随机向量 的特征函数:求1.边缘密度.2.与 是否相互独立?3.的特征函数例例1特征函数一元随机变量 的特征函数:求1.边缘密度.例113条件分布与独立性两随机向量间的条件分布的D.F d.f c.f的D.F d.f c.f的D.F d.f c.f给定 时,的条件密度函数条件分布与独立性两随机向量间的条件分布的D.F 14条件分布与独立性 两随机向量独立的充分必要条件t 与 相互独立t 相互独立 不成立条件分布与独立性 两随机向量独立的充分必要条件15 随机向量的数字特征随机向量的数学期望随机向量X的方差阵或协方差阵标准差矩阵:随机向量的数字特征随机向量的数学期望标准差16随机向量的数字特征两随机向量间的协方差阵随机向量X的相关系数阵随机向量的数字特征两随机向量间的协方差阵17随机向量的数字特征的性质 随机向量X与Y不相关:若X,Y 相互独立,则 ;反之不一定 成立。均值向量和协方差阵的性质:对称、非负定矩阵随机向量的数字特征的性质 随机向量X与Y不相关:对称、非负定18随机向量的数字特征的性质 其中L 为非负定矩阵.当矩阵 (正定)时,矩阵L称为 的平方根矩阵,记为 协方差阵 还可分解为 (A 为可逆阵)随机向量的数字特征的性质 其192 多元正态分布的定义与基本性质一元正态分布一元正态分布密度函数形式特征函数形式一般正态与标准正态之间的关系多个独立正态变量的线性组合仍为正态变量2 多元正态分布的定义与基本性质一元正态分布一元正态分布密20多元正态分布的定义与基本性质定义1 p 维标准正态分布 设 独立同分布于 ,则称随机向量 服从p 维正态分布,记特征函数:密度函数:多元正态分布的定义与基本性质定义1 p 维标准正态分布特征函21多元正态分布的定义与基本性质定义2 p 维一般正态分布 设 ,A为 实数矩阵,为 p 维实数向量,则 是 p 维正态分布,记为:其中 为非负定阵。多元正态分布的定义与基本性质定义2 p 维一般正态分布22多元正态分布的定义与基本性质t性质1 若 服从 ,则 (1),(2)定义3 若p 维随机向量X 的特征函数为 则称X 服从p 元正态分布,记为多元正态分布的定义与基本性质性质1 若 服从 23多元正态分布的定义与基本性质t 性质2:若 服从 (1)令 ,为 实数矩阵,为 维实数向量,则 服从 (2)服从 ,c 为实数.t 性质3:服从 为一元正态随机变量.定义4:设 为p 维随机向量,若 ,为一元正态随机变量,则称 X 服从p 元正态分布,记为用于验证用于验证多元正态分布的定义与基本性质 性质2:若 服从 24多元正态分布的定义与基本性质 定义5:若p 维随机向量 的联合密度函数为 其中 ,则称 X 服从p 元正态分布,记为t 性质4:若 为正定矩阵,则 服从 具有密度函数多元正态分布的定义与基本性质 定义5:若p 维随机向量 25多元正态分布的四个等价定义 其中 为一元正态随机变量 特征函数 密度函数多用于验证多用于证明多元正态分布的四个等价定义多用于验证多用于证明26二元正态分布的密度函数 二元正态分布的等高线(面)是一族中心在 的椭圆.二元正态分布的密度函数 二元正态分布的等高线(27p元正态分布密度函数的等高面 p元正态分布密度函数的等高面为椭球面,即在距离 的平方为常数的表面上多元正态密度是常数,这些密度曲线称为轮廓线。常数概率密度轮廓线=满足 的所有x=中心在 的椭球的表面。常数密度的每个椭球面的中心在u且轴在 的特征向量的方向上,而且其长度是与 的特征值的平方根的倒数成比例的。p元正态分布密度函数的等高面 p元正态分布密28(11=1,22=1,12=0)二元正态分布曲面(11=1,22=1,12=0)二元正态分布曲面29二元正态分布曲面(11=1,22=1,12=0)二元正态分布曲面(11=1,22=1,12=0)30二元正态分布曲面(11=2,22=4,12=0.75)二元正态分布曲面(11=2,22=4,12=0.731二元正态分布曲面(11=2,22=4,12=0.75)二元正态分布曲面(11=2,22=4,12=0.75)32二元正态分布曲面(11=2,22=4,12=0.75)二元正态分布曲面(11=2,22=4,12=0.733二元正态分布曲面剖面(11=1,22=1/2,12=0.75)二元正态分布曲面剖面(11=1,22=1/2,12=343 条件分布与独立性t定理1 若 服从 ,(1)服从 ,服从 ;(2)与 相互独立 .(不相关)t定理2 若 相互独立,且 则.3 条件分布与独立性定理1 若 35条件分布与独立性说明正态总体独立性与不相关性是等价的t推论2 若 ,则 相互独立t推论1 若 对角阵,则 相互独立.t推论3:若 不服从正态分布,则 不服从正 态分布.条件分布与独立性说明正态总体独立性与不相关性是等价的推论2 36条件分布与独立性定理3 设 则 Y与Z相互独立定理4 设 则Y与Z相互独立?定理5 设 则当 给定时,的条件分布为 其中 条件分布与独立性定理3 设?定理5 设37p元正态分布的性质o 每一个变量均服从正态分布。o 变量的线性组合服从正态分布。o p 元正态分布中的任意 k(0km)个变量服 从 k 元正态分布。o p元正态分布的条件分布仍服从正态分布。o 协方差为0的变量间相互独立。p元正态分布的性质 每一个变量均服从正态分布。385 多元正态分布的参数估计多元样本及数字特征多元样本的概念P维随机样本 P维总体 的一个容量为n的样本:的样本 的样本5 多元正态分布的参数估计多元样本及数字特征 的样本 39样本数据阵(样本资料阵)样本数据阵(样本资料阵)40样本均值其中样本均值其中41样本离差阵样本离差阵样本离差阵样本离差阵42样本方差阵样本方差阵其中为 的样本方差;称为 的样本标准差.样本方差阵样本方差阵其中为 的样本方差;43样本相关系数阵 与 的样本相关系数样本相关系数阵 与 的样本相关系数44多元正态均值向量及协方差阵的极大似然估计定理1 设 是 p 元正态总体 的随机样本,则 为 的极大似然估计,即 样本 的似然函数多元正态均值向量及协方差阵的极大似然估计定理1 设 45多元正态均值向量及协方差阵的极大似然估计定理2 当 时,的极大似然估计是多元正态均值向量及协方差阵的极大似然估计定理2 当 46极大似然估计量的性质定理3 若 和 分别是正态总体 的样本均值和样本离差阵,则 (1)(2),其中 独立同分布于 (3)与 相互独立 (4)证明:设 是n阶正交阵,极大似然估计量的性质定理3 若 和 分别是正态总体47极大似然估计量的性质极大似然估计量的性质48极大似然估计量的性质极大似然估计量的性质49极大似然估计量的性质极大似然估计量的性质50极大似然估计量的性质定理4 ,若 为正定矩阵,则 可作可作为检验统计量量极大似然估计量的性质定理4 ,51极大似然估计量的性质t无偏性 与 分别是 和 的无偏估计,即t有效性 与 分别是 和 的最小方差无偏 估计量.t相合性(一致性)当 时 与 分别是 和 的强相合估计.t充分性 与 分别是 和 的充分统计量.极大似然估计量的性质无偏性 与 52第二章多元正态总体参数的假设检验第二章53多元正态总体参数的假设检验1 1几个重要统计量的分布2 2单总体均值向量的检验3 3多总体均值向量的检验5 5独立性检验66 正态性检验及其SAS实现多元正态总体参数的假设检验1几个重要统计量的分布2单总体均值541 几个重要统计量的分布一、正态变量二次型的分布 1.分量独立的n维随机向量X的二次型定义1 中心 分布与矩阵表达 设 独立同分布于 ,则 若记 ,且 则 推广:若 则 1 几个重要统计量的分布一、正态变量二次型的分布55分量独立的 n 维随机向量 X 的二次型定义2 非中心 分布与矩阵表达设且则随即变量 服从自由度为 n,非中心参数为的卡方分布,并记为 或推广:若 则若则其中分量独立的 n 维随机向量 X 的二次型定义2 非中心 56分量独立的 n 维随机向量 X 的二次型t性质 (i)设 相互独立,则 (ii)设 则 (iii)(iv)若 则X 特征函数为分量独立的 n 维随机向量 X 的二次型性质 57分量独立的 n 维随机向量 X 的二次型定理1 设 则 (A为对称幂等阵)证明:分量独立的 n 维随机向量 X 的二次型定理1 设 58分量独立的 n 维随机向量 X 的二次型分量独立的 n 维随机向量 X 的二次型59分量独立的 n 维随机向量 X 的二次型 定理2 设 则 (A为对称幂等阵)其中 o 对称幂等阵的性质:1.I-A是对称幂等的;2.A的特征值是1或0;3.r(A)=tr(A)分量独立的 n 维随机向量 X 的二次型 定理2 设 60证明要点:若A是对称幂等的,则存在正交矩阵P,使 令 ,若 ,则存在正交矩阵P,使 分量独立的 n 维随机向量 X 的二次型证明要点:分量独立的 n 维随机向量 X 的二次型61定理3 设 则定理4 设 则 分量独立的 n 维随机向量 X 的二次型定理5 (Cochran定理)已知 (1)服从 (2)为 阶实对称阵;且 (3)则 服从 与 服从 且相互 独立 定理3 设分量独立的 n 维随机向量 X 的二次型定理5 62分量独立的 n 维随机向量 X 的二次型定理6 设 (1)(2)(3)非负定 则 且与 相互独立.分量独立的 n 维随机向量 X 的二次型定理6 设63一般 p 维正态随机向量的二次型定理1 若 则 (1),其中 (2)用于构造检验统计量并检验异常点定理2 若 则定理3 若 则一般 p 维正态随机向量的二次型定理1 若 64非中心 t 分布和非中心 F 分布 当 时,F服从自由度为m,n中心F分布记为:定义3 非中心 t 分布设 与 相互独立,令则随机变量T 服从自由度为n,非中心参数为 非中心t 分布,并记为:当 时,T服从自由度为n中心t 分布记为:定义4 非中心 F 分布设 与 相互独立,令 则随机变量F 服从自由度为m,n,非中心参数为 非中心F分布,并记为:非中心 t 分布和非中心 F 分布 当 时,F65非中心 分布、非中心t分布和非中心F分布 利用非中心 分布、非中心t分布和非中心F分布可以计算一元统计检验中犯第二类错误的概率。例 未知,检验 检验统计量为犯第一类错误的概率为犯第二类错误的概率为非中心 分布、非中心t分布和非中心F分布 利用非中心66威沙特(Wishart)分布定义1 随机矩阵的分布定义2(中心Wishart分布)设服从且相互独立,则称随机矩阵服从中心Wishart 分布,并记为 ,其中定义3(非中心Wishart分布)设服从 且相互独立,则称随机矩阵 服从非中心Wishart 分布,并记为 其中 为非中心参数,威沙特(Wishart)分布定义1 随机矩阵的分布67威沙特(Wishart)分布性质 结论1 分布是Wishart分布的特例 结论2 性质1 若 且相互独立,则性质2 若(1)且 独立同分布于 (2)是秩为 r 的实对称阵,则 威沙特(Wishart)分布性质 结论1 分布是68威沙特(Wishart)分布性质性质3 设p阶随机阵 是常数阵,则 特例 (1)(2)设 则性质4 设 相互独立,其中 则 (1)(2)当 时,威沙特(Wishart)分布性质性质3 设p阶随机阵 69威沙特(Wishart)分布性质性质5 设p阶随机阵 性质6(Cochran定理)若 (1)且 独立同分布于 (2)为 阶实对称阵;且 (3)则 服从 与 服从 且 相互独立 威沙特(Wishart)分布性质性质5 设p阶随机阵 70服从正服从正态分布分布服从卡方分布服从卡方分布服从多元正服从多元正态分布分布服从服从Wishart分布分布推广推广服从服从服从正态分布服从卡方分布服从多元正态分布服从Wishart分71霍特林(Hotelling)T2分布Hotelling 分布 定义1 设 且相互独立,则称 服从自由度为n的霍特林T2分布。若 则称 服从自由度为n的非中心霍特林T2分布。结论1 分布是t分布的推广 性质1 独立同分布于 ,则 霍特林(Hotelling)T2分布Hotelling 分72分布与 分布之间的关系性质2 若 和 是 的样本均值和样本离差阵,记 则 分布与 分布之间的关系性质2 若 和 是 73霍特林(Hotelling)T2分布性质4 若 和 是 的样本均值和样本离差阵,记 则 其中性质5 T2统计量的分布只与p,n有关,而与 无关.性质6 T2统计量对可逆变换保持不变.性质3 若 和 是 的样本均值和样本离差阵,记 则霍特林(Hotelling)T2分布性质4 若 和 是74威尔克斯(Wilks)统计量及分布 威尔克斯 分布定义1 设 则称协方差阵的行列式 为X的广义方差.若 为p 元总体X 的随机样本,A为样本离差阵,则称 或 为样本广义方差.定义2 设 则称广义方差比为威尔克斯统计量或 统计量,其分布称为威尔克斯分布,记为威尔克斯(Wilks)统计量及分布 威尔克斯 75 统计量与 或 F统计量的关系结论1 统计量与 或 F统计量的关系结论1 76 统计量与 或 F统计量的关系结论2结论3结论4结论5 统计量与 或 F统计量的关系结论2结论3结论477一元正态总体参数的假设检验 设 来自总体 第一步:建立零假设 第二步:寻找检验统计量及其在 下的分布第三步:依据小概率原理建立检验准则 若 则拒绝零假设.一元正态总体参数的假设检验 设 来自总78一元正态总体参数的假设检验 设 来自总体 第一步:建立零假设 第二步:寻找检验统计量及其在 下的分布第三步:依据小概率原理建立检验准则 由于 ,故若 则拒绝零假设.不不应含有未知数含有未知数一元正态总体参数的假设检验 设 79单总体均值向量的检验及置信域单总体均值向量的检验 设总体 随机样本 检验 1.当 已知时,均值向量的检验 检验统计量及其分布是:单总体均值向量的检验及置信域单总体均值向量的检验 检验统计量802.当 未知时,均值向量的检验单总体均值向量的检验 检验统计量是:且2.当 未知时,均值向量的检验单总体均值向量的检验 检验统81p值的计算p值通常由下面公式计算而得到:p=P|W|W0|=2 P W|W0|(拒绝域为两边对称的区域时)p=minPW W0,PW W0 (拒绝域为两边非对称区域时)p=PW W0 (拒绝域为右边区域时)p=PW W0 (拒绝域为左边区域时)只需根据SAS计算出的p值,就可以在指定的显著水平下 ,作出拒绝 或不能拒绝 原假设的决定.p值的计算p值通常由下面公式计算而得到:82似然比统计量 设p元总体的密度函数为 其中 是未知参数,且 是来自总体X的容量为n 的样本,检验o样本的似然函数为o 似然比统计量为o否定域似然比统计量 设p元总体的密度函数为 83似然比统计量定理1 当样本容量n 很大时,其中似然比统计量定理1 当样本容量n 很大时,84多元总体均值向量的检验两个正态总体均值向量的检验零假设 情形1 i.i.d于 i.i.d于(1)正定且已知时,检验统计量及其分布(2)正定且未知时,检验统计量及其分布相互独立相互独立多元总体均值向量的检验两个正态总体均值向量的检验零假设 85例1.两组贫血患者的血红蛋白浓度(%,X1)及红细胞计数(万/mm3,X2)A组B组X1X2X1X23.92104.82704.21904.71803.72405.42304.01704.52454.42204.62705.22304.42202.71605.92902.42605.52203.62404.32905.51805.13102.92003.3300例1.两组贫血患者的血红蛋白浓度(%,X1)及红细胞计数(万86o检验假设o或两个正态总体均值向量的检验检验假设两个正态总体均值向量的检验87o检验统计量由样本值得两个正态总体均值向量的检验检验统计量由样本值得两个正态总体均值向量的检验88p=0.0030.两个正态总体均值向量的检验p=0.0030.两个正态总体均值向量的检验89两正态总体协方差阵不等时均值向量的检验情形2 i.i.d于 i.i.d于 检验统计量及其分布(1)构造新样本:(2)构造统计量:相互独立相互独立两正态总体协方差阵不等时均值向量的检验情形2 90两正态总体协方差阵不等时均值向量的检验情形3 i.i.d于 i.i.d于 检验统计量及其分布(1)构造新样本:(2)构造统计量:相互独立且 相互独立.两正态总体协方差阵不等时均值向量的检验情形3 91多个正态总体均值向量的检验多元方差分析多元方差分析oMultivariate analysis of variance,MANOVAo一元方差分析的基本思想:n对方差的分解o多元方差分析的基本思想:n对方差-协方差阵的分解。多个正态总体均值向量的检验多元方差分析多元方差分析Mul92一元方差分析k 个一元正态总体均值向量的检验零假设 相互独立相互独立i.i.d于i.i.d于总偏差平方和组内偏差平方和组间偏差平方和一元方差分析k 个一元正态总体均值向量的检验零假设 相互93一元方差分析平方和分解公式 SST=SSA+SSE多元方差分析设第i个p元正态总体 的数据阵为一元方差分析平方和分解公式 SST=SSA+SSE多94总离差阵T的分解总离差阵T=组内离差阵A+组间离差阵B.k 个p元正态总体均值向量的检验零假设 检验统计量及其分布否定域 总离差阵T的分解总离差阵T=组内离差阵A+组间离差阵B.k 95例2.三组贫血患者的血红蛋白浓度(%,X1)及红细胞计数(万/mm3,X2)A组B组C组X1X2X1X2X1X23.92104.82704.42504.21904.71803.73053.72405.42302.92404.01704.52454.53304.42204.62703.32305.22304.42204.51952.71605.92903.82752.42605.52203.73103.62404.32905.51805.13102.92003.3300例2.三组贫血患者的血红蛋白浓度(%,X1)及红细胞计数(万96检验假设 设第i 组为2元正态总体 来自3个总体的样本容量检验:检验假设 设第i 组为2元正态总体 97结论2结论4k 个p元正态总体均值向量的检验取检验统计量结论2结论4k 个p元正态总体均值向量的检验取检验统计量98例2.(续)o三组的均向量和离差矩阵例2.(续)三组的均向量和离差矩阵99o三组的离差矩阵之和(组内变异)o总离差矩阵o组间离差矩阵例2.(续)三组的离差矩阵之和(组内变异)例2.(续)100多元方差分析表变异来源SSCPn组间Bn1=k-1组内An2=n-k总Tn-1多元方差分析表变异来源SSCPn组间Bn1=k-1组内An2101op=2,k=3,n=30:n1=n-k=27,n2=k-1=2;2n2=4,2(n1-1)=52.p=0.001161.例2.(续)p=2,k=3,n=30:例2.(续)102独立性检验(正态总体)t若 ,则 相互独立检验似然比统计量及其分布独立性检验(正态总体)若 103独立性检验独立性检验104正态性检验p元正态分布的性质o每一个变量均服从正态分布。o变量的线性组合服从正态分布。op 元正态分布中的任意 k(0km)个变量服从 k 元正态分布。op元正态分布的条件分布仍服从正态分布。o协方差为0的变量间相互独立。o正态随机向量的概率密度等高线为椭球。正态性检验p元正态分布的性质每一个变量均服从正态分布。105一维边缘分布的正态性检验 把 p元正态性检验化为 p 个一元数据的正态性检验,常用的方法有以下几种:检验:用于连续型或离散型随机变量分布的拟合优度检验.Kolmogorov 检验:用于连续型分布的拟合优度检验.仅用于正态性检验的方法偏峰(Skewness)检验:在SAS中:关于均值对称的数据其偏度为0;左侧更为分散的数据,其偏度为负,称为左偏;右侧更为分散的数据,其偏度为正,称为右偏。一维边缘分布的正态性检验 把 p元正态性检验化106一维边缘分布的正态性检验峰度(Kortosos)检验:利用峰度研究数据分布的形状是以正态分布为标准(假定正态分布的方差与所研究分布的方差相等)比较两端极端数据的分布情况,若 近似于标准正态分布,则峰度接近于零;尾部较正态分布更分散,则峰度为正,称为轻尾,尾部较正态分布更集中,则峰度为负,称为厚尾.W(Wilks)检验和D检验.(0W1)W统计量是基于次序统计量线性组合平方的方差最佳估计与通常校正平方和估计之比.当样本来自正态总体时,由样本构造的W的值接近1.若一维边缘分布的正态性检验峰度(Kortosos)检验:107一维边缘分布的正态性检验Q-Q(Quantile-Quantile)图形检验法.P-P(Probability-Probability)图形检验法.QQ图是一种散点图。对应于正态分布的QQ图由点 构成,其横坐标为标准正态分布的分位数,纵坐标 x(i)(i=1,2,n)是将x1,xn从小到大排序后的数列,为总体i/n分位点的估计。若观测数据近似正态分布N(,2),则QQ图上这些点近似在直线y=x+附近。(n2000时,采用D统计量,若 否定正态性假设.一维边缘分布的正态性检验Q-Q(Quantile-Quan108(1)分布函数与分位数 设随机变量X的分布函数为 ,若 则称 是 的上侧 分位数或 的 下侧分位数.此时有:F的的 上上侧分位数分位数F的的 下下侧分位数分位数Q-Q图形检验法(1)分布函数与分位数F的 上侧分位数F的 109(2)样本分布函数 设 为一组样本,将它们按大小序排列:,于是样本分布函数为:(2)样本分布函数110(3)X 的样本分位数 将 按大小序排列:它的样本分布函数为:于是,的 下侧分位数分别是:样本分位数本分位数(3)X 的样本分位数样本分位数111(4)X 的理论分位数 由 的 理论下侧分位数可以通过查标准正态分布表得到:若 X 确实服从 理理论分位数分位数(4)X 的理论分位数 理论分位数112(5)Q-Q图(5)Q-Q图113 原则检验法:若 则 检验法.比较样本经验分布函数与原假设指定的分布函数间的差异来检验原假设。等概椭圆检验法.(二元数据的正态性检验).统计量的Q-Q图(或P-P图)检验法.(p元数据的正态性检验).原则检验法:若 114正态性检验的SAS实现家庭编号地区编号家庭总收入家庭总支出家庭编号地区编号家庭总收入家庭总支出121794155016222002060221716136517127302236313410273018124961455421765153019117601040522184190020128202366622050205021222501966722460218422131702400811976117023212001250912850249624217761350101427527602521980179411220101275261245525501212236181027210801380131330528202821986120014124001976291336923051522250197030215301316不同地区居民家庭收入和支出情况正态性检验的SAS实现家庭编号地区编号家庭总收入家庭总支出家115多元统计应用分析课件116多元统计应用分析课件117多元统计应用分析课件118多元统计应用分析课件119多元统计应用分析课件120data bldk1(8个字符以内);Input num($)x1 x2 x3 x4 x5;(;)(label num=分行编号 x1=不良贷款(亿元);Cards;1 0.9 67.3 6.8 5 51.9;Run;编写SAS数据文件data bldk1(8个字符以内);编写SAS数据文件121多元统计应用分析课件122在Insight模块中绘制分布拟合图和QQ图在Insight中打开数据集sryzc;选择主采单analyse distributions.在Insight模块中绘制分布拟合图和QQ图在Insight123多元统计应用分析课件124多元统计应用分析课件125多元统计应用分析课件126多元统计应用分析课件127多元统计应用分析课件128多元统计应用分析课件129多元统计应用分析课件130多元统计应用分析课件131多元统计应用分析课件132在Analyze中绘制分布拟合图和QQ图在Analyze中打开数据集sryzc;选择主采单statistc descriptive distributions.在Analyze中绘制分布拟合图和QQ图在Analyze中打133多元统计应用分析课件134多元统计应用分析课件135多元统计应用分析课件136多元统计应用分析课件137多元统计应用分析课件138多元统计应用分析课件139多元统计应用分析课件140多元统计应用分析课件141多元统计应用分析课件142多元统计应用分析课件143多元统计应用分析课件144多元统计应用分析课件145
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!