统计学ppt课件-列联分析

上传人:txadgkn****dgknqu... 文档编号:241569890 上传时间:2024-07-05 格式:PPT 页数:31 大小:388.84KB
返回 下载 相关 举报
统计学ppt课件-列联分析_第1页
第1页 / 共31页
统计学ppt课件-列联分析_第2页
第2页 / 共31页
统计学ppt课件-列联分析_第3页
第3页 / 共31页
点击查看更多>>
资源描述
列联分析列联分析列联分析1列联表中的卡方检验列联表中的卡方检验列联表中的相关性测量列联表中的相关性测量列联表中的卡方检验列联表中的相关性测量2 某集团公司打算进行一项改革,但此项改革涉及到各分公司的某集团公司打算进行一项改革,但此项改革涉及到各分公司的利益。今采用抽样方法分别从下设的四个分公司中共抽取利益。今采用抽样方法分别从下设的四个分公司中共抽取420名职名职工了解对此项改革的看法。如果四个分公司对改革的看法一致,则工了解对此项改革的看法。如果四个分公司对改革的看法一致,则决定实施这项改革。调查结果如下表所示:决定实施这项改革。调查结果如下表所示:公司1公司2公司3公司4合计赞成68755779279反对32453331141合计10012090110420关于改革方案调查结果的样本数据关于改革方案调查结果的样本数据列联表列联表是描述两个分类变量的频数分布表。是描述两个分类变量的频数分布表。列联表中的卡方检验 某集团公司打算进行一项改革,但此项改革涉及到各分3 C1C2C3C4合计R1f11f12f13f14RT1R2f21f22f23f24RT2R3f31f32f33f34RT3合计CT1CT2CT3CT4nRC列联表取值多的变量表示为列变量取值少的变量表示为行变量列变量单元频数的合计行变量单元频数的合计样本容量单元观察频数列联表的一般结构列联表的一般结构列联表中的卡方检验 C1C2C3C4合计R1f11f12f13f4公司公司1公司公司2公司公司3公司公司4合计合计赞成赞成频数频数68755779279比率比率%68.062.563.371.866.4反对反对频数频数32453331141比率比率%32.037.536.728.233.6合计合计频数频数10012090110420比率比率%100100100100100赞成或反对的比率的样本数据赞成或反对的比率的样本数据从样本数据上看,各公司的赞成(反对)比率存在差异。从样本数据上看,各公司的赞成(反对)比率存在差异。从样本到总体的外推可通过假设从样本到总体的外推可通过假设检验完成。检验完成。赞成的比率一致。赞成的比率一致。赞成的比率不一致。赞成的比率不一致。列联表中的卡方检验公司1公司2公司3公司4合计赞成频数68755779279比5如果 为真,则总比率对各公司都适用。于是可根据总比率得出各单元的期望频数。公司1公司2公司3公司4合计赞成68755779279反对32453331141合计10012090110420公司1公司2公司3公司4合计赞成66806073279反对34403037141合计10012090110420 观察频数(观察频数(observed frequency 简写简写f0)期望频数(期望频数(expected frequency 简写简写fe)总赞成比率:总赞成比率:总反对比率:总反对比率:该单元的期望频数该单元的期望频数该单元所在行总频数该单元所在行总频数该单元所在列总频数该单元所在列总频数样本容量样本容量列联表中的卡方检验如果 为真,则总比率对各公司都适用。于是可根据总比率604260.000.050.100.150.250.208100.30观察频数与期望频差异的观察频数与期望频差异的大小以大小以 统计量衡量。统计量衡量。统计量服从自由度为 的分布。自由度为3 的分布自由度为1 的分布自由度为10 的分布自由度为20 的分布列联表中的卡方检验04260.000.050.100.150.250.20817寻找自由度 自由度是可以自由取值的数据个数。列联自由度是可以自由取值的数据个数。列联表中的行与列的总和是固定的。总有一行和一列表中的行与列的总和是固定的。总有一行和一列的取值不是自由的。自由度的取值不是自由的。自由度=(R-1)()(C-1)=(2-1)()(2-1)。)。C1C2合计R1f11f12RT1R2f21f22RT2合计CT1CT2n列联表中的卡方检验寻找自由度 自由度是可以自由取值的数据个数。列联8公司1公司2公司3公司4合计赞成68755779279反对32453331141合计10012090110420 关于改革方案调查结果样本数据列联表的自由度关于改革方案调查结果样本数据列联表的自由度自由度自由度=列联表中的卡方检验公司1公司2公司3公司4合计赞成68755779279反对39自由度用以衡量列联表的大小。自由度用以衡量列联表的大小。C1C2C3C4合计R1f11f12f13f14RT1R2f21f22f23f24RT2R3f31f32f33f34RT3合计CT1CT2CT3CT434列联表26列联表列联表C1C2C3C4合计R1f11f12f13f14RT1R2f21f22f23f24RT2R3f31f32f33f34RT3合计CT1CT2CT3CT4C1C2C3C4C5C6合计R1f11f12f13f14f15f16RT1R2f21f22f23f24f25f26RT2合计CT1CT2CT3CT4CT5CT6列联表中的卡方检验自由度用以衡量列联表的大小。C1C2C3C4合计R1f11f10687557793245333166806073344030372-5-36-253-64259364259360.06060.31250.15000.49320.11760.62500.30000.97303.0319列联表中的卡方检验6866240.0606列联表中的卡方检验116.2513.0319拒绝域拒绝域接受域接受域结论:结论:接受接受“赞成的比率一致赞成的比率一致”的原假设。即的原假设。即集团公司所属四个分公司的全体职工一致赞集团公司所属四个分公司的全体职工一致赞成此项改革。样本数据中赞成比率的差异由成此项改革。样本数据中赞成比率的差异由抽样的随机性所造成。抽样的随机性所造成。自由度为3的 分布经计算经计算查表得临界值查表得临界值已知已知自由度=0列联表中的卡方检验6.2513.0319拒绝域接受域结论:自由度为3的 12 某啤酒厂生产三种类型啤酒:淡啤酒、普通啤酒、黑啤酒。会议上某啤酒厂生产三种类型啤酒:淡啤酒、普通啤酒、黑啤酒。会议上有人提出男性与女性饮酒者啤酒偏好是否相同的问题。若不同,公司将有人提出男性与女性饮酒者啤酒偏好是否相同的问题。若不同,公司将针对不同的目标市场采取不同的推销策略;若相同,公司将发起对所有针对不同的目标市场采取不同的推销策略;若相同,公司将发起对所有啤酒的广告运动。啤酒的广告运动。淡啤普啤 黑啤合计男性20402080女性30301070合计507030150男性与女性饮者啤酒偏好的样本数据男性与女性饮者啤酒偏好的样本数据列联表中的卡方检验 某啤酒厂生产三种类型啤酒:淡啤酒、普通啤酒、黑13从样本数据上看,男性与女性的啤酒偏好比率存在差异。从样本数据上看,男性与女性的啤酒偏好比率存在差异。淡啤普啤 黑啤合计频数比率%频数比率%频数比率%频数比率%男性2025.04050.02025.080100女性3042.93042.91014.270100合计5033.37046.73020.0150100 从样本到总体的外推应通从样本到总体的外推应通过假设检验完成。过假设检验完成。不同性别饮酒偏好比率的样本数据不同性别饮酒偏好比率的样本数据男性与女性啤酒偏好相同男性与女性啤酒偏好相同男性与女性啤酒偏好不同男性与女性啤酒偏好不同列联表中的卡方检验从样本数据上看,男性与女性的啤酒偏好比率存在差异。淡啤普啤 14 如果如果H0为真,则代表饮酒偏好的总比为真,则代表饮酒偏好的总比率对男性和女性饮酒者都适用,于是可根率对男性和女性饮酒者都适用,于是可根据总比率得出各单元的期望频数。据总比率得出各单元的期望频数。淡啤普啤 黑啤合计男性26.6737.3316.0080女性23.3332.6714.0070合计507030150观察频数(观察频数(observed frequency 简写简写f0)期望频数(期望频数(expected frequency 简写简写fe)总比率:总比率:淡淡啤啤普普啤啤黑黑啤啤淡啤普啤 黑啤合计男性20402080女性30301070合计507030150式中:式中:该单元的期望频数该单元的期望频数该单元所在行总频数该单元所在行总频数该单元所在列总频数该单元所在列总频数样本容量样本容量期望频数:期望频数:列联表中的卡方检验 如果H0为真,则代表饮酒偏好的总比率对男性和女性15注意:注意:用用 进行假设检验时,每一单元的期望频数至少为进行假设检验时,每一单元的期望频数至少为5。当某一单。当某一单元的期望频数小于元的期望频数小于5时,通常将相邻的类合并以使每一单元的期望频数时,通常将相邻的类合并以使每一单元的期望频数大于或等于大于或等于5。服从自由度为(服从自由度为(R-1)()(C-1)的)的 分布。分布。列联表中的卡方检验注意:服从自由度为(R-1)(C-1)的 分布。列16性别性别偏好偏好男男男男男男女女女女女女淡啤淡啤普啤普啤黑啤黑啤淡啤淡啤普啤普啤黑啤黑啤20402030301026.6737.3316.0023.3332.6714.00-6.672.674.006.67-2.67-4.0044.497.1316.0044.497.1316.001.670.191.001.910.221.146.13判定饮酒偏好是否与饮酒者性别有关所需检验统计量的计算判定饮酒偏好是否与饮酒者性别有关所需检验统计量的计算列联表中的卡方检验性别偏好男淡啤2026.67-6.6744.491.67判定17结论:结论:拒绝拒绝 “男性与女性啤酒偏好相同男性与女性啤酒偏好相同”的原假设并接受的原假设并接受“男性与女性啤酒偏好不同男性与女性啤酒偏好不同”的备择假设。即啤酒的偏好的备择假设。即啤酒的偏好与性别是有关联的。与性别是有关联的。已知:已知:自由度自由度=查表得临界值:查表得临界值:经计算:经计算:列联表中的卡方检验结论:已知:自由度=查表得临界值:经计算:列联表中的卡方检验18相关系数相关系数C相关系数相关系数V相关系数相关系数列联表中的相关性测量相关系数C相关系数V相关系数列联表中的相关性测量19相关系数计算公式相关系数计算公式适用于适用于2 2列联表列联表C1C2合计合计R1aba+bR2cdc+d合计合计a+cb+dn22列联表列联表无相关无相关完全相关完全相关弱相关弱相关中度相关中度相关高度相关高度相关相关系数相关系数计算公式适用于2 2列联表C1C2合计R1aba+20C1C2合计R1aba+bR2cdc+d合计a+cb+dn22列联表列联表化简得:可充当测量相关性的尺度。可充当测量相关性的尺度。即:即:因为因为于是得:于是得:变量变量 与变量与变量 不相关时,有不相关时,有因此,因此,相关系数C1C2合计R1aba+bR2cdc+d合计a+cb+dn22122列联表列联表完全相关的两种情况完全相关的两种情况C1C2合计R1a0a+bR20dc+d合计a+cb+dn22列联表列联表C1C2合计R10ba+bR2c0c+d合计a+cb+dn相关系数22列联表完全相关的两种情况C1C2合计R1a0a+bR222 相关系数与相关系数与 统计量的关系统计量的关系或或相关系数 相关系数与 统计量的关系或相关系数2322列联表列联表C1C2合计R1aba+bR2cdc+d合计a+cb+dn22列联表C1C2合计R1aba+bR2cdc+d合计a+24 丹麦人与法国人以同样的眼光看丹麦人与法国人以同样的眼光看待陌生人吗?一次抽样调查中就待陌生人吗?一次抽样调查中就“你你认为大多数人都可信赖呢?还是认为认为大多数人都可信赖呢?还是认为与人相处要处处小心?与人相处要处处小心?”这一问题,这一问题,获得数据如下表。获得数据如下表。要求:判定要求:判定“国籍国籍”与与“态度态度”两变量间的相关性。两变量间的相关性。丹麦法国合计信任625206831怀疑3607631123合计985969195422列联表列联表相关系数比较适用于相关系数比较适用于22列联表。列联表的行数和列数大于列联表。列联表的行数和列数大于2时,时,相关系相关系数会出现大于是数会出现大于是1情况。情况。相关系数 丹麦人与法国人以同样的眼光看待陌生人吗?一次抽样25适用于大于适用于大于2 2列联表列联表列联表223344C的最大值0.70710.81650.87的最大值依赖于列联表的行列数的最大值依赖于列联表的行列数无相关无相关相关系数(列联系数)计算公式相关系数(列联系数)计算公式C相关系数适用于大于2 2列联表列联表223344C的最大值026 一种原料来自三个不同的地区,原料质量被分成三一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取个不同等级。从这批原料中随机抽取500件进行检验,件进行检验,得样本数据如下表所示:得样本数据如下表所示:一级二级三级合计地区1526424140地区2605952171地区3506574189合计162188150500原料抽样数据原料抽样数据要求:检验地区与原料质量之间有无依赖关系。要求:检验地区与原料质量之间有无依赖关系。C相关系数 一种原料来自三个不同的地区,原料质量被分成三个27性别偏差11122233312312312352642460595250657445.3652.6442.0055.4064.3051.3061.2471.0656.706.6411.36-18.004.60 5.300.70-11.24-6.0617.3044.09129.05324.0021.1628.090.49126.3436.72299.290.972.457.710.380.440.012.060.525.28合计19.82为判定地区是否与原料质量相关所需为判定地区是否与原料质量相关所需 统计量的计算统计量的计算C相关系数性别偏差115245.366.6444.090.97合计28统计学ppt课件-列联分析29适用于大于适用于大于2 2列联表列联表计算结果表明:计算结果表明:“地区地区”与与“原料质量原料质量”之间低度相关。之间低度相关。列联表行数和列数列联表行数和列数中较小者。中较小者。相关系数计算公式相关系数计算公式V相关系数解决了相关系数无上界和C相关系数小于1的情况。两个变量无相关时V=0;两个变量完全相关时V=1。V相关系数适用于大于2 2列联表计算结果表明:“地区”与“原料质量”30结 束结 束31
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!