社会统计学第3章简化两个变量的分布课件

上传人:20****08 文档编号:241506921 上传时间:2024-06-30 格式:PPT 页数:42 大小:853.25KB
返回 下载 相关 举报
社会统计学第3章简化两个变量的分布课件_第1页
第1页 / 共42页
社会统计学第3章简化两个变量的分布课件_第2页
第2页 / 共42页
社会统计学第3章简化两个变量的分布课件_第3页
第3页 / 共42页
点击查看更多>>
资源描述
第三章第三章 第三章简化两个变项的1 第一节第一节 第一节 统计相关的2 什么是相关?什么是相关?b是指一个变项的值与另一个是指一个变项的值与另一个变项的值有连带性,即,如果变项的值有连带性,即,如果一个变项的值发生变化,另一一个变项的值发生变化,另一个变项的值也有变化,则两个个变项的值也有变化,则两个变项就是相关了。变项就是相关了。什么是相关?是指一个变项的值与另一个变项的值有连带性,即,3社会统计学第3章简化两个变量的分布课件4社会统计学第3章简化两个变量的分布课件52、相关方向bb针对定序、定距变项而言,定类变针对定序、定距变项而言,定类变项无方向。项无方向。bb所谓正相关所谓正相关(或称正比或称正比)是指一个变是指一个变项的值增加时,另一变项的值也增项的值增加时,另一变项的值也增加。加。bb所谓负相关所谓负相关(或称反比或称反比)是指一个变是指一个变项的值增加时,另一变项的值却减项的值增加时,另一变项的值却减少。少。2、相关方向针对定序、定距变项而言,定类变项无方向。63、因果关系b分分析析两两个个变变量量的的关关系系时时,除除了了要要注注意意强强弱弱与与方方向向这这两两种种性性质质外外,也也要要注注意意两两个个变变项项是是否否有有因因果关系。果关系。3、因果关系分析两个变量的关系时,除了要注意强弱与方向这两种7自变量与因变量的关系可表示为自变量与因变量的关系可表示为bX XY Y 不对称关系不对称关系b如:性别如:性别吸烟吸烟b也有可能互为因果:也有可能互为因果:X XY Yb例例:同同学学间间交交往往频频次次友友谊谊程度程度 自变量与因变量的关系可表示为XY 不对称关系8二、相关测量种类二、相关测量种类bb 1 1从变量或现象多少看从变量或现象多少看 b 单相关单相关X与与Yb 复相关复相关 两个以两个以b 上影响一个变量上影响一个变量二、相关测量种类 1从变量或现象多少看 92 2从变量变化的形式看从变量变化的形式看b b 直线相关直线相关b b 曲线相关曲线相关2从变量变化的形式看 103 3从测量层次上看从测量层次上看b定类定类-定类定类b定序定序-定序定序b定距定距-定距定距b定类定类-定序定序b定类定类-定距定距b定序定序-定距定距3从测量层次上看定类-定类11 第二节 第二节交互分类与12一、交互分类一、交互分类b所谓交互分类,就是同所谓交互分类,就是同时依据两个变项的值,时依据两个变项的值,将所研究的个案分类将所研究的个案分类 。一、交互分类所谓交互分类,就是同时依据两个变项的值,将所研究13例如:bb某地区调查100名青年人的最大志愿,假定教育水平高的人,选择快乐家庭的5人,理想工作的0人,增广见闻的5人;教育水平中等的快乐家庭30人,理想工作的30人,增广见闻的0人;教育水平低的,快乐家庭5人,理想工作的20人,增广见闻的5人。例如:某地区调查100名青年人的最大志愿,假定教育水平高的人14表表3.1 3.1 100100名青年人教育水平与志愿名青年人教育水平与志愿表3.1 100名青年人教育水平与志愿15结合了两个变项的共同分布,结合了两个变项的共同分布,通常称为列联表通常称为列联表bb从从上上表表中中,我我们们可可以以清清楚楚知知道道在在每每种种教教育育条条件件下下志志愿愿的的次次数数分分布布情情况况。因因此此,这样的表又称为这样的表又称为条件次数表条件次数表。bb在在表表的的最最下下端端是是每每级级教教育育水水平平的的总总次次数数,称称为为边边缘缘次次数数,它它们们的的分分布布情情况况就就称称为为边缘分布边缘分布。bb表表中中的的其其他他次次数数,称称为为条条件件次次数数,表表示示在在自自变变项项的的每每个个值值(条条件件)的的情情况况下下依依变变项的各个值的个案数目项的各个值的个案数目(次数次数)结合了两个变项的共同分布,通常称为列联表从上表中,我们可以清16条件次数表有大小之分条件次数表有大小之分b如如果果我我们们将将依依变变项项放放于于表表的的旁旁边边,自自变变项项放放于于表表的的上上端端,则则表表的的大大小小就就是是横横行行数数目目(r)r)乘乘上上纵纵列列数数目目(c)c),即即表表的的大大小小为为xCxC。这这个个先先后后次次序序的的用用意意,是是表表示示前前者者(依依变变项项)是是受受后后者者(自自变变项项)影影响响的的。条件次数表有大小之分如果我们将依变项放于表的旁边,自变项放17如果b教教育育水水平平由由三三级级变变为为两两级级,但但志志愿愿的的分分类类不不变变,则则表表的的大大小小为为3232b即:即:br r为依变项的取值类型数为依变项的取值类型数(行数行数)bc c为自变项的取值类型数为自变项的取值类型数(列数列数)如果教育水平由三级变为两级,但志愿的分类不变,则表的大小为318二维列联表一般形式如下:二维列联表一般形式如下:二维列联表一般形式如下:19 二、条件百分表二、条件百分表结论表结论表bb条条件件次次数数表表的的缺缺点点,是是难难于于比比较较不不同同条条件件下下的的次次数数分分布布,是是因因为为作作为为基基数数的的边边缘次数各有不同。缘次数各有不同。bb因因此此,为为追追求求相相互互比比较较,从从而而知知道道两两个个变变项项间间的的关关系系,就就必必须须将将各各个个基基数数标标准准化,即在相同的基础上作比较。化,即在相同的基础上作比较。bb最最常常用用的的标标准准化化方方法法,是是将将所所有有基基数数变变成成100100,各各个个条条件件次次数数就就随随而而变变为为百百分分率率,这样制成的表,就是这样制成的表,就是条件百分表条件百分表。二、条件百分表结论表条件次数表的缺点,是难于比20表表3.2 3.2 青年人的教育水平对其志愿的影响青年人的教育水平对其志愿的影响表3.2 青年人的教育水平对其志愿的影响21上表的结论:上表的结论:bb低低等等教教育育水水平平的的青青年年比比其其他他教教育育水水平平的的青青年年更更以以工工作作为为重重,高高等等教教育育与与中中等等教教育育水水平平的的青青年年都都重重视视家家庭庭,但但前前者者比比后后者者更更重重视视见见闻闻,而而后后者者比比前前者者更更重重视视工工作作情情况况,总总的的说说来来,如如果果青青年年人人的的教教育育水水平平不不同同,他他们们的的最最大大志志愿愿也也会会有有分分别别。教育是决定青年人志愿的因素之一。教育是决定青年人志愿的因素之一。上表的结论:低等教育水平的青年比其他教育水平的青年更以工作为22三、百分率的计算方向三、百分率的计算方向bb应该从哪一个方向应该从哪一个方向计算百分率计算百分率?bb常用的规则常用的规则是:是:根据自变项的方向根据自变项的方向(即纵即纵向百分比或列百分比向百分比或列百分比)bb如如果果依依变变项项在在样样本本内内的的分分布布不不能能代代表表其其在在总总体体内内的的分分布布,则则百百分分率率的的计计算算要要根根据据依变项的方向依变项的方向,不在等比情况下抽样。,不在等比情况下抽样。三、百分率的计算方向应该从哪一个方向计算百分率?23例:例:b我我们们在在某某城城市市研研究究破破裂裂家家庭庭(自自变变项项)对对青青少少年年犯犯罪罪行行为为(依依变变项项)的的影影响响 ,如如何何抽抽样样呢?呢?例:我们在某城市研究破裂家庭(自变项)对青少年犯罪行为(依变24bb假定该城市的全部青少年人口中,未犯罪假定该城市的全部青少年人口中,未犯罪的青少年有的青少年有5440054400名名,犯罪青少年有犯罪青少年有960960名,我们决定从未犯罪的青少年中抽名,我们决定从未犯罪的青少年中抽出百分之一来研究,即出百分之一来研究,即544544名。从两名。从两名犯罪青少年中抽出一名来研究,于名犯罪青少年中抽出一名来研究,于是变为是变为480480名。假如这样一个样本犯名。假如这样一个样本犯罪与未犯罪的比例为罪与未犯罪的比例为480480:544=1544=1:1.3,1.3,实际上总体的犯罪与未犯罪的比实际上总体的犯罪与未犯罪的比例为例为960960:5440=15440=1:56.6756.67,显然样本,显然样本不能代表总体。不能代表总体。假定该城市的全部青少年人口中,未犯罪的青少年有54400名,25假定样本收集的资料,次数分假定样本收集的资料,次数分布如下:布如下:假定样本收集的资料,次数分布如下:26依据自变项状况计算百分率依据自变项状况计算百分率依据自变项状况计算百分率27家庭对青少年犯罪行为的影响家庭对青少年犯罪行为的影响28从上表可知:从上表可知:b犯犯罪罪青青少少年年中中,破破裂裂家家庭庭占占30.4%30.4%,大大于于未未犯犯罪罪青青少少年年的的比比率率(8.3%)(8.3%),证证明明家家庭庭破破裂裂是是会会引引起起青青少少年年犯犯罪的。罪的。从上表可知:犯罪青少年中,破裂家庭占30.4%,大于未犯罪青29总的来说总的来说:b绘绘制制条条件件百百分分表表时时,通通常常是是依依据据自自变变项项的的方方向向来来计计算算百百分分率率,但但如如果果依依变变项项缺缺乏乏代代表表性性,就就要要根根据据依依变变项项的的方向。方向。总的来说:绘制条件百分表时,通常是依据自变项的方向来计算百分30 第三节 第三节简化相关与31 一、简化相关一、简化相关b所所谓谓相相关关测测量量法法就就是是以以一一个个统统计计值值表表示示变变项项与与变变项项之之间间的的关关系系,这这个个值值通通常常称为相关系数。称为相关系数。一、简化相关所谓相关测量法就是以一个统计值表示变项与变项32相关测量法有很多种,我们怎样选择呢?bb一一是是要要考考虑虑变变项项的的测测量量层层次次,是是定定类类、定定序序还还是是定定距距变变项项;二二是是要要注注意意两两个个变变项项的的关关系系是是对对称称的的,还还是是不不对对称称的的(这这一一点点不不做做严严格格要要求求);三三是是选选择择的的公公式式最最好好要要有有消消减减误误差差比比例例意意义义,在在实实际际研研究究中中,从从更更多多考考虑虑的的是是一一、三三点。点。相关测量法有很多种,我们怎样选择呢?一是要考虑变项的测量层次33二、消减误差比例二、消减误差比例(PRE)PRE)bb 什么是消减误差比例:表示用一种现象(x)来解释另一种现象(y)时,减少百分之几的误差。二、消减误差比例(PRE)什么是消减误差比例:表示用一种34消减误差比例消减误差比例PREPREbb :表示在不知道X的情况下,我们预测Y值所产生的全部误差bb :表示在知道X的情况下,我们可以根据X的每个值来预测Y值时产生的误差bb -:表示在知道X 的情况下用X预测Y比不知道X预测Y比所减少的误差。消减误差比例PRE :表示在不知道X的情况下,我们预35与相关程度(一)b如果 =0,即以X预测Y不会产生任何误差,则PRE=1,反映X与Y是全相关b如果 =,即以X预测Y所产生的误差等于不以X预测Y所产生的误差,则PRE=0,反映X与Y是无相关。与相关程度(一)如果 =0,即以X预测Y不会产生任何36与相关程度(二)b又如:PRE=0.80,表示用X预测Y可减少80%的误差,反映两者相关程度很高。b又如:PRE=0.08,就表示只能消减8%的误差,即X对Y的影响很小。与相关程度(二)又如:PRE=0.80,表示用X预测Y37从上面公式可知道:0 PRE 1b ,-PRE,X与 Y关系密切b =,PRE=0,X与Y不相关b ,-,PRE,X与Y关系越不密切从上面公式可知道:0 PRE 1 ,-38例题:抽取100个样本研究性别与吸烟的关系。bb1 1已已知知吸吸烟烟者者3030人人,不不吸吸烟烟者者70 70 人人,若若不不给给任任何何条条件件,要要求求你你猜猜每每个个人人是是否否吸吸烟烟,怎怎样样猜猜?被被猜猜对对者者占百分之几?占百分之几?bb2 2若若已已知知性性别别与与吸吸烟烟者者的的关关系系如如下下表表,要要你你猜猜每每个个人人是是否否吸吸烟烟,被被猜猜错错者者比比不不给给性性别别条条件件时时的的被被猜猜错错者者少百分之几?少百分之几?例题:抽取100个样本研究性别与吸烟的关系。1已知吸烟者339 性别与吸烟 性别与吸烟40解:bb1.吸烟或不吸烟属于定类测量层次,因此,用众数猜,这样被猜对者占70/100=70%,则 猜 错:E1=100%-70%=30%。bb2.在知道性别的情况下,猜是否吸烟被猜错的比例为:解:1.吸烟或不吸烟属于定类测量层次,因此,用众数猜,这样被41因此b在知道性别的情况下,用性别预测下行抽烟可减少的误差:bPRE=因此在知道性别的情况下,用性别预测下行抽烟可减少的误差:42
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!