《公共行政研究方法》课件第七讲 数据的测度与品质(新版包含指数部分)

上传人:考试不挂****2941... 文档编号:242917965 上传时间:2024-09-11 格式:PPT 页数:29 大小:239KB
返回 下载 相关 举报
《公共行政研究方法》课件第七讲 数据的测度与品质(新版包含指数部分)_第1页
第1页 / 共29页
《公共行政研究方法》课件第七讲 数据的测度与品质(新版包含指数部分)_第2页
第2页 / 共29页
《公共行政研究方法》课件第七讲 数据的测度与品质(新版包含指数部分)_第3页
第3页 / 共29页
点击查看更多>>
资源描述
,*,Click to edit Master title style,29,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,测量的合理性,(validity),测量的合理性,解决的是测量工具与概念及其所指事物或指标的对应性问题,即测量的直接客体是否客观反映了所欲测量的对象。,why,合理性?,社会科学的研究客体通常是抽象概念,缺乏直接可测量对象,则在指标和概念之间存在对应性问题。,三种合理性指标:,更适于做否定而非肯定的结论,。,1,,内容合理性,(content validity),:,考察一个测量工具在多大程度上测量了所欲测量的概念的有关方面。,(,1,)表面合理性,(face validity),:研究者对测量工具合理性的主观判断,通常使用专家判别法,取得某种形式的共识(德尔菲法)。,(,2,)抽样合理性,(sampling validity),:测量的内容,即测量所用的陈述、问题和指标,是否充分代表了被测量的属性。假定存在相关内容的总体,合理的测量工具包含了其具有代表性的组成部分。例如公共行政博士论文的质量(研究问题、合理性、理论相关性、因果性、重要性和创新性),1,29,测量的合理性,2,,经验合理性,(empirical validity),:,当存在对于一个概念的合理的指标时,考察使用测量工具可以多大程度预测该指标(外部标准)的结果。例:测量政治保守性 (假定阶层是外在标准)。,方法:,计算在目标测量工具和外部标准下获得测量结果的相关性,该相关系数就叫做合理性系数,(validity coefficient),。,问题:,1,,为什么不直接使用该外部标准?(成本、研究意图等),2,,外部标准的合理性问题?,2,29,测量的合理性,3,,概念合理性,(construct validity),:,考察一个测量工具是否测量了其所欲测量的概念的变量而非其它变量(尤其针对易于混淆的概念)。,方法是在一个大的理论框架中,确定与该概念变量所可能相关和不相关的变量。测验该变量的测量结果与这些变量的测量结果之间的关系。,研究步骤,1,,研究者提出对于某一特定属性的测量,2,,研究该属性所在的一般理论框架,3,,在该理论框架内,预计那些与该属性(及其测量)相关或者不相关的属性,4,,收集数据,验证第,3,步所作出的预期,3,29,概念合理性,Case,待测属性,与之高度相关的变量,与之高度不相关的变量,1,2,3,4,5,6,7,8,.,相关系数,r1,r2,r3,r4,r5,r6,4,29,测量误差,(measurement error),测量误差:测量值与真实值的差异部分,即:,e = M T,e,是误差,,M,是测量值,,T,是真实值,测量误差的来源,1,,特定属性的干扰:与被测量对象相关的属性的干扰,例如测量道德发展水平时,受到人的智力和社会认知的影响,因而可能无法准确反映道德水平的差异。,2,,临时因素的影响,3,,测量环境的区别,4,,测量过程的掌握,5,,对数据的判断、编码,分类:系统误差和随机误差,5,29,测量的可信性,(reliability),测量的可信性指在假定测量的,validity,没有问题情况下,测量误差的存在程度,即测量结果的操作方面的精确度的问题。,在实际测量中,因为真实值只是一种概念上的存在,因此可信性不是直接计算误差的程度,而是寻找不同测量结果的相关性,是一种间接的方法。因此同样更适合作否定而非肯定的结论。,6,29,可信性的检测方法,1,,测验,-,再测验方法,(test-retest method),:即在两次不同时点测试,比较两次测验结果的不同。如果真实值没有变化,则测试值的不同可能意味着测试工具的不稳定。,可信性,=,r,xx,x and x,是测验和再测验值;,r,xx,是两次测验值的相关性。,问题:,1,,虚增的可信性:例如由于,pretest,的效应,2,,虚减的可信性:例如当真实值的确变化时,7,29,6,个组织的问卷测试,-,再测试结果,两次反馈的,间隔天数,存在回答差,异的题数,存在差异,的评估,类题数,评估类题前后回答差异的绝对值(评估题采取了,5,刻度,Likert,Scale,),1,2,3,4,平均,组织,1,27,19,18,16,1,1,0,1.17,组织,2,25,25,20,14,5,0,1,1.40,组织,3,35,18,14,11,2,1,0,1.29,组织,4,7,27,23,11,9,3,0,1.65,组织,5,21,17,13,12,1,0,0,1.08,组织,6,13,20,15,11,3,1,0,1.33,平均,21,21,17,12.5,3.5,1,0.17,1.32,8,29,可信性的检测方法,-,续,2,,平行形式的技巧,(parallel-form technique),:即发展一个类似的测量工具,比较两个工具的测量结果的相关性。克服了时间因素,但是主要问题在于该两个工具是否测量同一概念。,可信性,=,r,xx,x and x,是原测量工具和平行测量工具的测验值;,r,xx,是两次测验值的相关性。,9,29,可信性的检测方法,-,续,3,,内在一致性测验,(internal consistency),:,测验一个测量工具的多个构成部分,(items),被拆分(,split-half,)成两个单独的测量时,是否相互收敛。前提是该测量工具本身发展了多个,item,用以测量一个单独的概念,(construct),。,方法:将偶数和奇数的,item,各自组合成一个测量,发现它们的测量结果的相关性。,可信性,=2r,oe,/(1+,r,oe,),r,oe,是偶数,item,与奇数,item,的测量结果的相关系数。,10,29,内在一致性测验,Case,属性,第一组,item,第二组,item,1,集体凝聚力,参与,互助行为,接触频率,熟悉程度,集体活动频率,孤独感,2,3,4,5,6,7,8,.,11,29,数据准备,数据准备是从研究过程中提取数据的过程,包含数据的编码、具体的获取、以及整理和存储,使得数据可以直接满足分析需要。,编码,(code),:被分配给某一现象的数值。,编码方案,(coding scheme),:对一个现象的可能值进行分类而形成的类别系统,即对于编码的系统化。,例:对于职业的编码方案,12,29,对于职业的编码方案,职业的概念下存在多种形式:,律师,兽医,行政官,经理,工程师,广告代理,经纪人,理发师,机场调度人员,港口搬运员,建筑工人,环卫人员,1.,专业管理人员,2.,销售和技术人员,3.,熟练劳动力,4.,非熟练劳动力,5.,其他,13,29,编码的原则 (,rules of coding,),数字的赋予首先是有意义的,也包含了约定俗成,演绎式编码,演绎式编码以理论为指导,通过理论来构建测量的变量、变量的内容(,items,)、并设定对变量编码的种类。,所谓的理论,可以是科学理论、人们的观点、法律与政策的规定,等等。,例如,涂尔干对社会的划分,例如,对社会组织的分类,14,29,编码的原则,-,续,归纳式编码:,当研究是探索性的、缺乏理论指导时,研究者根据代表性样本对试验性问题的反馈、根据参与式观察或者其他文件材料而设定编码方案,并推广到更大领域的被调查对象。,归纳式编码的例子,妇女对于家庭暴力的反应模式,问题:如果丈夫具有家暴倾向,你认为该妇女该如何做?,1,,找组织:妇联或对方所在单位,2,,忍受,3,,法律途径,4,,以暴易暴,5,,找父母,6,,其他,请说明,_,15,29,编码的原则,-,续,编码种类的形式原则:,1.,互斥性:被调查对象不能同时作出两种或以上的反应。,例:学生居住的类型(,1,)住宿舍,(,2,)与父母住,(,3,)校外居住,(,4,)与配偶住,2.,穷尽性:被调查对象一定被编码方案所涵盖。,3.,明细程度:研究者根据研究的问题和需要设定编码方案的详细程度。通常可以将已有的编码种类进行分解或者归并,以达到需要的明细程度。,分类要足够特定,用尽可能少的种类捕捉到需要展示的区别,当缺乏分类依据时,增加种类,在有意义的范围类进行明细化,16,29,编码本的设计,编码本将所有编码方案的信息汇总,即汇总了所有变量以及其信息的编码,编码本的形式,和数据文件的形式对应,包含了变量的代号、简要提示信息、编码方案、所占用的列数(文本文件)、缺失值的代码,以及其他的特别规则,功能,17,29,编码本的样式:城市贫困人口生活状况的调查,变量名提示信息编码方案,变量字段数,ID,识别号,001-999 1-3,Q1,受教育水平,4,1=,小学,2=,初中,3=,高中,Q2,性别,5,0=,男,1=,女,Q3,月均收入 实际数,6-9,Q4,健康程度,10,1=,优异,2=,良好,Q5,家庭状况,11,0=,有法定配偶,1=,其他,缺失值代码为,9,,,99,,或者,999,,根据变量长度而定,18,29,00129435354543446432742543242545439768963768996378648634464327425432425,00220439768963768996378648632545439768963768996378648632545439768963768,00310637864863446444643274254324254544464327425432425454397689637689963,00430648633976896376899637864863344643274254324254543976896376899637446,00591274254324254543976896376899637864863864864464327425432425454397689,00611999996378648633274254344643274254324254464444643274254324254543976,00711637689963786486364327425432425454397689637689963786486343274254324,00830454397689637689963786486345439768963768996378648632425454397689637,00921996378644464327425432425454397689637689963786486386344643274254324,编码本的样式:城市贫困人口生活状况的调查,变量名提示信息 编码方案变量字段数,ID,被调查者识别号,001-9991-3,Q1,最高受教育水平,1=,小学,4,2=,初中,3=,高中及以上,Q2,性别,5,0=,男,1=,女,Q3,月均收入,实际数,6-9,缺失值代码为,9,,,99,,或者,999,,根据变量长度而定,19,29,公共行政博士论文信息的编码,(,EXCEL),SPSS,文档的编码,20,29,信息编码过程的可信性问题,1,,机械错误,2,,理解偏差,在原信息源上编码的原则:,1,,编码内容用红笔标出,2,,完全保留原问卷或访谈信息,3,,标明存疑处,用回形针标明页面,4,,对“其他”,“没有回答”,“问题不适用”,“不知道答案”等情况,要有清楚的编码原则。,21,29,指数,(index),构建,指数,是一种复合的测量工具,基于多个变量并按一定规则形成。一个指数可以包含多个维度,(dimension),,指数需要将这些不同维度结合起来,。,指数的功能:,直观表达某一个概念,更加准确和可信,其定量信息可以做精确的统计计算,指数的构建,1,,确定指数的目的:,a,寻找已存在或类似的指数;,b,发现相关的理论和实践,2,,确定指数的数据构成:测量的合理性和可信性,3,,选择比较的基数:指数通常需要比较才有意义,因此常常以比例、百分比、比率的形式表达。基数是可以变换的。,4,,指数形成中的加权:构成指数的指标(变量)的重要性不一定是完全一致的。,22,29,消费者物价指数,(Consumer Price Index),消费者物价指数,反映了物价随年份的变动趋势。通常选取一组有代表性的商品来计算其物价变动趋势。,全国居民消费价格指数涵盖全国城乡居民生活消费的食品、烟酒及用品、衣着、家庭设备用品及维修服务、医疗保健和个人用品、交通和通信、娱乐教育文化用品及服务、居住等八大类、,262,个基本分类的商品与服务价格。,数据来源于全国,31,个省(区、市),500,个市县、,6.3,万家价格调查点,包括食杂店、百货店、超市、便利店、专业市场、专卖店、购物中心以及农贸市场与服务消费单位等。,23,29,构成和各部分比重,2011,年最新调整为,1,食品,31.79%,2,烟酒及用品,3.49%,3,居住,17.22%,4,交通,通讯,9.95%,5,医疗保健个人用品,9.64%,6,衣着,8.52%,7,家庭设备及维修服务,5.64%,8,娱乐,教育文化用品及服务,13.75%,24,29,假定只有,A-D,四种代表性商品,存在,2000-2004,年的价格变化如下,商品,2000,2001,2002,2003,2004,A,3.12,元,4.14,4.9,5.8,6.1,B,5.4,5.6,5.1,6.4,7.18,C,6.62,8.1,9,8.35,7.9,D,4.9,5.4,5.1,7.25,6.8,总值,20.13,23.24,24.1,27.8,27.98,PI,指数,100,115.45,119.72,138.1,139,25,29,指数的不同形式,商品,2000,2001,2002,2003,2004,2000,年消费量,A,3.12,元,4.14,4.9,5.8,6.1,20,B,5.4,5.6,5.1,6.4,7.18,40,C,6.62,8.1,9,8.35,7.9,15,D,4.9,5.4,5.1,7.25,6.8,50,总值,20.13,23.24,24.1,27.8,27.98,PI,指数,100,115.45,119.72,138.1,139,转换基数,?,?,100,?,?,环比,PI,指数,100,115.45,?,?,?,加权,PI,指数,加权指数:既考虑不同指标的重要性,例如,用消费量的多少来考虑各种商品在决定物价水平上的重要性。,未加权指数:,PI = ,Pn/Pb,*100,加权指数:,PI = ,PnQ/PbQ,* 100,26,29,构建态度的指数,态度指数又称作态度的尺度,(scale),,测量人们对某一事物的看法。,例:关于,异化,程度的测量,请选出对以下问题的你的看法,1,,强烈同意,2,,同意,3,,既不同意也不反对,4,,不同意,5,,强烈不同意,有时我发现别人在利用我,我只是社会机器上的一个螺钉,未来前景黯淡,我对于今天周围发生的一切越来越感觉无力,像我这样的人没有社会影响力,27,29,莱克尔特尺度,(,Likert,Scale),程序,1,,组合可能的尺度项,(items),,取,5,点或,7,点的编码方案,2,,随机抽样,取被调查者在所有尺度项上的反馈,3,,计算每个被调查者,(case),的总分数,(分数由顺序测量转为间距测量),4,,确定各尺度项的判别能力,(discriminative power: DP),方法:,1,,内部连贯性:测试各尺度项与总分的相关性,2,,判别能力法:每一个尺度项对所有人的区分作用,具体:在某一个尺度项上对所有人排序,取出,1/4,的最大值和,1/4,的最小值,分别计算它们的加权平均分,再求出差值,DP,。常常以,2,为标准。,5,,选择尺度项:选取相关性高或者判别能力强的项,6,,测试可信性:,split-half reliability test,通常用,0.7,作为一个可接受的水平,28,29,判别能力,(discriminative power),组,组内人数,1,2,3,4,5,加权总分,平均分,DP,高(,1/4,的最大值),9,0,1,2,3,3,35,3.89,2,低(,1/4,的最小值),9,1,8,0,0,0,17,1.89,加权总分,=,分数*组内选择该分数的人数,平均分,=,加权总分,/,所有该组的人数,29,29,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!