资源描述
社会科学研究方法,1,第四章 测量与操作化,测量的信度和效度,概念的具体化与操作化,测量的概念与层次,1 测量的概念与层次,一、所谓测量(Measurement) 定义:根据一定的法则,将某种物体或现象所具有的属性或特征用数字或符号表示出来的过程。 作用:确定一个特定分析单位的特定属性的类别或水平。,二、测量的四个要素,测量客体 测量内容 测量法则 数字和符号,(1)测量客体:,即测量的对象 用数字或符号来进行表达、解释和说明的对象。 “测量谁”,(2)测量内容,测量客体的某种属性或特征 “测量什么” 例1:桌子高度、宽度、颜色等 例2:人性别,年龄,社会背景等,(3)测量法则,用数字和符号表达事物各种属性或特征的操作规则。 是不同特征或属性的标准 “怎么测” 例:桌子的高度-以米为衡量标准,收入情况,有效测量法则的条件:,准确性 所指派的数字或符号能够真实、可靠、有效地反映调查对象在属性和特征上的差异。 如,英语80分与60分 完备性 能够包括研究变量的各种状态或变异。 如,中共党员和非党员 互斥性 每一个观测对象(分析单位)的属性和特征都能以一个而且只能以一个数字或符号来表示。 如,工人、农民、城市居民、干部,(4)数字和符号,用来表示测量结果的工具 “如何表示”,测量图例 1,分析单位,测量法则,测量内容,符号(数字),按政治 兴趣问 卷的回 答得分,个人,N1,N3,N2,N4,(政治兴趣),最强,一般,较强,较弱,最弱,5,4,3,2,1,测量图例 2,分析单位,测量法则,测量内容,符号(数字),按国家 经委“厂 长负责 制条例”,企业,N1,N3,N2,(厂长负责制),实行,未实行,Y,N,测量图例 3,分析单位,测量法则,测量内容,符号(数字),按国家 统计局 的统计 标准,城市,A,C,B,D,(规 模),700万,100万,15 万,50 万,三、社会现象的测量,人一方面作为测量的客体或对象,而另一方面又作为测量过程的主体,因而给社会现象的测量带来了无法回避的主客观矛盾 社会测量的内容常常是社会中人们的行为,以及由人们的行为所构成的各种社会现象 在社会科学中,由于测量的对象十分复杂,因而测量的量化的程度比较低,可重复性也比较差,四、 测量层次(尺度),定类测量定类变量 定序测量定序变量 定距测量定距变量 定比测量定比变量,1、定类测量 (nominal measurement),也称类别测量或定名测量 本质:(分类体系)将调查对象的不同属性或特征加以区分,标以不同的名称或符号,以确定其类别。 数学特征:等于、不等于 属性:对称性和传递性,定类测量举例:性别,男 性,女 性,二、定序测量 (ordinal measurement),也称等级测量或顺序测量 按照某种逻辑顺序将调查对象排列出高低或大小,确定其等级及次序。 数学特性:大于、小于 属性:对称性、不对称性、传递性 例如,文盲、半文盲、小学、初中、高中、大专、本科、硕士及以上,定序测量举例:对宗教的认知,“对你来说,宗教有多重要?”,不那么 重要,一般,很重要,非常重要,低,高,三、定距测量 (interval measurement),也称间距测量或区间测量 不仅能够将社会现象或事物区分为不同的类别、不同的等级,而且可以确定它们相互之间的间隔距离和数量差别。 数学特性:测量结果之间可以进行加减运算 0不具备数学0的含义 例如,IQ为115与120,定距测量举例:IQ,95,100,105,110,115,四、定比测量 (ratio measurement),也称等比测量或比例测量 具有绝对的0点,具有实际意义的0。 数学特性:测量结果既能进行加减运算,又能进行乘除运算 例如,年龄、身高、体重,定比测量举例:收入,0,1000,2000,3000,4000,5000,测量层次小结,测量层次的比较,概念 变量 指标,2 概念的具体化与操作化,一、概念、变量与指标,概念、变量、指标及取值关系,概念 (对事物或 现象的抽象),变量,(具有多个取值的概念),(表示变量含义的具体事物),指标,取值:,事物1,事物2,事物n,常量 (仅有一个取值的概念),二、操作化的含义与作用,所谓操作化,就是要把我们无法得到的有关社会结构、制度或过程,以及有关人们行为、思想和特征的内在事实,用代表它们的外在事实来替换,以便于通过后者来研究前者。,或者说,操作化就是将抽象的概念转化为可观察的具体指标的过程。 它是对那些抽象层次较高的概念进行具体测量所采用的程序、步骤、方法、手段的详细说明。,操作化在社会研究中有着极为重要的作用。存在于研究者头脑中的各种概念、意识,研究者用以构建其理论大厦的各种基本变量,都只有经过了合适的操作化之后,才会在普通人可以看得见、摸得着的现实社会中显现出来。 从另一方面看,操作化也是具有定量取向的社会研究的关键一环。尤其是在解释性研究中,若要对任何有关社会现实的理论假设进行检验,操作化往往是不可回避的前提。这即是说,只有通过操作化的过程,将思辨色彩很浓的理论概念转变成、“翻译成”经验世界中那些人人可见的具体事实,假设检验才成为可能。,操作化是社会研究中由理论到实际、由抽象到具体这一过程的“瓶颈”。 操作化过程,就是沟通抽象的理论概念与具体的经验事实的一座桥梁,它为我们在社会研究中实际地测量抽象概念提供了关键的手段。,操作化的作用正是让那些通常只存在于我们头脑中的抽象概念,最终在我们所熟悉、所生活的现实世界中“现出原形”,让那些本来只能靠我们的思维去理解、去体验的东西,“变成”我们看得见、摸得着的东西。,作 用,有利于提高社会调查研究的客观性 有利于提高社会调查研究的统一性 有利于提高社会调查研究的可比性,三、操作化的方法,概念澄清与界定 弄清概念定义的范围 决定一个定义,发展测量指标 列出概念的维度 建立测量指标,方 法,用客观存在的具体事物来设计。如:用“人均年平均收入”把农民分成几种类型。 用看得见、摸得着的社会现象来设计。如:“劳动态度”可用工作数量、质量、出勤率等来设计。 用社会测量的方法来设计。如:考察领导干部的能力,可设计一份社会测量表。,领导干部能力测量表,指标体系,设计调查指标,一般都是以一定的理论假设为指导,每一个理论假设是由若干个概念组成的,每一个概念又需要通过若干个调查指标来反映社会现象,这样就形成一个完整的调查指标体系。,设计指标的过程,就是由“理论概念指标”的分解过程。,概念1 (智力),理论 (人的素质),概念2 (体力),概念3 (思想),指标1(记忆),指标2(思维),指标3(观察),指标4,指标5,指标6,指标7,指标8,指标9,指标设计的原则,科学性 完整性 准确性 可行性,四、指标选择的多样性,有些抽象概念往往很难、甚至不可能在具体现象中找到其所对应的指标,而且在许多情况下,一个操作性定义往往不能够完全代表一个概念 对这种抽象概念进行操作化时,往往在具体方法和测量指标方面,存在多种不同的选择 对同一个概念进行测量时,可能会产生出不同的测量指标,我们以“夫妻权力”的测量为例,1960年,美国社会学者布拉德和沃尔夫的八个指标 丈夫的职业选择 买什么样的汽车 是否买人寿保险 到什么地方度假,买什么样的房子 妻子是否应该参加社会工作 家里有人生病时,应去看哪位医生 全家每周在食品方面应花多少钱,1971年森特斯增加了下面六个指标,请谁来做客和与谁一起出门 怎样装饰房间和摆设家具 收看什么电视节目和广播节目 家庭的正餐吃什么 买什么样的衣服 配偶应买什么样的衣服,结果比较,在森特斯的研究中,前八个问题的调查结果与布拉德等人的研究结果几乎完全一致,但加上六个新问题时,丈夫的权力下降了 结果表明,夫妻权力的对比和分布随着所考察的决策方面的不同而不同,台湾社会学者陈明穗1986年的15项指标,丈夫的职业选择 妻子的职业选择 家人生病该看哪个医生 家庭生活费的支配 度假、旅游及休闲活动,生育子女数目 购买贵重物品 置产(买房子、土地等) 房子布置及购买家具 订阅报刊、选择电视节目等,子女的教育 谁代表参加婚丧喜庆 谁决定送礼与回赠礼物 是否买保险 何种家电用品该淘汰换新,伊庆春、蔡瑶玲1988年的15项指标,丈夫的职业或工作选择 妻子是否外出工作或改变工作 家用支出分配 储蓄、投资、保险等 婚丧喜庆时贺礼的数额,买房子或房地产 要不要搬家 是否与上一代同住 生几个孩子 用哪种避孕方法,小孩上哪所学校 小孩教育 请哪些客人吃饭 娱乐休闲活动的 家中的布置及买家具,五、操作化的几个例子,例1 “人的现代性” 美国著名社会学家英克尔斯及其合作者在研究“现代人”时,需要对“人的现代性”这一概念进行测量。为此,他们进行了非常周密细致的操作化工作 最终将人的现代性操作化为具有24个维度的个人现代性综合量表,“人的现代性”的24个维度,积极参与公共事务 年老者的角色 教育期望与职业期望 可依赖性 对变革的认识与评价 公民权,消费态度 对尊严的评价 效能 家庭大小 意见的增多 与国家的认同,信息 大众传播媒介 亲属义务 社会阶级分层 新经验 妇女权力,宗教 专门技能 对时间的评价 计划 工作信念 了解生产,每一个维度下面,又分解成若干个更为具体的指标 我们以第一个维度“积极参与公共事务”为例,“积极参加公共事务”的六个指标,是否属于某一个组织 所参加的组织的数目 哪一个组织在政治上持有自己的观点 是否谈话或书信方式向政府官员表明自己的观点 参加投票的次数 是否曾高度关心某件公共事务,例2 “父母投资”,陈皆明博士在有关父母投资与子女赡养关系的研究,将“父母投资”定义为“父母为子女所做的各种帮助”,并操作化为“早期家庭帮助”、“较近期的帮助”和目前“正在给予的帮助”三个大的方面以及一系列具体的指标。,“父母投资”的操作化框架,父母投资,早期家庭帮助,近期给与的帮助,正在给与的帮助,被访者早期对家庭帮助的依赖,父母为子女结婚所花的费用,被访人的教育水平,婚后的居住情况,是否在家做作业,在升学上是否得到帮助,在就业上是否得到帮助,在换工作上是否得到帮助,在分房上是否得到帮助,照看孩子,做家务,提供经济上的帮助,照看孩子,做家务,提供经济上的帮助,例3 “现代化的生存环境”,李银河博士在研究浪漫爱情时,试图检验这样一个假设:人们的生存环境越接近现代化,则他们越会看重浪漫爱情 为此,她需要对“现代化的生存环境”进行操作化,“现代化生存环境”的操作化,例4 “溺爱孩子”,风笑天教授在研究独生子女的教育问题时,需要了解和比较独生子女父母与非独生子女父母在溺爱孩子方面的行为表现和心理状态 研究中,风笑天教授将“溺爱孩子”的概念操作化为四个不同维度,“溺爱孩子”的四个不同维度,不注意培养孩子的生活自理能力 不注意培养孩子的劳动习惯 对孩子过分迁就 物质上对孩子尽量满足,练 习,失地农民的城市适应,对于任何一种测量工具或测量手段来说,都会涉及到这样一些基本问题: 测量所得的数据或资料是否与人们感兴趣的特征有关? 测量所得的结果是否正是人们所希望测量的东西? 当这种测量的时间、地点及操作者发生改变时,测量的结果将会受到什么样的影响?,3 测量的信度与效度,一、信 度 (reliability),(一)信度的定义 信度(reliability)即可靠性,它指的是采取同样的方法对同一对象重复进行测量时,其所得结果相一致的程度。 换句话说,信度是指测量结果的一致性或稳定性,即测量工具能否稳定地测量所测的事物或变量。,所谓信度是指测量数据(资料)与结论的可靠性程度,即测量工具能否稳定地测量到它要测量的事项的程度。 也就是说信度是指测量的稳定性与一致性而言的。 然而,信度并不比精确性更能保证准确性。,五名学生两次测验的成绩,建立有信度的测量的技巧,首先,如果要询问受访者的个人资料(如果有这个必要),你的问题应该明确地让受访者知道如何回答。 其次,问一些与受访者相关的问题,而且遣词造句应该明确。只是在这种情况下,潜在的问题是人们无论如何都会给你一个答案(不论答案是否可靠)。,(二)信度的类型,再测信度(重测信度) 复本信度 折半信度 评分者信度,(三)影响信度的因素,被调查者 调查者 测量内容 测量环境和时间,二、效 度 (validity),(一)效度的定义 测量的效度(validity)也称作测量的有效度或准确度。它是指测量工具或测量手段能够准确测出所要测量的变量的程度,或者说能够准确、真实地度量事物属性的程度,所谓效度就是正确性程度,即测量工具确能测出其所要测量的特质的程度。效度越高,即表示测量结果越能显示其所要测量的对象的真正特征。效度是任何科学的测量工具所必须具备的条件。 测量的效度可以决定所建立的理论解释的正确程度。 对效度的检验可以保证不同的研究人员对某一研究变量的意义与内涵有一致的理解。,(二)效度的检查,表面效度(face validity) 准则效度(criterion validity) 构造效度(construct validity),表面效度(face validity),表面效度也称为内容效度或逻辑效度,它指的是测量内容或测量指标与测量目标之间的适合性和逻辑相符性。 也可以说是指测量所选择的项目是否“看起来”符合测量目的和要求。,评价标准,首先必须知道所测量的概念是如何定义的 其次需要知道这种测量所收集的信息是否和该概念密切相关 然后评价者才能尽其判断能力之所及,作出这一测量是否具有表面效度的结论,考察表面效度旨在系统地检查测量内容的适当性,并依据我们对所研究的概念(变量)的了解去鉴别测量内容是否反映了这一概念的基本内容。,准则效度(criterion validity),准则效度也称为实用效度、经验效度或效标效度,它指的是用一种不同以往的测量方式或指标对同一事物或变量进行测量时,将原有的一种测量方式或指标作为准则、用新的方式或指标所得到的测量结果与原有准则的测量结果作比较,看二者的相关程度,并用这种特定的相关系数(或称效度系数)来反映测量工具或手段的效度。,如果新的测量方式或指标与原有的作为准则的测量方式或指标具有相同的效果,那么,我们就说这种新的测量方式或指标具有准则效度。 准则是被假设或被定义为有效的测量标准,符合这种标准的测量工具可以作为测量某一特定现象或概念的效标。 对同一概念的测量可以使用多种测量工具,其中每种测量方式与效标的一致性称为准则效度。,准则效度的形式,如果效标或准则是依据将来实际发生的情况而建立的,那么这种准则效度可称为预测效度。 如果效标是与某种测量方式同时被证明为有效的,则称之为共变效度。 如果效标是以实际经验判断为准的,则称为实用效度。,构造效度(construct validity),也叫建构效度或结构效度。它通过利用现有的理论或命题来考察当前测量工具或手段的效度。 它涉及到一个理论的关系结构中其他概念(或变量)的测量。,考察建构效度是要了解测量工具是否反映了概念和命题的内部结构。它通常在理论性研究中使用。由于它是通过与理论假设相比较来检查的,因此建构效度也称为理论效度。 理论假设一般是陈述两个概念(x和y)之间具有相关关系,那么在经验层次上对x的测量与对y的测量也应当是相关的。,检查效度的三种程序,概念层次,经验层次,建构效度,准则效度,表面效度,X 政治知识,X 学习能力,X 工作,Y 闲暇时间 的利用,X1 政治 考试成绩,X1 预测 学习成绩,X2 实际 学习成绩,X1 工作 主动性,Y1 有效活动 时间比率,X2 工作动机,注 意,测量的效度与信度都是一种相对量,而不是一种绝对量,即它们都是一种“程度事物”。 对于同一种对象,人们常常会采取各种不同的测量方法,常常会采用各种不同的测量指标。也许这些方法和指标都没有错,但它们相互之间一定会在效度与信度这两方面存在程度上的差别。,评价和选择的标准,越是在准确性和一致性上程度更高的方法和指标,就越是好的测量方法,就越是高质量的测量指标。,三、信度和效度的关系,信度低,效度不可能高 信度高,效度未必高(效度有可能很低) 效度低,信度有可能很高 效度高,信度必然也高,效度低,信度可能高; 效度高,信度必然高。,信度低,效度一定低;,信度高,效度不一定高;,效度与信度存在紧张关系,且是无法避免的两难,对人们的“婚姻状况”、“受教育年限”、“学术水平”的测量属于哪一层次的测量? 试简要说明概念、变量、指标三者之间的联系与区别。 请举例说明操作化在社会调查中的地位和作用。 试对概念“越轨行为”、“上进心”、“媒介接触”和“生育意愿”进行操作化。,思考与实践,仔细分析前几章练习中你所找到的几篇调查报告中的基本变量及其操作化方法,看看你可否对其作一些改进或补充。 试比较全国归联中国妇女社会地位调查中用来测量“妇女社会地位”的指标与中国社会科学院人口研究所做的同类研究中所用的测量指标,并作出你的评价。,
展开阅读全文