结构方程模型入门

资源描述

结构方程模型入门结构方程模型入门2结构方程模型（SEM）入门云南大学高等教育研究院解亚宁SEM3导言-1n 心理学或教育学研究的一个主要目的是通过分析变量与变量之间的关系来揭示心理或教育现象的发展以及变化规律与特点，如相关分析。X2X1r相关分析（Correlational Analysis）4导言-2 在相关分析基础上，进一步把变量分为自变量与因变量两部分，并以自变量来解释因变量。该模型假设自变量是原因，因变量是由这些原因引起的结果，如回归分析模型。yx11eexy+=1b简单线性回归模型简单线性回归模型（Simple Linear RegressionSimple Linear Regression）5导言-3 进一步的多元线性回归，包含多个自变量与一个因变量。（Multiple Linear Regression）yx1ex2126x1y1y2e1e2x2路径分析（Path Analysis）在回归分析基础上，还发展了路径分析，进一步把变量之间复杂关系，例如因果交错关系。7问题提出n 但是，现实中变量之间的关系要复杂得多，各自变量之间可能存在因果关系，因变量也可能是某个或某几个自变量的原因，有时需要处理多个原因和多个结果的关系。n 特别是会遇到不可直接观测的变量，这种变量称为潜在变量(Latent Variables)，诸如社会经济地位、智力等都不能准确、直接地加以测量。社会经济地位智力潜在变量8问题提出n对于潜变量，可用一些外显指标(Observable indicators)来间接测量它们。如用收入高低、教育水高低、教育水平平作为社会经济地位社会经济地位()的测量指标。nSEM主要特点在于能反映潜在变量(Latent variables)与外显变量(Manifest variable)之关系。收入高低教育水平社会经济地位外显指标潜在变量9n 方法的进步与革命常常导致相应学科的进步与革命。就统计方法而盲，回归分析是相关分析的深人，而结构方程模型（SEM）则是对回归分析的深入。10一、结构方程模型的概念n结构方程模型（structural equation modeling，简称SEM），早期称为线性结构关系(Linear Structural Relationships，简称LISREL)，是评价理论模型与经验数据一致性的统计方法。n潜在变量也称为隐变量。n外显变量也称观测变量(Observable variable)或测量变量(Measurement variable)。n SEM主要特点在于能反映潜在变量(Latent variables)与外显变量(Manifest variable)之关系。11导例1213x1x3x21 2 3123误差观测变量负荷量潜在变量典型的结构方程模型与参数示意图典型的结构方程模型与参数示意图结构方程模型是用来检验观测变量与潜在变量之间假设关系及测量误差的一种统计技术，或者说是模型构建与检验的方法。结构方程模型是通过观测变量集合的间的协方差结构和相关结构出发，从定量的角度建立模型来研究变量间的因果关系的一种方法。14例2误差误差观测变量观测变量负荷量负荷量潜在变量潜在变量15专栏：结构方程模型的构图与模式16SEM的模式n测量模式测量模式(measurement model)测量模式旨在建立测量模式旨在建立测量变量与潜在变量间测量变量与潜在变量间之关系，主要透过验证之关系，主要透过验证性因素分析（性因素分析（CFA）以）以考验测量模式的效度考验测量模式的效度结结构模式。构模式。y1y3y2e1e2e3f1y4y6y5e4e5e6f2验证验证性因素分析性因素分析(Confirmatory Factor Analysis(Confirmatory Factor Analysis，CFACFA）17y1y3y2e1e2e3f1y4y6y5e4e5e6f2fr1r2二二阶验证阶验证性因素分析性因素分析（2nd order Confirmatory Factor Analysis2nd order Confirmatory Factor Analysis）18SEM的模式结构模式结构模式 (structural model)结构模式旨在考验潜在变项间之因果路径关系，结构模式旨在考验潜在变项间之因果路径关系，主要针对潜在变量进行径路分析，以考验结构模式的主要针对潜在变量进行径路分析，以考验结构模式的适配性适配性。潛在潛在变量变量路徑分析路徑分析(Path Analysis with Latent Variables,PA-LV)(Path Analysis with Latent Variables,PA-LV)1920例3：研究生研究论文212223242526模型假设27282930二、结构方程模型分析步骤示意图首先针对研究问题，根据已有的研究资料提出多个假设模型，然后收集数据、进行分析，通过模型与实际数据的拟合情况和模型比较的结果，确定最终的结果模型。根据LISREL的分析程序，SEM大体分为建立模型、识别模型、估计模型，评估模型和修正模型五个步骤。31模型界定n模型的界定必须来自健全理论的建构。n模型界定的步骤有三。首先由研究者整理文献与相关理论，提出建立模型的双向结构表，然后由专家对结果进行论证，最后根据确定的结构设计可能的项目。32三种模型策略 nSEM的基本假设是观测变量的共变数矩阵是一组参数的函数，而检验一个共变数矩阵有三种模型策略。33验证模型策略n即根据搜集的经验资料严格检验研究者界定的理论模型，以确定所检验理论模型是接受还是拒绝，所谓严格检验是指当模型被拒绝时，不再寻找接受模型的可能线索。34竞争模型策略n即研究者事先界定多个可替代的理论模型，再搜集一组经验资料以检验哪一个理论模型与经验资料最匹配。譬如对智力既可用Spearman的二因素理论解释，也可用Thurstone的群因素理论解释，还可以用卡特尔的简明层次论解释等，对于哪一种解释方式最好，以往的统计技术难以处理，SEM却可以有效地处理这类问题，采用竞争模型更符合实际情况。35模型的发展策略n即研究者先利用理论界定出一个起始模型，再搜集一组资料检验其匹配程度。如果不是相当匹配，可运用SEM统计中的某种指数了解需要修正的地方，如果需修正处有着健全的理论可解释则将其修正，这是一般研究者常用的策略。36模型识别n模型的识别分为低识别、恰好识别和过度识别三种。n对SEM理论不十分清楚的研究者，往往会忽略模型识别的问题，只是将其交给统计软件处理，即不知其中存在诸多复杂的问题，对此应当阅读有关书藉，详细了解模型识别的问题。37模型的估计 n用观测资料估计模型的参数方法有很多，最常用的有三种，即最大概似法、广义最小平方法和渐近分布自由法。38拟合概念n当我们测试某一模型时,其实是在研究自己所提的模型(即哪些变量之间有关，哪些则没有)是否与数据拟合。39三、分析过程与结果示例例題:學生智力測驗成績之前分析建立在兩因子模型下，且能提供良好適合度，本例題測試在單因子模型下是否能提供更加適合度？樣本數：145個學生指標變數：文章閱讀,造句能力,字彙能力,加法能力,計數能力潛伏變數：語言,數學40路徑圖：學生智力測驗成績(P.192)語言文章閱讀2、GFI、AGFI、數學造句能力字彙能力加法能力計數能力=1採用Single dimension1234541TitleConfirmatoryFactorAnalysisforstudenttestperformanceObservedVariables文章閱讀造句能力字彙能力加法能力計數能力CorrelationMatrix=10.72210.7140.68510.2030.2460.17010.0950.1810.1130.5851SampleSize=145LatentVariables語言數學Relationships:文章閱讀=語言造句能力=語言字彙能力=語言加法能力=數學計數能力=數學SETtheCovarianceof語言and數學to1PathDiagramLISRELOUTPUTSETVRSMI相關矩陣指標變數潛伏變數定義指標變數與潛伏變數之關係軟體操作:學生智力測驗成績(P.192)定義潛伏變數之間的關係相關係數為1，不具區別效度輸出指令 SE:標準誤TV:t檢定RS:常態化殘差與Q圖MI:修飾指標42軟體操作:學生智力測驗成績(P.192)43軟體操作:學生智力測驗成績(P.192)參數最大概似估計、標準誤、t值:語言:相關性較大、標準誤0.07、t值顯著2數學:相關性小、標準誤0.09、t值2不顯著兩潛伏變數之間的相關係數為1殘差變異數估計、標準誤、t值44軟體操作:學生智力測驗成績(P.192)卡方值2=59.47GFI =0.88 0.90 AGFI=0.63 0.05 (皆低於可接受水準)模型配適度不佳45 學生智力測驗成績綜合比較二因子模型單因子模型卡方值2.9359.47GFI0.990.88AGFI0.970.63單因子模型下:GFI AGFI 皆低於可接受水準，故潛伏變數兼具區別性，應採二因子模型較合適。46四、模型拟合度指标n（一）基本拟合标准：n不能有负的误差变异；n误差变异需有统计意义；n估计参数之间相关的绝对值不能太接近1；n因素负荷量不能太低或太高，最好介于0.500.95之间；n标准误不能太大。47（二）整体模型拟合度指标数值范围及临界值48（二）整体模型拟合度指标数值范围及临界值 4950五、结构方程模型的用途（一）李茂能(2007)1、考验理论模式(test of theory)2、考验测量工具的建构信度(construct reliability)或因素结构效度(validity of factorial structure)n信度：观测变量与潜在变量之间相关程度(0.7)n 效度：可分为下列两种n收敛效度(convergent validity)：对相同特性(construct,concept,or research variables)使用不同衡量方法(Likert scale,Stapel scale,or semantic differential)，所得结果高度相关。n区别效度(discriminant validity)：不同建构(construct,即研究变数或称concept)彼此之间确实不相同。51五、结构方程模型的用途（二）侯杰泰(1999)na、验证性因素分析 nb、高阶因子分析 nc、路径及因果分析nd、多时段(multiwave)设计 ne、单形模型(Simplezs Model)nf、多组比较 52五、结构方程模型的用途n（三）范晓玲(2007)nSEM在心理学研究的应用，主要有两方面。n1、测验编制理论结构建立。因素分析虽然也应用于测验编制之中，但却只能用初步探讨结构而无法检验其理论建构。SEM却不同，其功用颇丰。n1-1 项目分析，即估计每个项目，把项目分析的概念融合于因素结构的检验中；检验每个项目的测量误差，把测量误差从项目变异中抽取出来，使因素负荷量具有较高的精确度，并根据理论，预先确定项目所属的因素。n1-2 根据理论，检验某些因素之间相关或不相关，确定各因素之间的关系；n1-3 对整体因素模型进行评估，确定以理论建构的因素模型与搜集资料之间的符合程度。因此，结构方程模型属于检验理论模型的统计方法，为研究者用于量化与理论检验提供一种综合模型。n2、是研究各种复杂心理现象之间的关系。譬如，心理学中，研究认知加工速度、工作记忆与智力发展的关系，家庭文化环境与儿童言语的关系等；在管理学中，研究组织绩效各层次指标与组织核心能力的关系，变革型领导与员工工作态度以及心理授权的关系；在教育学中，研究性别、文化程度、教育经验与教师职业承诺的关系等；在医学中，研究吸烟、喝酒等不良行为与身心健康的关系等；53六、结构方程的数学模式与方法n（一）测量模型（一）测量模型n对于外显变项与潜伏变项间的关系,即测量模式部分，通常写为以下测量方程:X=x+Y=y+nX,Y是外源及内生指标。n,是X，Y测量上的误差。nx是X指标与潜伏变项的关系。ny是Y指标与潜伏变项的关系。54（二）结构模型（二）结构模型n(a)对于潜伏变项(如：社经地位与收入)的关系，通常写成如下结构方程：n=+内生(依变)(endogenous,dependent)潜伏变项外源(自变)(exogenous,independent)潜伏变项内生潜伏变项间的关系外源变项对内生变项的影响模式内未能解释部份(即模式内所包含的变项及变项间关系所未能解释部分)潜变量间的关系，即结构模型，是研究的兴趣重点，所以整个分析也称潜变量间的关系，即结构模型，是研究的兴趣重点，所以整个分析也称结构方程模型。结构方程模型。55七、讨论56 1、探索型因素分析与驗證型因素分析比較比较内容EFACFA理論架構在分析過程中所扮演的角色理論架構是因素分析後的產物須先有特定的理論觀點作為基礎，再決定該架構是否適當。理論架構在分析過程中所扮演的檢驗時機事後概念事前概念572、结构方程模型假设条件、结构方程模型假设条件合理的样本量合理的样本量nJames Stevens的Applied Multivariate Statistics for the Social Sciences一书中说平均一个自变量大约需要15个case；nBentler and Chou(1987)说平均一个估计参数需要5个case就差不多了，但前提是数据质量非常好；这两种说法基本上是等价的；n而Loehlin(1992)在进行蒙特卡罗模拟之后发现对于包含24个因子的模型，至少需要100个case，当然200更好；n小样本量容易导致模型计算时收敛的失败进而影响到参数估计；特别要注意的是当数据质量不好比如不服从正态分布或者受到污染时，更需要大的样本量。58樣本大小的討論n樣本大小至少超過150個。Rigdon,E.(2005).SEM FAQ.from http:/www.gsu.edu/mkteer/htmln至少要為x觀察變項數目的10倍量或15倍量。Thompson,B.(2000).Ten commandments of structural equation modeling.In L.G.Grimm&P.R.Yarnold(eds.),Reading and understanding more multivariate statistics(pp.261-283).Washington,DC:APA.樣本大小亦取決於潛在變項的數目59n樣本大小不能少於50個，應該要超過100個。n至少要為x觀察變項數目的5倍量或10倍量。Hair,J.F.,Anderson,R.F.,Tatham,R.L.&Black,W.C.(1998).Multivariate data analysis 5th ed.New Jersey:Prentice Hall Inc.603、模型的、模型的解释n模型的说明和因果关系的理论基础模型的说明和因果关系的理论基础实际上就是假设检验的逻辑你只能说你的模型不能拒绝，而不能下定论说你的模型可以被接受。613、模型的解释n统计结果只有得到正确解释时才是有用的，一个不正确的解释比无用还要糟糕。SEM的解释主要有结构系数的因果性（或影响性）、方向性和效果系数三方面。n1因果性。之所以称因果性是源于SEM早期被视为因果模型，然而SEM并不限于研究因果关系，它与一般使用的相关、多元回归及变异数分析一样可以研究事物多种关系，为了避免因果性而将其结构系数看成是一种影响性。623、模型的解释n2方向性。方向性是建立在坚实的理论基础之上的。SEM是统计技术，无法处理方向性问题。n3效果系数。效果系数是指SEM的结构系数，有直接效果、间接效果和总效果之分。直接效果是指一个变量对另一个变量的影响未通过其他其他变量；间接效果是指一个变量对另一个变量的影响至少需要通过一个其他变量，总效果则是直接效果与间接效果的总和。在结果解释时直接效果是必然的，间接效果和总效果能回答直接效果无法回答的问题。譬如，在二级因素分析中，若想知道哪一个指标受到二级潜在变量的影响最大，就要找出二级潜在变量总效果最大的一个。633、模型的解释nSEM效果的解释可以用非标准化系数和标准化系数两种方式。非标准系数是直接以原始分数进行的估计，需将与标准误同时呈现，因为，标准误一方面反应模型的稳定性，过小或过大的标准误意味着模型估计存在问题或产生了模型的不稳定，另一方面则反应着估计参数是否具有统计意义。非标准化系数虽然无法进行了模型内的参数比较，但是却能够对同一模型在不同群体的系数进行比较。标准化系数是以标准分数进行的估计，它消除了测量单位的影响，可以进行模型内参数大小的比较，了解参数的影响力。SEM结果呈现时两类系数应同时给出。644、模型的推断和选择n在心理学研究中，模型的推断和选择是一个相当复杂的问题。在具体的实践中，研究者们应当特别注意如下两个原则：建构任何一个假设模型时都需要有相应的理论基础；竖立多个模型假设的观念，因为能够拟和任何一个数据的模型会有很多，一个能够很好拟和数据的模型并不一定是要找的最好的模型。n总的来说，只有在充分的理论研究的基础上，竖立多个模型假设的观念，借助相应的统计手段，才能找到一个最接近真实情况的最好的模型。655、评价nSEM并非是包治百病的灵丹妙药,与任何一种统计方法一样也有其局限性与不足之处。例如：n模型虽按变童的时间顺序建立,试图寻求变量间的因果关系,而且也可作一定程度因果推论,但不能作严格客观的因果推测n拟合指数易受样本大小的影响,小样本易拟合大样本难拟合。n要求变间呈线性关系,有时难以保证n潜在变量的解释具有模糊性和随意性等，研究者在使用它时，首先要深人了解的理论墓础，否则很容易产生滥用与错误解释的现象。666、SEM软件的使用情况(Why)Should We Use SEM?Pros and Cons of Structural Equation ModelingNachtigall,Kroehne,Funke,Steyer(2003)67结束语结束语谢谢大家聆听！谢谢大家聆听！68

展开阅读全文

结构方程模型入门

最新文档