结构方程模型_第1页
结构方程模型_第2页
结构方程模型_第3页
结构方程模型_第4页
结构方程模型_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、结构方程模型原理结构方程模型原理 内容提要内容提要一、结构方程模型概述二、结构方程模型的基本原理三、结构方程模型的Amos实现四、结构方程模型的应用 一、结构方程模型概述一、结构方程模型概述1 结构方程模型是应用线性方程表示观测变量与潜变量之间,以及潜在变量之间关系的一种多元统计方法,其实质是一种广义的一般线性模型。 2 发展历程 20世纪70年代,一些学者(Joreskog,1973;Wiley,1973)将因子分析、路径分析等统计方法整合,提出结构方程初步概念。 Joreskog与其合作者进一步发展矩阵模型的分析技术来处理共变结构的分析问题,提出测量模型与结构模型的概念,促成SEM的发展。

2、 Ullman(1996)定义结构方程为“一种验证一个或多个自变量与一个或多个因变量之间一组相关关系的多元分析程式,其中自变量和因变量既可以是连续的,也可以是离散的”,突出其验证多个自变量与多个因变量之间关系的特点。3 SEM与几种多元方法的比较SEM与传统多元统计方法(多元统计)传统多元统计方法:检验自变量和因变量的单一关系(多元方差分析可以处理多个,但是关系也是单一的)SEM:综合多种方法,验证性分析,允许测量误差的存在SEM与典型相关分析(多个自变量与多个因变量之间关系)典型相关分析:两组随机变量(定性或定量)之间线性密切程度;高维列联表各边际变量的线性关系;探索性分析SEM:估计多元和

3、相互关联的因变量之间的线性关系;处理不可观测的假设概念;说明测量误差SEM与联立方程模型(联立方程组、变量之间双向影响)联立方程模型:方程数量取决于内生变量的数量;只能处理有观察值的变量,假定不存在测量误差SEM:处理测量误差;分析潜在变量之间结构关系 SEM与人工神经网络(针对不可观测或潜在变量建模)人工神经网络:执行数据分析时,模型的隐含层接点仍然没有被明确标识出来;数据从输入层通过隐含变量流向输出层(输出向输入回流的网络拓扑结构)SEM:数据分析之前,已经标识潜在变量并构建起假设路径;观测变量都与中心潜在变量相关,潜在变量之间也可能发生关系。 SEM与偏最小二乘法(PLS)(集成多种分析

4、方法,对因变量进行测量)PLS:对观测变量协方差矩阵的对角元素拟合较好,适用于对数据点的分析,预测准确度较高SEM:对观测变量协方差矩阵的非对角元素的拟合较好,适合于对协方差结构的分析,参数估计更准确4 SEM的技术特性 具有理论先验性 同时处理因素的测量关系和因素之间的结构关系 以协方差矩阵的运用为核心 适用于大样本分析(样本数200) 包含不同的统计技术 重视多重统计指标的运用5 样本规模大小资料符合常态、无遗漏值及例外值(Bentler & Chou, 1987)下,样本比例最小为估计参数的5倍、10倍则更为适当。当原始资料违反常态性假设时,样本比例应提升为估计参数的15倍。以M

5、L法评估,Loehlin (1992)建议样本数至少为100 , 200较为适当。当样本数为400500时,此法会变得过于敏感,而使得模式不适合。二、结构方程模型的基本原理二、结构方程模型的基本原理(一)模型构成1 变量观测变量:能够观测到的变量(路径图中以长方形表示)潜在变量:难以直接观测到的抽象概念,由测量变量推估出来的变量(路径图中以椭圆形表示)内生变量:模型总会受到任何一个其他变量影响的变量(因变量;路径图会受到任何一个其他变量以单箭头指涉的变量外生变量:模型中不受任何其他变量影响但影响其他变量的变量(自变量;路径图中会指向任何一个其他变量,但不受任何变量以单箭头指涉的变量)中介变量:

6、当内生变量同时做因变量和自变量时,表示该变量不仅被其他变量影响,还可能对其他变量产生影响。内生潜在变量:潜变量作为内生变量外生观测变量:外生潜在变量的观测变量外生潜在变量:潜变量作为外生变量外生观测变量:外生潜在变量的观测变量中介潜变量:潜变量作为中介变量中介观测变量:中介潜在变量的观测变量2 参数( “未知”和“估计” )潜在变量自身:总体的平均数或方差变量之间关系:因素载荷,路径系数,协方差参数类型:自由参数:参数大小必须通过统计程序加以估计固定参数:模型拟合过程中无须估计(1) 为潜在变量设定的测量尺度 将潜在变量下的各观测变量的残差项方差设置为1 将潜在变量下的观测变量的因子负荷固定为

7、1(2)为提高模型识别度人为设定限定参数:多样本间比较(半自由参数)3 路径图(1)含义:路径分析的最有用的一个工具,用图形形式表示变量之间的各种线性关系,包括直接的和间接的关系。(2)常用记号:矩形框表示观测变量圆或椭圆表示潜在变量小的圆或椭圆,或无任何框,表示方程或测量的误差单向箭头指向指标或观测变量,表示测量误差单向箭头指向因子或潜在变量,表示内生变量未能被外生潜在变量解释的部分,是方程的误差单向箭头连接的两个变量表示假定有因果关系,箭头由原因(外生)变量指向结果(内生)变量两个变量之间连线的两端都有箭头,表示它们之间互为因果弧形双箭头表示假定两个变量之间没有结构关系,但有相关关系变量之

8、间没有任何连接线,表示假定它们之间没有 直接联系(3)路径系数含义:路径分析模型的回归系数,用来衡量变量之间影响程度或变量的效应大小(标准化系数、非标准化系数)类型:反映外生变量影响内生变量的路径系数反映内生变量影响内生变量的路径系数路径系数的下标:第一部分所指向的结果变量第二部分表示原因变量(4)效应分解直接效应:原因变量(外生或内生变量)对结果变量(内生变量)的直接影响,大小等于原因变量到结果变量的路径系数间接效应:原因变量通过一个或多个中介变量对结果变量所产生的影响,大小为所有从原因变量出发,通过所有中介变量结束于结果变量的路径系数乘积总效应:原因变量对结果变量的效应总和 总效应=直接效

9、应+间接效应x3 矩阵方程式(1)和(2)是测量模型方程,(3)是结构模型方程 是外生观测变量向量, 为外生潜在变量向量, 外生观测变量在外生潜在变量上的因子负荷矩阵, 外生观测变量的残差项向量; 为内生观测变量向量, 为内生潜在变量向量, 为内生观测向量在内生潜在变量上的因子负荷矩阵,为内生观测向量的残差项向量; 和 都是路径系数, 表示内生潜在变量之间的关系, 表示外生潜在变量对内生潜在变量的 影响, 为结构方程的误差项 xx (1) yy (2) B (3) xyyBB111 11xx 123xxxx1 12 13 1xxxx123111 11yy 123yyyy123456122100

10、0B 1 1测量模型:反映潜在变量和观测变量之间的关系方程式:112131425262000000yyyyyyy22112112 结构模型:反映潜在变量之间因果关系方程式:111 11 1121yy 结构方程模型的八种矩阵概念符号符号代表意义代表意义结构模型矩阵结构模型矩阵 B内生潜在变量被内生潜在变量解释之回归矩阵(回归系数)内生潜在变量被外生潜在变量解释之回归矩阵(回归系数)测量模型矩阵测量模型矩阵外生观测变量被外生潜在变量解释之回归矩阵(因素载荷)内生观测变量被内生潜在变量解释之回归矩阵(因素载荷)外生潜在变量之协方差矩阵(因素共变)残差矩阵残差矩阵内生潜在变量被外生潜在变量解释之误差项

11、协方差矩阵(解释残差)外生观测变量被外生观测变量解释之误差项协方差矩阵(X变量残差)内生观测变量被内生潜在变量解释之误差项协方差矩阵(Y变量残差)xy(二)模型识别1 模型整体识别性(1)t法则数据资料点数DP=(p+q)*(p+q+1)/2 (p+q)表示观测变量个数待估参数数目(自由参数)t =参数总数固定参数t DP,模型识别不足t = DP,模型充分识别(2)虚无B矩阵模型中没有任何内生变量去影响其他内生变量,无结构关系假设,没有任何结构参数( )的估计,B矩阵为0,模型自动识别。(3)递归法则B矩阵呈现三角形状态(对称矩阵,所有变量间的结构参数均加以估计),而 呈现对角线状态(仅估计

12、干扰项的方差,干扰项的相关不列入估计),此时为递归模型且为饱和模型,模型自动识别2 测量模型的识别性只有一个潜在变量,至少要有三个测量变量,其因素载荷必须不等于0,测量残差之间没有任何相关假设超过一个以上的潜在变量,每一个潜在变量只要有至少三个测量变量来估计,每一个测量变量只用以估计单一一个潜在变量,残差之间没有共变假设潜在变量只以两个测量变量来估计,残差无相关,每一个测量变量只用以估计单一一个潜在变量且没有任何一个潜在变量的共变或方差为03 结构模型的识别性虚无B矩阵法则递归法则每一个方程式至少要有(q-1)个变量不属于非递归模型用以计算标准误的讯息矩阵必须可以被完全估计,并可以求出倒置信息

13、矩阵(三)参数估计1 假设条件测量模型误差项 , 的均值为零结构模型的残差项 的均值为零误差项 , 与因子 , 之间不相关,误差项 与 不相关残差项 与 , , 之间不相关2 共变推导 (1)协方差协方差:利用两个变量间观测值与其均值离差的期望观测两个变量间的关系强弱。(2)运算定理2222( ,)( )(,)( , )( , )( , )( , )()(,)( ,)( , ) 2( , )()( ,)( , )Cov X XVar XCov aX bY cZ dUacCov X ZadCov X UbcCov Y ZbdCov Y UVar aX bYCov aX bY aX bYa Cov

14、 X Xb Cov Y YbcCov X YVar aX bYa Cov X Xb Cov Y Y(3)导出矩阵两个具有相关的潜在变量的两个具有相关的潜在变量的CFA图图(3)导出矩阵观测变量方程式:1111VFE2222VFE4444VFE121112121211112211121211121112(,)(,)(,)(,)(,)(,)(,)(,)Cov V VCovFEFECov F FCov F ECov E FCov E ECov F FVar F F 1411142414141144121414121421(,)(,)(,)(,)(,)(,)(,)Cov V VCovFEFECov F

15、 FCov F ECov EFCov EECov F F 11111112114111111112211111()(,)(,)(,)(,)(,)()()Var VCovFEFECov F FCov F ECov E FCov E EVar FVar E同一潜在变量的两个观测变量的协方差:同一潜在变量的两个观测变量的协方差:不同潜在变量的两个观测变量的协方差:不同潜在变量的两个观测变量的协方差:观测变量的方差:观测变量的方差:121231323414243451525354561626364656( )(,)()( ,)( ,)( )(,)(,)(,)()( ,)( ,)( ,)( ,)( )(

16、 ,)( ,)( ,)( ,)( ,)()Var VCov V VVar VCov V VCov V VVar VCov V VCov V VCov V VVar VCov V VCov V VCov V VCov V VVar VCov V VCov V VCov V VCov V VCov V VVar V211212222132333214212421342144215212521352145552162126213621465666 逐一计算六个观测变量的方差与配对协方差,参数的方差与协方参数的方差与协方差导出矩阵差导出矩阵( )S矩阵:矩阵:样本观测值的方差与协方差矩阵(6*6)残差

17、矩阵残差矩阵=S 估计协方差矩阵与观测协方差矩阵的差异极小化(4)参数估计策略加权最小平方策略(WLS)拟合函数:表示估计协方差矩阵与观察协方差矩阵的差异最大概似法(ML)基本假设:观察数据都是从总体中抽取得到的数据,且所抽取的样本必须是所有可能样本中被选择的几率最大者无加权最小平方法(ULS)一般化最小平方法(GLS)渐进分布自由法(ADF)(5)迭代运算停止条件达到计算机预计的叠代次数,如25次模式收敛完成,亦即达到计算机预设标准1( )( )( )F QsWs1loglog()MLFStr S(四)模型拟合评价1 参数检验(1)参数的显著性检验t=参数估计值/标准误t的绝对值大于2,则参

18、数即可达到.05的显著水平样本数低于30时,样本数越小, t值要越大才能超越显著水平的门槛(2)参数的合理性检验参数估计值是否有合理的实际意义:参数的符号是否符合理论假设参数的取值范围是否合理参数是否可以得到合理解释2 模型整体评价指标名称指标名称指标含义指标含义接受标准接受标准适用情形适用情形残差分析残差分析未标准化残差RMR未标准化假设模型整体残差越小越好了解残差特性标准化残差SRMR标准化模型整体残差.08了解残差特性拟合效果指标拟合效果指标绝对拟合效果指标卡方值导出矩阵与观测矩阵的整体相似程度卡方自由度比卡方值/自由度.90说明模型解释力调整拟合指数AGFI用模型自由度和参数数目调整的

19、GFI.90不受模型复杂程度影响简效拟合指数PGFI用模型自由度和参数数目调整的GFI.50说明模型的简单程度相对拟合效果指标正规拟合指数NFI假设模型与独立模型的卡方差异.90说明模型较虚无模型的改善程度非正规拟合指数NNFI用模型自由度和参数数目调整的NFI.90不受模型复杂程度的影响替代性指标替代性指标非集中性参数NCP假设模型的卡方值距离中央卡方值分布的离散程度越小越好说明假设模型矩阵中央卡方值的程度相对拟合指数CFI假设模型与独立模型的非中央性差异.95说明模型较虚无模型的改善程度,特别适合小样本指标名称指标名称指标含义指标含义接受标准接受标准适用情形适用情形平均概似平均误根系数RM

20、SEA比较理论模型与饱和模型的差距200反映样本规模的适切性(五)模型修正1 参考标准模型所得结果是适当的所得模型的实际意义、模型变量间的实际意义和所得参数与实际假设的关系是合理的参考多个不同的整体拟合指数2 修正原则省俭原则两个模型拟合度差别不大的情况下,应取两个模型中较简单的模型拟合度差别很大,应采取拟合更好的模型,暂不考虑模型的简洁性最后采用的模型应是用较少参数但符合实际意义,且能较好拟合数据的模型等同模式等同模式:用不同的方法表示各个潜在变量之间的关系,能得出基本相同的结果,参数个数相同,拟合程度相同的模式。实际意义多次验证3 模型修正方向模型扩展方面(放松一些路径系数,提高拟合度)修

21、正指数MI反映的是一个固定或限制参数被恢复自由时,卡方值可能减少的最小的量。如果MI变化很小,则修正没有意义;通常认为MI4,模型修正才有意义。(显著水平为0.05时,临界值为3.84)模型简约方面(删除或限制一些路径系数,使模型变简洁)临界比率CR通过自由度调整卡方值,以供选择参数不是过多,又能满足一定拟合度的模型,寻找CR比率最小者单个参数调整设为0两个变量之间路径系数关系进行调整,设为相等4 模型修正内容(1)测量模型修正添加或删除因子载荷添加或删除因子之间的协方差添加或删除测量误差的协方差(2)结构模型修正增加或减少潜在变量数目添加或删减路径系数添加或删除残差项的协方差2C Rdf22

22、1MMIEFACFA探索式 (data-driven)验证式 (theory-driven)因素个数由资料决定因素个数由研究者指定问卷设计的前端问卷应用的后端PCA是常用的估计法ML法是常用的估计法只提供标准化结果提供标准及非标准化结果没有loading 显著性报告有loading 显著性报告EFA无法做额外的设定 CFA模型设定有弹性无法执行跨群组比较可执行跨群组(时间)的比较1 验证性因子分析(CFA)F1e1F2e2e3e4e5e6x1x2x3x4x5x611一阶验证性因子分析一阶验证性因子分析F1e1F2e2e3e4e5e6x1x2x3x4x5x611F31二阶(高阶)验证性因子分析二

23、阶(高阶)验证性因子分析绩效绩效期望期望满意度满意度忠诚度忠诚度2 路径分析递归模型递归模型D1D2非递归模型非递归模型自我效能感自我效能感社会期待社会期待成就动机成就动机学业表现学业表现D1D20.290.630.210.020.130.16路径分析参数估计图路径分析参数估计图自我效能对于学业表现的模型衍生相关:(轨迹法则)1 直接效应:自我效能 学业表现=0.292 间接效应:自我效能 成就动机 学业表现=0.133 相关间接效应:自我效能 社会期待 学业表现=0.13*0.16=0.02自我效能 社会期待 成就动机 学业表现=0.13*0.02*0.21=0.000546衍生相关为0.2

24、9+0.13+0.02+0.00=0.44Y1X2X1Y2D1D2时间延宕非递归模型时间延宕非递归模型工具型变量模型工具型变量模型3 统合模型分析x1x2x3y1y2y3x1测量残差测量残差外生观察变量外生观察变量因素负荷量因素负荷量外生潜在变量外生潜在变量结构参数结构参数内生潜在变量内生潜在变量因素负荷量因素负荷量内生观察变量内生观察变量结构模式结构模式测量测量(CFA)模式模式测量残差测量残差x2x3y1y2y3测量测量(CFA)模式模式SPSS与与Amos一般的研究论文的数据分析部分少不了对样本的描述、对变量进行探索性因子分析(EFA),然后再利用多变量分析技术或SEM进行数据分析,最后

25、提出研究结论(验证假说),提出建议。基于这样的了解,我们来看看SPSS与Amos所发挥的功能:SPSSAmos样本描述(非常详尽)因子分析EFACFA多变量分析方差分析、判别分析、回归分析、多元尺度法等建立SEM,进行路径分析。多群组分析、Bootstrapping利用利用amos做统计检验做统计检验利用amos,所得到的值是显著性(p值),我们要用显著性和我们所设的显著水平值做比较,如果显著性大于值,未达到显著水平,则接受虚无假说;如果显著性小于值,达到显著水平,则拒绝虚无假说(即发现有统计上的显著性)。在统计检验时,本书所设定的显著性水平皆是0.05(=0.05)二、建立模型二、建立模型建

26、立路径图建立路径图1 制作潜在变量2 制作指标变量3 建立潜在变量之间的关系4 读取数据文件5 交代变量名称6 完整模型7 显示重要参数1 制作潜在变量:制作潜在变量:在工具箱中选“ ”,然后在绘图区从左上到右下拉出一个椭圆。2 制作指标变量制作指标变量指标变量包括观察变量和误差变量。在工具箱中选“ ”,然后在绘图区中的椭圆“ ”上点一下。就会出现指标变量,每多点一下,就出现一个指标变量。要改变指标变量的方向,可以按“ ”。3 建立潜在变量之间的关系建立潜在变量之间的关系“ ”表示影响,因果关系。“ ”表示相关性。4 读取数据文件读取数据文件注意:在读取数据之前,要对数据的完整性(如遗漏值的处

27、理、观察变量的信度等)进行处理。)在工具箱中选选择数据文件“ ”,在出现的“Data Files”窗口中,点击“File Name”,在 出现的“开启”窗口中,选择要读取的文件。数据的读入方式有两种:以观察变量的原始数据或者以观察变量相关系数矩阵读入。5 交代变量名称交代变量名称观察变量:在工具箱中选“ ”,就会出现“Variables in Dataset”窗口。此时,先点住变量名称,然后拖动到适当的观察变量上后松手,这个变量名称就独到观察变量上了。潜在变量名称:在对象上双击就会出现“object properties”窗口,在“variable name”上键入文字即可。误差变量名称,可以

28、按【plugins】、【name Unobserved Variables】。6 完整模型:如图完整模型:如图显示重要参数:在工具箱中选显示重要参数:在工具箱中选“ ”,然后在绘图区点一下,出现下图然后在绘图区点一下,出现下图然后在Figure Caption 窗口中输入Chi Square=cmindf=dfp=p点击点击ok,就会出现一下情况:,就会出现一下情况:在工具箱中点击Calculate estimates的图示“ ”,产生估计值,在点击显示区的view the output path diagram 图示“ ”。结果如图显示:三、分组三、分组如果数据文件有必要分组,自读取数据文件

29、之后,要分别交代Group Variable、Group Value四、分析输出报表四、分析输出报表1.违反估计2.正态性检验与异常值处理3.拟合度1.违反估计违反估计违反估计是指模型内统计所输出的估计系数,超出了可接受的范围。违反估计的项目有: 负的误差方差的存在 标准化洗漱超过或太接近1(通常以0.95为门槛)2.正态性检验与异常值处理正态性检验与异常值处理Asessment of normality表中的c.r.掉膘偏度系数或者峰度系数除以标准误的临界值,最后一行为Mardis多变量峰度系数c.r.。当c.r.大于2时,则暗示有些单变量可能具有异常值。Observations farth

30、est from the centroid表中通常看p2值,当p2值很小时(例如小于0.05)即表示该观察值为异常值。3.拟合度拟合度AMOS是以卡方统计量来进行检验的,一般以卡方值p大于0.05判断模型是否具有良好的拟合度。但是卡方统计量容易受到样本大小的影响,因此还要参考其他拟合指标。如下图:拟合指标拟合指标判断准则判断准则绝对拟合指标X2P0.05表明拟合度较好GFI越接近1表示模型拟合度越好,通常采用GFI0.9RMR越接近0表示模型拟合度越好,通常采用RMR0.05RMSEA越接近0表示模型拟合度越好,通常采用RMSER0.1增值拟合指标AGFI越接近1表示模型拟合度越好,通常采用A

31、GFI0.9NFI越接近1表示模型拟合度越好CFI越接近1表示模型拟合度越好IFI越接近1表示模型拟合度越好精简拟合指标AICAIC越小表示该模型那个较好CAICCAIC越小表示该模型那个较好四、模型修正四、模型修正在regression weights表中,可看到Modification Indices(M.I.)值,找出误差变量之间最大的项目,是卡方值减少,p值增加,是我们修正模型的主要目标。五、探索最佳模型五、探索最佳模型点【analyze】,在出现的“specification search”工具列中,点击最左边的虚线“make arrow optional”的图标,然后在个变量之间的箭头上分别加以点选,使他们呈现出虚线。五、探索最佳模型五、探索最佳模型在“specification search”工具列中,点“option”图示,在出现的“options

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论