结构方程模型及其应用
侯傑泰©
香港中文大學教育心理系
使用時請著明出處
100个分数 :
21, 31, 32, 05, 06, 09, 10, 22, 29, 18,
11, 01, 39, 92, 23, 27, 93, 97, 30, 02,
96, 40, 53, 78, 04, 98, 36, 07, 08, 24,
54, 55, 77, 99, 34, 03, 86, 87, 59, 60,
15, 62, 63, 43, 52, 28, 79, 58, 65, 95,
81, 85, 57, 14, 17, 33, 16, 19, 20, 37,
25, 69, 84, 61, 64, 68, 70, 42, 45, 72,
83, 89, 44, 38, 47, 71, 00, 73, 12, 35,
82, 56, 75, 41, 46, 49, 50, 94, 66, 67,
76, 51, 88, 90, 74, 13, 26, 80, 48, 91
均值M=53,标准差SD=15
100名学生在9个不同学科间的相关系数
检查模型的准确性和简洁性
拟合优度指数(goodness of fit index),简称为拟合指数 、NNFI、CFI
df=[不重复元素, p(p+1)/2] – [估计参数]
在前面例子 df =9 x 10/2 – 21 = 24
_________________________________________________________________________________________________
模型 df NNFI CFI 需要估计的参数个数
______________________________________________________________________________________________
M1 24 40 .973 .982 21 = 9 Load+9 Uniq+3 Corr
M2 27 503 .294 .471 18 = 9 Load+9 Uniq
M3 26 255 .647 .745 19 = 9 Load+ 9 Uniq+1 Corr
M4 26 249 .656 .752 19 = 9 Load+9 Uniq+1 Corr
M5 27 263 .649 .727 18 = 9 Load+9 Uniq
M6 24 422 .337 .558 21 = 9 Load+9 Uniq+3 Corr
M7 21 113 .826 .898 24 = 9 Load+9 Uniq+6Corr
______________________________________________________________________________________________
模型比较
自由度, 拟合程度 , 不能保证最好,可能存在更简洁又拟合得很好的模型
Input:
相关(或协方差)矩阵
一个或多个有理据的可能模型
Output:
既符合某指定模型,又与 差异最小的矩阵
估计各路径参数(因子负荷、因子相关系数等)。
计算出各种拟合指数
结构方程模型的重要性
Structural Equation Model,SEM
Covariance Structure Modeling,CSM
LInear Structural RELationship , LISREL
结构方程模型的结构
测量模型
—外源指标(如6项社经指标)组成的向量。
—内生指标(如语、数、英成绩)组成的向量
—因子负荷矩阵
—误差项
结构模型
结构方程模型的优点
同时处理多个因变量
容许自变量和因变量含测量[误差传统方法(如回归)假设自变量没有误差 ]
同时估计因子结构和因子关系
容许更大弹性的测量模型
估计整个模型的拟合程度[用以比较不同模型 ]
SEM包括:回归分析、因子分析(验证性因子分析、 探索性因子分析)、t检验、方差分析、比较各组因子均值、交互作用模型、实验设计
一 验证性因子分析
17个题目:
学习态度及取向
A、B、C、D、E
4、4、3、3、3题 350个学生
Confirmatory Factor Analysis Example 1
DA NI=17 NO=350 MA=KM
KM SY
1
.34 1
…
MO NX=17 NK=5 LX=FU,FI PH=ST TD=DI,FR
PA LX
4(1 0 0 0 0)
4(0 1 0 0 0)
3(0 0 1 0 0)
3(0 0 0 1 0)
3(0 0 0 0 1)
OU MI SS SC
什么情况下固定?
两个变量(指标或因子)间没有关系,将元素固定为0
例如,不从属,将因子负荷(LX 1,2)固定为0。又如,因子和因子没有相关,PH 1,2 固定为0。
需要设定因子的度量单位(scale)
因子没有单位,无法计算。
一种将所有因子的方差固定为1(或其他常数),简称为固定方差法
一种是在每个因子中选择一个负荷固定为1(或其他常数),简称为固定负荷法。
什么情况下设定为自由:所有需要估计的参数
补充例子
9个题目,第1、2、3题(第1个因子);第4、5、6题(第2个因子),第7、8、9题(第3个因子)
设因子1, 2, 3互有相关
固定方差法
MO NX=9 NK=3 LX=FU,FI PH=ST TD=DI,FR
FR LX 1,1 LX 2,1 LX 3,1 LX 4,2 LX 5,2
FR LX 6,2 LX 7,3 LX 8,3 LX 9,3
固定负荷法
MO NX=9 NK=3 LX=FU,FI PH=SY,FR TD=DI,FR
FR LX 2,1 LX 3,1 LX 5,2 LX 6,2 LX 8,3 LX 9,3
VA 1 LX 1,1 LX 4,2 LX 7,3
设因子1和因子3无关,因子1和因子2、因子2和因子3相关
固定方差法
MO NX=9 NK=3 LX=FU,FI PH=ST TD=DI,FR
FR LX 1,1 LX 2,1 LX 3,1 LX 4,2 LX 5,2 LX 6,2 LX 7,3 LX 8,3 LX 9,3
FI PH 1,3
固定负荷法
MO NX=9 NK=3 LX=FU,FI PH=SY,FR TD=DI,FR
FR LX 2,1 LX 3,1 LX 5,2 LX 6,2 LX 8,3 LX 9,3
VA 1 LX 1,1 LX 4,2 LX 7,3
FI PH 1,3
Number of Input Variables 17 (读入的变量个数)
Number of Y - Variables 0 (Y-变量个数)
Number of X - Variables 17 (X-变量个数)
Number of ETA - Variables 0 (Y-因子个数)
Number of KSI - Variables 5 (X-因子个数)
Number of Observations 350 (样品个数)
Parameter Specifications 参数设定
LAMBDA-X
KSI 1 KSI 2 KSI 3 KSI 4 KSI 5
-------- -------- -------- -------- --------
VAR 1 1 0 0 0 0
VAR 2 2 0 0 0 0
VAR 3 3 0 0 0 0
VAR 4 4 0 0 0 0
VAR 5 0 5 0 0 0
VAR 6 0 6 0 0 0
VAR 7 0 7 0 0 0
VAR 8 0 8 0 0 0
VAR 9 0 0 9 0 0
VAR 10 0 0 10 0 0
VAR 11 0 0 11 0 0
VAR 12 0 0 0 12 0
VAR 13 0 0 0 13 0
VAR 14 0 0 0 14 0
VAR 15 0 0 0 0 15
VAR 16 0 0 0 0 16
VAR 17 0 0 0 0 17
PHI
KSI 1 KSI 2 KSI 3 KSI 4 KSI 5
-------- -------- -------- -------- --------
KSI 1 0
KSI 2 18 0
KSI 3 19 20 0
KSI 4 21 22 23 0
KSI 5 24 25 26 27 0
THETA-DELTA
VAR1 VAR2 VAR3 VAR4 VAR5 VAR6 VAR7 VAR8 VAR9 VAR10
28 29 30 31 32 33 34 35 36 37
VAR 11 VAR 12 VAR 13 VAR 14 VAR 15 VAR 16 VAR 17
38 39 40 41 42 43 44
Number of Iterations = 19
LISREL Estimates (Maximum Likelihood) 参数估计
LAMBDA-X
KSI 1 KSI 2 KSI 3 KSI 4 KSI 5
-------- -------- -------- -------- --------
VAR 1 - - - - - - - -
()
VAR 2 - - - - - - - -
()
VAR 3 - - - - - - - -
()
VAR 4 - - - - - - - -
()
VAR 5 - - - - - - - -
()
VAR 6 - - - - - - - -
()
VAR 7 - - - - - - - -
()
VAR 8 - - - - - - - -
()
VAR 9 - - - - - - - -
()
VAR 10 - - - - - - - -
()
VAR 11 - - - - - - - -
()
VAR 12 - - - - - - - -
()
VAR 13 - - - - - - - -
()
VAR 14 - - - - - - - -
()
VAR 15 - - - - - - - -
()
VAR 16 - - - - - - - -
()
VAR 17 - - - - - - - -
()
PHI
KSI 1 KSI 2 KSI 3 KSI 4 KSI 5
-------- -------- -------- -------- --------
KSI 1
KSI 2
()
KSI 3
() ()
KSI 4
() () ()
KSI 5
() () () ()
THETA-DELTA
VAR 1 VAR 2 VAR 3 VAR 4 VAR 5 VAR 6
------ ------ ------ ------ ------ ------
() () () () () ()
VAR 7 VAR 8 VAR 9 VAR 10 VAR 11 VAR 12
------ ------ ------ ------ ------ ------
() () () () () ()
VAR 13 VAR 14 VAR 15 VAR 16 VAR 17
------ ------ ------ ------ ------
() () () () ()
Goodness of Fit Statistics 拟合优度统计量
Degrees of Freedom = 109
Minimum Fit Function Chi-Square = (P = )
Normal Theory Weight Least Sq Chi-Sq = (P = )
Estimated Non-centrality Parameter (NCP) =
90 Percent Confidence Interval for NCP = ( ; )
Minimum Fit Function Value =
Population Discrepancy Function Value (F0) =
90 Percent Confidence Interval for F0 = ( ; )
Root Mean Square Error of Approximation (RMSEA) =
90 Percent Confidence Interval for RMSEA = ( ; )
P-Value for Test of Close Fit (RMSEA < ) =
Expected Cross-Validation Index (ECVI) =
90 Percent Confidence Interval for ECVI = ( ; )
ECVI for Saturated Model =
ECVI for Independence Model =
Chi-Square for Independence Model with 136 df =
Independence AIC =
Model AIC =
Saturated AIC =
Independence CAIC =
Model CAIC =
Saturated CAIC =
Normed Fit Index (NFI) =
Non-Normed Fit Index (NNFI) =
Parsimony Normed Fit Index (PNFI) =
Comparative Fit Index (CFI) =
Incremental Fit Index (IFI) =
Relative Fit Index (RFI) =
Critical N (CN) =
Root Mean Square Residual (RMR) =
Standardized RMR =
Goodness of Fit Index (GFI) =
Adjusted Goodness of Fit Index (AGFI) =
Parsimony Goodness of Fit Index (PGFI) =
Modification Indices for LAMBDA-X 修正指数
KSI 1 KSI 2 KSI 3 KSI 4 KSI 5
-------- -------- -------- -------- --------
VAR 1 - -
VAR 2 - -
VAR 3 - -
VAR 4 - -
VAR 5 - -
VAR 6 - -
VAR 7 - -
VAR 8 - -
VAR 9 - -
VAR 10 - -
…
Maximum Modification Index is for Element ( 8,1)LX
修正指数:该参数由固定改为自由估计, 会减少的数值
Completely Standardized Solution
LAMBDA-X
KSI 1 KSI 2 KSI 3 KSI 4 KSI 5
-------- -------- -------- -------- --------
VAR 1 - - - - - - - -
VAR 2 - - - - - - - -
VAR 3 - - - - - - - -
VAR 4 - - - - - - - -
VAR 5 - - - - - - - -
VAR 6 - - - - - - - -
VAR 7 - - - - - - - -
VAR 8 - - - - - - - -
VAR 9 - - - - - - - -
VAR 10 - - - - - - - -
VAR 11 - - - - - - - -
VAR 12 - - - - - - - -
VAR 13 - - - - - - - -
VAR 14 - - - - - - - -
VAR 15 - - - - - - - -
VAR 16 - - - - - - - -
VAR 17 - - - - - - - -
PHI
KSI 1 KSI 2 KSI 3 KSI 4 KSI 5
-------- -------- -------- -------- --------
KSI 1
KSI 2
KSI 3
KSI 4
KSI 5
THETA-DELTA
VAR 1 VAR 2 VAR 3 VAR 4 VAR 5 VAR 6
-------- -------- -------- -------- -------- --------
VAR 7 VAR 8 VAR 9 VAR 10 VAR 11 VAR 12
-------- -------- -------- -------- -------- --------
VAR 13 VAR 14 VAR 15 VAR 16 VAR 17
-------- -------- -------- -------- --------
结果解释
Q4在A的负荷很小 (LX = ),但在其他因子的修正指数(MI)也不高
不从属A,也不归属其他因子
Q8在B的负荷不高(),但在A的MI是,可能归属A
因子间相关很高 ( 至 )
模型拟合相当好: (109) =,RMSEA=, NNFI = .94. CFI= .95。
仔细检查题目内容后,删去Q4, Q8归入A
模型修正
DA NI=17 NO=350
KM SY
….(此处输入相关矩阵)
SE; 1 2 3 5 6 7 8 9 10 11 12 13 14 15 16 17/
MO NX=16 NK=5 PH=ST TD=DI,FR
PA LX
3(1 0 0 0 0)
3(0 1 0 0 0)
1(1 0 0 0 0)
3(0 0 1 0 0)
3(0 0 0 1 0)
3(0 0 0 0 1)
OU MI SS SC
Q8归属A,因子负荷很高(.49),
(94) = ,RMSEA=.040,
NNFI=.96,CFI = .97。虽然没有嵌套关系,
模型 比 好
Q8同时从属A和B?
DA NI=17 NO=350
KM SY
…
SE; 1 2 3 5 6 7 8 9 10 11 12 13 14 15 16 17/
MO NX=16 NK=5 PH=ST TD=DI,FR
PA LX
3(1 0 0 0 0)
3(0 1 0 0 0)
1(1 1 0 0 0)
3(0 0 1 0 0)
3(0 0 0 1 0)
3(0 0 0 0 1)
OU MI SS SC
模型 的结果
(93)= , RMSEA=.040, NNFI = .96, CFI = .97。
Q8在A负荷为 .54,在B负荷为
因为概念上Q8应与B成正相关,故不合理。而且这负荷相对低,所以我们选择
通常,每题只归属一个因子
修正前后模型的拟合指数比较
______________________________________
模型 df RMSEA NNFI CFI 注
______________________________________
M-A 109 195 .046 .94 .95 原模型
M-B 94 150 .040 .96 .97 删Q4,Q8-A
M-C 93 149 .040 .96 .97 删Q4,Q8-A,B
MB-2 99 152 .038 .94 .95 2阶因______________________________________
二 多质多法模型MTMM
五种方法:家长,教师,学生,纸笔测验,专题报告
能力:创造力,美术技巧,数学能力,语文能力,科学知识
25个得分(观测变量)
相关特质相关方法 (CTCM, correlated-trait correlated-method)
DA NI=25 NO=500 MA=KM
KM SY
.40
.44 .43
.39 .41 .43
.44 .38 .44 .45
.50 .21 .18 .19 .19
.19 .48 .22 .23 .18 .45
.20 .21 .53 .18 .23 .42 .43
.22 .19 .19 .53 .22 .41 .45 .45
.19 .17 .22 .19 .52 .46 .41 .39 .44
.49 .23 .23 .17 .23 .51 .23 .17 .23 .23
MO NX=25 NK=10 PH=SY,FI TD=DI,FR
PA LX
1 0 0 0 0 1 0 0 0 0
1 0 0 0 0 0 1 0 0 0
1 0 0 0 0 0 0 1 0 0
1 0 0 0 0 0 0 0 1 0
1 0 0 0 0 0 0 0 0 1
0 1 0 0 0 1 0 0 0 0
0 1 0 0 0 0 1 0 0 0
0 1 0 0 0 0 0 1 0 0
0 1 0 0 0 0 0 0 1 0
0 1 0 0 0 0 0 0 0 1
0 0 1 0 0 1 0 0 0 0
0 0 1 0 0 0 1 0 0 0
0 0 1 0 0 0 0 1 0 0
0 0 1 0 0 0 0 0 1 0
0 0 1 0 0 0 0 0 0 1
0 0 0 1 0 1 0 0 0 0
0 0 0 1 0 0 1 0 0 0
0 0 0 1 0 0 0 1 0 0
0 0 0 1 0 0 0 0 1 0
0 0 0 1 0 0 0 0 0 1
0 0 0 0 1 1 0 0 0 0
0 0 0 0 1 0 1 0 0 0
0 0 0 0 1 0 0 1 0 0
0 0 0 0 1 0 0 0 1 0
0 0 0 0 1 0 0 0 0 1
FI LX 1 1 LX 7 2 LX 13 3 LX 19 4 LX 25 5 LX 6 6
FI LX 12 7 LX 18 8 LX 24 9 LX 5 10
VA 1 LX 1 1 LX 7 2 LX 13 3 LX 19 4 LX 25 5
VA 1 LX 6 6 LX 12 7 LX 18 8 LX 24 9 LX 5 10
PA PH
1
1 1
1 1 1
1 1 1 1
1 1 1 1 1
0 0 0 0 0 1
0 0 0 0 0 1 1
0 0 0 0 0 1 1 1
0 0 0 0 0 1 1 1 1
0 0 0 0 0 1 1 1 1 1
OU AD=OFF IT=2000 SS SC
许多时候CTCM模型并不收敛,在本例中,用固定方差法,固定为1也不收敛,可固定为2来解决
模型复杂,过早检查解答是否正定并不合适,所以让AD=OFF。IT=2000是加大迭代次数
多质多法模型的相关特质相关特性(CTCU)
较大MTMM模型(如7方法×7特质)收敛机会较大
只留下首五个特质因子(NK=5)
容许他们的特殊因子(也称为误差)相关
., 第1、6、11、16、21个变量为同一个方法的分数
FR TD 1 6 TD 1 11 TD 1 16 TD 1 21
FR TD 6 11 TD 6 16 TD 6 21 TD 11 16
FR TD 11 21 TD 16 21
NK=10改为NK=5;TD=DI, FR改为TD=SY, FI
将部份对角线以外的TD元素,改为自由
DA NI=25 NO=500 MA=KM
KM SY
(此处输入相关矩阵)
MO NX=25 NK=5 PH=ST TD=SY, FI
PA LX
5(1 0 0 0 0)
5(0 1 0 0 0)
5(0 0 1 0 0)
5(0 0 0 1 0)
5(0 0 0 0 1)
PA TD
1
0 1
0 0 1
0 0 0 1
0 0 0 0 1
1 0 0 0 0 1
0 1 0 0 0 0 1
0 0 1 0 0 0 0 1
0 0 0 1 0 0 0 0 1
0 0 0 0 1 0 0 0 0 1
1 0 0 0 0 1 0 0 0 0 1
0 1 0 0 0 0 1 0 0 0 0 1
0 0 1 0 0 0 0 1 0 0 0 0 1
0 0 0 1 0 0 0 0 1 0 0 0 0 1
0 0 0 0 1 0 0 0 0 1 0 0 0 0 1
1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1
0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1
0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1
0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1
0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1
1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1
0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1
0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1
0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1
0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1
OU AD=OFF IT=2000 SS SC
三 全模型
兴趣(x1,2,3)、学生智力(x4,5,6)、自信(x7,8,9)如何影响学业(y1,y2,y3)、课外活动(y4,5,6)和服务热诚 (y7,8,9)? N =500
LY=LY, TE = TD
GA 是KSI (x) 对 ETA (y)因子的效应, NE(ETA)×NK(KSI)矩阵,与传统的回归系数相似。. GA 3,1 KSI 1 ->ETA 3
BE是NE×NE矩阵,ETA (y)对ETA (y) 的效应。
PS是结构方程残差的协方差矩阵,NE×NE矩阵。与PH相似,但PS是因子的残差(未被解释的部份)方差。
DA NI=18 NO=500 MA=KM
KM SY
…
MO NY=9 NE=3 NX=9 NK=3 PH=SY,FR PS=SY,FI TD=DI,FR TE=DI,FR BE=FU,FI
PA LY
3(1 0 0)
3(0 1 0)
3(0 0 1)
PA LX
3(1 0 0)
3(0 1 0)
3(0 0 1)
FI LY 1 1 LY 4 2 LY 7 3 LX 1 1 LX 4 2 LX 7 3
VA 1 LY 1 1 LY 4 2 LY 7 3 LX 1 1 LX 4 2 LX 7 3
PA GA
1 1 1
0 0 1
1 0 0
FR BE 2 1
FR PS 1 1 PS 2 2 PS 3 3 PS 2 3
OU SS SC MI ND=3
结果解释
=,RMSEA=,NNFI=, CFI= ,拟合不错
BE 3,2(MI=)及GA 3,3(MI = )。因为BE3,2理论上不太合理,且ETA2,3间已有相关
故第一个修正模型M2是让GA 3, 3自由估计, =;GA 3,3 = ,说明增加路径GA 3, 3是合适。
然后考虑要不要减少原有路径。在各因子关系中,BE 2,1= (SE = , t = )的效应最小,可以删除该路径。将模型M2的 BE 2,1固定为0,变成模型M3。
增加自由参数(模型变复杂),模型的卡方会减少;减少自由参数(模型变简单),模型的卡方会增加。
如果增加自由参数后,卡方非常显著地减少,说明增加自由参数是值得的。
如果减少自由参数后,卡方没有显著地增加,说明减少自由参数是可取的。
四 高阶因子分析
设一阶能力因子有相关,需估计的参数很多。5个一阶因子时,共有10个因子间相关。
设有一个普遍能力(二阶)因子,影响各一阶能力因子的表现。10个相关改由5个参数(二阶因子与一阶因子的关系)所替代。
二阶因子卡方必然较大,自由度也增加,只要增加的卡方不到显著水平,从模型简洁性,我们选择二阶模型
Higher Order CFA
DA NI=17 NO=350
KM SY
…..
SE; 1 2 3 5 6 7 8 9 10 11 12 13 14 15 16 17/
MO NK=1 NY=16 NE=5 PS=DI,FR TE=DI,FR GA=FU,FR
PA LY
3(1 0 0 0 0)
3(0 1 0 0 0)
1(1 0 0 0 0)
3(0 0 1 0 0)
3(0 0 0 1 0)
3(0 0 0 0 1)
FI LY 1 1 LY 4 2 LY 8 3 LY 11 4 LY 14 5
VA 1 LY 1 1 LY 4 2 LY 8 3 LY 11 4 LY 14 5
OU SS SC
解释结果
MB-2ord节省5个df,chi-2大致相同,其他指数拟合较好
二阶因子与一阶因子关系(GA系数)很强(.66, .66, .66, .75, .66)
若一阶因子间相关很弱,没有建立二阶因子的需要
当模型只有3个一阶因子时(共有3个相关),二阶因子在数学上等同于一阶因子模型
因拟合指数反映整个模型的拟合程度,一阶因子模型要有较好的拟合指数。对因子少的一阶模型(如:只含4或5个1阶因子),一般一阶与二阶拟合指数相差不大难区分
另一个二阶因子模型例子
25个题:语文、数学、英语、历史和地理能力
M-1-ord: chi-2= 464, df = 265,RMSEA = .034, TLI = .91 ; 5个因子之间的相关系数在 .41至 .50之间。
M-2-ord: 拟合优度大致相同,chi-2 = 465, df = 270, RMSEA = .033, TLI = .92, RNI = .93。按简约原则,我们应取二阶模型。二阶与一阶因子关系也很强(BE值.70, .64, .69, .64, .66
单纯形模型
拟单纯形模型 (quasi-simplex)
多组SEM分析
第一类:多组验证性因子分析(或路径分析),
各组(例如男、女组)的因子结构是否相同?某些路径参数在不同的组是否有显著差异?(与比较多组回归系数是否相同类似)
第二类:各组的因子均值是否相同。这与传统方差分析相似 (通常需要先做第一类分析)
多组验证性因子分析
1. 形态相同(configural/pattern invariance)
2. 因子负荷等同
3. 误差方差等同
4. 因子方差等同
5. 因子协方差等同
表4-2 多组验证性因子分析各模型的拟合指数
Model df chi-2 RMSEA NNFI CFI
M0,M男生单独估计 24 .0423 .969 .979
M0,F女生单独估计 24 .0347 .976 .984
M1 两组同时估计, no Inv 48 .0384 .972 .982
M2 Loading Inv 54 .0389 .972 .979
M3 Ld, PH(3,1) Inv 55 .0383 .973 .979
M4 Ld, FacCov Inv 60 .0354 .977 .981
M5 Ld、FacCov、U Inv 69 .0364 .974 .975
M6 Ld,FacCov,U,Intrcpt Inv78 .0361 .975 .973
M7 Ld,FacCov,U,Intrcpt Inv;
Fac meanFree 75 .0334 .979 .978
M8 Ld,FacCov,U,Intrcpt,
FacM Inv 78 .0360 .975 .973
Multiple Group using NG=2,M1
Male
DA NI=9 NO=600 NG=2
KM
<男生组相关矩阵>
SD
.98
MO NX=9 NK=3 LX=FU,FI PH=SY,FR TD=DI,FR
FR LX 2,1 LX 3,1 LX 5,2 LX 6,2 LX 8,3 LX 9,3
VA 1 LX 1,1 LX 4,2 LX 7,3
OU SS SC ND=3
female
DA NO=700
<<KM, SD 女生组>>
MO LX=PS PH=PS TD=PS
OU SS SC ND=3
multiple group fixing LX, M2
male
DA NI=9 NO=600 NG=2
<KM, SD 男生组相关矩阵>
MO NX=9 NK=3 LX=FU,FI PH=SY,FR TD=DI,FR
FR LX 2,1 LX 3,1 LX 5,2 LX 6,2 LX 8,3 LX 9,3
VA 1 LX 1,1 LX 4,2 LX 7,3
OU SS SC ND=3
female
DA NO=700
<KM, SD女生组>
MO LX=IN PH=PS TD=PS
OU SS SC nd=3
fixing covariance of PH 1 3 to be equal
multiple group, M3
male
DA NI=9 NO=600 NG=2
<KM, SD 男生组相关矩阵>
MO NX=9 NK=3 LX=FU,FI PH=SY,FR TD=DI,FR
FR LX 2,1 LX 3,1 LX 5,2 LX 6,2 LX 8,3 LX 9,3
VA 1 LX 1,1 LX 4,2 LX 7,3
OU SS SC ND=3
female
DA NO=700
<KM, SD女生组相关矩阵>
MO LX=IN PH=PS TD=PS
EQ PH 1 3 1 PH 3 1
OU SS SC nd=3
fixing all covariances of factors
multiple group,M4
male
DA NI=9 NO=600 NG=2
<KM, SD男生组相关矩阵>
MO NX=9 NK=3 LX=FU,FI PH=SY,FR TD=DI,FR
FR LX 2,1 LX 3,1 LX 5,2 LX 6,2 LX 8,3 LX 9,3
VA 1 LX 1,1 LX 4,2 LX 7,3
OU SS SC ND=3
female
DA NO=700
<KM, SD女生组相关矩阵>
MO LX=IN PH=IN TD=PS
OU SS SC nd=3
fixing all variances of errors
multiple group, M5
male
DA NI=9 NO=600 NG=2
<KM, SD男生组相关矩阵>
MO NX=9 NK=3 LX=FU,FI PH=SY,FR TD=DI,FR
FR LX 2,1 LX 3,1 LX 5,2 LX 6,2 LX 8,3 LX 9,3
VA 1 LX 1,1 LX 4,2 LX 7,3
OU SS SC ND=3
female
DA NO=700
<KM, SD女生组相关矩阵>
MO LX=IN PH=IN TD=IN
OU SS SC nd=3
多组分析:均值结构模型
不同组别因子均值是否有显著差异(均值结构模型,mean structure models)
首先需确定各组的负荷相同
更希望因子协方差等同,误差方差等同难实现
指标截距TX等同
先让第1组的TX自由(TX=FR)
要求其他组别TX与第1组的相等 (TX=IN)
因子均值等同
先设定第1组各因子均值为0 (KA=FI )
容许其他组的KA元素自由估计(KA=FR)
因子值>2倍SE(t>),则因子不同于第1组
Multiple Group fixing tx=invariance,M6
male
DA NI=9 NO=600 NG=2
KM
<男生组相关矩阵>
SD
.98
ME
MO NX=9 NK=3 LX=FU,FI PH=SY,FR TD=DI,FR TX=FR
FR LX 2,1 LX 3,1 LX 5,2 LX 6,2 LX 8,3 LX 9,3
VA 1 LX 1,1 LX 4,2 LX 7,3
OU SS SC ND=3
female
DA NO=700
KM
<女生组相关矩阵>
SD
.99
ME
MO LX=IN PH=IN TD=IN TX=IN
OU SS SC ND=3
结果显示:
第2组的KA元素(即语文、数学、英语均值)为, 和
对应的SE为, ,
t-值为、、
这表示:
语文自信 -- 男女无差异
男生(均值为0)的数学自信高于女生(均值 = , t = )
女生的英语自信(均值 = )则高于男生(均值为0, t = )
均值结构模型(限制均值等同)
multiple group, M8 Fixing KA to be equal, male
DA NI=9 NO=600 NG=2
<KM, SD, ME 男生组相关矩阵>
MO NX=9 NK=3 LX=FU,FI PH=SY,FR TD=DI,FR TX=FR KA=FI
FR LX 2,1 LX 3,1 LX 5,2 LX 6,2 LX 8,3 LX 9,3
VA 1 LX 1,1 LX 4,2 LX 7,3
OU SS SC ND=3
female
DA NO=700
KM, SD, ME女生组相关矩阵>
MO LX=IN PH=IN TD=IN TX=IN KA=IN
OU
结构方程建模和分析步骤
验证模型与产生模型
纯粹验证(strictly confirmatory,SC)
心目中只有一个模型
这类分析不多,无论接受还是拒绝,仍希望有更佳的选择
选择模型(alternative models,AM)
从拟合的优劣,决定那个模型最为可取
但我们仍常做一些轻微修改,成为MG类的分析
产生模型(model generating,MG)
先提出一个或多个基本模型
基于理论或数据,找出模型中拟合欠佳的部份
修改模型,通过同一或其他样本,检查修正模型的拟合程度,目的在于产生一个最佳模型
结构方程分析步骤
模型建构(model specification),指定
观测变量与潜变量(因子)的关系
各潜变量间的相互关系(指定哪些因子间有相关或直接效应)
在复杂的模型中,可以限制因子负荷或因子相关系数等参数的数值或关系(例如,2个因子间相关系数等于;2个因子负荷必须相等)
模型拟合(model fitting,通常 ML)
主要的是模型参数的估计(.,回归分析,通常用所最小二乘方法拟合模型,相应的参数估计称为最小二乘估计 )
模型评价(model assessment)
结构方程的解是否适当( proper),估计是否收敛,各参数估计值是否在合理范围内(例如,相关系数在 +1与-1之内)
参数与预设模型的关系是否合理。当然数据分析可能出现一些预期以外的结果,但各参数绝不应出现一些互相矛盾,与先验假设有严重冲突的现象
检视多个不同类型的整体拟合指数,如 NNFI、CFI、RMSEA 和等
含较多因子的复杂模型中,无论是否删去某一两个路径(固定它们为0),对整个模型拟合影响不大
应当先检查每一个测量模型
模型修正(model modification)
依据理论或有关假设,提出一个或数个合理的先验模型
检查潜变量(因子)与指标(题目)间的关系,建立测量模型
可能增删或重组题目。
若用同一样本数据去修正重组测量模型,再检查新模型的拟合指数,这十分接近探索性因素分析(exploratory factor analysis,EFA),所得拟合指数,不足以说明数据支持或验证模型
可以循序渐进地,每次只检查含2个因子的模型,确立测量模型部分的合理后,最后才将所有因子合并成预设的先验模型,作一个总体检查。
对每一模型,检查标准误、t值、标准化残差、修正指数、参数期望改变值、及各种拟合指数,据此修改模型并重复步骤。
这最后的模型是依据某一个样本数据修改而成,最好用另一个独立样本,交互确定(cross-validate)
参数估计和拟合函数
目标是参数使得隐含协方差矩阵 与样本协方差矩阵 “差距”最小
称为拟合函数(fit function)
多种拟合函数,参数估计值可能不同
工具变量 (IV, instrumental variable);
两阶段最小二乘 ( TSLS, two-stage least squares);
无加权最小二乘 (ULS, unweighted least squares);
最大似然 (ML, maximum likelihood);
广义最小二乘 (GLS, generalized least squares);
一般加权最小二乘 (WLS, generally weighted least sq)
对角加权最小二乘 (DWLS, diagonally weighted least sq)
专题讨论——涉及数据的问题
样本容量
每个因子上多设计几题,预试协助删去一些不好的题目
最后每个因子应有3个或更多的题目
数据类型
绝大部份分析基于皮尔逊(Pearson)相关
来自等级(顺序)量表(ordinal scale),改用多项(polyserial)相关系数,并与渐近方差矩阵(asymptotical covariance matrix,ACM)合用,以WLS法拟合模型,除非N很大,额外需要的ACM矩阵多不稳定
可否应用相关矩阵作分析?
SEM建立在方差和协方差分析上
用相关矩阵,大多数情况下正确
在某些况下并不正确(见Cudeck, 1989 ):
限制因子方差为 1,同时限制某指标的因子负荷不等于零
同一个因子,限制其两个或以上指标的因子负荷,不等于零
同一个因子的两个或以上指标,限制其因子负荷相同
不同因子的两个或以上指标,限制其因子负荷相同
限制两个或以上内生潜变量的误差相等
专题讨论——涉及模型拟合的问题
忽略测量误差所引致的错误
方差(变异量)
x变异量= 变异量+ 误差变异量
除非 等于零,传统统计高估了变量的真正变异量
相关和回归参数
单指标潜变量
不能同时估计LX 与TD
对相关矩阵
FI LX 4,3 TD 4,4
VA .922 LX 4,3 ! SQRT(.85)=.922
VA .15 TD 4,4 ! ()=
误差相关
除非在特殊设计 (重复测量multi-wave panel),刻意容许误差相关
在一般研究,通常不容许误差可以相关
为甚么要考虑等同模型?
以同样个数的参数(t),用不同组合产生许多不同模型,而其中再生协方差矩阵,完全相同
换句话说,同样个数的参数(t)产生多个与样本数据有相同拟合程度、但结构不同的模型
结构方程是否验证变量间的因果关系?
严格来说,非经设计用以探讨变量间因果效应的研究,都不能证明变量间是否真正存在因果关系。单从等同模型,已经可以举出拟合指数相同,但变量间效应相反的例子
利用非实验设计:
采用纵贯研究数据,每个变量至少要有2次测量(2时段以上设计)
使用多个指标以推算潜变量
样本要够大并具代表性,使结果具有实质意义和普遍性
考虑不同模型的意义,考虑指标误差项相关的意义
合宜和错误的高阶因子
不一定可以强将数个因子合并,并简化为高阶因子的关系
例 :学生的性格如何影响学生成绩表现
通过SPSS读取数据
方法一(使用PRELIS)
1.在SPSS中创建 .sav 文件
(1)使用compute, recode 命令对数据进行编辑。
(2)把在LISREL中要用到的变量保存为 (文件名.sav)。
2.在LISREL中创建.dsf文件
(1)点击“file”菜单中的“Import External Data in Other Format”
(2)“file of type”一项,选择“spss for window(*.sav)”; 通过恰当的路径选择“”。
(3)现在看到一个表格,保存为, (或其他设置的文件名,但LISREL并不读取.psf文件)。
(4)对.psf文件进行必要的“transformation”和“statistics”后,选择“statistics”菜单中的“Data Screening”,对数据进行扫描(现在已自动创建了LISREL程序所用的)。
方法一(续)
3.在LISREL中创建.ls8文件
(1)点击“file”中的“new”(或打开旧文档名)
(2)在第一行,用“SY=”代替“DA”“ME”“KM”“SD”命令。
(3)例如:
SY=
MO NX=9 NK=3…
(4) 把以上语句保存为 (文件名.ls8)。
(5)点击“run LISREL”运行程序。
通过SPSS读取数据
方法二(输出.txt协方差距阵)
1.在SPSS中创建 .cov 文件(此文件可以采用“cov”或其他扩展名)
(1) 使用compute,recode 等命令编辑数据。
(2)把LISREL程序所用的变量保存为 (文件名.sav)。
(3)创建协方差矩阵文件 (文件名.cov);把任一变量作为因变量,把其他所有变量当作自变量。
regression
matrix=out(‘c:\SEM\’)
/var=y1 y2 y3 x1 x2 x3
/desc=cov
/dep=y1/meth=enter y2 to x3 .
方法二(续)
2.在SPSS中创建 .txt 文件
(1)读取所选的协方差矩阵文件(这并不是一个txt文件,只有SPSS能读取并使用它);输出这个文件内容为 (文件名.txt) 供LISREL使用。
(2): 使用指数格式,5位小数,总共13位数字。
get file=’C:\SEM\’ .
print format y1 to x3 () .
print outfile=’C:\SEM\’ .
/y1 to y2
/y3 x1 to x3.
execute .
方法二(续)
3.在“notepad”中去掉人数N(MS-WIN 的辅助非文本档案编辑器)
(1)编辑,去掉人数N (N为被试人数;在回归中,用列删法会有p个“N”值,对删法会有p×p个“N”值)。
(2)保存为。
(3)在LISREL程序中,甚至在分析中不会用着他们时,也必须读取ME, SD, KM。
DA NI=6 NO=249 MA=CM
ME FI=
SD FI=
KM FI= FU
MO NX=6 NK=2…