結構方程模型進階
張偉豪
SPSS宏德國際軟體諮詢資深顧問
成大企管博士候選人
勞委會職訓局專任講師
南部希望園區顧問
大綱
SEM概念
SEM參數估計原則
SEM十誡
SEM注意事項
結構模式與測量模式
分析資料的多元常態及例外值檢核
(Bollen- Stine 檢定)
Bootstrap應用
共線性的判定
結構模式的二階段準則
參數的解讀
大綱
何謂信度與效度?
信、效度的種類
探索式因素分析vs.驗證式因素分析
問卷信度評估
Cronbach’s α (標準化與非標準化係數的區別)
組內相關係數 (Intraclass correlation coefficient, ICC)
組成信度 (Composite Reliability, CR)
平均變異數萃取量 (Average Variance Extracted, AVE)
問卷效度評估
收斂 (convergence)效度、區別 (discriminant)效度
交叉效度 (cross validity)
文獻
Anderson . and Gerbing . (1988), Structural Equation Modeling in practice: a Review and Reccomended Two-Step Approach, Psychological Bulletin, 103, 3.
Bollen, . (1989). Structural equations with latent variables. New York: Wiley.
Chin, ., “Issues And Opinion on Structural Equation Modeling”, MIS Quarterly, (1), -16,1998.
Diamantopoulos, Adamantios and Judy A. Siguaw (2000), Introducing LISREL: A Guide for the Uninitiated. London: Sage Publications.
Fornell and Larcker (1981), “Evaluating Structural Equation Models with Unobservable Variables and Measurement Error,” Journal of Marketing Research, 18 (February), 39-50.
McGraw, K. O., & Wong, S. P. (1996). Forming inferences about some intraclass correlation coefficients. Psychological Methods, 1(1), 30-46.
Kline Rex B. (2005). Principles and Practice of Structural Equation Modeling (2. nd. ed.). New York: Guilford Press.
Torkzadeh, Koufteros,& Pflughoeft (2003) Confirmatory analysis of computer self-efficacy. Structural Equation Modeling, 10(2): 263-275.
所有外生變數的變異數均是模型的參數
所有自變數之間的共變異數都是模型的參數。
所有潛在變數與觀察變數之間的因素負荷量均是模型的參數
所有的觀察變數或潛在變數之間的迴歸係數都是模型的參數
應變數之間與自變數與應變數之間的共變異數都不是模型的參數
模型中的每一個潛在變數,必須給定一個適當的潛在量尺
SEM參數設定原則
(Raykov & Marcoulides,2006)
所有外生變數的變異數均是模型的參數
所有自變數之間的共變異數都是
模型的參數
所有潛在變數與觀察變數之間的因素負荷量均是模型的參數
所有的觀察變數或潛在變數之間的迴歸係數都是模型的參數
應變數之間與自變數與應變數之間的共變異數都不是模型的參數
潛在變項與一般量測變項最大的不同在其「不可直接量測」的特性,因此潛在變項缺乏一個自然存在的尺度,而必須以人為的手段設定尺度
SEM最常使用的方法是將「外生潛在變項」變異數設為1;或將潛在變項其中的一個「測量變項與潛在變項」的因素負荷量設為1。
兩種方法結果一樣,若目的為理論驗證,採第二種方法較為適宜。
SEM參數設定原則-第6原則探討
D1
x1
x2
滿意度
y1
y2
e1
e3
L1
e4
e2
L2
1
L4
W
1
忠誠度
標準化設定
未標準化設定
結構方程模型估計十誡
(Grimm & Yarnold, 2006)
第十誡
SEM不要用於小樣本 (100個以下)
第九誡
當利用共變異數矩陣分析時,要根據變數尺度選擇正確的矩陣
如變數均為連續尺度,則可用一般的共變異數矩陣;若為連續與類別尺度混合,則採用polychoric matrix;若為連續與順序尺度混合,則採用polyseries matrix。
結構方程模型估計十誡
(Grimm & Yarnold, 2006)
第八誡
模式選擇要以配適度良好,精簡模型為主
第七誡
資料分析需符合多元常態,因此所有變數要符合常態分配,亦即變數不可以是二分變數。
第六誡
要使用多個配適指標做為模型評估是否配適良好的依據
結構方程模型估計十誡
(Grimm & Yarnold, 2006)
第五誡
模式估計除了要考慮統計證據外,也要把理論依據及實務上的考量考慮進來,
第四誡
測量模式要優先考量於結構模式。
第三誡
考慮多個可能的競爭模型
結構方程模型估計十誡
(Grimm & Yarnold, 2006)
第二誡
有關於模式搜索,需要大樣本執行,分析時最好有一個獨立的比較樣本。
第一誡
絕對不要宣稱本估計模型是最佳模型。
SEM的注意事項
(Chin, 1998)
Capitalization on Chance
根據修正指標的指示,在沒有任何理論依據下任意連結。
利用探索式因素分析的結果放入驗證式因素分析下進行探討。
SEM的假設為 S-Σ(θ)=0,不需要每一條路徑去做假設,但結果需探討每一條的關係並說明。
SEM的注意事項
(Chin, 1998)
所有的SEM分析均是反映型(reflective)指標,不是形成型(formative)指標。
二階因素分析的存在,需先證明一階構面據有收斂效度,二階因素分析時,對每一個一階因素的loadings也要達以上。
SEM的注意事項
(Grimm & Yarnold, 2006)
傳統的分析方法如ANOVA,多元迴歸均假設變數本身的信度為1;SEM將測量誤差納入分析是一大特色。因此,兩個結果沒有比較的意義。
SEM的分析的結果不可以拿來做 “因果關係”的推論。
結構模式與測量模式
分析資料的多元常態及例外值檢核
(Bollen- Stine 檢定)
Bootstrap應用
共線性的判定
結構模式的二階段準則
參數的解讀
結構模式與測量模式-
多元常態及極端值檢核
View Analysis Properties
多元常態檢定
顯示為多元非常態
極端值檢定
P2小於.001即為極端值,應予刪除,一次一個
Bollen - Stine 檢定 (1993)
當輸入資料呈現非常態時,可採用Bollen-Stine校正p-value ,三步驟如下:
確認您的資料分配為非多元常態
利用Bollen-Stine 校正p-value評估整體配適度
使用拔靴法 (bootstrap)產生參數值、估計參數標準誤及每個參數的顯著性檢定
小樣本分析處理
Bootstrapping (拔靴程序)
利用抽出放回的方式重覆抽樣來增加樣本數
為了得到穩定的平均數分布 (常態分配)、信賴區間及標準誤估計
Bollen-Stine bootstrap
Bollen-Stine 計算結果
Bollen-Stine p-value
Bootstrap Distributions
卡方平均值
重新估計路徑值
估計值
Bootstrap估計值
結構模式的二階段準則 (Bollen,1989)
重新界定 SR 模型成為 CFA 模型,並讓所有的因素有相關。
View the structural portion of the SR as a path model.
二階段準則是充份條件,假如測量與結構模型都是一樣的,整個模型就會正定。
原始結構模型
Figure 1
第一步:將模型重新架構成一階CFA有相關
Figure 2
Commentary: Issues and Opinion on Structural Equation Modeling
The population from which the data sample was obtained.
The distribution of the data to determine the adequacy of the statistical estimation procedure.
The conceptual model to determine the appropriateness of the statistical models analyzed.
Statistical results to corroborate the subsequent interpretation and conclusions.
信、效度的重要性
信、效度的分析是社會科學研究的基礎,而達成這個目的:
適當的調查工具(問卷)
適當的過程(抽樣及分析)
達到有意義的結果(推論)
何謂信度與效度?
信度
指測量工具本身的準確程度。信度可以從以下兩個角度來了解,一是測量工具穩定一致的程度,二是從測量的誤差情形。
效度(結果導向)
指測驗分數的正確性。亦即指一個測驗能夠測量到它所想要測量的特質與實際情況接近的程度。
信、效度的評估
not everything that can be counted counts, and not everything that counts can be counted.--------------Albert Einstein
百發百中 彈無虛發
無的放矢 亂槍打鳥
瞎猫碰上 死耗子
志在參加 不在得名
研究中常見的信、效度
信度
Cornbach’s α、折半信度、再測信度、複本信度、互評信度、組成信度、組內相關係數 (intra-class correlation, ICC)
效度
構面效度(收斂效度及區別效度) 、內容(表面)效度、平均變異數萃取量、效標效度(預測、同步效度) 、 專家效度、法則效度、交叉(外部)效度、統計效度、 MultiTrait-MultiMethod (MTMM)。
Cronbach’s alpha
Cronbach’s α標準化與非標準化之差異
J1,J2 & J4,J5相關
Cronbach’s α標準化與非標準化之差異
非標準化係數
標準化係數
量表題項變異數總合
量表題項加總後變異數
量表包含的總題數
所有題項皮爾森兩兩相關的平均
Cronbach’s α
判定標準
Cronbach’s Alpha 一般學者認為以下 量表應重編;至少要以上; ~表理想。
Item-total correlation 以下刪除
以上表示(Nancy et al. p 67)
SPSS for Intermediate Statistics Use and Interpretation (2nd Ed.) (2005)
組內相關係數
(Intraclass Correlation Coefficient, ICC)
ICCs的目的是測量兩個或多個測量(或評估者)的一致性。又稱Inter-rater reliability
ICCs從概念上可視為組間變異與總變異之比例。
分析方法採用two-way ANOVA。
ICC根據分析目的可分為六大類: 請參考(MaGraw & Wong, 1996)
組內相關係數
(Intraclass Correlation Coefficient, ICC)
ICC結果
探索式因素分析
研究人員一開始並未有特定數量的潛在因素被萃取出來。
F1
e1
F2
e2
e3
e4
e5
e6
x1
x2
x3
x4
x5
x6
Charles Spearman
驗證式因素分析
CFA需要研究人員事先指定預期的結果
因素的個數
每個因素所反應的變數(指標)
因素之間是否相關
F1
e1
F2
e2
e3
e4
e5
e6
x1
x2
x3
x4
x5
x6
1
1
Karl Joreskog
一階(初階)驗證式因素分析
F1
e1
F2
e2
e3
e4
e5
e6
x1
x2
x3
x4
x5
x6
1
1
二階(高階)驗證式因素分析
e1
e2
e3
e4
e5
e6
F1
F2
x1
x2
x3
x4
x5
x6
1
1
F3
1
二階CFA考慮的重點
二階CFA執行結果要有不錯的模型配適度,亦即有一個二階因素可以取代一階的共變關係
理論上,二階因素是否為一階因素的傳遞媒介
同一階的方式標準檢定信、效度
二階對一階仍然是反映型指標,loading之一任要加以限制, loading要>
CFA模型設定的考量
以下這個又如何呢?
EFA VS. CFA
EFA
CFA
探索式 (data-driven)
驗證式 (theory-driven)
因素個數由資料決定
因素個數由研究者指定
問卷設計的前端
問卷應用的後端
PCA是常用的估計法
ML法是常用的估計法
不考慮共線性問題
考慮模型配適度
只提供標準化結果
提供標準及非標準化結果
沒有loading 顯著性報告
有loading 顯著性報告
EFA無法做額外的設定
CFA模型設定有彈性
無法執行跨群組比較
可執行跨群組(時間)的比較
SEM的重要矩陣
S矩陣
樣本共變異數矩陣
調查的資料
Σ(θ) 矩陣
模型再製(預測)矩陣 (model implied covariance)
殘差共變異數矩陣
S-Σ(θ)
估計方法
(ML, ADF, WLS, ULS)
CFA的目的是用來估計測量模型(因素負荷量、因素變異數及共變異數、誤差項共變異數) 。
運用疊代的方式使得S矩陣與Σ(θ) 矩陣儘可能的接近,亦即愈接近, 模型配適度愈好。
疊代運算停止的兩個充份條件
達到電腦預計的疊代次數,如25次
模式收斂完成,亦即達到電腦預設標準
疊代到底是蝦米碗榚呢?
樣本矩陣S
模型預測矩陣Σ
估計方法(ML)
CFA實務上的基本要求
量表最好為七點尺度 (Bollen, 1989)
每個潛在構面至少要有三個題目, 五~七題為佳 (Bollen, 1989)
若為多個因素模型,每一指標不得橫跨到其它潛在因素上(Bollen, 1989)
問卷最好引用自知名學者,儘量不要自己創造
一階有相關CFAvs.二階CFA
一階CFA模型和EFA的比較
一階CFA模型(單一群組分析)
統計效度
常態
同質
獨立
統計效度-常態假設
How to deal with non-normality?
統計效度-同質性假設
構念效度
收斂效度
區別效度
收斂效度的評估標準
SMC要=>
組型係數(factor loading)要=>
組成信度(CR)>
AVE>
Cronbach’s alpha>
組成信度
(composite reliability; CR)
CR值是其所有測量變項信度的組成,表示構念指標的內部一致性,信度愈高顯示這些指標的內部一致性愈高,是可接受的門檻( Hair,1997) , Fornell and Larcker (1981)建議值為以上。
計算公式
構念的組成信度=(Σ標準化因素負荷量)2/((Σ標準化因素負荷量)2+(Σ各測量變項的測量誤差)) (Jöreskog and Sörbom , 1996) 。
平均變異萃取量
(Average variance extracted,AVE)
AVE是計算潛在變項對各測量項的變異解釋力,若VE愈高,則表示潛在變項有愈高的信度與收斂效度。
Fornell and Larcker(1981)建議其標準值須大於(即由構面的可解釋變異大於測量誤差)。
計算公式
AVE=Σ(因素負荷量2)/((Σ因素負荷量)2+ (Σ各測量變項的測量誤差)) (Jöreskog and Sörbom , 1996)
一階CFA測量模型因素效度檢定
有沒有負的誤差變異數
因素負荷量有沒有接近或大於1
過大的標準誤
區別效度檢定
區別效度的檢定
直接檢查構面的相關係數,一般以為標準(較不嚴謹) 。
利用bootstrap計算構面之間的相關係數95%信賴區間,若沒包含1,則有區別效度 (Torkzadeh, Koufteros, pflughoeft , 2003)。
SEM檢定構面之間的相關係數設為1,如果reject則表示有區別效度(巢型結構) (Anderson and Gerbing,1988, Bogozzi et al., 1991) 。
AVE法,每個構面的AVE要大於構面相關係數的平方(Fornell and Larcker, 1981) 。
ECVI,AIC指標配適法(非巢型結構) (Kline, 2005, p151)
區別效度觀察法
相關矩陣
有形2
有形4
有形5
有形6
有形7
流程1
流程2
流程4
流程5
流程6
回應1
回應2
回應3
有形2
1
有形4
1
有形5
1
有形6
1
有形7
1
流程1
1
流程2
1
流程4
1
流程5
1
流程6
1
回應1
1
回應2
1
回應3
1
信賴區間(拔靴,bootstrap)法
Bootstrap信賴區間輸出結果
SEM係數檢定法
AVE法
F1
F2
F3
F1
F2
F3
對角線為AVE值
非對角線為標準化係數平方
ECVI,AIC指標配適法
將模型原來的問項以一個,兩個及三個構面來呈現,比較ECVI及AIC,值愈小表模型愈佳,若三個因素模型優於2個或1個因素,則稱為有區別效度。
Model fit
Full model
3 factors
Reduced
Factor 12
Reduced
Factor 13
Reduced
Factor 23
AIC
ECVI
二階CFA測量模型因素效度檢定
多群組比較步驟 (Browne, 2006)
分開檢定每一群之CFA模型
同步檢定因素結構權重等同
檢定因素負荷量等同
檢定指標(問卷題項)截距等同
檢定指標殘差等距(選擇性的)
檢定因素變異數等同
檢定因素共變異數等同 (假如有多個潛在變項)
檢定潛在變項平均數等同
測量模型不變性
同質性測量
交叉效度(複合效化) Cross validity
廣義:指測量結果具有跨樣本-跨情境的有效性。在SEM結構模式中,一個理想模型在不同樣本上重複出現的程度。
凡測量不同情境下的穩定性檢驗,都可視為交叉效度的一種做法。
交叉效度的概念反映了效度一般化(validity generalization)的能力,研究者由不同樣本上重複獲得證據,證明量表有效性的一個動態性、累積性的過程。
多群組的CFA是最佳分析工具。
交叉效度檢定
研究中的
模型數目
效度樣本來源
相同母體
不同母體
單一模型
模型穩定性
效度延展性
不同模型
模型選擇性
效度一般性
Diamantoulos and Siguaw (2000) p:130
交叉效度的執行過程
將原始資料隨機分成兩群 (請SPSS幫忙)
執行Amos中的多群組比較
群組之間的比較如 “因素負荷量”、 “結構(路徑)係數”及 “因素共變異數”之間 沒有差異,則表示模型具相當的 穩定性(交叉效度)。
SPSS操作過程
交叉效度
多群組比較
多群組比較
多群組比較
總結
學術研究的最佳統計工具
SPSS & Amos
視覺化的操作介面
豐富的統計方法
易學易用的線上輔助系統
完整的統計分析流程
讓統計變得容易
宏德國際軟體諮詢顧問股份有限公司