Download - SEM 演講 — 一般因徑模式
SEM演講—一般因徑模式
主講人 余泰魁
何謂 SEM
結構方程式模型分析法 (Structural Equation Model; SEM; 以下簡稱為 SEM) 是一種以迴歸為基礎 (Regression-based technique)的多變量技術,並結合徑路分析,它屬於驗證性實證研究的資料分析法,能同時處理多組變項間的關係,其目的在探究變數間的因徑關係以驗證理論,故又可稱為因果模式分析技術 (Causal Modeling Technique) 或可稱之為因徑模式分析技術。因此,在使用驗證性研究方法時,研究者所提的研究模式必須具有理論基礎,由理論來引導。
SEM 主要目的 1. 可以解釋一系列具有相互依存變數或變項之間的關係 2. 這些變數( Variable )可區分為外生的( Independence, Exogenous )及內
生的( Dependence, Endogenous ),這些變數均為可觀察的 3. 一些具有相同性質的變數,若在理論基礎上能形成一個構面( Construct ),
則會產生一個或數個潛伏變量( Latent variate ):此部份即因素分析( Factor Analysis )的概念
4. 依據理論或相關研究,這些潛伏變量之間存在著某些因徑關係, SEM 即是以線性( Linear )數學模式來表示這些關係:此部份即迴歸( Regression )的概念
透過上述 3 、 4 建立完整的模式,再利用 2 所觀察到的變數,來驗證模式的配適性,以解釋其因徑關係,即是 SEM 的目的
必須先有理論,才導出 SEM MODEL ,若只用 data fit 出模式,然後就解釋模式是明顯不對的作法。 ( 最為人所垢病 )
SEM 其它應用 SEM 其它應用:
(1) 因素分析若從不同母體抽樣,是否可導出相同的因素模式,可透過多群本樣本資料的分析來達成(2) 多變量複迴歸。 IV 與 DV 間、 DV 與 DV 間的因徑關係(3) 迴歸與因素分析皆無法處理共線性,但 SEM 可以。
SEM 基本流程 發展理論模式 建構因徑關係圖 決定因徑關係的結構與測量模式 檢視因徑關係與資料共變數矩陣是否收歛 評估模式的適合度 解釋模式 修正模式 結束
SEM 資料分析流程 1
SEM 資料分析流程 2
發展理論模式 理論的合理性 理論的適用性 因徑關係的正確性 變項衡量的一致性
行為理論-理性行動理論 (TRA)
態度
主觀規範
行為意向 行為
Ajzen & Fishbein, 1980
行為理論-科技接受模型 (TAM)態度
主觀規範
行為意向 行為
外部變數
知覺易用
知覺有用
態度 行為意向 行為
Davis, Bagozzi, & Warshaw, 1989
科技接受模型二代 (TAM)
Venkatesh, V., & F.D. Davis, 2000.
行為理論-整體科技接受第三代
Venkatesh, Morris, Davis & Davis, 2003
簡化的 TAM
複雜化的 TAM3
建構因徑關係圖 構念間的徑路關係最好要有文獻支持
研究者對理論的熟悉度 理論被應用的廣泛程度
決定是否為遞迴模式與非遞迴模式
決定潛在內生變項與潛在外生變項 研究文獻與理論的支持 合理的創新是被允許
決定因徑關係的結構與測量模式 研究者決定潛在內生變項與潛在外生變項後,針對結構與
測量模式應以簡圖呈現 測量模式與結構模式二者並重 測量模式—檢視變項的因素負荷量、測量問項的信效度 結構模式—檢視變項間的徑路關係 潛在變項被單一測量變數衡量
原則將其估計值設定為 1 ,並不開放予以 LISREL 自行估計
應儘量減少此一現象
檢視因徑關係與資料共變數矩陣是否收歛 資料的投入
相關矩陣 共變異數矩陣—強烈建議
模式的估計 如參數估計方法 (Maximum Likelihood, ML ; Generalized Least
Squares, GLS ; Weighted Least Squares, WLS) 的選擇—建議以 ML 樣本數— 200左右,建議至少為 250~350 間 Chi-square 值
程式的選擇 AMOS LISREL EQS
資料的投入 Covariance Matrix 之時機:檢定理論,比較不同的母體或
樣本;或解釋待驗證的理論,主要衡量研究變項的總變異,較建議採用此法投入資料
Correlation Matrix 之時機:直接比較模式中的係數;或瞭解研究變項之間的關係,使用較廣 。
Raw Data 之處理: Prelis 可協助進行名目尺度轉換為相關矩陣
模式鑑定度 待估計之參數個數為 t ,方程式個數為 s=(p+q)(p+q+1)/
2 , p 為測量變數 y 的個數, q 為測量變數 x 的個數
若 t = s ( just identified ):對每一個參數恰有一個估計值。 df = 0 ,沒有多餘的資訊來檢定模式
若 t < s ( over identified ):一個參數有數個估計值。 df > 0 ,有一組估計值能用來檢定模式
若 t > s ( unidentified ): df < 0 ,必須作下列處理,才能進行 Lisrel
評估模式的適合度 自由度—樣本數須大於欲估計參數個數,較易找到適配模式 針對異常估計值 (誤差變異數為負、標準化係數大於 1 、估
計係數的標準差很大 ) ,予以調整 測量模式評估指標
組成信度 變異抽取量
結構模式評估指標 Chi-square 值 Chi-squares/ 自由度 GFI AGFI CFI NNFI
基本配適度指標的標準 Overall model fit Incremental fit :與 Null model進行比較 Parsimonious fit :與不同測量變數個數的模型進行比較 SMC 測量變數對潛在變項的評估 Q-Q plot
Overall model fit
a. Chi-square :愈小愈好(或看 p-value ,愈大愈好),或者不顯著,但因 chi-square容易受到樣本數大小的影響,當樣本數越大時,越不容易接受 Ho 。
b. GFI :愈接近 1愈好,一般文獻臨界值 0.90 但 Baumgartner & Homburg(1996) 研究 1977-1994年間行銷與消費者領域註 [1]採 SEM進行資料分析的 184篇文獻中, GFI低於建議值的文獻比率分別為 24% ,故可放寬至 0.8
註 [1] 作者研究文獻資料來源為 Journal of Marketing, Journal of Marketing Research, International Journal of Research in Marketing, Journal of Consumer Research等四種期刊登刊之文章。
c. RMSEA :愈接近 0愈好,臨界值 0.08 ,較不受到樣本大小的影響,評鑑適配度時,有產生較穩定的現象
Incremental fit NFI :愈接近 1愈好,臨界值 0.90(Bentler, 1990,1992) ,較
不受到控制自由度與樣本大小的影響。
NNFI :愈接近 1愈好,臨界值 0.90 (Bentler, 1990,1992) ,可降低受樣本數大小的影響
Parsimonious fit Chi-square 與其自由度比值 :臨界水準介於 2.0 至 3.0 之間
(Carmines & McIver, 1981; Chin & Todd, 1995) ,不要高於 5 ,低於 2.0 時,須注意是否存在有 over-fitting情形
AGFI:主要利用研究模式的自由度與變項的個數進行調整,愈接近 1愈好,臨界值 0.9
但 Baumgartner & Homburg(1996) 研究 1977-1994年間行銷與消費者領域註 [2]採 SEM進行資料分析的 184篇文獻中, AGFI低於建議值的文獻比率分別為 48% ,故可放寬至 0.8 註 [2] 作者研究文獻資料來源為 Journal of Marketing, Journal of Marketing Research, International Journal of Research in Marketing, Journal of Consumer Research等四種期刊登刊之文章。
CFI :愈接近 1愈好,臨界值 0.9(Bentler, 1990,1992,1995) ,適用於評估小樣本的資料,一般樣本數未達 200 時,建議呈現此一數值
SMC( Squared Multiple Correlation Coefficients )
可用來衡量 measurement model 之配適度(每個變數一個解釋變異情形):通常為測量變數的負荷量平方值,一般而言,最好能高於 0.5 ,越接近 1愈好
Taylor 與 Todd(1995) 建議在測量模式時,個別項目的SMC 值大於 0.4 即可
同時可用來衡量 structure model 之潛在變項配適度:可視為潛在因變項的解釋變異程度 (R2) ,愈接近 1愈好
解釋模式 模式結果與資料模式是否相符 模式中測量變數與潛在變項的顯著性 模式中的標準化係數—係數愈高表示在因徑關係的重要性愈高
比較對立模式與遞迴模式
變項與變數的數值資料(1) 未標準化 (Non-standardized) :所有的可觀察變數及潛在變
量均未標準化,因此其結果與最初變數的衡量單位有關。此方法通常作為初始模型用估計。
(2) 標準化 ( Standardized) :僅將潛伏變項標準化,而可觀察變數未標準化。可用來比較在同一樣本下,同一個應變數受到不同自變數影響的貢獻關係,但無法對不同樣本或母體進行交叉比較
(3) 完全標準化 (Completely standardized) :將所有的可觀察變數及潛伏變項均標準化,可進行所有的比較。
修正模式
針對異常估計值 (誤差變數為負、標準化係數大於 1 、估計係數的標準差很大 ) ,予以調整
透過檢查 SR ( Standardized Residuals )及 MI ( Modification Indices )決定是否需修正
刪除或增加參數
驗證研究模式的不一致性
研究模式在檢定過程,會所產生四種不一致性,分別為 (1)近似的不一致性 (2) 抽樣不一致性 (3) 估計不一致性 (4) 整體不一致性 (MacCallum, Roznowski, Mar, & Reith,
1994) 。
不一致性釋疑 (1)近似的不一致性:係指母體共變數矩陣與研究模式假設的 實際參數估計間產生不一致性,如參數估計方法
(Maximum Likelihood, ML 或 Generalized Least Squares, GLS) 的選擇 所產生的差異 (2) 抽樣不一致性:因調查研究大都是以抽樣樣本來替代母體, 故母體與母體參數大都屬於未知,主要為樣本共變數矩
陣與 樣本參數估計間產生不一致 (3) 估計不一致性:係指母體參數估計值與樣本參數估計值間的 差異 (4) 整體不一致性 :母體共變數矩陣與樣本參數估計的共變數
矩 陣所產生不一致性
交叉驗證 以 SEM進行交叉驗證不僅可以對測量模式驗證,並可將整體
結構模式予以驗證,採用交叉驗證研究的方式有二: (1) 將研究過程與問項重新複製一次,以檢查二者之間是否有無差異,但常受時間、金錢、資源的限制;
(2) 研究樣本如果夠大,則將現有調查樣本予以分割,以二個較少樣本來進行資料分析。
受限於第一種情形下僅能以單一樣本分析時, Browne & Cudeck(1989) 建議研究者可採 ECVI 值,其 ECVI 值愈小顯示母體愈穩定;研究者若為採第二種方法, Cudeck & Browne(1983) 建議可用 CVI 值, CVI 值係由基準樣本(calibration sample) 與校準樣本 (validation sample) 資料共變數矩陣所組成。
投稿 SEM 文章內容的涵蓋 1(source:Shook, Ketchen, Jr., Hult, & Kacmar, 2004)
樣本的議題 基本敘述統計量 投入樣本數 樣本的分布 樣本統計力
測量的議題 測量的信度:個別信度與組成信度 測量的區別效度 測量的收歛效度
投稿 SEM 文章內容的涵蓋 2 (source:Shook, Ketchen, Jr., Hult, & Kacmar, 2004)
研究複製的議題 投入矩陣 使用的套裝軟體名稱與版本 參數估計的起始值 計算功能的使用 分析異常值的資料
恆等模式的議題 潛在存在模式與模式公認的限制是否交代
特定化的議題 交叉效度的改變 特定模式與假設模式間的關係
LISREL syntax 注意事項 LISREL8.30版本檔案名稱可用中文命名,而在 LISREL8.50
以上版本,檔案名稱不可全部使用中文命名方式,開頭以英文後中文即可
欄位的寬度最好不得超過 127欄,若資料輸入超過時,須予以斷行處理
試用版軟體時,變數輸入不得超過 15 個 二群組的資料,在 LISREL8.30版本無法使用 PD繪製徑路關
係圖 在 LISREL8.30版本時,二群組以上的資料無法形成正定矩
陣,會產生錯誤訊息 在 LISREL8.50版本以上有增加 Bootstrap 的功能,可適用於
估計小樣本的資料,但使用時較為複雜
簡報結束
問題與討論
測量理論相關重要文獻 ( 資料來源: Ponder & Lueg, 2003)
SEM 重要議題與相關文獻 ( 資料來源: Ponder & Lueg, 2003)