那一刻,我升起風馬,不為祈福,只為守候你的到來。 那一天,閉目在經殿香霧中,驀然聽見,你頌經中的真言。 那一月,我搖動所有的轉經筒,不為超度,只為觸摸你的指尖。 那一年,磕長頭匍匐在山路,不為覲見,只為貼著你的溫暖。 那一世,轉山轉水轉佛塔啊,不為修來生,只為途中與你相見。 《倉央嘉措》

2007年10月11日 星期四

結構方程模型的基本觀念 (10)

可是,有些時候,我們實在不夠瞭解這個世界,我們在想像中以為不相關的概念,在真實的世界裡,也許正是高度相關的,這與我們的人生境界、所接受的訓練、對於研究問題的經驗、認識等等,都有關係。那麼,當我們的結構方程模型發生「識別不足」的時候,我們該如何來歸因,才能夠知道這可能是因為自變量之間的多重共線所造成的問題呢?首先是觀察「標準化迴歸係數 (standardized regression weights)」,也就是「標準化路徑係數」的數值,如果兩個潛變量之間的「標準化路徑係數」接近1,就代表這兩個潛變量所代表的概念幾乎相同,換句話說,這兩個潛變量其實就是如假包換的同一個變量,這時如果將這兩個潛變量同時當作自變量,來估計它們同時對另一個潛變量的影響,結構方程模型將無法計算這兩條本來在概念上應該只有一條的路徑係數,計算結果很可能就是其中一條的路徑係數大於+1,而另一條卻小於-1。所以在檢查統計軟件所跑出來的「標準化迴歸係數 」矩陣時,如果看見這種情形,那麼就可以明白這個模型之所以「識別不足」,可能就導因於自變量的多重共線問題。

其次,如前所述,如果模型中存在兩條共線很嚴重的路徑,或者說,存在兩個高度相關的自變量潛變量,共同在影響著同一個因變量潛變量,由於統計軟件在參數估計上遇到困難,很可能直接將這些在迭代的過程中所面臨的不穩定現象,都歸入了「標準誤 (standard errors)」,以致使得存在共線問題的路徑的標準誤,明顯地大於其它不存在共線問題的路徑的標準誤,因此,我們也可以通過觀察「未標準化迴歸係數 (unstandardized regression weights)」的「標準誤」,來檢查自變量之間是否存在多重共線的問題,進而確定模型發生「識別不足」的可能原因。

同樣的,前述這個計算困難的問題,也可能反映在所估計參數的協方差矩陣 (covariance of the parameter estimates)裡,那些協方差特別高的成對路徑,很可能就在暗示著存在著共線的問題。另一個明顯的指標是,存在共線的路徑所指向的那個因變量(潛變量)的方差估計 (variance estimate) 可能為負值。所有這些徵候,都反映著模型的「識別不足」問題,正可能是來自於自變量間的高度共線性所造成的。

如果很不幸地(事實上研究者通常就是這麼不幸),我們的理論模型看起來很好,一點也沒有「識別不足」的問題,但是在昂貴的田野調查之後,利用統計軟件和大量樣本,針對模型進行參數估計時,電腦卻出現令人懊惱的「識別不足」問題,這時我們該怎麼辦呢?以下列出一些經驗之談:

(1) 設法找出並消除模型中的迴路型的路徑,換言之,就是設法將模型構造成「遞歸模型 (recursive model)」的形式。
(2) 從理論與實務同時下手,看看能不能找出證據,來支持模型中的某些待估計參數,其實是不需要估計的。換句話說,假如模型中原本有些預設需要估計的參數,但是在思考之後,我們發現這些參數的值,是可以合理的直接予以規定的,那麼我們就可以直接將那些數值明白地表述 (explicitly specify) 在模型當中,這樣每多指定一個固定 (fixed) 的值,模型就多出一個自由度來,可以很有效地消除模型「識別不足」的問題。但是能夠這樣做的前提,還是需要有根有據,不能為所欲為。
(3) 如果找不到證據支持來直接指定待估計參數的值,但是卻必須利用這方法來增加自由度,那麼還有一個秘訣可以使用。在AMOS的Analysis Properties的Output設定窗口裡,勾選critical ratios for differences (CR) 這個選項,然後檢查所跑出來的配對的路徑係數的這個CR值(這個CR值,事實上等於兩個路徑係數的差,除以它的標準誤,換句話說,就是標準化正態分佈下的Z值)如果CR<1.96,就代表這配對的兩條路徑之間的路徑係數差異不顯著(p>0.05),因此可以重新設定模型,將這兩條路徑的係數直接指定相同的任意值(當然要接近剛剛電腦跑出的估計值),因此就可以直接節省兩個自由度。
(4) 設法減少模型中的路徑。事實上,每減少一條路徑,就等於減少一個待估計參數,也就同時增加了一個自由度。如果在模型中直接將路徑係數指定為固定 (fixed) 的值0,這與在模型中刪除這條路徑的效果是一樣的。
(5) 設法刪減變量,讓模型變得更簡潔。
(6) 刪除(合併)那些相關係數很高的自變量潛變量。
(7) 在模型中增添(導入)新的自變量潛變量。
(8) 保證每個潛變量的可觀測變量都至少三個或以上。
(9) 確保樣本數據中不存在遺漏值。
(10) 一般的統計軟件直接內定使用「極大似然法 (maximum likelihood)」來進行參數的估計運算,可以考慮改用其他方法(例如GLS)試試看。
(11) 設法在統計軟件中設定更高的迭代次數。
(12) 把電腦砸爛。(開玩笑的,後果請自負!)

沒有留言: