那一刻,我升起風馬,不為祈福,只為守候你的到來。 那一天,閉目在經殿香霧中,驀然聽見,你頌經中的真言。 那一月,我搖動所有的轉經筒,不為超度,只為觸摸你的指尖。 那一年,磕長頭匍匐在山路,不為覲見,只為貼著你的溫暖。 那一世,轉山轉水轉佛塔啊,不為修來生,只為途中與你相見。 《倉央嘉措》

2007年10月7日 星期日

什麽才是規範的「洋八股」(5)

(六) 衡量模型 (measurement models) 與信度效度檢查

我們在田野調查之前,已經通過統計的手段,對衡量題項進行了效度與信度的檢查,由於田野調查所必須花費的資源量極大,這檢查的用意,事實上是為了確保在田野調查中所使用的衡量題項,能夠既有效,又可信,因此能確保田野調查的資源投入不致於浪費。但是在田野調查中我們收集了大量的數據,是為了檢驗研究者心中所想像的世界,與真實的世界是否一致,由於人非聖賢,孰能無過,我們想像中的世界,和真實的世界之間,也許存在著一些差異,而這些差異,正暗暗躲藏在我們通過衡量題項所蒐集到的數據當中。換句話說,即使我們的衡量題項在田野調查之前,已經通過效度與信度的考驗,我們仍然懷疑我們的衡量模型裡存在問題。

所謂衡量模型,簡單的說,就是將「衡量題項」(可觀測變量)和「想像的概念」(潛變量)加以結合起來的模型。我們所想像的世界是由許多個想像的概念,以及這些概念之間的因果關係所組合而成的,對於其中任何一個概念,我們都指定了一組相對應的可觀測變量,也就是衡量題項,來幫助我們對這個概念進行實地觀測,因此,我們所想像的世界,其實就是一組組的衡量模型,在因果邏輯的聯繫下,通過潛變量和潛變量之間的連結,所構造出來的結構模型。其中,每一組的衡量題項,都是我們用來觀察這個世界的門戶,而那些存在邏輯結構的潛變量,就是我們腦海裡的心智模型。這樣一種世界觀,在結構方程模型裡,就稱為「法則網絡 (nomological net)」,被認為是人類創造知識所依循的基本原理原則。

但是在進行田野調查的時候,我們針對研究問題所設計的那張「法則網絡」其實是主觀的,即使之前已經詳細檢驗過衡量題項的效度與信度,仍然不足以證實我們心中所想像的法則,一定和真實世界若合符節。為了讓我們所設計的衡量題項更能正確地反映現實,從而使依賴著這些衡量題項的研究模型也能正確反映現實,我們需要利用大規模田野調查所獲得的數據,重新來檢驗我們的衡量題項與衡量模型的效度與信度。因此,在結構方程模型的實踐過程中,在完成田野調查之後,我們的首要工作就是進行衡量模型的信度效度檢查。

但是由於我們用來檢驗「結構方程模型」的工具,一般是使用極大似然估計法 (Maximum Likelihood) 來進行參數估計,所以我們還是需要檢驗我們所獲得的數據,是否符合多變量正態分布的假定。檢驗的方法除了針對衡量題項進行偏態 (skewness,建議絕對值小於3) 與峰態 (kurtosis,建議絕對值小於10) 的觀察外,更具體的作法是使用QQ plot,再搭配一些專門用來檢驗正態分佈的方法,例如Shapiro-Wilk Statistic,或是Kolmogorov-Smirnov Statistic等等方法,對數據的正態性 (normality) 進行嚴謹的考驗。在數據通過正態性考驗後,我們才可以正式進行針對「衡量模型」的信度效度檢查。

「衡量模型」的信度效度檢查,在結構方程模型裡,主要是通過「驗證性因子分析 (confirmatory factor analysis)」來實現的。在傳統的高等統計方法裡,我們學習過的「因子分析」其實是「探索性因子分析 (exploratory factor analysis)」,顧名思義,「探索性」因子分析,就是事先不去預想一群變量,或是一群衡量題項,裡面的結構,而讓統計程序來幫忙找出這個結構,這樣所找出來的結構,是以「因子 (factors)」的形式顯現出來的,這群變量或是題項被重新分類分組,每一組的題項,都被賦予一個因子,來反映這群題項背後所代表的、抽象的、整體的概念或「主成份 (principle component)」,也就是我們前面所描述過的「潛變量」。

相對於傳統的因子分析,「驗證性因子分析」採取了一種完全不同的視角來看待衡量題項裡的結構。「驗證性因子分析」的想法是,萬事萬物原本即已存在結構,人為萬物之靈,理所當然地可以通過天人合一所形成的感知力,來理解天地的結構,所以這些衡量題項裡的結構,不假外求,不需要通過統計程序來幫我們探索尋找,早已存在我們心中對於這個世界的猜想中。在我們心中早有猜想,唯一需要做的事情,就是去驗證這個猜想,究竟正確不正確。我們在構造「結構模型」的過程中所引入的諸多「衡量模型」,就是我們對於這個世界裡,種種概念的猜想,我們可以通過「驗證性因子分析」,來驗證這些對各種概念結構的猜想,究竟與現實相差若何。

詳細的檢驗方法,我們留待後續章節再來深入探討,在這裡僅簡單指出這檢驗過程的主要程序。首先當然是根據我們事前的猜想,來構造出結構模型裡每個所涉及概念的「衡量模型」,同時使用「驗證性因子分析」方法,分別對這些衡量模型進行統計驗證。對於統計結果,我們需要檢查每個「衡量題項」的「因子負載 (factor loadings)」,也就是「可觀測變量」,可以有效解釋所屬「潛變量」的程度,我們一般要求這個負載係數要大過0.5,證明我們使用這個「衡量題項」來觀測「潛變量」,起碼所觀測到的事實,要大於沒觀測到的誤差。對於負載係數小於0.5的「衡量題項」則予以刪除。

在這個過程裡,我們同時還可以考慮兩兩成對的可觀測變量,在交互作用時所造成殘差 (residual) 發生變化的量,也就是所謂「修正指標 (modification index: MI)」的大小,來決定特定的衡量題項間,能夠被模型有效予以解釋的程度,對於那些解釋能力較差的題項(通常是MI大於4的成對題項),酌情予以刪除,如此將可以明顯地提昇「衡量模型」的「擬合指標 (fit index)」。關於「擬合指標」的概念,我們將在後續章節裡比較詳細地探討。此外,在檢查「衡量模型」的過程裡,我們還需要實際去計算這個衡量模型的效度與信度,這主要是通過計算「組成信度 (composite reliability: CR)」和「方差抽取量 (variance extracted: VE)」來實現的,如果所有「潜變量」的「方差抽取量」的平方根,均大于「潜變量」間的相關係數,就表明研究中所使用的「衡量題項」具有較好的「鑑別效度」(Bagozzi和Yi, 1988)。

部份研究在計算了CR和VE的同時,還計算了Cronbach's alpha係數,事實上這是不必要的,因為當我們檢查了每個「衡量題項」的「因子負載」,所獲得的「衡量模型」具備優秀的「擬合指標」,同時還考驗了CR和VE,這一切,其實已足夠證明衡量模型的結構信度。此外,部份研究先進行了「探索性因子分析」之後,再根據這個過程所「探索」出來的因子結構,來進行「驗證性因子分析」,甚至據以進行「結構方程模型」的檢驗,這則更是錯解了「結構方程模型」這個方法的本意。「結構方程模型」的本意是在驗證研究者心中對這個世界的猜想,所以在研究之初,心中早已存在定見,所謂成竹在胸,「結構方程模型」的用途是去驗證這個成竹究竟是虛竹還是可以蔚然成林的翠竹,可是卻絕對不是重新去尋找或探索出竹林的所在來。

沒有留言: