愚園囈語

2007年10月9日星期二

結構方程模型的基本觀念 (1)

三、結構方程模型的基本觀念

(一) 結構方程模型是什麼

結構方程模型可以說，就是「路徑分析 (path analysis)」和「因子分析 (factor analysis)」的結合體。它的用途，與大家所熟悉的多元迴歸分析十分相似，但是不同的地方在於，結構方程模型是一種更為強大的統計方法，在構造模型和估計參數的過程裡，可以直接處理多組方程間的互動干擾、非線性關係、不獨立（相關）的自變量、殘差相關、衡量誤差、以及將多組相依的衡量模型共冶於一個單一模型當中。事實上，我們可以將結構方程模型視為「廣義線性模型 (general linear model: GLM)」的延伸，它的強大功能，絕對可以用來取代我們慣用的迴歸分析、路徑分析、因子分析、時間序列分析、甚至共變量分析。不過限於篇幅，本書將聚焦於結構方程模型在因子分析、潛變量路徑分析、和一般路徑分析上的應用。

相對於多元迴歸分析，結構方程模型在應用上的限制也較少，關鍵的亮點包括在進行「路徑分析」的時候，即使自變量間存在明顯的共線性 (multicollinearity)，結構方程模型依然可以照單全收，絲毫不影響其解釋上的有效性。利用結構方程模型來進行「驗證性因子分析」，更可以通過將多個可觀測變量指定給單一潛變量，從而可以在根源處直接降低衡量誤差。尤其在殘差的處理上，很少有統計方法可以這麼方便地直接檢查每一個可觀測變量的殘差，甚至操弄這些殘差之間的相關。結構方程模型在路徑係數的處理上也高人一等，不僅可以同時估計多個自變量對多組因變量的關係，還能夠進行多樣本多模型之間的係數比較。最重要的優勢是，結構方程模型不僅僅可以估計單一參數的係數，還能夠直接估計整體模型的擬合度，這是許多傳統統計方法所望塵莫及的。

如前所述，結構方程模型的主要用途，其實是用來驗證研究者心中對於他所想像世界的猜想，而比較不是用來探索一個新的世界。換言之，在應用結構方程模型的一開始，大多數的研究者在他的心中，早已存在某些定見了。這些定見的存在形式，大抵上可以分成兩種：(1) 研究者想要檢驗他的某個想法是否正確，於是構造了一個結構方程模型，在代入真實數據對模型進行估計後，研究者可以根據擬合指標的好壞，來判斷真實世界裡的數據，和他所構造的模型之間是否一致，從而明白他原先的想法是否可以接受。(2) 研究者根據不同理論，得出兩種或兩種以上可以用來描述這個世界的不同看法，然後針對這些不同看法，分別構造出不同的結構方程模型來，在代入真實數據分別對這些模型進行估計後，研究者可以根據擬合指標的好壞，來判斷究竟哪種看法，更加切合實際。

儘管如此，我們還是可以在文獻中看到有些研究者，利用結構方程模型來進行模型探索，而不是正確使用結構方程模型，來驗證心中事先設定的模型猜想。例如有些研究者在驗證原先設定好的結構模型時，發現擬合指標很差，於是通過「修正指標 (modification index)」的暗示，「為數字而數字」地對模型任意調整改動，直到擬合指標達到及格標準為止。當然這樣的作法並不可取，因為通過這種過程而勉強予以接受的結構模型，可能只是剛好反映了這組特定樣本的特徵，而不是因為模型本身可以放諸四海而皆準，換句話說，是因為這組特定樣本造就了一個事先想像不到、缺乏理論依據的模型，而不是通過真實數據，驗證了一個具有理論深度的模型。這樣的模型即使擬合指標合格了，可能還是缺乏外部效度，我們很難接受這樣的模型會是能夠代表事實真理的模型。對於這種情形下所構造出來的結構方程模型，研究者有必要使用多組不同的樣本，對相同模型進行多次驗證，也就是「強韌度測試 (robust tests)」，如果多組樣本都證實了相同結構模型的「擬合指標」都是及格的，那麼我們才能夠正式接受這個結構方程模型。

2007年10月7日星期日

什麽才是規範的「洋八股」(6)

(七) 驗證結構模型

結構模型，就是我們在研究之初所猜想的那個概念的世界，但是因爲這其中的每個概念，都已經經過了前述的「操作型定義」，幷根據這些定義，分別構造出來所謂的「衡量模型」，所以在實證階段的結構模型，其實已經整合了研究者心中對這個世界的概念性猜想，以及研究者用來觀測這個世界的衡量題項。將現實觀測與概念想像合而爲一，共冶于一圖，所構造出來的結構模型，通常稱作「潜變量路徑模型 (latent variable path model)」，在其中，我們使用圈圈來代表潜變量，使用方框來代表可觀測變量，同時使用單箭頭或是雙箭頭來分別表示變量間單向的因果關係，或是變量間的相關，不論是單箭頭還是雙箭頭，都代表了模型中的因果路徑。

所以，當我們完成了「衡量模型」的效度與信度檢查，幷將這些「衡量模型」調整到了「擬合指標」最優、同時也最能反映現實的地步後，便可以將這些「衡量模型」依據事前猜想的邏輯結構加以組合起來，構造成結構模型，準備接受統計驗證。驗證結構模型的方法，還是不離開前述「修正指標」和「擬合指標」的考量，我們的基本原則是通過「修正指標」來進行模型修正，最後希望能獲得「擬合指標」最優的最後模型。因此這裏所謂的「模型比較」，指的就是在比較各模型間「擬合指標」的好壞，而這擬合指標的好壞判斷，還可以進一步通過「卡方差」的顯著檢定來科學驗證。我們將在後續章節裏，再來深入探討各種擬合指標的意義與用途。

和前述「衡量模型」的修正過程相同，我們必須檢查兩兩配對的「可觀測變量」之間的「修正指標」孰高孰低，來决定這些變量究竟該添增還是刪減，抑或是不予變動；同時，我們也可以根據邏輯思維，添增删减模型中的「潜變量」，甚至更改這些「潜變量」，在邏輯上的關聯，甚至其因果方向，然後通過「擬合指標」的起伏變化，來印證我們心中對這個世界的猜想。但是不論如何調整這個「結構模型」，在這個模型修正的過程裡，我們仍然必須遵循下列幾個原則：

首先是不能爲了獲得表面上數字性的指標擬合，而抹煞了真實世界裏顯而易見的事實，換言之，雖然「結構方程模型」是種十分嚴謹的驗證性的統計手段，我們卻不該「為數字而數字」、「為科學而科學」。子曰：「知之為知之，不知為不知，是知也。」不論是數字還是科學，畢竟還是必須爲這個現實世界服務，不能單純爲了追求統計上的顯著或是擬合，而犧牲了事實真相。其次，在修正模型的過程中，每次的模型修正，其實都代表著一個新模型的誕生，不論我們是增加還是删减變量，抑或是改變變量間的邏輯關係，所有的這些模型，都必須同屬于相同的模型家族，我們才可以比較這些模型間的差异，這就是所謂的「巢內模型 (nested models)」，我們在後續章節裡再來詳細說明何謂「巢內模型」，以及該通過什麽手段來進行模型的比較。

再者，修正模型的方法，主要雖然是去添增删减「結構模型」中的「可觀測變量」與「潜變量」，但是也可能通過對模型中「可觀測變量」的殘差的操弄，來改善模型的擬合指標。這個方法就是去承認模型中，不同「可觀測變量」的殘差間，存在未能被模型所解釋的相關。換言之，就是去承認，在我們的模型之外，還存在著一些「未被解釋的共同因子 (unexplained common factors)」，沒有被納入我們的模型裏面。也就是說，研究者承認自己考慮不周，在構造模型的時候，有些現實世界裏的現象，沒有被事先猜想到，因此被模型忽略了。這些殘差之間的相關，可以具體地在結構方程模型裏正式予以表述 (specify)，從而使這些原先未被模型解釋的共同因子，被正式地納進模型裏面來，其結果，將能够有效地提升整個模型的擬合指標。

不論是去添增删减「結構模型」中的「可觀測變量」與「潜變量」，還是去連結「可觀測變量」間殘差的相關，指引著我們選擇變量的决策指標，一般就是參考「修正指標」的高低，這是因爲「修正指標」實質上指出了模型中的不穩定因素，也就是殘差的變化。但是誠如前述，我們不可以「為數字而數字」，即使爲了達到「擬合指標」的高度優越，對於任何變量的添增刪減，或是對任何一組殘差的相關連結，我們都必須要恪守能夠「自圓其說」的起碼標準，我們最起碼還能自圓其說，表明我們的結構模型起碼還遵循著最基本的自然造化，那麽我們對于真理或事實的追求，至少可以雖不中亦不遠矣。

(八) 干擾變量下結構模型的比較

一個研究之所以有趣，通常不是基於對已知事實的直白描述，也不在於對未知事實的探索觀察，而是因為我們能夠通過真實的數據，來檢驗兩種或兩種以上的不同觀點下，我們所猜測的現象、或人類行爲，究竟哪一種更加符合現實。這就是所謂「替代模型 (competing models)」或「替代理論 (competing theories)」的概念。或者，基於我們對現實世界的猜想，我們可能認為不同類型的樣本，在某些事件上可能出現不相同的行爲，或者，即使是相同的樣本族群，在面對不同的外在刺激或是情境時，也會出現不同的反應，因此結構相同的一組「結構模型」，在不同的樣本群下，經過「結構方程模型」的洗禮，我們將會分別得出不同的模型來，這些不同的模型，雖然外表結構相同，但是其中的「因子負載」和「路徑係數」或許差异頗大，這些係數在數值上的差异，就反映了不同樣本族群間行爲模式的迥然不同。

問題是，差異多少，才稱得上在統計上具備顯著的差異？這時，我們就需要通過一些統計手段，去檢查這些數值上的差異。幹擾變量下比較結構模型的基本要件就是必須站在相同的基礎上進行比較，這樣的比較結果才有意義。和前述「修正模型」的模型比較不同，幹擾變量下結構模型比較的基礎，就是「完全相同的模型結構」，我們必須確保這些準備加以比較的模型，不論是其中的各組「衡量模型」、或是「潜變量」本身、還是「潜變量」之間的關係，都必須一模一樣，這樣才具備了共同的基礎，可以拿來比較。爲了滿足這個條件，我們必須先針對其中一組樣本，通過前述「模型修正」的過程，先構造了一個「擬合指標」及格的結構模型，然後以這個模型爲基礎，套入另一組樣本數據，重新估計模型中的各個參數與擬合指標，再來比較兩組不同的樣本數據下，所構造出來的兩組結構模型，在擬合指標上究竟是否存在顯著差异，以及兩組擬合指標何者爲優。這裏所采用的比較擬合指標差异的統計技術，依然是卡方差的統計檢定。

這個方法的前提要件其實是兩組模型，其中一組的擬合指標，顯著地優于另一組，依此，于是我們就可以確立其中一組模型中的「潜變量」關係，而弃却另一組模型的適用性。或者換句話說，研究者對于這個世界的概念想像，可以被這特定的一組樣本所驗證，而這樣一種對世界的概念想像，幷不適用于另一組樣本。在這樣的檢查下，其實我們就等于驗證了兩組「替代理論」之間的孰優孰劣，或者驗證了特定干擾變量下，不同兩群樣本之間在行爲上的不一致。

問題是，也許我們的驗證結果，發現兩個結構模型的「擬合指標」，在統計上幷不存在顯著差異。也就是說，兩組結構模型的擬合指標，其實同樣的好，這時，上述比較兩組模型擬合指標的方法，就無法爲我們服務了。在這樣的情形下，我們還是可以通過方差分析，來比較兩組結構模型中，相同路徑的路徑係數差異，是否存在統計上的顯著性。在結構方程模型的估計演算中，對每一條潜變量之間的路徑，除了路徑係數外，還能够計算出這係數的「標準誤 (standard error)」和t值，這時我們只要加上樣本數，同時將路徑係數當成均值（在迴歸分析的概念下，迴歸係數本來就是一種均值），就可以輕易地算出兩組路徑係數之間的F值，通過F分布的概率計算，我們可以獲取這個F值，在這個樣本數下的顯著水平，于是就可以對兩組路徑係數的差异是否顯著，做出一個嚴謹的判斷。

(九) 通過結構方程模型來驗證對事實的猜想

進行科學調研的最後階段，當然就是根據結構模型所顯示的數據結果，「實事求是」，「一分證據說一分話」。這些以數據形式存在的事實依據，主要包括兩種類型的結果，一是模型的「擬合指標」，二是「路徑係數」，以及這些路徑係數所附帶的，以t分布爲基礎所計算出來的顯著水平。事實上可以利用結構方程模型進行處理的問題形式有許多種，最主要的應用領域大致有三，首先是「驗證性因子分析」，用來對「可觀測變量」進行分類和梳理；其次是「潜變量路徑分析」，用來觀察抽象概念的因果關係；當然也可以用來直接估計「可觀測變量」之間的因果關係，也就是一般意義上的「路徑分析」。但是不論是哪一種應用，我們在解讀結構方程模型時所依據的事實，還是不離開「擬合指標」與「路徑係數」這兩大統計結果。當然，對于「驗證性因子分析」的用途，統計結果中幷不存在所謂的「路徑係數」，但是我們依然可以通過「因子負載」來明白這些「衡量模型」的結構。

這些「路徑係數」或是「因子負載」就是通過「結構方程模型」這方法所估計出來的結論，但是這結論是否確實可信，却取决于「擬合指標」是否及格。所以在通過「結構方程模型」來驗證我們心中對於這個世界的概念猜想時，首要之務就是先確定模型的「擬合指標」是否及格，在指標及格的前提下，這些統計估計的結論，才具備了科學上的意義。鄧小平先生說：「實踐是檢驗真理唯一的標準」，我個人對這句話的理解是，這裏的「真理」，其實還只是研究者心中的合理猜想而已，必定要通過實踐過程中的真實數據加以檢驗，同時這檢驗的結果，還必須在「擬合指標」的標準上合格，我們這才真正驗證了這個原先的猜想，究竟合不合現實，究竟算不算「實事求是」。由此看來，鄧先生實在是中國真正懂得「結構方程模型」的第一人。當然，在研究中能够具備上述這九大條件，我們就說，這「結構方程模型」的應用，已經滿足了「洋八股」的基本要求。

什麽才是規範的「洋八股」(5)

(六) 衡量模型 (measurement models) 與信度效度檢查

我們在田野調查之前，已經通過統計的手段，對衡量題項進行了效度與信度的檢查，由於田野調查所必須花費的資源量極大，這檢查的用意，事實上是為了確保在田野調查中所使用的衡量題項，能夠既有效，又可信，因此能確保田野調查的資源投入不致於浪費。但是在田野調查中我們收集了大量的數據，是為了檢驗研究者心中所想像的世界，與真實的世界是否一致，由於人非聖賢，孰能無過，我們想像中的世界，和真實的世界之間，也許存在著一些差異，而這些差異，正暗暗躲藏在我們通過衡量題項所蒐集到的數據當中。換句話說，即使我們的衡量題項在田野調查之前，已經通過效度與信度的考驗，我們仍然懷疑我們的衡量模型裡存在問題。

所謂衡量模型，簡單的說，就是將「衡量題項」（可觀測變量）和「想像的概念」（潛變量）加以結合起來的模型。我們所想像的世界是由許多個想像的概念，以及這些概念之間的因果關係所組合而成的，對於其中任何一個概念，我們都指定了一組相對應的可觀測變量，也就是衡量題項，來幫助我們對這個概念進行實地觀測，因此，我們所想像的世界，其實就是一組組的衡量模型，在因果邏輯的聯繫下，通過潛變量和潛變量之間的連結，所構造出來的結構模型。其中，每一組的衡量題項，都是我們用來觀察這個世界的門戶，而那些存在邏輯結構的潛變量，就是我們腦海裡的心智模型。這樣一種世界觀，在結構方程模型裡，就稱為「法則網絡 (nomological net)」，被認為是人類創造知識所依循的基本原理原則。

但是在進行田野調查的時候，我們針對研究問題所設計的那張「法則網絡」其實是主觀的，即使之前已經詳細檢驗過衡量題項的效度與信度，仍然不足以證實我們心中所想像的法則，一定和真實世界若合符節。為了讓我們所設計的衡量題項更能正確地反映現實，從而使依賴著這些衡量題項的研究模型也能正確反映現實，我們需要利用大規模田野調查所獲得的數據，重新來檢驗我們的衡量題項與衡量模型的效度與信度。因此，在結構方程模型的實踐過程中，在完成田野調查之後，我們的首要工作就是進行衡量模型的信度效度檢查。

但是由於我們用來檢驗「結構方程模型」的工具，一般是使用極大似然估計法 (Maximum Likelihood) 來進行參數估計，所以我們還是需要檢驗我們所獲得的數據，是否符合多變量正態分布的假定。檢驗的方法除了針對衡量題項進行偏態 (skewness，建議絕對值小於3) 與峰態 (kurtosis，建議絕對值小於10) 的觀察外，更具體的作法是使用QQ plot，再搭配一些專門用來檢驗正態分佈的方法，例如Shapiro-Wilk Statistic，或是Kolmogorov-Smirnov Statistic等等方法，對數據的正態性 (normality) 進行嚴謹的考驗。在數據通過正態性考驗後，我們才可以正式進行針對「衡量模型」的信度效度檢查。

「衡量模型」的信度效度檢查，在結構方程模型裡，主要是通過「驗證性因子分析 (confirmatory factor analysis)」來實現的。在傳統的高等統計方法裡，我們學習過的「因子分析」其實是「探索性因子分析 (exploratory factor analysis)」，顧名思義，「探索性」因子分析，就是事先不去預想一群變量，或是一群衡量題項，裡面的結構，而讓統計程序來幫忙找出這個結構，這樣所找出來的結構，是以「因子 (factors)」的形式顯現出來的，這群變量或是題項被重新分類分組，每一組的題項，都被賦予一個因子，來反映這群題項背後所代表的、抽象的、整體的概念或「主成份 (principle component)」，也就是我們前面所描述過的「潛變量」。

相對於傳統的因子分析，「驗證性因子分析」採取了一種完全不同的視角來看待衡量題項裡的結構。「驗證性因子分析」的想法是，萬事萬物原本即已存在結構，人為萬物之靈，理所當然地可以通過天人合一所形成的感知力，來理解天地的結構，所以這些衡量題項裡的結構，不假外求，不需要通過統計程序來幫我們探索尋找，早已存在我們心中對於這個世界的猜想中。在我們心中早有猜想，唯一需要做的事情，就是去驗證這個猜想，究竟正確不正確。我們在構造「結構模型」的過程中所引入的諸多「衡量模型」，就是我們對於這個世界裡，種種概念的猜想，我們可以通過「驗證性因子分析」，來驗證這些對各種概念結構的猜想，究竟與現實相差若何。

詳細的檢驗方法，我們留待後續章節再來深入探討，在這裡僅簡單指出這檢驗過程的主要程序。首先當然是根據我們事前的猜想，來構造出結構模型裡每個所涉及概念的「衡量模型」，同時使用「驗證性因子分析」方法，分別對這些衡量模型進行統計驗證。對於統計結果，我們需要檢查每個「衡量題項」的「因子負載 (factor loadings)」，也就是「可觀測變量」，可以有效解釋所屬「潛變量」的程度，我們一般要求這個負載係數要大過0.5，證明我們使用這個「衡量題項」來觀測「潛變量」，起碼所觀測到的事實，要大於沒觀測到的誤差。對於負載係數小於0.5的「衡量題項」則予以刪除。

在這個過程裡，我們同時還可以考慮兩兩成對的可觀測變量，在交互作用時所造成殘差 (residual) 發生變化的量，也就是所謂「修正指標 (modification index: MI)」的大小，來決定特定的衡量題項間，能夠被模型有效予以解釋的程度，對於那些解釋能力較差的題項（通常是MI大於4的成對題項），酌情予以刪除，如此將可以明顯地提昇「衡量模型」的「擬合指標 (fit index)」。關於「擬合指標」的概念，我們將在後續章節裡比較詳細地探討。此外，在檢查「衡量模型」的過程裡，我們還需要實際去計算這個衡量模型的效度與信度，這主要是通過計算「組成信度 (composite reliability: CR)」和「方差抽取量 (variance extracted: VE)」來實現的，如果所有「潜變量」的「方差抽取量」的平方根，均大于「潜變量」間的相關係數，就表明研究中所使用的「衡量題項」具有較好的「鑑別效度」(Bagozzi和Yi, 1988)。

部份研究在計算了CR和VE的同時，還計算了Cronbach's alpha係數，事實上這是不必要的，因為當我們檢查了每個「衡量題項」的「因子負載」，所獲得的「衡量模型」具備優秀的「擬合指標」，同時還考驗了CR和VE，這一切，其實已足夠證明衡量模型的結構信度。此外，部份研究先進行了「探索性因子分析」之後，再根據這個過程所「探索」出來的因子結構，來進行「驗證性因子分析」，甚至據以進行「結構方程模型」的檢驗，這則更是錯解了「結構方程模型」這個方法的本意。「結構方程模型」的本意是在驗證研究者心中對這個世界的猜想，所以在研究之初，心中早已存在定見，所謂成竹在胸，「結構方程模型」的用途是去驗證這個成竹究竟是虛竹還是可以蔚然成林的翠竹，可是卻絕對不是重新去尋找或探索出竹林的所在來。

什麽才是規範的「洋八股」(4)

(三) 確定衡量題項的效度 (validity)

當我們爲上述這些「構念」或「變量」進行操作型定義時，幷不是自以爲是地信口開河、依照我們的主觀偏好任意設計衡量題項，就能够有效地描述我們想要觀察的現象，或是解釋我們想要檢查的概念。古語有雲：「三個臭皮匠，勝過一個諸葛亮」，連諸葛亮這樣的天才高手都還需要旁徵博引，廣泛接納群衆的集體智慧，更何况像你我這樣的平凡人呢。所以用來描述「構念」或「變量」的衡量題項，幷不是一個研究者可以簡單地單憑自己想像，就可以創造出來的。換句話說，單純通過自己想像所創造出來的衡量題項，可能以偏概全，可能失之毫厘謬以千里，換句話說，這些閉門造車所得來的題項可能是無效的，我們必須通過一些手段，來保證這些題項的效度，這樣我們的研究才能客觀地反應事實。

「效度」就是衡量題項能够有效反映、或是描繪、一個概念的程度。檢驗題項效度所涵蓋的範圍，大抵上包含了「內容效度 (content validity)」、「建構效度 (construct validity)」、「內部效度 (internal validity)」、與「外部效度 (external validity)」四大類，我們在此僅僅略作說明。「內容效度」又稱爲「表面效度 (face validity)」，主要是在檢查我們所想要使用的衡量題項，究竟與我們的世俗概念是否一致？是否有所偏狹？所涵蓋的範圍是否過窄？抑或太過？文字表達的方式是否清晰易懂？是否正確傳達了語意概念？「建構效度」主要想要檢查的是我們用來直接觀察這個世界所使用的衡量題項，與我們心中對這個世界的所作的種種概念性的猜想，兩者之間究竟是一致還是不一致。這其中還包含了「聚斂效度 (convergent validity)」與「鑒別效度 (discriminant validity)」兩種狀况，詳情留待後續章節中再仔細討論。

「內部效度」所要檢查的是我們所使用的研究設計是否隱含瑕疵，以致于最後所觀察到的因變量所顯現的現象，不完全是來自于自變量的影響。這個效度檢查和衡量題項的關係較小，主要的著眼點在于研究設計。例如學過管理學的人可能聽過「霍桑效應 (Hawthorne effect)」這個名詞，在那個研究設計裏就因爲忽略了觀測者對受測者所可能造成的心理效應，因而無法正確觀察「工廠照明」與「生産力」之間的因果關係。在這個情形下，我們就說，這個研究設計缺乏「內部效度」。最後，「外部效度」指的是相同的衡量題項，是否可以放諸四海而皆准的問題。大多數與管理學領域相關的研究，經常采用其他國家或其他文化、次文化裏的研究中，所曾使用過的衡量題項，加以翻譯後直接引用進自己的研究裏來。如果我們觀察到這兩個文化實在是「非我族類，其心必异」，兩地的樣本差异實在太大，那麽這樣的題項引用，就是缺乏「外部效度」。

我們一般通過兩種手段來提升衡量題項的「內容效度」與「建構效度」。其中最簡便的方法，就是取材前人優秀論文裏所使用過的題項，略加變通調整後，直接應用在我們的研究上。要能滿足這裏所謂優秀論文的稱號，當然不能是濫竽充數的論文，當然存在一些關鍵的要求，來保證其中的題項是可用的，否則以瞎引盲，不過是讓我們平白瞎忙一場。最起碼，我們期望這前人論文必須滿足：(1) 已經公開在學術同行認可的頂級權威期刊裏發表。當然，最好是學術同行認可的國際頂級期刊。(2) 清晰交待了所使用題項的發展過程、來龍去脉、以及其中所隱含的維度或結構，(3) 對題項進行了效度與信度的檢驗，而且通過統計檢定，證實這些題項不論在效度還是信度上都是可接受的，(4) 清晰說明了用來檢驗效度與信度的樣本對象，以及進行檢驗的過程是合理的，同時與本研究的性質接近。

當然對于一些特別嶄新的概念，可能找不到現成的題項可用，所以我們還是不得不從無到有，一切重頭做起，來創造出我們進行研究所需要的衡量題項。比較正規的作法是，先進行「定性研究 (qualitative research)」，然後通過「內容分析 (content analysis)」方法，將所搜集到的「定性資料 (qualitative data)」轉換成有意義的信息，甚至可以從這些材料中歸納整理出可供使用的題項。這些題項，如果能够通過效度與信度的嚴苛檢驗，一樣可以拿來用在我們的研究裏。本書將在後面的章節裏介紹一些與結構方程模型有關的效度檢驗方法，至于效度與信度檢驗相關議題的深入介紹，有興趣的讀者請自行參閱與「研究方法 (research method)」相關的書籍。

這裏要補充說明的是，即使是直接引用自國外頂級期刊文獻裏的衡量題項，也一樣必須重新經歷過種種統計上的，效度與信度的嚴苛檢驗之後，才能安心地在我們的新研究裏重複使用。爲了防止衡量題項在文字翻譯過程中「橘逾淮而爲枳」，也爲了避免「外部效度」的問題，我們必須通過客觀的統計工具，來確保衡量題項的效度。這種通過統計檢定可以客觀加以觀察的效度，起碼還需要先滿足「信度 (reliability)」檢驗，「信度」是「效度」的必要條件之一。

(四) 確定衡量題項的信度 (reliability)

所謂的「信度」，就是「衡量題項」和我們想像中那個「真實的潜在概念」之間的相關程度。使用口語加以表白，也就是我們的「衡量題項」，所能正確地、可信地、穩定地傳達、或是替代，我們心中那個「潜在概念」的程度。但是由于現實世界裏幷不存在所謂的「真實的潜在概念」這麽一回事，因爲既然是個潜在概念，就不可能在真實世界裏被觀察到，同時既然是潜在概念，由于人心不同，每個人心中對于文字上相同的概念的真實認識，很可能其實也差异頗大，但是研究者却必須通過文字這種工具，通過由文字所形成的衡量題項，來測量人類心中的潜在概念，所以十分情不得已的，這種題項的「信度」，只能被間接地估計出來，而不可能被真實掌握。

如前所述，具有「效度」的衡量題項，必須先滿足「信度」的要求，但是具有「信度」的衡量題項，不一定具備「效度」的品質。我們通常通過四個視角來估計衡量題項的信度：(1) 內部一致性 (internal consistency)，也就是估計衡量題項之間的內部相關度高低，通常通過Cronbach's alpha係數來衡量，(2) 折半信度 (split-half reliability)，估計兩組被視爲等同的題項間的相關度高低，通常使用Spearman-Brown相關係數來衡量，(3) 再測信度 (test-retest reliability)，估計同一組衡量題項，在不同時間點上的穩定度，也通常是使用Spearman-Brown相關係數來衡量，(4) 測評員間信賴係數 (inter-rater reliability)，估計不同測評員之間答案的一致性程度，通常用來檢查定性研究中內容分析結果的可信度，而較少用來估計衡量題項的信度，所使用的檢查工具通常是Kappa係數。

我們留待後續章節再來深入介紹上述三種與衡量題項直接相關的信度檢查的具體作法。

(五) 抽樣框架 (sampling frame) 與田野調查 (fieldwork)

設計好衡量題項，同時决定了題項的衡量方式之後，或者說，設計好了研究工具 (research instrument) 之後，緊接著的就是大規模的田野調查了。田野調查的規模，當然與研究者本身所擁有的資源量有關，這些資源的類型，包括金錢資源、時間資源、甚至研究人員本身的精力、能力、和所曾接受過的訓練等等。一般的研究人員不具備國家的資源優勢，比較不可能實施以全體母體爲對象的普查，因此抽樣就成爲不得已中的必要。抽樣就是由母體中抽取一部分樣本來進行調查，然後將調查結果，推論成整體母體的共同現象或行爲。爲了讓少數樣本能忠實反映整體母體的現象，我們首先當然必須設法來保證這些樣本對于整體母體的代表性。

規範的洋八股，主張「隨機抽樣 (random sampling)」，提出三個條件來保證樣本能够滿足這個「代表性」的要求：(1) 獨立性，(2) 互斥性，與 (3) 被選中的機會均等。「互斥性」的意義比較容易明白，簡單的說，就是相同樣本不會被重複抽取，每一個樣本，最多只會被抽中一次。「被選中的機會均等」也容易瞭解，使用統計學的語言來說明，就是個別樣本被抽中的機率，服從均等分布。「獨立性」是指樣本之所以被抽中，和其他被抽中樣本之間不存在關聯，換句話說，每個被抽中樣本的抽取過程都是獨立的，彼此之間不相互干擾。例如，先抽取A樣本，再敦請A樣本介紹B樣本作爲下一個觀察對象，這就違反了「獨立性」的要求，因此不屬于隨機抽樣，所獲得的樣本，對全體母體不具代表性。

違背上述三個條件中任一條件的抽樣設計，都不屬于隨機抽樣，所獲得的樣本，對全體母體不具代表性。這樣的抽樣設計，我們將之稱爲「非隨機抽樣」，或是「便利抽樣」。當然我們幷不絕對排斥「非隨機抽樣」的設計，事實上，許多時候，由于受限于種種條件約束，例如母體很難接近、母體行踪出沒很難掌握、母體存在十分明顯的「無反應偏差 (non-respondent bias)」等等原因，我們不得不采用「非隨機抽樣」的方式來取得樣本，不僅僅是因爲可行性的問題，在這樣的時候，通過「非隨機抽樣」所取得的樣本，可能比隨機抽樣更具代表性。研究者必須通達事理，善巧機變，提出適當的抽樣框架來處理抽樣的問題。原則上，研究者要盡可能掌握三個隨機抽樣的基本條件，來滿足樣本對母體的代表性。具體詳情請參閱與研究方法相關的著作，本書對此不進行更深入的探討。

2007年10月4日星期四

江心圓月

回到澳大利亞，前兩天一頭栽進辦公室裡繁忙的公務中，再加上感冒尚未痊癒，昏昏沉沉中，只感覺日子過得極快，居然今天已經星期四了。感冒藥早吃光了，這兩天將消滅感冒病毒的重責大任交還給甩手功和瑜伽，發現效果良好，到今天早上，只剩喉頭微微異物感，略有些些痰涕，其他症狀大抵消失了。尤其在做瑜珈犁鋤式的時候，簡直舒服極了，聽著頸骨曲折時輕微的嘎搭聲，就好像開了個門縫，讓感冒病毒有個通道可以儘快逃逸出去。

話說在趕搭飛機返回澳洲那天，第一次參加了學生的中國「現代式」婚禮。從小到大，在台灣參加過的婚禮不計其數，甚至還在英國參加過朋友的教堂婚禮，但就是從來沒有機會親自見證一下，在大陸舉辦的婚禮，究竟和別處有何不同。這回終於親自體會了。就在婚禮的前一天晚上，自己還鄭重其事地寫信向學生抱歉，說是因為趕飛機，不克參加云云。但是翻開機票一看，才明白其實是傍晚的飛機，如果自己的動作夠俐落，其實趕場一下還是可以的。決定給學生一個驚喜。

婚禮的女主角是我在大陸的開山大弟子周靜。男主角名叫江波，但是在此之前，一直沒有機會見面認識。發現兩岸的婚禮還是很相似的，除了台灣人更加尊天敬祖外，在婚禮儀式中所洩漏出來的社會價值其實十分接近，不外就是孝順父母，攜手人生。坐在餐桌旁，饒有興味地看著婚禮進行，忽然發現男女主角的名字裡面，居然有些故事可說。周者全也，圓滿也，可以拿來象徵月亮。靜，當然指的是安靜。而江波，顯然是江心的波浪。想像一輪圓滿燦爛的明月，靜靜地照耀在江心之上，夜風溫柔地吹拂著，在月光下泛著粼粼的波光。啊，這不正就是「春江花月夜」的寫照嗎？

春江花月夜（唐張若虛）

春江潮水連海平，海上明月共潮生。
灩灩隨波千萬里，何處春江無月明？
江流宛轉繞芳甸，月照花林皆似霰。
空裡流霜不覺飛，汀上白沙看不見。
江天一色無纖塵，皎皎空中孤月輪。
江畔何人初見月？江月何年初照人？
人生代代無窮已，江月年年只相似。
不知江月待何人，但見長江送流水。
白雲一片去悠悠，青楓浦上不勝愁。
誰家今夜扁舟子？何處相思明月樓？
可憐樓上月徘徊，應照離人妝鏡臺。
玉戶簾中卷不去，搗衣砧上拂還來。
此時相望不相聞，願逐月華流照君。
鴻雁長飛光不度，魚龍潜躍水成文。
昨夜閑潭夢落花，可憐春半不還家。
江水流春去欲盡，江潭落月復西斜。
斜月沉沉藏海霧，碣石瀟湘無限路。
不知乘月幾人歸？落花搖情滿江樹。

嘗試著翻譯一下：

-----

春天的時候，豐盈湧動的江潮，像一條金色的項鍊，長長地在大地上委蛇鋪展，一路延伸到大海。在那江海相連的地方，一輪明月正從地平綫上升起，就好像和這金色的江潮一同涌現出來一般。月光靜靜照耀著春江，隨著這粼粼波光閃耀千萬里，還有什麽地方的春江，看不見這明亮的月光呢？

江水曲曲折折地流淌過野花爛漫的大地，開滿鮮花的樹林，就好像披上了一層細密的雪珠一般，在月光下閃爍。月光像細細的白霜在空氣中流瀉，但是卻感覺不到它的流動，它和江畔的白沙混融一體，只剩一片白茫茫的世界。江水、天空連成一色，看不見絲毫的微塵，只有明亮的一輪孤月，高高懸掛在空中。

究竟是誰，第一次在江邊看見這輪明月？究竟是在哪一年，江上的月亮第一次這樣地照耀著那個人？而人生輾轉輪迴，世世代代無窮無盡，只有這江上的明月，年復一年總是相同。江月啊，你究竟在等待著誰呢？我不明白這江上的月亮始終在等待著誰，只能目送著那波波湧去的潮水，隨著大江流向看不見邊際的盡頭。

一片孤零零的白雲在天際悠遊遠去，江邊灘上幾棵青楓，似乎也在印證著這相思的離情。是誰家的游子，今晚坐著小船在江上漂蕩？是哪裡的有情人，今晚也正在那滿耀著明月光輝的高樓裡，暗暗的相思？想那明月正倘佯在那高樓上，在那思念的人的妝台窗外，在那裡流連徘徊，不忍離去。

那思念的月光，是多麽的難以捉摸啊！想要它，想用閨房裡的繡簾把它包藏起來，但是卻一點也包藏不住；不想要它，想將搗衣石上的月光拂開，但是它始終還是停留在那裡。通過這江上的月亮，我們相互對望，但是卻聽不見彼此的聲音，我多麼希望能夠隨著這月光飄流到你的身邊，像月光那樣地照耀著你。只可嘆那替我傳遞書信的鴻雁，即使能夠高高飛翔，也無法隨著月光飛到你的身邊。而那替我轉述情話的魚龍，即使能夠深深潜游，也不能隨著這江波一路游到你的身旁，至多，也只是在江面激起一圈圈的波紋而已。

昨晚夢見落花飄零在這靜靜的水面上，春天都已經過去一大半了，但是却還是不能回家。江水悄悄地載走春光，唉，春光就快要流盡了。江水上的月亮好像才剛剛升起，如今卻又已西斜。斜月慢慢的西沉，將自己躲藏進濃濃的海霧裏。長路漫漫，只剩岸邊的礁石，陪伴著踽踽獨行的我。不知有多少人能夠乘著月光回家，飄零的落花搖蕩著滿腔的相思，遍灑在江邊的樹林裡。

-----

真是浪漫的詩句！說的是「永結同心」時的那個「同心」。每個平凡人，其實都是活在自己的妄心所創造出來的那個圈圈裡，而妄心是善變的，隨著時間不斷地變遷，每個人的那個圈圈，也不斷地伸縮移動。世俗所謂的真愛，其實就是在描述那個千巧萬巧的剎那，剛好兩個人的圈圈，在那個萬裡尋一的剎那時空裡，交錯融合，結成同心：我想給予的，剛好是你要的；而我極度需要的，又剛好是你亟想給予的。在這最真最善最美的片刻裡，全世界的浪漫都降臨一身，在那浪漫的情愫裡，希望時光停留凍結，永遠不要拆散這兩個圈圈。

但是因為這裡面涉及到「給予」和「需要」，換句話說，就是「慾望」的交換，在妄心的作用下，人類的慾望不僅無窮，而且還變化萬千，於是，當同心的熱情逐漸消散冷卻，自己的圈圈開始移動變化了，就逐漸感受到對方和自己的「不投契」，嚴重一些，甚至感覺到對方的可憎可厭。就好像徐志摩的詩句：「我是天空裡的一片雲，偶爾投影在你的波心，你不必訝异，更無須歡喜，在轉瞬間消滅了踪影。」這踪影的消滅，一切其實全是自己的錯，是自己變心了，是自己移走了自己的圈圈，又怎能怨懟對方？

如果能將這樣的情愛昇華，去欣賞對方的圈圈，而不是強要對方的圈圈來配合自己。如果在情愛中能夠沒有私慾，那就沒有了圈圈的拘限，廣大虛空，山河大地，全都包容在自己心中，那麼不論對方的圈圈如何移動，如何變化，全都逃不出如來佛的手掌心。江岸是固定不動的，江水只能順著江岸流動。如果這情愛能夠像月光，無私無欲地遍照大地，那麼不論這江河曲折幾千萬里，江心的波浪是沈寂還是洶湧，全都在這靜靜月光的周全籠罩之下，再也不能逃離。所以，追其究竟，還是在我們的心啊！

江樓上獨憑欄聽鐘鼓聲遠傳
裊裊娜娜灑入那落霞伴來
一江春水緩緩流四野悄無人
唯有淡淡瑟籟薄薄輕煙

-----
网友问：「此何卦象耶？」曰：「月为坎为水，月下有泽，水泽节也。」池泽纳水。兑泽在坎水之下，容蓄水量，约束水流，不使四散奔流为节卦。又坎陷、兑悦，以和悦之心情去行险犯难，可以克难出险。
江波要学习有容乃大，才不致於让这条真龙困於浅滩。
周静要收拾心性，以喜悦的心，节制的态度，度过曲折的江水，终於可以奔流进入宽阔无边、无限包容的大海。
第60卦，水泽节
卦辞：节：亨。苦节不可贞。
象曰：泽上有水，节﹔君子以制数度，议德行。
彖曰：节，亨，刚柔分，而刚得中。苦节不可贞，其道穷也。说以行险，当位以节，中正以通。天地节而四时成，节以制度，不伤财，不害民。
上六爻辞：苦节，贞凶，悔亡。（刚开始还是需要磨合，以无怨无悔的心境度过磨合期）象曰：苦节贞凶，其道穷也。
九五爻辞：甘节，吉﹔往有尚。（渐渐苦尽甘来）象曰：甘节之吉，居位中也。
六四爻辞：安节，亨。（相处和乐，安於生活之道）象曰：安节之亨，承上道也。
六三爻辞：不节若，则嗟若，无咎。（顺其自然）象曰：不节之嗟，又谁咎也。
九二爻辞：不出门庭，凶。（年纪渐老，仍然要守分寸）象曰：不出门庭，失时极也。
初九爻辞：不出户庭，无咎。（年老了，无为而治）象曰：不出户庭，知通塞也。

訂閱：文章 (Atom)

愚園囈語

我搬家了

2007年10月9日星期二

結構方程模型的基本觀念 (1)

2007年10月7日星期日

什麽才是規範的「洋八股」(6)

什麽才是規範的「洋八股」(5)

什麽才是規範的「洋八股」(4)

2007年10月4日星期四

江心圓月

歡迎光臨

網誌存檔

愚園囈語

我搬家了

2007年10月9日 星期二

結構方程模型的基本觀念 (1)

2007年10月7日 星期日

什麽才是規範的「洋八股」(6)

什麽才是規範的「洋八股」(5)

什麽才是規範的「洋八股」(4)

2007年10月4日 星期四

江心圓月

歡迎光臨

網誌存檔

2007年10月9日星期二

2007年10月7日星期日

2007年10月4日星期四