結構方程公共管理論文
時間:2022-08-15 11:29:12
導語:結構方程公共管理論文一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
(一)結構方程模型的基本思想
結構方程模型也被稱為協方差結構模型(CovarianceStructuralModelling),它有效地整合因子分析模型和路徑分析模型為一體,開創出全新的量化研究范式。SEM突出了“潛變量(latentvariable)”的概念,在很多涉及到人的研究中,其探討的變量多數不能被直接觀測,比如態度、情感、智力、動機、家庭社會經濟地位等。只能用外顯的指標(manifestindicator)去間接測量這些潛變量。如圖1(b)所示的因子分析模型,潛變量LV1和LV2依靠觀測變量OV1至OV6測量,每個觀測變量都存在自己的測量誤差,因子分析模型可以將測量誤差排除于潛變量之外,提高了統計的準確性。在SEM出現前,如果要探討LV1與LV2之間是否存在回歸關系,需先使用觀測變量OV1至OV6合成計算出兩個指標SV1和SV2,然后使用如圖1(a)的路徑分析模型計算SV1至SV2的回歸系數。此處的SV1和SV2并不等同于LV1和LV2,因為前者在合成的過程中加入了測量誤差。而使用SEM的方法,其模型如圖1(c)所示,該模型在潛變量LV1和LV2之間建立回歸路徑。顯然,SEM進行路徑分析時排除了測量誤差的影響,其回歸分析的結果更為精準和可靠。
(二)結構方程模型的優勢和特點
與原有統計方法相比,SEM整合了因子分析和路徑分析的過程,提高了分析的準確性,其優勢和特點被Bollen和Long總結為下述五點[6]:1.能同時處理多個自變量和因變量。在以前的統計模型中,可以允許存在多個自變量,但因變量只能有一個,即多元回歸分析。SEM可以將多個自變量和多個因變量同時放在一個模型內,考慮的是多對多的復雜關系。2.允許自變量和因變量都含有測量誤差。由于潛變量概念的引入,每個自變量或因變量可以由多個觀測變量來測量。每個測量變量都有自己的測量誤差,測量誤差可以被剔除在路徑分析之外。3.同時估計因子結構和因子關系。在原來的統計方法中,測量模型與結構模型相分離,需要先計算潛變量與指標間的因子載荷(factorloading),然后根據因子載荷計算獲得潛變量的測量值,再分析這些潛變量之間的結構和關系。SEM將這兩步同時進行,一次估計獲得因子關系和因子間結構的全部參數。4.檢驗整個模型的擬合好壞程度。傳統的回歸模型中,一般使用標準化回歸系數表示單條路徑(兩個變量間關系)的強弱,以不能被解釋的殘差判斷回歸模型的擬合好壞。在SEM中,則是對整個模型與樣本數據間的擬合程度進行估計,從整體上判斷哪個模型更為符合數據所呈現的復雜關系。5.允許更大彈性的測量模型。傳統測量模型只允許每個題目(或觀測變量)從屬于一個因子,SEM中不再存在該限制,同一觀測變量可以同時從屬于多個因子。例如,某地區的服裝類消費總額既體現了該地區的經濟發展水平,也受到當地居民消費傾向的影響,該觀測變量應同時從屬于這兩個因子。
(三)結構方程模型的主要應用對象
在公共管理領域的研究中,SEM一般用來解決兩類問題:一是運用其進行驗證性因子分析,檢驗問卷和量表的信效度;二是進行路徑分析,以檢驗變量間(包括顯變量之間和潛變量之間)的相互關系。社會科學的研究中,大量使用量表和問卷作為調查研究的工具。其中結構效度和維度的確定一般使用因子分析的方法完成,SEM的一大應用就是進行驗證性因子分析(CFA),探討量表或問卷的維度是否符合最初的設想。在我們檢索到的16篇應用SEM的論文中,張立榮和李曉園運用CFA建構縣級政府公共服務能力的結構模型[7],胡楊成和蔡寧則使用CFA驗證非營利組織市場導向量表的因子結構[8],張崇輝和李夢楠也在探討地區中心主義與其他變量的關系前,使用CFA對其修訂的消費者地區中心主義量表進行效度分析。[9]驗證性因子分析是檢驗測量工具效度的重要手段,卻并非本文所關注的重點。公共管理的研究中,更多的需要SEM處理變量間的復雜路徑關系。由于SEM具備上一節中所介紹的五大優勢,特別是它可以同時處理多個自變量和因變量、且能夠在多個變量之間設定連續的因果關系,非常有助于研究者分析變量間的作用機制。它在路徑分析中的應用,將是本文下面重點討論的內容。
二、典型的結構方程模型路徑分析
一些使用SEM的典型路徑分析模型將在本節中被討論,這些模型值得在公共管理的量化研究中推廣。
(一)多元回歸分析模型
簡單線性回歸和多元回歸是被廣大研究者所熟悉的統計模型,主要用于解釋因變量受一個或多個自變量的影響程度。SEM同樣可以用于該目的,但與傳統的回歸分析不同,SEM中的自變量和因變量都可以是潛變量,這些潛變量由顯變量觀測而得;同時,模型中可以混合潛變量和顯變量于一體。如圖2所示(該模型來自于陳占鋒發表于《國家行政學院學報》上的論文[10]),模型假設失地農民的生活滿意度受到社會保障、工作等7個潛變量的影響,同時還受到土地補償、性別等4個顯變量的影響。整個模型中,生活滿意度為多元回歸分析的因變量,而7個潛變量和4個顯變量一同構成了該多元回歸分析的自變量。圖中的e29為回歸模型的殘差,也就是生活滿意度中不能被11個自變量解釋的部分,通過它和生活滿意度的方差可以計算出模型的解釋率。
(二)帶有中介變量的模型
在實際研究中,自變量還有可能通過中間變量對因變量產生作用。如圖3(a)所示的中介模型(MediationMod-el)(圖3和圖4給出的模型均為示意圖,沒有詳細表示潛變量的觀測變量和殘差項),自變量為X、因變量為Y,一部分X對Y的影響通過中介變量M發生作用。通過路徑a和路徑b形成一條X對Y的影響路徑,系數a×b為中介模型的間接效應。同時,在圖3(a)所示的模型中,還存在X對Y的直接影響路徑,系數c的大小被稱為中介模型的直接效應,這樣的中介被稱為部分中介模型。如果系數c為零(或者可以設為零),則表明X對Y的作用全部通過中介變量M起作用,此時的模型被稱為完全中介模型。應用中介模型時,某些情況下特別驗證了中介變量的效應大小。如于海波等人考察工作投入在公務員可就業性與工作績效之間中介效應,表明工作投入在工作家庭平衡與工作績效之間起完全中介作用,在職業專長、自我完善、個人靈活性、集體意識4個自變量與工作績效之間起部分中介作用。[11]另一些情況下,雖然使用了中介模型,卻并沒有重點關注中介變量的作用,而僅僅把中介變量作為整個路經分析上的一個節點,也沒有給出每個中介變量的效應大小。如黎潔等人在分析參與式森林資源管理的影響因素時,其所構建的模型中參與態度實際上是參與感知、地方認同和參與行為之間的中介變量,但研究者只討論了其中每條路徑是否顯著,并沒有對參與態度的中介作用做過多探討。[12]除了圖3(a)給出的簡單中介模型外,自變量與因變量之間還可能同時存在多個中介變量,如圖3(b)所示,X對Y的作用包含直接效應(X→Y),通過M1的間接效應(X→M1→Y)和通過M2的間接效應(X→M2→Y)。此外,中介變量之間也可能出現串聯關系,如圖3(c)的模型,M2為X與Y之間的第二重中介,X對Y的作用通過三條路徑實現(X→Y,X→M1→Y,X→M1→M2→Y)。劉波等人[13]和董曉松[14]的研究中所構建的模型,均包含了多重中介效應。
(三)帶有調節變量的模型
調節模型(ModerationModel)是另外一類典型的路徑分析應用。從圖4(a)看,其與中介模型的不同主要集中在兩點:一是調節變量U不受自變量的影響,二是它的影響作用于X到Y的路徑上。例如,面對電價上漲,男女做出節電行為的頻率可能存在差異;此時,性別就是經濟成本與節電行為之間的調節變量。圖4(a)給出的是抽象概念,在SEM的實際操作中,U的影響無法被直接放置在一條路徑上,其模型圖可轉換為圖4(b)。如果變量X和U都是連續變量,其調節作用呈現為X與U的交互作用,即X×U的影響。調節變量和中介變量還可能同時出現在一個模型中,形成有調節的中介模型(圖4(c))和有中介的調節模型(圖4(d))。兩種模型的主要區別在調節變量U作用的路徑,有調節的中介模型中,調節變量U作用于中介變量到因變量的路徑上(M→Y);而在有中介的調節模型中,U作用于從自變量出發的路徑上(X→M和X→Y)。溫忠麟等人曾經這兩種模型做出過詳細介紹。[15]我們檢索到的16篇論文中,尚沒有涉及到調節效應的研究。
三、建立模型前應明確的關鍵問題
在應用SEM之前和過程中,必須明確下面幾個問題。一是必須對所研究的問題有明確的模型假設,然后利用SEM進行假設檢驗;二是對引入模型的變量和指標類型有清晰的認識,三是要保證充足的樣本量和樣本代表性。
(一)基于理論的模型假設
SEM是一種驗證性的統計工具,不能寄希望于它具有探索變量間關系的能力。如果研究者希望收集好數據后,通過SEM自動運行出某個恰當的模型來,它是無法達成的。SEM只負責評估給出的模型假設與數據之間的擬合程度,以便讓研究者對假設模型的合理性做出判斷。其次,包括SEM在內的統計方法,無法決定兩個變量之中哪個是因變量,哪個是自變量。從統計的角度看,當兩個變量間具有較高程度的相關時,將其中任一變量作為自變量,另一變量作為因變量,都可以獲得回歸分析的結果。然而,究竟哪個變量是自變量,這完全取決于研究的理論基礎。例如,公務員對部門的歸屬感與其工作的成就感之間存在著較高程度的相關,但是歸屬感影響了成就感,還是成就感影響歸屬感,需要研究者通過理論分析來證明,統計方法只能給出回歸作用的強弱。此外,SEM也不能自動發現模型中的中介變量和調節變量,哪些變量可能發揮中介或調節作用,同樣來自于研究者的理論分析。建立SEM的過程,實際上是一個模型比較和修正的過程。在該過程中,往往需要對最初的假設模型進行修正,經過反復比較后,最終獲得符合理論構想、且能夠得到數據有力支撐的模型。一般而言,模型越復雜、變量間的關系越多,則模型的擬合會越好;當把模型中所有變量都設為相關后,模型的擬合達到最優,此時的模型被稱為飽和模型(saturatedmodel)。但飽和模型對研究本身并無價值,因為我們的研究總是希望用盡可能簡潔的模型解釋較多的變量關系。所以,在模型比較和修正的過程中,不應以追求模型指標的好壞為唯一目標,能否得到理論的支持才是更為重要的標準。
(二)潛變量和觀測變量的類型
本文圖1和圖2中所示的潛變量,均使用多個觀測變量來測量,而且觀測變量決定于潛變量,此類測量模型所獲的潛變量被稱為反映式指標(reflectiveindex)。這樣的測量模型源于心理學的研究,例如個體對于測驗題目的表現(觀測變量)決定于其智力水平(潛變量),被廣泛用于態度、情感、能力的測量。然而,也有一些指標并不適合于該測量模型,比如管理學、社會學研究中常用的家庭社會經濟地位(SES)指標。該指標一般由收入水平、教育水平、職業聲望三個變量測量,但這三個變量的數值并非由家庭社會經濟地位決定,而是構成了家庭社會經濟地位指標,應該使用如圖5(b)所示的測量模型,該類指標也被稱為構成式指標(formativeindex)。圖5中,左側的反映式指標模型與右側的構成式指標模型主要存在三點區別[16]:(1)潛變量與觀測變量間的關系不同,反映式指標決定觀測變量,而構成式指標由觀測變量所決定,因此圖中作用路徑的箭頭方向不同;(2)反映式指標中,各觀測變量(圖中為3道測量題目)之間必須具有內部一致性(即相互間正相關),但在構成式指標對各觀測變量間的關系沒有限定;(3)反映式指標模型的測量誤差存在于各觀測變量上(e1至e3),構成式指標模型的測量誤差則表現為潛變量的殘差(e4)。公共管理研究中,既存在反映式指標,也存在構成式測量指標。選擇何種測量模型主要與潛變量的具體內容有關,需要研究者根據模型和問卷仔細分析后確定,而該決定將影響到SEM的統計結果。MacKenzie等人的仿真實驗表明,如果錯誤的使用了測量模型,有可能導致路徑系數最多被高估400%、或者被低估80%。[17]另外,測量數據的類型在分析前也應該被考慮,SEM假設其統計數據為多元分布的連續數據,但實際應用中,通過李克特問卷測量的數據往往只能達到順序數據的水平,而諸如性別等變量只有分類數據的水平。如果不對順序數據和分類變量進行小心處理,而直接放入到SEM進行分析,很有可能影響到結果的準確性。
(三)樣本的充足與代表性
“多大的樣本量對于SEM分析是足夠的”,這是很多研究者所關心的問題。常見的解答為,樣本量應該是觀測變量個數的5倍以上,其實際含義是要求模型中每一個待估計的參數對應于數倍的被試(subject)或個案(case)。事實上,要求樣本量與觀測變量呈一定比例的觀點并沒有充分的依據,因為這個問題會受到很多其他因素的影響,但所有的統計學家都認為,樣本量越大,SEM的參數估計結果越準確。在我們檢索到的16篇論文中,最大的樣本量為2500,最小的樣本量為133,平均樣本量達到了573。樣本量與參數之比,最小的為4.8,最大為416.7,平均達到45.1。與西方國家量化研究的樣本量較小不同,我國量化研究的樣本量一般都較為充足。另外,如果數據類型為順序數據,所需的樣本量應該比連續數據更大。因為樣本量偏小時,SEM的參數估計過程容易不收斂或者出現估計結果不恰當的現象。[18]還要說明的是,隨著統計技術的不斷發展,一些新的參數估計方法和模型擬合指標對樣本量的要求變得越來越少,如DWLS估計法在小樣本條件下就能取得更好的結果。而一些Robust的模型擬合指標也適用于小樣本和數據偏態分布的情況。最后,不考慮抽樣方法的合理性,而單純考慮樣本量的大小是沒有意義的。進行任何實證研究,都首先要求數據有充分的代表性,才有可能得出科學的結論。如果抽樣方法不合理,可能會導致樣本本身的偏差和偏態分布,此類錯誤對SEM的影響更大。
四、結構方程模型結果的報告
一般而言,使用SEM的過程及結果應該從模型與變量、樣本與數據、統計軟件與過程、參數估計結果、模型擬合指標五個方面給予詳細報告。下面結合16篇使用SEM論文的結果報告情況,具體說明五個方面應報告的內容。
(一)模型與變量
正如前文所指出的,研究者在運用SEM前對于變量間關系必然存在著假設,且在多數時候,由于存在著不同的理論,或對變量間關系不能完全確定,假設模型往往是一組而非單一模型。研究的任務就是要通過對一組模型的比較,確定最能獲得數據支持的一個。在我們分析的16篇論文中,有6篇文獻只檢驗和報告了一個模型,并不明確其是否對模型進行過修正,也不知道是否與其他模型進行過比較。在說明假設和最終模型的同時,還要說明模型中所涉及的變量。需描述清楚每個變量的測量方法,是潛變量還是顯變量,每個潛變量的測量模型是否包含于SEM中,潛變量是反映式指標或是構成式指標。如果可能的話,還應該報告潛變量的信度和效度。參見表1,在我們檢索到的論文中,多數文獻(11篇)引入了潛變量的測量模型進行分析,且全部為反映式指標。
(二)樣本與數據
任何量化研究都應該報告抽樣人群、抽樣方法與過程、樣本量的大小,這些因素決定了量化研究的科學性和可推廣性。對樣本的報告首先應該描述研究對象,還應報告總人數的大小和相關背景變量。抽樣如果無法采用完全隨機抽樣時,要對抽樣的方法和理由給予說明。此外,問卷回收率和有效率也是必須報告的內容。在很多研究中,收集數據的分布特征都被忽略或忽視了,但其對SEM結果卻有很大影響。數據特征中首先應說明的是變量的類型,對于順序型的變量,其中分類的數量也是重要的數據特征,如有的問卷使用5點李克特式題目,而有的則為4點或7點。然后,每個變量的均值、標準差、峰度和偏度應該被報告,并指出那些存在明顯偏態分布的變量。但16篇論文對樣本情況的實際報告并不樂觀,有6篇論文沒有報告問卷的回收率和有效率,有6篇文獻沒有對樣本的人口統計學特征進行分析,降低了統計結果的可靠性。對于數據的類型,有6篇文獻沒有報告;報告數據類型的10篇文獻中均使用李克特式的問題設置,但問題的分類數并不相同,除常見的5點李克特式問卷,還有4點、6點、7點、9點等不同形式。
(三)統計軟件與統計過程
根據SEM的統計基礎,它即可以與樣本協方差矩陣擬合,也可以用樣本相關系數矩陣來分析。不管擬合哪種矩陣,報告結果時都應該說明擬合矩陣的類型,并列出完整的樣本協方差矩陣或樣本相關系數矩陣,以便其他學者驗證或改進研究結果。但在檢索到的16篇文獻中,只有4篇報告了完整的相關系數矩陣,1篇報告了協方差矩陣,剩下的11篇論文都沒有給出具體的擬合矩陣數據,使后人無法驗證其模型和統計結果。目前已有多個支持SEM的成熟軟件,但這些軟件的參數估計方法、估計結果、模型擬合指標并不一致,應在論文中報告具體完成統計的軟件名稱。除1篇未報告使用軟件外,多數研究者(12篇)選用了SPSS公司的Amos軟件(版本從4.0到19.0不一),也有3篇使用Lisrel軟件完成。接下來,參數估計方法和估計過程是不可或缺的內容。不同的參數估計方法適用于不同類型的數據,所獲估計值和模型擬合指標也不同。SEM軟件一般都存在預設的最大迭代次數,達到該迭代次數后,無論參數估計值是否收斂,軟件都會自動停止估計過程。研究者必須查看估計過程是否順利完成,估計值是否達到收斂,并報告這一點。遺憾的是,在16篇被分析的論文中,大多數沒有報告參數估計方法,僅有3篇報告自己使用了極大似然估計法。而對于估計過程是否達到正確收斂,被全部研究者所忽略。
(四)參數估計結果
多數時候,我們很難也沒有必要將SEM軟件提供的所有參數估計結果都列在文章中。研究者應重點突出那些研究興趣點所在的結果,進行問卷的信效度分析時,因子載荷和因子的解釋率必須被報告;而進行中介效應檢驗時,中介路徑和直接路徑的系數、直接效應和間接效應大小必須被報告。參數的估計值存在標準化和非標準化兩類,一般都要求報告標準化的估計值,16篇論文也均報告了標準化參數。標準化的參數估計值應該處于-1至1之間,如果估計值不在該范圍內,則表明該參數估計值不合理。造成不合理結果的原因有很多,參數估計方法、抽樣的代表性不足、模型的結構不正確都可能是影響因素。還要強調的是,僅報告參數估計值是沒有意義的,因為估計值可能會隨著樣本的不同而變化。為了證明估計值的可推廣性,需要給出其顯著性檢驗的結果,或是報告其標準誤或顯著性。但在分析的16篇文獻中,有3篇沒有報告路徑參數的顯著性。如果條件允許,可以報告模型中的殘差,它表現了每條路徑的擬合程度,以及自變量對因變量的解釋程度,16篇論文中的7篇給出了回歸分析的解釋率。
(五)模型擬合指標
確定最終模型后,以及在進行模型比較和選擇的過程中,都需要參考和報告模型的擬合指標,它們是反映模型得到數據支持程度的體現。報告擬合指標時不能只報告一種,而應該綜合考慮絕對擬合指標和相對擬合指標①,特別是要報告χ2和RMSEA等常用指標。而且,不僅要報告擬合指標的數值,還應列出指標的判別標準;并對各擬合指標是否達到標準進行說明。在16篇論文的實際寫作中,對擬合指標的報告存在較大差異。其中最少的只報告了3個指標,最多的報告了11個指標;有2篇文獻未報告χ2,3篇文獻未報告RM-SEA,2篇文獻未報告任何相對擬合指標,這些文獻的報告顯然不太合理。另外,有5篇文獻未給出擬合指標的判別標準,不利于直接判斷其模型擬合的好壞。
作者:吳瑞林楊琳靜單位:北京航空航天大學公共管理學院講師北京航空航天大學公共管理學院碩士研究生
- 上一篇:黨的群眾路線教育實踐第一環節總結
- 下一篇:思想政治工作下公路管理論文