關于對診斷一致性Kappa系統的探討

時間:2022-03-18 07:49:00

導語:關于對診斷一致性Kappa系統的探討一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

關于對診斷一致性Kappa系統的探討

【關鍵詞】診斷試驗;,,一致性檢驗;,,kappa系數,,,

摘要:對診斷一致性的簡單Kappa系數、加權Kappa系數以及總Kappa系數進行了分析和說明,由于Kappa系數僅適用于行數和列數相等的方表,針對Kappa檢驗的這一局限性,給出了行數和列數不一致時使用SPSS軟件實現Kappa檢驗的方法。

關鍵詞:診斷試驗;一致性檢驗;Kappa系數

在診斷試驗中,研究者希望考察不同的診斷方法在診斷結果上是否具有一致性。診斷試驗的一致性檢驗經常用于下列兩種情況[1]:一種是評價新的診斷試驗方法與金標準的一致性;另一種是評價兩種診斷試驗方法對同一個樣本(化驗對象)的化驗結果的一致性、兩個醫務工作者對同一組病人的診斷結論的一致性、同一醫務工作者對同一組病人前后進行兩次觀察作出診斷的一致性等。1960年Cohen等提出用Kappa值作為評價判斷的一致性程度的指標。實踐證明,它是一個描述診斷的一致性較為理想的指標,因此在臨床試驗中得到廣泛的應用。

本研究分別給出三種Kappa系數,即簡單Kappa系數,加權Kappa系數和總Kappa系數及標準誤和檢驗統計量的計算公式,并針對Kappa系數僅適用于行數和列數相等的方表的問題,給出了用SPSS軟件實現對行列數不等資料的Kappa檢驗方法。

1簡單Kappa系數的計算公式[1]

K=P0-Pe[]1-Pe(1)

其中P0=∑ipii,稱為觀測一致率,Pe=∑ipi.p・i,稱為期望一致率,即兩次檢驗結果由于偶然機會所造成的一致率,其中pi.=Ri[]N,p・i=Ci[]N,Ri,Ci分別為第i個格點所對的行合計和列合計,N為總例數。當兩個診斷完全一致時,P0=1,此時Kappa值為1。當觀測一致率大于期望一致率時,Kappa值為正數,且Kappa值越大,說明一致性越好。當觀察一致率小于期望一致率時,Kappa值為負數,這種情況一般來說比較少見。根據邊緣概率的計算,Kappa值的范圍值應在-1~1之間。Kappa≥075兩者一致性較好;0.75>Kappa≥0.4兩者一致性一般;Kappa<0.4兩者一致性較差。

Kappa系數標準誤的計算公式為:

S=Pe+P2e-∑ipi.p・i(pi.+p・i)[](1-Pe)N(2)

其95%的置信區間為:

(k-1.96S,k+1.96S)(3)

由于Kappa值是一個樣本統計量,作是否有統計學意義的假設檢驗時,應選用統計量:

U=Kappa[]S(4)

2加權的Kappa系數[2]

加權的Kappa系數是簡單Kappa系數的推廣,是用加權的方法對兩個評價結果進行量化。對于四格表來說,簡單Kappa系數與加權的Kappa系數是相等的,對于一般的行列表,加權的Kappa系數的計算公式為:

Kw=P0(w)-Pe(w)[]1-Pe(w)(5)

P0(w)=∑i∑jwijpij

Pe(w)=∑i∑jwijpi.p・j

其中0≤wij=wji<1,i≠j,wij=1。

加權Kappa系數的標準誤計算公式為:

Skw=∑i∑jpi.p・j[wij-(i.+・j)]2-P2e(w)[](1-Pe(w))2N(6)

95%的置信區間為:

(kw-1.96Skw,kw+1.96Skw)(7)

假設檢驗的統計量為U=kW[]Skw(8)

Kappa的權系數一般使用CicchettiAllison和FleissCohen兩種權值類型[2],CicchettiAllison的計算公式為:

wij=1-|Ci-Cj|[]Ck-Ci(9)

FleissCohen的計算公式為:

wij=1-(Ci-Cj)2[](Ck-Ci)2(10)

其中,Ci表示第i列的評價分值,k表示列數。如果是數值型變量,評價分值Cij就是第i行第j列對應的具體數值;如果是分類變量,可按照相應級別進行賦值。由于wij=1,而當i≠j時,0≤wij<1,所以由Kappa系數的計算公式可知加權的Kappa系數大于簡單Kappa系數。

3總Kappa系數

假設列聯表為多向列聯表(我們不妨設有q個方向),且每個變量有兩個水平,即為2×2×…×2列聯表,令ki表示第i個變量的Kappa系數,Ski表示第i個Kappa系數的標準誤,則總Kappa系數的計算公式為:

K總=∑q[]i=1ki[]Ski/∑q[]i=11[]Ski(11)

若要檢驗各變量Kappa系數是否都相等,可采用自由度為q-1的χ2檢驗,計算公式為:

χ2=∑q[]i=1(ki-k總)2[]Ski(12)

(11)、(12)兩個公式均適用于加權的Kappa系數。

4行列數不等時Kappa系數的計算

Kappa系數的計算適用于兩個評價人分級水平數相同的情況,即數據格式為行數和列數相等的方表。而在實際操作中,經常會出現分級水平數不一致,即行列數不等的情況。我們來看一個實例:兩名醫生按照某項指標的1~4個等級來評價8個病人。一個醫生用全部4個等級進行評價,而另一醫生只有3個等級進行評價。此時,對于兩個醫生來說,他們評價的級別范圍不同。數據見表1。

表1甲乙兩醫生對病人的評價(略)

下面我們使用SPPS軟件獲得Kappa值及檢驗結果。SPSS110或更低的版本在這種情況下均無獲得Kappa統計量。SPSS115以上的版本可以計算出Kappa值。首先進入數據編輯器并給甲醫生添加額外的觀測值0001。數據錄入見圖1。選擇Analyze→DescriptiveStatistics→Crosstabs,將變量甲,乙分別放入對應的行列框內,選擇Statistics按鈕,得到如下對話框(圖2),選擇Kappa復選框,按continue即可輸出Kappa值、標準誤和P值。

相應的結果為:

Kappa=0.810,P=0.001,S=0.176。

5討論

在診斷試驗的研究中,數據資料多為雙向有序的列聯表資料,即兩個變量都是有序變量,而且屬性相同。屬性相同分為三種情況,一種情況是屬性、分級水平數和分級水平都完全相同。如甲醫生和乙醫生都把病人的檢查結果分為1、2、3、4四個等級。此時可直接作Kappa檢驗。當這兩個變量都只有2個水平時,就成為配對設計的四格表資料,可使用配對χ2檢驗,即McNemar檢驗。第二種是屬性相同的分級水平數相同,但分級水平不全相同。如甲醫生和乙醫生都把病人的檢查結果分為四個等級,但甲醫生的分級為1、2、3、4,而乙醫生的分級為2、3、4、5。在這種情況下,由于列聯表的行數和列數仍然是一致的,即列聯表仍為方表,所以也可計算出相應的Kappa統計量。第三種是屬性相同,但分級水平數和分級水平不全相同。這種情況就是我們所說的列聯表的行列數不一致。由于收集上來的數據不能輕易刪除掉,所以我們考慮添加行或列使聯表成為方表。如行數為n,例數為n-1,則我們只需要添加第n列,在第n行第n列的格點中添加權值0001,而第n行的其它格點均設為0,就可以命名其成為方表,并計算Kappa統計量了。由于權值系數很小,所以不會影響Kappa值的計算結果。

另一方面,如果兩個變量中有一個變量是金標準,那么我們不但能分析出檢驗結果的一致性,還可以計算出敏感度、特異度、誤診率和漏診率等指標。如果有不同的診斷分界點,還可以繪制出ROC曲線。

診斷試驗的評價[3]在醫學研究中具有十分重要的意義,目前大多數文獻都使用Kappa統計量來檢驗結果的一致性。所以本研究主要是對Kappa系數作一個探討和分析。診斷試驗評價的統計學方法還會隨著更多問題的提出和解決而不斷得到發展、修正和擴展。

參考文獻

1馬斌榮,主編醫學科研中的統計方法北京:科學出版,2005,3

2SAS91軟件說明書(英文版)

3宇傳華譯診斷醫學統計學北京:人民衛生出版社,2005,3