Kruskal-Wallis檢定是用來探討3個或3個以上的獨立群組是否有所不同的一種無母數檢定,適用在單因子變異數分析的基本假設受到嚴重違反,或依變項測量尺度不是等距或比率尺度的時候。當Kruskal-Wallis檢定達到統計上顯著時,僅指出群組間存在差異,但無法得知群組間如何不同。若想進一步瞭解成對群組間的差異,須執行Dunn檢定,就是Kruskal-Wallis檢定的事後成對比較。
本篇文章為Kruskal-Wallis檢定的延伸,建議您先閱讀Kruskal-Wallis檢定的假設檢定,將有助於下面內容的銜接和理解。以下將先介紹Dunn檢定的使用時機,再解釋Dunn檢定的成對比較方法並舉例說明,最後示範利用SPSS執行Dunn檢定的操作過程。
Dunn檢定的使用時機
Kruskal-Wallis檢定是類似於獨立群組的單因子變異數分析(以下簡稱「單因子變異數分析」)的一種統計檢定方法,因為適用在單因子變異數分析的常態分配和/或變異數同質性的基本假設受到嚴重違反,或依變項為次序尺度的時候,所以屬於一種無母數檢定。
單因子變異數分析是一種綜合檢定(omnibus test),也就是說當單因子變異數分析的F值達到統計上顯著時,僅代表整體群組間存在差異,但不清楚群組間如何地不同。若想瞭解哪些成對群組間存在差異,須進一步執行單因子變異數分析的事後比較,例如Tukey HSD檢定、REGWQ檢定、Scheffé檢定或Dunnett檢定。
同樣地,Krusal-Wallis檢定也是一種綜合檢定,當Kruskal-Wallis檢定的H檢定統計量達到統計上顯著時,只表示所有群組不是來自於極為相似的母群體,但群組間如何地不同則無從得知。為了探討群組和群組之間是否存在差異,須執行Kruskal-Wallis檢定的事後比較,而最常用的方法即為Dunn檢定(Dunn´s test),可用來進行成對群組的比較。
因此,Dunn檢定是Kruskal-Wallis檢定的假設檢定過程中,在檢定統計量達到統計上顯著並拒絕虛無假設後,用來更深入探討哪些成對群組間存在差異的一種事後比較方法。
Dunn檢定的成對比較方法
Dunn檢定是由Dunn(1964)提出,利用Kruskal-Wallis檢定的H檢定統計量計算過程中各個群組的等級總和,並使用z檢定和常態分配來評估成對群組之間的差異。Dunn檢定的z檢定統計量公式如下:
(1)
從上面的公式可看出,若資料裡存在相同等級,Dunn(1964)調整了成對比較的標準差。如果資料裡不存在相同等級,則上面的公式可簡化成下面的公式:
(2)
透過上面的公式(1)或(2)求得成對群組比較的z檢定統計量後,查詢標準常態分配表,找出獲得這統計量的絕對值或大於這統計量絕對值的機率(也就是超出z之外的常態曲線下面積),並將這機率乘以2即為雙尾檢定的值,再和事先設定的顯著水準(α水準)相比較。
不過,為了控制因多個成對比較而膨脹的第一類型錯誤機率α,須對α進行調整。Dunn(1961)採用Bonferroni校正(Bonferroni adjustment),將原本設定的α水準除以成對群組比較的組數後,再利用這個調整後的α水準和值相比較,最後透過決策規則去評估是否拒絕虛無假設。
Dunn檢定的假設檢定過程並沒有不同於其他統計檢定的假設檢定過程,若您不清楚或不熟悉假設檢定的步驟,可參考假設檢定的步驟和範例。瞭解了Dunn檢定的成對比較方法後,下面舉個例子來實際操作整個過程。
Dunn檢定的範例操作
這裡使用「Krusal-Wallis檢定的假設檢定」裡少年偏差行為者的居住環境和逃學天數的例子,因為這個例子裡Kruskal-Wallis檢定的H檢定統計量達到統計上顯著,為了進一步探討群組間如何地不同,所以利用Dunn檢定來執行成對群組的比較。
在這個例子裡,原生家庭(origin)、寄養家庭(foster)和團體家屋(group home)這3個群組的等級總和、個數分別如下表。此外,這例子裡有2組相同等級,而每一組相同等級裡的數值都是2個。
因為有3個群組,所以可進行3組成對比較,分別為① origin vs. foster、② origin vs. group home、③ foster vs. group home。每組成對比較的虛無假設()皆為兩個群組是來自於極為相似的母群體,也就是兩個群組間不存在差異。另外,和Kruskal-Wallis檢定相同,顯著水準為0.05。
由於這個例子有相同等級的存在,所以須使用上面的公式(1)來計算每組成對比較的z檢定統計量。先把因為相同等級須作調整的部分計算出來,計算過程如下:
再將0.0588帶入公式(1)裡,並計算每組成對比較的z檢定統計量,3組的計算過程分別如下:
① origin vs. foster:
② origin vs. group home:
③ foster vs. group home:
接著,取3組z檢定統計量的絕對值,並查詢標準常態分配表,找出常態分配右側超過z統計量之外的常態曲線下面積,也是獲得z統計量的機率。由於這只是分配右側的機率,須再乘以2,也就是加上分配左側的機率後,才是雙尾檢定的機率(值)。參考下表,3組的值分別如下:
① origin vs. foster:
② origin vs. group home:
③ foster vs. group home:
為了將第一類型錯誤機率維持在α,須進行Bonferroni校正,把原本設定的α水準除以成對比較的組數後,再與各個值相比較。若調整後的α水準稱為,則在α水準為0.05、成對比較組數為3的情況下,這個研究的為:
最後,藉由機率比較的決策規則,比較每組的值和,當時,即達到統計上顯著,可拒絕虛無假設。三組當中,只有③ foster vs. group home達到統計上顯著()。這分析結果指出,住在寄養家庭和住在團體家屋的少年偏差行為者在逃學天數上有顯著的差異,從平均等級來看,團體家屋的少年偏差行為者之逃學天數少於寄養家庭的少年偏差行為者。
運用SPSS執行Dunn檢定
將少年偏差行為者的居住環境和逃學天數例子的資料輸入至SPSS資料編輯器裡,輸入完成後,點選功能表的分析 » 無母數檢定 » 獨立樣本,帶出「非參數化檢定:兩個或多個獨立樣本」視窗。關於SPSS資料輸入方法,請參考SPSS操作環境和資料輸入。
在「非參數化檢定:兩個或多個獨立樣本」視窗的「目標」標籤裡,您的目標是什麼?長方框裡選擇自動比較群組間的分佈(U)。
在「欄位」標籤裡,將變項ABSENCE從左邊的欄位(F)移至右邊的檢定欄位(T)方框裡,變項GROUP則移至右下的群組(G)長框裡。
在「設定」標籤下選取項目(S)的選擇檢定裡,點選自訂檢定(C),然後在比較群組間的分佈長方框裡,勾選Kruskal-Wallis單因子變異數分析(k個樣本),再從多重比較(N)的下拉選單裡選擇所有成對。SPSS預設的顯著水準為0.05,若您想變更,可在選取項目(S)的檢定選項裡修改。完成後,點選視窗下方的執行。
經過上述的操作步驟,SPSS會輸出Kruskal-Wallis檢定和事後成對比較Dunn檢定的分析結果。Kruskal-Wallis檢定的結果和透過分析 » 無母數檢定 » 舊式對話框 » K個獨立樣本的操作方法所得到的結果是一樣的,不過舊式對話框下K個獨立樣本的分析沒有事後比較的選項。
從下表可看出,這個研究的樣本總數為18、自由度為2、H檢定統計量為9.892。因為獲得這檢定統計量的機率(0.007)小於事先設定的α水準0.05,所以H檢定統計量達到統計上顯著,可以拒絕虛無假設。綜合檢定的Kruskal-Wallis檢定指出,少年偏差行為者的居住環境會影響逃學天數。
SPSS還輸出一個盒形圖(盒鬚圖),顯示3個群組的相對位置。從下面的盒形圖可看出,原生家庭和團體家屋裡少年偏差行為者的逃學天數之分布狀態較相似,然而團體家屋裡少年偏差行為者的逃學天數明顯較少。相對地,寄養家庭裡少年偏差行為者的逃學天數不但較集中,且天數較多,但有一位逃學天數特別少的少年。
事後成對比較的Dunn檢定分析結果會出現在如下的「GROUP的配對比較」表裡,表格裡「檢定統計量」為公式(1)的分子,也就是兩群組平均等級之差值,「標準錯誤」則為公式(1)的分母,也就是平均等級差值的標準差。
表格裡「標準檢定統計量」就是各組成對比較的z檢定統計量,origin vs. foster為-1.732、origin vs. group home為1.407、foster vs. group home為3.140,這些數值皆和上面紙筆計算的結果相同。「顯著性」為獲得z檢定統計量的雙尾檢定機率(值),也和上面紙筆計算的結果相同,可藉由該欄和調整後α水準()的比較來評估研究結果。
此外,SPSS還輸出一「調整顯著性」欄,這欄是將「顯著性」欄的值乘以成對比較的組數後得到的機率值,可直接和原本設定的α水準相比較。換句話說,若調整顯著性的值等於或小於α水準,即達到統計上顯著,可拒絕虛無假設。從上表可看出,只有foster vs. group home這組達到統計上顯著(),代表寄養家庭和團體家屋的少年偏差行為者在逃學天數上存在顯著的差異。
因此,使用SPSS的Dunn檢定來評估成對事後比較的結果時,除了透過「顯著性」欄的值和調整後α水準(也就是)的比較之外,也可透過「調整顯著性」欄的機率值和原本設定的α水準相比較。不論是哪一種決策規則,都可得到相同的結果,您可依據個人的喜好來做選擇喔。
以上為本篇文章對Dunn檢定的介紹,希望透過本篇文章,您瞭解了Dunn檢定的使用時機、成對比較的運算方法,也學會了利用SPSS執行Dunn檢定的操作過程。
若您喜歡本篇文章,請將本網站加入書籤,作為您的學習資源,並持續回訪本網站喔!另外,您也可以在Facebook和Twitter上找到我們喲!
參考資料
Dunn, O. J. 1961. Multiple comparisons among means. Journal of the American Statistical Association, 56(293), 52-64. https://doi.org/10.2307/2282330
Dunn, O. J. 1964. Multiple comparisons using rank sums. Technometrics, 6(3), 241-252. https://doi.org/10.2307/1266041