行為和社會科學研究很常使用卡方獨立性檢定,既然稱為「獨立性」檢定,代表這種檢定方法適用在獨立樣本上,也就是隨機被抽取出來且各個群組都由不同的人所構成。但如果群組是由相同的人所構成的相依樣本(dependent sample),且想探討他們在一個2類別的名義尺度變項的回應上是否有所改變,則須使用 McNemar 檢定。關於獨立樣本和相依樣本差異的詳細說明,請參考獨立樣本 vs. 相依樣本。
McNemar 檢定類似於關聯樣本t檢定,同樣用在相依樣本上,通常是採用前後測或配對組的研究設計。兩種檢定的最大差別在於關聯樣本t檢定的依變項為等距或比率尺度的連續變項,而 McNemar 檢定的依變項為名義尺度的間斷變項,且只有2個類別。關於變項的測量尺度種類,請參考測量尺度的意義和分類。
下面內容將介紹 McNemar 檢定的使用時機,並舉例說明這個檢定的假設檢定過程,最後再示範運用 SPSS 執行 McNemar 檢定的操作方法。由於本篇文章為卡方檢定的延伸內容,建議您先閱讀卡方適合度檢定的假設檢定和卡方獨立性檢定的假設檢定,將有助於文章內容的理解喔!
McNemar 檢定的使用時機
McNemar 檢定(McNemar´s test)是用來評估2個關聯或相依的群組在一個2類別的名義尺度變項上是否有所不同的一種無母數檢定方法,有些中文翻譯成麥內瑪檢定。這個檢定最常用來探討研究參與者對研究測量的回應是否有改變,例如「通過」或「沒通過」測驗、「有」或「沒有」求助,也就是比較測量結果往一個方向改變的人數和測量結果往另一個方向改變的人數。
換句話說,McNemar 檢定的依變項為二分變項(dichotomous variable),即為2個類別的名義尺度變項,例如「是」和「否」、「有」和「沒有」、「增加」和「減少」。此外,McNemar 檢定適用的對象為2個相依的群組,可以是重複量數設計(也稱為前後測設計)或研究參與者配對組設計。
這個檢定必須滿足兩個相依群組的研究參與者在依變項的回應必須互斥,只能被歸類在2個類別裡的其中一個類別。例如要探討宣導短片的成效,研究參與者在觀看宣導短片前和觀看後分別進行一次測驗,測驗結果為「通過」或「不通過」,不論是觀看前或觀看後,每一位研究參與者的測驗結果只能被歸類至「通過」或「不通過」,而不能同時被歸類至「通過」和「不通過」。
因此,McNemar 檢定適用在2個關聯群組對一個二分變項測量結果的比較。如果依變項是超過2個類別的名義尺度變項、其他測量尺度的變項或研究參與者不是2個關聯或相依的群組,McNemar 檢定就不是一個合適的檢定方法,下面舉一個例子來說明這個檢定的假設檢定過程。
McNemar 檢定的範例解說
假設有一位社會工作者想探討宣導課程是否會改變親密伴侶受虐者的求助行為,她記錄了21位受虐者在參與宣導課程前的求助行為,宣導課程結束後的半年,再次紀錄了這21位參與者的求助行為。若求助行為的回應為「有」和「沒有」求助,表格的列為宣導課程前的求助行為,欄為宣導課程結束後的求助行為,這21位受虐者的列聯表資料如下:
後 | ||||
沒有 | 有 | 合計 | ||
前 | 沒有 | 4 | 10 | 14 |
有 | 2 | 5 | 7 | |
合計 | 6 | 15 | 21 |
由於宣導前後是相同的研究參與者,屬於2個相依的群組,而且依變項的求助行為是二分變項,若要瞭解宣導課程對求助行為的影響,McNemar 檢定為合適的檢定方法。如果顯著水準(α水準)為0.05,試問宣導課程對受虐者的求助行為是否有影響?
這個研究的目的在探討宣導課程是否會影響親密伴侶受虐者的求助行為,研究假設的虛無假設和對立假設分別如下:
- 虛無假設():宣導課程對親密伴侶受虐者的求助行為沒有影響。
- 對立假設():宣導課程對親密伴侶受虐者的求助行為有影響。
McNemar 檢定主要是在評估研究參與者對於依變項測量的回應是否有改變,以這個例子而言,宣導課程是否影響或改變了受虐者的求助行為。在上面的列聯表裡,可以看出行為改變的2個細格分別為「宣導前沒有但宣導後有」和「宣導前有但宣導後沒有」。若宣導課程沒有效果,這2個細格的觀察次數應該會差不多;若宣導課程有效果,「宣導前沒有但宣導後有」的觀察次數應該會遠大於「宣導前有但宣導後沒有」的觀察次數。
從上面的列聯表可以看到,「宣導前沒有但宣導後有」的觀察次數為10而「宣導前有但宣導後沒有」的觀察次數為2。把這2個觀察次數列出來後,期望次數為這2個觀察次數的平均數,也就是6,如下表。
沒有→有 | 有→沒有 | 合計 | |
---|---|---|---|
觀察次數 | 10 | 2 | 12 |
期望次數 | 6 | 6 | 12 |
從上表可看出 McNemar 檢定已經簡化成卡方適合度檢定,如果讓代表第個類別的觀察次數而代表第個類別的期望次數,卡方檢定統計量的計算公式為:
(1)
把上面表格裡的數值帶入公式裡,計算過程如下。如果您不清楚總和運算的方法,請參考社會統計常用的數學符號和運算。
因為只有「沒有→有」和「有→沒有」2個類別,所以自由度為。查詢卡方分配表,當α水準為0.05且自由度為1的時候,卡方臨界值為3.841。
最後,運用決策規則,比較卡方檢定統計量和卡方臨界值,因為,所以拒絕虛無假設。McNemar 檢定的分析結果指出,宣導課程對親密伴侶暴力受虐者的求助行為有影響。
除了利用公式(1)來計算檢定統計量之外,還可以直接利用「宣導前沒有但宣導後有」和「宣導前有但宣導後沒有」這2個代表改變的細格觀察次數來計算卡方檢定統計量。讓「宣導前沒有但宣導後有」的細格觀察次數為A而「宣導前有但宣導後沒有」的細格觀察次數為B,卡方檢定統計量的計算方法如下:
(2)
把上面「宣導前沒有但宣導後有」和「宣導前有但宣導後沒有」這2個細格的觀察次數帶入上面的公式(2),計算過程如下:
透過公式(2)得到的檢定統計量和利用公式(1)得到的檢定統計量是相同的,所以也會得到相同的分析結果,您可以選擇自己習慣或容易理解的公式來計算。不過當資料較多時,可以運用統計分析軟體來執行 McNemar 檢定分析,下面示範利用 SPSS 進行這個檢定的操作方法。
運用 SPSS 執行 McNemar 檢定
把上面例子的原始資料輸入至 SPSS 裡,讓研究參與者編號的變項名稱為 ID,共有21位參與者。宣導前求助行為的變項名稱為 BEFORE,編碼0代表沒有求助而1代表有求助;宣導後求助行為的變項名稱為 AFTER,編碼0代表沒有求助而編碼1代表有求助,資料輸入完成後如下圖。若您不清楚 SPSS 資料輸入方法,請參考SPSS操作環境和資料輸入。
利用 SPSS 執行 McNemar 檢定的方法有2種,一種是透過敘述統計裡交叉資料表的功能,另一種是透過無母數檢定裡2個相關樣本的功能,下面分別說明這2種操作方法。
❶ 敘述統計:交叉資料表
第1種方法為敘述統計裡交叉資料表的功能,點選功能表的分析 » 敘述統計 » 交叉資料表,帶出「交叉表」視窗。
在「交叉表」視窗裡,把宣導前求助行為 BEFORE 移至列(O)長框裡,宣導後求助行為 AFTER 移至欄(C)長框裡,完成後點選視窗最右側的統計量(S)。在「交叉資料表:統計量」視窗裡,勾選 McNemar,然後按下視窗下方的繼續(C)。回到「交叉表」視窗後,再按下確定。
經過上述的步驟,SPSS 會輸出2個表格,第1個為交叉資料表,第2個為 McNemar 檢定的分析結果。交叉資料表就是列聯表,藉由我們輸入的資料所製作出來的列聯表和上面例子的列聯表是一樣的。從輸出的列聯表可以看到,宣導前沒有求助但宣導後求助的觀察次數為10,而宣導前有求助但宣導後沒有求助的觀察次數為2。
SPSS 的 McNemar 檢定只會輸出檢定結果的機率(值),就是下表的 Exact Sig. (2-sided),不會輸出卡方檢定統計量。當評估分析結果時,比較這個值和事先設定的α水準,若值小於或等於α水準,可以拒絕虛無假設,接受對立假設;反之,保留虛無假設。
從上表可以看出值為0.039,而事先設定的α水準為0.05。因為,所以拒絕虛無假設。換句話說,McNemar 檢定的分析結果指出宣導課程對親密伴侶受虐者的求助行為有影響。
❷ 無母數檢定:2個相關樣本
另一種執行 McNemar 檢定的方法為無母數檢定裡2個相關樣本的功能,點選功能表的分析 » 無母數檢定 » 舊式對話框 » 2個相關樣本,帶出「兩個相關樣本檢定」視窗。
在「兩個相關樣本檢定」視窗裡,把變項 BEFORE 移到檢定配對(T)裡變數1的位置,變項 AFTER 移到變數2的位置,並在檢定類型長框裡勾選 McNemar。全部完成後,按下視窗下方的確定。
利用這個方法執行 McNemar 檢定,SPSS 同樣會輸出列聯表和檢定分析結果。檢定分析結果如下表,和利用第1個方法所得到的結果是一樣的。當要評估分析結果的時候,比較檢定結果的機率0.039和α水準0.05,因為,所以拒絕虛無假設。分析結果指出,宣導課程對親密伴侶受虐者的求助行為有影響。
不論是透過哪一種方法執行 McNemar 檢定,SPSS 都會輸出2個二分變項的列聯表和檢定分析的結果,您可以選擇自己習慣或喜歡的操作方式喔!
以上為本篇文章對 McNemar 檢定的介紹,希望透過本篇文章,您瞭解了 McNemar 檢定的使用時機和假設檢定,也學會了運用 SPSS 執行這個檢定的方法。如果您喜歡這篇文章,請將本網站加入書籤,並隨時回訪本網站喔!另外,也歡迎您追蹤本網站的 Facebook 和/或 X(Twitter)專頁喲!
如果您覺得本篇文章對您有幫助,歡迎您買杯珍奶給 Dr. Fish!小小珍奶,大大鼓勵,您的支持將給 Dr. Fish 更多撰寫優質文章的動力喔!
參考資料
Howell, D. C. (2012). Statistical methods for psychology. Wadsworth, Cengage Learning.