相依樣本(dependent samples)是很常用到的一種研究設計,利用相同的或配對的研究參與者,使得群組和群組間具有關聯性,可以從一個群組的參與者得知另一個群組參與者的資訊。因為群組間彼此關聯的特性,相依樣本也被稱為相關樣本、關聯樣本、配對樣本或成對樣本,而這個特性也是相依樣本和獨立樣本最主要的區別。關於相依樣本和獨立樣本差異的詳細說明,可以參考獨立樣本 vs. 相依樣本。
統計檢定可以區分為母數檢定(parametric tests)和無母數檢定(non-parametric tests)2大類型,而各個類別又包含許多種的統計檢定方法。兩個相依樣本比較的統計檢定方法也是如此,有母數檢定和無母數檢定的類型。下面將先說明母數檢定和無母數檢定的差異,再整理各個類別裡面2個相依樣本比較的統計檢定方法。
母數檢定 vs. 無母數檢定
統計檢定方法原則上可被劃分為2大類別:母數檢定和無母數檢定。母數檢定的使用大幅度地取決於母群體的特性或參數,樣本資料須滿足各個檢定方法要求的假設後才會讓分析結果更具可信度,例如獨立樣本t檢定要求2個樣本來自的2個母群體須為常態分配且母群體帶有相同的變異。
相反地,無母數檢定對於母群體特性或參數的要求相對地少,即便在不知道母群體分配和參數的情況下仍然可以使用,所以也稱為自由分配檢定(distribution-free tests)。最小化母群體特性要求的無母數檢定看起來似乎比母數檢定更好用,但是基於下面2個因素,在資料分析時研究人員仍會儘可能地使用母數檢定:
- 穩健的統計檢定:多數的母數檢定在基本假設沒有被嚴重違反的情況下,檢定的結果仍具有可信度,因此被視為穩健的(robust)統計檢定方法。
- 較佳的統計檢定力:母數檢定的統計檢定力(power)較無母數檢定來得高,也就是說,母數檢定較能夠偵測到自變項的效果,拒絕一個錯誤的虛無假設。
因此,雖然無母數檢定可在不清楚母群體的分配型態和參數的情況下執行,但考量到大多數的母數檢定可承受輕度或中度的假設違反且統計檢定力較高,所以母數檢定仍舊是較為廣泛使用的統計檢定類型。
兩個相依樣本比較的統計檢定方法
當要比較2個相依樣本的時候,通常會依據依變項的測量尺度來選擇統計檢定方法。兩個相依樣本比較的統計檢定方法也可區分為母數檢定和無母數檢定,這2種檢定類型各自涵蓋的統計檢定方法和適用的資料測量尺度可用下表呈現:
類型 | 統計檢定 | 適用測量尺度 |
---|---|---|
母數檢定 | 關聯樣本 t 檢定 | 等距、比率 |
無母數檢定 | 符號檢定 | 次序、等距、比率 |
Wilcoxon 配對符號等級檢定 | 次序、等距、比率 | |
McNemar 檢定 | 2類別的名義尺度 | |
邊際同質性檢定 | 超過2類別的名義尺度 |
從上表可以看出,2個相依樣本比較的統計檢定方法會隨著依變項測量尺度的不同而有所不同,除了邊際同質性檢定之外,其餘的檢定方法都有相關文章做詳細的介紹。下面將簡單地說明上表的各個統計檢定,如果您想深入瞭解其中一個統計檢定方法,可以點選說明裡的相關文章連結喔!
關聯樣本t檢定
關聯樣本t檢定(correlated-samples t-test)是2個相依樣本比較的統計檢定裡唯一的一種母數檢定,依變項的測量尺度必需為等距或比率尺度,用來檢驗2個相依樣本分別來自的母群體平均數是否相等。因為2個樣本具有關聯性,所以不使用各個樣本的原始資料,而是利用樣本配對的差值分數來計算t檢定統計量,把原本為2個樣本的分析簡化成單一樣本的分析方法。
由於關聯樣本t檢定為母數檢定,所以資料須滿足特定的假設,包括樣本來自的母群體分數須呈現常態分配和依變項需至少為等距尺度的資料。如果樣本資料不符合這些假設,可改使用2個相依樣本比較的無母數檢定方法。關於關聯樣本t檢定的詳細說明和 SPSS 的操作方法,可以參考關聯樣本t檢定的假設檢定。
符號檢定
符號檢定(sign test)是2個相依樣本比較的一種無母數檢定,依變項需至少為次序尺度,用來比較2個相依樣本是否有顯著的不同。不像利用樣本配對的差值分數來進行分析的關聯樣本t檢定,符號檢定只考量配對的數值是增加或減少,分別給予正號和負號,然後計算出在次試驗裡獲得正號出現次數或負號出現次數的機率。
符號檢定可直接計算出獲得研究結果的機率(值),再將這機率與事先設定的顯著水準(α水準)比較來評估分析的結果,操作過程很簡單。此外,符號檢定屬於無母數檢定,所以對母群體的分布型態沒有特別的要求,適用在關聯樣本t檢定的假設受到嚴重違反的情況下。關於符號檢定的詳細說明和 SPSS 的操作方法,可以參考符號檢定:使用二項分配進行假設檢定。
Wilcoxon 配對符號等級檢定
Wilcoxon 配對符號等級檢定(Wilcoxon matched-pairs signed-rank test)是2個相依樣本比較的一種無母數檢定,依變項需至少為次序尺度,用來比較2個相依樣本是否有顯著的不同。這個檢定和符號檢定相當地類似,主要的差別在於符號檢定只考慮配對數值的增加或減少,而 Wilcoxon 配對符號等級檢定進一步考量了配對數值改變的大小,所以比符號檢定更具敏感度。
Wilcoxon 配對符號等級檢定為無母數檢定,因此對母群體的特性沒有特別的要求,通常用在關聯樣本t檢定的假設受到嚴重違反的時候。雖然 Wilcoxon 配對符號等級檢定比符號檢定更具敏感度,但沒有母數檢定的關聯樣本t檢定那麼地強大。關於 Wilcoxon 配對符號等級檢定的詳細說明和 SPSS 的操作方法,可以參考 Wilcoxon配對符號等級檢定的假設檢定。
McNemar 檢定
McNemar 檢定(McNemar test)為2個相依樣本比較的一種無母數檢定,依變項為名義尺度,用來探討研究參與者在依變項的回應上是否有所改變。McNemar 檢定的依變項為二分變項,也就是2類別的名義尺度變項,例如「有」和「沒有」、「是」和「不是」、「合格」和「不合格」,比較在依變項的回應上往一個方向改變(例如有 → 沒有)的人數和往另一個方向改變(例如沒有 → 有)的人數是否有顯著的不同。
因為 McNemar 檢定為無母數檢定,所以對母群體的特性沒有特別的要求,不過2個相依樣本的研究參與者在依變項的回應上必須互斥。也就是說,不論是在第1次的測量或第2次的測量,每位參與者的回應只能被歸類至2個類別的其中一個類別。若是超過2個類別的名義尺度變項,就不適用 McNemar 檢定,可改使用下面提到的邊際同質性檢定。關於 McNemar 檢定的詳細說明和 SPSS 的操作方法,請參考 McNemar檢定的使用時機和範例解說。
邊際同質性檢定
邊際同質性檢定(marginal homogeneity test)為2個相依樣本比較的無母數檢定,依變項為名義尺度,用來比較2個名義尺度依變項的邊際分配是否隨著測量時間的不同而有顯著的改變。邊際同質性檢定可視為 McNemar 檢定的延伸,同樣用來探討研究參與者在依變項的回應上是否有改變,只是 McNemar 檢定的依變項為2個類別的名義尺度變項,而邊際同質性檢定的依變項為超過2個類別的名義尺度變項。
邊際同質性檢定為無母數檢定,所以對母群體的分配型態和參數沒有特別的要求,但和 McNemar 檢定一樣,每位研究參與者對依變項的回應只能被歸類至其中一個類別。邊際同質性檢定的檢定統計量計算過程較複雜,涉及矩陣代數,因此通常會運用統計分析軟體來取得研究結果的機率(值),再跟顯著水準(α水準)比較,評估是否拒絕虛無假設。
若利用 SPSS 來執行2個相依樣本的邊際同質性檢定,可以點選功能表的分析 » 無母數檢定 » 舊式對話框 » 2個相關樣本,接著在「兩個相關樣本檢定」視窗裡,把2個不同測量時間點的名義尺度依變項分別移至檢定配對(T)的變數1和變數2的位置,再勾選檢定類型方框裡的邊際同質性(H)即可。關於 SPSS 的操作方法,可以參考 SPSS操作環境和資料輸入。
在 SPSS 輸出的邊際同質性分析結果表的最下方可以看到值,運用決策規則,比較這個值和事先設定的α水準,如果,可以拒絕虛無假設;如果,保留虛無假設。
以上為本篇文章對2個相依樣本比較的統計檢定方法的整理,希望透過本篇文章,您理解了母數檢定和無母數檢定的差異,也知道了比較2個相依樣本時可使用的統計檢定方法。如果您喜歡本篇文章,請將本網站加入書籤,並隨時回訪本網站喔!另外,也歡迎您追蹤本網站的 Facebook 和/或 X(Twitter)專頁喲!
如果您覺得本篇文章對您有幫助,歡迎買杯珍奶給 Dr. Fish!小小珍奶,大大鼓勵,您的支持將給 Dr. Fish 更多撰寫優質文章的動力喔!