🐟 請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址
Welch t 檢定:變異數不相等時的獨立樣本檢定
獨立樣本t檢定的執行要求資料滿足常態分配和變異數同質性的假設,其中第2個假設的變異數同質性是指2個樣本來自的母群體帶有相同的變異,最常透過 Levene 檢定來檢驗。若檢驗結果顯示2樣本的變異數不相等,Welch t 檢定會是個比獨立樣本t檢定更合適的統計檢定方法。
當資料滿足變異數同質性假設的時候,通常會用合併變異數估計值來計算t檢定統計量。但在2個樣本的變異數不相等的情況下,就須分別考量2個樣本的變異數,並修正自由度後,再評估2個獨立樣本平均數比較的分析結果。
下面將先簡單回顧2樣本變異數相等時的t檢定統計量計算方法,再介紹變異數不相等時的做法,然後舉一例子說明 Welch t 檢定的假設檢定,最後示範利用 SPSS 執行 Welch t 檢定的操作方法。由於本篇文章為獨立樣本t檢定的延伸內容,建議先閱讀獨立樣本t檢定的假設檢定和 Levene 檢定:檢驗樣本間變異數是否相等的方法,將有助於下面內容的理解喔!
變異數同質性的獨立樣本t檢定
獨立樣本t檢定適用在2個群組或樣本平均數的比較,且母群體變異數未知的時候。因為這個檢定屬於母數檢定,所以樣本來自的母群體須滿足特定假設,具體來說,抽樣分配為常態分配和變異數同質性(homogeneity of variance)等2個假設。
變異數同質性是指2個樣本來自的母群體變異相同,一般多會利用 Levene 檢定來檢驗這個假設,而這個檢定也是目前大多數的統計分析軟體預設的檢定方法。當檢定結果指出2樣本的變異數相同,即資料滿足變異數同質性假設的時候,獨立樣本t檢定的t檢定統計量可用合併變異數估計值(pooled variance estimate)來計算,公式如下:
(1)
上面公式的分母 為獨立樣本t檢定的自由度,由於樣本變異數的計算是基於離差平方和,所以1個樣本變異數的計算會失去1個自由度。因為獨立樣本t檢定要計算2個樣本的變異數,所以會失去2個自由度。
利用公式(1)的合併變異數估計值,讓 、
分別代表第1個樣本的平均數和第2個樣本的平均數,獨立樣本t檢定的t檢定統計量公式如下:
(2)
上面的公式(2)就是2個樣本變異數相同時的t檢定統計量公式,數值計算出來後查詢t分配表,依據顯著水準(α 水準)、檢定方向性的有無和自由度找到t臨界值後,再透過決策規則評估分析結果。更詳細的獨立樣本t檢定的介紹,請參考獨立樣本t檢定的假設檢定。
變異數異質性的 Welch t 檢定
獨立樣本t檢定使用合併變異數估計值的原因在於2樣本變異數相等的假設,但當 Levene 檢定的結果指出2樣本的變異數不相等,即資料為變異數異質性(heterogeneity of variance)的時候,合併變異數估計值已經失去意義。此時,應分別考量每個樣本的變異數,若讓 代表變異數不相等的t檢定統計量,
值的公式如下:
(3)
不過公式(3)的 值已不是自由度
的t分配型態,為了讓它能夠帶有t分配的型態,須修改自由度(Welch, 1938)。若讓
代表
值的自由度,
的公式如下:
(4)
這個自由度會等於或大於 和
的較小值,且小於或等於
。另外,這個自由度通常是小數,當要查詢t分配表時,習慣上會四捨五入到最近的整數。依據這個自由度、顯著水準和檢定方向性的有無,查詢t分配表,找到臨界值後和公式(3)的
值相比較,再透過決策規則評估分析結果。
因此,Welch t 檢定是用來比較2個群組或樣本平均數且資料為變異數異質性的一種統計檢定方法,t檢定統計量和自由度的計算方法皆不同於獨立樣本t檢定,下面舉個例子來說明 Welch t 檢定的假設檢定過程。
Welch t 檢定的例子
假設有一位產品行銷部的主管想探討不同的訓練課程對銷售業務人員業績的影響,該部門有20位銷售業務人員,他隨機分配10位人員至A訓練課程,另外10位人員至B訓練課程。這位主管在訓練課程結束的2個月後查看這20位業務人員的銷售業績,他們的產品銷售數量如下表。若 α 水準為0.05、雙尾檢定,試問不同的訓練課程是否對業務人員的銷售業績有影響?

這位主管想探討不同的訓練課程是否會「影響」業務人員的銷售業績,屬於沒有方向性的研究假設,所以對立假設和虛無假設分別如下:
- 對立假設(
):A訓練課程業務人員和B訓練課程業務人員的產品銷售業績有所不同,也就是他們是來自於
的隨機樣本。
- 虛無假設(
):A訓練課程業務人員和B訓練課程業務人員的產品銷售業績沒有不同,也就是他們是來自於
的隨機樣本。
這個研究利用2組完全不同的銷售業務人員來探討訓練課程對產品銷售量的影響,屬於2個獨立群組的平均數比較。在決定運用哪一種統計檢定之前,先利用 Levene 檢定來檢驗2樣本的變異數是否相等。利用〈Levene 檢定:檢驗樣本間變異數是否相等的方法〉裡說明的方式進行 Levene 檢定,t值為-2.332而t臨界值為2.101。由於
,檢定結果顯示2樣本的變異數不相等。
因為2樣本的變異數不相等,也就是資料沒有滿足變異數同質性的假設,所以這個研究須使用 Welch t 檢定來分析。為了求得 Welch t 檢定的 值和自由度
,可利用如下的表格將所需的資料先計算出來。

上表中 指數值總和、
指樣本個數、
指平均數,由於 Welch t 檢定的
值和自由度
的計算須用到離差平方和,所以先利用上表中的數值來計算2個樣本的離差平方和,計算過程如下:
計算結果得到 為64而
為174,若您不清楚總和運算的方法,可以參考社會統計常用的基本數學符號和運算。然後將這2個數值、樣本個數和平均數帶入上面的公式(3)來計算
值,計算過程中無法整除的數值四捨五入到小數點後第5位,最後的結果則四捨五入到小數點後第3位,計算過程如下:
計算結果指出 值為-3.690,接下來同樣利用2樣本的離差平方和、樣本個數和平均數來計算自由度
,計算過程中無法整除的數值四捨五入到小數點後第5位,最後的數值則四捨五入到小數點後第3位,計算過程如下:
為了使用t分配表,把上面的自由度四捨五入至最近的整數變成15。當顯著水準為0.05、自由度為15、雙尾檢定時,t臨界值為2.131。

最後,比較 值和t臨界值,因為
,所以拒絕虛無假設,接受對立假設。Welch t 檢定的結果指出A訓練課程業務人員和B訓練課程業務人員的產品銷售業績有所不同,從2組的平均數來看,B訓練課程業務人員的產品銷售業績優於A訓練課程業務人員。
Welch t 檢定的 值和自由度的計算較獨立樣本t檢定麻煩,當資料變得龐大的時候,計算需要更多時間,因此除了像這裡的示範說明外,幾乎都是利用統計分析軟體取得分析結果。下面示範利用 SPSS 執行Welch t 檢定的操作過程。
運用 SPSS 執行 Welch t 檢定
將上面例子的資料輸入至 SPSS 資料編輯器裡,因為是2個獨立群組,所以共有20位研究參與者。資料裡有3個變項,ID 為銷售業務人員的編號、GROUP 為訓練課程的類別(編碼1為A訓練課程而編碼2為B訓練課程)、SELL 為產品銷售量。關於 SPSS 資料輸入的方法,請參考 SPSS操作環境和資料輸入。

資料輸入完成後,點選 SPSS 功能表的分析 » 比較平均數 » 獨立樣本T檢定,帶出「獨立樣本T檢定」視窗。

在「獨立樣本T檢定」視窗裡,將 SELL 移至檢定變數(T)裡而 GROUP 至分組變數(G)裡,再點選定義群組(D)。在「定義群組」小視窗裡,選擇使用指定的值(U),並輸入2個群組在 SPSS 裡的編碼值至群組1和群組2的長框裡,完成後按下繼續(C)。回到「獨立樣本T檢定」視窗後,再按下視窗下方的確定。

經過上述的步驟,SPSS 會輸出「群組統計量」和「獨立樣本檢定」表。群組統計量表呈現出2個群組的描述統計量:各個群組的樣本個數、平均數、標準差和標準誤。從下表可以看出,參與A訓練課程的業務人員為10人、平均產品銷售數量為10且標準差為2.667;參與B訓練課程的業務人員為10人、平均產品銷售數量為16且標準差為4.397。

獨立樣本檢定表為2個獨立群組平均數比較的檢定結果,包含變異數同質性檢驗的 Levene 檢定結果。從下表可以看到,Levene 檢定指出2個群組的變異數不相等,,
。因為資料沒有滿足變異數同質性假設,所以要看 Equal variances not assumed 那一列的結果,也就是 Welch t 檢定的結果。

Welch t 檢定結果指出t檢定統計量為-3.690、自由度為14.832且雙尾檢定的 p 值為0.002。因為 p 值小於 α 水準(0.05),所以拒絕虛無假設,接受對立假設。Welch t 檢定結果指出,A訓練課程業務人員的產品銷售量明顯不同於B訓練課程業務人員的產品銷售量,且從上面群組統計量表的結果可以知道B訓練課程業務人員的平均產品銷售量大於A訓練課程業人員的平均產品銷售量。
從上面的說明可以發現運用 SPSS 執行 Welch t 檢定和獨立樣本t檢定的操作過程是一樣的,最後是藉由 Levene 檢定的結果來決定查看「符合相等變異數假設」或「不符合相等變異數假設」的t檢定結果,而「不符合相等變異數假設」的結果即為 Welch t 檢定的結果。
以上為本篇文章對 Welch t 檢定的介紹,希望透過本篇文章,您瞭解了 Welch t 檢定的使用時機和計算原理,也學會了利用 SPSS 執行這個檢定的方法。若您喜歡本篇文章,請將本網站加入書籤,並隨時回訪本網站喔!另外,也歡迎您追蹤本網站的 Facebook 和/或 X(Twitter)專頁喲!
如果您覺得本篇文章對您有幫助,歡迎買杯珍奶給 Dr. Fish!小小珍奶,大大鼓勵,您的支持將給 Dr. Fish 更多撰寫優質文章的動力喔!
參考資料
Welch, B. L. (1938). The significance of the difference between two means when the population variances are unequal. Biometrika, 29, 350-362. https://doi.org/10.2307/2332010