Skip to content

合作邀約 email: dr.fish@drfishstats.com

  • Facebook
  • X
site icon of Dr. Fish

Dr. Fish 漫游社會統計

魚博士的專業漫談和課後隨筆

  • Home
  • 關於Dr. Fish
  • 統計基礎
    • 入門概念
    • 圖形繪製
    • 描述統計
    • 相關
    • 線性迴歸
  • 統計進階
    • 推論統計
    • 統計檢定
      • 相關係數
      • 迴歸
      • 平均數比較
      • 無母數檢定
  • EXCEL系列
    • 資料管理
    • 圖形繪製
      • 匯出SPSS資料至Excel並繪製盒形圖
      • 如何使用Excel製作Q-Q plot
      • 如何使用Excel繪製加上誤差線的長條圖
    • 描述統計
      • 如何使用Excel執行次數分配
      • 如何使用Excel樞紐分析表製作次數分配表
      • 如何使用Excel計算偏態和峰態
      • 如何使用Excel尋找常態曲線下面積或分數
      • 如何使用Excel一次取得描述性統計量
      • 如何使用Excel計算共變異數
      • 如何使用Excel取得皮爾森積差相關係數
      • 如何使用Excel製作列聯表
    • 推論統計
      • 如何使用Excel計算信賴區間
      • 如何使用Excel執行符號檢定
      • 如何使用Excel執行單一樣本z檢定和t檢定
      • 如何使用Excel執行獨立樣本t檢定
      • 如何使用 Excel 執行 Levene 檢定
      • 如何使用Excel執行關聯樣本t檢定
      • 如何使用Excel執行單因子變異數分析
      • 如何使用Excel執行簡單線性迴歸
      • 如何使用Excel計算最小平方迴歸線的預測區間
      • 如何使用Excel執行卡方獨立性檢定
  • 下課後
    • 生活
    • 旅遊
      • 日本
    • 美食
    • 攝影
  • 聯絡Dr. Fish
  • Home
  • 推論統計
  • 統計檢定
  • 平均數比較
  • Welch t 檢定:變異數不相等時的獨立樣本檢定

🐟 請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址

Welch t 檢定:變異數不相等時的獨立樣本檢定

Posted on 2025-05-142025-05-14 By Dr. Fish 在〈Welch t 檢定:變異數不相等時的獨立樣本檢定〉中尚無留言
平均數比較

獨立樣本t檢定的執行要求資料滿足常態分配和變異數同質性的假設,其中第2個假設的變異數同質性是指2個樣本來自的母群體帶有相同的變異,最常透過 Levene 檢定來檢驗。若檢驗結果顯示2樣本的變異數不相等,Welch t 檢定會是個比獨立樣本t檢定更合適的統計檢定方法。

當資料滿足變異數同質性假設的時候,通常會用合併變異數估計值來計算t檢定統計量。但在2個樣本的變異數不相等的情況下,就須分別考量2個樣本的變異數,並修正自由度後,再評估2個獨立樣本平均數比較的分析結果。

下面將先簡單回顧2樣本變異數相等時的t檢定統計量計算方法,再介紹變異數不相等時的做法,然後舉一例子說明 Welch t 檢定的假設檢定,最後示範利用 SPSS 執行 Welch t 檢定的操作方法。由於本篇文章為獨立樣本t檢定的延伸內容,建議先閱讀獨立樣本t檢定的假設檢定和 Levene 檢定:檢驗樣本間變異數是否相等的方法,將有助於下面內容的理解喔!

  • 變異數同質性的獨立樣本t檢定
  • 變異數異質性的 Welch t 檢定
  • Welch t 檢定的例子
  • 運用 SPSS 執行 Welch t 檢定

變異數同質性的獨立樣本t檢定

獨立樣本t檢定適用在2個群組或樣本平均數的比較,且母群體變異數未知的時候。因為這個檢定屬於母數檢定,所以樣本來自的母群體須滿足特定假設,具體來說,抽樣分配為常態分配和變異數同質性(homogeneity of variance)等2個假設。

變異數同質性是指2個樣本來自的母群體變異相同,一般多會利用 Levene 檢定來檢驗這個假設,而這個檢定也是目前大多數的統計分析軟體預設的檢定方法。當檢定結果指出2樣本的變異數相同,即資料滿足變異數同質性假設的時候,獨立樣本t檢定的t檢定統計量可用合併變異數估計值(pooled variance estimate)來計算,公式如下:

(1)   \begin{align*}s_p^2 &= \frac {(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2} \\[5pt]&= \frac {SS_1+SS_2}{n_1+n_2-2}\end{align*}

    \begin{equation*}\begin{CJK*}{UTF8}{bsmi}\begin{align*}s_p^2 &= \text {合併變異數估計值} \\n_1 &= \text {第1個樣本的個數} \\n_2 &= \text {第2個樣本的個數} \\s_1^2 &= \text {第1個樣本的變異數} \\s_2^2 &= \text {第2個樣本的變異數} \\SS_1 &= \text {第1個樣本的離差平方和} \\SS_2 &= \text {第2個樣本的離差平方和}\end{align*}\end{CJK*}\end{equation*}

上面公式的分母 n_1+n_2-2 為獨立樣本t檢定的自由度,由於樣本變異數的計算是基於離差平方和,所以1個樣本變異數的計算會失去1個自由度。因為獨立樣本t檢定要計算2個樣本的變異數,所以會失去2個自由度。

利用公式(1)的合併變異數估計值,讓 \overline X_1、\overline X_2 分別代表第1個樣本的平均數和第2個樣本的平均數,獨立樣本t檢定的t檢定統計量公式如下:

(2)   \begin{equation*}t = \frac {\overline X_1-\overline X_2}{\sqrt {s_p^2 \left ( \dfrac {1}{n_1}+\dfrac {1}{n_2} \right )}}\end{equation*}

上面的公式(2)就是2個樣本變異數相同時的t檢定統計量公式,數值計算出來後查詢t分配表,依據顯著水準(α 水準)、檢定方向性的有無和自由度找到t臨界值後,再透過決策規則評估分析結果。更詳細的獨立樣本t檢定的介紹,請參考獨立樣本t檢定的假設檢定。

變異數異質性的 Welch t 檢定

獨立樣本t檢定使用合併變異數估計值的原因在於2樣本變異數相等的假設,但當 Levene 檢定的結果指出2樣本的變異數不相等,即資料為變異數異質性(heterogeneity of variance)的時候,合併變異數估計值已經失去意義。此時,應分別考量每個樣本的變異數,若讓 t' 代表變異數不相等的t檢定統計量,t' 值的公式如下:

(3)   \begin{align*}t' &= \frac {\overline X_1-\overline X_2}{\sqrt {\dfrac {s_1^2}{n_1}+\dfrac {s_2^2}{n_2}}} \\[5pt]&= \frac {\overline X_1-\overline X_2}{\sqrt {\left [ \dfrac {1}{n_1} \left ( \dfrac {SS_1}{n_1-1} \right ) \right ]+\left [ \dfrac {1}{n_2} \left ( \dfrac {SS_2}{n_2-1} \right ) \right ]}}\end{align*}

不過公式(3)的 t' 值已不是自由度 n_1+n_2-2 的t分配型態,為了讓它能夠帶有t分配的型態,須修改自由度(Welch, 1938)。若讓 df' 代表 t' 值的自由度,df' 的公式如下:

(4)   \begin{align*}df' &= \frac {\left ( \dfrac {s_1^2}{n_1}+\dfrac {s_2^2}{n_2} \right )^2}{\dfrac {\left ( \dfrac {s_1^2}{n_1} \right )^2}{n_1-1}+\dfrac {\left ( \dfrac {s_2^2}{n_2} \right )^2}{n_2-1}} \\[10pt]&= \frac {\left [ \dfrac {1}{n_1} \left ( \dfrac {SS_1}{n_1-1} \right )+\dfrac {1}{n_2} \left ( \dfrac {SS_2}{n_2-1} \right ) \right ]^2}{\dfrac {\left [ \dfrac {1}{n_1} \left ( \dfrac {SS_1}{n_1-1} \right ) \right]^2}{n_1-1}+\dfrac {\left [ \dfrac {1}{n_2} \left (\dfrac {SS_2}{n_2-1} \right ) \right ]^2}{n_2-1}}\end{align*}

這個自由度會等於或大於 n_1-1 和 n_2-1 的較小值,且小於或等於 n_1+n_2-2。另外,這個自由度通常是小數,當要查詢t分配表時,習慣上會四捨五入到最近的整數。依據這個自由度、顯著水準和檢定方向性的有無,查詢t分配表,找到臨界值後和公式(3)的 t' 值相比較,再透過決策規則評估分析結果。

因此,Welch t 檢定是用來比較2個群組或樣本平均數且資料為變異數異質性的一種統計檢定方法,t檢定統計量和自由度的計算方法皆不同於獨立樣本t檢定,下面舉個例子來說明 Welch t 檢定的假設檢定過程。

Welch t 檢定的例子

假設有一位產品行銷部的主管想探討不同的訓練課程對銷售業務人員業績的影響,該部門有20位銷售業務人員,他隨機分配10位人員至A訓練課程,另外10位人員至B訓練課程。這位主管在訓練課程結束的2個月後查看這20位業務人員的銷售業績,他們的產品銷售數量如下表。若 α 水準為0.05、雙尾檢定,試問不同的訓練課程是否對業務人員的銷售業績有影響?

data of Welch t-test

這位主管想探討不同的訓練課程是否會「影響」業務人員的銷售業績,屬於沒有方向性的研究假設,所以對立假設和虛無假設分別如下:

  • 對立假設(H_1):A訓練課程業務人員和B訓練課程業務人員的產品銷售業績有所不同,也就是他們是來自於 \mu_1 \neq \mu_2 的隨機樣本。
  • 虛無假設(H_0):A訓練課程業務人員和B訓練課程業務人員的產品銷售業績沒有不同,也就是他們是來自於 \mu_1 = \mu_2 的隨機樣本。

這個研究利用2組完全不同的銷售業務人員來探討訓練課程對產品銷售量的影響,屬於2個獨立群組的平均數比較。在決定運用哪一種統計檢定之前,先利用 Levene 檢定來檢驗2樣本的變異數是否相等。利用〈Levene 檢定:檢驗樣本間變異數是否相等的方法〉裡說明的方式進行 Levene 檢定,t值為-2.332而t臨界值為\pm2.101。由於 |-2.332|>|\pm 2.101|,檢定結果顯示2樣本的變異數不相等。

因為2樣本的變異數不相等,也就是資料沒有滿足變異數同質性的假設,所以這個研究須使用 Welch t 檢定來分析。為了求得 Welch t 檢定的 t' 值和自由度 df',可利用如下的表格將所需的資料先計算出來。

calculation of Welch t-test data

上表中 \sum 指數值總和、n 指樣本個數、\overline X 指平均數,由於 Welch t 檢定的 t' 值和自由度 df' 的計算須用到離差平方和,所以先利用上表中的數值來計算2個樣本的離差平方和,計算過程如下:

    \begin{align*}SS_1 &= \sum (X_1-\overline X_1)^2 = \sum X_1^2-\frac {(\sum X_1)^2}{n_1} = 1064-\frac {100^2}{10} = 64 \\[5pt]SS_2 &= \sum (X_2-\overline X_2)^2 = \sum X_2^2-\frac {(\sum X_2)^2}{n_2} = 2734-\frac {160^2}{10} = 174\end{align*}

計算結果得到 SS_1 為64而 SS_2 為174,若您不清楚總和運算的方法,可以參考社會統計常用的基本數學符號和運算。然後將這2個數值、樣本個數和平均數帶入上面的公式(3)來計算 t' 值,計算過程中無法整除的數值四捨五入到小數點後第5位,最後的結果則四捨五入到小數點後第3位,計算過程如下:

    \begin{align*}t' &= \frac {\overline X_1-\overline X_2}{\sqrt {\left [ \dfrac {1}{n_1} \left ( \dfrac {SS_1}{n_1-1} \right ) \right ]+\left [ \dfrac {1}{n_2} \left ( \dfrac {SS_2}{n_2-1} \right ) \right ]}} \\[5pt]&= \frac {10-16}{\sqrt {\left [ \dfrac {1}{10} \left ( \dfrac {64}{10-1} \right ) \right ]+\left [ \dfrac {1}{10} \left ( \dfrac {174}{10-1} \right ) \right ]}} \\[5pt]&= \frac {-6}{\sqrt {0.71111+1.93333}} \\[5pt]&\approx -3.690\end{align*}

計算結果指出 t' 值為-3.690,接下來同樣利用2樣本的離差平方和、樣本個數和平均數來計算自由度 df',計算過程中無法整除的數值四捨五入到小數點後第5位,最後的數值則四捨五入到小數點後第3位,計算過程如下:

    \begin{align*}df' &= \frac {\left [ \dfrac {1}{n_1} \left ( \dfrac {SS_1}{n_1-1} \right )+\dfrac {1}{n_2} \left ( \dfrac {SS_2}{n_2-1} \right ) \right ]^2}{\dfrac {\left [ \dfrac {1}{n_1} \left ( \dfrac {SS_1}{n_1-1} \right ) \right]^2}{n_1-1}+\dfrac {\left [ \dfrac {1}{n_2} \left (\dfrac {SS_2}{n_2-1} \right ) \right ]^2}{n_2-1}} \\[5pt]&=\frac {\left [ \dfrac {1}{10} \left ( \dfrac {64}{10-1} \right )+\dfrac {1}{10} \left ( \dfrac {174}{10-1} \right ) \right ]^2}{\dfrac {\left [ \dfrac {1}{10} \left ( \dfrac {64}{10-1} \right ) \right]^2}{10-1}+\dfrac {\left [ \dfrac {1}{10} \left (\dfrac {174}{10-1} \right ) \right ]^2}{10-1}} \\[5pt]&= \frac {(0.71111+1.93333)^2}{0.05619+0.41531} \\[5pt]&\approx 14.832\end{align*}

為了使用t分配表,把上面的自由度四捨五入至最近的整數變成15。當顯著水準為0.05、自由度為15、雙尾檢定時,t臨界值為\pm2.131。

critical value of t with alpha 0.05 and df 15

最後,比較 t' 值和t臨界值,因為 |-3.690| > |\pm 2.131|,所以拒絕虛無假設,接受對立假設。Welch t 檢定的結果指出A訓練課程業務人員和B訓練課程業務人員的產品銷售業績有所不同,從2組的平均數來看,B訓練課程業務人員的產品銷售業績優於A訓練課程業務人員。

Welch t 檢定的 t' 值和自由度的計算較獨立樣本t檢定麻煩,當資料變得龐大的時候,計算需要更多時間,因此除了像這裡的示範說明外,幾乎都是利用統計分析軟體取得分析結果。下面示範利用 SPSS 執行Welch t 檢定的操作過程。

運用 SPSS 執行 Welch t 檢定

將上面例子的資料輸入至 SPSS 資料編輯器裡,因為是2個獨立群組,所以共有20位研究參與者。資料裡有3個變項,ID 為銷售業務人員的編號、GROUP 為訓練課程的類別(編碼1為A訓練課程而編碼2為B訓練課程)、SELL 為產品銷售量。關於 SPSS 資料輸入的方法,請參考 SPSS操作環境和資料輸入。

spss data of Welch t-test

資料輸入完成後,點選 SPSS 功能表的分析 » 比較平均數 » 獨立樣本T檢定,帶出「獨立樣本T檢定」視窗。

spss menu of Welch t-test

在「獨立樣本T檢定」視窗裡,將 SELL 移至檢定變數(T)裡而 GROUP 至分組變數(G)裡,再點選定義群組(D)。在「定義群組」小視窗裡,選擇使用指定的值(U),並輸入2個群組在 SPSS 裡的編碼值至群組1和群組2的長框裡,完成後按下繼續(C)。回到「獨立樣本T檢定」視窗後,再按下視窗下方的確定。

spss dialog box of independent samples t-test (Welch t-test)

經過上述的步驟,SPSS 會輸出「群組統計量」和「獨立樣本檢定」表。群組統計量表呈現出2個群組的描述統計量:各個群組的樣本個數、平均數、標準差和標準誤。從下表可以看出,參與A訓練課程的業務人員為10人、平均產品銷售數量為10且標準差為2.667;參與B訓練課程的業務人員為10人、平均產品銷售數量為16且標準差為4.397。

spss output of group statistics for independent samples t-test (Welch t-test)

獨立樣本檢定表為2個獨立群組平均數比較的檢定結果,包含變異數同質性檢驗的 Levene 檢定結果。從下表可以看到,Levene 檢定指出2個群組的變異數不相等,F(1, 18) = 5.440,p<.05。因為資料沒有滿足變異數同質性假設,所以要看 Equal variances not assumed 那一列的結果,也就是 Welch t 檢定的結果。

spss output of independent samples t-test (Welch t-test)

Welch t 檢定結果指出t檢定統計量為-3.690、自由度為14.832且雙尾檢定的 p 值為0.002。因為 p 值小於 α 水準(0.05),所以拒絕虛無假設,接受對立假設。Welch t 檢定結果指出,A訓練課程業務人員的產品銷售量明顯不同於B訓練課程業務人員的產品銷售量,且從上面群組統計量表的結果可以知道B訓練課程業務人員的平均產品銷售量大於A訓練課程業人員的平均產品銷售量。

從上面的說明可以發現運用 SPSS 執行 Welch t 檢定和獨立樣本t檢定的操作過程是一樣的,最後是藉由 Levene 檢定的結果來決定查看「符合相等變異數假設」或「不符合相等變異數假設」的t檢定結果,而「不符合相等變異數假設」的結果即為 Welch t 檢定的結果。

以上為本篇文章對 Welch t 檢定的介紹,希望透過本篇文章,您瞭解了 Welch t 檢定的使用時機和計算原理,也學會了利用 SPSS 執行這個檢定的方法。若您喜歡本篇文章,請將本網站加入書籤,並隨時回訪本網站喔!另外,也歡迎您追蹤本網站的 Facebook 和/或 X(Twitter)專頁喲!

如果您覺得本篇文章對您有幫助,歡迎買杯珍奶給 Dr. Fish!小小珍奶,大大鼓勵,您的支持將給 Dr. Fish 更多撰寫優質文章的動力喔!

參考資料

Welch, B. L. (1938). The significance of the difference between two means when the population variances are unequal. Biometrika, 29, 350-362. https://doi.org/10.2307/2332010

標籤: Levene檢定 p值 SPSS Welch t 檢定 α水準 假設檢定 合併變異數估計值 四捨五入 對立假設 常態分配 平均數 檢定統計量 母數檢定 獨立樣本t檢定 研究假設 總和運算 臨界值 自由度 虛無假設 變異數 變異數同質性 變異數異質性 離差平方和 顯著水準

文章導覽

❮ Previous Post: 如何使用 Excel 執行 Levene 檢定

您可能也會喜歡

featured image of Levene's test
Levene 檢定:檢驗樣本間變異數是否相等的方法
featured image of correlated samples t-test
關聯樣本t檢定的假設檢定
featured image of one-sample z-test
單一樣本z檢定的假設檢定
featured image of Scheffé test
Scheffé檢定:使用F分配的事後比較

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

關於 Dr. Fish

profile picture uploaded on July 5, 2024

喜歡求知和分析,所以一路讀到博士。也喜歡旅行、攝影、料理、看日劇,愛把複雜的思想和事物變簡單,是個有點宅也有點跳TONE的人。

支持 Dr. Fish

本網站經營和文章撰寫皆由Dr. Fish一人完成,投注許多時間和費用。若您喜歡任何一篇文章或覺得文章對您有幫助,請給我一些支持,買杯珍奶給我吧!您的支持不但能給我更多撰寫文章的動力,也可以讓這網站的經營持續下去喔!謝謝!😄

boba-icon
請我喝珍奶!
featured image of spss environment and data entry

下載專區

標準常態分配表

Student's t 分配臨界值表

F分配臨界值表

卡方分配臨界值表

斯皮爾曼等級相關係數臨界值表

Wilcoxon配對符號等級檢定臨界值表

曼–惠特尼U檢定臨界值表

Student化全距分配臨界值表

Dunnett檢定臨界值表(雙尾檢定)

單一樣本z檢定的SPSS語法

關於Dr. Fish漫游社會統計

本網站使用簡單易懂的文字解說社會統計,並示範軟體操作,同時有課後隨筆的分享,希望讀者在學習之餘,也能感受到生活的樂趣。

網站政策

著作權聲明 Copyright Notice
隱私權政策 Privacy Policy
免責聲明  Disclaimer

追蹤我們

Facebook
X(Twitter)

Copyright © 2021-2025 Dr. Fish 漫游社會統計. All rights reserved.