獨立樣本t檢定的信賴區間和效果量

獨立樣本ｔ檢定（independent samples t-test）是用來比較2個獨立的群組或樣本平均數是否有顯著不同的一種統計檢定，由於對樣本來自的母群體有常態分配和變異數同質性等要求，所以屬於母數檢定，是社會和行為科學領域很常用到的一種分析方法。

除了檢驗2個群組或樣本平均數為相等的虛無假設（也就是進行假設檢定）之外，還可以進一步探討信賴區間和效果量。信賴區間不但可看出2個樣本來自的母群體平均數差值可能存在的數值範圍，也可用來判斷自變項是否真地存在效果。此外，當自變項確實具有效果時，效果量則可用來瞭解這層效果的大小。

下面內容將先簡單回顧獨立樣本ｔ檢定的使用時機和運算原理，再介紹2個樣本平均數差值的信賴區間和效果量的計算方法，最後示範運用 SPSS 取得這2種統計量的操作方法。因為本篇文章為獨立樣本ｔ檢定的延伸內容，若您不清楚或不熟悉這種檢定方法，可先閱讀獨立樣本ｔ檢定的假設檢定，將有助於下面內容的理解喔！

獨立樣本ｔ檢定的簡單回顧
獨立樣本ｔ檢定的信賴區間
獨立樣本ｔ檢定的效果量
用 SPSS 取得獨立樣本ｔ檢定的信賴區間和效果量

獨立樣本ｔ檢定的簡單回顧

獨立樣本ｔ檢定適用在2個彼此獨立的群組或樣本平均數的比較，且母群體變異數未知的時候。當進行假設檢定時，獨立樣本ｔ檢定用來評估第1個樣本來自的母群體平均數等於第2個樣本來自的母群體平均數（ $\mu_1 = \mu_2$ ）的虛無假設，也就是2個樣本是否為來自於母群體平均數相同的一組隨機樣本。

兩個獨立樣本平均數比較的假設檢定會使用樣本平均數差異的抽樣分配（sampling distribution of the difference between sample means），當母群體參數已知的時候，樣本平均數差異抽樣分配為常態分配的型態。此時，若要探討2個樣本平均數是否有顯著不同，可以使用獨立樣本ｚ檢定，而ｚ檢定統計量的公式如下：

(1) $\begin{equation*}z = \frac {(\overline X_1-\overline X_2)-(\mu_1-\mu_2)}{\sigma_{\overline X_1-\overline X_2}}\end{equation*}$

$\begin{equation*}\begin{CJK*}{UTF8}{bsmi}\begin{align*}\overline X_1 &= \text {第1個樣本的平均數} \\\overline X_2 &= \text {第2個樣本的平均數} \\\mu_1 &= \text {第1個母群體的平均數} \\\mu_2 &= \text {第2個母群體的平均數} \\\sigma_{\overline X_1-\overline X_2} &= \text {樣本平均數差異抽樣分配的標準差}\end{align*}\end{CJK*}\end{equation*}$

不過大多數的時候，我們無法知道母群體參數，所以必須使用樣本統計量來估計母群體參數。當母群體參數無法得知的時候，上面公式(1)分母的樣本平均數差異抽樣分配的標準差須改用下面的估計值：

(2) $\begin{equation*}s_{\overline X_1-\overline X_2} = \sqrt {s_{\overline X_1}^2+s_{\overline X_2}^2}\end{equation*}$

$\begin{equation*}\begin{CJK*}{UTF8}{bsmi}\begin{align*}s_{\overline X_1-\overline X_2} &= \text {樣本平均數差異抽樣分配標準差的估計值} \\s_{\overline X_1}^2 &= \text {第1個樣本的變異數} \\s_{\overline X_2}^2 &= \text {第2個樣本的變異數}\end{align*}\end{CJK*}\end{equation*}$

但是在第1個樣本和第2個樣本的個數不一致（ $n_1 \neq n_2$ ）的時候，公式(2)會是一個偏誤的估計值，為了解決這個問題，須改用合併變異數估計值（pooled variance estimate）。若讓合併變異數估計值為 $s_p^2$ ，下面的公式提供一個無偏誤的樣本平均數差異抽樣分配標準差的估計值：

(3) $\begin{align*}s_{\overline X_1-\overline X_2} &= \sqrt {s_p^2 \left ( \frac {1}{n_1}+\frac {1}{n_2} \right )} \\[5pt]s_p^2 &= \frac {(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2} \\[5pt]&= \frac {SS_1+SS_2}{n_1+n_2-2}\end{align*}$

$\begin{equation*}\begin{CJK*}{UTF8}{bsmi}\begin{align*}s_p^2 &= \text {合併變異數估計值} \\s_1^2 &= \text {第1個樣本的變異數} \\s_2^2 &= \text {第2個樣本的變異數} \\n_1 &= \text {第1個樣本的個數} \\n_2 &= \text {第2個樣本的個數} \\SS_1 &= \text {第1個樣本的離差平方和} \\SS_2 &= \text {第2個樣本的離差平方和}\end{align*}\end{CJK*}\end{equation*}$

從公式(3)可以看到，合併變異數估計值（ $s_p^2$ ）考量了2個樣本的大小並利用自由度（degrees of freedom）加權2個樣本的變異數來取得無偏誤的樣本平均數差異抽樣分配標準差的估計值。當母群體變異數無法得知時，最適合描述樣本平均數差異的抽樣分配為ｔ分配，將公式(3)帶入公式(1)的分母即為2個樣本平均數比較時的ｔ檢定統計量（或稱為ｔ值）公式：

(4) $\begin{align*}t &= \frac {(\overline X_1-\overline X_2)-(\mu_1-\mu_2)}{s_{\overline X_1-\overline X_2}} \\[5pt]&= \frac {(\overline X_1-\overline X_2)-(\mu_1-\mu_2)}{\sqrt {\left ( \dfrac {SS_1+SS_2}{n_1+n_2-2} \right ) \left ( \dfrac {1}{n_1}+\dfrac {1}{n_2} \right )}}\end{align*}$

由於大多數的情況下我們是在評估2個樣本來自於平均數相同的母群體（ $\mu_1 = \mu_2$ ）之虛無假設，也就是 $\mu_1-\mu_2=0$ ，所以公式(4)可再簡化成下面的樣子：

(5) $\begin{equation*}t = \frac {\overline X_1-\overline X_2}{\sqrt {\left ( \dfrac {SS_1+SS_2}{n_1+n_2-2} \right ) \left ( \dfrac {1}{n_1}+\dfrac {1}{n_2} \right )}}\end{equation*}$

換句話說，ｔ檢定統計量是2個樣本平均數差值相對於標準誤的比值，而當虛無假設為真的時候，可以預期ｔ檢定統計量為0，這種情況下任何樣本平均數差值都是因為抽樣誤差（sampling error）所導致。

利用公式(5)得到ｔ值後，依據事先設定的顯著水準（α 水準）、自由度（ $n_1+n_2-2$ ）和檢定方向性的有無，透過ｔ分配表尋找臨界值。最後，運用決策規則，比較ｔ值和臨界值來評估檢定的結果。若使用統計分析軟體，則可直接比較 α 水準和 p 值來評估檢定的結果。

以上為獨立樣本ｔ檢定的簡單回顧，更詳細的說明可以參考獨立樣本ｔ檢定的假設檢定。除了假設檢定之外，很多時候還會想探討2個樣本平均數差值可能存在的範圍以及自變項的效果大小，此時即可透過信賴區間和效果量來達成，下面就來介紹這2種統計量的計算方法。

獨立樣本ｔ檢定的信賴區間

獨立樣本ｔ檢定的信賴區間（confidence interval）不但能夠用來瞭解2個樣本來自的母群體平均數差值可能存在的範圍，還可用來檢視自變項的效果是否真地存在。獨立樣本ｔ檢定適用在2個獨立樣本平均數的比較，而2個樣本來自的母群體平均數差值（ $\mu_1-\mu_2$ ）可作為自變項真實效果的一個測量，因此透過 $\mu_1-\mu_2$ 信賴區間的建構，得以評估自變項效果是否真實地存在。

獨立樣本ｔ檢定信賴區間的建構沒有不同於單一樣本ｔ檢定信賴區間的建構，唯一的差別在於前者在計算 $\mu_1-\mu_2$ 的信賴區間而後者在計算 $\mu$ 的信賴區間。利用上面的公式(4)和移項規則，因為ｔ臨界值有正、負2個數值，所以 $\mu_1-\mu_2$ 可用下面的不等式來表示：

(6) $\begin{equation*}(\overline X_1-\overline X_2)-\left ( t_{\frac {1-p}{2}} \times s_{\overline X_1-\overline X_2} \right ) \leq \mu_1-\mu_2 \leq (\overline X_1-\overline X_2)+\left ( t_{\frac {1-p}{2}} \times s_{\overline X_1-\overline X_2} \right )\end{equation*}$

$\begin{equation*}\begin{CJK*}{UTF8}{bsmi}\begin{align*}\overline X_1 &= \text {第1個樣本的平均數} \\\overline X_2 &= \text {第2個樣本的平均數} \\\mu_1 &= \text {第1個母群體的平均數} \\\mu_2 &= \text {第2個母群體的平均數} \\p &= \text {信賴區間的機率值} \\t &= \text {顯著水準為$(1-p)/2$且雙尾檢定的$t$臨界值} \\s_{\overline X_1-\overline X_2} &= \text {樣本平均數差異抽樣分配標準差的估計值}\end{align*}\end{CJK*}\end{equation*}$

常用的信賴區間機率值為0.95或0.99，也就是95%或99%的信心程度。從上面的不等式可以看到信賴區間的上、下界限，不等式左邊的數值為下信賴限而右邊的數值為上信賴限。

下信賴限： $(\overline X_1-\overline X_2)-\left ( t_{\frac {1-p}{2}} \times s_{\overline X_1-\overline X_2} \right )$
上信賴限： $(\overline X_1-\overline X_2)+\left ( t_{\frac {1-p}{2}} \times s_{\overline X_1-\overline X_2} \right )$

這裡使用〈獨立樣本ｔ檢定的假設檢定〉裡的例子，有一位工廠老闆想探討工作時安排一小段休息時間是否會影響員工的工作失誤次數，他將20位員工分成2組，第1組維持原來的工作模式，工作過程中沒有任何休息（nobreak），第2組則在下午2:45到3:00之間休息（break）。這位老闆紀錄了這20位員工在下午3:00到5:30間的工作失誤次數，如下表。

data of independent samples t-test for confidence interval and effect size

由於工廠老闆想瞭解休息時間是否「影響」員工的工作失誤次數，所以研究假設沒有方向性。對立假設和虛無假設分別如下：

對立假設（ $H_1$ ）：沒有休息員工和有休息員工的工作失誤次數有所不同，也就是說，他們是來自於母群體 $\mu_1 \neq \mu_2$ 的隨機樣本。
虛無假設（ $H_0$ ）：沒有休息員工和有休息員工的工作失誤次數沒有不同，也就是說，他們是來自於母群體 $\mu_1 = \mu_2$ 的隨機樣本。

當顯著水準（α 水準）為0.05、雙尾檢定且自由度為18時，獨立樣本ｔ檢定的結果指出沒有休息的員工和有休息的員工在工作失誤次數上有明顯的不同。詳細的假設檢定過程可以參考〈獨立樣本ｔ檢定的假設檢定〉裡工作中休息時間對工作失誤次數影響的例子，計算過程中已經知道下面的資訊：

$\begin{align*}\overline X_1 &= 6.3 \\\overline X_2 &= 3.3 \\SS_1 &= 20.1 \\SS_2 &= 12.1 \\n_1 &= 10 \\n_2 &= 10 \\t_{\frac {1-p}{2}} &= \pm 2.101\end{align*}$

利用上面的資訊來求得95%信賴區間，先將上面的資訊帶入公式(3)計算樣本平均數差異抽樣分配標準差的估計值，並把無法整除的數值四捨五入到小數點後第5位，計算過程如下：

$\begin{align*}s_{\overline X_1-\overline X_2} &= \sqrt {\left ( \frac {SS_1+SS_2}{n_1+n_2-2} \right ) \left ( \frac {1}{n_1}+\frac {1}{n_2} \right )} \\[5pt]&= \sqrt {\left ( \frac {20.1+12.1}{10+10-2} \right ) \left ( \frac {1}{10}+\frac {1}{10} \right )} \\[5pt]&\approx 0.59815\end{align*}$

計算獲得樣本平均數差異抽樣分配標準差的估計值後，再把這個數值帶入不等式(6)裡，並將無法整除的數值四捨五入到小數點後第3位，計算過程如下：

$\begin{align*}(6.3-3.3)-(2.101 \times 0.59815) &\leq \mu_1-\mu_2 \leq (6.3-3.3)+(2.101 \times 0.59815) \\[5pt]1.743 &\leq \mu_1-\mu_2 \leq 4.257\end{align*}$

計算結果指出有0.95的機率或95%的信心程度，母群體平均數差值會落在1.743和4.257之間。此外，因為這個例子在檢驗 $\mu_1-\mu_2=0$ 的虛無假設，而計算結果顯示這個95%信賴區間不包含0，所以可以拒絕虛無假設，代表休息時間確實會影響員工的工作失誤次數，藉由信賴區間所得到的分析結果和〈獨立樣本ｔ檢定的假設檢定〉裡假設檢定的結果是一致的。

獨立樣本ｔ檢定的效果量

上面信賴區間的計算結果指出休息時間（自變項）確實影響員工的工作失誤次數，而從2個群組的平均數可以看到有休息員工的平均工作失誤次數少於沒有休息的員工。雖然分析結果顯示休息時間具有效果，但我們不知道這個效果的大小（或強度），此時就須計算效果量（effect size）。

獨立樣本ｔ檢定的效果量計算類似於關聯樣本ｔ檢定的效果量計算，同樣使用 Cohen′s d，用2個樣本的平均數差值除以標準差。在2個獨立樣本的設計裡，當母群體的參數未知時，最好的標準差估計值為2樣本的合併變異數估計值的平方根。若讓 $\hat d$ 代表 Cohen′s d 的估計值，效果量的計算公式如下：

(7) $\begin{equation*}\hat d = \frac { | \overline X_1-\overline X_2 | }{\sqrt {s_p^2}}\end{equation*}$

$\begin{equation*}\begin{CJK*}{UTF8}{bsmi}\begin{align*}\hat d &= \text {Cohen's $d$ 的估計值} \\\overline X_1 &= \text {第1個樣本的平均數} \\\overline X_2 &= \text {第2個樣本的平均數} \\s_p^2 &= \text {合併變異數估計值}\end{align*}\end{CJK*}\end{equation*}$

由於效果量著重在效果的「大小」而不是「方向」，所以可以忽略2個樣本平均數差值的正、負號，因此 $\overline X_1-\overline X_2$ 取絕對值。不過若對立假設具有方向性，也就是單尾檢定時，當 $\overline X_1-\overline X_2$ 和原本預測的方向不一致，即應保留虛無假設，在這樣的情況下，也沒有必要計算效果量。

將上面工作中休息時間對工作失誤次數影響例子的資料帶入公式(7)裡，並把結果四捨五入到小數點後第3位，計算過程如下：

$\begin{align*}\hat d &= \frac { | 6.3-3.3 | }{\sqrt {\dfrac {20.1+12.1}{10+10-2}}} \\[5pt]&\approx 2.243\end{align*}$

效果量使用標準差單位來呈現2個群組或樣本的差異，根據計算的結果，沒有休息員工的平均工作失誤次數較有休息員工的平均工作失誤次數高出2.243標準差單位，可說是很大的差異，也代表休息時間（自變項）的效果量很大。

若2個樣本的變異數差異很大時，例如變異數異質性，合併變異數估計值的平方根可能不再是最合適的標準差估計值，此時可使用2個群組裡作為控制組或基準組（baseline）的那一組標準差來計算效果量。如果採用這種方法，需在研究報告裡註明標準差的來源，好讓讀者瞭解效果量的計算方式。

用 SPSS 取得獨立樣本ｔ檢定的信賴區間和效果量

將上面例子的資料輸入至 SPSS 資料編輯器裡，因為是2個獨立樣本，所以一共有20位參與者，如下圖。這裡有3個變項：ID 為員工的編碼、MISTAKE 為工作失誤的次數、GROUP 為組別（編碼1為沒有休息組而編碼2為有休息組）。若您不熟悉 SPSS 的資料輸入方法，請參考 SPSS操作環境和資料輸入。

entering data of independent samples into spss

資料輸入完成後，點選 SPSS 資料編輯器功能表的分析 » 比較平均數 » 獨立樣本Ｔ檢定，帶出「獨立樣本Ｔ檢定」視窗。

在「獨立樣本Ｔ檢定」視窗裡，把變項 MISTAKE 移至檢定變數(T)中而變項 GROUP 移至分組變數(G)中。接著，點選定義群組(D)，在「定義群組」小視窗裡，點選使用指定的值(U)並在群組1和群組2的長框裡輸入2個群組在變項 GROUP 裡的編碼值，這裡為1和2，完成後點選小視窗下方的繼續(C)。

spss dialog box of independent samples t-test

回到「獨立樣本Ｔ檢定」視窗後，再點選視窗右側的選項(O)，並在「獨立樣本Ｔ檢定：選項」小視窗的信賴區間百分比(P)方框裡輸入信心程度的百分比，這裡為95，完成後按下小視窗下方的繼續(C)。回到「獨立樣本Ｔ檢定」視窗後，勾選估計效應大小(E)，完成後按下視窗下方的確定。

注意：SPSS 第27版開始才有效果量計算的選項，若使用第26版或之前的版本，須自行手動計算獨立樣本ｔ檢定的效果量。

經過上述的步驟，SPSS 會輸出如下的獨立樣本檢定表。Levene 檢定的結果指出2個樣本的變異數相等（ $p>.05$ ），所以看 Equal variances assumed 那一列的95%信賴區間。從下表可以看到，上信賴限為1.743而下信賴限為4.257，和上面紙筆計算的結果相同。由於這個信賴區間不包含0，所以可以拒絕虛無假設，代表休息時間會影響員工的工作失誤次數。

spss output of 95% confidence interval for independent samples-t-test

另外，SPSS 也會輸出如下的獨立樣本效應大小表格。從下表可以看到 Cohen′s d 效果量位於第1列，效果量數值位於 Point Estimate 那一欄，數值為2.243，和上面紙筆計算的結果相同。這一效果量數值顯示，休息時間對員工的工作失誤次數有很大的影響。

spss output of effect size for independent samples t-test

信賴區間通常是 SPSS 或其他專門的統計分析軟體在獨立樣本ｔ檢定的預設輸出資訊之一，但若使用 Excel 執行獨立樣本ｔ檢定，輸出的檢定結果則沒有包含信賴區間。如果要在 Excel 裡取得獨立樣本ｔ檢定的信賴區間，可以利用函數或資料分析工具的方法，再進行簡單的數學計算來取得信賴區間的上、下信賴限。若想瞭解詳細的操作方法，可以參考如何使用 Excel 取得獨立樣本ｔ檢定的信賴區間。

若使用 SPSS 第26版或之前的版本，由於沒有「估計效應大小」的選項，可以改利用 Excel 來計算。上面 SPSS 輸出的第1個表格為群組統計量表（Group Statistics），複製該表格並貼上至一空白的 Excel 工作表中，參考上面的公式(3)並在一空白的儲存格（下圖為C6）裡輸入下面的公式語法來計算合併變異數估計值（ $s_p^2$ ）：

=(((C3-1)*E3*2)+((C4-1)*E4*2))/(C3+C4-2)

公式語法輸入完成後，按下 Enter 會傳回1.78889。在上面的公式語法裡，請依據您貼上群組統計量表的位置，對2個樣本各自所在的樣本數和標準差的儲存格位置進行相對應的修改。

calculation of pooled variance estimate using Excel

計算獲得合併變異數估計值後，再找一空白的儲存格（下圖為C7），參考上面的公式(7)並輸入下面的公式語法：

=ABS(D3-D4)/SQRT(C6)

這個公式語法要求計算2個樣本平均數差值的絕對值後再除以合併變異數估計值的平方根，輸入完成後，按下 Enter 會得到2.243002。這個數值即為 Cohen′s d 效果量，和上面紙筆計算、SPSS 輸出的結果都相同。若您不清楚利用 Excel 進行數學運算的方法，可以參考如何使用 Excel 進行數學計算【基礎篇】以及如何使用 Excel 進行數學計算【進階篇】。

calculation of Cohen's d estimate using Excel

總結來說，獨立樣本ｔ檢定可用來比較2個樣本平均數是否有顯著的不同，當檢定結果指出自變項有效果時，可進一步計算效果量來瞭解自變項效果的大小。此外，信賴區間也是相當實用的統計量，不但能夠看出2個樣本來自的母群體平均數差值可能存在的數值範圍，也可用來檢驗自變項是否真地存在效果。

以上為本篇文章對獨立樣本ｔ檢定的信賴區間和效果量的介紹，希望透過本篇文章，您瞭解了獨立樣本ｔ檢定信賴區間和效果量的概念和計算方式，也學會了利用 SPSS 取得這些統計量的方法。若您喜歡本篇文章，請將本網站加入書籤，並隨時回訪本網站喔！另外，也歡迎您追蹤本網站的 Facebook 和／或 X（Twitter）專頁喲！

如果您覺得本篇文章對您有幫助，歡迎買杯珍奶給 Dr. Fish！小小珍奶，大大鼓勵，您的支持將給 Dr. Fish 更多撰寫優質文章的動力喔！

獨立樣本ｔ檢定的簡單回顧

獨立樣本ｔ檢定的信賴區間

獨立樣本ｔ檢定的效果量

用 SPSS 取得獨立樣本ｔ檢定的信賴區間和效果量

您可能也會喜歡