Scheffé檢定：使用F分配的事後比較

Scheffé檢定（Scheffé test）或Scheffé法是由美國的統計學家Henry Scheffé（1953）所提出，為獨立群組單因子變異數分析的一種事後比較（post hoc comparisons）方法，有些中文翻譯成雪費法。由於Scheffé檢定為事後比較的方法，所以須在單因子變異數分析的Ｆ值達到統計上顯著後才會使用。

Scheffé檢定不只可比較成對樣本的平均數，也可比較兩個以上樣本的平均數，且使用Ｆ值、Ｆ分配和一個嚴格的臨界值來執行事後比較的顯著性檢定。因此，Scheffé檢定的事後比較類型雖然廣泛，但顯著性檢定卻相當地保守。

以下的內容牽涉獨立群組單因子變異數分析（以下直接稱「單因子變異數分析」）、事後比較和事前比較的線性對比概念，建議您先閱讀單因子變異數分析的假設檢定、單因子變異數分析的事後比較和單因子變異數分析的事前比較，將有助於下面內容的銜接和理解。

Scheffé檢定的定義和計算
Scheffé檢定的範例操作
- 成對樣本平均數的比較
- 多個樣本平均數的比較
運用SPSS執行Scheffé檢定

Scheffé檢定的定義和計算

Scheffé檢定是一種事後比較的方法，在單因子變異數分析達到統計上顯著後才會使用。事後比較是在進行多重比較，當執行單一比較或檢定的時候，研究人員將願意犯下第一類型錯誤的機率設定為α，習慣上為0.05或0.01，這個機率稱為比較錯誤率。但當執行數個比較或檢定時，犯下第一類型錯誤的機率會高於α，這時的機率稱為實驗錯誤率，而事後比較通常會控制這個實驗錯誤率。

如同事後比較裡的Tukey HSD檢定把實驗錯誤率維持在α，Scheffé檢定也把實驗錯誤率控制在α。不過，不像Tukey HSD檢定只進行所有可能的成對樣本比較，Scheffé檢定則允許所有可能的成對樣本和多個樣本間的比較。換句話說，Scheffé檢定是在實驗錯誤率為α的情況下，讓研究人員能夠進行所有可能的線性對比（linear contrasts）。

大多數事後比較方法的顯著性檢定使用Student化全距統計量和Student化全距分配（Studentized range distribution），不過Scheffé檢定使用Ｆ值和Ｆ分配。讓 $a_j$ 指第 $j$ 組的對比係數、 $\overline X_j$ 指第 $j$ 組的平均數，線性對比ψ的公式為：

(1) $\begin{equation*}\psi &= \sum a_j \overline X_j\end{equation*}$

公式(1)可轉換為平方和（sum of squares），若 $n$ 指每一組的個數（各組個數相同的情況）、 $a_j^2$ 為第 $j$ 組對比係數的平方，則對比平方和 $SS_c$ 的公式為：

(2) $\begin{equation*}SS_c = \frac {n \psi^2}{\sum a_j^2}\end{equation*}$

如果每個群組的個數不相等，將公式(2)的 $n$ 改成 $n_j$ ，代表第 $j$ 組的個數，對比平方和可改用下面的公式來計算：

$SS_c = \frac {\psi^2}{\sum \dfrac {a_j^2}{n_j}}$

因為每組對比都是在比較兩個平均數或兩個部分的變異（例如一個合併平均數和一個單一平均數的比較），所以對比的自由度 $df_c$ 皆為1。對比的變異數估計值 $MS_c$ 等於 $SS_c \div df_c = SS_c$ ，因此利用公式(2)和單因子變異數分析裡的組內變異數估計值 $MS_w$ 就可以計算出每組對比的Ｆ值：

(3) $\begin{equation*}F = \frac {MS_c}{MS_w} = \frac {{n \psi^2}/{\sum a_j^2}}{MS_w}\end{equation*}$

計算出每組對比的Ｆ值後，須和臨界值比較，才能判斷是否拒絕虛無假設。Scheffé檢定的Ｆ臨界值並非分子為1、分母為組內自由度的臨界值，而是一個調整後的Ｆ臨界值。若 $k$ 為自變項的群組個數、 $df_w$ 為組內自由度，調整後的臨界值 $F_{crit}$ 如下：

(4) $\begin{equation*}F_{crit} = (k-1)F_{\alpha}(k-1, df_w)\end{equation*}$

也就是說，Scheffé提出的臨界值是依據α水準、分子自由度為 $k-1$ 、分母自由度為組內自由度而得到的Ｆ臨界值再乘以（ $k-1$ ）的一個數值。由此可見，這個臨界值的數值會很大，每組事後比較變得很不容易達到統計上顯著。因為這樣的特性，Scheffé檢定可說是所有事後比較方法裡最保守、統計檢定力最低的一種方法。

下面使用單因子變異數分析的假設檢定裡不同治療方法和輕度憂鬱症治療效果的例子，示範如何利用Scheffé檢定來進行事後比較。

Scheffé檢定的範例操作

不同治療方法和輕度憂鬱症治療效果的例子裡，各個群組的平均數和個數如下表。此外，這個研究的組內自由度 $df_w$ 為12、組內變異數估計值 $MS_w$ 為1.9。

Scheffé檢定可用來比較成對樣本的平均數和多個樣本的平均數，下面利用這個例子來分別示範兩種不同的平均數比較。

成對樣本平均數的比較

Scheffé檢定使用對比係數來進行樣本平均數間的比較，若要進行所有成對樣本平均數的比較，每組對比的對比係數如下表：

利用上面的公式(1)，先計算出每一組成對比較的線性對比ψ。三組ψ的計算過程如下：

$\begin{align*}\textbf {relax vs. placebo} \Rightarrow \psi &= \sum a_j \overline X_j = (1)(8.0)+(0)(6.0)+(-1)(9.2) = -1.2 \\\textbf {talk vs. placebo} \Rightarrow \psi &= \sum a_j \overline X_j = (0)(8.0)+(1)(6.0)+(-1)(9.2) = -3.2 \\\textbf {relax vs. talk} \Rightarrow \psi &= \sum a_j \overline X_j = (1)(8.0)+(-1)(6.0)+(0)(9.2) = 2\end{align*}$

再利用公式(2)，計算出每一組成對比較的平方和 $SS_c$ 。三組平方和 $SS_c$ 的計算過程如下：

$\begin{align*}\textbf {relax vs. placebo} \Rightarrow SS_c &= \frac {n \psi^2}{\sum a_j^2} = \frac {5(-1.2)^2}{1^2+0^2+(-1)^2} = 3.6 \\\textbf {talk vs. placebo} \Rightarrow SS_c &= \frac {n \psi^2}{\sum a_j^2} = \frac {5(-3.2)^2}{0^2+1^2+(-1)^2} = 25.6 \\\textbf {relax vs. talk} \Rightarrow SS_c &= \frac {n \psi^2}{\sum a_j^2} = \frac {5(2)^2}{1^2+(-1)^2+0^2} = 10\end{align*}$

最後，利用公式(3)，計算出每一組成對比較的Ｆ值。三組Ｆ值的計算過程如下：

$\begin{align*}\textbf {relax vs. placebo} \Rightarrow F &= \frac {{n \psi^2}/{\sum a_j^2}}{MS_w} = \frac {3.6}{1.9} \approx 1.895 \\\textbf {talk vs. placebo} \Rightarrow F &= \frac {{n \psi^2}/{\sum a_j^2}}{MS_w} = \frac {25.6}{1.9} \approx 13.474 \\\textbf {relax vs. talk} \Rightarrow F &= \frac {{n \psi^2}/{\sum a_j^2}}{MS_w} = \frac {10}{1.9} \approx 5.263\end{align*}$

得到每一組對比的Ｆ值後，利用公式(4)計算臨界值。當α水準為0.05、分母自由度為12、分子自由度為2（ $k-1=3-1$ ）時，Ｆ臨界值為3.89。再將3.89乘以（ $k-1$ ），Scheffé檢定的Ｆ臨界值為 $3.89 \times 2=7.78$ 。

critical value of F with numerator df 2 and denominator df 12

比較每一組對比的Ｆ值和臨界值，只有talk和placebo這組的Ｆ值大於臨界值， $13.474>7.78$ ，代表談話治療和安慰劑控制在輕度憂鬱症治療效果上有顯著的差異。

多個樣本平均數的比較

Scheffé檢定不只適用在成對樣本的平均數比較上，也可用在兩個以上的樣本平均數比較。同樣在不同治療方法和輕度憂鬱症治療效果的例子裡，若想比較放鬆治療和談話治療兩組合併的平均數和安慰劑控制組的平均數，對比係數會如下表：

利用上面的公式(1)、(2)、(3)，計算出這組對比的線性對比ψ、平方和 $SS_c$ 和Ｆ值。整個計算過程如下：

$\begin{align*}\psi &= \sum a_j \overline X_j = (0.5)(8.0)+(0.5)(6.0)+(-1)(9.2) = -2.2 \\[5pt]SS_c &= \frac {n \psi^2}{\sum a_j^2} = \frac {5(-2.2)^2}{(0.5)^2+(0.5)^2+(-1)^2} \approx 16.133 \\[5pt]F &= \frac {{n \psi^2}/{\sum a_j^2}}{MS_w} = \frac {16.133}{1.9} \approx 8.491\end{align*}$

比較這組對比的Ｆ值和Scheffé檢定的臨界值，結果顯示Ｆ值大於臨界值， $8.491>7.78$ ，代表放鬆治療和談話治療合併而成的實驗組和安慰劑控制組在輕度憂鬱症的治療效果上有顯著的差異。

從上面的說明可發現，Scheffé檢定的計算過程有點麻煩，若使用統計分析軟體來進行分析則可節省許多時間。SPSS把Scheffé檢定列為單因子變異數分析的事後比較選項之一，操作上相當地簡單。不過，SPSS的Scheffé檢定只進行所有可能的成對樣本比較，並沒有多個樣本的比較。若想比較多個樣本的平均數，須另外自行運算。下面示範利用SPSS執行Scheffé檢定的操作方法。

運用SPSS執行Scheffé檢定

將不同治療方法和輕度憂鬱症治療效果例子的資料輸入至SPSS資料編輯器裡，輸入完成後，點選分析 » 比較平均數 » 單因數變異數分析，帶出「單因子變異數分析」視窗。關於SPSS的資料輸入方法，請參考SPSS操作環境和資料輸入。

在「單因子變異數分析」視窗裡，把SESSION移至依變數清單(E)方框裡、GROUP移至因子(F)長框裡，再點選視窗右側的事後(H)，會出現「單因子變異數分析：事後多重比較」視窗。在這個視窗的假設相等的變異的選項裡，勾選Scheffe法，完成後點選視窗下方的繼續(C)。回到上一個視窗後，再點選確定。

經過上述的步驟後，SPSS會輸出3個表格。第1個表格為變異數分析的顯著性檢定結果，該表格內容的相關說明請參考單因子變異數分析的假設檢定。

第2個表格為「多重比較」表，是Scheffé檢定對所有成對樣本的事後比較結果。比較下表「顯著性」欄的 $p$ 值和α水準，只有talk和placebo這組（相同於placebo和talk組）因為 $0.011<0.05$ 而達到統計上顯著，這結果指出談話治療和安慰劑控制對於輕度憂鬱症治療效果有明顯的不同。

spss output of pairwise comparisons using Scheffé test

第3個表格列出Scheffé檢定的事後比較裡沒有達到統計上顯著的成對比較，從下表可看出，talk和relax組以及relax和placebo組沒有達到統計上顯著。換句話說，只有talk和placebo組存在顯著的差異，這結果和上面紙筆計算的結果是相同的。

spss output of non-significant pairwise comparisons using Scheffé test

整體而言，在成對樣本平均數的比較裡，雖然Scheffé檢定的分析結果和Tukey HSD檢定的結果相同，只有一組達到統計上顯著，但因為這裡的例子為刻意凸顯群組間不同的虛構資料，所以群組間的平均數差異會比較大。實務上，由於Scheffé檢定使用了很嚴格的臨界值，所以能夠達到統計上顯著的成對比較並不多。因此，若只打算對所有可能的成對樣本進行事後比較，Tukey HSD檢定或REGWQ檢定會是更合適的方法。

此外，Scheffé檢定屬於事後比較的方法，任何可在研究資料蒐集前即擬定好研究假設的事前比較，也不適合使用Scheffé檢定，例如多個樣本平均數的比較裡兩個實驗情境的合併與安慰劑控制的比較，明顯地可當作實驗組和控制組差異的事前比較。透過Bonferroni t 檢定或Dunn-Šidák檢定修正α水準後再進行顯著性檢定，單獨一個或少數幾個事前比較的統計檢定力會遠高於Scheffé檢定。

以上為本篇文章對Scheffé檢定的介紹，希望透過本篇文章，您瞭解了Scheffé檢定的定義和計算方法，也學會了利用SPSS執行Scheffé檢定的操作過程。

若您喜歡本篇文章，請將本網站加入書籤，當作您的學習工具，並持續回訪本網站喔！另外，您也可以在Facebook和Twitter上找到我們喲！

參考資料

Scheffé, H. (1953). A method for judging all contrasts in the analysis of variance. Biometrika, 40(1/2), 87-104. https://doi.org/10.2307/2333100