Skip to content

合作邀約 email: dr.fish@drfishstats.com

  • Facebook
  • X
site icon of Dr. Fish

Dr. Fish 漫游社會統計

魚博士的專業漫談和課後隨筆

  • Home
  • 關於 Dr. Fish
  • 統計基礎
    • 入門概念
    • 圖形繪製
    • 描述統計
    • 相關
    • 線性迴歸
  • 統計進階
    • 推論統計
    • 統計檢定
      • 相關係數
      • 迴歸
      • 平均數比較
      • 無母數檢定
  • EXCEL 系列
    • 資料管理
    • 圖形繪製
    • 描述統計
    • 推論統計
  • 下課後
    • 生活
    • 旅遊
      • 日本
        • 北海道
        • 四國
    • 美食
    • 攝影
  • 聯絡 Dr. Fish
  • Home
  • 推論統計
  • 統計檢定
  • 平均數比較
  • Scheffé檢定:使用F分配的事後比較

🐟 請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址

Scheffé檢定:使用F分配的事後比較

Posted on 2023-05-242023-05-24 By Dr. Fish
平均數比較

Scheffé檢定(Scheffé test)或Scheffé法是由美國的統計學家Henry Scheffé(1953)所提出,為獨立群組單因子變異數分析的一種事後比較(post hoc comparisons)方法,有些中文翻譯成雪費法。由於Scheffé檢定為事後比較的方法,所以須在單因子變異數分析的F值達到統計上顯著後才會使用。

Scheffé檢定不只可比較成對樣本的平均數,也可比較兩個以上樣本的平均數,且使用F值、F分配和一個嚴格的臨界值來執行事後比較的顯著性檢定。因此,Scheffé檢定的事後比較類型雖然廣泛,但顯著性檢定卻相當地保守。

以下的內容牽涉獨立群組單因子變異數分析(以下直接稱「單因子變異數分析」)、事後比較和事前比較的線性對比概念,建議您先閱讀單因子變異數分析的假設檢定、單因子變異數分析的事後比較和單因子變異數分析的事前比較,將有助於下面內容的銜接和理解。

  • Scheffé檢定的定義和計算
  • Scheffé檢定的範例操作
    • 成對樣本平均數的比較
    • 多個樣本平均數的比較
  • 運用SPSS執行Scheffé檢定

Scheffé檢定的定義和計算

Scheffé檢定是一種事後比較的方法,在單因子變異數分析達到統計上顯著後才會使用。事後比較是在進行多重比較,當執行單一比較或檢定的時候,研究人員將願意犯下第一類型錯誤的機率設定為α,習慣上為0.05或0.01,這個機率稱為比較錯誤率。但當執行數個比較或檢定時,犯下第一類型錯誤的機率會高於α,這時的機率稱為實驗錯誤率,而事後比較通常會控制這個實驗錯誤率。

如同事後比較裡的Tukey HSD檢定把實驗錯誤率維持在α,Scheffé檢定也把實驗錯誤率控制在α。不過,不像Tukey HSD檢定只進行所有可能的成對樣本比較,Scheffé檢定則允許所有可能的成對樣本和多個樣本間的比較。換句話說,Scheffé檢定是在實驗錯誤率為α的情況下,讓研究人員能夠進行所有可能的線性對比(linear contrasts)。

大多數事後比較方法的顯著性檢定使用Student化全距統計量和Student化全距分配(Studentized range distribution),不過Scheffé檢定使用F值和F分配。讓a_j指第j組的對比係數、\overline X_j指第j組的平均數,線性對比ψ的公式為:

(1)   \begin{equation*}\psi &= \sum a_j \overline X_j\end{equation*}

公式(1)可轉換為平方和(sum of squares),若n指每一組的個數(各組個數相同的情況)、a_j^2為第j組對比係數的平方,則對比平方和SS_c的公式為:

(2)   \begin{equation*}SS_c = \frac {n \psi^2}{\sum a_j^2}\end{equation*}

如果每個群組的個數不相等,將公式(2)的n改成n_j,代表第j組的個數,對比平方和可改用下面的公式來計算:

    \[ SS_c = \frac {\psi^2}{\sum \dfrac {a_j^2}{n_j}} \]

因為每組對比都是在比較兩個平均數或兩個部分的變異(例如一個合併平均數和一個單一平均數的比較),所以對比的自由度df_c皆為1。對比的變異數估計值MS_c等於SS_c \div df_c = SS_c,因此利用公式(2)和單因子變異數分析裡的組內變異數估計值MS_w就可以計算出每組對比的F值:

(3)   \begin{equation*}F = \frac {MS_c}{MS_w} = \frac {{n \psi^2}/{\sum a_j^2}}{MS_w}\end{equation*}

計算出每組對比的F值後,須和臨界值比較,才能判斷是否拒絕虛無假設。Scheffé檢定的F臨界值並非分子為1、分母為組內自由度的臨界值,而是一個調整後的F臨界值。若k為自變項的群組個數、df_w為組內自由度,調整後的臨界值F_{crit}如下:

(4)   \begin{equation*}F_{crit} = (k-1)F_{\alpha}(k-1, df_w)\end{equation*}

也就是說,Scheffé提出的臨界值是依據α水準、分子自由度為k-1、分母自由度為組內自由度而得到的F臨界值再乘以(k-1)的一個數值。由此可見,這個臨界值的數值會很大,每組事後比較變得很不容易達到統計上顯著。因為這樣的特性,Scheffé檢定可說是所有事後比較方法裡最保守、統計檢定力最低的一種方法。

下面使用單因子變異數分析的假設檢定裡不同治療方法和輕度憂鬱症治療效果的例子,示範如何利用Scheffé檢定來進行事後比較。

Scheffé檢定的範例操作

不同治療方法和輕度憂鬱症治療效果的例子裡,各個群組的平均數和個數如下表。此外,這個研究的組內自由度df_w為12、組內變異數估計值MS_w為1.9。

group means of one-way ANOVA example

Scheffé檢定可用來比較成對樣本的平均數和多個樣本的平均數,下面利用這個例子來分別示範兩種不同的平均數比較。

成對樣本平均數的比較

Scheffé檢定使用對比係數來進行樣本平均數間的比較,若要進行所有成對樣本平均數的比較,每組對比的對比係數如下表:

pairwise contrasts for Scheffé test

利用上面的公式(1),先計算出每一組成對比較的線性對比ψ。三組ψ的計算過程如下:

    \begin{align*}\textbf {relax vs. placebo} \Rightarrow \psi &= \sum a_j \overline X_j = (1)(8.0)+(0)(6.0)+(-1)(9.2) = -1.2 \\\textbf {talk vs. placebo} \Rightarrow \psi &= \sum a_j \overline X_j = (0)(8.0)+(1)(6.0)+(-1)(9.2) = -3.2 \\\textbf {relax vs. talk} \Rightarrow \psi &= \sum a_j \overline X_j = (1)(8.0)+(-1)(6.0)+(0)(9.2) = 2\end{align*}

再利用公式(2),計算出每一組成對比較的平方和SS_c。三組平方和SS_c的計算過程如下:

    \begin{align*}\textbf {relax vs. placebo} \Rightarrow SS_c &= \frac {n \psi^2}{\sum a_j^2} = \frac {5(-1.2)^2}{1^2+0^2+(-1)^2} = 3.6 \\\textbf {talk vs. placebo} \Rightarrow SS_c &= \frac {n \psi^2}{\sum a_j^2} = \frac {5(-3.2)^2}{0^2+1^2+(-1)^2} = 25.6 \\\textbf {relax vs. talk} \Rightarrow SS_c &= \frac {n \psi^2}{\sum a_j^2} = \frac {5(2)^2}{1^2+(-1)^2+0^2} = 10\end{align*}

最後,利用公式(3),計算出每一組成對比較的F值。三組F值的計算過程如下:

    \begin{align*}\textbf {relax vs. placebo} \Rightarrow F &= \frac {{n \psi^2}/{\sum a_j^2}}{MS_w} = \frac {3.6}{1.9} \approx 1.895 \\\textbf {talk vs. placebo} \Rightarrow F &= \frac {{n \psi^2}/{\sum a_j^2}}{MS_w} = \frac {25.6}{1.9} \approx 13.474 \\\textbf {relax vs. talk} \Rightarrow F &= \frac {{n \psi^2}/{\sum a_j^2}}{MS_w} = \frac {10}{1.9} \approx 5.263\end{align*}

得到每一組對比的F值後,利用公式(4)計算臨界值。當α水準為0.05、分母自由度為12、分子自由度為2(k-1=3-1)時,F臨界值為3.89。再將3.89乘以(k-1),Scheffé檢定的F臨界值為3.89 \times 2=7.78。

critical value of F with numerator df 2 and denominator df 12

比較每一組對比的F值和臨界值,只有talk和placebo這組的F值大於臨界值,13.474>7.78,代表談話治療和安慰劑控制在輕度憂鬱症治療效果上有顯著的差異。

多個樣本平均數的比較

Scheffé檢定不只適用在成對樣本的平均數比較上,也可用在兩個以上的樣本平均數比較。同樣在不同治療方法和輕度憂鬱症治療效果的例子裡,若想比較放鬆治療和談話治療兩組合併的平均數和安慰劑控制組的平均數,對比係數會如下表:

non-pairwise contrasts for Scheffé test

利用上面的公式(1)、(2)、(3),計算出這組對比的線性對比ψ、平方和SS_c和F值。整個計算過程如下:

    \begin{align*}\psi &= \sum a_j \overline X_j = (0.5)(8.0)+(0.5)(6.0)+(-1)(9.2) = -2.2 \\[5pt]SS_c &= \frac {n \psi^2}{\sum a_j^2} = \frac {5(-2.2)^2}{(0.5)^2+(0.5)^2+(-1)^2} \approx 16.133 \\[5pt]F &= \frac {{n \psi^2}/{\sum a_j^2}}{MS_w} = \frac {16.133}{1.9} \approx 8.491\end{align*}

比較這組對比的F值和Scheffé檢定的臨界值,結果顯示F值大於臨界值,8.491>7.78,代表放鬆治療和談話治療合併而成的實驗組和安慰劑控制組在輕度憂鬱症的治療效果上有顯著的差異。

從上面的說明可發現,Scheffé檢定的計算過程有點麻煩,若使用統計分析軟體來進行分析則可節省許多時間。SPSS把Scheffé檢定列為單因子變異數分析的事後比較選項之一,操作上相當地簡單。不過,SPSS的Scheffé檢定只進行所有可能的成對樣本比較,並沒有多個樣本的比較。若想比較多個樣本的平均數,須另外自行運算。下面示範利用SPSS執行Scheffé檢定的操作方法。

運用SPSS執行Scheffé檢定

將不同治療方法和輕度憂鬱症治療效果例子的資料輸入至SPSS資料編輯器裡,輸入完成後,點選分析 » 比較平均數 » 單因數變異數分析,帶出「單因子變異數分析」視窗。關於SPSS的資料輸入方法,請參考SPSS操作環境和資料輸入。

spss menu of one-way ANOVA

在「單因子變異數分析」視窗裡,把SESSION移至依變數清單(E)方框裡、GROUP移至因子(F)長框裡,再點選視窗右側的事後(H),會出現「單因子變異數分析:事後多重比較」視窗。在這個視窗的假設相等的變異的選項裡,勾選Scheffe法,完成後點選視窗下方的繼續(C)。回到上一個視窗後,再點選確定。

dialog box of Scheffé test in spss

經過上述的步驟後,SPSS會輸出3個表格。第1個表格為變異數分析的顯著性檢定結果,該表格內容的相關說明請參考單因子變異數分析的假設檢定。

第2個表格為「多重比較」表,是Scheffé檢定對所有成對樣本的事後比較結果。比較下表「顯著性」欄的p值和α水準,只有talk和placebo這組(相同於placebo和talk組)因為0.011<0.05而達到統計上顯著,這結果指出談話治療和安慰劑控制對於輕度憂鬱症治療效果有明顯的不同。

spss output of pairwise comparisons using Scheffé test

第3個表格列出Scheffé檢定的事後比較裡沒有達到統計上顯著的成對比較,從下表可看出,talk和relax組以及relax和placebo組沒有達到統計上顯著。換句話說,只有talk和placebo組存在顯著的差異,這結果和上面紙筆計算的結果是相同的。

spss output of non-significant pairwise comparisons using Scheffé test

整體而言,在成對樣本平均數的比較裡,雖然Scheffé檢定的分析結果和Tukey HSD檢定的結果相同,只有一組達到統計上顯著,但因為這裡的例子為刻意凸顯群組間不同的虛構資料,所以群組間的平均數差異會比較大。實務上,由於Scheffé檢定使用了很嚴格的臨界值,所以能夠達到統計上顯著的成對比較並不多。因此,若只打算對所有可能的成對樣本進行事後比較,Tukey HSD檢定或REGWQ檢定會是更合適的方法。

此外,Scheffé檢定屬於事後比較的方法,任何可在研究資料蒐集前即擬定好研究假設的事前比較,也不適合使用Scheffé檢定,例如多個樣本平均數的比較裡兩個實驗情境的合併與安慰劑控制的比較,明顯地可當作實驗組和控制組差異的事前比較。透過Bonferroni t 檢定或Dunn-Šidák檢定修正α水準後再進行顯著性檢定,單獨一個或少數幾個事前比較的統計檢定力會遠高於Scheffé檢定。

以上為本篇文章對Scheffé檢定的介紹,希望透過本篇文章,您瞭解了Scheffé檢定的定義和計算方法,也學會了利用SPSS執行Scheffé檢定的操作過程。

若您喜歡本篇文章,請將本網站加入書籤,當作您的學習工具,並持續回訪本網站喔!另外,您也可以在Facebook和Twitter上找到我們喲!

參考資料

Scheffé, H. (1953). A method for judging all contrasts in the analysis of variance. Biometrika, 40(1/2), 87-104. https://doi.org/10.2307/2333100

標籤: Bonferroni t 檢定 Dunn-Šidák檢定 F分配 REGWQ檢定 Sheffé檢定 SPSS Tukey HSD檢定 事前比較 事後比較 單因子變異數分析 實驗錯誤率 對比係數 統計檢定力 線性對比 自由度 顯著性檢定

文章導覽

❮ Previous Post: 單因子變異數分析的事前比較
Next Post: Dunnett檢定:單一控制組和其他群組的事後比較 ❯

您可能也會喜歡

featured image of Levene's test using Excel
如何使用 Excel 執行 Levene 檢定
featured image of confidence interval for correlated samples using Excel
如何使用 Excel 取得關聯樣本t檢定的信賴區間
featured image of independent samples t-test
獨立樣本t檢定的假設檢定
featured image of Welch's t-test
Welch t 檢定:變異數不相等時的獨立樣本檢定

關於 Dr. Fish

profile picture uploaded on July 5, 2024

喜歡求知和分析,所以一路讀到博士。也喜歡旅行、攝影、料理、看日劇,愛把複雜的思想和事物變簡單,是個有點宅也有點跳 TONE 的人。

支持 Dr. Fish

本網站經營和文章撰寫皆由 Dr. Fish 一人完成,投注許多時間和費用。若您喜歡任何一篇文章或覺得文章對您有幫助,請給我一些支持,買杯珍奶給我吧!您的支持不但能給我更多撰寫文章的動力,也可以讓這網站的經營持續下去喔!謝謝!😄

boba-icon
請我喝珍奶!
featured image of spss environment and data entry

下載專區

標準常態分配表

Student's t 分配臨界值表

F分配臨界值表

卡方分配臨界值表

斯皮爾曼等級相關係數臨界值表

Wilcoxon 配對符號等級檢定臨界值表

曼–惠特尼U檢定臨界值表

Student 化全距分配臨界值表

Dunnett 檢定臨界值表(雙尾檢定)

單一樣本z檢定的 SPSS 語法

關於 Dr. Fish 漫游社會統計

本網站使用簡單易懂的文字解說社會統計,並示範軟體操作,同時有課後隨筆的分享,希望讀者在學習之餘,也能感受到生活的樂趣。

網站政策

著作權聲明 Copyright Notice
隱私權政策 Privacy Policy
免責聲明  Disclaimer

追蹤網站

Facebook
X(Twitter)

Copyright © 2021-2026 Dr. Fish 漫游社會統計. All rights reserved.