🐟 請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址
單因子變異數分析的統計檢定力
統計檢定力(statistical power)指在虛無假設確實是錯誤的時候,一種統計檢定方法得以拒絕該錯誤虛無假設的機率。獨立群組的單因子變異數分析(以下直接稱「單因子變異數分析」)主要在同時檢驗3個或3個以上群組平均數相同的虛無假設(),而單因子變異數分析的統計檢定力即是在任兩個群組平均數確實存在差異的情況下,能夠拒絕這個錯誤虛無假設的機率。
單因子變異數分析的統計檢定力(以下簡稱「檢定力」)會受到樣本大小、自變項的效果和樣本變異等3個因素的影響,與樣本大小、自變項的效果呈現正向的關係,與樣本變異則呈現負向的關係。本篇文章將先回顧單因子變異數分析的概念上公式,再從公式探討影響檢定力的3個因素,最後示範利用軟體取得檢定力的方法。
由於本篇文章的內容和檢定力有關,若您不清楚或不熟悉檢定力的概念,建議您先閱讀統計檢定力的意義和影響因素,將有助於以下內容的理解。若您只對文章的某部分內容感興趣,也可點選下方的連結,即可直接跳至您想瞭解的內容。
單因子變異數分析的概念公式
在探討單因子變異數分析的檢定力之前,先回顧一下這個分析的概念公式,將有助於接下來檢定力影響因素的理解。單因子變異數分析的F檢定統計量,也稱為F值(F-ratio),為組間變異數估計值和組內變異數估計值
的比率,公式如下:
(1)
組間變異數估計值用來估計群組平均數之間的變異,是將每一個群組的平均數視為一個分數,然後計算出這些平均數的變異數。讓代表第
組的分數平均數、
為總平均數、
指第
組的分數個數、
為群組的組數,組間變異數估計值
的公式為:
(2)
假設每一組的分數個數都相等(),皆為
,則上面公式(2)可改寫成下面的公式:
(3)
組內變異數估計值則用來估計群組內分數的平均變異,為所有群組內分數變異數的平均值。讓代表第
組的第
個分數、
為第
組的分數個數、
為第
組的分數平均數、
為群組的組數,組內變異數估計值
的公式為:
(4)
在公式(4)裡,指一組內每一個分數和該組平均數間的差值,稱為離差,而將每一個分數的離差平方後相加即為離差平方和(sum of squared deviations)或簡單稱為平方和(sum of squares),就是公式裡的
。讓
代表第
組的平方和,則每一組的平方和如下:
(5)
利用公式(5)的平方和概念,公式(3)的組內變異數估計值可以改寫成下面的公式:
(6)
和上面公式(3)一樣,假設每一組的分數個數都相等,皆為,則將分數個數乘以組數會變成樣本的總個數。換句話說,
。因此,公式(6)可再寫成:
(7)
最後,將公式(3)和公式(7)帶入公式(1),單因子變異數分析的F檢定統計量(F值)可用下面的公式來呈現:
(8)
公式(8)讓單因子變異數分析的F值來源變得更清楚,下面就利用這個公式來探討單因子變異數分析檢定力的影響因素。
單因子變異數分析檢定力的影響因素
檢定力為拒絕錯誤虛無假設的機率,若要提高拒絕虛無假設的機率,就須增加單因子變異數分析的F值。參考上面的公式(8),可發現3個因素影響F值的大小,分別為自變項的效果大小、樣本的變異和樣本的大小,以下分別探討這3個因素和F值之間的關係。
自變項的效果大小
自變項的效果是指公式(8)裡、
、
、
等數值,也就是各組的平均數到總平均數之間的差值,當差值愈大的時候,自變項的效果也愈大。
由於自變項的效果位在F值公式的分子,所以當自變項的效果愈大,代表組間變異數估計值愈大,使得F值也愈大。F值愈大,愈容易拒絕虛無假設,檢定力也愈高。因此,自變項的效果大小和檢定力之間為正向的關係,也就是自變項的效果愈大,檢定力愈高。
樣本的變異
樣本的變異是指公式(8)裡、
、
、
等數值,也就是每一群組的組內變異。當這些數值愈大的時候,代表樣本的變異愈大,使得組內變異數估計值
也愈大。
由於組內變異數估計值位於F值公式的分母,所以當組內變異數估計值
愈大,F值會愈小。F值愈小,代表愈不容易拒絕虛無假設,使得檢定力變低。因此,樣本的變異和檢定力之間為負向的關係,也就是樣本的變異愈大,檢定力愈低。
樣本的大小
在公式(8)裡,樣本總數為,而當樣本總數
愈大時,各個群組的個數
也會愈大。為了讓說明更簡單明瞭,這裡假設每一組的分數個數都相等,皆為
。
先看位於組內變異數估計值分母的樣本總數,當樣本總數
愈大的時候,組內變異數估計值
會愈小。當組內變異數估計值
愈小的時候,F值會愈大,代表愈容易拒絕虛無假設,使得檢定力愈高。
再看位於組間變異數估計值分子的各群組分數個數,當各群組的分數個數
愈大的時候,組間變異數估計值
會愈大。當組間變異數估計值
愈大的時候,F值會愈大,代表愈容易拒絕虛無假設,使得檢定力愈高。
因此,樣本的總個數和各群組的分數個數
與檢定力之間為正向的關係。換句話說,當樣本總數
愈大的時候,各個群組的分數個數
也愈大,檢定力愈高。
總結來說,影響單因子變異數分析檢定力的3個因素裡,自變項的效果大小和樣本大小與檢定力為正向的關係,樣本變異與檢定力則為負向的關係。具體而言,當自變項的效果愈大或樣本數愈大,檢定力愈高;而當樣本的變異愈大,檢定力愈低(參考下表)。

瞭解了單因子變異數分析檢定力的影響因素後,下面來介紹利用軟體取得單因子變異數分析檢定力的方法,分別示範SPSS和G*Power的運用。
運用SPSS取得單因子變異數分析的檢定力
這裡使用單因子變異數分析的假設檢定裡的不同治療方法和輕度憂鬱症治療效果的例子,先將這個例子的資料輸入至SPSS資料編輯器裡。關於SPSS資料輸入的方法,請參考SPSS操作環境和資料輸入。
檢定力並不在SPSS功能表的分析 » 比較平均數 » 單因數變異數分析的執行視窗裡,而是在功能表的分析 » 一般線性模型 » 單變異數的「單變量」執行視窗裡。

一般線性模型(general linear model,簡寫為GLM)是一個概念上的數學模型,可用如下的線性方程式來表示單因子變異數分析裡任一位參與者的分數:
上面的方程式裡,指第
組裡第
位參與者的分數,
代表所有可能成為這個研究參與者的分數平均數,
指第
組的分數平均數和總平均數之間的差值,
為第
組的第
位參與者與其所屬組別平均數間的差值。
因此,運用SPSS執行單因子變異數分析的時候,除了使用比較平均數選單下的單因數變異數分析,也可以使用一般線性模型選單裡的單變異數。但若想取得分析結果的檢定力,僅有透過一般線性模型的執行方法才可。
在「單變量」視窗裡,將依變項SESSION移至應變數(D)長框裡、自變項GROUP移至固定因子(F)方框裡。接著,按下視窗右側邊的選項(O),會出現「單變量:選項」視窗,在顯示下的選項裡勾選觀察到的檢定力(B),若您想取得效果量也可勾選效應大小的估計值(E)。完成後,按下視窗下方的繼續(C),回到「單變量」視窗後,再按下確定。

SPSS會輸出如下的「Tests of Between-Subjects Effects」表,檢定力即在這個表格的「Observed Power」欄(由於中文的輸出表格在該欄的翻譯不太正確,所以這裡放上英文的輸出表格)。因為是單因子變異數分析,只有一個自變項,所以下表中「Corrected Model」和「GROUP」呈現出的資訊是一樣的,不論看哪一列都可以。

從上表可以看出,不同治療方法和輕度憂鬱症治療效果研究的檢定力為0.838,是相當高的檢定力,代表這個研究可以偵測到任何自變項可能存在的效果。
除了檢定力之外,透過一般線性模型的選單步驟,也可以取得效果量。從上表可看出,效果量
為0.534,代表不同的治療方法可以解釋輕度憂鬱症治療效果裡0.534或53.4%的變異,這樣的結果和單因子變異數分析的效果量裡透過SPSS功能表的分析 » 比較平均數 » 平均數的操作過程所得到的結果是相同的。
運用G*Power計算單因子變異數分析的檢定力
若您沒有SPSS,也可以使用G*Power來計算單因子變異數分析的檢定力。G*Power是一套功能很強大的免費軟體,可用來計算多種統計檢定方法的檢定力或達到某程度檢定力所需要的樣本數。雖然操作介面只有英文,但若理解檢定力的概念,操作起來並不會太困難。以下使用3.1.9.7的版本,示範取得單因子變異數分析檢定力的操作方法。
開啟G*Power後,暫且略過視窗上半部的圖形顯示區,直接看視窗的下半部。從Test family的下拉選單中選擇F tests,再從Statistical test的下拉選單中點選ANOVA: Fixed effects, omnibus, one-way。

接著,從Type of power analysis的下拉選單中選擇Post hoc: Compute achieved power – given α, sample size, and effect size,這個選項是計算研究完成後的檢定力。

完成上面的步驟後,開始輸入檢定力計算所需要的資訊。在Input Parameters方框裡,輸入研究的α水準(α err prob)、樣本總數(Total sample size)、群組數目(Number of groups)的數值。輸入完成後,按下Determine ⇒ 後會在右邊出現一個小視窗,在這裡輸入效果量(Effect size f)計算所需要的數值。

先整理出不同治療方法和輕度憂鬱症治療效果的例子裡每一群組的平均數、總平均數和每組的個數,如下表所示。此外,在這個研究裡,組內變異數估計值為1.9。

將上表中各組的平均數輸入至效果量計算的小視窗裡,SD σ within each group為組內變異數估計值的平方根,也就是
。輸入完成後,按下Calculate,會計算出Effect size f的數值,為0.9575832,再按下Calculate and transfer to main window,將這個數值輸出至主視窗Input Parameters的Effect size f裡。最後,按下主視窗下方的Calculate。
在Output Parameters方框裡,Power (1-β err prob)即為這研究的檢定力,數值為0.838(取至小數點後第3位),和上面利用SPSS的一般線性模型功能所計算出來的數值是相同的。

您可能會好奇為什麼這裡計算出來的效果量不同於單因子變異數分析的效果量裡的或
,原因在於
和
是從變異量的角度計算出來,而這裡的效果量是從平均數差值的角度計算出來。G*Power使用Cohen´s f 的效果量,下面稍微介紹這個效果量的概念和計算方法。
效果量的測量:Cohen´s f
Cohen(1988)的f 用來計算變異數分析(analysis of variance)的效果量,在單因子變異數分析且各群組的分數個數皆相等的情況裡,Cohen´s f 利用各個群組的平均數和總平均數差值的概念來計算整體的效果量。這種效果量的計算不同於變異量解釋的和
效果量,因此也不能做類似的解釋。
根據Cohen(1988),若各個群組的個數皆為、各個群組的平均數為
、總平均數為
、組內標準差為
、群組的組數為
,效果量
的公式如下:
若將上面的公式展開並轉換成如下的公式,會發現Cohen´s f 其實是各個群組的平均數轉換成標準分數(z分數)後,這些標準分數的標準差,也就是個平均數標準分數的標準差。
但「個平均數標準分數的標準差」的說法可能有點難理解,若換另一種方法來解釋,Cohen´s f 是類似於一種標準化的自變項整體的平均效果之概念。將Cohen´s f 的概念用在樣本上,讓
代表效果量、
為第
組的分數平均數、
為總平均數、
為組內變異數估計值、
為群組的組數,Cohen´s
的公式如下:
(9)
將不同治療方法和輕度憂鬱症治療效果例子的各組平均數、總平均數、組內變異數估計值和組數等數值帶入上面的公式(9),計算過程如下:
計算結果得到效果量為0.9576(四捨五入至小數點後第4位),這個數值和上面G*Power計算出來的效果量是相同的。因此,計算檢定力時,一般會使用以平均數差值為主的效果量,而不是變異量解釋的效果量。
Cohen(1988)對效果量提出了一套如下表的參考標準,
代表小效果量,
為中效果量,
則為大效果量。以不同治療方法和輕度憂鬱症治療效果的例子來看,0.9576屬於大效果量。不過,就像其他任何的參考指標,每個研究應依據所屬的專門領域,發展出適合該領域的效果量指標,才能做出最適當的解釋。

以上為本篇文章對單因子變異數分析統計檢定力的介紹,希望透過本篇文章,您瞭解了單因子變異數分析的檢定力影響因素,也學會了運用SPSS和G*Power取得檢定力的操作方法。
若您喜歡本篇文章,請將本網站加入書籤,作為您的學習資源,並持續回訪本網站喔!另外,您也可以在Facebook和Twitter上找到我們喲!
參考資料
Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, NJ: Lawrence Erlbaum Associates, Publishers.