變異數分析(analysis of variance,簡寫為ANOVA),是檢驗3個或3個以上群組的平均數是否有所不同的一種母數檢定。變異數分析可用來探討單一自變項或多個自變項和依變項之間的關係,當自變項只有一個且具有3個或3個以上的獨立類別(也就是不同的實驗情境)時,即為獨立群組的單因子變異數分析(one-way analysis of variance),以下直接稱「單因子變異數分析」。
當研究設計只有兩個獨立的群組時,例如實驗組和對照組,可以使用獨立樣本t檢定來探討兩個群組是否來自於平均數相同的母群體。若資料為次序尺度或獨立樣本t檢定的基本假設受到嚴重違反時,則可改使用無母數檢定裡的曼–惠特尼U檢定來比較兩個獨立的群組是否有所不同。
不過很多時候,行為或社會科學領域的研究不會侷限於兩個群組的比較,而是3個或更多群組之間差異的探討。例如除了單純地探討宣導課程的參與是否影響了兒童對身體虐待的認識,研究人員可能想更進一步瞭解什麼樣的宣導課程能夠讓兒童對身體虐待有更充足的認識,而各種不同類型的宣導課程是否影響兒童對身體虐待的認識程度即牽涉到3個或3個以上群組之間的比較。
本篇文章將介紹變異數分析裡最基本的類型,就是一個具有3個或3個以上類別的自變項和一個依變項的單因子變異數分析,而單因子變異數分析的假設檢定即是檢驗3個或3個以上的群組是否來自於平均數相同的母群體之虛無假設。由於文章內容牽涉到假設檢定,若您不清楚或不熟悉假設檢定的過程,建議您先閱讀假設檢定的步驟和範例,將有助於以下內容的理解。
單因子變異數分析的使用時機
單因子變異數分析是變異數分析裡最基本的一種類型,用來探討一個帶有3個或3個以上群組或類別的自變項和一個依變項之間的關係。由於群組間彼此獨立,屬於獨立樣本的研究設計,所以適用單因子變異數分析的研究設計又稱為簡單隨機群組設計(simple randomized-group design)或獨立群組的單因子實驗(single factor experiment)設計。
依據這樣的研究設計,研究人員從一母群體裡隨機抽取出研究參與者(或稱為受試者),再將這些研究參與者隨機分配至不同的實驗情境,最好是每一種實驗情境的參與人數都相同,而從各種實驗情境獲得的數據即為研究資料。這些不同的實驗情境就是自變項的群組或類別,例如探討不同的藥劑量對疾病的療效、不同的心理治療法對憂鬱減緩的效果、不同的課程類型對多元性別的認識程度,皆屬於單因子變異數分析的研究設計。
單因子變異數分析是一種綜合檢定(omnibus test),讓研究人員可以在單一實驗裡同時比較自變項的數個不同群組或類別(也就是實驗情境),藉此評估自變項和依變項之間是否存在著有意義的關係。由於行為或社會科學的範疇裡,大多時候很難將研究現象清楚地劃分為兩個群組或類別,所以能夠同時比較數個群組或類別的單因子變異數分析便可以讓研究人員探索和解釋更複雜的研究問題。
有人可能會質疑為何不使用數個獨立樣本t檢定來進行成對比較(或稱為兩兩比較)就好,原因在於若在單一實驗裡執行多重的獨立樣本t檢定,犯下第一類型錯誤的機率會提高。當執行單一的獨立樣本t檢定時,研究人員會將願意犯下第一類型錯誤的機率設為α,代表研究人員拒絕虛無假設時願意承擔錯誤的機率,這個α也稱為成對比較(pairwise comparison)的α,或稱為比較錯誤率(comparisonwise error rate)。
但是當在單一實驗裡進行多個獨立樣本t檢定的t檢定統計量運算時,由於不斷地使用同樣的平均數和變異數,已違反了樣本間彼此獨立的假設,所以提高了第一類型錯誤的機率。換句話說,若在單一實驗裡進行多個成對平均數的比較,犯下第一類型錯誤的機率會高於α,而這時的第一類型錯誤機率稱為實驗錯誤率(experimentwise error rate)且可用下面的公式計算:
上面的公式裡,α指成對比較的α,c指成對平均數比較的數目。運用這個公式,若在單一實驗裡進行6個成對平均數的比較、成對比較的α為0.05時,實驗錯誤率為,代表犯下第一類型錯誤的機率為0.265,也就是有26.5%的機會研究人員會拒絕一個或數個真實的虛無假設。
此外,執行多個成對平均數的比較也無法回答最基本的研究問題,就是自變項和依變項之間是否存在著有意義的關係。反觀單因子變異數分析,不但解決了第一類型錯誤增加的問題,也能夠檢驗自變項整體和依變項之間是否有關聯,顯然是個較佳的統計檢定方法之選擇。
因此,若要探討一個帶有3個或3個以上群組或類別的自變項和一個依變項之間的關係,單因子變異數分析是一種很合適的統計檢定方法。瞭解了單因子變異數分析的使用時機後,下面來看看這種統計檢定的研究假設撰寫方法。
單因子變異數分析的研究假設
研究假設可分為虛無假設()和對立假設(),虛無假設主張自變項的效果不存在,而對立假設主張自變項的效果存在。因為單因子變異數分析同時檢驗3個或3個以上的群組,所以虛無假設陳述自變項沒有效果,群組之間沒有差異存在。假設有k個群組,虛無假設可寫成:
其中,指第1個群組來自的母群體平均數、指第2個群組來自的母群體平均數、指第3個群組來自的母群體平均數、指第k個群組來自的母群體平均數。換句話說,虛無假設主張所有的群組都是來自於平均數相同的母群體之隨機樣本,而任何平均數間的差異皆導因於隨機因子(random factors)或抽樣誤差。
對立假設會陳述自變項有效果,且群組之間有差異存在。由於單因子變異數分析是一種綜合檢定,同時比較3個或3個以上的平均數,所以不會在對立假設裡明確地指出哪一個平均數如何地不同於哪一個平均數,屬於一種沒有方向性的對立假設。
在單因子變異數分析裡,只要有一個群組的平均數明顯地不同於至少另一個群組的平均數,即可拒絕虛無假設。通常在確定自變項和依變項之間有顯著的關係後,研究人員才會進一步實施一連串的事後分析,評估哪些成對的平均數間有顯著的不同。
單因子變異數分析的檢定統計量
單因子變異數分析顧名思義,是透過變異數的計算來求得F檢定統計量,也稱為F值。單因子變異數分析把總變異數(total variance)劃分成組內變異數(within-group variance)和組間變異數(between-group variance),而F值就是組間變異數估計值和組內變異數估計值的比率。下面分別探討組內變異數和組間變異數的定義與估計值的計算方法。
組內變異數估計值
組內變異是指存在於各個群組內的變異,也就是一個群組裡研究參與者之間的差異,這些差異通常是研究人員無法掌控的隨機誤差和因子所造成。研究人員假設這些隨機誤差呈現常態分配且平均數為0,長遠來看,不會影響母群體的平均數,但確實會存在一個變異數。
由於每一個群組內的分數都存在一個變異數,所以組內變異數就是群組內分數變異數的平均值。從概念上來看,讓代表第組的第個分數、代表第組的分數個數、為第組的分數平均數、為群組的組數,組內變異數估計值的公式如下:
(1)
和獨立樣本t檢定一樣,變異數分析同樣帶有變異數同質性(homogeneity of variance)的基本假設,若自變項帶有效果,只有群組的平均數會受到影響,變異數則維持不變。換句話說,單因子變異數分析假設各個群組來自的母群體變異數都是相同的,可用下列的符號來呈現:
由於組內變異數估計值為所有組內變異數的平均值,在各個群組來自的母群體變異數皆相同的基本假設下,組內變異數估計值即為母群體變異數的不偏估計值(unbiased estimate)。
公式(1)為概念上的公式,便於理解組內變異數的意義,但若要使用這個公式來進行紙筆運算,過程中可能會面對許多的小數,容易造成計算錯誤,因此可改使用運算上的公式來計算。
運算公式須計算出平方和(sum of squares)與自由度(degrees of freedom),讓代表第組的第個分數、代表第組的分數總和、代表第組的分數個數,組內平方和與組內自由度的公式如下:
(2)
上面使用來表示組內變異數的估計值,但統計分析軟體會使用離差平方和的平均值(mean squares),也稱為均方,來表示變異數估計值,雖然表現的方式不一樣,但都代表相同的意思。使用這個代稱,組內變異數估計值的寫法變成,且計算公式如下:
(3)
從上面的公式(3)可以知道,只要先求出組內的平方和與組內的自由度,再用組內平方和除以自由度,即可得到組內變異數估計值。整個運算過程只使用到原始分數,不需要計算出可能帶有小數的平均數,可以大幅地降低運算上的錯誤。
組間變異數估計值
組間變異是指群組平均數之間的變異,概念上來說,是將每一個群組的平均數視為一個分數,然後計算出這些平均數之間的變異數。組間變異數和組內變異數的差異在於,組間變異數在估計群組平均數之間的變異數,而組內變異數在估計群組內分數的平均變異數。
讓代表第組的分數平均數、代表所有分數的平均數(總平均數)、指第組的分數個數、為群組的組數,組間變異數估計值在概念上可用下面的公式來呈現:
(4)
組間變異數估計值其實是由誤差變異數(error variance)和自變項效果導致的群組平均數間的變異數所組成。誤差變異數是隨機因子造成的個別分數間的差異,研究人員無法掌控或預測,而組內變異數就是用來估計誤差變異數。因此,組間變異數估計值可寫成:
和組內變異數估計值一樣,若使用概念上的公式(4)來計算組間變異數估計值,運算過程中可能充斥著許多小數,很容易造成運算上的錯誤,因此也可以改使用組間的平方和與組間的自由度來計算。
讓代表第組的第個分數、代表第組的分數總和、指第組的分數個數、為所有的分數個數(樣本數)、為群組的組數,組間平方和與組間自由度的計算方式如下:
(5)
組間變異數估計值即為組間平方和除以組間自由度,公式如下:
(6)
使用上面的公式(6)進行運算時,只需要用到原始分數,不需要計算出各個群組的平均數和總平均數,可以大幅地降低運算錯誤。
F值
單因子變異數分析使用F分配和F檢定統計量,F檢定統計量也稱為F值(F-ratio),即是組間變異數估計值和組內變異數估計值的比率,公式如下:
(7)
由於變異數分析假設自變項的效果僅會影響一組的平均數,而不會影響變異數,所以組內變異數估計值不會因為自變項的效果而有所改變。從這個角度來看,若自變項的效果愈大,F值也會愈大,也愈有可能拒絕虛無假設。
在求得F值之後,查詢F分配臨界值表,根據組內(分母)自由度、組間(分子)自由度和顯著水準(α水準),找到F臨界值。比較F值和F臨界值,若F值等於或大於F臨界值,即可拒絕虛無假設,接受對立假設。
此外,上面提到組間變異數估計值為誤差變異數加上自變項效果所致的群組間平均數之變異數,而組內變異數就是用來估計誤差變異數。從這方向來看,F值還可以用下面的公式來呈現:
上面的公式指出,若自變項沒有效果,F值會等於1。換句話說,F臨界值最小會是1,若從資料計算出來的F值小於1,代表自變項不存在效果,此時無須和F臨界值比較,即可保留虛無假設。
瞭解了單因子變異數分析的研究假設寫法和檢定統計量的計算方法後,下面舉個例子來實際操作單因子變異數分析的假設檢定。
單因子變異數分析的假設檢定
假設有一位心理學家想探討不同的治療方法對輕度憂鬱症的治療效果,他從輕度憂鬱症個案中隨機抽取出15位,再隨機分配5位至放鬆治療組(relax)、5位至談話治療組(talk)、5位至安慰劑控制組(placebo)。所有的治療持續到個案被診斷不再具有憂鬱的症狀或已經進行了10次的治療,下表為15位個案接受治療的次數。使用,試問不同的治療方法是否影響輕度憂鬱症的治療效果?
這個研究的自變項為治療方法,帶有3個群組(3種治療方法),依變項為治療效果。因為單因子變異數分析是種沒有方向性的統計檢定方法,所以不會在對立假設裡指出自變項效果的方向,只會指出自變項效果的存在與否。這個研究的虛無假設和對立假設分別為:
- 虛無假設():不同的治療方法不會影響輕度憂鬱症的治療效果,3個群組間的平均數差異是由隨機因子或抽樣誤差所造成,也就是。
- 對立假設():不同的治療方法會影響輕度憂鬱症的治療效果,3個群組間的平均數差異並非單純地由隨機因子或抽樣誤差所造成。
研究假設擬定完成後,依據研究的性質、目的和可能帶來的後果,選擇適當的顯著水準(也就是α水準),通常為0.05或0.01,這個例子裡的心理學家選擇了0.05的α水準。
因為這位心理學家想同時比較3種不同的治療方法對輕度憂鬱症的效果,也就是探討一個帶有3個群組的自變項和一個依變項之間的關係,所以單因子變異數分析是合適的統計檢定方法。
為了評估是否能拒絕虛無假設,須先計算出F檢定統計量,也就是F值。運用上面的公式(2)、(3)和公式(5)、(6),分別求得組內變異數估計值和組間變異數估計值後,再計算出F值。先把套用公式所需的數值在如下的表格裡計算出來:
將上面表格裡的數值帶入公式(2)、(3),計算組內平方和、組內自由度和組內變異數估計值,計算過程如下:
同樣地,將上面表格裡的數值帶入公式(5)、(6),計算組間平方和、組間自由度和組間變異數估計值,計算過程如下:
最後,將計算出來的組內變異數估計值和組間變異數估計值帶入公式(7),求得F值:
計算結果得到F值為6.877,然後查詢F分配臨界值表,在分子自由度為2、分母自由度為12、α水準為0.05的時候,F臨界值為3.89。關於F分配臨界值表的解讀方法,請參考F分配的定義和F分配臨界值表的解讀。
比較F值和F臨界值,因為,所以拒絕虛無假設,接受對立假設。單因子變異數分析的結果顯示,不同的治療方法會影響輕度憂鬱症的治療效果。
單因子變異數分析的基本假設
單因子變異數分析是一種對樣本來自的母群體有特定假設的母數檢定,其假設類似於獨立樣本t檢定的基本假設。這些基本假設包括下面3點:
- 常態分配:每一個群組裡的資料呈現常態分配,也就是說,各個樣本來自的母群體皆為常態分配。
- 變異數同質性(homogeneity of variance):各個樣本來自的母群體變異數是相等的,也就是。
- 觀察值之間彼此獨立:每一個樣本裡的觀察數值(也就是透過測量而得到的資料)都彼此獨立。換句話說,任一成對的觀察值之間都不具有系統性的關聯。
原則上,單因子變異數分析是一種穩健(robust)的檢定方法,在常態分配和變異數同質性的假設受到違反的情況下,分析結果仍舊是有效的。和常態分配假設的違反相較,變異數同質性假設的違反通常會帶來較大的影響。若您有任何理由可以預期樣本之間的變異不會相等,建議儘量讓各個樣本的數目相同,可大幅地降低變異數同質性假設受到違反所帶來的影響(Glass, Peckham, and Sanders, 1972)。
觀察值間彼此獨立的假設則與研究方法有關,為了能夠將單因子變異數分析的分析結果正確地推論至母群體中,觀察值間必須彼此獨立。若是真實驗(true experiment)的研究設計,應隨機分配研究參與者至不同的實驗情境裡;若是原樣團體(intact group)的研究設計,則應確保一個群組內的參與者所接受的測量不會去影響到另一個群組的參與者所接受的測量。
運用SPSS執行單因子變異數分析
將上面範例的資料輸入至SPSS資料編輯器裡,一共有3個變項。變項ID為15位研究參與者的編碼,變項GROUP為不同的治療方法組別,標籤值1為放鬆治療組、標籤值2為談話治療組、標籤值3為安慰劑控制組,變項SESSION為每位研究參與者接受的治療次數。關於SPSS的資料輸入方法,請參考SPSS操作環境和資料輸入。
資料輸入完成後,點選功能表的分析 » 比較平均數 » 單因數變異數分析,帶出「單因子變異數分析」視窗。
在「單因子變異數分析」視窗裡,將變項SESSION移至依變數清單(E)方框中,分組變項GROUP移至因子(F)長框裡。點選視窗右側的選項(O),會出現「單因子變異數分析:選項」視窗,在這個視窗的統計量選項裡,勾選敘述統計(D)和變異同質性檢定(H),完成後按下繼續(C)。回到「單因子變異數分析」視窗後,再按下視窗下方的確定。
經過上面的步驟,SPSS會輸出3個表格。第1個表格為「敘述統計」表,顯示各個群組的個數、平均數、標準差、最小值、最大值等描述性統計量。
第2個表格為「變異數同質性檢定」表,利用Levene檢定來檢驗變異數同質性的假設。如同其他統計檢定方法的假設檢定過程,Levene檢定檢驗的虛無假設,若檢定結果的值小於或等於0.05,代表群組間的變異不相等;相反地,若檢定結果的值大於0.05,則代表群組間的變異相等。
上表顯示不同計算方法的Levene檢定,較常使用平均數為依據的方法,所以看第一列「根據平均數」的檢定結果。這個結果指出顯著性(值)為0.401,因為,所以保留虛無假設,代表3種不同治療方法組別間的變異是相同的,滿足了變異數同質性的基本假設。
第3個表格為「變異數分析」表,也就是單因子變異數分析的分析結果。從下表可看出,組間平方和、組間自由度、組間均方(組間變異數估計值)、組內平方和、組內自由度、組內均方(組內變異數估計值)和F值的數值皆和上面紙筆計算的結果相同。
和紙筆計算不同的地方在於,統計分析軟體會輸出獲得F值的機率,而不是F臨界值。為了評估研究結果,須比較值和事先設定的α水準,若,即可拒絕虛無假設,接受對立假設;反之,若,則保留虛無假設。
從上表可看出,獲得F值為6.877的機率(顯著性)為0.010。和事先設定的α水準0.05相比較,因為,所以拒絕虛無假設,接受對立假設。單因子變異數分析的結果顯示,不同的治療方法會影響輕度憂鬱症的治療效果。
撰寫研究結果時,社會或行為科學領域很常使用美國心理學會論文格式(Publication Manual of the American Psychological Association),簡稱為APA格式,目前版本為第7版。以上面的分析結果為例,APA格式建議的撰寫格式為,括弧裡先寫分子(組間)的自由度,再寫分母(組內)的自由度。
若您沒有SPSS或其他的統計分析軟體,可以使用微軟的Excel來執行單因子變異數分析,不過須先安裝「分析工具箱」(Analysis ToolPak)才能使用,詳細的操作過程請參考如何使用Excel執行單因子變異數分析。
當分析結果為拒絕虛無假設時(也就是F值達到統計上顯著),您可能想進一步探討哪些群組間存在差異,此時須進行事後比較,請參考單因子變異數分析的事後比較、Scheffé檢定:使用F分配的事後比較、Dunnett檢定:單一控制組和其他群組的比較。相反地,若您在資料蒐集前即擬定好群組間比較的研究假設,並沒有一定要進行單因子變異數分析,請參考單因子變異數分析的事前比較。
此外,若您想瞭解研究設計裡自變項的效果大小,請參考單因子變異數分析的效果量。如果單因子變異數分析的綜合檢定結果沒有達到統計上顯著,您想探討統計檢定力的影響因素和研究的檢定力大小,請參考單因子變異數分析的統計檢定力。
以上為本篇文章對單因子變異數分析假設檢定的介紹,希望透過本篇文章,您瞭解了單因子變異數分析的使用時機、研究假設的寫法、F值的計算方法和假設檢定的過程,也學會了利用SPSS執行單因子變異數分析的操作方法。
若您喜歡本篇文章,請將本網站加入書籤,作為您的學習資源,並持續回訪本網站喔!另外,您也可以在Facebook和Twitter上找到我們喲!
參考資料
Glass, G. V., Peckham, P. D., & Sanders, J. R. (1972). Consequences of failure to meet assumptions underlying the fixed effects analysis of variance and covariance. Review of Educational Research, 42(3), 237-288. https://doi.org/10.3102/00346543042003237