🐟 請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址
費雪精準檢定的使用時機和範例解說
當我們使用統計分析軟體如 SPSS 執行卡方檢定時,在分析結果的輸出表格下方通常會有一個註解,顯示「0 cells (.0%) have expected count less than 5 」,指出沒有任何細格(儲存格)的期望次數少於5。不過,如果有1個或數個細格的期望次數少於5時,雖然卡方檢定的結果仍舊值得參考,但此時還有一種更合適的檢定方法,稱為費雪精準檢定(Fisher´s exact test)。
費雪精準檢定和卡方獨立性檢定一樣,適用在2個名義尺度變項間的關聯探討上。不過不同於卡方獨立性檢定,費雪精準檢定無須利用期望次數來計算卡方檢定統計量,而是直接利用形成列聯表的觀察次數來計算得到這樣一個列聯表的精準機率(exact probability)。
下面將先介紹費雪精準檢定的使用時機,再利用一個例子說明費雪精準檢定的假設檢定過程,最後示範運用 SPSS 執行這個檢定的方法。由於文章內容為卡方獨立性檢定的延伸,建議您先閱讀卡方獨立性檢定的假設檢定。另外,若您不清楚或不熟悉假設檢定的過程,也建議您參考假設檢定的步驟和範例,將有助於文章內容的理解喔!
費雪精準檢定的使用時機
費雪精準檢定用來探討2個名義尺度變項間的關係,而每一個變項僅有2個類別(也就是二分變項),會形成一個2X2列聯表。費雪精準檢定是在列聯表的邊際合計(marginal totals)維持不變的情況下,列出所有可能的2X2列聯表與獲得各個表格的機率,然後把原本觀察次數形成的列聯表機率加上比原本列聯表機率更為極端結果的機率,就是費雪精準檢定的機率值。
由於卡方檢定統計量的抽樣分配趨近於卡方分配的分布型態,當樣本數愈大時,會愈趨近於卡方分配,但當樣本數愈少時,則會偏離卡方分配,使得顯著性檢定的結果變得較不準確。這也是為什麼統計分析軟體如 SPSS 會在卡方檢定的分析結果表格下方顯示有多少個細格的期望次數少於5的註解,因為期望次數少於5時,可能代表著樣本數過小,卡方檢定統計量的抽樣分配偏離卡方分配,分析結果可能無法反映真實的情況。
為了解決這個小樣本造成的問題,Fisher(1922)提出了獲得一特定列聯表的精準機率的計算方法,即是現在為人熟知的費雪精準檢定(Fisher´s exact test)。費雪精準檢定不會計算檢定統計量,而是直接計算出機率(值),再比較這個
值和事先設定的顯著水準(α水準),當
值小於或等於α水準時,就可拒絕虛無假設。
因此,費雪精準檢定是探討2個名義尺度變項間的關聯性,且適用在①樣本數較小或②任何細格的期望次數少於5的2X2列聯表的一種無母數檢定。雖然費雪精準檢定也可以用在較大的列聯表或較多樣本數的時候,但因為要在邊際合計固定的情況下計算出所有可能出現的列聯表機率,牽涉到密集的電腦運算,所以統計分析軟體需要較長的時間才能傳回分析的結果。
一般來說,在樣本數較大的時候,直接執行卡方獨立性檢定即可,沒有必要使用費雪精準檢定,畢竟這本來就是為了小樣本而發展出來的一種無母數檢定方法。瞭解了費雪精準檢定的使用時機後,下面利用一個範例來說明假設檢定的過程。
費雪精準檢定的範例解說
假設有一位研究人員想探討城鄉地區的居民對於陌生人的求助行為是否會有不同的反應,他給15位研究參與者一個陌生人需要幫助的假想情境,並調查他們的幫助意願。若居住地區的2個類別為城市與鄉村,而幫助意願的2個類別為幫助和不幫助,這個2X2列聯表的資料如下表。如果顯著水準(α水準)為0.05、雙尾檢定,採用費雪精準檢定,試問居住地區和對陌生人的幫助意願是否有關聯?
城市 | 鄉村 | 列合計 | |
---|---|---|---|
幫助 | 2 | 4 | 6 |
不幫助 | 6 | 3 | 9 |
欄合計 | 8 | 7 | 15 |
這個研究想探討居住地區和對陌生人的幫助意願是否有關聯,並且採取雙尾檢定,研究假設的虛無假設和對立假設分別如下:
- 虛無假設(
):居住地區和對陌生人的幫助意願沒有關聯。
- 對立假設(
):居住地區和對陌生人的幫助意願有關聯。
費雪精準檢定不計算檢定統計量,而是計算當觀察次數形成的列聯表之邊際合計被固定時,各種可能出現的2X2列聯表的機率。把觀察次數形成的列聯表機率加上比這個列聯表更極端的表格機率,就是單尾檢定的機率,而雙尾檢定的機率有2種計算方法:
- 單尾檢定的機率乘以2;
- 觀察次數的列聯表機率加上所有小於這個列聯表機率的其他表格機率,也等於單尾檢定機率加上小於原本觀察次數列聯表機率的其他表格機率。
假設樣本總數為,第1欄第1列的細格觀察次數為
,第1列和第2列的邊際合計分別為
和
而第1欄和第2欄的邊際合計分別為
和
,如下表。
Column 1 | Column 2 | Total | |
---|---|---|---|
Row 1 | n | r | |
Row 2 | c-n | N-r | |
Total | c | N-c | N |
在邊際合計固定的情況下,當虛無假設是真實的時候,得到第1欄第1列的細格觀察次數為的機率可使用超幾何分配(hypergeometric distribution)且計算方式如下(Conover,1999):
(1)
上面的公式裡,、
和
的驚嘆號是指「階乘」運算,如果您不清楚階乘的計算方法,可以參考社會統計常用的基本數學符號和運算。
以這裡的例子來看,第1欄第1列為住在都市且有幫助陌生人意願的人,觀察次數為2,利用上面的公式(1)來計算在邊際合計固定時獲得這個觀察次數的機率,過程如下:
因為2X2列聯表的自由度為1,代表當1個細格的次數被決定後,其他細格的次數也隨著被決定,所以只要改變第1欄第1列的細格次數,就可列出所有可能的列聯表情況。接著計算在邊際合計固定時,第1欄第1列的細格觀察次數少於2時的其他列聯表的機率,並把所有的計算結果都四捨五入到小數點後第4位。
城 | 鄉 | |
---|---|---|
幫 | 1 | 5 |
不幫 | 7 | 2 |
城 | 鄉 | |
---|---|---|
幫 | 0 | 6 |
不幫 | 8 | 1 |
把第1欄第1列的細格觀察次數為2的列聯表(也就是原本觀察次數形成的列聯表)機率加上上面2個更極端結果的列聯表機率,就是單尾檢定的機率。
由於這個例子採用雙尾檢定,所以須求得雙尾檢定的機率。除了上面已經計算出來的3個列聯表機率外,還需要計算在邊際合計固定時大於第1欄第1列的細格觀察次數為2的4個列聯表機率,運算過程如下。
城 | 鄉 | |
---|---|---|
幫 | 3 | 3 |
不幫 | 5 | 4 |
城 | 鄉 | |
---|---|---|
幫 | 4 | 2 |
不幫 | 4 | 5 |
城 | 鄉 | |
---|---|---|
幫 | 5 | 1 |
不幫 | 3 | 6 |
城 | 鄉 | |
---|---|---|
幫 | 6 | 0 |
不幫 | 2 | 7 |
在獲得了所有可能的2X2列聯表機率後,便可計算雙尾檢定的機率。上面提到雙尾檢定機率的計算方法有2種,第1種是直接把單尾檢定的機率乘以2,計算結果為0.4616。
第2種方法是把單尾檢定機率加上小於原本觀察次數列聯表機率的其他表格機率,原本的列聯表機率為0.1958,而小於這個機率的表格為細格觀察次數為5和6的表格,所以雙尾檢定的機率為:
這2種計算方法得到的結果不太相同,但2者都是有效的值。不論是哪一個數值,都大於事前設定的α水準0.05,所以要保留虛無假設。也就是說,費雪精準檢定的分析結果指出居住地區和對陌生人的幫助意願沒有關聯。
從上面的說明可以發現,費雪精準檢定是在原本觀察次數形成的列聯表之邊際合計固定的情況下,計算出所有可能產生的列聯表機率,過程相當費時。因此,若要進行費雪精準檢定,一般會依靠統計分析軟體,利用軟體輸出的雙尾檢定和單尾檢定的機率來評估分析的結果,下面來示範運用 SPSS 執行費雪精準檢定的操作方法。
運用 SPSS 執行費雪精準檢定
在上面居住地區和幫助陌生人意願的例子裡,若居住地區(LOCATION)的編碼為0代表城市而1代表鄉村,幫助陌生人意願(HELP)的編碼為0代表有幫助意願而1代表沒有幫助意願,輸入至 SPSS 的資料會如下圖。關於 SPSS 資料輸入的方法,請參考SPSS操作環境和資料輸入。

資料輸入完成後,點選功能表的分析 » 敘述統計 » 交叉資料表,帶出「交叉表」視窗。

在「交叉表」視窗裡,先把幫助意願 HELP 移到列(O)長框裡,再把居住地區 LOCATION 移到欄(C)長框裡。接著,點選視窗最右側的精確(X),在「精確檢定」視窗裡勾選精確(E),這就是費雪精準檢定的選項,完成後按下視窗下方的繼續(C)。
回到「交叉表」視窗後,再點選統計量(S),在「交叉資料表:統計量」視窗裡勾選卡方檢定(H),完成後按下視窗下方的繼續(C)。若想看到列聯表裡各個細格的期望次數,可以在「交叉表」視窗裡點選資料格(E),然後勾選計數方框裡的期望值(E)。完成所有的勾選後,按下「交叉表」視窗下方的確定。

經過上述的步驟後,SPSS 會輸出如下的列聯表。列聯表裡的觀察次數即為上面例子裡列聯表的細格資料,除了觀察次數外,還有期望次數,可以看到每個細格的期望次數都小於5。

費雪精準檢定的結果可在卡方檢定的表格裡看到,從下圖可看出,費雪精準檢定沒有檢定統計量,只有雙尾檢定和單尾檢定的機率。雙尾檢定的機率為0.315,而單尾檢定的機率為0.231,可以發現 SPSS 的費雪精準檢定的雙尾檢定機率是使用文章內提到的第2種計算方法。

最後,比較雙尾檢定的機率和α水準,因為,所以保留虛無假設。透過 SPSS,費雪精準檢定的分析結果指出居住地區和對陌生人的幫助意願沒有關聯。
由於大多數的統計分析軟體都已內建費雪精準檢定的分析,所以要執行這種檢定並不困難。然而,費雪精準檢定向來存在爭議,其中一個挑戰是這個檢定是在列聯表的邊際合計固定的條件下進行,不過這種方式忽略了重複相同的研究會帶來的不同邊際合計結果。另一個挑戰則是單尾檢定和雙尾檢定機率的計算,到底怎麼樣才構成極端結果一直沒有定論,使得雙尾檢定機率的計算方法不只一種(Howell,2012)。
儘管費雪精準檢定存在爭議,但仍舊被廣泛地使用。雖然卡方獨立性檢定在探討2個名義尺度變項間的關聯時是一個很好的檢定方法,但在樣本數較小的時候會面臨分析結果可能無法反映真實情況的困境,此時費雪精準檢定可能是一個更合適的檢定方法,分析結果也值得做參考喔!
以上為本篇文章對費雪精準檢定的介紹,希望透過本篇文章,您瞭解了費雪精準檢定的使用時機和背後的運算邏輯,也學會了運用 SPSS 執行這個檢定的方法。若您喜歡本篇文章,請將本網站加入書籤,並隨時回訪本網站喔!另外,也歡迎您追蹤本網頁的 Facebook 和/或 X(Twitter)專頁喲!
如果您覺得本篇文章對您有幫助,歡迎您買杯珍奶給 Dr. Fish!小小珍奶,大大鼓勵,您的支持將給 Dr. Fish 更多撰寫優質文章的動力喔!
參考資料
Conover, W. J. (1999). Practical nonparametric statistics. John Wiley & Sons, Inc.
Fisher, R. A. (1922). On the interpretation of from contingency tables, and the calculation of P. Journal of the Royal Statistical Society, 85(1), 87-94. https://doi.org/10.2307/2340521
Howell, D. C. (2012). Statistical methods for psychology. Wadsworth, Cengage Learning.