🐟 請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址
第一和第二類型錯誤的意義和關聯
任何統計檢定的假設檢定過程中,都會藉由蒐集到的資料去計算出檢定統計量和獲得這個檢定統計量的機率,以便用來評估自變項是否有效果,並決定是否拒絕虛無假設。但在評估虛無假設是否為真實的過程中,研究人員可能會犯下兩種錯誤,分別為第一類型錯誤和第二類型錯誤。
第一類型錯誤和第二類型錯誤是推論統計裡很重要的概念,下面將先介紹這兩類型錯誤的意義,再說明他們之間的關聯。本篇文章牽涉到假設檢定過程裡研究假設、顯著水準、決策規則和檢定統計量等各個層面,建議您可先閱讀研究假設的種類和寫法、顯著水準和決策規則、檢定統計量的意義,將有助於以下內容的理解。
第一類型錯誤和第二類型錯誤的意義
假設檢定的結果不外乎兩種:自變項有效果,所以拒絕虛無假設,接受對立假設;或自變項沒有效果,所以保留虛無假設。不過,研究人員無法百分之百地確定研究結果一定是正確的,很有可能自變項實際上沒有效果,但研究結果顯示有效果;或自變項實際上有效果,但研究結果卻指出沒有效果。因此,假設檢定的決策可能會出現兩種錯誤,這兩種錯誤的名稱和意義分別為:
- 第一類型錯誤(Type Ⅰ error):拒絕一個真實的虛無假設。
- 第二類型錯誤(Type Ⅱ error):保留一個錯誤的虛無假設。
第一類型錯誤是指研究人員相信自變項帶有效果,但實際上自變項並沒有效果。這個錯誤的機率通常為0.05或更為嚴苛的0.01,就是資料蒐集前已設定好的顯著水準,而第一類型錯誤機率為0.05的意思是若複製研究100次,研究人員可預期其中會有5次自變項實際上沒有效果卻出現拒絕虛無假設的結果。由於顯著水準也稱為α水準,所以第一類型錯誤的機率可用符號α來表示。
第二類型錯誤是指研究人員相信自變項沒有效果,但實際上自變項帶有效果,而這類型錯誤的機率通常用符號β來表示。Cohen(1992)建議能夠被接受的第二類型錯誤的最大機率為0.2,也就是說,若從自變項帶有效果的母群體中,隨機抽取出樣本100次,則其中會有20次研究人員無法測量到自變項的效果。
因此,假設檢定過程的最後階段,藉由決策規則所得到的研究結果和母群體的真實狀況之間會出現下面表格所呈現的4種結果:

當保留真實的虛無假設或拒絕錯誤的虛無假設時,皆為正確的決定。不過,當研究人員拒絕虛無假設,但實際上虛無假設是真實的時候,研究人員犯了第一類型錯誤。反之,當研究人員保留虛無假設,但實際上虛無假設是錯誤的時候,研究人員則犯了第二類型錯誤。
若更進一步地將決策過程中4種結果的機率呈現出來,則會如下表。當第一類型錯誤的機率為α時,保留真實的虛無假設之機率為
。另一方面,當第二類型錯誤的機率為β時,拒絕錯誤的虛無假設之機率為
,而這個拒絕一個錯誤虛無假設的機率即稱為統計檢定力(power),左右著一個研究發現真實的能力。

但是,第一類型錯誤和第二類型錯誤並非各自獨立,兩者之間實具有密切的關係。研究人員可能採用較為嚴苛的顯著水準,例如0.01或0.001,試圖降低第一類型錯誤的機率,不過這樣的選擇卻會提升第二類型錯誤的機率,接著就來看兩類型錯誤間的關聯。
第一類型錯誤和第二類型錯誤間的關聯
第一類型錯誤和第二類型錯誤之間並非彼此獨立,而是相互消長,當降低其中一個錯誤的機率時,另一個錯誤的機率就會提高。舉個例子來看,假設研究人員設定顯著水準(α水準)為0.05,資料蒐集完成後,分析時發現獲得特定檢定統計量的機率或模型適配的機率(值)為0.03,依據決策規則,
,所以拒絕虛無假設,接受對立假設。
若研究人員想降低第一類型錯誤的機率,將顯著水準改設為0.01,在適配模型的機率仍舊為0.03的情況下,因為,所以保留虛無假設。由此可見,設定較嚴苛的顯著水準,雖然降低了拒絕真實的虛無假設(第一類型錯誤)之機率,卻提高了保留錯誤的虛無假設(第二類型錯誤)之風險,請見下表。

由於第一類型錯誤和第二類型錯誤是立基於不同的假設:犯下第一類型錯誤必須是母群體中自變項不存在效果,第二類型錯誤則是母群體中自變項存在效果,所以兩種錯誤之間的關係並非顯而易見。即便知道降低第一類型錯誤的機率會提升第二類型錯誤的機率,也很難訂立一標準去取得兩種錯誤之間的平衡。
雖然第一類型錯誤和顯著水準有關聯,但這並不表示真相取決於顯著水準的數值,嚴苛的顯著水準只是降低犯下第一類型錯誤的機率而已。顯著水準的選擇通常會因為研究的性質、目的和錯誤結論可能造成的後果而有不同。
若研究為探索(exploratory)性質,目的在於初步探究一個議題,視研究結果再決定是否進行更深入的探討,第一類型錯誤通常可被容忍,所以可選擇較寬鬆的顯著水準。反之,若研究為解釋(explanatory)性質,目的在於建立因果關係並推論至其他的群體,因為錯誤的結論可能帶來嚴重的後果,所以研究人員寧願降低第一類型錯誤的機率,承擔第二類型錯誤的風險。
由於沒有一個研究能夠百分之百確信研究結果為正確的,所以需要重複驗證(replication)。在一個研究結果能夠廣泛地被科學界接受前,必須經過反覆的驗證,而非藉由單一研究的發現即可被視為真實。因此,重複驗證不但能夠提高研究結果的可信度,也可以大幅降低犯下第一類型錯誤的機率。
以上為本篇文章對於第一類型錯誤和第二類型錯誤的介紹,希望透過本篇文章,您瞭解了第一類型錯誤和第二類型錯誤的意義以及這兩種錯誤之間的關聯。
若您喜歡本篇文章,請將本網站加入書籤,作為您的學習資源,並持續回訪本網站喔!另外,您也可以在Facebook和Twitter上找到我們喲!
參考資料
Cohen, J. (1992). A power primer. Psychological Bulletin, 112(1), 155-159. https://doi.org/10.1037/0033-2909.112.1.155