Skip to content

合作邀約 email: dr.fish@drfishstats.com

  • Facebook
  • X
site icon of Dr. Fish

Dr. Fish 漫游社會統計

魚博士的專業漫談和課後隨筆

  • Home
  • 關於Dr. Fish
  • 統計基礎
    • 入門概念
    • 圖形繪製
    • 描述統計
    • 相關
    • 線性迴歸
  • 統計進階
    • 推論統計
    • 統計檢定
      • 相關係數
      • 迴歸
      • 平均數比較
      • 無母數檢定
  • EXCEL系列
    • 資料管理
    • 圖形繪製
      • 匯出SPSS資料至Excel並繪製盒形圖
      • 如何使用Excel製作Q-Q plot
      • 如何使用Excel繪製加上誤差線的長條圖
    • 描述統計
      • 如何使用Excel執行次數分配
      • 如何使用Excel樞紐分析表製作次數分配表
      • 如何使用Excel計算偏態和峰態
      • 如何使用Excel尋找常態曲線下面積或分數
      • 如何使用Excel一次取得描述性統計量
      • 如何使用Excel計算共變異數
      • 如何使用Excel取得皮爾森積差相關係數
      • 如何使用Excel製作列聯表
    • 推論統計
      • 如何使用Excel計算信賴區間
      • 如何使用Excel執行符號檢定
      • 如何使用Excel執行單一樣本z檢定和t檢定
      • 如何使用Excel執行獨立樣本t檢定
      • 如何使用 Excel 執行 Levene 檢定
      • 如何使用Excel執行關聯樣本t檢定
      • 如何使用Excel執行單因子變異數分析
      • 如何使用Excel執行簡單線性迴歸
      • 如何使用Excel計算最小平方迴歸線的預測區間
      • 如何使用Excel執行卡方獨立性檢定
  • 下課後
    • 生活
    • 旅遊
      • 日本
    • 美食
    • 攝影
  • 聯絡Dr. Fish
  • Home
  • 推論統計
  • 第一和第二類型錯誤的意義和關聯

🐟 請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址

第一和第二類型錯誤的意義和關聯

Posted on 2021-12-092023-06-29 Updated on 2023-06-292023-06-29 By Dr. Fish
推論統計

任何統計檢定的假設檢定過程中,都會藉由蒐集到的資料去計算出檢定統計量和獲得這個檢定統計量的機率,以便用來評估自變項是否有效果,並決定是否拒絕虛無假設。但在評估虛無假設是否為真實的過程中,研究人員可能會犯下兩種錯誤,分別為第一類型錯誤和第二類型錯誤。

第一類型錯誤和第二類型錯誤是推論統計裡很重要的概念,下面將先介紹這兩類型錯誤的意義,再說明他們之間的關聯。本篇文章牽涉到假設檢定過程裡研究假設、顯著水準、決策規則和檢定統計量等各個層面,建議您可先閱讀研究假設的種類和寫法、顯著水準和決策規則、檢定統計量的意義,將有助於以下內容的理解。

  • 第一類型錯誤和第二類型錯誤的意義
  • 第一類型錯誤和第二類型錯誤間的關聯

第一類型錯誤和第二類型錯誤的意義

假設檢定的結果不外乎兩種:自變項有效果,所以拒絕虛無假設,接受對立假設;或自變項沒有效果,所以保留虛無假設。不過,研究人員無法百分之百地確定研究結果一定是正確的,很有可能自變項實際上沒有效果,但研究結果顯示有效果;或自變項實際上有效果,但研究結果卻指出沒有效果。因此,假設檢定的決策可能會出現兩種錯誤,這兩種錯誤的名稱和意義分別為:

  • 第一類型錯誤(Type Ⅰ error):拒絕一個真實的虛無假設。
  • 第二類型錯誤(Type Ⅱ error):保留一個錯誤的虛無假設。

第一類型錯誤是指研究人員相信自變項帶有效果,但實際上自變項並沒有效果。這個錯誤的機率通常為0.05或更為嚴苛的0.01,就是資料蒐集前已設定好的顯著水準,而第一類型錯誤機率為0.05的意思是若複製研究100次,研究人員可預期其中會有5次自變項實際上沒有效果卻出現拒絕虛無假設的結果。由於顯著水準也稱為α水準,所以第一類型錯誤的機率可用符號α來表示。

第二類型錯誤是指研究人員相信自變項沒有效果,但實際上自變項帶有效果,而這類型錯誤的機率通常用符號β來表示。Cohen(1992)建議能夠被接受的第二類型錯誤的最大機率為0.2,也就是說,若從自變項帶有效果的母群體中,隨機抽取出樣本100次,則其中會有20次研究人員無法測量到自變項的效果。

因此,假設檢定過程的最後階段,藉由決策規則所得到的研究結果和母群體的真實狀況之間會出現下面表格所呈現的4種結果:

research conclusions and reality

當保留真實的虛無假設或拒絕錯誤的虛無假設時,皆為正確的決定。不過,當研究人員拒絕虛無假設,但實際上虛無假設是真實的時候,研究人員犯了第一類型錯誤。反之,當研究人員保留虛無假設,但實際上虛無假設是錯誤的時候,研究人員則犯了第二類型錯誤。

若更進一步地將決策過程中4種結果的機率p呈現出來,則會如下表。當第一類型錯誤的機率為α時,保留真實的虛無假設之機率為1-\alpha。另一方面,當第二類型錯誤的機率為β時,拒絕錯誤的虛無假設之機率為1-\beta,而這個拒絕一個錯誤虛無假設的機率即稱為統計檢定力(power),左右著一個研究發現真實的能力。

research conclusions, reality, and probabilities

但是,第一類型錯誤和第二類型錯誤並非各自獨立,兩者之間實具有密切的關係。研究人員可能採用較為嚴苛的顯著水準,例如0.01或0.001,試圖降低第一類型錯誤的機率,不過這樣的選擇卻會提升第二類型錯誤的機率,接著就來看兩類型錯誤間的關聯。

第一類型錯誤和第二類型錯誤間的關聯

第一類型錯誤和第二類型錯誤之間並非彼此獨立,而是相互消長,當降低其中一個錯誤的機率時,另一個錯誤的機率就會提高。舉個例子來看,假設研究人員設定顯著水準(α水準)為0.05,資料蒐集完成後,分析時發現獲得特定檢定統計量的機率或模型適配的機率(p值)為0.03,依據決策規則,p=0.03< \alpha =0.05,所以拒絕虛無假設,接受對立假設。

若研究人員想降低第一類型錯誤的機率,將顯著水準改設為0.01,在適配模型的機率仍舊為0.03的情況下,因為p=0.03> \alpha =0.01,所以保留虛無假設。由此可見,設定較嚴苛的顯著水準,雖然降低了拒絕真實的虛無假設(第一類型錯誤)之機率,卻提高了保留錯誤的虛無假設(第二類型錯誤)之風險,請見下表。

alpha levels and error types

由於第一類型錯誤和第二類型錯誤是立基於不同的假設:犯下第一類型錯誤必須是母群體中自變項不存在效果,第二類型錯誤則是母群體中自變項存在效果,所以兩種錯誤之間的關係並非顯而易見。即便知道降低第一類型錯誤的機率會提升第二類型錯誤的機率,也很難訂立一標準去取得兩種錯誤之間的平衡。

雖然第一類型錯誤和顯著水準有關聯,但這並不表示真相取決於顯著水準的數值,嚴苛的顯著水準只是降低犯下第一類型錯誤的機率而已。顯著水準的選擇通常會因為研究的性質、目的和錯誤結論可能造成的後果而有不同。

若研究為探索(exploratory)性質,目的在於初步探究一個議題,視研究結果再決定是否進行更深入的探討,第一類型錯誤通常可被容忍,所以可選擇較寬鬆的顯著水準。反之,若研究為解釋(explanatory)性質,目的在於建立因果關係並推論至其他的群體,因為錯誤的結論可能帶來嚴重的後果,所以研究人員寧願降低第一類型錯誤的機率,承擔第二類型錯誤的風險。

由於沒有一個研究能夠百分之百確信研究結果為正確的,所以需要重複驗證(replication)。在一個研究結果能夠廣泛地被科學界接受前,必須經過反覆的驗證,而非藉由單一研究的發現即可被視為真實。因此,重複驗證不但能夠提高研究結果的可信度,也可以大幅降低犯下第一類型錯誤的機率。

以上為本篇文章對於第一類型錯誤和第二類型錯誤的介紹,希望透過本篇文章,您瞭解了第一類型錯誤和第二類型錯誤的意義以及這兩種錯誤之間的關聯。

若您喜歡本篇文章,請將本網站加入書籤,作為您的學習資源,並持續回訪本網站喔!另外,您也可以在Facebook和Twitter上找到我們喲!

參考資料

Cohen, J. (1992). A power primer. Psychological Bulletin, 112(1), 155-159. https://doi.org/10.1037/0033-2909.112.1.155

標籤: p值 α水準 假設檢定 對立假設 探索性研究 模型適配 檢定統計量 決策規則 第一類型錯誤 第二類型錯誤 統計檢定力 虛無假設 解釋性研究 重複驗證 顯著水準

文章導覽

❮ Previous Post: 檢定統計量的意義
Next Post: 假設檢定的步驟和範例 ❯

您可能也會喜歡

featured image of test statistics
檢定統計量的意義
featured image of significance level and decision rules
顯著水準和決策規則
featured image of hypothesis test
假設檢定的步驟和範例
featured image of effect size
效果量的意義和測量

關於 Dr. Fish

profile picture uploaded on July 5, 2024

喜歡求知和分析,所以一路讀到博士。也喜歡旅行、攝影、料理、看日劇,愛把複雜的思想和事物變簡單,是個有點宅也有點跳TONE的人。

支持 Dr. Fish

本網站經營和文章撰寫皆由Dr. Fish一人完成,投注許多時間和費用。若您喜歡任何一篇文章或覺得文章對您有幫助,請給我一些支持,買杯珍奶給我吧!您的支持不但能給我更多撰寫文章的動力,也可以讓這網站的經營持續下去喔!謝謝!😄

boba-icon
請我喝珍奶!
featured image of spss environment and data entry

下載專區

標準常態分配表

Student's t 分配臨界值表

F分配臨界值表

卡方分配臨界值表

斯皮爾曼等級相關係數臨界值表

Wilcoxon配對符號等級檢定臨界值表

曼–惠特尼U檢定臨界值表

Student化全距分配臨界值表

Dunnett檢定臨界值表(雙尾檢定)

單一樣本z檢定的SPSS語法

關於Dr. Fish漫游社會統計

本網站使用簡單易懂的文字解說社會統計,並示範軟體操作,同時有課後隨筆的分享,希望讀者在學習之餘,也能感受到生活的樂趣。

網站政策

著作權聲明 Copyright Notice
隱私權政策 Privacy Policy
免責聲明  Disclaimer

追蹤我們

Facebook
X(Twitter)

Copyright © 2021-2025 Dr. Fish 漫游社會統計. All rights reserved.