Skip to content

合作邀約 email: dr.fish@drfishstats.com

  • Facebook
  • X
site icon of Dr. Fish

Dr. Fish 漫游社會統計

魚博士的專業漫談和課後隨筆

  • Home
  • 關於Dr. Fish
  • 統計基礎
    • 入門概念
    • 圖形繪製
    • 描述統計
    • 相關
    • 線性迴歸
  • 統計進階
    • 推論統計
    • 統計檢定
      • 相關係數
      • 迴歸
      • 平均數比較
      • 無母數檢定
  • EXCEL系列
    • 資料管理
    • 圖形繪製
      • 匯出SPSS資料至Excel並繪製盒形圖
      • 如何使用Excel製作Q-Q plot
      • 如何使用Excel繪製加上誤差線的長條圖
    • 描述統計
      • 如何使用Excel執行次數分配
      • 如何使用Excel樞紐分析表製作次數分配表
      • 如何使用Excel計算偏態和峰態
      • 如何使用Excel尋找常態曲線下面積或分數
      • 如何使用Excel一次取得描述性統計量
      • 如何使用Excel計算共變異數
      • 如何使用Excel取得皮爾森積差相關係數
      • 如何使用Excel製作列聯表
    • 推論統計
      • 如何使用Excel計算信賴區間
      • 如何使用Excel執行符號檢定
      • 如何使用Excel執行單一樣本z檢定和t檢定
      • 如何使用Excel執行獨立樣本t檢定
      • 如何使用 Excel 執行 Levene 檢定
      • 如何使用 Excel 執行 Welch t 檢定
      • 如何使用Excel執行關聯樣本t檢定
      • 如何使用Excel執行單因子變異數分析
      • 如何使用Excel執行簡單線性迴歸
      • 如何使用Excel計算最小平方迴歸線的預測區間
      • 如何使用Excel執行卡方獨立性檢定
  • 下課後
    • 生活
    • 旅遊
      • 日本
    • 美食
    • 攝影
  • 聯絡Dr. Fish
  • Home
  • 推論統計
  • 統計檢定
  • 無母數檢定
  • 卡方適合度檢定的假設檢定

🐟 請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址

卡方適合度檢定的假設檢定

Posted on 2022-08-242023-08-15 Updated on 2023-08-152023-08-15 By Dr. Fish
無母數檢定

很多統計檢定方法適用在等距或比率測量尺度的變項資料上,例如單一樣本z檢定、獨立樣本t檢定、皮爾森積差相關係數等,但在行為或社會科學領域的研究裡,很多時候還會用到名義尺度的變項或類別變項(categorical variable),這時候就需要使用其他的統計檢定方法。

名義尺度的變項會被劃分為數個互斥的類別,通常會以各個類別出現的次數來進行分析,而不會去計算平均數,因為名義尺度變項的平均數不具有任何意義。為了探討各個類別的次數之間是否有明顯的不同,即可使用卡方檢定(chi-square test),符號為\chi^2。

卡方檢定由提出皮爾森積差相關係數的Karl Pearson所發明,是用來檢驗名義尺度變項資料的各個互斥的類別,並評估觀察次數是否相同於假設次數的一種無母數檢定。卡方檢定可以分為適合度檢定(goodness-of-fit test)和獨立性檢定(test of independence),本篇文章將介紹卡方適合度檢定。

卡方適合度檢定的假設檢定過程並沒有不同於其他統計檢定的假設檢定,若您不清楚或不熟悉假設檢定的過程,建議您先閱讀假設檢定的步驟和範例,將有助於下面內容的理解。以下將先介紹卡方適合度檢定的使用時機、卡方分配和假設檢定過程,再舉一例子說明,最後示範利用SPSS執行卡方適合度檢定的操作方法。

  • 卡方適合度檢定的使用時機
  • 卡方分配
  • 卡方適合度檢定的假設檢定
    • 卡方適合度檢定的基本假設
  • 卡方適合度檢定假設檢定的範例
  • 運用SPSS執行卡方適合度檢定

卡方適合度檢定的使用時機

卡方適合度檢定是卡方檢定的一種,適用在測量尺度為名義尺度的變項資料上,用來評估各個互斥類別的發生次數是否顯著地不同於假設的母群體次數。各個類別的發生次數是指從樣本資料得到的觀察次數(observed frequencies),通常用英文字母O來表示;假設的母群體次數則是指樣本來自的母群體裡的期望次數(expected frequencies),通常用英文字母E來表示。

舉個例子來看,假設有位咖啡職人想要探索咖啡愛好者對於3種不同品牌咖啡的喜好程度是否有所不同,因此她從咖啡愛好者裡隨機抽取出90位參與者,在不透露咖啡品牌的實驗設計下,請每位參與者試喝3種不同品牌的咖啡,並選擇最喜歡的一款。三種咖啡品牌的選擇人數如下表:

example of goodness-of-fit test

從上表可以明顯地看出3個品牌的選擇人數(也就是觀察次數)都不同,選擇A品牌的參與者最多,選擇C品牌的人最少。假設母群體裡對這3種咖啡品牌的喜好程度並沒有不同,也就是這3種品牌的期望次數皆為30(90 \div 3=30)。

從下表可看出,除了C品牌以外,其他2個品牌的觀察次數和期望次數並不相等,觀察和期望次數之間的差距到底是因為隨機變動(random variation)或因為參與者對這3種咖啡品牌的喜好程度確實有所不同呢?為了解決這一個問題,卡方適合度檢定就是適當的統計檢定方式。

example of goodness-of-fit test with expected frequencies

因此,卡方適合度檢定是用來探討觀察次數和期望次數之間的差值是否大到足以讓人做出兩者間的差距不是因為隨機變動而導致的結論。也就是說,卡方適合度檢定的假設檢定是在檢驗觀察次數和期望次數間的差距為機會所造成的虛無假設。

就像其他統計檢定方法有各自相應的抽樣分配,卡方檢定也有自己理論上的抽樣分配,稱為卡方分配(chi-square distribution),以下稍做介紹。

卡方分配

卡方分配和t分配相當地類似,是由很多條曲線所組成,而每條曲線會隨著自由度(degrees of freedom,簡寫為df)的改變而有不同的分布型態,如下圖所示。

chi-square distribution

從上圖可以發現,當自由度比較小的時候,卡方分配曲線呈現正偏態,而當自由度愈來愈大時,分配曲線愈趨近於對稱的型態。這裡的自由度是指一個名義尺度變項的互斥類別裡可以自由變動的類別數目,若讓互斥的類別數為k,則卡方適合度檢定的自由度為k-1。

回到上面的例子,名義尺度的變項為咖啡種類,由於咖啡有3種品牌,也就是類別數為3,則卡方適合度檢定的自由度為3-1=2。當決定了自由度之後,就可查詢卡方分配表,找出相對應的臨界值,再運用決策規則去評估分析的結果。

瞭解了卡方適合度檢定的使用時機、卡方分配的型態和自由度的計算方式後,接著來看看卡方適合度檢定的假設檢定過程。

卡方適合度檢定的假設檢定

卡方適合度檢定是卡方檢定的一種,主要用來檢驗名義尺度變項或類別變項資料的互斥類別中之觀察次數和期望次數間是否存在顯著的差異。換句話說,觀察次數和期望次數之間的差距是否大到足以做出這樣的結果並非機會所導致的結論。

研究人員須根據研究目的、理論基礎和過往的研究發現來擬定研究假設,而不能憑空臆測。雖然研究假設可以分為無方向性和有方向性的假設,但卡方適合度檢定是一種沒有方向性、綜合的(omnibus)檢定方法,所以只有無方向性的假設。也就是說,該檢定僅能指出觀察次數的整體模式是否不同於期望次數,但無法指出某一個特定的差值顯著地小於或大於期望的數值。

擬定好研究假設後,再考量研究的性質、目的與研究可能帶來的後果,選擇適當的顯著水準或稱為α水準,習慣上為0.05、0.01或更嚴苛的0.001。

卡方適合度檢定使用上面提到的卡方分配和卡方檢定統計量,若讓O_i代表第i個類別的觀察次數、E_i代表第i個類別的期望次數,卡方檢定統計量的計算公式如下:

(1)   \begin{equation*}\chi^2=\sum {\frac {(O_i-E_i)^2}{E_i}}\end{equation*}

從上面的公式(1)可以看出,卡方適合度檢定的檢定統計量分子為一個類別裡觀察次數和期望次數差值的平方,分母則是該類別的期望次數,每一個類別都做相同的計算後再相加。若觀察次數和期望次數之間的差距是因為機會所導致,卡方檢定統計量的數值會相對地偏小;但若觀察次數和期望次數之間的差距不是因為機會所造成,則卡方檢定統計量的數值會比較大。

上面已經提到卡方適合度檢定的自由度為名義尺度變項的類別數減1,用公式表示為k-1。在得到卡方檢定統計量之後,查詢卡方分配表,透過自由度和事先選擇好的α水準,找到相對應的卡方臨界值。最後,運用決策規則,若卡方檢定統計量等於或大於卡方臨界值,即可拒絕虛無假設,接受對立假設。

若是使用統計分析軟體,例如SPSS、SAS,通常會輸出獲得特定卡方檢定統計量的機率(p值)而不是臨界值。此時須使用機率比較的決策規則,當p \leq \alpha時,即可拒絕虛無假設,接受對立假設。但不論是使用數值比較或機率比較的決策規則,兩者的結果都會相同。

雖然卡方適合度檢定是無母數檢定,不太會要求母群體具備一定的特性,但在研究設計上仍須滿足幾個基本假設,好讓該檢定提供有效的結果,下面來瞭解一下這幾個假設。

卡方適合度檢定的基本假設

為了讓卡方適合度檢定的結果有效,它的基本假設有3個:互斥的類別、觀察間彼此獨立、足夠的樣本數目。

  1. 互斥的類別:每一位研究參與者或每一個觀察只能被分配到一個類別,必須避免同一位參與者或同一個觀察被多次計算。
  2. 彼此獨立的觀察:一位研究參與者或一個觀察被分配到一個類別不會對其他的類別帶來影響,也就是說,分配到任一類別的標準是相同的。例如上面的咖啡品牌選擇的例子,若A品牌的咖啡是用濾杯沖泡,另外2種品牌則用法壓壺沖泡,由於不同的沖泡方法會影響咖啡的氣味和口感,可能使得參與者傾向於選擇A品牌的咖啡,如此一來,每一類別的基準不同,可能造成無效的研究結果。
  3. 足夠的樣本數:一般而言,卡方檢定要求每一個類別的期望次數不得少於5。如果期望次數太小,卡方檢定可能會產生錯誤的結果。

在清楚了卡方適合度檢定的假設檢定過程和基本假設後,接下來使用一開始提到的咖啡品牌選擇的例子來實際操作整個過程。

卡方適合度檢定假設檢定的範例

假設在咖啡品牌選擇的研究裡,上述的3個基本假設皆被滿足,也就是類別之間互斥、參與者選擇的類別間彼此獨立、樣本數目夠大。如果這位咖啡職人選擇0.05的α水準,試問3種咖啡品牌的受喜愛程度是否有顯著的不同呢?

由於卡方適合度檢定是不具有方向性的統計檢定,所以只能使用沒有方向性的研究假設。這個研究的對立假設和虛無假設分別為:

  • 對立假設(H_1):咖啡愛好者對3種咖啡品牌的喜好程度不一樣。換句話說,觀察次數的模式不同於期望次數的模式。
  • 虛無假設(H_0):咖啡愛好者對3種咖啡品牌的喜好程度沒有不一樣。換句話說,觀察次數的模式相同於期望次數的模式。

由於咖啡職人想瞭解3種咖啡品牌的觀察次數模式是否不同於期望次數的模式,所以卡方適合度檢定是合適的統計檢定方法。她選擇了0.05的α水準,如果卡方檢定統計量(\chi^2)夠大的話,就有可能拒絕虛無假設,接受對立假設。

卡方適合度檢定使用卡方分配和卡方檢定統計量,為了利用上面公式(1)來計算卡方檢定統計量,可先在如下的表格裡將需要的數值計算出來:

computation of goodness-of-fit test example

接著,將上表中的數值帶入卡方檢定統計量的計算公式(1)裡,計算過程如下:

    \begin{align*}\chi^2 &= \sum {\frac {(O_i-E_i)^2}{E_i}} \\&= \frac {225}{30}+\frac {225}{30}+\frac {0}{30} \\&= 7.5+7.5+0 \\&= 15\end{align*}

計算結果得到卡方檢定統計量為15,另外,自由度為N-1=3-1=2。查詢卡方分配表,當α水準為0.05、自由度為2時,卡方的臨界值為5.991。

critical value of chi-square with alpha 0.05 and df 2

最後,運用數值比較的決策規則,比較卡方檢定統計量和卡方臨界值。因為檢定統計量大於臨界值(15>5.991),所以咖啡職人可以拒絕虛無假設,接受對立假設。研究結果顯示,咖啡愛好者對於這3種咖啡品牌的喜好程度不相同。

運用SPSS執行卡方適合度檢定

使用SPSS進行分析前,須在SPSS資料編輯器裡輸入90筆資料,內含兩個變項。第1個變項為參與者的編號(ID),第2個變項為參與者的咖啡品牌選擇(CHOICE)。您可使用自己的資料來練習,關於SPSS資料輸入的方法,請參考SPSS操作環境和資料輸入。

咖啡品牌選擇CHOICE有3個數值,數值1為A品牌、數值2為B品牌、數值3為C品牌,出現的次數分別為45、15和30。資料輸入完成後,點選功能表的分析 » 無母數檢定 » 舊式對話框 » 卡方檢定,帶出「卡方檢定」視窗。

spss menu of chi-square goodness-of-fit test

在「卡方檢定」視窗裡,將左邊方框中的變項CHOICE移到右邊檢定變數清單(T)方框中,期望值方框裡勾選所有類別相等(I)的選項,然後按下視窗最下方的確定。

dialog box of goodness-of-fit test in spss

經過上面的程序後,SPSS會輸出兩個表格,第1個為檢驗變項的次數分配表,第2個為卡方適合度檢定的結果。下表為變項CHOICE的次數分配表,從表中可以看出3種咖啡品牌的觀察次數分別為45、15和30,期望次數皆為30,殘差則是各個品牌的觀察次數和期望次數的差值。

output of frequency distribution for goodness-of-fit test in spss

第2個表格為卡方適合度檢定的結果,如下表。該表顯示卡方檢定統計量為15,和上面紙筆計算的結果相同。顯著性(p值)為0.001,根據機率比較的決策規則,因為p值小於α水準(0.001<0.05),所以能夠拒絕虛無假設,接受對立假設。SPSS的分析結果指出,咖啡愛好者對於3種咖啡品牌的喜好程度有所不同。

output of test statistic for goodness-of-fit test in spss

上表有一註解指出沒有任一期望次數小於5,代表這個檢定達到了「足夠樣本數」的基本假設。也就是說,卡方檢定統計量的結果是可信賴的。

若您不是想探討一個名義尺度變項或類別變項裡各個類別間的觀察和期望次數模式的差異,而是想瞭解兩個名義尺度變項或類別變項之間為彼此獨立或相互關聯,則須使用卡方檢定裡的卡方獨立性檢定,詳細的介紹請參考卡方獨立性檢定的假設檢定。

以上為本篇文章對卡方適合度檢定的假設檢定的介紹,希望透過本篇文章,您瞭解了卡方適合度檢定的使用時機、卡方分配的型態和假設檢定的過程,也學會了利用SPSS執行卡方適合度檢定的方法。

若您喜歡本篇文章,請將本網站加入書籤,作為您的學習資源,並持續回訪本網站喔!另外,您也可以在Facebook和Twitter上找到我們喲!

標籤: p值 SPSS 假設檢定 卡方分配 卡方檢定 名義尺度 抽樣分配 期望次數 檢定統計量 正偏態 決策規則 測量尺度 無母數檢定 獨立性檢定 研究假設 綜合檢定 臨界值 自由度 觀察次數 適合度檢定 類別變項 顯著水準

文章導覽

❮ Previous Post: phi係數的意義和計算
Next Post: 卡方獨立性檢定的假設檢定 ❯

您可能也會喜歡

featured image of measures of association for chi-square test of independence
卡方獨立性檢定的效果量:關聯性測量
featured image of Cohen's kappa
Cohen′s kappa:評分者間信度的測量方法
featured image of test of independence
卡方獨立性檢定的假設檢定
featured image of Dunn's test
Dunn檢定:Kruskal-Wallis檢定的事後成對比較

關於 Dr. Fish

profile picture uploaded on July 5, 2024

喜歡求知和分析,所以一路讀到博士。也喜歡旅行、攝影、料理、看日劇,愛把複雜的思想和事物變簡單,是個有點宅也有點跳TONE的人。

支持 Dr. Fish

本網站經營和文章撰寫皆由Dr. Fish一人完成,投注許多時間和費用。若您喜歡任何一篇文章或覺得文章對您有幫助,請給我一些支持,買杯珍奶給我吧!您的支持不但能給我更多撰寫文章的動力,也可以讓這網站的經營持續下去喔!謝謝!😄

boba-icon
請我喝珍奶!
featured image of spss environment and data entry

下載專區

標準常態分配表

Student's t 分配臨界值表

F分配臨界值表

卡方分配臨界值表

斯皮爾曼等級相關係數臨界值表

Wilcoxon配對符號等級檢定臨界值表

曼–惠特尼U檢定臨界值表

Student化全距分配臨界值表

Dunnett檢定臨界值表(雙尾檢定)

單一樣本z檢定的SPSS語法

關於Dr. Fish漫游社會統計

本網站使用簡單易懂的文字解說社會統計,並示範軟體操作,同時有課後隨筆的分享,希望讀者在學習之餘,也能感受到生活的樂趣。

網站政策

著作權聲明 Copyright Notice
隱私權政策 Privacy Policy
免責聲明  Disclaimer

追蹤我們

Facebook
X(Twitter)

Copyright © 2021-2025 Dr. Fish 漫游社會統計. All rights reserved.