Skip to content

合作邀約 email: dr.fish@drfishstats.com

  • Facebook
  • X
site icon of Dr. Fish

Dr. Fish 漫游社會統計

魚博士的專業漫談和課後隨筆

  • Home
  • 關於Dr. Fish
  • 統計基礎
    • 入門概念
    • 圖形繪製
    • 描述統計
    • 相關
    • 線性迴歸
  • 統計進階
    • 推論統計
    • 統計檢定
      • 相關係數
      • 迴歸
      • 平均數比較
      • 無母數檢定
  • EXCEL系列
    • 資料管理
    • 圖形繪製
      • 匯出SPSS資料至Excel並繪製盒形圖
      • 如何使用Excel製作Q-Q plot
      • 如何使用Excel繪製加上誤差線的長條圖
    • 描述統計
      • 如何使用Excel執行次數分配
      • 如何使用Excel樞紐分析表製作次數分配表
      • 如何使用Excel計算偏態和峰態
      • 如何使用Excel尋找常態曲線下面積或分數
      • 如何使用Excel一次取得描述性統計量
      • 如何使用Excel計算共變異數
      • 如何使用Excel取得皮爾森積差相關係數
      • 如何使用Excel製作列聯表
    • 推論統計
      • 如何使用Excel計算信賴區間
      • 如何使用Excel執行符號檢定
      • 如何使用Excel執行單一樣本z檢定和t檢定
      • 如何使用Excel執行獨立樣本t檢定
      • 如何使用 Excel 執行 Levene 檢定
      • 如何使用Excel執行關聯樣本t檢定
      • 如何使用Excel執行單因子變異數分析
      • 如何使用Excel執行簡單線性迴歸
      • 如何使用Excel計算最小平方迴歸線的預測區間
      • 如何使用Excel執行卡方獨立性檢定
  • 下課後
    • 生活
    • 旅遊
      • 日本
    • 美食
    • 攝影
  • 聯絡Dr. Fish
  • Home
  • 推論統計
  • 統計檢定
  • 無母數檢定
  • 概似比檢定:類別資料分析的另一種選擇

🐟 請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址

概似比檢定:類別資料分析的另一種選擇

Posted on 2024-10-262024-10-26 By Dr. Fish
無母數檢定

在行為和社會科學領域的研究裡,當我們想針對類別變項進行假設檢定的時候,很常使用卡方檢定(chi-square test)。若要探討1個類別變項裡各個類別的發生次數是否不同於假設的母群體次數時,可使用卡方適合度檢定;若要探討2個類別變項間為彼此獨立或具有關聯性時,可使用卡方獨立性檢定。此外,如果樣本數很小且2個變項都各只有2個類別時,則可使用費雪精準檢定。

除了卡方檢定之外,另一個可用來分析類別變項資料的檢定方法為概似比檢定(likelihood ratio test)。概似比檢定運用最大概似理論(maximum likelihood theory)來分析2個類別變項構成的列聯表,藉此探討2變項之間的關係。統計分析軟體如 SPSS 會在卡方檢定分析結果的輸出表格裡同時顯示概似比檢定的分析結果,可見概似比檢定也是很常見的一種類別資料假設檢定方法。

下面內容將介紹概似比檢定的概念和使用方法,並舉一例子說明假設檢定的過程,最後示範利用 SPSS 執行這個檢定的操作方法。由於文章內容涉及假設檢定的過程,若您不清楚或不熟悉假設檢定的意義和步驟,可先參考假設檢定的步驟和範例,將有助於下面內容的理解喔!

  • 概似比檢定的概念
    • 單一變項的適合度檢定
    • 兩個變項的獨立性檢定
  • 概似比檢定的例子
  • 運用 SPSS 執行概似比檢定

概似比檢定的概念

概似比檢定是一種可以用來分析類別變項的統計檢定方法,而類別變項就是測量尺度為名義尺度的變項。依據最大概似理論,概似比檢定透過列聯表的分析來檢驗類別變項之間的關係。因為概似比檢定和卡方檢定一樣都是在探討類別變項間的關聯,所以可視為卡方檢定外的另一種統計檢定方法選擇。

概似比檢定的基本概念為2個概度(likelihood)或機率的比較,第1個概度為虛無假設為真時獲得研究所蒐集到資料(也就是觀察資料)的機率,第2個概度為在對立假設下獲得研究所蒐集到資料的最大機率。如果在對立假設下獲得觀察資料的可能性遠大於虛無假設為真時的可能性,可拒絕虛無假設;如果在對立假設下獲得觀察資料的可能性相似於虛無假設為真時的可能性,則保留虛無假設。

不論是單一變項的適合度檢定或2個變項的獨立性檢定都可用概似比的方法來進行分析,由於計算出來的檢定統計量帶有卡方分配(chi-square distribution)的型態,所以也可以稱為「最大概似卡方檢定」。評估分析結果時,和卡方檢定一樣,藉由事先設定的顯著水準(α水準)和自由度在卡方分配臨界值表裡尋找臨界值,再比較檢定統計量和臨界值,當檢定統計量等於或大於臨界值時,即可拒絕虛無假設。

單一變項的適合度檢定

適合度檢定適用在單一的類別變項上,檢驗各個類別的觀察次數是否不同於假設的母群體次數。若讓O_i代表第i個類別的觀察次數,E_i代表第i個類別的期望次數,\ln為自然對數,利用概似比方法來計算適合度檢定的檢定統計量L \chi^2公式如下:

(1)   \begin{equation*}L \chi^2 = 2 \sum O_i \ln \left ( \frac {O_i}{E_i} \right )\end{equation*}

適合度檢定的自由度為類別變項的類別數目減1,如果類別數目為k,自由度即為k-1。接著,查詢卡方分配臨界值表,利用事先設定的α水準和k-1自由度找到卡方臨界值,再比較利用公式(1)計算得到的數值和臨界值,當前者數值等於或大於後者時,即可拒絕虛無假設,接受對立假設。

兩個變項的獨立性檢定

獨立性檢定適用在2個類別變項上,探討這2個變項彼此獨立或相互關聯,通常會先製作2個變項組成的列聯表後再進行分析。若讓O_{ij}代表列聯表裡第i列第j欄細格的觀察次數,E_{ij}代表第i列第j欄細格的期望次數,\ln為自然對數,利用概似比方法來計算獨立性檢定的檢定統計量L \chi^2公式如下:

(2)   \begin{equation*}L \chi^2 = 2 \sum O_{ij} \ln \left ( \frac {O_{ij}}{E_{ij}} \right )\end{equation*}

列聯表裡各個細格的期望次數計算方法和卡方獨立性檢定相同,若讓R_i代表第i個類別的列總和,C_j代表第j個類別的欄總和,T為樣本總數,一個細格的期望次數E_{ij}的計算公式為:

(3)   \begin{equation*}E_{ij} = \frac {R_i C_j}{T}\end{equation*}

獨立性檢定的自由度須用到列聯表的列和欄數目,若讓列的數目為r而欄的數目為c,自由度為(r-1) \times (c-1)。接著,利用事先設定的α水準和自由度在卡方分配臨界值表裡尋找臨界值,再比較利用公式(2)計算得到的數值和臨界值,當前者數值等於或大於後者時,就可拒絕虛無假設。

從上面的說明可以發現,概似比檢定和卡方檢定同樣用來分析類別變項的資料,且兩者的檢定統計量同樣具有卡方分配的型態,是很類似的統計檢定方法。當樣本數較大時,2種方法的分析結果會差不多;但當樣本數較小時,卡方檢定會比概似比檢定更近似於卡方分配型態,因此卡方檢定會是較合適的檢定方法(Agresti, 2013)。

概似比檢定的例子

這裡使用卡方獨立性檢定的假設檢定裡生理性別和政黨傾向的例子,假設有位政治學者想探討生理性別和政黨支持傾向之間的關聯,她隨機抽取出500位成年女性和男性,並調查他們傾向於支持政黨A、政黨B或政黨C。資料整理完成後,生理性別和政黨傾向組成的2X3列聯表如下。若α水準為0.05,統計檢定為概似比檢定,試問生理性別和政黨傾向間是否有關聯?

政黨A 政黨B 政黨C 列合計
生理女性 120 15 115 250
生理男性 90 10 150 250
欄合計 210 25 265 500

這位政治學者想要探討民眾的生理性別和他們的政黨支持傾向之間是否存在關聯,因此這研究的虛無假設和對立假設分別如下:

  • 虛無假設(H_0):生理性別和政黨支持傾向之間彼此獨立。
  • 對立假設(H_1):生理性別和政黨支持傾向之間具有關聯。

在這個例子裡,生理性別為2個類別的名義尺度變項而政黨支持傾向為3個類別的名義尺度變項,為了瞭解2個類別變項之間為彼此獨立或相互關聯,概似比檢定為合適的統計檢定方法。(當然,卡方獨立性檢定也是合適的統計檢定方法。)

因為要探討2個類別變項間的關係,所以適用獨立性檢定,須利用上面的公式(2)來計算檢定統計量。首先,利用上面的公式(3)計算出列聯表裡各個細格的期望次數,例如生理女性傾向支持政黨A的期望次數為:

    \[ \frac {250 \times 210}{500} = 105 \]

利用和上面相同的計算方法,求得列聯表裡其他細格的期望次數,完成後各個細格的期望次數會如下表:

政黨A 政黨B 政黨C 列合計
生理女性 105 12.5 132.5 250
生理男性 105 12.5 132.5 250
欄合計 210 25 265 500

接著,把每一個細格的觀察次數和期望次數帶入上面的公式(2),計算出概似比檢定的檢定統計量。由於算式很長,所以先分別計算每個細格的數值後再加總,運算過程中所有無法整除的數值都四捨五入到小數點後第5位,最後的答案再四捨五入到小數點後第3位,計算過程如下:

    \begin{gather*}\begin{alignat*}{3}\text {Female-Party A} &\Rightarrow 120 &&\ln \left ( \frac {120}{105} \right ) &&= 16.02377 \\[5pt]\text {Female-Party B} &\Rightarrow 15 &&\ln \left ( \frac {15}{12.5} \right ) &&= 2.73482 \\[5pt]\text {Female-Party C} &\Rightarrow 115 &&\ln \left ( \frac {115}{132.5} \right ) &&= -16.28981 \\[5pt]\text {Male-Party A} &\Rightarrow 90 &&\ln \left ( \frac {90}{105} \right ) &&= -13.87356 \\[5pt]\text {Male-Party B} &\Rightarrow 10 &&\ln \left ( \frac {10}{12.5} \right ) &&= -2.23144 \\[5pt]\text {Male-Party C} &\Rightarrow 150 &&\ln \left ( \frac {150}{132.5} \right ) &&= 18.60790\end{alignat*}\end{gather*}

    \begin{align*}L \chi^2 &= 2(16.02377 + 2.73482 - 16.28981 - 13.87356 - 2.23144 + 18.60790) \\[5pt]&= 2(4.97168) \\[5pt]&\approx 9.943\end{align*}

計算結果顯示檢定統計量為9.943,而2X3列聯表的自由度為(2-1) \times (3-1)=2。從卡方分配臨界值表可以看到,當α水準為0.05且自由度為2的時候,卡方臨界值為5.991。

critical value of chi-square with alpha 0.05 and df 2

最後,運用決策規則,比較檢定統計量和臨界值。因為9.943>5.991,所以拒絕虛無假設,接受對立假設。概似比檢定的分析結果指出,民眾的生理性別和他們的政黨支持傾向之間有關聯。

這樣的分析結果和在〈卡方獨立性檢定的假設檢定〉裡利用卡方獨立性檢定分析所得到的結果是一樣的,而且兩種方法的檢定統計量很相近,這也印證了當樣本數較大的時候,概似比檢定和卡方檢定的分析結果為一致的。

運用 SPSS 執行概似比檢定

在已經輸入資料的 SPSS 資料編輯器裡,點選功能表的分析 » 敘述統計 » 交叉資料表,帶出「交叉表」視窗。關於 SPSS 的介面和基本操作,請參考 SPSS操作環境和資料輸入。

spss menu of crosstabulation

在「交叉表」視窗裡,把一個類別變項移至列(O),另一個類別變項移至欄(C),然後點選視窗最右側的統計量(S)。在「交叉資料表:統計量」視窗裡,勾選卡方檢定(H),完成後按下視窗下方的繼續(C)。回到「交叉表」視窗後,再按下視窗下方的確定。

spss dialog box of crosstabulation

經過上述的步驟,SPSS 會輸出如下的卡方檢定表格。表格裡的 Pearson Chi-Square 為我們熟悉的卡方獨立性檢定的分析結果,其下方的 Likelihood Ratio 就是概似比檢定的分析結果。

spss output of likelihood ratio test

從上面的卡方檢定表可以看到,概似比檢定的檢定統計量為9.943,自由度為2,這樣的結果和上面利用紙筆計算得到的結果是相同的。利用 SPSS 評估分析結果時,可以直接比較獲得研究結果的機率(p值)與事先設定的α水準,當p值等於或小於α水準時,可以拒絕虛無假設,接受對立假設;當p值小於α水準時,則保留虛無假設。

上面的卡方檢定表顯示p值為0.007,因為p=0.007 < \alpha = 0.05,所以拒絕虛無假設。也就是說,概似比檢定的分析結果顯示民眾的生理性別和他們的政黨支持傾向有關聯。

以上為本篇文章對概似比檢定的介紹,希望透過本篇文章,您瞭解了概似比檢定的概念和使用時機,也學會了運用 SPSS 執行概似比檢定的方法。若您喜歡這篇文章,請將本網站加入書籤,並隨時回訪本網站喔!另外,也歡迎您追蹤本網站的 Facebook 和/或 X(Twitter)專頁喲!

如果您覺得本篇文章對您有幫助,歡迎買杯珍奶給 Dr. Fish!小小珍奶,大大鼓勵,您的支持將給 Dr. Fish 更多撰寫優質文章的動力喔!

參考資料

Agresti, A. (2013). Categorical data analysis (3rd ed.). Hoboken, NJ: John Wiley & Sons, Inc.

標籤: SPSS 假設檢定 列聯表 卡方分配 卡方檢定 名義尺度 對立假設 最大概似理論 期望次數 概似比檢定 檢定統計量 決策規則 測量尺度 獨立性檢定 自由度 虛無假設 觀察次數 費雪精準檢定 適合度檢定 類別變項

文章導覽

❮ Previous Post: 兩個相依樣本比較的統計檢定方法
Next Post: 卡方獨立性檢定的效果量:關聯性測量 ❯

您可能也會喜歡

featured image of sign test using Excel
如何使用Excel執行符號檢定
featured image of goodness-of-fit test
卡方適合度檢定的假設檢定
featured image of odds ratio for chi-square test of independence
卡方獨立性檢定的效果量:勝率比
featured image of measures of association for chi-square test of independence
卡方獨立性檢定的效果量:關聯性測量

關於 Dr. Fish

profile picture uploaded on July 5, 2024

喜歡求知和分析,所以一路讀到博士。也喜歡旅行、攝影、料理、看日劇,愛把複雜的思想和事物變簡單,是個有點宅也有點跳TONE的人。

支持 Dr. Fish

本網站經營和文章撰寫皆由Dr. Fish一人完成,投注許多時間和費用。若您喜歡任何一篇文章或覺得文章對您有幫助,請給我一些支持,買杯珍奶給我吧!您的支持不但能給我更多撰寫文章的動力,也可以讓這網站的經營持續下去喔!謝謝!😄

boba-icon
請我喝珍奶!
featured image of spss environment and data entry

下載專區

標準常態分配表

Student's t 分配臨界值表

F分配臨界值表

卡方分配臨界值表

斯皮爾曼等級相關係數臨界值表

Wilcoxon配對符號等級檢定臨界值表

曼–惠特尼U檢定臨界值表

Student化全距分配臨界值表

Dunnett檢定臨界值表(雙尾檢定)

單一樣本z檢定的SPSS語法

關於Dr. Fish漫游社會統計

本網站使用簡單易懂的文字解說社會統計,並示範軟體操作,同時有課後隨筆的分享,希望讀者在學習之餘,也能感受到生活的樂趣。

網站政策

著作權聲明 Copyright Notice
隱私權政策 Privacy Policy
免責聲明  Disclaimer

追蹤我們

Facebook
X(Twitter)

Copyright © 2021-2025 Dr. Fish 漫游社會統計. All rights reserved.