Skip to content

合作邀約 email: dr.fish@drfishstats.com

  • Facebook
  • X
site icon of Dr. Fish

Dr. Fish 漫游社會統計

魚博士的專業漫談和課後隨筆

  • Home
  • 關於Dr. Fish
  • 統計基礎
    • 入門概念
    • 圖形繪製
    • 描述統計
    • 相關
    • 線性迴歸
  • 統計進階
    • 推論統計
    • 統計檢定
      • 相關係數
      • 迴歸
      • 平均數比較
      • 無母數檢定
  • EXCEL系列
    • 資料管理
    • 圖形繪製
      • 匯出SPSS資料至Excel並繪製盒形圖
      • 如何使用Excel製作Q-Q plot
      • 如何使用Excel繪製加上誤差線的長條圖
    • 描述統計
      • 如何使用Excel執行次數分配
      • 如何使用Excel樞紐分析表製作次數分配表
      • 如何使用Excel計算偏態和峰態
      • 如何使用Excel尋找常態曲線下面積或分數
      • 如何使用Excel一次取得描述性統計量
      • 如何使用Excel計算共變異數
      • 如何使用Excel取得皮爾森積差相關係數
      • 如何使用Excel製作列聯表
    • 推論統計
      • 如何使用Excel計算信賴區間
      • 如何使用Excel執行符號檢定
      • 如何使用Excel執行單一樣本z檢定和t檢定
      • 如何使用Excel執行獨立樣本t檢定
      • 如何使用 Excel 執行 Levene 檢定
      • 如何使用Excel執行關聯樣本t檢定
      • 如何使用Excel執行單因子變異數分析
      • 如何使用Excel執行簡單線性迴歸
      • 如何使用Excel計算最小平方迴歸線的預測區間
      • 如何使用Excel執行卡方獨立性檢定
  • 下課後
    • 生活
    • 旅遊
      • 日本
    • 美食
    • 攝影
  • 聯絡Dr. Fish
  • Home
  • 推論統計
  • 統計檢定
  • 無母數檢定
  • 卡方獨立性檢定的事後分析:標準化殘差和調整後殘差的運用

🐟 請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址

卡方獨立性檢定的事後分析:標準化殘差和調整後殘差的運用

Posted on 2024-11-212024-11-21 By Dr. Fish
無母數檢定

卡方獨立性檢定可用來探討類別變項之間的關係,統計上顯著代表變項之間存在關聯,進一步的關聯性測量和勝率比還可用來瞭解關聯的強度(也就是效果量的大小),相關內容可參考卡方獨立性檢定的效果量:關聯性測量以及卡方獨立性檢定的效果量:勝率比。除了效果量外,我們還可以「拆解」列聯表來瞭解哪些細格造成統計上顯著的結果,有點類似單因子變異數分析的事後比較。

單因子變異數分析屬於一種綜合檢定,假設檢定的結果僅指出自變項整體是否有效果,但無法知道自變項裡的哪些群組間有顯著的不同,需要進行事後比較才能知道。卡方獨立性檢定也是類似的情形,假設檢定的結果僅指出2個類別變項間有關聯,但無法知道哪些情況造成了統計顯著的結果,此時可以透過標準化殘差(standardized residual)和調整後殘差(adjusted residual)來做進一步的探索。

下面將介紹標準化殘差和調整後殘差的意義、計算和運用的方法,並舉例說明,最後示範利用 SPSS 取得這些統計量的操作過程。因為文章內容為卡方獨立性檢定的延伸,若您不清楚或不熟悉這種統計檢定,建議您先閱讀卡方獨立性檢定的假設檢定,將有助於內文的理解喔!

  • 標準化殘差的意義和計算
  • 調整後殘差的意義和計算
  • 標準化殘差和調整後殘差的例子
  • 運用 SPSS 取得標準化殘差和調整後殘差

標準化殘差的意義和計算

當卡方獨立性檢定的假設檢定結果指出類別變項(測量尺度為名義尺度的變項)間有關聯時,雖然可再透過相關性測量和勝率比來瞭解變項間的關聯程度,但我們仍舊不曉得哪些情況導致了統計顯著的結果。為了解答這個疑惑,可以「拆解」列聯表,仔細檢視列聯表裡的每一個細格,利用觀察次數和期望次數來計算標準化殘差。

殘差是指列聯表的細格裡觀察次數和期望次數的差值,而標準化殘差是把殘差除以期望次數的平方根,因此標準化殘差可說是觀察次數和期望次數之間相對差異的一個描述統計量。若讓O_{ij}代表第i個列類別和第j個欄類別的觀察次數,E_{ij}代表第i個列類別和第j個欄類別的期望次數,標準化殘差\text {SR}_{ij}的計算公式如下:

(1)   \begin{equation*}\text{SR}_{ij} = \frac {O_{ij}-E_{ij}}{\sqrt {E_{ij}}}\end{equation*}

在變項彼此獨立的虛無假設下,利用公式(1)求得的標準化殘差會趨近於平均數為0的常態分配,但變異數小於1(Agresti, 2013)。基於這個因素,當進行假設檢定時,直接比較標準化殘差的統計量和常態分配下的標準分數(z分數),會導致不容易拒絕虛無假設的結果。為了改善這一個問題,標準化殘差須進行調整,變成下面的調整後殘差。

調整後殘差的意義和計算

調整後殘差是從標準化殘差而來,為了讓統計量帶有平均數為0且變異數為1的常態分配型態所做的調整。調整後殘差的分子仍舊是觀察次數和期望次數的差值,但分母不再僅是期望次數的平方根,而是考量了列和欄的邊際合計後所做的調整。若讓R_i代表第i個類別的列總和,C_j代表第j個類別的欄總和,T代表樣本總數,調整後殘差的公式如下:

(2)   \begin{equation*}\text {Adj. SR}_{ij} = \frac {O_{ij}-E_{ij}}{\sqrt {E_{ij} \left ( 1-\dfrac {R_i}{T} \right ) \left ( 1-\dfrac {C_j}{T} \right )}}\end{equation*}

利用公式(2)計算得到的調整後殘差統計量即帶有平均數為0且變異數為1的常態分配型態,也就是說,可以把調整後殘差視為標準分數。如果調整後殘差的絕對值夠大,就能主張觀察次數和期望次數的差值達到統計上顯著。

回憶一下常態曲線下的面積,在雙尾檢定下,當超出標準分數的面積為0.05時(即顯著水準為0.05),標準分數為\pm 1.96;當超出標準分數的面積為0.01時,標準分數為\pm 2.58。換句話說,在顯著水準為0.05、雙尾檢定的情況下,當調整後殘差大於1.96或小於-1.96時,觀察次數即顯著地不同於期望次數。同樣地,在顯著水準為0.01、雙尾檢定時,當調整後殘差大於2.58或小於-2.58時,觀察次數即顯著地不同於期望次數。

normal distribution with alpha 0.05 and 0.01

除了利用如上圖的標準常態分配表來尋找標準分數外,也能夠運用微軟的 Excel 來尋找常態曲線下的標準分數,詳細的操作說明可以參考如何使用 Excel 尋找常態曲線下面積或分數。

透過上述的調整後殘差統計量,可以知道哪些細格的觀察次數明顯地不同於期望次數,導致卡方獨立性檢定的顯著結果。這一列聯表拆解的過程也讓我們更清楚地瞭解變項類別間的關係,具有相當的實用性,下面舉個例子來示範計算過程和解釋計算結果。

標準化殘差和調整後殘差的例子

假設有位研究人員想探討居住地區和對陌生人幫助行為之間的關係,她給250位研究參與者一個陌生人需要幫助的假想情境,並調查他們的幫助意願。若居住地區的2個類別為鄉村和城市,而幫助行為的2個類別為幫助和不幫助,居住地區和幫助行為的列聯表如下。

鄉村 ① 城市 ② 列合計
幫助 ① 75
(60)
50
(65)
125
不幫助 ② 45
(60)
80
(65)
125
欄合計 120 130 250

從〈卡方獨立性檢定的效果量:勝率比〉已經知道卡方獨立性檢定的結果為居住地區和對陌生人的幫助行為存在關聯,\chi^2 (1) = 14.423,p < .001。由於假設檢定的結果為統計上顯著,所以可進行事後分析,探討列聯表裡的哪些細格「貢獻」了統計上顯著的結果。

➊ 標準化殘差

事後分析包括標準化殘差和調整後殘差的運用,首先計算標準化殘差。上面的列聯表中每個細格括號裡的數值為期望次數,由於期望次數的計算方法已經在〈卡方獨立性檢定的假設檢定〉裡介紹過,這裡就不再說明。將每個細格裡的觀察次數和期望次數帶入上面的公式(1)裡,計算出各個細格的標準化殘差,並把所有無法整除的數值四捨五入到小數點後第3位,計算過程如下:

    \begin{align*}\text {SR}_{11} &= \frac {75-60}{\sqrt {60}} \approx 1.936 \\[5pt]\text {SR}_{12} &= \frac {50-65}{\sqrt {65}} \approx -1.861 \\[5pt]\text {SR}_{21} &= \frac {45-60}{\sqrt {60}} \approx -1.936 \\[5pt]\text {SR}_{22} &= \frac {80-65}{\sqrt {65}} \approx 1.861\end{align*}

在顯著水準為0.05、雙尾檢定的情況下,常態曲線下的標準分數為\pm 1.96。比較已經計算出來的4個標準化殘差的絕對值和標準分數\pm 1.96的絕對值,沒有任一個標準化殘差大於1.96,代表沒有任何一個細格的觀察次數顯著地不同於期望次數。這樣的結果難以解釋卡方獨立性檢定為統計上顯著的結果,也印證了標準化殘差的假設檢定不容易拒絕虛無假設的說法(Agresti, 2013)。

➋ 調整後殘差

為了改善標準化殘差較不容易拒絕虛無假設的情形,接著計算調整後殘差。調整後殘差的計算除了觀察次數和期望次數外,還需要列和欄的邊際合計,計算上稍微麻煩一點。將列聯表裡的數值帶入上面的公式(2)裡,並把所有無法整除的數值四捨五入到小數點後第3位,計算過程如下:

    \begin{align*}\text {Adj. SR}_{11} &= \frac {75-60}{\sqrt {60 \left ( 1-\dfrac {125}{250} \right ) \left ( 1-\dfrac {120}{250} \right )}} \approx 3.798 \\[5pt]\text {Adj. SR}_{12} &= \frac {50-65}{\sqrt {65 \left ( 1-\dfrac {125}{250} \right ) \left ( 1-\dfrac {130}{250} \right )}} \approx -3.798 \\[5pt]\text {Adj. SR}_{21} &= \frac {45-60}{\sqrt {60 \left ( 1-\dfrac {125}{250} \right ) \left ( 1-\dfrac {120}{250} \right )}} \approx -3.798 \\[5pt]\text {Adj. SR}_{22} &= \frac {80-65}{\sqrt {65 \left ( 1-\dfrac {125}{250} \right ) \left ( 1-\dfrac {130}{250} \right )}} \approx 3.798\end{align*}

比較上面的4個調整後殘差的絕對值和標準分數\pm 1.96的絕對值,所有的調整後殘差都大於1.96,代表每一個細格的觀察次數都顯著地不同於期望次數。這樣的結果指出,在鄉村裡有幫助意願的人顯著地多於預期而沒有幫助意願的人顯著地少於預期,但在城市裡有幫助意願的人顯著地少於預期而沒有幫助意願的人顯著地多於預期。

運用 SPSS 取得標準化殘差和調整後殘差

標準化殘差和調整後殘差可以透過統計分析軟體 SPSS 取得,省去逐一計算的麻煩,而且操作過程很簡單。這裡使用居住地區和對陌生人的幫助行為的原始資料來操作,在 SPSS 資料編輯器的頁面,點選功能表的分析 » 敘述統計 » 交叉資料表,帶出「交叉表」視窗。若想瞭解更多 SPSS 的操作,可以參考 SPSS操作環境和資料輸入。

spss menu of chi-square post hoc analysis

在「交叉表」視窗裡,將一個變項移至列(O),另一個變項移至欄(C),完成後再點選視窗右側的資料格(E)。在「交叉資料表:資料格顯示」視窗裡,勾選計數(T)方框裡的期望值(E)和殘差長框裡的未標準化(U)、標準化(S)和調整的標準化(A),然後按下視窗下方的繼續(C)。回到「交叉表」視窗後,再按下確定。

spss dialog box of chi-square post hoc analysis

經過上述的步驟後,SPSS 會輸出如下的列聯表,每一個細格裡從上到下分別為觀察次數、期望次數、殘差、標準化殘差和調整後殘差。從下表可以看到,4個細格的標準化殘差和調整後殘差統計量都和上面紙筆計算的結果相同。因此,當比較調整後殘差統計量和常態分配的標準分數時,也會得到拒絕虛無假設的結果,代表每一個細格裡的觀察次數都顯著地不同於期望次數。

spss output of chi-square post hoc analysis

簡單來說,透過標準化殘差和調整後殘差統計量,可以瞭解卡方獨立性檢定達到統計上顯著的原因,而且每個細格的深入檢驗也能夠讓我們更清楚變項類別之間的關係。利用 SPSS 執行卡方獨立性檢定時,不妨同時取得這些統計量,將有助於分析結果的理解喔!

以上為本篇文章對卡方獨立性檢定事後分析的介紹,希望透過本篇文章,您瞭解了標準化殘差和調整後殘差的意義、計算和運用,也學會了利用 SPSS 取得這些統計量的操作方法。若您喜歡這篇文章,請將本網站加入書籤,並隨時回訪本網站喔!另外,也歡迎您追蹤本網站的 Facebook 和/或 X(Twitter)專頁喲!

如果您覺得本篇文章對您有幫助,歡迎買杯珍奶給 Dr. Fish!小小珍奶,大大鼓勵,您的支持將給 Dr. Fish 更多撰寫優質文章的動力喔!

參考資料

Agresti, A. (2013). Categorical data analysis (3rd ed.). Hoboken, NJ: John Wiley & Sons, Inc.

標籤: Excel SPSS 事後比較 假設檢定 列聯表 勝率比 卡方檢定 單因子變異數分析 四捨五入 常態分配 效果量 期望次數 標準分數 標準化殘差 標準常態分配表 獨立性檢定 觀察次數 調整後殘差 關聯性測量 雙尾檢定 顯著水準

文章導覽

❮ Previous Post: 卡方獨立性檢定的效果量:勝率比
Next Post: Cohen′s kappa:評分者間信度的測量方法 ❯

您可能也會喜歡

featured image of Wilcoxon signed-rank test
Wilcoxon配對符號等級檢定的假設檢定
featured image of likelihood ratio test
概似比檢定:類別資料分析的另一種選擇
featured image of Mann-Whitney U test
曼–惠特尼U檢定的假設檢定
featured image of sign test using Excel
如何使用Excel執行符號檢定

關於 Dr. Fish

profile picture uploaded on July 5, 2024

喜歡求知和分析,所以一路讀到博士。也喜歡旅行、攝影、料理、看日劇,愛把複雜的思想和事物變簡單,是個有點宅也有點跳TONE的人。

支持 Dr. Fish

本網站經營和文章撰寫皆由Dr. Fish一人完成,投注許多時間和費用。若您喜歡任何一篇文章或覺得文章對您有幫助,請給我一些支持,買杯珍奶給我吧!您的支持不但能給我更多撰寫文章的動力,也可以讓這網站的經營持續下去喔!謝謝!😄

boba-icon
請我喝珍奶!
featured image of spss environment and data entry

下載專區

標準常態分配表

Student's t 分配臨界值表

F分配臨界值表

卡方分配臨界值表

斯皮爾曼等級相關係數臨界值表

Wilcoxon配對符號等級檢定臨界值表

曼–惠特尼U檢定臨界值表

Student化全距分配臨界值表

Dunnett檢定臨界值表(雙尾檢定)

單一樣本z檢定的SPSS語法

關於Dr. Fish漫游社會統計

本網站使用簡單易懂的文字解說社會統計,並示範軟體操作,同時有課後隨筆的分享,希望讀者在學習之餘,也能感受到生活的樂趣。

網站政策

著作權聲明 Copyright Notice
隱私權政策 Privacy Policy
免責聲明  Disclaimer

追蹤我們

Facebook
X(Twitter)

Copyright © 2021-2025 Dr. Fish 漫游社會統計. All rights reserved.