卡方獨立性檢定能夠用來探討2個類別變項為彼此獨立或相互關聯,當分析結果拒絕虛無假設且指出變項之間有關聯性時,我們並不知道這一層關聯的程度,也就是效果量的大小。效果量的呈現方法有2種:關聯性的測量(measures of association)和勝率比(odds ratio),這篇文章將介紹關聯性測量的方法。若您想瞭解勝率比呈現效果量的方法,可以參考卡方獨立性檢定的效果量:勝率比。
關聯性的測量是用一個量化的數值來呈現2個類別變項之間的關聯程度,類似於相關係數,例如皮爾森積差相關係數。不過不同於一般相關係數的數值會介於-1和1之間,用來呈現卡方獨立性檢定效果量的關聯性測量數值則會介於0和1之間,數值愈大代表2個類別變項的關聯程度愈大,也就是效果量愈大。
本篇文章將介紹這些關聯性測量的方法、使用時機、計算方式,並舉例說明,最後示範運用 SPSS 取得這些數值的操作方式。由於下面內容為卡方獨立性檢定的延伸,若您不清楚或不熟悉這種統計檢定,請先參考卡方獨立性檢定的假設檢定,將有助於下面內容的理解喔!
關聯性測量的方法
卡方獨立性檢定雖然可用來探討2個類別變項(測量尺度為名義尺度的變項)之間是否有關聯性,但從顯著性檢定的結果無法知道2個變項的關聯程度有多高。實際上,當樣本數目愈大的時候,卡方獨立性檢定愈容易達到統計上顯著,也就是2個變項為相互關聯的結果,因此若能夠知道2變項間的關聯強度,將可更清楚地看出變項之間的關係。
效果量是用來測量自變項的效果大小或變項之間關聯程度的一種客觀、標準化的方法,而關聯性的測量即是呈現效果量的一種方式。卡方獨立性檢定效果量的關聯性測量考量了樣本大小和自由度,計算出一個類似於相關係數的數值,只是一般的相關係數會介於-1和1之間,關聯性測量的數值則介於0和1之間。這些關聯性測量包括 phi、列聯係數(contingency coefficient)和 Cramér′s V,下面分別說明這3種方法。
phi (Φ)
第1種關聯性測量的方法為 phi,符號為 Φ,用來呈現2個二分變項之間的關聯程度。二分變項是指僅有2個類別的名義尺度變項,換句話說,phi 適用在2X2列聯表上。若讓代表卡方檢定統計量,代表樣本總數,phi 的計算公式如下:
(1)
利用公式(1)計算出來的2X2列聯表的 phi 數值會介於0和1之間,不過若把 phi 用在大於2X2的列聯表上,可能會出現大於1的數值,造成難以解釋的情況。因此,若要呈現大於2X2列聯表的關聯性程度,可改用下面的2種方法。
列聯係數
第2種關聯性測量的方法為列聯係數,用來呈現2個類別變項的關聯程度,適用在2X2或大於2X2的列聯表上。列聯係數的計算公式如下:
(2)
列聯係數的數值會介於0和1之間,數值愈大代表2個變項的關聯程度愈高。但很可惜的是,列聯係數幾乎不會達到數值1,即使2變項間為完全的關係也是如此。基於這個原因,若是大於2X2的列聯表,Cramér′s V 會是個更好的關聯性測量方法。
Cramér′s V
第3種關聯性測量的方法為 Cramér′s V,適用在2X2或大於2X2的列聯表上。若讓列和欄的數目裡較小的數值為,為樣本總數,為卡方檢定統計量,Cramér′s V 的計算方式如下:
(3)
和上面2種關聯性測量一樣,Cramér′s V 的數值會介於0和1之間。若是2X2列聯表,Cramér′s V 和 phi 的結果完全相同。若是大於2X2的列聯表,不同於列聯係數,當2個變項具有完全的關係時,Cramér′s V 的數值可以達到1。
關聯性測量的例子
這裡使用〈卡方獨立性檢定的假設檢定〉裡生理性別和政黨支持傾向的例子,假設有位政治學者想探討民眾的生理性別和他們的政黨支持傾向之間是否有關聯,她隨機抽取出500位成年女性和男性,並調查他們傾向於支持政黨A、政黨B或政黨C。這500位受訪民眾的生理性別和政黨支持傾向的列聯表如下,已知卡方檢定統計量為9.908,試問用關聯性測量呈現的效果量是多少?
政黨A | 政黨B | 政黨C | 列合計 | |
---|---|---|---|---|
生理女性 | 120 | 15 | 115 | 250 |
生理男性 | 90 | 10 | 150 | 250 |
欄合計 | 210 | 25 | 265 | 500 |
在這個例子裡,生理性別為2個類別的變項而政黨支持傾向為3個類別的變項,所以組成2X3列聯表。因為 phi 只能用在2X2列聯表上,所以這個例子不適合用 phi 來呈現效果量,但可用列聯係數和 Cramér′s V。
這個例子的卡方檢定統計量為9.908,樣本總數為500。另外,因為列的數目為2而欄的數目為3,列的數目較小,所以。把這些數值分別帶入上面的公式(2)和公式(3)來計算列聯係數和 Cramér′s V,過程如下:
➀ 列聯係數
➁ Cramér′s V
計算結果顯示列聯係數為0.139而 Cramér′s V 為0.141,不論是哪一個數值,都指出民眾的生理性別和他們的政黨支持傾向間的關聯程度沒有很高。若用〈何謂皮爾森積差相關係數〉裡提到的 Cohen(1992)指標來看,生理性別和政黨支持傾向間僅為低度相關。
雖然卡方獨立性檢定顯示生理性別和政黨支持傾向間具有顯著的關聯性,但效果量指出2個變項的關聯程度並不高。這個結果告訴我們,即使顯著性檢定指出變項間並非彼此獨立,變項間的關聯程度不一定很高。因此,在執行卡方檢定的假設檢定後,再進一步探討效果量將會讓我們更清楚看到變項間的關係。
運用 SPSS 取得關聯性測量的數值
把您想取得關聯性測量的資料輸入至 SPSS 資料編輯器裡,這裡使用民眾的生理性別和政黨支持傾向的500筆資料。資料輸入完成後,點選功能表的分析 » 敘述統計 » 交叉資料表,帶出「交叉表」視窗。關於 SPSS 的操作介面和資料輸入方法,請參考 SPSS操作環境和資料輸入。
在「交叉表」視窗裡,把一個變項移至列(O),另一個變項移至欄(C),再點選視窗最右側的統計量(S)。在「交叉資料表:統計量」視窗裡,先勾選卡方檢定(H),再勾選名義方框裡的列聯係數(O)和 Phi (Φ) 和 Cramér′s V,完成後按下視窗下方的繼續(C)。回到「交叉表」視窗後,再按下視窗最下方的確定。
經過上述的步驟後,SPSS 會輸出熟悉的卡方檢定結果表格。從下表可以看到,不論是卡方獨立性檢定(Pearson Chi-Square)或概似比檢定(Likelihood Ratio),兩者都顯示民眾的生理性別和他們的政黨支持傾向有關聯。關於詳細的卡方獨立性檢定和概似比檢定的假設檢定說明,可以分別參考卡方獨立性檢定的假設檢定和概似比檢定:類別資料分析的另一種選擇。
卡方檢定結果表格的下方即為關聯性測量表,顯示 Phi、Cramér′s V 和列聯係數(Contingency Coefficient)的數值。由於 Phi 不適合用在2X3列聯表,所以這裡就不看這個數值。Cramér′s V 的數值為0.141而列聯係數為0.139,這2個數值都和上面紙筆計算的結果相同,指出民眾的生理性別和政黨支持傾向間的關聯性並沒有很強。換句話說,雖然生理性別和政黨支持傾向存在關聯,但效果量沒有很大。
運用上面的操作方法,您可以取得卡方獨立性檢定的效果量,只是應用時須注意 phi 僅適用在2X2的列聯表,而 Cramér′s V 和列聯係數則可適用在2X2和大於2X2的列聯表上。
以上為本篇文章對卡方獨立性檢定效果量的介紹,希望透過本篇文章,您瞭解了呈現效果量的關聯性測量方法、各個方法的使用時機和計算方式,也學會了運用 SPSS 取得這些測量的操作方法。如果您喜歡這篇文章,請將本網站加入書籤,並隨時回訪本網站喔!另外,也歡迎您追蹤本網站的 Facebook 和/或 X(Twitter)專頁喲!
若您覺得本篇文章對您有幫助,歡迎買杯珍奶給 Dr. Fish!小小珍奶,大大鼓勵,您的支持將給 Dr. Fish 更多撰寫優質文章的動力喔!
參考資料
Cohen, J. (1992) A power primer. Psychological Bulletin, 112(1), 155-159. http://doi.org/10.1037/0033-2909.112.1.155