Skip to content

合作邀約 email: dr.fish@drfishstats.com

  • Facebook
  • X
site icon of Dr. Fish

Dr. Fish 漫游社會統計

魚博士的專業漫談和課後隨筆

  • Home
  • 關於 Dr. Fish
  • 統計基礎
    • 入門概念
    • 圖形繪製
    • 描述統計
    • 相關
    • 線性迴歸
  • 統計進階
    • 推論統計
    • 統計檢定
      • 相關係數
      • 迴歸
      • 平均數比較
      • 無母數檢定
  • EXCEL 系列
    • 資料管理
    • 圖形繪製
    • 描述統計
    • 推論統計
  • 下課後
    • 生活
    • 旅遊
      • 日本
        • 北海道
        • 四國
    • 美食
    • 攝影
  • 聯絡 Dr. Fish
  • Home
  • 推論統計
  • 統計檢定
  • 相關係數
  • phi係數的假設檢定

🐟 請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址

phi係數的假設檢定

Posted on 2022-10-282023-08-10 Updated on 2023-08-102023-08-10 By Dr. Fish
無母數檢定, 相關係數

行為或社會科學領域的研究很常蒐集名義測量尺度的原始資料,特別是二分變項(dichotomous variable),也很常需要探討兩個二分變項之間的關聯性。二分變項是指僅有兩個類別的變項,例如生理女性和男性、生存和死亡、實驗組和對照組,通常會用0、1或1、2來編碼。

當兩個變項中的其中一個變項為二分變項,另一個變項為等距尺度或比率尺度的變項時,可使用點二系列相關係數(point-biserial correlation coefficient)來探討兩者之間的關聯性,通常用符號r_{pb}來表示。然而,當兩個變項皆為二分變項的時候,則須用phi係數(phi coefficient)來評估其間的關聯程度,符號為\phi。

雖然phi係數可用來瞭解兩個二分變項之間的關聯程度,但若要進一步判斷兩者之間的關聯性是否存在於母群體中,則要進行假設檢定(hypothesis testing),也可稱為顯著性檢定。因此,本篇文章將先簡單回顧phi係數的計算方法,再說明phi係數的假設檢定過程,最後示範利用SPSS評估phi係數假設檢定結果的操作方法。

  • phi係數的計算
  • phi係數的假設檢定
  • phi係數假設檢定的範例
  • 運用SPSS評估phi係數的假設檢定結果
    • 方法1:皮爾森積差相關係數的分析程序
    • 方法2:列聯表裡的統計量選項

phi係數的計算

phi係數的計算方法已經在phi係數的意義和計算裡介紹過,這裡稍做回顧。phi係數其實是皮爾森積差相關係數的特例,也就是將皮爾森積差相關係數的公式應用至較低層次的測量尺度變項上。換句話說,若要計算兩個二分變項之間的phi係數,只須套用皮爾森積差相關係數的公式來計算即可。

概念上而言,皮爾森積差相關係數是將兩個變項各自轉換成標準分數後,再計算他們之間的關聯程度,詳細的計算方法可參考如何計算皮爾森積差相關係數。由於使用概念公式的計算過程容易牽涉到小數,增加計算錯誤的機率,所以可改使用下面的計算公式:

    \[ \phi=r=\frac {\sum {xy}-\dfrac {(\sum x)(\sum y)}{N}}{\sqrt { \left [ \sum x^2-\dfrac {(\sum x)^2}{N} \right ] \left [ \sum y^2-\dfrac {(\sum y)^2}{N} \right ] }} \]

上面的公式裡,\sum x和\sum y分別指X變項和Y變項所有數值的總和、\sum {xy}指成對的兩個變項數值的交叉乘積和、\sum x^2和\sum y^2分別指X變項和Y變項所有數值平方後的總和、(\sum x)^2和(\sum y)^2分別表示X變項和Y變項所有數值總和的平方、N為樣本的總個數。若您不清楚或不熟悉總和運算的方法,請參考社會統計常用的基本數學符號和運算。

計算後得到的phi係數可使用Jacob Cohen(1992)所提出的皮爾森積差相關係數的參考指標來評估關聯程度,若phi係數為正數,數值0.1到0.3之間為低度相關、0.3到0.5之間為中度相關、0.5到1.0之間為高度相關,負數的phi係數也可做相同的解釋。

strength of correlation by Cohen

雖然使用Cohen的參考指標可以很簡單、快速地判斷兩個變項之間的關聯程度,但研究人員最好還是依據研究本身的整體目的、各個研究領域的過往研究結果來解釋phi係數,而不要盲目地遵從參考指標。

透過phi係數,可以知道兩個二分變項之間的關聯強度,但無法知道兩者之間的關係是否達到統計顯著,換句話說,兩者之間的關係是否存在於母群體中。為了解決這一問題,須進行假設檢定,下面就來介紹phi係數的假設檢定。

phi係數的假設檢定

phi係數的假設檢定不具有方向性,若母群體的相關係數為\rho,phi係數的假設檢定是在評估\rho=0的虛無假設(H_0),也就是檢驗兩個二分變項是來自於\rho=0的一組隨機樣本。對立假設(H_1)則主張\rho \neq 0,也就是兩個變項是來自於\rho \neq 0的一組隨機樣本。關於研究假設的介紹,請參考研究假設的種類和寫法。

擬定好研究假設後,依據研究的性質、目的和研究可能帶來的後果,設定適當的顯著水準,或稱為α水準,習慣上為0.05、0.01或更嚴苛的0.001。

phi係數的假設檢定使用卡方分配和卡方檢定統計量,若讓N指樣本總個數、\phi指phi係數,卡方檢定統計量\chi^2的計算公式為:

(1)   \begin{equation*}\chi^2=N \phi^2\end{equation*}

卡方分配會隨著自由度(degrees of freedom,簡寫為df)的改變而有不同的分布型態,而自由度的計算與列聯表的列、欄數目有關。若讓列的數目為r、欄的數目為c,自由度的計算公式如下:

    \[ df=(r-1) \times (c-1) \]

列聯表的列、欄數目其實就是兩個變項各自的類別數目,由於phi係數涉及到兩個二分變項,代表每個變項的類別數目為2,所以自由度永遠為(2-1) \times (2-1)=1。

運用上面的公式(1)求得卡方檢定統計量後,查詢卡方分配表,根據事先設定好的α水準和自由度1,找到相對應的臨界值。最後,運用決策規則,比較卡方檢定統計量和臨界值,若卡方檢定統計量等於或大於臨界值,即可拒絕虛無假設,接受對立假設;反之,則保留虛無假設。

如果使用統計分析軟體(例如SPSS、SAS)進行分析,通常會輸出獲得特定卡方檢定統計量的機率,也就是p值,而不會輸出臨界值。這時候須運用機率比較的決策規則,當p \leq \alpha,即可拒絕虛無假設,接受對立假設;若p > \alpha,則保留虛無假設。但不論使用哪種決策規則,都會得到相同的結論。

瞭解了phi係數的假設檢定步驟後,以下使用〈phi係數的意義和計算〉裡防治宣導課程的參與和求助行為的範例來實際操作整個假設檢定的過程。

phi係數假設檢定的範例

假設有位家庭暴力防治的研究人員想瞭解親密伴侶暴力受虐者的求助行為和親密伴侶暴力防治宣導課程之間的關聯,她有10位參與者的資料,記錄了他們的課程參與情況和求助行為(如下表)。受虐者是否曾參與宣導課程的變項名稱為EDU,曾參與者的編碼為1,不曾參與者的編碼為0;受虐者是否曾向他人求助的變項名稱為HELP,曾求助者的編碼為1,不曾求助者的編碼為0。使用α水準0.05,試問親密伴侶暴力受虐者的求助行為和宣導課程的參與之間是否有顯著的關聯?

data of phi coefficient example

這位研究人員想探討親密伴侶暴力受虐者的求助行為和防治宣導課程的參與之間是否有關聯,為無方向性的研究假設,對立假設和虛無假設分別為:

  • 對立假設(H_1):親密伴侶暴力受虐者的求助行為和防治宣導課程的參與有關聯。換句話說,這10位參與者是來自於母群體相關係數\rho \neq 0的一組隨機樣本。
  • 虛無假設(H_0):親密伴侶暴力受虐者的求助行為和防治宣導課程的參與沒有關聯。換句話說,這10位參與者是來自於母群體相關係數\rho=0的一組隨機樣本。

因為親密伴侶暴力受虐者的求助行為和宣導課程的參與皆是用0和1編碼,所以兩個變項都屬於二分變項。為了探討兩者之間的關聯性是否真實地存在於母群體中,可使用phi係數的假設檢定。

phi係數的假設檢定使用卡方檢定統計量,計算公式為上述的公式(1)。為了使用這個公式,須先求得兩個變項之間的phi係數,從〈phi係數的意義和計算〉裡phi係數的計算已經知道\phi=0.408,再將這個數值帶入上面的公式(1)裡:

    \[ \chi^2=N \phi^2=10 \times (0.408)^2 \approx 1.665 \]

計算結果顯示卡方檢定統計量為1.665,然後查詢卡方分配表,當α水準為0.05且自由度為1的時候,卡方臨界值為3.841。

critical value of chi-square with alpha 0.05 and df 1

最後,運用決策規則,比較卡方檢定統計量和臨界值,因為1.665<3.841,所以保留虛無假設。分析結果顯示,親密伴侶暴力受虐者的求助行為和防治宣導課程的參與沒有關聯。

這樣的研究結果可能讓人有點納悶,雖然這兩個變項的phi係數為0.408,若以Cohen的評估指標來看,兩者也達到中等程度的關聯;若從兩個變項所製成的列聯表(或稱為交叉表)來看,曾經參與宣導課程的人向他人求助的比率(66.7%)確實高於不曾參與課程的人(25%),但兩個變項之間的關聯卻沒有達到統計顯著。

contingency table of phi coefficient example

這樣的結果很可能導因於本範例的樣本總數N只有10,過小的樣本數目影響了統計檢定力,降低了拒絕錯誤虛無假設的機率。若使用更大的樣本來複製該研究,說不定會得到不同的研究發現。

運用SPSS評估phi係數的假設檢定結果

運用SPSS評估phi係數的假設檢定結果有兩種方法,一種是使用皮爾森積差相關係數的分析程序,另一種則是利用列聯表裡的統計量選項,以下分別示範操作方法。

方法1:皮爾森積差相關係數的分析程序

將範例中的變項數值輸入至SPSS資料編輯器中,輸入完成後,點選功能表的分析 » 相關 » 雙變異數,帶出「雙變量相關性」視窗。關於SPSS的資料輸入方法,請參考SPSS操作環境和資料輸入。

spss menu of phi coefficient

在「雙變量相關性」視窗中,將EDU和HELP兩個變項移至右方的變數(V)方框中,勾選相關係數長框中的Pearson選項,其他的選項不用更動,最後點選視窗下方的確定。

dialog box of bivariate correlation to calculate phi coefficient in spss

經過上述的步驟後,SPSS會輸出如下的「相關性」表格。不論看EDU欄或HELP欄都可以,下表顯示分析的樣本總個數N為10,phi係數(表格中的「皮爾森相關性」)為0.408,而獲得這個係數的機率值(表格中的「顯著性」)為0.242。

spss output of hypothesis test of phi coefficient

將上表中的顯著性(也就是p值)和事先設定的α水準相比較,利用決策規則,因為0.242 > 0.05,也就是p>\alpha,所以保留虛無假設。分析結果指出,親密伴侶暴力受虐者的求助行為和宣導課程的參與沒有關聯。

方法2:列聯表裡的統計量選項

在已經輸入範例資料的SPSS資料編輯器裡,點選功能表的分析 » 敘述統計 » 交叉資料表,帶出「交叉表」視窗。

using crosstab in spss to find phi coefficient

在「交叉表」視窗裡,將變項EDU移到欄(C),變項HELP移到列(O)後,先按一下最右邊的統計資料(S),會出現「交叉資料表:統計量」小視窗。在這個小視窗的名義方框中的4個選項裡,勾選Phi (Φ)和 Cramer´s V,完成後按下最下方的繼續(C)。回到「交叉表」視窗後,再按下最下方的確定。

dialog box of crosstab in spss to find significance test of phi coefficient

經過上述的步驟,SPSS會輸出如下的表格。從下表可看出,phi係數為0.408,大約顯著性(也就是p值)為0.197。比較顯著性和事先設定的α水準,因為0.197 > 0.05(p>\alpha),所以保留虛無假設。分析結果顯示,親密伴侶暴力受虐者的求助行為和宣導課程的參與之間沒有關聯。

spss output of significance test of phi coefficient using contingency table

因為方法1和方法2使用不同的演算法,雖然phi係數的數值相同,但獲得phi係數的機率值(SPSS表格裡的「顯著性」)並不相同。即便如此,不論使用哪一種方法,皆可進行phi係數的假設檢定,且會得到相同的分析結果。

以上為本篇文章對phi係數假設檢定的介紹,希望透過本篇文章,您瞭解了phi係數的假設檢定過程,也學會了如何利用SPSS評估phi係數的假設檢定結果。

若您喜歡本篇文章,請將本網站加入書籤,作為您的學習工具,並持續回訪本網站喔!此外,也歡迎您追蹤我們的Facebook和Twitter專頁喲!

參考資料

Cohen, J. (1992). A power primer. Psychological Bulletin, 112(1), 155-159. https://doi.org/10.1037/0033-2909.112.1.155

標籤: phi係數 SPSS 二分變項 交叉表 假設檢定 列聯表 卡方分配 檢定統計量 決策規則 測量尺度 皮爾森積差相關係數 相關係數 研究假設 統計檢定力 總和運算 自由度 顯著性檢定 顯著水準 點二系列相關係數

文章導覽

❮ Previous Post: 社會統計常用的基本數學符號和運算
Next Post: 莖葉圖的使用時機和製作方法 ❯

您可能也會喜歡

featured image of measures of association for chi-square test of independence
卡方獨立性檢定的效果量:關聯性測量
featured image of comparing 2 independent Pearson correlation coefficients
兩個獨立的皮爾森積差相關係數比較的假設檢定
featured image of Fisher's exact test
費雪精準檢定的使用時機和範例解說
featured image of hypothesis test of spearman rho
斯皮爾曼等級相關係數的假設檢定

關於 Dr. Fish

profile picture uploaded on July 5, 2024

喜歡求知和分析,所以一路讀到博士。也喜歡旅行、攝影、料理、看日劇,愛把複雜的思想和事物變簡單,是個有點宅也有點跳 TONE 的人。

支持 Dr. Fish

本網站經營和文章撰寫皆由 Dr. Fish 一人完成,投注許多時間和費用。若您喜歡任何一篇文章或覺得文章對您有幫助,請給我一些支持,買杯珍奶給我吧!您的支持不但能給我更多撰寫文章的動力,也可以讓這網站的經營持續下去喔!謝謝!😄

boba-icon
請我喝珍奶!
featured image of spss environment and data entry

下載專區

標準常態分配表

Student's t 分配臨界值表

F分配臨界值表

卡方分配臨界值表

斯皮爾曼等級相關係數臨界值表

Wilcoxon 配對符號等級檢定臨界值表

曼–惠特尼U檢定臨界值表

Student 化全距分配臨界值表

Dunnett 檢定臨界值表(雙尾檢定)

單一樣本z檢定的 SPSS 語法

關於 Dr. Fish 漫游社會統計

本網站使用簡單易懂的文字解說社會統計,並示範軟體操作,同時有課後隨筆的分享,希望讀者在學習之餘,也能感受到生活的樂趣。

網站政策

著作權聲明 Copyright Notice
隱私權政策 Privacy Policy
免責聲明  Disclaimer

追蹤網站

Facebook
X(Twitter)

Copyright © 2021-2026 Dr. Fish 漫游社會統計. All rights reserved.