Skip to content

合作邀約 email: dr.fish@drfishstats.com

  • Facebook
  • X
site icon of Dr. Fish

Dr. Fish 漫游社會統計

魚博士的專業漫談和課後隨筆

  • Home
  • 關於Dr. Fish
  • 統計基礎
    • 入門概念
    • 圖形繪製
    • 描述統計
    • 相關
    • 線性迴歸
  • 統計進階
    • 推論統計
    • 統計檢定
      • 相關係數
      • 迴歸
      • 平均數比較
      • 無母數檢定
  • EXCEL系列
    • 資料管理
    • 圖形繪製
      • 匯出SPSS資料至Excel並繪製盒形圖
      • 如何使用Excel製作Q-Q plot
      • 如何使用Excel繪製加上誤差線的長條圖
    • 描述統計
      • 如何使用Excel執行次數分配
      • 如何使用Excel樞紐分析表製作次數分配表
      • 如何使用Excel計算偏態和峰態
      • 如何使用Excel尋找常態曲線下面積或分數
      • 如何使用Excel一次取得描述性統計量
      • 如何使用Excel計算共變異數
      • 如何使用Excel取得皮爾森積差相關係數
      • 如何使用Excel製作列聯表
    • 推論統計
      • 如何使用Excel計算信賴區間
      • 如何使用Excel執行符號檢定
      • 如何使用Excel執行單一樣本z檢定和t檢定
      • 如何使用Excel執行獨立樣本t檢定
      • 如何使用 Excel 執行 Levene 檢定
      • 如何使用Excel執行關聯樣本t檢定
      • 如何使用Excel執行單因子變異數分析
      • 如何使用Excel執行簡單線性迴歸
      • 如何使用Excel計算最小平方迴歸線的預測區間
      • 如何使用Excel執行卡方獨立性檢定
  • 下課後
    • 生活
    • 旅遊
      • 日本
    • 美食
    • 攝影
  • 聯絡Dr. Fish
  • Home
  • 相關
  • phi係數的意義和計算

🐟 請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址

phi係數的意義和計算

Posted on 2022-08-122023-08-10 Updated on 2023-08-102023-08-10 By Dr. Fish
相關

皮爾森積差相關係數(Pearson product-moment correlation coefficient)是科學研究裡最常被使用的一種相關係數,用來瞭解兩個等距或比率測量尺度變項間的關聯程度。但當兩個變項裡的其中一個變項為二分變項或兩個變項皆為二分變項時,若要探討關聯程度,皮爾森積差相關係數就不是一個合適的相關係數。

當兩個變項中的其中一個變項為二分變項,而另一個變項為連續變項時,可採用點二系列相關係數(point-biserial correlation coefficient)來探討他們之間的關聯程度,符號為r_{pb}。然而,當兩個變項皆為二分變項,若想瞭解兩者間的相關程度,則須使用phi係數(phi coefficient),符號為\phi。

下面將先說明phi係數的意義,然後舉一個例子說明phi係數的計算方式和計算結果的解釋,再示範利用SPSS取得phi係數的操作方法,最後比較phi係數和四項相關係數的異同。

  • phi係數的意義
  • phi係數的計算
  • 運用SPSS計算phi係數
    • 方法1:皮爾森積差相關係數的分析程序
    • 方法2:列聯表裡的統計量選項
  • phi係數和四項相關係數的比較

phi係數的意義

很多科學研究都會使用皮爾森積差相關係數來探討兩個等距或比率測量尺度變項間的關聯性,不過在行為或社會科學的領域裡,很多時候變項不是等距或比率測量尺度,而是名義尺度的二分變項(dichotomous variable),例如是和否、生理女性和生理男性、實驗組和對照組。當兩個變項裡有一個為二分變項,甚或兩者皆為二分變項,探討兩個變項間的關聯性時,皮爾森積差相關係數就不是一個合適的相關係數選擇。

若兩個變項裡,一個變項為二分變項,另一個變項為等距或比率尺度的連續變項時,探討兩變項間的關聯性可以使用點二系列相關係數。然而,當兩個變項皆為二分變項的時候,則須使用phi係數來瞭解兩變項間的關聯程度,例如生理性別和就業與否、有沒有抽菸和是否死於肺癌之間的關聯性探討。

因此,phi係數是用來瞭解兩個二分變項之間關聯程度的一種相關係數。不過,雖然phi係數的使用時機和皮爾森積差相關係數完全不同,但它和點二系列相關係數一樣,都是皮爾森積差相關係數的特例,所以可使用皮爾森積差相關係數的公式來計算,只是在解釋計算結果時,遣詞用字上須稍微注意一些。

行為或社會科學領域的研究很常遇到兩個變項皆為二分變項的情況,下面就舉個例子來示範phi係數的計算過程,並說明phi係數計算結果的解釋方法。

phi係數的計算

假設有位家庭暴力防治的研究人員想瞭解親密伴侶暴力受虐者的求助行為和親密伴侶暴力防治宣導課程之間的關聯,她手上有10位參與者的資料,記錄了他們參與課程的情況和求助行為。受虐者是否曾參與宣導課程的變項名稱為EDU,曾參與者的編碼為1,不曾參與者的編碼為0;受虐者是否曾向他人求助的變項名稱為HELP,曾求助者的編碼為1,不曾求助者的編碼為0。這10位參與者的資料如下表:

data of phi coefficient example

因為是否曾參與宣導課程為二分變項,是否曾向他人求助也是二分變項,所以探討兩者之間的關聯性時,phi係數是較合適的相關係數。由於phi係數是皮爾森積差相關係數的特例,所以可套用皮爾森積差相關係數的公式來計算。

回顧皮爾森積差相關係數的計算,是將兩變項皆轉換成標準分數後,再計算他們之間的關聯性。若從這個概念來看,讓z_x為X變項數值的標準分數、z_y為Y變項數值的標準分數、\sum z_x z_y指成對的X變項和Y變項數值標準分數的乘積和、N為樣本總個數,皮爾森積差相關係數的公式如下:

    \[ r=\frac {\sum z_x z_y}{N-1} \]

但上面的公式在運算上比較容易出錯,因為須先計算出兩變項各自的平均數、標準差和各個數值的離差,才能計算出各個數值的標準分數,過程中可能充斥著小數。為了減少運算錯誤,可改使用便於計算的運算公式。

若讓\sum x和\sum y分別表示X變項和Y變項數值的總和、\sum xy指成對的兩變項數值的乘積和、\sum x^2和\sum y^2分別指X變項和Y變項所有數值平方後的總和、(\sum x)^2和(\sum y)^2分別表示X變項和Y變項所有數值總和的平方、N為樣本總個數,皮爾森積差相關係數的運算公式如下:

(1)   \begin{equation*}r=\frac {\sum xy-\dfrac {(\sum x)(\sum y)}{N}}{\sqrt { \left [ \sum x^2-\dfrac {(\sum x)^2}{N} \right ] \left [ \sum y^2-\dfrac {(\sum y)^2}{N} \right ] }}\end{equation*}

由於上面公式(1)的計算過程須使用到總和的運算,若您不清楚或不熟悉總和運算的方法,請參考社會統計常用的基本數學符號和運算。

假設上面例子裡的X變項為EDU、Y變項為HELP,先在如下的表格裡計算出套用上面公式(1)所需要的數值。

computation of phi coefficient example

接著,將表格裡的數值帶入上面皮爾森積差相關係數的公式(1)裡,計算過程如下:

    \begin{align*}\phi=r &= \frac {\sum xy-\dfrac {(\sum x)(\sum y)}{N}}{\sqrt { \left [ \sum x^2-\dfrac {(\sum x)^2}{N} \right ] \left [ \sum y^2-\dfrac {(\sum y)^2}{N} \right ] }} \\&= \frac {4-\dfrac {6 \times 5}{10}}{\sqrt { \left [ 6-\dfrac {6^2}{10} \right ] \left [ 5-\dfrac {5^2}{10} \right ] }} \\&= \frac {4-3}{\sqrt {(6-3.6)(5-2.5)}} \\& \approx 0.408\end{align*}

計算結果得到phi係數為0.408,代表是否曾參與親密伴侶暴力防治宣導課程和是否曾向他人求助的行為之間具有中度的關聯性,而正數的相關係數指出曾經參與過親密伴侶暴力防治宣導課程的受虐者愈有可能曾向他人求助過。關於變項之間可能具有的關係型態,請參考變項之間關係的基本特色。

為了更深入地瞭解受虐者是否曾參與親密伴侶暴力防治宣導課程和是否曾向他人求助之間的關係,可製作一如下表的列聯表(contingency table)或交叉表(cross tabulation)。從下表可以看出,不曾參與家庭暴力防治宣導課程的受虐者裡,僅有25%曾向他人求助;反觀曾經參與宣導課程的受虐者裡,則有66.7%曾向他人求助。

contingency table of phi coefficient example

就像皮爾森積差相關係數可以平方變成決定係數後再解釋一樣,phi係數也可以平方後再解釋。將上面計算出來的phi係數平方,(0.408)^2 \approx 0.166,為求得百分比,再將0.166 \times 100 =16.6,此數值表示是否參與過親密伴侶暴力防治的宣導課程可以說明或解釋16.6%是否曾向他人求助行為的變異。

運用SPSS計算phi係數

運用SPSS取得phi係數有兩種方法,第1種是使用皮爾森積差相關係數的分析程序,第2種是使用列聯表裡的統計量選項,以下分別介紹。

方法1:皮爾森積差相關係數的分析程序

將上面範例中的數值輸入至SPSS資料編輯器中,輸入完成後,點選功能表的分析 » 相關 » 雙變異數,帶出「雙變量相關性」視窗。關於SPSS的資料輸入方法,請參考SPSS操作環境和資料輸入。

spss menu of phi coefficient

在「雙變量相關性」視窗中,將EDU和HELP兩個變項移到右方的變數(V)方框中,勾選相關係數長框中的Pearson選項,其他的選項不用變動,最後點選視窗下方的確定。

dialog box of bivariate correlation to calculate phi coefficient in spss

透過上述的步驟,SPSS會輸出如下的「相關性」表格。雖然表格內顯示「皮爾森(Pearson)相關性」,但實際上為phi係數的計算結果。

spss output of phi coefficient

不論是看EDU欄或HELP欄都可以,上表顯示受虐者是否曾參加親密伴侶暴力防治宣導課程和是否曾向他人求助之間的相關係數為0.408,SPSS的計算結果和上面紙筆計算的結果相同。

方法2:列聯表裡的統計量選項

在已經輸入上面範例資料的SPSS資料編輯器裡,點選功能表的分析 » 敘述統計 » 交叉資料表,帶出「交叉表」視窗。

using crosstab in spss to find phi coefficient

在「交叉表」視窗裡,將變項EDU移到欄(C),變項HELP移到列(O)之後,先按一下最右邊的統計資料(S),在隨即出現的「交叉資料表:統計量」小視窗的名義方框中的4個選項裡,勾選Phi (Φ)和 Cramer´s V,然後按下小視窗最下方的繼續(C)。

回到「交叉表」視窗後,再按一下最右邊的資料格(E),在隨即出現的「交叉資料表:資料格顯示」小視窗的百分比方框裡,勾選欄(C),然後按下最下方的繼續(C)。回到「交叉表」視窗後,再按下最下方的確定。

dialog box of crosstab in spss to find phi coefficient

透過這個過程,SPSS會輸出一個兩個變項的交叉列表,如同上面我所製作的列聯表,可以清楚地看出兩個變項之間的關係。

spss output of contingency table for phi coefficient

除了列聯表外,SPSS還會輸出如下表的phi係數計算結果。從下表可以看出,phi係數為0.408,和上面利用方法1所得到的計算結果是相同的。

spss output of phi coefficient using contingency table

不論使用方法1或方法2,都可以得到phi係數的數值。如果只是單純地想知道兩個二分變項之間的相關係數,可以直接使用方法1,但若想要更清楚地明瞭兩個變項之間的關係,建議使用方法2。

不過,透過上述的操作程序,僅能明瞭兩個二分變項之間的關聯程度,若想進一步探討兩者之間的關係是否真實地存在於母群體中(也就是是否達到統計顯著),則須進行假設檢定,請參考phi係數的假設檢定。

最後,有一種也是用來計算兩個二分變項之間的關聯性,和phi係數相當類似的相關係數,稱為四項相關係數(tetrachoric correlation coefficient),但實際上非常少使用到,以下稍微做概念上的介紹。

phi係數和四項相關係數的比較

phi係數和四項相關係數之間的差異就如同點二系列相關係數和二系列相關係數之間的差異,也就是phi係數和點二系列相關係數對於二分變項的定義不同於四項相關係數和二系列相關係數,主要差異在於後兩者考量了二分變項類別間的質性特徵。

phi係數和四項相關係數都是用來探討兩個二分變項之間關聯性的相關係數,不過兩者對二分變項的定義不太相同。phi係數所指的二分變項是真實的(true)或間斷的(discrete)二分變項,但四項相關係數所指的二分變項則是具有連續性質的(continuum)二分變項。

phi係數的二分變項確實地僅存在兩種可能,例如有受訓練和沒有受訓練、有工作和沒有工作、實驗組和對照組、死亡和活著等兩種明確的類別。但四項相關係數則考量了每一個二分變項的類別間可能存在的連續性,例如課程參與雖然可簡單地分類為「有參與」和「沒有參與」,但實際上可能為幾分鐘的參與、1小時的參與、2小時的參與和全天的參與。再例如親密伴侶虐待雖可簡單地分為「有虐待」和「沒有虐待」,但實際上虐待會有程度上的不同。

因此,四項相關係數就是將每一個二分變項的類別間可能存在的連續性納入考量,並評估兩個具有連續性質的二分變項間關聯程度的一種相關係數。雖然此種相關係數更符合人情,但實際上鮮少被使用,實務上仍舊是以真實的或間斷的二分變項為主要的資料分析變項。

以上為本篇文章對phi係數的介紹,希望透過本篇文章,您瞭解了phi係數的意義、使用時機和計算方法,也學會了利用SPSS取得phi係數的兩種方法。

如果您喜歡本篇文章,請將本網站加入書籤,作為您的學習工具,並持續回訪本網站喔!此外,您也可以在Facebook和Twitter上找到我們喲!

標籤: phi係數 SPSS 二分變項 二系列相關係數 交叉表 列聯表 四項相關係數 標準分數 決定係數 測量尺度 皮爾森積差相關係數 連續變項 點二系列相關係數

文章導覽

❮ Previous Post: Electrolux 伊萊克斯 Flow A3 抗菌空氣清淨機【開箱文】
Next Post: 卡方適合度檢定的假設檢定 ❯

您可能也會喜歡

featured image of definition of pearson correlation coefficient
何謂皮爾森積差相關係數
featured image of kendall tau
肯德爾等級相關係數的意義和計算
featured image of partial and semipartial correlations
淨相關、半淨相關的意義和計算【Venn Diagram 解說】
featured image of adjusted correlation coefficient
調整後相關係數的意義和計算

關於 Dr. Fish

profile picture uploaded on July 5, 2024

喜歡求知和分析,所以一路讀到博士。也喜歡旅行、攝影、料理、看日劇,愛把複雜的思想和事物變簡單,是個有點宅也有點跳TONE的人。

支持 Dr. Fish

本網站經營和文章撰寫皆由Dr. Fish一人完成,投注許多時間和費用。若您喜歡任何一篇文章或覺得文章對您有幫助,請給我一些支持,買杯珍奶給我吧!您的支持不但能給我更多撰寫文章的動力,也可以讓這網站的經營持續下去喔!謝謝!😄

boba-icon
請我喝珍奶!
featured image of spss environment and data entry

下載專區

標準常態分配表

Student's t 分配臨界值表

F分配臨界值表

卡方分配臨界值表

斯皮爾曼等級相關係數臨界值表

Wilcoxon配對符號等級檢定臨界值表

曼–惠特尼U檢定臨界值表

Student化全距分配臨界值表

Dunnett檢定臨界值表(雙尾檢定)

單一樣本z檢定的SPSS語法

關於Dr. Fish漫游社會統計

本網站使用簡單易懂的文字解說社會統計,並示範軟體操作,同時有課後隨筆的分享,希望讀者在學習之餘,也能感受到生活的樂趣。

網站政策

著作權聲明 Copyright Notice
隱私權政策 Privacy Policy
免責聲明  Disclaimer

追蹤我們

Facebook
X(Twitter)

Copyright © 2021-2025 Dr. Fish 漫游社會統計. All rights reserved.