Skip to content

合作邀約 email: dr.fish@drfishstats.com

  • Facebook
  • X
site icon of Dr. Fish

Dr. Fish 漫游社會統計

魚博士的專業漫談和課後隨筆

  • Home
  • 關於Dr. Fish
  • 統計基礎
    • 入門概念
    • 圖形繪製
    • 描述統計
    • 相關
    • 線性迴歸
  • 統計進階
    • 推論統計
    • 統計檢定
      • 相關係數
      • 迴歸
      • 平均數比較
      • 無母數檢定
  • EXCEL系列
    • 資料管理
    • 圖形繪製
      • 匯出SPSS資料至Excel並繪製盒形圖
      • 如何使用Excel製作Q-Q plot
      • 如何使用Excel繪製加上誤差線的長條圖
    • 描述統計
      • 如何使用Excel執行次數分配
      • 如何使用Excel樞紐分析表製作次數分配表
      • 如何使用Excel計算偏態和峰態
      • 如何使用Excel尋找常態曲線下面積或分數
      • 如何使用Excel一次取得描述性統計量
      • 如何使用Excel計算共變異數
      • 如何使用Excel取得皮爾森積差相關係數
      • 如何使用Excel製作列聯表
    • 推論統計
      • 如何使用Excel計算信賴區間
      • 如何使用Excel執行符號檢定
      • 如何使用Excel執行單一樣本z檢定和t檢定
      • 如何使用Excel執行獨立樣本t檢定
      • 如何使用 Excel 執行 Levene 檢定
      • 如何使用 Excel 執行 Welch t 檢定
      • 如何使用Excel執行關聯樣本t檢定
      • 如何使用Excel執行單因子變異數分析
      • 如何使用Excel執行簡單線性迴歸
      • 如何使用Excel計算最小平方迴歸線的預測區間
      • 如何使用Excel執行卡方獨立性檢定
  • 下課後
    • 生活
    • 旅遊
      • 日本
    • 美食
    • 攝影
  • 聯絡Dr. Fish
  • Home
  • 相關
  • 點二系列相關係數的意義和計算

🐟 請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址

點二系列相關係數的意義和計算

Posted on 2022-04-012023-08-08 Updated on 2023-08-082023-08-08 By Dr. Fish
相關

行為和社會科學的研究裡最常使用皮爾森積差相關係數(Pearson product-moment correlation coefficient)來瞭解兩個變項之間的關聯程度和方向,但此種相關係數適用在兩個變項的測量尺度皆至少為等距尺度的連續變項資料上,若其中有一個變項為二分變項(dichotomous variable)時,即變得不合適。

二分變項是指變項只有兩個數值,也就是只存在兩個類別,和可能帶有各種不同數值的連續變項有很大的差別。若想探討一個二分變項和一個連續變項之間的關聯性,可以使用點二系列相關係數(point-biserial correlation coefficient)。

下面將先說明點二系列相關係數的意義,然後舉一個例子說明點二系列相關係數的計算方式和計算結果的解釋,再示範利用SPSS取得點二系列相關係數的操作方法,最後比較點二系列相關係數和二系列相關係數的異同。

  • 點二系列相關係數的意義
  • 點二系列相關係數的計算
  • 運用SPSS計算點二系列相關係數
  • 二系列相關係數和點二系列相關係數的比較

點二系列相關係數的意義

皮爾森積差相關係數是最常被使用的一種相關係數,適用在兩個變項資料的測量尺度皆為等距或比率尺度的情況。若兩個變項裡有一個變項為二分變項,另一個變項為等距或比率尺度的變項時,就不適合使用皮爾森積差相關係數來探討兩者之間的關聯性。

如果想探討一個二分變項和一個連續變項之間的關聯程度時,可使用點二系列相關係數(point-biserial correlation coefficient),符號為r_{pb}。二分變項是指變項僅有兩個類別,例如生理男性和女性、結婚和沒有結婚、實驗組和控制組,而在資料輸入時,通常會將兩類別分別編碼為0、1或1、2,至於哪一個數值分配到哪一個類別並沒有關係,僅會影響相關係數的正負號而已。

因此,點二系列相關係數是用來評估一個二分變項和一個連續變項之間關聯強度和方向的一種相關係數。雖然該相關係數的適用時機和名稱與皮爾森積差相關係數(符號為r)截然不同,但它的計算卻是使用皮爾森積差相關係數的公式。換句話說,點二系列相關係數是皮爾森積差相關係數的一個特例,而從代數上來看,r_{pb}=r。

下面舉一個例子來示範點二系列相關係數的紙筆計算過程,並說明該相關係數計算結果的意思和解釋的方法。

點二系列相關係數的計算

假設有位社會統計學的大學教師想探討社會統計學的學期成績和生理性別之間的關聯程度,因此她從修課的學生中隨機抽取出5位女同學和5位男同學,並記錄他們已經修習完成的社會統計學學期成績。若生理性別的變項名稱為SEX,女同學的編碼為0,男同學的編碼為1,這10位學生的成績(SCORE)如下表。試問學生的生理性別和社會統計學成績之間的關聯程度為何?

data of point-biserial correlation example

首先,繪製一散布圖,將生理性別SEX置於橫座標軸,學期成績SCORE置於縱座標軸,繪製出的散布圖如下圖。從下圖可以看出,男同學整體的學期成績稍微低於女同學整體的成績,但女同學的成績較男同學的成績分散(變異較大)。

scatterplot of point-biserial correlation data

另外,圖中還加上一條迴歸線,該條迴歸線會通過兩類別各自的平均數。換句話說,若讓生理性別SEX為X變項、學期成績SCORE為Y變項,用X預測Y的最小平方迴歸線方程式為:

    \[ \hat Y=a+bX \]

上面的方程式裡,\hat Y指Y的預測值。當X=0時,\hat Y為截距a且等於女同學的平均學期成績;而當X=1時,\hat Y則是男同學的平均學期成績。

因為生理性別為二分變項,學期成績為連續變項,所以可使用點二系列相關係數來計算兩者之間的關聯程度。由於點二系列相關係數的計算使用皮爾森積差相關係數的公式,所以先回顧皮爾森積差相關係數的計算方法。

讓\sum x和\sum y分別指X變項和Y變項裡所有數值的總和、\sum xy指成對的X和Y變項數值的交叉乘積和、\sum x^2和\sum y^2分別指X變項和Y變項裡所有數值平方後的總和、(\sum x)^2和(\sum y)^2分別指X變項和Y變項裡所有分數總和的平方、N為樣本的總個數,皮爾森積差相關係數的運算公式為:

(1)   \begin{equation*}r_{pb}=r=\frac {\sum xy-\dfrac {(\sum x)(\sum y)}{N}}{\sqrt { \left [ \sum x^2-\dfrac {(\sum x)^2}{N} \right ] \left [ \sum y^2-\dfrac {(\sum y)^2}{N} \right ] }}\end{equation*}

為了減少計算時可能發生的錯誤,可先將利用公式(1)時所需要的數值在如下的表格裡計算出來:

computation of data of point-biserial correlation example

接著,將表格中的數值帶入皮爾森積差相關係數的公式(1)裡,計算過程如下:

    \begin{align*}r_{pb} &= \frac {\sum xy-\dfrac {(\sum x)(\sum y)}{N}}{\sqrt { \left [ \sum x^2-\dfrac {(\sum x)^2}{N} \right ] \left [ \sum y^2-\dfrac {(\sum y)^2}{N} \right ] }} \\&= \frac {287-\dfrac {5 \times 641}{10}}{\sqrt { \left [ 5-\dfrac {5^2}{10} \right ] \left [ 42483-\dfrac {641^2}{10} \right ] }} \\&= \frac {287-320.5}{\sqrt {(5-2.5)(42483-41088.1)}} \\&= \frac {-33.5}{\sqrt {3487.25}} \\&\approx -0.567\end{align*}

從計算結果得知,點二系列相關係數為-0.567,代表學生的生理性別和社會統計學學期成績之間具有中等以上的關聯程度。此外,負數的相關係數指出編碼為1的類別之平均數值低於編碼為0的類別,也就是男同學的平均學期成績低於女同學的平均學期成績。

實際計算出女同學和男同學的平均學期成績(如下),發現女同學的平均學期成績為70.8分,男同學則為57.4分,所以男同學的平均學期成績確實低於女同學的成績。

    \begin{align*}\overline X_{female} &= \frac {80+58+68+89+59}{5}=70.8 \\[10pt]\overline X_{male} &= \frac {53+63+59+47+65}{5}=57.4\end{align*}

就像皮爾森積差相關係數可以平方後(變成決定係數)再進行解釋一樣,點二系列相關係數也可以平方後再做解釋。將上面計算出來的點二系列相關係數平方,(-0.567)^2 \approx 0.3215,為求得百分比再將0.3215 \times 100=32.15,代表學生的生理性別可以說明或解釋32.15%社會統計學學期成績的變異。

運用SPSS計算點二系列相關係數

將上面範例中的數值輸入至SPSS資料編輯器中,輸入完成後,點選功能表的分析 » 相關 » 雙變異數,帶出「雙變量相關性」視窗。關於SPSS的資料輸入方法,請參考SPSS操作環境和資料輸入。

spss menu of point-biserial correlation

在「雙變量相關性」視窗中,將SEX和SCORE兩個變項移至右方的變數(V)方框中,勾選相關係數常框裡的Pearson選項,其他的選項不用變更,最後點選最下方的確定。

dialog-box of bivariate correlation in spss

經過上述的步驟後,SPSS會輸出如下的「相關性」表格。不論是看SEX欄或SCORE欄都可以,計算結果顯示學生的生理性別和社會統計學學期成績之間的點二系列相關係數為-0.567,可看出SPSS輸出的結果和上面紙筆計算的結果相同。

spss output of point-biserial correlation

最後,有一種很容易和點二系列相關係數混淆,且名稱也相當類似的相關係數稱為二系列相關係數(biserial correlation coefficient),以下稍做概念上的介紹。

二系列相關係數和點二系列相關係數的比較

二系列相關係數和點二系列相關係數皆是用來探討一個二分變項和一個連續變項之間關聯程度的相關係數,但兩種相關係數對於二分變項的定義有所不同。點二系列相關係數所指的二分變項是指真實的(true)或間斷的(discrete)二分變項,但二系列相關係數的二分變項則是指具有連續性質(continuum)的二分變項。

點二系列相關係數的二分變項真實地僅存在兩種可能,例如死亡和活著、實驗組和控制組等兩種明確的類別,但二系列相關係數則考量了兩類別間可能存在的連續性。舉例來說,考試雖可簡單地分為「通過」和「沒通過」,但實際上可能有高分通過、低空飛過、差1分就通過和一敗塗地等不同的程度。再例如,兒童受虐雖可簡單地分為「有受虐」和「沒有受虐」,但實際上虐待會有各種不同程度的差異。

因此,二系列相關係數即是將二分變項的兩類別之間的連續性納入考量,並測量這種連續的二分變項和一個連續變項之間關聯程度的相關係數。雖然此種相關係數合乎情理地考慮了二分變項的質性特徵,但實務上很少被使用,大多數仍舊是以真實的或間斷的二分變項作為資料分析的變項。

上面的內容僅單純地探討一個二分變項和一個連續變項間關聯程度和方向的計算,若想進一步瞭解兩個變項間的關係是否真實地存在於母群體中,則須進行假設檢定,詳細的介紹請參考點二系列相關係數的假設檢定。

以上為本篇文章對點二系列相關係數的意義和計算方式的介紹,希望透過本篇文章,您瞭解了點二系列相關係數的使用時機、計算方法,也學會了利用SPSS取得點二系列相關係數的操作方法。

若您喜歡本篇文章,請將本網站加入書籤,作為您的學習資源,並持續回訪本網站喔!另外,您也可以在Facebook和Twitter上找到我們喲!

標籤: SPSS 二分變項 二系列相關係數 假設檢定 散布圖 決定係數 測量尺度 皮爾森積差相關係數 相關係數 迴歸線 連續變項 點二系列相關係數

文章導覽

❮ Previous Post: 二天二夜恆春遊:戀海126風情旅棧
Next Post: 點二系列相關係數的假設檢定 ❯

您可能也會喜歡

featured image of Pearson correlation using Excel
如何使用Excel取得皮爾森積差相關係數
featured image of adjusted correlation coefficient
調整後相關係數的意義和計算
featured image of Pearson computation methods
如何計算皮爾森積差相關係數
featured image of definition of pearson correlation coefficient
何謂皮爾森積差相關係數

關於 Dr. Fish

profile picture uploaded on July 5, 2024

喜歡求知和分析,所以一路讀到博士。也喜歡旅行、攝影、料理、看日劇,愛把複雜的思想和事物變簡單,是個有點宅也有點跳TONE的人。

支持 Dr. Fish

本網站經營和文章撰寫皆由Dr. Fish一人完成,投注許多時間和費用。若您喜歡任何一篇文章或覺得文章對您有幫助,請給我一些支持,買杯珍奶給我吧!您的支持不但能給我更多撰寫文章的動力,也可以讓這網站的經營持續下去喔!謝謝!😄

boba-icon
請我喝珍奶!
featured image of spss environment and data entry

下載專區

標準常態分配表

Student's t 分配臨界值表

F分配臨界值表

卡方分配臨界值表

斯皮爾曼等級相關係數臨界值表

Wilcoxon配對符號等級檢定臨界值表

曼–惠特尼U檢定臨界值表

Student化全距分配臨界值表

Dunnett檢定臨界值表(雙尾檢定)

單一樣本z檢定的SPSS語法

關於Dr. Fish漫游社會統計

本網站使用簡單易懂的文字解說社會統計,並示範軟體操作,同時有課後隨筆的分享,希望讀者在學習之餘,也能感受到生活的樂趣。

網站政策

著作權聲明 Copyright Notice
隱私權政策 Privacy Policy
免責聲明  Disclaimer

追蹤我們

Facebook
X(Twitter)

Copyright © 2021-2025 Dr. Fish 漫游社會統計. All rights reserved.