請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址
點二系列相關係數的意義和計算
行為和社會科學的研究裡最常使用皮爾森積差相關係數(Pearson product-moment correlation coefficient)來瞭解兩個變項之間的關聯程度和方向,但此種相關係數適用在兩個變項的測量尺度皆至少為等距尺度的連續變項資料上,若其中有一個變項為二分變項(dichotomous variable)時,即變得不合適。
二分變項是指變項只有兩個數值,也就是只存在兩個類別,和可能帶有各種不同數值的連續變項有很大的差別。若想探討一個二分變項和一個連續變項之間的關聯性,可以使用點二系列相關係數(point-biserial correlation coefficient)。
下面將先說明點二系列相關係數的意義,然後舉一個例子說明點二系列相關係數的計算方式和計算結果的解釋,再示範利用SPSS取得點二系列相關係數的操作方法,最後比較點二系列相關係數和二系列相關係數的異同。
點二系列相關係數的意義
皮爾森積差相關係數是最常被使用的一種相關係數,適用在兩個變項資料的測量尺度皆為等距或比率尺度的情況。若兩個變項裡有一個變項為二分變項,另一個變項為等距或比率尺度的變項時,就不適合使用皮爾森積差相關係數來探討兩者之間的關聯性。
如果想探討一個二分變項和一個連續變項之間的關聯程度時,可使用點二系列相關係數(point-biserial correlation coefficient),符號為。二分變項是指變項僅有兩個類別,例如生理男性和女性、結婚和沒有結婚、實驗組和控制組,而在資料輸入時,通常會將兩類別分別編碼為0、1或1、2,至於哪一個數值分配到哪一個類別並沒有關係,僅會影響相關係數的正負號而已。
因此,點二系列相關係數是用來評估一個二分變項和一個連續變項之間關聯強度和方向的一種相關係數。雖然該相關係數的適用時機和名稱與皮爾森積差相關係數(符號為)截然不同,但它的計算卻是使用皮爾森積差相關係數的公式。換句話說,點二系列相關係數是皮爾森積差相關係數的一個特例,而從代數上來看,
。
下面舉一個例子來示範點二系列相關係數的紙筆計算過程,並說明該相關係數計算結果的意思和解釋的方法。
點二系列相關係數的計算
假設有位社會統計學的大學教師想探討社會統計學的學期成績和生理性別之間的關聯程度,因此她從修課的學生中隨機抽取出5位女同學和5位男同學,並記錄他們已經修習完成的社會統計學學期成績。若生理性別的變項名稱為SEX,女同學的編碼為0,男同學的編碼為1,這10位學生的成績(SCORE)如下表。試問學生的生理性別和社會統計學成績之間的關聯程度為何?

首先,繪製一散布圖,將生理性別SEX置於橫座標軸,學期成績SCORE置於縱座標軸,繪製出的散布圖如下圖。從下圖可以看出,男同學整體的學期成績稍微低於女同學整體的成績,但女同學的成績較男同學的成績分散(變異較大)。

另外,圖中還加上一條迴歸線,該條迴歸線會通過兩類別各自的平均數。換句話說,若讓生理性別SEX為X變項、學期成績SCORE為Y變項,用X預測Y的最小平方迴歸線方程式為:
上面的方程式裡,指Y的預測值。當
時,
為截距
且等於女同學的平均學期成績;而當
時,
則是男同學的平均學期成績。
因為生理性別為二分變項,學期成績為連續變項,所以可使用點二系列相關係數來計算兩者之間的關聯程度。由於點二系列相關係數的計算使用皮爾森積差相關係數的公式,所以先回顧皮爾森積差相關係數的計算方法。
讓和
分別指X變項和Y變項裡所有數值的總和、
指成對的X和Y變項數值的交叉乘積和、
和
分別指X變項和Y變項裡所有數值平方後的總和、
和
分別指X變項和Y變項裡所有分數總和的平方、
為樣本的總個數,皮爾森積差相關係數的運算公式為:
(1)
為了減少計算時可能發生的錯誤,可先將利用公式(1)時所需要的數值在如下的表格裡計算出來:

接著,將表格中的數值帶入皮爾森積差相關係數的公式(1)裡,計算過程如下:
從計算結果得知,點二系列相關係數為-0.567,代表學生的生理性別和社會統計學學期成績之間具有中等以上的關聯程度。此外,負數的相關係數指出編碼為1的類別之平均數值低於編碼為0的類別,也就是男同學的平均學期成績低於女同學的平均學期成績。
實際計算出女同學和男同學的平均學期成績(如下),發現女同學的平均學期成績為70.8分,男同學則為57.4分,所以男同學的平均學期成績確實低於女同學的成績。
就像皮爾森積差相關係數可以平方後(變成決定係數)再進行解釋一樣,點二系列相關係數也可以平方後再做解釋。將上面計算出來的點二系列相關係數平方,,為求得百分比再將
,代表學生的生理性別可以說明或解釋32.15%社會統計學學期成績的變異。
運用SPSS計算點二系列相關係數
將上面範例中的數值輸入至SPSS資料編輯器中,輸入完成後,點選功能表的分析 » 相關 » 雙變異數,帶出「雙變量相關性」視窗。關於SPSS的資料輸入方法,請參考SPSS操作環境和資料輸入。

在「雙變量相關性」視窗中,將SEX和SCORE兩個變項移至右方的變數(V)方框中,勾選相關係數常框裡的Pearson選項,其他的選項不用變更,最後點選最下方的確定。

經過上述的步驟後,SPSS會輸出如下的「相關性」表格。不論是看SEX欄或SCORE欄都可以,計算結果顯示學生的生理性別和社會統計學學期成績之間的點二系列相關係數為-0.567,可看出SPSS輸出的結果和上面紙筆計算的結果相同。

最後,有一種很容易和點二系列相關係數混淆,且名稱也相當類似的相關係數稱為二系列相關係數(biserial correlation coefficient),以下稍做概念上的介紹。
二系列相關係數和點二系列相關係數的比較
二系列相關係數和點二系列相關係數皆是用來探討一個二分變項和一個連續變項之間關聯程度的相關係數,但兩種相關係數對於二分變項的定義有所不同。點二系列相關係數所指的二分變項是指真實的(true)或間斷的(discrete)二分變項,但二系列相關係數的二分變項則是指具有連續性質(continuum)的二分變項。
點二系列相關係數的二分變項真實地僅存在兩種可能,例如死亡和活著、實驗組和控制組等兩種明確的類別,但二系列相關係數則考量了兩類別間可能存在的連續性。舉例來說,考試雖可簡單地分為「通過」和「沒通過」,但實際上可能有高分通過、低空飛過、差1分就通過和一敗塗地等不同的程度。再例如,兒童受虐雖可簡單地分為「有受虐」和「沒有受虐」,但實際上虐待會有各種不同程度的差異。
因此,二系列相關係數即是將二分變項的兩類別之間的連續性納入考量,並測量這種連續的二分變項和一個連續變項之間關聯程度的相關係數。雖然此種相關係數合乎情理地考慮了二分變項的質性特徵,但實務上很少被使用,大多數仍舊是以真實的或間斷的二分變項作為資料分析的變項。
上面的內容僅單純地探討一個二分變項和一個連續變項間關聯程度和方向的計算,若想進一步瞭解兩個變項間的關係是否真實地存在於母群體中,則須進行假設檢定,詳細的介紹請參考點二系列相關係數的假設檢定。
以上為本篇文章對點二系列相關係數的意義和計算方式的介紹,希望透過本篇文章,您瞭解了點二系列相關係數的使用時機、計算方法,也學會了利用SPSS取得點二系列相關係數的操作方法。
若您喜歡本篇文章,請將本網站加入書籤,作為您的學習資源,並持續回訪本網站喔!另外,您也可以在Facebook和Twitter上找到我們喲!