請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址
點二系列相關係數的假設檢定
點二系列相關係數(point-biserial correlation coefficient)是用來瞭解一個二分變項和一個連續變項之間關聯程度的一種相關係數,通常用符號來表示,而點二系列相關係數的假設檢定即在檢驗兩個變項間的關係是否真實地存在於樣本來自的母群體裡。
雖然點二系列相關係數在名稱和適用時機上與皮爾森積差相關係數(符號為)完全不同,但從數學的角度來看兩者卻是相同的,也就是
。換句話說,點二系列相關係數可以使用皮爾森積差相關係數的公式來計算,也可使用同樣的假設檢定方式。
以下將簡單回顧點二系列相關係數的計算,再介紹它的假設檢定過程並舉例說明,最後示範利用SPSS評估點二系列相關分析結果的操作步驟。由於下面內容為點二系列相關係數的延伸,且牽涉到假設檢定的過程,建議您可先閱讀點二系列相關係數的意義和計算以及假設檢定的步驟和範例,將有助於文章內容的銜接和理解。
點二系列相關係數的計算
點二系列相關係數是一種相關係數,用來測量一個二分變項和一個連續變項之間的關聯強度,數值介於1和-1之間。二分變項是指變項僅存在兩個類別,例如活著和死亡、合格和不合格,編碼時通常會使用0、1或1、2這兩個數值,而連續變項是指具有等距或比率測量尺度的數據資料。
由於點二系列相關係數為皮爾森積差相關係數的特例,代數上,所以計算點二系列相關係數時,可以直接使用皮爾森積差相關係數的公式。
若讓和
分別代表X變項和Y變項所有數值的總和、
指成對的X變項和Y變項數值的交叉乘積和、
和
分別表示X變項和Y變項各個數值平方後的總和、
和
分別指X變項和Y變項所有數值總和的平方、
為樣本總個數,皮爾森積差相關係數的運算公式如下:
(1)
若樣本數不大,利用紙筆運算時,可先將上面公式(1)所需要的數值在表格中計算出來後,再帶入公式裡,就可簡單地求得點二系列相關係數的數值。若您不清楚或不熟悉總和運算的方法,請參考社會統計常用的基本數學符號和運算。
點二系列相關係數的假設檢定
點二系列相關係數在探討樣本裡的兩個變項之間的關聯程度,為了評估兩變項之間的關聯性是否存在於母群體中,就須進行假設檢定。由於點二系列相關係數使用皮爾森積差相關係數的公式來運算,其假設檢定的方式也相同於皮爾森積差相關係數的假設檢定。
點二系列相關係數的假設檢定是在評估母群體相關係數的虛無假設(
),也就是檢驗兩變項是否來自於
的一組隨機樣本。對立假設(
)則是主張
,此為無方向性的對立假設。關於研究假設的詳細說明,請參考研究假設的種類和寫法。
由於點二系列相關係數的其中一個變項是二分變項,編碼時分配給兩個類別的數值決定了相關係數的正、負號,所以探討點二系列相關係數的方向實際上並無多大的意義,有方向性的對立假設也變得不太合適。若想探討二分變項的兩類別在連續變項上的差異,獨立樣本t檢定會是較合適的檢定方法。
擬定好研究假設後,須依據研究的性質、目的和研究可能帶來的後果,設定適當的顯著水準或稱為α水準,通常為0.05、0.01或更嚴苛的0.001。另外,因為對立假設沒有方向性,所以假設檢定為雙尾檢定。
點二系列相關係數的假設檢定使用t分配和t檢定統計量,自由度(degrees of freedom,簡寫為df)為,計算t檢定統計量的公式如下:
(2)
求得t檢定統計量後,查詢t分配表,依照已設定的α水準和的自由度,找出相對應的臨界值。最後,利用決策規則,比較t檢定統計量和臨界值,當t檢定統計量的絕對值等於或大於臨界值的絕對值時,即可拒絕虛無假設,接受對立假設;反之,則保留虛無假設。
如果使用統計分析軟體執行點二系列相關係數的假設檢定,通常會輸出獲得該特定相關係數的機率值(值),此時要利用機率比較的決策規則,當
時,就可拒絕虛無假設,接受對立假設。透過此種方式,反而省卻了查詢表格的麻煩。
以下使用〈點二系列相關係數的意義和計算〉裡學生的生理性別和社會統計學成績的例子來說明點二系列相關係數假設檢定的過程。
點二系列相關係數假設檢定的範例
假設有位社會統計學的大學教師從往年的學生成績發現女同學的成績似乎比男同學好,因此想探討社會統計學的學期成績和生理性別之間是否有顯著的關聯性。她從修課的學生裡隨機抽取出5位女同學和5位男同學,並記錄他們已經修習完成的社會統計學學期成績。若生理性別的變項名稱為SEX,女同學的編碼為0、男同學的編碼為1,這10位學生的成績(SCORE)如下表。使用0.05的α水準、雙尾檢定,試問社會統計學的學期成績和學生的生理性別間是否有顯著的關聯性?

這位老師想要探討社會統計學的學期成績和學生的生理性別間是否有關聯性,由於生理性別為二分變項,指明關聯性的方向並無多大的意義,所以採用無方向性的對立假設。這個研究的對立假設和虛無假設分別為:
- 對立假設(
):社會統計學的學期成績和學生的生理性別有關聯性,也就是說,這10位學生是來自於母群體相關係數
的一組隨機樣本。
- 虛無假設(
):社會統計學的學期成績和學生的生理性別沒有關聯性,也就是說,這10位學生是來自於母群體相關係數
的一組隨機樣本。
由於這研究屬於探索性質,所以老師設定顯著水準(α水準)為0.05。此外,因為對立假設沒有方向性,所以採用雙尾檢定。若用符號來表示,可以寫成。
考量學期成績為等距測量尺度的連續變項、生理性別為二分變項,因此檢驗兩變項之間的關聯性是否真實地存在可使用點二系列相關係數的假設檢定。
首先,利用上面的公式(1)計算出學期成績和生理性別間的關聯程度,也就是點二系列相關係數。從〈點二系列相關係數的意義和計算〉裡點二系列相關係數的計算可以知道兩者間的相關係數為-0.567,屬於中等以上的關聯程度。
接著,將兩者的相關係數-0.567帶入上面的公式(2),求得t檢定統計量,計算過程如下:
計算結果顯示t檢定統計量為-1.947,再查詢t分配表,當α水準為0.05、自由度為、雙尾檢定時,t臨界值為
。

最後,利用決策規則,比較t檢定統計量和臨界值,因為,所以保留虛無假設。這裡的分析結果顯示,社會統計學的學期成績和學生的生理性別沒有關聯性。
運用SPSS評估點二系列相關分析的結果
將上面範例中的數值輸入至SPSS資料編輯器中,輸入完成後,點選功能表的分析 » 相關 » 雙變異數,帶出「雙變量相關性」視窗。關於SPSS的資料輸入方法,請參考SPSS操作環境和資料輸入。

在「雙變量相關性」視窗裡,將SEX和SCORE移至變數(V)方框中,相關係數長框裡勾選Pearson的選項,顯著性檢定長框裡選擇雙尾(T),完成後按下視窗最下方的確定。

經過上面的步驟,SPSS會輸出如下的「相關性」表格。從下表可看出,點二系列相關係數為-0.567,而得到該數值的機率(值)為0.087。依據決策規則,因為0.087 > 0.05(
),所以保留虛無假設。分析結果顯示社會統計學的學期成績和學生的生理性別沒有關聯性,利用SPSS所得到的結果和上面紙筆計算的結果相同。

上面提到二分變項裡兩個類別的編碼只會影響點二系列相關係數的正、負號,而不會改變假設檢定的結果,以下針對這一點進行驗證。
分配不同的數值給二分變項的兩類別
將SPSS資料編輯器裡變項SEX的編碼對調,讓女同學的編碼為1、男同學的編碼為0,變項SCORE的數值不要更動,如下圖所示。

使用上面示範的SPSS操作步驟,執行點二系列相關係數的分析,輸出的結果如下表。從下表可看出,兩變項的相關係數變成0.567,而不是編碼改變前的-0.567,但值仍為0.087,分析結果依舊是社會統計學的學期成績和學生的生理性別沒有關聯性。

這結果告訴我們,在點二系列相關係數的分析裡,分配不同的數值給二分變項的兩個類別只會改變相關係數的正、負號,但不會影響假設檢定的結果。
以上為本篇文章對點二系列相關係數假設檢定的介紹,希望透過本篇文章,您瞭解了點二系列相關係數的假設檢定過程,也學會了利用SPSS評估點二系列相關分析結果的方法。
如果您喜歡本篇文章,請將本網站加入書籤,作為您的學習資源,並持續回訪本網站喔!另外,您也可以在Facebook和Twitter上找到我們喲!