🐟 請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址
兩個獨立的皮爾森積差相關係數比較的假設檢定
皮爾森積差相關係數是行為和社會科學研究裡很常用到的一種相關係數,最主要用來測量2個變項間的關聯程度和方向。如果有2個獨立的群組,雖然可從皮爾森積差相關係數的數值簡單地評估2個變項在各自群組裡的關係程度,但若想要探討這2個群組的皮爾森積差相關係數是否有明顯的不同,則須進行2個獨立的皮爾森積差相關係數比較的假設檢定。
由於皮爾森積差相關係數的意義和計算方法已經在本網站的多篇文章裡提及,所以這裡不再做說明,若您想瞭解皮爾森積差相關係數的基礎內容,請參考何謂皮爾森積差相關係數和如何計算皮爾森積差相關係數。此外,下面內容涉及假設檢定的過程,建議您先閱讀假設檢定的步驟和範例和皮爾森積差相關係數的假設檢定,將有助於文章內容的理解喔!
兩個獨立的皮爾森積差相關係數比較的使用時機
皮爾森積差相關係數(Pearson product-moment correlation coefficient)可簡單稱為皮爾森相關係數,是行為和社會科學領域很常用到的一種相關係數,用來評估2個變項的關聯程度和方向,數值會介於1和-1之間,正、負符號代表關聯方向而數值大小代表關聯強度。關於皮爾森積差相關係數的意義,請參考何謂皮爾森積差相關係數。
從皮爾森積差相關係數的數值可以簡單地評估2個變項間的關係,若研究的領域尚未有一套評估標準時,還可以參考Cohen(1992)提出的數值指標來判斷變項間關係的程度。因此,如果想瞭解相同的2個變項在不同的2個群組裡的關係時,可以分別求得2個變項在各個群組裡的皮爾森積差相關係數後,再比較2個群組的相關係數。
但不同群組間相關係數大小的比較只能看出2個變項在哪一群組裡的關聯比較大,而無法指出群組和群組間的相關係數是否有明顯的不同。若想要探討一群組的相關係數是否明顯地不同於另一群組的相關係數,則須進行2獨立的皮爾森積差相關係數比較的假設檢定。
例如一位高中教師發現學生的智商和學期平均成績有很高的關聯,但她想進一步探討生理女性在智商和學期平均成績的關聯是否明顯地不同於生理男性在智商和學期平均成績的關聯,此時就須比較生理女性和男性在智商和學期平均成績的皮爾森積差相關係數並進行假設檢定。
下面說明的假設檢定適用在2個獨立的皮爾森積差相關係數上,也可說是2個獨立群組的皮爾森積差相關係數的比較。若2個皮爾森積差相關係數並非彼此獨立,例如同一個群組裡帶有共同變項的2個相關係數,則須使用不同的檢定統計量和抽樣分配,詳細的說明請參考兩個相依的皮爾森積差相關係數的假設檢定。
兩個獨立的皮爾森積差相關係數比較的假設檢定
假設檢定的一開始必須根據研究目的、理論和過往研究發現,擬定研究假設。因為我們要比較2個獨立的皮爾森積差相關係數是否有明顯不同,所以研究假設沒有方向性。假設母群體皮爾森積差相關係數的符號為,第1個相關係數為
而第2個相關係數為
,則對立假設(
)為
,虛無假設(
)為
。
研究假設擬定後,再依據研究的性質和目的,選擇合適的顯著水準或稱為α水準,習慣上為0.05、0.01或更嚴苛的0.001。此外,由於研究假設不具方向性,所以使用雙尾檢定。若想瞭解更多顯著水準和檢定的方向性,請參考顯著水準和決策規則。
由於皮爾森積差相關係數的抽樣分配不是常態分配的型態,尤其是母群體相關係數愈趨近1或-1的時候,抽樣分配會愈趨偏態的分配型態,所以很不容易推估標準誤,使得檢定統計量的計算變得困難。同樣地,2個獨立的皮爾森積差相關係數的比較
也帶有相同的問題。
為了讓皮爾森積差相關係數的抽樣分配具有常態分配的型態,Fisher(1921)提出把皮爾森積差相關係數轉換成下面的
:
(1)
若為配對2變項的總組數,轉換後的皮爾森積差相關係數
大致上呈現常態分配且帶有如下的標準誤
:
運用這樣的概念,當比較2個獨立的皮爾森積差相關係數的時候,若第1個轉換後的相關係數為而第2個轉換後的相關係數為
,第1個群組的配對變項總組數為
而第2個群組的配對變項總組數為
,z檢定統計量的計算公式如下:
(2)
利用上面的公式(2)求得z檢定統計量後,再根據事先選擇的α水準從標準常態分配表中找到相對應的臨界值。最後,運用檢定統計量和臨界值比較的決策規則,當檢定統計量的絕對值等於或大於臨界值的絕對值時,即可拒絕虛無假設,接受對立假設;反之,保留虛無假設。
在瞭解了2個獨立的皮爾森積差相關係數比較的假設檢定過程後,下面舉個例子來實際操作。因為這裡的假設檢定過程會使用到常態分配和常態曲線下的面積,若您不熟悉相關的應用,可以先參考標準分數和常態曲線下面積之應用。
兩個獨立的皮爾森積差相關係數比較的例子
假設有位社會統計學的教師發現期中考和期末考的成績有滿大的關聯,由於該課程有2班,她想進一步探討這2班的期中考和期末考成績的關聯是否有明顯的不同。若A班有44位學生,期中考和期末考成績的皮爾森積差相關係數為0.634,而B班有56位學生,期中考和期末考成績的皮爾森積差相關係數為0.539。試問若α水準為0.05,這2班的皮爾森積差相關係數是否有明顯的不同?
在這個例子裡,社會統計教師想探討2個班級的期中考和期末考成績的皮爾森積差相關係數是否不同,因此須進行2個獨立的皮爾森積差相關係數的假設檢定。首先,虛無假設和對立假設分別為:
- 虛無假設(
):A班和B班的皮爾森積差相關係數沒有不同,也就是
。
- 對立假設(
):A班和B班的皮爾森積差相關係數有所不同,也就是
。
這位老師選擇了0.05的α水準,因為是無方向性的假設,所以使用雙尾檢定。顯著水準0.05會平均分配在常態曲線的兩側,每一側的機率為0.025,也就是下圖超過標準分數z之外的面積(B)為0.025。查詢標準常態分配表,當超過標準分數z之外的面積為0.025時,z臨界值為1.96,因為是雙尾檢定,所以臨界值為1.96。

接著,利用上面的公式(1)把2個班級的皮爾森積差相關係數都轉換成。為了提高最後計算結果的準確度,將所有無法整除的數值都四捨五入到小數點後第4位,計算過程如下:
再把上面2個轉換後的皮爾森積差相關係數帶入上面的公式(3),計算z檢定統計量,過程如下:
最後,運用決策規則,比較z檢定統計量和z臨界值。因為,所以保留虛無假設。分析結果指出,雖然A班的期中考和期末考成績的關聯程度高於B班,但2個班級的關聯性並沒有明顯的不同。
運用SPSS比較兩個獨立的皮爾森積差相關係數
在說明如何利用SPSS比較2個獨立的皮爾森積差相關係數之前,先介紹一個SPSS使用上的小技巧。如果想比較的2個群組來自於同一個樣本的話,可先利用功能表的資料 » 分割檔案,把一整個樣本依據1個名義尺度變項分割成2個子樣本(也就是2個群組)後,再進行相關係數的分析。關於SPSS的操作環境,請參考SPSS操作環境和資料輸入。

在「分割檔案」視窗裡,預設值為分析所有觀察值,不建立群組(A),但這裡我們要比較群組,所以勾選比較群組(C),然後把名義尺度變項班級(CLASS)移到群組基於(G)的長框裡。完成後按下視窗下方的確定,之後進行的分析都會出現2個班級各自的分析結果。

這裡要取得2個班級各自的期中考和期末考成績的皮爾森積差相關係數,所以點選功能表的分析 » 相關 » 雙變異數,在「雙變量相關性」視窗裡選擇要分析的2個變項後,SPSS會輸出如下的相關表格。關於運用SPSS取得皮爾森積差相關係數的詳細操作方法,請參考〈如何計算皮爾森積差相關係數〉裡運用SPSS計算皮爾森積差相關係數。
相關表格的上半部為A班的分析結果,而表格的下半部為B班的分析結果。從下表可以看出,A班的期中考和期末考成績的皮爾森積差相關係數為0.634而B班的相關係數為0.539。此外,A班有44位學生而B班有56位學生。

但很可惜的是,SPSS沒有直接比較2個獨立的皮爾森積差相關係數的功能,必須撰寫SPSS語法來執行(IBM Support,2020)。語法撰寫前,先開啟一空白的資料編輯器,並輸入4個變項的名稱和數值,分別為A班的皮爾森積差相關係數(r1)、B班的皮爾森積差相關係數(r2)、A班的人數(n1)和B班的人數(n2),而各個變項的數值可從上面的相關表格取得。

在資料編輯器裡輸入4個變項的名稱和數值後,開啟一空白的語法編輯器,輸入下面的語法:
COMPUTE z_r1 = 0.5*ln((1+r1)/(1-r1)).
COMPUTE z_r2 = 0.5*ln((1+r2)/(1-r2)).
COMPUTE SE_diff = sqrt((1/(n1-3))+(1/(n2-3))).
COMPUTE z_diff = (z_r1-z_r2)/SE_diff.
COMPUTE z_sig = 2*(1-cdfnorm(abs(z_diff))).
EXECUTE.
FORMATS z_r1 to z_sig (F5.3).
LIST VARIABLES = z_r1 z_r2 z_diff z_sig.
上面語法裡先使用COMPUTE指令分別計算出2個班級轉換後的皮爾森積差相關係數、z檢定統計量的標準誤、z檢定統計量和獲得z檢定統計量的機率,再用FORMATS指令四捨五入這些數值到小數點後第3位,最後利用LIST指令輸出2個轉換後的皮爾森積差相關係數、z檢定統計量和獲得z檢定統計量的機率(值)等4個數值至檢視器。
語法撰寫完成後,點選語法編輯器功能表的執行 » 全部,SPSS會執行所有的語法,並將結果輸出至資料編輯器和檢視器。

在資料編輯器裡,除了原本的4個變項資料外,還多出了5個變項資料,從左到右分別為轉換後A班的皮爾森積差相關係數、轉換後B班的皮爾森積差相關係數、z檢定統計量的標準誤、z檢定統計量和獲得z檢定統計量的機率。

此外,因為語法有要求輸出4個數值,所以在SPSS檢視器裡可以看到如下的輸出結果。這4個數值分別指出,轉換後A班的皮爾森積差相關係數為0.748、轉換後B班的皮爾森積差相關係數為0.603、z檢定統計量為0.699和得到這個檢定統計量的機率為0.485,而這些數值都和上面利用紙筆計算得到的結果是相同的。

利用這些語法的輸出數值評估假設檢定的結果時,可以運用機率比較的決策規則,比較事先選擇的α水準和值,只要
,就可拒絕虛無假設。在這個例子裡,因為
,所以保留虛無假設。分析結果指出,A班和B班在期中考和期末考成績的關聯上沒有明顯的不同。
由於兩個獨立的皮爾森積差相關係數的比較並沒有牽涉到太複雜的運算公式,所以若您不習慣撰寫SPSS語法,當然可以直接利用2個群組的皮爾森積差相關係數進行紙筆運算,並透過常態分配表的使用來評估虛無假設。但若您擔心運算過程出錯的話,撰寫SPSS語法來執行分析也會是一個不錯的方法喔!
以上為本篇文章對2個獨立的皮爾森積差相關係數比較的介紹,希望透過本篇文章,您瞭解了這種分析的使用時機和假設檢定過程,也學會了紙筆運算和利用SPSS語法執行分析的方法。若您喜歡本篇文章,請將本網站加入書籤,並隨時回訪本網站喔!另外,也歡迎您追蹤本網站的Facebook和/或X(Twitter)專頁喲!
如果您覺得本篇文章對您有幫助,歡迎買杯珍奶給 Dr. Fish!小小珍奶,大大鼓勵,您的支持將給Dr. Fish更多撰寫優質文章的動力喔!
參考資料
Cohen, J. (1992). A power primer. Psychological Bulletin, 112(1), 155-159. https://doi.org/10.1037/0033-2909.112.1.155
Fisher, R. A. (1921). On the probable error of a coefficient of correlation deduced from a small sample. Metron, 1, 3-32. https://hdl.handle.net/2440/15169
IBM Support. (2020, April 16). Differences between correlations. IBM. https://www.ibm.com/support/pages/differences-between-correlations