皮爾森積差相關係數(Pearson product-moment correlation coefficient)是推估兩個變項間關係程度和方向的一個統計量,數值介於1和-1之間。進行相關性研究時,通常會從母群體中隨機抽取出樣本,再計算樣本資料的相關係數。因此,為了檢驗兩變項間的關係是否真實地存在於母群體中,即可進行相關係數的假設檢定。
本篇文章將探討皮爾森積差相關係數的假設檢定,若您不清楚或不熟悉假設檢定的過程,建議您先閱讀假設檢定的步驟和範例,將有助於下面內容的理解。以下先簡單回顧皮爾森積差相關係數的意義,再介紹皮爾森積差相關係數的假設檢定過程,並舉一例子實際操作,最後再示範利用SPSS評估皮爾森積差相關係數分析結果的方法。
皮爾森積差相關係數的意義
皮爾森積差相關係數是相關係數(correlation coefficient)的一種,用來表示變項間關係的程度和方向的量化數值,數值從1到-1,正負號代表關係的方向,數值大小則代表關係的強度。係數1指正向的完全關係(下圖左),係數-1為負向的完全關係(下圖中),係數0則指變項間不存在關係(下圖右)。皮爾森積差相關係數適用在等距或比率測量尺度的變項上,通常用符號來表示。
考量到兩個變項間可能為不同的測量尺度和單位,皮爾森積差相關係數先將兩個變項轉換成具有相同尺度和單位的標準分數( score)後,再測量其間的相關程度。利用標準分數的概念,皮爾森積差相關係數的概念公式如下:
(1)
上面公式(1)中,指成對的X變項數值和Y變項數值的標準分數之乘積和。若要用公式(1)進行紙筆運算,須先求得各個分數的標準分數後才能計算出皮爾森積差相關係數,運算過程中可能充斥著小數,很容易產生錯誤。因此,公式(1)可再轉換成一個運算公式,讓紙筆運算更為簡單。
若讓代表X變項所有分數的總和、指Y變項所有分數的總和、指成對的X變項和Y變項分數的交叉乘積和、為X變項各個分數平方後的總和、為Y變項各個分數平方後的總和、指樣本總個數,皮爾森積差相關係數的運算公式如下:
(2)
在紙筆運算時,只要先求得公式(2)所需的各項數值後,再把計算出來的數值帶入公式(2)裡,即可計算出皮爾森積差相關係數。若您不熟悉總和運算的方法,可參考〈社會統計常用的基本數學符號和運算〉裡總和/求和運算,而更詳細的皮爾森積差相關係數的說明,則可參考何謂皮爾森積差相關係數。
皮爾森積差相關係數的假設檢定
皮爾森積差相關係數是用來測量兩個變項間關聯強度和方向的樣本統計量,跟其他的描述性統計量一樣,是從母群體所抽取出的樣本資料計算得來。為了判斷兩變項之間的關聯性是否存在於母群體中,就須實行皮爾森積差相關係數的假設檢定。
根據研究的目的、理論和過往的研究發現,須先擬定研究假設。母群體相關係數的符號為,無方向性的對立假設()主張,不用指出關聯的方向,但有方向性的對立假設則要指出兩變項間為正向或負向的關係。另一方面,虛無假設()主張兩變項之間沒有關聯,也就是兩變項是來自於母群體相關係數的一組隨機樣本。
擬定好研究假設後,再依據研究的性質和目的,選擇適當的顯著水準或稱為α水準,習慣上為0.05、0.01或更嚴苛的0.001。此外,再根據對立假設是否具有方向性,決定使用雙尾檢定或單尾檢定。
皮爾森積差相關係數的假設檢定使用皮爾森積差相關係數的抽樣分配,該分配是從母群體中隨機抽取出樣本大小為的所有可能樣本,並計算出每一個樣本的皮爾森積差相關係數和獲得各個相關係數的機率,最後呈現出分布狀態的機率分配。
不過,皮爾森積差相關係數抽樣分配並非簡單地呈現常態分配的型態。當母體相關係數時,抽樣分配確實趨近於常態分配,與t分配型態一致。但當愈大或愈小,尤其是愈趨近1或-1時,抽樣分配則會變成負偏態或正偏態的分配型態。由於皮爾森積差相關係數抽樣分配的這個特性,進行假設檢定時須分成兩個方向來探討:
- 若虛無假設()主張,假設檢定使用t檢定統計量和t分配,自由度(degrees of freedom,簡寫為)為。大多數的皮爾森積差相關係數的假設檢定使用這種方法,而這也是SPSS採用的運算方式。
- 若虛無假設()主張為其他的數值,因為抽樣分配不是常態分配,所以須將皮爾森積差相關係數調整成,使其具有常態分配(z分配)型態的抽樣分配後,再將轉換成一般的標準分數,才可利用標準常態分配表進行假設檢定(Fisher, 1921)。
虛無假設主張和主張為其他的數值時,因為使用不同的抽樣分配,所以檢定統計量也不一樣,下面分別探討兩種不同虛無假設時的檢定統計量。
虛無假設主張ρ = 0
若虛無假設主張,皮爾森積差相關係數的假設檢定可使用t分配和t檢定統計量,計算t檢定統計量的公式如下:
(3)
藉由公式(3)獲得t檢定統計量後,再查詢t分配表,依據已選擇的α水準和自由度(),找到相對應的t臨界值。最後,運用決策規則,比較t檢定統計量和臨界值,若是雙尾檢定,當t檢定統計量絕對值等於或大於臨界值絕對值時,即可拒絕虛無假設,接受對立假設;反之,則保留虛無假設。
若是單尾檢定,須注意皮爾森積差相關係數的方向和對立假設所擬定的方向是否相同,若不相同,就直接保留虛無假設。如果方向相同,當t檢定統計量絕對值等於或大於臨界值絕對值時,可以拒絕虛無假設。例如對立假設主張兩變項之間為正相關,但計算出來的皮爾森積差相關係數為-0.635,因為結果和對立假設的方向不符,所以保留虛無假設。
虛無假設主張ρ為其他數值
若虛無假設主張為其他的數值,例如或,因為抽樣分配已呈現偏態分配且不符合t分配的型態,所以須將皮爾森積差相關係數調整成,使其抽樣分配呈現常態分配(Fisher, 1921)。求得的公式如下:
(4)
接著,把利用公式(4)計算出來的轉換成一般的標準分數。若讓指調整後的母群體相關係數,這個轉換的公式如下:
(5)
求得標準分數後,查詢標準常態分配表,依據已選擇好的α水準,找到相對應的臨界值。最後,運用決策規則,比較標準分數和臨界值,若是雙尾檢定,當標準分數的絕對值等於或大於臨界值的絕對值,即可拒絕虛無假設,接受對立假設;反之,則保留虛無假設。
若是單尾檢定,當皮爾森積差相關係數的方向不同於事先擬定的對立假設方向時,即須保留虛無假設。反之,若相關係數的方向和對立假設的方向相同,當標準分數的絕對值等於或大於臨界值的絕對值時,可以拒絕虛無假設。
雖然上述的Fisher調整至的方法多使用在母群體相關係數不為0的時候,但也可使用在的情況下。不過,檢驗虛無假設為的皮爾森積差相關係數假設檢定過程,t檢定仍舊是較常使用的方法。
若使用統計分析軟體如SPSS來執行皮爾森積差相關係數的分析,通常會輸出獲得該特定皮爾森積差相關係數的機率值(值)而不是臨界值,反而省卻了查詢表格的麻煩。依據機率比較的決策規則,只要,就可拒絕虛無假設,接受對立假設。
瞭解了皮爾森積差相關係數的假設檢定方法後,下面舉一個例子來實際操作皮爾森積差相關係數的假設檢定過程。
皮爾森積差相關係數的假設檢定之範例
假設有一位基礎社會統計課程的大學教師想探討學生的期中考成績和期末考成績之間的關聯性,因此隨機抽取出修課的10位學生,並記錄他們在上一個學期的期中考成績(MIDTERM)和期末考成績(FINAL),如下表所示。使用α水準0.05、雙尾檢定,試問學生的期中考和期末考成績之間的關聯性為何?
這位教師想要瞭解學生的期中考和期末考成績之間的關聯性,沒有指出關聯的方向,因此採用無方向性的研究假設。對立假設和虛無假設分別為:
- 對立假設():學生的期中考和期末考成績有關聯性,換句話說,這10位學生來自於母群體相關係數的母群體。
- 虛無假設():學生的期中考和期末考成績沒有關聯性,換句話說,這10位學生來自於母群體相關係數的母群體。
由於研究屬於探索性質,所以這位教師選擇0.05的α水準。此外,因為研究假設不具有方向性,所以使用雙尾檢定。若用符號來表示,可以寫成。
藉由上面的公式(2)計算期中考和期末考成績的皮爾森積差相關係數,結果為,詳細的計算過程請參考如何計算皮爾森積差相關係數。再利用這個皮爾森積差相關係數來計算檢定統計量,由於有t檢定和z檢定兩種方法,下面分別示範。
使用t檢定的方法
若使用t檢定的方法,須先計算出t檢定統計量。將相關係數0.617帶入上面的公式(3)中,計算過程如下:
計算結果顯示t檢定統計量為2.218,而自由度為。再查詢t分配表,當α水準為0.05、雙尾檢定、自由度為8時,t臨界值為。
最後,運用決策規則,比較t檢定統計量和t臨界值,因為,所以保留虛無假設。分析結果顯示,學生的期中考和期末考成績間沒有關聯性。
使用z檢定的方法
若使用Fisher提出的調整成的方法,根據上面的公式(5),須求得和兩個數值,分別指樣本的皮爾森積差相關係數和母群體相關係數的調整值。套用上面的公式(4),計算過程如下:
接著,將和的數值帶入上面的公式(5),計算過程為:
計算結果顯示標準分數為1.905,再查詢標準常態分配表,當α水準為0.05、雙尾檢定,也就是等於或大於標準分數z的機率(面積)為時,臨界值為。關於常態曲線下面積的運用,請參考標準分數和常態曲線下面積之應用。
最後,運用決策規則,比較標準分數和z臨界值,因為,所以保留虛無假設。分析結果指出,學生的期中考和期末考成績之間沒有關聯性,這個結果和上面使用t檢定方法的結果相同。
上述兩種方法的決策規則皆為檢定統計量和臨界值的比較,若是使用統計分析軟體,則會輸出獲得特定皮爾森積差相關係數的機率(值),此時就須使用α水準和值比較的決策規則,以下示範利用SPSS評估皮爾森積差相關係數分析結果的方法。
運用SPSS評估皮爾森積差相關係數分析的結果
將上面範例中10位學生的資料輸入至SPSS資料編輯器裡,輸入完成後,點選功能表的分析 » 相關 » 雙變異數,開啟「雙變量相關性」視窗。關於SPSS的資料輸入方法,請參考SPSS操作環境和資料輸入。
在「雙變量相關性」視窗裡,將兩個變項MIDTERM和FINAL移至右邊的變數(V)方框中。相關係數長框裡勾選Pearson的選項,顯著性檢定長框裡勾選雙尾(T)的選項,並確認標示顯著相關性(F)已被勾選。
在「雙變量相關性」視窗的最右邊有一選項(O),點選後會出現「雙變量相關性:選項」視窗,在統計量長方框裡可勾選平均值和標準差(M),會輸出兩個變項各自的平均數和標準差。完成後,點選視窗最下方的繼續(C),回到上一個視窗後,再點選下方的確定。
SPSS會輸出兩個表格,第1個為「敘述統計」表格,第2個為「相關性」表格。從下圖的「敘述統計」表可以看出,期中考(MIDTERM)的平均成績為56.8分,標準差為14.673;期末考(FINAL)的平均成績為49.1分,標準差為9.893。
第2個「相關性」表格會顯示兩個變項間的皮爾森積差相關係數和顯著性檢定的結果,如下圖所示。不論是看MIDTERM欄或FINAL欄都可以,SPSS的分析結果指出期中考和期末考成績間的皮爾森積差相關係數為0.617,而獲得該結果的機率為0.057。雖然相關程度頗高,但因為0.057大於α水準0.05(),所以保留虛無假設,也就是學生的期中考和期末考成績之間沒有關聯性。
若要執行單尾檢定,可在「雙變量相關性」視窗裡的顯著性檢定長框裡選擇單尾(L)選項,SPSS即會輸出單尾檢定的機率值,再透過決策規則,評估研究結果。
另外,若您想探討兩個皮爾森積差相關係數是否有明顯的不同,可以進行兩個相關係數比較的假設檢定。依據兩個皮爾森積差相關係數為獨立的或關聯的情況,假設檢定的方法有所不同,可分別參考下列的文章:
- 相關係數彼此獨立➡兩個獨立的皮爾森積差相關係數比較的假設檢定
- 相關係數相互關聯➡兩個相依的皮爾森積差相關係數比較的假設檢定
以上為本篇文章對皮爾森積差相關係數的假設檢定之介紹,希望透過本篇文章,您瞭解了皮爾森積差相關係數的假設檢定過程和方法,也學會了利用SPSS評估皮爾森積差相關係數分析的結果。若您喜歡本篇文章,請將本網站加入書籤,並持續回訪本網站喔!另外,也歡迎您追蹤本網站的Facebook和/或X(Twitter)專頁喲!
如果您覺得本篇文章對您有幫助,歡迎買杯珍奶給 Dr. Fish!小小珍奶,大大鼓勵,您的支持將給Dr. Fish更多撰寫優質文章的動力喔!
參考資料
Fisher, R. A. (1921). On the probable error of a coefficient of correlation deduced from a small sample. Metron, 1, 3-32. https://hdl.handle.net/2440/15169