當我們想要利用一個變項去預測另一個變項的數值時,可以執行簡單線性迴歸分析,也就是運用兩變項之間的關係建構出一條可作為預測用途的迴歸線,而這過程通常會透過統計分析軟體如SPSS或SAS來達成。在分析的輸出結果裡,除了截距和斜率等迴歸線建構所需要的係數外,還可以看到兩變項關聯程度的相關係數、決定係數和調整後決定係數(調整後R平方)等資訊。
在這些與兩變項關聯性有關的資訊裡,從相關係數可以計算出決定係數,但令人困惑的地方在於,是否有「調整後相關係數」可以計算出調整後決定係數?實際上,調整後相關係數是去除偏誤後的相關係數,當樣本數不大的時候,反而能夠更正確地估計母群體相關係數。只是絕大多數的情況下,我們仍舊使用一般的相關係數,而不會使用調整後的相關係數。
雖然實務上很少被使用,但調整後相關係數是一個相對無偏誤的母群體關聯程度的估計值,也可用來計算出調整後決定係數。下面內容會先回顧皮爾森積差相關係數的意義,再探討調整後相關係數的意義和計算,並舉例說明計算方法,最後再示範利用SPSS求得調整後相關係數的方式。
皮爾森積差相關係數的意義
皮爾森積差相關係數(Pearson product-moment correlation coefficient)也可稱為皮爾森相關係數,是用來瞭解兩個成對的變項裡,當一個變項變化的時候,另一個變項往相同或相反方向變化的程度。簡單地說,皮爾森積差相關係數是測量兩變項間關聯方向和程度的一個量化數值,通常會用符號來表示。
皮爾森積差相關係數其實是標準化的共變異數,由於測量兩變項共同變化程度的共變異數仍帶有變項本身的測量單位,所以共變異數會隨著變項測量單位而改變數值的大小,造成解釋上和跨樣本比較上的困難。為了克服這個困難,便需要把共變異數去單位化,也就是標準化。關於共變異數的詳細說明,請參考共變異數的意義和計算。
標準化的共變異數是將兩變項的共變異數除以兩變項的標準差乘積,即為相關係數,也就是耳熟能詳的皮爾森積差相關係數。若讓和分別表示X和Y變項的第個資料,和分別表示X和Y變項的平均數,和分別表示X和Y變項的標準差,為X和Y變項的共變異數,為配對的X和Y變項之總組數,皮爾森積差相關係數可以用下面的公式來呈現:
(1)
皮爾森積差相關係數的數值會介於1和-1之間,若兩變項間為完全的正向關係,相關係數為1;若兩變項間為完全的負向關係,相關係數為-1;若兩變項間不存在關係,相關係數為0。不過社會或行為科學的領域裡,幾乎不太可能存在完全的關係,所以兩變項的相關係數通常會介於1和-1之間。關於皮爾森積差相關係數的詳細說明,請參考何謂皮爾森積差相關係數。
調整後相關係數的意義和計算
皮爾森積差相關係數並非母群體相關係數的不偏誤估計值(unbiased estimate),尤其是在樣本數很小的時候,樣本的相關係數其實是母群體相關係數的偏誤估計值。舉例來說,假設一個樣本裡只有2組配對的X和Y變項資料,撇除2組配對資料皆為0的情況,不論配對資料如何變化,因為2個點就能構成一條直線,所以相關係數永遠為1或-1,很顯然地這不符合母群體的真實情況。
從這個例子可以看出,當樣本數很小的時候,從樣本計算出來的相關係數並無法正確地估計母群體相關係數。為了讓樣本相關係數能夠更正確地估計母群體相關係數,可以改使用調整後相關係數(adjusted correlation coefficient)。因此,調整後相關係數是指去除偏誤後的相關係數,計算公式如下:
(2)
雖然有調整後相關係數的存在,不過實務上幾乎沒有在使用,仍舊是以皮爾森積差相關係數為主。相較於相關係數,當利用樣本資料來計算標準差或變異數時,研究報告多使用樣本標準差或樣本變異數等不偏誤估計值(分母為而不是)來估計母群體標準差或變異數。同樣是不偏誤估計值,調整後相關係數卻鮮少被使用,實在難以理解。
調整後相關係數的例子
這裡使用共變異數的意義和計算的例子,假設有位老師認為學生的邏輯思考能力和課程表現有關聯,因此在學期開始的時候,讓修課的10位學生填寫一份邏輯能力的標準化測驗,並在學期末時記錄這10位學生的期末成績。若邏輯能力成績為X變項,變項名稱為LOGIC,而期末成績為Y變項,變項名稱為SCORE,這10位學生的2種成績如下表,試問邏輯能力和期末成績的調整後相關係數是多少?
為了計算調整後相關係數,須先計算皮爾森積差相關係數。上面的公式(1)為概念公式,若使用這個公式,計算過程中可能會充斥著小數,很容易造成計算上的錯誤,因此可以改利用下面的運算公式:
(3)
為了套用上面的公式(3),須先計算出、、、和的數值,可利用像下面的表格計算出這些數值。關於基本數學符號和總和運算的方法,請參考社會統計常用的基本數學符號和運算。
接著,把利用上面表格得到的數值帶入公式(3)裡,計算皮爾森積差相關係數。計算過程如下:
從計算結果可以發現,學生的邏輯能力和期末成績之間的皮爾森積差相關係數為0.947,兩者之間具有高度的正向關係。由於樣本裡只有10位學生,為了能夠更準確地估計母群體相關係數,可以套用上面的公式(2)來計算調整後相關係數,計算過程如下:
計算結果顯示調整後相關係數為0.940,與調整前的相關係數差了0.007,雖然差距不大,但並非所有的情況都是如此。當樣本數更小的時候,調整前與調整後的相關係數差異會更大一點。
運用SPSS求得調整後相關係數
可能因為實務上幾乎沒有在使用調整後相關係數,所以SPSS並沒有直接輸出調整後相關係數的分析或選項。雖然如此,但SPSS會輸出調整後決定係數(adjusted coefficient of determination)或稱為調整後R平方,而調整後決定係數的平方根即為調整後相關係數。
若要取得調整後決定係數,可以利用簡單線性迴歸分析。將上面例子裡10位學生的邏輯能力和期末成績輸入至SPSS資料編輯器裡,輸入完成後,點選功能表的分析 » 迴歸 » 線性,帶出「線性迴歸」視窗。關於SPSS的資料輸入方法,請參考SPSS操作環境和資料輸入。
在「線性迴歸」視窗裡,依據研究假設,可作為依變項的變項移至應變數(D),可作為自變項的變項移至自變數(I),這裡把期末成績移至應變數(D)而邏輯能力成績移至自變數(I)。再點選視窗最右側的統計資料(S),帶出「線性迴歸:統計量」小視窗,確定模型配適度(M)有被勾選,完成後按下這視窗下方的繼續(C)。回到「線性迴歸」視窗後,再按下最下方的確定。
經過上面的步驟,SPSS的輸出結果裡會有一個如下圖的「模型摘要」表格。從這個表格裡,可以看到邏輯能力和期末成績的相關係數(R)為0.947,這數值和上面利用紙筆計算所得到的結果是相同的。
另外,從「模型摘要」表還可以看到調整後R平方為0.883,也就是調整後決定係數,代表邏輯能力可以解釋期末成績裡88%的變異。把這個調整後R平方開根號,就是調整後相關係數。
調整後R平方的平方根為0.940,這就是調整後相關係數,相同於上面紙筆計算的結果。雖然計算調整後相關係數的公式並沒有很複雜,但在不想紙筆運算或想驗算的情況下,可以透過SPSS的簡單線性迴歸分析所輸出的調整後R平方來計算取得。
以上為本篇文章對調整後相關係數的介紹,希望透過本篇文章,您瞭解了調整後相關係數的意義、計算方法和利用SPSS取得調整後相關係數的方式。若您喜歡本篇文章,請將本網站加入書籤,並持續回訪本網站喔!另外,也歡迎您追蹤本網站的Facebook和/或Twitter專頁喲!
如果您覺得本篇文章對您有幫助,歡迎買杯珍奶給Dr. Fish!小杯珍奶,大大鼓勵,您的支持將給Dr. Fish更多撰寫優質文章的動力喔!