Skip to content

合作邀約 email: dr.fish@drfishstats.com

  • Facebook
  • X
site icon of Dr. Fish

Dr. Fish 漫游社會統計

魚博士的專業漫談和課後隨筆

  • Home
  • 關於 Dr. Fish
  • 統計基礎
    • 入門概念
    • 圖形繪製
    • 描述統計
    • 相關
    • 線性迴歸
  • 統計進階
    • 推論統計
    • 統計檢定
      • 相關係數
      • 迴歸
      • 平均數比較
      • 無母數檢定
  • EXCEL 系列
    • 資料管理
    • 圖形繪製
    • 描述統計
    • 推論統計
  • 下課後
    • 生活
    • 旅遊
      • 日本
        • 北海道
        • 四國
    • 美食
    • 攝影
  • 聯絡 Dr. Fish
  • Home
  • 相關
  • 調整後相關係數的意義和計算

🐟 請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址

調整後相關係數的意義和計算

Posted on 2024-04-172024-04-17 By Dr. Fish
相關

當我們想要利用一個變項去預測另一個變項的數值時,可以執行簡單線性迴歸分析,也就是運用兩變項之間的關係建構出一條可作為預測用途的迴歸線,而這過程通常會透過統計分析軟體如SPSS或SAS來達成。在分析的輸出結果裡,除了截距和斜率等迴歸線建構所需要的係數外,還可以看到兩變項關聯程度的相關係數、決定係數和調整後決定係數(調整後R平方)等資訊。

在這些與兩變項關聯性有關的資訊裡,從相關係數可以計算出決定係數,但令人困惑的地方在於,是否有「調整後相關係數」可以計算出調整後決定係數?實際上,調整後相關係數是去除偏誤後的相關係數,當樣本數不大的時候,反而能夠更正確地估計母群體相關係數。只是絕大多數的情況下,我們仍舊使用一般的相關係數,而不會使用調整後的相關係數。

雖然實務上很少被使用,但調整後相關係數是一個相對無偏誤的母群體關聯程度的估計值,也可用來計算出調整後決定係數。下面內容會先回顧皮爾森積差相關係數的意義,再探討調整後相關係數的意義和計算,並舉例說明計算方法,最後再示範利用SPSS求得調整後相關係數的方式。

  • 皮爾森積差相關係數的意義
  • 調整後相關係數的意義和計算
  • 調整後相關係數的例子
  • 運用SPSS求得調整後相關係數

皮爾森積差相關係數的意義

皮爾森積差相關係數(Pearson product-moment correlation coefficient)也可稱為皮爾森相關係數,是用來瞭解兩個成對的變項裡,當一個變項變化的時候,另一個變項往相同或相反方向變化的程度。簡單地說,皮爾森積差相關係數是測量兩變項間關聯方向和程度的一個量化數值,通常會用符號r來表示。

皮爾森積差相關係數其實是標準化的共變異數,由於測量兩變項共同變化程度的共變異數仍帶有變項本身的測量單位,所以共變異數會隨著變項測量單位而改變數值的大小,造成解釋上和跨樣本比較上的困難。為了克服這個困難,便需要把共變異數去單位化,也就是標準化。關於共變異數的詳細說明,請參考共變異數的意義和計算。

標準化的共變異數是將兩變項的共變異數除以兩變項的標準差乘積,即為相關係數,也就是耳熟能詳的皮爾森積差相關係數。若讓x_i和y_i分別表示X和Y變項的第i個資料,\overline x和\overline y分別表示X和Y變項的平均數,s_x和s_y分別表示X和Y變項的標準差,cov_{xy}為X和Y變項的共變異數,N為配對的X和Y變項之總組數,皮爾森積差相關係數可以用下面的公式來呈現:

(1)   \begin{equation*}r = \frac {cov_{xy}}{s_x s_y} = \frac {\sum_{i=1}^n (x_i-\overline x)(y_i-\overline y)}{(N-1)s_x s_y}\end{equation*}

皮爾森積差相關係數的數值會介於1和-1之間,若兩變項間為完全的正向關係,相關係數為1;若兩變項間為完全的負向關係,相關係數為-1;若兩變項間不存在關係,相關係數為0。不過社會或行為科學的領域裡,幾乎不太可能存在完全的關係,所以兩變項的相關係數通常會介於1和-1之間。關於皮爾森積差相關係數的詳細說明,請參考何謂皮爾森積差相關係數。

調整後相關係數的意義和計算

皮爾森積差相關係數並非母群體相關係數的不偏誤估計值(unbiased estimate),尤其是在樣本數很小的時候,樣本的相關係數其實是母群體相關係數的偏誤估計值。舉例來說,假設一個樣本裡只有2組配對的X和Y變項資料,撇除2組配對資料皆為0的情況,不論配對資料如何變化,因為2個點就能構成一條直線,所以相關係數永遠為1或-1,很顯然地這不符合母群體的真實情況。

從這個例子可以看出,當樣本數很小的時候,從樣本計算出來的相關係數並無法正確地估計母群體相關係數。為了讓樣本相關係數能夠更正確地估計母群體相關係數,可以改使用調整後相關係數(adjusted correlation coefficient)。因此,調整後相關係數是指去除偏誤後的相關係數,計算公式如下:

(2)   \begin{equation*}r_{adj} = \sqrt {1-\frac {(1-r^2)(N-1)}{N-2}}\end{equation*}

    \begin{equation*}\begin{CJK*}{UTF8}{bsmi}\begin{align*}r_{adj} &= \text {調整後相關係數} \\r &= \text {相關係數(皮爾森積差相關係數)} \\N &= \text {配對X和Y變項資料的總組數}\end{align*}\end{CJK*}\end{equation*}

雖然有調整後相關係數的存在,不過實務上幾乎沒有在使用,仍舊是以皮爾森積差相關係數為主。相較於相關係數,當利用樣本資料來計算標準差或變異數時,研究報告多使用樣本標準差或樣本變異數等不偏誤估計值(分母為N-1而不是N)來估計母群體標準差或變異數。同樣是不偏誤估計值,調整後相關係數卻鮮少被使用,實在難以理解。

調整後相關係數的例子

這裡使用共變異數的意義和計算的例子,假設有位老師認為學生的邏輯思考能力和課程表現有關聯,因此在學期開始的時候,讓修課的10位學生填寫一份邏輯能力的標準化測驗,並在學期末時記錄這10位學生的期末成績。若邏輯能力成績為X變項,變項名稱為LOGIC,而期末成績為Y變項,變項名稱為SCORE,這10位學生的2種成績如下表,試問邏輯能力和期末成績的調整後相關係數是多少?

data of covariance example

為了計算調整後相關係數,須先計算皮爾森積差相關係數。上面的公式(1)為概念公式,若使用這個公式,計算過程中可能會充斥著小數,很容易造成計算上的錯誤,因此可以改利用下面的運算公式:

(3)   \begin{equation*}r = \frac {\sum {XY}-\dfrac {(\sum X)(\sum Y)}{N}}{\sqrt {\left [ \sum X^2-\dfrac {(\sum X)^2}{N} \right ] \left [ \sum Y^2-\dfrac {(\sum Y)^2}{N} \right ]}}\end{equation*}

    \begin{equation*}\begin{CJK*}{UTF8}{bsmi}\begin{align*}\sum X &= \text {X變項裡所有資料的總和} \\\sum Y &= \text {Y變項裡所有資料的總和} \\\sum {XY} &= \text {配對X和Y變項資料的交叉乘積和} \\\sum X^2 &= \text {X變項裡每個資料平方後的總和} \\\sum Y^2 &= \text {Y變項裡每個資料平方後的總和} \\N &= \text {配對X和Y變項資料的總組數}\end{align*}\end{CJK*}\end{equation*}

為了套用上面的公式(3),須先計算出\sum X、\sum Y、\sum {XY}、\sum X^2和\sum Y^2的數值,可利用像下面的表格計算出這些數值。關於基本數學符號和總和運算的方法,請參考社會統計常用的基本數學符號和運算。

computation table of correlation coefficient

接著,把利用上面表格得到的數值帶入公式(3)裡,計算皮爾森積差相關係數。計算過程如下:

    \begin{align*}r &= \frac {\sum {XY}-\dfrac {(\sum X)(\sum Y)}{N}}{\sqrt {\left [ \sum X^2-\dfrac {(\sum X)^2}{N} \right ] \left [ \sum Y^2-\dfrac {(\sum Y)^2}{N} \right ]}} \\[5px]&= \frac {54742-\dfrac {(722)(738)}{10}}{\sqrt {\left [ 53462-\dfrac {722^2}{10} \right ] \left [ 56244-\dfrac {738^2}{10} \right ]}} \\[5px]&= \frac {54742-53283.6}{\sqrt {(1333.6)(1779.6)}} \\[5px]&\approx 0.947\end{align*}

從計算結果可以發現,學生的邏輯能力和期末成績之間的皮爾森積差相關係數為0.947,兩者之間具有高度的正向關係。由於樣本裡只有10位學生,為了能夠更準確地估計母群體相關係數,可以套用上面的公式(2)來計算調整後相關係數,計算過程如下:

    \begin{align*}r_{adj} &= \sqrt {1-\frac {(1-r^2)(N-1)}{N-2}} \\[5px]&= \sqrt {1-\frac {(1-0.947^2)(10-1)}{10-2}} \\[5px]&\approx 0.940\end{align*}

計算結果顯示調整後相關係數為0.940,與調整前的相關係數差了0.007,雖然差距不大,但並非所有的情況都是如此。當樣本數更小的時候,調整前與調整後的相關係數差異會更大一點。

運用SPSS求得調整後相關係數

可能因為實務上幾乎沒有在使用調整後相關係數,所以SPSS並沒有直接輸出調整後相關係數的分析或選項。雖然如此,但SPSS會輸出調整後決定係數(adjusted coefficient of determination)或稱為調整後R平方,而調整後決定係數的平方根即為調整後相關係數。

若要取得調整後決定係數,可以利用簡單線性迴歸分析。將上面例子裡10位學生的邏輯能力和期末成績輸入至SPSS資料編輯器裡,輸入完成後,點選功能表的分析 » 迴歸 » 線性,帶出「線性迴歸」視窗。關於SPSS的資料輸入方法,請參考SPSS操作環境和資料輸入。

spss menu of linear regression

在「線性迴歸」視窗裡,依據研究假設,可作為依變項的變項移至應變數(D),可作為自變項的變項移至自變數(I),這裡把期末成績移至應變數(D)而邏輯能力成績移至自變數(I)。再點選視窗最右側的統計資料(S),帶出「線性迴歸:統計量」小視窗,確定模型配適度(M)有被勾選,完成後按下這視窗下方的繼續(C)。回到「線性迴歸」視窗後,再按下最下方的確定。

spss dialog box of linear regression

經過上面的步驟,SPSS的輸出結果裡會有一個如下圖的「模型摘要」表格。從這個表格裡,可以看到邏輯能力和期末成績的相關係數(R)為0.947,這數值和上面利用紙筆計算所得到的結果是相同的。

spss output of linear regression model summary

另外,從「模型摘要」表還可以看到調整後R平方為0.883,也就是調整後決定係數,代表邏輯能力可以解釋期末成績裡88%的變異。把這個調整後R平方開根號,就是調整後相關係數。

    \begin{equation*}\sqrt {0.883} \approx 0.940\end{equation*}

調整後R平方的平方根為0.940,這就是調整後相關係數,相同於上面紙筆計算的結果。雖然計算調整後相關係數的公式並沒有很複雜,但在不想紙筆運算或想驗算的情況下,可以透過SPSS的簡單線性迴歸分析所輸出的調整後R平方來計算取得。

以上為本篇文章對調整後相關係數的介紹,希望透過本篇文章,您瞭解了調整後相關係數的意義、計算方法和利用SPSS取得調整後相關係數的方式。若您喜歡本篇文章,請將本網站加入書籤,並持續回訪本網站喔!另外,也歡迎您追蹤本網站的Facebook和/或Twitter專頁喲!

如果您覺得本篇文章對您有幫助,歡迎買杯珍奶給Dr. Fish!小杯珍奶,大大鼓勵,您的支持將給Dr. Fish更多撰寫優質文章的動力喔!

標籤: SPSS 共變異數 完全關係 標準差 決定係數 皮爾森相關係數 皮爾森積差相關係數 相關係數 簡單線性迴歸 總和運算 調整後R平方 調整後決定係數 調整後相關係數

文章導覽

❮ Previous Post: 北海道自助旅行:道南、道央8天7夜行程規劃
Next Post: 最小平方迴歸線的預測區間計算 ❯

您可能也會喜歡

featured image of Pearson correlation using Excel
如何使用Excel取得皮爾森積差相關係數
featured image of measuring scales and choices of correlation coefficients
測量尺度和相關係數的選擇
featured image of kendall tau
肯德爾等級相關係數的意義和計算
featured image of point-biserial correlation
點二系列相關係數的意義和計算

關於 Dr. Fish

profile picture uploaded on July 5, 2024

喜歡求知和分析,所以一路讀到博士。也喜歡旅行、攝影、料理、看日劇,愛把複雜的思想和事物變簡單,是個有點宅也有點跳 TONE 的人。

支持 Dr. Fish

本網站經營和文章撰寫皆由 Dr. Fish 一人完成,投注許多時間和費用。若您喜歡任何一篇文章或覺得文章對您有幫助,請給我一些支持,買杯珍奶給我吧!您的支持不但能給我更多撰寫文章的動力,也可以讓這網站的經營持續下去喔!謝謝!😄

boba-icon
請我喝珍奶!
featured image of spss environment and data entry

下載專區

標準常態分配表

Student's t 分配臨界值表

F分配臨界值表

卡方分配臨界值表

斯皮爾曼等級相關係數臨界值表

Wilcoxon 配對符號等級檢定臨界值表

曼–惠特尼U檢定臨界值表

Student 化全距分配臨界值表

Dunnett 檢定臨界值表(雙尾檢定)

單一樣本z檢定的 SPSS 語法

關於 Dr. Fish 漫游社會統計

本網站使用簡單易懂的文字解說社會統計,並示範軟體操作,同時有課後隨筆的分享,希望讀者在學習之餘,也能感受到生活的樂趣。

網站政策

著作權聲明 Copyright Notice
隱私權政策 Privacy Policy
免責聲明  Disclaimer

追蹤網站

Facebook
X(Twitter)

Copyright © 2021-2026 Dr. Fish 漫游社會統計. All rights reserved.