Skip to content

合作邀約 email: dr.fish@drfishstats.com

  • Facebook
  • X
site icon of Dr. Fish

Dr. Fish 漫游社會統計

魚博士的專業漫談和課後隨筆

  • Home
  • 關於Dr. Fish
  • 統計基礎
    • 入門概念
    • 圖形繪製
    • 描述統計
    • 相關
    • 線性迴歸
  • 統計進階
    • 推論統計
    • 統計檢定
      • 相關係數
      • 迴歸
      • 平均數比較
      • 無母數檢定
  • EXCEL系列
    • 資料管理
    • 圖形繪製
      • 匯出SPSS資料至Excel並繪製盒形圖
      • 如何使用Excel製作Q-Q plot
      • 如何使用Excel繪製加上誤差線的長條圖
    • 描述統計
      • 如何使用Excel執行次數分配
      • 如何使用Excel樞紐分析表製作次數分配表
      • 如何使用Excel計算偏態和峰態
      • 如何使用Excel尋找常態曲線下面積或分數
      • 如何使用Excel一次取得描述性統計量
      • 如何使用Excel計算共變異數
      • 如何使用Excel取得皮爾森積差相關係數
      • 如何使用Excel製作列聯表
    • 推論統計
      • 如何使用Excel計算信賴區間
      • 如何使用Excel執行符號檢定
      • 如何使用Excel執行單一樣本z檢定和t檢定
      • 如何使用Excel執行獨立樣本t檢定
      • 如何使用 Excel 執行 Levene 檢定
      • 如何使用 Excel 執行 Welch t 檢定
      • 如何使用Excel執行關聯樣本t檢定
      • 如何使用Excel執行單因子變異數分析
      • 如何使用Excel執行簡單線性迴歸
      • 如何使用Excel計算最小平方迴歸線的預測區間
      • 如何使用Excel執行卡方獨立性檢定
  • 下課後
    • 生活
    • 旅遊
      • 日本
    • 美食
    • 攝影
  • 聯絡Dr. Fish
  • Home
  • 相關
  • 共變異數的意義和計算

🐟 請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址

共變異數的意義和計算

Posted on 2023-11-182023-11-18 By Dr. Fish
相關

共變異數(covariance)是用來探討兩變項間關聯性的一種測量方法,也就是一個變項和另一個變項共同變化的程度。共變異數的概念相當類似於變異數,只是變異數用在瞭解單一變項的變化上,而共變異數則用在兩個變項的共同變化上。

下面內容將先介紹共變異數的意義和計算方法,並舉例說明,再解釋共變異數和相關係數之間的差異,最後示範利用SPSS取得共變異數的操作方法。

  • 共變異數的意義
  • 共變異數的計算
  • 共變異數和相關係數的差異
  • 運用SPSS取得共變異數

共變異數的意義

共變異數是用來顯示兩個變項共同變化程度的一個數值,可以用符號\text {cov}_{xy}來表示,類似於變異性測量裡變異數的概念。變異數是用來測量一個變項裡所有資料偏離平均數(稱為離差)的平均程度,若讓x_i表示X變項的第i個資料、\overline x為平均數、N為樣本總個數,變異數s^2的概念公式如下:

    \[ s^2 = \frac {\sum_{i=1}^n (x_i-\overline x)^2}{N-1} \]

把上面變異數公式的分子稍微展開,會變成下面的樣子:

    \[ s^2 = \frac {\sum_{i=1}^n (x_i-\overline x)(x_i-\overline x)}{N-1} \]

變異數可視為自己對自己的變化,若把上面公式分子的第2個(x_i-\overline x)變成另一個變項裡每一個資料和平均數的離差(y_i-\overline y),就變成共變異數的公式。換句話說,當我們把一個變項裡各個資料的離差乘以配對的另一個變項裡各個資料的離差並相加(稱為離差交叉乘積和)後,再除以配對兩變項的總組數減1,即為兩變項的平均合併離差,而這就是共變異數。

(1)   \begin{equation*}\text {cov}_{xy} = \frac {\sum_{i=1}^n (x_i-\overline x)(y_i-\overline y)}{N-1}\end{equation*}

從共變異數的公式可以看出,當一個變項裡大多數的離差為正數且另一個變項裡大多數的離差也為正數,或一個變項裡大多數的離差為負數且另一個變項裡大多數的離差也為負數時,兩變項的離差交叉乘積和會很大且為正數,代表兩變項具有強大的正向共變關係。反過來看,若其中一個變項裡大多數的離差為正數,另一個變項裡大多數的離差為負數,兩變項的離差交叉乘積和會很大且為負數,代表兩變項為強大的負向共變關係。

此外,若一個變項裡的離差為正數,但另一個變項裡配對的離差有時為正數、有時為負數時,在這種情況下,兩變項的離差交叉乘積可能有一半為正數而有一半為負數,因此離差交叉乘積和會約略為0,代表兩變項間不具有關係。關於變項之間可能具有的關係型態,請參考變項之間關係的基本特色。

瞭解了共變異數的意義和計算公式的來由之後,下面舉個例子,示範如何利用上面的公式來計算共變異數。

共變異數的計算

假設有一位法學緒論的老師認為學生的邏輯思考能力和該門課程的表現有很大的關係,因此在學期開始的時候,她給予修課的10位學生一份邏輯能力的標準化測驗,並拿這些成績和各個學生在這門課的期末成績相比較。若邏輯能力成績為X變項,變項名稱為LOGIC,而期末成績為Y變項,變項名稱為SCORE,這10位學生的成績如下表,試問邏輯能力和期末成績的共變異數是多少?

data of covariance example

在計算共變異數之前,先製作這兩個變項的散布圖,以便觀察這兩個變項間的關係。將X變項置於橫座標軸、Y變項置於縱座標軸,這兩個變項的散布圖如下:

scatter plot of covariance example

從上面的散布圖可以看出,當邏輯能力的成績愈高,期末成績也有愈高的趨勢,代表這兩個變項具有正向的關係。另外,大多數的資料點都沒有太過偏離最小平方迴歸線,顯示這兩個變項之間具有高度的關聯性。

由於邏輯能力的成績愈高,期末成績也愈高,所以能夠預期這兩個變項的離差交叉乘積和會是一個偏大的正向數值,共變異數也會偏大。您當然可以使用上面的公式(1)來計算共變異數,但過程中須用到兩變項各自的平均數來求得每一個資料的離差,運算過程中可能充斥著小數,很容易造成運算錯誤或進位誤差,所以可改利用下面的運算公式來計算。

(2)   \begin{equation*}\text {cov}_{xy} = \frac {\sum XY-\dfrac {\sum X \sum Y}{N}}{N-1}\end{equation*}

    \begin{equation*}\begin{CJK*}{UTF8}{bsmi}\begin{align*}\sum X &= \text {X變項裡所有資料的總和} \\\sum Y &= \text {Y變項裡所有資料的總和} \\\sum XY &= \text {配對兩變項資料的交叉乘積和} \\N &= \text {配對兩變項資料的總組數}\end{align*}\end{CJK*}\end{equation*}

您可利用如下的表格,先計算出套用上面公式所須的數值,包括X變項裡所有資料的總和、Y變項裡所有資料的總和以及配對兩變項的資料交叉乘積和。若您不清楚或不熟悉總和的運算方法,請參考社會統計常用的基本數學符號和運算。

calculation of covariance example

從上表可以得到\sum X為722、\sum Y為738、\sum XY為54742,把這幾個數值帶入上面的公式(2)裡並將計算結果四捨五入至小數點後第2位,計算過程如下:

    \begin{align*}\text {cov}_{xy} &= \frac {\sum XY-\dfrac {\sum X \sum Y}{N}}{N-1} \\[5pt]&= \frac {54742-\dfrac {722 \times 738}{10}}{10-1} \\[5pt]&\approx 162.04\end{align*}

計算結果指出邏輯能力成績和期末成績之間的共變異數為162.04,如同我們的預期,兩變項的共變異數為一個偏大的正向數值。

共變異數和相關係數的差異

藉由共變異數的計算,可以知道一個變項和另一個變項的共同變化程度。正數的共變異數指出當一個變項偏離平均數時,另一個變項也往相同的方向偏離平均數;負數的共變異數則指出當一個變項偏離平均數時,另一個變項往相反的方向偏離平均數。

雖然共變異數是瞭解兩變項共同變化程度的一個好方法,但數值本身很難被解釋,也很難進行跨資料集(也就是不同樣本)的比較,因為共變異數會隨著不同的測量單位而改變數值的大小。舉例來說,若兩變項有很強的關聯性,以公尺為測量單位的變項所計算出來的共變異數會小於以公分為測量單位所計算出來的共變異數。

換句話說,共變異數不是一個標準化的測量數值,所以無法在不同的資料集間作為一個客觀的比較方法。為了彌補這個缺點,可以改用標準化的測量單位來呈現兩變項的共同變化程度,也就是把兩變項的離差交叉乘積和除以兩變項的標準差乘積。若讓s_x為X變項資料的標準差、s_y為Y變項資料的標準差,標準化的共變異數可用下面的公式來呈現:

    \[ \text {cov}_{\text {std}}=\frac {\text {cov}_{xy}}{s_x s_y}=\frac {\sum_{i=1}^n (x_i-\overline x)(y_i-\overline x)}{(N-1)s_x s_y} \]

這個標準化的共變異數稱為相關係數,更正確地說,為皮爾森積差相關係數,通常用符號r來表示。如果兩變項為完全的正向關係,相關係數為1;如果兩變項為完全的負向關係,相關係數為-1;如果兩變項不存在關係,相關係數為0。一般而言,變項之間通常為不完全的關係,所以相關係數會介於1和-1間。關於皮爾森積差相關係數的詳細介紹,請參考何謂皮爾森積差相關係數。

雖然共變異數和相關係數同樣是變項間關聯性的測量方法,但相關係數帶有較多的優勢且實務上也較常被使用。共變異數和相關係數的差異可用下表來呈現:

共變異數 相關係數
用途 測量兩變項的共同變化程度 測量兩變項的關聯方向和強度
測量單位 有測量單位 沒有測量單位
數值範圍 可為各種不同的數值 數值介於1和-1之間
測量單位改變 數值會受到影響 數值不會受到影響
解釋難易度 不容易解釋 容易解釋

從上表可看出,共變異數和相關係數間的差異皆源於變項測量單位的有無,也因為這樣,共變異數的數值可能會非常小或非常大,讓解釋變得很困難,也無法進行不同樣本間的比較。因此,在統計分析的過程中,通常會以相關係數作為變項間關係程度的主要測量方法,而不是共變異數。

運用SPSS取得共變異數

運用SPSS取得共變異數的方法很簡單,這裡示範操作方法。首先,開啟SPSS資料編輯器,輸入上面例子裡10位學生的邏輯能力成績和課程期末成績,再點選功能表的分析 » 相關 » 雙變異數,帶出「雙變量相關性」視窗。關於SPSS的資料輸入方法,請參考SPSS操作環境和資料輸入。

spss menu of covariance

在「雙變量相關性」視窗裡,把變項LOGIC和SCORE從左邊的方框移至右邊的變數(V)方框裡,然後點選視窗最右側的選項(O),帶出「雙變量相關性:選項」小視窗。在這個小視窗的統計量長框裡,勾選交叉乘積偏差和共變數(C),完成後按下繼續(C)。回到上一個視窗後,再按下視窗最下方的確定。

dialog box of covariance in spss

經過上述的步驟,SPSS會輸出如下的「相關性」表格。不論是看LOGIC欄或SCORE欄都可以,邏輯能力成績和課程期末成績的共變異數為162.044,這數值和上面利用紙筆計算所得到的結果是相同的。

spss output of covariance

此外,變項自己對自己的變化即為變異數,從上表可看出邏輯能力成績的變異數為148.178,而期末成績的變異數為197.733。若想知道標準化共變異數,可以看上表的「皮爾森(Pearson)相關性」列,也就是皮爾森積差相關係數。邏輯能力成績和期末成績的相關係數為0.947,顯示兩者的關聯程度相當高。

如果您沒有專門的統計分析軟體如SPSS,也可以使用微軟的Excel來取得共變異數,詳細的操作方法請參考如何使用Excel計算共變異數。

以上為本篇文章對共變異數的介紹,希望透過本篇文章,您瞭解了共變異數的意義、計算方法、共變異數和相關係數的差異,也學會了利用SPSS取得共變異數的操作方法。

若您喜歡本篇文章,請將本網站加入書籤,作為您的學習資源,並持續回訪本網站喔!另外,您也可以在Facebook和Twitter上找到我們喲!

標籤: SPSS 共變異數 散布圖 最小平方迴歸線 皮爾森積差相關係數 相關 相關係數 總和運算 變異數 離差

文章導覽

❮ Previous Post: 如何使用Excel製作Q-Q plot
Next Post: 如何使用Excel計算共變異數 ❯

您可能也會喜歡

featured image of phi coefficient
phi係數的意義和計算
featured image of covariance using Excel
如何使用Excel計算共變異數
featured image of Pearson computation methods
如何計算皮爾森積差相關係數
featured image of point-biserial correlation
點二系列相關係數的意義和計算

關於 Dr. Fish

profile picture uploaded on July 5, 2024

喜歡求知和分析,所以一路讀到博士。也喜歡旅行、攝影、料理、看日劇,愛把複雜的思想和事物變簡單,是個有點宅也有點跳TONE的人。

支持 Dr. Fish

本網站經營和文章撰寫皆由Dr. Fish一人完成,投注許多時間和費用。若您喜歡任何一篇文章或覺得文章對您有幫助,請給我一些支持,買杯珍奶給我吧!您的支持不但能給我更多撰寫文章的動力,也可以讓這網站的經營持續下去喔!謝謝!😄

boba-icon
請我喝珍奶!
featured image of spss environment and data entry

下載專區

標準常態分配表

Student's t 分配臨界值表

F分配臨界值表

卡方分配臨界值表

斯皮爾曼等級相關係數臨界值表

Wilcoxon配對符號等級檢定臨界值表

曼–惠特尼U檢定臨界值表

Student化全距分配臨界值表

Dunnett檢定臨界值表(雙尾檢定)

單一樣本z檢定的SPSS語法

關於Dr. Fish漫游社會統計

本網站使用簡單易懂的文字解說社會統計,並示範軟體操作,同時有課後隨筆的分享,希望讀者在學習之餘,也能感受到生活的樂趣。

網站政策

著作權聲明 Copyright Notice
隱私權政策 Privacy Policy
免責聲明  Disclaimer

追蹤我們

Facebook
X(Twitter)

Copyright © 2021-2025 Dr. Fish 漫游社會統計. All rights reserved.