共變異數(covariance)可用來瞭解一個變項和另一個變項的共同變化程度,屬於變項間相關性的一種測量方法。共變異數類似於變異性測量裡變異數的概念,只不過變異數用在單一變項的變化上,而共變異數用在兩變項的共同變化上。
因為共變異數仍舊帶有變項原本的測量單位,所以數值可能很小或很大,不但不容易解釋,也沒有辦法進行跨樣本的比較,實用性不如變項測量單位已經標準化的相關係數。雖然如此,共變異數是相關係數計算過程中須用到的一個數值,且共變異數本身並非完全沒有參考價值,所以仍為統計分析裡很常使用到的一種相關性測量。
共變異數可說是基礎的相關性統計量,透過統計分析軟體如SPSS、STATA皆可簡單地取得。如果沒有專門的統計分析軟體,也可以利用微軟的Excel來計算。計算方法有2種,第1種是透過資料分析工具,第2種是利用函數語法,下面將分別示範操作方法。
本篇文章將著重在技術層面的操作,不涉及學理層面的說明。因此,若您想瞭解共變異數的意義、紙筆計算方法或共變異數和相關係數差異等實質內容,請參考共變異數的意義和計算。下面內容將以〈共變數的意義和計算〉裡邏輯能力成績和法學緒論期末成績的例子來示範如何使用Excel計算共變異數。
運用資料分析工具計算共變異數
運用資料分析工具來取得共變異數前須先安裝「分析工具箱」,您可查看功能表的資料 » 分析裡是否有資料分析的圖示。若有,代表您已經安裝「分析工具箱」;若沒有,請參考〈如何使用Excel一次取得描述性統計量〉裡安裝分析工具箱的步驟進行安裝。
以一欄為一個變項的方式,把〈共變異數的意義和計算〉裡10位學生的邏輯能力成績和法學緒論期末成績輸入至一空白的活頁簿或工作表裡,輸入完成後如下圖。
資料輸入完成後,點選功能表的資料 » 分析裡的資料分析圖示,帶出「資料分析」視窗。從這個視窗的分析工具(A)選項裡點選共變數後,按下確定,會出現「共變數」視窗。
在「共變數」視窗的輸入範圍(I)裡,輸入欲計算共變異數的資料所在的儲存格範圍,或點⬆小圖示,再用滑鼠圈選儲存格的範圍。分組方式是指資料輸入是以一欄為一個變項或一列為一個變項,這裡採用一欄一個變項的方式,所以點選逐欄(C)。另外,若資料的第1列為變項的名稱,須勾選類別軸標記是在第一列上(L)。
輸出選項長方框裡為輸出結果存放位置的選擇,一共有3個選項。這裡選擇輸出範圍(O),也就是將輸出結果存放於同一工作表的某個儲存格,可自行輸入儲存格的位置。另外,您也可以選擇將輸出結果存放於新工作表(P)或新活頁簿(W)。全部輸入完成後,按下視窗最右側的確定。
經過上述的步驟後,資料分析工具會傳回如下圖的表格。這樣的表格稱為共變異數矩陣,可以清楚地看出變項和變項之間的共變異數和變項本身的變異數。從下圖的共變異數矩陣可以知道,邏輯能力成績和法學緒論期末成績的共變異數為145.84,而邏輯能力成績的變異數為133.36、期末成績的變異數為177.96。
不過您可能會發現這些數值和〈共變異數的意義和計算〉裡計算得到的數值並不相同,原因在於資料分析工具輸出的結果為母群體共變異數,而不是樣本共變異數。母群體和樣本共變異數的差別只在於公式的分母,前者除以配對變項的總組數,後者則除以配對變項總組數減1。
一般來說,若是用樣本來計算共變異數,為了能夠更準確地估計母群體的共變異數,會採用分母為配對變項總組數減1的公式來計算共變異數。但是從上面的示範過程可以發現,利用資料分析工具求得變項間的共變異數時,僅會輸出母群體的共變異數。若想取得樣本的共變異數,則須透過函數語法的撰寫,下面示範操作方法。
運用函數計算共變異數
利用相同的範例資料,這裡改用函數來求得共變異數。Excel內建2個共變異數的函數,一個為母群體的共變異數函數,另一個為樣本的共變異數函數。兩者的語法分別如下:
- 母群體共變異數函數:COVARIANCE.P(array1, array2)
- 樣本共變異數函數:COVARIANCE.S(array1, array2)
不論是母群體或樣本共變異數的函數,括弧裡的引數都相同,只要寫出2個變項各自的資料儲存格範圍即可,語法並不複雜。
在同一個工作表裡找2個空白的儲存格,輸入「樣本」和「母群體」,分別代表樣本共變異數和母群體共變異數。在「樣本」右邊的儲存格(這裡為F2)輸入下面的語法:
=COVARIANCE.S(B2:B11, C2:C11)
這語法指出第1個變項的資料位於儲存格B2到B11,第2個變項的資料位於儲存格C2到C11,利用樣本共變異數的公式計算出共變異數。語法輸入完成後,按下Enter,會傳回數值162.04(四捨五入到小數點後第2位),這就是邏輯能力成績和法學緒論期末成績的樣本共變異數,也是在〈共變異數的意義和計算〉裡計算得到的數值。
若想求得母群體共變異數,可利用母群體共變異數的函數。在「母群體」右邊的儲存格(這裡為F3)輸入下面的語法:
=COVARIANCE.P(B2:B11, C2:C11)
這語法指出第1個變項的資料位於儲存格B2到B11,第2個變項的資料位於儲存格C2到C11,利用母群體共變異數的公式計算出共變異數。這語法會傳回數值145.84,和上面透過資料分析工具所得到的共變異數是相同的。
如果您想製作樣本的共變異數矩陣,可以仿照上面資料分析工具所輸出的表格格式,並利用樣本變異數和樣本共變異數的函數來計算2個變項各自的變異數和2個變項的共變異數。樣本變異數的函數為VAR.S,語法為VAR.S(number1, [number2], …),括弧裡可直接輸入資料或資料所在的儲存格範圍。
透過函數運算得到邏輯能力成績和期末成績的樣本共變異數為162.04,邏輯能力成績的樣本變異數為148.18,而期末成績的樣本變異數為197.73。這些數值全部和〈共變異數的意義和計算〉裡運用SPSS取得共變異數所獲得的結果是相同的,這也表示SPSS採用的是樣本變異數和共變異數的運算方法。
利用上述的方法,即使有數個變項,也能夠製作出變項間的樣本共變異數矩陣。雖然過程可能比較麻煩,但只利用到2個函數,操作上並不困難。
以上為本篇文章對如何使用Excel計算共變異數的介紹,希望透過本篇文章,您瞭解了共變異數的函數種類,也學會了利用Excel取得共變異數的操作方法。
若您喜歡本篇文章,請將本網站加入書籤,作為您的學習資源,並持續回訪本網站喔!另外,您也可以在Facebook和Twitter上找到我們喲!