相關(correlation)通常是研究人員在執行更明確、深入的統計檢定前會實行的一種分析,主要透過相關係數(correlation coefficient)的計算來瞭解兩個變項之間的關聯方向和強度。但相關係數的種類很多,其選擇最主要會受到資料分布的型態(線性關係或非線性關係)、變項的測量尺度等兩個因素的影響。
社會或行為科學的研究較常碰到變項之間為線性關係的情況,而很多的相關係數也是建立在線性關係的基礎上。若兩變項之間不是線性關係,使用線性關係的相關係數將會低估兩個變項之間的關聯程度,例如下圖的倒U型關係(inverted U-shaped relationship)。因此,進行任何的相關分析前,最好先繪製散布圖,仔細地觀察兩個變項之間的分布型態後再決定線性關係的相關係數是否合適。
另一個和相關係數的選擇息息相關的因素為變項的測量尺度。測量尺度可以分為名義尺度、次序尺度、等距尺度和比率尺度,而不同的測量尺度有各自適用的相關係數。下表為測量尺度和相關係數選擇的總整理:
測量尺度 | 變項 | 相關係數 | 表示符號 | 假設檢定 |
---|---|---|---|---|
名義尺度 | 2個變項皆為二分變項 | phi係數 | phi係數的假設檢定 | |
名義尺度 | 1個變項為二分變項,另1個變項為等距或比率尺度 | 點二系列相關係數 | 點二系列相關係數的假設檢定 | |
次序尺度 | 2個變項皆至少為次序尺度 | 斯皮爾曼等級相關係數 | 斯皮爾曼等級相關係數的假設檢定 | |
次序尺度 | 2個變項皆至少為次序尺度 | 肯德爾等級相關係數 | 肯德爾等級相關係數的假設檢定 | |
等距或比率尺度 | 2個變項皆至少為等距尺度 | 皮爾森積差相關係數 | 皮爾森積差相關係數的假設檢定 |
上表中的相關係數都屬於線性關係的相關係數,不適合用在非線性關係的變項上。此外,phi係數、點二系列相關係數和斯皮爾曼等級相關係數都是皮爾森積差相關係數的特例,簡單地說,是將皮爾森積差相關係數的公式套用至較低層次的測量尺度變項上。
斯皮爾曼等級相關係數和肯德爾等級相關係數同樣用來測量兩個次序尺度變項間的關聯方向和強度,但因為至今仍舊沒有一個共通地計算小樣本的斯皮爾曼等級相關係數標準誤之方法,所以當樣本數很小且變項中有很多相同等級存在的時候,肯德爾等級相關係數會是一個比斯皮爾曼等級相關係數更好的母體參數估計值(Howell, 2009)。
雖然相關係數的選擇會受到資料分布型態和測量尺度的影響,但不論是哪一種相關係數,都具有下面的特性:
- 資料來源為配對的兩個測量:計算相關係數的資料來自於配對的兩個測量(變項),這兩個測量可能取自於相同的人、物或事件,或是經過配對的兩個人。
- 數值介於-1和1之間:相關係數的數值介於數值-1和1之間,數值-1代表兩變項間為負向的完全關係,數值1則代表正向的完全關係。若相關係數的數值為0,代表兩個變項間不存在關係。關於變項間關係的介紹,請參考變項之間關係的基本特色。
- 關係是否確實存在須靠假設檢定:單純從相關係數的數值無法知道兩個變項間的關係是否真實地存在於母群體中(也就是達到統計顯著),必須進行假設檢定才能探討這層關係。
- 高關聯程度不代表因果關係:關聯程度高不代表兩變項間具有因果關係,若要探討因果關係,須使用嚴謹的實驗研究設計,並經過反覆的驗證才可以。
以上為本篇文章對測量尺度和相關係數選擇的說明和整理,希望透過本篇文章,您瞭解除了耳熟能詳的皮爾森積差相關係數之外,還有很多種類的相關係數,而這些相關係數會依據資料的測量尺度而有不同。
若您喜歡本篇文章,請將本網站加入書籤,作為您的學習工具,並持續回訪本網站喔!另外,也歡迎您追蹤我們的Facebook和Twitter專頁,將可獲得第一手的文章資訊喲!
參考資料
Howell, D. C. (2009). Statistical methods for psychology (7th ed.). Belmont, CA: Wadsworth.