斯皮爾曼等級相關係數(Spearman´s rank correlation coefficient)是用來測量次序尺度變項資料關聯程度的一種相關係數,可簡稱為Spearman´s rho,通常用符號來表示,屬於一個無母數統計量。關於這個相關係數的意義和計算方法,已經在斯皮爾曼等級相關係數的意義和計算裡有詳細的說明。
雖然斯皮爾曼等級相關係數可用來探討次序尺度變項間的關聯程度,但無法知道兩變項間的關係是否達到統計顯著。換句話說,單從相關係數的數值無法看出兩個變項之間的關係是否真實地存在於母群體中。若要知道兩者間的關係是否真實地存在,則須進行斯皮爾曼等級相關係數的假設檢定,或稱為顯著性檢定。
因此,本篇文章將簡單地回顧斯皮爾曼等級相關係數的計算方法,再說明斯皮爾曼等級相關係數的假設檢定過程,最後示範利用SPSS評估斯皮爾曼等級相關係數假設檢定結果的操作方法。由於文章內容牽涉到假設檢定的過程,若您不清楚或不熟悉假設檢定,建議您可先閱讀假設檢定的步驟和範例,將有助於下面內容的理解。
斯皮爾曼等級相關係數的計算
斯皮爾曼等級相關係數是用來測量兩個次序尺度變項間關聯程度的一種相關係數,而這個相關係數的計算可分為「沒有相同等級的存在」和「有相同等級的存在」兩種情況。若資料裡沒有相同等級的存在,也就是沒有平手或平分的情況,可以使用下面的公式來計算斯皮爾曼等級相關係數:
(1)
上面的公式(1)中,指配對的兩變項等級的差值,也就是成對變項的第1個變項的等級減去第2個變項的等級。指所有配對等級差值平方後的總和、指配對等級的總組數。若您不清楚或不熟悉總和運算的方法,請參考社會統計常用的基本數學符號和運算。
若變項裡有相同等級的存在,使用公式(1)將無法正確地計算出兩變項間的相關係數,須改用皮爾森積差相關係數的公式來運算:
(2)
上面的公式(2)中,和分別指X變項和Y變項裡所有等級的總和、指配對兩變項等級的乘積和、和分別指X變項和Y變項所有等級平方的總和、和分別指X變項和Y變項所有等級總和的平方、為配對兩變項的總組數。
其實斯皮爾曼等級相關係數是皮爾森積差相關係數的一個特例,當變項裡沒有相同等級存在的時候,不論使用上述的公式(1)或公式(2),都會得到相同的結果;但當變項裡有相同等級存在的時候,使用公式(2)才能得到正確的相關係數的數值。
這裡有一點要注意的是,斯皮爾曼等級相關係數是用來測量次序尺度變項之間的關聯程度,若其中有一個變項是等距尺度或比率尺度的變項,須先將變項的數值依據大小排序並列出等級後,才可進行運算。若兩個變項都屬於次序尺度,則可直接套用公式進行運算。
斯皮爾曼等級相關係數的假設檢定
斯皮爾曼等級相關係數用來測量次序尺度變項間的關聯程度和方向,但獲得相關係數的數值後,並不知道兩個變項之間的關係是否真實地存在於母群體中。若想進一步地探討這層關係,就須進行斯皮爾曼等級相關係數的假設檢定。
假設檢定的一開始須先擬定研究假設,通常會根據研究的目的、理論基礎和過去的研究發現來決定研究假設的內容以及方向性的有無。無方向性的對立假設()主張配對兩變項間的等級有關聯,虛無假設()則主張配對兩變項間的等級沒有關聯。若是有方向性的對立假設,須在對立假設裡指出關聯的方向,也就是兩變項的等級趨於一致或不一致。
擬定完研究假設後,須設定適當的顯著水準或稱為α水準,一般而言,會依據研究的目的、性質和可能帶來的後果來選擇顯著水準的大小,習慣上為0.05、0.01或更嚴苛的0.001。另外,根據研究假設是否具有方向性,決定假設檢定為雙尾檢定或單尾檢定。若無方向性,為雙尾檢定;若有方向性,則為單尾檢定。
當配對兩變項的組數等於或大於10()的時候,斯皮爾曼等級相關係數會趨近於t分配,自由度(degrees of freedom,簡寫為df)為(Gingrich, 2020)。此時和皮爾森積差相關係數的假設檢定一樣,當虛無假設主張時(指母群體的相關係數),檢定統計量為t統計量,公式為:
(3)
求得t檢定統計量後,透過已選擇的α水準和的自由度,查詢t分配表,找出相對應的t臨界值。最後,運用決策規則,若是雙尾檢定,當t檢定統計量的絕對值等於或大於t臨界值的絕對值時,就可拒絕虛無假設,接受對立假設;反之,則保留虛無假設。
若是單尾檢定,也就是對立假設為有方向性的假設,當斯皮爾曼等級相關係數的方向不同於事先擬定的對立假設方向時,就須保留虛無假設,而不用繼續執行剩下的假設檢定步驟。若兩者的方向一致,當t檢定統計量的絕對值等於或大於臨界值的絕對值時,即可拒絕虛無假設。
如果配對兩變項的組數小於10,也可查詢斯皮爾曼等級相關係數的臨界值表。當計算出來的斯皮爾曼等級相關係數的絕對值等於或大於斯皮爾曼等級相關係數臨界值的絕對值時,即可拒絕虛無假設,接受對立假設。不過在單尾檢定的情況,仍舊須注意上面提到的相關係數的方向和對立假設的方向是否一致的問題。
不過,次序尺度變項的資料本來就不可能呈現常態分配,且至今仍舊沒有一個共通地計算小樣本的斯皮爾曼等級相關係數標準誤的方法,使得斯皮爾曼等級相關係數的臨界值表有多種不同的版本(Howell, 2009)。這裡提供Ramsey(1989)的臨界值表給您參考,但只要配對兩變項的組數等於或大於10,就建議使用上述的t分配和t檢定統計量進行假設檢定。
上面提到的決策規則皆是比較檢定統計量和臨界值,如果是使用統計分析軟體來評估假設檢定的結果,例如SPSS、SAS,通常會輸出獲得特定檢定統計量的機率(值)而非臨界值。此時須改用機率比較的決策規則,當,就可拒絕虛無假設,接受對立假設;反之,則保留虛無假設。
瞭解了斯皮爾曼等級相關係數的假設檢定步驟後,下面使用一個例子來實際操作整個假設檢定的過程。
斯皮爾曼等級相關係數假設檢定的範例
有位諮商心理師想探討兩位精神科醫生對個案憂鬱程度的評估是否有所不同,她請兩位精神科醫生分別對10位個案進行詳細的訪談,再依據個案的憂鬱程度加以排序,兩位醫生各自給予10位個案的排序如下表。若設定α水準為0.05、雙尾檢定,試問這兩位精神科醫生對個案憂鬱程度的排序是否有顯著的關聯性?
這位諮商心理師想瞭解兩位精神科醫生對10位個案所給予的憂鬱程度排序「是否有所不同」,並沒有指出關聯的方向,所以屬於無方向性的研究假設。這研究的對立假設和虛無假設分別如下:
- 對立假設():兩位精神科醫生對憂鬱程度的排序有關聯,可能傾向於一致或不一致。
- 虛無假設():兩位精神科醫生對憂鬱程度的排序彼此獨立,沒有關聯性。
這研究屬於探索性質,所以諮商心理師選擇0.05的α水準。此外,研究假設不具有方向性,因此假設檢定為雙尾檢定。若用符號來表示,可以寫成。
由於兩位精神科醫生各自將個案的憂鬱程度排序,屬於次序尺度的變項,為了探討兩個次序尺度變項間的關聯性,可以使用斯皮爾曼等級相關係數(當然也可以使用肯德爾等級相關係數)。此外,兩位醫生的排序裡都沒有相同等級的存在,所以可使用上面較簡單的公式(1)來計算相關係數。
套用公式(1)時須使用到配對兩變項等級的差值和差值的平方,所以可先在如下的表格裡將所需的數值計算出來:
接著,將上表中的數值帶入上面的公式(1)中,計算過程如下:
計算結果指出斯皮爾曼等級相關係數為0.782,關聯程度滿高的。因為這個範例的配對兩變項的組數為10組,也就是,所以可使用t分配和t檢定統計量。使用上面的公式(3)來計算t檢定統計量,計算過程如下:
因為,所以自由度為。查詢t分配表,當自由度為8、α水準為0.05、雙尾檢定時,t臨界值為。
最後,運用決策規則,比較t檢定統計量和t臨界值,因為,所以拒絕虛無假設,接受對立假設。分析結果顯示,兩位精神科醫生對個案憂鬱程度的排序有顯著的關聯,而正數的相關係數代表兩人的排序傾向於一致。
這裡也示範一下斯皮爾曼等級相關係數臨界值表的運用方式,當、α水準為0.05、雙尾檢定的時候,斯皮爾曼等級相關係數的臨界值為。
比較計算出來的斯皮爾曼等級相關係數和臨界值,因為,所以拒絕虛無假設,接受對立假設。分析結果顯示兩位精神科醫生對個案憂鬱程度的排序有顯著的關聯,和上面使用t分配和t檢定統計量的結果相同。
不過紙筆計算只適合配對兩變項的組數很少的情況,若組數很多,紙筆計算便不切實際,須改用統計分析軟體,下面示範如何利用SPSS評估斯皮爾曼等級相關係數的假設檢定結果。
運用SPSS評估斯皮爾曼等級相關係數的假設檢定結果
將上面範例裡的資料輸入至SPSS資料編輯器裡,輸入完成後,點選功能表的分析 » 相關 » 雙變異數,帶出「雙變量相關性」視窗。關於SPSS資料輸入的方法,請參考SPSS操作環境和資料輸入。
在「雙變量相關性」視窗裡,將兩個次序尺度的變項(這裡為PSYCHR1和PSYCHR2)從左邊的方框移到右邊的變數(V)方框中。在相關係數長框裡,勾選Spearman的選項,而顯著性檢定的預設值為雙尾(T),所以不用變更。完成後,按下視窗下方的確定。
經過上述的步驟,SPSS會輸出如下的「相關性」表格。不論是看PSYCHR1欄或PSYCHR2欄都可以,斯皮爾曼等級相關係數為0.782,雙尾的顯著性(值)為0.008,而配對兩變項的組數為10。
運用機率比較的決策規則,比較雙尾顯著性的機率和事先設定的α水準,因為0.008 < 0.05,也就是,所以拒絕虛無假設,接受對立假設。分析結果告訴我們,兩位精神科醫生對個案憂鬱程度的排序有顯著的關聯,正數的斯皮爾曼相關係數指出兩位醫生的排序傾向於一致。
雖然斯皮爾曼等級相關係數是個滿常被用來測量次序尺度變項間關聯性的相關係數,但是如上面所提到,當樣本數很小的時候,至今仍舊沒有一個能被廣泛接受的斯皮爾曼等級相關係數標準誤的計算方法,導致斯皮爾曼等級相關係數的臨界值表有多種版本。
因此,Howell(2009)建議當樣本數很小且變項中有很多相同等級存在的時候,同樣用來測量次序尺度變項間關聯性的肯德爾等級相關係數會是一個比斯皮爾曼等級相關係數更好的母體參數估計值,而且可計算出標準誤。另外,肯德爾等級相關係數在時即趨近於常態分配,所以可使用常態分配和z檢定統計量來進行假設檢定,其詳細的假設檢定過程請參考肯德爾等級相關係數的假設檢定。
以上為本篇文章對斯皮爾曼等級相關係數假設檢定過程的介紹,希望透過本篇文章,您瞭解了斯皮爾曼等級相關係數的假設檢定步驟,也學會了如何利用SPSS評估斯皮爾曼等級相關係數假設檢定結果的方法。
若您喜歡本篇文章,請將本網站加入書籤,作為您的學習工具,並持續回訪本網站喔!另外,也歡迎您追蹤我們的Facebook和Twitter專頁喲!
參考資料
Gingrich, P. (2020, August 7). Association between variables [lecture notes]. University of Regina. https://uregina.ca/~gingrich/corr.pdf
Howell, D. C. (2009). Statistical methods for psychology (7th ed.). Belmont, CA: Wadsworth.
Ramsey, P. H. (1989). Critical values for Spearman´s rank order correlation. Journal of Educational Statistics, 14(3), 245-253. https://doi.org/10.2307/1165017