Skip to content

合作邀約 email: dr.fish@drfishstats.com

  • Facebook
  • X
site icon of Dr. Fish

Dr. Fish 漫游社會統計

魚博士的專業漫談和課後隨筆

  • Home
  • 關於Dr. Fish
  • 統計基礎
    • 入門概念
    • 圖形繪製
    • 描述統計
    • 相關
    • 線性迴歸
  • 統計進階
    • 推論統計
    • 統計檢定
      • 相關係數
      • 迴歸
      • 平均數比較
      • 無母數檢定
  • EXCEL系列
    • 資料管理
    • 圖形繪製
      • 匯出SPSS資料至Excel並繪製盒形圖
      • 如何使用Excel製作Q-Q plot
      • 如何使用Excel繪製加上誤差線的長條圖
    • 描述統計
      • 如何使用Excel執行次數分配
      • 如何使用Excel樞紐分析表製作次數分配表
      • 如何使用Excel計算偏態和峰態
      • 如何使用Excel尋找常態曲線下面積或分數
      • 如何使用Excel一次取得描述性統計量
      • 如何使用Excel計算共變異數
      • 如何使用Excel取得皮爾森積差相關係數
      • 如何使用Excel製作列聯表
    • 推論統計
      • 如何使用Excel計算信賴區間
      • 如何使用Excel執行符號檢定
      • 如何使用Excel執行單一樣本z檢定和t檢定
      • 如何使用Excel執行獨立樣本t檢定
      • 如何使用 Excel 執行 Levene 檢定
      • 如何使用 Excel 執行 Welch t 檢定
      • 如何使用Excel執行關聯樣本t檢定
      • 如何使用Excel執行單因子變異數分析
      • 如何使用Excel執行簡單線性迴歸
      • 如何使用Excel計算最小平方迴歸線的預測區間
      • 如何使用Excel執行卡方獨立性檢定
  • 下課後
    • 生活
    • 旅遊
      • 日本
    • 美食
    • 攝影
  • 聯絡Dr. Fish
  • Home
  • 推論統計
  • 統計檢定
  • 無母數檢定
  • 曼–惠特尼U檢定的假設檢定

🐟 請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址

曼–惠特尼U檢定的假設檢定

Posted on 2023-02-152023-02-15 By Dr. Fish
無母數檢定

曼–惠特尼U檢定(Mann-Whitney U test)是用來探討兩個獨立的群體或樣本是否有所不同且變項資料至少為次序尺度的一種無母數檢定,而曼–惠特尼U檢定的假設檢定即在檢驗兩個獨立的群體或樣本是否來自於極為相似的母群體之虛無假設。

曼–惠特尼U檢定是獨立樣本t檢定的一種替代檢定方法,用在資料為次序尺度或獨立樣本t檢定的基本假設受到嚴重違反的時候。透過數值等級的比較,評估兩個群體或樣本是否有顯著的差異。雖然曼–惠特尼U檢定是一種無母數檢定,但因為使用了資料裡多數的量化訊息,所以是一種頗受歡迎的統計檢定方法。

由於本篇文章內容涉及假設檢定的過程,若您不清楚或尚未熟悉假設檢定的意義和步驟,建議您先閱讀假設檢定的步驟和範例,將有助於以下內容的理解。

下面將先介紹曼–惠特尼U檢定的使用時機,再使用例子說明曼–惠特尼U檢定的假設檢定過程,最後示範利用SPSS執行曼–惠特尼U檢定的操作方法。若您只對文章某部分的內容感興趣,也可點選下方的連結,即可直接跳至您想瞭解的內容喔。

  • 曼–惠特尼U檢定的使用時機
  • 曼–惠特尼U檢定的假設檢定
    • 研究假設的擬定和顯著水準的選擇
    • 檢定統計量的計算
    • 決策規則的行使
  • 趨近於常態分配的曼–惠特尼U檢定
  • 運用SPSS執行曼–惠特尼U檢定

曼–惠特尼U檢定的使用時機

曼–惠特尼U檢定用來探討兩個獨立的群體或樣本是否有所不同,是類似於獨立樣本t檢定的一種統計檢定方法。當變項資料的測量尺度為次序尺度或獨立樣本t檢定的基本假設受到嚴重違反的時候,曼–惠特尼U檢定會是一種比獨立樣本t檢定更合適的統計檢定方法。

基本上,獨立樣本t檢定適用在測量尺度為等距或比率尺度的變項資料上,當資料為次序尺度的時候,該檢定方法就變得不合適。然而,曼–惠特尼U檢定可用在測量尺度至少為次序尺度的資料上,所以當資料為次序尺度時,曼–惠特尼U檢定是較好的選擇。

此外,獨立樣本t檢定是一種對樣本來自的母群體有特定要求的母數檢定,也就是樣本資料須滿足常態分配和變異數同質性(homogeneity of variance)兩個假設。雖然獨立樣本t檢定是一種穩健(robust)的檢定方法,當兩個基本假設受到輕度或中度違反時,檢定結果可能仍具可信度;但當假設受到嚴重違反的時候,獨立樣本t檢定便不太合適。

反觀曼–惠特尼U檢定,將兩個獨立群體或樣本裡的數值轉換成等級後再進行比較,為一種對樣本來自的母群體沒有什麼特定要求的無母數檢定。因此,當兩個群體或樣本來自的母群體沒有呈現常態分配,或變異不相等(\sigma_1^2 \neq \sigma_2^2)的情況下,曼–惠特尼U檢定可代替獨立樣本t檢定。

總結來說,曼–惠特尼U檢定適用在測量尺度至少為次序尺度的變項資料上,或兩個獨立群體或樣本來自的母群體沒有呈現常態分配或變異不相等的情況下。也就是說,當樣本資料嚴重違反獨立樣本t檢定的基本假設時,曼–惠特尼U檢定是更為合適的統計檢定方法。

瞭解了曼–惠特尼U檢定的使用時間點後,下面舉個例子來說明曼–惠特尼U檢定的假設檢定過程。

曼–惠特尼U檢定的假設檢定

假設一位保險公司的經理主張受過人際關係訓練的業務人員比較能夠給客戶留下好印象,進而招攬到較多的客戶。為了檢驗這個假設,她從新進的業務人員裡隨機抽取出20位,分配其中的10位至人際關係訓練課程,剩下的10位則沒有參與任何課程。課程結束後,20位業務人員皆參與一個客戶招攬的模擬面談,並接受評比。分數為1到20分,分數愈高代表表現愈好。

若參與課程組的名稱為TRAINED、沒有參與課程組的名稱為CONTROL,每一組各有10位業務人員,這20位業務人員的成績如下表。使用曼–惠特尼U檢定,\alpha=0.05_{\text{1 tail}},試問受過人際關係訓練的業務人員是否較能夠給客戶留下好印象?

data of Mann-Whitney U test example

假設檢定的過程包含研究假設的擬定、顯著水準的選擇、檢定統計量的計算和決策規則的行使等步驟,以下分別來討論。

研究假設的擬定和顯著水準的選擇

在這個研究裡,保險公司的經理主張受過人際關係訓練的業務人員比較能夠給客戶「留下好印象」,因為有指出方向,所以屬於有方向性的研究假設。研究假設可分為對立假設和虛無假設,在這個研究裡這兩個假設分別為:

  • 對立假設(H_1):和沒有參與過課程的業務人員相比較,參與過人際關係訓練課程的業務人員較能讓客戶留下好印象。
  • 虛無假設(H_0):和沒有參與過課程的業務人員相比較,參與過人際關係訓練課程的業務人員沒有較能讓客戶留下好印象。也就是說,參與過人際關係訓練課程的業務人員在客戶對自己的印象上沒有影響,或讓客戶留下不好的印象。

闡述完研究假設後,須選擇適當的顯著水準或稱為α水準,通常依據研究的性質、目的和可能帶來的後果來決定,習慣上為0.05或0.01。這個研究選擇了0.05的顯著水準,且因為研究假設具有方向性,所以採用單尾檢定,可用符號\alpha=0.05_{\text {1 tail}}來表示。

由於這個研究使用1到20分來評估業務人員的面談表現,也是該研究的依變項,所以變項資料屬於次序尺度。另外,這個研究要比較參與過人際關係訓練課程和沒有參與過訓練課程的業務人員在模擬面談上的表現,屬於兩個群體或樣本的比較。考量這兩個因素,曼–惠特尼U檢定是合適的統計檢定方法。

檢定統計量的計算

為了評估能否拒絕虛無假設,須先計算出曼–惠特尼U檢定的檢定統計量,U或U^\prime。不論是U或U^\prime,都是用來測量兩組樣本數值之間的分離程度。若自變項(這裡為人際關係訓練課程)沒有效果,兩組樣本數值間的分離程度較低,這也代表數值的等級平均分配在兩個樣本裡,U=U^\prime。

反之,若自變項具有效果,兩組樣本數值間的分離程度會比較高,也就是一個樣本裡的數值等級偏低,另一個樣本的數值等級則偏高。當分離程度愈高的時候,U會減少而U^\prime會增加;當完全分離的時候,U=0。對任一研究而言,U+U^\prime=n_1n_2(n_1指第1個群體或樣本的個數,n_2指第2個群體或樣本的個數)。

計算曼–惠特尼的檢定統計量包含3個步驟。首先,合併兩個樣本的分數,並將分數從小到大排序,給予最低分等級1、最高分等級20,如下表的Rank欄。如果有相同的分數,則給予平均等級。例如這個研究裡有2個10分,分別占據第10和11名,平均等級為(10+11) \div 2=10.5,所以分配等級10.5給這2個10分,下一個分數11則從等級12開始排序。

接著,加總每一個樣本裡的等級。參與課程組(TRAINED)的分數等級總和R_1為150.5,人數n_1為10;而沒有參與課程組(CONTROL)的分數等級總和R_2為59.5,人數n_2為10,如下表的最後一列所示。

computation of Mann-Whitney U test data

最後,利用兩個樣本各自的等級總和,計算出曼–惠特尼U檢定的檢定統計量U和U^\prime。U和U^\prime的計算公式分別如下:

    \begin{align*}U &= n_1 n_2 + \frac {n_1(n_1+1)}{2} - R_1 \\U^\prime &= n_1 n_2 + \frac {n_2(n_2+1)}{2} - R_2\end{align*}

將上表中已經計算出來的R_1、n_1、R_2和n_2帶入上面的兩個公式裡,計算過程如下:

    \begin{align*}U &= 10(10) + \frac {10(10+1)}{2} - 150.5 = 4.5 \\U^\prime &= 10(10) + \frac {10(10+1)}{2} - 59.5 = 95.5\end{align*}

計算結果得到U=4.5,而U^\prime = 95.5。若您讓第1個樣本為沒有參與課程組、第2個樣本為參與課程組,計算出來的U和U^\prime數值會和這裡計算出來的數值顛倒,但這不會影響最後的結果。原則上,讓計算出來的較小數值為U、較大的數值為U^\prime。

另外有一點須留意,若是有方向性的研究假設,須注意兩個樣本各自的等級總和是否和對立假設所擬定的方向一致,若不一致,則無須進行至下一步驟的決策規則行使。例如這個研究的對立假設為參與過課程的業務人員較能給客戶留下好印象,因此參與課程組的等級總和應高於沒有參與課程組;如果計算結果是沒有參與課程組的等級總和較高,則因和對立假設的方向不一致,即應保留虛無假設,無須再執行剩餘的假設檢定步驟。

決策規則的行使

計算出曼–惠特尼U檢定的檢定統計量U和U^\prime後,須和U和U^\prime的臨界值比較,才能決定是否拒絕虛無假設。曼–惠特尼U檢定的臨界值表在兩個樣本的各種不同樣本大小組合下都會有兩個臨界值,一個數值較小,另一個數值較大,決策規則為:

  • 如果U \leq 較小數值,拒絕虛無假設且接受對立假設。
  • 如果U^\prime \geq 較大數值,拒絕虛無假設且接受對立假設。

因為U和U^\prime都在測量相同的分離程度,因此上面的兩個決策規則裡,只需要使用其中的一個,習慣上評估U就好。

曼–惠特尼U檢定的臨界值表有4個表格,先依據事前選擇的α水準和檢定方向性的有無,決定使用哪一個表格;再根據兩個樣本各自的樣本個數,尋找臨界值。這個研究的α水準為0.05、單尾檢定,所以使用第4個表格。當n_1=10且n_2=10的時候,U臨界值為27、U^\prime臨界值為73。

critical value of U when both n1 and n2 equal 10

比較U檢定統計量和U臨界值,因為4.5<27,所以拒絕虛無假設,接受對立假設。曼–惠特尼U檢定的分析結果指出,曾參與過人際關係訓練課程的業務人員比沒有參與過訓練課程的業務人員較能讓客戶留下好印象。

趨近於常態分配的曼–惠特尼U檢定

曼–惠特尼U檢定的臨界值表只提供到兩個樣本各自的樣本個數最大到20而已,若超出這些樣本大小,曼–惠特尼U檢定的抽樣分配已漸趨近於常態分配。理論上,當兩個樣本的樣本個數差不多,且其中一個樣本的樣本個數大於20的時候,便可使用常態分配和z檢定統計量來評估兩個樣本的數值等級是否有顯著的不同。

當趨近於常態分配時,可以用下面的公式來計算曼–惠特尼U檢定的z檢定統計量:

    \[ z=\frac {U-\displaystyle \frac {n_1n_2}{2}}{\sqrt {\displaystyle \frac {n_1n_2(n_1+n_2+1)}{12}}} \]

若用上面的例子來練習,將已經計算出來的U、n_1和n_2帶入上面的公式裡,計算過程如下:

    \begin{align*}z &= \frac {4.5-\displaystyle \frac {10(10)}{2}}{\sqrt {\displaystyle \frac {10(10)(10+10+1)}{12}}} \\& \approx -3.439\end{align*}

計算結果得到z檢定統計量為-3.439。接著,查詢標準常態分配表,當α水準為0.05、單尾檢定,也就是下表的B欄為0.05時,z臨界值為(1.64+1.65) \div 2=1.645。

critical value of z when alpha equals 0.05

由於這個研究的對立假設為參與過訓練課程的業務人員較能夠給客戶留下「好」印象,單尾檢定的方向落在常態分配的右側尾端,所以取z檢定統計量的絕對值使其變成正數後,再和z臨界值相比較。

因為\left | -3.439 \right |>1.645,所以可拒絕虛無假設,接受對立假設。透過常態逼近的曼–惠特尼U檢定,分析結果顯示參與過人際關係訓練課程的業務人員比沒有參與過課程的業務人員更能讓客戶留下好印象。

運用SPSS執行曼–惠特尼U檢定

將上面研究範例的資料輸入至SPSS資料編輯器裡,除了變項分數(SCORE)之外,還要有一個組別(GROUP)的變項。組別變項的標籤值1為參與訓練課程組(TRAINED),標籤值2為沒有參與訓練課程組(CONTROL)。關於SPSS的資料輸入方法,請參考SPSS操作環境和資料輸入。

data for Mann-Whitney U test in spss

資料輸入完成後,點選功能表的分析 » 無母數檢定 » 舊式對話框 » 2個獨立樣本,帶出「兩個獨立樣本檢定」視窗。

spss menu of Mann-Whitney U test

在「兩個獨立樣本檢定」視窗裡,將SCORE移到檢定變數清單(T)方框中,GROUP移到分組變數(G)裡。接著,點選定義群組(D),在隨即出現的小視窗裡,群組1裡輸入1、群組2裡輸入2(也就是組別變項GROUP的兩個標籤值),完成後點選繼續(C)。

回到「兩個獨立樣本檢定」視窗後,檢定類型的長方框中勾選Mann-Whitney U(M)的選項,完成後點選視窗最下方的確定。

dialog box of Mann-Whitney U test in spss

經過上述的操作後,SPSS會輸出兩個表格。第1個表格為「等級」表,會顯示各個群組或樣本的個數和等級總和;第2個表格則是曼–惠特尼U檢定的「統計量」表,會顯示曼–惠特尼U檢定的U檢定統計量和獲得該檢定統計量的機率p值。。

從「等級」表可以看出,兩個樣本的樣本大小各為10,參與訓練課程組(TRAINED)的等級總和為150.5,沒有參與訓練課程組(CONTROL)的等級總和為59.5。這兩個等級總和與紙筆計算的結果相同,也就是R_1和R_2。

spss output of rank for Mann-Whitney U test

從「統計量」表可以看出,U檢定統計量為4.5,和上面紙筆計算的結果相同。SPSS使用常態逼近的曼–惠特尼U檢定來進行假設檢定,z檢定統計量為-3.441,而獲得該結果的機率p值(漸近顯著性)為0.001。由於SPSS顯示雙尾檢定的機率,所以須將該機率除以2才是單尾檢定的機率。

比較單尾檢定的機率(0.001 \div 2=0.0005)和事先選擇的α水準,因為0.0005<0.05,所以拒絕虛無假設,接受對立假設。常態逼近的曼–惠特尼U檢定的分析結果指出,參與過人際關係訓練課程的業務人員比沒有參與過訓練課程的業務人員更能讓客戶留下好印象。

spss output of statistic for Mann-Whitney U test

眼尖的您會發現SPSS輸出的z檢定統計量(-3.441)和上面紙筆計算的結果(-3.439)有些微差距,這是因為SPSS考量了資料裡的平分情況而調整了公式分母的標準差計算方法。若資料裡有平分的情形,也就是相同等級的存在,SPSS和多數的統計分析軟體會採用下列的公式計算z檢定統計量:

    \[ z=\frac {U-\displaystyle \frac {n_1n_2}{2}}{\sqrt {\displaystyle \frac {n_1n_2}{12} \left [ (n_1+n_2+1)-\frac {\sum_{i=1}^g (t_i^3-t_i)}{(n_1+n_2)(n_1+n_2-1)} \right ] } }\]

在上面的公式裡,g指資料裡平分的組數,t_i指第i組裡平分的數值數目。以這裡的研究範例來看,平分的組數為1組,而該組裡平分的數值有2個,所以\sum_{i=1}^g (t_i^3-t_i)的計算過程為:

    \[ \sum_{i=1}^g (t_i^3-t_i)=2^3-2=6 \]

將上面的計算結果帶入分母經過調整的z檢定統計量公式裡,計算過程如下:

    \begin{align*}z &= \frac {4.5-\displaystyle \frac {10(10)}{2}}{\sqrt {\displaystyle \frac {10(10)}{12} \left [ (10+10+1)-\frac {6}{(10+10)(10+10-1)} \right ] }} \\&= \frac {4.5-50}{\sqrt {\displaystyle \frac {100}{12} \left [ 21-\frac {6}{20(19)} \right ] }} \\&\approx -3.441\end{align*}

利用分母經過調整的公式計算出來的z檢定統計量為-3.441,這就和SPSS輸出的結果相同。若資料裡只有少數幾組平分的組數,使用未經調整和經過調整的公式所計算出來的結果不會相差太多;但若平分的組數較多的話,使用分母經過調整的公式會得到較正確的結果。

總結來說,曼–惠特尼U檢定利用了資料裡滿多的量化訊息,且是獨立樣本t檢定的一種替代檢定,可說是一種強力的統計檢定方法。不過,曼–惠特尼U檢定畢竟只用到變項資料的次序屬性,不像獨立樣本t檢定利用變項資料的等距或比率屬性,因此沒有獨立樣本t檢定那麼地強大。

以上為本篇文章對曼–惠特尼U檢定的介紹,希望透過本篇文章,您瞭解了曼–惠特尼U檢定的使用時機和假設檢定過程,也學會了利用SPSS執行曼–惠特尼U檢定的操作方法。

如果您喜歡本篇文章,請將本網站加入書籤,作為您的學習工具,並持續回訪本網站喔!另外,也歡迎您按讚和追蹤我們的Facebook和Twitter專頁喲!

標籤: SPSS α水準 單尾檢定 常態分配 常態逼近 曼–惠特尼U檢定 有方向性假設 檢定統計量 次序尺度 母數檢定 測量尺度 無母數檢定 獨立樣本t檢定 研究假設 穩健的檢定 變異數同質性 顯著水準

文章導覽

❮ Previous Post: 如何使用Excel一次取得描述性統計量
Next Post: F分配的定義和F分配臨界值表的解讀 ❯

您可能也會喜歡

featured image of Kruskal-Wallis test
Kruskal-Wallis檢定的假設檢定
featured image of Dunn's test
Dunn檢定:Kruskal-Wallis檢定的事後成對比較
featured image of chi-square post hoc analysis
卡方獨立性檢定的事後分析:標準化殘差和調整後殘差的運用
featured image of hypothesis test of phi coefficient
phi係數的假設檢定

關於 Dr. Fish

profile picture uploaded on July 5, 2024

喜歡求知和分析,所以一路讀到博士。也喜歡旅行、攝影、料理、看日劇,愛把複雜的思想和事物變簡單,是個有點宅也有點跳TONE的人。

支持 Dr. Fish

本網站經營和文章撰寫皆由Dr. Fish一人完成,投注許多時間和費用。若您喜歡任何一篇文章或覺得文章對您有幫助,請給我一些支持,買杯珍奶給我吧!您的支持不但能給我更多撰寫文章的動力,也可以讓這網站的經營持續下去喔!謝謝!😄

boba-icon
請我喝珍奶!
featured image of spss environment and data entry

下載專區

標準常態分配表

Student's t 分配臨界值表

F分配臨界值表

卡方分配臨界值表

斯皮爾曼等級相關係數臨界值表

Wilcoxon配對符號等級檢定臨界值表

曼–惠特尼U檢定臨界值表

Student化全距分配臨界值表

Dunnett檢定臨界值表(雙尾檢定)

單一樣本z檢定的SPSS語法

關於Dr. Fish漫游社會統計

本網站使用簡單易懂的文字解說社會統計,並示範軟體操作,同時有課後隨筆的分享,希望讀者在學習之餘,也能感受到生活的樂趣。

網站政策

著作權聲明 Copyright Notice
隱私權政策 Privacy Policy
免責聲明  Disclaimer

追蹤我們

Facebook
X(Twitter)

Copyright © 2021-2025 Dr. Fish 漫游社會統計. All rights reserved.