符號檢定(sign test)是一種很簡單的統計檢定方法,可以用來比較兩個成對樣本(也稱為相依樣本)是否有顯著的差異存在。由於符號檢定不要求母群體具備特定的分布型態或參數,所以屬於無母數檢定。
符號檢定和關聯樣本t檢定同樣用來比較兩個成對的樣本是否顯著地不同,不過不像關聯樣本t檢定使用了各個配對的實際差值分數來進行分析,符號檢定僅考量了各個配對數值的增加或減少。因此,相較於關聯樣本t檢定,符號檢定是一種較不具敏感度的檢定方法。
雖然符號檢定不是強力的統計檢定方法,但很容易理解。此外,進行假設檢定時,可直接利用二項分配來計算出獲得某特定結果的機率,而不需要透過分配表尋找臨界值後再決定是否拒絕虛無假設,操作上可說是很簡單。基於這些原因,符號檢定是值得瞭解的一種統計檢定方法。
由於本篇文章的內容牽涉到假設檢定,若您不知道或不熟悉假設檢定的過程,建議先閱讀假設檢定的步驟和範例,將有助於以下內容的理解。因為符號檢定使用二項分配,所以我們先回顧一下二項分配的定義和使用後,再探討符號檢定的假設檢定過程,最後示範運用SPSS執行符號檢定的操作方法。
二項分配的定義
二項分配(binomial distribution)是呈現只有兩種互斥結果的一連串獨立試驗所出現的所有不同結果的機率分配,而這種只有兩種互斥結果的試驗稱為伯努利試驗(Bernoulli trial)。換句話說,藉由二項分配,可以知道在一連串的個試驗裡,會出現的各種可能結果以及獲得各種結果的機率。
最常見的伯努利試驗為擲硬幣,而二項分配可以呈現次試驗裡出現各種不同頭像次數的機率。舉例來說,若正面頭像為H、反面幣值為T,擲一枚硬幣3次會出現的所有結果如下表:
結果 | 第1次 | 第2次 | 第3次 | 頭像次數 |
---|---|---|---|---|
1 | H | H | H | 3 |
2 | H | H | T | 2 |
3 | H | T | H | |
4 | T | H | H | |
5 | H | T | T | 1 |
6 | T | H | T | |
7 | T | T | H | |
8 | T | T | T | 0 |
從上表的結果可以計算出擲一枚硬幣3次,獲得0次、1次、2次和3次頭像的機率。讓代表獲得次頭像的機率,則獲得各種不同頭像次數的機率分別為:
從上面的計算結果可以知道,擲一枚硬幣3次,得到0次或3次頭像的機率為0.125;而得到1次或2次頭像的機率比較高,為0.375。
若將出現0次、1次、2次和3次頭像的機率相加,,得到的機率總和為1,代表這4種結果為擲一枚硬幣3次會得到的所有可能結果。透過這樣的過程,得到0次、1次、2次和3次頭像的機率就是擲一枚硬幣3次的二項分配。
以上是二項分配的簡單回顧,更詳細的二項分配介紹,請參考二項分配的定義和分布型態。
利用二項分配計算特定結果的機率
藉由二項分配,除了能夠知道在次試驗裡會出現的所有可能結果和獲得各種不同結果的機率外,也可以計算出獲得特定結果的機率。舉例來說,若擲一枚硬幣3次,得到至少2次頭像的機率是多少呢?
得到至少2次頭像的機率指得到2次或3次頭像的機率,運用機率加法規則(addition rule),將得到2次頭像的機率加上得到3次頭像的機率即可。從上面二項分配的定義裡的計算結果已經知道獲得2次和3次頭像的機率,藉此可計算出得到至少2次頭像的機率為:
上面的計算結果告訴我們,擲一枚硬幣3次,有一半的機率會得到至少2次的頭像。不過,當試驗次數變多的時候,逐一寫出每種可能的結果再計算機率的方式已變得費時且不切實際,所以可改用下面的二項分配公式來計算:
(1)
上面公式(1)牽涉到階乘的計算,如果您不清楚階乘的意義和計算方法,可以參考社會統計常用的基本數學符號和運算裡的階乘說明。假設擲一枚硬幣10次,且得到正面頭像()或反面幣值()的機率皆為0.5,利用上面的公式(1),試問獲得至少8次頭像的機率是多少呢?
獲得至少8次頭像的機率指獲得8次和大於8次的機率,所以是獲得8次、9次或10次頭像的機率。讓指得到次頭像的機率,、,運用公式(1)先計算出得到8次、9次和10次頭像的機率:
接著,將已經計算出來的8次、9次和10次頭像的機率相加,即為獲得至少8次頭像的機率,計算過程如下:
從計算結果可以發現,擲一枚硬幣10次,且出現正面或反面的機率皆為0.5時,獲得至少8次頭像的機率為0.0547,機率並不高。
因此,使用上面二項分配的公式,能夠簡單地計算出次試驗裡獲得特定結果的機率。瞭解了如何利用二項分配求得特定結果的機率後,接著就可探討符號檢定的假設檢定過程。
符號檢定的假設檢定
符號檢定可用來比較兩個成對樣本是否存在著顯著的差異,是運用二項分配來執行假設檢定的一種很簡單的統計檢定方法。雖然符號檢定很簡單,卻也相當實用,下面舉個例子來說明其假設檢定的過程。
假設有一位社會工作者想探討家庭暴力防治課程是否會影響學員的知識程度,於是他設計了一份家庭暴力相關的知識問卷,共20題選擇題。他在課程開始前請12位參與學員填寫該份問卷,課程結束後再請學員填寫一次相同的問卷,這12位學員的前測(pre-test)與後測(post-test)成績如下表。使用顯著水準(α水準)0.05、雙尾檢定,試問家庭暴力防治課程是否影響了學員對該議題的知識程度?
這位社會工作者想瞭解家庭暴力防治課程是否影響學員的知識程度,可視家庭暴力防治課程為自變項,而知識程度為依變項。由於他沒有指出影響的方向,所以屬於無方向性的研究假設。研究假設分為對立假設和虛無假設,在這個範例裡這兩個假設分別為:
- 對立假設():家庭暴力防治課程對學員的知識程度有影響。
- 虛無假設():家庭暴力防治課程對學員的知識程度沒有影響。
研究假設擬定好後,須考量研究的性質、目的和可能帶來的後果,選擇適當的顯著水準或稱為α水準,習慣上為0.05或0.01。在這個範例裡,社會工作者選擇了0.05的顯著水準。此外,因為研究假設不具有方向性,所以這裡採用雙尾檢定,而不是有方向性研究假設的單尾檢定。
因為符號檢定只考量成對數值的增加或減少,而不在乎成對數值實際上的差值,所以若後測的成績高於前測就給一個正號(+),後測的成績低於前測則給一個負號(−),這也是符號檢定名稱的由來。下表顯示10位學員的成績改變狀況:
從上表可以看出,12位學員裡,10位學員的後測成績高於前測,也就是有10個正號。若家庭暴力防治課程不具有任何影響的話(暫時撇開其他可能的影響因素),學員的測驗成績應該不會產生任何系統性的變化。換句話說,在只有機會的影響下,後測成績高於前測(正號)的機率和後測成績低於前測(負號)的機率應該是相同的,各為0.5。
因此,這個範例可被視為、的二項分配,要計算出在虛無假設為真實的情況下,12次試驗裡獲得至少10個正號的機率,也就是10個、11個和12個正號的機率。首先,利用上面的公式(1),計算出12次試驗裡得到10個、11個和12個正號的機率:
接著,將上面計算出來的10個、11個和12個正號的機率相加,即為12次試驗裡得到至少10個正號的機率:
因為這範例為雙尾檢定,且在二項分配的意義和分布型態裡提到當答對或成功的機率為0.5時,二項分配會呈現對稱的分布型態,所以除了10個、11個和12個正號的機率外,還要考量到0個、1個和2個正號的機率。
透過上面的計算過程,已經知道12次試驗裡得到至少10個正號的機率為0.0192,不過這是單尾的機率。為了求得雙尾檢定的機率,須將已經計算出來的單尾機率乘以2才可以。
最後,將計算出來的機率(值)0.0384和事先選擇好的顯著水準(α水準)0.05相比較,運用機率比較的決策規則,只要0.0384等於或小於α水準,即可拒絕虛無假設,接受對立假設。
因為,所以我們可以拒絕虛無假設,接受對立假設。分析結果指出,家庭暴力防治課程會影響學員的知識程度,且從資料可以看出,家庭暴力防治課程實際上增加了學員的知識程度。
從上面的說明可以發現符號檢定的假設檢定過程並不困難,無須查詢任何表格去尋找臨界值,若樣本數不大,可直接計算出研究結果的機率。但若樣本數較大的時候,紙筆計算可能變得困難,此時可運用SPSS來執行符號檢定,以下就來示範操作步驟。
運用SPSS執行符號檢定
將上面範例裡的資料輸入至SPSS資料編輯器裡,點選功能表的分析 » 無母數檢定 » 舊式對話框 » 2個相關樣本,帶出「兩個相關樣本檢定」視窗。關於SPSS的資料輸入方法,請參考SPSS操作環境和資料輸入。
在「兩個相關樣本檢定」視窗裡,將左邊長框裡的pretest和posttest兩個變項移到右邊檢定配對(T)裡變數1和變數2的位置,然後在檢定類型方框裡勾選符號(S),完成後按下最下方的確定。
經過上述的步驟,SPSS會輸出兩個表格,第1個表格為次數分配表,第2個表格為檢定統計量。次數分配表顯示12組配對分數裡,後測分數低於前測、後測分數高於前測、後測分數等於前測的數目,也就是下表裡Negative Differences、Positive Differences和Ties的數值。從下表可看出,範例裡後測低於前測有2組,後測高於前測則有10組,且沒有同分的情況存在。
第2個表格顯示利用二項分配計算出來的雙尾檢定結果的機率,也就是在12次試驗裡得到0個、1個、2個、10個、11個和12個正數(後測分數高於前測)的機率。從下表可以知道,這個機率為0.039,和上面使用紙筆計算的結果相同(小數點後的些微差異是因為進位誤差所導致)。
透過機率比較的決策規則,比較值0.039和事先設定的α水準0.05,因為,所以拒絕虛無假設,接受對立假設。符號檢定的分析結果指出,家庭暴力防治課程會影響學員的知識程度。
若研究假設具有方向性,則為單尾檢定,此時使用SPSS進行分析時,須將檢定統計量表格裡的雙尾機率除以2才是最後應得的機率。最後,再用該機率和α水準比較,決定是否拒絕虛無假設。
雖然符號檢定是種很簡單也很容易執行的統計檢定方法,但它畢竟沒有考量到配對數值的實質上分數差異,所以較不具敏感度,換句話說,可能較不容易拒絕一個錯誤的虛無假設。因此,若樣本來自的母群體呈現常態分配,或配對數值的組數等於或大於30的話,關聯樣本t檢定會是個較佳的統計檢定選擇。
如果樣本數真地很小或資料無法滿足關聯樣本t檢定的假設,且2樣本為成對或相依樣本時,可改使用Wilcoxon配對符號等級檢定,除了配對數值的增加或減少外,這檢定也考量了配對數值的實際差異大小。Wilcoxon配對符號等級檢定雖然沒有關聯樣本t檢定來得強大,但比符號檢定更具敏感度。若您想更進一步瞭解2個相依樣本比較時可以運用的統計檢定,請參考兩個相依樣本比較的統計檢定方法。
以上為本篇文章對符號檢定的介紹,希望透過本篇文章,您知道了如何利用二項分配計算特定結果的機率和執行假設檢定,也學會了如何運用SPSS執行符號檢定。若您喜歡本篇文章,請將本網站加入書籤,並持續回訪本網站喔!另外,也歡迎您追蹤本網頁的Facebook和/或X(Twitter)專頁喲!
如果您覺得本篇文章對您有幫助,歡迎買杯珍奶給Dr. Fish!小小珍奶,大大鼓勵,您的支持將給Dr. Fish更多撰寫優質文章的動力喔!