獨立樣本z檢定(independent samples z-test)是用來比較兩個不同群組的平均數是否有顯著差異的一種統計檢定方法,例如生理女性和生理男性在英文成績上的比較、參與學校社團活動和沒有參與學校社團活動的學生在偏差行為上的比較。但是,獨立樣本z檢定須在兩群組的母群體變異數皆已知的情況下才可使用,所以實際上幾乎不會用到。
雖然實際研究過程不太可能使用到獨立樣本z檢定,但這種統計檢定卻是瞭解獨立樣本t檢定的一個重要概念,所以本篇文章將簡單地介紹獨立樣本的設計,再說明獨立樣本的研究假設、樣本平均數差異的抽樣分配和獨立樣本z檢定的使用。
獨立樣本的研究設計
獨立樣本的研究設計是指一個研究包含了兩種以上的群組或樣本,這些群組或樣本可能為原本即存在的團體或實驗分配的團體,而利用這兩種團體的研究設計分別稱為原樣團體(intact group)設計和真實驗(true experiment)設計,下表為兩種研究設計的比較。
團體來源 | 自變項本質 | 操縱與否 | 例子 | |
---|---|---|---|---|
獨立樣本的設計 | 原樣團體 | 受試者變項 | 不可操縱 | 生理性別、種族、年齡 | 真實驗 | 受控變項 | 可以操縱 | 實驗組和對照組 |
原樣團體和真實驗設計的差別在於自變項(independent variable)的本質或種類,而自變項是研究人員用來描述或解釋研究結果的一種變項,又可區分為受試者變項(subject variable)和受控變項(manipulated variable)。
受試者變項是指研究人員無法操縱的情境,例如研究參與者的生理性別、年齡、智商或經濟收入。運用受試者變項的獨立樣本設計可以探討群組之間是否有差異,也可以估計差異的程度,但無法做出因果關係的推論。
舉例來說,有一研究發現高中女生和男生在英文成績上有顯著的差異。這研究結果僅指出生理女性的英文成績和生理男性的英文成績有明顯的不同,並沒有告訴我們高中生的生理性別「導致」英文成績的差異,因為生理性別可能只是成績差異的其中一個影響因素,或是其他的因素造成成績的差異。
相反地,受控變項是指研究人員可以直接操縱的情境,而且可隨機分配研究參與者至任何一種情境,例如實驗組和對照組。運用受控變項的獨立樣本設計,當研究人員隨機分配研究參與者至不同的情境時,即是創造出不同的假設母體(hypothetical population)。若研究結果指出不同情境之間存在很大的差異,研究人員就可假設樣本來自的不同母群體之間也存在著差異,因此可做出受控變項導致了該差異的結論。
基本上,獨立樣本的研究設計會包含至少兩種情境,例如生理女性和生理男性、實驗組和對照組。進行兩種情境的資料分析時,可使用獨立樣本z檢定或獨立樣本t檢定;若是超過兩種情境的資料分析,就須使用較為複雜的變異數分析(analysis of variance)。
相較於單一樣本的研究設計(相關的假設檢定為單一樣本z檢定和單一樣本t檢定),獨立樣本的研究設計有下列3點優勢:
- 無須知道母群體平均數μ:單一樣本的研究設計須明確指出母群體的平均數,才能用來和樣本平均數比較,但大多數的時候,母群體平均數的資訊很難取得。相對地,獨立樣本的研究設計無須知道母群體平均數即可進行假設檢定。
- 無須考量母群體平均數μ的正確性:這一點為上一點的延伸,單一樣本的研究設計須使用母群體平均數才能進行假設檢定,不過該數值的正確性可能存有疑義,例如這數值可能為好幾年前的資訊、數值的取得過程可能不客觀等。相對地,獨立樣本的研究設計無須使用到母群體平均數,所以不會遇到母群體平均數是否正確的問題。
- 可做因果關係的推論:單一樣本的研究設計在於比較一個樣本平均數是否顯著地不同於一個母群體平均數,研究結果僅能顯示兩者是否存在差異,無法做出任何因果關係的推論。相對地,若是使用真實驗的獨立樣本研究設計,將研究參與者隨機分配至不同的實驗情境,可藉由不同情境之間的差異程度做出受控變項是否導致最終差異的結論。
從上面幾點可以知道在研究設計上,獨立樣本的設計確實優於單一樣本的設計。此外,在假設檢定的過程中,獨立樣本的研究假設、抽樣分配和檢定統計量的計算也不同於單一樣本,下面先探討研究假設的寫法。
獨立樣本的研究假設
假設在只有兩個群組的獨立樣本裡,第1個樣本的分數是來自於第1個常態分配母群體的一組隨機樣本,讓第1個假設母體的平均數為、標準差為。同樣地,第2個樣本的分數是來自於第2個常態分配母群體裡的一組隨機樣本,讓第2個假設母體的平均數為、標準差為。
研究假設可分為對立假設()和虛無假設(),並可再依據方向的有無劃分為無方向性和有方向性的假設,以下將分別探討獨立樣本設計裡無方向性和有方向性研究假設的寫法。
無方向性的研究假設
若研究沒有明確指出自變項效果或作用的方向,就是無方向性的研究假設,這時對立假設和虛無假設的寫法分別如下:
- 對立假設():第1個樣本的平均數不同於第2個樣本的平均數,也就是樣本是來自於母群體的隨機樣本。
- 虛無假設():第1個樣本的平均數和第2個樣本的平均數相同,也就是樣本是來自於母群體的隨機樣本。
有方向性的研究假設
若研究明確地指出自變項效果或作用的方向,則為有方向性的研究假設,可能會有或的兩種情況,須分開來看。
第1種:當μ1 > μ2時
- 對立假設():第1個樣本的平均數大於第2個樣本的平均數,也就是樣本是來自於母群體的隨機樣本。
- 虛無假設():第1個樣本的平均數沒有大於第2個樣本的平均數,也就是樣本是來自於母群體的隨機樣本。
第2種:當μ1 < μ2時
- 對立假設():第1個樣本的平均數小於第2個樣本的平均數,也就是樣本是來自於母群體的隨機樣本。
- 虛無假設():第1個樣本的平均數沒有小於第2個樣本的平均數,也就是樣本是來自於母群體的隨機樣本。
獨立樣本的假設檢定有一個前提假設,即第1個母群體的變異和第2個母群體的變異相同,也就是,稱為變異數同質性(homogeneity of variance)假設。這假設的涵義在於,當自變項確實有效果或作用時,該效果會影響到群組裡的每一個人,因此只會改變母群體的平均數,但不會改變母群體的標準差或變異。
樣本平均數差異的抽樣分配
兩個情境的獨立樣本的假設檢定使用樣本平均數差異的抽樣分配(sampling distribution of the difference between sample means),是指從平均數為、變異數為的第1個母群體中隨機抽取出樣本大小為的所有可能樣本;同樣地,從平均數為、變異數為的第2個母群體中隨機抽取出樣本大小為的所有可能樣本。
抽取出所有可能的樣本後,計算出每一個樣本的平均數,和,再計算出所有可能配對的兩平均數之差值()以及獲得各個差值的機率,藉此獲得的機率分配型態即為樣本大小為和的樣本平均數差異的抽樣分配。重複這個過程至不同的樣本大小和母群體分數,就能建構出樣本平均數差異的抽樣分配。
在樣本大小為和的情況下,從所有可能配對的兩平均數之差值()裡,可以求出這些差值的平均數和標準差,這個平均數和標準差就是樣本平均數差異抽樣分配的平均數和標準差。樣本平均數差異的抽樣分配有以下3點特徵:
- 若樣本來自的母群體呈現常態分配,樣本平均數差異的抽樣分配也會呈現常態分配。
- :樣本平均數差異抽樣分配的平均數等於兩個母群體平均數的差值。
- :樣本平均數差異抽樣分配的標準差,也稱為樣本平均數差異的標準誤(standard error of the difference between sample means),等於樣本大小為的平均數抽樣分配之變異數加上樣本大小為的平均數抽樣分配之變異數後開根號。
由於樣本平均數差異的抽樣分配呈現常態分配,所以獨立樣本z檢定的假設檢定可以使用z檢定統計量和z分配(常態分配),接下來探討獨立樣本z檢定的使用。
獨立樣本z檢定的使用
獨立樣本z檢定是用來比較兩個樣本的平均數是否有顯著不同的一種統計檢定方法,而兩個樣本皆須來自於常態分配的母群體。進行假設檢定時,須使用樣本平均數差異的抽樣分配。
從上面樣本平均數差異抽樣分配的第1點特徵可以知道,若兩個樣本來自的母群體呈現常態分配,樣本平均數差異的抽樣分配也會呈現常態分配,所以獨立樣本z檢定的假設檢定使用常態分配和z檢定統計量。獨立樣本z檢定的z檢定統計量的計算公式如下:
(1)
再將上面提到的樣本平均數差異抽樣分配的第2和第3點特徵帶入公式(1)中,z檢定統計量的公式會變成:
(2)
利用公式(2)計算得到z檢定統計量的數值後,即可查詢標準常態分配表,找到獲得該檢定統計量的機率(值),再運用決策規則,比較值和事先選擇好的顯著水準(水準),評估是否能夠拒絕虛無假設。
然而,從上面的公式(2)可以看出,兩個母群體的變異數必須是在已知的情況下,才可計算出z檢定統計量。由於大多數的時候,無法知道母群體變異數,所以在比較兩個平均數的獨立樣本研究裡,幾乎不會用到獨立樣本z檢定,而是使用以樣本統計量推估母體參數的獨立樣本t檢定。關於獨立樣本t檢定的詳細介紹,請參考獨立樣本t檢定的假設檢定。
以上為本篇文章對獨立樣本z檢定概念的介紹,希望透過本篇文章,您瞭解了獨立樣本的研究設計、獨立樣本的研究假設寫法、樣本平均數差異抽樣分配的意義和獨立樣本z檢定的使用時機。
若您喜歡本篇文章,請將本網站加入書籤,作為您的學習資源,並持續回訪本網站喔!另外,您也可以在Facebook和Twitter上找到我們喲!