實證研究的一個重要目的是隨機抽取樣本,並透過資料的蒐集去計算出樣本的數值,將其作為母體參數的估計值(estimate),例如平均數、標準差。以平均數為例,若從同一母群體抽取樣本數目相同的不同樣本,由於抽樣變異(sampling variation),將使得有些樣本的平均數靠近母群體的平均數,有些則遠離母群體的平均數,而藉由標準誤(standard error)可得知這些樣本平均數的變異程度。
因為無從得知哪一個樣本的平均數才是真正的母群體平均數,所以可透過標準誤,進一步地計算出涵蓋母群體平均數的上下界限,這個上下界限就稱為信賴界限(confidence limits),而其所涵蓋的範圍即為信賴區間(confidence interval)。
若知道母群體的標準差,只要透過標準常態分配表尋找常態曲線下涵蓋信心程度的兩個標準分數,即可簡單地計算出信賴區間。以下將先介紹信賴區間的意義,再說明母群體已知時信賴區間的計算方法和通用公式,最後再舉一例子示範計算過程。
信賴區間的意義
信賴區間是指可能包含母群體數值的數值範圍,屬於區間估計值(interval estimate)。不同於用單一數值去估計母群體數值的點估計值(point estimate),例如用樣本平均數估計母群體平均數;區間估計值則是建立最有可能涵蓋母群體數值的上、下界限(即信賴界限),而這個上、下界限包含的範圍就是信賴區間。
為了讓信賴區間能夠傳達有用的訊息,統計學家使用信心程度或機率來建構信賴區間。換句話說,信賴區間告訴我們有多少的機率或信心程度,該區間包含母群體的真實數值。原則上,最常使用95%或99%的信賴區間。95%信賴區間的解釋為,該區間包含母群體真實數值的機率為0.95或信心程度為95%,99%信賴區間也可做類似的解釋。
若換個方式來思考95%信賴區間,也可說是從母群體隨機抽取出100個樣本數目相同的樣本,然後計算出每一個樣本的平均數(或任何欲求得的統計量)和信賴區間,則其中95個樣本的信賴區間會包含母群體的真實平均數。
瞭解了信賴區間的意義後,下面以平均數為例子來介紹95%和99%信賴區間的計算、信賴區間的通用公式,並舉一實例進行演算。
95%信賴區間的計算
這裡用平均數為例子,說明信賴區間的計算,先探討95%信賴區間的計算。進行95%信賴區間的計算前,須先找出涵蓋95%平均數的上下界限。根據中央極限定理(central limit theorem),當樣本數愈大時(),平均數抽樣分配會愈趨近於常態分配。此時可透過標準常態分配表,查詢涵蓋常態曲線下中間95%面積的標準分數(或稱為z分數)之數值。
從上表可看出常態曲線下中間95%的面積是介於標準分數1.96和-1.96之間,再將這兩個標準分數還原至樣本中相對應的原始分數,就可找到信賴界限。標準分數的詳細介紹和其在常態曲線下的運用,請參考標準分數和常態曲線下面積之應用。
回顧平均數抽樣分配的概念,是從母群體中隨機抽取樣本數目為的所有可能樣本,計算出每一個樣本的平均數和獲得該平均數的機率,最後呈現出各個平均數的機率分布狀況。
若要求得每一個樣本的標準分數,須把一個樣本的平均數減去平均數抽樣分配的平均數,再除以平均數抽樣分配的標準差,也就是標準誤。公式如下:
因為平均數抽樣分配具有➀和➁等特性,所以上面的公式可變成:
(1)
透過上面標準常態分配表的查詢已知道常態曲線下中間95%的面積是介於標準分數1.96和-1.96之間,將帶入公式(1)裡:
即為95%信賴區間的上信賴限,而為下信賴限。也就是說,母群體平均數會介於這兩個界限間:
(2)
上面的不等式即為95%的信賴區間,但運用這個不等式的前提為母群體的標準差是已知的情況。接下來,利用上面提及的概念來探討99%信賴區間的計算。
99%信賴區間的計算
同樣以平均數為例子,說明99%信賴區間的計算。首先,找出常態曲線下涵蓋99%平均數的上下界限。透過標準常態分配表的查詢,找到常態曲線下中間99%的面積是介於標準分數2.575和-2.575之間。
接著,將標準分數2.575和-2.575帶入上面的公式(1)裡:
即為99%信賴區間的上信賴限,而為下信賴限。也就是說,母群體平均數會介於這兩個界限間:
(3)
上面即為99%信賴區間的不等式,但也必須是在母群體標準差已知的情況下才可使用。經過上面95%和99%信賴區間計算方法的說明,可發現信賴區間的計算有一定的模式可循,因此能利用一個通用的公式來計算各種信心程度的信賴區間。
信賴區間的通用公式
透過上述95%和99%信賴區間的建構,可以知道若母群體標準差已知,且樣本數夠大,就能夠利用標準常態分配表找到常態曲線下涵蓋信心程度的兩個標準分數之方式,計算任何信心程度的信賴區間。任何信賴區間的下信賴限和上信賴限的通用公式如下:
(4)
公式(4)裡,指信賴區間的機率值。例如95%的信賴區間代表機率為0.95,即是要找到落在常態曲線左、右兩側尾端的面積各為的兩個標準分數。查詢標準常態分配表中「超出標準分數z之外的面積」為0.025的欄位,找到標準分數的值為1.96,由於常態分配為對稱的曲線,所以標準分數有兩個,分別為1.96和-1.96。
下信賴限為樣本平均數減去標準分數的數值乘以標準誤(母群體的標準差除以),上信賴限則為樣本平均數加上標準分數的數值乘以標準誤,而母群體的平均數就會落在上、下信賴限之間。上、下信賴限和母群體平均數之間的關係可用下面的不等式來呈現:
由此可見,有了上、下信賴限的通用公式後,即可簡單地計算各種信心程度的信賴區間。下面舉個例子來示範95%和99%信賴區間的計算過程。
信賴區間的實例演算
假設一位英文老師想瞭解高三學生的平均英文能力,他隨機抽取出36位學生並給予英文能力測驗,得到平均成績65.6分。若全國高三學生的英文能力測驗成績呈現常態分配,且已知標準差為12.81,試問全國高三生的平均英文能力測驗成績的95%和99%信賴區間為何?
在這裡例子裡,樣本平均數為65.6、母群體標準差為12.81、樣本數目為36,利用這些資訊來分別計算95%和99%信賴區間。
95%信賴區間
利用上面的不等式(2),當、、時,全國高三生的平均英文能力測驗的95%信賴區間計算如下:
根據計算的結果,全國高三生的平均英文能力測驗成績會落在61.42分和69.78分之間。更正確地說,有0.95的機率或95%的信心程度,全國高三生的平均英文能力測驗成績會落在61.42分和69.78分之間。
99%信賴區間
利用上面的不等式(3),當、、時,全國高三生的平均英文能力測驗的99%信賴區間計算如下:
計算結果顯示,全國高三生的平均英文能力測驗成績會落在61.10分和71.10分之間。更正確地說,有0.99的機率或99%的信心程度,全國高三生的平均英文能力測驗成績會落在60.10分和71.10分之間。
從實例的計算結果可發現,當信心程度愈高時,信賴區間的數值範圍也愈廣。這裡要特別注意一點,95%的信賴區間代表著5%的錯誤估計,99%的信賴區間則代表著1%的錯誤估計。因為有錯誤估計存在的機率,所以無法100%斷言我們計算出來的信賴區間一定會包含母群體的平均數。
既然有錯誤估計的可能性,解釋時就須明確地指出信賴區間的信心程度。例如95%的信賴區間,解釋時即須強調母群體平均數(或其他的母體參數)落於該區間的機率為0.95,讓人知道有0.05的錯誤機率存在。
撰寫研究報告時,若採用社會或行為科學領域很常用的美國心理學會論文格式(Publication Manual of the American Psychological Association),簡稱為APA格式,上面例子的95%信賴區間結果的撰寫格式為95% CI [61.42, 69.78],而99%信賴區間結果的撰寫格式為99% CI [60.10, 71.10],中括弧裡先寫下信賴限再寫上信賴限。
本文所提到的信賴區間必須是在母群體標準差已知的情況下才能夠計算,但很多時候並無法得知母群體標準差。另外,當樣本數小於30時,並不適合使用常態分配。因此,在母群體標準差未知或樣本數小於30時,須改用t分配來計算信賴區間,請參考小樣本或σ未知的信賴區間之計算。
以上為本篇文章對於母群體標準差已知時信賴區間的意義和計算的介紹,希望透過本篇文章,您瞭解了信賴區間的意義、母群體標準差已知時信賴區間的計算方法。
若您喜歡本篇文章,請將本網站加入書籤,當作您的學習資源,並持續回訪本網站喔!另外,您也可以在Facebook和Twitter上找到我們喲!