信賴區間(confidence interval)指可能包含母群體參數的一個數值範圍,並指出落在這個範圍的機率,習慣上為0.95或0.99,屬於一種「區間估計」。相對於「區間估計」的概念為「點估計」,是用單一數值來估計母群體參數的一種方法,例如用樣本平均數來估計母群體平均數。
當樣本數等於或大於30且母群體標準差(σ)已知的時候,可以利用常態分配和標準分數來計算信賴區間;當樣本數小於30或母群體標準差未知的時候,則可利用t分配和t值來計算信賴區間。關於信賴區間的詳細介紹,請參考信賴區間的意義和計算(σ已知)以及小樣本或σ未知的信賴區間之計算。
原本 Excel 用來計算信賴區間的函數為 CONFIDENCE 函數,但為了讓使用者獲得更正確的結果,這個函數已經被 CONFIDENCE.NORM 函數和 CONFIDENCE.T 函數取代,前者適用在樣本數較大且母群體標準差已知的時候,而後者適用在樣本數較小或母群體標準差未知的時候。下面將分別介紹這2個函數的語法,並舉例說明他們的使用方法。
利用 CONFIDENCE.NORM 函數計算信賴區間
當研究的樣本數等於或大於30且母群體標準差已知的時候,可以先計算出樣本的平均數,再利用 CONFIDENCE.NORM 函數求得信賴度,最後使用平均數加、減這個信賴度來計算信賴區間。這個函數的語法為 CONFIDENCE.NORM(alpha, standard_dev, size),括號裡的3個引數分別指顯著水準(信心程度)、母群體標準差和樣本數。
這裡使用〈信賴區間的意義和計算(σ已知)〉裡的例子,假設有一位英文老師想瞭解高三生的平均英文能力,她隨機抽取出36位學生並給予英文能力測驗,得到平均成績65.6分。若全國高三生的英文能力測驗平均成績呈現常態分配且標準差為12.81,試問全國高三生的平均英文能力測驗成績的95%信賴區間為何?
首先,開啟一新的活頁簿或工作表,在空白的儲存裡輸入信賴區間計算所需的資訊,如下圖。圖中 B 欄的 mean、standard_dev、size 和 alpha 為資訊名稱,分別代表平均數、母群體標準差、樣本數和顯著水準,而 C 欄為各個資訊的數值。

撰寫 Excel 函數的語法時,通常會使用儲存格參照(cell reference)作為語法裡的引數,而不是直接使用數值。透過這樣的方法,當要計算不同數值的信賴區間時,只須修改各個資訊的數值,而不用更改函數語法。以上圖為例,平均數、母群體標準差、樣本數和顯著水準的儲存格參照分別為C2、C3、C4和C5。
找3個空白儲存格輸入 confidence level、lower limit 和 upper limit 等名稱,分別代表信賴度、下信賴限和上信賴限。先用 CONFIDENCE.NORM 函數計算信賴度,在 confidence level 右邊的儲存格(下圖的F2)輸入下面的語法:
=CONFIDENCE.NORM(C5, C3, C4)
這語法要求計算顯著水準為0.05(信心程度為95%)、母群體標準差為12.81且樣本數為36時的信賴度,語法輸入完成後按下 Enter 會傳回數值4.184523。

利用 CONFIDENCE.NORM 函數計算出來的數值為信賴度,而不是信賴區間,須再用平均數加、減這個數值後才能得到信賴區間。這裡先計算下信賴限再計算上信賴限,在 lower limit 右邊的儲存格(下圖的F3)輸入 =C2-F2,也就是利用位在儲存格C2的平均數減去儲存格F2的信賴度,按下 Enter 後傳回數值61.41548,此即為下信賴限。

運用相同的儲存格參照,在 upper limit 右邊的儲存格(下圖的F4)輸入 =C2+F2,按下 Enter 後傳回數值69.78452,此即為上信賴限。若您不清楚或想瞭解更多利用 Excel 進行數學運算的方法,可以參考如何使用Excel進行數學運算【基礎篇】。

把上、下信賴限的數值都四捨五入到小數點後第2位,可以看到全國高三生英文能力測驗成績的95%信賴區間介於61.42分和69.78分之間。換句話說,有0.95的機率或95%的信心程度,全國高三生英文能力測驗成績會落在61.42分和69.78分之間。
如果想求得99%信賴區間,只要把 alpha 右邊儲存格(下圖的C5)的數值改成0.01,位在儲存格F2的信賴度、F3的下信賴限和F4的上信賴限數值都會自動更改,這也凸顯了函數語法和數學運算過程中使用儲存格參照的好處。

從上圖可以看到,成績的99%信賴區間介於60.10分和71.10分之間。也就是說,有0.99的機率或99%的信心程度,全國高三生的英文能力測驗成績會落在60.10分和71.10分之間。
從上面的說明可以發現 CONFIDENCE.NORM 函數適用在研究的樣本數較大且母群體的標準差已知的時候,但很多時候我們很難知道母群體的標準差,而是利用樣本的標準差來估計母群體的標準差,這時候就不適合使用 CONFIDENCE.NORM 函數,而要改使用 CONFIDENCE.T 函數。
利用 CONFIDENCE.T 函數計算信賴區間
當研究的樣本數小於30或母群體的標準差未知時,可以先計算出樣本的平均數和標準差,再利用 CONFIDENCE.T 函數求得信賴度,最後再用平均數加、減這個信賴度來計算信賴區間。這個函數的語法為 CONFIDENCE.T(alpha, standard_dev, size),括號裡的3個引數分別指顯著水準(信心程度)、樣本標準差和樣本數。
這裡使用〈小樣本或σ未知的信賴區間之計算〉裡的例子,假設有一位英文老師想知道她所任職的學校裡高三生的平均英文能力,於是她隨機抽取出30位高三生,給予他們英文能力測驗並記錄成績,試運用 Excel 求得這個學校高三生的平均英文能力測驗成績的95%信賴區間。
將要計算信賴區間的資料輸入至一空白的活頁簿或工作表裡,這裡的例子有學生編碼 ID 和英文測驗成績 SCORE 兩個變項。當資料輸入完成後,找4個空白的儲存格輸入如下圖的 mean、standard_dev、size 和 alpha,分別代表平均成績、樣本標準差、樣本數和顯著水準。
首先,利用 AVERAGE 函數求得英文測驗成績的平均數,這函數的語法為 AVERAGE(number1, [number2], …),括號裡的引數為資料範圍。由於這個例子裡30位學生的成績位在儲存格B2到B31,所以可在 mean 右邊的儲存格(下圖的E2)輸入下面的語法:
=AVERAGE(B2:B31)
這語法要求計算位在儲存格B2到B31的英文測驗成績的平均數,輸入完成後按下 Enter 會傳回數值65.93333。

接著,利用 STDEV.S 函數求得英文測驗成績的標準差,這函數的語法為 STDEV.S(number1, [number2], …),括號裡的引數為資料範圍。在 standard_dev 右邊的儲存格(下圖的E3)輸入下面的語法:
=STDEV.S(B2:B31)
這語法要求計算位在儲存格B2到B31的英文測驗成績的標準差,輸入完成後按下 Enter 會傳回數值13.47714。

因為有30位學生,所以在 size 右邊的儲存格輸入30(您也可使用 COUNT 函數來計算樣本數,操作方法可參考如何使用Excel計算數目)。此外,這裡要求得95%信賴區間,所以在 alpha 右邊的儲存格輸入0.05。接著,再找3個空白儲存格輸入 confidence level、lower limit 和 upper limit,分別代表信賴度、下信賴限和上信賴限。

由於這裡使用樣本標準差而非母群體標準差,所以要用 CONFIDENCE.T 函數來計算信賴度。在 confidence level 右邊的儲存格(下圖的H2)輸入下面的語法:
=CONFIDENCE.T(E5, E3, E4)
這語法要求計算顯著水準為0.05(信心程度為95%)、樣本標準差為13.47714 且樣本數為30的信賴度,語法輸入完成後按下 Enter 會傳回數值5.032447。

最後,用平均成績加、減信賴度來求得上信賴限和下信賴限。在 lower limit 右邊的儲存格(下圖的H3)輸入 =E2-H2,也就是用儲存格E2的平均成績減去儲存格H2的信賴度,按下 Enter 後會傳回60.90089,此即為95%信賴區間的下信賴限。

在 upper limit 右邊的儲存格(下圖的H4)輸入 =E2+H2,也就是用儲存格E2的平均成績加上儲存格H2的信賴度,按下 Enter 後會傳回70.96578,此即為95%信賴區間的上信賴限。

將上、下信賴限的數值都四捨五入到小數點後第2位,可以看到英文測驗成績的95%信賴區間介於60.90分和70.97分之間。換句話說,這個學校的高三生英文能力測驗成績的95%信賴區間會落在60.90分和70.97分之間。
如果要求得99%信賴區間,只要把 alpha 右邊儲存格(下圖的E5)的數值改成0.01,位在儲存格H2、H3和H4的信賴度、下信賴限和上信賴限都會跟著變更。

從上圖可以看到,英文成績的99%信賴區間介於59.15分和72.72分之間。也就是說,這個學校的高三生英文能力測驗成績的99%信賴區間會落在59.15分和72.72分之間。
從上面的示範過程可以發現利用 Excel 來計算信賴區間並不困難,若手邊沒有像 SPSS 或 SAS 那樣的統計分析軟體,也可用 Excel 來取得信賴區間的數值。分析時須注意樣本數和母群體標準差的有無,再決定使用 CONFIDENCE.NORM 函數或 CONFIDENCE.T 函數。
以上為本篇文章對如何使用 Excel 計算信賴區間的介紹,希望透過這篇文章,您學會了利用 Excel 函數來取得信賴度和上、下信賴限的方法。如果您喜歡這篇文章,請將本網站加入書籤,並隨時回訪本網站喔!另外,也歡迎您追蹤本網站的 Facebook 和/或 X(Twitter)專頁喲!
若您覺得本篇文章對您有幫助,歡迎買杯珍奶給 Dr. Fish!小小珍奶、大大鼓勵,您的支持將給 Dr. Fish 更多撰寫優質文章的動力喔!