Skip to content

合作邀約 email: dr.fish@drfishstats.com

  • Facebook
  • X
site icon of Dr. Fish

Dr. Fish 漫游社會統計

魚博士的專業漫談和課後隨筆

  • Home
  • 關於 Dr. Fish
  • 統計基礎
    • 入門概念
    • 圖形繪製
    • 描述統計
    • 相關
    • 線性迴歸
  • 統計進階
    • 推論統計
    • 統計檢定
      • 相關係數
      • 迴歸
      • 平均數比較
      • 無母數檢定
  • EXCEL 系列
    • 資料管理
    • 圖形繪製
    • 描述統計
    • 推論統計
  • 下課後
    • 生活
    • 旅遊
      • 日本
    • 美食
    • 攝影
  • 聯絡 Dr. Fish
  • Home
  • 推論統計
  • 小樣本或σ未知的信賴區間之計算

🐟 請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址

小樣本或σ未知的信賴區間之計算

Posted on 2021-10-252025-02-11 Updated on 2025-02-112025-02-11 By Dr. Fish
推論統計

信賴區間指可能包含母群體數值的一個數值範圍,不同於使用單一數值作為母群體參數估計值的點估計(point estimate),例如以樣本平均數\overline X作為母群體平均數\mu的估計值,信賴區間是使用一個範圍作為母群體參數的估計值,並指出母群體參數可能落在該區間的機率,屬於區間估計(interval estimate)。

根據中央極限定理,當樣本數愈大時,抽樣分配會愈趨近於常態分配。因此,在信賴區間的意義和計算(σ已知)裡提到,當樣本數夠大且母群體標準差\sigma已知的時候,可以利用常態分配去尋找常態曲線下面積所對應的標準分數(z分數),進而計算出信賴區間。

如果讓\overline X代表樣本平均數、p為信賴區間的機率值(最常使用0.95或0.99)、\sigma為母群體標準差、N為樣本總數,當樣本數目N \geq 30且母群體標準差\sigma已知時,信賴區間可用下面的不等式呈現:

    \[ \overline X - \left ( z_{\frac {1-p}{2}} \times \frac {\sigma}{\sqrt N} \right ) \leq \mu \leq \overline X + \left ( z_{\frac {1-p}{2}} \times \frac {\sigma}{\sqrt N} \right ) \]

然而,當無從得知母群體的標準差或樣本數較小時(N<30),便無法使用上述的方式計算信賴區間,而須改用t分配(t distribution)來計算。以下將先介紹t分配的意義,再說明小樣本或\sigma未知時信賴區間的計算方法,最後示範利用SPSS求得小樣本或\sigma未知時的信賴區間之操作過程。

  • t分配
  • 小樣本或σ未知時信賴區間的計算
  • σ未知時信賴區間的實例演算
    • 95%信賴區間
    • 99%信賴區間
  • 運用 SPSS 求得σ未知時的信賴區間
    • 95%信賴區間
    • 99%信賴區間

t分配

t分配為抽樣分配的一種,由 William S. Gosset 於1908年提出。運用抽樣分配的概念,t分配是指從一母群體中隨機抽取出樣本大小為N的所有可能樣本,計算出每一個樣本的t值與得到該t值的機率,最後呈現出各個t值的機率分布狀態之機率分配。

t分配會隨著樣本大小的不同而有不同的曲線,此點有別於不論樣本大小都只有一條曲線的常態分配。但當母群體本身為常態分配,或樣本數N \geq 30時,t分配會趨近於常態分配;當樣本數無限大的時候,t分配即變成常態分配的分配型態(參考下圖)。

graph of t-distribution

但t分配不是單純地因樣本數而有不同的曲線,它其實是隨著與樣本大小相關的自由度(degrees of freedom,簡稱df)而改變。自由度是指計算一個統計量時,可以自由變動的分數之數目。舉例來說,假設有5個分數且已知平均數為10,若隨意選擇了4個分數,分別為4、6、12、18,則第5個分數必定為10才能讓平均數為10;也就是說,能夠自由變動的分數個數為4,代表自由度為4。因此,若讓一個參數保持恆定,自由度必定為計算這個參數的分數之數目減去1。

小樣本或\sigma未知的信賴區間之計算須使用到t分配和單一樣本t值的計算方法,而單一樣本t值的計算公式如下:

(1)   \begin{equation*}t=\frac {\overline X-\mu}{s_{\overline X}}=\frac {\overline X-\mu}{\displaystyle \frac {s}{\sqrt N}}\end{equation*}

    \begin{equation*}\begin{CJK*}{UTF8}{bsmi}\begin{align*}\overline X &= \text {樣本平均數} \\\mu &= \text {母群體平均數} \\s_{\overline X} &= \text {估計標準誤} \\s &= \text {樣本標準差} \\N &= \text {樣本總數} \end{align*}\end{CJK*}\end{equation*}

從上面的公式(1)可看出,因為計算t值時須先計算出樣本標準差s而失去1個自由度,所以t的自由度為N-1。這個自由度與t分配的曲線型態息息相關,也是下面提到的t分配表查詢時必須知道的訊息之一。

小樣本或σ未知的信賴區間

當母群體標準差\sigma未知或樣本數目很小時,並無法使用常態分配和標準分數來計算信賴區間,而須使用t分配和t值來計算。標準分數和t值最大的差別在於,標準分數使用母群體標準差\sigma來計算,而t值使用樣本標準差s來計算。也就是說,小樣本或\sigma未知的信賴區間計算是利用樣本標準差s作為母群體標準差\sigma的估計值。

formula of z-score vs. t-value

將原本計算\sigma已知的信賴區間的標準分數z換成t,母群體標準差\sigma換成樣本標準差s,即為小樣本或\sigma未知時信賴區間的計算方式,這時信賴區間的不等式如下:

(2)   \begin{equation*}\overline X - \left ( t_{\frac {1-p}{2}} \times \frac {s}{\sqrt N} \right ) \leq \mu \leq \overline X + \left ( t_{\frac {1-p}{2}} \times \frac {s}{\sqrt N} \right )\end{equation*}

上面的不等式裡,p為信賴區間的機率值,最常使用的機率值為0.95或0.99,也就是95%或99%信心程度。從上面的不等式可看出信賴界限分別為:

  • 下信賴限:\displaystyle \overline X - \left ( t_{\frac {1-p}{2}} \times \frac {s}{\sqrt N} \right )
  • 上信賴限:\displaystyle \overline X + \left ( t_{\frac {1-p}{2}} \times \frac {s}{\sqrt N} \right )

要找到t值,須使用t分配表,下表為部分的t分配表。實際上,t分配表包含「雙尾檢定的顯著水準」和「單尾檢定的顯著水準」兩部分,由於信賴區間的計算僅使用「雙尾檢定的顯著水準」,所以這裡沒有列出「單尾檢定的顯著水準」的表格內容。另外,表格最左邊的欄(df)為自由度,為樣本總數減去1(N-1)。

partial t-distribution table

舉例來說,若樣本總數N為27,想找95%的信賴區間,則顯著水準為1-0.95=0.05,自由度為N-1=26,查詢上表後得到的t值為2.056。

95 percent confidence interval with df 26

將t值2.056帶入上面的不等式(2),當樣本數目N為27時,95%信賴區間的不等式如下:

    \[ \overline X - \left ( 2.056 \times \frac {s}{\sqrt {27}} \right ) \leq \mu \leq \overline X + \left ( 2.056 \times \frac {s}{\sqrt {27}} \right ) \]

假設樣本數目N同樣為27,但改成找99%的信賴區間,此時顯著水準為1-0.99=0.01,自由度為N-1=26。查詢上面的t分配表,得到的t值為2.779。

99 percent confidence interval with df 26

同樣地,將t值2.779帶入上面的不等式(2)。當樣本數目N為27時,99%信賴區間的不等式為:

    \[ \overline X - \left ( 2.779 \times \frac {s}{\sqrt {27}} \right ) \leq \mu \leq \overline X + \left ( 2.779 \times \frac {s}{\sqrt {27}} \right ) \]

接著,只要再計算出樣本的平均數和標準差,並分別帶入上面95%和99%信賴區間的不等式中,就可得到樣本數目N為27時的信賴區間。下面舉一個例子來示範\sigma未知時95%和99%信賴區間的計算過程。

σ未知時信賴區間的實例演算

假設一位英文老師想知道她所任職的學校裡高三生的平均英文能力,於是她隨機抽取出30位高三的學生,並給予他們英文能力測驗,成績如下表所示。試問該校高三生的平均英文能力測驗成績的95%和99%信賴區間各為何?

example of confidence interval when sigma unknown

從題目可知母群體的標準差\sigma未知,須使用樣本標準差s作為\sigma的估計值。因此,先計算出這30位學生成績的平均數\overline X和標準差s,計算方式請分別參考〈集中趨勢的測量〉裡平均數的計算和〈變異性的測量〉裡標準差的計算。

    \begin{align*}\overline X &= 65.93 \\s &= 13.48\end{align*}

得到樣本的平均數和標準差後,就可利用上面的不等式(2),分別計算該校高三生平均英文能力測驗的95%和99%信賴區間,以下分別示範計算過程。

95%信賴區間

因為是95%信賴區間,所以「雙尾檢定的顯著水準」為1-0.95=0.05。此外,樣本總數為30,所以自由度為30-1=29。查詢上面的t分配表,得到t的數值為2.045。

將\overline X=65.93、s=13.48、t=2.045、N=30等數值帶入上面的不等式(2)裡:

    \begin{align*}\overline X - \left ( t_{\frac {1-p}{2}} \times \frac {s}{\sqrt N} \right ) \leq &\mu \leq \overline X + \left ( t_{\frac {1-p}{2}} \times \frac {s}{\sqrt N} \right ) \\[10pt]65.93 - \left ( 2.045 \times \frac {13.48}{\sqrt {30}} \right ) \leq &\mu \leq 65.93 + \left ( 2.045 \times \frac {13.48}{\sqrt {30}} \right ) \\[10pt]60.90 \leq &\mu \leq 70.97\end{align*}

從計算結果得知,信賴下限為60.90分,信賴上限為70.97分。換句話說,有0.95的機率或95%的信心程度,該校高三生的平均英文能力測驗成績落在60.90分和70.97分之間。

99%信賴區間

因為是99%信賴區間,所以「雙尾檢定的顯著水準」為1-0.99=0.01。此外,樣本總數為30,所以自由度為30-1=29。查詢上面的t分配表,找到t值為2.756。

將\overline X=65.93、s=13.48、t=2.756、N=30等數值帶入上面的不等式(2)裡:

    \begin{align*}\overline X - \left ( t_{\frac {1-p}{2}} \times \frac {s}{\sqrt N} \right ) \leq &\mu \leq \overline X + \left ( t_{\frac {1-p}{2}} \times \frac {s}{\sqrt N} \right ) \\[10pt]65.93 - \left ( 2.756 \times \frac {13.48}{\sqrt {30}} \right ) \leq &\mu \leq 65.93 + \left ( 2.756 \times \frac {13.48}{\sqrt {30}} \right ) \\[10pt]59.15 \leq &\mu \leq 72.71\end{align*}

計算結果顯示,信賴下限為59.15分,而信賴上限為72.71分。這個結果指出,有0.99的機率或99%的信心程度,該校高三生的平均英文能力測驗成績落在59.15分和72.71分之間。

雖然使用紙筆運算並不困難,但每次計算都須先求得資料的平均數、標準差,再查詢t分配表去找到t值,整個過程有些麻煩,此時若使用統計分析軟體來進行運算將會節省許多時間,下面示範利用 SPSS 求得\sigma未知的信賴區間之操作方法。

運用 SPSS 求得σ未知的信賴區間

將上面實例的30個分數(變項名稱為 SCORE)輸入至 SPSS 的資料編輯器中,輸入完成後,點選功能表的分析 » 比較平均數 » 單一樣本T檢定,帶出「單樣本T檢定」視窗。關於 SPSS 的資料輸入方法,請參考 SPSS操作環境和資料輸入。

spss menu for confidence interval calculation

不同信心程度的信賴區間僅在於不同信賴區間百分比數值的輸入,其餘的操作過程都相同,以下分別示範95%和99%信賴區間的操作過程。

95%信賴區間

在「單樣本T檢定」視窗中,將 SCORE 移至檢定變數(T)方框中,下方的檢定值(V)設為0。接著,點選視窗右側的選項(O),在隨即出現的「單樣本T檢定:選項」小視窗中,信賴區間百分比(C)填入95,完成後按下方的繼續(C),回到上一個視窗後再按下確定。

dialog-box for 95 percent confidence interval in spss

經過上面的步驟,SPSS 會輸出2個表格,第1個表格為變項 SCORE 的描述統計量,包括樣本總數、樣本平均數、樣本標準差和估計標準誤。從下表可看出,這30位學生的平均成績為65.93分,標準差為13.48,估計標準誤為2.46。

output of descriptive statistics for confidence interval in spss

第2個表格為單一樣本t檢定的結果,可略過t值和顯著性的結果,直接看95%信賴區間的資訊。下表的95%信賴區間顯示,下信賴限為60.90分,上信賴限為70.97分,也可看到自由度為29,這些結果全都和上面紙筆計算的結果相同。

output of 95 percent confidence interval in spss

分析結果告訴我們有0.95的機率或95%的信心程度,這個學校高三生的平均英文能力測驗成績會落在60.90分和70.97分之間。若要使用美國心理學會論文格式(簡稱為 APA 格式)來撰寫95%信賴區間的結果,可用 95% CI [60.90, 70.97] 來表示,中括弧裡先寫下信賴限再寫上信賴限。

99%信賴區間

若要求得99%信賴區間,在「單樣本T檢定:選項」小視窗中,信賴區間百分比(C)填入99,按下繼續(C),回到「單樣本T檢定」視窗後,再按下最下方的確定。

dialog-box for 99 percent confidence interval in spss

同樣地,SPSS 會輸出2個表格,這裡略過第1個描述統計量的表格,直接看第2個「單一樣本檢定」表格。從下表可看到99%信賴區間的下信賴限為59.15分,而上信賴限為72.72分。雖然上信賴限的值較紙筆計算的值多0.01,但這是進位誤差所導致,並不影響整體的分析結果。

output of 99 percent confidence interval in spss

上表的結果顯示,有0.99的機率或99%的信心程度,這個學校高三生的平均英文能力測驗成績會落在59.15分和72.72分之間。若要使用 APA 格式來撰寫99%信賴區間的分析結果,寫法為 99% CI [59.15, 72.72],中括弧裡先寫下信賴限再寫上信賴限。

若您沒有 SPSS 或其他的統計分析軟體,也可利用微軟的 Excel 來計算信賴區間。Excel 內建2個信賴區間函數,分別為 CONFIDENCE.NORM 函數和 CONFIDENCE.T 函數,前者適用在樣本數較大且母群體標準差已知時,而後者適用在樣本數較小或母群體標準差未知的時候,詳細的操作方法可以參考如何使用Excel計算信賴區間。

以上為本篇文章對於小樣本或\sigma未知時信賴區間計算的介紹,希望透過本篇文章,您瞭解了t分配的意義、利用t分配和t值計算信賴區間的方法,也學會了如何運用 SPSS 求得小樣本或\sigma未知時的信賴區間。若您喜歡本篇文章,請將本網站加入書籤,並持續回訪本網站喔!另外,也歡迎您追蹤本網站的 Facebook 和 X(Twitter)專頁喲!

如果您覺得本篇文章對您有幫助,歡迎買杯珍奶給 Dr. Fish!小小珍奶,大大鼓勵,您的支持將給 Dr. Fish 更多撰寫優質文章的動力喔!

標籤: APA CONFIDENCE.NORM函數 CONFIDENCE.T函數 Excel SPSS t分配 上信賴限 下信賴限 信賴區間 區間估計 單一樣本t檢定 常態分配 抽樣分配 標準分數 母體參數 自由度 雙尾檢定 顯著水準 點估計

文章導覽

❮ Previous Post: 信賴區間的意義和計算(σ已知)
Next Post: 連續變項的機率計算 ❯

您可能也會喜歡

featured image of confidence interval using Excel
如何使用Excel計算信賴區間
featured image of statistical tests for 2 dependent samples
兩個相依樣本比較的統計檢定方法
featured image of F distribution
F分配的定義和F分配臨界值表的解讀
featured image of hypothesis writing
研究假設的種類和寫法

關於 Dr. Fish

profile picture uploaded on July 5, 2024

喜歡求知和分析,所以一路讀到博士。也喜歡旅行、攝影、料理、看日劇,愛把複雜的思想和事物變簡單,是個有點宅也有點跳 TONE 的人。

支持 Dr. Fish

本網站經營和文章撰寫皆由 Dr. Fish 一人完成,投注許多時間和費用。若您喜歡任何一篇文章或覺得文章對您有幫助,請給我一些支持,買杯珍奶給我吧!您的支持不但能給我更多撰寫文章的動力,也可以讓這網站的經營持續下去喔!謝謝!😄

boba-icon
請我喝珍奶!
featured image of spss environment and data entry

下載專區

標準常態分配表

Student's t 分配臨界值表

F分配臨界值表

卡方分配臨界值表

斯皮爾曼等級相關係數臨界值表

Wilcoxon 配對符號等級檢定臨界值表

曼–惠特尼U檢定臨界值表

Student 化全距分配臨界值表

Dunnett 檢定臨界值表(雙尾檢定)

單一樣本z檢定的 SPSS 語法

關於 Dr. Fish 漫游社會統計

本網站使用簡單易懂的文字解說社會統計,並示範軟體操作,同時有課後隨筆的分享,希望讀者在學習之餘,也能感受到生活的樂趣。

網站政策

著作權聲明 Copyright Notice
隱私權政策 Privacy Policy
免責聲明  Disclaimer

追蹤網站

Facebook
X(Twitter)

Copyright © 2021-2025 Dr. Fish 漫游社會統計. All rights reserved.