Skip to content

合作邀約 email: dr.fish@drfishstats.com

  • Facebook
  • X
site icon of Dr. Fish

Dr. Fish 漫游社會統計

魚博士的專業漫談和課後隨筆

  • Home
  • 關於Dr. Fish
  • 統計基礎
    • 入門概念
    • 圖形繪製
    • 描述統計
    • 相關
    • 線性迴歸
  • 統計進階
    • 推論統計
    • 統計檢定
      • 相關係數
      • 迴歸
      • 平均數比較
      • 無母數檢定
  • EXCEL系列
    • 資料管理
    • 圖形繪製
      • 匯出SPSS資料至Excel並繪製盒形圖
      • 如何使用Excel製作Q-Q plot
      • 如何使用Excel繪製加上誤差線的長條圖
    • 描述統計
      • 如何使用Excel執行次數分配
      • 如何使用Excel樞紐分析表製作次數分配表
      • 如何使用Excel計算偏態和峰態
      • 如何使用Excel尋找常態曲線下面積或分數
      • 如何使用Excel一次取得描述性統計量
      • 如何使用Excel計算共變異數
      • 如何使用Excel取得皮爾森積差相關係數
      • 如何使用Excel製作列聯表
    • 推論統計
      • 如何使用Excel計算信賴區間
      • 如何使用Excel執行符號檢定
      • 如何使用Excel執行單一樣本z檢定和t檢定
      • 如何使用Excel執行獨立樣本t檢定
      • 如何使用 Excel 執行 Levene 檢定
      • 如何使用Excel執行關聯樣本t檢定
      • 如何使用Excel執行單因子變異數分析
      • 如何使用Excel執行簡單線性迴歸
      • 如何使用Excel計算最小平方迴歸線的預測區間
      • 如何使用Excel執行卡方獨立性檢定
  • 下課後
    • 生活
    • 旅遊
      • 日本
    • 美食
    • 攝影
  • 聯絡Dr. Fish
  • Home
  • 推論統計
  • 統計檢定
  • 迴歸
  • 簡單線性迴歸的假設檢定

🐟 請您尊重本網站的智慧財產權,如有任何引用,請註明出處:Dr. Fish 漫游社會統計。(文章發表日期)。文章名稱。文章網址

簡單線性迴歸的假設檢定

Posted on 2024-05-102024-05-10 By Dr. Fish
迴歸

當想要瞭解兩個變項之間是否存在關聯性,且一個變項的改變如何影響另一個變項的變化時,可以先透過散布圖、相關係數來探討兩變項之間的關聯方向和程度。若分析結果指出兩變項之間為不完全的線性關係,可以再利用兩變項建構出一條最小平方迴歸線,從迴歸線的斜率評估一個變項如何隨著另一個變項而變化。

不過相關係數和最小平方迴歸線的斜率皆是從樣本計算得來,無法知道兩變項之間的關係是否真實地存在於母群體中。若想探討兩變項的相關係數和斜率是否能反映母群體的真實情況,就須執行假設檢定或稱為顯著性檢定,也就是檢驗母群體的參數是否為0。

利用統計分析軟體如SPSS執行簡單線性迴歸分析時,分析結果除了顯示兩變項間關係程度的相關係數、最小平方迴歸線的截距和斜率等迴歸係數之外,也會指出獲得這些係數的機率,藉由這些資訊即可進行假設檢定。下面內容將介紹簡單線性迴歸的使用時機、簡單線性迴歸裡兩變項的相關係數和斜率的假設檢定過程,並舉一例子說明,最後示範利用SPSS執行簡單線性迴歸的方法和解釋分析結果。

  • 簡單線性迴歸的使用時機
  • 簡單線性迴歸的假設檢定
    • 相關係數的假設檢定
    • 斜率的假設檢定
  • 簡單線性迴歸假設檢定的例子
  • 運用SPSS執行簡單線性迴歸的假設檢定

簡單線性迴歸的使用時機

簡單線性迴歸(simple linear regression)是涉及一個自變項和一個依變項的分析,兩變項之間為不完全的線性關係,變項的測量尺度為等距或比率尺度,用來探討自變項的改變如何影響依變項的變化。在這兩變項間可以建構出一條迴歸線,用來預測某個自變項數值的依變項結果。

雖然兩變項之間可以建構出許多條直線,但唯有一條能夠最小化預測誤差的直線,即為最小平方迴歸線(least-squares regression line),而利用這條線進行預測才能達到最好的預測準確度。若自變項為X、依變項為Y,用X預測Y的最小平方迴歸線方程式為:

    \[ \hat Y_i = a + bX_i \]

在上面的方程式裡,\hat Y_i指第i個Y的預測值,X_i指第i個X的值,a為預測誤差最小化時迴歸線的截距,b為預測誤差最小化時迴歸線的斜率。截距a和斜率b在統計分析軟體的輸出結果裡通常會出現在「係數」(coefficients)的表格裡,下面SPSS的示範說明裡即會看到。

截距a是指自變項的數值為0時依變項的數值,而斜率b為自變項改變1個單位時依變項會產生的變化。由於研究人員通常會把焦點放在斜率而不是截距上,所以下面內容也把重點放在斜率的假設檢定過程。若想更深入瞭解最小平方迴歸線,請參考最小平方迴歸線的建構和計算。

簡單線性迴歸的假設檢定

一般而言,在統計分析軟體的簡單線性迴歸分析結果裡,除了迴歸係數外,還會輸出兩變項的相關係數和其假設檢定結果。由於兩變項的關聯程度左右著斜率的結果,所以在探討斜率的假設檢定前,先看一下相關係數的假設檢定過程。若您不清楚或不熟悉統計檢定的假設檢定方法,可參考假設檢定的步驟和範例,將有助於下面內容的理解喔!

相關係數的假設檢定

簡單線性迴歸裡相關係數的假設檢定其實就是皮爾森積差相關係數的假設檢定,也是用來評估簡單迴歸模型和資料間的適合度(goodness of fit)。皮爾森積差相關係數是測量兩變項間關係的方向和程度的一種相關係數,通常從樣本的資料計算得到,符號為r,而為了評估兩者間的關係是否真實地存在於母群體中,就須進行假設檢定。關於皮爾森積差相關係數的意義,請參考何謂皮爾森積差相關係數。

假設母群體相關係數的符號為\rho,研究假設沒有方向性,虛無假設(H_0)主張自變項和依變項彼此獨立,不具有關聯性,也就是\rho = 0。反之,對立假設(H_1)主張自變項和依變項具有線性的關聯性,也就是\rho \neq 0。

然後依據研究的性質和目的,選擇適當的顯著水準或稱為α水準,通常為0.05、0.01或更為嚴苛的0.001。由於研究假設不具有方向性,所以統計檢定為雙尾檢定。關於顯著水準和檢定方向性的說明,請參考顯著水準和決策規則。

當樣本數N很大且母群體相關係數\rho = 0的時候,皮爾森積差相關係數r的抽樣分配會趨近於常態分配,與t分配的型態一致。因此,簡單線性迴歸裡相關係數的假設檢定使用t分配和t檢定統計量,自由度(degrees of freedom,簡寫為df)為N-2。計算t檢定統計量的公式如下:

(1)   \begin{equation*}t = \frac {r}{\sqrt {\dfrac {1-r^2}{N-2}}}\end{equation*}

利用上面的公式(1)計算得到t檢定統計量後,查詢t分配表,根據事先選擇的α水準和自由度,尋找相對應的t臨界值。最後,比較t檢定統計量和t臨界值,當t檢定統計量的絕對值等於或大於t臨界值的絕對值時,即可拒絕虛無假設,接受對立假設;反之,則保留虛無假設。

不過統計分析軟體可能會利用迴歸線的存在而能夠解釋的變異和不能被解釋的變異來計算F檢定統計量或F值,而不是t檢定統計量。遇到這種情況時,因為t檢定統計量的平方等於F值(分子自由度1、分母自由度N-2),所以把F值開根號後即可得到t檢定統計量。關於簡單迴歸模型能夠劃分出來的3種變異,請參考迴歸線和皮爾森積差相關係數間的關係。

斜率的假設檢定

在只有一個自變項的簡單線性迴歸裡,斜率的假設檢定結果會和上面的相關係數的假設檢定結果相同。換句話說,當相關係數的假設檢定發現自變項和依變項間有顯著的關聯性時,最小平方迴歸線的斜率也會達到統計上顯著,也就是依變項會隨著自變項的改變而產生變化。不過,這層關係在數個自變項的多元線性迴歸(multiple linear regression)裡就不存在,顯著的相關係數不代表每一個自變項的斜率都會達到統計顯著。

假設母群體的斜率為b_{pop},且研究假設不具有方向性。虛無假設(H_0)會主張自變項對依變項數值的預測沒有幫助,也就是b_{pop} = 0。相反地,對立假設(H_1)主張自變項對依變項數值的預測有所幫助,也就是b_{pop} \neq 0。

和相關係數的假設檢定相同,擬定好研究假設後,再依據研究的性質和目的,選擇適當的顯著水準或α水準,習慣上為0.05、0.01或0.001。因為研究假設不具有方向性,所以採用雙尾檢定。

斜率的假設檢定同樣使用t分配和t檢定統計量,當檢驗b_{pop} = 0的虛無假設時,計算t檢定統計量的公式如下:

(2)   \begin{equation*}t = \frac {b-b_{pop}}{SE_b} = \frac {b}{\dfrac {s_e}{s_X \sqrt {N-1}}}\end{equation*}

在上面的公式(2)裡,SE_b指斜率的標準誤,s_e指最小平方迴歸線的估計標準誤,s_X為自變項的標準差,N為樣本總數。

利用公式(2)計算得到斜率的t檢定統計量後,根據事先決定好的α水準和N-2的自由度,從t分配表尋找相對應的t臨界值。最後,比較t檢定統計量和t臨界值,當t檢定統計量的絕對值等於或大於t臨界值的絕對值時,可以拒絕虛無假設,接受對立假設;反之,保留虛無假設。

除此之外,還可以利用斜率、t臨界值和斜率標準誤求得母群體斜率的信賴區間,也就是真實的斜率可能存在的數值範圍。若p為信賴區間的機率值,通常為0.95或0.99,則母群體斜率的信賴區間(confidence intervals)公式為:

(3)   \begin{equation*}\text {CI} (b_{pop}) = b \pm \left ( t_{\frac {1-p}{2}} \times SE_b \right )\end{equation*}

上面公式(3)的t值為雙尾檢定、自由度為N-2時的臨界值,可透過t分配表取得。當信賴區間不包含數值0的時候,代表母群體的斜率不等於0,因此可以拒絕虛無假設,接受對立假設。

簡單線性迴歸假設檢定的例子

這裡使用最小平方迴歸線的預測區間計算的例子,假設有位研究人員想探討孩童在問題解決時的不相關回應次數是否會隨著年齡的增長而減少。她蒐集了12位孩童的資料,分別記錄了他們的年齡(AGE)和問題解決時不相關的回應次數(RESPONSE),資料如下表。若年齡為自變項,不相關的回應次數為依變項,試執行簡單線性迴歸的假設檢定並說明分析結果。

data of prediction intervals example

首先,為了瞭解兩變項之間的關係,可以先繪製一個散布圖。把孩童年齡置於橫座標軸、不相關的回應次數置於縱座標軸,畫出來的散布圖如下。從下圖可看出,當孩童的年齡增加時,問題解決時不相關的回應次數有減少的趨勢,兩者間呈現出一種負向的、不完全的線性關係。關於變項之間關係的型態,請參考變項之間關係的基本特色。

scatter plot of prediction intervals example

從上面12位孩童的資料,可以計算出年齡和不相關回應次數的皮爾森積差相關係數r、自變項年齡的標準差s_X、估計標準誤s_e以及用年齡預測不相關回應次數的最小平方迴歸線方程式。若把這些數值都四捨五入到小數點後第3位,這些數值和最小平方迴歸線方程式如下:

    \begin{align*}r &= -0.815 \\s_X &= 3.108 \\s_e &= 1.671 \\\hat Y_i &= 14 - 0.72X_i\end{align*}

由於這裡的重點為假設檢定,所以皮爾森積差相關係數的計算、標準差、估計標準誤的計算和最小平方迴歸線的建構請分別參考如何計算皮爾森積差相關係數、變異性的測量、估計標準誤測量預測誤差和最小平方迴歸線的建構和計算。利用上面這些數值,先進行相關係數的假設檢定再進行斜率的假設檢定。

❶ 相關係數的假設檢定

在進行相關係數的假設檢定前,須先擬定研究假設。若母群體相關係數為\rho,不具有方向性的虛無假設和對立假設分別為:

  • 虛無假設(H_0):孩童年齡和問題解決時不相關的回應次數沒有關聯,也就是\rho = 0。
  • 對立假設(H_1):孩童年齡和問題解決時不相關的回應次數有關聯,也就是\rho \neq 0。

假設這研究為探索的性質,所以選擇較寬鬆的α水準0.05。另外,由於研究假設不具有方向性,所以統計檢定為雙尾檢定。

已知皮爾森積差相關係數r為-0.815,樣本總數N為12,把這些數值帶入上面的公式(1)來計算t檢定統計量,過程如下:

    \[ t = \frac {r}{\sqrt {\dfrac {1-r^2}{N-2}}} = \frac {-0.815}{\sqrt {\dfrac {1-(-0.815)^2}{12-2}}} \approx -4.448\]

查詢t分配表,當α水準為0.05、自由度為10且雙尾檢定時,t臨界值為\pm2.228。最後,比較t檢定統計量的絕對值和t臨界值的絕對值,因為\left | -4.448 \right | > \left | \pm 2.228 \right |,所以拒絕虛無假設,接受對立假設。

2-tailed critical t value with alpha 0.05 and df 10

相關係數的假設檢定結果指出,孩童年齡和問題解決時不相關的回應次數有顯著的關聯性,且因為相關係數為負數,表示兩者間為負向的關係,也就是孩童的年齡愈大,問題解決時不相關的回應次數會愈少。

❷ 斜率的假設檢定

相關係數的假設檢定顯示孩童年齡和問題解決時不相關的回應次數有顯著的關聯性,於是可以進一步來探討不相關的回應次數如何隨著孩童年齡的不同而改變,也就是斜率的假設檢定。

在進行斜率的假設檢定前,同樣先擬定沒有方向性的研究假設。若母群體的斜率為b_{pop},虛無假設和對立假設分別如下:

  • 虛無假設(H_0):孩童年齡對不相關回應次數的預測沒有幫助,也就是b_{pop} = 0。
  • 對立假設(H_1):孩童年齡對不相關回應次數的預測有幫助,也就是b_{pop} \neq 0。

顯著水準(α水準)同樣為0.05,且因為是沒有方向性的研究假設,所以統計檢定為雙尾檢定。接著,把斜率、自變項年齡的標準差、迴歸線的估計標準誤和樣本總數帶入上面的公式(2),計算斜率的t檢定統計量,過程如下:

    \[t = \frac {b}{\dfrac {s_e}{s_X \sqrt {N-1}}} = \frac {-0.72}{\dfrac {1.671}{3.108 \sqrt {12-1}}} \approx -4.442\]

因為這個例子只有一個自變項,所以斜率的t檢定統計量和上面相關係數的t檢定統計量應該是一樣的,但因為紙筆計算過程造成的進位誤差,使得2個t檢定統計量有些微的差異。

從上面相關係數的假設檢定已知t臨界值為\pm2.228,比較t檢定統計量的絕對值和臨界值的絕對值,因為\left | -4.442 \right | > \left | \pm 2.228 \right |,所以拒絕虛無假設,接受對立假設。

分析結果顯示孩童年齡對問題解決時不相關回應次數的預測有幫助,且斜率-0.72指出當年齡增加1歲的時候,孩童在問題解決時不相關的回應會減少0.72次。

若想計算母群體斜率的信賴區間,可將斜率、斜率標準誤和t臨界值帶入上的公式(3)。若要求得95%的信賴區間,計算過程如下:

    \[ SE_b &= \frac {s_e}{s_X \sqrt {N-1}} = \frac {1.671}{3.108 \sqrt {12-1}} \approx 0.162 \]

    \begin{align*}\text {CI}(b_{pop}) &=  b \pm \left ( t_{\frac {1-p}{2}} \times SE_b \right ) \\&= -0.72 \pm ( 2.228 \times 0.162 ) \\& \Rightarrow -1.081 \leq b_{pop} \leq -0.359\end{align*}

從計算結果可以知道,有0.95的機率或95%的信心程度,真實的斜率會落在-1.081和-0.359之間。因為這2個數值間不包含0,所以95%信賴區間的結果也指出孩童年齡對問題解決時不相關回應次數的預測有幫助。

運用SPSS執行簡單線性迴歸的假設檢定

將上面例子裡12位孩童的資料輸入至SPSS資料編輯器裡,可在第1欄增加一個參與者編碼的變項,名稱為ID。在樣本數較多的時候,參與者編碼將有助於資料輸入和資料整理的過程。關於SPSS資料輸入的方法,請參考SPSS操作環境和資料輸入。

data of simple linear regression example

資料輸入完成後,點選功能表的分析 » 迴歸 » 線性,帶出「線性迴歸」視窗。

spss menu of simple linear regression

在「線性迴歸」視窗裡,將年齡AGE移到自變數(I),不相關的回應次數RESPONSE移到應變數(D),再點選視窗最右側的統計資料(S)。在「線性迴歸:統計量」小視窗裡,除了原本就已經被勾選的地方外,再勾選敘述統計(D)和迴歸係數裡的信賴區間(N),也可修改信賴區間的機率值。完成後按下小視窗下方的繼續(C),回到「線性迴歸」視窗後,再按下視窗下方的確定。

dialog box of simple linear regression in spss

經過上面的步驟,SPSS會輸出幾個表格,由於有些名詞的中文翻譯有點怪,所以這裡放上英文的輸出。一開始會看到「描述統計量」和「相關」表,「描述統計量」表顯示自變項年齡(AGE)和依變項不相關回應次數(RESPONSE)的平均數、標準差和樣本數等資訊。「相關」表則顯示自變項和依變項的皮爾森積差相關係數,為-0.815,代表兩變項為負向的關係。

spss output of descriptive statistics and correlations for simple linear regression

接著,「模型摘要」表呈現整個簡單線性迴歸模型和資料間的適合度,因為在數個自變項的多元線性迴歸裡,表中的相關係數為複相關係數,所以用大寫的R來表示。此外,雖然表中的R是兩變項的皮爾森積差相關係數,但因為是從R平方(R Square)開根號計算而來,所以永遠是正數,即使像這裡的例子裡兩變項實際上為負向關係,仍舊會顯示正數。

再往下的「變異數分析」表格,即是相關係數的假設檢定結果,只是用F檢定統計量而不是用t檢定統計量。這裡的F值是用整個簡單線性迴歸模型可解釋的變異和不可解釋的變異計算出來,分子自由度為1而分母自由度為10。把上面紙筆計算的t檢定統計量平方,(-4.448)^2 = 19.785,就是下表中的F值,但因為紙筆計算過程有進位誤差,所以2個數值有些差異。

spss output of model summary and ANOVA for simple linear regression

利用SPSS或其他統計分析軟體進行研究結果的評估時,不使用檢定統計量和臨界值比較的決策規則,而是比較獲得檢定統計量的機率p值和事先選擇的α水準,當p \leq \alpha時,可拒絕虛無假設。從上面的「變異數分析」表可知獲得F值的p值為0.001,而α水準為0.05,因為p < \alpha,所以拒絕虛無假設,相關係數的假設檢定指出孩童年齡和問題解決時不相關的回應次數有顯著的關聯。

最後可以看到「係數」表,這表格呈現出最小平方迴歸線的截距、斜率和假設檢定結果。從下表可看出,截距為14,斜率為-0.72,斜率的t檢定統計量為-4.442而獲得這個檢定統計量的p值為0.001。因為p < \alpha,所以拒絕虛無假設,研究結果指出孩童年齡對問題解決時不相關回應次數的預測有顯著的幫助。另外,有95%的信心程度,真實的斜率會落在-1.081和-0.359之間。

spss output of simple linear regression coefficients

不論是相關係數的假設檢定或斜率的假設檢定,結果都和上面紙筆計算的結果相同。不像紙筆計算過程中所使用的檢定統計量和臨界值比較的決策規則,運用統計分析軟體進行假設檢定時,只須比較獲得某檢定統計量的機率值和事先選擇的α水準即可評估保留或拒絕虛無假設,省去查詢t分配或F分配表的麻煩。

如果您沒有統計分析軟體如SPSS,也可以使用微軟的Excel來執行簡單線性迴歸的假設檢定,而且操作方法很簡單。利用Excel執行檢定線性迴歸有2種方法,一種是透過LINEST函數,另一種是運用「分析工具箱」裡的資料分析工具,詳細的操作方法請參考如何使用Excel執行簡單線性迴歸。

以上為本篇文章對簡單線性迴歸的假設檢定之介紹,希望透過本篇文章,您瞭解了相關係數和斜率的假設檢定過程,也學會了利用SPSS執行假設檢定的方法。若您喜歡本篇文章,請將本網站加入書籤,並隨時回訪本網站喔!另外,也歡迎追蹤本網站的Facebook和/或Twitter專頁喲!

如果您覺得本篇文章對您有幫助,歡迎買杯珍奶給 Dr. Fish!小小珍奶,大大鼓勵,您的支持將給Dr. Fish更多撰寫優質文章的動力喔!

標籤: ANOVA Excel Excel分析工具箱 F分配 LINEST函數 SPSS t分配 α水準 估計標準誤 信賴區間 假設檢定 多元線性迴歸 常態分配 截距 散布圖 斜率 最小平方迴歸線 檢定統計量 決策規則 測量尺度 無方向性假設 皮爾森積差相關係數 相關係數 研究假設 簡單線性迴歸 臨界值 自由度 變項 雙尾檢定 顯著 顯著性檢定

文章導覽

❮ Previous Post: 如何使用Excel計算最小平方迴歸線的預測區間
Next Post: 如何使用Excel執行簡單線性迴歸 ❯

您可能也會喜歡

featured image of simple linear regression using Excel
如何使用Excel執行簡單線性迴歸

關於 Dr. Fish

profile picture uploaded on July 5, 2024

喜歡求知和分析,所以一路讀到博士。也喜歡旅行、攝影、料理、看日劇,愛把複雜的思想和事物變簡單,是個有點宅也有點跳TONE的人。

支持 Dr. Fish

本網站經營和文章撰寫皆由Dr. Fish一人完成,投注許多時間和費用。若您喜歡任何一篇文章或覺得文章對您有幫助,請給我一些支持,買杯珍奶給我吧!您的支持不但能給我更多撰寫文章的動力,也可以讓這網站的經營持續下去喔!謝謝!😄

boba-icon
請我喝珍奶!
featured image of spss environment and data entry

下載專區

標準常態分配表

Student's t 分配臨界值表

F分配臨界值表

卡方分配臨界值表

斯皮爾曼等級相關係數臨界值表

Wilcoxon配對符號等級檢定臨界值表

曼–惠特尼U檢定臨界值表

Student化全距分配臨界值表

Dunnett檢定臨界值表(雙尾檢定)

單一樣本z檢定的SPSS語法

關於Dr. Fish漫游社會統計

本網站使用簡單易懂的文字解說社會統計,並示範軟體操作,同時有課後隨筆的分享,希望讀者在學習之餘,也能感受到生活的樂趣。

網站政策

著作權聲明 Copyright Notice
隱私權政策 Privacy Policy
免責聲明  Disclaimer

追蹤我們

Facebook
X(Twitter)

Copyright © 2021-2025 Dr. Fish 漫游社會統計. All rights reserved.