行為或社會科學研究的過程中很常使用到屬性為連續變項(continuous variable)的依變項,而在大部分的情況下,連續變項的數值會呈現常態分配。因此,若要探討連續變項的機率,可將連續變項的數值轉換成標準分數後,再利用常態曲線下的面積來找到相應的機率值。
下面將先簡單說明連續變項機率的計算方法,再舉3個例子來實際操作連續變項的機率計算。由於本篇文章牽涉到常態分配、標準分數和常態曲線下的面積,若您不熟悉這些概念,建議您先閱讀常態曲線和曲線下的面積、標準分數和常態曲線下面積之應用,將有助於下面內容的理解。
連續變項機率的計算方法
連續變項在很多時候都會呈現常態分配,因此可利用常態曲線和曲線下的面積來計算連續變項的機率。若讓指一個連續變項的機率,則該連續變項機率的計算方法為:
在標準分數和常態曲線下面積之應用中提到,利用標準常態分配表,標準分數和常態曲線下面積可為下列兩個方向的運用:
- 從標準分數找曲線下面積:將原始數據轉換成標準分數後,再藉由標準分數去尋找常態曲線下的面積,例如百分等級的計算。
- 從曲線下面積找標準分數:從常態曲線下的面積尋找標準分數後,再將標準分數換算成資料中相對應的原始數據。
使用與上述相同的概念和方法,還可將原始數據裡的連續變項數值轉換成標準分數後,再利用常態曲線下的面積去尋找相對應的機率值。雖然現在的統計分析幾乎都是透過統計分析軟體達成,但機率的計算和顯著性檢定(或稱為假設檢定)的過程息息相關,所以瞭解機率的取得過程將有助於各種統計檢定結果的理解和解釋。
連續變項的機率計算
運用標準分數和常態曲線下面積的概念來求得連續變項的機率並不困難,下面使用3個範例說明3種不同情況的連續變項數值機率的計算過程。
等於或大於一個數值的機率
有一位英文老師給予自己任教學校的所有高三生英文能力測驗,假設這是一個母群體且成績呈現常態分配,平均數為70、標準差為12。如果從這個母群體中隨機抽取出一個分數,試問該分數等於或大於82分的機率是多少?
因為成績為常態分配,且平均數、標準差,先利用和將82分轉換成標準分數:
計算結果顯示82分的標準分數為1,剛好大於平均數1個標準差單位。因為要知道等於或大於82分的機率,所以必須求得下圖藍色區塊的機率。
參考標準常態分配表(如下表),從z欄找到1.00,再往右移查詢「超過標準分數z之外的面積」的B欄,其數值為0.1587,代表分數等於或大於82分的機率為0.1587。
因此,從平均數為70、標準差為12且常態分配的母群體裡隨機抽取出一個分數,這個分數等於或大於82分的機率為0.1587。若用符號表示,可寫成。
等於或小於一個數值的機率
使用上面「等於或大於一個數值的機率」的相同情境,假設母群體裡的分數呈現常態分配,平均數為70、標準差為12。若從母群體中隨機抽取出一個分數,試問該分數等於或小於55分的機率是多少?
同樣地,利用平均數、標準差,先將55分轉換成標準分數:
從計算結果得知55分的標準分數為-1.25,代表該分數小於平均數1.25個標準差單位。因為要計算等於或小於55分的機率,所以必須找到下圖藍色區塊的機率。
雖然標準常態分配表裡沒有負數的標準分數,但因為常態分配是左右對稱的型態,所以可直接查詢當標準分數為1.25時,超過標準分數z之外的面積之數值。
查詢上面的標準常態分配表,找到z欄為1.25的細格(),其「超過標準分數z之外的面積」的B欄之數值為0.1056,代表等於或小於55分的機率為0.1056。若用符號來表示,可以寫成。
等於小於一個分數或等於大於一個分數的機率
使用上面「等於或大於一個數值的機率」的相同情境,假設母群體裡的分數呈現常態分配,平均數為70、標準差為12。若從母群體中隨機抽取出一個分數,試問該分數等於小於46分或等於大於94分的機率是多少?
利用平均數、標準差,先將46分和94分轉換成標準分數:
計算結果顯示46分的標準分數為-2,而94分的標準分數為2。等於或大於94分的區域為下圖的A藍色區塊,而等於或小於46分的區域為下圖的B藍色區塊。
要計算上圖中等於大於94分或等於小於46分的機率,須使用機率的加法規則(addition rule),公式為:
上面公式裡代表A和B同時發生的機率,也就是分數等於大於94分和等於小於46分同時發生的機率。因為沒有任一分數可以同時等於大於94分和等於小於46分,代表這兩個情況互斥,所以。
換句話說,當兩個事件不會同時發生,也就是互斥的時候,出現A或B的機率只須將各自發生的機率相加即可,所以上面的加法規則可簡化為:
接著,查詢上面的標準常態分配表,當時, 「超過標準分數z之外的面積」的B欄之數值為0.0228。因為常態分配為對稱的曲線,所以當時,「超過標準分數z之外的面積」也是0.0228。因此,從母群體中隨機抽取出的一個分數等於小於46分或等於大於94分的機率為:
透過上面的計算過程可以知道,從母群體中隨機抽取出一個分數,該分數等於小於46分或等於大於94分的機率為0.0456。
從上面的3個範例可以發現,取得連續變項數值的機率之過程與尋找常態曲線下面積的過程相當地類似,同樣是先將原始數據轉換成標準分數後,再藉由標準常態分配表的查詢去找到相對應的面積或機率,差別僅在於面積是以百分比呈現,而機率是以小數顯示。
以上為本篇文章對於連續變項的機率計算之介紹,希望透過本篇文章,您瞭解了連續變項的機率計算方式,也學會了利用標準常態分配表計算獲得一個分數的機率之方法。
若您喜歡本篇文章,請將本網站加入書籤,作為您的學習資源,並持續回訪本網站喔!另外,您也可以在Facebook和Twitter上找到我們喲!