社會統計基礎的機率認識【定義和專有名詞篇】

在〈描述統計 vs. 推論統計〉裡提到描述統計是用組織和概括的方式來呈現樣本資料，目的在於描述資料的特性；推論統計則是運用統計檢定方法來檢驗樣本資料，目的在把檢定結果推論至母群體上。推論統計裡把樣本資料推論至母群體的統計技術涉及嚴謹的假設檢定過程，而在這個推論過程中「機率」（probability）就扮演一個基礎且重要的角色。

數學上機率的問題和運算可能相當複雜，常讓很多人聞之變色，不過這裡的目的不在於討論數學上的機率理論和解決複雜的機率問題，而是在說明社會統計裡機率的定義、常見的機率專有名詞和基礎的機率運算規則，讓學習者能對機率有基本的瞭解。這篇【定義和專有名詞篇】將先介紹社會統計裡機率的定義和常見的機率專有名詞，下一篇【運算規則篇】再說明基礎的運算規則。

機率的定義
- 古典機率
- 經驗機率
基礎的機率專有名詞

機率的定義

當討論機率的時候，作為計算的資料單位通常為「事件」（event），而這個名詞可泛指很多種情況，例如一顆骰子的1面、一副撲克牌裡的1張牌、選擇題裡的1個選項或一群人裡的1個人。因此，當我們談到○○的機率時，○○通常就稱為一個事件。

機率的定義可以從2個方向來探討，第1個方向為古典機率（classical probability），第2個方向為經驗機率（empirical probability），下面分別說明。

古典機率

古典機率運用數學家發展出來的數學規則來決定在已知的條件下不同事件的發生機率，過程中不涉及任何的經驗法則。舉例來說，一顆骰子有6面，每1面都有不同數目的小圓點，從1個點到6個點，若擲一顆骰子一次，獲得3個點的機率為1/6或0.1667。

從古典機率的角度來看，機率的定義為一個事件相對於所有可能發生事件的發生次數或可能性。以上面提到的骰子為例，有3個小圓點的面只有1面（一個事件），而一顆骰子有6個面（所有可能發生的事件），若讓 $p(A)$ 代表事件A的發生機率且把計算結果四捨五入到小數點後第4位，則擲一顆骰子一次，得到3個點的機率為：

$\begin{equation*}\begin{CJK*}{UTF8}{bsmi}p(A)=p(3)=\frac {\text {得到3個點的次數}}{\text {所有可能發生事件的次數}}=\frac {1}{6} \approx 0.1667\end{CJK*}\end{equation*}$

因此，古典機率是以數學規則作為基礎，若適用在社會統計學上，代表統計學家須知道所有母群體的參數才可計算出機率。不過這樣的想法不太可能適用在實際的研究上，因為大多數的時候我們無法得知母群體的參數，而是要從母群體中抽取樣本來估計不同事件的相對發生次數，此即為經驗機率。

經驗機率

經驗機率是藉由樣本資料的蒐集來估計不同事件的相對發生次數，這一點是和古典機率最主要不同的地方。由於古典機率是運用數學規則來計算，所以沒有牽涉到任何樣本資料的蒐集。從經驗機率的角度來看，機率的定義為樣本資料裡一個事件相對於所有發生事件的發生次數。

由此可見，若想用經驗機率的方法來決定擲一顆骰子一次獲得3個點的機率，可以擲一顆骰子很多次，然後計算3個點那一面出現的次數。假設擲一顆骰子10000次，3個點那一面出現1598次，則擲一顆骰子一次得到3個點的機率為：

$\begin{equation*}\begin{CJK*}{UTF8}{bsmi}p(A)=p(3)=\frac {\text {得到3個點的次數}}{\text {所有發生事件的次數}}=\frac {1598}{10000}=0.1598\end{CJK*}\end{equation*}$

經驗機率的方法須實際蒐集資料後才能計算出機率，當上面公式的分母（所有發生事件的次數）愈大的時候，經驗機率會愈趨近於古典機率。以擲骰子來說，當擲一顆公正骰子（每一面出現的機率相同）的次數愈多次的時候，獲得不同點的機率會愈趨近於古典機率，而當擲一顆公正骰子無數次的時候，經驗機率會等於古典機率。

基礎的機率專有名詞

上面利用古典機率和經驗機率的角度簡單地說明了機率的定義，這裡再來看看社會統計裡幾個常見的機率專有名詞。請把上面提到的機率計算時的資料單位「事件」謹記在心，因為這個名詞會反覆出現在下面的專有名詞裡。

獨立事件

當一個事件的發生不會影響到另一個事件的發生時，這2個事件稱為獨立事件（independent events）。舉例來說，擲2枚公正的硬幣（正面和反面出現的機率一樣）並計算2枚硬幣都出現反面的機率，由於第1枚硬幣的結果不會影響第2枚硬幣的結果，所以這2枚硬幣可被視為獨立事件。

用來計算數個事件共同或連續發生機率的乘法規則（multiplication rule）裡，當事件之間彼此獨立的時候，機率為各個事件發生機率的乘積。假設有A事件和B事件，且這2事件間彼此獨立，則A事件和B事件同時發生的機率公式為：

$p(A \ \text {and} \ B) = p(A) \times p(B)$

因此，擲2枚公正的硬幣且2枚硬幣都出現反面的機率為第1枚硬幣出現反面的機率乘以第2枚硬幣出現反面的機率，也就是 $\dfrac {1}{2} \times \dfrac {1}{2} = \dfrac {1}{4} = 0.2500$ 。

互斥事件

當一個事件的發生排除了另一個事件的發生時，這2個事件稱為互斥事件（mutually exclusive events）。例如擲一顆骰子一次，只會出現1個點到6個點的其中一面，而不會同時出現2個面，所以一顆骰子的面與面之間為互斥事件。

當2個事件互斥時，2個事件同時發生的機率為0，也就是 $p(A \ \text {and} \ B) = 0$ 。此外，用來計算數個事件裡任一個事件發生機率的加法規則（addition rule）裡，當事件之間互斥的時候，機率為各個事件發生機率的總和。

舉例來說，我們已經知道骰子的面與面之間互斥，所以擲一顆骰子一次，得到2個點或6個點的機率為得到2個點的機率加上得到6個點的機率，也就是 $\dfrac {1}{6} + \dfrac {1}{6} = \dfrac {2}{6} \approx 0.3333$ 。

周延事件

當一組事件包含所有可能的發生結果時，這組事件稱為周延事件（exhaustive events）。例如一顆骰子有6個面，當擲一顆骰子一次，得到1個點、2個點、3個點、4個點、5個點或6個點的結果為周延事件，因為這6種結果為一顆骰子的所有可能結果。

當一組事件為互斥且周延時，這組事件裡各個事件的機率總和為1。若讓A、B、C、D、E、F代表6個互斥且周延的事件，則他們的關係可用下面的公式來呈現：

$p(A) + p(B) + p(C) + p(D) + p(E) + p(F) = 1$

因此，擲一顆骰子一次，可能會得到1個點、2個點、3個點、4個點、5個點或6個點，若把得到各個結果的機率相加，會得到下面的結果：

$\begin{alignat*}{6}&p(1) &&+ p(2) &&+ p(3) &&+p(4) &&+p(5) &&+ p(6) \\[5pt]= & \ \frac {1}{6} &&+ \ \frac {1}{6} &&+ \ \frac {1}{6} &&+ \ \frac {1}{6} &&+ \ \frac {1}{6} &&+ \ \frac {1}{6} \\[5pt]= & \ 1\end{alignat*}$

從上面的計算過程可以發現一顆骰子的6種可能發生結果的機率總和為1，證明了一顆骰子的6種結果為互斥且周延事件。

聯合機率

聯合機率（joint probability）是指2個或多個事件同時發生的機率，例如尋求警察協助的受虐者為生理女性且受到親密伴侶身體虐待的機率，或社區守望相助隊的參與者為生理男性且具有碩士學歷的機率。在只有2個事件的情況下，聯合機率可用 $p(A \ \text {and} \ B)$ 來表示。當事件之間彼此獨立時，聯合機率為各個事件發生機率的乘積。

條件機率

條件機率（conditional probability）是指在一個事件已經發生的情況下，另一個事件發生的機率，例如受到親密伴侶身體虐待的受虐者也受到精神虐待的機率，或吸食毒品的人也酗酒的機率。也就是說，事件之間為相依事件，而非獨立事件。若只有2個事件，B事件已經發生的情況下A事件發生的機率可用 $p(A \mid B)$ 來表示。

放回抽樣

放回抽樣（sampling with replacement）是指從母群體裡抽取樣本時，每抽取出一個人或物後，會把已經抽取出來的人或物放回母群體裡再進行下一個抽取。也就是說，曾經被抽取出來的人或物有可能再被抽取出來。

不放回抽樣

不放回抽樣（sampling without replacement）是指從母群體抽取樣本時，每抽取出一個人或物後，不會把已經抽取出來的人或物再放回母群體裡就進行下一個抽取。也就是說，曾經被抽取出來的人或物不會再被抽取出來。

以上為社會統計基礎的機率定義和專有名詞的介紹，希望透過本篇文章，您瞭解了古典機率和經驗機率的差異以及常見的機率專有名詞。若您喜歡本篇文章，請將本網站加入書籤，並隨時回訪本網站喔！另外，也歡迎您追蹤本網站的 Facebook 和／或 X（Twitter）專頁喲！

如果您覺得本篇文章對您有幫助，歡迎買杯珍奶給 Dr. Fish！小小珍奶，大大鼓勵，您的支持將給 Dr. Fish 更多撰寫優質文章的動力喔！