文章專區

2013-01-01統計檢定假設—從三國王粲覆棋談起 517 期

Author 作者 陳昱成/任教高雄市立中山高中

初,粲與人共行,讀道邊碑。人問曰:「卿能諳誦乎?」曰:「能。」固使背而誦之,不失一字。觀人圍棋,局壞,粲為覆之。棋者不信,以帊蓋局,使更以他局為之,用相比較,不誤一道。其強記默識如此。——《三國志魏書王粲傳》

這段正史強調強記能力,他觀看別人下棋,棋局因故毀壞,王粲將其復原。別人不信,用頭巾蓋住棋局,請他用另一副棋擺出來,結果和覆蓋的棋局一子不差,這就將大家折服了!在三國演義中,也用同樣的情節,只是主角換成是張松,眾人仍是大為讚嘆。

這裡有兩個要點,第一是棋局崩,王粲還原,旁人不信,但也沒有其他人知道原局。於是延伸出第二點,以頭巾蓋棋盤,用另一副棋驗證,結果一子不差。第二點的行為,主要是驗證王粲的強記能力,但即使一子不差,也只能說在這次實驗中,王粲經過了考驗,但原先的棋局,是否真的被還原,仍無法得到證實,因為真相沒有人知道(或許王粲知道),只是經過第二點的驗證,下棋者會「比較」相信王粲真的還原了,但卻無從「證明」最先的棋局,是對或錯。

統計學的看法—四種可能

典故強調王粲的強記,隱含測試失敗,就會引起對還原棋局的不信任。但即使測試失敗真的發生,也不能「保證」還原的棋局一定是錯的,有可能在測試過程中,倍感壓力,反而失去水準,然而失敗卻會誤導對還原棋局的認知。如果還原棋局是對的,但測試未過,而造成誤判,這種錯誤是「擺對譜,卻被誤認是錯的」。表一將四種可能整理在一起,其中兩種錯誤的推論,二種正確的推論。

表一:對棋局判定的所有可能

當然棋局的判定,不會是上述表格的唯一應用。可以利用類似的表格,分析常見藥商宣稱新藥比舊藥更安全、更有療效的所有可能情形。實際上新藥的效能只會有兩種可能:一是較有效,另一種則是沒有比較有效(包含新舊效能一樣或新藥更差),因此如何確認哪個選項,便成了一項重要的工作。而我們的決定也只有兩種,所以跟表一雷同,只有四種可能。仿造復原棋局的表格,可以得到表二。

表二:對新藥療效推論的可能情形

兩個表格,有一個共通性,都要確認某些「假設」:表一復原棋局的正確;表二則為新藥的療效。接著透過一些驗證的程序,像王粲重新復原另一次的棋局,到新舊藥的對照實驗,再根據結果,決定接受或拒絕「假設」。這樣的流程,在生活中不斷的上演,統計學給了這樣的流程,一個專有的名詞,稱為「假設檢定」(test of hypothesis)。在統計學上,如果要確認的「假設」為H0,一般化表示如表三。

從表三來看,錯誤有兩種分別稱為型一錯誤(H0正確卻誤認為非;type I error)與型二錯誤(H0 不正確卻誤認為真;type II error),一般統計學稱型一、型二錯誤的機率為αβ。最理想的狀況是錯誤不要發生,但從王粲的例子來看,這要求太高,在檢定過程中,無可避免會產生這兩種錯誤。那麼退而求其次呢?即使無法讓αβ同時為0 ,但同時讓它們變小呢?有句話說「魚與熊掌不能兼得」,統計的理論可以證明,在固定的樣本數下,αβ兩者有抵換(trade off)的效果,降低其中一個,會以提升另一個機率做為代價。科普文章,並不適合在理論的證明上大作「文章」,但這種概念會影響到如何選定被檢定的「假設」,有需要用例子說明這種取捨關係。

表三:假設檢定

一個檢定的例子

審判也是一種檢定,對「嫌疑犯是無罪」的假設做檢定如表四。以極端的情形為例,如果採用「寧可錯殺百,不可放過一」的酷吏心態,任何嫌疑犯,都判有罪,則有罪而被誤判無罪的錯誤不會發生,β=0。另一方面,即使嫌疑犯真的無罪,也一定被判有罪,型一錯誤α=1。

如果採取「完全相信人本無罪」,任何嫌疑犯都判無罪,根本不可能發生型一錯誤,α=0,但遺憾的是,β=1。「毋枉勿縱」的「毋枉」 是不要冤枉好人,不犯型一錯誤;而「毋縱」是不要縱放惡徒,不犯刑二錯誤。理想的「毋枉勿縱」,在統計學裡是α=0,且β=0,做不到。孟子在於魚與熊掌不能兼得下,「捨魚而取熊掌」。在固定的樣本數下,αβ不能兼顧,要取何者呢?

從現實的社會觀點切入,有犯罪行為而未被揭露的「犯罪黑數」,向來就不少,這與有罪而被誤判無罪的型二錯誤相同,而犯型一錯誤則冤枉了好人。權衡之下,降低型一錯誤,減少濫殺無辜的可能,雖然付出提高型二錯誤的代價,但因為犯罪黑數原本就存在,廣義的「縱放」並沒有因此增加多少,而原本無罪卻被冤枉,這種無中生有的事,不論對當事人或整個社會而言,是非常嚴重的事,於是捨棄β先顧α,讓冤獄變少再說,圖一說明對H0的態度與α的關係。

圖一:從α的機率來觀察對H0 的態度。

……【更多內容請閱讀科學月刊第517期】

參考資料
1. 黃文璋,《隨機思考論》,台北市,華泰文化, 2003 年。
2. Witte, R.S. & Witte, J. S.,蔡碧惠、邱心怡、游宜君等譯,《基礎統計學》,台北市,桂冠出版社, 2002 年。
3. 陳壽原,《三國志》,台灣商務, 2010 年。
4. 林品石註譯,呂氏春秋今註今譯,台灣商務, 2011 年。