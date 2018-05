台灣瘋選舉不是什麼新鮮事,為了奪得勝利,參選人總是花招百出。黨內初選總是參選人必須通過的第一關,因此相信你/妳應該曾經接過「電話民調」或是看過電視廣告「唯一支持XXX」吧。但你知道嗎?台灣從過去到現在所做的民調大多有問題,無論是路邊民調還是電話民調又或是網路民調,都有問題。為何如此說呢?不論政黨顏色,你可曾記得有哪一個民調結果與選舉結果接近嗎?答案顯而易見的,可以從選舉結果看到與民調大相逕庭,最後導致大家根本不相信民調。本篇除了探討何謂民調之外,更要進一步的剖析我國民調的問題。

【為什麼民調無用】

民調為何令人難以相信?我們身為公民、對於台灣的選舉不僅有「決定權」更可以在民主自由的環境下,表達自己的政治理念與想法,然而近年的民調結果往往跌破我們的眼鏡,因為民調結果與選舉結果差太多,使得民眾不信政府或坊間的民調。並讓很多人認為「民調是信者恆信、不信者恆不信」的自我催眠,因此不同政黨對於他黨所做的民調皆持懷疑的態度多過「相信」,或者認為民調只是強化自己與選民間的一種安慰劑;在有心與無心間操作而成的,因此沒有實際效用。

作者認為,真正的民調理應透過第三方公正且客觀的民調公司,來執行較為公允也更值得信賴。然而,有效民調並不好做,因為要說明母體並隨機抽樣到一定的人數、及設計出一份合適的問卷、並正確使用統計這個數學工具,才能得到一份不失公允的民調結果。

因此,正確的使用統計不僅不會騙人還能揭露真實的民意,唯有被有心人士濫用統計,才會做出錯誤民調,才會刻意扭曲真正的聲音。

統計絕不會是英國前首相班傑明·迪斯雷利(Benjamin Disraeli)所說的那麼不堪:「世界上有三種謊言:謊言,該死的謊言,統計數字。」(There are three kinds of lies: lies, damned lies, and statistics)。我們要知道統計是個工具,不會騙人。會騙人的只有人,是人利用統計去騙人。

【民調有哪些問題】

接著下來,我們來探討今日的民調與過去的民調的作法有哪些是與時俱進?而在認識如何做正確民調前,我們先來看看台灣目前民調的錯誤,台灣的民調大多數情況沒有說明是針對哪一區域做抽樣,或沒有說明是如何抽樣,或沒有說明樣本數是多少,這樣我們要如何相信這樣的民調是可以接近母體的情況呢?

舉例來說,要做台北支持率的民調,直接說某某某的支持率為何,殊不知它是針對大安區抽樣還是針對全台北抽樣;以及我們也不清楚他的抽樣方法夠不夠隨機,總不能大安區多抽幾個,大同區少抽幾個;同時沒有說明抽樣的數量,總不能抽100人就想認為是足夠接近全台北人的支持率;最後是問卷的設計夠不夠客觀。

故作者可以歸納出較有問題的四大部分:

1.母體不明

2.抽樣方法錯誤

3.樣本數量錯誤

4.問卷設計有瑕疵

【民調應該怎麼做】

民調是一種統計方法,必須滿足統計的基本精神,見以下三點:

1.必須說明母體

2.使用隨機抽樣

3.抽樣數量夠多

隨機抽樣且數量夠多才真的可以代表母體,同時民調的問卷調查要有意義,不能方法錯誤失去隨機抽樣的意義,及不能有誘導式問答,這會導致結果失真。

舉例:想要做全台灣總統選舉人的民調,我們必須針對全台灣具有投票權的人做抽樣調查,而不能只對某一區域做抽樣調查;並且要夠隨機避免失真,作者建議應該從有投票權的人的身分證字號中,抽取一定數量來進行調查;同時抽取的數量應該基於統計建議的數量,利用統計上95%信心水準、誤差在2%以內,我們需要抽取2500人作為調查,而問卷也要夠客觀;最後才能稱呼此民調結果具有意義。

【名詞解釋】

何謂母體不明

觀察目前民調內容,絕大多數、幾乎所有的民調都沒有清楚指出抽樣的母體。舉例來說,如果要做全台的民調,但如果不說明母體為何,會讓人以為是對某個城市進行抽樣調查,換言之就是坐井觀天,以少數民意代表「全國人民發表意見」,而正確的作法應該要對台灣全部縣市進行隨機抽樣,見圖1右邊。而不是只對某一區的區域作抽樣,見圖1中間,會讓人有一種台北觀天下的感覺。

為了期望民調的結果是可以代表真實情況,必須全台灣進行隨機抽樣,見圖1左邊,所以一定要說明母體。舉例來說:如果是只做台北民調的國民黨支持率可能會是逾60%,但是如果是做全國民調的國民黨支持率不大可能還是60幾%。

圖1:左是母體,中是對台北抽樣,右是對全台灣抽樣

何謂抽樣方法錯誤

我們希望民調的結果會趨近真實情況,必須做隨機抽樣。什麼是隨機抽樣,我們以蘋果的圖片為例。

圖2

由圖2中間、右邊可以發現抽樣的區域應該要夠隨機,也就是夠均勻,才能看出「大致」情況。

由圖2中間可以發現數量越多,可以越接近實際情況。

但如果抽樣的區域太過偏頗則會看不出真實的結果,見圖3。

圖3

因此以蘋果圖片來看,僅集中抽樣某一區域就可能誤會該圖只有葉子,而非一顆蘋果。

換言之,民調如果只在某一區對1000人做抽樣,其結果是80%支持某事,然後說根據統計方法估計全台灣的民調近80%支持某事,這是錯誤的統計方法。

母體問題及抽樣問題乍看回答的方式很像,但要注意,太多民調都沒說明母體,僅說有隨機抽樣,就認為它隨機的程度足以代表母體,這是不對的,民調結果都應說明清楚母體為何、以及如何隨機抽樣兩個內容,才足以讓人接受民調的結果。

樣本數量錯誤

由上述「抽樣方法錯誤」的內容可知抽樣數量要夠大,但我們也知道不可能全部都調查,因為如果全都調查不僅費時、費力、更需投入不少金錢。但要選多少數量才能足夠精準呢?基本上數量越多越好,統計依據「信心水準」與「誤差」的容許度,能算出最低的隨機抽樣樣本數,見表1。

表1

統計上95%信心水準的意義是,基於常態分布,有95%的信心,如果隨機抽樣2500人這個支持率的誤差只會在2%以內,如果隨機抽樣1112人這個支持率的誤差只會在3%以內。99.7%信心水準的意義也是同理。