〈時評〉民進黨需要的是「開放原始碼的市調機器人」

  184
照片來源:pixabay

照片來源:pixabay

民進黨的中執會於5月22日下午召開。這次中執會的目的是要解決民進黨總統候選人民調問題的爭議。在此次中執會的前一天,黨主席卓榮泰及參選人賴清德都強力表態,要求依3月13日公告的初選辦法只用市内電話,中執會開會的過程就如媒體所報導,我們暫時不做任何評論。這篇文章想聚焦來討論,到底納入手機民調時,手機與市電的比率應該是多少呢?

市電與手機比率分析

2週前我曾經投在「蘋果日報」文章提出各佔50%的說法。現在我深入研究台灣的實况後,提出至少手機要佔60%,甚至手機應該是可以佔到80%的道理。這完全是從統計學的觀點著手。

一、目前室內電話民調部份,是要用去年黃頁的電話大約350萬個號碼。而手機數總共有2,600萬支比台灣的人口數2,300萬人還多,其中有500萬人只有手機沒有室內電話。也就是說用室內電話做民調時,要使用外插法去推測,以比較小的350萬個號碼為抽樣母體,來對整個有投票權大約1,800萬人的行為做出推測。然而,如果是用手機的話就完全沒有這樣的問題,因為2,600萬支手機,比人口數還多,甚至比有投票權大約1,800萬人還多出800萬支手機,另外有500萬人只有手機沒有室內電話。

我們簡單來講,350萬有室內電話的家庭,沒有辦法精確去推測500萬個只有手機沒有市內電話的家庭的投票行為。那麼我認為單單由這一點,室內電話與手機的比例就應該是350萬比500萬,也就是說可以換成41比59,或者簡化應該是4:6,即室内電話佔40%、手機佔60%。

二、 另外一個更直觀的方法,我們可以這樣推論。平常台灣一個四口之家,有一支室內電話很可能有4支、甚至5支的手機。那麼市電與手機的比率應該是1:4,也就是說是室內電話20%、手機80%。

所以我認為,即使比例變成室內電話20%、手機佔80%,其實是台灣目前最合理的民意調查的比率。

民進黨需要的是「開放原始碼的市調機器人」

在詳述了這個理論之後我的建議:民進黨其實現在最需要的是一個「做市場調查的開放原始碼的機械人」,暫時稱為「智慧型市調機器人」。我認為由這個「智慧型市調機器人」來主持總統候選人民調,一定可以做到卓榮泰黨主席追求的「公開、公正、公平」的目的。

這個機器人的程式,其實概念上非常簡單,需要的是:

1、手機及市電的號碼來源資料庫,這些其實是公開的。

2、手機及市電兩者間的比例。而我目前認為最合理的比例是手機80%、市電20%,其道理如上述。

3、一個接近完美的亂數產生器,這方面的演算法有很多種,所有資訊工程系的學生上課時都學過。像我做基因演算法研究的人,在1992年回台灣就開始教基因演算法這門課,其中最重要的基礎就是「亂數產生器」,這方面如果需要的話,我可以找學生們提供給民進黨。

4、如果民進黨有足夠的錢,應該用10,000個號碼,而不是目前大家慣用的1,200個號碼,或者稍微修正的3,000個號碼。因為10,000個號碼時統計誤差是正負1%,1200個號碼時的誤差是正負3%,來回之下就會產生要超過6%才是統計有效的爭議,這樣統計方面的爭議應該要避免。

5、接下來,就是開放原始碼。而且可以將這個計劃整個包給幾個公司來進行,或者在民進黨中央建置一套電腦系統來進行。民進黨如果需要的話,我可以請我的學生們去支援,我的學生中有包括318太陽花學運時發動g0v的高嘉良等人,都可以支援建置這些程式。

6、使用窮舉法:將可能的狀況都納入。例如,是否包含柯P以及國民黨的候選人韓國瑜、郭台銘等全部納入考量。也就是說與郭台銘做一次對比、與韓國瑜做一次對比、與郭台銘及柯P「三脚督」做一次對比、再與韓國瑜及柯P「三脚督」一次對比。這樣總共做4次對比,收集到所有的可能性的資料,作為日後民進黨考慮提名時的決策資料。這樣才不會像522當天柯P出國前夕,諷刺說如果我不選了,那是不是(國民黨的)民調要重做。