〈時評〉台語、客語與人工智慧

數日前AlphaGo軟體打敗了圍棋棋王柯潔,此軟體在圍棋界已經是所向無敵了。 (來源 中央社)

5月26日立法院三讀通過原住民語言為國家語言。這真是一個可喜可賀的進展!我們也看到管碧玲立委問了一個問題 : 那麼台語、客語呢?台語、客語是不是也應該列為國家語言呢?其實這是一個很重大的政治問題。此大哉問令我想起在十幾年前我寫國科會計畫時往事,當時我想研究台語文,但評審意見「這個題目不值得研究!」

數日前AlphaGo軟體打敗了圍棋棋王柯潔,此軟體在圍棋界已經是所向無敵了,於是Google此軟體的開發團隊宣佈這個軟體立即退役,不再參加任何比賽。

我認為此決定最主要原因是接下來硬體的進展,Google軟體AlphaGo的棋力只會增加不會減少,而人類的極致當今的棋王柯潔目前都沒有辦法打敗它,接下來就更困難了。AlphaGo若繼續留下參賽,終就會被其他下圍棋的軟體打敗,於是在最高點急流勇退。

其實用下棋軟體來展現電腦的人工智慧的實力,並不是 Google首創。大約20年前,深藍(Deep Blue)由IBM開發,專門用以分析西洋棋的超級電腦。1997年5月曾擊敗西洋棋世界冠軍卡斯巴羅夫,當時軟體與人類互有勝敗。過了這十年,下棋的程式已經可以所向無敵了。AlphaGo是專攻複雜度更高的圍棋。

不只是下棋、遊戲,最後都可用軟體戰勝人類。例如很多人瘋迷的「數獨」遊戲,我們可不可以寫一個程式來解這個問題呢?當然可以。事實上,五年前我還在台大教「資訊與社會」的時候,曾開一堂課介紹「基因演算法」。我給學生作業就是寫一個程式來做所有的「數獨」,這個程式眼睛部分比較難,腦的部分其實非常容易寫。基本上只要對於每一個「排法」給一個合理的分數,這樣就可以。當然這個「排法」的產生過程裡面,盡量能夠滿足這一個特定的「數獨」遊戲的要求,也就是說橫的來看每一個數字只能出現一次,豎的來看也是一樣,0至9之間每一個數字只能出現一次。靠這遺傳演算法及適當的給分方式,就可以使得「數獨」的遊戲得到解答了。

另一個展示人工智慧的能力,就是語言處理及眼睛的辨識能力。簡單講,電腦要有嘴巴、眼睛、耳朵的功能,下棋表示電腦有很好的腦力推理功能。其實眼睛、耳朵、嘴巴所處理的問題,從電腦程式計算複雜度來看,基本上是類似複雜的。那麼如何把這些軟體做好呢?

我們看到最近的一則新聞,和碩董事長童子賢提到和碩公司人工智慧的團隊,目前有大約100人。童子賢董事長同時也是台北市電腦公會的理事長,他認為台灣的人工智慧應該有發展的前途,人工智慧有2個面向,一個是標準的制定,一個是應用層面。

其實,台灣最應該做的是將一些應用程式做好。舉例子來說,在2005年我擔任資策會副董事長期間,曾經有一家美國很主要開發安全系統的公司來推銷他們所謂911系統。他告訴我,他們在德州911系統電話過來的時候能夠做得多好又多好。我只問他一句話:「那你的911系統可以聽懂我們台語嗎?」他就當場傻眼了。我們在台灣碰到的問題,台灣人講的英文並不是非常標準,甚至於文法都有錯。如要在醫院應用的話,那很可能就需要用台語文來講。所以我曾在台大開了一個課程「台語文計算語言學」。很可惜,這個課程選的人不多。記得在2003年的時候,我也曾經在洛杉磯及舊金山的台灣中心演講,演講題目「尋找一個書寫台文的可行方式」。同樣題目我也在台灣四個扶輪社共同的大會上演講過,演講的內容網路上可以尋找到。

我當時一直希望能夠把台灣社會需要的「眼睛、耳朵、及嘴巴」都做出來。

當時我有一個提議,就是做個台語文語音系統。例如牧師講道的時候,牧師可以選擇用自己的聲音,也可以用電腦和成的聲音來傳達。而這個電腦和成的聲音,我當時想找一位很重要的人士,就是李登輝前總統。因為李前總統曾經說過,他退休以後要去當牧師傳教。自2005年起到今天為止,李前總統還沒有真正去做牧師傳教。

所以我想了一個方法,希望給李前總統一組簡單的錄音道具,每天早上當他在讀經或禱告的時候,把它唸出來錄下來,或者是他平常有訪客講話的時候,也可以錄起來。那我們就可以從李前總統這些錄音檔中,做語音辨識及語音和成的工作。完成後再將系統公開在網路上,當一個牧師用羅馬字寫好台語的稿子,就可以利用語音合成的方式,以李前總統的聲音,將它唸出來。這就是我在十多年前曾經想做的事情。當年我曾幾次親自將請求信送交李前總統。但是我跟他的辦公室聯絡的時候,都被擋掉了,實在是可惜!

另外關於電腦遊戲,我在資策會時曾想推動電遊及動漫相關的軟體研發工作。結果當時的執行長反對,他跟我說這不是資策會的核心工作。隔了十多年了,我們看到電腦動漫正夯,語言處理等人工智慧,確實是下世代的軟體。想起來真是可悲!!

台灣一直重視電腦硬體,而沒有能夠好好將軟體發展出來。例如資策會執行長,到今天為止還沒有一個是真正真正學軟體的人。因此,我們國家資訊業的發展方向軟體非常弱,也就不足為奇了!