當今人工智慧(AI)正以前所未有的速度改變各行各業的面貌,成為人類解決各類難題的重要工具。美國科技巨擘 Google 近期在 AI 應用上的創新,更令全球為之驚艷,其技術的發展潛力,幾乎難以想像。
據科技新聞網站 Interesting Engineering,近來 Google 利用 AI 達成了一項看似不可能的成就。他們透過大型語言模型(large language model,LLM)使人類能理解海豚的行為並與之對話。
AI 與海豚的對話:劃時代的技術
Google 研究人員目前正在測試這款名為 DolphinGemma 的大型語言模型以及其附屬的 Cetacean Hearing Augmentation Telemetry(CHAT)系統,確認這項發明是否能識別語音和模擬海豚的溝通模式。
智慧海洋生物的代表-海豚
海豚被公認為是地球上最聰明的海洋生物之一,牠們高度複雜的社交行為,長期以來是美國 Wild Dolphin Project(WDP)的研究對象。四十多年來,該研究團隊在巴哈馬周邊海域持續蒐集大量水下音頻與影像資料,為海豚溝通行為的研究奠定了基礎。
這群研究員已成功將海豚的聲音訊號與各種行為建立關聯,從求偶過程的互動到彼此爭執,皆可從牠們的聲音中觀察到蛛絲馬跡。
儘管研究人員堅信人類與鯨豚之間的溝通是可能的,但過去礙於技術不發達,人類無法輕易解讀或重建牠們在水中發出的口哨、點擊聲(clicks)與鯨豚獨有的「爆裂脈衝聲」(burst-pulse sounds),因此這項任務長期被視為天方夜譚。
DolphinGemma :AI 的創新應用
隨著大型語言模型的興起,研究人員開始思考是否可以將此模型的原理應用到與海豚的互動中。於是,Google 與 WDP 及喬治亞理工學院(Georgia Institute of Technology)合作訓練了這套大型語言模型。
這次的三方合作催生了 DolphinGemma,這款 AI 模型基於 Google Gemini 系統技術,內建約 4 億個參數。它的運作方式與 ChatGPT 類似,能夠讓人類初步與海豚進行對話。
DolphinGemma 的運作模式
DolphinGemma 能夠接收、解讀並重現海豚發出的音頻信號,並將這些信號與安裝在 Google Pixel 手機上的 CHAT 系統進行配對。雖然目前 CHAT 還無法完整翻譯海豚發出的聲響,但已能協助人類與海豚建立一種簡單的共享語言,作為跨物種溝通的起點。
這套系統的最終目標,是要教導巴哈馬海域的海豚利用口哨聲來發出請求。研究人員指出,不同的口哨聲對應不同的物品。科學家希望海豚能學會使用特定的口哨聲來「點菜」,也就是主動請求牠們想要的物品。
儘管這項技術仍需經過大量的數據分析與測試,才能真正彌合人類與海豚之間的溝通差距。然而,這套語言模型的應用,不僅提升人類對海豚及其他海洋哺乳動物的了解,更開啟人類與海豚對話的可能。