紐約州立大學賓漢姆頓分校(Binghamton University, State University of New York)研究人員開發了一款能說話的機器導盲犬系統,能提供即時導航協助,並與使用者進行雙向互動,大幅提升使用安全。
據科技新聞 Interesting Engineering,這套系統利用大型語言模型指引視障人士前往目的地,同時能描述沿途的環境與障礙物。與傳統導盲犬不同的是,這隻機器狗能在出發前解釋路線,並在行進途中持續更新資訊。
早期的研究主要讓機器狗透過物理信號,例如拉繫牽繩來回應使用者的指令,而該大學開發的最新版本加入了對話功能,使用者可以透過語音指令與機器狗系統互動。
團隊其中一位研究員張世奇(Shiqi Zhang,音譯)表示,真實的導盲犬在訓練下最多只能理解約 20 個指令;但機器導盲犬搭配 OpenAI 開發的大型語言模型 GPT-4 語音指令後,就能與使用者進行互動。
從「汪汪」到「對話」
這套機器狗系統融合兩大特色:路線說明(plan verbalization)與場景描述(scene verbalization)。
- 出發前,機器狗會列出可能的路線與預估行程時間。
- 行進中,它會即時描述周遭環境與路況,幫助使用者更清楚了解場景。
為測試機器狗與 AI 工具結合的效果,研究團隊招募了七名盲人在室內辦公環境中參與測試。機器狗會先詢問使用者欲前往的目的地,接著提供路線選擇。選定路線後,它會逐步引導使用者,提供語音回饋描述周遭環境直到抵達目的地為止。
對話式導航強化安全
使用者在體驗系統後,對其易用性與效果進行評估。結果顯示,他們傾向出發前提供路線說明,並搭配行進中即時環境描述的方式。團隊的模擬研究也顯示,對話式導航能提升使用者的安全感與掌控感。
研究人員表示,未來將進一步提升機器狗的自主能力,並擴展到室外或更複雜的環境,甚至進行長距離導航測試。此外,團隊目標讓機器導盲犬成為實用的輔助工具,藉由行動支援與結合智慧對話,幫助視障人士生活更便利。




