用臺語打造AI翻譯系統 Meta陳鵬仁:開民宿伯父想買
Meta日前發佈用閩南語(臺語)與英語互譯的AI軟體,主要幕後功臣爲陳鵬仁,出生於臺灣的他,曾在新北市板橋居住20多年,畢業於臺灣大學資訊工程學系,在臺工作1年多後即加入Meta公司前身臉書的紐約辦公室。
在Meta工作近10年的陳鵬仁,主要負責AI相關,臉書的地點打卡功能精進就由他操刀,4年前研發文字翻譯,1年半前轉爲研究語音對語音翻譯。
陳鵬仁接受媒體訪問時坦言,這套系統獲得媒體關注感到十分意外,新聞報導出來後,伯父透過父親詢問是否有販賣,因爲伯父經營民宿,不太懂英文,如果有這套軟體,未來接待國外觀光客會方便許多。
他談到,閩南語是很複雜語言,儘管開發團隊成員大多聽得懂、會講臺語,但牽涉到七聲八調,開發難度大增,翻譯系統發出來的聲音有時候腔調不對,需要找出新的研究課題設法解決,這是開發閩南語翻譯系統比較特別部分。
在研究過程中,陳鵬仁和團隊也有進行使用者意見調查,找出語音到語音翻譯系統有哪些特性,因此接觸到一些閩南語使用者,對於這項專案都非常熱情,提供很多建議。團隊甚至找來一名閩南語老師,協助團隊更精準翻譯閩南語。
被問及在美國工作如何讓小孩學會閩南語,陳鵬仁表示,有跟太太討論如何把閩南語帶到日常生活中,讓小孩自然而然熟悉這個語言。他的大女兒目前約4歲半,小女兒約1歲半,有透過一些輔助教材讓她們熟悉閩南語,例如睡前讀閩南語繪本,或跟小孩一起聽閩南語兒歌及流行音樂。
陳鵬仁透露,現在有越來越多以閩南語爲主的Podcast,講一些有趣素材,自己平常走路或送女兒去學校時會收聽。YouTube上也有很多自媒體用閩南語介紹有趣事情,透過這些方法可以維持聽力。說的部分在家裡跟小朋友講,保持對閩南語的熟悉度,遇到有些字真的不會講,臺灣也有很多相關網站可以查詢。
他說,在工作上可以做一個專案,打造出自己聽得懂的翻譯系統,覺得很幸運也很開心,過程中也學習更多閩南語知識,例如本來不知道七聲八調怎麼講,一方面是爲了工作,另一方面是自己也想了解。
陳鵬仁強調,對翻譯系統而言,語料收集是很困難的部分,即使有語料資料,但授權不明確就難以使用。如果能引起外界更多重視,在推動閩南語翻譯系統和AI應用落地會有很大幫助,畢竟這不是單一機構或個人可以完成的事情。
提到翻譯系統下一步規劃,陳鵬仁表示,希望繼續提升精準度,解決閩南語變調問題,因爲閩南語有聲調和各種不同語氣來表達問句或肯定句,都不是透過文字可以表達,會是接下來研究重點。
媒體提問未來是否可能納入如客家話或原住民語等其他臺灣在地語言,陳鵬仁表示「有可能」,對於接下來要選擇哪些語言,Meta團隊還在討論,客語確實是考慮的語言之一,會評估不同因素來決定哪些語言優先發展,再繼續擴張。(編輯:潘羿菁)1111027