實時翻譯、解說加聊天…… 科技公司爲何紛紛佈局AI耳機?

2024年,被很多人看作是AI硬件的元年,不少有趣的AI可穿戴設備在這一年誕生,其中就包括AI耳機。AI耳機的好處在於,在充分利用AI感知能力的同時,最大限度地優化了便捷性,與手機形成了明顯的差異化。

科技大廠佈局AI耳機

隨着手機中音頻、視頻內容佔比的逐漸增加,人們對長時間佩戴耳機的需求越來越大。這標誌着耳機從僅用於聽音樂或打電話的單一功能,轉變爲多功能普適性產品,成爲接收各類多媒體信息的設備。也就是說,耳機已經能夠完成多媒體內容與日常信息交流的處理,論重要性、計算能力它已成爲僅次於手機的第二大可攜帶計算設備。從目前看,多家科技大廠有意佈局AI耳機並且有所行動。

據國外媒體報道,Meta平臺正在探索開發帶有攝像頭的人工智能耳機,希望這種設備能用來識別物體和翻譯外語。這個項目在Meta內部被稱爲“Camerabuds”。OpenAI則有消息傳出,正在探索開發帶攝像頭的耳機設備。不僅如此,蘋果也在探索在其耳機中加入攝像頭和AI。

今年4月,Alphabet旗下實驗室GoogleX孵化的Iyo公司,推出了一款AI藍牙耳機IyoOne。它的外觀是一副體型更大的藍牙耳機,沒有屏幕,專注於自然語言的語音交互。在應用場景上,比如收到郵件或短信時,不必拿出手機、滑動、打字,完全可以一邊坐着喝咖啡,一邊用耳朵和嘴巴收發信息。

錄音轉寫實時翻譯方便辦公

國內方面,科大訊飛近兩年推出數款面向辦公場景的AI耳機。它們搭載了先進的AI技術,具備精準的語音識別、錄音轉寫、實時翻譯和AI總結及問答等功能,能夠輕鬆應對各種會議商務和學習等場景,爲用戶提供高效、便捷的溝通體驗。

2024年4月,智能聲學品牌Cleer發佈了全球首款開放式AI耳機CleerARC3音弧,面向的則是個人生活場景。該款耳機中內置了AI運動算法,可幫助用戶實時監控運動生理數據;在交互上集成了出門問問的語音控制技術,升級了AI語音控制,無須提示詞喚醒語音助手,使用“下一首”“接聽電話”等快捷口令即可進行相應操作;另外還實現了AI降噪效果。

接入大模型擁有通用智能

近日,字節跳動旗下豆包發佈了首款AI智能體耳機OlaFriend。該款耳機接入豆包大模型,並與豆包App深度結合。用戶戴上耳機後,無須打開手機,便能通過語音,調用手機上的App進行交流。由於耳機接入大模型後擁有了通用智能,因此在旅遊、英語學習、聊天等場景中有了新的體驗。比如遊覽博物館、藝術館時,用戶可以向它詢問展品、藝術品的由來及背景,它還能延展至朝代變遷、藝術家理念等話題,一定程度上充當了導遊角色,非常便捷。此外,針對一些“突發奇想”的閒聊和情緒表達,它的回覆也非常親切,能夠表現出高興、意外等情緒,讓用戶能夠像和朋友聊天一樣與AI交流。並且,用戶在溝通時可以“邊聽邊說、隨時打斷”,還能隨時切換話題。

此外,還有一些耳機廠商通過爲耳機充電盒上加入屏幕,並且通過配備SIM卡槽、搭載深度定製的操作系統,以及引入AI功能來增強產品的競爭力,比如iKKOActiveBuds就是這種設計思路的產物。它內置獨立智能系統,將耳機與移動通信、AI語音、翻譯等功能融合在一起,支持超過45種語言的雙向實時翻譯,無須額外設備即可實現。並且,由於可以通過SIM卡獨立網絡連接,跑步時不帶手機,也可通過耳機流量聆聽愛心歌單,打電話發短信等。

文/本報記者陳斯