亞馬遜新版Alexa“換腦”,被曝因內部管理混亂,將延遲推出
智東西編譯 施佳璇編輯 程茜
智東西1月15日消息,據英國《金融時報》報道,大型科技集團亞馬遜升級版語音助手Alexa的推出延遲,或與內部管理問題有關。將大語言模型接入Alexa是順應用戶需求亦是時代所趨,而如何在已然強手如雲的生成式AI領域佔領有利生態位是個挑戰,亞馬遜正多方面尋求調整。
Alexa被期待功能多樣且強大,但因爲原有算法與大語言模型的融合不洽,目前推進困難,解決起來仍需時間。產業下游公司表示設備推出因此受阻。Alexa在安全性、可靠性、可預測性方面具有的問題是當前生成式AI所共有的,行業內尚未找到明確解決辦法,亞馬遜也在努力攻克中。
一、給Alexa裝上“大腦”,從語音助手轉變爲私人管家
亞馬遜的科技團隊積極處理困擾該AI系統改革的挑戰,因此正準備重新推出語音助手Alexa,試將其打造成能夠完成實際任務的AI代理。團隊正積極解決困擾該系統人工智能全面改革的挑戰。
這家市值2.4萬億美元的公司過去兩年來一直試圖重新設計Alexa,它的對話系統嵌入了全球範圍內5億消費者設備,運作方式從原先的算法系統變成了AI算法模型。
亞馬遜通用人工智能(AGI)的領隊Rohit Prasad告訴英國《金融時報》,這款語音助手在推出前仍需克服幾道技術障礙。
這包括解決“幻覺”或捏造答案、響應速度或“延遲”、可靠性問題。“捏造答案必須被降低到接近沒有。”Prasad說,“這仍然是行業內一個尚未知曉答案的問題,但我們正在極其努力地解決它。”
亞馬遜領導層的願景是將目前仍主要侷限於播放音樂、設置鬧鐘等簡單任務的Alexa轉變爲一個“代理型”產品,讓它充當個性化的私人管家,這可能包括從推薦餐廳到根據個人的睡眠週期調節臥室燈光等各種功能。
二、Alexa每週應對數十億次請求,需兼顧生成式AI新功能與原始優勢
自2022年底微軟支持的OpenAI推出ChatGPT以來,Alexa的重新設計工作便已啓動。當微軟、谷歌、Meta等公司迅速將生成式AI嵌入其計算平臺並增強了軟件的服務,批評者質疑亞馬遜是否能及時解決其技術和組織上的困境來與競爭對手抗衡。
據近年來曾在亞馬遜語音助手團隊工作的多名員工表示,Alexa的人工智能研究與開發經歷了很多年,因此團隊的相關工作一直飽受複雜情況困擾。
一些前員工稱,遲遲未能推出的原因主要是由於將Alexa所基於的更簡單、預先定義好的算法與更強大但不可預測的大型語言模型進行切換和結合時,研究團隊遇到了意想不到的困難。
對此,亞馬遜迴應,他們正“努力使語音助手能提供更加主動和強大的幫助”。亞馬遜還補充說,曾經從未有過像這樣大規模地將技術實施到一個全球用戶都在使用的實時服務和一系列設備中,這並非簡單地將大型語言模型疊加到Alexa服務上就能實現。
亞馬遜前Alexa首席架構師Prasad透露,公司上個月發佈的內部亞馬遜Nova模型——由其AGI團隊主導——部分出於對最優速度、成本、可靠性的特定需求,以幫助像Alexa這樣的AI應用“完成確實很難的最後一英里”。
Prasad說,若要作爲代理運行,Alexa的“大腦”必須能調用數百個第三方軟件和服務。
“有時我們低估了被整合到Alexa中的服務數量,它是一個龐大數字。這些應用每週會收到數十億次請求,所以當你試圖快速地採取可靠行動……你必須以一種非常划算的方式來實現。”他補充道。
複雜性源於Alexa用戶既期望快速響應又期望極高的準確度,而這些品質與基於語音和語言模式的統計性詞彙預測軟件,即當今生成式AI的固有概率性質相悖。
一些前員工還指出,在爲助手注入新的生成式功能(如創造力和自由流暢對話)的同時,保留其原始屬性(包括連貫性和功能性)存在困難。
據知情人士透露,由於大語言模型(LLM)更具聊天屬性,公司還計劃聘請專家來塑造AI的個性、聲音和措辭,來保持Alexa用戶的熟悉感。
三、規避“幻覺”不簡單,鍋在“技術和官僚問題”
一位前Alexa團隊高級成員分享,儘管大型語言模型非常複雜,它們也存在風險,比如有時會“完全憑空捏造答案”。亞馬遜說:“以亞馬遜的運營規模,這種情況可能每天都會發生很多次”,這會損害公司的品牌和聲譽。
去年6月, Alexa的前機器學習科學家、“對話建模團隊(conversational modelling team)”的創始成員Mihail Eric分享,亞馬遜在使Alexa成爲“無可爭議的對話式AI市場領導者”方面錯失良機。儘管擁有強大的科研人才和“巨大”的財力資源,公司卻“充斥着技術和官僚問題”,暗指“數據標註不當”以及“說明要麼不存在要麼過時”。
據兩位從事與Alexa相關AI工作的亞馬遜前員工透露,支撐語音助手的歷來技術一直不夠靈活、難快速改善,是受到笨拙且雜亂無章的代碼庫以及“過於扁平式分散”的工程團隊的拖累。
最初的Alexa軟件是基於2012年亞馬遜從英國初創公司Evi收購的技術構建的,它是一個問答機器,通過在既定的事實範圍內搜索來找到正確的回答,比如當天的天氣或你音樂庫中的一首特定歌曲。
新的Alexa使用多種不同的AI模型來識別和翻譯語音提問並生成回答,並且識別違規行爲,例如篩選出不恰當的回答和“幻覺”。構建軟件在舊系統和新AI模型之間進行轉換一直是Alexa與大型語言模型整合過程中的主要障礙。
這些模型包括亞馬遜自己最新的Nova模型,以及生成式AI初創公司Anthropic的AI模型Claude(過去18個月里亞馬遜已向其投資80億美元)。
他補充道,代理型AI軟件需要達到“人們對系統真的信任”的程度。“一旦我們達到這一點,我們將發佈這些系統。”
一位現任員工表示更多步驟仍被需要,例如疊加兒童安全過濾器並測試Alexa的自定義集成(如智能燈和Ring門鈴)。
“可靠性是問題——讓它接近100%的時間都能正常工作。”該員工補充道,“這就是爲什麼你會看到我們……或蘋果或谷歌推出產品緩慢且漸進。”
衆多爲Alexa開發“技能”或功能的第三方公司表示,他們不確定新的可適用生成式AI的設備何時會推出、如何爲它創建新功能。
“我們正在等待細節和理解。”瑞典內容開發商Wanderword的聯合創始人Thomas Lindgren說,“我們剛開始合作時他們開放得多……隨着時間推移他們已然變化。”
另一位合作伙伴表示,在最初亞馬遜對開發者“施壓”讓他們開始爲下一代Alexa做好準備的一段時間後,事情變得安靜了。
結語:亞馬遜Alexa團隊的長期挑戰:走出裁員陰影,攻克盈利難關
對於亞馬遜的Alexa團隊來說,在遭受了2023年大規模裁員的打擊後,一個長期的挑戰是如何賺錢。弄清楚如何讓助手“足夠便宜以實現大規模運行”將是一項重大任務,該團隊生成式AI組織(OctoAI)的聯合創始人Jared Roesch說。
一位前Alexa員工稱,正在討論的選項包括創建一個新的Alexa訂閱服務,或者從商品和服務銷售中抽取一定比例的分成。
Prasad表示,亞馬遜的目標是創建超越Alexa的可以作爲各種應用“構建模塊”的多種AI模型。
“我們始終立足於的是用戶和實用AI,我們不是爲了科學而科學。”Prasad說,“我們這麼做……是爲了給用戶傳遞價值和創造影響,這在這個生成式AI的時代變得比以往任何時候都更重要,因爲用戶希望看到投資的回報。”
來源:英國《金融時報》