“後進生”切大模型蛋糕:字節“賽馬”機制或面臨資金挑戰

“入局晚,發力強”,這是行業對於字節跳動(以下簡稱“字節”)AI(人工智能)的整體印象,但在此之下,字節也大都是以產品爲核心,結合自身生態發力,現在字節又釋放出了一個新目標——追尋AGI。

據晚點latepost報道,字節旗下豆包大模型團隊日前正式設立了一個代號爲“Seed Edge”的研究項目,鼓勵項目成員探索更長週期、不確定的和大膽的AGI研究課題。

接近字節的知情人士透露,Seed Edge的目標是探索AGI的新方法,代號名中“Seed”即豆包大模型團隊名稱,“Edge”代表最前沿的AGI探索。Seed Edge鼓勵跨模態、跨團隊合作,爲項目成員提供寬鬆的研究環境,實行採用更長週期的考覈方式,以保障挑戰真正顛覆性的AGI課題。同時,Seed Edge也將得到單獨的算力資源保障。

報道稱,該項目已初步確定了五大研究方向,包括探索推理能力的邊界、探索感知能力的邊界、探索軟硬一體的下一代模型設計、探索下一代AI學習範式、探索下一個scaling(規模)方向。

與此同時,一個消息開始在社交媒體流傳:字節2025年在人工智能基礎設施上投入超120億美元,其中爲2025年購買AI芯片準備了400億元人民幣,是2024年支出的兩倍。另計劃在海外投資約68億美元。此外,還有消息稱,公司計劃2025年斥資至多70億美元購買英偉達芯片。

模型價格業界最低,還有高毛利

對此,字節跳動相關人士迴應稱:相關消息並不準確。字節跳動非常重視人工智能領域的發展與投入,但相關預算與規劃傳聞並不正確。

字節雖然否認,但行業還是對此感到壓力,作爲AI的“後進生”,字節正在發揮自己“大力出奇跡”的長處,向大模型砸錢、砸資源。僅2024年,字節在AI領域投入就達到800億元。

據瞭解,字節跳動創始人張一鳴雖然在2021年卸任CEO,但仍然深度參與集團的AI戰略佈局。多位公司內部人士透露,張一鳴不僅親自負責從競爭對手公司招攬中國AI人才,還多次在內部強調追求“通用人工智能”的目標。

在產品端,字節近日也是強勢出擊。1 月 22 日,字節迭代豆包基礎模型剛過一個月,又發佈融合多模態能力的豆包 1.5 Pro 模型,稱 “用較小激活參數,即可比肩一流超大稠密預訓練模型的性能”。

豆包 1.5 Pro 是一個 MoE(混合專家系統)模型,此類模型解決問題時不用激活模型所有參數,能提升計算效率、降低成本。MoE 模型的性能通常用能力相同的稠密模型(解決問題時激活所有參數)的總參數量和 MoE 模型的激活參數量的比值來確定,這被稱爲 “性能槓桿”,業界此前的普遍水平爲不到 3 倍。

字節稱,用完全相同的部分訓練數據(9T tokens)對比驗證,他們優化後的 MoE 架構,僅需激活性能相當的稠密模型 1/7 的參數量,就能有更好表現,性能槓桿提升至 7 倍。

數據顯示,截至2024年12月中旬,豆包通用模型的日均tokens使用量已超過4萬億。1月份的數據應該會更高,“1.5pro可以說是讓豆包穩穩站進了國內大模型第一梯隊。”一位行業人士如是說。

二級市場率先嗅到這一變化,2024年12月之後,A股市場人工智能(AI)題材的熱度持續升溫,尤其是豆包概念股,在Kimi概念股、智譜概念股之後,成爲了市場上的新寵。

近三日,豆包概念股開啓強勢上漲,其中包括深度參與字節硬件合作,爲相關智能硬件設備接入豆包大模型提供支持的樂鑫科技(688018.SH),爲豆包AI玩具提供芯片模組的移遠通信(603236.SH),爲豆包大模型提供強大數據存儲和運算支持的字節跳動數據中心供應商潤澤科技(300442.SZ)等等。

1月23日,抖音豆包概念股震盪走強,漢得信息(300170)20CM漲停,久其軟件(002279)漲停,彩訊股份(300634)、佳雲科技(300242)、天龍集團(300063)、值得買(300785)、易點天下(301171)等跟漲。

《財中社》發現,字節AI戰略當下有兩個特點,一方面字節不斷升級模型能力,不斷積累人才,追尋AGI,張一鳴本人也參與其中,無論是行業影響力,還是用戶心智,都在向國內頂級AI公司邁進,一改此前“利用ChatGPT生成數據進行預訓練”的負面口碑;另一方面,在用戶規模、產品生態等優勢加持下,字節可以不斷壓低模型價格,依舊可以保持高利潤率。

界面報道稱,豆包大模型2024年大幅降價後,毛利率依然爲正。其中,字節最新推出的豆包大模型1.5,在推理成本優化上取得進一步突破。在火山引擎上售賣API的Doubao-1.5-pro,毛利率仍能達到50%。

字節認爲原因主要有兩個:

一方面,豆包大模型的調用量在快速增長。字節對外公佈的數據顯示,截至2024年12月中旬,豆包通用模型的日均tokens使用量已超過4萬億,較首次發佈時增長了33倍。

另一方面,豆包大模型的能力快速提升,但成本仍在持續降低。1月22日,字節發佈了豆包大模型1.5Pro,性能比之前版本顯著增強,多項基準測試甚至超過GPT4o,推理成本卻大幅降低。

據火山引擎官網,Doubao-1.5-pro-32k的百萬tokens輸入價格仍爲0.8元,命中緩存爲0.16元,輸出價格爲2元;輕量化版本Doubao-1.5-lite-32k的百萬tokens輸入價格0.3元,命中緩存0.06元,輸出價格0.6元。兩款模型價格在業界同級別最低。

目前,字節系AI產品全線已經全面鋪開,幾乎包含了當下AI行業所有賽道。據字節介紹,豆包大模型是一個具備多模態能力的“模型家族”,包括通用模型 pro/lite、角色扮演模型、語音識別模型、文生圖模型等 11 款 模型,2023 年 8 月通過備案並上線,2024 年 5 月正式發佈。豆包已被應用於字節跳動旗下的 多個業務中,包括抖音、巨量引擎、飛書等 50 多個業務。在 C 端產 品方面,基於自研的豆包大模型,推出多款垂類應用,包括豆包、 星繪、即夢、貓箱、釦子等,覆蓋內容、社交、創作等多個場景。

多輪“賽馬”,“APP工廠”歸來

在此“大力出奇跡”的動作之下,許多AI行業人士感覺到,移動互聯網時期的那個“APP工廠”回來了。而App工廠名不虛傳的背後,是字節的賽馬機制。

據硅星人報道,去年開始字節內部就形成了多輪“賽馬”制:

第一階段,創新產品中心負責前期孵化、產品創意、內部審覈以及完成產品的前期打造,到產品測試上線。在這個階段幾乎不會有流量支持,靠產品自身的形態吸引自然用戶;

進入第二階段的產品,開始可以拿到一部分初始預算進行外部推廣,由專門負責增長的團隊負責拉新留存,進行產品排名,數據表現好結合內部分析,從創新產品中心進入到具體的產品組;

而第三階段,成型的產品開始進行大規模推廣,如「貓箱」、「星繪」從2024年年底開始在抖音投流以及通過KOL推廣。

字節AI產品今天的突飛猛進,是其賽馬機制下,一套屢試不爽的產品開發方法論加持的結果。但與移動互聯網時代字節的“生產體系”很不同的是,今天在底層的模型側,字節也在進行着賽馬。

字節可能寄希望於它也像應用一樣,百花齊放後篩選出最強的那一個,但是大模型時代,“燒錢”已經是常態,尤其在模型能力增長方面,即使是“不差錢”的字節,面對OpenAI、xAI等動輒數十億美元的融資,也將面臨挑戰。

如果您有新聞線索,請聯繫我們:newsroom@caizhongshe.cn