☰

大模型融資競賽提速，“AI六小龍”齊讓路大廠？

近日，有報道稱人工智能領域新星Anthropic正在進行一筆高達20億美元的融資談判，該輪融資由Lightspeed Venture Partners（光速創投）領投。

自2021年成立以來，Anthropic已從Menlo Park Ventures等VC以及亞馬遜、谷歌和 Salesforce等科技巨頭獲得超過113億美元的資金。最新一輪融資完成後，Anthropic估值將達到600億美元，較一年前的180億美元估值翻了三倍多。600億美元的估值意味着Anthropic將躋身美國估值最高的五大創業公司，僅次於SpaceX、OpenAI、Stripe和Databricks。

最近，海內外模型廠商相繼開啓了新一輪融資。上個月，馬斯克的大模型平臺xAI完成了60億美元的C輪融資，市場估值超過400億美元。國內模型廠商方面，2024年12月11日，面壁智能宣佈完成新一輪數億元融資；12月17日，智譜AI獲得新一輪30億元融資；12月23日，階躍星辰完成了數億美元的B輪融資。

火熱背後，傳出異動。李開復創立的零一萬物被曝要將團隊整體打包賣給阿里，雖然李開復連夜在朋友圈闢謠否認出售，但零一萬物明顯減少了對基礎大模型的押注。多位投資人、業內高管向時代週報記者透露，“AI六小龍”普遍已不在預訓練方面傾斜更多精力。

Anthropic的市場期待已高於OpenAI？

Anthropic由一對在美國舊金山的意大利裔美籍兄妹創立，兩人都是OpenAI的早期員工。公司成立兩個月後，A輪融資就籌集了1.24億美元；一年後拿下5.8億美元的B輪融資，團隊隨之擴展到40多人。

Anthropic的大語言模型Claude，被認爲是OpenAI ChatGPT的最大競爭對手。Claude主要被應用在B端銷售、營銷和客戶服務等領域。據瞭解，Anthropic目前的年化收入約爲8.75億美元，主要來自B端客戶，按照600億美元估值計算，Anthropic估值/收入比約68.6倍；OpenAI的最新估值爲1570億美元，預計2024年收入爲37億美元，估值/收入比約爲42.4倍，這意味着市場對Anthropic寄予了高度期待。

與背靠微軟的OpenAI相比，Anthropic背後的支持者並不遜色，這些公司都希望全力爭奪未來十年內市場收入超過1萬億美元的AI份額。

作爲Anthropic的重要支持者，亞馬遜在去年11月追加了40億美元投資，成爲Anthropic的最大投資者。同時，Anthropic也承諾使用亞馬遜雲科技的自研芯片Trainium和 Inferentia來訓練和部署其人工智能模型；谷歌此前也表示向Anthropic投資20億美元，並已確認持有該公司10%的股份，同時兩家公司之間簽訂了一份大型雲計算合同。

Anthropic在去年加大了研發力度，技術和產品迭代加速。去年9月，Anthropic推出了Claude Enterprise，這是自其聊天機器人Claude問世以來最大的產品更新，專爲希望將人工智能技術集成到業務中的企業設計。早些時候，Anthropic還推出了更強大的AI模型Claude 3.5 Sonnet。

2024年10月，Anthropic宣佈其AI智能體能夠像人類一樣使用計算機完成複雜任務。據介紹，Anthropic的“計算機使用能力”新功能使其能夠與計算機界面交互，解讀計算機屏幕上的信息、選擇按鈕、輸入文本、導航網站並通過任何軟件和實時互聯網瀏覽執行任務，這爲實現更智能化的工作流程奠定了基礎。

國內獨角獸“讓路”大廠

Anthropic和OpenAI的大參數模型對外發布速度已經放緩。

Anthropic Claude系列模型從大到小，分爲Opus、Sonnet和Haiku 3個版本。Claude 3發佈了全部 3個版本，而 Claude 3.5 目前只對外發布了Sonnet和Haiku。同樣地，GPT-5（或GPT-4.5）也遲遲未出現在大衆眼前。

據瞭解，Opus模型和GPT-5均在內部取得了良好的測試效果，但因效果無法與成本匹配都被內部當作“教師模型”使用，即在內部扮演提升小模型性能的角色。

對大參數模型，國外創企尚在堅持，國內獨角獸已“讓路”大廠。

1月6日晚，有消息稱零一萬物將把預訓練團隊和算力資源打包出售給阿里雲。隨後，第一財經也報道，“阿里雲正在洽談收購零一萬物的預訓練團隊，已談好報價。”彼時，阿里雲未對該消息作出迴應。

零一萬物CEO李開復很快在朋友圈闢謠稱，“不知爲什麼會有這樣的謠言散播，不過散的快，撤的也快。”零一萬物公衆號在凌晨發佈官方迴應，否認“阿里收購零一萬物”。後據界面新聞和智能涌現報道，相比於“零一萬物出售預訓練團隊”的說法，更接近事實的是，零一萬物的確在進行預訓練團隊及Infra團隊的調整，部分人員以跳槽形式加入阿里旗下公司。其中預訓練算法團隊獲得通義團隊offer，Infra團隊則獲得阿⾥雲offer。

1月7日，李開復迴應表示，只有大廠能夠“燒”超大模型，零一萬物內部願意繼續訓練超大參數模型的成員，加入了零一萬物和阿里雲成立的“產業大模型聯合實驗室”。

去年5月，在零一萬物發佈千億參數模型Yi-Large時，李開復還宣佈公司已經啓動下一代萬億參數Yi-XLarge MoE模型訓練。當時，智譜、MiniMax、百川、月之暗面、零一萬物、階躍星辰在內的“AI六小龍”也在全力追逐AGI。

困擾李開復的“預訓練”是什麼？所謂“預訓練（pre-train）”，指對大模型的基礎教育，即賦予模型海量而通用的知識，來決定模型性能，這是模型廠商最核心的技術壁壘。而狂堆參數的Scaling Law，目前是預訓練的主流路徑，同時也意味着高昂且持續的算力和數據投入。

馬斯克曾估算，GPT-5的訓練可能需要3萬-5萬張H100，僅芯片成本就超過7億美元（約50億元人民幣）。對於尚未規模化盈利的創業公司而言，繼續堆參數訓練模型，要跨越高企的資金門檻。

大模型發展至今，邊際效應顯現。李開復表示，去年9、10月時，公司看到Scaling Law明顯進入 diminishing return（收益遞減）。不是說用更多算力和數據做不出進步，而是進步不符合投資回報，“從一張卡加到10張卡時，可以達到9.5張卡的價值，但從10萬張卡加到100萬張卡，也許只能達到30萬張卡的價值”。

事實上，去年10月就有報道稱，“AI六小龍”中已有兩家公司逐步放棄預訓練模型，縮減預訓練算法團隊人數，業務重心轉向AI應用。

“當下的技術路徑很容易同質化和到達瓶頸，再多投入也可能無法建立有效壁壘。”一名業內高管告訴時代週報記者，“去年大部分人不是這樣預期的。當時，大家認爲領先的大模型會步步領先，AGI會很快到來。如果該預期能實現，那的確應該在訓練上死砸資金。至於資金實力強如Open AI和Anthropic的這類企業想實現‘暴力美學’，更多要看下一代技術框架能在什麼時間誕生”。

從一級市場資金流向來看，側重落地的細分領域AIGC投融資情況相對樂觀。IT桔子的數據顯示，2024年全年，國內人工智能行業投資事件466個，投資金額634億元，相比2023年分別減少27%、9%；細分領域AIGC方面，國內AIGC投資事件117個，同比減少26個，投資金額370億元，增加164.82億元，平均每個投資事件投資金額增加了一倍。

“從資金消耗程度來看，訓練模型比開發推廣應用要大。”上述高管向時代週報記者解釋，投流獲客和推理算力是應用層兩大成本。不過，這兩項成本支出的高與低，企業在策略推進上有較大的自主權和靈活性。

本文源自：時代週報

作者：申謹睿

大模型融資競賽提速，“AI六小龍”齊讓路大廠？

相關資訊