阿里雲大模型降價不是短期競爭行爲,而是長期戰略選擇

今天,國內大模型圈十分熱鬧,先是阿里雲宣佈大模型降價,隨後國內多家公司跟進、迴應,掀起一輪行業的降價潮。

但與國內其它廠商僅下調輕量級模型價格的策略不同,阿里這次一共有9款模型降價,其中性能對標GPT-4的主力模型Qwen-Long,API輸入價格從0.02元/千tokens降至0.0005元/千tokens,直降97%。1塊錢可以買200萬tokens,相當於5本《新華字典》的文字量。

Qwen-Long實力究竟如何?根據官方的信息顯示,其不僅性能達到GPT-4級別,還支持最長1000萬tokens的超長上下文對話,可輕鬆處理約1500萬字或1.5萬頁文檔,是同級別模型之最。

近期,OpenAI的GPT-4o和谷歌的Gemini 1.5 Pro也下調了API價格。不過從性價比上來說阿里雲的主力模型仍然具有優勢,這次降價也顯得誠意十足。

對於雲計算廠商來說,沒有產品力的降價是沒有意義的,大模型基礎能力的領先是通義千問降價的底氣。自從去年8月宣佈“全模態、全尺寸”開源路線以來,通義千問的技術實力已經獲得了國際認可。通義千問已被多個國際權威榜單和測試基準認可,還是基於人類偏好評估大模型的開放平臺Chatbot Arena中首個上榜並持續在榜的中國大模型,與GPT-4Turbo、Gemini-1.5-Pro等模型處於同一梯隊。通義千問從5億到1100億參數的全模態、全尺寸的系列模型,也能夠滿足企業和開發者不同場景下的需求。

可以說阿里雲的這次降價真正做到了便宜、量大、又能打。

今年年初,在和比爾·蓋茨的播客節目中表示,大模型技術正處於陡峭的成長曲線上,成本也在飛快地下降,大模型門檻的降低是趨勢所在。

GPT-4o發佈之後,Sam Altman久違的發佈了一篇個人博客,宣佈了團隊的階段性目標更新:“用最低的價格甚至是免費,將最好的模型提供給世界上所有人”。這句話是代表OpenAI說的,其實也可以認爲是代表微軟說的。

因爲“摩爾定律適用於大模型行業”不會自然發生,更不是單一一家公司能做到的,這需要硬件廠商、大模型廠商和雲計算廠商之間的共同努力。如果把大模型行業比作一個龐大的工廠,那麼雲計算廠商就像是提供電力的公司。沒有電力,工廠的機器就無法運轉。

同樣,沒有云計算廠商提供的計算能力和存儲資源,大模型的訓練和推理就很難進行。沒有云計算廠商提供彈性、可擴展、高效的雲服務,原生AI應用普及的難度也會大大提高。

價格的降低背後則是大模型結構、訓練、推理等成本的持續優化。對於阿里雲這樣的雲廠商來說,能夠把API的價格逐步降低,本質上是雲計算規模遊戲的必然結果。

技術進步帶來的性能提升和效率增加,使得雲平臺能夠以較低的成本提供更強大的計算服務。這一點對於大模型領域也不例外。

尤其是考慮到,GPU短缺導致算力的緊缺,如何高效利用算力,公共雲服務是一種最直接、便捷的方式。

技術升級帶來的是直接成本降低,而規模擴大帶來的間接成本分攤。無論是大模型的訓練、推理還是AI原生應用開發,阿里雲提供的雲計算網絡和資源池,都隨着客戶增多,降低了供應鏈採購成本、研發成本分攤和資源閒置成本,從而提高了整體的成本效益。

以千問72B開源模型爲例,根據阿里雲的測算,如果每個月1億token的使用量爲例,在阿里雲百鍊上的調用成本是每月600元人民幣,而如果做私有化部署,即使減去成本分攤,每個月成本也需要1萬元。

具體來看,阿里雲主要從模型和AI基礎設施兩個層面降低推理成本和性能。阿里雲基於自研的異構芯片互聯、高性能網絡HPN7.0、高性能存儲CPFS、人工智能平臺PAI等核心技術和產品,構建了極致彈性的AI算力調度系統,結合百鍊分佈式推理加速引擎,大幅壓縮了模型推理成本,並加快模型推理速度。

從阿里雲的戰略來看,這次大模型的降價實際上可以理解爲阿里雲公共雲降價策略的一種延續。在過去兩年,阿里雲率先進行了幾次大規模降價,一方面進一步提升了國內公共雲市場滲透率,另一方面,也帶來了新的營收增長空間。更重要的是,阿里雲在降價的同時,繼續保持着盈利。

依託公共雲的領先優勢,阿里雲大模型的降價,不是打價格戰,與“燒錢換市場無關”,更不能與當年雲服務廠商“一元中標”搶佔市場的歷史同日而語。

這不是短期的市場競爭行爲,而是長期的戰略選擇。是阿里雲依託“AI驅動、公共雲優先”戰略所帶來的領先身位的一種必然。對於阿里雲來說,大模型時代的新機遇不是一場百米衝刺,它需要做的是把這種勢能持續下去。

正如阿里雲資深副總裁劉偉光所說,這不僅僅是CPU和簡單的GPU帶來的策略,更多是大規模GPU集羣帶來算力的基礎,包括網絡存儲背後能力的提升。生成式AI從推理、訓練,逐漸走向雲端,再一次點燃了公共雲的爆發。

“微軟+OpenAI”的組合帶來了巨大的商業價值潛力,所有云計算巨頭都希望找到自己的OpenAI,亞馬遜重金押注了Anthropic。阿里也不例外,除了通過投資,集齊了國內五大大模型獨角獸之外。阿里還在打造屬於自己的ChatGPT:通義千問,當然阿里雲不僅僅打造的是阿里雲+通義千問的組合,其百鍊平臺還支持百川、ChatGLM、Llama系列等上百款國內外優質模型,體現了阿里雲在大模型時代的開放屬性。

對於大模型行業來說,僅僅具有技術的先進性並不能帶來應用的落地,如果不能降低大模型的推理成本,任何商業化都將是一種昂貴的嘗試,尤其是C端應用,成本可能是個無底洞。

大模型的訓練和推理都需要使用GPU或TPU這類專用硬件來加速計算過程,相比之下,許多傳統互聯網應用的計算需求通常較低。

例如,傳統谷歌搜索每點擊的成本約爲0.2美分,而一次AI搜索,涉及大語言模型的深度分析與精煉總結,成本驟升。Perplexity的大額融資,也可以說明AI搜索是多麼燒錢。

極高的估值、巨大的運營成本,如果大模型的使用成本不能進一步降低,無法明確商業化的衆多項目都很難維繫下去。此前Inflection AI 創始人跑路就是一個例子。

無論是對於企業還是個人開發者,推理成本的降低是大模型應用落地的前提,也是商業化的前提。所以,構建開發者生態,推動大模型應用的爆發,纔是阿里雲降價的真正意圖所在。

當前,以文本爲中心的單模態應用還是主流,但隨着技術進步,大模型將走向多模態應用,比如圖像、語音等更復雜的數據交互處理,這無疑會使得推理市場的體量進一步擴大。就像智能手機的發展,將電話從單一通話工具轉變爲集娛樂、社交、工作等多功能於一身的設備。

所以只要大模型應用真正爆發,AI推理市場也將迎來爆發,打造了具有基座大模型能力的公共雲廠商,通過公共雲+API的模式,才能走出新的增長曲線,獲取更大的盈利空間。

根據IDC數據,隨着人工智能進入大規模落地應用的關鍵時期,預計到 2026 年,在雲端部署的算力當中,推理將佔到 62.2%。阿里雲認爲到今年年底,大模型整個API的市場日均調用量將達到100億次,這個數字還會增長十倍,一百倍,一千倍。甚至可能讓雲計算市場整體規模翻倍。

在移動互聯網時代,從社交網絡到移動支付,創新應用不斷涌現,徹底地重塑了現代社會的生活方式和商業格局。像奈飛和米哈遊這樣的企業從誕生之初就100%在雲上,其背後正是公共雲作爲基礎設施的支撐,讓企業和開發者無需大規模前期投資就能利用強大的計算資源。

正如雲計算爲移動互聯網的爆發式增長提供了必要的土壤,公共雲+大模型API的模式,也將爲大模型的爆款應用提供類似的支持和催化作用。從這個角度出發,生成式人工智能時代的殺手級應用,也會是雲原生應用。

在這一進程中,公共雲廠商需要做的是持續將新技術與原有技術進行重新組織和重新架構,以支撐計算範式和算力格局的轉變。

而以阿里云爲代表的雲計算廠商,通過從底層算力、AI平臺再到模型服務的不斷創新,同時AI也反哺了雲從管理、應用、計算、基礎架構能力的提升。這已經讓我們看到了公共雲在生成式人工智能時代神經網絡和啓動機器般基石作用的體現。

公共雲技術紅利的持續釋放,爲大模型應用的爆發鋪平了路,我們將迎來一個大模型無處不在的世界,這可能不需要更多的邏輯推演,那麼同理,公共雲的AI基礎設施也將成爲無處不在的存在。當AGI有一天像水電一樣廉價、可靠的時候,每個人都會想要使用它,每個人都會離不開它。