21深度丨DeepSeek如何盈利?

21世紀經濟報道記者 鄧浩 陳歸辭 李覽青 上海報道

2025年過年期間,DeepSeek-R1一夕爆火,以極致性價比與媲美OpenAI-o1的性能強勢出圈,卻令包括“AI六小虎”在內模型創業公司的境地頗爲尷尬。

除了打破以往主要依靠算力堆砌實現“大力出奇跡”的訓練路線,更重要的是,DeepSeek用開源模式衝擊了許多大模型廠商依賴高昂的投流費用與閉源模式來獲取商業利益的方式。

“AI六小虎”等大模型公司將何去何從?DeepSeek-R1的商業模式是什麼?作爲產業鏈來說,哪個環節會率先受益?

基座大模型攪風雲

在DeepSeek的衝擊波下,模型大廠與頭部創業公司或將開始步入小徑分岔的花園。

“大廠更有選擇一點,除了字節的豆包,基本上大廠都接入了DeepSeek。因爲他們更加看重的是生態,自己家的產品不行沒關係,先用DeepSeek,有一天自己的技術趕上來再替換不遲。”無界AI聯合創始人兼CTO張飛彪向21世紀經濟報道記者指出。

“六小虎更沒有選擇一些,要麼做應用,要麼做模型硬剛。如果接入DeepSeek,那麼他們會很難以底層模型的概念去融資、後續人才也會更容易流失。”他說。

事實上,在DeepSeek發起巨大挑戰之前,大模型行業分化的苗頭早已經在醞釀。從去年下半年開始,以“AI六小虎”爲代表的大模型公司出現了不少人事和業務上的變動。

比如零一萬物算法副總裁、模型預訓練負責人黃文灝去年8月離職加入字節跳動,聯合創始人李先剛離職回到曾就職的貝殼;MiniMax“星野”產品負責人張千川去年9月確認離職;月之暗面幾位出海產品負責人去年11月前後離職創業;百川智能聯創、商業化負責人洪濤去年12月確認離職。

更令業內注目的是,今年1月初,前微軟全球副總裁和谷歌全球副總裁李開復創立的零一萬物宣佈與阿里雲達成合作,成立“產業大模型聯合實驗室”。零一萬物的大部分預訓練算法團隊及Infra團隊轉入阿里雲,公司將停止訓練超大模型。

其他大模型公司如百川智能的選擇與零一萬物類似,據悉在去年就已經停止預訓練新的超大規模通用大模型,更聚焦應用;而月之暗面則在去年收縮了海外業務,更聚焦Kimi的研發。

更重要的問題是,如果不卷大模型,要怎麼做出差異化?

一個選擇是深耕垂類。例如百川智能就選擇專注於做醫療垂類大模型。今年3月初,百川智能裁撤了主要負責金融行業To B業務的B端組,並對旗下商用業務部門進行了大調整,將資源集中至醫療這一核心業務上。

“零一萬物把自己的基礎模型板塊與阿里整合,當時大家覺得不爭氣,但是現在覺得很合理。做上層應用、做入口還有很大的機會。”張飛彪表示。

但也有公司選擇在基座大模型上“死磕”,認爲仍有機會,同時發力多模態大模型及智能體等C端產品。

今年3月底,智譜發佈了其最新智能體產品AutoGLM沉思,智譜稱其背後是智譜GLM全棧自研大模型,包括推理模型GLM-Z1-Air和基座模型GLM-4-Air0414,前者不僅性能比肩DeepSeek-R1,在速度提升最高8倍的同時,價格僅需DeepSeek-R1的1/30。上述模型將於4月14日開源。

智譜CEO張鵬在今年的中關村論壇上表示,智譜是一家技術和商業化“兩條腿走路”的公司,對於AGI這類前沿探索,智譜需要花大錢試錯,風險較高,並表示融了多少錢都是AGI道路上的盤纏;等到了推廣階段,重點就變成怎麼把技術用好、怎麼跟市場結合了。他認爲目前智譜來到了一個必須要深入到產業和應用當中去吸取營養回饋技術研發的階段。

一個有意思的問題是,在基座大模型領域,未來DeepSeek是否將一家獨大?

張飛彪認爲,DeepSeek對基礎模型領域有很良性的影響,雖然暫時是一家獨大,但是未來不一定。“首先,DeepSeek是非常良心的,它的開源策略整體上提高了國內的模型水平,大家也有了更清晰的訓練路線。其次,國內的其他模型也在趕上來,比如智譜等也很強,也在走開源路線,大家資質差不多,人才、算力、數據等差得不遠,多給點時間總會有跑出來的。”

應用爆發下如何商業化?

簡單來說,DeepSeek是通過App、API(應用編程接口)的方式提供服務,其將高性能的模型開源、大幅降低API調用價格,這對下游應用廠商而言,大大降低了部署成本。

張飛彪告訴記者,下游廠商運用DeepSeek模型進行商業化,最簡單的是直接用DeepSeek的API,當然要付費,但是省時省事,也不貴。

目前,在標準時段,DeepSeek-V3和R1的百萬tokens輸入(緩存命中)價格分別爲0.5元和1元,百萬tokens輸出分別爲8元和16元。而在優惠時段,V3和R1的百萬tokens輸入(緩存命中)則均降爲0.25元,百萬tokens輸出均降爲4元。這低於OpenAI-o1一個多數量級。

而直接部署DeepSeek開源模型的企業則無需向DeepSeek付費。一家服務於金融機構的投研平臺創始人告訴記者,在DeepSeek開源底層代碼前,該平臺在調用官方API接口時,需要根據API服務的調用量計費,但在開源後可以自己直接部署相關模型,無需向DeepSeek付費。

他透露,目前其使用滿血版R1模型的成本主要是租用雲服務器的算力成本。“滿血版R1模型跑起來的話,目前我們使用一臺服務器的成本在3萬元/月,但因爲我們主要是對內部員工投研場景使用,不需要滿足C端用戶的實時交互,所以我們對算力的消耗並不高。”他指出,對於合規要求較高的金融機構而言,在不能租用雲端服務器只能本地化部署的情況下,算力成本將大幅提高,在數百萬元級別。

此外,DeepSeek帶動的推理技術發展,在實際應用中有望降低複雜應用對計算資源的要求,算力更密集的應用賽道如人形機器人、自動駕駛、AI玩具等有望加速演繹。

隨着大模型部署成本及難度的顯著下降,業內普遍預期將有更多人加入進大AI應用開發的隊伍,各行各業將迎來AI應用大爆發。

但需要注意的是,在DeepSeek出圈之前,業內就已經形成廣泛共識,將2025年視爲智能體和AI應用的爆發元年。

今年1月初,OpenAI CEO山姆·奧爾特曼曾發文稱相信2025年人們將會看到第一批AI智能體“加入勞動力大軍”,從根本上改變各公司產出的東西。許多國內外知名科技界人士也都曾表示看好2025年智能體和AI應用的發展。

而從AI產業實際發展趨勢中也可以看到,目前產業正在嚮應用端遷移。許多科技巨頭和頭部模型廠商已經在智能體或其他AI應用領域有積極的佈局,也有許多行業已經在打造AI應用或正在密切關注AI應用的可能。

因此,DeepSeek出圈更多是加速了大模型廠商轉向應用以及各行各業AI應用爆發的進程。

“AI應用已經爆發,還有各類智能體Agent,不要光看語言模型,多模態模型、大世界模型也在飛速的進步,我們迎來了一個大躍遷的時代。”張飛彪表示,“DeepSeek對於AI商業場景來說一是教育意義非凡,讓大家都知道了、都要用。另一個是切實的降低了成本,讓大家都用得上、用得起。”

目前,AI智能體是AI行業最關注的下一個里程碑。業內普遍認爲,AI智能體是大模型落地的關鍵場景和重要突破點,同時也有不少人將其視作通向AGI的重要途徑。與此同時,在醫療、金融、教育、視頻生成、內容創作、新零售、數字人等諸多領域,均涌現出AI應用的開發實例。

儘管AI技術顯示出廣泛的應用前景,商業化落地卻仍面臨諸多難題。李開復今年年初曾表示,“2025年是大模型考驗年,是應用爆發年,更是商業化淘汰年”。行業正在等待殺手級應用。

今年3月6日,中國AI初創公司蝴蝶效應發佈的智能體產品Manus一炮走紅,引來資本市場狂歡,或可視爲一個先聲。

Munus具有一定的獨立思考能力,能思考、規劃和執行復雜任務,直接交付完整成果。例如,它可以幫助用戶篩選簡歷、研究房產、分析股票數據等。

這種“運用大腦”和“使用工具”的能力,很大程度得益於AI基礎模型之上的多模態功能。據透露,Manus使用了Claude和不同的基於阿里千問大模型(Qwen)的微調模型。

3月11日,早期預覽版產品發佈一週時間不到,Manus宣佈與阿里通義千問團隊達成戰略合作,雙方將在國產模型和算力平臺上實現Manus的功能。

目前,還處於非公開測試階段的Manus已經開始向用戶收費。據悉,付費版本分爲Manus Starter和Manus Pro,前者每月收費39美元,後者每月收費199美元。

大模型“賣水人”或是首批受益者

在Deepseek橫空出世下,如果資本市場對上游算力卡的需求大規模擴張尚存疑慮,下游也或面臨終端用戶付費意願強弱等問題,那麼中游的雲計算和一體機廠商,卻無疑正在迎來業務爆發。

從公開信息來看,國內阿里雲、百度智能雲、華爲雲、騰訊雲、火山引擎、京東雲等都已接入了DeepSeek。海外的亞馬遜AWS、微軟Azure等雲巨頭同樣官宣支持。

以華爲云爲例,2月1日,其在官方公衆號透露,硅基流動和華爲雲聯合首發並上線基於華爲雲昇騰雲服務的DeepSeekR1/V3推理服務。

華爲雲稱,得益於自研推理加速引擎加持,該模型可獲得持平全球高端GPU部署模型的效果,而且可提供穩定的、生產級服務能力,讓模型能夠在⼤規模生產環境中穩定運行,並滿足業務商⽤部署需求。

從2月以來,據21世紀經濟報道記者不完全統計,已經有希維科技、雲銳數科、漢斯夫、宜興市大數據發展有限公司等多家單位選擇華爲雲昇騰AI雲服務,基於DeepSeek展開業務創新。

事實上,產業界一直存在“傑文斯悖論”的說法,即模型成本下降會帶來AI場景擴展,算力總需求反而會提升。

CIC灼識諮詢總監林莉就曾對記者表示,互聯網大廠、雲廠商等頭部企業爲了滿足自身AI業務的發展,不斷擴充算力中心,對服務器的採購量持續增加,“與之相對應的是第三方算力中心服務商,承接80%以上的智算算力,例如剛剛發佈四季度財報的世紀互聯,基準抓取了AI增長引擎,進行前瞻佈局,基地業務同比增長125%以上。”

不過,由於企業數據隱私和知識產權的需要,也衍生出本地化部署的市場機會,DeepSeek一體機成爲剛需產品。

雪浪雲高級副總裁、雪浪工業軟件研究院副院長郭翹就對記者表示,“我們面向製造業都是私有化部署的,因爲很多企業內部知識有產權保護等問題,我們通過服務器加軟件的方式,幫助企業在內部搭建大模型系統。”

值得一提的是,由於算力一體機技術難度並不算高,性能指標也差異巨大,市場上從幾萬元到幾百萬元的產品都存在,頗爲魚龍混雜。

郭翹認爲,與性能有關的核心有三點,首先,精度要原生支持FP8,現在國產GPU裡,可能只有摩爾線程才能支持,而如果無法原生支持的話,意味着需要更多的卡來搭建滿血版;其次,有了滿血版DeepSeek一體機,也要看可以支持多少個用戶同時使用,也就是併發數;最後,是每秒的token數,就是回答的效率。

郭翹直言,“目前至少要200萬元以上的一體機,才能滿足製造業場景的實際需要。”

財信證券研報認爲,大模型一體機有望解決私有化部署中硬件選型難、軟件適配慢、調優成本高等痛點難點,構建從硬件到軟件、從開發到運維的全生命週期技術閉環,讓政企無需組建專業團隊即可實現敏捷部署。

據財信證券初步測算,現階段央國企、 政務機構、學校、醫院私有化部署 AI 大模型所需的服務器(一體機)開支空間約在 1000 億元左右,且隨着AI 應用場景逐漸拓寬,服務器(一體機)需求仍有較大提升空間。

郭翹也透露,從春節以來,其公司來自客戶的需求項目數至少有100%的同環比提升,“製造業的數據質量很差,所以數據與語料的預處理是大模型落地的前提,我們有成熟的產品方法論與工程化實踐能力。此外,我們的一體機使用的是摩爾線程的GPU,性價比比較高。與目前業內其他廠商不能原生支持FP8精度的GPU相比,可以節省約1/3的成本。”

技術極客的開源理想

DeepSeek爲什麼要開源?對未來大模型的發展怎麼看?

最直接的,可以看看DeepSeek自己怎麼說。在去年12月其官方發佈的《DeepSeek-V3 Technical Report》論文中,DeepSeek這樣描述自己的技術願景,“始終堅持長期主義的開源模型路線,旨在穩步邁向通用人工智能(AGI)這一最終目標。”

爲此,DeepSeek將持續研究和優化模型架構,致力於進一步提高訓練和推理效率,努力實現對無限上下文長度的高效支持。

此外,其將嘗試突破Transformer的架構限制,從而拓展其建模能力的邊界;不斷迭代訓練數據的數量和質量,並探索納入更多的訓練信號源;持續探索和迭代模型的深度思考能力,旨在通過擴展推理長度和深度,提升其智能水平和問題解決能力。

實際上,開源並不是DeepSeek首創,而是軟件行業一直以來的傳統理想。

“自由軟件之父”Richard Stallman曾說過,“長遠來看,讓軟件自由是通往富足世界的一小步;在富足世界裡,人們不必辛苦工作來謀生······我們必須做這件事,爲了使技術進步帶來的生產力提高能夠轉化爲人們工作的減少。”

樑文鋒在接受《暗涌》採訪時明確表示,“過去很多年,中國公司習慣了別人做技術創新,我們拿過來做應用變現,但這並非是一種理所當然。這一波浪潮裡,我們的出發點,就不是趁機賺一筆,而是走到技術的前沿,去推動整個生態發展。”

不少AI產業鏈人士在接受記者採訪時,都表達了對DeepSeek的尊敬,並認爲其當下的首要目標並非商業化,而是某種技術極客的理想主義,而以DeepSeek爲代表的開源模型推進下,下游應用市場正在加速爆發。

“市場在等待一個殺手級爆款時刻。”有產業人士如是說。