華爲、騰訊等雲廠商紛紛上線DeepSeek大模型
作者 | 黃昱
編輯 | 周智宇
2025年春節期間,中國AI初創公司深度求索(DeepSeek)憑藉開源模型DeepSeek-R1和V3系列,以“3%成本對標OpenAI”的技術突破,讓全球科技圈迎來了“DeepSeek時刻”。
爲了在這場全球科技風暴中分得一杯羹,短短一週內,全球雲巨頭紛紛“搶灘登陸”,上線DeepSeek大模型。
2月4日,華爲雲宣佈,經過硅基流動和華爲雲團隊連日攻堅,雙方聯合首發並上線基於華爲雲昇騰雲服務的DeepSeekR1/V3推理服務。
近日,騰訊雲TI平臺也宣佈上架DeepSeek系列模型,包括“滿血”的V3、R1原版模型,參數量達到671B;以及基於DeepSeek-R1蒸餾得到的系列模型,參數規模從70B到1.5B不等。
據悉,TI平臺全面支持DeepSeek系列模型的一鍵部署。此外,爲便於開發者零門檻開箱,TI平臺也限時開放了R1 模型的免費在線體驗。TI平臺還提供模型服務管理、監控運營、資源伸縮等能力,幫助企業和開發者將DeepSeek模型高效、穩定地接入實際業務中。
除了華爲雲和騰訊雲外,字節跳動旗下火山引擎也宣佈,將支持 V3、R1 等不同尺寸的 DeepSeek 開源模型,可以通過在火山引擎機器學習平臺 veMLP 中部署和在火山方舟中調用模型兩種方式使用模型。
百度智能雲、阿里雲、360數字安全等也沒有在這場“軍備賽”中缺席。
當然,不只是國內雲服務廠商,如今在全球科技圈掀起巨浪的DeepSeek,已被更多國際科技巨頭加入“購物車”。
據悉,微軟、英偉達、亞馬遜、英特爾、AMD等也於近日上線DeepSeek大模型服務。
過去一年來,雲服務市場機遇與挑戰並存,價格戰從年頭打到年尾,AI大模型帶來的巨大市場機遇,是兵家必爭之地。
騰訊集團副總裁、政企業務總裁李強曾表示,過去兩年,大模型訓練帶來了非常龐大的GPU算力的需求,去年大模型訓練帶來的需求增長雖然放緩,但是隨着越來越多的企業用戶和創業公司轉向大模型應用,也帶來了非常大的推理側的需求。
大模型從底層訓練到上層應用,都醞釀着很大的機會,雖然目前AI大模型給雲廠商帶來的收入還很少,但長期來看,會成爲重要的增長引擎。
因此,雲廠商“集體上架” DeepSeek大模型的背後,是在如今競爭越發激烈的市場環境下,各大雲廠商不想錯過DeepSeek帶來的重要商機,以及面向未來的做出的重要戰略佈局。
通過提供“零代碼部署”“限時免費”等政策,雲廠商實質是在爭奪未來AI應用的流量入口,誰能綁定最多的開發者,誰就能在下一輪AI應用爆發中佔據先機。
DeepSeek已然成爲繼ChatGPT之後的又一款爆款AI原生APP。
DeepSeek 2025年1月10日上線官方APP,而後受益於1月20日發佈R1模型的高性能、低成本,疊加春節期間信息傳播下沉,產品關注度呈裂變式增長。
從產品發佈日起日活用戶看,DeepSeek第5天超過 ChatGPT,第15天以259萬日活達到 ChatGPT 的2倍,亦爲全球增速最快的 AI 原生應用,第18天達到1500萬日活,而ChatGPT上線第244天才達到1500萬日活。
1月 27 日,DeepSeek APP更登上蘋果中國地區和美國地區應用商店免費 APP 下載排行榜榜首。
此外,DeepSeek的推理模型DeepSeek-R1發佈即開源,在數學、代碼、自然語言推理等任務上,性能比肩OpenAI o1 正式版。與此同時,DeepSeek通過算法迭代、架構升級,使通用及推理模型成本相較於OpenAI同類模型下降至數十分之一以下。
DeepSeek已成功改寫全球AI競爭格局。
中信建投計算機首席分析師應瑛指出,DeepSeek 完全開源了模型權重,所遵循的 MIT License 開源協議極爲寬鬆,允許其他開發者將模型用於商業用途並進行模型蒸餾,被Facebook首席人工智能科學家楊立昆譽爲“開源模型對閉源模型的勝利”。
可以預見的是,隨着應用開發門檻降低,具備突破性的 “殺手級”AI應用將更快出現。