刷屏!國產大模型匹敵GPT-4o,重點關注三大主線

日前深度求索DeepSeek發佈了其DeepSeek-V3模型。該模型是一款強大的混合專家(MoE)語言模型,擁有671B參數,激活37B。DeepSeek-V3在多項基準測試中表現優異,編程能力甚至媲美最領先的3.5 Sonnet,超過GPT-4o。

光大證券分析,短期來看,DeepSeek-V3的低訓練預算可能會讓市場對算力需求的增長預期有所下調,尤其是對高性能計算(HPC)和GPU等硬件供應商的需求可能受到一定影響。但長期而言,低訓練預算並不意味着算力需求的減少,而是算力利用效率的提升。隨着大模型技術的普及和應用的擴展,算力需求仍將保持增長,AI芯片、邊緣計算等長期成長性無憂。

中信證券認爲,DeepSeek新一代模型的發佈意味着AI大模型的應用將逐步走向普惠,助力AI應用廣泛落地;同時訓練效率大幅提升,亦將助力推理算力需求高增。持續看好AI產業鏈的加速落地機遇,建議重點關注AI應用、AI Infra、AI算力三大主線。

本文源自:金融界