☰

刷屏！國產大模型匹敵GPT-4o，重點關注三大主線

日前深度求索DeepSeek發佈了其DeepSeek-V3模型。該模型是一款強大的混合專家（MoE）語言模型，擁有671B參數，激活37B。DeepSeek-V3在多項基準測試中表現優異，編程能力甚至媲美最領先的3.5 Sonnet，超過GPT-4o。

光大證券分析，短期來看，DeepSeek-V3的低訓練預算可能會讓市場對算力需求的增長預期有所下調，尤其是對高性能計算（HPC）和GPU等硬件供應商的需求可能受到一定影響。但長期而言，低訓練預算並不意味着算力需求的減少，而是算力利用效率的提升。隨着大模型技術的普及和應用的擴展，算力需求仍將保持增長，AI芯片、邊緣計算等長期成長性無憂。

中信證券認爲，DeepSeek新一代模型的發佈意味着AI大模型的應用將逐步走向普惠，助力AI應用廣泛落地；同時訓練效率大幅提升，亦將助力推理算力需求高增。持續看好AI產業鏈的加速落地機遇，建議重點關注AI應用、AI Infra、AI算力三大主線。

本文源自：金融界

刷屏！國產大模型匹敵GPT-4o，重點關注三大主線

相關資訊