☰

阿里雲發佈開源模型Qwen2

北京商報訊（記者魏蔚）6月7日，阿里雲發佈開源模型Qwen2-72B。通義千問團隊披露，Qwen2系列包含5個尺寸的預訓練和指令微調模型，Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B，其中Qwen2-57B-A14B爲混合專家模型（MoE）。Qwen2所有尺寸模型都使用了GQA（分組查詢注意力）機制。在中英文之外，模型訓練數據中增加了27種語言相關的高質量數據。Qwen2還增大了上下文長度支持，Qwen2-72B-Instruct能夠完美處理128k上下文長度內的信息抽取任務。

相關資訊

▣ AI早知道｜阿里雲發佈全球最強開源模型Qwen2；快手發佈可靈大模型
▣ 阿里通義千問Qwen2大模型發佈並同步開源
▣ 阿里發佈開源多模態模型Qwen2-VL，多項性能超越GPT-4o
▣ AI早知道｜B 站開源輕量級 AI 語言模型；阿里通義Qwen2成最強開源大模型
▣ 阿里雲通義千問發佈業界首個開源多模態推理模型
▣ 阿里雲開源視頻基礎模型
▣ 阿里國際發佈最新開源多模態模型Ovis
▣ 阿里雲發佈通義千問2.5，開源通義千問1100億參數模型
▣ 阿里雲通義開源視覺模型Qwen2.5-VL
▣ AI早知道｜阿里雲開源視頻生成大模型萬相2.1；DeepSeek發佈DeepGEMM
▣ AI早知道｜阿里通義將發佈視頻大模型；元象發佈MoE開源大模型
▣ 阿里宣佈開源推理模型和視頻生成模型
▣ 通義千問開源視覺語言模型Qwen2-VL
▣ 阿里雲正式發佈通義千問2.5，開源通義千問1100億參數模型
▣ 阿里發佈並開源推理模型通義千問QwQ-32B
▣ AI早知道｜阿里開源全新多模態模型 Qwen2.5-VL-32B；DeepSeek-V3模型發佈
▣ 阿里雲通義開源首個多模態推理模型QVQ
▣ 科技早報 | DeepSeek據悉力求提前發佈R2模型；阿里雲視頻生成大模型萬相2.1開源
▣ 阿里雲通義千問推出開源Qwen2.5-1M模型
▣ 阿里雲通義開源視覺理解模型Qwen2.5-VL
▣ AI行業觀察：DeepSeek開源模型破圈；阿里雲加速生態佈局
▣ AI早知道｜智源發佈多模態模型Emu3；阿里巴巴達摩院開源文檔處理模型
▣ 數智早參｜蘋果推出開源大模型OpenELM；阿里雲宣佈EMO模型上線通義APP
▣ 阿里雲魔搭社區首發階躍星辰最新開源兩款多模態模型，已上架超4萬個開源模型
▣ AI早知道｜騰訊發佈最大規模開源MoE模型；阿里巴巴達摩院發佈八觀氣象大模型
▣ 阿里雲開源從模型到工具的AI全棧技術
▣ 幻方量化旗下DeepSeek發佈開源模型，超越阿里Qwen、Meta Llama
▣ 阿里雲通義千問旗艦版模型Qwen2.5-Max發佈
▣ 阿里雲發佈通義千問旗艦版模型Qwen2.5-Max

DMCA | PRIVACY | s@bg3.co