阿里雲發佈開源模型Qwen2
北京商報訊(記者 魏蔚)6月7日,阿里雲發佈開源模型Qwen2-72B。通義千問團隊披露,Qwen2系列包含5個尺寸的預訓練和指令微調模型,Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B,其中Qwen2-57B-A14B爲混合專家模型(MoE)。Qwen2所有尺寸模型都使用了GQA(分組查詢注意力)機制。在中英文之外,模型訓練數據中增加了27種語言相關的高質量數據。Qwen2還增大了上下文長度支持,Qwen2-72B-Instruct能夠完美處理128k上下文長度內的信息抽取任務。
相關資訊
- ▣ AI早知道|阿里雲發佈全球最強開源模型Qwen2;快手發佈可靈大模型
- ▣ 阿里通義千問Qwen2大模型發佈並同步開源
- ▣ AI早知道|B 站開源輕量級 AI 語言模型;阿里通義Qwen2成最強開源大模型
- ▣ 阿里雲發佈通義千問2.5,開源通義千問1100億參數模型
- ▣ 阿里雲正式發佈通義千問2.5,開源通義千問1100億參數模型
- ▣ 數智早參|蘋果推出開源大模型OpenELM;阿里雲宣佈EMO模型上線通義APP
- ▣ AI早知道|阿里雲發佈音頻模型;OpenAI發佈新技術PVG
- ▣ 通義千問開源數學模型Qwen2-Math 測評得分超GPT-4o
- ▣ 阿里雲CTO談大模型開閉源之爭:模型應用不能只對接一個形式
- ▣ 阿里通義千問開源首個MoE模型
- ▣ 谷歌發佈 Gemma 2 開源 AI 模型
- ▣ 阿里雲CTO周靖人:通義千問開源模型下載量突破2000萬次
- ▣ 阿里雲財報:AI收入三位數增長 開源模型下載量破2000萬
- ▣ 阿里發佈Qwen2-Math:數學推理全球第一,超越GPT-4o和Claude-3.5
- ▣ 阿里雲魔搭發起“ModelScope-Sora開源計劃”
- ▣ 阿里雲的開源算盤
- ▣ AI早知道|Anthropic發佈Claude 3.5 Sonnet模型;阿里雲推出首個AI程序員
- ▣ Meta發佈LLAMA 3.1開源人工智能模型
- ▣ 阿里雲通義千問開源
- ▣ 大模型上終端,阿里雲找“隊友”
- ▣ Meta發佈LLAMA 3.1 405B開源人工智能模型
- ▣ 開源模型Llama3發佈,原來Meta纔是真OpenAI?
- ▣ 阿里雲攜手聯發科爲手機芯片適配大模型
- ▣ 阿里雲聯發科聯手爲手機芯片適配大模型
- ▣ 阿里雲推出域名AI大模型應用
- ▣ 一週Martech新聞:OpenAI將發佈新開源AI模型
- ▣ 谷歌發佈Gemma 2輕量級模型,以牽制Meta的開源模型Llama 3
- ▣ 阿里雲CTO周靖人:阿里雲已建立完善的AI大模型訓練平臺
- ▣ 上新大模型2.5版 阿里雲緊追慢趕