阿里雲通義開源首個多模態推理模型QVQ

12月25日,阿里雲通義千問發佈首個開源多模態推理模型QVQ-72B-Preview。QVQ展現出超預期的視覺理解和推理能力,在解決數學、物理、科學等領域的複雜推理問題上表現尤爲突出。

多項評測數據顯示,QVQ超越了此前的視覺理解模型Qwen2-VL,整體表現與OpenAI o1、Claude3.5 Sonnet等推理模型相當。