阿里雲通義開源首個多模態推理模型QVQ

12月25日，阿里雲通義千問發佈首個開源多模態推理模型QVQ-72B-Preview。QVQ展現出超預期的視覺理解和推理能力，在解決數學、物理、科學等領域的複雜推理問題上表現尤爲突出。

多項評測數據顯示，QVQ超越了此前的視覺理解模型Qwen2-VL，整體表現與OpenAI o1、Claude3.5 Sonnet等推理模型相當。

相關資訊