2025-02-04
可操控手机电脑!阿里云通义开源Qwen2.5-VL视觉理解能力提升
【大河财立方记者陈薇】1月28日凌晨,阿里云通义千问开源全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。其中,旗舰版Qwen2.5-VL-72B在视觉理解方面,全面超越GPT-4o与Claude3.5。 拥有准确地解析图像内容也意味着,大模型无需微调就可变身为一个能操控手机和电脑的AI视觉智能体,其可以完成指定朋友送祝福、电脑修图、手机订票等多步骤复杂操作。 Qwen2.5-VL手机端AI Agent 演示:帮我给我的QQ好友张三,发送一条新春祝福 通......