通义千问推出最强视觉理解模型Qwen2 (通义千问推出了什么)

文章编号:39753 资讯动态 2024-12-03 大模型 阿里云 通义千问

8月30日,阿里通义千问发布第二代视觉语言模型Qwen2-VL,旗舰模型 Qwen2-VL-72B的API已上线阿里云百炼平台。Qwen2-VL在多个权威测评中刷新了多模态模型的最佳成绩,在部分指标上甚至超越了 GPT-4o 和 claude3.5-Sonnet 等闭源模型。

2023年8月,通义千问开源第一代视觉语言理解模型Qwen-VL,成为开源社区最受欢迎的多模态模型之一。短短一年内,模型下载量突破1000万次。目前,多模态模型在手机、车端等各类视觉识别场景的落地正在加速,开发者和应用企业也格外关注Qwen-VL的升级迭代。

通义千问推出最强视觉理解模型Qwen2-VL-72B,API已上线阿里云

相比上代模型,Qwen2-VL的基础性能全面提升。可以读懂不同分辨率和不同长宽比的图片,在MathVista、DocVQA、RealWorldQA、MTVQA 等基准测试创下全球领先的表现;可以理解20分钟以上长视频,支持基于视频的问答、对话和内容创作等应用;具备强大的视觉智能体能力,可自主操作手机和机器人,借助复杂推理和决策的能力,Qwen2-VL 可以集成到手机、机器人等设备,根据视觉环境和文字指令进行自动操作;能理解图像视频中的多语言文本,包括中文、英文,大多数欧洲语言,日语、韩语、阿拉伯语、越南语等。

通义千问团队从六个方面评估了模型能力,包括综合的大学题目、数学能力、文档表格多语言文字图像的理解、通用场景问答、视频理解、Agent 能力。Qwen2-VL-72B 在大部分的指标上都达到了最优,甚至超过了 GPT-4o 和 Claude3.5-Sonnet 等闭源模型,在文档理解方面优势尤其明显,仅在综合的大学题目方面与 GPT-4o 存在差距。

用户可通过阿里云百炼平台调用Qwen2-VL-72B的API,地址:

版权文章,未经授权禁止转载。详情见 转载须知 。


本文地址: https://www.gpxz.com/article/ab9f5825900f4986a82b.html
全局中部横幅
全局中部横幅
舜宇光学科技

舜宇光学科技(集团)有限公司是中国领先的光学产品制造企业,具备全面的设计实力及专业生产技术,公司立足光电行业,以光学、机械、电子三大核心技术的组合为基础,大力发展光学、仪器、光电三大事业

广州有信科技

有信云,超级业务云,一款支持企业级复杂业务系统高速构建与迭代的PaaS云平台,致力于以云计算技术帮助企业实现数字化转型。通过适配所有组织,自定义所有业务流程,结合企业自身“业务在线”与“精细化运营”,实现企业利润型销售增长目标。有信云产品体系囊括了经销管理系统、门店管理系统、零售管理系统等,能够帮助品牌解决店中店分销平台、微商城分销代理、代理商分销商城、店铺运营平台及三级分销系统商城等场景。

首页

百思图一直致力于打造“轻时尚”鞋类领街品牌,产品大多采用色彩、轻装饰、轻科技、轻材质的设计,为女性营造更轻盈、柔软的鞋履,创造轻简有质的生活品味。

北京甲板智慧科技有限公司

引领公共空间场景创新的,数十项发明专利,团队规模200人,2015年至今全国完成经典案例800+主要研究及落地5个场景:以AI场景为基础,以运动场景、艺术场景、运营场景和管理场景为应用进行突破业务种类包含:智慧公园、智慧园林、智慧体育、智慧景区、智慧社区、智慧园区、智慧城市更新等业务链条:智慧专项策划设计、生产建设、运维运营

信宇网

信宇为您提供杭州专业写字楼装修,厂房装修,宾馆,酒店,公寓,展厅装修,专业办公室装修设计等服务,餐饮空间装修,商业店铺装修,主题酒店装潢,宾馆装饰,健身房美容机构装修设计等工装工程公司

策文全端云

四川策文科技有限公司全端云小程序

安徽伯克智能科技有限公司

安徽伯克智能科技有限公司自2017年成立至今,一直以来公司从事工业自动控制系统研发及施工、调度指挥系统、大屏、工业品等销售与施工。并获得:软件著作证书4项;发明专利5项;商标注册4项

热心公益

凝聚你我的力量,还他一个圆满的家!热心公益,传递社会正能量,让我们一起找点人!-17zhao.ren

演出门票

演唱会门票,音乐会,话剧

爱瑞电子

三维推网络营销客户案例列表集中了三维推营销服务所有出色案例,供您随便浏览.

通山县左翊百货营业部(个体工商户)

通山县左翊百货营业部(个体工商户),是一家集汽车电瓶,汽车配件,汽车音响等产品的专业销售企业。致力于为汽车电瓶,汽车配件,汽车音响技术及产品服务。经营产品种类涵盖不同的客户需求:汽车电瓶,汽车配件,汽车音响等产品。我们无以为报,唯有不断努力,为您带来更优质的服务,更多样化的交流机会和更精彩的参展


全局底部横幅