通义千问开源320亿参数模型 已实现7款大语言模型全开源 (通义千问开源版本下载)
4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。
通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFAce等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。
基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。
Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。
多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。
版权文章,未经授权禁止转载。详情见 转载须知 。
本文地址: https://www.gpxz.com/article/bf3438b503ff4ae93c72.html
沈阳云之道网络科技有限公司,成立于2017年5月26日,公司主要为互联网企业提供软件私有化部署服务,旗下产品有:云之道律师、云之道知识付费、云之道智慧预约。我们现已经为五百余家网络公司提供源码私有化部署服务,间接为数万家企业提供技术支持。我们是追求品质、力求不断超越自己的团队。公司拥有超强的技术团队,研发实力过硬,市场嗅觉灵敏,能够及时把握市场发展的主流趋势。云之道致力于打造小程序在线咨询、教育市场标杆品牌,多年来不断更新迭代,为广大中小型企业提供一键制作小程序,快速上线发布的功能及服务。云之道始终把客户体验放在第一,有专业的售后团队,提供全方位系统培训指导和售后系统操作服务。我们尊重每次合作的机会与挑战,不断精进,力求完美。团队秉承专注、专业的服务态度,让客户通过我们,发挥产品的最大价值,并发掘无限的可能。我们坚信梦想的力量会使我们不断前进































