零一万物大模型Yi (零一万物大模型)

文章编号:43645 资讯动态 2024-12-09 零一万勿 大模型 魔搭社区

11 月 6 日,李开复博士带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型 Yi-34B,模型开放商用申请,已在 阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。

零一万物此次开源的Yi系列模型包含34B和6B两个版本。据 Hugging Face英文开源社区平台和C-Eval中文评测的最新榜单,Yi-34B 预训练模型取得了多项 SOTA 国际最佳性能指标认可,成为全球开源大模型“双料冠军”。

零一万物创始人及 CEO 李开复博士表示:“零一万物坚定进军全球第一梯队目标,从招的第一个人,写的第一行代码,设计的第一个模型开始,就一直抱着成为‘World's No.1’的初衷和决心。”

零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源

魔搭社区开源地址:

魔搭社区最佳实践:

Yi-34B 登顶全球英文及中文权威榜单 No.1

在 Hugging Face英文测试公开榜单Pretrained预训练开源模型排名中,Yi-34B以70.72 分位列全球第一,碾压 LLaMA2-70B 和 Falcon-180B 等众多大尺寸模型。

零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源

Hugging Face Open LLM Leaderboard (pretrained) 大模型排行榜,Yi-34B高居榜首(2023 年 11 月 5 日)

在 C-Eval中文权威榜单排行榜上, Yi-34B超越了全球所有开源模型。对比gpt-4,在 CMMLU、E-Eval、Gaokao 三个主要的中文指标上,Yi-34B 也具有绝对优势。

零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源

C-Eval 排行榜:公开访问的模型,Yi-34B 全球第一(2023 年 11 月 5 日)

在全球大模型各项评测中最关键的 MMLU(Massive Multitask Language Understanding 大规模多任务语言理解)、BBH 等反映模型综合能力的评测集上,Yi-34B 同样表现突出,在通用能力、知识推理、阅读理解等多项指标评比中全部胜出。

零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源

各评测集得分:Yi 模型 v.s. 其他开源模型

和 LLaMA2 一样,Yi 系列模型在 GSM8k、MBPP 的数学和代码评测表现略逊 GPT 模型。未来,零一万物的系列开源计划中将推出代码能力和数学能力专项的继续训练模型。

全球最长200K 上下文窗口

Yi-34B模型将发布全球最长、可支持200K超上下文窗口(context window)版本,可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一,对于理解和生成与特定上下文相关的文本至关重要。

受限于计算复杂度、数据完备度等问题,上下文窗口规模扩充从计算、内存和通信的角度存在各种挑战。为此,零一万物技术团队实施了一系列优化,包括计算通信重叠、序列并行、通信压缩等,实现了在大规模模型训练中近100倍的能力提升,也为Yi系列模型上下文规模下一次跃升储备了充足“电力”。

AI Infra实测实现 40%训练成本下降

李开复曾经表示,“做过大模型 Infra 的人比做算法的人才更稀缺”。超强的 Infra 能力是大模型研发的核心护城河之一。

AI Infra(AI Infrastructure 人工智能基础架构技术)涵盖大模型训练和部署提供各种底层技术设施,包括处理器、操作系统、存储系统、网络基础设施、云计算平台等等。

零一万物 Yi系列大模型基于阿里云平台打造,阿里云强大的智能算力基础设施为模型训练提供了稳固的基石。零一万物的Infra 技术通过“高精度”系统、弹性训和接力训等全栈式解决方案,确保训练高效、安全地进行。

凭借强大的 AI Infra,Yi-34B模型训练成本实测下降40%,实际训练完成达标时间与预测的时间误差不到一小时,进一步模拟上到千亿规模训练成本可下降多达 50%。目前,零一万物 Infra 能力实现故障预测准确率超过 90%,故障提前发现率达到 99.9%,不需要人工参与的故障自愈率超95%。

零一万物组建了由前 Google 大数据和知识图谱专家领衔的数据团队,建设了高效、自动、可评价、可扩展的智能数据处理管线;还自研出一套“规模化训练实验平台”,用来指导模型的设计和优化。数据处理管线和加大规模预测的训练能力建设,把以往的大模型训练碰运气的“炼丹”过程变得极度细致和科学化。

李开复宣布,零一万物已启动下一个千亿参数模型的训练。

接下来,零一万物将基于 Yi系列大模型,打造更多To C超级应用。李开复强调,“AI 2.0 是有史以来最大的科技革命,它带来的改变世界的最大机会一定是平台和技术,正如 PC 时代的微软 Office,移动互联网时代的微信、抖音、美团一样,商业化爆发式增长概率最高的一定是 ToC 应用。零一万物邀请开发者社群跟我们一起搭建 Yi 开源模型的应用生态系,协力打造 AI 2.0 时代的超级应用。”

版权文章,未经授权禁止转载。详情见 转载须知 。


本文地址: https://www.gpxz.com/article/34b638f65fca17671bc0.html
全局中部横幅
全局中部横幅
中企动力科技股份有限公司

中企动力科技股份有限公司中企动力(300.cn)为您提供网站建设、网站制作、网页设计及定制高端网站建设服务,中企动力专注于企业网站建设、高端网页制作领域18年,对企业网站制作、平台高端网站建设,包括汽车、家装、农业、外贸、机械等多个行业拥有丰富建站经验,选择中企动力,为网站保驾护

新余花店

新余花店,为您提供专业、优质的新余网上订花,送花,新余鲜花预定服务。鲜花种类繁多:玫瑰花、百合,康乃馨,婚礼鲜花、会议用花、开业花篮等,保证191%新鲜花材。汇聚了新余附近花店电话、地址、价格,18年新余鲜花速递服务,支持新余地区可先送花,后付款。

浙江声测管现货

本页面为河北日升昌钢管有限公司【19933757886】关于浙江声测管厂家,杭州声测管现货的推荐页面,声测管是一种桩基检测用钢管,本公司声测管现货直销衢州,温州,,湖州,嘉兴,宁波,衢州,金华,丽水,温州,台州厂家直销等地,发货快规格全,欢迎来电咨询

排烟天窗,电动排烟天窗,消防天窗,一字型消防电动排烟天窗,薄型电动排烟天窗

山东永聚德通风设备有限公司(188-6302-8333)采光通风天窗生产厂家实体生产厂家,主营:排烟天窗,电动排烟天窗,消防天窗,一字型消防电动排烟天窗,薄型电动排烟天窗生产厂家广泛用于厂房,车间,办公楼等,欢迎咨询。

iShow爱秀国际英语口语听说培训班机构

iShow爱秀国际英语专注大学生英语口语培训,线下英语学习小班课程,浸泡式学习环境,表演式课堂,结合线上一对一外教授课,英语口语培训热线:057188891189,领取英语口语免费试听课程!

口子喵

口子喵(www.gzszes.com)是靠谱的网贷口子发布平台,每日分享最新网贷口子,秒批贷款新口子,容易下款的网贷口子等资讯,助力个人及企业网上小额贷款,解决您的借贷需求!

首页

北京企业联合会北京市企业家协会

高压电器网

高压电器网是一个高压电气元器件、成套电器设备及周边产品信息展示平台。也是浙江川龙电气有限公司旗下网站。网站涵盖了消防应急照明集中电源、高压真空断路器、一二次融合成套断路器、高压负荷开关、高压隔离开关、跌落式熔断器、氧化锌避雷器、接地开关、电缆分支箱、高压计量箱、稳压器、故障指示器、万能式断路器、VCS可视化断点隔离开关箱、成套箱式变电站、充气柜、环网柜、高压开关柜、刀开关、冷热缩终端及附件等高压电气元器件及周边配套产品。同时也是中高压配电的售后维护任务发布和技工接活的信息展示平台。内容是配合送电调试、设备现场勘测、备件安装接线、故障检查排除、设备升级改造、工程整包项目等其他服务。

天智通物流

天智通物流提倡优质服务理念的太原物流公司,以汽运,空运,海运为核心.致力于为客户提供优质高效的太原仓储物流,仓储配送,第三方仓储物流与仓库托管服务.

宿州市恒顺工贸有限公司

宿州市恒顺工贸有限公司是一家专业生产矿用锚杆,矿用锚索,井下支护网,瓦斯抽放管,风筒,矿用钻具,矿用导轨等工矿配件为主的矿用安全产品实力厂家,产品通过煤安认证,广泛应用于各大矿企。

全局底部横幅