零一万物大模型首次发布 2.0 李开复说话算数正在路上 AI (零一万物大模型)

文章编号：36625 资讯动态 2024-11-30 Yi 系列大模型李开复零一万物

作者 | 王悦

编辑 | 陈彩娴

11月6日，李开复带队创办的 AI 2.0 公司零一万物，开源发布了Yi系列模型，包含 34B 和 6B 两个版本。

令人惊艳的是，从参数量和性能上来看，Yi-34B 相当于只用了不及 LLaMA2-70B一半、Falcon-180B五分之一的参数量，碾压了LLaMA2-70B 和 Falcon-180B 等众多大尺寸模型。凭借这一表现，跻身目前世界范围内开源最强基础模型之列。

根据 Hugging Face 英文开源社区平台和 C-Eval 中文评测的最新榜单，Yi-34B 预训练模取得了多项 SOTA 国际最佳性能指标认可，成为全球开源大模型「双料冠军」。这也是迄今为止唯一成功登顶 Hugging Face 全球开源模型排行榜的国产模型。

李开复说话算数：零一万物大模型首次发布，AI 2.0 正在路上

获悉，「Yi 」系列大模型，命名来自「一」的拼音。「Yi 」中的「Y」上下颠倒，巧妙形同汉字的「人」，结合 AI 里的 i ，代表Human + AI ，强调以人为本的精神，为人类创造巨大的价值。

零一万物创始人及CEO李开复博士表示：「零一万物坚定进军全球第一梯队目标，从招的第一个人，写的第一行kl代码，设计的第一个模型开始，就一直抱着成为‘World's No.1’的初衷和决心。」

从「AI 1.0」迈向「AI 2.0」，李开复说话算数，一步步向目前迈进。

一、零一万物大模型 Yi 首次曝光

作为国产大模型， Yi-34B 不得不说的的优势之一就是更「懂」中文。对比大模型标杆GPT-4，在CMMLU、E-Eval、Gaokao 三个主要的中文指标上，Yi-34B 也具有绝对优势，能够更好地适配国内市场需求。

从更为全面的评估看，在全球大模型各项评测中最关键的「MMLU」（Massive Multitask Language Understanding 大规模多任务语言理解）、BBH等反映模型综合能力的评测集上，Yi-34B 同样表现突出，在通用能力、知识推理、阅读理解等多项指标评比中全部胜出，与 Hugging Face 评测高度一致。

李开复说话算数：零一万物大模型首次发布，AI 2.0 正在路上

各评测集得分：Yi 模型 v.s. 其他开源模型

在语言模型中，上下文窗口是大模型综合运算能力的关键指标之一，对于理解和生成与特定上下文相关的文本至关重要，拥有更长窗口的语言模型可以处理更丰富的知识库信息，生成更连贯、准确的文本。

据了解，此次开源的 Yi-34B 模型，将发布全球最长、可支持 200K 超长上下文窗口（context window）版本，可以处理约40万汉字超长文本输入。理解超过 1000 页的 PDF 文档，让很多依赖于向量数据库构建外部知识库的场景，都可以用上下文窗口来进行替代。

相比之下，OpenAI 的 GPT-4 上下文窗口只有 32K，文字处理量约 2.5 万字。今年三月，硅谷知名 AI 2.0 创业公司Anthropic 的 Claude2-100K 将上下文窗口扩展到了 100K 规模，零一万物直接加倍，并且是第一家将超长上下文窗口在开源社区开放的大模型公司。

上下文窗口规模扩充从计算、内存和通信的角度存在各种挑战，零一万物能做到这个程度也并非一蹴而就。受限于计算复杂度、数据完备度等问题，大多数发布的大型语言模型仅支持几千 tokens 的上下文长度。

为了解决这个限制，零一万物技术团队实施了一系列优化，包括：计算通信重叠、序列并行、通信压缩等。通过这些能力增强，实现了在大规模模型训练中近 100 倍的能力提升。

其实，Yi 系列模型之所以能取得如此亮眼的成绩，背后的 AI Infra 是功不可没的，其通过「高精度」系统、弹性训和接力训等全栈式解决方案，确保训练高效、安全地进行。

凭借强大的 AI Infra 支撑，零一万物团队能实现超越行业水平的训练效果，Yi-34B 模型训练成本实测下降40%，实际训练完成达标时间与预测的时间误差不到一小时，进一步模拟上到千亿规模训练成本可下降多达 50%。

截至目前，零一万物 Infra 能力实现故障预测准确率超过90%，故障提前发现率达到 99.9%，不需要人工参与的故障自愈率超过 95%，

无论是人前耀眼的成绩还是背后基础能力的攻坚，也都离不开零一万物潜心数月练就的大模型「科学训模」方法论。

大模型效果依赖于更多、更高质量的数据，零一万物在数据处理管线上可谓「不惜成本」。

数据处理管线和加大规模预测的训练能力建设，把以往的大模型训练碰运气的「炼丹」过程变得极度细致和科学化，不仅保证了目前发布 Yi-34B、Yi-6B 模型的高性能，也为未来更大规模模型的训练压缩了时间和成本，

经过几个月大量的建模和实验，零一万物自研出一套「规模化训练实验平台」，用来指导模型的设计和优化。数据配比、超参搜索、模型结构实验都可以在小规模实验平台上进行，对 34B 模型每个节点的预测误差都可以控制在0.5%以内。

在 Yi 开源模型的全球首发日，零一万物 CEO 李开复也宣布，在完成 Yi-34B 预训练的同时，已经旋即启动下一个千亿参数模型的训练。「零一万物的数据处理管线、算法研究、实验平台、GPU 资源和 AI Infra 都已经准备好，我们的动作会越来越快」。

二、从「AI 1.0」到「AI 2.0」

零一万物的首次成果公布，体现的不仅是技术的进步，还有商业的可能性。

今年 3 月，李开复作了一场关于 AI 从 1.0 时代跨到 2.0 时代的演讲。随后，零一万物在李开复所设想的 AI 2.0 框架下成立，招揽了前百度安全副总裁马杰、前微软副总裁祁瑞峰等等技术大咖，阵容豪华，引起业内的广泛关注。

过去十年，深度学习催生了一批优秀的 AI 公司，随后经过多年的发展，在过去两年曾进入短暂的低谷期，一度传出 AI 泡沫、AI 寒冬的说法。其中的根源就在于：上一代 AI 公司尽管基于崭新的技术立足，但在商业化上的步伐却比预期慢。

而从去年 8 月 Stable Diffusion 掀起 AIGC 热潮以来，加上去年11月底 ChatGPT 发布，全球 AI 突然看到了新的机会。这个新的机遇，被李开复称为「AI 2.0」。

ChatGPT 之后，AI 时代的进步在技术上体现为通用人工智能（AGI）雏形初显，在商业应用上则被李开复形容为平台级的趋势爆发。

所谓「平台」，包含一个大的目标，即要大幅降低开发 AI 应用的成本。如同电与电网的区别，电是一项伟大的发明，但如果没有电网，就不会出现微波炉、电烤箱、电动车等新的发明。换言之，AI 2.0 之于 AI 1.0 的区别，就在于将 AI 技术变成平台，将定制变成通用，将点变成面。

过去十年的商业实践验证了 AI 1.0 时代的瓶颈。在 AI 1.0 时代，数据越多、结果越好，但同时也因为需要大量的标注数据，成本巨大。此外，AI 1.0 时代的应用在各个领域是相互割裂的，诞生了一连串的「孤岛应用」，无法形成有效的平台。

但 AI 2.0 时代的技术基石是自监督，可以让 AI 模型不进行数据标注也能学习。虽然同样需要将大量的、跨领域的数据拿来学习，但学习后形成一个基础模型（即大模型）后再去做知识的迁移，AI 即相当于一个世界模型。经过多年的训练与积累，基础模型更成熟，基于基础模型再做平台应用，即可打破 AI 应用的孤岛现象，边际效益与日俱增。

换言之，AI 2.0 时代有三大优势：一是减少人工标注；二是模型规模大，具备世界知识；三是能够以极低的成本对基础模型进行微调训练，即可适应不同领域的任务。所以，在 AI 2.0 时代，每个领域都有机会将原有的应用重构一遍，用更短的时间生产出更高质量的数字内容，而且千人千面、精准优化信息流，做出更伟大的商业模式。

一方面，降低训练成本是减少 AI 应用开发成本、催生一系列爆款应用的前提；另一方面，长文本处理是商业应用的一道拦路虎。如果长文本处理的技术瓶颈能突破，许多更高难度的应用也会被一一破解，如处理超长篇幅的法务合同、交叉对比多篇学术论文、基于长篇剧本进行角色扮演、通过多篇财报进行市场分析等等。

因此，「长文本处理」在下半年成为大模型赛道的兵家必争之地。从 Anthropic AI 对 OpenAI 发起挑战后，国内多家大模型厂商也陆续推出长文本处理里程碑。如月之暗面的 Kimi Chat 支持 20 万字输入，百川智能的 Baichuan2-192k 支持 35 万字输入，零一万物的 Yi-34B 迅速扩展到 40 万字。

此次零一万物团队开源大模型 Yi-34B 与 Yi-6B，在长文本领域可以做到最长 200k 上下文窗口、40 万字的文本处理，也与李开复此前谈的 AI 2.0 思想相一致。同时，据零一万物介绍，他们还依托基础的计算设施与算法优化等 Infra 能力，将训练成本下降了 40%。

上传到 Hugging Face 不过两天后，Yi-34B 的下载量就超过了 1000 次，获得了接近 150 个点赞。

李开复说话算数：零一万物大模型首次发布，AI 2.0 正在路上

长文本处理的技术突破，不仅是表面上关于 Token 数的数据变更，更重要的是其体现了人工智能领域整体对 AI 2.0 时代所蕴含的商业潜力的认同与乐观。正是因为对大模型为代表的新一代 AI 技术的信心，才有如此多优秀的技术人才涌入该赛道，在极短的时间内快速突破了长文本等技术问题的局限。

据了解，如今长文本处理已逐渐被热情的 AI 技术人才攻破，目前业内流行的技术方法包括：最简单粗暴的堆显存，或滑动窗口、降采样等，或在 Attention-mask 中做动态内插。这些方法的效果很好，缺点是计算开销大。但在各大云计算厂商的加持下，算力壁垒也被逐渐打了下来。

可以看见，AI 进入一个新的时代毫无疑问已是行业共识。AI 2.0 代表一个新的商业愿景，道阻路长，玩家众多，但后来者零一万物也已成为其中最有潜力的团队之一，期待零一万物接下来的表现。

OpenAI 首届开发者大会召开在即，AI 科技评论持续关注，欢迎同样关注的朋友添加作者微信s1060788086一起交流。

原创文章，未经授权禁止转载。详情见转载须知。

李开复说话算数：零一万物大模型首次发布，AI 2.0 正在路上

本文地址： https://www.gpxz.com/article/3b383ce8f410b5d76f25.html

上一篇：AI百度智能云应用产品部总经理刘倩将离职独

下一篇：多模态的方法看懂手语专访纽约城市大学田英

包双龙运势网

包双龙运势网（www.yunshi.com.cn）是由著名易学大师“包双龙”老师驻站主持推出的专业风水学、八字命理、数字能量学、教学视频及在线问答等易学文化知识交流学习平台。

电影视频 2026-01-21 12:32:47

网游网站导航大全

LOL网址导航网是专业的上网导航网站,精心收录各类优质热门网站信息,同时提供天气、快递、违章等各种生活便民查询工具网址,为您提供安全便捷的上网导航服务,现已被众多网友设为上网主页,网址导航大全首选LOL网址导航.

游戏网游 2024-07-03 15:50:33

体育频道

腾讯视频致力于打造中国领先的在线视频媒体平台，以丰富的内容、极致的观看体验、便捷的登录方式、多平台无缝应用体验以及快捷分享的产品特性，主要满足用户在线观看视频的需求。

电影视频 2024-08-06 20:07:39

橡胶支座

广东鸿凯建筑科技有限公司是一家专注于桥梁伸缩缝生产制作的厂家.本公司专注于桥梁伸缩缝生产研发多年,是一家专业高标准的桥梁伸缩缝生产厂家.咨询热线:13602350285.

管理咨询 2026-01-25 15:03:49

中信博

江苏中信博新能源科技股份有限公司是世界领先的光伏跟踪支架系统、固定支架系统及BIPV系统制造商和解决方案提供商，致力于为公共事业、商业、工业和住宅项目提供太阳能跟踪和支架系统的相关产品和服务。

商业服务 2026-01-25 23:31:57

第一课件网

第一课件网收集了中小学全学科所有章节ppt课件、教案、试卷等资源，一切资源都能免费下载。

下载资源 2026-01-28 15:34:05

1377平台

1377游戏(www.1377.com)是全球具有知名度的专业手游平台之一，旗下有手机游戏、h5游戏等，致力于精细化运营和推广，打造属于自己的平台，提供最新最好玩的手机游戏大全，手游礼包、充值、下载、新闻攻略评测等，为用户提供全方位的服务，坚持创新，立志成为新兴游戏平台中的领军人。

游戏网游 2026-01-28 20:56:36

医药网

网盛生意宝旗下中国医药网，医药招商代理及产品供求等商机平台，医药行情及健康资讯媒体，医药人才招聘求职服务中心，拥有药品、保健品、医疗器械、制药设备、医药专利等产品数据库及医药企业和供应商数据库。

新闻资讯 2026-01-29 16:28:51

迅雷电影下载

最好的迅雷电影下载网站,电视剧下载网站,所有片源均有1280p,1080p,720p高清资源,免费为您提供下载服务.电影资源下载网站哪个好,好恐怖MP4电影下载网站.

电影视频 2026-01-29 19:08:00

安徽省刀锋网络科技有限公司

安徽省刀锋网络科技有限公司是是国内知名的游戏服务全产业链的企业，集游戏体验、账号租赁、陪玩、买卖四大主营业务为一体的个人游戏服务企业，并于完成数千万美元A轮、A+轮融资，估值5个亿。

游戏网游 2025-02-15 15:49:06

云南英华门茶业有限公司

云南英华门茶业有限公司坚持品质至上，诚信为本的经营理念，在对普洱茶系列品牌的研究开云南英华门茶业有限公司坚持品质至上，诚信为本的经营理念，在对普洱茶系列品牌的研究开发上更是不遗余力。

编程开发 2026-01-30 22:44:38

无主之地3

无主之地3游戏专题;提供无主之地3中文版下载,无主之地3攻略大全,无主之地3汉化补丁,无主之地3视频解说,攻略视频,修改器,汉化下载,完美存档,MOD,教学,配置,截图,壁纸,武器,枪械,角色等资料。《无主之地3》是一款RPG风格的合作FPS游戏。

电影视频 2026-02-03 00:56:54

360拼音输入法(手心输入法)3.2.7.1060

360手心输入法是一款无广告的输入法，极致简约、知你所想、卓越非凡的输入法。

2026-02-04 15:11:26

盒马等多家企业参与起草橙心优选牵头发起首个社区零售食品安全规范 (盒马多少家)

一直以来，食品安全问题都是大家关注的焦点，社区零售行业也不例外，6月17日，社区零售行业首部食品安全管理标准，社区零售平台食品安全管理规范，团体标准通过中国消费品质量安全促进会批准，正式发布落地，据报道，该规范由滴滴旗下电商平台橙心优选发起，盒马集市、多多买菜、SGS，通标标准技术服务有限公司，、中粮我买网、蒙牛集团等企业共同参与起草...。

2024-12-09 21:13:32

窃听无线键盘暗黑微信群我在保密大会上进入的神秘体验区 (键盘监听)

不久前雷锋网宅客频道编辑收到了来自360小伙伴的邀约，邀请我们参加在青岛举办的保密技术交流大会，为了学习技术，其实是青岛海鲜，，编辑立马应了下来，本来以为保密大会只是个与内容相关的名字，但到了现场发现保密级别相当高了，因为10月31日来到主会场的我们，没进去……对，就是这样，进不去主会场的编辑决定逛一下展区，这次保密大会设有四大展区，...。

2024-12-04 01:15:29

双十一选投影不再盲目明基智能商务家族不能少 (双十一投影)

发表在行业动态2018，11，609，51去年此时，电商界的大型春晚活动如约而至，商家们仿佛出奥数竞赛卷子的老师，而你是那台下绞尽脑汁解题的小学生，总也逃不出套路的手掌心，精挑细选的，必买好货，，甚至不如别人闭眼盲选的商品，囤了整整一年生活日用品，以为自己既务实又血赚，却直到过期也没用得完，和商家斗智斗争，最后意识到全是泡沫，只想高歌...。

2024-11-29 02:35:25

黑猫平台经常出现Q& A (黑猫平台有用没)

黑猫作为新浪旗下协助交易双方处置，生产纠纷，的第三方平台，旨在经过互联网的模式打造一个双方沟通的桥梁，并经过企业在平台的揭发及客服体现数据给其余生产者提供必定的生产参考及避坑指南，随着平台始终壮大，服务的用户越来越多，遭到各方的关注也越来越多，为了更好的为广阔生产者提供服务，并和各协作方一起包全生产者的权力，平台将大家往常比拟关注和经...。

2024-07-17 01:39:57

马自达的马六是什么意思 (马自达的马六油泵在哪里)

马六是指马自达品牌消费开售的小型轿车，其称号起源于日语中的，MAZDA6，马六车型是马自达品牌的中上流轿车，驳回了一系列先进技术和外观设计，以满足消费者日益增长的需求，马六车型是一款极具性价比的车型，领有较高的性能和品质保证，成为公路上颇受欢迎的车型之一，马六车型是一款十分器重安保性的车型，在安保性能上有很多亮点，例如，车辆装备了很...。

2024-07-07 03:39:38

夏利n5是前驱还是后驱

夏利N5是前置前驱还是后驱，夏利N5驳回前置前驱的设计，前置前驱车是应用前轮驱动的车辆，相较于后驱车，前置前驱车的好处在于车内空间较大，后排乘坐温馨，此外，前置前驱车的机械组件较少，省略了传动轴装置，车身重量也相对较轻，但是，前置前驱车也存在一些缺陷，由于前轮既要承当驱动又要转向，容易发生转向无余的状况，轮胎磨损也较为重大，然后置后驱...。

2024-07-02 22:45:27

道奇酷威和菲亚特菲跃的不同 (道奇酷威和菲亚特菲跃哪个好)

道奇酷威和菲亚特菲跃在外观、内饰、能源、操控、空间、温馨性以及品牌和多少钱等方面都存在差异，1、外观和内饰，道奇酷威和菲亚特菲跃的外观和内饰设计格调有所不同，道奇酷威的外观愈加硬朗，线条明显，给人一种粗犷的觉得，而菲亚特菲跃的外观则愈加圆润，线条流利，给人一种时兴的觉得，在内饰方面，道奇酷威的内饰设计愈加繁复明了，器重适用性和温馨性，...。

2024-07-01 22:35:55

爱思助手如何在iphone高低载 (爱思助手如何连接手机)

1，首先须要在电脑高低载一个爱思助手，关上阅读器搜查，爱思助手，2，点击进入爱思助手官方，在页面两边会有一个立刻下载的选项，点击下载，3，下载装置好之后，点击关上爱思助手，第一次性须要装置itunes或许是驱动，任选其一即可，4，装置成功之后将手机用数据线与电脑衔接，第一次性衔接须要手机信赖电脑，成功后在爱思助手主界面便会产生衔接的...。

2024-07-01 16:59:21

Alook浏览器PC版下载-Alook浏览器电脑版v8.5官方最新版

Alook浏览器电脑版是一款非常好用的主页浏览工具，该浏览器的体积十分小巧，意味着占用空间极少，并且无广告无弹窗

2023-11-12 07:37:17

机器学习|PyTorch简明教程上篇-人工智能

前面几篇文章介绍了特征归一化和张量，接下来开始写两篇PyTorch简明教程，主要介绍PyTorch简单实践。1、四则运算importtorcha=torch.tensor([2,3,4])b=torch.tensor([3,4,5])print(

2023-11-03 16:15:52

【全民养狗运营版】陀螺国际APP+区块链系统+宠物养成+挖矿合成+养狗养宠物+算力币+商城版

源码说明区块链宠物养成挖矿源码+养狗区块链源码-区块链养宠物源码支持算力币+商城-收集-分利等伴随着智能手机的普及，越来越多的互联网企业、电商平台将APP作为销售的主战场之一。越多的人通过智能手机来了解什么是APP开发，...

2023-09-17 17:45:50

文章推荐

休闲农场游戏下载安装推荐2022 热门农场游戏排行榜 (休闲农场游戏大全)

有很多小伙伴都非常喜欢农场游戏，模拟种植饲养的过程不仅能带给玩家成就感，而且趣味性满满哦，以下是休闲农场游戏下载安装推荐2022，喜欢休闲经营的你可一定不要错过哦，接下来一起看一看热门农场游戏排行榜吧！1、，模拟农场，这是一款上手非常简单的农场模拟经营游戏，玩家不仅可以种植、垂钓、养殖、贸易、偷菜等等，还能够装扮和扩建农场哦，游戏画风...。

2025-02-11 23:21:46

资讯动态

热门的五岁小孩游戏有哪些 2024高人气的小孩游戏下载分享 (热门的五岁小说有哪些)

五岁的小孩是比较容易接受各种新鲜的食物，也是培养各方面发展的极佳时间段，家长不妨让孩子选择一款游戏来认识更多的新鲜事物，同时还能让孩子的动手能力以及想象力变得更加丰富，那么热门的五岁小孩游戏有哪些呢，在游戏的领域当中，很多游戏都是专门针对于所有小孩来体验，涵盖的知识内容极其丰富，也是秉持着寓教于乐的核心来创作，儿童建农场小镇，这是专门...。

2025-02-11 21:22:39

资讯动态

马云内网发声丨雷峰早报华为三折叠手机最高被炒到10万；杭州外卖员猝死一天干16个小时知情人跑够五百块才下班；阿里25周年 (马云内网发声肯定阿里变革一年成效)

要闻提示1.国产芯片企业华夏芯破产清算，域名等资产被公开拍卖，起拍价不到30000元2.阿里25周年，马云内网发声，没有一家公司能在任何领域永远保持第一3.华为正式发布三折叠手机，售价19999起，门店排长龙，黄牛最高炒到10万4.杭州55岁外卖，单王，猝死，知情人，一天工作16个小时以上5.影视飓风送全体员工iPhone16Pro，...。

2024-12-03 17:44:53

资讯动态

保时捷计划9月底或10月初上市这两家公司未来发展前景如何大众证实 (保时捷计划全球召回Taycan)

大众集团首次透露，它正在考虑让保时捷上市，大众表示，将直接向新投资者出售保时捷12.5%的股份，并补充称，大众集团最大股东之一的卡塔尔投资局已，表达了购买2.5%股份的强烈兴趣，与此同时，大众集团的核心股东保时捷·皮耶希家族将以7.5%的溢价进一步收购保时捷12.5%的股份，保时捷一直是大众集团10个品牌中利润最高的，它的Tayca...。

2024-11-24 22:37:53

资讯动态

介绍一下各保时捷车型的价格 (介绍一下保和殿)

卡宴官方指导价，88.8，244.9万车型，SUV，CRV，CUV变速箱，6档手自一体分类，SUV越野车尺寸，4795x1928x1694排量，4806cc油耗，14.9L，100km报价参数配置图片经销商口碑2011款新卡宴官方指导价，86.6，203.5万车型，SUV，CRV，CUV变速箱，8档手自一体分类，SUV越野车尺寸，48...。

2024-11-24 20:14:26

资讯动态

零一万物大模型首次发布 2.0 李开复说话算数 正在路上 AI (零一万物大模型)

相关文章

文章推荐

零一万物大模型首次发布 2.0 李开复说话算数正在路上 AI (零一万物大模型)