巨量模型时代打造全球最大中文语言模型 2457亿浪潮不做旁观者 (巨量时代(深圳)科技有限公司)

文章编号：45828 资讯动态 2024-12-09 大模型 NLP

看到这首诗歌，有超过50%的人误以为是人类的杰作

但其实，它出自巨量模型源1.0

经过图灵测试认证，源1.0 写诗歌、写对联、生成新闻、续写小说的能力已经让人类的平均误判率达到了50.84%。（超过30%即具备人类智能）

9月28日，浪潮人工智能研究院正式发布全球最大中文预训练语言模型“源1.0”。历时四个月研发，源1.0参数量已达2457亿，约GPT-3的1.4倍。

巨量模型时代，浪潮不做旁观者：2457亿，打造全球最大中文语言模型

中国工程院院士、浪潮首席科学家王恩东表示，源1.0巨量模型旨在打造更“博学”的AI能力，未来将聚合AI最强算力平台、最优质的算法开发能力，支撑和加速行业智能转型升级，以更具备通用性的智能大模型成就行业AI大脑。

“源1.0”定位中文语言模型，由5000GB中文数据集训练而成。在国内，以中文语言理解为核心的大模型不在少数，参数规模均在亿级以上，如悟道· 文源 26 亿，阿里PLUG 270 亿；华为&循环智能「盘古」1100亿。相比之下，2457亿的源1.0 可以说是单体模型中绝对的王者。

更值得关注的是，源1.0是业界首个挑战“图灵测试”并且使平均误判率超过50%的巨量模型。图灵测试是判断机器是否具有智能的最经典的方法。通常认为，进行多次测试后，如果人工智能让平均每个参与者做出超过30%的误判，那么这台机器就通过了测试，并被认为具有人类智能。源1.0逼近通过图灵测试，再次证明了大模型实现认知智能的潜力。

为何加入这股“浪潮”？

近几年，巨量模型在人工智能领域大行其道，BERT、GPT-3、Switch Transformer、悟道2.0相继问世，出道即巅峰，在产学各界掀起一阵阵巨浪。如今“巨量模型”一词已经成功破圈，成为全民热词。那么，人工智能遭遇了哪些瓶颈，巨量模型又带来了哪些可能性？

在会后采访中，浪潮信息副总裁、AI&HPC产品线总经理刘军表示，人工智能模型目前存在诸多挑战，当前最首要的问题是模型的通用性不高，即某一个模型往往专用于特定领域，应用于其他领域时效果不好。

巨量模型时代，浪潮不做旁观者：2457亿，打造全球最大中文语言模型

也就是说，面对众多行业、诸多业务场景，人工智能需求正呈现出碎片化、多样化的特点，而现阶段的AI模型研发仍处于手工作坊式，从研发、调参、优化、迭代到应用，研发成本极高且难以满足市场定制化需求。而训练超大规模模型在一定程度上解决通用性问题，它可以被应用于翻译，问答，文本生成等等，涵盖自然语言理解的所有领域。

具体来说，从手工作坊式走向“工场模式”，大模型提供了一种可行方案：预训练+下游微调”，大规模预训练可以有效地从大量标记和未标记的数据中捕获知识，通过将知识存储到大量的参数中并对特定任务进行微调，极大地扩展了模型的泛化能力。同时大模型的自监督学习方法，使数据无需标注成为可能，在一定程度上解决了人工标注成本高、周期长、准确度不高的问题。

巨量模型时代，浪潮不做旁观者：2457亿，打造全球最大中文语言模型

刘军解释说，大模型最重要的优势是表明进入了大规模可复制的产业落地阶段，只需小样本的学习也能达到比以前更好的能力，且模型参数规模越大这种优势越明显，不需要开发使用者再进行大规模的训练，使用小样本就可以训练自己所需模型，能够大大降低开发使用成本。

现阶段，零样本学习和小样本学习是最能衡量巨量模型智能程度的两项测试。而源1.0在CLUE基准上刷新了多项任务的SOTA。

官方数据显示：源1.0在零样本榜单中，以超越第二名18.3%的绝对优势遥遥领先。

l 在文献分类、TNEWS，商品分类、OCNLIF、成语完型填空、名词代词关系6项任务中获得冠军。

l 在小样本榜单中，文献分类、商品分类、文献摘要识别真假、名词代词关系4项任务中获得冠军。

巨量模型时代，浪潮不做旁观者：2457亿，打造全球最大中文语言模型

"面对产业AI化挑战，巨量模型在多任务泛化及小样本学习上突出能力，以及其探索深度学习的极限和实现通用智能的可能性，浪潮前瞻性的做出了开发巨量模型的重要决策"。刘军表示，浪潮源1.0大模型只是一个开始，未来源1.0将面向学术研究单位和产业实践用户进行开源、开放、共享，降低巨量模型研究和应用的门槛，推进AI产业化和产业AI化的进步，

2457亿是如何炼成的？

大模型需要“大数据+大算力+强算法”三驾马车并驾齐驱，而对于大部分企业和机构来说，其中任意一项的研发投入都是沉重的负担，尤其是算力成本。比如1750亿参数的GPT-3单次训练需要 355 张 GPU，花费大约 2000 万美元。所以在炼大模型浪潮中，我们只看到了全球顶级的科技企业和科研机构的身影，而浪潮本潮也在其中。

浪潮源1.0 在算力、算法和数据三个方面都做到了超大规模和巨量化。

巨量模型时代，浪潮不做旁观者：2457亿，打造全球最大中文语言模型

首先是数据，浪潮创建了 5000GB 大规模的中文数据集，将近5年互联网上的内容浓缩成了2000亿词。2000亿词是什么概念？假如人一个月能读十本书，一年读一百本书，读 50 年，一生也就读 5000 本数，一本书假如 20 万字，加起来也就 10 亿字。也就是说，人类穷极一生也读不完2000亿词。

在大数据时代，比数据量更珍贵的数据质量。作为AI的底层燃料，模型对数据集质量提出了更高的要求。为此浪潮创新中文数据集生成方法，研制高质量文本分类模型，收集并清洗互联网数据过程中，有效过滤了废品文本，最终生成5000GB数据集可以说具备了够大、够真实、够丰富的特点。

巨量模型时代，浪潮不做旁观者：2457亿，打造全球最大中文语言模型

在算法层面，源1.0大模型使用了4095PD（PetaFlop/s-day）的计算量，获得高达2457亿的参数量，相对于GPT-3消耗3640PD计算量得到1750亿参数，计算效率大幅提升；在算力层面，源1.0通过算法与算力协同优化，使模型更利于GPU性能发挥，极大的提升了计算效率，实现业界第一训练性能的同时实现业界领先的精度。

谈起浪潮很多人还是停留在初级的印象，这是一家老牌硬件厂商，每年服务器市场占有率在全球范围内高居榜首。其实浪潮也一直活跃在AI前沿方向，自2018年成立浪潮人工智能研究院以来，其异构加速计算、深度学习框架、AI算法等领域已经战绩颇丰。例如，浪潮先后推出了深度学习并行计算框架Caffe-MPI、TensorFlow-Opt、全球首个FPGA高效AI计算开源框架TF2等；此外，在全球顶级的AI赛事上已累计获得56个MLPerf全球AI基准测试冠军。有了这些深厚的AI功底，浪潮在四个月内推出全球最大巨量模型不难理解了．

对于源1.0，业内专业人士评价称，其在巨量数据、超大规模分布式训练的扩展性、计算效率、巨量模型算法及精度提升等等难题上都有所创新和提升。

源1.0 更“博学”了吗？

图灵测试一直被认为是人工智能学术界的”北极星“，也是检验机器是否具有人类智能的唯一标准。以GPT-3为代表的巨量模型出现后，机器开始在多项任务中逼近图灵测试，但直到源1.0之前，没有任何大模型突破30%的关卡。

在“源1.0”的图灵测试中，将模型生成的对话、小说续写、新闻、诗歌、对联与由人类创作的同类作品进行混合并由人群进行分辨，测试结果表明，人群能够准确分辨人与“源1.0”作品差别的成功率已低于50%。

巨量模型时代，浪潮不做旁观者：2457亿，打造全球最大中文语言模型

如图，受访者的平均误判率为50.84%，在新闻生成领域误判率高达57.88%。

而抛开数据，源1.0的诗歌、对联的作品确实让人惊艳

巨量模型的潜力

炼大模型热潮的兴起,离不开谷歌微软、OpenAI、智源研究院等全球顶级科技企业和研发机构的追逐和热捧，在它们看来，巨量模型代表了实现通用人工智能最具潜力的路径,代表了当前传统产业实现智能化转型的新机遇．

而这次，浪潮重磅发布中文单体大模型源1.0，通过图灵测试和小样本学习能力再次印证了业界对超大模型潜力的普遍期望. 前者为模型推理\走向认知智能提供了可能性，后者降低了不同场景的适配难度,提升了模型的泛化应用能力。相信未来这股"浪潮"还会越来越汹涌.

原创文章，未经授权禁止转载。详情见转载须知。

巨量模型时代，浪潮不做旁观者：2457亿，打造全球最大中文语言模型

本文地址： https://www.gpxz.com/article/dc431556acdfb7918ef6.html

上一篇：延期公告第三届中国人工智能安防峰会延期公

下一篇：启明创投发布2024生成式AI十大展望启明创投

上海生活服务网站

上海生活服务网站排名,根据网站的综合值按照不同的上海生活服务网站进行筛选排名结果,通过筛选上海生活服务网站可以看到每个上海生活服务网站里面的网站排名优质的网站是哪些

网站模板 2023-11-22 21:34:22

企业旺旺

企业旺旺是免费的产品信息网，可以免费发布查询供应信息、求购信息、招商信息、服务信息、等实用信息。企业旺旺可以满足企业、个人各种推广宣传需求、问答求助等服务！

商业服务 2026-01-24 22:29:48

博山信息港

博山信息港是山东博山的门户网站,主要提供博山房产信息,招聘信息,企业黄页,网上商店,是博山商家做宣传开网店的理想平台,同时也是博山市民发信息查信息的常用网站！客服电话:0533-8603721QQ:863932

网站模板 2026-01-25 17:09:57

万里旅行网：都市旅游

万里旅行网专注超大城市旅游、特大城市旅游、全球都市旅游

旅游度假 2026-01-28 19:26:44

佛山市中医院

佛山市中医院创建于1956年，是一所集医、教、研及康复于一体的大型三级甲等中医医院，以中医骨伤科闻名国内外，是广州中医药大学附属医院（非直属）、2011年全国地级市中医医院综合竞争排名第一。

学校大学 2026-01-29 13:59:55

深圳奇建装饰设计工程有限公司

设计美化 2026-01-29 14:03:45

山东龙兴供水有限公司

山东龙兴供水有限公司集自来水生产及输配、给排水管道的安装与维修、工程建设、设计、咨询、城乡供水一体化系统建设、运营及管理等业务为一体的综合水务服务商0531-76412111

生活常识 2026-01-29 14:41:13

美容化妆师培训班

化妆培训平台汇集全国化妆培训班,化妆培训学校,化妆师培训学校,美容化妆培训学校等化妆培训机构,提供化妆师培训,半永久化妆培训,化妆美甲培训,化妆造型培训,新娘化妆培训等美容化妆培训服务.

商业服务 2026-01-29 15:31:49

耐磨焊丝厂家

公司专业研发、生产、销售各种类型耐磨焊丝。主要包括：气保护堆焊焊丝、埋弧堆焊焊丝、自保护堆焊焊丝、高强钢焊丝、不锈钢焊丝及其它合金材料。并免费提供焊丝样品、焊接工艺指导。并承接轧辊堆焊、轴、柱塞等焊接修复工程。

电影视频 2026-01-29 16:22:35

无缝钢管

聊城宽达钢管有限公司经营：无缝钢管,聊城无缝钢管,小口径无缝钢管,大口径无缝钢管,聊城小口径无缝钢管,聊城大口径无缝钢管，我公司材质规格齐全，真正实现了无缝钢管一站式采购。

电影视频 2025-02-06 21:01:26

绿桔网

绿桔网是生活帮助资讯平台，包含便民信息，教育，交通，旅游等实用民生帮助信息。

新闻资讯 2025-03-04 17:45:34

欢迎访问徐艺军研究小组

电影视频 2026-01-31 12:21:44

现在加盟儿童阅读馆行不行 (加盟儿童店)

在阅读经济迅猛发展的当下，加盟儿童阅读馆行不行，需要综合多方面来看，01市场需求大环境看，全民阅读深入推进，整本书阅读走进新课标和教材，对孩子的能力和阅读量提出了更高的要求，再加上教育成本和家长阅读意识的影响，儿童阅读受到普遍重视，说明儿童阅读馆的潜在客源是非常广的，02产品布局如何在利好的市场环境中发展呢，需要看产品的布局，现在的儿...。

2024-12-21 14:30:19

征战商用清洁机器人奇勃科技发布三款新品 (征战商场)

2023年1月4日，商用清洁机器人公司，奇勃科技，正式宣布获得来自索道资本领投的数千万人民币天使轮融资，同时，，奇勃科技，科技还发布了三款清洁机器人iKitbotONE、V45和H45，奇勃科技，成立于2021年4月，创始人王雪松曾在猎户星空任，豹小秘，负责人，2019年加入坎德拉主管产品和研发，后续独立创业，主攻商用清洁机器人产品...。

2024-12-01 01:29:09

天猫精灵小红盒Pro和极米NEW Z6X对比评测对比谁更值得买 (天猫精灵小红盒遥控器怎么配对)

发表在天猫魔屏2022，7，1111，16前段时间天猫精灵上新的一款天猫精灵小红盒Pro在之前一代的基础上更新升级了不少配置，吸引了不少消费者的关注，这款售价在三千六左右的家用小型投影仪在于差不多价位的极米NEWZ6X相比，谁的表现更出色呢，天猫精灵小红盒Pro和极米NEWZ6X对比首先两款投影仪虽然都是小型便携式投影仪，但是外观上有...。

2024-11-28 21:20:09

坚果J9系统版本1.0.52固件分享附带刷机教程 (坚果j9系统更新)

发表在投影固件2020，2，1819，54坚果J9JMGO4.0系统1.0.52版本固件下载地址，https，pan.baidu.com，s，1j5vos1vqHFiTxYMTtJbV5Q提取码，此处内容被隐藏，回复本帖后可见回复可查看提取码坚果J9使用U盘刷机教程，前期准备，您电脑上需要有一个百度网盘客户端，不是网页版，和账号，...。

2024-11-28 14:02:52

小小集渔菜品怎么样市场认可吗 (集小渔小火锅加盟)

时下，餐饮行业的竞争激烈，很多创业者就想要以特色的美食吸引客源，不错，特色的美食就是杀手锏，其中市面上的小小集渔菜品就是一家有特色的地方菜品牌，店面的装修有特色，是以东南亚异域风格为主，吸引顾客的眼球，公司总部推出特色美食，引爆话题，并吸引很多消费者打卡，不少创业者就香火加入其中，那么，小小集渔菜品怎么样，市场认可吗，小小集渔菜品是地...。

2024-11-22 19:52:31

哄呼是什么陪玩 (哄指的是什么)

哄别人睡觉的，比如有一些人有着入睡困难的问题，就可以让哄睡师去帮助自己入睡，这其实就是一种陪伴式的聊天，并且哄睡师是很善于发现客人的心理问题的，会帮助客人解决，让客人的心情很放松，自然会产生困意，哄睡师，即与深夜失眠的顾客聊天，对顾客进行睡眠引导的职业，中国睡眠研究会发布的报告显示，中国有3亿多人存在睡眠障碍，调查显示，中国成年人失眠...。

2024-11-18 22:37:13

学校不担任不给退款 (学校不担任不良事件)

申明，1.以上内容仅代表揭发者自己，不代表黑猫揭发立场，2.未经授权，本平台案例制止任何转载，违者将被清查法律责任，3.黑猫揭发处置揭发不收取任何费用，凡以黑猫揭发名义不要钱的均为混充、诈骗行为，请及时报警并与黑猫官网反应，揭发邮箱heimaotousu@vip.sina.com，4.请大家选用官网渠道处置生产纠纷，不要轻信第三方机构...。

2024-07-17 14:52:40

音箱设施的网站有没有HIFI发烧友专门交易二手音响 (音箱设施的网络连接)

不知道，但自己有挪威西亚仕HI，FI书架箱一对，相对原版，托好友从那边带回来的，五年前购入，折合人民币三万五千元左右，，最近想换箱子了，计划出手，感兴味咨询我，环保设施在哪个交易平台北极星环保设施网，北极星环保设施网原名北极星环保商务通，是环保设施的洽购和推行平台，为企业提供环保行业灵活、技术运行、企业求购消息、环保企业资讯、环保抢手...。

2024-07-07 00:43:51

美国又对中国下黑手了 (美国又对中国留学生下手)

美国又对中国下黑手了，前所未有，与投资无关；手腕够狠，美国企业也很无奈，美国总统拜登8月9日签订了这项行政命令，一些条款确实是磨刀霍霍，几个看点，，限度甚至制止美国对华三个畛域的间接投资，即半导体、量子计算和人工智能三大畛域，，之所以选用这三大类，白宫的解释是，由于它们在减速开展先进军事、情报、监督和网络才干方面，能起到的关键作用，，...。

2024-07-03 18:45:55

德阳短途汽车站在哪 (德阳短途汽车站电话)

四川省德阳市旌阳区，依据查问网络地图得悉，德阳短途汽车站位于四川省德阳市旌阳区泰山南路，德阳短途汽车客运站是四川省德阳市的一个关键的交通枢纽，位于城市核心肠带，交通便利，客运站始建于1980年代，现曾经成为了德阳市和周边地域人民出行的关键基地，德阳德野汽车租赁有限公司怎样样，德阳德野汽车租赁有限公司是2017，01，24在四川省德阳市...。

2024-07-01 22:39:49

黄海大柴神皮卡车汽油油耗 (黄海大柴神皮卡车图片)

13.14L每100km，黄海大柴神皮卡车汽油油耗是13.14L每100km，黄海大柴神皮卡以其大能源、大空间、大承载的产品特点深受生产者青眼，曾荣获，生产者最满意的皮卡车型奖，，2012年大柴神至尊版皮卡正式上市，该车有2.4L汽油和3.2T柴油两种发起机，两驱和四驱共8款车型可选，黄海皮卡大柴神开车时一抖一抖怎样回事?一、缺点或许...。

2024-07-01 17:42:32

PDF转WORD转换器下载-PDF转WORD转换器最新版下载

pdf转word转换器是一款体积小巧的办公软件，可以将PDF转换为Word功能强大稳定!欢迎下载体验！软件功能PDF2Files文件格式转换器是一款PDF文

2023-10-25 16:44:30

文章推荐

门槛高不高加盟日本先端美容有哪些费用 (门槛高吗)

不少创业者在加盟项目选择和品牌选择时都很困惑，有些门店门槛比较高，加盟可能不能获得预期的目标，对于创业者来说也要把握市场行情，了解更多项目，特别是美容项目行业很受欢迎，日本先端美容就是口碑很不错，而且很有实力的美容机构可以给大家提供更好的产品和设备以及服务，加盟日本先端美容有哪些费用，门槛高不高，日本先端美容加盟对于创业者来说有一定的...。

2025-01-15 21:30:40

创业加盟

将未使用的空间转换为智能家居界面 Orbit是一个投影系统 (将未使用的空格删除)

Orbit是一个投影系统，将未使用的空间转换为智能家居界面，与周围的架构无缝融合，整个系统采用18厘米直径的可回收铝制外壳，配有集成电池，可播放4小时视频，...。

2024-11-28 22:34:54

网络百科

激光投影仪排行榜！当贝包揽前三名！劲爆 (激光投影仪排名前十的)

发表在当贝投影仪2024，10，916，30近段时间，政府家电补贴力度非常大，让广大用户纷纷入手投影仪，而在活动期间，当贝旗下激光投影仪在众多品牌中脱颖而出，霸榜天猫激光投影仪热销榜，包揽榜单前三名，分别是当贝X5SPro、当贝X5S和当贝D6X！当贝投影目前为家用智能投影行业头部品牌，洛图科技，RUNTO，线上数据显示，2023年，...。

2024-11-28 15:50:56

网络百科

头道汤加盟费用需要多少钱 (头道汤加盟费多少钱微博)

健康护理需要从头到脚，但是事实是，就连脚部护理都已经开始受人关注，头部护理从业的人员却不多，不管是出于技术壁垒角度考虑，还是没有发现这一市场商机，头道汤的出现都足以占据市场超大份额的红利，若是您对此心动的话，头道汤是欢迎有识之士共同创业的，头道汤加盟费用需要多少钱，头道汤加盟费用需要多少钱，头道汤加盟费有十万和三十万两个方案，分别有5...。

2024-11-22 23:24:42

创业加盟

创速网络传媒站内互动数据分析 (创速网络传媒是干嘛的)

文字链接认证代码普通联盟标志认证代码企业广告联盟标志认证代码广告联盟评测代码说明，本页面的认证代码为创速网络传媒专用评测代码，站长需懂简单html知识，直接复制代码粘贴到联盟网站相应页面即可使用，本代码不适用于其他广告联盟网站请勿获取！文字认证，文字链接代码认证适用所有类型的广告联盟，复制代码后放在创速网络传媒网站首页底部或友情链接位...。

2024-11-19 20:47:14

网络百科

巨量模型时代 打造全球最大中文语言模型 2457亿 浪潮不做旁观者 (巨量时代(深圳)科技有限公司)

为何加入这股“浪潮”？

2457亿 是如何炼成的？

源1.0 更“博学”了吗？

巨量模型的潜力

相关文章

文章推荐

巨量模型时代打造全球最大中文语言模型 2457亿浪潮不做旁观者 (巨量时代(深圳)科技有限公司)

2457亿是如何炼成的？