大模型最新突破帮科学家读论文 AI 小菜一碟 (大模型 ai)

文章编号：36812 资讯动态 2024-11-30 大模型 Galactica 语言模型 AI

自人类迈入信息时代开始，信息资源总量越来越多，信息过载的现象非常严重。

英国学者带姆·乔丹曾说：“拥有太多信息使信息的利用变得不可能。” 美国工程师 Vannever Bush 也观察到信息过载的情况，在上个世纪就提出通过计算机来解决日益庞大的信息量问题。

Meta AI 新近推出的语言大模型 Galactica，正是在这样的背景下诞生。

由于语言模型可以潜在地储存、组织和推理科学知识，所以语言模型可以作为一种工具帮人类处理大量的信息。例如，语言模型可以在一个文献训练中发现不同研究中潜在的联系，并让这些见解浮出水面。Galactica 通过自动生成二次内容来整合知识，将论文与代码连接起来，为科学研究提供动力。

目前，Meta AI 已开放了 Galactica 所有模型的源代码。

精心设计的语料库

近年来，大型语言模型在 NLP 任务上取得了突破性的进展。这些模型在大型通用语料库上进行自我监督训练，并在数百个任务中表现良好。

但自监督的一个缺点是倾向使用未经整理的数据，模型可能反映语料库中的错误信息、刻板印象和偏见等。对于重视真理的科学任务来说，这是不可取的，未经整理的数据也意味着会浪费更多算力预算。

Galactica 用一个大型科学语料库训练一个单一的神经网络，以学习不同的科学语言。Galactica 的语料库包括了论文、参考资料、百科全书和其他学科资源的 1060 亿个 token 组成，集合了自然语言来源，如论文、教科书和自然序列，如蛋白质序列和化学公式，能够捕捉到 LATEX 并对其进行处理，同时还用学术代码捕捉计算科学。

与其他规模更大、未经策划的大型语言模型项目相比， Galactica 使用的数据集规模更小，而且是经过精心策划的，这很关键，即我们能否在一个经过策划和规范的语料库上制造一个好的大型语言模型。如果可以，我们就能通过设置语料库的内容，更有目的性地设计出大型语言模型。

研发者们主要通过专业化标记来设计数据集，这会形成不同的模态，例如：蛋白质序列是根据氨基酸残基来写的。研发团队还对不同模态进行了专门的标签化。在处理好了数据集后，研发者们在 Galactic 的解码器设置中使用了 Transformer 架构，并进行了以下修改：

GeLU 激活——对所有模型的尺寸都使用了 GeLU 激活；

上下文窗口——对所有的模型尺寸都使用了 2048 长度的上下文窗口；

无偏差——遵循 PaLM ，不在任何密集核或层规范中使用偏差；

学习的位置嵌入——对模型使用学习的位置嵌入，在较小的尺度上试验了 ALi Bi ，但没有观察到大的收益，所以研发者们没有使用它；

词语——使用 BPE 构建了一个包含 50k 个标记组成的词汇表，词汇量是由随机选择的 2% 的训练数据子集中产生的。

实验效果

研发者们还对大型语言模型作为科学模式和自然语言之间的桥梁的潜力进行了初步调查，展示了 Galactica 可以通过自监督来学习 IUPAC 命名等任务。他们发现，增加连接自然语言和自然序列的数据及数量和大小可能进一步提高模型的性能。

研发者们认为语言模型有更多潜力承担目前人类所擅长的事情。

而且为了考察 Galactica 吸收知识的情况，研发者们还建立了几个知识探针的基准，并用于确定语料库内的知识差距，并告知如何确定语料库内的知识差距和迭代语料库。

另外，Galactica 在推理方面表现十分出色，在数学 MMLU 上的表现优于 Chinchilla 41.3% 至 35.7%，在 MATH 上的 PaLM 540B 得分分别为 20.4% 和 8.8%。

AI 大模型最新突破：帮科学家读论文，小菜一碟

在经过四个 epoch 的训练之后，最大的 120B 参数模型从第五个 epoch 才开始过度拟合。

AI 大模型最新突破：帮科学家读论文，小菜一碟

尽管没有接受过一般语料库的训练，但 Galactica 在 BIG-bench 上的表现优于 BLOOM 和 OPT-175B。根据评估，Galactica 的毒性也明显低于其他语言模型。

AI 大模型最新突破：帮科学家读论文，小菜一碟

Galactica 犹如自动驾驶

Meta AI 发布 Galactica 后，在 AI 领域引起广泛注意，并收获了一众好评。

Yann LeCun 评论： 这个工具（ Galactica ）于论文写作而言，就像 辅助 驾驶之于驾驶一样，它不会帮你自动写论文，但它会在你写论文的时候大大减轻你的认知负担。

AI 大模型最新突破：帮科学家读论文，小菜一碟

太神奇了！Galactica 甚至可以针对某个领域写评论，推导 SVM ，告诉我什么是线性回归算法！只是生产内容的长度好像有限制？

AI 大模型最新突破：帮科学家读论文，小菜一碟

真是太神奇了！我只是用这个来帮我写“选择性注意研究”评论——它看起来很不错，也许下一步它就可以产生真正的想法！

AI 大模型最新突破：帮科学家读论文，小菜一碟

50 多年来，人类获取科学知识的主要方式一直是通过存储和检索，信息的推理、组合、组织无法依靠机器，只能通过人的努力完成，这导致知识吞吐量存在瓶颈。在 Galactica 的实践中，研发者们探讨了语言模型可能如何破坏这种旧的形式，带来人与知识的新接口。

从长远来看，语言模型的上下文关联能力可能会给搜索引擎带来显著优势。在 Galactica 的实践中，研发者们还证明语言模型可以是一个精心策划的知识库，执行知识密集型的问答任务。

未经「AI科技评论」授权，严禁以任何方式在网页、论坛、社区进行转载！

版权文章，未经授权禁止转载。详情见转载须知。

AI 大模型最新突破：帮科学家读论文，小菜一碟

本文地址： https://www.gpxz.com/article/2196d14fdcc0630d02ce.html

上一篇：周志华等等China高文大牛出席2022IJCAI张正

下一篇：宗成庆IEEE姬水旺2023Fellow宋厚冰等入选欧

360导航

360导航--一个主页，整个世界，为用户提供门户、新闻、视频、游戏、小说、彩票等各种分类的优秀内容和网站入口，提供简单便捷的上网导航服务。安全上网，从360导航开始。

电影视频 2024-09-15 01:01:55

四川航空股份有限公司官方网站

四川航空股份有限公司官网，提供国内国际飞机票查询预订、最新打折特价机票、订单查询与退票改签、航班动态查询、机票验真、行李查询、在线网上值机、金熊猫会员等服务。四川航空官网、手机m站、手机APP渠道购票享更高优惠。四川航空全国统一客户服务热线95378

手机软件 2026-01-21 14:50:25

貂皮大衣修改中心

貂皮大衣改样子，貂皮改款式，貂皮衣服改色染色，貂皮大衣修改，貂皮衣服生虫掉毛裂口修补等看是简单的服务，但是目前几乎很难找到这样的专业店家，尤巧三十年左右的守护从事皮衣和貂皮修补，翻新，染色，护理保养，貂皮衣服改色改制年复一年日复一日只为自己的喜好，为自己喜欢的工作而工作不为追求金钱而放弃守匠三十个春秋。

商业服务 2026-01-25 01:13:11

六亿导航

网址导航 2026-01-25 16:57:30

头像大全

库尔图图提供抖音头像,微信头像,动漫高清头像,高清头像,情侣高清头像，精选海量风格的热门抖音头像图片

卡通动漫 2026-01-25 20:35:01

观网东北在线

观网东北在线是观网文化传媒发展（长春）有限公司旗下网站，所属观网文化传媒发展（北京）有限公司。东北区地方站：观网东北在线（www.cvppdbzx.com）,观网东北在线以亿万网民的思想与力量为宣传定位，是一家传媒机构和民意排行榜平台，以无形资产增值服务，服务于企事业单位。关注东北三省（黑龙江省、吉林省、辽宁省）大事小情，也是最具权威性“第三方评价”机构。

网站模板 2026-01-28 17:35:03

趣旅

您身边的海岛旅行专家,为您专业定制全球海岛旅行：马尔代夫旅游,斐济旅游,大溪地旅游,斯里兰卡旅游,塞班岛,毛里求斯旅游,海岛旅游...

商业服务 2026-01-29 12:49:16

四川秉亨乡村别墅

四川秉亨建设是一家专注于四川乡村别墅建设的公司，提供一站式的服务，包括四川别墅设计、施工、以及四川别墅图纸设计。我们拥有经验丰富的团队，致力于为客户打造独一无二的四川乡村别墅。从初步规划到最后的施工，我们都能为客户提供全方位的支持和服务。无论您的需求是什么样的四川别墅，我们都能根据您的要求进行量身定制，并提供高质量的设计和施工。选择四川秉亨乡村别墅，让您的四川乡村别墅梦想成为现实。

设计美化 2026-01-29 14:06:00

LED显示屏

上海三思是全球知名的全彩LED显示屏、LED照明应用产品制造商，32年自主研发，技术创新，始终走在LED行业前列；提供业内全彩LED显示屏、LED照明优质解决方案且可定制方案。欢迎来电垂询TEL：400-600-3434

网络应用 2025-02-09 12:44:40

盐城大丰鼎盛宏业机械科技有限公司

盐城大丰鼎盛宏业机械科技有限公司主要产品有Q32系列履带式抛丸机、Q37系列吊钩式抛丸机、Q69系列通过式抛丸机,咨询热线：13851017121乔经理

管理咨询 2025-02-23 01:52:06

广州施工资质代办公司

天众资汇是建筑资质代办公司，公司承接施工总承包、专包、设计、勘察监理等多项建筑工程资质代办，是帮助做企业资质转让、升级、增项的建筑企服公司。

设计美化 2025-02-25 00:40:52

武汉广慈中医门诊部

武汉广慈中医门诊部，是在国家振兴中医国粹的号召下，由多位老中医，为复兴国粹联手创立，是国家卫生部门批准执业的正规医疗机构，门诊位于九省通衢的武汉市，这里保留着许多中药经方验方。是一所集预防调理、诊疗、康复理疗为一体的中医门诊！

健康医疗 2026-02-28 21:54:15

快手推出快手虚拟演播助手 (快手推出快手智播如何使用)

上个月我还发文章说，虚拟人能否代替直播带货?，结果这个月快手就推出了，快手虚拟演播助手，，而且还支持多平台推流直播，用户也能化身虚拟形象进入元宇宙直播间了，这对想做无人直播、半无人直播的人来说，是个利好消息，毕竟直播带货太费了，用虚拟人更划算，这肯利好淘宝上卖假胸卖变声器啥的，有看官做这个，赶紧上一批，现在有人为了赚钱是啥都不讲，9月...。

2025-02-02 01:32:11

怎么加盟壹零壹奶茶有公司联系方式吗 (壹零壹奶茶加盟费多少)

奶茶存在于市场上时间就非常长，也阻挡不了人们对奶茶的喜爱，很多人都喜欢喝奶茶，但是现在奶茶品牌店也迅速的出现，也有很多品牌走进了人们的生活，壹零壹奶茶就是一家特别有特色的饮品店，特别受顾客喜欢，怎么加盟壹零壹奶茶，有公司联系方式吗，想必这两个问题也是众多创业者比较关注的问题，壹零壹奶茶加盟的步骤非常简单，如果大家想要与公司联系，可以有...。

2025-01-15 21:39:48

iOS 15.4 iPhone 测试版可以戴口罩解锁 (ios15.6怎么样)

1月18日消息，苹果iOS15将无需摘下口罩即可解锁手机，目前面向开发人员发布的iOS15.4测试版将新的安全功能中有FaceID选项，据了解，此更新显示在，设置，、，面容ID和密码，下，它可以让用户选择读取出现在面罩上方的面部部分来解锁手机，简单来说，该系统会使用用户的眼睛特征及周围环境来识别真伪，如果匹配，则可以解锁手机，目...。

2024-12-03 18:13:45

怎么开烤肉店 (怎么开烤肉店赚钱)

烤肉是一种非常简单的用餐方式，但是却给人们的味蕾带来巨大满足，因此现在各种各样的烤肉店兴起，在我国各大城市的商场中都是非常有名的餐饮项目，现在烤肉店的加盟备受人们瞩目，没有经验的创业者想要知道，怎么开烤肉店，一、市场分析开一家烤肉店，您首先要做市场具体分析，现在餐饮市场上各种项目比较多，因为烤肉店也很多，因此您不能盲目地开店，要在一个...。

2024-12-02 21:06:13

区别选购建议投影幕布的类型 (选购和购买的区别)

其实对于普通消费者来说，选择一块合适的幕布可能比选择一台合适自己的手机还要难！之所以让各位觉的得选择困难，主要是因为投影厂商对这一块的知识普及做得不够，而手机虽然构造复杂，但是现如今稍微关注手机的一些朋友，都知道什么样的手机好，选手机该看什么配置，所以极米君今天先抛砖引玉，跟大家聊聊投影幕布怎么选的问题，为什么需要幕布，我们为什么需要...。

2024-11-28 17:07:49

4K投影仪怎么选择专业攻略了解一下 (4K投影仪怎么选)

足不出户就能享受电影院的大屏高清效果，有了明基4K投影系列，家庭影院体验升级轻而易举，无论是，蓝色星球，里瑰丽壮观的海洋生物，或是，人生一串，里诱惑十足的羊肉烤串，又或是，头号玩家，里惊心动魄的极速飞驰，明基4K投影搭配它精准的色彩，都能交出一屏沉浸式满分答卷，无怪乎成为众多影音发烧友们的心头好，明基4K投影主要划分两条线，一条是以W...。

2024-11-28 16:14:41

拉链品质疑问安踏儿童防晒衣 (拉链品质疑问怎么解决)

申明，1.以上内容仅代表揭发者自己，不代表黑猫揭发立场，2.未经授权，本平台案例制止任何转载，违者将被清查法律责任，3.黑猫揭发处置揭发不收取任何费用，凡以黑猫揭发名义不要钱的均为混充、诈骗行为，请及时报警并与黑猫官网反应，揭发邮箱heimaotousu@vip.sina.com，4.请大家选用官网渠道处置生产纠纷，不要轻信第三方机构...。

2024-07-17 15:50:12

配送14公里实践配送距离17.2公里 (10公里配送)

2024-07-17 09:33:01

商家不回复树苗死了 (商家不回复树枝怎么办)

2024-07-17 06:35:27

顺丰速运屡次咨询顺丰不处置报价邮寄的五粮液被人为拆封调包 (顺丰速运屡次停止运行)

2024-07-17 04:54:30

好玩的游戏都有哪些介绍 (好玩的游戏都在这里)

好玩的游戏介绍包含，王者荣耀，、，原神，、，绝地求生，、，敌对精英，和，英雄联盟，王者荣耀，是一款5v5MOBA竞技游戏，领有精巧的画面和丰盛的英雄角色，玩家须要组建团队，运用战略和操作技巧击败对手，游戏内有多种形式和地图可供选用，为玩家提供了丰盛的游戏体验，原神，是一款开明环球冒险游戏，玩家可以在一个充溢奇幻元素的环球中自在探...。

2024-07-05 14:51:38

段奥娟从前慢《从前慢》在哪听？段奥娟从前慢歌词

最近有一档综艺节目创造里面有一位叫段奥娟的选手非常受大家欢迎且瞩目她一出场就让全场安静她唱了一首干净的从前慢令在场所有评委陶醉其中段奥娟一身清爽的装扮素颜搭配青葱的校服脸上甜甜地笑清亮的嗓音在众多浓妆艳抹的网红脸中脱颖而出这个青春十足的岁高中女生彻底火了那么抖音段奥娟从前慢在哪听小编在这里为大家带来这首段奥娟从前慢的歌...

2023-11-15 05:34:00

文章推荐

谁才是真正的领跑者呢 2018区块链热潮 (谁才是真正的英雄表情包)

进入2018年以来，区块链、大数据、人工智能以他汹涌澎湃不可阻挡之势进入人们的视野，而区块链无疑是众多科技一匹黑马，国内各家科技巨头均已粉墨登场，开始在这个新兴领域里抢占高地，谁又能一骑绝尘、独领风骚呢，笑到最后呢?其中一大规律是，多家巨头的布局涉及区块链竞争的主战场——主链领域，以蜂巢财经研究院发布的，2018中国区块链底层开放平台...。

2025-01-30 19:30:12

网络百科

首张对比样张揭秘超越苹果的底气荣耀Magic3影像领先苹果13 (首张对比样张怎么做)

手机高端市场步入2021年，厂商这之间的竞争逐渐白热化，特别在用户最为看重的影像方面，一直是高端玩家着重发力的领域，下半年手机市场终于迎来两大重磅机型，一款是被行业称为接棒华为Mate50的荣耀Magic3系列以及虽然一直被吐槽创新力不足但依然强大的iPhone13，两者均在影像方面有重大升级，因此成为了行业以及用户重点关注的对象，作...。

2024-12-09 21:32:14

资讯动态

化全球主机厂正控制原材料供应链共享自动驾驶 (全球主机市场规模)

近日，理想汽车CEO李想在第八届电动车百人会上宣布，将对理想ONE搭载的J3芯片开源自研AEB算法，此事引来地平线CEO余凯回应，这是极有格局的善举，地平线也会积极参与，乐意分享自研技术的主机厂不止理想汽车，马斯克曾称特斯拉研发的自动驾驶技术和所有专利并不仅限于特斯拉汽车使用，如果其它主机厂有意，可有偿对外提供，开放合作、互利共赢...。

2024-12-09 15:17:53

资讯动态

大陆首个！芯原股份加入UCIe产业联盟 (中国首个芯片)

消息，本周六，中国芯片设计平台即服务企业芯原股份正式宣布加入UCIe产业联盟，成为中国大陆首个加入该产业联盟的企业，芯原表示，将与UCIe产业联盟其他成员共同致力于UCIe1.0版本规范和新一代UCIe技术标准研究与应用，推动芯原Chiplet产品发展，UCIe产业联盟于本月初建立，是由全球知名芯片制造商英特尔、台积电、三星联手...。

2024-12-09 15:06:02

资讯动态

NVIDIA与全球工作站厂商共同推出用于生成式AI及LLM开发内容创作和数据科学的强大系统 (nvidia股票)

洛杉矶—SIGGRAPH—太平洋时间2023年8月8日—NVIDIA与全球工作站厂商于今日发布性能强大的全新NVIDIARTX™工作站，专为生成式AI和数字化时代的开发与内容创作打造，BOXX、戴尔、惠普、联想等公司所提供的系统配备另外，NVIDIA发布了三款全新台式工作站Ada架构GPU——，为全球专业人士带来最新的AI、图形和实时...。

2024-12-03 20:46:55

资讯动态

大模型最新突破 帮科学家读论文 AI 小菜一碟 (大模型 ai)

未经「AI科技评论」授权，严禁以任何方式在网页、论坛、社区进行转载！

相关文章

文章推荐

大模型最新突破帮科学家读论文 AI 小菜一碟 (大模型 ai)