AndrejKarpathy：大模型有内存限制，这个妙招挺好用|速度|序列|token|karpathy

文章编号：2086 技术教程 2023-09-02 速度序列大模型内存限制 token karpathy

用微信扫码二维码

RPAthy大有内存限">

分享至好友和朋友圈

AndrejKarpathy用通俗易懂的语言介绍了speculativeexecution。blockquote>

「如今，LLM（大语言模型）并不是单点突破的——而是需要多个重要组件有效协同工作的系统。Speculativedecoding是帮助我们从系统角度思考的一个很好的例子。」爱丁堡大学博士生符尧表示道。

人形机器人公司1XTechnologies的AI副总裁EricJang评价道：「Karpathy很好的解释了LLM的speculativeexecution。其他自回归模型可能会以类似的方式加速。连续（扩散）模型可能从K步中获益较少（可能在第1步后偏离猜测），但可以将其应用于VQ-latents的离散代码。」

看完上述评价，我们大概也了解了，Karpathy说的「Speculativeexecution」，这是优化技术的一类，采用这个技术的计算机系统会根据现有信息，利用空转时间提前执行一些将来可能用得上，也可能用不上的指令。如果指令执行完成后发现用不上，系统会抛弃计算结果，并回退执行期间造成的副作用（如缓存）。

为了让大家更好的理解Karpathy的内容。我们先介绍一下「Speculativedecoding」方法，对后续理解更加有益，其主要用于加速大模型的推理。据了解，GPT-4泄密报告也提到了OpenAI线上模型推理使用了它（不确定是否100%）。

关于「Speculativedecoding」，已有几篇重要文献可供参考，这也是Karpathy为了写这则推特所参考的论文，包括谷歌今年1月发表的论文《FastInferencefromTransformersviaSpeculativeDecoding》、DeepMind今年2月发表的论文《AcceleratingLargELAnguageModelDecodingwithSpeculativeSampling》，以及谷歌等机构2018年的论文《BlockwiseParallelDecodingforDeepAutoregressiveModels》。

简单来说，「Speculativedecoding」使用两个模型：一个是原始目标模型称为大模型，另一个是比原始模型小得多的近似模型称为小模型。主要思想是先让小模型提前解码多个token进行猜测，并将它们作为单个batch输入到一个大模型中进行审核修正，其效果和直接用大模型解码等价。如果小模型猜测的不准确，那么大型模型会放弃小模型预测的token，继续使用大型模型进行解码。

由于小模型计算量小，从而大大减少了内存访问需求。

介绍完「Speculativedecoding」，我们再回到Karpathy的推特。Karpathy是针对下面内容回复的。

Karpathy表示：对于LLM来说，「Speculativeexecution」是一种极好的推理—时间优化方法。

它取决于以下方面：在单个输入token上分发LLM所花费的时间与在批处理中分发K个输入token所花费的时间一样多。产生这样的原因是因为采样严重受内存限制：模型运行时的大部分工作不是在做计算，而是从VRAM读取transformer的权重到片上缓存进行处理。如果你要做的工作是来读取这些权值，你可以把它们应用到一整批输入向量上。

但是我们不能一次性采样一批K个token，因为每N个token都取决于我们在第N-1步采样的token。由于存在串行依赖性，因此基线实现只是从左到右逐一进行。

这种方法起作用的原因在于，很多「草稿」token都会被接受，因为它们很容易，所以即使是更小的草稿模型也能得到它们。当这些简单的token被接受时，我们会跳过这些部分。大模型不同意的hardtoken会回落到原始速度，但由于一些额外的工作，实际上速度会慢一些。

Karpathy表示，这个奇怪的技巧之所以有效，是因为LLM在推理时受到内存限制，在对单个序列进行采样的batchsize=1设置中，很大一部分本地LLM用例都属于这种情况。因为大多数token都很「简单」。

本文地址： https://www.gpxz.com/article/a735b091036354aa2eda.html

上一篇：新款特斯拉Model3预售2599万，想试驾？还得再等

下一篇：复旦大学团队发布中文医疗健康个人助手，开源

pa捕鱼(中国区)官方网站

pa捕鱼（www.b2bfb.com）全称是浙江pa捕鱼生物技术有限公司成立于2008年，pa捕鱼集研发、生产、销售体外诊断试剂、POCT仪器及生物原材料为一体的生物医药高科技公司。专注于POCT试剂及仪器的研发、生产与销售，同时聚焦生物原料平台的开发与产品技术储备m

商业服务 2026-01-25 20:41:11

FAG轴承代理商,TIMKEN轴承经销商

芙润得(上海)机电设备有限公司主营世界知名品牌SKF轴承、NSK轴承、FAG轴承、TIMKEN轴承、NTN轴承、KOYO轴承、IKO轴承、NACHI轴承、THK轴承及相关配套产品,已成华东地区最大的专业经营进口轴承的总代理经销商,型号齐全,库存充足,可根据客户特殊要求设计提供优质轴承服务和各种解决方案。

设计美化 2026-01-25 20:59:23

H型钢加工

【13638520524】遵义勇乐钢结构有限公司专业生产角驰760、角驰820、840、900彩钢瓦，各型彩钢折件（对外出租压瓦机），80-300各型C型钢，C型钢拉条，750、720、915楼承板，8米钢板天沟，预埋件，预埋螺栓，各型铁板切割，各型折弯件等。本公司配备有专业设计人员，可根据要求，设计钢结构建筑图纸，效果图。

设计美化 2026-01-28 22:14:19

真空泵

无锡市钱盛机泵厂建于1980年，地处风景秀丽的惠山之麓。是一家具有国家发明专利的专业生产各类真空泵的真空泵厂。主要生产往复式真空泵、W型真空泵系、水环式真空泵系列、旋片式真空泵、无介质（无油、无水）真空泵、移动式全自动真空泵、罗茨真空泵机组、玉和树脂产品专用真空泵的专业真空泵厂。该各类真空泵广泛用于冶金、化工、医药、轻纺、食品、航空、电子、科研等行业和部门。

行业信息 2026-01-29 11:45:54

ئوتقاش

ئوتقاشئەپبازىرى

电影视频 2026-01-29 16:54:09

三菱厌氧

上海菁邑贸易有限公司(www.shjy17.cn)是专业的三菱厌氧,一级胎牛血清,特级特制新生牛血清供应商,我们公司拥有雄厚的实力、合理的价格和优良的服务,能够及时解决和满足客户的各方面的需求,我们一直秉承着代理优质品牌的产品,服务好每一位顾客,欢迎来电洽谈

商业服务 2026-01-29 16:58:56

站长工具

站长工具站长工具站长工具站长工具站长工具站长工具站长工具站长工具站长工具站长工具站长工具站长工具站长工具站长工具站长工具站长工具站长工具站长工具站长工具站长工具站长工具

站长资源 2026-01-29 17:21:49

Evergo

Websitedescription

电影视频 2025-01-29 00:33:22

六只脚

六只脚通过GPS轨迹记录仪记录户外自助游线路轨迹,航迹,航点,提供GPS轨迹分享,轨迹下载,旅游景区景点及GPS设备资讯,感受你在户外旅游中的乐趣,分享您在自助游线路的轨迹路线,并提供手机GPS轨迹记录软件

新闻资讯 2025-02-04 22:07:47

快霸商城

快霸集团（KUARBAAGroup）起源于19世纪20年代的德国，已有两百多年历史，创世人先祖为俄国人，后经战乱库尔巴家族迁移至德国定居；“KUARBAA”之名取自俄语“Курба”；以纪念这段历史,其继承了德国工业严谨科学、专注品质的精神，世世代代不忘初心，始终如一地坚持着优良品质；主要涉及清洁设备、环保设备、家用电器、厨房设备、跨境生鲜等多领域。

企业品牌 2025-02-10 02:27:15

广州百兰稀贸易有限公司

广州百兰稀贸易有限公司_化妆品_护肤类广州百兰稀贸易有限公司主要是从事于固定资产投资开发及其经营活动，涉足生物、贸易、地产、酒店经营等多个行业领域。

编程开发 2025-02-15 00:52:19

维酷商贸知识

维酷网致力于为广大网友打造一个多元化的知识分享平台，涵盖体育、生活、美食、数码等丰富领域。无论是体育赛事的精彩解析，健康生活的实用技巧，全球美食的探索之旅，还是最新数码产品的深度评测，维酷网都为用户提供权威、实用且易于理解的内容。通过汇聚各领域的达人和热爱分享的用户，维酷网构建了一个活跃、互动的社区，助力每个人发现兴趣、学习新知。同时，平台不断优化体验，为用户提供更便捷的浏览方式和更个性化的推荐内容。无论您是知识的分享者还是探索者，维酷网都是您畅享多彩信息世界的最佳选择！

体育竞技 2025-02-24 19:50:16

2023热门的数学游戏大闯关盘点趣味数学闯关游戏推荐 (2023热门电视剧)

相信有很多小朋友都被数学所困扰，认为数学题都太难了，但是数学是学习和生活中特别重要的一门知识，基础是必须要掌握的，所以今天小编就给大家推荐一些数学游戏大闯关，让小朋友们能够在休闲娱乐的同时学到一些基础的数学知识，感兴趣的话就跟着小编一起看看吧！1、，宝宝玩数字，宝宝玩数字，是一款适合幼儿的数学益智小游戏，在这款游戏中设置了不同的日常...。

2025-02-11 22:56:36

酷比乐加盟赠送全套核心设备再优惠1万元限时加盟进行中 (酷比乐加盟赠品怎么样)

酷比乐寄语，酷比乐2018全新加盟政策正式起航，不忘初心，砥砺前行，酷比乐，作为西式快餐特许加盟品牌之一，引路西式快餐品牌，专心只做好炸鸡，酷比乐品牌发展一直秉承，真诚不凡快捷，的经营宗旨，以对人真诚与美食的热情为顾客营造出，好吃时尚快捷，的用餐体验，我们深知在品牌发展的道路上离不开您的合作与支持，酷比乐2018全新加盟政策，正式...。

2024-12-21 15:32:00

亚马逊表示受宠若惊微软花了几个小时阐述他们打算如何超越亚马逊 (亚马逊表示受欢迎吗)

微软的Cortana并非最流行的个人语音助理，这一头衔属于亚马逊的Alexa，微软的Azure公共云服务同样落后于亚马逊的AWS，鉴于这一现状，在周二于西雅图举办的Build2017大会上，微软高管花了几个小时阐述，他们打算如何对Amazon实现赶超，不过微软CEOSatyaNadella也指出，相比亚马逊，微软仍具备一大优势，它在企...。

2024-12-09 20:42:10

1955 人工智能十月怀胎记 (1955人工智能研究主题)

联合编译，高斐，Blake编者按，一般认为，1956年的达特茅斯会议奠定了人工智能的基础，到今年恰逢人工智能诞生60周年，但很少有人知道的是，，人工智能，一词最早在一年前的1955年8月31日提出，今天正好是这一概念被提出的61周年，从这一概念的孕育到诞生，这当中有什么，十月怀胎，的故事，1955年8月31日，，人工智能，这个词首次出...。

2024-12-09 15:48:28

生成式AI落地万能公式有没有 (生成式ai落地又添新利器)

年初看到ChatGPT掀起生成式AI热潮时，蚂蚁集团百灵代码大模型，开源名称CodeFuse，负责人技术总监李建国迫不及待地想找合作伙伴NVIDIA聊聊，李建国所在的办公楼与NVIDIA北京办公室仅一路之隔，步行几分钟就能到达，来到NVIDIA北京办公室，接待李建国的是NVIDIA开发与技术部门亚太区总经理李曦鹏，两位AI圈里的资深人...。

2024-11-30 22:06:46

坚果P1炫彩版1.0.8 固件更新 (坚果p1炫彩生活版和p1有什么区别)

发表在坚果投影仪2018，7，211，01坚果P1炫彩版1.0.8固件更新一、下载地址，链接，http，pan.baidu.com，s，1eSkNu4U密码，此处内容被隐藏，回复本帖后可见二、更新说明，1.优化音量调节；2.优化快捷菜单；3.增加自定义主题功能；4.增加开机启动服务管理5.更新文件管理器，优化复制粘贴等功能；6.增...。

2024-11-28 16:36:28

唐山市委书记调整 (唐山市市委书书记)

河北资讯联播，11月12日信息，日前，河北省委选择，张成中同志任唐山市委委员、常委、书记，武卫东同志不再负责唐山市委书记、常委、委员职务，地下简历显示，张成中，男，汉族，1970年10月生，大学学历，初级治理人员工商治理硕士，中共党员，张成中曾任西南炼化工程有限公司副总经理，抚顺市副市长，中国石油自然气个人辽宁开售分公司党委委员、副...。

2024-11-13 10:33:37

前线到职前博雷利视察乌军 (前线工作)

将于12月1日到职的欧盟外交与安保政策初级代表博雷利外地期间11日在社交媒体发文称，当日他观赏了乌克兰边陲左近的进攻工事并示意他在前线亲眼目击了，乌克兰军队的力气和韧性，此外，博雷利还呐喊称，，更多、更快的，对乌，军事援助至关关键，据此前报道，博雷利外地期间9日称其已达到乌克兰首都基辅，这是俄乌抵触迸发以来他第五次访问基辅，博雷利...。

2024-11-12 15:43:36

最新停顿香港名媛碎尸案 (最新停顿香港歌曲)

去年，28岁香港名媛蔡天凤被碎尸案震惊社会，警方曾拘捕包含蔡天凤前夫一家四口在内的多名涉案人员，南都记者留意到，往年7月8日，此案于香港东区裁判法院启动第三次提讯，以解决将此案交付初等法院审理的程序，但提讯环节中，原告的辩方律师提出，此前，未能从警方处取得案件关系监控录像画面的内容，裁判官由此将案押后至9月30日再作第四次提讯，南都此...。

2024-07-10 17:10:45

一键root权限巨匠的适用性与安保性辨析 (一键root软件)

随着智能手机的宽泛运行，越来越多的用户开局关注手机的系统权限疑问，在安卓系统中，失掉root权限可以让用户领有更多的自主性和可定制性，但同时也会带来一些潜在的危险，于是一键root权限巨匠应运而生，它可以让疑问技术的用户轻松失掉root权限，但是其安保性和牢靠性也不时遭到争议，本文将会对一键root权限巨匠的适用性与安保性启动剖析，首...。

2024-07-09 01:10:02

李元芳扮演者，李元芳这个演员的真名叫什么

李元芳这个演员的真名叫什么李元芳在剧中真名就是李元芳扮演者叫张子健张子建呀2，是谁扮演李元芳张子键张子健林志颖3，李元芳简介神探狄仁杰中李元芳的扮演者是谁扮演者基本信息个人概况中文名：张子健别名：张建新，张子建国籍：中国民族：汉星座：天蝎座出生地：天津出生日期：1968年10月28日个人背景职业：演员毕业院校：北京电影学院代表作品影视作品：《神探狄仁杰》、《白眉大侠》、《甘十九妹》、《孤岛神鹰》其他信息星座：天蝎座身高：1.83米张子建4，李元芳是谁扮演的张子健，1968年10月出生于天津，毕业于北京

2023-10-11 01:42:01

firefoxformac官方下载-火狐浏览器Mac版下载V110.0正式版

火狐浏览器Mac版乃是全球三大主流浏览器Safari、Chrome和Firefo之一Firefox转为MacOS用户推出的，火狐浏览器Mac版在全世界拥有数亿的用户;您可以免费下载。

2023-08-11 13:12:00

文章推荐

石锅饭加盟流程 (石锅饭加盟流程图)

在快节奏、高压力的当下，快餐无疑是一个有前景的智慧之选项目，而在众多的快餐模式中，石锅饭，无疑是一个特殊的存在，中西合璧，集西式的简便和中式的营养于一身，颇受欢迎，在智慧之选领域，也是备受青睐，今天，小编将针对大家普遍关心的石锅饭加盟流程及加盟前景进行具体介绍，以飨众位有心人士，一、石锅饭加盟流程，时下，由于石锅饭是个炙手可热的智慧之...。

2024-12-21 20:39:51

创业加盟

博士生奖学金名单公布华人学生超过1 AI 每人喜提10万美元！2022年摩根大通 (武汉大学博士生奖学金)

近日，摩根大通，J.P.MorganChase&，Co.，公布了2022年获得其AI博士生奖学金的学生名单，据摩根大通官网显示，今年一共有位博士生获奖，比去年，15位，少了4位，入选华人博士生共名，超过，据摩根大通人工智能研究的主管ManuelaVeloso介绍，他们设立该奖项是为了认可与鼓励下一代的前沿AI研究人员，激励他们取...。

2024-12-03 19:31:17

资讯动态

程氏面庄加盟大概需要多少钱 (程氏面庄加盟费多少)

面食店是很多消费者都非常喜欢的，从而也带动了该行业的发展，对于这样的市场现象，也让不少有经济头脑的人抓住了这个机会，但关于面食的店铺比较多，而程氏面庄之所以能够得到大家的认可，与它特色的口感和贴心的服务也是分不开的，当然，大家在选择创业的时候，也会关注各种各样的问题，比如程氏面庄加盟大概需要多少钱，毕竟资金是支撑店铺运营的基本，程氏面...。

2024-12-02 23:37:32

创业加盟

中国云原生事务型数据库厂商技术大比腾讯云TDSQL获得六项满分 (云原生到底解决什么问题)

10月8日，国际数据公司IDC发布了，中国云原生事务型数据库厂商技术能力评估，2024，报告，腾讯云凭借数据库TDSQL成功入选代表厂商，并在高性能、高可用、兼容性、安全性、金融行业应用、互联网行业应用等六项能力评估中获得第一，作为支撑企业数字化的核心基础设施，数据库与云原生技术结合诞生的云原生数据库，充分发挥了公有云的优势，具备高可...。

2024-11-30 20:08:44

资讯动态

家用激光投影仪推荐来了 2023激光投影仪哪款好 (家用激光投影仪推荐)

ZHANGWWW大神级投影控发表于2023，07，182023年还没有到来，但是目前市面上已经有不少好用的激光投影仪了，根据功能和价格等因素，为大家推荐几款家用激光投影仪，1.小米米家激光投影仪小米米家激光投影仪采用了字母级别的激光光源，亮度可达5000流明，支持1080P分辨率，可投大屏幕，且无需预热，响应速度很快，价格比同类产品便...。

2024-11-29 00:50:35

网络百科

AndrejKarpathy：大模型有内存限制，这个妙招挺好用|速度|序列|token|karpathy

相关文章

文章推荐