DeepSeek (deepseek是什么)

文章编号：52120 资讯动态 2025-02-01 deepseek OpenAI AI

昨日 1 月20 号，DeepSeek 团队推出了全新开源模型 DeepSeek-R1，一夜之间模型就在 Github 上收获了 4k+star，引爆大模型领域。

而这次的 R1 模型一出，不仅反驳了之前蒸馏 OpenAI o1 的说法，官方更是直接下场表示： “我们可以和开源版的 o1 打成平手”。

DeepSeek-R1 最新发布，剑指 OpenAI o1

值得一提的是， R1 突破了以往的模型训练形式，完全没有使用任何 SFT 数据，仅通过纯粹的 RL 来训练模型，这一点说明 R1 已经学会了自己思考问题——这实则更符合人类的思维规则。

DeepSeek-R1 最新发布，剑指 OpenAI o1

更有网友称其为“开源的 LLM 界 alphago”。

DeepSeek-R1 最新发布，剑指 OpenAI o1

OpenAI，你的“强”来了

叫板 o1，Deepseek 的自信并不是空穴来风。

先是在在后训练阶段凭借凭借有限的数据直接在模型推理能力方面把 o1 甩了几条街。

DeepSeek-R1 最新发布，剑指 OpenAI o1

并且在数学、代码、自然语言推理上更是和 o1 正式版不相上下，在多个基准测试中展现了卓越的性能。

例如 DeepSeek - R1 在 AIME 2024 数学竞赛中，取得了79.8%的成绩，略高于 OpenAI 的 o1-1217。在 MATH-500 测试中，DeepSeek-R1 更是达到了 97.3% 的高分，与 OpenAI-o1-1217 相当，同时显著优于其他模型。

在编程竞赛方面，DeepSeek-R1 表现出了专家级水平，其在 Codeforces 上的 Elo 评级达到了 2029，超过了 96.3% 的人类参赛者。此外，在工程相关任务中，DeepSeek-R1 的表现也略胜 OpenAI-o1-1217 一筹。

DeepSeek-R1 最新发布，剑指 OpenAI o1

除此之外，团队还 R1 蒸馏出了 6 个小模型开源给社区，参数从小到大分别为 1.5B、7B、8B、14B、32B 以及 70B。其中蒸馏过的 R1 32B 和 70B 模型在性能方面不仅超过了 GPT-4o、Claude 3.5 Sonnet 和 QwQ-32B，甚至比肩 o1-mini 的效果。

DeepSeek-R1 最新发布，剑指 OpenAI o1

如果你仍未真切领略到它的强大，那么请注意：它只需付出 o1 五十分之一的成本，却能收获 o1 百分之百的效能。

典型的花小钱，办大事。

DeepSeek-R1 最新发布，剑指 OpenAI o1

除了 R1 在几乎所有的基准测试中性能都优于 o1 的硬实力，再其发布即开源的训练数据集和优化工具，让不少网友直呼：这才是真正的 Open AI。

三点核心技术，剑指 o1

R1 发布后，国内外大模型从业者纷纷围观、并交流点评。

深度赋智 CEO 吴承霖向 AI 科技评论评价： DeepSeek R1 确实厉害，但方法非常简单，核心其实就三点。

Self play、Grpo 以及 Cold start。

DeepSeek 团队这次开源的 R1 模型共有两个版本，分别是 DeepSeek-R1-Zero 和 DeepSeek-R1，参数都是 660B 且功能各有千秋。

先说 DeepSeek-R1-Zero，这个模型完全没有使用任何 SFT 数据，仅通过纯粹的 RL 来训练模型，突破了以往模型在提升推理能力时常依赖于 SFT 作为预训练步骤的形式。这是大模型训练中首次跳过监督微调，是此次DeepSeek的核心创新。

通俗一点讲，就是我们不直接告诉模型“应该如何解题”，而是让它通过自主试错并从中学习正确的方法，即 Self play。这就像不让孩子死记硬背公式，而是直接提供题目和评分标准，让他们在实践中自行摸索解法。这样的方式不仅能激发模型的自主学习能力，还可能在探索过程中发现更具创新性的思路。

DeepSeek-R1 最新发布，剑指 OpenAI o1

但是DeepSeek-R1-Zero这个孩子一直做试错练习的话，就会有可读性差和语言混合问题。于是团队研发推出了 DeepSeek-R1，这个模型在训练过程中引入了少量的冷启动数据，即cold-start> DeepSeek-R1 最新发布，剑指 OpenAI o1

这么说吧，虽然孩子做错题集可以有效提高分数，但是他的答案可能写得乱七八糟。通过先教模型如何规范地写步骤和总结，再让它自由发挥，最终答案既正确又容易看懂。

除此之外，DeepSeek-R1 Zero还创新了一种很厉害的算法 GRPO，通过采样一组输出并计算奖励的均值和标准差来生成优势函数，从而优化策略。这种方法避免了传统 PPO 中需要额外训练价值模型的高成本，让模型能够自主探索复杂的推理行为，比如长思维链、自我验证和反思。

这种纯强化学习训练方式在数学（AIME 2024 的 Pass@1 从 15.6% 提升至 71.0%）和代码任务中取得了显著提升。简单来说，就像让机器人通过“试错”学习解题，而不是依赖例题，最终让它学会了复杂的解题步骤，表现非常出色。

DeepSeek-R1 最新发布，剑指 OpenAI o1

最后，团队还分享了他们在实验中遇到的很多失败尝试，并表示虽然在过程奖励模型以及蒙特卡洛树搜索算法上团队都没有取得研究进展，但这并不意味着这些方法无法开发出有效的推理模型。

DeepSeek-R1 最新发布，剑指 OpenAI o1

One more thing

值得一提的是， R1 在训练时甚至还出现了“顿悟时刻”，就像我们在解难题时突然“灵光一闪”，模型在训练过程中也自发地学会了“回头检查步骤”。这种能力并非程序员直接教授，而是在算法通过奖励正确答案的机制下，自然涌现的。

DeepSeek-R1 最新发布，剑指 OpenAI o1

原创文章，未经授权禁止转载。详情见转载须知。

DeepSeek-R1 最新发布，剑指 OpenAI o1

本文地址： https://www.gpxz.com/article/9e0cc1965f58bcab85fa.html

上一篇：比亚迪举办2025首届王朝盛典聚焦用户与品牌

下一篇：阶跃星辰再拿多模态榜首全方位升级发布六款

万年历查询

2345万年历主要提供在线日历查询,农历,节日,节气,假期放假调休以及星座运势,黄历择吉日,时辰吉凶宜忌等。查万年历,日历,吉日,老黄历就上2345万年历网。

星座灵异 2026-01-20 22:21:40

中海国际大厦

中海国际大厦位于朝阳区安定路5号院，5A高端写字楼，地标性建筑，距离10号线地铁安贞门200米，楼内有食堂，停车场满足客户基本条件。本网站实时更新关于中海国际大厦的写字楼出租面积，写字楼出租价格，写字楼楼内配套等。欢迎大家咨询。

网站模板 2026-01-21 13:55:26

魔站企业建站系统

魔站企业建站系统，是八十万企业共同选择的多屏合一的响应式智能建站系统，为企业轻松搭建免费企业网站、微网站、移动网站、手机网站。响应式建站，托拉拽布局，自定主题色，行业化企业网站模板，是企业首选智能建站平台。

手机软件 2026-01-24 20:21:48

湖南田野生物科技有限责任公司

湖南田野生物科技有限责任公司系由娄底市农科所科技服务部改制而成，该服务部创立于1991年，于2001年改组为湖南田野生物科技有限责任公司，注册住址湖南省娄底市娄星区扶青南路。公司主要生产销售除草剂产品，是国家定点农药生产企业，国家高新技术企业，拥有自主进出口权，是我国最早研发推广化学除草剂的生产企业之一。

商业服务 2026-01-26 00:13:57

SKF轴承

中机华创轴承（上海）有限公司经销各品牌原装进口轴承，包括skf轴承、fag轴承、nsk轴承、ina轴承等，充足的库存，解决您购买进口轴承的后顾之忧。

企业品牌 2026-01-28 17:39:19

坑道钻机

全液压坑道钻机生产厂家赤峰捷兴钻机主要产品有全液压坑道钻机、坑道钻机、探矿钻机、绳索取芯钻机、全液压探矿钻机、钻机配件等。型号齐全、批发价格、厂家直销。

贸易批发 2026-01-28 23:32:13

超高频感应加热设备

上海为可机电设备有限公司是专业生产超高频感应加热设备，高频感应加热电源，电磁感应铝箔封口机

电影视频 2026-01-29 14:23:00

铝业网

铝业网，铝业网络门户网站，提供海量铝业公司、铝业供应、铝业采购、铝业价格行情、铝业招商加盟、铝业展会、铝业人才招聘以及铝业新闻知识等信息。

新闻资讯 2026-01-29 16:59:07

列表网

列表网为您提供生活，商务，教育，宠物，车辆，房产，加盟等综合分类信息。一站式分类信息平台，找信息，更便捷可靠。

行业信息 2026-01-20 17:47:30

首页

EXEED星途品牌以“探索精神”为价值核心，以智能、舒适、轻奢为品牌价值彰显，打造前瞻智能、品质高效的科技产品和服务体验，满足用户多维出行追求。

商业服务 2025-02-13 18:38:36

首页

苏州东山东湖莼菜厂

电影视频 2026-01-20 23:34:27

虎绰

提供最全的美女写真套图精品资源全集,通过本站将一些宅男周边好玩的,好看的,新鲜资讯分享给大家,森萝财团,森罗财团,风之领域,少女秩序,轻兰映画,喵写真,jkfun,南桃,木绵绵,喵糖映画,新蔻島,桜桃喵,过期米线线喵,神乐坂真冬,一小央泽,鳗鱼霏儿,水淼,菌烨,腐团儿,面饼仙儿,抱走莫子,nagesa魔物喵,凉凉子,木花琳琳是勇者,yoko宅夏,星之迟迟,樱桃喵,疯猫ss,,写真集,全套合集,r,本子,里番,cosplay,轰趴猫,免费下载,模范学院,波萝社新刊,秀人网,肉肉

新闻资讯 2026-02-04 19:55:44

什么app剪辑抖音视频好抖音用什么软件剪辑视频比较好 (什么APP剪辑视频最好)

刷抖音成为了很多人在生活中都喜欢做的一件事情，在闲暇的时候刷一刷抖音，的确可以让人变得放松，也可根据自己喜欢的内容弹出很多相同的内容，每个人都可以在抖音拍摄视频，那么抖音用什么软件剪辑视频比较好呢，今天小编就和大家详细介绍一下，如果喜欢拍抖音，想要拍出好看的视频，都可利用这些剪辑软件对内容进行制作，如果想对抖音的视频剪辑的话，就可下载...。

2025-02-10 00:43:15

浅谈开小米寿司店的开店秘籍 (浅谈开小米寿司店的人)

在现在这个竞争激烈的社会，只有自己创业才是致富之道了！因为人总不能一辈子替别人打工的！总的要为自己的理想而努力一搏的！创业开小米寿司店是个很理想的想法，因为现在的异域美食越来越受欢迎了！寿司的市场也越来越广阔！但是怎么才能在众多寿司店中脱颖而出呢，小编来告诉你开小米寿司店的秘籍吧！1、，开在大城市，对于很多人来说，吃寿司等同于一种小资...。

2024-12-21 18:20:42

McClure 我对完美的创业团队没兴趣 Startups创始人Dave 500 (mcclure怎么读)

雷锋网新智造按，自2010年至今，G，Startup创新创业大赛每年都会吸引来自全球各地的优秀创业团队参与，由权威投资机构作为评委，评选兼具全球视野和创新精神的早期创业团队，并为其提供超过100万美元的投资，以及来自投资人、行业知名企业的指导，在过去的几年中，G，Startup发掘了滴滴出行、豌豆荚、云知声等创业明星，而在今日，4月2...。

2024-12-03 23:53:43

最轻松投影减压方式你get了吗工作压力大 (轻便投影仪)

发表在综合交流大区2018，11，3022，26在一个惬意的周末傍晚，打开投影机，打开零食，躺在沙发上，观看一场电影是我能想到的最舒适的减压画面，在家看大屏电影，自然少不了家用投影机这一产品，今天给大家推荐一款1080P的高性价投影机，看电影不失为一种最舒适的减压方式极米Z6X家用投影机外观设计沿袭了Z6的扁平风设计，扁平的机身加上圆...。

2024-11-29 00:44:24

2024双十一万元投影仪参数配置 2024双十一万元投影仪怎么选

赤木晴子大神级投影控发表于2024，10，25在选择2024双十一万元投影仪时，可以从以下参数配置来考虑，1.光源，考虑使用LED或激光作为光源，激光投影仪的光线更集中，色彩更饱和，画面更清晰，2.分辨率，选择支持1080P或4K分辨率的投影仪，虽然4K分辨率的投影仪价格较高，但它的画质表现会比108P分辨率的投影仪好很多，3.亮度，...。

2024-11-28 18:00:10

中国在参与全球治理过程中提供的中国方案有哪些 (中国在参与全球治理时,主要考虑的是自身的经济利益)

中国方案坚持互利共赢，强调权利与责任的互动、对等和一致，强调共存共处、共同发展，强调求同存异、包容互鉴，中国方案植根中国土壤，是在中国实践的成功基础之上提出的，可以为其他国家提供借鉴参考，中国方案蕴含中华传统文化精髓，深受中华文化整体观、辩证观、义利观的启发，其所倡导的循序渐进、顾全大局、实事求是、客观公正等理念都被实践证明是有效管控...。

2024-11-19 13:48:29

巴伦西亚自治区洪灾是气象变动的结果西班牙首相 (巴伦西亚自治区地图)

外地时期11月12日，西班牙首相桑切斯在缺席第29届联结国气象变动大会时期宣布演讲，他示意，近日在西班牙巴伦西亚自治区出现的严重洪水患祸已造成超越220人死亡，而这是气象变动造成的结果，仅去年一年，气象变动就形成了环球30万人死亡，桑切斯同时在演讲中示意，目前最关键的事就是防止相似人造灾祸再次出现和进一步扩展，必定放慢翻新和，脱碳，的...。

2024-11-13 08:46:46

小米取得独立造车资质小米汽车消费企业由北汽变卦为小米 (小米取得独立市场)

7月12日，据工信部官方披露的第385批，路线机动车辆消费企业及产品通告，新产品公示，赫然产生四款，小米牌，纯电动轿车，值得留意的是，其企业称号为，小米汽车科技有限公司，去年11月15日，工信部颁布，路线机动车辆消费企业及产品通告，第377批，，两款小米牌汽车正式亮相，企业称号为北京汽车个人越野车有限公司，消费地址为，北京市北京经...。

2024-07-13 01:38:29

七彩阳光联盟有哪些学校 (七彩阳光联盟高三开学考)

慈溪中学、余姚中学、萧山中学、富阳中学、德清初级中学、桐乡初级中学、海宁初级中学、元济初级中学、平湖中学、嘉善初级中学，平阳中学、黄岩中学、鲁迅中学、新昌中学、长兴中学、永嘉中学、路桥中学、嘉兴一中、瑞安中学，浙江七彩阳光联盟难度难度高，1、成员水平高，浙江七彩阳光联盟的成员学校和组织都是浙江省内的一流学校和组织，具有较高的教学水温和...。

2024-07-07 16:07:29

言论旋涡中的体育专长生读名校国度一级静止员证真能暗箱操作吗 (言论旋涡中的反义词)

海报资讯首席记者张稳实习生牛亚琪报道有资历读北大、清华等名校的国度一级静止员证书，有或许经过暗箱操作失掉吗，近段期间，关于国度级静止员证书，有水分，、，能造假，的争议层出不穷，前有某演员在接受采访时称，自己不会游泳，，引发了网友对其游泳二级静止员证书的质疑；后有北京某中学一在校生经过了北京大学高水平静止员专项测试，却因其多场较量得分不...。

2024-07-04 14:09:52

知识网站大全-重庆分类目录网

重庆分类目录网站收录知识相关的优秀网站大全分类检索，为上网用户提供知识网站排行榜与您分享、收藏！

2023-09-18 01:03:12

中金财富管理终端-中金财富管理终端下载v9.05官方版-

中金财富管理终端,中金财富是一款专业级的股票软件，软件支持科创板普通交易、融资融券信用交易、股票期权、行情展示，以及E服务、金融商城、易网厅、OTC多金等各种服务，还有丰富的资讯让你掌握第一手实况,您可以免费下载。

2023-08-11 17:47:57

文章推荐

开启0窜水 0误启美的无冷感燃气热水器M11S Ultra新品发布 0费气新时代

随着品质生活升级，人们对沐浴及生活用水的响应速度、水温舒适度、节能等方面提出更高追求，据，厨电新观察，分析，存量化时代下，燃气热水器市场转向以用户需求为导向，并在速热、恒温、零冷水、绿色低碳、智能化等产品技术领域不断迭代创新，持续推动行业创新发展和激发市场新增量，近年来，零冷水、恒温等燃气热水器的推陈出新，虽然一定程度上改善人们的沐浴...。

2025-02-01 15:17:43

资讯动态

回顾2016李彦宏的本命年为什么用户不再热爱百度了 (回顾2016电竞)

2016年是李彦宏的本命年，在传统习俗中，本命年是个不吉利的年份，李彦宏和百度也一起遭遇了前所未有的信任危机，2016年初，李彦宏在1月17日的，未来论坛2016年会，上作为第一个嘉宾发言，这是他在百度遭遇今年第一次危机后，首次面对公众，当时，网友曝出百度血友病吧运营权被承包给第三方合伙人运营，牵出百度贴吧商业化背后的一系列问题，瞬间...。

2025-01-31 00:01:15

网络百科

网红papi酱出任百度App首席内容官 (网红papi酱)

作为曾经的第一大网红，Papi酱现在依然换了一种方式来展现自己的才华了，现在百度App官方发微博称，正式任命Papi酱正式担任百度App首席内容官，并在世界杯期间，全天各时段有抢18亿现金红包活动，首席内容官是近年来出现在视频网站公司的职位，主要负责公司的内容策略、内容营销等事宜，全面负责内容合作、媒资库、内容监控、内容投资等领域，目...。

2025-01-30 23:09:17

网络百科

如何从创业失败的阴影中走出来我们又学会了什么? (如何从创业失业到创业)

根据统计，95%的大学生出来自出创业都是以失败的结局而告终，执行力、资金、一个好的团队、每一项都会是导致失败的主要原因，创业无非有两种，一种美梦成真，迎娶白富美，走向人生的巅峰，还一种就是失败，一无所有，好比辛苦养的一个孩子突然夭折，创业就好比一条不归路，孤独的旅行，路上荆棘密布的，艰难险阻，但是依然也会有人创造传奇，如果你的一生没有...。

2025-01-28 23:54:02

好文分享

大模型给企业带来的变革与增长 (大模型给企业带来什么)

9月5日，2024腾讯全球数字生态大会在深圳国际会展中心举行，腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生，在数字生态大会上提到，增长是企业当下最重要的事，以数提效、顺势而为、扬帆出海是企业破局增长的三个方向，为了促进企业实现增长，腾讯云全面升级了智能化、融合创新、国际化三大产品体系，这些升级旨在支持企业在人工智能的应用、自...。

2024-11-30 16:15:11

资讯动态

DeepSeek (deepseek是什么)

OpenAI，你的“强”来了

三点核心技术，剑指 o1

One more thing

相关文章

文章推荐