卡牌游戏八合一华人团队开源强化学习研究平台RLCard (卡牌游戏八合怎么玩)

文章编号：46638 资讯动态 2024-12-10 胡侠冷扑大师 AlphaGo IJCAI 德州扑克强化学习人工智能斗地主

语音播放文章内容

由深声科技提供技术支持

雷锋网 AI 科技评论按：在过去的两三年中，我们经常听说人工智能在棋牌类游戏（博弈）中取得新的成果，比如基于深度强化学习的 AlphaGo 击败了人类世界冠军，由 AlphaGo 进化而来的 AlphaZero 还一并搞定了国际象棋和日本象棋；基于博弈论的冷扑大师（Libratus）也在无限注德州扑克比赛中击败了人类职业选手；今年在澳门举行的 IJCAI 2019 上我们也发现了一篇斗地主 AI 论文。

不过，虽然这些团队各自做出了令人瞩目的成果，但不管对于工业界还是学术界来说，都缺少一个迅速开发和测试棋牌类 AI 的环境。最近德州农工大学胡侠带领的华人团队就给出了他们的解决方案，开源了基于牌类游戏设计的强化学习 Python 平台 RLCard ，在打包实现了多种牌类游戏算法的同时，也提供了中西方最流行的几种牌类游戏环境（包括斗地主、麻将、21点、德州扑克、UNO等），致力于为强化学习提供一个统一、易用的开发和测试环境。雷锋网 AI 科技评论介绍如下。

卡牌游戏八合一，华人团队开源强化学习研究平台RLCard

具体来说，RLCard 实现了四种有代表性的强化学习算法：作为强化学习的代表算法的 DQN、作为带有自我学习的强化学习的代表算法的 NSFP、反事实后悔最小化 CFR 以及深度反事实后悔最小化 DeepCFR。RLCard 中也带有一个随机智能体。

RLCard 中实现了八种牌类游戏环境：二十一点（Blackjack），三种德州扑克（简化版德扑 Leduc Hold'em，有限制德扑 Limit Texas Hold'em 以及无限制德扑 No-limit Texas Hold'em），斗地主，麻将，UNO 以及升级（目前升级游戏环境还在开发中）。

卡牌游戏八合一，华人团队开源强化学习研究平台RLCard

RLCard 安装快速、使用简单，提供大量的实例、文档及 demo；提供人类与 AI，以及 AI 与 AI 间对战的接口，支持并行加速。平台设计遵循以下设计原则：

对于游戏环境实现，RLCard 平台抽象并定义了这些游戏概念：玩家，比赛（Game），对局（Round），发牌者（Dealer），裁判（Judger）。游戏环境实现都通过这些概念对应的类，这样的相同的设计规范让游戏逻辑更容易理解、更容易操作。别的牌类游戏也基本都可以符合这个结构，未来如果想要增加很容易。

作为对比，现有的强化学习库多数都是单智能体环境的（比如 OpenAI Gym）；近期虽然也有一些支持多智能体的环境（比如星际2），但它们并不支持牌类游戏。RLCard 专为牌类游戏设计，不仅是一些牌类游戏在强化学习库中的首次实现，也提供了简单直观的接口，便于强化学习研究。

在目前的学术文献中，解决扑克游戏的最热门的方法是反事实后悔最小化（Counterfactual Regret Minimization，CFR），以及它的各种变体，胜过了人类职业选手的冷扑大师（Libratus）使用的就是基于 CFR 的方法。不过，CFR 很消耗计算资源，因为它需要完全遍历整个游戏树，所以它也不适用于斗地主之类的状态空间很大的游戏。

近期也有研究表明，强化学习策略可以在打赌类的博弈中取得很好的表现，比如玩斗地主就玩得不错。这些美妙的成果，以及强化学习本身的灵活性都让我们有可能探索状态空间、行动空间更大的更困难的牌类游戏。

RLCard 使用简单，输入 pip install rlcard 可快速安装。安装完成后，用以下 5 行代码就能用随机的智能体产生对局数据，返回的数据可直接用于强化学习算法训练。

卡牌游戏八合一，华人团队开源强化学习研究平台RLCard

另外，RLCard还提供了丰富的的运行实例，包括产生随机数据，训练CFR、DQN、NFSP等算法，以及多进程运行实例。

卡牌游戏八合一，华人团队开源强化学习研究平台RLCard

RLCard 提供人机对战 demo。RLCard 提供 Leduc Hold'em 游戏环境的一个预训练模型，可以直接测试人机对战。Leduc Hold'em 是一个简化版的德州扑克，游戏使用 6 张牌（红桃 J、Q、K，黑桃 J、Q、K），牌型大小比较中对牌>单牌，K>Q>J，目标是赢得更多的筹码。与预训练模型对局展示如下：

卡牌游戏八合一，华人团队开源强化学习研究平台RLCard

除此之外，开发团队还对 RLCard 做了系统的评估。他们测试了最流行的强化学习算法在环境上的表现。测试方法包括与随机策略的比较以及 AI 间互相对战的比较。发现主流算法在小型游戏上普遍有较好的效果，但是在较复杂游戏（例如斗地主、UNO）效果一般。如何在复杂的游戏中更好地训练强化学习算法需要更多的研究。

卡牌游戏八合一，华人团队开源强化学习研究平台RLCard

团队也对游戏运行的效率进行了评估。在 24 核 2.10GHz CPU 服务器上对各个游戏的运行时间进行了测试，使用多进程可以更高效地产生游戏数据。

卡牌游戏八合一，华人团队开源强化学习研究平台RLCard

目前 RLCard 的官网已经上线，其中提供了详细的文档。学术论文也已经发表在 arXiv，第一作者为查道琛。详细信息可以访问下面的链接：

未来，作者们还会继续优化和增强这个平台，他们的计划包括增加基于规则的智能体、增加更多预训练模型（帮助评价模型），增加更多游戏环境和算法，以及增加可视化和分析功能等。相信这个环境能对领域内的研究人员们起到很大帮助。

感谢查道琛、胡侠对文本提供的帮助。雷锋网 AI 科技评论报道。

原创文章，未经授权禁止转载。详情见转载须知。

卡牌游戏八合一，华人团队开源强化学习研究平台RLCard

本文地址： https://www.gpxz.com/article/e687f968eed515a19769.html

上一篇：要怎么精确导航室内没有GPS信号怎么精确导

下一篇：人工智能将为这五个难题绞尽脑汁2018年人工

申芯微(上海)半导体科技有限公司

申芯微（上海）半导体科技有限公司（以下简称“申芯微”）2022年在上海成立的高科技初创企业，主要从事集成电路芯片及电子元器件产品研发、生产、销售业务。申芯微以为物联网领域、人工智能和大数据处理提供解决方案为使命，汇集了一批行业内的顶级专家，自主研发创新，为信息技术的发展作出贡献，同时在智能电力领域具有比较丰富的行业资源。

下载资源 2026-01-24 22:30:16

无锡华达电机

江苏西葆电力设备有限公司是雷勃电气无锡有限公司马拉松电机授权代理商，主营产品：马拉松电机、marathon电机、无锡华达电机、UL认证电机、NEMA电机。

电影视频 2026-01-25 19:04:46

优咔科技

上海优咔网络科技有限公司是一家提供车联网连接管理服务、车联网运营服务、车联网生态服务的通信高科技企业,是国内车联网行业专业的服务提供商和方案解决商。

网络应用 2026-01-28 21:46:25

东方人才网

海南东方市人才网站，是海南区域内专业的求职招聘平台。专为求职者提供丰富的工作信息，为招聘方寻找合适的优秀人才。东方招聘信息网覆盖了东方市的各行各业，无论您是想找工作还是招聘人才，我们都将为您提供专业|全面的服务。

网站模板 2026-01-29 15:55:27

新中式家具

上海忆苑家具，自成立以来一直专注于高品味的新中式家居饰品领域，以东方智慧融入产品内涵，以自然态度倾诉生活境界，以时尚姿态把握家居理念。是一家专业生产具有东方文化特色的时尚家居厂家，拥有一支集研发设计、生产、销售为一体的优秀团队。

设计美化 2026-01-29 16:53:56

随州门户网

随州门户网是一个以消费时尚,娱乐休闲,本地生活为主的大型综合性网站，内容涉及到本土衣食住行、吃喝玩乐等日常实用消费信息。

新闻资讯 2025-02-01 14:11:26

宁海在线

宁海影响力网络媒体，全面提供宁海本地综合信息资源，是了解宁海、互动宁海、共建宁海的渠道。

游戏网游 2026-01-29 19:22:36

网络游戏攻略

澄拾将不断分享自己的游戏心得和经验，希望这种互动交流能够提升个人及玩家们的游戏技巧，还能够增加游戏的乐趣。

游戏网游 2025-02-22 18:36:32

政策补贴宝

“政策补贴宝”是天九共享网络科技集团运用大数据、人工智能等技术，整合了全国政策数据，并基于精准算法开发了智能政策匹配系统。覆盖了我国各级政府每年发布的数千项政策，从国家部委到省、市、区县，政策主要发布部门包括科技、发改、招商、文化旅游、人社等多个部门。为企业服务，实现企业政策精准匹配，政策补贴快速申请。

网络应用 2025-03-05 00:29:03

山东盈莱洗涤服务有限公司

山东盈莱洗涤服务有限公司作为一家从事酒店、干洗以及加工、租赁三位为一体的现代化洗涤公司

商业服务 2026-01-25 17:26:51

临沭县人民医院

临沭县人民医院前身为中国人民解放军华野淮海战役战地医院，目前已经发展成为集医疗、教学、科研、预防、保健、康复为一体的现代化三级乙等综合医院，国家级爱婴医院。

健康医疗 2026-01-29 16:18:48

自助销售网

自动销售网是一款用于软件充值等虚拟卡密24小时在线交易的自动销售平台,对比其他自动销售平台费率低,功能全,服务器安全稳定.销售平台就选自动销售网！

手机软件 2026-02-04 22:21:09

火热上映中人在天涯扫毒3 当贝投影为电影联合推广合作伙伴

在众多影迷的期待中，聚齐郭富城、刘青云、古天乐三大影帝的，扫毒3，人在天涯，已于7月6日在全国上映，当贝投影为电影联合推广合作伙伴，当贝投影&，扫毒3，人在天涯，三大影帝齐聚最经典警匪动作IP再现火爆场景作为香港电影中最经典的警匪动作IP之一，，扫毒，系列在不少观众心中有着无可替代的位置，扫毒3，人在天涯，由擅长拍摄警匪动作...。

2025-02-02 18:35:15

北京时间自媒体平台即将上线！新360自媒体 (北京时间自媒体平台)

在3月初，就有网友爆料，360自媒体要和北京电视台联合推出新的自媒体平台——，北京时间，而在3月份期间，北京时间自媒体已经进行系统内部邀请入驻方式，邀请了一部分自媒体人直接进驻，并在4月9日后陆陆续续的发放帐号，据得知，360自媒体，北京时间，将在4月12日星期二上线，我们先来了解下北京时间的一些具体情况，北京时间是由360和北京电...。

2025-02-02 02:35:06

回转寿司加盟店 (回转寿司加盟费多少钱)

回转寿司，是寿司餐厅的一种，师傅把制作好的寿司放在盘子后摆在运输带上，运输带围绕餐厅的坐台而行，顾客可随意食用，用膳后，店员依照顾客桌上的盘子而结算帐单，通常，回转寿司设备运输带的运转速度是固定的，在不同的环境下可能需要进行改造，回转寿司的运输带上除了寿司之外，还有日式小吃、纸包饮料、水果、甜点、汤等，回转寿司店通常比传统寿司店的价钱...。

2024-12-21 21:08:43

意式披萨加盟哪家好 (意式披萨加盟店大概需要多少钱)

意式披萨，外形独特，口味丰富，广受消费者欢迎，现在许多创业者都想开一家意式披萨店，但苦于选择品牌，那么，意式披萨加盟哪家好，意式披萨加盟优选比意格意式披萨，为什么这么说呢，不妨看看以下介绍，比意格意式披萨隶属于广州管理有限公司，该公司是一家集餐饮项目开发、品牌策划、技术培训、开店指导、运营服务为一体的综合性企业，不仅为消费者奉上了一道...。

2024-12-03 00:14:09

茶叶的茶叶怎么样茶叶的茶叶有哪有优点 (茶叶的茶叶怎么写)

茶叶是的国饮，因为具有很好的保健作用，在全国国民都更加注重健康的国情之下，喝茶人群的年龄也逐渐由老人向年轻人蔓延，而茶叶品牌也如雨后春笋般的发展起来，具有六大茶类的茶叶，成为很多茶客青睐的品牌，那么茶叶的茶叶怎么样?接下来我们一起来看看，一、产品质量可追踪，原产地更正宗！茶叶遍访全国茶园，坚持寻找好的茶青，与好的茶园建立长期合作社模式...。

2024-11-23 00:27:05

别对X下手！万斯正告欧盟 (别怪我对你下手了)

[万斯正告欧盟，别对X下手！]据德国资讯电视频道网站11月9日报道，在美国大选前的一次性采访中，特朗普的竞选伙伴詹姆斯·戴维·万斯曾要挟道，假设欧盟继续对埃隆·马斯克的社交平台X采取执行，美方将拒相对欧盟中的北约成员国提供支持，报道称，随着特朗普胜选，万斯也行将成为副总统，这一要挟的重量又重了几分，过后，万斯在采访中示意，一名欧盟初级...。

2024-11-12 19:02:26

枪法太差被拒绝因美媒爆料袭击特朗普的枪手高中时曾想参与射击队 (枪法太差被拒绝怎么办)

[全球网报道记者姜蔼玲]外地期间13日，前美国总统特朗普在美国宾夕法尼亚州举办的竞选集会上宣布演讲时，现场突然响起枪声，特朗普被特勤局人员护送分开，美联邦考查局随后发申明称，确认枪击特朗普的枪手身份为20岁宾夕法尼亚州女子托马斯·马修·克鲁克斯，事发时其经常使用一支AR，15型步枪，后被当场击毙，无关克鲁克斯更多信息，成为美媒关注焦点...。

2024-07-15 21:55:02

8月29日是什么星座 (8月29日是星期几)

1、阳历08月29日的星座，处女座，出世日期8月23日，9月22日，2、处女座，virgo，是黄道十二宫的第六宫，出世日期为8月23日—9月22日，在狮子座之东，天秤座之西，3、处女座认真慷慨，外表柔和，外在充溢热情的星座；青睐关注细节，容易挑剔和神经弛缓，做事精打细算，只管较外向不免会使心境忧郁，但天生的好处就是放得开，不会因此一...。

2024-07-09 18:17:02

美以相关紧张之际知情人士称估量拜登几周后将同到访的内塔尼亚胡会见美媒

[全球网报道]据美国有线电视资讯网，CNN，外地时期7月2日报道，一名知情人士通知该媒体，估量几周后美国总统拜登将在华盛顿同到访的以色列总理内塔尼亚胡举办会见，CNN提到，估量内塔尼亚胡将访问美国，并于7月24日向美国国会宣布演讲，报道称，一名知情人士说，估量拜登会与到访的内塔尼亚胡在华盛顿会见，此次会见或者会在白宫举办，美国和以色列...。

2024-07-04 13:51:23

xf是什么意思 (xf是什么意思骂人)

xf的意思有，极优的、不提供、超精细的、木琴、媳妇，1、extrafine，极优的，白兰地规格，藏窖年份75年以上，；，线等，特细的，2、exoffer，不提供，代号，3、extrafine，超精细的，特细的，代号，4、xilofono，木琴，5、媳妇的缩写，例句，1、ExperienceforUseofConcretewithF...。

2024-07-01 17:22:12

橙子vr怎么使用橙子vr使用教程详情介绍

橙子vr是个功能性非常强的VR视频播放器，使用其可以帮助用户自由观看更多的电影电视，给用户带来更多的享受。这里2265小编为大家带来橙子vr使用方法攻略，赶紧看看吧！橙子VRapp是一个优质VR视频3D电影电视剧动画聚合平台，超级好用的360度全景视频VR播放器，

2023-10-11 01:59:30

IE修复_保护浏览网页安全软件下载

保护浏览网页安全软件下载PC6免费提供IE修复,浏览安全下载

2023-08-11 17:31:23

文章推荐

靠扮女神赚400万美元女子长相似梦露 (我靠女装爆红了)

2015年10月2日报道，来自美国加州的55岁女子SusanGriffiths，这位前化妆品公司的销售代表化妆后变身为好莱坞女星玛丽莲，梦露的分身，多年以此赚到了令人瞠目的400万美元，来源，IC这名金发女郎凭借自己与荧幕经典形象惊人的相似度获得了来自全球各地的邀约，甚至还在鬼才导演昆汀，塔伦蒂诺的经典作品，低俗小说，中出演，Susa...。

2025-01-30 17:47:39

网络百科

自行车品牌加盟自行车品牌 (自行车品牌加盟)

自行车，从西方地区传入中华，又称脚踏车或单车，通常是二轮的小型陆上车辆，现在自行车遍及世界各地，进入家家户户，是人们常见的交通工具，人骑上车后，以脚踩踏板为动力，是绿色环保的交通工具，英文bicycle或bike的bi意指二，而cycle意指轮，在日本称为，自転，转，车，；在中国大陆、香港、澳门、台湾、新加坡，通常称其为，自行车，或，...。

2024-12-21 19:10:53

创业加盟

加盟费多少钱怎么加盟韵意心无人售货店 (霸王茶姬加盟费多少钱)

智能化科技已然融入到各行各业中，其中无人售货机发展潜力颇大，韵意心无人售货店打造智能无人售货店，以二十四小时自动售货的模式，让店面经营三百六十五天天天有账进入，红火发展效应和契机下，也让品牌总部面向市场诚邀加盟合伙人，那么怎么加盟韵意心无人售货店，加盟费多少钱，怎么加盟韵意心无人售货店设备采用全钢加厚机身，安全坚固，自重约一千斤，安全...。

2024-12-21 14:33:58

创业加盟

NVIDIA推出Titan RTX；腾讯泰国推微信支付；库克获反仇恨勇气奖；陆金所最新融资13亿 (nvidia显卡官网)

NVIDIA推出，TitanRTX，显卡12月3日，在推出QuadroRTX系列之后，NVIDIA发布了三款消费类GeForceRTX显卡，推出了第一款TuringTesla，NVIDIA再此更新高端显卡Titan，即TitanRTX，这一次，NVIDIA为TitanRTX起了个昵称，T，Rex，霸王龙，规格方面，TitanRTX...。

2024-12-09 23:07:20

资讯动态

notability怎样添加分配器 (notability)

notability怎样添加分配器，notability里有两种方式可以帮助用户来管理自己的笔记，你还可以通过主题来管理，那么应该怎么添加分配器呢，还不清楚的用户就一起来看看吧！...。

2024-12-02 00:00:59

技术教程

卡牌游戏八合一 华人团队开源强化学习研究平台RLCard (卡牌游戏八合怎么玩)

相关文章

文章推荐

卡牌游戏八合一华人团队开源强化学习研究平台RLCard (卡牌游戏八合怎么玩)