蚂蚁集团联合出招 OpenAI 应对AI大模型新的安全挑战 (蚂蚁集团联合贷款)

文章编号：40462 资讯动态 2024-12-03 AI大模型蚂蚁大模型安全

去年年初，ChatGPT引爆了新一轮AI浪潮。在人们期待大模型能够为各行各业带来颠覆性变革的同时，也不得不承认，大模型创造了新机遇，但也带来了新的安全风险。

比如，基于大模型的高效内容生成特质，黑客的攻击成本和门槛变低，发动更加密集的攻击变得容易，助长黑客行为；基于生成式AI在多种语言和信息整合的优势，伪造一个极其逼真的骗局成本和时间降低，网络钓鱼行为规模范围、实施效率大幅度提升；还有老生常谈的数据泄漏问题，将企业的安全、隐私等置于极大的威胁中。

难以想象，如果不对大模型的安全问题加以防御，任由其野蛮生长，将会带来多么严重的后果。

如今，经过去年持续一年多的“百模大战”后，大模型进入落地应用阶段，开始走进千行百业，与各种各样的场景进行深度融合。基于此，面对持续发展的大模型所带来的安全威胁与挑战，如何采取积极措施，在已有的、传统的安全工具、策略体系下，进行技术和方法的革新，打造安全可信的大模型，成为全球范围内各大大模型厂商、从业者关注的焦点所在。

WDTA就大模型安全发布国际标准，AI安全评估测试进入新基准

4月15日-19日，第27届联合国科技大会在瑞士日内瓦召开。其中，4月16日，在以“塑造AI的未来”为主题的AI边会上，世界数字技术院（WDTA）发布了一系列突破性成果，包括《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。

应对AI大模型新的挑战，<a href= openai、蚂蚁集团联合出招" src="https://www.gpxz.com/zdmsl_image/article/20241203181544_45919.jpg" loading="lazy"> WDTA发布大模型安全国际标准，OpenAI、蚂蚁集团、科大讯飞等参编

据了解，世界数字技术院（WDTA）是一家在日内瓦注册的国际非政府组织，遵从联合国指导框架，致力于在全球范围内推进数字技术，促进国际合作。

其中AI STR（安全、可信、负责任）计划是WDTA的核心倡议，旨在确保人工智能系统的安全性、可信性和责任性。蚂蚁集团、华为、科大讯飞、国际数据空间协会(IDSA)、弗劳恩霍夫研究所、中国电子等均为其成员单位。

而此次会议上发布的两项国际标准——《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》，是国际组织首次就大模型安全领域发布的国际标准，代表着全球人工智能安全评估和测试进入新的基准。

据悉，这两项国际标准是由OpenAI、蚂蚁集团、科大讯飞、谷歌、微软、英伟达、百度、腾讯等数十家单位的多名专家学者共同编制而成。

据了解，《生成式人工智能应用安全测试标准》（以下简称《标准》）由WDTA作为牵头单位，该《标准》概述了一个综合框架，用于测试或验证下游人工智能应用程序的安全性，特别是那些使用大语言模型（LLM）构建的应用程序。

整体来看，该《标准》定义了人工智能应用程序架构每一层的测试和验证范围，包括基础模型选择、嵌入和矢量数据库、RAG或检索增强生成、APP运行时安全等，确保人工智能应用程序各个方面都经过严格的安全性和合规性评估，保障其在整个生命周期中免受各种威胁和漏洞的侵害。

而《大语言模型安全测试方法》（以下简称《测试方法》）由蚂蚁集团牵头编制。

相较于《标准》，《测试方法》则为大模型本身的安全性评估提供了一套全面、严谨且实操性强的结构性方案，提出了针对大语言模型的安全风险分类、攻击分类和分级方法以及测试方法，并率先给出了四类不同攻击强度的攻击手法分类标准，提供了严格的评估指标和测试程序等，可有效解决大语言模型固有的复杂性，测试其抵御敌对攻击的能力，使开发人员和组织能够识别和缓解潜在漏洞，并最终提高使用大语言模型构建的人工智能系统的安全性和可靠性。

聚焦大模型安全风险，筑牢防线刻不容缓

会上，WDTA人工智能安全可信负责任工作组组长黄连金表示，这两项标准汇集了全球AI安全领域的专家智慧，填补了大语言模型和生成式AI应用方面安全测试领域的空白，为业界提供了统一的测试框架和明确的测试方法，有助于提高AI系统安全性，促进AI技术负责任发展，增强公众信任。

正如黄连金所言，这两项标准的制定集齐了国内外多位专家学者的智慧，而像OpenAI、蚂蚁集团、科大讯飞、谷歌、微软、英伟达、百度、腾讯等大模型领域厂商，以及360、奇安信、深信服等安全厂商，也都在打造安全可信的大模型的道路上进行了长期的探索。

比如，作为ChatGPT、GPT-4等最前沿大模型技术背后的公司，OpenAI在去年7月宣布成立Superalignment团队，由联合创始人Ilya Sutskever和Jan Leike共同领导，目的是创建一个接近人类水平的、负责模型对齐的“AI研究员”，即用AI来监督AI。

作为推动大模型快速发展背后的算力提供者，英伟达在去年4月推出了一款名为NeMo Guardrails的软件，该软件能够为AI模型设置安全“护栏”，避免输出一些错误的事实、涉及有害的话题或导致安全风险，以解决大模型存在的“幻觉”难题。

今年3月，国内安全厂商360发布360安全大模型3.0版本，奇安信、深信服等安全厂商也都相继发布AI+安全产品，在探索安全大模型的道路上进行了深度探索。

而作为此次《大语言模型安全测试方法》牵头编制方的蚂蚁集团，更是在安全领域有着丰富的经验。

众所周知，蚂蚁集团最初是从支付宝这一小工具诞生，发展至今，而在涉及人们“钱袋子”的问题上，安全和可靠的重要性不言而喻，因此，从2015年起，蚂蚁集团就开始积极投入可信AI技术研究，目前已建立了大模型综合安全治理体系。

据了解，去年9月，蚂蚁集团自研了业界首个大模型安全一体化解决方案“蚁天鉴”，包含大模型安全检测平台“蚁鉴”、大模型风险防御平台“天鉴”两大产品，可用于AIGC安全性和真实性评测、大模型智能化风控、AI鲁棒和可解释性检测等。

此次发布的《测评方法》，便是蚂蚁集团基于“蚁天鉴”AI安全检测体系的应用实践，与全球生态伙伴交流编制。

此外，蚂蚁集团在公司内成立了科技伦理委员会和专门团队来评估和管理生成式AI的风险，公司所有AI产品均需通过科技伦理评测机制，确保AI安全可信。

不仅如此，去年2月，蚂蚁集团还在设立公司内部科技伦理委员会的基础上，成立科技伦理顾问委员会，定期邀请AI领域的专家学者围绕着科技伦理治理体系建设、生成式AI治理、大模型风险管理等议题进行深入讨论，力求打造“安全、合规、可控、可靠”的大模型。

应对AI大模型新的挑战，OpenAI、蚂蚁集团联合出招

蚂蚁集团王维强作为标准参与单位代表，在会上发言

正如蚂蚁集团机器智能部总经理、蚂蚁安全实验室首席科学家王维强在会上所言，“生成式AI将释放巨大的生产力，但也要对它带来的新风险高度警惕。”

大型科技公司应在促进生成式AI安全和负责任的发展中发挥关键作用，利用其资源、专业知识和影响力推动最佳实践，构建一个优先考虑安全、隐私、可靠和伦理优先的生态系统。例如，通过制定行业标准与指南，为开发和部署生成式AI系统的开发者和机构提供清晰指导；投入研发并开放保障生成式AI安全的工具，形成产业共治。

如今，当大模型开始走进各行各业，在成千上个场景落地的时候，打造安全、可信、可靠的大模型已经不是某一家大模型厂商需要解决的问题，而应该是产业各界携手，群策群力，一起面对、迎接AI新时代的挑战，创造更美好的未来。

原创文章，未经授权禁止转载。详情见转载须知。

应对AI大模型新的挑战，OpenAI、蚂蚁集团联合出招

本文地址： https://www.gpxz.com/article/cd505ad7eec64cbc2935.html

上一篇：李佳琦公司合同细则曝光别的渠道比直播间价

下一篇：印度明确将追责车企国内电车再起火有法可鉴

天元设计

天元建设工程设计研究院隶属于建筑工程施工总承包、市政公用工程施工总承包双特级大型企业天元建设集团有限公司。

设计美化 2026-01-24 22:13:03

理想作文网

理想作文网_专业提供各种优质教学文档,学习文档,优秀作文,经典美文,毕业论文,职场文档,古诗文,实用文,个人工作总结范文等优质文章内容资源文档。

下载资源 2026-01-25 15:32:57

物流公司

驹马提倡优质服务理念的物流公司,以香港物流,澳门物流,台湾物流为核心.致力于为客户提供优质高效的仓储物流,仓储配送,第三方仓储物流与仓库托管服务电话4006123466

商业服务 2026-01-25 16:31:40

东莞领航电子新材料有限公司

抛光液、抛光蜡,专利,证书,详情

电影视频 2026-01-25 16:42:47

B2B电子商务平台

书生网是一个专业的B2B电子商务信息平台,汇集海量商家的供求信息和产品展示，以及行业大全和近期的行业资讯,帮助您促成订单,是中小型企业寻求电子商务网络贸易信息的好帮手.

网络应用 2026-01-26 00:11:43

设计百宝箱

设计百宝箱-全球权威设计师网址导航，严格收藏全球著名品牌、包装、广告、营销、咨询、室内、建筑、工业设计公司，以及常用的图片、字库、素材、设计社区等全方位设计师网站导航指引。

图片摄影 2026-01-28 15:36:35

数字电子手臂和手腕血压监测器制造商

Hopfat是一家专业从事全球医疗器械OEM/ODM制造、制造和出口的企业，主要经营数字式电子血压计、数字式电子体温计、非接触式额头体温计等医疗器械

企业品牌 2026-01-28 20:53:01

邢台市岳鲁机械制造有限公司

专业从事系列叉车属具的研发制造和销售

电影视频 2026-01-28 23:10:39

首页

大众报业集团大众日报社

电影视频 2026-01-28 23:27:50

淮畔珍珠梗米丨闪蝶大米丨闪蝶稻虾米

安徽优科生态农业有限公司坐落在素有“淮上明珠”之称的凤台，优科致力于绿色生态农业的传播与发展，是集基地种植、研发生产、销售于一体的实业公司，主营产品有淮畔珍珠梗米丨闪蝶大米丨闪蝶稻虾米，现已在朱马店等乡镇，建立了拥有15万亩全国绿色食品原料专业化生产基地，先后授予绿色食品、“凤台糯米”地理标志等品牌荣誉。

企业品牌 2026-01-29 15:00:13

江苏品诚标识有限公司

江苏品诚标识有限公司专业致力于导视系统研发设计、标识标牌制作、发光字、广告灯箱、景观雕塑、道路交通设施安装一体化，标识系统工程全案解决专家！

设计美化 2026-01-29 15:40:55

福州凡来界信息科技有限公司

福州凡来界信息科技有限公司官网

行业信息 2026-01-29 16:10:53

JIP发起2万亿日元要约收购日本东芝公司最早或于年内退市

日前，日本东芝公司，TOSHIBA，宣布，以日本国内私募股权基金，日本产业合作伙伴，即JapanIndustrialPartners，简称JIP，为主的财团于8月8日正式向东芝发起总额约２万亿日元，约合人民币1007亿元，的要约收购，如果该收购成功达成，东芝最早将于2023年内退市，记者了解到，以JIP为主的日本财团由20多家日本公...。

2025-02-02 19:29:06

峰米激光电视怎么调焦距 (峰米激光电视官网)

发表在专业问答2021，7，1017，18展示机型信息，品牌型号，峰米激光电视4Kmax系统版本，FengOS使用遥控器打开峰米激光电视的系统设置界面；选择图像设置，并点击打开图像设置界面；点击打开画面对焦功能，通过遥控器的方向键进行调焦即可，峰米激光电视怎么调焦距1.打开系统设置使用遥控器在峰米激光电视的主界面找到系统设置并点击打开...。

2024-11-28 13:36:25

小心！搜索记录暴露你的内心

当你在某搜索引擎里面还只写下几个字而后面半句话就已经自动出现的时候，如下图，，有没有想一下这是为什么，是的，在一个人人都离不开网络的时代，你在网上的一举一动、一言一行都留下了足迹，搜索引擎之所以能够联想出你的下半句，那是因为你并不孤单，你想搜索的、在世界的各个角落，你并不认识的同伴们也在搜索，于是，有一群看热闹不嫌事大的程序猿们，专门...。

2024-11-16 00:03:23

乌拉圭0 中柱苏亚雷斯告别战染黄 (乌拉圭中场)

直播吧9月7日讯北京期间9月7日早上7，30，世预赛南美区第7轮，乌拉圭主场迎战巴拉圭，此役也是苏亚雷斯的国度队告别战，上半场，恩西索中框，苏亚雷斯工笔腾空斩中柱，下半场，戈麦斯兜射中框，苏亚雷斯替队友出头染黄，全场完结，乌拉圭0，0巴拉圭，本场事先，乌拉圭4胜2平1负积14分继续排名第2，巴拉圭1胜3平3负积6分排名第7，[较量焦点...。

2024-11-12 22:05:23

美国宾夕法尼亚州女子托马斯·马修·克鲁克斯为枪击前总统特朗普的枪手 (美国宾夕法尼亚大学世界排名第几)

美国宾夕法尼亚州女子托马斯·马修·克鲁克斯为枪击前总统特朗普的枪手降级，美国联邦考查局确认20岁的美国宾夕法尼亚州女子托马斯·马修·克鲁克斯为枪击前总统特朗普的枪手，关系资讯FBI发布刺杀特朗普者身份，来自宾州外地一20岁女子，澎湃资讯，新华社纽约7月13日信息，美国前总统特朗普今日在宾夕法尼亚州巴特勒市举办的竞选集会现场出现枪击事情...。

2024-07-15 20:17:03

联结国环球人口将在本世纪80年代到达约103亿的峰值 (环球联署倡议)

外地期间7月11日，联结国经济和社会事务部，经社部，颁布，环球人口展望2024，报告，报告预测，环球人口将在本世纪80年代到达约103亿的峰值，随前人口数量将会缓慢降低，在21世纪完结前回落至102亿人，对2100年人口数量的预测较10年前的预测数据降低6%，报告称，目前环球已有63个国度与地域人口数量曾经到达高峰，人口数量占环球的2...。

2024-07-13 01:30:48

爱奇艺在哪里下载装置 (爱奇艺在哪里取消自动续费)

机顶盒装置，爱奇艺，须要到机顶盒的运行商店启动下载装置，详细方法为，展示以小米机顶盒为例，其余机顶盒的操作方法大抵相反，1.首先在机顶盒的页面上找到，搜运行，的选项，进入机顶盒的运行商店，2.进入机顶盒的运行商店后，在搜查区域经常使用遥控器输入，爱奇艺，启动电视运行搜查，3.在搜查的结果页面中，点击，爱奇艺TV版，启动下载装置，4....。

2024-07-09 01:51:59

房顶像孤岛洞庭湖外地村民讲述撤退险情家里洪水3米高 (房顶像孤岛洞的房子)

顶端资讯首席记者杨晓妍，文记者宋亚猛，图7月7日午时，阳红在湖南省岳阳市华容县职业中专食堂的电视前停下，画面上播放的是湖南的午间资讯，她在寻觅着故乡的痕迹，该学校是华容县的四个安排点之一，阳红在内的700余名灾民在这里，期待着重回故乡、重建家园，7月7日，华容县职业中专团洲同乡集中安排点就在两天前的7月5日16时，华容县团洲垸洞庭湖一...。

2024-07-08 17:51:29

09款英菲尼迪G37S大略性能是怎么的 (09款英菲尼迪fx35)

09款G37SSedan搭载可输入328马力的3.7LV6人造吸气引擎，传动系统除了提供六前速手动波箱，还会提供全新的七前速手自波箱，FR驱动规划，0，100km，h减速约为5秒，Infiniti更为G37车系提供高性能刹车系统，前四卡钳、后两卡钳，作为选装设施，新车的头尾灯仅作出小许改变，全新18寸合金轮圈及新增的尾绕流器则是新车外...。

2024-07-06 22:14:51

Plus将于6月20日上市 2024款广汽埃安或装备遥控泊车性能 V (plus最新进展)

易车讯咱们从关系渠道得知，新款埃安AIONVPlus将于6月20日上市，新车将基本坚持现款车型的外型设计，在性能上新车有望装备遥控泊车性能，外型方面，新车估量将与现款车型坚持分歧，照旧驳回时兴的外型设计，敞开式进气格栅很有电动车的特征，车身尺寸方面，新车的长宽高区分为4650，1920，1720mm，轴距2830mm，与现款车型坚持分...。

2024-07-06 14:45:10

怎样在手机上看CCTV5体育频道直播 (怎样在手机上学英语免费)

可以在手机高低载央视影音运行，经过该运行观看CCTV5体育频道的直播，央视影音是央视官方推出的手机运行，提供了丰盛的央视节目资源，包含CCTV5体育频道的直播，下载装置央视影音运行后，关上运行并选用CCTV5频道，即可观看体育频道的直播内容，同时，央视影音还提供了丰盛的节目回放、预订等配置，繁难用户随时随地观看央视节目，关于无法下载央...。

2024-07-05 13:33:29

天正建筑T20v10.0破解版下载-T20天正建筑v10.0破解版v2024永久激活版

T20天正建筑v10.0破解版是一款功能强大的电脑CAD绘图软件，在自定义对象核心技术方面取得了极大突破性，引入了动态数据扩展的技术解决方案

2023-11-10 06:44:08

文章推荐

自己制作音乐的软件有哪些自己制作音乐的软件合集 (自己制作音乐视频,怎样显示歌词)

很多小伙伴都有自己创造音乐的念头，但之前由于智能手机的技术还不是很完善，所以没有什么软件能够完成这一理想，而如今科学技术发展的壮大，让智能手机的功能也越来月强大了，接下来介绍自己制作音乐的软件有哪些，找到自己喜欢的那一个音乐制作软件去下载体验，相信在大家的努力之下能够制作出非常动听优美的旋律，1、，5sing原创音乐，比较大的原创音乐...。

2025-02-10 00:16:16

资讯动态

只要两年手机就能变成唯一的计算机 (只要两年手机就会坏吗)

现在几乎每个人手上都至少有一个智能手机或平板，我们的生活很好地证明了这一点，在过去的2年里，仅仅是智能手机就能满足基本数字化生活需求了，但是在几年前，情况并不是这样的，甚至是2011和2012年的智能手机，都没有强大到满足我们对电脑的要求，由于移动设备处理能力的增强，电池寿命的延长，网络速度的提高以及屏幕尺寸的加大，手机时代也越来越接...。

2024-12-09 20:00:46

资讯动态

哪些行业成勒索攻击重灾区重磅发布深信服2021年度勒索病毒态势报告 (什么行业容易成功)

勒索病毒作为目前最具有破坏力的恶意软件之一，在2021年达到爆发高峰，据深信服云端监测，全网勒索攻击总次数高达2234万，，影响面从企业业务到关键基础设施，从业务数据安全到国家安全与社会稳定，同时，随着ApacheLog4j2漏洞等全球网络安全事件频频出圈，网络攻击的强度和破坏性都前所未有，网络安全不再只是计算机行业的，独角戏，，已然...。

2024-12-09 14:27:33

资讯动态

火爆TWS耳机芯片赛道里的单项冠军 (tws耳机火了)

2016年苹果的秋季发布会，苹果的王牌产品iPhone7，7Plus没能让消费者眼前一亮，反倒是为配合手机上取消3.5mm耳机接口而推出的全新产品AirPods无线耳机引发消费者强烈的兴趣，AirPods给用户更舒服的产品使用体验，大家迅速接受了这个新的产品形态，站在巨人的肩膀才能看的更远，我们当时义无反顾地进入TWS市场，确信这个...。

2024-12-03 22:54:45

资讯动态

棘手记四年不兑付理财收益 (棘手案子)

申明，1.以上内容仅代表揭发者自己，不代表黑猫揭发立场，2.未经授权，本平台案例制止任何转载，违者将被清查法律责任，3.黑猫揭发处置揭发不收取任何费用，凡以黑猫揭发名义不要钱的均为混充、诈骗行为，请及时报警并与黑猫官网反应，揭发邮箱heimaotousu@vip.sina.com，4.请大家选用官网渠道处置生产纠纷，不要轻信第三方机构...。

2024-07-17 14:30:06

欧美电影

蚂蚁集团联合出招 OpenAI 应对AI大模型新的安全挑战 (蚂蚁集团联合贷款)

相关文章

文章推荐