重磅!斯坦福 团队被曝抄袭中国大模型开源成果 AI 推特舆论开始发酵 (斯坦福llm)

文章编号:41562 资讯动态 2024-12-03 开源 面壁智能 大模型抄袭 斯坦福

过去一年,中国大模型一直被贴上「追赶美国」的标签,但近日,推特上却有人曝出:

美国斯坦福大学的一个 AI 团队疑似抄袭、「套壳」一家中国大模型公司的开源成果,模型架构与代码完全相同。

舆论已经开始发酵,引起了圈内人士的广泛讨论。

根据 AI 科技评论整理,事情的经过大致如下:

5 月 29 日,斯坦福大学的一个研究团队发布了一个名为「Llama3V」的模型,号称只要 500 美元(约等于人民币 3650 元)就能训练出一个 SOTA 多模态模型,且效果比肩 GPT-4V、Gemini Ultra 与 Claude Opus 。

由于该团队的作者(Mustafa Aljaddery、Aksh Garg、Siddharth Sharma)来自斯坦福,又集齐了特斯拉、SpaceX、亚马逊与牛津大学等机构的相关背景经历,很快该模型发布的推特帖子浏览量就已经超过 30 万,转发 300+次,并迅速冲到了 Hugging Face 首页:

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

但很快,没过几天,推特与 Hugging Face 上就开始出现怀疑的声音,质疑 Llama3V 套壳面壁智能在 5 月中旬发布的 8B 多模态小模型 MiniCPM-Llama3-V 2.5,且没有在 Llama3V 的工作中表达任何「致敬」或「感谢」 MiniCPM-Llama3-V 2.5 的声音。

对此,Llama3V 团队回复,他们「只是使用了 MiniCPM-Llama3-V 2.5 的 tokenizer」,并宣称「在 MiniCPM-Llama3-V 2.5 发布前就开始了这项工作」。

紧接着,6 月 2 日,有网友在 Llama3V 的 GitHub 项目下抛出事实性质疑,但很快被 Llama3V 的团队删除。为此,提出质疑的网友被激怒暴走,跑到了 MiniCPM-V 的 Github 页面进行事件还原,提醒面壁智能团队关注此事。

随后,面壁团队通过测试 ,发现 Llama3V 与 MiniCPM-Llama3-V 2.5 在「胎记」般案例上的表现 100% 雷同,「不仅正确的地方一模一样,连错误的地方也一模一样」。

至此,推特舆论开始发酵,「斯坦福抄袭中国大模型」一事不胫而走。

1、「套壳」证据实锤,斯坦福团队百口莫辩

最开始,用户质疑 Llama3V 套壳 MiniCPM-Llama3-V 2.5 开源模型时,Llama3V 作者团队并不承认,而是声称他们只是「使用了 MiniCPM-Llama3-V 2.5 的 tokenizer」,并宣称他们「在 MiniCPM-Llama3-V 2.5 发布前就开始了这项工作」:

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

不过,好心网友对 Llama3V 作者团队的回应并不买单,而是在 Llama3V 的 Github Issue 上发布了一系列质疑,列举具体 4 点证据,但很快被 Llama3V 的团队删除。幸好作者事先截了图保留:

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

面对网友的质疑,Llama3V 作者只是避重就轻地回复,称他们只是使用了 MiniCPM 的配置来解决 Llama3V 的推理 bug,并称「MiniCPM 的架构是来自 Idéfics,SigLIP也来自 Idéfics,他们也只是追随 Idéfics 的工作」而非 MiniCPM 的工作,因为「MiniCPM 的视觉部分也是来自 Idéfics 的」——

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

并且将原来 readme 里引用致谢 「MiniCPM-Llama3 」改为了「致谢 MiniCPM」:

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

但根据网友的复盘、梳理,Llama3V 并非只是简单的借鉴,而是有 4 点证据能充分表明其「套壳」了 MiniCPM-Llama3-V 2.5。

证据 1:

Llama3V 项目使用了与 MiniCPM-Llama3-V 2.5 项目完全相同的模型结构和代码实现。

Llama3-V 的模型结构和配置文件与 MiniCPM-Llama3-V 2.5 完全相同,只是变量名不同。

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

Llama3-V 的代码是通过对 MiniCPM-Llama3-V 2.5 的代码进行格式调整和变量重命名得到的,包括但不限于图像切片方式、tokenizer、重采样器和数据加载:

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

证据 2:

Llama3V 团队称其「引用了 LLaVA-UHD 作为架构」,但事实是 Llama3V 与 MiniCPM-Llama3-V 2.5 结构完全相同,但在空间模式等多方面却与 LLaVA-UHD 有较大差异。

Llama3-V 具有与 MiniCPM-Llama3V 2.5 相同的标记器(tokenizer),包括 MiniCPM-Llama3-V 2.5 新定义的特殊标记:

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

证据 3:

Llama3V 作者曾在 Hugging Face 上直接导入了 MiniCPM-V 的代码,后改名为 Llama3V。事件发酵后,AI 科技评论打开 Hugging Face 页面发现已经「404」:

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

作者回应删除 Hugging Face 仓库的原因是「修复模型的推理问题」,并称他们「尝试使用 MiniCPM-Llama3 的配置,但并没有用」:

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

戏剧效果拉满的是,该网友随后贴出了如何使用 MiniCPM-Llama3-V 的代码,跑通 Llama3V 模型推理的详细步骤。

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

当 Llama3V 的作者被询问如何能在 MinicPM-Llama3-V2.5 发布之前就使用它的 tokenizer 时(因为其一开始称他们在 MinicPM-Llama3-V2.5 发布前就已经开始了 Llama3V 的研究),Llama3V 的作者开始撒谎,称是从已经发布的上一代 MinicPM-V-2 项目里拿的tokenizer:

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

但事实是,据 AI 科技评论向面壁团队了解,MiniCPM-V-2 的 tokenizer 与 MinicPM-Llama3-V2.5 完全不同,在Huggingface 里是两个文件,「既不是同一个 tokenizer 件,文件大小也完全不同」。

MinicPM-Llama3-v2.5 的 tokenizer 是 Llama3 的 tokenizer 加上 MiniCPM-V 系列模型的一些特殊 token 组成,MiniCPM-v2 因为在 Llama3 开源之前就发布,所以不会有 Llama3 的 tokenizer :

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵 重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

证据 4:

Llama3V 的作者删除了 GitHub 上的相关 issue,并似乎不完全理解 MinicPM-Llama3-V2.5 的架构或 Llama3V 自己的代码。

Perceiver重采样器是一个单层的交叉注意力机制,而不是两层自注意力机制。SigLIP 的 Sigmoid 激活函数并未用于训练多模态大型语言模型,而仅用于 SigLIP 的预训练

但 Llama3V 在论文中的介绍却说其采用了两层自注意力机制:

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

而 MiniCPM-Llama3-V 2.5 和 Llama3V 代码如下,体现的却是单层交叉注意力机制:

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

MiniCPM-Llama3-V 2.5:

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

且视觉特征提取不需要激活 sigmoid:

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

2、推特舆论发酵,面壁回应

6 月 2 日下午,该事件开始在推特上发酵,MiniCPM-V 的作者亲自发帖,表示「震惊」,因为斯坦福的 Llama3V 模型居然也能识别「清华简」。

据 AI 科技评论向面壁团队了解,「清华简」是清华大学于 2008 年 7 月收藏的一批战国竹简的简称;识别清华简是 MiniCPM-V 的「胎记」特征。该训练数据的采集和标注均由面壁智能和清华大学自然语言处理实验室团队内部完成,相关数据尚未对外公开。

斯坦福的 Llama3V 模型表现与 MiniCPM-Llama3-V 2.5 检查点的加噪版本高度相似:

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

以下是面壁团队成果与 Llama3V 对「清华简」的识别对比。结果显示,两个模型不仅正确的地方一模一样、错误的地方也雷同:

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

Q:请识别图像中的竹简字?

MiniCPM-Llama3-V 2.5:民

Llama3-V:民

GT:民

错误识别示例:

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

Q:请识别图像中的竹简字?

MiniCPM-Llama3-V 2.5:君子

Llama3-V:君子

GT:甬

以下是在 1000 个清华简字体上的识别效果:

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

可以看到,Llama3V 与 MiniCPM-Llama3-V 2.5 的重叠高达 87%,且两个模型的错误分布律高度相似:Llama3V 的错误率为 236,MiniCPM-Llama3-V 2.5 的错误率是 194,两个模型在 182 个错误识别上相同。

同时,两个模型在清华简上的高斯噪声也同样高度相似:

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

此外,Llama3V 的 OCR 识别能力在中文字上也与 MiniCPM-Llama3-V 2.5 高度相似。对此,面壁团队表示,他们很好奇斯坦福团队是如何只用「500 美元就能训练出这么高深的模型性能」。

根据公开信息显示,Llama3V 的两位作者 Siddharth Sharma 与 Aksh Garg 是斯坦福大学计算机系的本科生,曾发表过多篇机器学习领域的论文。

其中,Siddharth Sharma 曾在牛津大学访问、在亚马逊实习;Aksh Garg 也曾在 SpaceX 实习。

这件事反映出,AI 研究的投机分子不分国度。

同时,也反映出,中国科研团队的开源大模型实力已经冲出国门,逐渐被越来越多国际知名的机构与开发者所关注、学习。

中国大模型不仅在追赶世界顶尖机构,也正在成为被世界顶尖机构学习的对象。

由此可见,今后看客们审视国内外的大模型技术实力对比,应该多一份民族自信、少一点崇洋媚外,将关注度多聚焦在国内的原创技术上。

最后,一句话总结:投机不可取,永争创新一。

原创文章,未经授权禁止转载。详情见 转载须知 。

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵


本文地址: https://www.gpxz.com/article/4564b8c2a5a7098bbbbc.html
全局中部横幅
全局中部横幅
武汉市中江科技有限公司

武汉市中江科技有限公司专业维修电动执行器,维修西博斯(SIPOS),罗托克(ROTORK),奥托克(AUTORK),奥玛,瑞基,川仪执行器,维修变频器,维修伺服驱动器。芯片级维修工业控制设备、检测设备、电梯设备、自动化生产线、运动控制系统、数控机床、加工中心、工业生产机器人、烟机、纺机。芯片级维修变频器、软启动器、智能马达控制器、伺服驱动器、直流调速器、工业控制模块、电源模块、电动执行机构。芯片级维修PLC模块、DCS模块、PCS模块、工业控制电路板、各种卡件、机床控制电路板、电梯控制电路板。芯片级维修空压机、拧紧机、熔胶机、UPS、断路器。芯片级维修流量计、水位计、各种检测仪表。芯片级维修伺服电机。

进口无管道通风柜

无锡铭安安全设备有限公司(www.wxmingan.com)主营进口无管道通风柜,智能净气型安全柜,无管式净气型通风柜、药品柜、危化品柜,公司不仅具有国内外精湛的技术水平,更有良好的售后服务和解决方案,欢迎来电洽谈

神河汽车有限公司

神河汽车有限公司主要生产“神河”系列商用车,专用车,自卸车,半挂车,厢式车,仓栅式运输车,加油车,洒水车,粉粒物料运输车和轻,微型卡车等,销售热线0719-7580848,7580880

好玩的手机游戏

飞游网是专为游戏玩家们打造的一个安全、快速、绿色专业的下载前沿基地,这里汇集全网各种最前沿最新手机资源和安卓应用app,让你率先在这里尝鲜各种手机游戏、应用app、攻略、资讯、教程等相关内容,给你一站式的游戏网站服务体验。

千年客家,三明千年客家食品有限公司官网

三明千年客家食品有限公司是一家集研发、生产加工、销售为一体的综合性食品加工企业,企业重点开发药食同源中国道地药材—宁化薏米,采用公司+专业合作社+农场+农户的合作模式。

桥式起重机

新乡市魔工起重机有限公司产品主要有桥式起重机、门式起重机、轮胎吊、门座式起重机、坞臂车、悬臂吊、电动葫芦、定制化的起重设备及配套件。经过长期的技术创新,MAGICART已为客户节省了大量购机成本和生命周期运营成本。经过长期的技术创新,MAGICART已为客户节省了大量购机成本和生命周期运营成本。

上海诚展实业有限公司

上海诚展实业有限公司成立于2011年,总部位于上海市嘉定区上海国际机电五金城,是一家从事:金属材料、建筑材料、五金交电、劳保用品、消防器材销售,仓储物流配送,电子商务等的大型综合一体化企业。公司先后代理:沙钢、中天、鞍钢、永钢,千年舟、莫干山等众多国内外知名品牌。公司秉承着:诚信立足、共赢发展的理念,销售额逐年攀升,年销售额达到10多亿元,业务范围遍及全国各大中小城市。 上海诚展通过科学管理,以坦诚、共识、共享、共创的发展方针,建立合伙人事业平台,拥有着一群优秀的合伙人团队和技术团队。我们充分利用互联网平台带来的市场资源整合及控制能力,精准把握供需动向,从最传统的门店线下商品交易模式转向网络平台直采,线上交易线下配送,各区域联动,相互协调配合,提高了货物轮转效率,降低了货物流通成本,保证了货物配送的时效性,同时公司大力发展数字化管理、移动化办公提高企业管理效率,将降本增效落到实处。 公司经过多年发展与中国建筑、中国交建、中国中核、中石化、中国铁建等一大批大型建筑企业展开深入合作,成功的为上海世博园工程,上海虹桥综合交通枢纽工程、上海会展中心工程、武汉体育馆工程,黄石奥林匹克中心工程、北京大兴国际机场工程、杭州市亚运村工程等一大批国家重点工程项目提供建筑材料的销售配送服务。我们以最优的品质、最高时效和最好的服务赢得了广大客户的认可。 未来,诚展人定将不忘初心,秉着:专业、渠道、服务、创新的运营理念,以优质的客户服务、专业的产品规划、开放的发展视野,力争成为行业最值得信赖的供应链企业。诚信立足、共赢发展、共创辉煌。

新景网

新景网是河南广播电视台法治频道《生态与健康》栏目官方网站,由河南新景网文化传媒有限公司运维,拥有网站、APP、抖音、视频号、微博、头条号等多个新媒体平台。《生态与健康》栏目将积极发挥媒介职能作用,解读国家对环境、卫生方面相应的政策和举措,传递民众对环境和卫生方面改善的需求和心声,坚持以“绿水青山就是金山银山”“为中华民族伟大复兴打下坚实健康基础”为理念,围绕生态文明和健康基础为建设目标,共建美丽中原!

鞍山树人计算机培训学校

鞍山树人教育集团是专业提供鞍山计算机,鞍山电脑培训,鞍山专升本,鞍山建筑装潢,鞍山计算机等级,国家等级考试,电脑硬件基础和办公培训,全日制装潢就业班,100%法律保证白领就业.

变频器

浙江唐川科技有限公司,是一家专业从事变频器、软启动器和伺服驱动器等工控自动化产品研发和生产的高技术企业。主要定位为产品的0EM代工,争做区域性工控行业的专业龙头企业”。公司重视人才,推行绩效制度,打造精兵良将,任人唯贤;实行精细化的管理,产品工艺文件精湛到每个螺丝每个步骤。电话:400-999-4446

全局底部横幅