jk 露出斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

发布日期：2024-09-28 07:08 点击次数：91

斯坦福 AI 团队jk 露出，竟然曝出了抄袭事件，而且抄袭的照旧中国国产的大模子遵守 —— 模子结构和代码，险些一模一样！跟任何抄袭事故一样……AI 圈内齐惊呆了。

斯坦福的这项贪图叫作念 Llama3-V，是于 5 月 29 日崭新发布，声称只需要 500 好意思元就能训出一个 SOTA 多模态大模子，比 GPT-4V、Gemini Ultra、Claude Opus 齐强。

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

Llama3-V 的 3 位作家或者是领盛名校头衔加握，又有特斯拉、SpaceX 的大厂相关布景，这个技俩短短几天就受到了不小的暖和。

致使一度冲上了 HuggingFace 趋势榜首页：

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

然则，戏剧性的一幕运转演出了。

有位重视的网友发现，咦？这“配方”如何如斯的纯熟？

然后他定睛一看，好家伙，这未便是 MiniCPM-Llama3-V 2.5（出自清华系明星创业公司面壁智能）嘛。

于是这位网友便跑到面壁智能 GitHub 技俩下运转爆料了：

你们家大模子被斯坦福团队抄袭了！

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

况兼他还附上了一堆的凭证，最径直的莫过于这张 2 个模子代码的对比图了：

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

Emmm…… 用这位网友的话来说便是：

模子结构、代码、成立文献，简直一模一样，仅仅变量名变了辛勤。

至于为什么这位网友要跑到面壁智能 GitHub 技俩底下留言，是因为他之前依然给 Llama3-V 作家留过言了，但斯坦福团队的作念法竟是删库跑路……

文爱

没错，刻下岂论是 GitHub 照旧 HuggingFace，完全齐是 404：

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

况兼这事刻下还在握续发酵的流程中，网上吃瓜的群众亦然越来越多。

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

那么我先来一同转头一下这件 drama 事情的始末。

“代码和架构一模一样”

正如刚才所述，一个网友爆料 Llama3-V 抄袭 MiniCPM-Llama3-V 2.5，跑到面壁智能的 GitHub 主页提示团队谨慎，并把要津凭证齐逐个截图列举整理了下来，这才有了悉数抄袭门的回复现场。

以下是来自这位网友的凭证。

凭证一，Llama3-V 的模子架构和代码与 MiniCPM-Llama3-V 2.5 险些完全疏导：

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

看底下的例子，成立文献就改了图像切片、分词器、重采样器和数据加载等步调化和变量名：

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

Llama3-V 作家默示参考了 LLaVA-UHD 架构，在 ViT 和 LLM 等继承上有一些各异。但实质上，网友发现他们的具体达成在空间方法等许多方面齐与 LLaVA-UHD 不同，却特别与 MiniCPM-Llama3-V 2.5 一致。

致使，Llama3-V 还用了 MiniCPM-Llama3-V 2.5 的分词器，连 MiniCPM-Llama3-V 2.5 界说的特殊秀丽齐能“赶巧”实属离谱。

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

凭证二，网友质疑 Llama3-V 作家是如安在 MinicPM-Llama3-V2.5 技俩发布之前就使用上 MinicPM-Llama3-V2.5 分词器的。

Llama3-V 作家给的回复是这么婶儿的，说是用的面壁智能上一代 MinicPM-V-2 项指标：

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

但事实却是，HuggingFace 中，MiniCPM-V2 与 MiniCPM-Llama3-V 2.5 分词器鉴识是两个文献，文献大小也完全不同。

MiniCPM-Llama3-V 2.5 的分词器是用 Llama3 分词器加上 MiniCPM-V 系列模子的特殊 token 构成，而 MiniCPM-V2 的发布齐在 Llama3 开源之前，如何会有 Llama3 分词器。

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

凭证三，Llama3-V 作家随后无故删除了网友在 Llama3-V 页面上提交的质疑他们抄袭的问题。

而且，他们似乎对 MiniCPM-Llama3-V 2.5 架构或他们我方的代码齐不完全了解。

感知器重采样器（Perceiver resampler）是单层交叉谨慎力，而不是双层自谨慎力。但是下图所示 Llama3-V 的手艺博客里作家的明白很较着是错的。

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

SigLIP 的 Sigmoid 激活也无须于磨真金不怕火多模态大说话模子，而仅用于预磨真金不怕火 SigLIP。

视觉特征索求不需要 Sigmoid 激活：

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

基于以上三点事实，这位网友合计凭证足以评释 Llama3-V 技俩窃取了 MiniCPM-Llama3-V 2.5 项指标学术遵守。

但还没完，他随后又补充了两点凭证。

几天前，当这位网友尝试运行 Llama3-V 时，发现他们提供的代码无法与 HuggingFace 的 checkpoint 通盘使用，反映问题莫得得到作家回复。

于是网友把从 HuggingFace 下载的 Llama3-V 模子权重中的变量名改成了 MiniCPM-Llama3-V 2.5 的，惊叹发现模子竟然不错用 MiniCPM-V 代码得手运行。

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

此外，要是将高斯噪声（由单个标量参数化）添加到 MiniCPM-Llama3-V 2.5 的 checkpoint，罢休便是会得到一个手脚与 Llama3-V 极其相似的模子。

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

收到网友的提示后，MiniCPM-Llama3-V 2.5 团队这边也连忙张开了造访，他们按照网友的在 GitHub 上的证实，使用 Llama3-V 的 checkpoint 和 MiniCPM-Llama3-V 2.5 的代码和成立文献正确获取了推理罢休。

于是，一个更为要津性的凭证出现了。

Llama3-V 在一些未公开的履行性特征上阐明出与 MiniCPM-Llama3-V 2.5 高度相似的手脚，而这些特征是根据 MiniCPM-Llama3-V 2.5 团队里面数据磨真金不怕火的。

举例，识别清华简！

MiniCPM-Llama3-V 2.5 独特的功能之一是识别清华简，这是一种特地心事、于战国时代写在竹子上的中国古捉刀墨。

磨真金不怕火图像是从最近出土的文物中扫描出来的，由 MiniCPM-Llama3-V 2.5 团队进行了标注，尚未公开采布。

而 Llama3-V 的识别情况和 MiniCPM-Llama3-V 2.5 极为相似。

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

识别失实的情况竟也特别一致：

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

MiniCPM-Llama3-V 2.5 团队还在 1000 张竹简图像上测试了几种基于 Llama3 的视觉-说话模子，并比拟了每对模子的计议精准匹配。

罢休，每两个模子之间的重复为零，而 Llama3-V 和 MiniCPM-Llama3-V 2.5 之间的 && 重复达到了惊东说念主的 87%**。

此外，MiniCPM-Llama3-V 2.5 和 Llama3-V 致使具有相似的失实散播。Llama3-V 和 MiniCPM-Llama3-V 2.5 鉴识作念出 236 和 194 个失实计议，重复部分为 182 个。

且按照网友在 GitHub 上的指示取得的 MiniCPM-Llama3-V2.5-noisy 流泄漏与 Llama3-V 险些疏导的定量罢休，真令东说念主匪夷所念念……

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

在另一个 MiniCPM-Llama3-V 2.5 里面数据上磨真金不怕火的未公开功能 ——WebAgent 上，也出现了通常的情况。

Llama3-V 致使和 MiniCPM-Llama3-V 2.5 团队新界说的 WebAgent 方法中犯的失实齐一样。

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

鉴于这些罢休，MiniCPM-Llama3-V 2.5 团队默示很难将这种不寻常的相似性解释为赶巧，但愿 Llama3-V 作家能对这个问题给出一个认确切解释。

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

斯坦福团队已删库跑路

固然斯坦福的 2 位本科生依然下架了险些通盘与之相关的技俩，但其确凿此之前，他们领先在濒临质疑的时候照旧作念出了多少的解释。

举例他们强调，Llama3-V 这项职责的时代是要早于面壁智能的 MiniCPM，仅仅使用了他们的 tokenizer。

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

不外作家对 Medium 上的声明照旧作念了保留：

特地感谢那些在磋商中指出与之前贪图相似之处的东说念主。

咱们雄厚到咱们的架构特地肖似于 OpenBMB 的“MiniCPM-Llama3-V 2.5，他们在达成上比咱们抢先一步。

咱们依然删除了对于作家的原始模子。

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

对此，一部分网友默示，既然继承删掉技俩，那么就默示如实存在一定的问题。

不外另一方面，对于抄袭这事也有不一样的声息 ——

MiniCPM-Llama3-V 2.5 不亦然在 Llama3 的基础上作念的改革吗？不外连 tokenizer 齐径直拿来用就应该不算是鉴戒了。

而就在刚刚，另一个戏剧性的事情发生了。

斯坦福的作家在中午时代作念出了最新的回应：

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

但刻下…… 这条回应又删掉了。

而面壁智能这边，CEO 李大海也作念出了认真回应：

斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

参考连合：

[1]https://github.com/OpenBMB/MiniCPM-V/issues/196

[2]https://github.com/mustafaaljadery/Llama3-V

[3]https://www.reddit.com/r/LocalLLaMA/comments/1d6f1f3/Llama3-V_project_is_stealing_a_lot_of_academic/

[4]https://www.reddit.com/r/LocalLLaMA/comments/1d6f1f3/Llama3-V_project_is_stealing_a_lot_of_academic/?rdt=41696&onetap_auto=true&one_tap=true

[5]https://aksh-garg.medium.com/llama-3v-building-an-open-source-gpt-4v-competitor-in-under-500-7dd8f1f6c9ee

本文来自微信公众号：量子位（ID：QbitAI），作家：金磊西风

告白声明：文内含有的对外跳转连合（包括不限于超连合、二维码、口令等体式），用于传递更多信息，节俭甄选时代，罢休仅供参考jk 露出，IT之家通盘著作均包含本声明。

上一篇：蘇暢麻豆大学生成东谈主视频色情视频免费在线不雅看 | My XXX Hot Girl

下一篇：周处除三害麻豆年青一又友作念爱在线色情免费色情18 电影悉数类型的色情恰当泰国东谈主的悉数类型的色情片 | My XXX Hot Girl

jk 露出 斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供

相关资讯

jk 露出斯坦福团队被曝抄袭清华系大模子，已删库跑路，创举东说念主回应：也算国外招供