学术造假？学术投毒？两中国学生卷入“假论文刷引用”风波

知社学术圈

05.1213:24

关注

据知名学术媒体撤稿观察报道，有一篇作者全是“假人”的预印本论文，整篇剽窃了其他学者的研究。但这种作者全假的论文，显然无法带来任何署名收益。它们的真实目的是，通过大量无关引用，悄悄抬高其他真实论文的引用。研究者发现，这可能揭示了一条利用预印本平台、引用指标漏洞制造“学术影响力”的灰色链条。更迷惑的是，这种操作既可能是刷引用，也可能是反其道而行之的栽赃式投毒。两名中国学生目前就已经卷入了这场引用造假风波之中。

幽灵论文

数月前，密歇根大学数据科学家 Elle O’Brien 在Google Scholar上查看自己研究的被引用情况。她偶然注意到，有一篇引用她研究的新论文（简称论文A[2]），看起来很像是她和同事Grischa Liebel 、Sebastian Baltes 合作撰写的一篇预印本论文。O’Brien警觉起来：自己和同事的论文被剽窃了？

O’Brien仔细看论文A时，进一步发现了更多疑点。它简直就是对她们的论文进行了一次洗稿。Liebel 在 LinkedIn 上发帖表示，两篇论文文本的相似程度很高，就像是用ChatGPT在不改变论文原意的情况下做了一次改写。但还有一个更为吊诡的情况，论文A所列出的六位作者都是虚构人名，不是真人。这些虚构作者中有三人的单位分别写成了O’Brien、Liebel 和 Baltes 所在的真实机构：密歇根大学、雷克雅未克大学和海德堡大学。

O’Brien等人极其困惑，论文A（发在预印本上）费心剽窃，却不列任何真实作者，那么剽窃的目的是什么？后来，他们仔细查看论文的参考文献时，才发现了猫腻。论文A的参考文献包含包含大量与论文内容毫无关系的引用。而这些引用的论文都是真实的。那么论文A的目的也就浮出水面，它可以通过参考文献来刷高其他真实论文的引用数。

O’Brien等人顺藤摸瓜查下去，在多个预印本服务器上找到了一系列类似的假论文。它们的路数出奇一致：剽窃真实论文，署名给不存在的作者，然后大量引用文献，最终集中抬高了某些学者的论文引用数。

谁在受益？

论文A发表在在 Elsevier 旗下的 SSRN 上，O’Brien发现这篇论文参考文献列表中的主要“引用受益人”，是来自中国内蒙古大学的郝某。Liebel 查看郝某的论文发表情况，然后注意到了郝某引用数最高的一篇文章。这是一篇 2025 年会议上的短篇投稿（Tiny paper[3]），引用次数已经超过 100 次。

Liebel 发现，除去来自ACM 和 IEEE 论文中的 4 次引用，这篇文章的其他引用都来自预印本服务器，包括 arXiv、SSRN、Authorea 和 Cambridge等。arXiv上每一篇声称引用了郝某研究的文章，其文中都找不到任何对郝某工作的具体引用。另一方面，在SSRN上引用郝某研究的15篇假论文中，Liebel 根据一些AI不太可能改动的术语或特征词汇进行检索，很轻松就找到了这些假论文所剽窃的原文。它们的剽窃套路也是一致的，作者并不存在，但署名机构使用了真实大学。其中，第一作者大多使用 Outlook 邮箱，或者虚假的机构邮箱。

按照 SSRN 官方说明，提交论文需要完整的作者资料。但由于邮箱和作者身份都是虚构的，这些上传这些假论文的实际责任人一时还难以查出。

而从假论文的参考文献中的“引用受益人”，比如郝某，则声称自己对这些假论文全然不知情。Liebel 在LinkedIn发表帖子公开了此事，而郝某则在帖子下评论，否认自己参与了引用造假。他表示，自己在2025年11 月注意到 Google Scholar 个人主页上出现了“异常引用活动”，随即就关闭了个人主页，并要求SSRN撤下这些假论文。他说：“我怀疑有一个与我姓名拼写相同的人冒充我，并实施了欺诈行为”，是他的“合法研究被这些欺诈性预印本引用”了。

在接受撤稿观察采访时，他在邮件中表示：“我与这些预印本的创作或发表完全没有任何关系，我不会从欺诈性或无关工作的‘虚高’引用中获益，因为这种行为只会损害我的职业声誉和我所在领域的诚信。……我们有共同目标，那就是清理学术出版中的这类欺诈行为。如果你们的报道能反映出我是向相关平台举报这些假论文的吹哨人，我将非常感谢。”

郝某的说法并非没有道理。国内某些评审政策虽然也看论文的引用数，但是郝某这篇会议投稿层级较低，不算正式期刊论文或会议论文，刷高其引用数不会带来明显收益。只是对某些宽口径平台有用，比如Google Scholar。这些宽口径平台有可能把这类假预印本的引用算进去，从而在相当有限的层面形成“引用数增长很快”的迷惑效果。这或许能起到一个简历包装作用，但在严肃学术评价中，这种花招骗不了任何人，反而会释放一个极强的学术不端的风险信号。

另一名明显从假论文引用中受益的人是悉尼大学研究生裴某，他在 Google Scholar 主页上自称是“世界前2%科学家”（World's Top 2% Scientists）之一。

今年 1 月，Baltes联系裴某时，他表示自己对造假一事一无所知。他在邮件中写到：“这不是我的论文。我不知道发生了什么，你可以让 SSRN 查是谁干的。让他们提供上传论文者的账号。我从不用预印本网站，也从没做过这事，为什么说是我的？” 后续邮件中，裴某为自己先前的语气道歉，称自己是因为感觉被指控学术不端而“深感沮丧”，所以“防御性很强”。

他说：“我此前经历过非常类似的事件，我的工作曾被剽窃并未经授权作为预印本发布，后来还给一篇合法期刊投稿造成了严重麻烦。正因如此，我完全理解这类不端行为对原作者来说有多么令人痛苦、多么具有破坏性。”

裴某同时也给SSRN 发去了邮件，要求删除那篇预印本，因为它“包含大量对我出版物的引用，而这些引用与论文内容无关”。他称这种做法“问题严重”，并表示它可能“直接损害被引用研究人员的学术声誉”。

学术造假 or 学术投毒？

随着对假论文的深入调查，局面变得疑团重重。Baltes说：“这是个狡兔之窟。”裴、郝二人都是学生，做这样的造假，收益和风险完全不对等。于是也有人认为，真正的冰山还藏在幕后。科研诚信专家如Matt Hodgkinson等，正在搜集证据，以追踪一个潜在的“引用工厂”。

Liebel 和 Baltes 也承认，这种收益低、风险高的造假，也有可能被用来抹黑某个人。Liebel 说：“你完全可以通过这种操作，把某个同事拖入虚假引用。” 换言之，如果这种推论成立，这将是一种学术投毒的手段。不说能完全毁掉别人的学术声誉，至少能够给他造成不小的麻烦。

Liebel表示：尤其是，计算机科学领域重视会议论文，因此只看期刊数据库（如Scopus ）会不完整；但 Google Scholar 又太宽，容易把各种质量不一的引用都算进去。所以不能简单说某一个 H-index 就是真实学术影响力，Scopus 可能偏低，Google Scholar 可能偏高，真实情况介于二者之间。

最后Baltes 补充说：“对我来说，一个重要结论是，我们越来越有必要摆脱这种引用计数体系。它几乎已经没有意义了。”

参考消息：

[1] https://retractionwatch.com/2026/03/30/fake-articles-plagiarism-preprints-arxiv-ssrn-citation-network

[2] https://web.archive.org/web/20251226172955/https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5735022

[3] https://openreview.net/forum?id=TXSJg657AD#discussion