新浪财经

学术造假?学术投毒?两中国学生卷入“假论文刷引用”风波

知社学术圈

关注

据知名学术媒体撤稿观察报道,有一篇作者全是“假人”的预印本论文,整篇剽窃了其他学者的研究。但这种作者全假的论文,显然无法带来任何署名收益。它们的真实目的是,通过大量无关引用,悄悄抬高其他真实论文的引用。研究者发现,这可能揭示了一条利用预印本平台、引用指标漏洞制造“学术影响力”的灰色链条。更迷惑的是,这种操作既可能是刷引用,也可能是反其道而行之的栽赃式投毒。两名中国学生目前就已经卷入了这场引用造假风波之中。

幽灵论文

数月前,密歇根大学数据科学家 Elle O’Brien 在Google Scholar上查看自己研究的被引用情况。她偶然注意到,有一篇引用她研究的新论文(简称论文A[2]),看起来很像是她和同事Grischa Liebel 、Sebastian Baltes 合作撰写的一篇预印本论文。O’Brien警觉起来:自己和同事的论文被剽窃了?

O’Brien仔细看论文A时,进一步发现了更多疑点。它简直就是对她们的论文进行了一次洗稿。Liebel 在 LinkedIn 上发帖表示,两篇论文文本的相似程度很高,就像是用ChatGPT在不改变论文原意的情况下做了一次改写。但还有一个更为吊诡的情况,论文A所列出的六位作者都是虚构人名,不是真人。这些虚构作者中有三人的单位分别写成了O’Brien、Liebel 和 Baltes 所在的真实机构:密歇根大学、雷克雅未克大学和海德堡大学。

O’Brien等人极其困惑,论文A(发在预印本上)费心剽窃,却不列任何真实作者,那么剽窃的目的是什么?后来,他们仔细查看论文的参考文献时,才发现了猫腻。论文A的参考文献包含包含大量与论文内容毫无关系的引用。而这些引用的论文都是真实的。那么论文A的目的也就浮出水面, 它可以通过参考文献来刷高其他真实论文的引用数。

O’Brien等人顺藤摸瓜查下去,在多个预印本服务器上找到了一系列类似的假论文。它们的路数出奇一致:剽窃真实论文,署名给不存在的作者,然后大量引用文献,最终集中抬高了某些学者的论文引用数。

谁在受益?

论文A发表在在 Elsevier 旗下的 SSRN 上,O’Brien发现这篇论文参考文献列表中的主要“引用受益人”,是来自中国内蒙古大学的郝某。Liebel 查看郝某的论文发表情况,然后注意到了郝某引用数最高的一篇文章。这是一篇 2025 年会议上的短篇投稿(Tiny paper[3]),引用次数已经超过 100 次。

Liebel 发现,除去来自ACM 和 IEEE 论文中的 4 次引用,这篇文章的其他引用都来自预印本服务器,包括 arXiv、SSRN、Authorea 和 Cambridge等。arXiv上每一篇声称引用了郝某研究的文章,其文中都找不到任何对郝某工作的具体引用。另一方面,在SSRN上引用郝某研究的15篇假论文中,Liebel 根据一些AI不太可能改动的术语或特征词汇进行检索,很轻松就找到了这些假论文所剽窃的原文。它们的剽窃套路也是一致的,作者并不存在,但署名机构使用了真实大学。其中,第一作者大多使用 Outlook 邮箱,或者虚假的机构邮箱。

按照 SSRN 官方说明,提交论文需要完整的作者资料。但由于邮箱和作者身份都是虚构的,这些上传这些假论文的实际责任人一时还难以查出。

而从假论文的参考文献中的“引用受益人”,比如郝某,则声称自己对这些假论文全然不知情。Liebel 在LinkedIn发表帖子公开了此事,而郝某则在帖子下评论,否认自己参与了引用造假。他表示,自己在2025年11 月注意到 Google Scholar 个人主页上出现了“异常引用活动”,随即就关闭了个人主页,并要求SSRN撤下这些假论文。他说:“我怀疑有一个与我姓名拼写相同的人冒充我,并实施了欺诈行为”,是他的“合法研究被这些欺诈性预印本引用”了。

在接受撤稿观察采访时,他在邮件中表示:“我与这些预印本的创作或发表完全没有任何关系,我不会从欺诈性或无关工作的‘虚高’引用中获益,因为这种行为只会损害我的职业声誉和我所在领域的诚信。……我们有共同目标,那就是清理学术出版中的这类欺诈行为。如果你们的报道能反映出我是向相关平台举报这些假论文的吹哨人,我将非常感谢。”

郝某的说法并非没有道理。国内某些评审政策虽然也看论文的引用数,但是郝某这篇会议投稿层级较低,不算正式期刊论文或会议论文,刷高其引用数不会带来明显收益。只是对某些宽口径平台有用,比如Google Scholar。这些宽口径平台有可能把这类假预印本的引用算进去,从而在相当有限的层面形成“引用数增长很快”的迷惑效果。这或许能起到一个简历包装作用,但在严肃学术评价中,这种花招骗不了任何人,反而会释放一个极强的学术不端的风险信号。

另一名明显从假论文引用中受益的人是悉尼大学研究生裴某,他在 Google Scholar 主页上自称是“世界前2%科学家”(World's Top 2% Scientists)之一。

今年 1 月,Baltes联系裴某时,他表示自己对造假一事一无所知。他在邮件中写到:“这不是我的论文。我不知道发生了什么,你可以让 SSRN 查是谁干的。让他们提供上传论文者的账号。我从不用预印本网站,也从没做过这事,为什么说是我的?” 后续邮件中,裴某为自己先前的语气道歉,称自己是因为感觉被指控学术不端而“深感沮丧”,所以“防御性很强”。

他说:“我此前经历过非常类似的事件,我的工作曾被剽窃并未经授权作为预印本发布,后来还给一篇合法期刊投稿造成了严重麻烦。正因如此,我完全理解这类不端行为对原作者来说有多么令人痛苦、多么具有破坏性。”

裴某同时也给SSRN 发去了邮件,要求删除那篇预印本,因为它“包含大量对我出版物的引用,而这些引用与论文内容无关”。他称这种做法“问题严重”,并表示它可能“直接损害被引用研究人员的学术声誉”。

学术造假 or 学术投毒?

随着对假论文的深入调查,局面变得疑团重重。Baltes说:“这是个狡兔之窟。”裴、郝二人都是学生,做这样的造假,收益和风险完全不对等。于是也有人认为,真正的冰山还藏在幕后。科研诚信专家如Matt Hodgkinson等,正在搜集证据,以追踪一个潜在的“引用工厂”。

Liebel 和 Baltes 也承认,这种收益低、风险高的造假,也有可能被用来抹黑某个人。Liebel 说:“你完全可以通过这种操作,把某个同事拖入虚假引用。” 换言之,如果这种推论成立,这将是一种学术投毒的手段。不说能完全毁掉别人的学术声誉,至少能够给他造成不小的麻烦。

Liebel表示:尤其是,计算机科学领域重视会议论文,因此只看期刊数据库(如Scopus )会不完整;但 Google Scholar 又太宽,容易把各种质量不一的引用都算进去。所以不能简单说某一个 H-index 就是真实学术影响力,Scopus 可能偏低,Google Scholar 可能偏高,真实情况介于二者之间。

最后Baltes 补充说:“对我来说,一个重要结论是,我们越来越有必要摆脱这种引用计数体系。它几乎已经没有意义了。

参考消息:

[1] https://retractionwatch.com/2026/03/30/fake-articles-plagiarism-preprints-arxiv-ssrn-citation-network

[2] https://web.archive.org/web/20251226172955/https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5735022

[3]  https://openreview.net/forum?id=TXSJg657AD#discussion

加载中...