2021-12-29 08:17:19 来源:参考消息网 责任编辑:汤立斌
核心提示:《自然》周刊认为,这名计算机科学家助力发现了一种新的虚假论文。

参考消息网12月29日报道 英国《自然》周刊评出2021年自然科学领域十大人物,法国图卢兹大学计算机科学家纪尧姆·卡巴纳克入选。全文摘编如下:

这名计算机科学家助力发现了一种新的虚假论文。

令人毛骨悚然的地下爬虫。胸部恶性肿瘤。太阳定向力。这些表述听起来似乎出自科幻小说,但实际上,它们源于学术文献,分别是对科学术语蚁群、乳腺癌和太阳能的奇怪翻译。法国图卢兹大学计算机科学家纪尧姆·卡巴纳克每天都会在学术论文中发现此种怪异措辞。

今年,卡巴纳克及其同事已在数以千计论文中发现了这些他们所谓的“歪曲”措辞。少数论文已被撤回;出版者正在调查更多论文。卡巴纳克已建立一个网站来跟踪这个层出不穷的问题。加利福尼亚州的科研诚信问题分析师伊丽莎白·比克说:“他们发现,这一大堆乱七八糟的新文章似乎完全是虚假的。”

清除这些问题与卡巴纳克的日常工作有关:他专门分析学术文献,现在,每天花大约两个小时去寻找“歪曲”措辞。有些人可能会觉得好笑,但卡巴纳克对待这个问题十分严肃。他说:“这种情况不应发生。”

卡巴纳克对胡言乱语式论文的寻找始于2015年,当时,他开始与法国格勒诺布尔阿尔卑斯大学计算机科学家西里尔·拉贝合作。拉贝开发了一个程序,以发现利用SCIgen软件自动生成的胡言乱语式计算机科学论文。拉贝的工作导致各种期刊撤回120多份稿件。卡巴纳克助力更新了拉贝的程序,以找到仅有部分内容用SCIgen软件撰写的论文,并使用学术文献搜索引擎Dimensions进行定位。今年,他们声称又发现了数百篇包含胡言乱语式文本的论文。

拉贝和卡巴纳克的工作促使总部设在莫斯科的跨国技术公司央捷科斯公司的软件工程师亚历山大·马加津诺夫与他们进行了联系。马加津诺夫问,他在一些论文中注意到的某些关于科学概念的古怪措辞——比如用“巨大信息”指代“大数据”——是否是使用SCIgen的产物。这三人合作在数以百计论文中找到了这些措辞。在进行了更深入挖掘后,他们认为,可能使用机器改述工具炮制了这些论文。

到目前为止,卡巴纳克及其同事——以及一些志愿者——在2000多篇论文中找到了近400个“歪曲”措辞。首先,必须人工发现这样一个措辞;然后,一个搜索算法在Dimensions的索引中运行,找到包含该措辞的论文。卡巴纳克和一群助手人工扫描每篇文章,以剔除误报。卡巴纳克希望,最终开发出一个能自动识别“歪曲”措辞的程序。

卡巴纳克希望,他的工作有助于净化科学文献。但他知道这并非易事。他说:“我担心新技术会帮助骗子发表包含更不易察觉的错误的论文。这是一场打地鼠游戏。我们需要做好准备。”

凡注明“来源:参考消息网”的所有作品,未经本网授权,不得转载、摘编或以其他方式使用。