Currently set to Index
Currently set to Follow

虚构文章的终极工具 – SCIGEN

SCIgen [1]是MIT计算机科学与人工智能实验室的3个研究生编写的程序,能够自动生成无意义的英文计算机科学研究论文,论文上摘要、背景介绍、实验结果、讨论以及结论一应俱全,还配上一些自动生成的漂亮图表和参考文献。这个程序能够从词库中随机选取专业术语并且生成句子,尽管文章不知所云,乍看上去,规范的文章格式跟满眼的专业词汇还是让人觉得挺高尚大的,还能唬住一些平时看英文就头疼的业内“专家”。

SCIgen的本意是出于对学术界那种水平低下,只关心收取注册费的灌水会议的反感,它的首次亮相就引起了很大的影响。自动产生的论文Rooter: A Methodology for the Typical Unification of Access Points and Redundancy被WMSCI(World Multiconference on Systemics, Cybernetics and Informatics)会议所接收,并且作者被邀请到会议上发言。在SCIgen的编写者们公布了真相之后,WMSCI撤销了作者的报告资格。不过作者们却在募捐的赞助下仍然到了会议的举办酒店,租了一个房间在同一时间同一地点按照学术会议的流程举办了一场由自动生成的文章组成的会议。整个事件虽然是个闹剧,却也让WMSCI大失颜面,IEEE随即终止了对该会议的资助并且删除了文章。

这几年国内举办的国际会议数量也比以前大大增加,除了确实能让更多的科研人员有机会接触到行业大牛外,也成了一些单位提高自身知名度的工具以及成为某些领导晋升的政绩,同时高昂的注册费也变成了某些职业办会人的牟利手段。笔者邮箱就经常收到一些国际会议的邀请,里面通常是着重注明了保证EI等数据库的收录,而会议的主题常常跟俺的研究方向完全不相干。所以俺实在怀疑这些所谓会议主办者真的在意投稿文章的质量。非英语母语的劣势更是让国内举办的国际会议成为SCIgen的试验场。德国几个学生伪造了个Schlangemann教授投的文章的专家意见如下:The author’s work is suggestive, and the point of view deserves researching. Figures in this paper seem exact, which makes this paper more convictive. There is no major modification opinion, only please pay more attention to English grammatical rule and format your paper according to the template provided by conference homepage [2]. 还好没有列出审稿人的名字,要是一不小心还是个啥知名人士,那这个脸就丢大了,这辈子的一世英名也就只能付之东流了。希望审稿人是跟俺一样的外行人吧。更无语的是,两年之后这个伪造的教授还能收到国内主办的国际会议的会议邀请。到目前为止,SCIGEN已经在各大会议以及期刊上发表了120多篇文章,按照NATURE文章的说法,其中大部分文章都是发在中国举办的会议上,同时大部分的文章作者单位是中国。文章虽然没有一一列出文章名称以及发表刊物,但是也足以让当事者暗暗擦一把冷汗了[3]。不过恶意的想,有些人可能还真的可以无所谓。

对于SCIGEN产生的虚构文章,只要审查文章的人稍稍上点心,不要不懂装懂,是很容易辨认出来的。只是现在科研圈子越来越功利的趋势一时半会是改变不了的。利之所在,就有人愿意冒风险使用SCIGEN产生的文章,也会有不负责任的出版商就中了招。俺很恶意的觉得,那就让SCIGEN的文章越来越多吧,假文章多了,野鸡会议才会曝光得越多,也整治得越多。

[1] http://zh.wikipedia.org/wiki/SCIgen
[2] http://diehimmelistschoen.blogspot.co.uk/
[3] http://www.nature.com/news/publishers-withdraw-more-than-120-gibberish-papers-1.14763

Researchers Poll

您希望抄袭检测器具备哪些功能?(请选择所有适用项)