不知道从什么时候开始,学术论文和研究生学位论文,甚至科研项目申请书都要在正式送审前实施查重。一些期刊和机构还规定,不管什么情况,查重率不得超过一定数值,否则不接受论文送审、发表和答辩,这给我们的学者,尤其是青年学者和研究生带来一定困惑和麻烦。我在美国普度大学任教学生告诉我,他们那儿对研究生学位论文也会通过学校提供的第三方软件平台实施查重。这就表明,对学术论文查重不仅限于我国学术界。一篇学术论文手稿文字重复率高一点是否意味论文作者一定存在学术不端,这决不会是一个简单的是非问题,两者之间不一定存在确定的因果关系。因为,我们要客观分析重复率产生的原因,具体要看重复率数据、重复内容、重复目的及是否注明出处(引文)等因素。
回想当年我们发表国内外学术论文都没有查重这个环节,至少我发表的中英文学术论文及我的研究生的硕博学位论文都没有经历查重过程,这种情况也许与当年的学术环境以及缺乏有效的检测技术有关。所以,从某种意义上,当下学术论文查重属于学术界的自我纠错行为,规避学术不端,营造良好的学术环境。因此,有关机构要求论文查重的初衷和愿望无可厚非,我想就这个话题谈点我的粗浅认识,供大家参考。
在谈到论文查重话题就必须了解一篇学术论文的基本结构与产出过程。众所周知,一篇承载科技成果的学术论文与研究生学位论文的结构与撰写的基本过程相似。抛开剽窃同行成果和捏造数据的学术不端,我们正常发表的学术论文属于科技成果的载体,它体现了成果的优先属性以及满足各种科学评价需求。我的科教公益报告“学术论文的创作”中有一张片子谈到学术论文内容的基本组成:“一篇学术论文主要有下面几部分组成: 1.为什么要做?这部分内容一般安排在“前言或研究背景”部分,它通过引用足够文献深刻阐述学术论文成果的重要性和创新性,尤其是原创性。2.如何做?指成果采用的研究方法或实验方法(或计算方法)。3.获得什么结果?充分运用图表展示论文的具体成果。4.讨论。展示成果的意义,通过与同行类似成果对比,显示论文成果在某一方面的创新性与重要意义。5.结论。”对于不同学科论文结构基本相似,具体编排稍有不同,例如,有的作者喜爱将结果与讨论放在一起。对于研究生学位论文一般机构通常会提供一个论文写作模版供学生参考。
上述提到一篇论文组成的5个部分内容中除了结果与结论,其余部分几乎都可能涉及文字重复的可能。因为“前言或研究背景”,“研究方法或实验技术”与“讨论”中都会涉及与同行论文比较和参考同行的分析实验(或计算)方法,从而造成与引文文字重复现象,导致论文查重率偏高,即使作者注意列出了对应的文献。例如一篇论文的“前言或研究背景”在论证“为什么做?”就涉及大量引用同行发表的论文,因为,论文前言需要重点介绍:为什么值得做?别人做的怎么样?相对于同行有什么特色?这表示作者充分尊重同行的研究成果,属于“站在同行肩膀上做自己的科学研究。”所以,我常说,一篇论文的前言是引用同行文献相对较多地方(另一个是讨论部分)。为此,在引用同行文献时如果将相关文字简单粘贴就会造成较高的重复率。显然,对于一篇综述类(评述)论文的查重就更有必要,因为,一篇高水平的综述论文往往要引用大量文献。一位资深教授给我发来他刚发表的一篇重要综述论文的参考文献达300篇。如果在介绍同行文献时简单粘贴,不仅会造成文字高重复率,文章的文字表述也会枯燥无味,降低综述论文的水平和价值。
在我的理念里,文字重复率似乎还与学科性质相关。例如我们地球科学学科,除了上述情况外,论文的文字重复还会发生在一些案例研究成果(Case study)文章中。这是由地球科学学科的“不确定”属性决定,即同样一种客观存在的地球科学现象,可以有多种不同的解释,真相永远藏而不露,例如恐龙绝灭的成因机制。以我所在的固体球物理学科为例,当我研究某一地区岩石物理性质(磁性、密度、电性和波速)与深部构造关系时,在论文“地质-地球物理背景”和“结果及讨论”部分就会用到这个地区的地质学科学者研究成果,它涉及地层学、岩石学、矿物学、地球化学和构造地质学等,包括地质图件和文字内容。如果只是简单粘贴就容易造成文字重复,尽管这种情况也许属于“合理”重复,但是查重软件无法区分。
以上是我对一篇学术论文文字重复率主要原因的基本认识。如何克服或降低高重复率?我认为采取“自己组织文字撰写学术论文”就可以做到降低重复率。具体是指在参考同行文献时不要大段粘贴同行文献中的文字段落,而是在阅读同行文献内容基础上用自己语言重新组织文字撰写相关部分内容,尤其不要依赖AI技术,例如当下流行的Deepseek模型。由于AI技术主要基于同行文献的各种数据库,所以,也许AI技术会存在某种程度文字粘贴从而导致论文重复率增高。有学者告诉我,AI工具撰写的论文存在一些严重表述趋同化现象,显然不适合直接撰写学术论文。这也是为什么有的期刊学术编辑和专家很容易发现利用AI技术撰写的文字材料。所以,“用自己的语言文字撰写学术论文”是克服论文查重率高的基本手段。正如我的博文“聊聊‘专业学术语言文字表述’话题”(2025年3月10日科学网)最后说:“逐渐形成具有自己特色的学术语言文字表述方式。”只有这样长期坚持才能将同行的先进学术思想和精彩的文字表达转变成自己的学术语言,你撰写的文字材料的查重率就会大大降低。一位中国地质大学(武汉)李四光学院本科毕业,在中国科学院精密测量科学与创新研究院获得博士学位,在清华大学做博士后的年轻人读了本文初稿后谈了她的感言:“我觉得科研一大魅力是形成文字表述自己的思想。最近我写了一篇中文文章,用自己的话把工作讲述了一遍,查重率(只有)2.56%,还是很骄傲的”,我认为她说的很对,值得大家参考。
2025年3月20日初稿,24日提交科学网