APE:论文查重陷在知网的围城里

又是一年毕业季,宛如例行公事一般,“论文”一词如期登上热搜。

“今天你查重了吗?”完成毕业论文已经心力交瘁,“答辩”的临门一脚又被“查重”挡在线外,“不知知网”的演员以一己之力拉高毕业门槛,让论文成为每届高校毕业生的“心头大患”,也让对知网的质疑声在社交媒体上不断发酵:毕业论文查重乱象都是被知网逼的吗?

论文查重作为高校学子毕业之路上必须克服的关卡,需将毕业论文与现有数据库进行对比,确保其文章与已有论文的重合度满足学校规定范围,方可毕业。

这其中知网作为我国最大的文献数据库之一,是许多高校进行论文查重的首选。为不浪费为数不多的查重机会,许多毕业生也会在提交论文前自行通过第三方平台购买额外的知网查重机会。

受此影响,知网多次发表声明,表示其查重服务并不向个人用户开放,在第三方平台提供论文查重的入口均系违规,但许多毕业生仍为“求安心”选择所谓“黑中介”查重机构。

01盲盒一般的查重网站

靠谱的第三方查重网站更像是碰运气的随机活动,可遇不可求。

有些早已毕业的“打工人”提起查重事故仍然哭笑不得。“当时为完成毕业论文,使用某查重网站查重,显示文章重复率为15%,已经满足我们学校当时20%的重复率限制。本以为论文已没有问题。结果学校知网查重结果显示重复率高达25%,我成为全班唯一一个查重没通过的人”。

卡尔达诺开发人员将发布关于算法稳定币的新研究论文:IOHK首席执行官Charles Hoskinson 宣布,卡尔达诺开发人员将发布关于算法稳定币的新研究论文,该算法通过自动调整供应量来保持稳定。这位亿万富翁声称,这篇论文是他在 Bitshares 时代的一些“未完成的事业”。(u.today)[2021/6/18 23:47:30]

而不同网站提供的论文查重结果存在差距也并非偶发现象。

因为各查重网站数据库及查重算法存在差异,“以学校指定为准”难倒了不少准毕业生。某毕业生表示“为保证论文顺利通过,先通过维普网站查重,并将修改后的论文再次通过维普网站进行查重,显示重复率为14.8%。但由于维普并非学校指定查询网站,还是有些担心。所以又在第三方商家付费进行知网查重,结果却十分意外,文章重复率竟高达43%。

随着毕业生数量逐年增加、论文查重愈发严格,各类查重网站不断涌现。

除广为人知的知网、维普、万方等热门查重系统网站外,还有诸如PaperOK、PaperPass、PaperYY等第三方低价乃至免费的论文查重网站,以及部分假冒伪劣网站。

在某知名搜索引擎以“知网查重”为关键词,会发现搜索结果第一名为广告,甚至自称“高校指定论文查重系统入口”。不过至少平台在界面顶部提醒:“在网络交易平台提供所谓“知网检测服务”均是违规假冒行为”。商家设置网站域名时比搜索引擎聪明,如果手误搜索“zhiwangchachogn”等一系列相似字母时,便会发现搜索结果几乎全部为假网站,并且没有提醒。在这种情况下,用户极易误点进盗版网站而导致一系列麻烦事。

论文:一种闪电网络的系统性攻击可窃取锁定在支付通道中的资金:6月29日发表的一项研究揭示,闪电网络系统中的瓶颈( bottleneck )可成为被用来作为盗走闪电网络中比特币 (BTC) 资金的方法。

来自以色列希伯来大学的 Jona Harris 和 Aviv Zohar 评估了一次对闪电网络的系统性攻击,该攻击使得锁定在支付渠道中的比特币资产被盗。Lighting Network 被用来通过中间节点发送支付,这可以被用来窃取比特币。

具体的攻击方式为:哈希时间锁定合约(HTLC) 背后的关键思想是,在建立哈希时间锁定合约 (HTLC) 之后,目标节点通过提供一个秘密 (哈希的原像) 从路径上的前一个节点『拉出』支付。我们的攻击者将在他自己的两个节点之间路由一个支付,并在路径的末端拉出支付。当支付最终从源节点撤出时,他将拒绝合作—迫使受害者通过区块链交易来这么做。[2020/6/29]

此外,在某知名电商平台以关键词“论文查重”进行搜索,可选择产品超2500条,令人眼花缭乱。其中打着“知网查重”标签的占到一半以上。

按照“销量排名”选择销量第一的产品,发现其销量近6万,评论已超33万。

通过与该店家沟通得知,其店铺共提供2种查重服务:6元“低配版”与220元“高配版”。

客服表示6元“低配版”仅适用于论文初稿查重,以便于论文“粗改”,该查重结果往往与学校最终查重结果存在较大差距。220元的“高配版”,则与学校知网检测结果基本一致。但事实真的如此吗?

以太坊创始人发布论文 称无状态加密货币可实现极低通信和计算开销:以太坊创始人Vitalik Buterin联合多名研究人员在 5月5日发布一篇名为《无状态加密货币的可聚合子向量承诺(aSVC)》的论文。根据该论文,aSVC的无状态加密货币可实现非常低的通信和计算开销,包括减少区块证明大小、降低区块验证时间和减少更新密钥占用的区块空间(可减少矿工的存储空间需求)。[2020/5/7]

根据评论显示,近千名网友表示该网店提供的论文查重结果与学校或单位查重结果存在较大差距,可见第三方商家提供的查重结果可靠性并无保障。

相较于花钱买到劣质查重报告,另一种现象则更令人发指——论文窃取。

此前新华网曾报道,某研究生小杨本想将其本科论文进行修改完善作为硕士论文发表。却发现其论文查重结果显示其论文核心部分为抄袭,且抄袭内容全部指向一篇于某某已发表的论文。

通过对比发现,于某某发表的文章其核心内容与小杨的毕业论文内容高度一致,相似度达90%以上。针对此事,小杨认为论文盗取应该发生在论文查重环节。本科毕业前,小杨通过某电商平台购买了2次论文查重服务,均价在20元以下。

这次论文抄袭事件的最终结果不得而知,但可以肯定的是这不是一个偶发事件。近几年,论文被盗或者被他人抢先发表导致自己毕业受到影响的案例时可见闻,最终调查出来的结果大多将矛头指向市面上的论文查重机构。

动态 | 2019电力大数据论坛中一篇关于区块链的论文获奖:10月17日—18日,“2019电力大数据论坛暨应用成果交流会”在成都召开。会议分别为电促会2019年度征集的大数据优秀创新成果及论文获奖者颁发了证书,《能源互联网大数据公众服务平台》等33项成果分获一二三等奖;《基于区块链理念的电网安全运行穿透式管控》等14篇论文获奖。(中国电力新闻网)[2019/10/21]

而查重只是踏上毕业路的第一步。

02降重第一步,洗稿来凑数

2019年后,受演员翟天临学术造假事件影响,国内高校毕业生论文查重工作愈发严格,教育部门甚至专门支出800万元用于论文抽检。而高校毕业生除面临上文已提及的“假查重网站”和“高昂费用查询”外,还有一种更无奈的现象,近日央媒也针对此事作出评论。

5月11日,人民网以“毕业生学位论文查重乱象:买了降重服务论文照抄不误”为题,发表微博,引发网友热议。毋庸置疑,利用降重服务恶意抄袭不可取,但其中所提的一种现象却令诸多高校毕业生感到无奈——“见红就删,见黄就改”。

某网友于该微博下评论道“问题是有的真的是我自己写的,就是重啊怎么办呢”。

应届毕业生陈文也表示:“感觉现在的查重意义并不大,室友一稿重复率40%,核心内容并无改动,通过多语种互译、文字转图片、调换语序等一系列手段,竟然直接降至18%。”

同为应届毕业生的张莹对此深有同感:“论文一稿完成后,老师觉得并无大碍,查重结果却高于学校要求的20%标准,无奈只好对文章进行改动。最后虽使得重复率达到要求,可文章本身却已面目全非”。

动态 | 中国区块链论文首次入选计算机网络顶级学术会议NSDI:据搜狐科技快讯报道,2018年12月,计算机网络顶级学术会议NSDI宣布录用由王嘉平博士及汪浩博士撰写的区块链研究论文,该论文提出名为异步共识组Monoxide的区块链扩容方案,可以在由4.8万个全球节点组成的测试环境中,实现比比特币网络高出1000倍的每秒事务处理量,以及1000倍的状态内存容量,有望打破“不可能三角”这个长期困扰区块链性能的瓶颈。区块链“不可能三角”指区块链网络模型无论采用哪种共识机制来决定新区块的生成方式,都无法同时兼顾性能、安全、去中心化这三项要求,只能满足其中两项而牺牲另外一项,最多三者取其二。王嘉平博士现任创新工场执行董事,投资方向为区块链和人工智能,曾主导了对比特大陆的首轮机构投资。论文的两名作者,王嘉平博士与汪浩博士均毕业于中国科院计算所,中科院计算所也是这篇论文的联合署名单位之一。[2019/4/29]

可见,计算机查重弊病并不少。实际上,只要文字功底深厚,即便抄袭比例极高也可通过查重。

针对机器查重,厦门大学一位教授也曾对此表示质疑。他发现自己某项课题研究成果通过计算机查重后,竟有2万字被认定为抄袭,这令其难以理解。

不禁让人思考,随着国内高校毕业生数量逐年增加,未来的论文查重算法若不改变,坚持当下机器查重之法,是否会导致学生只是将已有的内容换一种形式进行表达,从而违背科学探究的本意,更损失科研本身的价值。

毕竟,在诸如B站、微博、小红书等多个平台,论文降重技巧早已屡见不鲜。

03无可奈何的高昂收费

“知网还要在垄断之路上狂奔多久”,这是半月谈2019年的文章标题,其中写道“在把持海量文献数据之后,不仅对使用者规定了最低消费额度,更依靠自己的垄断地位,对各高校连年涨价。”

据报道,仅2010年—2016年间,知网报价涨幅就已高达132.86%,平均年涨幅近20%。

受此影响,2013年,云南高校图书情报工作委员会旗下所属的近10所省属重点高校就宣布停用知网;2016年,武汉理工大学因知网续订价格上涨发布停用通知,甚至连中国经费最充足大学之一的北京大学也一度传闻将因知网涨价而暂停续订。

究其根本,知网涨价原因便是由于学术资源储备足够丰富,议价话语权高。

此前《半月谈》曾报道,知网是目前中国最大的学术电子资源集成商,收录了95%以上正式出版的中文学术资源。

高收录量背后,则是历史之偶然。

上世纪末,国内各高校、机构撰写的学术论文尚分散在成百上千种期刊杂志中,科研工作者检索难度高。直至光盘技术引进,国内论文开始电子化,这一现象才开始有所改观,而当时负责此事的便是知网。

此后随着互联网技术遍地开花,知网顺势成为我国最早成立的学术资源数据库,开始将此前已获授权的论文光盘版数字版视为互联网版权,将学术期刊资源搬运至互联网。

不同于传统行业,互联网领域十分强调先发优势,马太效应明显。

虽然知网仅早于维普、万方2年左右成立,然而随着时间推移,其优势逐年扩大,逐渐成为国内最大的学术资源数据库,乃至国内学术论文标准化格式亦由知网制定。

与此同时,随着科研资源日渐丰富,知网在行业内话语权也更加强大。

以论文查重价格为例,一篇2783字的小论文,知网查重价格为68元,而在维普和万方两平台查重,价格仅需9元。

不可否认,知网巨大的文献收录量是其无可比拟的专业加持,查重优势不言而喻。但如此高昂的费用,是否有一家独大的垄断之嫌?

据悉,知网本体为“中国学术期刊电子杂志社”,为清华集团全资子公司。目前杂志社已将知网实际运营权委托给“北京同方知网公司”,其母公司则为上市公司“同方股份”。

根据同方股份最近三年财报数据显示,同方知网近3年营收均在10亿元左右,净利润近2亿元,毛利率常年维持在50%以上。与10年前数据相比,知网营收与净利润均翻了近一倍。

傲人营收背后,科研工作者收入却十分惨淡。

根据知网公告可知,博士论文著作权人每篇论文可获面值为400元人民币的“CNKI网络数据库通用检索阅读卡”和100元人民币现金稿酬;硕士论文著作权人一次性获得面值300元人民币的“CNKI网络数据库通用检索阅读卡”和60元人民币现金稿酬。

这些以微小稿酬和所谓的“阅读卡”交换得来的论文,便是知网最根本的护城河,更是一本万利的“摇钱树“。

有数据显示知网年下载文献总量达到20亿篇次,按照其计费标准,期刊全文0.5元/页,硕士学位论文15元/本、博士学位论文25元/本,其10亿营收便不难理解了。

事实上,不仅国内用户对知网叫苦连连,海外市场对学术集团的怨念也十分深刻。

据研究显示,全球一半以上的国际学术论文都是由5大集团出版的,且这部分论文影响力远超以其他形式出版的剩余学术论文,在某些领域,如心理学,甚至有71%的论文发表于5大集团的学刊中。

以五大集团之一的爱思维尔为例,2018年营收75亿欧元,净利润超14亿欧元,股价总市值接近500亿美元,其科学出版业务的净利润率更是高达39%,即便利润极高的苹果也不过30%出头。

个人若想下载爱思维尔平台拥有的论文,平均每篇收费在30美元以上。一般大学订阅爱思维尔以使用相关论文,每年则需支付50万到200万美元不等。即便是作为全世界最富有大学之一的哈佛大学,都认为这笔资金过于高昂。

为对抗学术巨头高收费行为,开放获取运动开始于海外互联网出现,试图绕过商业机构,直接将学术论文免费分享。

2018年,加州大学便因与爱思维尔谈判破裂,随后将该校论文向全世界免费公开。与此同时,随着各高校、科研机构及众多科研工作者的努力,最终形成了全球最大的盗版学术论文网站——Sci-Hub。

不同于其他领域,盗版学术论文网站反而更适合科研创作者进行知识分享,并被诸多科研工作者称为“科学海盗”。

04写在最后

知识存在本身最重要意义之一便是信息的留存与传播。作为学术信息平台的知网,其初衷本是作为公共服务的一部分,方便学者进行学术研究的线上知识库。但如今的知网似乎不仅没扮演好公共服务角色,其实际运营者“同方知网”作为同方股份全资子公司,商业化程度并不低。

此外,商业化目的不应该披着尊重版权本的外衣,使高昂资费成本转化为知识与文章阅读者之间的障碍,这样的保护毫无意义。饱受诟病的论文查重算法若不改变,降重乱象将会无意义的一遍遍上演。学术环境的改善任重而道远,至于知网未来是否会成为下一个爱思维尔,则需时间来见证。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金星链

[0:15ms0-0:507ms