当前位置: > 未分类 > 论文范文ROST反剽窃论文检测系统简介

论文范文ROST反剽窃论文检测系统简介

论文类型:论文范文
论文字数:
论点:剽窃,文档,检测
论文概述:

这篇论文是关于ROST反剽窃论文检测系统介绍,是由硕博论文网论文中心为你提供的多种反剽窃论文检测系统介绍中的ROST篇。主要从ROST反剽窃论文检测系统的简介优缺点几个方面进

论文正文:

反剽窃论文检测系统简介——ROST论文
硕博论文网论文中心为您提供各种反剽窃论文检测系统的介绍。本章将向您介绍ROST反剽窃论文检测系统。

简介:
ROST反剽窃论文检测系统是一个通过比较源文档和目标文档之间的相似性给出相似性结果的信息处理系统。信息管理学院出版科学系教师沈洋教授开发的ROST文档相似度测试工具可以检测论文的剽窃相似度。大约有几个单位对其进行了免费测试,并得到了良好的响应。在一定程度上,它阻止了可能剽窃的论文的发表。

ROST反剽窃论文检测系统的基本原理:
反剽窃软件自动将文档切割成50-200个单词(可定制)的小文本,并通过混合引擎与188亿个网页和490万个文档进行模糊匹配,以标记每个文本块与文档库中一些文档的最大相似度。由此,软件计算相似度≥95%(基本不变的剽窃)和相似度≥80%(稍加修改的剽窃)的单词比例。我们用这个比率来衡量剽窃(相似性)。

ROST反剽窃论文检测系统优势:
覆盖面广,通过混合引擎覆盖188亿网页和490万篇论文。该系统使用自主开发的ROST网络蜘蛛(WebSpider)和ROST赛德(针对谷歌、百度、有道、搜狗的元搜索引擎分析和轮询元搜索引擎分析工具)算法,实现互联网和部分期刊网络的广度覆盖。

模糊检测,灵活匹配,为防止抄袭者替换部分字符和删除部分标点符号,系统根据相似度进行判断。系统采用ROST相似算法实现相似性检测和测量。系统使用庆庆算法提取信息指纹。在P3和512MBPC上,分割速度为13MB/S,评估版本已在互联网上提供进行行业评估。

该软件的测试结果只能作为参考。您可以使用右键单击表导出详细的测试结果,并将其发送给被检查人员。该软件不会对剽窃做出结论,只是告诉你文章总数中与现有文档相似度高于80%的词所占的比例。相似度高于80%的单词需要注意。
将引用和引用的删除标准化,以减少误判的可能性。
用户定义的块检测机制准确地指示文章的每个文本块与其他文档之间的相似性。每个文本块的范围从大约50个单词到200个单词(可定制),并且在红色方面极其相似(相似度大于80%),这是清晰和引人注目的。当设置为50个字符时,可以在较低的信息粒度下找到可以复制或类似的文档。
相似文档的模块跟踪技术可以通过简单的操作直接定位相似文档中的哪些内容已经被复制或拷贝,直观明了。
结果分析功能,自动分析文档的相似结果并给出评价意见。
支持各种文件格式,包括PDF、DOC、PPT、XLS、TXT和其他文档。
专有数据文件无需重复检测即可保存,浪费了时间。

缺点:
这个反剽窃系统不能覆盖世界上所有的中文和英文文档。覆盖率和召回率之间的关系正在研究之中。
检测时间稍长。一份8000字的文件至少需要大约5分钟,需要一点耐心。
该软件的检测结果有一个小错误。使用较小的文档块进行检测可以减少错误,但所需的时间也会相应增加。经过我们在几个编辑部的试用,200字的版块更合适。此时,错误率也是可接受的,并且文档相似率通常低于实际相似率。
为了在试用版中最大程度地检测不同学科最相关的文档,该软件在某些情况下有误判的可能。此时,用户可以通过调整设置中的两个参数来获得不同的相似性指数结果。如果用于研究目的,请联系我们来调整参数,并将系统调整到更严格的匹配。稍后,我们将针对这一点升级软件,并发布不同学科的版本。