专利详细信息
文献类型:专利
专利类型:发明专利
是否失效:否
是否授权:否
申 请 号:CN201910937578.2
申 请 日:20190930
申 请 人:南京网感至察信息科技有限公司
申请人地址:210001 江苏省南京市秦淮区光华路129-3号南京白下高新技术产业园区A1区5层511室
公 开 日:20200110
公 开 号:CN110674299A
代 理 人:邵永永
代理机构:32385 苏州言思嘉信专利代理事务所(普通合伙)
语 种:中文
摘 要:本发明提供一种文章观点剽窃行为的检测方法,涉及文本抄袭检测技术领域。该文章观点剽窃行为的检测方法,包括以下步骤:S1.根据不同领域的文章特点定义文章的关键要素;S2.针对关键要素定义抽取规则;S3.从比对库中获取比对文本;S4.在待检测和比对文本中进行关键要素抽取;S5.基于抽取得到的关键要素,可以基于规则的方式计算文章整体相似度;也可以作为基于统计的方法的特征数据,输入到训练好的分类器中进行分类;S6.报告检测结果。通过对现有系统无法有效检测观点剽窃行为的现状进行改进,提高抄袭检测的有效性,可以作为现有系统的有利补充。
主 权 项:1.一种文章观点剽窃行为的检测方法,其特征在于:包括以下步骤:S1.根据不同领域的文章特点定义文章的关键要素;S2.针对关键要素定义抽取规则;S3.从比对库中获取比对文本;S4.在待检测和比对文本中进行关键要素抽取;S5.基于抽取得到的关键要素,可以基于规则的方式计算文章整体相似度;也可以作为基于统计的方法的特征数据,输入到训练好的分类器中进行分类;S6.报告检测结果。
关 键 词:关键要素 比对 剽窃 现有系统 检测 抽取 文本 文本抄袭检测 整体相似度 抄袭检测 抽取规则 检测结果 特征数据 有效检测 分类器 分类 补充 改进 统计
IPC专利分类号:G06F16/35(20190101);G06F40/30(20200101);G06K9/62(20060101)
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...