知网学术不端检测系统使用说明
中国学术期刊网检索方法介绍

中国工具书网络出版总库
知网工具书库》集成了近200家知名出版社的近4000余 部工具书,类型包括语文词典、双语词典、专科辞典、 百科全书、图录、表谱、传记、语录、手册等,约1500 万个条目,70万张图片,所有条目均由专业人士撰写, 内容涵盖哲学、文学艺术、社会科学、文化教育、自然 科学、工程技术、医学等各个领域。知网工具书库》除 了实现了库内知识条目之间的关联外,每一个条目后面 还链接了相关的学术期刊文献、博士硕士学位论文、会 议论文、报纸、年鉴、专利、知识元等,帮助人们了解 最新进展,发现新知,开阔视野。
中国大百科全书全文数据库 (1)
《中国大百科全书》全文数据库以《中国大 百科全书》和中国百科术语数据库为基础,内容 涵盖哲学、社会科学、文学艺术、文化教育、自 然科学、工程技术等学科领域,数据权威,共收 条目约8万条,图片5万余幅。本数据库有完善的 多种检索功能,使您在浩如烟海的文献资料中, 查找所需的知识点迅速且轻而易举。《中国大百 科全书》全文数据库既可满足图书馆数字资源建 设的需求,又是读者了解各学科知识,并向其深 度和广度进展的桥梁和阶梯。
特别提示:CAJ 阅读器问题
1.各库所收录的期刊论文、博/硕士论文、会议论文及报 纸全文均包含 CAJ 和 PDF 两种全文格式; 2.如果浏览CAJ格式全文时出现空白页,应卸载计算机 上的CAJ全文浏览器,下载最新版的“CAJ全文浏览器” 专用软件重新进行安装;
访问
访问
访问
访问
访问
学术不端
年鉴
年鉴是以全面、系统、准确地记述上年度事物运 动、发展状况为主要内容的资料性工具书。汇辑 一年内的重要时事、文献和统计资料,按年度连 续出版的工具书。它博采众长,集辞典、手册、 年表、图录、书目、索引、文摘、表谱、统计资 料、指南、便览于一身,具有资料权威、反应及 时、连续出版、功能齐全的特点。属信息密集型 工具书。
中国知网其他检索

★中国知网专业检索
* 专业检索比高级检索功能更强大,但需要检索人员根据系统的检索语法编制检索式进行检 索,适用于熟练掌握CQL检索语言的专业检索人员。 • 一般图书情报专业人员在进行查新、信息分析等工作时,使用专业检索。
P45 表2.3
• ★中国知网出版物检索
• CNKI知识发现网络平台(简称KDN)平台特色之一就是统一了出版物导航检索,包括期刊导 航、博士学位授予单位导航、导师学位授予单位导航、会议论文集导航、报纸导航、年鉴导航 和工具书导航。统一导航页面中有字母导航和分类导航,左侧文献分类目录帮助用户快速定位 导航的分类。分类导航检索可以采取鼠标滑动展现的方式实现导航操作,读者可直接按照分类 浏览基本信息,按期查找出版物。
• 针对任意一篇需要检测的文献,系统首先对进行分层处理,按照篇章、段落、句 子等层级多阶创建指纹,而比对资源库中的文献,也采取同样的技术创建指纹索引。 这样的分层多阶指纹结构,不仅可以满足用户对超长文献的快速检测,而且,因为 用户的最小指纹粒度为句子,因此,也满足系统了对检准率和检全率的高要求。原 则上,只要检测与比对文献存在一个相同的句子。就能被检测系统发现。
• 中国知网期刊检索
• ★中国知网学术不端检测
• CNKI学术不端文献检测系统(简称AMLC)以《中国学术文献网络出版总库》为
全文比对数据库,能够对抄袭与剽窃、伪造、篡改等学术不端行为实现快速检测, 另外,可供用户检测论文并支持用户自建比对库。AMLC采用CNKI自主研发的自适 应性阶段指纹(AMLFP)特征检测技术,具有检测速度快、准确率、召回率较高、 抗干饶性强等特征。其支持篇章、段落、句子等层级检测;支持文献改写、多篇文 献组合等各种文献变形监测;支持研究生论文、图书专著等超长文献的学束的不断 检测。
关于使用《科技期刊学术不端文献检测系统(AMLC)》的启事

桑污 叶病发 生在 桑 叶背面 , 开始 发病 时 , 先在
叶背 出现 油浸状 小斑 点 , 后形 成小块 污 色霉斑 , 随
着 病情 的发展 , 病斑逐 渐 扩大 , 病斑 上形 成一 层煤 粉状 物 。在相 应 的叶表 呈现 同样 大小 的灰黄 色或 暗褐 色变 色斑 。 当病斑 不 断 扩 大 , 多 个 病 斑 连接
成该 村 养蚕发 病 率 上 升 , 桑 园 产 叶量 和 张 蚕 产 茧
量下 降 , 严 重 影 响 了 该 村 蚕 桑 生 产 的发 展 。 2 为 害 症 状
重, 且连 片桑 园 , 通透性 不好 的桑 园传 染较 其他 桑 园要快 。不 同桑 树 品种问 感染此 病 , 差异 不 明显 。
该 病 在 多 雨 和 气 候 潮 湿 的 季 节 及 年 份 发 生 较
备注: 该调查采取入户抽取 2 0户取 平 均 值 调 查 。
由上述 调查 可 以看 出 , 近 年来 该 病 在 南 窑 村 发生 呈越 来越 严重 的趋 势 。桑 污 叶病普 遍发 生率
已达 3 O 以上, 在 水 田、 坡地 、 洼地均有发生 , 造
藉此 , 敬请 作 者端 正 学风 , 求 实创 新 , 不断提 高文稿 学术 质量 。
为进一 步提 高期刊 办刊 水 平 , 确 保稿件 质 量 , 杜 绝 学术 不端行 为 , 净化 学术研 究环境 , 《 北 方蚕 业 》 编
辑 部 已经从 2 O 1 2年 第 1 期 起 正式启 用《 科 技 期刊 学术 不端 文献检 测 系统 ( AML C ) 》 。
中国知 网( C NKI ) 中国学术期 刊 ( 光盘版 ) 电子 杂志社 AML C以《 中国 学术文 献 网络 出版 总库 》 为全
中国知网学位论文检测修改指导(修改论文必看)

学位论文检测修改指导一、如何看报告检测完您收到的检测报告包含:一个截图和3个网页文件,3个网页分别是:简洁,全文标明引文、全文对照。
这个3个都是系统自动生成的不同样式的报告,简洁的只显示所有抄袭论文的来源,全文标明引文的是最详细的,修改就看这个报告,抄袭的地方直接在原文上标明了,全文对照是直接显示抄袭的部分,并且是左右对照的。
亲们拿到检测报告单后是一个压缩文件,要先解压然后双击用IE浏览器打开。
学校规定的比例指的就是报告上的总文字复制比,除非学校还有对段落章节有规定,那就还要看下章节和段落的比例。
常见的修改方法总结:1.替换关键字2.打乱句子结构3.改写标红的句子4.关键字用同义替换修改论文前必读(修改抄袭黄金要点):修改的原则是用意思相近的词语去替代你抄袭的部分:就是用你自己的语言去表达抄袭部分相同的意思。
千万不要只是简单的倒换打乱下顺序,或者在检测出来的标红部分中加几个字,如“的”、“地”之类语气词的,这是没用的,因为你原来的那些标红还在,再次检测的时候还是同样会标红。
检测的原理如同百度搜索是一个道理,您加个语气助词之类的,再次搜索一下,结果肯定还是差不多的!检测的原理就是比较相同的部分,不管你怎么样打乱顺序,只要还是那些词语存在论文中,一样可以检测出来。
如同一个班级的同学排成几个队列一样,你把某几个同学的位置调换下,你依然可以在整个队列中找到他是一个道理的!所以,对于检测出来的抄袭部分必须用自己的话去说,替换词语,记住,这样才能有效的降低抄袭比例!另外,我们真诚的提醒一下您,修改之后一定再测一次,确保检测之后是合格之后再提交学校,这样才能确保万无一失!这不是为了忽悠你多测几次,因为每个人的修改水平不一样,你自认为修改很好的,可能再次检测还是有很多标红,毕业是大事!对自己要负责,事后再说没修改好为时已晚!检测报告抄袭部分(标红的和标黄色的,黄色代表引用部分的抄袭,黄色的不一定每个人的报告都有)即为检测出来的抄袭部分,标红部分需要修改,具体修改方法参考以下几条:1、知网学位论文检测为整篇上传,格式对检测结果可能会造成影响,需要将最终交稿格式提交检测,将影响降到最小,此影响为几十字的小段可能检测不出。
【普及贴】知网、万方、paperpass等论文重复率检测软件介绍

淘宝搜索:双赢文笔---- 人大经济论坛普及贴每个即将毕业的学生或在岗需要评职称、发论文的职场人士,论文检测都是必不可少的一道程序。
面对市场上五花八门的检测软件,到底该如何选择?选择查重后到底该如何修改?现在就做一个知识的普及。
一、关于检测软件分类1 知网知网是使用率最广的一套检测系统,其使用率广,其实是在于这套系统背后的资源支持及平台支持,如同方依靠的学校背景及咱们下载文章的知网平台。
知网随着使用对象的不同,又划分为以下几个分类:①知网学术不端检测。
现在的知网学术不端检测已发展到了VIP5.0,大多数学校毕业检测都用的这套系统。
针对的主要对象是硕士研究生和博士研究生。
当然我们需要注意一点,知网学术不端VIP5.0的系统会不定时更新,(淘宝搜索:双赢文笔)所以随着系统内容的不端丰富,你当时重复率检测只有2%的文章,可能过一段时间会变成5%,对于那些重复率控制的马马虎虎的同学,尽量早作打算。
②知网TMLC2,实际上这套系统的检测范围可能较VIP5.0稍微小一点,但一般情况下与VIP5.0的检测结果相同。
现在高校一般都用TMLC2,尽管如此,(淘宝搜索:双赢文笔)学生毕业检测的时候一般都用VIP5.0检测。
③科技期刊学术不端文献检测系统(AMLC)/社科期刊学术不端文献检测系统(SMLC)。
这两种都是用来检测期刊论文的。
④知网CNKI小分解,其实是学术不端5.0中的一种,其专门针对大学本科的毕业生论文检测。
2.万方万方论文检测比较简单,更多的是一种网络数据库,检测相对最不严格,可适合任何群体的初稿检测。
3.paperpass检测(简称PP检测)这个软件检测的比较严格,可以说达到变态的地步,有时候自己写的一句话都有可能标红。
所以,经过多年的论文检测经验,无论是初稿还是终稿,只要PP检测通过了,可以说知网的任何系统检测都有99.99...%的(淘宝搜索:双赢文笔)把握能通过。
所以各位如果实在不放心自己的检测结果,那就PP检测挑战一把吧。
知网查重论文修改秘籍综述

关于知网学位论文检测系统的说明常见的修改方法总结:1.替换关键字2.打乱句子结构3.改写标红的句子4.不要删除标红的句子5.不要改变标红段落总字数6.关键字用同义替换一、本检测帮助您顺利通过学校检测感谢您使用知网的学位论文检测系统VIP版本检测自己的学位论文,本检测系统和学校一样,都是上传到知网的服务器检测,所以只要您给我的论文和给学校的一样(包括文件形式、目录大纲级别等),检测结果就一样。
二、检测报告解读1、首先看总-xx% 的截图文件(有些是直接下载所截图的网页,会命名为”xxx-文献分段浏览.htm l”,学位论文检测系统是整篇上传,如果没有这个文件肯定不是学位论文检测系统检测的。
(1)截图或者分段浏览上面有学术不端文献检测系统4.0(或TMLC)的标志,说明是用VIP版本检测的。
(2)上部左侧有文章及作者信息,还有总文字复制比和总重合字数。
大部分学校基本只看总文字复制比这个指标,具体要求各个学校不同,一般5%-30%。
(3)上部中间偏是参考文献字数,系统会自动识别文章末尾的参考文献,如能识别就会单独放在这里,不参与检测。
(4)截图下部是各段落的抄袭比例,系统会识别文章的大纲目录,如果能被正确识别就会按照章节进行分段,否则会自动分段。
(5)总文字复制比由各段落复制比加权平均得来。
2、然后看文本复制检测报告单,这个是系统自动导出的检测报告,并非手工拼凑。
(1)最上部是文章及作者信息,总复制比以及比对库范围等内容。
(2)然后是文章及段落抄袭率概要,此部分对应总截图文件。
(3)接着就是各段落的详细检测报告,包括被抄袭文献的信息,并且系统识别出来的抄袭的文字会被标红处理,您只要修改红字就可以了。
三、修改建议1、知网学位论文检测为整篇上传,格式对检测结果可能会造成影响,需要将最终交稿格式提交检测,将影响降到最小,此影响为几十字的小段可能检测不出。
对于3万字符以上文字较多的论文是可以忽略的。
2、上传论文后,系统会自动检测该论文的章节信息,如果有自动生成的目录信息,那么系统会将论文按章节分段检测,否则会自动分段检测。
CNKI超详细使用介绍
不同年代的古旧资料
选择年鉴年份分组,点击各年代即可看到 相应地方的水灾情况
受灾理赔情况
选择专辑导航中的不同学科,快速定位到 相关领域的史实
2014-11-9
各领域事件、数据
2014-11-9
• 年鉴知网节--发现逐年年鉴信息,发现更多研究文献
满足文献调研及写作时所需各类资源
第 103 页
科技资料必查库
—查新、成果辨析必备资料支持
文献调研所需各类资料
学术图片库
—绘图参照、形象学术研究
文献调研所需各类资料
外文合作数据库
--跨国界遴选同步信息资源 免费正版题录信息,跳转原库提供下载!
文献调研所需各类资料
免费获取OA资源
点击来源数据库,选择OA类数据库, 即可使用OA资源
案例:房产税
1、如何找到学科带头人? --通过文献作者分组
发现学科专家,牛人 可追踪已知学者,寻访名师
通过发表时间排序:了解学科带头人目前 的新观点、新看法,多为此领域的新兴研 究方向
• 关注某个学者的文献? • 为导师建立学者库! • 实时监控自己所发表的文献……
2014-11-9
Tips:查到这么多文献,如何快速浏览?
想要各省、各年代、不同类型的大量数据? 中国经济社会发展统计数据库入口
更多数据功能展示 ---中国经济社会发展统计数据库
简单三步勾选,快速生成!
选择地区参数 选择指标参数
设置年份 参数
节省时间,可直接导出EXECL
通过中国经济社会发展统计数据库,直接可提取三省住宅及商品房平均销售价 格情况。数据来源统计年鉴,真实可靠。可作为分析的基础数据
• 书写文献综述、文献关键词时,需要查找相关词汇的定义及翻译,选 择翻译助手,查的各类型译文议句,权威可靠!
CNKI学术不端行为检测系统高校版TMLC与VIP版区别
CNKI学术不端行为检测系统高校版TMLC与VIP版区别首先给大家声明的是现在绝大部分学校用的是高校版TMLC,因为这个版本是专门为研究生
院提供检测毕业论文服务,大家可以看知网官方网站/左下方,少数高校
采用VIP版,其实两者区别不大。
一、相同点:
都是CNKI学位论文学术不端行为检测系统,检测结果是相同的,误差很小,因为数据库基本一样,相对来说VIP版数据库如果全选的话要更准确,如果VIP版多的数据库不选入检测范围数据库,那检测结果与高校TMLC版是一模一样的。
二、不同点:
1、入口不一样:
高校版入口是/tmlc/
VIP版入口是/vip/
2、检测数据库大都一样,VIP版多了几个
(1)高校版TMLC的数据库是
检测范围中国学术期刊网络出版总库,中国博士学位论文全文数据库/中国优秀硕士学位论文全文数据库,中国重要会议论文全文数据库,中国重要报纸全文数据库,中国专利全文数据库,其他对比库
(2)VIP版的数据库是
检测范围中国学术期刊网络出版总库,中国博士学位论文全文数据库/中国优秀硕士学位论文全文数据库,中国重要会议论文全文数据库,中国重要报纸全文数据库,中国专利全文数据库,其他比对库,个人比对库
从我的多次检测结果看,高校版与VIP版是一样的,另外亲可能发虽然用了VIP版,系统
默认的数据库与TMLC是完全一样的,
另值得提醒的是:期刊论文的数据库只有以下:检测范围中国学术期刊网络出版总库,中国博士学位论文全文数据库/中国优秀硕士学位论文全文数据库
期刊论文数据库检测结果不准确,一是数据库少,二是每次检测限定8000字。
中国知网大学生论文管理系统使用帮助
“中国知网”大学生论文管理系统使用帮助一、学生登录系统打开浏览器,在地址栏内输入/选择教师/学生入口进入登录界面,输入用户名(学生证号)、密码(18位身份证号)、验证码在此输入学生证号在此输入身份证号身份选择学生二、提交论文如果学生账号没有上传过论文,进入系统后会进入到“提交新论文页面”。
也可以点击“提交新论文”按钮计入该页面;系统会提示论文状态为“待提交”,并显示提交次数。
在提交论文之前,需要先选择指导教师,点击选择指导教师,会弹出选择教师的弹框,输入教师名“图书馆”,只能输入“图书馆”。
选好指导教师后,填写篇名、关键词、创新点、中文摘要和英文摘要,然后点击“浏览”按钮选择论文,点击“提交”按钮上传论文。
提交的次数。
三、学生已提交论文点击左侧导航“”可进入页面,下方的论文状态显示为“已提交”,并提示提交的次数。
学生在已提交论文页面,可以查看到已经上传的论文的检测信息。
3.1提交权限当学生已经提交了论文,则没有了提交权限,系统会在“已提交论文”页面予以提示。
当管理员通知某个学生修改其提交的论文时,则该学生登录系统后会发现其提交权限发生了变化,变成了“论文需要修改,请重新提交”,此时点击左侧的导航“提交新论文”,即可重新提交论文。
3.2检测结果查看(可查看简洁报告单)当学生查看检测结果的权限为可查看简洁报告单时,“检测结果”栏会显示文字复制比、重复字数,并提示“点击可以查看报告单”。
当鼠标划过时,该提示会改变颜色作为提示;且当鼠标划过该百分比时,会提示该比例是“文字复制比”;鼠标划过重复字数时,会提示该数字是“重合字数”;点击链接可以查看简洁报告单。
简洁报告单简洁报告单的标题会提示“简洁”两个字。
简洁报告单分为以下几部分:第1 部分:文献基本情况展示,包括报告单编号和检测时间、篇名、作者、检测范围和时间范围。
第2 部分:展示指导教师的意见。
第3 部分:展示检测结果各项指标,包括文字复制比结果、指标结果、表格结果及提取到的脚注、尾注。
学术不端行为检测系统 报告
最大段长 平均段 段落数
• 在学位论文检测中,当连续文字超过一定比例时,称之为 段。在本系统中,一般认为,连续200以上文字称为段。 • 与比对文献重合的最大段长度即为最大段长。最大段长反 映成段抄袭特征。连续的文字越长,抄袭的可能性越大。 • 在学位论文中,所有段的长度的平均值即为平均段长。 • 在学位论文中,所有段的数量为段落数。 • 平均段长和段落数反映了重合文字在学位论文中的分布情 况,一般来说,指标参数越高,存在学术不端行为的可能 性越大。如图9所示,标红部分的连续文字构成了段,而 且它是算法设计的抄袭,审查人员比较容易判断;而在图 10中,标红文字不构成段,连续文字较少,对它的性质判 断则可能需要更多的信息。
检测结果内容
4. 子检测指标。 因为学位论文一般较长,因此,系统一般按章检索,并且 每一章给出子检测指标,该检测指标从多个角度对该章内 容的检测情况进行了详细描述。 5. 诊断类型。 系统根据指标参数以及其他元数据相关信息,自动给出一 个预判的诊断类型,供审查人员参考。 6. 检测报告。 检测系统自动生成一个检测报告单,详细列出检测文献的 学术不端行为检测情况,用户可以对该报告单进行修改, 生成终审报告。
系统架构模式
图3 系统架构图
图4系统示意图
图5 系统核心流程图
引用自己的文献是合理的
特别提到的是: 在进行学位论文检测的时候,作者信息是非 常必要的。输入作者信息,在后续的检测过程中, 系统能够自动根据作者信息区分比对资源中的文 献是属于该作者已发表的文献,还是他人的文献, 为用户快速甄别论文是否存在学术不端行为提供 更直观的印象。 在学位论文中,引用自己以前发表过的文献 是合理的
检测结果内容
在对用户提交的检测文献检测之后,系统生成的检测结果 包括: 1. 重合文字来源文献信息。 系统详细列出重合文字来源文献信息,这些文献都是真实 存在,而且应是公开发表或得到发表确认的。 2. 比对信息。 检测文献和来源文献的详细比对信息,用户可以快速选择 重合文字部分查阅。 3. 总检测指标。 该指标体系从多个角度对检测文献中的文字复制情况进行 了概括性描述。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学位论文学术不端行为检测系统研制介绍与使用方法第一章系统简介1.1 系统概述学位论文学术不端行为检测系统(简称“TMLC”)以《中国学术文献网络出版总库》为全文比对数据库,实现了对抄袭与剽窃、伪造、篡改等学术不端行为的快速检测,可供用户检测学位论文,并支持用户自建比对库。
其系统示意图如图1所示。
图1 检测系统示意图1.2 系统技术路线介绍TMLC采用CNKI自主研发的自适应多阶指纹(AMLFP)特征检测技术,具有检测速度快,准确率,召回率较高,抗干扰性强等特征。
支持篇章、段落、句子各层级检测;支持文献改写,多篇文献组合等各种文献变形检测;支持研究生学位论文、图书专著等超长文献的学术不端检测。
CNKI自适应多阶指纹技术原理如图2所示:图2 CNKI自适应多阶指纹技术原理图对任意一篇需要检测的文献,系统首先对其进行分层处理,按照篇章、段落、句子等层级分别创建指纹,而比对资源库中的比对文献,也采取同样技术创建指纹索引。
这样的分层多阶指纹结构,不仅可以满足我们对超长文献的快速检测,而且,因为我们的最小指纹粒度为句子,因此,也满足了系统对检准率和检全率的高要求。
原则上,只要检测文献与比对文献存在一个相同的句子,就能被检测系统发现。
1.3 系统功能概述系统主要功能包括:已发表文献检测、论文检测、问题库查询、自建比对库管理等。
◆已发表文献检测:指检测系统能够自动将属于用户的已正式发表的学位论文检索出来,并对每一篇已发表文献进行实时检测,快速给出检测结果。
◆论文检测:主要实现论文实时在线检测功能。
◆问题库查询:指用户可以将检测结果中确认有问题的文献放入到问题库,便于用户集中管理。
◆自建比对库:指管理人员可以选择将检测文献放入个人比对库或者批量上传文献作为个人比对库,该个人比对库即可作为以后学术不端文献检测的比对数据库,该自建个人比对库完全属于用户,其他用户无权使用。
1.4 系统目的TMLC的目的是辅助各研究生培养单位对学位论文质量进行评估,为审查论文提供技术服务。
检测系统在对论文进行检测之后,生成检测报告,为判断论文性质提供相关依据。
第二章检测原理及方法2.1 支撑技术CNKI拥有强大的技术研发队伍,目前已经拥有了具有国际或国内领先水准的全面的数字出版的相关技术,包括资源采集技术,文本数据库加工技术,文本数据库技术, 数字资源版权保护技术, 知识挖掘技术, 自然语言处理技术、快速比对技术等。
在海量的全文数据的基础上实现快速准确的检测,上述技术是基本的保证。
2.2 支撑资源TMLC需要一个尽可能完备的全文数据比对资源库,而CNKI的《中国学术文献网络出版总库》则正好满足这一要求。
到目前为止,CNKI拥有学术期刊7000余种,期刊全文文献2480万篇,期刊期数和文献收录完整率都大于99.9%,文献量居国际国内同类产品之首;出版503家硕士学位点的72万篇优秀硕士学位论文,368家博士学位点的9.6万篇博士学位论文;1286家重要会议论文106万篇;515家重要报纸500多万篇;1376种重要年鉴787万篇;600多种工具书220多万条;学术引文索引数据600多万条;这些出版物做到平均日更新20000条记录;国家标准、专利、SPRINGER数据库也集成到CNKI网络出版平台中;另外,出版平台还集成整合出版了各类第三方数据库资源1020种。
在收录资源种类上,CNKI在国内具有明显优势,收录了期刊、学位论文、会议论文、报纸、年鉴、工具书、专利、外文文献、学术文献引文等与科学研究、学习相关的主要资源。
在资源收录数量上,CNKI明显优于同类产品,各个资源库收录年限长,期刊等主要资源库回溯到创刊。
在资源更新速度上,CNKI产品除了第三方合作的外文文献以外,其他资源都做到了日更新,单日更新数量大,这是推行产业化、标准化运作的结果。
2.3 系统架构模式2.3.1系统架构图图3 系统架构图2.3.2系统示意图检测系统提供整套的文献学术不端行为检测,系统服务器位于CNKI中心网站,用户将待检测的学位论文通过网络在线提交到中心网站服务器,服务器在检测完成后,自动将检测结果返回给用户。
整套系统架构为B/S结构,客户端不需要安装任何软件。
其系统示意如图4所示:图4系统示意图2.3.3系统流程图图5 系统核心流程图2.4 用户提供的资源实现学位论文的学术不端检测,用户需要提供的资源包括:1.论文全文内容论文全文内容是检测论文是否存在学术不端行为的基础数据。
本检测系统是对提交的论文全文内容进行分析,在内容分析的基础上,生成各项检测指标。
因此,全文数据是系统所需要的必要资源。
2.元数据信息元数据指论文相应的作者、作者单位、发表时间、支持基金项目等信息。
元数据是检测系统对学术不端类型进行判断所需的基础数据,为了更准确的便于系统做出预判,用户可以在提交检测文献的同时,一并提交文献的元数据信息。
特别提到的是:在进行学位论文检测的时候,作者信息是非常必要的。
输入作者信息,在后续的检测过程中,系统能够自动根据作者信息区分比对资源中的文献是属于该作者已发表的文献,还是他人的文献,为用户快速甄别论文是否存在学术不端行为提供更直观的印象。
因为在学位论文中,引用自己以前发表过的文献是合理的。
注意:元数据不是系统必需的数据,用户在使用检测系统的时候,可以选择不填写元数据。
但我们建议最好输入作者信息。
2.5 检测结果内容在对用户提交的检测文献检测之后,系统生成的检测结果包括:1.重合文字来源文献信息。
系统详细列出重合文字来源文献信息,这些文献都是真实存在,而且应是公开发表或得到发表确认的。
2.比对信息。
检测文献和来源文献的详细比对信息,用户可以快速选择重合文字部分查阅。
3.总检测指标。
该指标体系从多个角度对检测文献中的文字复制情况进行了概括性描述。
4.子检测指标。
因为学位论文一般较长,因此,系统一般按章检索,并且每一章给出子检测指标,该检测指标从多个角度对该章内容的检测情况进行了详细描述。
5.诊断类型。
系统根据指标参数以及其他元数据相关信息,自动给出一个预判的诊断类型,供审查人员参考。
6.检测报告。
检测系统自动生成一个检测报告单,详细列出检测文献的学术不端行为检测情况,用户可以对该报告单进行修改,生成终审报告。
注意:系统只对疑似存在学术不端行为的论文生成检测报告。
第三章检测指标体系学位论文学术不端行为检测系统采用的指标体系分为两个部分:3.1 总检测指标学位论文一般文献篇幅较大,字数多,硕士论文一般为3~5万字,博士论文则多达十多万字。
因此,为了让用户对整个学位论文有一个快速的概况了解,特制定了以下指标体系:●总重合字数(CCA)●总文字复制比(TTR)●总文字数(TCA)●疑似章节数(QCA)●总章节数(TCA)●首部重合文字数(HCCA)尾部重合文字数(ECCA)上述指标从整体情况描述了论文的检测情况,便于用户快速了解该论文总的检测概况。
下面对上述指标分别进行说明。
3.1.1总重合字数(CCA)学位论文一般篇幅大,少则3~5万字,多则十多万字,若以文字复制比来衡量一篇论文的文字重合情况,则不太合适。
因为对于一篇十几万字的博士论文来说,10%就已达到1万字,文字复制情况已经非常严重。
因此,对于博硕士论文检测,检测系统使用绝对字数即总重合字数作为检测结果的核心指标。
如图6所示:图6 总重合字数示例3.1.2总文字复制比(TTR)总文字复制比则是指学位论文中总的重合字数在总的论文字数中所占的比例。
通过该指标,我们可以直观了解到重合字数在该检测学位论文中所占的比例情况。
3.1.3总文字数(TCA)总文字数是指该检测论文所有包含的字数,文字复制比与总文字数的乘积即为重合字数。
3.1.4疑似章节数(QCA)、总章节数(TCA)疑似章节数是则检测论文疑似存在学术不端行为的章节的数量。
总章节数则是指学位论文总的章节数(对于不按章节显示,而是按照固定长度切分的论文,每一段落为一章节)。
3.1.5首部重合文字数(HCCA)、尾部重合文字数(ECCA)首部重合文字数指学位论文前1万字中重合的文字数量。
尾部重合文字数是指除去前1万字,剩下的部分中重合的文字数量。
对于学位论文,一般开头部分均是综述性的报告介绍,其重要性远低于论文尾部。
3.2 子检测指标对于学位论文的每一章节,又制定了如下检测指标来反映该章节的检测情况,对于一篇学位论文来说,每一章的内容各异,重点也不一样,其核心工作内容一般主要存在某几章中,子检测指标可以让用户迅速了解每一章节的检测情况。
子检测指标包括:●文字复制比(TR)●重合字数(CNW)●最大段长(LPL)●平均段长(APL)●段落数(PN)●段文字比(PR)●首部复制比(HR)●尾部复制比(ER)●引用复制比(RR)*上述指标从多个角度反映了检测文献的检测情况,便于用户进行针对性审核。
下面对各项指标分别进行说明。
3.2.1文字复制比(TR)因为学位论文一般文字量较多,为了便于用户快速浏览检测结果。
系统会自动对学位论文进行切分处理。
有如下两种处理方式:1.若用户提交的论文是MS Word格式,且按照MS Word格式生成了文档目录,检测系统会自动识别论文章节,按论文实际章节信息显示论文内容。
2.若学位论文不存在明显的章节信息,或者不是MS Word格式论文,则系统会自动按照每段1万余字符切分学位论文,按照切分后的结果显示。
文字复制比即指论文切分后每一章节段落的文字复制情况。
文字复制比即指学位论文的某一章节与比对文献比较后,重合文字部分在该章节中所占的比例。
比例越高,反映该章节越多的文字来自于其他已发表文献。
文字复制比反映了文章“抄袭”的文字数量比例,一般来说,文字复制比越高,存在学术不端行为的可能性越大。
文字复制比情况如图7所示。
图7 文字复制比示例3.2.2重合字数(CNW)重合字数指学位论文该章节与比对文献比较后,重合部分的字数。
一般来说,不管文字复制比如何,重合字数越多,存在学术不端行为的可能性越大。
如图8所示,在图中,虽然文字复制比只有16%,比例不高,但图中左文标红部分实际上是抄袭了右文的标红部分。
图8 重合字数示例3.2.3最大段长(LPL)、平均段长(APL)、段落数(PN)在学位论文检测中,当连续文字超过一定比例时,称之为段。
在本系统中,一般认为,连续200以上文字称为段。
与比对文献重合的最大段长度即为最大段长。
最大段长反映成段抄袭特征。
连续的文字越长,抄袭的可能性越大。
在学位论文中,所有段的长度的平均值即为平均段长。
在学位论文中,所有段的数量为段落数。
平均段长和段落数反映了重合文字在学位论文中的分布情况,一般来说,指标参数越高,存在学术不端行为的可能性越大。
如图9所示,标红部分的连续文字构成了段,而且它是算法设计的抄袭,审查人员比较容易判断;而在图10中,标红文字不构成段,连续文字较少,对它的性质判断则可能需要更多的信息。