厦门大学信息检索大作业
信息检索习题带答案

205、逻辑“与”是一种用于交叉概念或者限定关系的组配,可以缩小检索范围, 提高查准率。 答案.(正确)
206、逻辑“或”是一种用于概念并列关系的组配,可以扩大检索范围,提高查 全率。 答案.(正确)
最新文献检索
一、 判断题
1、《维普期刊资源整合服务平台》作者提供的关键词语言属于叙词语言。答
案.(错误)
2、借助于《维普期刊资源整合服务平台》期刊导航可查阅某年限范围期刊上发 表的文献。 答案.(正确)
3、《维普期刊资源整合服务平台》收录的范围限人文社会科学类。答案.(错
误)
4、在因特网上可任意检索《维普期刊资源整合服务平台》 ,并可以下载全文。 答案.(错误)
89、CNKI同样的检索策略条件下,模糊匹配的检索结果记录数一般多于精确匹 配的记录ቤተ መጻሕፍቲ ባይዱ 答案.(正确)
90、CNKI模糊匹配表示结果中含所输入检索词中的字或词素答案.(正确)
91、CNKI精确匹配表示与输入检索词一致或包含所输入的检索词语答案.(正
确)
92、CNKI专业检索中运算符号如“*”、“+”等可以用全角表示 答案.(错误)
62、NSTL系统可以为用户提供中、西、俄、日等语种的文献答案.(正确)
63、通过NSTL系统可以同时进行期刊、学位论文、会议论文、科技报告、专利、标准等文献的检索。答案.(正确)
64、通过文献传递平台可以直接阅读全文答案.(错误)
65、文献传递服务是图书馆利用本馆和外馆文献资源帮助读者获取原始文献的服 务 答案.(错误)
234、间接检索法是通过最新的报刊杂志、会议文献查找文献的方法。答 案.
2021年第一次信息检索课作业及答案

2021年第一次信息检索课作业一、文献检索课基础知识练习题1.具有相近含义的同义词或同族词在组成检索策略时应该利用( B )算符予以组配。
A.逻辑“与” B.逻辑“或”C.逻辑“非” D.位置2.若想排除某概念,以缩小检索范围,可利用(B)算符。
A.逻辑“与” B.逻辑“非” C.逻辑“或” D.位置3.当某些检索词词干相同、词义相近,但词尾有转变时,可采用( B )方式表示。
A.逻辑“与” B.截词 C.位置算符 D.字段限定4.切分课题“当前商业银行经营体系的特点”的概念,并用布尔逻辑算符组成检索策略。
(无需扩展概念,无需利用英语)商业银行 AND 经营体系 AND 特点5.切分课题“当前数理统计模型研究的趋势”的概念,并用布尔逻辑算符组成检索策略。
(无需扩展概念,无需利用英语)数理统计模型 AND 趋势二、Google搜索引擎练习题1.用Google的“手气不错”功能,,选择检索下面国家某所大学的网站,写出该大学的名称及其主页的网址。
(1)英国的大学。
(2)美国的大学。
(3)加拿大的大学。
(4)澳大利亚的大学。
(5)新加坡的大学。
(6)香港大学牛津大学;.uk/2. Google学术搜索引擎练习(1) 请写出Google学术搜索网址。
(2) 利用Google学术搜索引擎,检索《僧帽牡蛎三倍体的研究》从维普或CNKI数据库中写出该文献前两篇引文的作者,并写出CNKI数据库用户名与密码。
第一篇:曾志南; 陈木; 林琪; 陈朴贤; 刘伟斌第二篇:赵荣涛; 何建瑜; 刘慧慧用户名:db0185 密码:dlscxy3.李阳是著名的英语教育专家,请用google检索题目中包括“疯狂英语”的中国商业类网站的文献,并写出有效的检索式。
李阳or疯狂英语4.采用google的高级语法(filetype:pdf),搜索有关“信息检索”方面的doc\pdf\ppt 格式的文献,给出检索式。
信息检索filetype:doc OR filetype:xls OR filetype:ppt5.搜索大连海洋大学网站内有关“毕业论文”的所有消息,共有几条?12条三、网络免费期刊资源检索从SOCOLAR开放获取期刊检索平台检出2种与自己专业相关期刊。
信息检索与利用大作业

信息内化与应用
知识分享与传播
通过学习和思考,将整理后的信息内化为 个人知识体系的一部分,并运用到工作、 学习和生活中。
通过撰写博客、参加研讨会等方式,将个 人知识和经验分享给他人,促进知识交流 和共享。
05 跨领域信息检索与利用挑 战及应对
跨领域信息需求特点分析
多样性
跨领域信息需求涉及多个学科领域,信息内容多样且复杂。
信息检索与利用大作业
目 录
• 信息检索基础 • 信息检索方法与技巧 • 信息筛选与评估 • 信息利用策略与实践 • 跨领域信息检索与利用挑战及应对 • 总结与展望
01 信息检索基础
信息检索概念及原理
信息检索定义
01
信息检索是指从大量信息集合中找出符合用户需求的特定信息
的过程。
信息检索原理
02
基于用户输入的查询请求,通过特定的检索算法和策略,在信
学术成果产出
将分析结果与自身研究相结合,撰写 学术论文或研究报告,推动学术交流 和知识创新。
企业经营决策中信息支持
市场信息收集
通过市场调查、竞争对手分析 等手段,收集关于市场需求、
竞争态势等方面的信息。
信息评估与预测
对收集到的信息进行评估,预 测市场发展趋势和潜在机会, 为企业决策提供数据支持。
经营策略制定
利用关键词、标题、摘要等快速浏览信息,判断其与主题的相关性;利用专业数据库、学术搜索引擎等获取权威 信息;注意信息的发布时间、来源等判断其时效性;通过多种渠道和方式收集信息,确保信息的全面性。
信息质量评估标准
准确性
信息内容是否准确、无误,是否符合事实。
完整性
信息内容是否全面、完整,是否包含所需的所有 信息。
信息检索综合作业

信息检索综合作业一、实习内容利用所学的信息检索知识和检索方法,根据自己选择的课题,综合运用各种检索工具,从多方面搜集相关资料,完成该课题的综合检索报告。
二、实习要求1、检索课题:自拟。
根据自己专业情况或自己的兴趣选择检索题目。
2、检索报告(1)请按照规定格式撰写,格式如下;(2)提交打印稿,排版整洁。
打印稿交至图书馆401信息咨询室。
截止日期:2013.10.29 3、信息检索综合作业占本课程最终考核成绩的60%,请大家独立、认真完成。
三、评分标准1、检索课题的难度系数值(10分)2、选择和使用检索工具的情况:(1)选择检索工具的种类(10分)(2)检索词、检索表达式的构建(10分)(3)所查文献的出版类型(10分)(4)所查文献的著录格式(10分)(5)所查文献的语种(10分)(6)所查文献与课题的相关度情况(10分)3、小结情况(20分)4、检索报告的整体格式(10分)关于大学生心理问题研究的检索报告班级:电力营销111 姓名:许彤彤学号:209110325一、分析研究课题(黑体四号)大学是人生道路上个重要的新起点,是一个人从家庭走向社会,从依赖走向独立,从不成熟走向成熟的桥梁。
但是随着社会经济的飞速发展、生活节奏日益加快、竞争不断激烈,人们心理方面存在的问题也日趋增多。
尤其是大学生处于青年时期,社会经验与社会阅历较缺乏,心理成熟程度还不高,面临大学这个人才集中、竞争激烈的环境,更容易出现心理适应不良甚至心理疾病。
因此认真分析大学生心理障碍形成原因,及时的、有针对性的加以教育引导显得非常重要。
二、选择数据库***************************************************(把你在第三部分使用到的检索工具名称罗列出来)三、制定检索策略、记录检索结果(不少于8条)1、检索工具名称:CNKI中国学术期刊网络出版总库检索策略:命中结果总数:检索结果列表:(检索结果列举一篇,必须按照参考文献的著录规则著录,详见教材P305 GB/T 7714-2005《文后参考文献著录规则》,并附上摘要信息)2、检索工具名称:检索策略:命中结果总数:检索结果列表:3、检索工具名称:检索策略:命中结果总数:检索结果列表:***************************************************四、小结***************************************************(根据检索结果比较各个检索工具;检索过程中遇到的问题、解决的办法等等,自由发挥)以下所列检索课题供学生在完成检索练习时参考。
信息检索作业

信息检索作业:•一、利用数据库查出本馆不同学科图书四种,外馆图书三种。
•记录:数据库名称、检索途径、检索词;•检索结果记录:书名、作者、出版项、藏书地点、索取号,ISBN号。
•二、在互联网上查出5条关于本校新闻。
•要求:1、不用本校网站;•2、写出所查网站的网址及检索表达式;•3、记录新闻标题及新闻来源,如果标题含义不明,请摘要新闻主要内容。
•三、自命题目一个,查出相关的期刊论文中文9篇,外文1篇(可另命题)•要求:写出数据库名称、检索途径、检索表达式。
•结果记录:论文标题、作者、论文来源(所载刊物名称、年、卷、期、页码)•四、写出本校提供的与你专业相关的外文数据库名称。
作业解答如下:一(a).本馆图书:数据库名称:中原工学院图书馆公共检索系统(1).检索途径:主题途径检索检索词:“PLC编程设计与案例分析”检索结果记录:《S7-200 PLC编程设计与案例分析》作者:朱文杰出版项:机械工业出版社2010/01/01出版藏书地点:南区新馆理工2北4楼索取号:TM571.6/42ISBN号:9787111283119(2).检索途径:分类检索(分类号)检索词:“F316.11”检索结果记录:《粮食战争》作者:帕特尔, 郭国玺程剑峰出版项:东方出版社2008/01/01出版藏书地点:南区新馆经管类北6楼索取号:F316.11/1ISBN号:9787506033084(3).检索途径:责任者途径检索(作者)检索词:“余秋雨”检索结果记录:《一个王朝的背影-穿越中国历史的散文之旅》作者:余秋雨出版项:四川文艺出版社1995/01/01 出版藏书地点:南区新馆密集书库索取号:I267/300ISBN号:7-5411-1137-6(4).检索途径:文献代码途径检索(索书号)检索词:“B848.4/568”检索结果记录:《“白骨精”学习法: 让你的年收入持续增长》作者:胜间和代出版项:中信出版社出版2009年7月第一版藏书地点:南区新馆社科类南5楼索取号:B848.4/568ISBN号:978-7-5086-1549-3/F·1627(b).外馆图书:数据库名称:郑州大学网上图书馆(1).检索途径:主题途径题名(刊名)检索词:“大众软件”检索结果记录:《大众软件》作者:孙月湘中国科学技术情报学会北京前导软件有限公司出版项:北京藏书地点:郑州大学图书馆中心馆过刊索取号:TP31/6ISBN号:无(2).检索途径:主题途径(主题词)检索词:“计算机”检索结果记录:《计算机与通信专业英语:修订版》作者:徐秀兰出版项:北京:北京邮电大学出版社,1998年出版藏书地点:中心馆密集书库中文外借图书索取号:41.68/953ISBN号:7-5635-0335-8(3).检索途径:责任者途径检索(作者)检索词:“王若平”检索结果记录:《大学英语四、六级考试万能作文》作者:穆春玲王若平出版项:北京:航空工业出版社,1999年出版藏书地点:南区社科中文外借图书索取号:41.683/797ISBN号:7-80134-517-7二关于本校的新闻:(1). /hnfw/jy/200904/t20090424_505312906_2.html 检索表达式:“中原工学院*健与美”新闻标题及来源:健与美中原工学院举办健美健美操街舞大赛来源:中广网2009-04-24(2). /jiaoyu/2009-05/27/content_613580.htm 检索表达式:(中工社团)新闻标题及来源:中工社团才情展演一台晚会三代梦想中原新闻网 2009-05-27 10:10中原教育来源:中原网(3). /data/2010/2010-06-12/306858.shtml检索表达式:中国服装网=服装院校=院校快讯=%新闻标题及来源:葛巾麻衫,编织成文章锦绣(图)来源:中国服装网2010-06-12(4). /ShowDetail.aspx?id=915检索表达式:(中原工学院+图书馆)*张怀涛*学术交流新闻标题及来源:中原工学院张怀涛馆长一行来我馆学术交流来源:河南师范大学图书馆作者:系统管理部发布日期:2010-10-15 18:08:19(5). /dfpd/henan/2010-11-09/content_1164651.html检索表达式:“中原工学院*诗歌朗诵会*55周年”新闻标题及来源:中原工学院举办诗歌朗诵会来源:人民网2010-11-08 15:56:39[提要] 11月5日晚,我国艾青、徐志摩、梁启超等著名诗人的代表作在中原工学院图书馆被众人朗诵,让在场的大学生和老师们大呼过瘾。
信息检索作业 (3)

信息检索作业1. 简介信息检索(Information Retrieval)指的是通过计算机系统从大量的信息中找到用户所需的有效信息的过程。
本篇文档将介绍信息检索的基本概念、技术和应用,并探讨信息检索系统的优化策略。
2. 信息检索的基本概念2.1 信息检索定义信息检索是指从大规模的、非结构化的信息资源中寻找用户所需信息的过程。
不同于数据库查询,信息检索更关注的是如何从大规模、动态的信息资源中快速准确地提取出用户需要的信息。
2.2 信息检索过程信息检索过程主要包括以下几个步骤:1.收集信息源:从互联网、数据库、文件等资源中收集大量的信息。
2.预处理:对收集到的信息进行清洗、分词、去除停用词等操作,将原始文本转化为可以处理的形式。
3.索引构建:根据预处理后的文本,构建倒排索引(Inverted Index),用于快速定位文档。
4.查询处理:根据用户的查询词,通过倒排索引定位相关的文档。
5.评价与排序:根据查询与文档的匹配程度,计算出相关性分数,并对结果进行排序。
6.结果展示:将获取的信息以用户易读的方式展示给用户。
2.3 常见的信息检索模型•布尔模型:把检索任务看作是布尔逻辑运算,通过组合关键词的逻辑运算进行检索。
•向量空间模型:将查询和文档表示为向量,在向量空间中计算相似度并排序结果。
•概率检索模型:基于概率论统计的模型,通过计算查询与文档的相关性得分进行排序。
•语言模型:将查询和文档都看作是语言模型,通过计算两者的相似度进行排序。
3. 信息检索的技术3.1 分词技术分词是信息检索的基础步骤,通过将文本切分成一个一个的词语,构建倒排索引。
常见的分词技术有:基于字典的分词、最大匹配法、最少切分法等。
3.2 倒排索引倒排索引是一种将词语映射到文档的数据结构,用于快速定位包含某个词语的文档。
倒排索引一般由词典和倒排列表组成,可以通过词典快速查找到包含某个词语的文档列表。
3.3 相似度计算相似度计算是信息检索中评价文档与查询之间相关性的指标,常见的相似度计算方法有:余弦相似度、BM25等。
《信息检索》实习题目及答案11年

《信息检索》实习题⽬及答案11年《信息检索》实习题⽬⼀、OPAC检索1、利⽤“中图分类法”查找⾃⼰所在专业的分类号TH,并记录。
再使⽤书⽬查询系统查找该分类下的⼀本图书,写出该书的书名机械创新设计、作者⾼志,黄纯颖主编清华⼤学,北京科技⼤学,中南⼤学编、出版社北京:⾼等教育出版社、出版年2010、索书号TH122/825(2)、馆藏复本数3、ISBN号978-7-04-029158-2/CNY、馆藏地⾃科⼀库[2楼东部](写⼀个即可)2、查找作者姓“李”、索书号为“H31”的图书,记录下检索的结果数量1314,再在结果中检索由中⼭⼤学出版社出版的图书,记录下检索结果的数量7,并写下任⼀检索结果的作者谢春锦,葛磊,李惠芳编著、书名现代海关英语、出版社⼴州:中⼭⼤学出版社、索书号H31/765、在图书馆中有效的馆藏地点北京路校区北京路校区书库及馆藏复本数5、可借复本数5。
3、分类号是“TP311.1”的是关于哪⽅⾯内容的图书程序设计?写出此类书其中⼀种图书的书名⾼级数据库系统及其应⽤、作者谢兴⽣、出版社北京:清华⼤学出版社和索书号。
TP311.13/12924、⾃⾏熟悉OPAC中“我的图书馆”各项功能,并写出今年所借阅的前两本书的书名材料⼒学习题详解:《材料⼒学·第四版》(刘鸿⽂主编)理论⼒学解题⽅法和技巧,如果可能请进⾏续借。
⼆、电⼦图书检索1.利⽤“读秀学术搜索”打开并阅读书名包含“竞争情报”,作者为“王知津”的图书,写出该书的书名竞争情报”、出版社科学技术⽂献出版社、出版⽇期2005.2,并从书中查阅竞争情报的概念:为达到竞争⽬标,合法⽽合乎职业伦理地搜集竞争对⼿和竞争环境的信息,并转变为情报的连续的系统化过程。
2.利⽤“读秀学术搜索”检索⼆本有关美国前总统的图书,写出图书的书名、著者、出版社。
⽩宫领袖美国已故37位总统从政⽣涯研究【作者】冯祥英著北京市:团结出版社美国总统全书【作者】(美)威廉·A. 德格雷⼽⾥奥(William A. DeGregorio)著;周凯等译北京市:社会科学⽂献出版社 , 20073.利⽤“读秀学术搜索”找出与⾃⼰专业相关的图书,写出其中2本图书的书名、作者和出版社。
信息检索大作业

『课题名称』米根霉发酵产富马酸的过程优化及代谢通量分析『研究背景及意义』富马酸(fumaric acid),又名反丁烯二酸、延胡索酸,是生物体的重要中间代谢产物,同时也是一种重要的有机基本化工原料和大宗化工产品,广泛应用于涂料、树脂、医药、增塑剂等领域,并可作为食品添加剂和饲料。
作为一种重要的四碳平台化合物,富马酸还可以通过酶催化转化、酯化、加氢等工艺生产天冬氨酸、苹果酸、琥珀酸、马来酸、1,4-丁二醇(BDO)、γ-丁内酯(GBL)和四氢呋喃(THF)等四碳化合物。
目前工业上主要采用顺酐异构法合成富马酸,该法以石油基产品顺酐为原料,在催化剂(硫脲-硫酸、盐酸及溴氧化剂等)的作用下发生异构化生产富马酸,它具有生产条件苛刻、催化剂毒性较大、环境污染严重等缺点;相对而言生物法合成富马酸具有操作条件温和、环境污染小、原料来源广泛、可持续发展性强等优点。
因此利用生物法替代化学法合成富马酸这一大宗化学品势在必行。
据报道米根霉产富马酸主要经反TCA途径,而丙酮酸是其一个关键节点,由丙酮酸出发,可以生成乳酸、乙醇、富马酸以及进入TCA途径,其他旁路途径通量的增加必将导致主途径富马酸途径通亮的减少。
但TCA途径与富马酸生成途径又存在对立统一关系,富马酸的生成需要A TP,TCA途径是A TP的主要贡献者,故对几条途径的有效调控有利于富马酸高效积累。
而普通的发酵调控只是从环境角度,不断变换因素,寻求最佳点。
本研究以传统发酵为依托,利用代谢通亮分析,比较环境因素变化前后的通量分布,寻找几条代谢途径的相关性,选择特定的抑制、促进剂,削弱副代谢途径,强化主代谢途径,最终实现富马酸的高通量积累。
同时结合关键节点的酶活分析,从理论上分析各环境因素对酶活性的影响,以及对富马酸生成的作用。
『文献检索及分析』1.中文文献查找中文数据库主要有中国期刊网、维普、万方等,由于在本人电脑上中国期刊网无法登陆,故选取维普、万方硕博士数据库作为案例进行检索。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课题大作业(2人一组,自拟与自己导师研究方向一致的课题,完成以下作业)1课题的分析思维导图及主要概念分析(要求:要有主概念面、相关概念、隐含概念、英文检索词)1.1写出拟进行检索的检索策略、涉及到的学科范围。
课题名称:数据挖掘技术及应用主要概念面:数据挖掘技术应用1.2总体检索思路你目前对这个课题了解的大致情况,以及你希望解决的问题。
由此你准备如何展开(国内、国外、年限、文献类型)。
涉及学科及分类号:计算机技术与自动化技术(TP3)1.3数据挖掘(Data Mining),也叫数据开采,数据采掘等,是按照既定的业务目标从海量数据中提取出潜在、有效并能被人理解的模式的高级处理过程。
在较浅的层次上,它利用现有数据库管理系统的查询、检索及报表功能,与多维分析、统计分析方法相结合,进行联机分析处理,从而得出可供决策参考的统计分析数据。
在深层次上,则从数据库中发现前所未有的、隐含的知识。
OLAF'的出现早于数据挖掘,它们都是从数据库中抽取有用信息的方法,就决策支持的需要而言两者是相辅相成的。
国内对DMKD的研究稍晚,1993年国家自然科学基金首次开始支持对该领域的研究项目。
近年来发展迅速,进行的大多数研究项目是由政府资助进行的,如国家自然科学基金、863计划、“九五”计划等。
所涉及的研究领域很多,一般集中于学习算法的研究、数据挖掘的实际应用以及有关数据挖掘理论方面的研究。
国内从事数据挖掘研究的机构主要在大学,也有部分在研究所或公司。
这些单位包括清华大学、中科院计算技术研究所、空军第三研究所、海军装备论证中心等。
2搜索引擎(百度、谷歌、scirus):选择百度作为搜引擎2.1检索策略:如下图所示2.2找到的结果(截图第一页)2.3你选定的最相关的结果(要求必须可直接看原文)2.4 说明选择该文的原因,从中你是否有新的想法(线索)选择本文的原因是既涉及到数据挖掘这方面相关知识的研究与应用其次是与要检索的应用领域,也就是数据挖掘在航天或者军事方面的领域相吻合,并且在时间上也相对比较近。
另外下载相关的在线阅读软件既可以进行阅读。
因此选用该文章。
3 图书搜索(读秀、Fulink)要求查找与你课题有关的信息,主要是相关的概念、或者涉及到的具体的研究方法、实验方法的介绍。
3.1 检索策略FULink平台检索策略:书名=数据挖掘分类=工业技术中图分类号=TP3年份=2000-20133.2具体的检索结果,即概念的解释、研究方法或实验方法具体的操作过程等(截图表示)。
要求:注明出处,以参考文献的格式检索结果:共90条结果读秀平台检索策略:书名=数据挖掘分类=工业技术中图分类号=TP3年份=2000-2013共90条结果具体的检索结果:对结果进行筛选,选取3本与课题相关的具体书:(1)《数据挖掘技术》朱玉全编著. 南京市:东南大学出版社, 2006(2)《数据挖掘技术以及应用》刘诗平编著. 北京市:高等教育出版社, 2010.(3)《数据挖掘原理与技术》张云涛编著北京市:电子工业出版社,20044论文检索(期刊论文、学位论文、会议论文)选用CNKI、维普、万方跨库查找4.1检索工具万方4.2检索策略(最终的)篇名=(数据挖掘+数据勘探+数据采矿+data mining+DM)* 应用*时间=2013年1月1日-2013年10月25日4.3检中的结果(第一页,包括检索结果的条数)条数:4.4选择最有代表性的论文15篇(要求3种文献类型都要),说明选择的理由。
学位论文:[1] 张岭.人工神经网络模型预测的分析与研究[D].南京信息工程大学,2010.DOI:10.7666/d.y1694886.[2] 戴南.基于决策树的分类方法研究[D].南京师范大学,2003.DOI:10.7666/d.y499922.[3] 李想.Boosting分类算法的应用与研究[D].兰州交通大学,2012.DOI:10.7666/d.y2142546.[4] 任宇飞.SVM模型改进的若干研究[D].南京邮电大学,2013.[5] 毛国君.数据挖掘技术与关联规则挖掘算法研究[D].北京工业大学,2003.[6] 刘君强.海量数据挖掘技术研究[D].浙江大学,2003.[7] 萨迪.基于B/S框架的数据挖掘系统的设计与实现[D].中南大学,2011.DOI:10.7666/d.y1914056.[8] 刘舒舒.面向医疗保险领域的数据挖掘平台研究与设计[D].江苏大学,2013.期刊论文:[1] 姜斌,潘景昌,王为等.SDSS-DR8中激变变星候选体的数据挖掘[J].光谱学与光谱分析,2013,33(2):464-467.DOI:10.3964/j.issn.1000-0593(2013)02-0464-04.[2] 张玉存,孔涛,付献斌等.基于双重逆极限空间的地貌信息数据挖掘方法[J].地球物理学[3] 赵艳君,魏明军.改进数据挖掘算法在入侵检测系统中的应用[J].计算机工程与应用,2013,(18):69-72,115.DOI:10.3778/j.issn.1002-8331.1304-0309.[4] 刘大有,陈慧灵,齐红等.时空数据挖掘研究进展[J].计算机研究与发展,2013,50(2):225-239.[5] 潘玫玫,蔡健,朱隆海等.基于数据挖掘的规则库防御性能改进研究[J].科技通报,2013,29(5):151-155,163. 会议论文:[1] 白羽,丁晓熔.基于数据挖掘的冗余套餐梳理模型[C].//辽宁省通信学会2013年通信网络与信息技术年会论文集.2013:25-30.[2] 别小妹.移动互联网流量经营分析模型研究与应用[C].//辽宁省通信学会2013年通信网络与信息技术年会论文集.2013:397-403.学位论文:[1] 张岭.人工神经网络模型预测的分析与研究[D].南京信息工程大学,2010.DOI:10.7666/d.y1694886.选择理由:人工神经网络是数据挖掘里模拟人的神经反射而提出的一种算法,此论文比较系统的介绍了人工神经网络的内容。
[2] 戴南.基于决策树的分类方法研究[D].南京师范大学,2003.DOI:10.7666/d.y499922.选择理由:决策树算法是数据挖掘的一种算法,具有较大的应用范围。
[3] 李想.Boosting分类算法的应用与研究[D].兰州交通大学,2012.DOI:10.7666/d.y2142546.选择理由:对AdaBoost 算法进行了比较详细的表述,有助于我们的理解。
[4] 任宇飞.SVM模型改进的若干研究[D].南京邮电大学,2013.选择理由:SVM是近几年来机器学习领域的一个热门,此论文深入研究了SVM算法的原理,有助于我们更好的理解sVM算法。
期刊文献:[1] 姜斌,潘景昌,王为等.SDSS-DR8中激变变星候选体的数据挖掘[J].光谱学与光谱分析,2013,33(2):464-467.DOI:10.3964/j.issn.1000-0593(2013)02-0464-04.借鉴价值。
[2] 张玉存,孔涛,付献斌等.基于双重逆极限空间的地貌信息数据挖掘方法[J].地球物理学报,2013,56(1):317-324.DOI:10.6038/cjg20130133.选择理由:实用的数据挖掘方法新颖,并且对于挖掘不完备数据信息有较好的效果。
[3] 赵艳君,魏明军.改进数据挖掘算法在入侵检测系统中的应用[J].计算机工程与应用,2013,(18):69-72,115.DOI:10.3778/j.issn.1002-8331.1304-0309.选择理由:安全问题永远是我们所关注的大问题,特别是在网络如此发达的时代,所以数据挖掘在这方面的应用很值得参考和研究。
[4] 刘大有,陈慧灵,齐红等.时空数据挖掘研究进展[J].计算机研究与发展,2013,50(2):225-239.选择理由:随着我国北斗系统的逐渐形成,时空数据处理任务日趋繁重,所以对于数据挖掘在时空数据中的应用具有十分重要的意义。
[5] 潘玫玫,蔡健,朱隆海等.基于数据挖掘的规则库防御性能改进研究[J].科技通报,2013,29(5):151-155,163.主学习能力的防御系统很有必要会议文献:[1] 白羽,丁晓熔.基于数据挖掘的冗余套餐梳理模型[C].//辽宁省通信学会2013年通信网络与信息技术年会论文集.2013:25-30.选择理由:时间性比较新,有很大的实用价值。
4.5描述你查找过程中检索策略调整的情况。
例如最初的检索策略如何,经过怎样的调整形成最终的检索策略,包括如何调整检索字段,如何调整检索词等一开始使用的检索策略为:主题=(数据挖掘+数据勘探+数据采矿+data mining+DM)* 应用,这样发现结果太多(有4万多条),而且很多都过时了。
于是就限定时间为2010年到2013年的,搜索结果还是很多(有1万多)。
然后就将时间限定为2013年的,条数就变为2000多条。
但是仔细一看,有很多不相关的结果出来,于是就将检索式改为:篇名=(数据挖掘+数据勘探+数据采矿+data mining+DM)* 应用,检索结果就只剩303条。
然后根据不同的机构选择15篇。
5专利、标准分别检索与课题相关的专利、标准信息5.1检索工具中国专利数据库(万方)5.2检索策略专利:主题:(计算机应用) * 数据挖掘* Date:2000-2013标准:主题:(计算机应用) * 数据挖掘* Date:2000-20135.3检中的结果,检索结果页面截图专利:标准:5.4专利全文、标准全文首页截图专利:标准:6外文文献(利用EI检索与课题有关的信息)6.1写出检索策略(((data mining or DM or KDD) WN All fields) AND ((application) WN All fields))6.2检索结果页面截图,说明查找的过程过程:先找出所有的数据挖掘英文表达式,然后把时间限定为2013年到2014年6.3选择最有代表性的10篇论文,记下文献线索[1] Qin Y B, Lu D X. The Application of KDD in HIS[J]. Applied Mechanics and Materials, 2013, 263:1510-1514.[2]Holzinger A, Pasi G. and Knowledge Discovery in Complex, Unstructured, Big Data[J].[3]Huang L N, Liu G X. Application of Web Data Mining in On-line Education[J]. Advanced MaterialsResearch, 2013, 684: 526-530.[4]Nenonen N. Analysing factors related to slipping, stumbling, and falling accidents at work:Application of data mining methods to Finnish occupational accidents and diseases statisticsdatabase[J]. Applied ergonomics, 2012.[5]Wright J H, Sanati-Mehrizy A. A Study of Application of Data Mining Algorithms In HealthcareIndustry[J].[6]Akhilomen J. Data mining application for cyber credit-card fraud detection system[M]//Advancesin Data Mining. Applications and Theoretical Aspects. Springer Berlin Heidelberg, 2013: 218-228.[7]Chen H, Chen G. Visual Space Research and Application of the Data Mining in Soil FertilityEvaluation[M]//Computer and Computing Technologies in Agriculture VI. Springer Berlin Heidelberg, 2013: 376-385.[8]Li H, Luo Y. The application of data mining technology in the quality and security of agriculturalproducts[C]//Third International Conference on Photonics and Image in Agriculture Engineering (PIAGENG 2013). International Society for Optics and Photonics, 2013: 87620Q-87620Q-5.[9]Yan H. The Data Mining Technology in the Application of Graduates’ Employment[M]//IntelligenceComputation and Evolutionary Computation. Springer Berlin Heidelberg, 2013: 147-151.[10]Fan Y. The Application of Data Mining Algorithm in Grain Output Prediction[C]//Proceedings ofthe 2012 International Conference on Cybernetics and Informatics. Springer New York, 2013: 757-764.6.4选择其中一篇可直接下载全文的列出篇名,并拷贝全文的第一页篇名:The Application of Data Mining Algorithm in Grain Output PredictionWith the rapid development of computer technology and its wide application in theproduction process, the capacities of formation, collection, storage and processingdata of the enterprise have greatly increase and the amount of data grows with eachpassingday.Asweallknow,dataiswealth,butthisvalueisimplied.Inordertolocatethe truly valuable thing—knowledge from mountains of data, from 1990s, peoplebeganthestudyofdatamining[1].Itisworthnothingthatfordifferentapplications,itshould design specific data mining solutions, in order to achieve the efficiency ofknowledge acquisition. According to characteristics for agricultural production, theY. Fan (*)Department of Computer Science and Engineering, Guangdong Peizheng College, 53# PeizhengAvenue, Chini Town, Huadu District, Guangzhou City, Guangdong Province 510830, Chinae-mail: fanyu1233211@S. Zhong (ed.), Proceedings of the 2012 International Conference on Cyberneticsand Informatics, Lecture Notes in Electrical Engineering 163,DOI 10.1007/978-1-4614-3872-4_97, # Springer Science+Business Media New York 2013757useofdataminingtechnologycanaccessqualitativeandquantitativeknowledgefromthe field to help agricultural workers improve the planting structure. Data mining donothaveauniformdefinitioncurrentlyintheworld[2].Oneofthemorerepresentativeviews regards that data miningisthe process ofextractingordigging out a model thatis credible, innovative, effective, and has potential value and can be understood fromlarge amounts of data. This process is non-normal process [3]. From view of technol-ogy, it is the process of extracting information and knowledge which is implicit,unknown, but is potentially useful from a large number of incomplete, noisy, fuzzy,random data [4].Genetic algorithm, basing on natural population evolution mechanism, is anefficient exploration algorithm which abandons the traditional searching method,simulates the natural biological evolution and takes artificial evolution approach torandomly search in the target space. It takes the possible solution in the problemdomain as an individual of chromosomes, encodes each individual into the form ofsymbol string and simulates Darwinian biological evolution process of geneticselection and of natural elimination to repeatedly take operations (genetic, crossoverand mutation) basing on genetic on the group. It evaluates each individual accordingtoapredefinedfitnessfunctionandcontinuouslygetsbettergroupsbasedonevolutionrules of survival of the fittest, selection of the superior and elimination of the inferiorand at the same time searches the best individual in the optimized group by parallelsearchingmethodtoseektheoptimalsolutionthatcanmeettherequirements.Geneticalgorithmisaclassofrandomizedalgorithm,butitisnotasimplerandomwalk.Itcaneffectively make use of the already gotten information to search for those stringswhich enable to improve the quality of the solutions. Similar to natural evolution,geneticalgorithmactsonthechromosomegenestosolvetheproblembyfindinggoodchromosomes. And similar to the nature, genetic algorithm knows nothing aboutsolving the problem itself. It only needs evaluate each chromosome generated by thealgorithm, and create chromosome basing on fitness value, so chromosomes withgood applicability have more chance to reproduce than those with poor adaptability.This paper chooses to combine genetic algorithm with LM algorithm to build theprediction model. After analysis of the statistical data of each attribute value relatedwith crop output, observe emphatically the attribute which is closely related to theoutput. For example, under the same conditions of irrigation and fertilization, themain factors that affect the crop output are temperature and precipitation. Use datamining method to carry out mining of the temperature and precipitation propertiesandgetthepotentialrelationshipbetweenthetwofactorsandcropoutputtofacilitatedecisionmakinginagriculture,sotheycanpredictthefutureannualcropproduction.6.5选择其中一篇只有摘要的,利用OPAC查找,说明该文福州大学图书馆有没有收藏,如果有收藏请截图(包括索书号、馆藏地点等信息在内)。