201410搜索引擎模块作业

201410搜索引擎模块作业
201410搜索引擎模块作业

山西农大网络信息检索与利用

搜索引擎模块201410冬作业

1、关注“大数据文摘”公众微信帐号,搜索其中有关谷歌大数据和大数据搜索方面的文摘各2篇。给出篇名和文摘发表在微信上的日期。

2、利用(https://www.360docs.net/doc/da14364072.html,)搜索引擎查找与你所学专业相关的专业网站3个;查找近一年来山西农大网站有关研究生招生的信息,给出URL。

3利用baidu“图片搜索”功能查找一幅有关山西农大图书馆正面图片(要求:1024*683像素,并记录图片所在的URL)

4 利用360搜索引擎(https://www.360docs.net/doc/da14364072.html,)查找“工业三废”是指什么?检索有关“工业三废的污染治理”主题方面的PDF/DOC/PPT格式文件个1篇,写出检索式,并提供文章所在的URL。

5 利用搜狗搜索引擎查找“天空软件站”网站内有关格式转换(音/视频、图片、文档)的软件,写出检索式、软件名称及下载地址。

6.360和百度的网站导航收集了多少个招聘网站和考试网站?分别写出其中2个网站名称及其所在页面的URL。

7 利用索引擎查找有关简历制作的网站,下载一套适合本专业的简历模板及封面。

8 如要寻找专业方面的参考文献,选择哪个合适搜索引擎来确定相关的学术类文章?请搜索包含关键字“计算机软件测试的方法”的网页,并设定搜索的网页中要包含“测试前准备工作”的完整关键词

9 现在有一家企业需要为自己一款新白酒产品写一份该产品的可行性报告,需要了解知道中国白酒行业的供需状况如何、发展现状和趋势如何、国家政策如何、竞争企业状况如何、重点市场在哪里?各种白酒产品如何?消费群构成如何?消费者需求如何等。请问你如何帮助这家企业来完成这些数据信息的检索任务?

10 对于我们大学理工科学生来说,大量阅读相关专业文献是必不可少的,比如英文文献,当我们在阅读英文文献或者英文网页时,如何利用搜索引擎功能帮助我们,将英文转化成中文,进而提高阅读效率呐?

11.利用360学术搜索(https://www.360docs.net/doc/da14364072.html,)查找近5年来有关N-二甲基亚硝胺对肝纤维化影响方面的文章。用参考文献的格式列出其中2篇文章。

12 利用无线移动搜索,用搜索引擎查找HTTP的含义

13分别利用peterson(https://www.360docs.net/doc/da14364072.html,)college NET(https://www.360docs.net/doc/da14364072.html,),查找“美国南加州大学(USC)”的英文名称、地址、电话以及研究生专业设置、入学要求等信息。

14查找汉语“信息”和英文BREAKFAST 二词的最早出处?

15利用百度(google)学术搜索频道查找你所在院系老师历年来发表论文的情况。列出其中一名老师发表论文目录。

16、利用百度文库上传一篇自己的文档

事实数据检索板块思考题

要求:利用网络事实和数据库等资源检索回答下列问题:(按步骤写出主题分析,所用数据库,关键词,表达式以及简要答案)

1. 哪些金属属贵金属,重贵金属和轻贵金属是怎样区分的?

2. 请查出五种农用除草剂的名称和化学结构式。

3. 请查2013年世界处于前十位的银行。

4. 羽毛球的英文名称从何而来?

5. 请查英谚“one swallow does not a summer make”的出处和含义。

6. 化学元素中的钫、镅的英文名称是以何地命名的。

7. 香港科技大学(Hong Kong University of Science & Technology)建于哪年,现任校长是谁?

8. 海洛因的密度是多少?

9. 2013年科学家们在人类基因组研究方面取得哪些进展?

10. 我国2010---2013年国民生产总值各是多少?

11. 请查找并对比中国和美国近十年的科研经费投入。

12. “Encyclopedia”、“gazetteer”两词的来源。

13. 从中国大百科网中查找一幅已故总理周恩来的照片。

14. 诺贝尔奖金的几个奖项是同时设立的吗?

15. 海明威的小说“For Whom the Bell Tolls”取名自什么作品,作者是谁?

16. 请简单介绍一下WOK(SCI)数据库的情况。

17. 用维基百科检索H7N9甲型禽流感的最新信息?

18. 查找公元1669年在我国哪一朝代?记录朝代名称、统治者、庙号及其建都的地址。

19 如何使用国研网、万方数据系统等网站获取某个行业产品的详细数据?

全文数据库检索实习题

1.检索2010-2013年间由中国计算机学会举办,有关计算机的会议文献。

2.利用万方数据库,查找气象集合预报应用网格的科技成果。

3.查找计算机网络的轨道电路的专利文献。

4.检索广东地区生产电梯的中外合资企业信息,要求企业职工人数在500-2000人。

5.检索浙江大学,有关环境污染方面的学术期刊、学位论文和会议文献。

6万方数据资源系统收录了哪些类型的文献?万方数据资源系统提供了哪些个性化服务?

7.查找1997年发布的有关化妆品色素的标准文献

8中国知识资源总库收录了哪些类型的文献?中国知识资源总库的知识网络系统提供了哪些重要的链接?

9.查找2009-2013年,发表在期刊《中国兽医杂志》上,禽流感疫苗研制的相关期刊论文

10.查找2007年到2012年,山西农业大学授予的,农学专业的学位论文全文。

11.检索江苏浙江上海地区生产碳酸饮料的企业信息。

12.利用中国学术期刊全文数据库,检索2007年至今,属于国家自然科

学基金资助项目成果的有关汽车尾气的文献。

13 利用维普数据库高级检索功能检索“海带凉粉的制作工艺”的全文,浙江海洋学院食品与药学学院范利洪撰写,发表在《粮油食品科技》期刊上,文献分类号是TS217.2。

14 利用《中国引文数据库》,检索山西农业大学王俊东老师发表的论文,以及被引用的情况,H指数;通过“中国引文数据库”试一试查你专业老师发表论文被引用情况和H指数。

15利用《维普数据库》,检索吴志红撰写,发表在深圳土木与建筑期刊上,有关聚氨酯防水涂料的相关文献。写出检索式,并进行检索。

16 某同学在检索“汶川防震减灾的研究”相关文献时,结果为零。现需要调整策略,扩大检索范围。请给出调整后的检索策略

常见问题解答及上机操作题

1.作业讲解。 2.常见问题解答如下: ?问题1:以太网使用载波监听多点接入碰撞检测协议CSMA/CD。频分复用FDM才使用载波。以太网有没有使用频分复用? 答:这里的“载波”并非指频分复用FDM的载波。CSMA/CD协议的发明者故意使用了大家早已熟悉的旧名词Carrier(载波),来表示连接在以太网上的工作站检测到了其他工作站发送到以太网上的电信号。 ?问题2:使用5类线的10BASE-T以太网的最大传输距离是100 m。但听到有人说,他使用10BASE-T以太网传送数据的距离达到180 m。这可能吗? 答:可能。这是因为有许多因素决定以太网的最大传输距离。当一些具体条件(如导线的电阻、实际的信噪比等)发生变化时,以太网的最大传输距离就会起变化。 ?问题3:一个大学能否就使用一个很大的局域网而不使用许多相互连接的较小的局域网? 答:一般不会使用一个很大的局域网。这是因为使用一个很大的局域网有许多问题: (1)可能一个局域网无法覆盖整个大学的地理范围; (2)一个大学需要联网的计算机数量可能超过一个局域网所容许接入的计算 机的最大数量; (3)很大的局域网不便于管理。 (4)过大的局域网常常会产生“广播风暴”,影响局域网的正常工作。 因此,一个大学的校园网通常并不是一个单个的大局域网而是一个互连网,这个互连网由许多较小的局域网通过一些路由器互连而成的。 ?问题4:为什么IP地址又称为“虚拟地址”? 答:这是因为IP地址是靠软件来维持的而不是硬件地址。我们好像构成了一个很大的互连网络,但这个网络是虚拟的网络系统,因为它的通信系统是抽象的。虽然许多硬件和软件的组合看起来好像构成了一个很大的网络,但这样的大网络实际上并不存在。 这种虚拟网络的地址也是虚拟的,因此IP地址又称为“虚拟地址”。 ?问题5:如下图所示。五个网络用四个路由器(每一个路由器有两个端口)互连起来。能否改变这种连接方法,使用一个具有五个端口的路由器将这五个网络互连起来? 答:一般说来是不采用这样的连接方法。

SEO网站优化测试题及答案

SEO网站优化测试题及答案 一、选择题45题 1. 如果你的网站是关于手机的,下面哪个是最好的网页标题?() A. 手机,买手机,手机报价,手机新闻,手机游戏,手机软件 B. 本站提供各种价格的便宜手机供你选择 C. 手机 | 手机之家 D. 主页 | 2. 一个纯内容的页面(如文章,博客等)应该有多少字?() A . 100 - 200 B . 500 - 800 C . 200 - 400 D . 800+ 3. 最优关键字密度?() A . 2 %- 5 % B .页面内容保持正常,但是利用隐藏文字, alt 标签, meta 标签尽量多加关键字 C .尽可能保持文章对用户的友好性 D .不管关键字密度,搜索引擎不关心这个,只集中于内容,做到人们都爱链接你的页面 4. 你应该在 meta 标签里放什么?() A. 在 meta 标签的 keywords 中放满关键字列表,把重要的关键字放在 meta 标签的description 中 B. 忽略 meta 标签,搜索引擎不用这些 C. 在 meta 标签的 description 中写上你网站的简短描述,在 meta 标签的 keywords 放上最重要的关键字 D. 在 meta 标签的 keywords 放上最重要的关键字,忽略 meta 标签的 description 5. 你怎么利用网站上的图片?() A. 利用 alt 标签精确描述每张图片,包括图片周围的描述性内容 B. 在 alt 标签中写上最重要的关键字,后面加上“图片” C. 只在必要的时候使用,不用每张都加,因为这根本不重要 D. 利用 alt 标签加入关键字列表以增加关键字密度 6. 内容很少网站获得高排名的最好方法?() A. 拥有大量各种各样网站的自然(内容相关)反向链接 B. 网站页面填满关键字和隐藏文字 C. 使用内容生成软件来做搜索引擎作弊来获得搜索引擎排名 D. 付费来获得高 PR 值 7.下面哪种做法不会受到 Google 的惩罚?() A. 针对搜索引擎自动生成数千个页面 B. 稳步创建高质量链接 C. 采集其它网站的内容 D. 有 google 认为是坏链的网站的反向链接 8.设计网站的结构时,下面哪个方法不好?() A. 创建网站地图指向网站的每个页面 B. 网站的每个页面都可以通过最多 3 次点击访问 C. 把网站的所有内部页面链接到你的其它网站 D. 创建网站的结构性 9、搜索引擎营销的简称是( ) A、SEO B、SEM C、SEC D、SERP 10、友情链接方面,PR的选择应该优先选择的链接为( ) A、PR高,相关性低 B、PR低,相关性高 C、PR高,相关性低 D、RP高,相关性高 11、下面哪个HTTP状态码是搜索引擎返回的抓取正常的状态码( ) A、500 B、301 C、200 D、404 12、下列URL对SEO最友好的是( ) A、seo/ B、seo/ C、 D、?id=21 13、不支持的代码为( ) A、Allow B、Disallow C、Crawl-delay D、noindex 14、以下哪一种提高PR值的行为被Google 认为是作弊行为( ) A、与很多相关站点友情链接 B、加入很多网站目录站、导航站 C、向PR值高的站点购买链接 D、发布供求信息,带有反向链接 ) ?( 不是网站外部链接添加方式_____、以下15. A. 论坛发帖 B. 自身网站文章链接 C. 黄页发布 D. 博客发帖

上机操作练习试题(2015)

上机操作练习试题:一:Windows 7操作系统 1. 在F:盘建立如图所示的文件夹。 在F:盘建立“我的资料”文件夹。 在“我的资料”文件夹下分别建立“图片资料”、“下载软件”、“Word文档”文件夹。 2. 使用“搜索”功能,查找计算机中的“*.jpg”文件,并将查找到的三个“*.jpg”文件拷贝到“F:\我的资料\图片资料”文件夹中(例如,将sha.jpg、图1.jpg、图2.jpg文件拷贝到“F:\我的资料\图片资料”文件夹中)。 3. 将“F:\我的资料\图片资料\sha.jpg”文件重命名为“沙滩.jpg”。 4. 删除“F:\我的资料\图片资料\图1.jpg”文件. 5. 将“F:\我的资料”文件夹设置只读属性。 6. 关闭来宾账户。 7. 设置屏幕分辨率为1920×1080。 8. 设置屏幕保护程序为“气泡”、等待5分钟。 样张:

1. 创建“练习题.docx”文档,并录入以下文本内容。 微电网是一种由负荷和微电源共同组成的系统。它可同时提供电能和热量。微电网内部的电源主要由电力电子器件负责能量的转换,并提供必要的控制。微电网相对于大电网表现为单一的受控单元,并可同时满足用户对电能质量和供电安全方面的需求。当微电网与主网因为故障突然解列时,微电网还能够维持对自身内部的电能供应,直到故障排除。 欧美日三地都在进行微电网的技术研究,其中日本立足于国内能源日益紧缺、负荷日益增长的现实背景,展开了微电网研究,但其发展目标主要定位于能源供给多样化、减少污染、满足用户的个性电力需求。日本学者还提出了灵活可靠性和智能能量供给系统(FRIENDS),其主要思想是在配电网中加入一些灵活交流输电系统装置,利用控制器快速、灵活的控制性能,实现对配电网能源结构的优化,并满足用户的多种电能质量需求。 机构研究显示,微电网市场有望在未来5年迎来高速成长期。从全球来看,微电网主要处于实验和示范阶段,微电网的技术推广已经度过幼稚期,市场规模稳步成长。着眼于当下世界范围的能源和环境困局以及电力安全需求的长期高企,微电网技术应用前景看好。未来5到10年,微电网的市场规模、地区分布和应用场所分布都将会发生显著变化。 2. 按以下要求完成对文档的设置。 ⑴设置页面格式:A4纸、横向;上、下页边距为2厘米,左、右页边距为2.5厘米;页眉距边界1.8厘米、页脚距边界1.5厘米。 ⑵将正文中的中文字体设置为楷体_GB2312、西文字体设置为Arial、常规、四号、水绿色-强调文字颜色5-深色50%;两端对齐、每段首行缩进2字符、行间距(固定值)为28磅。 ⑶增加标题:插入艺术字“微电网及其发展前景”(采用艺术字样式17、隶书、36磅)、设置艺术字的版式为上下型环绕、艺术字高度为2厘米(锁定纵横比),将艺术字拖动到文档左上角的位置(水平位置为0、垂直位置为0),如样张所示。 ⑷将第二自然段等分为偏左的两栏、左栏宽度为20字符,栏间距为6字符、两栏之间设置分隔线。 ⑸插入剪贴画“Earth”(j0285360.wmf),设置图片版式为四周型;图片宽度为3.6厘米,锁定纵横比,并将图片拖动到样张所示位置。 ⑹为第三自然段设置首字下沉(字体为隶书、首字下沉2行、距正文0.5厘米、首字颜色设置为橙色-强调文字颜色6、阴影效果)。 ⑺设置页眉为“微电网技术”(页眉样式为条纹型;字符格式黑体、小五号;居中对齐;页脚样式为纯文本-颚化符;字符格式为Arial、小五号;文本右对齐)。

百度搜索引擎练习

实习作业题1:百度搜索引擎练习 (1)用逻辑“与”查出“计算机网络技术”有关的网页。(要求:记录检索式和命中结果的数量,并体会“百度快照”、“相关搜索”的作用。) 记录检索式:计算机* 网络技术+ 或& 命中结果的数量:约8,450,000篇 (2)用逻辑“或”查出:“汶川地震”或“四川地震”的有关网页。(要求:记录命中网页数量和前两篇网页的标题)“|” 网页数量:约13,700,000篇 前两篇网页的标题:1.四川汶川强烈地震_新闻中心_新浪网 2.四川汶川地震

(3)用逻辑“非”查出:中国电信(不含“上海公司”)有关的网页。(要求:记录命中网页数量和前两篇网页的标题) 逻辑非“-”号 命中网页数量:约22,000,000篇 前两篇网页的标题:1.中国电信集团公司CHINA TELECOM 2.行业分类-中国电信黄页 (4)利用“图片搜索”功能查找一幅有关象鼻山的风景图片(要求:800*700像素,并记录图片所在的URL) (图片在附件中,名为:象鼻山像素800乘600) 实习作业题2:Google搜索引擎练习

(1)利用“手气不错”(提供可能最符合要求的网站)功能,查出查出“清华大学”主页的网址是什么? (选做:*查出2002年4月,由清华大学7位学生开发研制的哪一个软件,一举打破了PennySort世界排序纪录,获得该年度冠军?) “清华大学”的网址: 选做题:2002年4月7日,由清华7位学生开发研制的THSORT 排序软件,一举打破PeenySort世界排序纪录,获得该年度冠军 (2)利用“图片”检索功能查出Google收集了多少张蒙娜丽莎的图像?下载一张个人照片。 蒙娜丽莎的图像约有:80,300项(图片在附件中,名为:蒙娜丽莎) (3)利用“大学搜索”功能查出Google收集了多少个北京地区的大学? 北京地区的大学有:82所

搜索引擎优化答案

一、单项选择题(2分×15=30分) 1.搜索引擎搜索结果页面,简称什么? SERP SEM PPC 2.Inbound Links 指的是以下哪一种? 内部链接 反向链接 导出链接 3.以下哪一种说法是错误的? 搜索引擎对静态页面更友好。 搜索引擎更喜欢原创内容。 搜索引擎对新站排名更好。 4.一个SEO 良好的网站,其主要流量往往来自:首页 内容页面 目录页面 5.新站登录搜索引擎最佳的时间是: 刚注册域名,即提交给搜索引擎。 先做一个静态的首页,提交给搜索引擎。 把网站架构基本完善后,提交给搜索引擎。 6.关键词密度多少最佳?

1%-5% 5%-10% 10%-20% 7.目标关键词放在哪里效果最佳? 关键词标签 标题标签 描述标签 8.在关键词分析时,以下哪一个思路是错误的: 选择热门关键词,一旦成功就会有非常高的流量。 罗列关键词,并合理分布到网站的目录页和内容页。 如果竞争对手是大型网站首页,则需要谨慎考虑。 9.提供关键词排名,以下哪一种办法是不可取的: 在ALT 标签中写关键词。 导出链接锚文本中包含关键词。 重复关键词以增加关键词密度。 10.以下哪一种导入链接对PR 值影响最大? PR 值很高,但无相关性的站点。 相关性很强,但PR 值一般的站点。 大量PR 值一般,无相关性的站点。 11.以下哪一种提高PR 值的行为被Google 当作作弊?与很多相关站点友情链接。 加入很多网站目录站、导航站。 向PR 值高的站点购买链接。 12.以下哪一种行为不是作弊?

采用群发软件群发包含网站链接的内容。 使用隐藏文本或隐藏链接。 在百度知道、Google论坛等发表文章,并留有链接。 13.针对SEO 服务,以下论述错误的是: 专业SEO 服务对整站进行优化,整体提高网站排名和搜索流量。 SEO 服务保证关键词长期排名。 采用购买竞价和SEO 服务相结合的方式,效果最佳。 14.搜索引擎程序对关键词的排名是什么时候进行? 用户输入关键词,点击搜索之后。 对于热门关键词,搜索引擎隔一段时间对排名进行更新和保存。 搜索引擎索引网页时,即对其进行排名。 15.目前看来,搜索引擎无法实现: 对一个站点是采集站或原创站,进行判断。 判断站点内容对于某关键词的专业性。 判断被大量转载的文章的原创站点。 二、一句话简答题(5分×4=20分) 1.从SEO 的角度,网页设计采用div+css 的主要好处是什么? 2.首页采用flash 的方式,为什么不利于SEO? 3.竞价排名与SEO 的投入收益对比分析。 4.如果每个站都做SEO了,那时怎么办? 答案 单向选择题 1、搜索引擎搜索结果页面,简称SERP,全称Search Engine Results Page 选择1

大工19春《SEO搜索引擎优化》在线作业3

(单选题)1: 新站登录搜索引擎最佳的时间是()。 A: 刚注册域名,即提交给搜索引擎。 B: 先做一个静态的首页,提交给搜索引擎。 C: 把网站架构基本完善后,提交给搜索引擎。 D: 有网站原型后,提交给搜索引擎。 正确答案: (单选题)2: 哪一种导入链接对PR值的影响最大()。 A: PR值很高,但是无相关性的站点 B: 相关性很强,PR值一般的站点 C: 大量PR值一般,无相关性的站点 D: PR值低的站点 正确答案: (单选题)3: 以下哪一种行为不是作弊?()。 A: 采用群发软件群发包含网站链接的内容。 B: 使用隐藏文本或隐藏链接。 C: 在百度知道、Google论坛等发表文章,并留有链接。 D: 关键词过度优化。 正确答案: (单选题)4: 下面哪个HTTP状态码是搜索引擎返回的抓取正常的状态码()。A: 500 B: 301 C: 200 D: 404 正确答案: (单选题)5: 下列URL对SEO最友好的是()。 A: seo/index.html B: seo/ C: seo.aspx D: seo.php?id=21 正确答案: (单选题)6: 以下哪一种提高PR值的行为被Google认为是作弊行为()。A: 与很多相关站点友情链接 B: 加入很多网站目录站、导航站 C: 向PR值高的站点购买链接 D: 发布供求信息,带有反向链接 正确答案: (单选题)7: robot.txt不支持的代码为()。 A: Allow

B: Disallow C: rawl-delay D: noindex 正确答案: (单选题)8: 下列那些内容可能导致搜索引擎无法收录网页()。 A: 改变网页所有现有的关键字 B: 将另一个网页内容类似的网页添加到您的网站上 C: 建立一个内容类似的网页 D: 改变robots.txt文件 正确答案: (单选题)9: 友情链接方面,PR的选择应该优先选择的链接为()。 A: PR高,相关度低; B: PR低,相关高; C: PR高,相关低; D: RP高,相关高 正确答案: (单选题)10: 目前已经声明丢弃keywords的搜索引擎是()。 A: 百度 B: 谷歌 C: 搜搜 D: 搜狗 正确答案: (多选题)11: 发外链需要注意三大原则:质量、数量、稳定,其中质量主要指()。A: 高质量文案 B: 高质量平台 C: 高质量互动 D: 高质量分析 正确答案: (多选题)12: 以下对应命令正确的是()。 A: site:查网站收录情况 B: domain:查百度反向链接 C: link:查谷歌反向链接 D: 搜索框直接输入网站就能查收录以及反向链接 正确答案: (多选题)13: 进行数据分析的意义是什么()。 A: 可以查看推广的效果 B: 根据效果,改进工作的方法 C: 根据效果,改版网站

201206网络上机题

常用的搜索引擎类型有 A、目录式搜索引擎、自动搜索引擎和手工搜索引擎 B、目录式搜索引擎、元搜索引擎和全文搜索引擎 C、随机搜索引擎、元搜索引擎和自动搜索引擎 D、目录式搜索引擎、元搜索引擎和随机搜索引擎 WWW(World Wide Web)表示的中文含义是 A、局域网 B、万维网 C、广域网 D、城域网 常见的网络拓扑结构有 A、总线型结构、星型结构和层次型结构 B、层次型结构、星型结构和分散型结构 C、总线型结构、分散型结构和直线型结构 D、总线型结构、星型结构和环型结构 某台计算机的IP地址为“111.168.3.192”,子网掩码为“255.255.255.0”,则该计算机的主机地址是 A、192 B、168 C、3 D、111 下列属于网络连接设备的是 A、双绞线 B、光缆 C、集线器 D、防火墙 在“https://www.360docs.net/doc/da14364072.html,/index.html”中,“index.html”属于 A、域名 B、协议 C、网络号 D、主页名 客户机/服务器模式指的是 A、B/S B、C/S C、B/B D、C/C 下列都属于实时信息交流方式的是 A、IP电话、MSN聊天 B、电子邮件、博客 C、MSN聊天、电子邮件 D、IP电话、BBS论坛 因特网采用的数据交换技术是 A、逻辑交换技术 B、电路交换技术 C、分组交换技术

D、报文交换技术 超文本传输协议的英文缩写是 A、HTML B、HTTP C、OSI D、FTP 数据交换技术不包括 A、报文交换技术 B、分组交换技术 C、电路交换技术 D、逻辑交换技术 下列都不属于实时信息交流方式的是 A、IP电话、博客 B、电子邮件、MSN聊天 C、MSN聊天、IP电话 D、电子邮件、BBS论坛 使用FoxMail软件收发电子邮件的模式属于 A、B/S B、S/C C、S/B D、C/S 在“https://www.360docs.net/doc/da14364072.html,”中,“gov”表示该网站的性质是 A、网络服务机构 B、商业机构 C、教育机构 D、政府机构 下列都属于网络传输介质的是 A、双绞线、集线器 B、双绞线、光缆 C、路由器、同轴电缆 D、光缆、交换机 某台计算机的IP地址为192.10.1.168,子网掩码为“255.255.255.0”,则该计算机的网络地址是 A、192.10.1.168 B、192.10.0.0 C、192.10.1.0 D、192.0.0.0 常见的网络拓扑结构有:环型结构、星型结构和 A、层次型结构 B、总线型结构 C、交叉型结构 D、集中型结构 按照计算机网络规模从小到大排列依次是 A、局域网、城域网、广域网 B、局域网、广域网、城域网

计算机上机操作试题

汇川区教师计算机上机操作试题 (A卷100分钟) 一、Windows基础 在D盘中找到“kaoshi”文件夹,在其中创建一个新文件夹,用自己的中文名为文件夹名命,并在该文件夹中创建一个名为“下载资源”的文件夹。 二、浏览器的运用 (一)资源下载 运用搜索引擎找到一段关于大熊猫的文字(不超过200字)和至少三张大熊猫的图片,将其分别下载后保存到自己创建的“下载资源”文件夹中。 (二)发送电子邮件 用自己的电子邮箱(或QQ邮箱)发送一封关于此次考试内容的邮件到指定邮箱中(邮箱地址由监考人员提供)。邮件中落款必须为参考人真实姓名。 三、Office办公软件的运用 (一)Word: 1、打开Word建立一个新文档,在其中输入以下内容: 教育应该做什么 教育应该做什么?教育要以学生为本,着眼于调动和依靠学生内在的积极性,用我们教育工作者自己燃烧着的火把去点燃广大学生心底的火种,焕发成长的光辉。 2、用艺术字设置标题文字,样式、大小、颜色以美观为宜。 3、将文字内容设置为四号,仿宋体,蓝色,首行缩进2字符,行距为固定值23磅。 4、在文稿下插入一个表格,列宽调整至与下表大致相同。将标题文字、正文内容复制到相应表格中,并根据文稿内容部分填写其他相关内容。 5、完成后保存到D盘“kaoshi”文件夹中自己的文件夹中。

(二)Excel 1、按下表格式创建表格,表格各行高为20,列宽为10。 2、按下表内容制表,用公式统计各同学总成绩并降序排序,然后统计各科的平均成绩; 3、将标题行合并居中,字体设置为黑体16号加粗;内容字体为宋体、10号; 4、按下表样式设置边框,将总成绩列和平均成绩行的底色设置为浅蓝色。 成绩统计表 4、完成后将该文件命名为“成绩统计表”并保存到D盘“kaoshi”文件夹中自己的文件夹中。 (三)PowerPoint 1、打开PowerPoint,在第一张幻灯片中添加标题为“教学课件”,背景设置为红色,标题字体为隶书,字号96号,加粗,斜体,阴影;副标题添加为所在学校名和自己的姓名。 2、添加第二张新幻灯片,在幻灯片设计里选择任意一款设置为背景,在其中插入一个文本框,将“下载资源”文件夹中下载的文字复制后粘贴到文本框中,并调整字号、颜色,以美观为宜。 3、添加第三张新幻灯片,自行设置背景。将下载的大熊猫的图片插入,自行调整图片大小至美观。 4、将三张图片分别用自定义动画功能设置为: a.第一张:飞入——自左侧、中速; b.第二张:强调——放大/缩小; c.第三张:退出——到右侧、缓慢移出。 5、完成后保存到D盘“kaoshi”文件夹中自己的文件夹中。

作业题-搜索引擎练习.

作业题1:百度搜索引擎练习 (1用逻辑“与”查出“计算机网络技术”有关的网页。(要求:记录检索式和命中结果的数量,并体会“百度快照”、“相关搜索”的作用。 (2用逻辑“或”查出:“汶川地震”或“四川地震”的有关网页。(要求:记录命中网页数量和前两篇网页的标题 (3用逻辑“非”查出:中国电信(不含“上海公司”有关的网页。(要求:记录命中网页数量和前两篇网页的标题 (4利用“图片搜索”功能查找一幅有关黄山的风景图片(要求:1024*768像素,并记录图片所在的URL 作业题2:Google搜索引擎练习 (1利用“手气不错”(提供可能最符合要求的网站功能,查出查出“清华大学”主页的网址是什么? (选做:*查出2002年4月,由清华大学7位学生开发研制的哪一个软件,一举打破了PennySort世界排序纪录,获得该年度冠军? (2利用“图片”检索功能查出Google收集了多少张的图像?下载一张个人照片。 (3利用“大学搜索”功能查出Google收集了多少个北京地区的大学? (4利用“网站搜索”查出Google收集了多少个招聘网站和交友网站?写出网站名称及其所在页面的URL。 作业题3:请利用网络上的搜索引擎,找出下列问题的答案: (1请查出计算机网络技术专业常用的网址。

(2张老师明天要去济南开会,请你帮他查出从临沂到济南的火车票是多少钱?需要带什么衣服? (3现在是个出游好时节,周末小张收到一条短信:“我是小王,在某市当导游,周末 过来耍吧,我包吃住哦。”看到号码是:131********发来的信息,小张欣喜若狂,好时节,好天气,好心情去游玩多美!突然他犯难了,他的朋友在哪个城市呢?请你帮他查出这 个手机号码所在的城市? (4请问“非鬼亦非仙,一曲桃花水”的上一句是什么?它的最初出处?作者是谁? (5天山雪莲相传具有起死回生之功效,早在清代,赵学敏著的《本草纲目拾遗》 一书中就有“其地有天山,冬夏积雪,雪中有莲,以天山峰顶者为第一”的记载,请问天山雪莲是属于哪一科植物?请写出使用的搜索引擎,检索式和结果所在页面的URL。 (6以“文献检索与课程教学改革”为主题查找doc,ppt,pdf 若干篇,并提供文章所 在的URL。 (7小黄的表弟准备要参加高考了,请你帮他查找应该怎样搭配饮食? (8小李某日上网时,其邻桌的一位同学正在听网上的一首音乐作品,小李觉得那 首歌非常好听。第二天小李上网时也想自己听听,但不知道是何歌名,只记得其中有 一句歌词叫“牵着手留下一缕芬芳”,你能帮帮小李查查这是什么歌吗?是由谁演唱的? (9请查找关于关于“计算机网络课程”的PPT课件1篇。 (10什么是打口CD?请写出使用的搜索引擎、检索式和结果所在页面的URL。 (11试比较搜索引擎百度、google的服务产品(相同的和不同的至少分别列出5种。

信息检索--上机操作

信息检索 --上机操作部分供临床医学、检验、护理、精神卫生、预防等基础医学专业学生使用

实习一中文网络全文检索系统 实习学时: 2学时 一、实习目的和要求 1.了解常用中文网络文献检索系统及所能获取的资源。 2.掌握中国知网、维普、万方等常用中文网络文献检索系统的检索方法。 二、实习报告 (一)从中国知网(CNKI)(https://www.360docs.net/doc/da14364072.html,)中选择《中国学术期刊网络出版总库》,1. 在“期刊导航”中,选择“核心期刊导航”,浏览“临床医学类”的核心期刊,写出2种、。 2. 检索我校某一教师发表的论文, 检索策略: 命中:篇。 3. 检索2006年以来的有关“痤疮(又称青春痘)的治疗”方面的文献,按格式写出检索结果。 限定时间: 检索项检索词逻辑检索词 逻辑检索项检索词 命中文献篇数 任选一篇相关文献,并记录: 中文篇名: 第一著者及所在单位: 文献出处: 点击“PDF下载”,浏览其全文。 在文献排序浏览中,点击“被引频次”,写下被引频次最高的一篇文献的篇名: (二)从重庆维普(https://www.360docs.net/doc/da14364072.html,/)的高级检索中,检索“地震后灾区人群的心理干预”按格式写出检索结果。 1、所用检索词及检索策略: 检索项检索词 逻辑检索项检索词 命中文献篇数 2、按以下要求抄下一篇密切相关文献 中文篇名:

出处: (三)进入万方数据资源系统(万方)(https://www.360docs.net/doc/da14364072.html,/),从左下角相关链接中选择万方数据医药,选择高级检索,检索你感兴趣的文献,按格式写出检索结果。 1、所用检索策略: 检索项检索词 逻辑检索项检索词 命中文献篇数 实习二中国生物医学文献光盘数据库 (CBMdisc) 实习学时:2学时 一、实习目的和要求 1.了解CBMdisc的启动及退出。 2.熟悉CBMdisc的使用界面、数据库结构。 3.掌握CBMdisc的检索途径、检索方法及提高检索效率的策略。 二、CBMdisc的检索途径、检索方法 1.自由词检索 ⑴任意检索:在检索式输入框键入任意词或检索表达式,点击“检索”按钮。 ⑵限定字段检索:点击字段下拉按钮,可选择“缺省”(默认字段)、“全部”、“中文题目”、“英文题目”、“作者”、“地址”、“中文摘要”、“刊名”等限定字段检索。亦可用通用格式:“检索词in 字段”或“字段=检索词”(精确查找)。 ⑶选词检索:浏览检索结果时,如发现有更适当的检索词,可选中,点击“加入列表”,再点击“检索列表”,可显示检索式。点击“显示”,即可见检索结果。 2.主题词检索 点击“主题词”按钮,进入主题词检索状态。 ⑴选择中文主题词或英文主题词,输入检索词,点击“浏览”,屏幕上出现轮排主题词表,选择所需的主题词(若选择多个主题词,则需要加入列表)。可点击“主题词注释”,察看主题词的详解及树状结构。 ⑵在检索选项中,选择“扩展”、“不扩展”或“加权”。 ⑶点击“检索”,可见副主题词话框,选择适当副主题词后,点击“确认”,即可显示检索式。点击“显示”可见检索结果。 3.索引词检索 在“索引”状态下,输入检索词,点击“浏览”,屏幕上出现含有该词的索引词列表,点击所要选的检索词(若选择多个主题词,则需要加入列表),再击“检索”可显示检索式。点击“显示”可见检索结果。 4.分类检索 点击“分类”,屏幕上出现分类检索状态。

技能训练5-1主要搜索引擎特性的对比分析

技能训练5-1 主要搜索引擎特性的对比分析 以“六度空间理论”、“搜索引擎优化”、“手持移动电视”为关键字,在三大搜索引擎(百度、谷歌、搜搜)上进行“网页”搜索,将相关搜索结果整理为100字左右的文字描述,然后以4-6人为小组分享各自的结论,并就三大搜索引擎的特点、返回结果信息的相关性、价值度的大小等方面进行讨论,并将形成的结论填入下表。 表5-4 三大搜索引擎对比分析表 调查时间: 11·28 调查人:余思琪 搜索对象搜索引 擎种类 搜索引擎 特性描述 信息 相关 性 评价 信息 价值 度 评价 是 否存在 商业推 广 六度 空间理论百度 拥有目前世界上 最大的中文信息库, 支持主流的中文编码 标准,采用智能相关 度算法,支持二次检 索(又称渐进检索或 逼进检索),采用先进 的网页动态摘要显示 技术 相关 度高,前 20条里有 19条都与 之相关,大 多来自百 科.文库. 博客 信息 价值度,在 这19条中 我都能了 解到关于 六度空间 理论的相 关信息 没 有Google 目前规模最大搜 索引擎,提供常规搜 不高, 前十条中 一般, 其中有不 存 在关键

索和高级搜索两种功能。信息条目数量。但也要注意其多种语言字母无大小写之分,全部默认为小写,不使用词干法,也不支持通配符只有5条 与其相关 来自百科, 和一些网 页 少与所搜 索的东西 不相关 字广告 和广告 联盟 搜搜 腾讯出品为广 大用户提供的问答互 动平台。覆盖面广 ——接触庞大QQ用户 群,针对性强——准 确覆盖目标用户,互 动性强——即搜即Q, 立刻抓住您的客户, 灵活可控——快捷调 整广告内容和广告开 销 相关 度很高,前 十条内都 与之相关 信息 价值度高。 从前十条 中我都能 了解到六 度空间理 论的含义 没 有 什么是六度空间理论? 你和任何一个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能够认识任何一个陌生人。这就是六度分割理论,也叫小世界理论。

SEO网站优化测试题与答案

SEO 网站优化测试题及答案 一、选择题45 题 1. 如果你的网站是关于手机的,下面哪个是最好的网页标题?() A. 手机,买手机,手机报价,手机新闻,手机游戏,手机软件 B. 本站提供各种价格 的便宜手机供你选择 C. 手机| 手机之家 D. 主页| https://www.360docs.net/doc/da14364072.html, 2. 一个纯内容的页面(如文章,博客等)应该有多少字?() A . 100 - 200 B . 500 - 800 C . 200 - 400 D . 800+ 3. 最优关键字密度?() A . 2 %- 5 % B .页面内容保持正常,但是利用隐藏文字,alt 标签,meta 标签尽量多加关键字 C .尽可能保持文章对用户的友好性 D .不管关键字密度,搜索引擎不关心这个,只集中于内容,做到人们都爱链接你的页面 4. 你应该在meta 标签里放什么?() A. 在meta 标签的keywords 中放满关键字列表,把重要的关键字放在meta 标签的description 中 B. 忽略meta 标签,搜索引擎不用这些 C. 在meta 标签的description 中写上你网站的简短描述,在meta 标签的keywords 放上最重要的关键字 D. 在meta 标签的keywords 放上最重要的关键字,忽略meta 标签的description 5. 你怎么利用网站上的图片?() A. 利用alt 标签精确描述每张图片,包括图片周围的描述性内容 B. 在alt 标签中写上最重要的关键字,后面加上“图片” C. 只在必要的时候使用,不用每张都加,因为 这根本不重要 D. 利用alt 标签加入关键字列表以增加关键字密度 6. 内容很少网站获得高排名的最好方法?() A. 拥有大量各种各样网站的自然(内容相关)反向链接 B. 网站页面填满关键字和隐藏 文字 C. 使用内容生成软件来做搜索引擎作弊来获得搜索引擎排名 D. 付费来获得高PR 值 7.下面哪种做法不会受到Google 的惩罚?() A. 针对搜索引擎自动生成数千个页面 B. 稳步创建高质量链接 C. 采集其它网站的内容 D. 有google 认为是坏链的网站的反向链接 8.设计网站的结构时,下面哪个方法不好?() A. 创建网站地图指向网站的每个页面 B. 网站的每个页面都可以通过最多 3 次点击访问 C. 把网站的所有内部页面链接到你的其它网站 D. 创建网站的结构性 9、搜索引擎营销的简称是( ) A、SEO B、SEM C、SEC D、SERP 10、友情链接方面,PR 的选择应该优先选择的链接为( ) A、PR 高,相关性低 B、PR 低,相关性高 C、PR 高,相关性低 D、RP 高,相关性高 11、下面哪个HTTP 状态码是搜索引擎返回的抓取正常的状态码( ) A、500 B、301 C、200 D、404 12、下列URL 对SEO 最友好的是( ) A、seo/index.html B、seo/ C、seo.aspx D、seo.php?id=21 13、robots.txt 不支持的代码为( ) A、Allow B、Disallow C、Crawl-delay D、noindex 14、以下哪一种提高PR 值的行为被Google 认为是作弊行为( ) A、与很多相关站点友情链接 B、加入很多网站目录站、导航站 C、向PR 值高的站点购买链接 D、发布供求信息,带有反向链接 15、以下_____不是网站外部链接添加方式?( )

seo试题答案

1.? (单选)下列选项中,哪个选项是精确搜索全国政府网站中含有“互联网”关键词的网页?()。 ? A. 互联网“政府”; B. 互联网intitle:政府; C. 互联网intitle:; D. 互联网inurl:; 正确答案:D ? 2.? (单选)在网民搜索时,如果推广商户的账户内符合网民搜索需求的关键词被触发,该关键词所对应的创意在搜索结果页获得的点击次数,称之为:

A. 展现量 B. 点击量 C. 检索量 D. 搜索量 正确答案:B ? 3.? (单选)在HTML中关于strong和B标记的区别是:()。 ? A. Strong和B都是粗体显示,但是strong有重点强调的意思; B.

Strong和b完全一样; C. Strong和b完全不一样; D. b标记和strong标记在HTML使用是不一样的; 正确答案:A ? 4.? (单选)下列选项中,关于关键词密度和频率说法说法正确的有()。 ? A. 有较高的关键词密度和频率有利于排名; B. 关键词密度过低容易被搜索引擎处罚; C. 关键词的出现的频率建议3-6次左右; D.

关键词的出现要在内容中故意多堆积; 正确答案:C ? 5.? (单选)下列选项中,关于信噪比的解释正确的是() ? A. 页面中关键词出现的次数和全部网页内容的比率; B. 网站关键词个数和网页全部内容的比率; C. 网页中的文本内容部分和生成这些文本的html标签的比率,即网页有用信息和干扰信息之比; D. 网页关键词信息和网页的HTML标签的比率; 正确答案:C ? 6.?

(单选)4C营销理论中的4C具体是指()。 ? A. 顾客、成本、便利、沟通; B. 关联、反应、关系、回报; C. 产品、价格、渠道、促销; D. 需求、成本、订单、利润; 正确答案:A ? 7.? (单选)下列关于市场定位方式的表述,错误的是()。 ? A. 市场定位的目的是使企业的产品和形象在目标顾客的心理上占据一个独特、有价值的位置;

信息检索上机实验

信息检索实习作业 一.找找看哪里有关于MATLAB神经网络应用的书可以看,总结网络上有哪些相关资源。 实习步骤: 1.方法一:选择通用搜索引擎查询书名。 2.方法二:选择OPAC系统查询书名。 每种方法各保存一条检索结果,同时总结查询图书信息的方法以及获得图书全文的方法。 方法一:选择通用搜索引擎查询书名。 (图2) 方法二:选择OPAC系统查询书名。

(图3) 总结:获取图书信息的方式有许多种,一是通过搜索引擎检索到该类书籍的销售信息,通过网上购买的方式获得该书内容(如图一);二是通过搜索引擎从网上获取该类书籍的电子版,可以免费下载来获取该书信息;三是通过OPAC系统查询书名,得到该类书籍馆藏信息,可以从图书馆借到该书;四是通过图书类检索工具从该类数据库中获取信息。二.查阅应用自适应光学技术实时校正人眼像差方面的中文文章。 实习步骤: 1.选择检索工具,因为题目没有要求具体的文献类型,所以图书、期刊、学位论文、 会议文献、科技报告、专利等类型的检索工具都可以使用。推荐使用期刊类、会议 类、学位论文类学科范围相符的检索工具。 2.提取检索词,设定检索字段、时间、排序方式等。 3.结果不准确时需调整策略重新检索。 保存检索过程,含检索词、检索条件、检索结果数量和质量的变化情况。

(图4)

(图5) 第一次检索时,检索词设为“自适应光学”和“人眼相差”按相关度排序(图4)得到74条结果,第二次检索时检索词设为“自适应光学”和“校正人眼相差”按相关度排序(图5)得到20条结果,虽然结果少了,但是更精确了。 三.检索2009年《南京航空航天大学学报》上发表的微小卫星方面的文献。 实习步骤: 1.判断文献的类型、学科,选择合适的检索工具。(科技期刊类工具) 2.设定时间、字段、检索词等,开始检索。 保存检索式和一条检索结果条目信息。 该文献为期刊论文,时间为从2009年到2009年,主题为“微小卫星”搜索结果如图6 所示。

文献检索上机题答案

①上机习题总分100分。 ②要求认真审题,独立完成,抄袭者和被抄袭者均不得分。 ③可先在电脑上做好后再打印出来,注意排版整洁清晰。 1.在中国知识基础设施工程(CNKI)系列资源库的中国期刊全文数据库中检索篇名为《聚合硫酸铁的制备》发表在《四川师范大学学报》上的论文。(6`) 1)给出检索策略。 答:双击浏览器,在地址栏输入http://218.87.32.9/,进入江西蓝天学院图书馆,单击“中国知网CNKI系列资源库”,单击“中国学术文献网络出版总库”,在“文献出版来源”中填“四川师范大学学报”,主题栏填“聚合硫酸铁的制备”,单击“检索文献”得出信息。 2)给出该文的题录信息。 答:【作者】向群; 【作者单位】四川轻化工学院; 【文献出处】四川师范大学学报(自然科学版) , JOURNAL OF SICHUAN NORMAL UNIVERSITY(NA TURAL SCIENCE), 编辑部邮箱1997年01期 【期刊荣誉】中文核心期刊要目总览ASPT来源刊中国期刊方阵CJFD收录刊 【中文关键词】聚合硫酸铁; 酸度; 催化剂; 【摘要】本文介绍了聚合硫酸铁的制备原理和方法,对制备方法中的催化剂选择作了一定的讨论. 【DOI】CNKI:SUN:SCSD.0.1997-01-016 【分类号】O622.7 2.你想向《软科学》杂志投稿,却不知道其通信地址、邮政编码或E-mail。请用至少两种并方法进行查找,写出该杂志社的通讯地址、邮政编码和E-mail及具体的查找方法。(6`)答:第一种方法:打开浏览器,在地址栏输入https://www.360docs.net/doc/da14364072.html, 在搜索栏输入“《软科学》杂志社通讯地址”,在结果中点击“软科学杂志社”选项,获得结果如下: 中文名称:软科学,地址:成都市人民南路4段11号5楼,邮政编码:610041,投稿信箱:qkwtougao@https://www.360docs.net/doc/da14364072.html,,主编:张勇 第二种方法:打开浏览器,在地址栏输入https://www.360docs.net/doc/da14364072.html, 在搜索栏输入“《软科学》杂志社介绍”,在结果中单击“软科学杂志介绍”选项,获得结果如下: 期刊名称:软科学,地址:成都市人民南路4段11号5楼,邮政编码:610041,电子邮件:xuxi@https://www.360docs.net/doc/da14364072.html, ;rkx@https://www.360docs.net/doc/da14364072.html,,主编:张勇 3.在中国知识基础设施工程(CNKI)系列资源库中找出作者“陈绍魁”发表在《电气技术》2005年第8期上的一篇文章,写出篇名。(6`) 答:打开浏览器,在地址栏输入http://218.87.32.9/,打开江西蓝天学院图书馆,单击中

搜索引擎的设计与实现

web搜索引擎的设计与实现

摘要 随着网络的迅猛发展。网络成为信息的极其重要的来源地,越来越多的人从网络上获取自己所需要的信息,这就使得像Google[40],百度[39]这样的通用搜索引擎变成了人们寻找信息必不可少的工具。 本文在深入研究了通用搜索引擎基本原理、架构设计和核心技术的基础上,结合小型搜索引擎的需求,参照了天网,lucene等搜索引擎的原理,构建了一个运行稳定,性能良好而且可扩充的小型搜索引擎系统,本文不仅仅完成了对整个系统的设计,并且完成了所有的编码工作。 本文论述了搜索引擎的开发背景以及搜索引擎的历史和发展趋势,分析了小型搜索引擎的需求,对系统开发中的一些问题,都给出了解决方案,并对方案进行详细设计,编码实现。论文的主要工作及创新如下: 1.在深刻理解网络爬虫的工作原理的基础上,使用数据库的来实现爬虫部分。 2.在深刻理解了中文切词原理的基础之上,对lucene的切词算法上做出了改进的基础上设计了自己的算法,对改进后的算法实现,并进行了准确率和效率的测试,证明在效率上确实提高。 3.在理解了排序索引部分的原理之后,设计了实现索引排序部分结构,完成了详细流程图和编码实现,对完成的代码进行测试。 4.在完成搜索部分设计后,觉得效率上还不能够达到系统的要求,于是为了提高系统的搜索效率,采用了缓存搜索页面和对搜索频率较高词语结果缓存的两级缓存原则来提高系统搜索效率。 关键词:搜索引擎,网络爬虫,中文切词,排序索引

ABSTRACT With the rapidly developing of the network. Network became a vital information source, more and more people are obtaining the information that they need from the network,this making web search engine has become essential tool to people when they want to find some information from internet. In this paper, with in-depth study of the basic principles of general search engines, the design and core technology architecture, combining with the needs of small search engine and in the light of the "tianwang", lucene search engine, I build a stable, good performance and can be expanded small-scale search engine system, this article not only completed the design of the entire system, but also basically completed all the coding work. This article describle not only the background of search engines, but also the history of search engine developing and developing trends,and analyse the needs of small search engines and giving solutionsthe to the problems which was found in the development of the system ,and making a detailed program design, coding to achieve. The main thesis of the article and innovation are as follows: 1.with the deep understanding of the working principle of the network spider.I acheived network spider with using database system. 2.with the deep understanding of Chinese segmentation and segmentation algorithm of lucene system,I made my own segmentation algorithm,and give a lot of tests to my segmentation algorithm to provide that my segmentation algorithm is better. 3.with the deep understanding of sorted and index algorithm,I designed my own sorted and index algorithm with the data-struct I designed and coding it ,it was provided available after lots of tests. 4.after design of search part,I foud the efficiency of the part is not very poor,so I designed two-stage cache device to impove the efficiency of the system. Key words: search engine,net spider, Chinese segmentation,sorted and index

相关文档
最新文档