资源数据采集技术方案_1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
资源数据采集技术方案
公司名称
2011年7月二O一一年七月
目录
第 1 部分概述 (3)
1.1 项目概况 (3)
1.2 系统建设目标 (3)
1.3 建设的原则 (4)
1.3.1 建设原则 (4)
1.4 参考资料和标准 (5)
第 2 部分系统总体框架与技术路线 (5)
2.1 系统应用架构 (6)
2.2 系统层次架构 (6)
2.3 关键技术与路线 (7)
第 3 部分系统设计规范 (9)
第 4 部分系统详细设计 (10)
第 1 部分概述
1.1 项目概况
Internet已经发展成为当今世界上最大的信息库和全球范围内传播知识的主要渠道,站
点遍布全球的巨大信息服务网,为用户提供了一个极具价值的信息源。无论是个人的发展还
是企业竞争力的提升都越来越多地依赖对网上信息资源的利用。
现在是信息时代,信息是一种重要的资源,它在人们的生活和工作中起着重要的作用。
计算机和现代信息技术的迅速发展,使Internet成为人们传递信息的一个重要的桥梁。网络
的不断发展,伴随着大量信息的产生,如何在海量的信息源中查找搜集所需的信息资源成为
了我们今后建设在线预订类旅游网重要的组成部分。
因此,在当今高度信息化的社会里,信息的获取和信息的及时性。而Web数据采集可以通过一系列方法,依据用户兴趣,自动搜取网上特定种类的信息,去除无关数据和垃圾数据,筛选虚假数据和迟滞数据,过滤重复数据。直接将信息按照用户的要求呈现给用户。可
以大大减轻用户的信息过载和信息迷失。
1.2 系统建设目标
在线预订类旅游网是在线提供机票、酒店、旅游线路等旅游商品为主,涉及食、住、行、游、购、娱等多方面的综合资讯信息、全方位的旅行信息和预订服务的网站。
如果用户要搜集这一类网站的相关数据,通常的做法是人工浏览网站,查看最近更新的信息。然后再将之复制粘贴到Excel文档或已有资源系统中。这种做法不仅费时费力,而且
在查找的过程中可能还会遗漏,数据转移的过程中会出错。针对这种情况,在线预订类旅游网信息自动采集的系统可以实现数据采集的高效化和自动化。