数据挖掘软件立项建议书

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据挖掘软件立项建议书

1. 文档介绍

2.文档目的:是介绍一种数据挖掘软件的立项,包括即将开发的产品的介绍、市场的情况及对客户需求的描述、该产品开发过程所需要的人力资源等。

3.文档范围:项目开发计划, 需求规格说明书, 概要设计说明书, 详细设计说明书 ,数据库设计说明书, 用户手册, 操作手册, 测试计划, 测试总结报告, 开发进度周(月)报, 项目开发总结报告。

4. 读者对象:软件开发人员;软件维护人员;软件开发的管理人员;银行、保险、电信等大企业的需要该产品功能的用户

5.参考文档【1】数据挖掘软件发展分析朱杨勇【2】海量数据与数据挖掘技术李燕

6.术语与缩写解释:DB—数据挖掘SAS Enterprise Miner —提供全面的数据挖掘算法SPSS Clementine—企业级数据挖掘平台

1.产品介绍:(1)产品定义:数据挖掘(DB)--从大量数据中寻找其规律的技术,是统计学、数据库技术和人工智能技术的综合。数据挖掘软件是从大量的数据中抽取出潜在的、有价值的知识或规则,自动分析海量数据,获取有用知识,通过分析大量的数据,了解已经发生了什么,分析发生的原因并预测将来会发生什么。(2)产品开发背景:本产品开发的内因:已经开发出的各种软件都有一定的缺陷,例如:第一代数据挖掘软件CBA面对足够大且频繁变化的数据,难以与数据库或数据仓库建立接口来进行管理;第二代数据挖掘软件DBMiner、SAS Enterprise Miner 只注重模型的生成,没有与预言模型系统集成,难以预测将来会发生什么;第三代数据挖掘软件SPSS Clementine不能支持移动环境。

所以为了实现在移动环境下进行数据分析,为了更好的让人机结合,迫切需要开发出一种更好的软件。本产品开发的外因:随着信息时代的到来,信息量增大,数据变得越来越多,决策者们淹没在数据中,不能制定出合适的决策。随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据。目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。缺乏挖掘数据背后隐藏的知识的手段,导致了“数据爆炸但知识贫乏”的现象。只有通过数据挖掘,借助于数据挖掘技术来分析海量的数据,这就需要开发一种能够自动进行数据分析和人机互动的软件。(3)产品主要功能和特色:本产品主要进行数据的分析,通过数据挖掘和移动计算相结合为决策者制定出较好的决策提供一种工具。本产品的特色是能够挖掘嵌入式系统、移动系统、和普遍存在(ubiquitous)计算设备产生的各种类型的数据。(4)产品范围:本产品可以在银行、电信(欺诈甄别、客户流失)、零售、保险、各行业的电子商务网站、制药、生物信息、科学研究等领域使用,结合实际,解决现实问题。本产品应当包含分析数据的各种算法(神经网络、时序模型、关联规则等)、业务建模、预测模型等。

2.市场概述:(1)客户需求描述:不同的客户有不同的需求。在市场营销中的客户,需要通过收集、加工和处理涉及消费者消费行为的大量信息,确定特定消费群体或个体的兴趣、消费习惯等,进而推断出相应消费群体或个体下一步的消费行为然后以此为基础,对所识别出来的消费群体进行特定内容的定向营销。对商业银行客户来说,他们要求能够进行对大量数据的处理和分析,发现其数据模式及特征,然后发现某个客户消费群体或组织的金融和商业兴趣,并观察金融市场的变化趋势。电子商务:网上商品推荐;个性化网页;

自适应网站… 生物制药、基因研究:DNA 序列查询和匹配;识别基因序列的共发生性 …

电信:欺诈甄别 银行 美国银行家协会(ABA)预测数据仓库和数据挖掘技术在美国商业银行

的应用增长率是14.9%。 分析客户使用分销渠道的情况和分销渠道的容量 ;建立利润评

测模型;客户关系优化;风险控制等

(2) 市场规模与发展趋势: 经过几代产品的开发与使用,该项技术与产品正在趋于成熟

化。 第三、 四代系统强调预言模型的使用和在操作型环境的部署 第二代系统提供数据

管理系统和数据挖掘系统之间的有效接口 第三代系统另外还提供数据挖掘系统和预言模

型系统之间的有效的接口 第一代系统与第二代相比因为不具有和数据管理系统之间有效

的接口,所以在数据预处理方面有一定缺陷 目前,随着新的挖掘算法的研究和开发,第一

代数据挖掘系统仍然会出现,第二代系统是商业软件的主流,部分第二代系统开发商开始研

制相应的第三代数据挖掘系统,比如 IBM Intelligent Score Service 。第四代数据挖掘原型或

商业系统尚未见报导。 未来的发展 • 与数据库数据仓库系统集成 • 与预言模型系统集成

• 挖掘各种复杂类型的数据 • 与应用相结合 • 研制和开发数据挖掘标准 • 支持移动

环境 中国数以千万中小企业也将是本产品的巨大的市场所在,不过,由于这些对于对数据

的重要性认识还不是很充足,加之难以负担费用,因此近两年不会成为数据仓库的重点客户,

将主要围绕电信、银行、金融保险等信息处理量大的大型企业。

3。产品发展目标: (1)短期目标:能够开发出比较适用的产品。(2) 长期目标:

能够适用于更多的领域。

4. 产品技术方案:(1)产品体系结构:

(2)关键技术:本产品关键利用数据挖掘技术,包括各种算法,该技术要求开发人员有一

定的专业知识,懂得一些算法的实现。

5.

5.make-or-buy 分析: 作为公司内部的一个部门,或者成立一个全资子公司来负责,

不外包。有一定的的风险,因为在国内市场占的份额不大。

6.项目开发计划:(1)团队建设

角色

知识技能要求 建议人选、人数、工作时间

信息系统 客户数据仓库 数据挖掘库算法 模型库 组件用户应用

相关文档
最新文档