数据挖掘的现状与未来发展
数据挖掘研究及发展现状

数据挖掘研究及发展现状
数据挖掘是一种通过对数据的分析和探索,以发现其中隐藏的有用信
息的技术,在现今的信息时代具有重要的意义。
随着信息技术的发展与完善,数据挖掘应用于各个领域的研究也越来越广泛。
近几年来,数据挖掘
的研究和应用取得了特别的发展,建立了多种相关的理论模型,应用于社
会的各个领域,并得到了广泛的应用。
一、数据挖掘发展研究的现状
在社会和科学研究的各个领域,数据挖掘的应用已经取得了显著的成果。
从健康保障、交通、经济到社会政治、安全、财税等各个领域均有其
应用,在提高效率、降低成本和改善服务质量方面取得了突出成果。
其中,数据挖掘研究的主要内容包括:数据收集、处理、实验、分析、可视化以
及应用等。
1、数据收集
数据收集是进行数据挖掘研究的基础步骤,可以通过实际测量、实验
及分析等方法获得原始数据。
数据收集以及处理研究已经被广泛应用于社
会服务、医疗、管理决策、政策分析等多个领域,充分发挥了其作用。
2、数据处理
数据处理是数据挖掘研究中的重要环节,其主要内容包括:数据清洗、数据筛选、数据转换、数据统计等。
数据挖掘现状与前景

数据挖掘,这是个听起来既神秘,又具有诱惑性的词。
就好像要去一片热带沙漠搜寻宝藏,宝藏的诱惑性很强,但是黄沙远处却看不透彻,不知此行是对是错,看到的光亮又是否只是虚幻的海市蜃楼。
所以很多学习数据挖掘的,或是想选择数据挖掘方向的人会在是否踏出第一脚时犹豫不决。
以下,我们就来分析看看数据挖掘的现状及前景。
首先看看百科中数据挖掘的定义:数据挖掘(Data Mining,DM)是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。
基于数据挖掘可能产生的巨大价值,我国的各大重点院校都针对数据挖掘开了专业课程以及研究课题,不仅如此,政府以及大型企业也开始重视这一领域,投资人力物力支持数据挖掘项目。
或许这样说还不够直观,那就就数字佐证。
据IDC对欧洲和北美62家采用了商务智能技术的企业的调查分析发现,这些企业的3年平均投资回报率为401%,其中25%的企业的投资回报率超过600%。
调查结果还显示,一个企业要想在复杂的环境中获得成功,高层管理者必须能够控制极其复杂的商业结构,若没有详实的事实和数据支持,是很难办到的。
因此,随着数据挖掘技术的不断改进和日益成熟,它必将被更多的用户采用,使更多的管理者得到更多的商务智能。
国外如此,那中国呢?随着我国信息化的发展,数据的积累及计算机的广泛应用,加上来自外资企业商业智能数据挖掘应用带来的竞争压力,商业智能及数据挖掘也逐渐在中国也形成了一个产业。
随着成功案例的增多,不仅仅是金融保险电信等行业或是政府机构,中小企业也逐渐将商业智能应用于业务之中。
信息化时代数据的潜力不容小觑,IT部门一直是企业的核心,而数据挖掘技术更是得到了前所未有的重视和期待。
目前我国数据挖掘、商业智能技术的人才培养体系还未健全,而企业对这方面的需求却一直在增长。
数据知识发展为核心竞争力是现在及未来必然的形势。
因此数据挖掘、商业智能行业的前景还是非常可观的。
大数据的挖掘和分析技术及应用

大数据的挖掘和分析技术及应用在当今信息化的时代,大数据已经成为各行各业得以发展的重要基石之一。
大数据挖掘和分析技术,作为大数据的核心应用技术之一,其在商业、医疗、金融、政府等领域的应用得到越来越广泛的认可和重视。
本文从大数据挖掘和分析技术的基础知识出发,深入探讨了其发展历程和现有应用情况,并简单预测了其未来发展趋势。
一、大数据挖掘技术的概述大数据挖掘技术是指从海量数据中获取有价值信息的一种技术手段。
通过对数据的获取、处理、分析和模型建立,可以发现并提取其中的关联规则、异常点、趋势、模式等等。
其核心思想在于对数据进行加工,挖掘出其中的潜在价值,为机构或企业提供参考依据。
二、大数据分析技术的概述大数据分析技术是指将大数据进行筛选、计算、分析和可视化等一系列操作,得到有用的洞察和结论的技术。
它是一种好的决策工具,可为企业的经营管理、市场营销、风险管理和人才管理等提供有力的支持。
分析技术充分利用互联网各种数据源,从而挖掘其中鲜为人知的结果或信息,进而发现有利的营销机遇或其他商业模式。
三、大数据挖掘和分析技术的历史和现状大数据挖掘和分析技术得以迅速发展,受益于近几年国内外IT技术和通信技术的迅速发展,尤其是云计算、移动互联网和人工智能等技术的诞生和发展。
同时,大数据汇聚与存储的技术、新型应用模式以及跨界创新产物的兴起,也为大数据挖掘和分析技术打下了坚实基础。
在商业领域,各大企业为提高数据的价值和利用,积极在数据挖掘和分析领域做出尝试。
在福特、可口可乐、波音、华为、京东等国内外著名企业,业务实践中已经成功应用了各种大数据挖掘和分析技术,如基于数据挖掘的消费理解、基于征信评分的风险预测、基于机器学习的推荐系统等。
四、大数据的挖掘和分析技术应用领域商业领域是大数据挖掘和分析技术最广泛的应用领域之一。
比如对于营销市场部门而言,通过挖掘客户消费行为和产品偏好等信息,制定出更为合适的产品营销策略。
对于金融来说,数据挖掘和分析可以帮助预测债务信用风险、最大化利润等。
大数据时代的数据挖掘综述

大数据时代的数据挖掘综述一、本文概述随着信息技术的迅猛发展,大数据已经渗透到社会生活的各个领域,成为现代社会发展的重要基石。
大数据时代的来临,不仅带来了海量的数据资源,也对数据挖掘技术提出了更高的要求。
数据挖掘,作为从海量数据中提取有用信息、发现潜在规律的重要手段,已经成为当前研究的热点和前沿领域。
本文旨在对大数据时代的数据挖掘技术进行全面而系统的综述,分析当前数据挖掘领域的研究现状,探讨面临的挑战和未来的发展趋势。
本文将首先介绍大数据和数据挖掘的基本概念,阐述数据挖掘在大数据时代的重要性和应用价值。
接着,本文将重点回顾数据挖掘的发展历程,介绍数据挖掘的主要方法和技术,包括分类、聚类、关联规则挖掘、预测模型等,并结合具体案例进行说明。
同时,本文还将对数据挖掘在各个领域的应用进行梳理和总结,如商业智能、医疗健康、金融风控等。
在此基础上,本文将深入探讨大数据时代数据挖掘面临的挑战,如数据规模巨大、数据类型多样、数据质量参差不齐等问题,并分析这些问题对数据挖掘算法和性能的影响。
为解决这些问题,本文还将介绍一些新兴的数据挖掘技术和方法,如深度学习、强化学习、迁移学习等,并探讨它们在大数据时代的应用前景。
本文将展望数据挖掘未来的发展趋势,预测未来可能的研究热点和方向,为相关领域的研究人员和实践者提供参考和借鉴。
通过本文的综述,希望能够为大数据时代的数据挖掘研究提供全面而深入的理解,推动数据挖掘技术的进一步发展和应用。
二、数据挖掘相关概念及理论基础在大数据时代,数据挖掘成为了一个不可或缺的工具,它帮助我们从海量的、复杂的、多样化的数据中提取出有价值的信息和模式。
数据挖掘是一门涉及多个学科的交叉学科,其理论基础涵盖了统计学、机器学习、模式识别、数据库管理等多个领域。
数据挖掘的基本概念是通过特定算法对大量数据进行处理和分析,以发现其中的关联规则、分类模式、聚类结构、异常检测以及预测趋势等。
这一过程中,数据预处理是极其关键的一步,它包括对数据的清洗、转换、降维等操作,以确保数据的质量和有效性。
数据挖掘调研报告

数据挖掘调研报告一、调研背景和目的本调研报告旨在对数据挖掘技术进行全面的了解和探讨,以促进其在不同领域的应用。
数据挖掘是指从大量数据中发现模式、规律和知识,并以此支持决策和预测的过程。
随着数据量快速增长和计算能力的提升,数据挖掘技术变得越来越重要。
二、调研方法和过程为了全面了解数据挖掘技术的应用现状和发展趋势,我们采用了以下调研方法和过程:1. 文献综述:收集和分析相关领域的学术论文、期刊和研究报告,了解数据挖掘技术的最新进展和应用案例。
2. 专家访谈:与数据挖掘领域的专家进行深入交流,了解他们对数据挖掘技术的看法、经验和建议。
3. 实地考察:参观一些数据挖掘应用于实际场景的企业或机构,了解他们的数据挖掘流程、工具和效果。
4. 调研问卷:设计和发放问卷,收集不同领域的从业人员对数据挖掘技术的使用情况和需求意见。
三、数据挖掘技术应用现状根据收集的数据和调研结果,我们总结了数据挖掘技术在不同领域的应用现状:1. 金融领域:数据挖掘技术在风控、信贷评分和欺诈检测等方面得到广泛应用,能够帮助金融机构提高风险管理能力和预测能力。
2. 零售领域:通过分析顾客购买行为和偏好,数据挖掘技术可以帮助零售商进行精细化营销和库存管理,提高销售额和客户满意度。
3. 医疗领域:数据挖掘可以辅助医疗机构进行疾病预测、诊断和治疗方案优化,提高医疗效果和患者生活质量。
4. 市场调研领域:通过分析消费者行为数据和市场趋势,数据挖掘技术可以帮助企业做出准确的市场预测和决策,提高竞争力。
四、数据挖掘技术发展趋势根据专家访谈和文献综述的结果,我们总结了数据挖掘技术的发展趋势:1. 深度学习:随着神经网络和计算力的不断发展,深度学习将成为数据挖掘的重要技术手段,可以应用于图像识别、自然语言处理等领域。
2. 多模态数据分析:数据挖掘技术将逐渐向多模态数据分析扩展,例如结合图像、文本和语音等多种数据形式进行综合挖掘和分析。
3. 实时数据处理:随着物联网和5G技术的快速发展,实时数据处理将成为数据挖掘的重要应用场景,例如智能交通、智能制造等领域。
数据挖掘的发展趋势及未来的研究方向

数据挖掘的发展趋势及未来的研究方向一、数据挖掘简介近十几年来,信息数据增长之巨大已到了令人咂舌地步,大型数据库、数据仓库被用于商业管理、政府办公、科学研究和工程开发等等。
于是,我们又面临了新的问题:如何从中及时发现有用的知识,提高信息利用率?要想使数据真正成为一个公司的资源,只有充分利用它为公司自身的业务决策和战略发展服务才行,否则大量的数据只能成为包袱,甚至垃圾。
因此,数据挖掘技术应运而生。
我们可以把数据挖掘理解为:数据挖掘就是从海量的数据(包括结构化和非结构化)中挖掘出隐含在其中的、事先不为人知的、潜在的、有用信息和知识的技术。
这些信息是可能有潜在价值的,是用户感兴趣的、可理解、可运用的,支持决策,可以为企业带来利益,或者为科学研究寻找突破口。
二、数据挖掘的功能数据挖掘综合了各个学科技术,有很多的功能,当前主要功能如下:(1)分类:按照分析对象的属性、特征,建立不同的组类来描述事物。
例如:银行部门根据以前的数据将客户分成了不同的类别,现在就可以根据这些来区分新申请贷款的客户,以采取相应的贷款方案。
(2)聚类:识别出分析对内在的规则,按照这些规则把对象分成若干类。
例如:将申请人分为高度风险申请者,中度风险申请者,低度风险申请者。
(3)关联规则和序列模式的发现:关联是某种事物发生时其他事物会发生的这样一种联系。
例如:每天购买尿布的人也有可能购买啤酒,比重有多大,可以通过关联的支持度和可信度来描述。
与关联不同,序列是一种纵向的联系。
例如:今天银行调整利率,明天股市的变化。
(4)预测:把握分析对象发展的规律,对未来的趋势做出预见。
例如:对未来经济发展的判断。
(5)偏差的检测:对分析对象的少数的、极端的特例的描述,揭示内在的原因。
例如:在银行的100万笔交易中有500例的欺诈行为,银行为了稳健经营,就要发现这500例的内在因素,减小以后经营的风险。
需要注意的是:数据挖掘的各项功能不是独立存在的,在数据挖掘中互相联系,发挥作用。
大数据技术的发展现状与未来趋势展望

大数据技术的发展现状与未来趋势展望随着互联网技术的快速发展,数据量急剧增加,大数据技术逐渐崭露头角,成为了信息时代最为重要的技术之一。
本文将从大数据技术的概念、发展现状以及未来趋势三个方面进行阐述。
一、大数据技术的概念大数据是指传统数据库软件工具无法处理和管理的海量数据。
而大数据技术是一种可处理、存储和分析大量数据的技术,其主要包含数据挖掘、数据管理和数据分析三个方面。
大数据技术的核心是数据挖掘技术,而数据挖掘技术则是为了从海量的数据中发掘出规律和价值而产生的技术,主要应用于商业领域。
二、大数据技术的发展现状大数据技术的应用越来越广泛。
在人工智能、企业管理、市场营销、物联网等领域都有非常广泛的应用。
在人工智能方面,大数据技术配合机器学习进行数据分析和智能化推荐,为智能语音助手、智能金融、智能家居等带来了巨大的发展空间。
在企业管理和市场营销方面,大数据技术可以基于用户数据挖掘用户画像,分析用户需求,提高营销效果。
物联网技术则可以通过传感器等设备采集大量数据,并进行数据分析,以提高智能化程度。
目前,大数据技术正在引领数字经济的发展。
数字经济是指大量数据驱动的经济形态,大数据技术为数字经济提供了可靠的支撑。
根据经济学家预测,数字经济将成为未来经济发展的重要驱动力,因此大数据技术的发展也具有十分广阔的前景。
三、大数据技术的未来趋势展望大数据技术的未来发展可以从以下几个方面展望:1、云计算和大数据的结合。
目前云计算已经成为了企业建立信息化平台的主流方式,未来云计算和大数据技术的结合将成为大数据应用的重要形态。
2、深度学习和大数据的结合。
深度学习是一种类似于人类学习的算法,当前已经成为了人工智能领域的重要方法之一,未来深度学习和大数据结合将极大地加速人工智能的发展。
3、大数据的安全保障问题。
随着大数据技术的不断发展,数据泄露、数据泄密等安全问题也面临着不断增加的压力。
因此,在未来,大数据技术的安全保障问题将成为行业的重要课题。
大数据发展现状与未来趋势

大数据发展现状与未来趋势
一、大数据的发展现状
随着当今社会信息化的发展,越来越多的信息被生成和传播,存储容量也在快速增长,这些信息被称为大数据。
大数据技术是指将单纯的数据挖掘和分析技术与分布式和并行计算技术结合在一起,形成了能够处理海量数据的混合技术体系。
尤其是数据挖掘技术,将传统的数据挖掘技术完善,构建复杂的数据挖掘系统,从中获得更多价值的结果。
大数据技术目前是快速发展的技术,在很多领域都有广泛的应用。
在金融领域,大数据技术通过分析用户的行为及交易数据,可以有效的优化金融机构的风险管理。
在电子商务领域,大数据技术可以帮助电子商务企业深入分析客户行为,用以挖掘潜在客户,提升客户体验,提高电子商务企业的销售能力。
在医疗领域,大数据技术可以通过分析大量的医疗数据和病例,帮助医生进行更科学的诊断,更有效的管理病患,以此提高治疗效果。
二、大数据的未来趋势
预计大数据技术将在未来获得更多的应用,发展前景广阔。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据挖掘的现状与未来发展作者:冯馨张恺来源:《电脑知识与技术》2012年第14期摘要:随着数据获取设备和手段的发展,设备获得了大量的数据,如何充分利用这些数据,从数据中挖掘出有价值的信息,是目前迫切需要解决的问题。
该文对数据挖掘技术的定义、步骤以及类型做了简单介绍,最后提出了数据挖掘未来所面临的挑战。
关键词:数据挖掘;定义;类型;挑战中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)14-3221-02Data Mining Status and Future DevelopmentFENG Xin1, ZHANG Kai2(1.Hunan Chemical Vocational Technical College,Zhuzhou 412011,China; 2. Zhongnan University of Economics and Law, Wuhan 430073, China)Abstract: With the data acquisition equipment and means of development, Equipment made a lot of data, how to make full use of the da ta, data from mining out valuable information, is the urgent need to address the problem. In this paper, the definition of data mining tech nology, processes and type also reviewed, finally puts forward the data mining future challenges.Key words: data mining; definition; type; challenge如果把数据看成是地表的泥土和石头,而信息是隐藏在里面的矿藏,数据挖掘就是把埋藏在地表下的矿藏挖掘出来。
1数据挖掘的定义现今社会的各行各业在处理日常事务时,几乎都离不开数据。
例如到便利商店购物,或到图书馆借还书,即使是日常使用的手机里,也存放着各式各样的数据。
主要是因为数据的储存装置已非常便宜,不需再斤斤计较。
但伴随而来的是,数据的产生和储存的速度远超过人们所能分析和消化的速度。
在这样一个周遭都是数据的环境中,要担心的已不是手边没有数据可以分析,而是烦恼如何有效率地把手边的数据转化成有用的信息。
因为有很多的信息隐藏在数据的背后,如果能从数据中挖掘出有用的信息加以运用,可以增加个人或组织的竞争力。
数据挖掘的目的就是希望从海量数据中,使用自动或半自动的方式把隐藏在数据中的有用信息发掘出来。
如果把数据看成是地表的泥土和石头,而信息是隐藏在里面的矿藏,数据挖掘就是把埋藏在地表下的矿藏挖掘出来,因此数据挖掘也称为资料采矿。
数据挖掘和一般用统计方法来进行资料分析有个很大的不同。
统计分析希望能用单一规则或单一模式来显示数据的性质,但大多数的数据是由多条规则或多个模型混合产生的。
数据挖掘则是除了运用统计的概念来判读资料的性质外,更善用计算机的高运算效能,来归纳哪一条规则或哪一个模型适合用来解读哪一部分的资料,如此可使数据的诠释更具弹性,也较能发掘出真正隐藏在数据背后的信息。
因此简单来说,数据挖掘就是以统计学和信息科学为基础,所发展出来能快速分析资料的方法。
为了分清数据挖掘和一般数据检索的不同,以某一银行的信用卡发放为例。
如果只是把现有的信用卡使用者做一些数据的整理,以了解目前的使用状况,那只是一般的数据检索而已,数据库管理系统大都会提供相关的数据检索功能来汇整出这些信息。
但数据挖掘要做的是如何从信用卡使用者的个人、刷卡和付款资料,分析哪些新的申请者应核发信用卡,哪些应拒绝核发。
其余的新申请者则是无法用计算机来自动判断,因而人工只需处理这一部分的新申请者。
如此不但可节省审核的人力,也可进一步了解适合和不适合核发信用卡的主要原因,而一般的数据检索并无法提供这一类的信息。
另外以异常值的检测为例,从统计学的观点来看,如果数据服从常态分配,则可以设定离平均值正负三个标准差以上的是异常值。
由于可以从一组数据计算出平均数和标准差,因此判定的标准非常明确,很多制造程序或产品都是采用这样的标准来判断生产线的运作是否正常。
但如果用这样的标准来进行网络异常入侵的检测,由于异常入侵的种类非常多,其异常的行为必须有一般计算机的使用行为来做对照,才能猜测某一作业是否是入侵行为。
更棘手的是,很多异常入侵的方式是新发展出来的,以前从未发生或被发现过,因此无法用一般的数据检索方式来进行网络的异常入侵检测。
2数据挖掘的步骤为了能从资料中挖掘出有用且非显而易见的信息,数据挖掘的进行主要分5个步骤。
首先是确定目标,了解进行数据挖掘的目的。
因为在目的不明的状况下,无法知道应搜集哪些数据来做分析,或该使用哪一类型的工具来进行挖掘。
而且数据挖掘的成本比使用统计方法或数据检索的成本高,因此要确认统计方法和数据检索都无法产生所需要的信息后,才适合使用数据挖掘。
在明确目标后,接着是对资料进行整理和搜集,得出适合挖掘的数据。
由于现在数据的来源有很多种方式。
数据型态除了传统的文(字)数字数据外,还有网页格式、语音和图像数据。
数据挖掘的第2个步骤,就是把这些不同来源和格式的资料搜集起来,并用适当的格式来存放。
搜集好的资料并不见得就可以进行数据挖掘,因为数据中可能有些有异常,或是有些字段的值无法取得,这些都会直接影响到数据挖掘的结果。
因此第3个步骤是做数据的前置处理。
这个步骤除了处理异常值和遗漏值外,还要考虑字段是摆放数字还是文字,以及每个字段的必要性。
另外为了避免字段的度量对结果造成影响,还要考虑是否进行数据的正规化。
例如衡量长度时使用公尺或公分,会使该字段有一百倍的差距,而这一百倍的差距有可能严重影响到该字段在数据挖掘时的重要性。
第4个步骤就是对数据进行挖掘。
数据挖掘除了分类、关联分析及分群这3种公认的类型外,其余的类型到目前为止并没有一致的见解,因此后续会针对这3种公认的类型做进一步的说明。
对于一开始设定的目标,要了解适用的数据挖掘类型是哪一种,否则无法得到有用的信息。
甚至往往为了能得到有意义的挖掘结果,必须结合多种类型的数据挖掘工具。
因此了解各类型数据挖掘的定义和数据分析方法后,才能选择适当的工具进行数据挖掘。
最后对于挖掘结果的诠释,则要倚赖在线工作人员具备的背景知识来解读挖掘的结果。
因此这一部分最好由数据挖掘的人员和产生数据的人员合作,除了能适切地诠释挖掘结果外,也才能知道该如何把结果应用在实务上。
如果发现挖掘中的步骤有问题,则应考虑回到前面的步骤去重新验证。
例如认为数据挖掘的结果不理想,可以考虑使用不同的正规化方法来处理资料或进行字段转换,这样或许可以产生较佳的挖掘结果。
如果还是不太理想,可能是因为有些有用的字段没有被选取,如果能回到资料取得的步骤重新检视,或许所得的结果就能让人耳目一新。
几乎在所有的数据挖掘案例中,都要不断地回到上一步骤去验证,并进一步从挖掘结果中思考应如何修正才能获得较佳的结果。
在如此不断来回的测试中,累积对数据挖掘的经验,也才能得到满足当初所设定目标的结果。
3数据挖掘的类型虽然数据挖掘的类型该怎么划分,到现在还没有一致的见解,但公认分类、关联分析和分群3种类型的数据挖掘方式,是其中最主要的。
分类的方式主要是从现有的资料中,归纳出一个较能解释这些资料的模型,等将来有新的数据产生时,就用这个模型来预测这笔新数据的类别值。
关联分析最早是由美国的量贩店发展出来的,用来了解顾客的购买行为中,是否会有一些物品存在一起被购买的关联性。
最有名的例子就是,该量贩店发觉有一部分的顾客会同时买尿布和啤酒。
由于尿布是婴儿用品而啤酒是大人喝的,因此一开始对这二种物品经常被一起购买感到有些惊讶。
但深入了解后才知道,原来大多数有婴儿的家庭,其男主人假日会一边带小孩一边看电视转播的运动节目,因此会准备啤酒来喝。
挖掘出这样的购买行为后,量贩店便改变物品摆放的位置,把尿布和啤酒摆在相邻的货架或走道,让顾客较容易找到所需要的物品,因而提高了顾客对该量贩店的服务满意度。
数据的分群是希望尽量把相似的资料归在同一群,并把不相似的数据尽量分在不同群。
当针对一整组的数据进行其它的挖掘工作时,有时候结果会过于复杂而无法予以适当地诠释,或是无法得到较精简且有用的结果。
遇到这种情况时,若能先把资料进行分群,然后再对每一群的资料个别进行挖掘,往往能得到较有用且清晰的结果。
不管是分类、关联分析、分群或其它的数据挖掘工具,衡量一个数据挖掘方法的优劣主要是从3方面:分析效能、运算效率和结果诠释。
现今的数据挖掘方法很少能在这3方面都具有绝对的优势,因此应从这3方面来认识一个数据挖掘工具,然后根据自身的需求选择适合的工具以进行数据的挖掘。
4数据挖掘的未来挑战当数据的产生和储存越来越容易之际,对于数据挖掘工具的需求越来越多,要求也越来越高。
因此为了因应数据处理的新需求,数据挖掘方法也不断地演进。
对于一般文数字的数据,现行的数据挖掘方法要面对的挑战是如何处理大量的资料。
虽然数据挖掘工具是希望能自动分析或过滤大量的数据,但当数据笔数相当庞大时,如何在有限的时间内整理出有用的结果,对任何一个数据挖掘工具都是莫大的挑战。
目前大多数的数据挖掘方法,主要还是用来处理数字的数据,要把这些方法扩展成可以处理非数字的数据并不容易。
因为声音和影像的储存格式有很多种,要萃取出声音或影像的字段或维度以便后续的数据挖掘,到现在还没有一定的标准做法,表示这种非数字的数据挖掘还有很长的一段路要走。
参考文献:[1]张丽伟,李礼.Web挖掘中数据预处理技术研究[J].电脑知识与技术, 2010(15).[2]毕永成.Web日志处理中Apriori算法及其改进[J].电脑知识与技术, 2010(14).[3]庄小叶,周新生,郝中军,等.WEB数据挖掘研究探析[J].数字技术与应用, 2010(4).[4]黄翔.浅谈数据分析在电子商务中的应用[J].商情, 2010(13).。