浅谈数据挖掘应用
浅谈大数据下财务数据挖掘及应用

浅谈大数据下财务数据挖掘及应用引言概述:随着大数据时代的到来,财务数据挖掘逐渐成为财务领域的热门话题。
大数据技术的发展为财务数据的分析和应用提供了更广阔的空间和更高效的工具。
本文将从五个大点出发,详细阐述大数据下财务数据挖掘及应用的相关内容。
正文内容:1. 数据采集与清洗1.1 数据源的选择:在大数据时代,财务数据的来源变得更加多样化,可以包括企业内部的财务系统、外部的金融市场数据、社交媒体等。
选择合适的数据源对于财务数据挖掘的准确性和可靠性至关重要。
1.2 数据清洗与预处理:财务数据往往存在缺失值、异常值和噪声等问题,需要进行数据清洗和预处理,以确保数据的质量。
常用的方法包括缺失值处理、异常值检测和数据平滑等。
2. 数据分析与挖掘2.1 数据可视化:通过数据可视化技术,可以将财务数据转化为图表、图像等形式,直观地展示数据的分布、趋势和关联关系,帮助财务人员更好地理解和分析数据。
2.2 数据挖掘算法:在财务数据挖掘中,常用的算法包括聚类分析、分类分析、关联规则挖掘等。
这些算法可以帮助财务人员从大量的数据中发现隐藏的模式和规律,提供决策支持和业务洞察。
2.3 预测与模型建立:通过对历史财务数据的分析,可以建立预测模型,预测未来的财务状况和趋势。
常用的预测方法包括时间序列分析、回归分析和神经网络等。
3. 财务风险管理3.1 风险识别与评估:通过对财务数据的挖掘和分析,可以及时发现潜在的财务风险,如欺诈、信用风险等,并进行风险评估和预警。
3.2 决策支持:财务数据挖掘可以为财务决策提供数据支持和参考,帮助财务人员制定更科学、更准确的决策策略。
3.3 风险控制与监测:通过对财务数据的实时监测和分析,可以及时发现和控制财务风险,保障企业的财务安全。
4. 财务欺诈检测4.1 数据特征提取:财务欺诈通常具有一定的特征,如异常交易、虚假报表等。
通过对财务数据的挖掘和特征提取,可以帮助财务人员识别潜在的欺诈行为。
数据挖掘方法及其应用研究

数据挖掘方法及其应用研究数据挖掘是一种从大量数据中自动发掘出有用信息的技术,对于信息化时代的企业而言,数据挖掘技术的应用已经成为了提高业务水平和核心竞争力的必备手段。
本文将从数据挖掘的方法、应用以及研究方面进行探讨。
一、数据挖掘的方法数据挖掘的方法主要是基于数据分析和机器学习的,其中数据分析主要包括关联规则和分类预测等。
首先,关联规则挖掘是指在数据集中发掘出事物之间的关联性,比如“如果顾客购买了巧克力,那么他们很有可能也会购买口香糖”,而分类预测则是对数据进行分类,比如“根据用户的浏览记录,预测他们最可能会购买哪些商品”。
而机器学习是数据挖掘的核心技术,它是一种通过数据自我修正以提高性能的方法。
常见的机器学习方法包括决策树、神经网络以及聚类等。
决策树是一种用于分类和预测的树形结构,它将数据以节点的形式进行分类,直到数据达到叶节点,从而做出相应的决策;神经网络则是通过构建一种类比于人类大脑的模型来识别模式,进行分类或预测;而聚类则是在数据集中查找相似之处并将数据分组的方法。
二、数据挖掘的应用数据挖掘技术在各行各业的应用越来越广泛,比如在金融行业中常用于信用评估、欺诈检测以及风险管理等方面。
在零售业中,数据挖掘技术可以用于用户行为分析及商品推荐,以此提高销售额和用户忠诚度。
而在医疗领域,数据挖掘技术则可以用来提高早期预警、疾病诊断和药物研发等方面的能力。
此外,数据挖掘技术在交通、安全、舆情监测及人工智能等领域也发挥着越来越重要的作用。
三、数据挖掘的研究在数据挖掘的研究方面,目前有诸多的挑战。
首先,各类数据源的结构化程度参差不齐,挖掘数据的质量和有效性面临着较大的挑战。
其次,代表性和可扩展性是数据挖掘领域中的两大难点,它们影响着数据挖掘结果的可靠性和准确性。
另外,数据挖掘算法的集成和融合也是研究方向之一,通过多种算法的组合和协同来解决特定问题,进一步提高数据挖掘的效率和准确性。
最后,隐私保护和信息安全问题也是需要重点关注的研究方向,保障数据隐私的同时,也使得挖掘结果更加可靠。
数据挖掘的应用

数据挖掘的应用
数据挖掘是一种分析巨量数据的统计分析技术,它可以帮助企业和研究人员发现以前未知的规律和关系。
从这一点上看,数据挖掘被广泛应用于众多行业,大大提高了企业的效率和绩效。
数据挖掘可以用于市场营销。
企业可以利用数据挖掘技术分析消费者的行为习惯,找出客户的偏好,为企业提供有效的营销策略。
同时,企业也可以利用数据挖掘技术发现潜在的客户,以增加销售量和收入。
数据挖掘还可以用于金融分析。
金融分析师可以利用数据挖掘技术分析股票市场数据,更准确地预测股票价格的走势,从而更好地为投资者服务。
此外,数据挖掘还可以用于更好地了解金融行业的趋势,从而帮助金融机构制定更有效的发展战略。
数据挖掘还可以用于教育行业。
教育机构可以利用数据挖掘技术分析学生的学习情况,找出学习中存在的问题,从而更好地帮助学生提高学习效率。
数据挖掘是一种非常有用的分析工具,它能够帮助企业和研究人员发现以前难以发现的知识,从而为企业提供更多的机会,提高企业的效率和绩效。
浅谈大数据下财务数据挖掘及应用

浅谈大数据下财务数据挖掘及应用大数据下财务数据挖掘及应用引言:随着大数据时代的到来,企业面临着海量的数据,其中包括财务数据。
财务数据是企业经营活动的重要组成部分,通过对财务数据进行挖掘和分析,可以帮助企业发现潜在的商业机会、风险和问题,提供决策支持。
本文将探讨大数据下财务数据挖掘的意义、方法和应用。
一、大数据下财务数据挖掘的意义1. 提供全面的财务分析:大数据技术可以帮助企业从海量的财务数据中提取有用的信息,进行全面的财务分析。
通过对财务数据的挖掘,可以了解企业的财务状况、经营绩效和风险状况,为企业提供全面的财务分析报告。
2. 发现商业机会:大数据技术可以帮助企业发现潜在的商业机会。
通过对财务数据的挖掘,可以发现市场需求的变化、产品销售的趋势等信息,为企业提供商业机会的预测和分析。
3. 风险管理:大数据技术可以帮助企业进行风险管理。
通过对财务数据的挖掘,可以发现企业的财务风险,如财务造假、资金流动性风险等,及时采取措施进行风险控制。
二、大数据下财务数据挖掘的方法1. 数据清洗:财务数据通常包含大量的噪声和异常值,需要进行数据清洗。
数据清洗包括数据去重、数据填充、异常值处理等。
2. 数据集成:财务数据通常来自不同的系统和部门,需要进行数据集成。
数据集成包括数据格式转换、数据字段映射等。
3. 数据挖掘算法:财务数据挖掘可以采用多种算法,如关联规则挖掘、分类算法、聚类算法等。
根据具体的需求和问题,选择合适的算法进行数据挖掘。
4. 数据可视化:通过数据可视化技术,将挖掘到的财务数据以图表、报表等形式展示出来,便于用户理解和分析。
三、大数据下财务数据挖掘的应用1. 财务风险预警:通过对财务数据的挖掘,可以建立财务风险预警模型,及时发现财务风险,并采取相应的措施进行风险控制。
2. 财务绩效评估:通过对财务数据的挖掘,可以评估企业的财务绩效,包括利润率、资产回报率等指标,为企业提供绩效评估报告。
3. 成本管理:通过对财务数据的挖掘,可以了解企业的成本结构和成本驱动因素,为企业提供成本管理的决策支持。
数据挖掘技术的应用

数据挖掘技术的应用随着信息时代的到来,数据量的急剧增长让我们的生活日益依赖于数据技术。
而数据挖掘技术作为其中的重要一环,受到了越来越广泛的关注。
那么,数据挖掘技术在实际应用领域中有哪些具体的应用呢?一、智能推荐如果你在购物网站上购买过商品,在接下来的几天里可能会不断地收到与你购买的商品相关的推荐信息。
其背后的技术就是数据挖掘。
通过分析用户的购买记录、浏览记录以及其他用户的购买习惯,数据挖掘可以精准地向用户推荐相关的商品。
这不仅可以提高购物网站的用户满意度,也可以为商家创造更多的销售机会。
二、舆情分析在当前社交媒体广泛应用的背景下,舆情分析成为了一个重要的研究领域。
数据挖掘技术可以对大规模的社交媒体数据进行挖掘和分析,识别出人们关注的话题、情绪等,并据此评估公众舆情。
通过对舆情的了解,相关部门可以更准确地判断社会热点、民意倾向、危机事件等,从而做出及时有效的应对措施。
三、金融风险控制金融风险控制是目前数据挖掘技术应用比较成熟的领域之一。
在银行、保险、证券等金融机构中,数据挖掘可以通过分析客户的历史信用记录、消费习惯、偏好等信息,评估其风险水平。
例如,在评估个人信用时,数据挖掘可以分析申请人的收入、职业、信用卡还款记录等多维度信息,排除风险较高的申请人,降低银行的逾期率和不良贷款率。
四、医疗领域医疗领域的数据挖掘应用主要集中在疾病预测和诊断辅助方面。
通过分析大量的病历、体检、医学影像等数据,数据挖掘可以帮助医生快速准确地预测患者可能出现的症状及可能的疾病,并为医生提供更多的参考信息,辅助其做出诊断和治疗方案。
此外,数据挖掘还可以在临床试验、新药开发等方面发挥重要的作用,帮助医学界提高治疗效果,降低医疗成本。
五、交通运输随着城市化的发展,交通拥堵问题愈发突出。
数据挖掘可以通过分析车流量、出行时段、路况等多维度数据,提供准确的交通预测和优化策略,从而降低交通拥堵,提高出行效率。
另外,数据挖掘还可以用于智能导航、车辆识别、车辆监控等方面,为交通运输提供更加智能化和安全的服务。
数据挖掘的应用

数据挖掘的应用数据挖掘是一种从大量数据中发现模式、关联和趋势的过程。
它通过使用统计分析、机器学习和人工智能等技术,匡助企业和组织从海量数据中提取有价值的信息,并用于决策制定、市场营销、客户关系管理、风险评估等领域。
以下是数据挖掘在不同领域的应用示例。
1. 零售业数据挖掘在零售业中的应用非常广泛。
通过分析顾客购买历史和行为模式,零售商可以了解顾客的喜好和需求,从而进行个性化推荐和定价策略。
例如,通过挖掘购买历史数据,可以发现某些产品往往同时被购买,从而进行捆绑销售;通过分析购物篮数据,可以发现顾客的购买习惯,从而进行交叉销售。
2. 金融业数据挖掘在金融业中的应用可以匡助银行、保险公司等机构进行风险评估和欺诈检测。
通过分析客户的信用历史、交易模式和行为特征,可以预测客户的信用风险和违约概率。
同时,数据挖掘还可以用于检测信用卡欺诈、保险欺诈等非法行为,提高金融机构的安全性和效率。
3. 健康医疗数据挖掘在健康医疗领域的应用可以匡助医生和医疗机构进行疾病预测、诊断和治疗。
通过分析患者的病历、生理指标和基因数据,可以发现疾病的风险因素和早期预警信号。
同时,数据挖掘还可以匡助医生进行个性化治疗方案的制定,提高治疗效果和患者的生活质量。
4. 交通运输数据挖掘在交通运输领域的应用可以匡助交通管理部门进行交通流量预测和拥堵管理。
通过分析交通监控数据、车辆轨迹数据和道路状况数据,可以预测交通拥堵的发生和扩散,并采取相应的交通调控措施。
同时,数据挖掘还可以匡助优化交通信号配时、路线规划和公共交通运营,提高交通运输的效率和安全性。
5. 社交媒体数据挖掘在社交媒体领域的应用可以匡助企业进行用户行为分析和社交网络分析。
通过分析用户在社交媒体上的互动、兴趣和关系,可以了解用户的需求和偏好,从而进行精准营销和用户个性化推荐。
同时,数据挖掘还可以匡助企业发现潜在的影响者和意见领袖,进行社交网络营销和口碑传播。
总结起来,数据挖掘在各个领域的应用都能带来巨大的商业价值和社会效益。
简述数据挖掘的主要作用

简述数据挖掘的主要作用数据挖掘是指通过分析大量的数据,从中发掘出有用的信息和知识,以支持决策和行动的一种技术。
在当今信息时代,数据挖掘已经成为了各个领域中不可或缺的一部分。
本文将简述数据挖掘的主要作用。
一、市场营销数据挖掘可以帮助企业更好地了解市场需求和客户行为,从而制定更加精准的营销策略。
通过分析客户的购买历史、购买频率、购买偏好等信息,企业可以更好地了解客户需求,从而针对性地推出产品和服务。
二、金融风险控制银行和保险公司等金融机构需要对风险进行有效的识别和控制。
数据挖掘可以帮助金融机构分析客户信用记录、交易历史、欺诈行为等信息,从而及时识别潜在的风险,制定相应的控制策略。
三、医疗健康数据挖掘可以帮助医疗机构分析病人的历史病例、病情进展、治疗效果等信息,从而更好地制定治疗方案和预测病情发展趋势。
此外,数据挖掘还可以帮助医疗机构进行疾病监测和预警,提高公共卫生水平。
四、智能推荐数据挖掘可以根据用户的历史行为和偏好,为用户推荐符合其需求的产品和服务。
例如,电商平台可以根据用户的购买历史和搜索记录,为用户推荐更加符合其需求的商品。
五、社会管理数据挖掘可以帮助政府和社会管理机构了解社会问题的本质和趋势,从而制定更加有效的政策和措施。
例如,通过分析社会犯罪的模式和趋势,警方可以更好地制定防范和打击犯罪的策略。
六、科学研究数据挖掘可以帮助科学家从大量的数据中发现新的规律和知识,从而推动科学研究的进展。
例如,天文学家可以通过分析天体运动的规律,探索宇宙的奥秘。
综上所述,数据挖掘在各个领域中都有着广泛的应用。
通过挖掘大量的数据,我们可以更好地了解客户需求、识别潜在风险、制定更加精准的政策等。
数据挖掘的应用将会越来越广泛,对于提高我们的生产和生活效率、推动社会进步和发展都具有重要的意义。
数据挖掘的实际应用

数据挖掘的实际应用数据挖掘是一种通过分析大量数据来发现隐藏模式、关联和趋势的过程。
它基于统计学、机器学习和人工智能的方法,已经在各个领域得到了广泛的应用。
本文将探讨数据挖掘在实际应用中的一些典型案例。
一、市场营销数据挖掘在市场营销中起到了至关重要的作用。
通过对客户数据进行分析,企业可以更好地了解市场需求,制定个性化的推广策略。
例如,企业可以通过对顾客购买记录的挖掘,发现他们的购买偏好,从而准确预测客户未来的需求,并针对性地提供个性化的推荐产品。
此外,数据挖掘还可以帮助企业识别潜在的市场细分,帮助企业更好地制定营销策略,提升市场竞争力。
二、金融风险管理金融领域是数据挖掘应用最为广泛的领域之一。
银行和金融机构通过对客户的信用评级、历史交易记录等进行数据挖掘,可以更好地评估客户的信用风险。
此外,数据挖掘还可以帮助金融机构发现欺诈行为,通过对大量的交易和账户数据进行分析,发现异常模式,及时发出警报。
这样可以有效地减少金融诈骗的风险,保护客户的资产安全。
三、医疗健康数据挖掘在医疗健康领域也有广泛的应用。
通过对大量的病例数据进行分析,可以挖掘出一些潜在的疾病模式和风险因素。
这有助于医生做出更准确的诊断和治疗决策。
此外,数据挖掘还可以用于发现新的药物组合和疾病治疗方式。
通过分析大量的医学文献和试验数据,可以发现一些药物之间的相互作用,并预测它们对某些疾病的疗效。
四、社交网络社交网络是数据挖掘的另一个重要应用领域。
通过对用户在社交网络上的行为和兴趣进行挖掘,可以发现用户之间的社交关系和兴趣相似性。
这对于社交媒体平台的个性化推荐和广告投放非常重要。
通过分析用户的喜好和行为,社交媒体平台可以更好地推荐相关的内容和产品,提高用户的参与度和用户体验。
五、制造业数据挖掘在制造业中也有广泛的应用。
通过对生产数据和设备数据进行挖掘,企业可以发现生产过程中的异常和风险,及时采取措施避免可能的故障和生产线停机。
此外,数据挖掘还可以帮助企业优化生产计划和供应链管理,提高生产效率和产品质量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
作者简介:1)牛承珍,女,1968年11月出生,太原理工大学计算机与软件学院在读研究生,030024,山西省太原市收稿日期:2008-03-17●信息技术浅谈数据挖掘应用牛承珍1) 马季兰2)(太原理工大学计算机与软件学院)摘 要:数据挖掘,作为一种新颖的数据分析手段,在学校、银行、电信、股市、保险、交通、零售等领域已得到广泛的应用。
文章从高校、金融企业和零售企业入手,分析数据挖掘技术在其中的应用,以及存在的问题和前景展望。
关键词:数据挖掘;高校;金融;超市中图分类号:TP311 文献标识码文章编号:1004-6429(2008)03-0031-021 数据挖掘概述1.1 数据挖掘的定义数据挖掘(Data M ining )就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。
即通过预测未来趋势及行为,做出前瞻性的、基于知识的决策,目标是从数据库中发现隐含的、有意义的知识,为人们的正确决策提供帮助。
1.2 数据挖掘的功能1)自动预测趋势和行为:数据挖掘自动在大型数据库中寻找预测性信息。
以往需要进行大量手工分析的问题,如今可以迅速直接由数据本身得出结论。
2)关联分析:目的是找出数据库中隐藏的关联网,生成的规则带有可信度。
3)聚类:数据库中的记录可被化分为一系列有意义的子集,即聚类。
聚类增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。
4)概念描述:对某类对象的内涵进行描述,并概括这类对象的有关特征。
概念描述分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述不同类对象之间的区别。
5)偏差检测:数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。
偏差包括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。
2 数据挖掘的应用数据挖掘技术已应用于许多领域,如在学校、银行、电信、股市、保险、交通、零售等领域已得到广泛的应用。
2.1 数据挖掘技术在高校中的应用随着招生规模的扩大,高校的学生人数就达到上万人,甚至几万人,考试成绩达到几十万个数据,还有大量的学习成绩以外的影响因素,传统的学习成绩分析方法已不能完全满足需要,对此引入数据挖掘技术以找到影响学生成绩的真实原因,制定相应的措施,提高教育教学质量。
1)将关联规则的方法运用到教学问题中,从教学评价数据中进行数据挖掘,找到课堂教学效果与教师状态的关系问题,在班级排课时,注意一个教学班中配备教师的年龄、职称、学历等的合理分配。
2)把学生的学习特征存入模型库,教师可以通过它及时地了解学生的需求、兴趣爱好、个性差异等信息,并以此为依据对不同学生提供动态的学习内容、推荐个性化的学习材料等服务,真正实现个性化教学。
3)利用数据挖掘工具,对收集的信息进行如“去噪”等处理,对学生的学习成绩数据库、行为记录数据库、奖励处罚数据库等进行分析处理,及时得到学生的评价结果,对学生出现的不良学习行为进行及时指正。
4)按照教学培养目标,利用粗糙集方法,对数据仓库资料进行归类。
为了解学生的想象能力,可以把有关课程中的成绩以及这些课程中有关想象能力的考核成绩分离出来,单独分析渗透在不同领域的学生想象能力,从而对学生的想象能力进行科学评价和分析,发现其潜力。
2.2 数据挖掘技术在金融企业中的应用1)数据挖掘技术在证券行业中得到广泛应用,数据挖掘技术作为分析与辅助决策工具已经越来越得到国内券商的重视。
其典型应用包括:①客户分析:建立数据仓库来存放对全体客户、预定义客户群、某个客户的信息和交易数据,并通过对这些数据进行挖掘和关联分析,实现面向主题的信息抽取。
②咨询服务:根据采集行情和交易数据,结合行情分析,预测未来大盘走势,并发现交易情况随着大盘变化的规律,并根据这些规律做出趋势分析,对客户针对性进行咨询。
③风险防范:通过对资金数据的分析,可以控制营业风险,同时可以改变公司总部原来的资金控制模式,并通过横向比较及时了解资金情况,起到风险预警的作用。
④经营状况分析:通过数据挖掘,可以及时了解营业状况、资金情况、利润情况、客户群分布等重要的信息,并结合大盘走势,提供不同行情条件下的最大收益经营方式。
同时,通过对各营业部经营情况的横向比较,以及对本营业部历史数据的纵向比较,对营业部的经营状况作出分析,提出经营建议。
2)数据挖掘技术也应用于银行业,主要有以下几个方面:①对账户进行信用等级的评估:利用数据挖掘工具进行信用评估的最终目的是从已有的数据中分析得到信用评估的规则或・13・标准,并应用到对新的账户的信用评估。
②金融市场分析和预测:对庞大的数据进行主成分分析,剔除无关的,甚至是错误的、相互矛盾的数据“杂质”,以更有效地进行金融市场分析和预测。
③分析信用卡的使用模式:通过数据挖掘,可以得到这样的规则,通过了解客户使用信用卡的习惯性模式,一方面,可以监测到信用卡的恶性透支行为;另一方面,可以识别“合法”用户。
④发现隐含在数据后面的不同的财政金融指数之间的联系。
⑤探测金融政策与金融业行情的相互影响的关联关系。
数据挖掘可以从大量的历史记录中发现或挖掘出这种关联关系更深层次的、更详尽的方面。
3)数据挖掘技术也应用于保险业:①保险金的确定:对受险人员的分类有助于确定适当的保险金额度。
通过数据挖掘可以得到对不同行业的人、不同年龄段的人、处于不同社会层次的人的保险金该如何确定。
②险种关联分析:分析购买了某种保险的人是否同时购买另一种保险。
预测什么样的顾客会购买新险种。
2.3 数据挖掘技术在零售企业中的应用1)客户分片数据挖掘:通过分析客户购买商品的行为,利用数据挖掘技术将这些客户分成不同的类别,这个过程称之为客户分片(customer segmentation)。
客户购买商品的行为可能是:购物时间是集中性购买,还是分散性购买;所购产品是趋向于物美,还是偏好价廉;选择产品的类型是多样,还是单一等。
针对不同类型的客户,商家推出不同的策略,以迎合不同客户的购物习惯,这样,所推出的策略就更具有针对性,客户也感到了更多的人文关怀。
2)购物篮分析:购物篮分析的主要目标是在顾客的购买交易中分析出能够同时购买一类产品或一组产品的可能性(相互关联)。
从超市销售管理系统、客户资料管理及其他运营数据中,可以收集到关于商品销售、客户信息、库存及超市店面信息等的信息资料。
数据从各种应用系统中采集,经按不同条件分类,存放到数据仓库,允许管理人员、分析人员、采购人员、市场人员和客户访问,利用数据挖掘工具对这些数据进行分析,为管理者提供高效的科学决策工具。
3 数据挖掘应用的困境和展望数据挖掘作为一种新颖的数据分析手段,在我国越来越多的企事业单位中得到应用,被广泛应用于数据库营销、客户关系管理、顾客行为预测、市场趋势预测等。
但是,随着数据挖掘应用的深入,对该项技术的误解也在增多,加上目前数据挖掘本身的局限和人为的局限,导致数据挖掘在应用过程中出现问题。
3.1 数据挖掘应用的困境1)数据挖掘的内在局限性:对数据挖掘技术期望过高是数据挖掘应用过程中经常出现的一个问题。
企业管理人员或者业务人员抱着美好的愿望,希望数据挖掘像“魔杖”一样解决面临的棘手问题,但是如果要求的结果与已有的数据没有关联(或者相关性太小),数据挖掘是无能为力的。
2)把数据挖掘当作一个IT项目来做:容易把数据挖掘理解成一种管理工具,因此倾向于把数据挖掘建成类似一种MIS 的东西,希望有一个界面,登录进去后,点几个按钮,神奇的预测结果就展现出来。
这种僵硬的做法有可能窒息数据挖掘的强大威力。
3)技术采用的偏颇:对数据挖掘算法技术理解的不全面,也可能导致企业只愿意选择那些外观容易理解的技术,使得数据挖掘的功能得不到充分发挥。
4)数据挖掘工具的局限:数据挖掘的60%~80%工作量花在数据准备阶段。
建模过程需要大量的手工劳动。
目前的数据挖掘软件工具中,各算法采用默认的参数设置并不总是最合理的,不能得到最佳的预测模型,对于每个业务新问题,都要重新探索数据的相关性,进行算法参数的重新调整和配置。
但是,由于现实问题太复杂,已有的原理并不能始终指导模型的调优方向,更多的时候还是依赖大量的数据试验摸索前进,建模的过程也是漫长痛苦的。
现有的很多数据挖掘工具并不支持复杂调优过程的自动化。
3.2 数据挖掘应用的展望计算机硬件性能的巨幅提升和数据库技术的飞速发展,使得企业级大数据量的计算成为现实,挖掘工具越来越强大,汇合的算法越来越多,预测类算法将吸纳颇具新意的算法,并将实现算法的自动选择和参数自动调优。
作为一种无法绕过去的必需的技术,数据挖掘的应用领域将越来越广。
参考文献[1] Margaret H・Dunham.数据挖掘教程[M].北京:清华大学出版社,2005.[2] David Hand Heikki Mannila Padhraic Smyth.数据挖掘原理[M].北京:机械工业出版社,2003.[3] 戴永群.数据挖掘在教学中的应用[J].福建电脑,2005(9).Application of Data MiningNiu Chengzhen,Ma Jilan ABSTRACT:Data mining,as a novel means of data analysis in schools,banking,telecommunications,the stock market,insurance, transportation,retail,and other fields,has been widely applied.This paper,from its applicatin in colleges,universities,enterprises and retailing enterprises,analyzes problems and prospects.KE Y WOR DS:Data M ining;C ollege;Financial;Supermarket・23・。