大数据案例分析-南京大学
大数据分析的实际案例

大数据分析的实际案例数据从来不是孤立的存在,它们背后总是有一个故事,讲述着人们的生活、社会的变迁。
大数据是当今互联网时代的一个重要词汇,它所带来的不仅仅是数据的增量,更是数据的改变和呈现方式的更新。
各个产业领域都在乘风破浪,试图用大数据技术来变革自己的商业模式和服务方式。
下面,我们来看看大数据分析在实际商业中的应用。
案例一:亚马逊的推荐算法在网购时,我们常常耳熟能详的“看了本书的人也看了……”是怎么实现的呢?亚马逊的推荐算法就是一种基于大数据的人工智能算法。
亚马逊通过分析大量的交易和用户数据,来准确地预测用户的购物喜好和需求,并将推荐列表个性化地展现给不同用户。
该算法的好处不仅在于提高了用户购买率,还可以减少商品的滞销和回收,提高了商家品牌的知名度。
案例二:滴滴大数据驱动的智慧出行随着经济的发展,城镇化进程加速,交通拥堵成了日常生活中的一大问题。
滴滴大数据的智慧交通方案的出现,真正为解决这个问题提供了一条可行之路。
滴滴依托庞大的用户交易和位置数据,分析出不同地区的交通拥堵状况,并把这些信息反馈给司机,驾驶员便可根据最佳路径规划进行行驶和接送。
除此之外,滴滴还可以基于用户出行数据和天气状况,预测出车辆需求和交通高峰时间,为用户和司机提供更加便利和高效的交通服务。
案例三:浴室卫浴界的大数据在传统的卫浴行业中,产品的生产和销售往往仅基于人的直觉或者经验,缺乏科学而系统的方法。
以艾美特浴室的实践为例,该公司在产品研发和销售过程中,依托大数据技术开展了深入分析,从产品设计、生产制造、营销策略、服务体系全面提升企业的竞争力。
从智慧生产到智慧物流,从精准营销到售后服务,由此形成了一套完整、科学的数字管理模式,为制造企业实现高质量发展提供了有力保障。
结语大数据分析技术为商业提供了更加精细、便捷、高效的服务,它的应用范围是非常广泛的。
无论是从卫浴企业到交通出行,再到电商购物领域,每一种行业都可以通过大数据技术对自己的业务进行创新和优化。
院校大数据治理 典型案例

院校大数据治理典型案例
1. 中国人民大学大数据治理案例:中国人民大学利用大数据技术,实施了校园安全管理的大数据治理。
通过收集学生的通行数据、监控视频等信息,进行分析和挖掘,构建了校园安全风险预警模型,可以实时监控校园内的安全情况并及时发出警报,有效提升了校园安全管理的能力。
2. 北京大学大数据治理案例:北京大学利用大数据技术,实施了学生学业管理的大数据治理。
通过收集学生的学习数据、课程成绩等信息,运用数据分析模型,可以分析学生的学业情况,对于学业进展缓慢的学生发出预警并提供针对性的帮助,提升了学生的学业成绩和学习效果。
3. 清华大学大数据治理案例:清华大学利用大数据技术,实施了校园能源管理的大数据治理。
通过收集校园内各个建筑的能源消耗数据,利用数据挖掘和分析技术,可以分析出能源的使用趋势和高耗能的区域,从而制定出相应的节能措施,提升了清华大学的能源利用效率。
4. 上海交通大学大数据治理案例:上海交通大学利用大数据技术,实施了校园人员管理的大数据治理。
通过收集校园内学生和教职工的通行记录、消费记录等信息,通过建立人员行为模型,可以分析出异常行为和人员活动规律,从而提升校园安全防控和学生管理水平。
这些大数据治理案例展示了高校在利用大数据技术进行校园管
理和优化的实践经验,通过大数据的收集、分析和挖掘,可以更加科学地进行决策,提升管理效率和服务质量。
大数据的挖掘与应用实践案例分析

大数据的挖掘与应用实践案例分析近年来,随着互联网的不断发展和数据技术的不断进步,大数据的概念越来越被人们所重视。
大数据的挖掘和应用已经在各个领域得到了广泛应用。
本文将对大数据的挖掘与应用实践案例进行分析。
一、大数据的概念大数据是指规模超出传统数据处理能力范围的数据集合。
这些数据一般具有高维度、高密度和高速度的特点,需要采用特殊的工具和算法进行存储、处理和分析。
大数据的出现,对人们的生产生活带来了极大的变化。
二、大数据的挖掘大数据的挖掘包括数据清洗、数据集成、数据转换、数据信息处理、数据建模等步骤。
其中数据清洗是指对原始数据进行预处理,把无用的、噪声的和重复的数据清除掉,保证数据的准确性和可靠性。
数据集成是把来自不同数据源的数据进行整合,建立一个完整的数据集。
数据转换是将数据标准化、归一化、统一格式化处理,保证不同数据之间的一致性。
数据信息处理是对数据进行分析、分类、聚类、关联规则挖掘等操作。
数据建模是从数据中提取出模型,用于进行分析和预测。
三、大数据的应用实践1、智能制造领域智能制造是指在生产过程中利用先进的数字技术和大数据技术,对生产过程进行优化和智能化管理。
智能制造需要通过大数据技术对生产过程进行实时监测、分析和预测,以达到生产效率的最大化和生产成本的最小化。
比如,facebook利用大数据技术对全球的生产工厂进行精细化管理,节约了大量的生产成本。
2、智慧城市领域智慧城市是指在城市管理中,利用现代科技手段和大数据技术,实现城市内公共服务的智能化和信息化。
智慧城市需要利用大数据技术进行城市数据采集、处理、分析和决策,从而实现交通、能源、环境、安全等多个领域的综合管理。
比如,纽约市利用大数据技术对城市中的垃圾箱进行智能化管理,可以根据垃圾的填充程度来合理安排清运任务,提高垃圾处理的效率。
3、金融领域金融业是大数据技术的典型应用领域。
现代金融业需要通过大数据技术对市场变化、企业风险和金融安全等方面进行全面的分析和预测。
案例检索报告大数据分析(3篇)

第1篇一、引言随着信息技术的飞速发展,大数据时代已经到来。
大数据作为一种新型的数据资源,其蕴含的价值逐渐被社会各界所重视。
在司法领域,大数据分析的应用为司法实践提供了新的思路和方法,有助于提高司法效率、保障司法公正。
本报告通过对相关案例的检索和分析,探讨大数据分析在司法领域的应用现状、优势及挑战。
二、案例检索与分析1. 案例背景近年来,我国司法领域大数据分析的应用案例不断涌现。
以下列举几个具有代表性的案例:案例一:某地法院利用大数据分析技术,对辖区内的刑事案件进行预测预警,有效预防和打击犯罪。
案例二:某地检察机关通过大数据分析,对涉案人员进行风险评估,提高公诉效率。
案例三:某地公安部门运用大数据分析,协助侦破一起重大经济犯罪案件。
2. 案例分析(1)案例一:该案例中,法院通过收集、整合辖区内的各类数据,运用大数据分析技术,对犯罪趋势进行预测预警。
具体做法如下:①数据收集:收集辖区内的人口、经济、治安等方面的数据。
②数据清洗:对收集到的数据进行清洗,确保数据质量。
③数据挖掘:运用大数据分析技术,对数据进行分析,挖掘犯罪规律。
④预测预警:根据分析结果,对犯罪趋势进行预测预警,为法院审判提供参考。
(2)案例二:该案例中,检察机关通过大数据分析,对涉案人员进行风险评估。
具体做法如下:①数据收集:收集涉案人员的个人信息、犯罪记录、社会关系等方面的数据。
②数据清洗:对收集到的数据进行清洗,确保数据质量。
③数据挖掘:运用大数据分析技术,对数据进行分析,评估涉案人员的风险等级。
④公诉决策:根据风险评估结果,对公诉案件进行决策。
(3)案例三:该案例中,公安部门运用大数据分析,协助侦破重大经济犯罪案件。
具体做法如下:①数据收集:收集涉案企业、人员、资金等方面的数据。
②数据清洗:对收集到的数据进行清洗,确保数据质量。
③数据挖掘:运用大数据分析技术,对数据进行分析,挖掘犯罪线索。
④案件侦破:根据分析结果,协助侦破重大经济犯罪案件。
大数据分析实践案例研究

大数据分析实践案例研究随着信息技术的迅猛发展,人们积累了大量的数据。
这些数据可以从不同的角度进行分析和应用,如市场研究、公共管理、金融分析等。
在这些领域,大数据分析已成为支持决策制定的重要工具。
下面,我们来看几个实际案例,探讨如何通过大数据分析提高决策的有效性。
1. 零售市场分析在零售市场,店家们需要了解自己的目标顾客群体和他们的购买习惯。
传统的统计学方法可能不再适用,因为统计样本可能有偏差。
但是,随着电子商务的普及和电子支付的普及,零售商可以收集大量的数据。
使用大数据分析技术可以更准确地分析和预测消费者的购买习惯。
比如,当客户购物时,他们经常使用的信用卡可以记录下来。
通过分析客户消费的时间、地点、金额,零售商可以了解客户的喜好和购物趋势。
2. 医疗保健医疗保健领域也需要大数据分析,以从复杂的医疗数据中发现有意义的模式。
医疗保健数据通常包括来自医生、护士以及其他医疗保健专业人员的医疗记录和病人的生理状态。
这些数据可以用于优化病人的诊断和治疗方案,同时可以在病人爆发疾病的早期发现和预防方面发挥作用。
例如,大数据分析可以通过监测病人的体温、血压和心率等指标,来提前发现可能存在的危险因素。
医疗保健机构也可以使用数据分析来发现哪些治疗方式或药物最为有效。
3. 城市规划城市规划需要综合考虑交通、环境、能源等多个方面的因素。
对于城市规划师来说,需要考虑未来的人口增长、经济发展趋势等因素。
通过收集和分析历史数据、人口普查数据、公共交通使用情况等数据,城市规划师可以了解人口变化的趋势和城市交通情况,以便建议改善交通。
城市规划师还可以分析公共设施,如学校、医院、警察局、火车站等,以了解哪些设施未满足当地需求。
4. 金融分析大数据分析也在金融业中发挥作用。
传统的金融分析方法主要依赖于财务报表和财务比率。
但是,对于大型金融机构而言,这些方法往往不够精确。
数据分析可以通过分析股票交易和股价波动等数据,来预测证券市场的走势。
大数据应用的典型案例

大数据应用的典型案例随着信息技术的快速发展,大数据应用在各个领域都得到了广泛的应用。
下面将列举10个典型的大数据应用案例。
1. 电商推荐系统电商平台通过收集用户的购买记录、浏览记录、搜索记录等大量数据,利用大数据分析的技术,可以为用户提供个性化的推荐服务。
通过分析用户的行为模式和兴趣偏好,推荐系统可以准确地推荐用户可能感兴趣的商品,提高用户的购物体验和转化率。
2. 金融风控金融行业需要对客户进行风险评估,以便决定是否提供贷款或信用卡等服务。
大数据分析可以帮助金融机构从海量数据中识别出潜在的欺诈行为、风险因素和信用评分等,提高风险管理能力和决策效率。
3. 智能交通交通运输领域是一个典型的大数据应用场景。
通过收集交通流量、车辆位置、道路状况等数据,可以实现智能交通控制、拥堵预测和优化路线规划等功能。
通过大数据分析,可以提高交通系统的效率和安全性,减少交通堵塞和事故发生。
4. 医疗健康在医疗健康领域,大数据应用可以帮助医生更准确地诊断疾病、制定治疗方案和预测疾病的发展趋势。
通过分析患者的病历、影像数据和基因组数据等,可以发现疾病的潜在风险因素和治疗效果,提高医疗服务的质量和效率。
5. 城市规划大数据应用可以帮助城市规划部门进行城市规划和管理。
通过收集城市的人口数据、交通数据、环境数据等,可以分析城市的发展趋势和问题,帮助决策者做出科学的规划和决策,提高城市的可持续发展和居民的生活质量。
6. 航空安全航空公司通过收集飞机的传感器数据、机组的操作数据、气象数据等,可以进行飞行安全分析和预测。
通过大数据分析,可以识别潜在的飞行风险和故障模式,提前采取措施避免事故发生,提高航空安全。
7. 物流管理物流行业需要管理庞大的货物流动和仓储配送等环节,大数据应用可以帮助物流企业实现精细化管理和优化运营。
通过收集货物的运输数据、仓库的存储数据、车辆的位置数据等,可以实现货物跟踪、配送路线优化和库存管理等功能,提高物流效率和客户满意度。
大数据应用的典型案例和分析

大数据应用的典型案例和分析摘要本文将介绍几个大数据应用的典型案例,并对每个案例进行分析。
这些案例涉及到不同行业,包括零售、金融、医疗等。
通过分析这些案例,我们可以深入了解大数据应用在不同行业中的应用场景、挑战和价值。
1. 零售行业案例一:顾客行为分析在传统零售行业中,顾客行为分析一直是一个重要的课题。
随着大数据技术的发展,零售企业可以收集大量的顾客数据,包括购买历史、浏览记录、社交媒体活动等。
通过对这些数据的分析,零售企业可以更好地了解顾客的行为习惯和偏好,从而优化产品定价和促销策略,提高销售效果。
案例二:供应链优化供应链管理是零售行业中的一个重要环节。
大数据应用可以帮助零售企业实时跟踪物流信息、订单履行情况和库存水平等。
通过对供应链数据的分析,零售企业可以发现潜在的瓶颈和风险,并及时采取措施进行优化,从而提高物流效率和降低成本。
2. 金融行业案例一:信用评估在金融行业中,信用评估是一个关键的业务环节。
传统的信用评估方式主要依靠个人申请表格和信用报告,而大数据技术可以为金融机构提供更全面和准确的信用评估数据。
通过分析个人的消费行为、社交网络活动和其他相关数据,金融机构可以更准确地评估个人的信用风险,从而更好地决策是否给予贷款或者设置利率。
案例二:欺诈检测金融行业中存在着许多欺诈活动,大数据技术可以帮助金融机构更好地检测和预防欺诈行为。
通过分析大量的交易记录、网络活动等数据,金融机构可以发现异常模式和风险指标,及时采取措施阻止欺诈行为的发生。
3. 医疗行业案例一:疾病诊断大数据技术在医疗行业中的应用可以提高疾病诊断的准确性和效率。
通过分析大量的医疗记录、基因数据和其他相关的健康数据,医疗机构可以建立更准确的疾病模型,帮助医生进行疾病的早期诊断和治疗决策,从而提高治疗效果和患者的生存率。
案例二:公共卫生管理大数据技术在公共卫生管理中也发挥着重要作用。
通过分析大量的流行病数据、社交网络数据和移动定位数据,卫生部门可以及时发现和追踪疫情的爆发,制定相应的防控措施,保护公众的健康安全。
大数据十大经典案例

引言概述:本文将介绍大数据领域的十个经典案例,并探讨它们在不同领域的应用,这些案例涵盖了金融、医疗、零售、交通和市场营销等领域。
通过详细阐述这些案例,读者将了解到大数据技术对于提高业务效率和创新的重要性。
正文内容:1.金融领域的大数据案例1.1.金融风控:通过大数据分析大量的用户数据,金融机构可以更好地评估借贷风险,提高风控能力,降低违约概率。
1.2.欺诈检测:利用大数据技术,金融机构能够快速发现可疑的交易模式,及时采取措施避免欺诈行为。
2.医疗领域的大数据案例2.1.个性化医疗:利用大数据分析患者的基因数据和病历资料,医疗机构可以根据个体差异制定个性化的治疗方案,提高医疗效果。
2.2.疾病预测:通过分析大规模的医疗数据,可以发现潜在的疾病模式,提前预测患者可能的健康问题,及早干预治疗。
3.零售领域的大数据案例3.1.消费者行为分析:通过对消费者购买记录和行为数据的分析,零售商可以了解消费者的偏好和购买习惯,从而进行更精确的市场定位和产品推广。
3.2.库存管理优化:通过对销售数据和库存数据的分析,零售商能够做出更准确的库存预测,减少库存积压和缺货现象,提高利润率。
4.交通领域的大数据案例4.1.交通流量优化:通过对车流量和道路状况的实时数据进行分析,交通管理部门可以合理调度交通信号灯和路线规划,减少交通拥堵。
4.2.共享交通:通过运用大数据技术,共享交通平台可以更好地预测和满足乘客需求,实现更高效的交通资源利用。
5.市场营销领域的大数据案例5.1.目标市场定位:通过对大量市场数据的分析,企业可以了解不同市场的消费者需求和趋势,从而精确地定位目标市场。
5.2.营销策略优化:通过对市场活动和广告效果的追踪分析,企业可以优化营销策略,提高广告投放的回报率。
总结:通过对这十个大数据经典案例的分析,我们可以看到大数据技术在各个领域的广泛应用。
它不仅能够提高业务效率,降低风险,还能够促进创新和发展。
随着技术的进步和数据规模的增加,大数据将在未来发挥越来越重要的作用。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高 阳 教授/博导
王皓博士/副研究员,史颖欢 博士/副研究员 南京大学软件新技术国家重点实验室 江苏省软件新技术与产业化协同创新中心 中国计算机学会大数据专家委员会
提
1
2 3 4 5
纲
大数据应用背景
互联网大数据应用
工业大数据应用 政务大数据应用 大数据与智慧城市
大数据案例分析
1
大数据应用背景
9
10 11
2240.50
2202.70 2505.80
2244.50
2402.10 2773.30
4.00
199.40 267.50
0.18%
9.05% 10.68%
负荷为333下的煤耗概率密度曲线
12
AVG
3121.40
3385.%
2015年负荷预测值和真实值对比
489
297 92.2 362 142 556 23.7 154
95.8
53.2 18.1 69.7 20.1 69.5 3.44 18.1
5.1
5.58 5.09 5.19 7.06 8 6.89 8.51
77.36
41.47 13.01 38.48 17.38 59.75 2.63 48.37
8.26
数据量:
每天登陆的不同用户数:PC端10万级;APP端万级
每天产生的日志记录:PC端和APP端均有百万条 房源数量级:新房1.8万,二手房200万套左右
高峰时段并发访问:万级用户
365网推荐系统:项目概况
365网推荐系统:用户画像
365网推荐系统:用户画像
算法方案: 冷启动用户:热门标签 低频访问用户:使用K-means进行用户聚类,为目标用户找到距离最 近的聚类中心,将聚类中心的标签作为其画像。
高频访问用户:使用频次统计结合行为优先级加权,按频率设定标签。
算法结果: 个性化用户画像精准定位
365网推荐系统:用户画像
365网推荐系统:个性推荐
模块需求: 推荐结果:根据用户访问记录结合用户画像、房源标签,预测用户可 能感兴趣的房源 实时更新:推荐列表随用户点击实时变化
三,四,五
一,二
1 1 2 3 4
全网全指标预测 ——高斯特征抽取聚类
x0 x1 x2 x23
以天为粒度构成序列:
x0 1 2 23 where k xk xk 1
依据n个历年同期序列,可以抽出48个特征值:
n
0
1
2
3
23
输出
测试结果
数据压缩测试 文件夹名称 原始大小 (MB) 压缩后的大小 (MB) 压缩比 压缩时间(s) 解压时间(s)
dcc(.hda)
dtl(.hda)
358
585
43.6
83.5
8.21
7.01
36.87
69.99
4.23
7.74
nh(.hda)
rd(.hda) sw(.hda) xcc(.hda) xtl(.hda) xtx(.hda) zyzhly(.hda) ssdata(.rda)
全南京市,5000基站,8个指标,24小时值,之前一年数据量>10GB
电信大数据:话务预测
需求:通过对各小区(一个基站包含多个小区)上指标分析与建模,预 测各小区未来某天的指标值。 数据量:全南京市,7000多小区,8个指标,24小时值,一年数据量 >13GB。
任务:根据需求,预测任务具体分为两类,
国内外竞争产品
Weka 新西兰Waikato大学研发 数据源/数据格式/算法/用户界面 单机算法(分类、聚类、关联规则等等)
Mahout
Apache开源项目 采用Map/Reduce,并行化数据挖掘算法
用户界面:命令行交互
DoDo 自主知识产权 采用Map/Reduce,并行化数据挖掘算法 友好的图形界面
0 , 0 , 1 ,1 , 23 , 23
每个小区每天可以表示成48维的特征向量,针对小区进行特征聚类,利用聚类 结果以及以往同期数据进行预测。
主要案例
电力(环保)大数据 江苏方天电力技术有限公司
环保设施工况寻优模块建模及典型机组应用技术服务
火电机组运行人员行为分析模块建模及典型机组应用技术服务 燃煤机组超低排放监测数据辨识模型建模及典型机组应用技术服 务项目
知识产权
基于Hadoop的KNN,FP,SVM,PLSA以及文档分类等算法
申请国家发明专利9项,授权4项:201210071445.X,201210072524.2等
大数据技术和案例分析
2
互联网大数据应用
365网推荐系统:项目概况
需求:通过对365网APP端和Web端的用户访问日志学习推荐系统模型到达 提高点击推荐到买房的转化率的目的。
干道预警 工作日,周末
异常小区预警
行业应用 景区预警
七个法定节假日
全网预测,高效调整和保障
异常小区预警 ——平滑特征抽取,时间维度聚类 异常预警处理方法:
针对小区历史数据,提取每天特征值(平滑后12个值); 对该小区一周七天进行聚类(例如上述例子可以分为两类),并且以属于该 类的聚类中心进行线性插值后的24个值作为一小区的平时正常话务量; 实时监测小区话务量,如果某小区某天值连续超过该类的正常值,则进行异 常预警。 六,日 一,二 pattern 实时周一 预警!
方天项目:海量数据压缩
项目需求
压缩算法模型,要有较高的压缩比和压缩效率:压缩比至少做到1:5 ,每兆数据压缩时间不多于10秒钟。
研究开发的压缩/解压缩算法必须为无损压缩/解压缩。 能够兼容实时数据流的压缩/解压缩方式和历史数据文件的压缩/解压 缩两种功能需求。 最终提供的交付物包括:完整算法模型文档、完整的算法实现代码 ,且代码能够支持跨平台使用(包括Windows和Linux)。
使用k-means聚类
典型的数 据分布刻 画任务
使用高斯分布刻画
方天项目:行为分析模块建模
行为分析模块建模:解决办法
任务1,2(得到分布特征)
得到供电数据煤耗数据特征以及主机小指标的数据分 布特征
概率密度 估计
使用核密度估计
任务3(班组煤耗比较)
比较各种情况下的煤耗分布差异,找出主要影响因素
不同分布 之间的比 较
计算不同因素下的煤耗分布,计算它们 之间的EMD距离从而得到主要影响因素
时间序列 预测
在节假日采用SVR模型,温度过高或过 低月份采用GRNN神经网络,其他时间 采用SARIMA模型
节能环保指标预测结果:
月份 实际值 预测值 绝对误差 相对误差 1 2 3 4 5 6 7 8 3234.66 2071.88 2903.70 2790.80 2698.10 2514.20 2736.70 2822.80 3323.00 2089.00 3031.65 2640.44 2743.21 2702.20 2664.70 2664.70 88.34 17.12 127.95 150.36 45.11 188.00 72.00 158.10 2.73% 0.83% 4.41% 5.39% 1.67% 7.48% 2.63% 5.60%
主要创新点
为Hadoop系统提供图形化管理界面 基于Map/Reduce编程模型,对常用的数据挖掘算法进行并行化
基于XML技术,为大数据建立元数据管理系统
应用MVC开发框架,提供可扩展的、易用的大数据分析平台
主要功能
主要核心算法
基本算法 WordCount, TF-IDF, 排序, 距离计算(Euclidean, Manhattan) 聚类算法 K-means, Canopy ,Graph Mining(the Shortest Path) 分类与预测算法 KNN, Naive Bayesian, SVM, BP Neural Network, Locally-Weighted, Linear Regression(LWLR), Logistic Regression 关联规则算法 Apriori, FP 协同过滤算法 User-Based Collaborative Filtering(CF), Item-Based CF 中文处理 分词(具有新词学习和词库扩充功能) 网页解析 VIPS,DOM-Tree, PageRank, InvertedIndexing
方天项目:工况寻优模块建模
以环境温度等为输入条件,发掘特定供热负荷(工况)下机 组可调出力区间(机组负荷的最大值、最小值)。
负荷的最大值、最小值应根据数据分布特征选取数据密集区 的极值。
避免极值落在数据稀疏区域(置信度较低),以确保负荷极 值是合理可达的。
供热机组可调处理区间估计:解决方法
典型的聚 类任务
电力(环保)大数据
数据描述
数据主要由源于发电机组内部传感器数据以及除尘、脱硫、脱硝等环保 设备的运行参数和环境温度等外部因素构成。
数据特点
原始数据中维数比较高,同时由于数据是由传感器经过固定的时间间隔 进行采集而形成的,因此可以认为是典型的时间序列。
数据量
根据不同的采样时间间隔和总的采样时间,三个项目对应所需处理的数 据量从10万条到55万条不等。
• 决策树:GBDT
365网推荐系统:个性推荐
推荐结果:
协同过滤
SVD
NMF
特征维度
推荐点击率 精确度
1379
6.18% 2.14%
4
18.54% 3.02%
10
18.16% 3.66%
各算法推荐效果对比
大数据技术和案例分析