生产企业大数据平台建设项目建议书

合集下载

大数据中心项目建议书

大数据中心项目建议书

大数据中心项目建议书一、项目背景随着互联网的快速发展和信息化的深入推进,大数据已经成为当今社会的一个重要产业。

大数据中心作为大数据处理和存储的重要基础设施,具有极其重要的意义。

在这样的背景下,我们提出了建设大数据中心项目的建议。

二、项目概况1. 项目名称:大数据中心建设项目2. 项目地点:选址在交通便利、资源丰富的城市3. 项目规模:计划建设面积约10000平方米4. 项目内容:包括数据处理中心、数据存储中心、机房、办公区等设施三、项目意义1. 推动大数据产业发展:大数据中心的建设将为大数据产业的发展提供重要支撑,促进大数据技术的创新和应用。

2. 促进信息化进程:大数据中心的建设将为企业和政府部门提供更加高效、安全的数据处理和存储服务,推动信息化进程。

3. 增强城市竞争力:大数据中心的建设将吸引更多的大数据企业和人才,增强城市的产业竞争力和吸引力。

四、项目建设内容1. 数据处理中心:配备先进的大数据处理设备和软件,满足大数据处理需求。

2. 数据存储中心:采用高效的存储设备和技术,提供安全可靠的数据存储服务。

3. 机房:提供稳定的电力和网络支持,保障设备的正常运行。

4. 办公区:为管理人员和技术人员提供舒适的办公环境。

五、项目投资与收益分析1. 项目投资:预计总投资约5000万元,其中设备投资约3000万元,建设投资约2000万元。

2. 项目收益:预计项目建成后,年收益约2000万元,投资回收期约3年。

六、项目实施方案1. 确定项目地点:选择交通便利、资源丰富的城市,进行选址。

2. 制定项目规划:设计大数据中心的建设规划和布局方案。

3. 确定项目投资:制定项目投资计划,寻求投资合作。

4. 开展项目建设:依据规划方案,进行项目建设和设备采购。

5. 项目运营管理:建成后进行项目运营管理,保障项目的正常运行和效益。

七、项目风险与对策1. 技术风险:采购先进的设备和技术,进行技术培训和保障设备稳定运行。

2. 市场风险:开展市场调研,确保项目建设与市场需求相适应。

大数据平台项目建议书

大数据平台项目建议书

大数据平台项目建议书篇一:“十三五”规划重点-大数据项目建议书“十三五”规划重点-大数据项目建议书(立项报告)编制单位:北京智博睿投资咨询有限公司定义及作用定义:项目建议书又称立项报告,是由项目投资方向其主管部门上报的文件,从宏观上论述项目设立的必要性和可能性,建议书内容包括项目的战略、市场和销售、规模、选址、物料供应、工艺、组织和定员、投资、效益、风险等,把项目投资的设想变为概略的投资建议。

目前广泛应用于项目的国家立项审批工作中。

项目建议书通常是在项目早期使用,由于项目条件还不够成熟,仅有规划意见书,对项目的具体建设方案还不明晰,市政、环保、交通等专业咨询意见尚未办理。

项目建议书主要论证项目建设的必要性,建设方案和投资估算也比较粗,投资误差为土30%左右。

对于大中型项目,有的工艺技术复杂,涉及面广,协调量大的项目,还要编制预可行性研究报告,作为项目建议书的主要附件之一。

作用:项目建议书是项目发展周期的初始阶段,是国家选择项目的依据,也是可行性研究的依据。

项目建议书是项目发展周期的初始阶段基本情况的汇总,可以减少项目选择的盲目性,是国家选择和审批项目的依据,也是制作可行性研究报告的依据。

涉及利用外资的项目,只有在项目建议书批准后,才可以开展对外工作。

项目建议书批准后,可以着手成立相关项目法人。

民营企业(私人投资)项目一般不再需要编写项目建议书,只有在土地一级开发等少数领域,由于行政审批机关习惯沿袭老的审批模式,有时还要求项目方编写项目建议书。

外资项目目前主要采用核准方式,项目方委托智博睿等有资格的机构编写项目建议书即可。

项目建议书和可行性研究报告的区别项目建议书和可行性研究是项目前期两个不同的阶段,其内容、深度、作用都是不一样的。

项目建议书往往是在项目早期,由于项目条件还不够成熟,仅有规划意见书,对项目的具体建设方案还不明晰,市政、环保、交通等专业咨询意见尚未办理。

项目建议书主要论证项目建设的必要性,建设方案和投资估算也比较粗,投资误差为土30%左右。

项目建议书(大数据方向)

项目建议书(大数据方向)

项目建议书(大数据方向)项目建议书(大数据方向)1. 引言在当今数字化时代,大数据已成为各行业重要的资源和决策依据。

为了更好地应对和利用大数据,我们计划开展一个大数据项目。

本项目的目标是通过收集、分析和应用大数据,为企业提供有价值的洞察和决策支持。

在本中,我们将详细介绍项目的背景、目标和实施计划。

2. 项目背景在过去几年中,随着互联网的蓬勃发展,数据的产生和积累量呈指数级增长。

这些数据包含了行为、市场趋势、产品销售等宝贵信息。

然而,由于数据的规模庞大和复杂,企业难以充分挖掘和应用这些数据,导致无法发现数据中的潜在价值。

3. 项目目标本项目的主要目标是为企业提供特定领域的大数据分析服务,企业获取关键的商业洞察,并基于这些洞察做出更明智的决策。

具体目标包括:3.1 收集大数据搜集并整理与特定领域相关的大数据集,包括行为数据、市场数据、竞争对手数据等。

3.2 数据清洗和预处理对收集到的数据进行清洗和预处理,包括去除噪音数据、处理缺失值、处理异常值等,确保数据的准确性和完整性。

3.3 数据存储和管理建立数据仓库和数据管理系统,有效地存储和管理大数据,以便后续的分析和应用。

3.4 数据分析利用统计分析、机器学习等方法对大数据进行深入分析,发现数据中的潜在模式和规律,并提取有价值的信息。

3.5 决策支持将分析结果应用于实际业务决策中,为企业提供决策支持和优化建议。

4. 项目实施计划4.1 项目启动阶段确定项目团队,明确项目目标和范围,制定项目计划和工作流程。

4.2 数据收集阶段收集与特定领域相关的大数据集,包括内部和外部数据源,确保数据的准确性和可靠性。

4.3 数据清洗和预处理阶段对收集到的数据进行清洗和预处理,去除噪音数据、处理缺失值和异常值,确保数据的质量。

4.4 数据存储和管理阶段建立数据仓库和数据管理系统,确保数据的安全性和可用性,为后续的分析和应用做好准备。

4.5 数据分析阶段利用统计分析、机器学习等方法对大数据进行深入分析,发现数据中的模式和规律。

大数据平台项目实施建议书

大数据平台项目实施建议书

大数据平台项目建议书篇一:“十三五”规划重点-大数据项目建议书“十三五”规划重点-大数据项目建议书(立项报告)编制单位:北京智博睿投资咨询有限公司定义及作用定义:项目建议书又称立项报告,是由项目投资方向其主管部门上报的文件,从宏观上论述项目设立的必要性和可能性,建议书内容包括项目的战略、市场和销售、规模、选址、物料供应、工艺、组织和定员、投资、效益、风险等,把项目投资的设想变为概略的投资建议。

目前广泛应用于项目的国家立项审批工作中。

项目建议书通常是在项目早期使用,由于项目条件还不够成熟,仅有规划意见书,对项目的具体建设方案还不明晰,市政、环保、交通等专业咨询意见尚未办理。

项目建议书主要论证项目建设的必要性,建设方案和投资估算也比较粗,投资误差为±30%左右。

对于大中型项目,有的工艺技术复杂,涉及面广,协调量大的项目,还要编制预可行性研究报告,作为项目建议书的主要附件之一。

作用:项目建议书是项目发展周期的初始阶段,是国家选择项目的依据,也是可行性研究的依据。

项目建议书是项目发展周期的初始阶段基本情况的汇总,可以减少项目选择的盲目性,是国家选择和审批项目的依据,也是制作可行性研究报告的依据。

涉及利用外资的项目,只有在项目建议书批准后,才可以开展对外工作。

项目建议书批准后,可以着手成立相关项目法人。

民营企业(私人投资)项目一般不再需要编写项目建议书,只有在土地一级开发等少数领域,由于行政审批机关习惯沿袭老的审批模式,有时还要求项目方编写项目建议书。

外资项目目前主要采用核准方式,项目方委托智博睿等有资格的机构编写项目建议书即可。

项目建议书和可行性研究报告的区别项目建议书和可行性研究是项目前期两个不同的阶段,其内容、深度、作用都是不一样的。

项目建议书往往是在项目早期,由于项目条件还不够成熟,仅有规划意见书,对项目的具体建设方案还不明晰,市政、环保、交通等专业咨询意见尚未办理。

项目建议书主要论证项目建设的必要性,建设方案和投资估算也比较粗,投资误差为±30%左右。

大数据平台建设项目需求与技术方案

大数据平台建设项目需求与技术方案

大数据平台建设项目需求与技术方案1. 引言随着互联网的迅猛发展,大数据的使用和价值日益凸显。

大数据分析能够帮助企业更好地了解市场、预测需求、优化业务流程等。

为了更好地利用和管理大数据资源,我们计划建设一套大数据平台。

本文档旨在说明大数据平台建设项目的需求和技术方案,以便于整个团队明确目标、合理分工、高效推进。

2. 项目背景2.1 问题陈述目前,我们公司面临以下问题:•数据分散存储:各个业务部门的数据分散存储在不同的系统中,难以统一管理和利用。

•数据处理效率低下:现有的数据处理方式无法满足业务部门日益增长的数据需求,导致处理效率低下。

•数据安全性和隐私保护:由于数据存储和处理的方式不规范,数据的安全性和隐私保护存在风险。

2.2 解决方案为了解决上述问题,我们决定建设一套大数据平台,具体目标如下:•统一数据存储:将各个业务部门的数据集中存储在一套大数据平台中,实现数据的统一管理和利用。

•提升数据处理效率:引入分布式计算和并行处理的技术,提高数据处理效率,满足业务部门日益增长的数据需求。

•加强数据安全性和隐私保护:采用安全可靠的数据存储和处理方案,确保数据的安全性和隐私保护。

3. 项目需求3.1 数据集成和存储•支持多种数据源的接入:包括关系型数据库、非关系型数据库、日志文件等。

•实现数据的批量和实时采集:支持定时任务和实时流式数据的采集。

•提供数据存储和管理功能:包括数据索引、分区、备份和恢复等。

3.2 数据处理和计算•支持大规模数据处理:引入分布式计算框架,如Hadoop、Spark等,支持大规模数据的并行计算和分析。

•提供数据清洗和转换功能:支持对原始数据进行清洗、转换和标准化,以满足不同业务部门的需求。

•实现数据挖掘和机器学习功能:支持数据挖掘和机器学习算法的应用,为业务部门提供更准确的数据分析和预测能力。

3.3 数据安全和隐私保护•实现数据的加密和权限控制:对敏感数据进行加密,并设置不同用户的权限,确保数据的安全性和隐私保护。

大数据立项建议书

大数据立项建议书

大数据立项建议书一、项目背景随着互联网的快速发展和智能化技术的不断创新,大数据技术已经成为当今社会发展的重要引擎。

大数据技术以其强大的数据处理能力和深度分析能力,正在为各行各业带来前所未有的机遇和挑战。

在这样的背景下,我们提出了大数据项目立项建议书,旨在充分利用大数据技术,推动企业的数字化转型,提高经营管理水平,增强竞争力。

二、项目意义大数据技术可以帮助企业从海量数据中挖掘出有价值的信息,为企业决策提供科学依据。

通过大数据分析,企业可以更好地了解市场需求、用户行为、产品品质等方面的信息,从而精准定位市场,提高产品质量,提升用户体验,实现精细化管理。

同时,大数据技术还可以帮助企业发现潜在的商机和风险,及时调整经营策略,提高市场应变能力。

因此,大数据项目的开展对于企业的发展具有重要意义。

三、项目内容1. 数据采集与存储:建立完善的数据采集系统,实现对各类数据的高效采集和存储,包括结构化数据、半结构化数据和非结构化数据。

2. 数据清洗与预处理:对采集的数据进行清洗和预处理,去除噪声数据,填补缺失值,使数据质量达到可分析的标准。

3. 数据分析与挖掘:利用大数据分析工具和算法,对清洗后的数据进行深度分析和挖掘,发现数据背后的规律和价值信息。

4. 数据可视化与应用:将分析结果通过可视化的方式展现出来,为企业决策提供直观的参考,并将分析结果应用到实际业务中,实现数据驱动决策。

四、项目目标1. 建立健全的大数据平台,实现对企业各类数据的集中管理和高效利用。

2. 提高数据分析的准确性和效率,为企业决策提供更科学的依据。

3. 优化产品和服务,提升用户满意度和忠诚度。

4. 发现潜在商机和风险,为企业发展提供战略指导。

五、项目实施步骤1. 确定项目需求和范围,制定详细的项目计划和时间表。

2. 搭建大数据平台,包括硬件设施和软件系统的建设。

3. 进行数据采集和存储,建立数据清洗和预处理流程。

4. 进行数据分析和挖掘,发现数据背后的规律和价值信息。

项目建议书(大数据方向)

项目建议书(大数据方向)

项目建议书(大数据方向)项目建议书(大数据方向)一、背景和目标随着互联网技术的不断发展,大数据成为当前社会的热点话题之一。

大数据分析对于各行业来说都具有重要意义,可以帮助企业做出更准确的决策,提高工作效率,增强竞争力。

本项目旨在利用大数据技术,对企业的数据进行深入分析,为企业提供决策支持和业务优化建议。

二、项目内容和范围本项目主要包括以下内容:1. 数据收集与清洗通过引入合适的大数据采集工具,对企业的各类数据进行全面收集。

然后针对不同数据源的差异,进行数据清洗,去除脏数据和异常值,并进行数据格式标准化。

2. 数据存储与管理利用大数据存储技术,搭建高可用、高性能的数据存储与管理平台。

采用分布式存储系统,实现数据的高效读写和容错能力。

3. 数据分析与挖掘通过大数据分析和挖掘技术,对企业的数据进行深入挖掘和分析。

包括但不限于数据关联分析、聚类分析、分类预测等。

通过建立合适的数据模型和算法,发现数据中隐藏的规律和价值信息。

4. 可视化呈现与报表为了便于管理者和决策者理解和运用数据分析结果,我们将采用数据可视化工具,对分析结果进行展示和呈现。

并通过开发报表功能,方便各类决策支持报告。

三、项目资源和计划本项目需要以下资源支持:- 项目组成员:包括大数据工程师、数据分析师、软件开发人员等。

- 技术工具:包括数据采集工具、大数据存储与管理平台、数据分析与挖掘工具、数据可视化工具等。

- 数据支持:需要企业提供相关的数据源。

项目计划如下:- 第一阶段(1个月):需求调研和数据收集,确定数据采集范围和目标。

- 第二阶段(2个月):数据清洗和存储,搭建数据存储与管理平台。

- 第三阶段(3个月):数据分析和挖掘,建立数据模型和算法。

- 第四阶段(1个月):数据可视化呈现和报表功能开发。

- 第五阶段(1个月):项目总结与验收,撰写项目报告。

四、项目收益本项目的主要收益包括:- 提供决策支持:通过对企业数据的深入分析,为决策者提供准确、实时的数据,帮助其做出科学的决策。

面向企业的大数据服务平台项目建议书

面向企业的大数据服务平台项目建议书

面向企业的大数据服务平台项目建议书北京智联软件技术有限公司二○一五年六月目录第一章概述 (5)1.1项目背景 (5)1.2项目建设目标 (5)1.3项目建设内容 (6)1.3.1采集行业基础信息 (6)1.3.2采集法律法规数据 (6)1.3.3产业大数据分析 (6)1.3.4采集互联网信息 (6)1.4设计依据 (7)1.5设计原则 (7)1.5.1安全性原则 (7)1.5.2可靠性原则 (7)1.5.3 标准化原则 (7)1.5.4 开放性原则 (8)1.5.5 松耦合原则 (8)第二章系统设计方案 (9)2.1整体架构 (9)2.2网络拓扑 (9)第三章详细功能设计 (10)3.1信息获取 (10)3.1.1科情所内部信息 (10)3.1.2企业内部信息 (11)3.1.3互联网信息 (11)3.1.4外购数据库 (14)3.2大数据挖掘 (14)3.2.1自动分类 (15)3.2.2自动聚类 (15)3.2.3智能检索 (16)3.2.4信息过滤 (16)3.2.5自动摘要和自动关键词抽取 (17)3.2.6关联规则挖掘 (17)3.2.7信息指纹 (17)3.3业务应用 (17)3.3.1信息精准定位与分享 (17)3.3.2协同应用 (18)3.3.3行业热点 (19)3.3.4产业分析 (19)3.3.5危机预警分析 (20)3.3.6传播路径分析 (20)第四章实施计划 (21)4.1任务描述 (21)4.2项目进度计划 (26)4.3质量保证 (26)4.3.1硬件设备与网络的测试与验收 (26)4.3.2软件系统的测试与验收 (26)第五章技术服务与培训 (28)5.1服务体系介绍 (28)5.1.1项目经理 (28)5.1.2售后服务 (29)5.1.3技术支持 (30)5.1.4专家 (30)5.2产品升级 (30)5.2.1产品升级服务表 (30)5.2.2服务方案及升级承诺 (31)5.3服务支持 (31)5.3.1服务流程 (31)5.3.2服务政策 (31)5.3.3服务方式及时间 (32)5.3.4服务方案承诺 (33)5.4需求扩展支持 (33)5.5培训计划 (34)5.5.1竞争情报系统培训资料 (34)5.5.2培训人员 (34)5.5.3培训组织形式 (35)第六章项目建设预算 (35)6.1投资测算主要依据 (35)6.2测算方法 (35)6.3投资估算 (36)第七章效益和风险分析 (38)7.1经济效益分析 (38)7.2社会效益分析 (38)7.3政策风险 (39)7.4系统风险 (39)7.5操作风险 (40)第一章概述1.1项目背景在网络化和计算机技术高度发展的时代,如何及时准确掌握情报信息并进行高效率地处理,是现代情报信息服务的关键所在,是体现情报信息的价值所在。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据平台建设项目建议书目录第一章、项目背景..................... 错误!未定义书签。

第二章、项目思路..................... 错误!未定义书签。

第三章、建设内容与方案............... 错误!未定义书签。

第四章、时间进度..................... 错误!未定义书签。

第五章、项目预算..................... 错误!未定义书签。

第六章、企业效益及社会效益........... 错误!未定义书签。

第七章、结论......................... 错误!未定义书签。

第一章、项目背景企业对信息化工作历来较为重视,也是省内较早开始实施信息化的大型企业。

目前已经建成财务系统、生产调度系统、农务系统、供应链系统等:调度系统,2015年公司共投资了175万元,按集团分步建设、逐步投入的规划,完成了系统基本硬件与亚控平台软件的结合,构建了一个以明阳糖厂生产调度指挥中心为核心,生产信息能够上至集团,下至车间的生产调度网络系统。

农务系统,2005年开始实施,经过多次升级,现涵盖了计划、报蔗、派车、质检、过磅、结算、短信管理、移动应用等一系列模块,覆盖公司4家直属糖厂和大桥制糖公司,实现了农务统一的信息化管理。

供应链系统,利用用友NC供应链系统,以公司存货管理为核心的采、供、销、存供应链管理平台,实现物资、仓储、供应、销售、物流一体化业务协同处理平台,建立了公司对各直属厂工作的监督平台,总部可以实时对下属各公司的工作进行监督,实时对各公司的具体业务执行情况进行查看,及时的对下属公司进行指导和监督。

尽管在两化融合及企业信息化方面已取得了相当的成效,但在实际应用过程中仍然存在一些较为显著的问题。

(一)总部与下属糖厂未实现完全的集约管理a)企业在原先六家糖厂的基础上,又收购了三博公司五家糖厂。

三博五厂由上海迁回南宁,在宜州设立管理下属五厂的二级管理总部。

b)从系统部署上分析,企业总部与原先六厂为一套架构,而三博总部与下属五厂为一套架构,各自独立,暂未整合为一体。

c)为了保证各糖厂生产的稳定,企业总部与下属六厂之间仅在NC供应链、OA、财务、人力等系统方面实现了集约管理,农务管理系统、生产调度系统以及化验系统均由各厂自建,因此出现各厂建设系统的厂家不同,使用的系统版本不同等现象。

三博总部与下属五厂的关系亦如此。

(二)总部及各厂之间的数据共享有限a)由于大多数生产相关的系统均为各厂自建,因此不管是企业总部,或者是三博总部在获取各糖厂生产相关数据上均较为困难。

b)企业总部通过制定报表模板、开发报表同步功能的方式,定期的获取下属六家糖厂的生产相关报表,但这些报表的数据容量有限、数据呈现较为固定,无法为总部经营决策提供实时、灵活的数据依据。

c)三博总部获取下属糖厂的数据方式更为有限,仅依靠各厂按照总部的业务需求进行手工填写,通过邮件、微信等方式提交数据报表,汇总到三博总部。

(三)各业务部门对未来的数据应用有着强烈的需求a)当前业务条线对于未来大数据平台建设的需求仍处于较为初步的设想阶段,但已具雏形:b)进一步完善供产销流程中系统数据采集能力,尤其是对于甘蔗种植面积的测绘、甘蔗产量的估算等信息,因此对于GIS地理信息系统的上线有需求;c)提高总部对于各厂生产数据的获取及共享能力,解决目前总部各部门、总部与各厂、各厂与各厂之间数据不流通、共享困难的现状;d)提高内部各平台数据对于生产经营的指导作用,充分利用各环节系统流程数据汇总,产出经营决策建议、对比分析、趋势统计、效益分析等数据应用;e)实时、动态、快速的掌握外部环境的动向,包括行业发展、原材料、供应商、产品销售、竞争对手等信息,以形成内外部数据的融合,为生产经营决策提供数据支撑。

第二章、项目思路为了解决内部各厂、各系统之间的数据共享问题,此次项目将依托现有的农务管理平台、NC供应链平台、生产调度平台、电子商务平台、协同工作平台OA、质量管理平台等一系列业务相关系统,通过制定一定的标准,整合下属各厂各系统数据,打造统一的大数据平台及智能决策分析平台。

利用大数据分析技术,为公司管理层、业务部门及各生产单位提供具有指导意义的数据分析结果,实现生产精准化、管理可视化。

根据对内部信息化及系统部署情况的分析,此次项目将按照由近及远、由浅入深的方式划分为几个阶段:(一)对总部及下属六厂各系统的数据进行整合、共享及分析,以企业六厂为基础,搭建大数据平台框架,在不对基础系统进行迁移整合的前提下,对数据进行整合并建立数据之间的关系。

并制定一定的数据采集规则,获取三博五厂的数据。

(二)基于大数据平台全面的数据共享能力,强化数据的表达深度,能够对原有汇总的报表数据进行更细粒度的表达和展示;这里可能需要创建新的应用服务系统或者是扩充原有的服务系统来完成。

(三)完全整合三博所属五厂系统及数据,消除企业内部的数据孤岛。

(四)面向外部进行数据扩充,例如利用网络进行相关行业的数据抓取,并将数据整合到大数据平台,结合既有的内部数据建立运营决策系统。

第三章、建设内容与方案基于对整合三博五厂系统及数据难度的考虑,本次项目以第一、第二阶段作为项目的主要内容。

、建立大数据平台基础架构,整合现有生产及管理系统由合作方负责建设大数据平台基础架构,整合现有的各个生产及管理系统,将各系统的生产及管理数据进行集中统一管理、分析,对大数据平台建设提供相应的支撑。

大数据平台的总体架构及模块部署情况如下:、总体架构、模块划分及部署根据大数据平台建设的要求,大数据智能决策平台(大数据存储、计算及分析平台)主要由三大模块组成:数据采集模块、存储计算模块及访问支撑模块。

数据采集模块:数据采集模块提供支持多数据源提取、多通道传输、多种方式聚合的数据采集工具及接口,包括flume代理集群日志采集、Chukwa 实时数据采集、Python网络数据爬取、Sqoop关系数据库数据批量提取、HDFS 文件上传下载FTP客户端及多通道数据源整合实时分布式消息系统Kafka。

存储计算模块:存储计算模块实现了海量数据存储、批处理计算、实时计算、机器学习、图计算、实时查询及集群运行监控等功能,包括YARN分布式资源管理系统、分布式文件系统HDFS、Spark/MR批处理、Spark实时计算、GraphX图计算、MLLib机器学习、Hbase实时查询、Hive等Sql计算引擎、MySql关系型数据库及等可视化集群监控工具。

访问支撑模块:访问支撑模块提供了上层软件易于使用和编程的大数据平台层接口及内存数据库,包括封装了SparkSql、Hive、Phoenix的sql查询接口,封装了MR、Spark开发函数库的API编程接口、工具及redis内存数据库。

系统部署:基础Hadoop大数据平台服务器集群由一台主机(Master)、三台从机(Slaver152/153/154)、组成。

平台采用分布式集群方式工作,提供N+1冗余模式。

、通过建设,提供存储及数据服务能力1)存储能力:初期建设完毕按照其物理硬件配置,平台实现如下存储能力指标:业务数据存储:1TB业务数据实时数据存储:8GB实时数据查询:2秒业务数据查询:10秒存储动态扩容能力:根据后期系统以及数据迁移的需要平台具备动态扩容能力,在先期物理设备所提供的容量不能满足业务发展需要的请下进行动态扩容。

2)业务数据支持:根据企业既有业务系统以及对应的实际行业和运营特征,基于大数据平台被划分为三级数据存储,各级存储的建设目标描述如下:A. 一级存储:平台的原始业务数据存储层,面向企业内部的原有各大业务系统,支持其将原有数据存储完全迁移到大数据平台,即提供数据融合能力外还把原有系统的基础存储支持作为平台基础能力;也支持通过文件或者消息方式将其部分的融合数据以非实时或准实时的周期上传到大数据平台,主要用于业务数据融合。

B. 二级存储:细化的融合层,主要面向现有业务之间的数据融合沟通,解决现有业务系统之间数据互通问题;同时在该层对于基础业务数据进行整合以及基础计算,产生新的业务数据并存储,为更高层级的业务运维提供大数据支撑。

本层数据是对基础数据的第一级融合计算,主要面向业务。

C. 三级存储:基于二级存储数据进行高层的决策分析计算,产生最终的运营支撑和决策分析结果数据,该层次计算过程中将应用各种统计、分析、学习算法;同时也给予业务访问特征,将二级存储的热点数据组织为热表进行存储,对外提供高速数据访问接口。

、对目前生产及管理中涉及的数据进行采集并予以整合、内部数据整合完善现有农务管理平台、NC供应链平台、生产调度平台、电子商务平台等与企业供产销业务流程相关的系统采集数据功能,统一集中管控的形式,将公司管理范围内的农户、车辆及地块信息、糖厂生产信息集中输入到公司总部平台中,完成集中化采集及管理。

1、优先针对农务系统以及生产系统进行数据整合共享,再次是NC系统;考虑整合的主要目标是可分析业务数据,图片图表等文件类型数据不考虑在大数据平台上存储;可以存储在其它位置仅在大数据平台上存储其位置信息;2、在各分厂数据库服务器上部署数据采集代理,按照业务数据规则要求最高以准实时的要求同步数据到大数据平台;或者首先以生产报表为周期在同步报表数据的同时同步相关详细数据记录。

将以上各平台采集到的结构化及非结构化的数据以统一的数据规则进行处理,通过图形可视化的方式,对采集到的数据进行抽取、转换、加工、整合,最大程度的简化数据并采用过程流式的组织方式进行数据集成应用开发。

、外部数据采集利用爬虫技术,帮助企业把外部互联网的各类相关数据资源转变成企业的数据资产,并且与内部数据结合,结合的数据挖掘平台和文本处理技术,能够从海量的文本数据中智能地获取深度的价值信息,最终形成行业的发展趋势、竞争对手情报、竞品对比分析、以及各类数据提供服务,如财报数据、宏观经济数据、价格指数等。

、利用采集的数据进行挖掘分析,输出有价值的成果、经营分析主要分析价值链,包括种植、加工、销售三个阶段,依据企业价值链模型展开分析,如种植-加工生产(采购、生产、质量)-销售物流(仓库管理、销售管理),纵向分析各职能对主价值链的支撑与协同。

、生产分析利用大数据处理和分析方法,挖掘工艺参数(如处理甘蔗、初压汁、末压汁、打包蔗渣等流程)、优化协同时间(实际榨蔗时间、生产安全率、设备故障损失时间、部门/公司协作流程时间优化等)、成品糖(优级白砂糖、一级白砂糖、一级赤砂糖)产量之间的流程工艺优化、生产能耗分析(混合蔗渣、滤泥、废蜜、辅助材料、燃料及汽电消耗等)、产能分析(多维度分析,如糖产率),优化生产流程、降本增效、提高收益、实现利润最大化是生产主题的核心内容。

相关文档
最新文档