数据仓库的构建和ETL课程设计.

合集下载

ETL数据仓库建模与实践

ETL数据仓库建模与实践数据仓库是企业级信息管理架构中的一个重要组成部分，其作用在于提供数据共享、数据集成、灵活查询、数据挖掘、数据分析、报表生成等多种功能。

ETL（Extract-Transform-Load）即是从原始数据源中抽取数据、将数据进行转换和清洗，在数据仓库中加载的过程。

本文将就ETL数据仓库建模与实践展开讨论。

一、数据仓库设计1. 数据仓库层次结构数据仓库通常是由三层结构组成：数据源层、数据仓库层和数据应用层。

数据源层是指数据来源，包括文件、数据库、FTP等，这些数据通过ETL工具提取并转化后，放置在数据仓库层中。

数据仓库层是指存储数据的地方。

数据应用层是指面向不同用户群体的客户界面，数据仓库的数据根据不同的需求和目的进行展示。

2. 维度建模与事实建模维度建模和事实建模是两种在数据仓库模型中经常使用的建模方式。

维度建模将数据集中在围绕业务主题而呈现的维度表中，例如时间、地理位置、人员等。

事实建模则将业务早期中的事实数据集中在称为事实表的表中，并通过外键链接到维度表上。

3. 多星模型与雪花模型多星模型是一种简单明了的数据仓库模型，只涉及一个基础事实表和若干个维度表。

雪花模型是在多星模型基础上的一种拓扑结构。

多星模型和雪花模型都是建立在维度和事实表之间的关系上，区别在于雪花模型通过重复维度表的数据，使用数据规范化来优化空间利用率。

二、ETL建模1. ETL工具选择ETL主要是负责数据加载、数据转换和数据抽取工作的工具。

常用的ETL工具有IBM的DataStage、Informatica、Microsoft的SSIS和Oracle的ODI。

在选择ETL工具的时候，需要根据公司的实际情况和需求进行综合考虑，选择能够支持大数据和高可用性的工具。

2. ETL建模的流程ETL建模的流程包括：数据抽取、数据转换、数据加载三个主要步骤。

数据抽取是指从源数据库中提取出数据，以供后续处理。

数据转换是指对数据进行转换和清洗的过程。

如何使用MySQL进行数据仓库建设与ETL过程

如何使用MySQL进行数据仓库建设与ETL过程1. 引言在当今数字化时代，数据成为了企业决策和战略制定的重要驱动力。

而数据仓库作为数据集中存储和分析的重要组成部分，在企业中扮演着至关重要的角色。

本文将介绍如何使用MySQL进行数据仓库的建设和ETL(Extract, Transform, Load)过程，帮助读者更好地理解和应用这一技术。

2. 数据仓库概述数据仓库是一个面向主题的、集成的、时间变化的、非易失的数据集合，用于支持企业的决策分析过程。

与传统数据库相比，数据仓库更加注重数据的质量、一致性和可靠性，并通过集成和变换等操作，将多源的数据整合到一个统一的存储中。

3. MySQL与数据仓库建设MySQL是一种开源的关系型数据库管理系统，具备良好的稳定性和可扩展性，在数据仓库建设中广泛应用。

以下是一些关于MySQL在数据仓库建设中的应用注意事项：a. 数据库设计：合理的数据库设计是数据仓库建设的基础。

在设计阶段，需要根据业务需求和数据特点，进行数据模型的设计，包括维度表和事实表的设计等。

b. 数据抽取：数据仓库的建设需要从多个数据源获取数据，并进行抽取到数据仓库中。

MySQL提供了多种方式进行数据抽取，如使用ETL工具进行数据抽取、使用MySQL的数据导入导出工具进行数据抽取等。

c. 数据清洗：在将数据加载到数据仓库之前，需要对数据进行清洗，确保数据的完整性和一致性。

MySQL提供了丰富的函数和操作符，可以方便地进行数据清洗和变换。

d. 数据加载：数据加载是将清洗过的数据存储到数据仓库中的过程。

MySQL提供了高效的数据加载方式，如使用LOAD DATA语句进行数据加载等。

e. 数据查询和分析：数据仓库的最终目的是为了支持决策分析和数据挖掘。

使用MySQL的强大查询功能和丰富的分析函数，可以方便地进行复杂的数据分析和挖掘。

4. ETL过程概述ETL是数据仓库建设中的重要环节，包括数据抽取(Extract)、数据变换(Transform)和数据加载(Load)。

数据仓库建模与ETL设计实践指南

数据仓库建模与ETL设计实践指南在当今信息时代，数据的重要性日益凸显。

为了更好地管理和分析大量的数据，数据仓库的建模与ETL（提取、转换和加载）设计成为了企业数据管理的关键环节。

本文将详细介绍数据仓库建模与ETL设计的实践指南，帮助读者更好地理解和应用这些技术。

一、数据仓库建模1.1 数据仓库概述数据仓库是一个集成、主题导向、可用于决策支持的数据集合。

它将企业的各类数据从不同的来源进行提取、转换和加载，经过清洗和整合后形成一个统一、一致的数据视图。

数据仓库建模的目标是将跨越多个系统的数据转化为易于理解和使用的形式。

1.2 数据仓库建模方法在进行数据仓库建模时，可以选择多种建模方法，例如维度模型和归一化模型。

维度模型适合于分析型报表和高度聚焦的查询，而归一化模型则适合于大规模的交易处理。

根据实际情况选择合适的建模方法，既要考虑数据的业务需求，也要兼顾数据的性能和可维护性。

1.3 维度建模与事实建模数据仓库的维度建模是数据仓库建模的核心内容之一。

维度是指数据的关键特征或类别，例如时间、地点、产品等。

在维度建模中，需要考虑维度的层次结构和关系，以及维度之间的关联。

事实建模则围绕事实表展开，事实表记录了业务过程中发生的事件或度量，例如销售额、客户数量等。

二、ETL设计实践指南2.1 ETL概述ETL是指将数据从各个源系统中提取出来，经过转换和清洗后加载到数据仓库中的过程。

ETL设计是确保数据能够准确、完整地从源系统到数据仓库的关键环节。

一个好的ETL设计应该考虑数据的可扩展性、可维护性和性能。

2.2 ETL流程一个典型的ETL流程包括以下几个步骤：数据提取（Extract）、数据转换（Transform）和数据加载（Load）。

在数据提取阶段，需要确定数据提取的方式和频率，例如全量提取、增量提取或增量更新。

在数据转换阶段，需要对数据进行清洗、整合和转换，以满足数据仓库的需求。

在数据加载阶段，需要将转换后的数据加载到数据仓库中，确保数据的可用性和一致性。

MySQL数据库的ETL与数据仓库建设实战教程

MySQL数据库的ETL与数据仓库建设实战教程数据在当今信息时代的重要性不言而喻，而有效地管理和分析数据则对于企业的发展至关重要。

在大数据时代，数据仓库成为了企业必备的基础设施之一。

本文将介绍MySQL数据库的ETL（抽取、转换和加载）过程以及数据仓库的建设实战教程，帮助读者深入了解和应用这些技术。

1. 数据仓库概述数据仓库（Data Warehouse）是指将企业内部各个部门和系统产生的分散、异构、海量的数据汇总、整合到一个统一、一致的数据库中，并提供给企业决策者进行数据分析和挖掘的一种信息系统。

数据仓库的建设旨在解决企业数据存储、数据质量、数据一致性和数据分析等问题。

2. MySQL数据库的ETL过程2.1 数据抽取数据抽取是指从多源数据系统中获取需要的数据，并将其导入到数据仓库中的过程。

MySQL数据库提供了多种数据抽取的方式，包括基于时间的增量抽取、全量抽取和增量抽取等。

其中，基于时间的增量抽取是最常用的方式，通过捕获增量数据来实现定期更新数据仓库，大大缩短了数据抽取的时间和成本。

2.2 数据转换数据转换是指将数据从源系统中的原始格式转换为适合数据仓库的格式。

在MySQL数据库中，可以通过SQL语句和函数对数据进行转换。

例如，可以使用SQL语句进行数据清洗、数据筛选和数据合并等操作，通过函数进行数据格式转换和计算。

2.3 数据加载数据加载是指将经过抽取和转换的数据加载到数据仓库中的过程。

在MySQL数据库中，可以使用INSERT语句将数据加载到数据仓库的表中。

同时，在数据加载过程中，还可以进行数据校验、错误处理和日志记录等操作，以确保数据的完整性和正确性。

3. 数据仓库建设实战教程3.1 数据模型设计数据模型是数据仓库建设的关键步骤之一，它决定了数据仓库中数据的存储结构和关系。

在MySQL数据库中，可以使用物理数据模型进行数据仓库的建模工作。

物理数据模型通过实体-关系图（ER图）和实体属性关系图（EP图）来描述数据实体、属性和关系之间的关系，并将其映射到数据库表结构中。

数据仓库的ETL设计与实现

数据仓库的ETL设计与实现随着数据管理和处理技术的不断发展，数据仓库的应用越来越广泛。

数据仓库是一个面向主题的、集成的、稳定的、历史数据导向的数据集合，它可以为企业决策提供支持和参考。

而ETL （Extract-Transform-Load）是数据仓库建设中至关重要的一环，本文将从ETL的定义、设计和实现三个方面讨论数据仓库ETL的相关内容。

一、ETL的定义ETL是数据仓库中的三个核心过程之一，其作用是将来源系统的数据提取出来、进行清洗和转换、最终加载到数据仓库中。

该过程包括了多个环节，例如数据抽取、转换、质量验证等。

数据抽取主要是从数据源系统中提取需要的数据，转换则是对数据进行处理，如合并、拆分、计算、汇总等操作。

而在数据转换的过程中，也需要对数据的质量进行验证，包括数据完整性、准确性、一致性等多方面的要求。

最后通过数据加载的过程，将清洗后的数据存储到数据仓库中，以供后续的查询和分析使用。

二、ETL的设计1. 数据源分析在进行ETL设计之前，需要对数据源进行充分、全面的分析。

这个过程可以帮助我们了解源数据的组织方式、数据格式以及数据量，进而为后续的数据抽取和转换设计提供有力的支持。

此外，还需要考虑数据源的连接方式和可靠性。

2. 抽取和清洗在数据抽取方面，需要针对不同来源系统选择不同的抽取方式。

例如，可以使用增量抽取方式来避免对全部数据的重复抽取；也可以选择周期性全量抽取的方式，提高数据抽取的准确性和及时性。

而在数据清洗方面，则需要对数据进行结构化、规整、控制数据质量，如去除重复记录、删除无效数据、纠正数据错误等操作。

清洗之后的数据能够满足数据仓库的要求，保证后续数据处理的有效性。

3. 转换和装载在数据转换方面，主要采用ETL工具对数据进行处理。

ETL工具能够提供大量的内置函数、命令和工具，帮助我们完成加工数据的过程，如对数据进行汇总、拆分、格式转换等操作，让数据达到更好的可用性和易读性。

而在数据装载方面，主要考虑数据的加载方式和处理速度。

数据仓库设计思路及ETL设计思路

数据仓库设计思路及ETL设计思路⼀、数据仓库构建思想构造数据仓库有两种⽅式：⼀是⾃上⽽下，⼀是⾃下⽽上。

Bill Inmon先⽣推崇“⾃上⽽下”的⽅式，即⼀个企业建⽴唯⼀的数据中⼼，就像⼀个数据的仓库，其中数据是经过整合、经过清洗、去掉脏数据的、标准的，能够提供统⼀的视图。

要建⽴这样的数据仓库，并不从它需要⽀持哪些应⽤⼊⼿，⽽是要从整个企业的环境⼊⼿，分析其中的概念，应该有什么样的数据，达成概念完成整；（会考虑到很全⾯的设计）Ralph Kimball先⽣推崇“⾃下⽽上”的⽅式，他认为建设数据仓库应该按照实际的应⽤需求，加载需要的数据，不需要的数据不要加载到数据仓库中。

这种⽅式建设周期较短，客户能够很快看到结果。

（针对客户的需求，需求要什么就做什么）⼆者都要达到同⼀个⽬标：企业级数据仓库。

实际上在建设数据仓库的时候，⼀般都参照这两种⽅式结合使⽤没有硬性规定。

⼆、ETL（Extract/Transformation/Load）⽤户从数据源中抽取所需的数据，经过数据清洗、转换，最终按照预先定义好的数据仓库模型，将数据加载到数据仓库中去；ETL是数据仓库系统中最重要的概念之⼀，ETL在⼀个数据仓库系统项⽬中要花⼀半以上的时间。

1） ETL调度⽬标数据来源：数据库、数据库⽂件、⽂本⽂件、程序⽣成（派⽣列）系统数⽬：单个系统、多个系统（过多的系统可以考虑接⼝实现）数据库的类型：同种数据库/多种数据库2） ETL调度参数设计调度优先级/调度次序/中断标志/回滚标志/成功标志/调度开始结束时间等3） ETL调度⽇志管理⽂件记录/数据库记录作业名称/作业执⾏开始-结束时间/作业执⾏结果/异常信息捕获/作业编号等4） ETL调度JOB设计数据⽂本⽂件加载/SQL在程序中调⽤/存储过程/ETL⼯具的WORKFOLW5） ETL调度策略设计全量数据加载：⽤户信息类数据，状态会更新发⽣变化的数据增量数据加载：流⽔分批调度设计，抽取数据⼀般在⽐较闲暇的时候进⾏，凌晨时候⽐较多，⽽且按照要分析数据的周期，还分为按⽇、按⽉数据；由于涉及到的业务系统的数据量庞⼤，需要分批进⾏抽取，以及抽取数据后⾯的⼀系列处理过程。

通过Hive创建数据仓库与ETL流程

通过Hive创建数据仓库与ETL流程随着大数据时代的到来，企业面临着大量的数据积累和分析需求，为了更好地管理和利用这些数据，构建高效的数据仓库成为了重要的任务。

在数据仓库的构建过程中，使用Hive进行数据管理和ETL处理是一种常见的做法。

本文将介绍如何通过Hive创建数据仓库并实现ETL流程。

一、Hive简介Hive是一种基于Hadoop的数据仓库基础设施，提供了类似于SQL的查询语言HiveQL来进行数据管理和查询。

Hive主要由三部分组成：元数据存储、Hadoop MapReduce、HiveQL。

通过Hive，我们可以方便地使用SQL语言对存储在Hadoop中的数据进行处理和分析。

二、创建Hive数据仓库1. 配置Hive环境首先，我们需要在Hadoop集群中安装和配置Hive。

在安装Hive之前，需要确保Hadoop已经安装并正确配置。

然后，可以从官方网站或者软件仓库中下载Hive，并将其解压到所需的目录中。

接下来，需要修改Hive的配置文件，将Hadoop的配置信息与Hive关联起来，以便Hive可以通过Hadoop进行数据存储和计算。

2. 创建数据库在Hive中，一个数据库对应一个数据仓库。

我们可以使用HiveQL语句在Hive中创建数据库。

例如，可以使用以下语句创建一个名为"mydatabase"的数据库：```CREATE DATABASE mydatabase;```3. 表创建和数据导入在数据库创建完成后，我们可以使用HiveQL语句创建表并导入数据到表中。

首先，需要定义表的结构和字段，然后使用“LOAD DATA INPATH”命令将数据导入到表中。

例如，可以使用以下语句创建一个名为"mytable"的表，并将数据从本地文件导入到该表中：```CREATE TABLE mytable (id INT,name STRING,age INT);LOAD DATA INPATH '/path/to/localdata' INTO TABLE mytable;```通过以上步骤，我们就成功地使用Hive创建了一个数据仓库，并将数据导入到了表中。

ETL的过程原理和数据仓库建设

ETL的过程原理和数据仓库建设数据仓库建立中的ETL(Extract, Transform, Load)是数据抽取、转换和装载到模型的过程，整个过程根本是通过掌握用SQL语句编写的存储过程和函数的方式来实现对数据的直接操作，SQL语句的效率将直接影响到数据仓库后台的性能。

目前，国内的大中型企业根本都具有四年以上计算机信息系统应用阅历，积存了大量可分析的业务数据，这些信息系统中的数据需要通过搭建数据仓库平台才能得到科学的分析，这也是近几年数据仓库系统建立成为IT领域热门话题的缘由。

2.优化的思路分析数据仓库ETL过程的主要特点是：面对海量的数据进展抽取；分时段对大批量数据进展删除、更新和插入操作；面对特别的数据进展规章化的清洗；大量的分析模型重算工作；有特定的过程处理时间规律性，一般整个ETL过程需要在每天的零点开头到6点之前完成。

所以，针对ETL过程的优化主要是结合数据仓库自身的特点，抓住需要优化的主要方面，针对不同的状况从如何采纳高效的SQL入手来进展。

3.优化的实例分析目前数据仓库建立中的后台数据库大局部采纳Oracle，以下的SQL 采纳Oracle的语法来说明，全部的测试在Oracle9i环境中通过，但其优化的方法和原理同样适合除Oracle之外的其他数据库。

3.1索引的正确使用在海量数据表中，根本每个表都有一个或多个的索引来保证高效的查询，在ETL过程中的索引需要遵循以下使用原则：(1) 当插入的数据为数据表中的记录数量10%以上时, 首先需要删除该表的索引来提高数据的插入效率，当数据全部插入后再建立索引。

(2) 避开在索引列上使用函数或计算，在WHERE子句中，假如索引列是函数的一局部，优化器将不使用索引而使用全表扫描。

举例: 低效： SELECT * ROM DEPT WHERE SAL * 12 > 25000;高效： SELECT * FROM DEPT WHERE SAL > 25000/12;(3) 避开在索引列上使用NOT和”!=”，索引只能告知什么存在于表中，而不能告知什么不存在于表中，当数据库遇到NOT和”!=”时，就会停顿使用索引转而执行全表扫描。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Northwind数据仓库的构建和ETL 课程设计与实验报告
课程设计与实验教学目的与基本要求
数据仓库与知识工程课程设计与实验是学习数据仓库与知识工程的重要环节，通过课程设计与实验，可以使学生全面地了解和掌握数据仓库与知识工程课程的基本概念、原理及应用技术，使学生系统科学地受到分析问题和解决问题的训练，提高运用理论知识解决实际问题的能力。

使学生在后继课的学习中，能够利用数据仓库与数据挖掘技术及实践经验，解决相应的实际问题，并能在今后的学习和工作中，结合自己的专业知识，开发相应的数据仓库与数据挖掘应用程序。

培养学生将已掌握的理论与实践开发相结合的能力，以及在应用方面的思维能力和实践动手能力。

课程设计与实验一数据仓库的构建和ETL
（一）目的
1．理解数据库与数据仓库之间的区别与联系；
2．掌握数据仓库建立的基本方法及其相关工具的使用。

3．掌握ETL实现的基本方法及其相关工具的使用。

（二）内容
1. 以SQL Server为系统平台，设计、建立创建数据仓库NorthwindDW（根据课程设计内容）。

2. 将业务数据库Northwind的数据经过ETL导入（或加载）到数据仓库NorthwindDW。

3. 将数据仓库NorthwindDW事实表的前100个记录导出到Excel中。

（三）数据仓库设计要求
Northwind数据库存储了一个贸易公司的订单数据、产品数据、顾客数据、员工数据、供货商数据等，假设贸易公司的经营者迫切的需要准确地把握贸易公司经营情况，跟踪市场趋势，更加合理地制定商品采购、营销和奖励政策。

具体的分析需求是：
●分析某商品在某地区的销售情况
●分析某商品在某季度的销售情况
●分析某年销售多少金额的产品给顾客
●分析某员工的销售业绩
任务：确定主题域、确定系统（或主题）的边界。

设计数据模型（星型模型）的事实表和维表。

实验步骤一、主题需求分析:
主题域：订单主题，商品主题，员工主题；
订单相关边界：Orders，Order Details，Employees；
商品相关边界：Products，Order Details；
员工相关边界：Employees，Orders；
实验步骤二、构建数据模型以及相应的事实表和维度表：1.原始关系图:
2.去除不需要的表和与需求分析无关的字段:
5.根据信息分析包以及表间关系图设计具体维度表和事实表:
6. 下图显示了Northwind数据库的星型雪花架构结构图：
实验步骤三、创建数据仓库并抽取转换导入数据：
1.首先打开SQL Server Business Intelligence Development Studio, 创建一个新的SQL Server Integration Services项目,并取名为northwind
2.点击确定后生成以下界面。

3.接下来在菜单栏中点击[项目]选择SSIS导入和导出向导，在弹出来的窗口里选择SQL Native Client 10.0 作为数据源，数据库下拉选择已装好的Northwind数据库，点击下一步。

4.进入数据目标的操作界面，这里需要新建一个数据仓库，以后数据经过ETL过程后，数据存放到这个数据仓库中。

5.选择数据的复制方式，如下图所示，有两种方式，一种是直接将表复制过去，这种方式不是很灵活，对多表连接存在一定的局限性。

这里采用的第二种方法。

6.接下来输入SQL语句，目前进行提取和转换的是事实表orders，sql语句必须写正确，要不然会影响后面的导入数据。

点击分析可以查看是否有误，没有的话即可进入下一步。

7.接下来可以编辑表之间的映射关系。

当时我想把表名改成其他更形象具体的名字，可是不知道为什么，如果把【查询】改了之后，后面的数据加载就会有问题。

这也是一个有待解决的问题。

8.点击完成后即可以完成本次表格的导入。

的工具箱，拖出来数据流源的OLE DB源和数据流目标的OLE DB目标两个元件到界面上。

10. 右击OLE DB源选择编辑，OLE DB连接管理器那一定要看清楚是对什么进行的编辑，如果是源，就要选source..。

然后再对目标进行编辑，需要新建一个表来进行映射。

11.直到所有的与事实表相关的维表全部编辑完，右击右侧的你刚刚生成的包，设为启动项，再运行程序。

12.调试成功的话所有的元件底色都会变成绿色，如图所示：
13.此时回到NorthDW数据仓库中可以发现，全部的表已成功导入完毕，接下来回到数据库系统中给所生成的各表手动建立主键约束以及关系设置，全部操作完成之后本次数据仓库抽取-转换-导入数据宣告完成。

Orders事实表
Employee维表
实验步骤四、导出指定内容数据至Excel表格：
1.执行事实表Sales的数据导出至excel操作，首先右键单击NorthwindDW数据仓库，在
弹出的菜单下依次点击任务->导出数据。

2.接着在需要复制的数据源处选择SQL Native Client 10.0，数据库选择NorthDW，点击下
一步。

3.选择目标为Microsoft Excel，自行设置文件存放路径，Excel版本推荐选择97-2005，然
后点击下一步，选择编写查询以指定要传输的数据。

4.接着使用SQL语句写出想要导出来的表以及相应的内容即可。

本次目标是导出Sales事
实表的前100行
5.点击下一步后即可生成对应的Excel文件，导出任务成功，事实表前100个记录。

6.
实验结果：
1. 确定主题域、确定系统（或主题）的边界。

完成了NorthDW 的星型雪花结构设计，确定全部维表和事实表。

2.设计、建立创建数据仓库NorthDW。

3.将业务数据库Northwind的数据经过ETL导入（或加载）到数据仓库NorthDW。

4.将数据仓库NorthDW事实表的前100个记录导出到Excel中。

实验问题和总结：
本次实验花了我很多的心思和心血，主要是觉得自己基础太薄弱。

实验的最终结果由于时间关系跟自己最初想做的不太一样。

主要是在开始花掉了太多的时间，但是整个流程自己还是了解得挺好了，所以说做出一个更好的东西出来也只是时间问题。

在做的过程中，遇到了很多小问题。

1.创建数据仓库表的时候，到底是从原有的数据库中复制还是用sql语句创建复制。

刚开始我是用的sql语句复制，当时就因为一个小小的圆点问题耽搁了很多时间，没有解决出来，就尝试用原有数据库中的表复制，但是问题就来了，多个表连接再映射没法做，最后还是通过sql语句实现的。

2.表映射完后，对数据的加载也出现了问题。

刚开始老不成功，最后发现时表重复的
原因，因为自己反复新建了很多个项目和相同的表，只要把书库仓库中的同名表删掉就可以加载了。

导出数据的时候也出现了问题，后来发现原来我的表名和关键字重复了，只需要将数据仓库的order表重新命名就好了。

3.
4．生成数据仓库表的关系图的时候，由于两张表的customerID数据类型不同，则不能添加主外键关系，本来想直接在数据库里改的，但是不允许修改，就只能借助数
据转换工具，但是数据转换现在还没有研究成功。

5. 其实还想做更多的任务，比如字段的拼接，由于时间关系这次没有做，但是下来会
花时间来做做。

遇到的问题肯定不止这一点点，但都是些很小的问题，通过自己的研究和同学的帮助最终做出一个勉强的东西，但是下来我会接着研究的，因为通过学习，感觉数据仓库还是挺有趣的。