铁路客票数据仓库的设计与实现

目录

1绪论 (1)

1.1研究背景 (1)

1.2研究目标和内容 (3)

1.3论文结构 (3)

2相关技术综述 (4)

2.1数据仓库的概念 (4)

2.2数据仓库的开发方法 (4)

2.2.1方法概述 (4)

2.2.2需求分析 (5)

2.2.3逻辑分析 (6)

2.2.4ODS建模 (7)

2.2.5数据仓库建模 (9)

2.2.6数据集市建模 (12)

2.2.7数据源分析 (13)

2.2.8数据的获取与整合 (13)

2.2.9应用设计 (14)

2.3数据仓库的技术 (15)

3铁路客票数据仓库的需求分析 (17)

3.1铁路客票系统现状分析 (17)

3.1.1铁道部客运现状分析 (17)

3.1.2客票系统的架构 (18)

3.1.3客票系统的数据存储 (21)

3.2铁路客票数据仓库的需求 (23)

3.2.1目标定位 (23)

3.2.2总体需求 (23)

3.2.3主题域总体结构 (24)

3.2.4各主题域 (25)

4铁路客票数据仓库的设计 (31)

4.1总体架构设计 (31)

4.2数据架构 (32)

4.2.1总体数据架构 (32)

4.2.2各组件 (33)

4.2.3数据建模 (36)

4.3执行架构 (41)

4.3.1数据ETL (42)

4.3.2数据访问 (43)

4.4物理架构 (48)

4.4.1服务器分类 (48)

4.4.2服务器部署拓扑 (49)

4.5存储容量规划 (50)

4.6服务器性能估算 (54)

5客票系统数据仓库的实现和测试 (56)

5.1平台选型 (56)

5.2实现 (56)

5.2.1ETL的实现 (57)

5.2.2数据展现的实现 (60)

5.2.3实现效果 (65)

5.3测试 (72)

5.3.1测试环境 (72)

5.3.2测试方法 (73)

5.3.3功能测试 (73)

5.3.4性能测试 (75)

6总结和展望 (77)

6.1本文总结 (77)

6.2展望 (77)

参考文献 (79)

致谢 (80)

攻读学位期间发表的学术论文目录 (81)

1绪论

中国拥有总里程超过五万公里的铁路线,是世界上最大的铁路运输网之一。而铁路客运服务在其中又占有非常重要的地位。其中有5000多个车站承办客运业务,日开行列车2000多列。随着中国经济的快速发展,近几年全国运输市场结构发生了巨大变化,铁路、公路、水运、航空等各种运输方式的竞争日趋激烈,铁路在旅客发送量增长的同时,所占市场客运总量的比例却逐年下降[1]。自1990年公路客运市场占有率超过铁路升至首位以来,铁路已丧失“铁老大”地位。近年来,铁路相关部门也一直在努力寻找提高竞争力、改善服务的途径和办法。

本文利用目前全国联网的铁路客票发售和预订系统(Tickets Retrieval System,TRS,以下简称“客票系统”),分析其中的交易数据,建立数据仓库和数据集市,抽取相应的业务数据到数据仓库中,建立科学的数据分析模型,从客流预测、市场细分、适时通报、运力配置等方面不断探索,依靠数据仓库技术来改造传统信息产业,逐步建立起科学预测、及时预警的客运营销辅助决策系统,旨在改变以往传统的人工分析和经验预测的方法,为铁路充分挖掘运能潜力、实现运输效益最大化提供科学依据。

1.1研究背景

著名的数据仓库专家W.H.Inmon在其著作《Building the Data Warehouse》一书中给予如下描述:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策[2]。

数据仓库的概念在国外出现后,首先被应用于金融、电信、保险等传统数据处理密集的行业,国外许多大型的数据仓库在1996-1997年建立。随着市场竞争的加剧,数据仓库已成为营销的必备武器,一种通过更多地了解客户需求进而保住客户的途径。从目前看,数据仓库在国外的应用已较为普遍,并呈现出应用较早、在数据积累方面比较领先、业务应用较为丰富、业务人员IT背景较强、有比较完善的管理和实施等特点。截止2011年,处于世界500强的企业多数都在建设或已经建设完成数据仓库系统,处于世界排名前列的交通行业均建设有数据仓库系统。

相关主题
相关文档
最新文档