PAXIS数据分析作业指导书

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

PAXIS数据分析作业指导书

目录

1.PAXIS数据介绍 (2)

1.1 什么是PAXIS (2)

1.2 BSP覆盖国家 (2)

1.3 PAXIS数据库及表格 (2)

1.4 PAXIS数据字段 (4)

2. SQL创建、查询命令 (6)

2.1 基本查询格式 (6)

2.2 Select 语句 (6)

2.3 where 语句 (7)

2.4 Create tabe语句 (9)

2.5 Insert语句 (9)

2.6 group by 语句 (9)

2.7 Union 语句 (10)

3.Paxis数据分析应用 ............................................................................ 错误!未定义书签。

3.1 分析步骤 (10)

3.2 分析案例 (15)

1.1 什么是PAXIS

PAXIS是Passenger Intelligence Services的简称,PAXIS数据是来源于国际航协IATA 的BSP销售数据,属于出票环节的数据。

1.2 BSP覆盖国家

BSP主要在以下国家使用

以下地区的销售数据不包括在BPS销售数据当中。

1.3 PAXIS数据库及表格

目前首尔办事处SQL数据库服务器当中,有两个PAXIS数据库,PAXIS和PAXIS2013,其他的数据库都是没用的或者测试的数据库。

1.3.2 PAXIS数据表格

Paxis数据库下面的icnpaxis2012存储的是2012年承运的跟韩国相关航程的paxis 数据。

Paxis2013数据库下面的icnpaxis2013存储的是2013年承运的跟韩国相关航程的paxis数据,暂时数据只有1-5月份的,6月份以后的数据还需要继续导入。

当只在某个数据库查询时,直接使用数据表格的名称即可,如icnpaxis2013,或者aa_paxis。当数据查询涉及到两个或者多个数据库时,按以下形式:数据库名称.数据表格名称。如需要同时查询paxis数据库下面的icnpaxis2012数据表格和paxis2013数据库下面的icnpaxis2013 数据表格,则分别使用paxis.icnpaxis2012和paxis2013.icnpaxis2013

1.4 PAXIS数据字段

1.4.1 如何在MYSQL找到PAXIS数据字段

打开SQL数据表后,点击TABLE,即可找到数据表里面的全部字段。全部字段均可单击复制。

1.4.2 PAXIS数据常用字段

MYSQL 服务器里的PAXIS数据,每一行表示客票当中的某一个航段。例如有100行则表示一共有100个航段。包括以下的字段:

2. SQL创建、查询命令

2.1 基本查询格式

2.2 Select 语句

2.2.1 Count函数

Distinct表示不重复的值,因为每个旅客都有不重复的primary_ticket_key,故可以用select count(distinct primary_ticket_key) 来统计旅客人数,假如没有加distinct的话,select count(primary_ticket_key)统计出来的则是旅客人次,即航段数量。

2.2.2 求和函数

2.3 where 语句

2.3.1 比较操作符

例如,提取OD为ICN-LAX的数据,则where语句为:where OD=’ICN-LAX’2.3.2 逻辑及连接操作符

2.3.3 通配符%

通配符%表示一个或者一串字符,经常与like 联用,如需要查询ICN始发至LAX的数据,则使用where route like ‘icn%lax%’,表示筛选所有航程中以ICN开头,并且航程中含有LAX的所有数据。

2.3.4 引号

使用逻辑及连接操作符的内容都要使用英文引号,如Where route like ‘ICN%CAN%’。假如引号里面的内容是数值的话,可以用也可以不用引号,例如year(issue_date)=2013

2.4 Create tabe语句

Create table用户创建用户table,如需要从icn_paxis2012这个表格中,筛选出ICN 始发至广州的所有数据,并建立一个table,语句为:

Create table can_paxis

Select * from icn_paxis2012

Where route like ‘ICN%CAN%’

2.5 Insert语句

用于向已有的table中添加数据,例如:需要往刚才创建的can_paxis表里再添加首尔始发至武汉的数据,语句为:

Inter into can_paxis

Select * from icn_paxis2012

Where route like ‘ICN%WUH%’

2.6 group by 语句

GROUP BY 语句用于结合合计函数,根据一个或多个列对结果集进行分组。常跟count、

sum等函数一并使用,用法为: group by + count或sum前面的所有字段。如:Select od, od_order,month(issue_date),count(distinct primary_ticket_key) as pax From can_paxis

Group by od, od_order,month(issue_date)

2.7 Union 语句

UNION 操作符用于合并两个或多个SELECT 语句的结果集,常用union all。如需筛选出ICN 始发至广州的2012年和2013年数据:

Select * from paxis.icn_paxis2012

Where route like ‘ICN%CAN%’

Union all

Select * from paxis2013.icn_paxis2013

Where route like ‘ICN%CAN%’

3.Paxis数据分析应用

3.1 分析步骤

相关文档
最新文档