数据分析概要

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章——数据分析概要

数据分析六部曲

明确分析目的和思路、数据收集、数据处理、数据分析、数据展现、报告撰写

(1)确定分析思路

使分析框架体系化(逻辑化,简单说就是先分析什么后分析什么):以理论为指导,结合实际业务情况,搭建分析框架。

营销理论模型:4P、用户使用行为、STP理论、SWOT等。

(2)数据收集

第一手数据:可直接获取的数据;

第二手数据:经过加工整理后得到的数据。

数据来源:数据库、公开出版物、互联网、市场调查。

(3)数据处理

数据处理基本目的是从大量的、杂乱无章的、难以理解的数据中,抽取并推导出对解决问题有价值、有意义的数据。

处理方法:数据清洗、数据转化、数据提取、数据计算。

(4)数据分析

在确定数据分析思路的阶段,分析师应当为需要分析的内容确定适合的数据分析方法。(5)数据展示

一般情况下通过表格和图形的方式来呈现。

常用图表:饼图、柱形图、条形图、折线图、散点图、雷达图等;

整理加工后可变为:金字塔图、矩阵图、漏斗图、帕累托图等。

(6)报告撰写

通过报告,把数据分析的起因、过程、结果及建议完整地呈现出来,供决策者参考。

一份好的数据分析报告,首先需要有一个好的分析框架,并且图文并茂,层次清晰,能够让阅读者一目了然。另外,数据分析报告需要有明确的结论。最后,好的分析报告一定要有建议或解决方案。

《数据分析报告实例》

目录

一、分析背景与目的

二、分析思路

三、分析正文

1.XX分析

2.XX分析

3.XX分析

四、总结与建议

数据分析的三大误区

1、分析目的不明确,为分析而分析

2、缺乏业务知识,分析结果偏离实际

3、一味追求使用高级方法,热衷研究模型

常用指标和术语

平均数:算数平均数、调和平均数、几何平均数

绝对数:反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合性指标,如GDP、总人口等。

相对数:由两个有联系的指标对比计算而得到的数值,用以反映客观现象之间数量联系程度的综合指标。绝对数=比较数值(比数)/基础数值(基数)

百分比与百分点:如公司今年的利润是45%,比去年的28%提高了17个百分点。

频数与频率:频数指一组数据中个别数据重复出现的次数。

比例与比率:比例指在总体中各部分的数值占全部数值的比重。比率指不同类别数值的对比。

倍数与番数:番数指原来数量的2的N次方倍,如翻一番为原来数量2倍,翻两番为4倍。

同比与环比:同比指与历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况。环比指与前一个统计期进行比较得到的数值。

第二章——确定分析思路

数据分析方法论

主要用来指导数据分析师进行一次完整的数据分析,它更多的是指数据分析思路,比如主要从哪几方面开展数据分析?各方面包含什么内容和指标?

应养成在分析方法论的指导下开展分析的习惯,以确保分析结果具有指导意义。

作用:①理顺分析思路,确保数据分析结构体系化

②把问题分解成相关联的部分,并显示它们之间的关系

③为后续数据分析的开展指引方向

④确保分析结果的有效性及正确性

常用的数据分析方法论

1、PEST分析法(行业分析)

用于对宏观环境的分析,宏观环境包括四类:政治环境、经济环境、社会环境、技术环境。

2、5W2H分析法(用户行为分析、业务问题专题分析等)

Why, What, Who, When, Where; How, How much

3、逻辑树分析法(业务问题专题分析)

使用时必须遵循:①要素化:把相同问题总结归纳成要素

②框架化:将各个要素组织成框架,遵守不重不漏的原则

③关联化:框架内的各要素保持必要的相互关系,简单而不孤立

4、4P营销理论(公司整体经营情况分析)

Product(产品)、Price(价格)、Place(渠道)、Promotion(促销)

5、用户行为理论(用户行为研究分析)

认知→熟悉→试用→使用→忠诚

第三章——数据准备

理解数据

1、字段与记录(数据或变量值)

2、数据类型:字符型数据,数值型数据

3、数据表:如表中合并单元格较多,设计不合理,不符合数据分析的要求。

二维表转换为一维表

数据来源

导入数据

(1)导入文本数据(txt格式)

(2)自动导入网站数据,可即时刷新

问卷录入要求

根据问题的类型不同:①数值题②单选题③多选题(二分法/多重分类法)④排序题⑤开放性文字题

第四章——数据处理

何为数据处理

“三心二意”处理数据

信心、细心、平常心、诚意、合意

1%的错误=100%的失败

数据清洗

一、重复数据的处理

(1)函数法:COUNTIF

(2)高级筛选法:“将筛选结果复制到其他位置”“选择不重复的记录”

(3)条件格式法:突出重复值

(4)数据透视表法

二、缺失数据的处理

1、定位输入

选中表格,①“查找和选择”,“定位条件”/ ②F5 / ③Ctrl+G

处理缺失值的四种方法

方法一:用一个样本统计量的值代替缺失值,如用该变量的样本平均值;

方法二:用一个统计模型计算出来的值去代替缺失值,如回归模型、判别模型,需用专业数据分析软件;

方法三:将有缺失值的记录删除,可能会导致样本量的减少;

方法四:将有缺失值的记录保留,仅在相应的分析中做必要的排除。(应在调查的样本量较大,缺失值的数量不多,且变量之间也不存在高度相关的情况下使用)

“Ctrl+Enter”快捷键

①Ctrl定位不连续单元格/Ctrl+G定位空白单元格②录入数据③“Ctrl+Enter”使所有选中的单元格都被填充

2、查找替换

三、检查数据逻辑错误

1、利用IF函数检查错误

2、利用条件格式标记错误

数据加工

一、数据抽取

字段分列:(1)菜单法(2)函数法:

相关文档
最新文档