浅谈如何才能快速成为数据分析师

浅谈如何才能快速成为数据分析师
浅谈如何才能快速成为数据分析师

浅谈如何才能快速成为数据分析师

我小时候的理想是将来做一名数学家,可惜长大了发现自己天赋不够,理想渐行渐远,于是开始考虑现实,开始做一些人生规划,我一直在思考将来从事何种职业,专注什么样的领域,重新定义着自己的职业理想。我现在的职业理想,比较简单,就是做一名数据分析师。

为什么要做数据分析师:

在通信、互联网、金融等这些行业每天产生巨大的数据量(长期更是积累了大量丰富的数据,比如客户交易数据等等),据说到2020年,全球每年产生的数据量达到3500万亿GB;海量的历史数据是否有价值,是否可以利用为领导决策提供参考依据?随着软件工具、数据库技术、各种硬件设备的飞快发展,使得我们分析海量数据成为可能。

而数据分析也越来越受到领导层的重视,借助报表告诉用户什么已经发生了,借助OLAP和可视化工具等分析工具告诉用户为什么发生了,通过dashboard监控告诉用户现在在发生什么,通过预报告诉用户什么可能会发生。数据分析会从海量数据中提取、挖掘对业务发展有价值的、潜在的知识,找出趋势,为决策层的提供有力依据,为产品或服务发展方向起到积极作用,有力推动企业内部的科学化、信息化管理。

我们举两个通过数据分析获得成功的例子:

(1) Facebook广告与微博、SNS等网络社区的用户相联系,通过先进的数据挖掘与分析技术,为广告商提供更为精准定位的服务,该精准广告模式收到广大广告商的热捧,根据市场调研机构eMarketer的数据,Facebook年营收额超过20亿美元,成为美国最大的在线显示广告提供商。

(2) Hitwise发布会上,亚太区负责人John举例说明: 亚马逊30%的销售是来自其系统自动的产品推荐,通过客户分类,测试统计,行为建模,投放优化四步,运营客户的行为数据带来

竞争优势。

此外,还有好多好多,数据分析,在营销、金融、互联网等方面应用是非常广泛的:比如在营销领域,有数据库营销,精准营销,RFM分析,客户分群,销量预测等等;在金融上预测股价及其波动,套利模型等等;在互联网电子商务上面,百度的精准广告,淘宝的数据魔方等等。类似成功的案例会越来越多,以至于数据分析师也越来越受到重视。

然而,现实却是另一种情况。我们来看一个来自微博上的信息:在美国目前面临14万~19万具有数据分析和管理能力的专业人员,以及150万具有理解和决策能力(基于对海量数据的研究)的管理人员和分析人员的人才短缺。而在中国,受过专业训练并有经验的数据分析人才,未来三年,分析能力人才供需缺口将逐渐放大,高级分析人才难寻。

也就是说,数据分析的需求在不断增长,然而合格的为企业做分析决策的数据分析师却寥寥无几。好多人想做数据分析却不知道如何入手,要么不懂得如何清洗数据,直接把数据拿来就用;要么乱套模型,分析的头头是道,其实完全不是那么回事。按俗话说就是:见过猪跑,没吃过猪肉。

我的职业规划:

对于数据分析,有一句话说的非常好:spss/sql之类的软件、决策树、时间序列之类的方法,这些仅仅就都是个工具而已,最重要的是对业务的把握。没有正确的业务理解,再牛的理论,再牛的工具,都是白搭。

做一名合格的数据分析师,除了对数据需要有良好的敏感性之外,对相关业务的背景的深入了解,对客户或业务部门的需求的清晰认识。根据实际的业务发展情况识别哪些数据可用,哪些不适用,而不是孤立地在“真空环境”下进行分析。

为此,我对自己的规划如下:

第一步:掌握基本的数据分析知识(比如统计,概率,数据挖掘基础理论,运筹学等),掌握基本的数据分析软件(比如,VBA,Matlab,Spss,Sql等等),掌握基本的商业经济常识(比如宏微观经济学,营销理论,投资基础知识,战略与风险管理等等)。这些基础知识,在学校里尽量的学习,而且我来到了和君商学院,这样我可以在商业分析、经济分析上面领悟到一些东西,增强我的数据分析能力。

第二步:参与各种实习。研一开始我当时虽然有课,不过很幸运的找到一份一周只需去一两天的兼职,内容是为三星做竞争对手分析,当然分析框架是leader给定了,我只是做整合资料和往ppt里填充的内容的工作,不过通过兼职,我接触到了咨询行业,也向正式员工学习了很多商业分析、思考逻辑之类的东西。

之后去西门子,做和VBA的事情,虽然做的事情与数据分析无关,不过在公司经常用VBA 做一些自动化处理工作,为自己的数据分析工具打好了基础。再之后去了易车,在那里兼职了一个多月,参与了大众汽车销量数据短期预测的项目,一个小项目下来,数据分析的方法流程掌握了不少,也了解了企业是如何用一些时间序列模型去参与预测的,如何选取某个拟合曲线作为预测值。

现在,我来到新的地方实习,也非常幸运的参加了一个央企的码头堆场优化系统设计,其实也算数据分析的一种吧,通过码头的数据实施调度,通过码头的数据进行决策,最后写成一个可操作的自动化系统。而这个项目,最重要的就是业务流程的把握,我也参与项目最初的需求调研,和制定工作任务说明书SOW,体会颇多。

第三步:第一份工作,预计3-5年。我估计会选择咨询公司或者IT公司吧,主要是做数据分析这块比较强的公司,比如Fico,埃森哲,高沃,瑞尼尔,IBM,AC等等。通过第一份工作去把自己的知识打得扎实些,学会在实际中应用所学,学会数据分析的流程方*,让自己成长起来。

第四步:去自己喜欢的一个行业,深入了解这个行业,并讲数据分析应用到这个行业里。比

如我可以去电子商务做数据分析师。我觉得我选择电子商务,是因为未来必将是互联网的时代,电子商务必将取代传统商务,最显著的现象就是传统零售商老大沃尔玛正在受到亚马逊的挑战。此外,电子商务比传统的零售商具有更好的数据收集和管理能力,可以更好的跟踪用户、挖掘潜在用户、挖掘潜在商品。

第五步:未知。我暂时没有想法,不过我希望我是在一直的进步。

有一位数据分析牛人曾经总结过数据分析师的能力和目标:

能力:一定要懂点战略、才能结合商业;一定要漂亮的presentation、才能buying;一定要有global view、才能打单;一定要懂业务、才能结合市场;一定要专几种工具、才能干活;一定要学好、才能有效率;一定要有强悍理论基础、才能入门;一定要努力、才能赚钱;最重要的:一定要务实、才有reputation;不懂的话以后慢慢就明白了。

目标:1-做过多少个项目?2-业务背景有哪些,是否跨行业?3-做过多少种类型的模型?做了多少个模型?4-基于模型做过多少次完整的marketing闭环?以上四个问题,足以秒杀95%以上的忽悠和菜鸟!

【编辑推荐】

数据分析师新的主宰者

大数据时代数据分析师的尴尬

浅谈数据分析师的级别

大数据分析师的“YES”与“NO”

【精选】数据分析师面试常见的77个问题

数据分析师面试常见的77个问题 2013-09-28数据挖掘与数据分析 随着大数据概念的火热,数据科学家这一职位应时而出,那么成为数据科学家要满足什么条件?或许我们可以从国外的数据科学家面试问题中得到一些参考,下面是77个关于数据分析或者数据科学家招聘的时候会常会的几个问题,供各位同行参考。 1、你处理过的最大的数据量?你是如何处理他们的?处理的结果。 2、告诉我二个分析或者计算机科学相关项目?你是如何对其结果进行衡量的? 3、什么是:提升值、关键绩效指标、强壮性、模型按合度、实验设计、2/8原则? 4、什么是:协同过滤、n-grams, map reduce、余弦距离? 5、如何让一个网络爬虫速度更快、抽取更好的信息以及更好总结数据从而得到一干净的数据库? 6、如何设计一个解决抄袭的方案? 7、如何检验一个个人支付账户都多个人使用? 8、点击流数据应该是实时处理?为什么?哪部分应该实时处理? 9、你认为哪个更好:是好的数据还是好模型?同时你是如何定义“好”?存在

所有情况下通用的模型吗?有你没有知道一些模型的定义并不是那么好? 10、什么是概率合并(AKA模糊融合)?使用SQL处理还是其它语言方便?对于处理半结构化的数据你会选择使用哪种语言? 11、你是如何处理缺少数据的?你推荐使用什么样的处理技术? 12、你最喜欢的编程语言是什么?为什么? 13、对于你喜欢的统计软件告诉你喜欢的与不喜欢的3个理由。 14、SAS, R, Python, Perl语言的区别是? 15、什么是大数据的诅咒? 16、你参与过数据库与数据模型的设计吗? 17、你是否参与过仪表盘的设计及指标选择?你对于商业智能和报表工具有什么想法? 18、你喜欢TD数据库的什么特征? 19、如何你打算发100万的营销活动邮件。你怎么去优化发送?你怎么优化反应率?能把这二个优化份开吗? 20、如果有几个客户查询ORACLE数据库的效率很低。为什么?你做什么可以提高速度10倍以上,同时可以更好处理大数量输出? 21、如何把非结构化的数据转换成结构化的数据?这是否真的有必要做这样的转换?把数据存成平面文本文件是否比存成关系数据库更好? 22、什么是哈希表碰撞攻击?怎么避免?发生的频率是多少? 23、如何判别mapreduce过程有好的负载均衡?什么是负载均衡? 24、请举例说明mapreduce是如何工作的?在什么应用场景下工作的很好?云的安全问题有哪些? 25、(在内存满足的情况下)你认为是100个小的哈希表好还是一个大的哈希表,对于内在或者运行速度来说?对于数据库分析的评价? 26、为什么朴素贝叶斯差?你如何使用朴素贝叶斯来改进爬虫检验算法? 27、你处理过白名单吗?主要的规则?(在欺诈或者爬行检验的情况下) 28、什么是星型模型?什么是查询表?

数据分析师的基本素质

数据分析师的基本素质 摘自《谁说菜鸟不会数据分析》第一章 Mr.林看到小白斗志昂扬的样子非常高兴:别光说不做啊,要成为一名优秀的数据分析师,并非一件容易的事。虽然所学的专业与数据分析不相关,但你可以通过工作中的实践学习数据分析,需要付出大量的时间和精力,不经一番寒彻骨,怎得梅花扑鼻香? 下面,我给你介绍一名合格的数据分析师需要具备的五大基本能力和素质。 1、态度严谨负责 严谨负责是数据分析师的必备素质之一,只有本着严谨负责的态度,才能保证数据的客观、准确。在企业里,数据分析师可以说是企业的医生,他们通过对企业运营数据的分析,为企业寻找症结及问题。一名合格的数据分析师,应具有严谨、负责的态度,保持中立立场,客观评价企业发展过程中存在的问题,为决策层提供有效的参考依据;不应受其他因素影响而更改数据,隐瞒企业存在的问题,这样做对企业发展是非常不利的,甚至会造成严重的后果。而且,对数据分析师自身来说,也是前途尽毁,从此以后所做的数据分析结果都将受到质疑,因为你已经不再是可信赖的人,在同事、领导、客户面前已经失去了信任。所以,作为一名数据分析师就必须持有严谨负责的态度,这也是最基本的职业道德。 2、好奇心强烈

好奇心人皆有之,但是作为数据分析师,这份好奇心就应该更强烈,要积极主动地发现和挖掘隐藏在数据内部的真相。在数据分析师的脑子里,应该充满着无数个“为什么”,为什么是这样的结果,为什么不是那样的结果,导致这个结果的原因是什么,为什么结果不是预期的那样等等。这一系列问题都要在进行数据分析时提出来,并且通过数据分析,给自己一个满意的答案。越是优秀的数据分析师,好奇心也越不容易满足,回答了一个问题,又会抛出一个新的问题,继续研究下去。只有拥有了这样一种刨根问底的精神,才会对数据和结论保持敏感,继而顺藤摸瓜,找出数据背后的真相。 3、逻辑思维清晰 除了一颗探索真相的好奇心,数据分析师还需要具备缜密的思维和清晰的逻辑推理能力。我记得有位大师说过:结构为王。何谓结构,结构就是我们常说的逻辑,不论说话还是写文章,都要有条理,有目的,不可眉毛胡子一把抓,不分主次。 通常从事数据分析时所面对的商业问题都是较为复杂的,我们要考虑错综复杂的成因,分析所面对的各种复杂的环境因素,并在若干发展可能性中选择一个最优的方向。这就需要我们对事实有足够的了解,同时也需要我们能真正理清问题的整体以及局部的结构,在深度思考后,理清结构中相互的逻辑关系,只有这样才能真正客观地、科学地找到商业问题的答案。 4、擅长模仿

最新数据分析员工作总结

数据分析员工作总结数据分析员是根据数据分析方案进行数据分析的人员,能进行较高级的数据统计分析。下面是出国留学网的先、编为大家精心整理的“数据分析员工作总结”,供大家阅读!希望能够帮助到大家!篇一:数据分析员工作总结在数据分析岗位工作三个月以来,在公司领导的正确领导下,深入学习关于淘宝网店的相关知识,我已经从一个网店的门外汉成长为对网店有一定了解和认知的人。现向公司领导简单汇报一下我三个月以来的工作情况。 一、虚心学习 努力提高网店数据分析方面的专业知识作为一个食品专业出身的人,刚进公司时,对网店方面的专业知识及网店运营几乎一无所知,曾经努力学习掌握的数据分析技能在这里根本就用不到,我也曾怀疑过自己的选择,怀疑自己对踏出校门的第一份工作的选择是不是冲动的。 但是,公司为我提供了宽松的学习环境和专业的指导,在不断的学习过程中,我慢慢喜欢上自己所选择的行业和工作。一方面,虚心学习每一个与网店相关的数据名词,提高自己在数据分析和处理方面的能力,坚定做好本职工作的信心和决心。另一方面,向周围的同同事学习业务知识和工作方法,取人之长,补己之短,加深了与同事之间的感

情。 二、踏实工作 努力完成领导交办的各项工作任务三个月来,在领导和同事们的支持和配合下,自己主要做了一下几方面的工作 1、汇总公司的产品信息日报表,并完成信息日报表的每日更新,为产品追单提供可靠依据。 2、协同仓库工作人员盘点库存,汇总库存报表,每天不定时清查入库货品,为各部门的同事提供最可靠的库存数据。 3、完成店铺经营月报表、店铺经营日报表。 4、完成每日客服接待顾客量的统计、客服工作效果及工作转化率的查询。 5、每日两次对店铺里出售的宝贝进行逐个排查,保证每款宝贝的架上数的及时更新,防止出售中的宝贝无故下架。 6、配合领导和其他岗位的同事做好各种数据的查询、统计、分析、汇总等工作。做好数据的核实和上报工作,并确保数据的准确性和及时性。 7、完成领导交代的其它各项工作,认真对待、及时办理、不拖延、不误事、不敷衍,尽量做到让领导放心和满意。 三、存在的不足及今后努力的方向 三个月来,在公司领导和同事们的指导和配合下,自己虽然做了一些力所能及的工作,但还存在很多的不足,主要是阅历浅,经验少,有时遇到相对棘手的问题考虑欠周密,

数据分析师个人工作总结

数据分析个人工作总结 在数据分析岗位工作三个月以来,在公司领导的正确领导下,深入学习关于淘宝网店的相关知识,我已经从一个网店的门外汉成长为对网店有一定了解和认知的人。现向公司领导简单汇报一下我三个月以来的工作情况。 一、虚心学习,努力提高网店数据分析方面的专业知识 作为一个食品专业出身的人,刚进公司时,对网店方面的专业知识及网店运营几乎一无所知,曾经努力学习掌握的数据分析技能在这里根本就用不到,我也曾怀疑过自己的选择,怀疑自己对踏出校门的第一份工作的选择是不是冲动的。但是,公司为我提供了宽松的学习环境和专业的指导,在不断的学习过程中,我慢慢喜欢上自己所选择的行业和工作。一方面,虚心学习每一个与网店相关的数据名词,提高自己在数据分析和处理方面的能力,坚定做好本职工作的信心和决心。另一方面,向周围的同同事学习业务知识和工作方法,取人之长,补己之短,加深了与同事之间的感情。 二、踏实工作,努力完成领导交办的各项工作任务 三个月来,在领导和同事们的支持和配合下,自己主要做了一下几方面的工作: 1.汇总公司的产品信息日报表,并完成信息日报表的每日更新,为产品追单提供可靠依据。 2.协同仓库工作人员盘点库存,汇总库存报表,每天不定时清查入库货品,为各部门的同事提供最可靠的库存数据。 3.完成店铺经营月报表、店铺经营日报表。 4.完成每日客服接待顾客量的统计、客服工作效果及工作转化率的查询。 5.每日两次对店铺里出售的宝贝进行逐个排查,保证每款宝贝的架上数的及时更新,防止出售中的宝贝无故下架。 6.配合领导和其他岗位的同事做好各种数据的查询、统计、分析、汇总等工作。做好数据的核实和上报工作,并确保数据的准确性和及时性。 7.完成领导交代的其它各项工作,认真对待、及时办理、不拖延、不误事、不敷衍,尽量做到让领导放心和满意。 三、存在的不足及今后努力的方向 三个月来,在公司领导和同事们的指导和配合下,自己虽然做了一些力所能

给数据分析师的几点建议

几点想法,分享给刚入门的数据分析师,也跟经验丰富的数据分析师做下探讨。 1.数据是有立场的,立场决定解读 数据对于业务来讲,是KPI的衡量标杆,也是行动指南。但一旦涉及到立场和方向性的东西,必然有利益触发点的问题。比如同样的一次活动的网站转化率是1.2%,是好还是坏?这是做数据分析第一步要进行的定位,也就是我们所说的下结论。好坏的区分在于比较,如何比较呢?我们知道比较分析方法有环比、占比、定基比、横向比、纵向比等,其中如环比可以比较昨日、上周今日、上月今日等,不同的时间对比出的结果一定有差异,甚至是迥然不同的结果。那面对这种情况,除了分析师的经验以外,在都符合统计学规律的前提下该如何判断活动效果好坏? 第一步结果总算出来了。 那么假设结果是好的(先不管对比的是什么时间),那确实是好的吗?我们知道做活动效果肯定会好啊。尤其在中国,只要价格低,无论多么差的用户体验,无论网站UI多么垃圾,无论送货多么慢,订单转化率一定会起来。这就意味着,无论你的营销、运营做的怎样(只要不是特别特别差),各个渠道、各个节点转化率都会上来。这时候,你会怎样分析?其中有多少是归于渠道或运营本身的优化因素,而有多少是归于活动影响? 假设我们能找出其中归于活动本身或渠道、运营本身的影响因素,结果出来后可能是——刨去活动影响,渠道、运营做的转化率其实变化不大(事实上通常是这样的,但我们不能否认他们的功劳,毕竟没有流量、没有运营,网站无法正常运行),工作效果不明显啊?你会怎样?直接告诉你的同事他们的工作没效果?可能你不会那样做,那此时你该如何取舍?尽职尽责做好一个数据的本职工作还是考虑下其他因素?怎么做才能既让数据价值最大化又能不打击同事的工作积极性? 2.数据质量永远是数据分析立项后首先要考虑的 做过大型数据分析的同学刚开始或多或少有这样的经历,拿到数据后经过分析发现了一个异常分析点,做了N多预处理、N多牛叉的模型,N多分析和多维钻取,最后把报告呈现出来,跟业务沟通的时候,业务只说了一句话“哦,那个异常数据啊,那是我们的测试数据”,然后我们会不会疯掉? 为什么会出现这种问题,因为拿到数据后没有进行一步必要的步骤——数据质量验证。什么是数据质量验证?我理解的是首先要理解数据来源、数据统计和收集逻辑、数据入库处理逻辑;其次是理解数据在数据仓库中是如何存放的,字段类型、小数点位数、取值范围,规则约束如何定义的;第三是明确数据的取数逻辑,尤其是从数据仓库中如何用SQL取数的,其中特别是对数据有没有经过转换和重新定义;第四是拿到数据后必须要有数据审查的过程,包括数据有效性验证、取值范围、空值和异常值处理等。 当这些工作都做充足之后才是数据分析。但可惜的是大多数数据分析师都不关注数据质量问题,甚至对数据的理解仅限于表现定义。当然做足了底层的工作,你会发现做起数据来事半功倍,并且你的结论和推到是经得起验证和考究的。 3.缺乏落地的数据没价值,除非是市场分析 数据的价格在于对业务的驱动,不管你的业务对象是你的BOSS还是同事。很多情况下,我们的数据分析师是这样工作的:一天到晚闷头做事,出数据写报告。结果出来的数据结论和建议会有这么几种情况:

数据分析师薪资待遇如何,一位过来人的身份告诉你

数据分析师薪资待遇如何,一位过来人的身份告诉你 随着大数据时代的到来,企业对数据价值的重视,数据分析师的市场越来越大,毫无疑问数据分析师已成为“当今最具发展潜力的职业”,吸引了无数像小编这样的热血青年,在迈进大数据行业之前,先来了解一下数据分析师工资收入多少? 在美国,大数据分析师平均每年薪酬高达17.5万美元,而国内顶尖互联网公司,大数据分析师的薪酬可能要比同一个级别的其他职位高20%至30%,且颇受企业重视。 国内拉勾网上,我们通过爬虫采集数据进行分析发现,全国有29个城市的企业有数据分析师的岗位的人才需求,其中将近一半需求产生在北京市,需求量全国第一。排在前5的分别是:北京、上海、深圳、杭州、广州。数据分析这一职业大量集中在北上广深四大一线城市,以及杭州这个互联网和电子商务企业的聚集地。 通过以上数据可以得出一个结论:数据分析师这高精尖职位,有大量的工作机会集中在北上广深以及杭州,期待往这个方向发展的同学还是要到这些城市去多多尝试。当然,从另一个方面说,这些城市也都集中了大量的各行业人才,竞争压力想必也是很大的。 任何行业都是看经验的,经验是王道,数据分析师也不例外,按工作经验统计,工作3年至5年薪资待遇普遍不会低于15K,拥有8年至10年经验的数据分析师平均薪资可以达25K 左右。怎么样是不是很心动?高薪职业就看你敢不敢来挑战喽! 数据分析师薪资这么高,工作是不是很累呢?关于数据分析师工作累不累,CPDA师兄有话说 成为一名合格的数据分析师,不是那么简单的,数据分析师这个职业很肯定说是前途无量,然而,这也说明这并不是一个容易上手的工作,就业门槛是不低的。数据分析师需要储备大

数据分析师需要学些什么东西

数据分析师需要学些什么东西 我想要成为一名数据分析师,可是数据分析师需要学些什么东西? 数据分析师分布在不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测。数据分析师需要敏锐的数字洞察力,因此,统计、会计、保险、工程经济、金融、数学、计算机等专业的同学对这个行业有明显优势,但其他行业的同学如果对这个职业感兴趣,通过日常学习,掌握一些统计必备技能,亦可以从事此类工作. 主要工作领域: 1、从事投资项目审核审批和招商引资、项目评估、投资决策等工作的政府机构、企业的相关领导以及从业人员。 2、在银行或非银行金融机构、投资管理公司、投资管理顾问公司从事风险投资、产业投资、信贷和投资管理等方面工作的专业从业人员。 3、会计师事务所、资产评估事务所及税务师事务所、律师相关专业人员。 4、学习财务、统计、投资、金融和企业管理等相关专业的在校应届学生。 5、在企事业单位从事市场调查与宣传工作的人士以及具有策划与决策工作职能要求的人士。 6、在不同领域尝试创业以及在投资、金融、资本运营、房地产和企业管理领域发展的各界人士。 数据分析师的工作内容分为四个层面: 1、处理临时需求:解决业务一次性,临时性的数据需求 2、报表开发:根据业务需要,与开发工程师讨论进行相关报表开发。 3、数据分析与挖掘:与业务同事一起沟通,分析业务问题,提供建议;根据业务需要建立各类挖掘模型。 4、数据产品化:通过数据产品化方式解决结构化业务问题。 数据分析师的基本要求: 1、懂得建立目标 数据分析是为了解决问题而去分析,不是单纯为分析而分析。数据分析是有目的性的。比如:一季度ABC产品的销售情况,是按月份为横坐标建立各部门的图表;各产品线ABC在一季度的销售情况,是按部门为横坐标建立对应的图表。 2、针对不同人群提供不同的结论报告 数据分析要有结论报告,不同的人群报告的侧重点不同。比如管理层,看的是趋势和异常点;营销人员看的是ROI((Return On Investment)产出比率和高用户质量的导入情况;业务人员看的是产品对用户的活跃度等。 3、掌握数据分析工具 如果是互联网数据分析,可以从google GA入门,EXCEL辅助,了解数据分析的基本算法。至于SAS,SPSS这些高级工具不一定需要。 4、不同时期要有不同的KPI(Key Performance Indicator,关键绩效指标) 不断的调整目标和发现问题是数据分析精细化的必经过程。 例如:腾讯的数据分析关键指标集不断调整,从2007年的关注会员基数,到现在的会员活跃度、用户体验度、性能度等等。建立对应的模型,帮助产品和项目的同事更好的了解用户 Q&A如何迅速成长成为一名数据分析师? 如从编程零基础,知道一些简单的统计知识的情况下

数据分析师常见的7道笔试题目及答案

数据分析师常见的7道笔试题目及答案 导读:探索性数据分析侧重于在数据之中发现新的特征,而验证性数据分析则侧重于已有假设的证实或证伪。以下是由小编为您整理推荐的实用的应聘笔试题目和经验,欢迎参考阅读。 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map 进行频率统计,然后再找出频率最大的几个)及相应的频率。然后再在这1000个最大的IP 中,找出那个频率最大的IP,即为所求。 或者如下阐述: 算法思想:分而治之+Hash 地址最多有2^32=4G种取值情况,所以不能完全加载到内存中处理; 2.可以考虑采用“分而治之”的思想,按照IP地址的Hash(IP)24值,把海量IP 日志分别存储到1024个小文件中。这样,每个小文件最多包含4MB个IP地址; 3.对于每一个小文件,可以构建一个IP为key,出现次数为value的Hash map,同时记录当前出现次数最多的那个IP地址; 4.可以得到1024个小文件中的出现次数最多的IP,再依据常规的排序算法得到总体上出现次数最多的IP; 2、搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。 假设目前有一千万个记录(这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门。),请你统计最热门的10个查询串,要求使用的内存不能超过1G。 典型的Top K算法,还是在这篇文章里头有所阐述, 文中,给出的最终算法是: 第一步、先对这批海量数据预处理,在O(N)的时间内用Hash表完成统计(之前写成了排序,特此订正。July、第二步、借助堆这个数据结构,找出Top K,时间复杂度为N‘logK。 即,借助堆结构,我们可以在log量级的时间内查找和调整/移动。因此,维护一个K(该题目中是10)大小的小根堆,然后遍历300万的Query,分别和根元素进行对比所以,我们最终的时间复杂度是:O(N) + N’*O(logK),(N为1000万,N’为300万)。ok,更多,详情,请参考原文。 或者:采用trie树,关键字域存该查询串出现的次数,没有出现为0。最后用10个元素的最小推来对出现频率进行排序。 3、有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过16字节,内存限制大小是1M。返回频数最高的100个词。 方案:顺序读文件中,对于每个词x,取hash(x)P00,然后按照该值存到5000个小文件(记为x0,x1,…x4999)中。这样每个文件大概是200k左右。 如果其中的有的文件超过了1M大小,还可以按照类似的方法继续往下分,直到分解得到的小文件的大小都不超过1M。 对每个小文件,统计每个文件中出现的词以及相应的频率(可以采用trie树 /hash_map等),并取出出现频率最大的100个词(可以用含 100 个结点的最小堆),并把100

数据分析师笔试题目

网易数据分析专员笔试题目 一、基础题 1、中国现在有多少亿网民? 2、百度花多少亿美元收购了91无线? 3、app store排名的规则和影响因素 4、豆瓣fm推荐算法 5、列举5个数据分析的博客或网站 二、计算题 1、关于简单移动平均和加权移动平均计算 2、两行数计算相关系数。(2位小数,还不让用计算器,反正我没算) 3、计算三个距离,欧几里德,曼哈顿,闵可夫斯基距离 三、简答题 1、离散的指标,优缺点 2、插补缺失值方法,优缺点及适用环境 3、数据仓库解决方案,优缺点 4、分类算法,优缺点 5、协同推荐系统和基于聚类系统的区别 四、分析题 关于网易邮箱用户流失的定义,挑选指标。然后要构建一个预警模型。

五、算法题 记不得了,没做。。。反正是决策树和神经网络相关。 1、你处理过的最大的数据量?你是如何处理他们的?处理的结果。 2、告诉我二个分析或者计算机科学相关项目?你是如何对其结果进行衡量的? 3、什么是:提升值、关键绩效指标、强壮性、模型按合度、实验设计、2/8原则? 4、什么是:协同过滤、n-grams, map reduce、余弦距离? 5、如何让一个网络爬虫速度更快、抽取更好的信息以及更好总结数据从而得到一干净的数据库? 6、如何设计一个解决抄袭的方案? 7、如何检验一个个人支付账户都多个人使用? 8、点击流数据应该是实时处理?为什么?哪部分应该实时处理?

9、你认为哪个更好:是好的数据还是好模型?同时你是如何定义“好”?存在所有情况下通用的模型吗?有你没有知道一些模型的定义并不是那么好? 10、什么是概率合并(AKA模糊融合)?使用SQL处理还是其它语言方便?对于处理半结构化的数据你会选择使用哪种语言? 11、你是如何处理缺少数据的?你推荐使用什么样的处理技术? 12、你最喜欢的编程语言是什么?为什么? 13、对于你喜欢的统计软件告诉你喜欢的与不喜欢的3个理由。 14、SAS, R, Python, Perl语言的区别是? 15、什么是大数据的诅咒? 16、你参与过数据库与数据模型的设计吗? 17、你是否参与过仪表盘的设计及指标选择?你对于商业智能和报表工具有什么想法? 18、你喜欢TD数据库的什么特征?

一个电商数据分析师的经验总结

一个电商数据分析师的经验总结 king发表于2013-07-27 20:54 来源:贾鹏 08年毕业,不知不觉的混进了电子商务行业,又不知不觉的做了三年数据分析,恰好又赶上了互联网电子商务行业发展最快的几年,也算是不错吧,毕竟感觉前途还是很光明的。三年来,可以说跟很多同事学到了不少东西,需要感谢的人很多,他们无私的教给了我很多东西。 就数据分析职业来说,个人感觉这对互联网公司来说是非常重要的,也是确实能够带来实际效果的东西。比如说利用数据分析做会员的细分以进行精准化营销;利用数据分析来发现现有的不足,以作改进,让顾客有更好的购物体验;利用CRM系统来管理会员的生命周期,提高会员的忠诚度,避免会员流失;利用会员的购买数据,挖掘会员的潜在需求,提供销售,扩大影响力等等。 最开始进公司的时候是在运营部,主要是负责运营报表的数据,当时的系统还很差,提取数据很困难,做报表也很难,都是东拼西凑一些数据,然后做成PPT,记得当时主要的数据就是销售额、订单量、毛利额、客单价、每单价、库存等一些特别基础的数据,然后用这些数据作出一些图表来。在这个阶段基本上就是做一些数据的提取工作,Excel的技巧倒是学到了不少,算是数据分析入门了吧。 后来公司上了数据仓库,里面就有了大量的原始数据,提取数据非常方便了,而且维度也多,可以按照自己的想法随意的组合分析,那个阶段主要就是针对会员购物行为的分析,开始接触数据建模,算法等一些比较难的东西,也是学到东西最多的时候。记得当时做了很多分析报告,每周还要给总裁办汇报这些报告,下面详细说一下当时使用的一些主要的模型及算法:1、RFM模型

模型定义:在众多的客户关系管理的分析模式中,RFM模型是被广泛提到的。RFM模型是衡量客户价值和客户创利能力的重要工具和手段。该机械模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱三项指标来描述该客户的价值状况。在RFM模式中, R(Recency)表示客户最近一次购买的时间有多远,F(Frequency)表示客户在最近一段时间内购买的次数,M (Monetary)表示客户在最近一段时间内购买的金额。一般的分析型CRM 着重在对于客户贡献度的分析,RFM则强调以客户的行为来区分客户。利用RFM分析,我们可以做以下几件事情: ⑴建立会员金字塔,区分各个级别的会员,如高级会员、中级会员、低级会员,然后针对不同级别的会员施行不同的营销策略,制定不同的营销活动。 ⑵发现流失及休眠会员,通过对流失及休眠会员的及时发现,采取营销活动,激活这些会员。 ⑶在短信、EDM促销中,可以利用模型,选取最优会员。 ⑷维系老客户,提高会员的忠诚度。 使用方法:可以给三个变量不同的权重或按一定的规则进行分组,然后组合使用,即可分出很多不同级别的会员。 2、关联分析 关联分析最原始的案例来自于沃尔玛的“啤酒与尿布”。通俗意义上讲,就是只买了A商品的人,又有很多人买了B商品,那么我们就可以认为A、B两个商品的关联性比较高。很多数据挖掘工具都有关联挖掘,主要使用的算法是Apriori算法,在计算的过程中会主要考察项集、置信度、相关性这三个结果数据,以最终确定商品之间的相关性。除了Apriori算法外,还有许多其他的关联分析的算法,基本上也都是从Apriori发展而来,比如FPgrowth。本人从几年的数据分析经验感觉,关联分析在零售业中并不太实用,挖掘出来的关联度比较高的

数据分析师工作简历模板

数据分析师工作简历模板 导读:本文数据分析师工作简历模板,仅供参考,如果能帮助到您,欢迎点评和分享。 数据分析师工作简历模板(一) 三年以上工作经验| 男| 26岁 居住地:XX 电话:XXX E-mail:[email protected] 最近工作 公司:XX金融证券有限公司 行业:金融/投资/证券 职位:证券分析师最高学历 学历:本科 专业:金融学 学校:XX理工大学 求职意向 到岗时间:一周以内 工作性质:全职 希望行业:金融/投资/证券 目标地点:西安 期望月薪:面议/月

目标职能:证券分析师 工作经验 20XX /X—至今:XX金融证券有限公司[ X年X个月] 所属行业:金融/投资/证券 研发部证券分析师 1、负责通过股市报告会、面谈等形式,营销理财服务; 2、负责分析目标板块的上市公司的基本面,列出投资原因,并给出风险提示; 3、负责宏观经济、政策走向分析及解读; 4、负责协助基金经理,对持仓比重、结构、品种做出建议; 5、负责协助其他分析师进行投资组合的配置。 20XX /X--20XX /X:XX金融证券有限公司[ X年X个月] 所属行业:金融/投资/证券 市场部证券分析师 1、负责为客户提供投资理财咨询; 2、负责组建及管理投资顾问团队,维护投资渠道; 3、负责维护客户关系,推广并销售公司的金融理财产品; 4、负责通过数据、技术面的分析来进行股票买卖的实盘操作; 5、负责定期召开投资报告会,培训客户经理的投资分析知识。 20XX /X--20XX /X:XX金融有限公司[ XX个月] 所属行业:金融/投资/证券 投资部证券分析师

1、负责研究中国宏观经济、市场状况和投资环境,分析投资行业政策、产业政策以及公司的经营情况; 2、负责跟踪****行业动态,并对行业内变化个股做出分析评价; 3、负责维护客户,为客户提供咨询服务; 4、负责***基金的交易,并指导交易员完成交易指令; 5、负责培训下属员工以及分配部门任务。 教育经历 20X X/X --20XX /X XX理工大学金融学本科 语言能力 英语(良好) 听说(熟练),读写(良好) 自我评价 在证券公司任职***年,对于股票投资具有深入的研究,善于数据挖掘和财务分析,对于国家政策和经济形势发展具有敏锐的观察力。具有出色的逻辑思维能力和写作能力,曾在知名财经杂志发表文章数篇,得到读者的欢迎。能够承受巨大的工作强度,抗压能力强,工作责任心高,团队合作意识佳,希望在证券行业继续发展。 数据分析师工作简历模板(二) 求职意向: 数据分析师 基本信息: 姓名:李xx 性别:女 出生日期:1985.11.21 民族:汉族 教育程度:本科工作年限:4年

数据分析师述职报告

数据分析师述职报告 述职采用夹叙夹议的方式,运用叙述和议论,还辅助以适当的说明。以下是整理的数据分析师,欢迎阅读! 在数据分析岗位工作三个月以来,在公司领导的正确领;一、虚心学习,努力提高网店数据分析方面的专业知识;作为一个食品专业出身的人,刚进公司时,对网店方面;二、踏实工作,努力完成领导交办的各项工作任务;三个月来,在领导和同事们的支持和配合下,自己主要;1.汇总公司的产品信息日报表,并完成信息日报表的;2.协同仓库工作人员盘点库存,汇总库存报表数据分析个人工作在数据分析岗位工作三个月以来,在公司领导的正确领导下,深入学习关于淘宝网店的相关知识,我已经从一个网店的门外汉成长为对网店有一定了解和认知的人。现向公司领导简单汇报一下我三个月以来的工作情况。 一、虚心学习,努力提高网店数据分析方面的专业知识 作为一个食品专业出身的人,刚进公司时,对网店方面的专业知识及网店运营几乎一无所知,曾经努力学习掌握的数据分析技能在这里根本就用不到,我也曾怀疑过自己的选择,怀疑自己对踏出校门的第一份工作的选择是不是冲动的。但是,公司为我提供了宽松的学

习环境和专业的指导,在不断的学习过程中,我慢慢喜欢上自己所选择的行业和工作。一方面,虚心学习每一个与网店相关的数据名词,提高自己在数据分析和处理方面的能力,坚定做好本职工作的信心和决心。另一方面,向周围的同同事学习业务知识和工作方法,取人之长,补己之短,加深了与同事之间的感情。 二、踏实工作,努力完成领导交办的各项工作任务 三个月来,在领导和同事们的支持和配合下,自己主要做了一下几方面的工作: 1.汇总公司的产品信息日报表,并完成信息日报表的每日更新,为产品追单提供可靠依据。 2.协同仓库工作人员盘点库存,汇总库存报表,每天不定时清查入库货品,为各部门的同事提供最可靠的库存数据。 3.完成店铺经营月报表、店铺经营日报表。 4.完成每日客服接待顾客量的统计、客服工作效果及工作转化率的查询。 5.每日两次对店铺里出售的宝贝进行逐个排查,保证每款宝贝的架上数的及时更新,防止出售中的宝贝无故下架。 6.配合领导和其他岗位的同事做好各种数据的查询、统计、分析、汇总等工作。做好数据的核实和上报工作,并确保数据的准确性和及时性。 7.完成领导交代的其它各项工作,认真对待、及时办理、不拖延、不误事、不敷衍,尽量做到让领导放心和满意。

如何快速成为数据分析师 [一点资讯]

如何快速成为数据分析师?[一点资讯] 作者:秦路说来我正式接触数据分析也快一年,对速成还是有一些心得。优秀的数据分析师是不能速成的,但是零经验也有零经验的捷径。以上的前提针对入门,目的是达到数据分析师的门槛,顺利拿到一份offer,不涉及数据挖掘等高级技巧。我的方法倾向互联网领域,不论是分析师这个职位,还是运营、产品的能力发展都是适用的。其他领域就仁者见仁了。市面上有《七周七数据库》,《七周七编程语言》。今天我们就《七周七学习成为数据分析师》。没错,七周。第一周:Excel学习掌握如果Excel玩的顺溜,你可以略过这一周。不过介于我入行时也不会vlookup,所以有必要讲下。重点是了解各种函数,包括但不限于sum,count,sumif,countif,find,if,left/right,时间转换等。Excel函数不需要学全,重要的是学会搜索。即如何将遇到的问题在搜索引擎上描述清楚。我认为掌握vlookup和数据透视表足够,是最具性价比的两个技巧。学会vlookup,SQL中的join,Python 中的merge很容易理解。学会数据透视表,SQL中的group,Python中的pivot_table也是同理。这两个搞定,基本10万条以内的数据统计没啥难度,80%的办公室白领都能秒杀。Excel是熟能生巧,多找练习题。还有需要养成好习惯,不要合并单元格,不要过于花哨。表格按照原始数据(sheet1)、

加工数据(sheet2),图表(sheet3)的类型管理。专栏上写了三篇Excel的文章,比较简单,大体介绍了Excel应用,可以作为职场新人的指南。第一篇数据分析—函数篇。主要简单讲解常用的函数,以及与之对应的SQL/Python函数。第二篇数据分析—技巧篇。主要简单讲解我认为很有新价比的功能,提高工作效率。第三篇数据分析—实战篇。主要将前两篇的内容以实战方式进行,简单地进行了一次数据分析。数据源采用了真实的爬虫数据,是5000行数据分析师岗位数据。下面是为了以后更好的基础而附加的学习任务。了解单元格格式,后期的数据类型包括各类timestamp,date,string,int,bigint,char,factor,float等。了解数组,以及怎么用(excel 的数组挺难用),Python和R也会涉及到list。了解函数和参数,当进阶为编程型的数据分析师时,会让你更快的掌握。了解中文编码,UTF8和ASCII,包括CSV的delimiter等,以后你会回来感谢我的。养成一个好习惯,不要合并单元格,不要过于花哨。表格按照原始数据、加工数据,图表的类型管理。如果时间还有剩余,可以看大数据时代,培养职业兴趣。再来一道练习题,我给你1000个身份证号码,告诉我里面有多少男女,各省市人口的分布,这些人的年龄和星座。(身份证号码规律可以网上搜索)第二周:数据可视化数据分析界有一句经典名言,字不如表,表不如图。数据可视化是数据分析的主要方向之一。除掉数据挖掘这类高级分析,不

数据分析师常见的面试问题集锦

数据分析师常见的面试问题集锦 随着大数据概念的火热,数据科学家这一职位应时而出,那么成为数据科学家要满足什么条件?或许我们可以从国外的数据科学家面试问题中得到一些参考,下面是77个关于数据分析或者数据科学家招聘的时候会常会的几个问题,供各位同行参考。 1、你处理过的最大的数据量?你是如何处理他们的?处理的结果。 2、告诉我二个分析或者计算机科学相关项目?你是如何对其结果进行衡量的? 3、什么是:提升值、关键绩效指标、强壮性、模型按合度、实验设计、2/8原则? 4、什么是:协同过滤、n-grams, map reduce、余弦距离? 5、如何让一个网络爬虫速度更快、抽取更好的信息以及更好总结数据从而得到一干净的数据库? 6、如何设计一个解决抄袭的方案? 7、如何检验一个个人支付账户都多个人使用? 8、点击流数据应该是实时处理?为什么?哪部分应该实时处理? 9、你认为哪个更好:是好的数据还是好模型?同时你是如何定义好?存在所有情况下通用的模型吗?有你没有知道一些模型的定义并不是那么好? 10、什么是概率合并(AKA模糊融合)?使用SQL处理还是其它语言方便?对于处理半结构化的数据你会选择使用哪种语言? 11、你是如何处理缺少数据的?你推荐使用什么样的处理技术? 12、你最喜欢的编程语言是什么?为什么? 13、对于你喜欢的统计软件告诉你喜欢的与不喜欢的3个理由。 14、SAS, R, Python, Perl语言的区别是? 15、什么是大数据的诅咒? 16、你参与过数据库与数据模型的设计吗? 17、你是否参与过仪表盘的设计及指标选择?你对于商业智能和报表工具有什么想法? 18、你喜欢TD数据库的什么特征?

数据分析员工作总结

数据分析员工作总结 数据分析员是根据数据分析方案进行数据分析的人员,能进行较高级的数据统计分析。下面是出国留学网的先、编为大家精心整理的“数据分析员工作总结”,供大家阅读!希望能够帮助到大家!篇一:数据分析员工作总结在数据分析岗位工作三个月以来,在公司领导的正确领导下,深入学习关于淘宝网店的相关知识,我已经从一个网店的门外汉成长为对网店有一定了解和认知的人。现向公司领导简单汇报一下我三个月以来的工作情况。 一、虚心学习 努力提高网店数据分析方面的专业知识作为一个食品专业出身的人,刚进公司时,对网店方面的专业知识及网店运营几乎一无所知,曾经努力学习掌握的数据分析技能在这里根本就用不到,我也曾怀疑过自己的选择,怀疑自己对踏出校门的第一份工作的选择是不是冲动的。 但是,公司为我提供了宽松的学习环境和专业的指导,在不断的学习过程中,我慢慢喜欢上自己所选择的行业和工作。一方面,虚心学习每一个与网店相关的数据名词,提高自己在数据分析和处理方面的能力,坚定做好本职工作的信心和决心。另一方面,向周围的同同事学习业务知识和工作方法,取人之长,补己之短,加深了与同事之间的感情。

二、踏实工作 努力完成领导交办的各项工作任务三个月来,在领导和同事们的支持和配合下,自己主要做了一下几方面的工作 1、汇总公司的产品信息日报表,并完成信息日报表的每日更新,为产品追单提供可靠依据。 2、协同仓库工作人员盘点库存,汇总库存报表,每天不定时清查入库货品,为各部门的同事提供最可靠的库存数据。 3、完成店铺经营月报表、店铺经营日报表。 4、完成每日客服接待顾客量的统计、客服工作效果及工作转化率的查询。 5、每日两次对店铺里出售的宝贝进行逐个排查,保证每款宝贝的架上数的及时更新,防止出售中的宝贝无故下架。 6、配合领导和其他岗位的同事做好各种数据的查询、统计、分析、汇总等工作。做好数据的核实和上报工作,并确保数据的准确性和及时性。 7、完成领导交代的其它各项工作,认真对待、及时办理、不拖延、不误事、不敷衍,尽量做到让领导放心和满意。 三、存在的不足及今后努力的方向 三个月来,在公司领导和同事们的指导和配合下,自己虽然做了一些力所能及的工作,但还存在很多的不足,主要是阅历浅,经验少,有时遇到相对棘手的问题考虑欠周密,视角不够灵活,缺乏应变能力;理论和专业知识不够丰富,导

数据分析师的完整流程与知识结构体系

数据分析师的完整流程与知识结构体系

————————————————————————————————作者:————————————————————————————————日期:

1.数据采集 了解数据采集的意义在于真正了解数据的原始面貌,包括数据产生的时间、条件、格式、内容、长度、限制条件等。这会帮助数据分析师更有针对性的控制数据生产和采集过程,避免由于违反数据采集规则导致的数据问题;同时,对数据采集逻辑的认识增加了数据分析师对数据的理解程度,尤其是数据中的异常变化。比如:Omniture中的Prop变量长度只有100个字符,在数据采集部署过程中就不能把含有大量中文描述的文字赋值给Prop变量(超过的字符会被截断)。 在Webtrekk323之前的Pixel版本,单条信息默认最多只能发送不超过2K的数据。当页面含有过多变量或变量长度有超出限定的情况下,在保持数据收集的需求下,通常的解决方案是采用多个sendinfo方法分条发送;而在325之后的Pixel 版本,单条信息默认最多可以发送7K数据量,非常方便的解决了代码部署中单条信息过载的问题。(Webtrekk基于请求量付费,请求量越少,费用越低)。 当用户在离线状态下使用APP时,数据由于无法联网而发出,导致正常时间内的数据统计分析延迟。直到该设备下次联网时,数据才能被发出并归入当时的时间。这就产生了不同时间看相同历史时间的数据时会发生数据有出入。 在数据采集阶段,数据分析师需要更多的了解数据生产和采集过程中的异常情况,如此才能更好的追本溯源。另外,这也能很大程度上避免“垃圾数据进导致垃圾数据出”的问题。 2.数据存储 无论数据存储于云端还是本地,数据的存储不只是我们看到的数据库那么简单。比如: 数据存储系统是MySql、Oracle、SQL Server还是其他系统。 数据仓库结构及各库表如何关联,星型、雪花型还是其他。 生产数据库接收数据时是否有一定规则,比如只接收特定类型字段。 生产数据库面对异常值如何处理,强制转换、留空还是返回错误。 生产数据库及数据仓库系统如何存储数据,名称、含义、类型、长度、精度、是否可为空、是否唯一、字符编码、约束条件规则是什么。 接触到的数据是原始数据还是ETL后的数据,ETL规则是什么。 数据仓库数据的更新更新机制是什么,全量更新还是增量更新。 不同数据库和库表之间的同步规则是什么,哪些因素会造成数据差异,如何处理差异的。

一个电商数据分析师的经验总结

一个电商数据分析师的经验总结 08年毕业,不知不觉的混进了电子商务行业,又不知不觉的做了三年数据分析,恰好又赶上了互联网电子商务行业发展最快的几年,也算是不错吧,毕竟感觉前途还是很光明的。三年来,可以说跟很多同事学到了不少东西,需要感谢的人很多,他们无私的教给了我很多东西。 就数据分析职业来说,个人感觉这对互联网公司来说是非常重要的,也是确实能够带来实际效果的东西。比如说利用数据分析做会员的细分以进行精准化营销;利用数据分析来发现现有的不足,以作改进,让顾客有更好的购物体验;利用CRM系统来管理会员的生命周期,提高会员的忠诚度,避免会员流失;利用会员的购买数据,挖掘会员的潜在需求,提供销售,扩大影响力等等。 最开始进公司的时候是在运营部,主要是负责运营报表的数据,当时的系统还很差,提取数据很困难,做报表也很难,都是东拼西凑一些数据,然后做成PPT,记得当时主要的数据就是销售额、订单量、毛利额、客单价、每单价、库存等一些特别基础的数据,然后用这些数据作出一些图表来。在这个阶段基本上就是做一些数据的提取工作,Excel的技巧倒是学到了不少,算是数据分析入门了吧。 后来公司上了数据仓库,里面就有了大量的原始数据,提取数据非常方便了,而且维度也多,可以按照自己的想法随意的组合分析,那个阶段主要就是针对会员购物行为的分析,开始接触数据建模,算法等一些比较难的东西,也是学到东

西最多的时候。记得当时做了很多分析报告,每周还要给总裁办汇报这些报告,下面详细说一下当时使用的一些主要的模型及算法: 1、RFM模型 模型定义:在众多的客户关系管理的分析模式中,RFM模型是被广泛提到的。RFM模型是衡量客户价值和客户创利能力的重要工具和手段。该机械模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱三项指标来描述该客户的价值状况。在RFM模式中,R(Recency)表示客户最近一次购买的时间有多远,F(Frequency)表示客户在最近一段时间内购买的次数,M(Monetary)表示客户在最近一段时间内购买的金额。一般的分析型CRM着重在对于客户贡献度的分析,RFM则强调以客户的行为来区分客户。利用RFM分析,我们可以做以下几件事情: ⑴建立会员金字塔,区分各个级别的会员,如高级会员、中级会员、低级会员,然后针对不同级别的会员施行不同的营销策略,制定不同的营销活动。 ⑵发现流失及休眠会员,通过对流失及休眠会员的及时发现,采取营销活动,激活这些会员。 ⑶在短信、EDM促销中,可以利用模型,选取最优会员。 ⑷维系老客户,提高会员的忠诚度。 使用方法:可以给三个变量不同的权重或按一定的规则进行分组,然后组合使用,即可分出很多不同级别的会员。

相关文档
最新文档