大数据时代下的统计学
大数据时代下统计学有何意义

大数据时代下统计学有何意义1. 引言1.1 大数据时代的背景在当今数字化时代,大数据已经成为我们生活和工作中不可或缺的一部分。
随着互联网的迅速发展和物联网技术的普及,各行各业都在不断产生海量的数据,这些数据以前所未有的速度增长和积累。
大数据时代的背景可以说是信息爆炸,数据爆炸,让我们面临着巨大的数据量和复杂性。
在大数据时代,统计学与机器学习、人工智能等新兴科技相互融合,共同推动了数据科学的发展。
统计学在数据清洗和预处理中的应用,以及在数据可视化和解释中的重要性,也凸显了其在大数据时代的重要作用。
随着大数据的不断增长和发展,统计学在大数据时代的意义也愈发重要,不可替代。
1.2 统计学在大数据时代的作用统计学在大数据时代扮演着至关重要的角色。
随着数据量不断增加和信息的急剧膨胀,统计学通过其丰富的理论和方法为大数据的解读和分析提供了基础。
统计学的主要任务是利用数据来描述事物的规律和特征,通过概括现实世界中的随机现象,揭示数据背后的规律性。
在大数据时代,统计学可以帮助人们从海量数据中提取有效信息,发现隐藏的规律和关联,进行数据的有效管理和分析。
统计学还在数据的清洗和预处理中发挥着关键作用。
在实际应用中,大数据往往存在着缺失值、异常值和噪声等问题,而统计学可以运用其方法来解决这些问题,保证数据的质量和准确性。
统计学的技术和工具可以帮助对数据进行清洗、处理和转化,使数据更具可信度和应用价值。
统计学在大数据时代的作用不可低估,它为数据的概括、分析和解读提供了基础,帮助人们更好地理解和利用大数据。
统计学的发展将对大数据时代产生深远影响,推动数据科学的发展,为人类社会的发展和进步提供有力支持。
2. 正文2.1 统计学对数据的概括和分析统计学对数据的概括和分析是大数据时代中至关重要的一环。
通过统计学的方法和技术,我们可以对海量的数据进行概括和分析,从中挖掘出有用的信息和规律。
统计学帮助我们理解数据中的趋势和关联,帮助我们更好地理解数据背后的故事。
统计学在大数据时代的新挑战有哪些

统计学在大数据时代的新挑战有哪些在当今数字化、信息化飞速发展的时代,大数据已经成为了我们生活和工作中不可或缺的一部分。
从社交媒体的信息流到电子商务的交易记录,从医疗健康的病历数据到科学研究的观测结果,数据的规模和复杂性呈爆炸式增长。
而统计学作为一门研究数据收集、整理、分析和解释的学科,在这个大数据时代面临着前所未有的新挑战。
首先,数据的规模和多样性是统计学面临的一大挑战。
传统的统计学方法通常适用于相对较小、结构清晰的数据样本。
然而,在大数据环境中,数据的规模可能达到数十亿甚至更多的记录,而且数据的来源和类型极其多样,包括结构化数据(如数据库中的表格)、半结构化数据(如 XML 和 JSON 格式的数据)以及非结构化数据(如文本、图像、音频和视频)。
处理如此大规模和多样化的数据,需要新的算法和技术来有效地存储、管理和分析。
例如,对于海量的文本数据,传统的统计分析方法可能难以直接应用。
需要运用自然语言处理技术将文本转化为可量化的特征,然后再进行统计分析。
而对于图像和视频数据,如何提取有意义的特征并进行统计建模也是一个难题。
此外,不同来源和类型的数据可能存在质量参差不齐、缺失值、异常值等问题,这增加了数据预处理的难度和复杂性。
其次,数据的产生速度也是一个重要的挑战。
在大数据时代,数据的生成速度非常快,实时数据处理成为了常见的需求。
例如,金融交易中的高频数据、社交媒体上的实时信息流、物联网设备产生的连续监测数据等。
传统的统计学方法往往是基于批处理的模式,难以满足实时处理的要求。
为了应对这一挑战,需要开发新的流式计算和实时分析技术。
这些技术能够在数据不断流入的过程中进行快速的处理和分析,及时提供有价值的信息。
同时,还需要考虑如何在有限的计算资源和时间内做出准确的决策,这对算法的效率和精度提出了更高的要求。
再者,数据的相关性和复杂性也是统计学需要应对的难题。
大数据中往往存在着复杂的相关性和依赖关系,不再是简单的线性关系或独立分布。
大数据时代下的统计学

大数据时代下的统计学随着信息技术的飞速发展和全球互联网的普及,大数据时代已经来临。
大数据的出现给人们的生活和工作带来了诸多变化,也给统计学提出了新的挑战和机遇。
在这个大数据时代下,统计学如何发展和应用,成为了学术界和产业界争相探讨和探索的课题。
一、大数据时代对统计学的影响在大数据时代,数据的规模呈几何级数增长,各种类型的数据如气象数据、人口数据、金融数据、医疗数据等不断涌现,并且呈现出高维度、复杂性和实时性的特点。
这就要求统计学家既要掌握传统统计学方法,又要拥抱新兴的数据科学方法,提高处理大规模、多维度、实时性数据的能力。
大数据时代也加速了统计学与其他学科的融合。
统计学与计算机科学、人工智能、数据挖掘等领域的融合,以及与经济学、生物医学、社会学等领域的跨学科合作,已经成为大数据时代下统计学的发展趋势。
统计学不再是一个独立的学科,而是与其他学科相互渗透、相互融合,为其它学科的发展和应用提供支持和保障。
在大数据时代,传统的统计学方法已经不能满足对大规模、高维度、实时性数据的处理需求。
统计学家需要不断创新,研发和应用新的统计学方法,以适应大数据时代的挑战。
1. 机器学习机器学习是一种基于统计学原理和计算机科学算法的方法,通过训练模型,从大规模数据中挖掘规律和模式,提取特征和信息。
在大数据时代,机器学习已经成为处理大规模数据的有效手段,广泛应用于数据分类、聚类、回归、预测等领域。
2. 深度学习3. 数据挖掘在大数据时代,统计学的应用领域变得更加广泛和深入,渗透到人们的生活和各行各业的方方面面。
1. 社会科学大数据时代下,统计学不仅仅是一种工具,更成为社会科学研究的基础性学科。
统计学的方法和理论被广泛应用于经济学、社会学、政治学等领域,帮助人们更好地理解社会现象和规律。
2. 金融领域金融领域是大数据时代下统计学的重要应用领域。
统计学的方法被广泛用于金融市场的预测、风险管理、投资组合优化等方面,帮助金融机构和投资者做出科学的决策。
大数据时代下统计学有何意义

大数据时代下统计学有何意义统计学在大数据时代下有助于发现规律和趋势。
大数据时代意味着数据的规模庞大,数以亿计的数据源源不断地被产生和积累。
但光有大量数据并不能真正帮助人们做出有意义的决策,而统计学提供的方法和工具可以帮助人们从这些海量数据中发现规律和趋势。
通过统计学的分析方法,可以从复杂的数据中提取出关键信息,用于预测趋势、制定计划和做出决策。
统计学在大数据时代下有助于验证和推断。
尽管大数据提供了丰富的信息,但这些信息并不一定都是准确和可靠的。
统计学提供了一套科学的方法,用于验证数据的可靠性和真实性。
通过统计学的抽样与推断方法,可以利用部分数据推断出整体数据的特征和分布。
统计学还可以帮助人们从相对小的样本中得出关于整个总体的结论,提高数据的使用效率和价值。
统计学在大数据时代下有助于解释和可视化数据。
在大数据时代,数据的规模和复杂性使得数据的解释和理解变得更加困难。
统计学可以帮助人们对数据进行解释和可视化,以便更好地理解数据背后的含义。
通过统计学的方法,可以将数据进行分类、汇总和展示,使其更具有可读性和易于理解性。
这样,数据的价值就能够得到充分地发挥,为人们的决策和行动提供有力的支持。
统计学在大数据时代下有助于数据的隐私和安全保护。
在大数据时代,随着数据的广泛收集和使用,数据隐私和安全面临着严峻的挑战。
统计学可以通过数据加密、匿名化和其他方法来保护数据的隐私和安全。
统计学还可以帮助智能系统从原始数据中提取有用的特征,而不需要直接访问原始数据,从而减少了数据泄露的风险。
大数据时代下,统计学仍然具有重要的意义。
它能够帮助人们从海量的数据中发现规律和趋势,验证和推断数据的可靠性,解释和可视化数据,保护数据的隐私和安全。
统计学的研究方法和工具为人们在大数据时代下做出科学决策和行动提供了重要的支持。
统计学在大数据时代下的意义不可低估。
大数据背景下的统计学发展方向分析

大数据背景下的统计学发展方向分析随着大数据时代的到来,统计学的发展方向也随之发生了变化。
传统的统计学方法已经不能满足大数据处理的需求,因此统计学在大数据背景下的发展方向也逐渐呈现出新的趋势和变化。
本文将从统计学的应用领域、方法论、工具技术和专业人才需求等角度,对大数据背景下的统计学发展方向进行分析。
一、统计学的应用领域在大数据背景下,统计学的应用领域将进一步拓展和深化。
传统的统计学主要应用于生物统计、经济统计、社会统计等领域,随着大数据技术的发展,统计学将会广泛应用于金融、医疗、能源、交通、环境保护等各个行业。
特别是在金融领域,大数据和统计学的结合将有助于风险管理、投资决策、信用评估等方面的提升。
在医疗领域,大数据和统计学的应用也将有助于疾病预测、医疗资源优化配置等方面的改善。
统计学将逐渐成为各个领域数据分析和决策的基础工具。
二、统计学的方法论在大数据背景下,统计学的方法论也将发生一些变化。
传统的统计学方法主要包括参数估计、假设检验、方差分析等,这些方法对数据的规模和维度有一定的要求。
在大数据背景下,传统的统计学方法往往难以适用于海量和高维度的数据分析。
统计学将向更加灵活和高效的方法发展,如机器学习、深度学习、神经网络等。
这些方法能够更好地处理大数据,并从中挖掘出隐藏在数据背后的规律和模式,为决策提供更加有力的支持。
三、统计学的工具技术在大数据背景下,统计学的工具技术也将得到进一步的推广和应用。
传统的统计学工具主要包括R、Python、SAS等,这些工具在小样本数据分析方面表现出色,但在大数据分析方面存在一定的局限性。
统计学将向更加高效和强大的工具技术发展,如Hadoop、Spark、Flink等大数据处理平台,以及各种云计算平台和数据库技术。
这些工具技术能够更好地处理大数据,并为统计学方法的应用提供更加稳定和可靠的支持。
四、统计学的专业人才需求在大数据背景下,统计学的发展将对专业人才提出更高的要求。
大数据时代的统计学方法与应用研究

大数据时代的统计学方法与应用研究一、大数据的概念和特点大数据是指数据规模大、涉及多领域、多来源、高速增长等特点的数据集合。
它主要由传统的结构化数据和新兴的非结构化数据组成,如社交网络、移动设备、云计算等。
大数据的特点主要包括:数据规模大、多变性、高实时性、不确定性、但是含有很多有价值的信息。
二、统计学方法在大数据中的应用在大数据时代,统计学方法非常重要。
统计学的主要方法可以分为描述统计和推断统计两大类。
描述统计用于对数据进行汇总、统计和展示,以便发现数据的规律和特点。
推断统计则是在已有的数据样本中,推断全集的特点、规律和未来趋势等。
常用的统计学方法有回归分析、主成分分析、聚类分析、时间序列分析等。
三、大数据中的回归分析回归分析是一种估计因变量和自变量之间关系的方法。
在大数据中,回归分析可以用于预测趋势、模拟情况、调整模型、拟合关系等。
常用的回归分析方法有线性回归、非线性回归、多元回归、逐步回归、岭回归等。
例如,通过分析消费者的购买历史和历史数据,可以预测未来的消费量,并利用回归分析优化市场营销策略。
四、大数据中的主成分分析主成分分析是一种数据降维方法,它可以将多维数据降至少维,同时保留原始数据中重要的信息。
主成分分析可以解释原始数据中的关系、因素之间的相互联系等。
在大数据中,主成分分析可以用于数据的压缩和简化、特征选择、异常检测等。
例如,对于销售数据中的很多指标,可以使用主成分分析方法,得到少量的主成分,从而更好地了解销售情况,并采取相应的措施。
五、大数据中的聚类分析聚类分析是将数据根据相似性划分为不同的组别,以便更好地了解数据的结构和特点。
在大数据中,聚类分析可以用于分类、预测、分析等多种方面。
聚类分析可以通过距离度量、相似度度量等方法,将数据划分为不同的组别。
例如,在电商领域中,可以根据用户的行为、交易数据及其它观察指标,对其进行分群,以实现更精准的精准营销和个性化推荐。
六、大数据中的时间序列分析时间序列分析是根据时间顺序对数据进行分析的方法,往往用于对趋势、周期、季节性以及其他时间相关的特点进行研究。
大数据时代下的统计学

大数据时代下的统计学一、大数据时代下的统计学概述1.1 大数据时代的特点大数据时代的到来,主要体现在数据量大、数据速度快、数据来源多样化、数据价值高等特点。
与传统的数据处理相比,大数据时代下的数据分析更加复杂和庞大。
传统的统计学方法已经无法满足对大数据的处理和分析需求,统计学需要不断创新和发展,以适应大数据时代的要求。
1.2 统计学在大数据时代中的作用在大数据时代中,统计学发挥着至关重要的作用。
统计学可以通过数据收集、整理、分析、解释等环节,帮助人们从海量的数据中获取有用的信息和知识。
统计学方法可以帮助人们发现数据的规律、提取数据的特征、进行数据的预测和决策,从而促进科学研究、商业应用、社会管理等领域的发展和创新。
1.3 大数据时代下的统计学挑战在大数据时代下,统计学面临着一系列的挑战。
首先是数据质量和准确性的问题。
大数据时代下,数据的质量和准确性是一个关键的问题,需要统计学借助先进的技术和方法来确保数据的可信性。
其次是数据分析的效率和速度问题。
大数据时代下,数据量大,需要更快速的数据处理和分析方法,以满足实时的需求。
还有数据隐私和安全等问题,需要统计学家考虑如何有效保护数据的隐私和安全。
二、大数据时代下的统计学方法2.1 机器学习与统计学的结合在大数据时代中,机器学习成为了一种重要的数据分析方法。
机器学习可以利用大量的数据进行模型的构建和参数的学习,从而实现对未知数据的预测和分类。
统计学与机器学习可以相互补充,结合统计学的方法和理论,可以为机器学习提供更加可靠和稳健的基础,使得机器学习模型在实际应用中更加可靠和高效。
2.2 数据挖掘与统计学的结合数据挖掘是一种通过自动或半自动的方式来发现数据中的潜在规律和模式的技术。
统计学与数据挖掘可以通过统计检验、回归分析、因子分析等方法,来揭示数据中的潜在规律和特征,从而帮助人们更好地理解数据以及做出相应的决策。
2.3 可视化分析与统计学的结合可视化分析是一种通过图表、图形等方式将数据呈现出来,以帮助人们更加直观地理解数据的方法。
大数据时代下统计学有何意义

大数据时代下统计学有何意义1. 引言1.1 大数据时代的背景在当今社会,随着信息技术的快速发展和智能化设备的普及,我们正迎来大数据时代。
大数据时代指的是海量、高速、多样、全面的数据爆炸式增长和快速流动的时代。
随着互联网、移动互联网、物联网等新兴技术的广泛应用,各种数据源的数据持续不断地产生,形成了海量的数据汇集和流动,这种数据规模以往无法想象,因而被称为大数据。
大数据时代的到来,给我们的生活、工作、生产等方方面面都带来了巨大影响。
大数据的挖掘和分析为我们提供了更多元、更准确、更细致的信息,为决策和判断提供了更有力的支撑。
在医疗、金融、交通、教育等领域,大数据分析已被广泛应用,为提高效率、降低成本、优化资源配置等方面发挥了积极作用。
也带来了数据隐私、数据泄露、信息安全等问题,需要引起我们的高度重视。
1.2 统计学在大数据时代的重要性在大数据分析中,统计学更是发挥着关键作用。
统计学家能够运用统计模型和算法,对大数据进行分析和挖掘,提取有意义的信息和知识。
统计学在数据处理、数据清洗、数据挖掘、预测建模等方面都有独特的优势,可以帮助人们更好地利用大数据资源。
统计学在大数据时代的重要性不可忽视。
统计学家的专业知识和技能将成为解决大数据难题的关键。
统计学在指导人们更好地应对大数据时代的挑战和机遇中将起到至关重要的作用。
2. 正文2.1 统计学在大数据分析中的作用统计学在大数据分析中扮演着关键的角色,它的作用不可忽视。
统计学通过概率理论和推断统计等方法,帮助我们对大数据进行有效的描述和分析。
利用统计学的方法,我们可以从海量数据中提取有用的信息,发现数据之间的关系和规律,为决策提供科学依据。
统计学在数据清洗和预处理阶段起着至关重要的作用。
大数据往往存在着各种噪声、缺失值等问题,统计学可以帮助我们识别并处理这些问题,确保数据的质量和准确性。
统计学还可以帮助我们筛选特征、建立模型,从而更好地挖掘数据的潜在信息。
统计学在大数据分析中还可以帮助我们进行统计推断和预测。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8.3 商业 智能—— 决策者的
锦囊
【案例1】罩 杯和败家程度 【案例2】外
滩踩踏悲剧 【案例3】大 数据和途牛网
【案例】 DataEye,数 据驱动手游运
营
【案例】广告 业的商业智能
8.4 市场 智能—— 商业智能 的衍生智
慧
8.5 消费 智能—— 当数据成 为一种服
务
感谢聆听
叁
【知识点2】如何降低 不回应率
2 样本魅影
01
【案例1】娱乐圈话
题:锋菲恋
03
【案例3】双重否定
的疑惑
05
【知识点2】有效性 (Validity)和可靠 性(Reliability)
02 04
【案例2】几字之差 对于民众支持率的影 响
【知识点1】响应误 差(Response Error)
2.4 措辞的艺术——僧推/敲 月下门
03
04
5.1 点估计——统计学家比间 谍干得漂亮
【案例1】二 战中的德军坦
克数
2020
【知识点1】 样本统计量和
总体参数
2022
5 统计推断
1
【案例】美国盖洛普公司的民 意调查
2
【知识点1】置信水平
3
【知识点2】置信区间
5.2 置信区间——责善切戒尽 言
【案例1】法律中的人文精 神
【知识点1】零假设和备择 假设
6 变量间的关系
【知识点5】 回归分析F
检验
【知识点6】 拟合优度R2
6.4 回归分析——对不起,其 实我也想长高
07
Part One
7 统计杂谈
7.1 为什么对回归情有独 钟
7.3 条件概率和更多的信 息
7.5 R you happy
7 统计杂谈
7.2 调查问卷中的分类变 量
7.4 极大似然估计——看 起来最像
【知识点2】概 率
1 大数据时代下的统计学
01
【案例】挑战者号 航天飞机(STS Challenger)失 事
02
【知识点】“必然 会发生”和“必然 不会发生”的事件
1.3 小概率事件≠必然不会发 生的事件
1 大数据 时代下的 统计学
1.4 你真的了解数据吗
【案例】淘宝的客 户评价体系
成
B
4.4 中心极限定 理
D
【案例1】掷骰子和伯努利 试验
【知识点1】概率分布
【知识点3】方差
4 正态女神
4.1 期望——量化你的预期
【案例2】赌场就是概率场
【知识点2】期望 (Expectation)
4 正态女神
2020
【案例2】谁 会是被骗的大
傻瓜
2022
01
02
03
4.2 大数定律——为什么十赌 九输
实际显著
5.4 假设检验——“凑巧”可 以拒绝吗
5 统计推断
A
【知识点5】假设 检验vs.置信区间
【知识点6】单侧 检验 vs.双侧检验
B
5.4 假设检验——“凑巧”可 以拒绝吗
5 统计推断
2020
【知识点1】p 值的历史和思
想
2022
01
02
03
5.5p 值——打开潘多拉魔盒 的钥匙
【案例】金榜 题名无望、少
年得志梦断
2021
【知识点2】p 值误用
06
Part One
6 变量间的关系
6 变量间的关系
6.1 卡方分析——细腻的眼神里岂 容得半粒沙
6.3 ANOVA——地域,我们没有 什么不同
6.2 相关性分析——早起的鸟儿有 虫吃
6.4 回归分析——对不起,其实我 也想长高
6 变量间的关系
【案例1】仙道迟 到事件发生率分析
【案例3】被解雇的市场调 研部员工
【知识点2】抽样中存在的 错误风险
2 样本魅影
2.2 抽样——尝一勺锅里的靓汤
【案例2】“捉放法”估算 鱼苗成活率
【知识点1】简单随机抽样
【知识点3】访问员
2 样本魅影
壹
【案例】不回应的影响 有多大
贰
【知识点1】不回应 (Nonresponse)
2.3 不回应误差——沉默不是 金
A
【知识点】数据的 类型
B
1 大数据时代下的统计学
01
【案例】大数据,大 偏差——谷歌的流感 预测模型真的靠谱吗
03
【知识点2】相关关 系和因果关系
02
【知识点1】二手数 据
1.5 数据来自哪里
02
Part One
2 样本魅影
2 样本魅影
2.1 样本——窥一 斑而见全豹,观滴
水而知沧海
2.2 抽样——尝 一勺锅里的靓汤
【案例2】抗击埃博拉要避 免两类错误
【知识点2】两类错误
5 统计推断
5.3 两类错误:有罪被判无罪和无罪被判有罪哪个更严重
5 统计推断
0 1
【案鲜
吗
0
5
【知识点 2】p值
【知识点3】 统计显著
0 3
【知识点1】 显著性水平
0 6
【知识点4】 统计显著vs.
2.3 不回应误差— —沉默不是金
2.4 措辞的艺术— —僧推/敲月下门
2.5 大数据时代, 当“样本”已成往
事
2 样本魅影
01
【案例1】客户满 意度调查
03
【知识点】随机样 本,方便样本和自
愿回应样本
02
【案例2】救护车 垄断业务调查
2.1 样本——窥一斑而见全豹, 观滴水而知沧海
【案例1】红豆和绿豆
7.6 贝叶斯
7 统计杂谈
7.7 来自星星的统计 陷阱
7 统计杂谈
【回归和电 影】
1
【回归和手 游】
2
7.1 为什么对回归情有独钟
7 统计杂谈
04
【工作环境和员
工满意度】
03
【Svensson
Method】
02
【Rank-
Invariant】
7.2 调查问卷中的分类变量
01
【疼痛】
7 统计杂谈
05
【知识点3】相关表、
06
【知识点4】相关系
相关图和相关系数
数t统计量
6 变量间的关系
0
0
1
2
【案例】 地域歧视
问题
0
【知识点1】 方差分析
0
4
5
【知识点3】 离差平方和
及其分解
【知识点 4】均方
0 3
【知识点2】 方差分析统
计模型
0 6
【知识点5】 AMOVA F
统计量
6.3 ANOVA——地域,我们 没有什么不同
【清新萝莉 R】
7 统计杂谈
7.6 贝叶斯
【起源】
【定义】
【自拍杆和蓝 牙耳机】
7 统计杂谈
【被黑的统计 机构】
【统计局的无 奈】
【王老吉状告 加多宝】
7.7 来自星星的统计陷阱
08
Part One
8 大数据,在水一方
8 大数据,在水一方
8.1 洛阳 纸贵—— 大数据思
维
8.2 大 数据驱 动运营
3.3 标准差、标准误,傻傻分 不清楚
【案例】“剩女”和潜力巨 大的相亲市场
【知识点2】条状图(Bar Chart)
【知识点1】饼状图(Pie Chart)
【知识点3】散点图 (Scatter Plot)
3 描述数据
3.4 图形替数据说话——“剩女”和相亲市场
3 描述数据
2019
【知识点1】 什么是数据可
1.3 小概率事件≠必然不 会发生的事件
1.5 数据来自哪里
1.2 概率——上帝的指引 1.4 你真的了解数据吗
1 大数据时代下 的统计学
1.1 统计学——天使还是恶 魔
【知识点】统计学的定 义
【案例1】硬币 的指引
【知识点1】随 机性
1 大数据时代下的统计学
1.2 概率——上帝的指引
【案例2】赌徒 的错觉
【案例2】性别和 文化程度是相互独
立的吗
【知识点1】 卡方分布
【知识点2】 卡方检验
6.1 卡方分析——细腻的眼神 里岂容得半粒沙
6 变量间的关系
01
【案例1】早起的鸟
儿有虫吃
02
【案例2】化妆品销 售额与广告费的关系
分析
03
【知识点1】相关关
系
04
【知识点2】相关分
析
6.2 相关性分析——早起的鸟 儿有虫吃
2 样本魅影
【案例】Farecast, 美国创业梦
A
【知识点】大数据 的4V特征
B
2.5 大数据时代,当“样本” 已成往事
03
Part One
3 描述数据
3 描述数据
3.2 寻找中位数— —排序,数到中间
3.1 均值——可 能会说谎的天平
3.3 标准差、标准 误,傻傻分不清楚
3.4 图形替数据说 话——“剩女”和
视化
2021
【知识点3】 数据可视化的
工具
01
02
03
04
3.5 数据可视化——“云想衣 裳花想容”
【案例】谁在 开网店
2020
【知识点2】 数据可视化主
要应用领域
2022
04
Part One
4 正态女神
4 正态女神
A
C
4.2 大数定律—— 为什么十赌九输
4.1 期望——量 化你的预期
4.3 正态分布—— 大道至简,大美天