【精品】PPT课件 第四讲 数据的描述性分析

合集下载

描述性统计分析 ppt课件

描述性统计分析  ppt课件

PPT课件
23
【界面介绍】
⑴ 选 择 菜 单 【Analyze】→【Descriptive Statistics】→ 【Crosstabs】,进入列联表分析界面。
PPT课件
24
【实验案例】
例4-4 调查339名45岁以上吸烟习惯与患肺癌的关系,数 据见4-4-1.sav。试问吸烟者与不吸烟者患肺癌的概率是 否有所不同。
PPT课件
32
【实验案例】
例4-5 已知有2005年各省城乡居民消费水平数据,数据见45-1.sav。试按地区对各省城乡消费水平之比进行分析,并 比较不同地区城乡消费水平是否有较大差异。
PPT课件
33
PPT课件
8
【实验案例】 例4-1 测量20台液晶显示器的重量,数据见4-1-1.sav,对其进行 描述性统计分析。
PPT课件
9
4.2 频数分布表分析
频数分析统计的是每一组中观测点的个数,而不是 考虑其实际取值。
通过频数分析能够了解变量取值的情况,对于把握 数据的分布特征非常有用。当某变量的自然取值是局限 在有限的几个数值中,则频数分析就是统计该变量在各 个取值点的个数分布情况;如果某变量的取值是在某范 围内的离散值,则需要将其取值区域划分为几个取值区 间,频数分析就是统计该变量在各个取值区间观测点个 数的分布情况。
描述性统计分析
【学习提要】
对数据进行统计描述是统计分析中最基本的工作。对于 整理好的数据,通过描述性统计分析,可以挖掘出很多统计 量的特征。SPSS软件中,描述性统计分析功能主要集中在 “Descriptive Statistics”菜单。具体包括5个过程: Frequencies过程、Descriptives过程、Explore过程、 Crosstabs过程和Ratio过程。

第4章spss描述性统计分析ppt课件

第4章spss描述性统计分析ppt课件
27
操作主界面:
28
Exact按钮:
29
Statistics按钮: 计算卡方值,用于行列
变量的独立性检验
计算pearson和 spearman相关系数
定类资料的行列变 量相关性检验
定序资料的行列变 量相关性检验
定序与定距资料的行 列变量相关性检验
评判内部一致性 相关风险比例 两相关二项分类变量的非参检验
100.0
Cumulative Percent
5.6 11.1 16.7 22.2 27.8 33.3 38.9 44.4 50.0 55.6 66.7 83.3 88.9 94.4 100.0
数学 18 0
83.33 7.639
27 75.75 85.00 89.00
语文 18 0
74.78 12.066
2)Descriptive : 基本描述统计,对单变量计算基本描述统计量
3)Explore: 探索性分析,考察一些极端值和奇异值;考察变量 与变量间分布的差异是否显著
4)Crosstabs:交叉列联表,讨论变量间的频数关系及各种测度 (定类、定序、定距、定比)间的相关关系
5)Ratio:比率分析,对两变量间变量值比率变化的描述分析
2
4.1 Frequencies(频数分析)
进行频数分布表的分析,适合于定性资料, 以及部分定量资料,不能分组进行。
对数据的分布趋势进行初步分析。
基本概念: 频数(Frequency): 百分比(Percent,频率 ): 有效百分比(Valid Percent):各频数占有效样 本数(除去缺失样本数)的百分比。 累计百分数(Cumulative Percent):最后累积取 值100。
Interval by IntPeervaarsl on's R

2019年第四讲数据的描述性分析.ppt

2019年第四讲数据的描述性分析.ppt

分数 人数(人)f 组中值X Xf f/62 X*(f/62)
70-80
2
75 150 0.0323 2.419
80-90
7
85 595 0.1129 9.597
90-100 10
95 950 0.1613 15.323
100-110 16
105 1680 0.2581 27.097
110-120 14
W1 W

X2
W2 W

Xk
Wk W
9
加权算术平均数
适用情况 ♦ 资料已分组 ♦ 每一个变量值的作用不同
权数的确定方法 ♦主观确定法(专家确定) ♦客观存在(频数分布表中的相对频数)
影响平均数大小的因素有 ♦变量值的大小 ♦权数的大小
10
根据频数分布表求平均数
62人皮尔逊智商分数平均数计算表
种类 计算 适用情况 离散趋势测度指标 种类 计算 适用情况
位置测度指标 种类 计算 适用情况
箱索图 绘制方法 作用
3
描述数据特征的意义
4
集中趋势测度指标(平均数、中位数、众数)
掌握计算方法 掌握每种指标的适用情况
5
集中趋势指标1----平均数
衡量变量分布中心的指标 最常用的 集中趋势指标 容易受极端值的影响
单位相同 数据总体水平相同
否则必须用变异系数
变 异 系 数 C .V S 或 C .V =
X

33
变异系数应用举例
n1 100头羊 X 50公斤 S = 10公斤
n 2 100头马 X 300公斤 S = 10公斤 问 : 哪个样本更集中 ?
10

Chap04_数据的描述性分析

Chap04_数据的描述性分析


i 1
n
1 xi
加权调和平均数
xH m1 m2 ...... mn m m1 m2 ...... n x1 x2 xn
m
i 1 n
n
i
mi i 1 x i
调和平均数是算术平均数的变形
xH
m
i 1 n
n
i
mi i 1 xi

x
i 1 n
n

相对指标应用的原则
1、可比性原则 (1)正确选择对比基数 (2)保持对比指标的可比性 2、相对指标与总量指标结合运用原则 3、多种相对指标结合运用原则

集中趋势
集中趋势(Central Tendency)反映 的是一组数据向某一中心值靠拢的倾向, 在中心附近的数据数目较多,而远离中心 的较少。对集中趋势进行描述就是寻找数 据一般水平的中心值或代表值。
例题
峰度
峰度(Kurtosis)是分布集中趋势高峰的形状。在 变量数列的分布特征中,常常以正态分布为标准, 观察变量数列分布曲线顶峰的尖平程度,统计上称 之为峰度。

v4

4
3
x
n i 1
i
x fi

4

i 1
n
3
fi 4
正态分布的峰度系数为0,当>0时为尖峰分布, 当<0时为平顶分布。 例题
例题
离散系数 离散程度的绝对指标 对应的平均指标
V

x
100%
是非标志的平均数和方差
π是一个比率,它表示具有某种特征的个体的 数量占总体中个体总数的比重,即总体成数。 是非标志的平均数为:

x

第四章 数据特征的描述统计分析_PPT幻灯片

第四章 数据特征的描述统计分析_PPT幻灯片

准误
Harmonic Mean 调和平均数
2021/3G/10eometric Mean 几何平均数
6
输入统 计量的 标题
输入注解, 这些注解将 显示在统计 量输出栏的 下面
标题对话框
04-1 下面举例说明
2021/3/10
7
表4-1
编号
性别 1男 2男 3男 4男 5男
6男 7男
8男
9男 10 男 11 男
Ⅱ、个案汇总分析
按Analyze—Reports—Case Summaries 顺序单击打开Case Summaries 对话框。
2021/3/10
12
Summarize Cases 对话框
可在参数框中输 入数值,该数值表 示分析过程只对前 几个个案进行
带有缺省值的个 案不被显示
在列出个案的同 时,显示个案的序 号
Std.Error of Mean 均值标准误
Minimum 最小值
Maximum 最大值
Range 极差
First 首值
Last 尾值
Variance 方差
Skewness 偏度
Std.Error of Skewness 偏度的
标准误
Kurtosis 峰度
Std.Error of Kurtosis 峰度的标
24 女 25 女 26 女
5 120.9
5
124
5 125.4 5 130.1
27 男 28 男
29 男 30 男
年级 身高
5
132.7
5
133
5
133.4
5
136.7
5
137.5
5

统计学数据的描述性分析解析

统计学数据的描述性分析解析
描述性统计学可以帮助我们进行数据比较,通过比较不同数据集之间的差异,发现数据背后的 规律和趋势。
描述性统计学与推断统计学的关系
描述性统计学:对数据进行描述性 分析,揭示数据的分布特征和规律
描述性统计学是推断统计学的基础: 描述性统计学提供了推断统计学所 需的数据基础和信息
添加标题
添加标题
添加标题
描述性统计学 是统计学的一 个分支,主要 研究如何描述 和总结数据集 的特征和分布。
描述性统计学 包括数据的集 中趋势、离散 程度、分布形 状等统计量的 计算和描述。
描述性统计学 可以帮助我们 更好地理解数 据集,为后续 的统计分析和 决策提供基础。
描述性统计学 的应用广泛, 包括社会科学、 自然科学、商
统计学数据的描述 性分析解析
,
汇报人:
目录
CONTENTS
01 添加目录标题 02 描述性统计学的概念与意义 03 描述性统计学的常用指标 04 描述性统计学的分析方法 05 描述性统计学的应用场景
06 描述性统计学的局限性及注意事项
单击添加章节标题
第一章
描述性统计学的概念与意义
第二章
描述性统计学的定义
业等领域。
描述性统计学在数据分析中的作用
描述性统计学可以帮助我们理解数据的分布情况,包括数据的集中趋势、离散程度和分布形状 等。
描述性统计学可以帮助我们识别数据的异常值和缺失值,从而提高数据分析的准确性和可靠性。
描述性统计学可以帮助我们进行数据可视化,将复杂的数据转化为易于理解的图表和图形,从 而提高数据分析的可读性和可解释性。
描述性统计学的局限性及注 意事项
第六章
描述性统计学的局限性
描述性统计学不能预测 未来,只能描述过去和

数据的统计分析与描述剖析精品PPT课件

数据的统计分析与描述剖析精品PPT课件
j(x)
1
x2
e2
2p
分布函数
F(x)
1
x
y2
e 2 dy
2p
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-4
-2
0
2
4
6
2021/2/1
7
2. 2 分布 2 (n)
若随机变量 X1,X2,…,Xn 相互独立,都 服从标准正态分布 N(0,1),则随机变量
Y=
X
2 1
1. 表示位置的统计量—平均值和中位数.
平均值(或均值,数学期望): X
1 n
n i 1
Xi
中位数:将数据由小到大排序后位于中间位置的那个数值.
2. 表示变异程度的统计量—标准差、方差和极差.
标准差: s
[ 1 n 1
n i1
(Xi
1
X )2 ]2
它是各个数据与均值偏离程度的度量.
方差:标准差的平方.
极差:样本中最大值与最小值之差.
2021/2/1
4
3. 表示分布形状的统计量—偏度和峰度
偏度: g1
1 s3
n
(Xi
i 1
X )3
峰度: g2
1 s4
n
(Xi
i 1
X)4
偏度反映分布的对称性,g1 >0 称为右偏态,此时数据位于均值 右边的比位于左边的多;g1 <0 称为左偏态,情况相反;而 g1 接近 0 则可认为分布是对称的.
2,…,k).这样的统计量称为估计量.
1. 点估计:构造(X1,X2,…,Xn)的函数ˆi ( X1,X2,…,Xn) 作为参数 i 的点估计量,称统计量ˆi 为总体 X 参数 i 的点估计量.

第四章数据的描述性分析

第四章数据的描述性分析

说 ⒈为无名数,一般用倍数、系数表示; 明 ⒉用来说明现象发展的不均衡程度。
2019/11/5
华政商学院
2019/11/5
华政商学院
4、动态相对数
是同类指标数值在不同时间上 的对比
发展 速度

报基告期期指指标标数数值值100﹪
上海的国民生产总值
年份 1999 2000 2001 2002 2003 2004 2005 亿元 4034.96 4551.15 4950.84 5408.76 6250.81 7450.27 9143.95
• 权数的意义:可以表示结构,例如社会发展 结构,产业结构等。
• 带有权数公式的记忆方法 • 应用:基金,绩点的计算
2019/11/5
华政商学院
算术平均数的性质
可以分析现象之间的依存关系(收入和文化程度)
平均值是一个重要的统计量,可以推断总体的平均值 不适合于定类数据和定序数据
2019/11/5
受极端值影响较大。
华政商学院
偏度 峰度
第二节 集中趋势的描述
集中趋势
指总体中各单位的次数分布从两边向中
间集中的趋势,用平均指标来反映。
对集中趋势的描述就是找数据的一般水平的 中心值或者代表值
测定集中趋势的意义:
可以反映现象总体的客观规律性;
可以对比同类现象在不同的时间、地 点和条件下的一般水平; 可以分析现象之间的依存关系。
X

i 1 K
fi
2019/11/5 i 1

6160 50
1、各组变量用中值代表 123.2 2、假设条件是数据在组中的分布是
华均政商匀学院或者对称的
对于分组资料—加权算术平均数*
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档