统计学第六章_ppt课件
合集下载
《统计学》完整袁卫-贾俊平PPT课件

定比数据
定距测定的量可以进行加或减的运算,但 却不能进行乘或除的运算。
也称比率数据,是比定距数据更高一级的 定量数据。它不仅可以进行加减运算,而 且还可以作乘除运算。
如产量、产值、固定资产投资额、居民
货币收入和支出、银行存款余额等。
精品ppt
11
统计数据四个层次的概括
测定层次 特征
运算功能 举例
1. 定类测定 分类
计数
产业分类
2. 定序测定 分类;排序 计数;排序 企业等级
3. 定距测定 分类;排序; 计数;排序;温度
有基本测量单位 加减
4. 定比测定 分类;排序; 计数;排序;商品销售
有基本测量单位;加减
额
有绝对零点 乘除
精品ppt
12
4. 截面数据和时间序列数据
截面数据:所搜集的不同单位在同一时间的数据。例 如,所有上市公司公布的2004年年度的净利润。
(三)数据的类型
1. 定性数据和定量数据 定性数据:用文字描述的 。
如在本章的“统计引例”中消费者对永美所提供服 务的总体评价等都属于文字描述的定性数据。
精品ppt
8
定量数据:用数字描述的。
如企业的净资产额、净利润额等。 2. 离散型数据和连续型数据
变量 若我们所研究现象的属性和特征的具体表现在 不同时间、不同空间或不同单位之间可取不同 的数值,则可称这种数据为变量。
定序数据,也称序列数据,是对事物所具 有的属性顺序进行描述。
例如,对企业按经营管理的水平和取得 的效益划分为一级企业、二级企业等。
精品ppt
10
定距数据
也称间距数据,是比定序数据的描述功能 更好一些的定量数据。
如10℃、20℃等。它不仅有明确的高低 之分,而且可以计算差距,如20℃比 10℃高10℃,比5℃高15℃等。
新教材高中数学第6章统计学初步3统计图表课件湘教版必修第一册

解析 (1)因为总数是100,区间[0.5,1)内的频率为0.08,区间[4,4.5]内的频率为0.02, 所以区间[0.5,1)内的频数为8,区间[4,4.5]内的频数为2,
则x=100-(4+8+15+22+14+6+4+2)=25,y= 6 =0.06.
100
(2)因为从左往右数第4个矩形对应的频率为0.22,且表中的数据组距为0.5, 所以它的高度为0.22÷0.5=0.44.
6.3 统计图表
1 |基本的统计图表
统计图表 条形统计图
扇形统计图 折线统计图
特点 主要用于直观描述不同类别或分组数据的频数 和频率,适用于描述离散型的数据 主要用于直观描述各类数据占总数的比例 主要反映数据的发展变化趋势
2 |频率分布表和频率分布直方图
绘制频率分布表和频率分布直方图的步骤:
1.计算极差.一组数据中① 最大值 与② 最小值 的差.
如果将频率分布直方图中的左边和右边各延长一个分组,取各相邻小矩形⑤ 上底边 的中点,用线段顺次连接各点,就得到频率分布折线图.
判断正误,正确的画“ √” ,错误的画“ ✕” . 1.从频率分布直方图中得不出原始的数据信息. ( √ ) 2.在频率分布直方图中,各个小矩形的面积和为1. ( √ ) 3.频率分布直方图中小矩形的面积表示该组数据的个数.( ✕ ) 提示:频率分布直方图中小矩形的面积表示该组数据的频率. 4.画频率分布直方图时,分组越多越好. ( ✕ ) 5.频率分布折线图反映数据频率分布的规律. ( √ )
|频率分布直方图
1.频率分布直方图的优缺点:频率分布直方图能够直观地表明数据分布的形状,一 般呈中间高、两端低的“峰”状结构.但是从直方图本身得不到具体的数据内
管理统计学第6章PPT课件

具
体
参
样
的
假
数
本
统
设
假
观
计
检
设
察
方
验
法
2
6.1 假设检验的一般问题
例如:
某种大量生产的袋装食品,按规定每袋重量 不得少于250g。 今从一批该种食品中任意抽 取50袋,发现有6袋低于250g 。若规定不符 合标准的比例达到5%,食品就不得出厂,问 该批食品能否出厂。
➢从2000年的新生儿中随机抽取30个,测得 其平均体重为3210g,而根据1999年的统计资 料,新生儿的平均体重为3190g,问2000年的 新生儿与1999年相比,体重有无显著差异。
H0:μ≤8000(产品寿命不超过8000小时) H1:μ>8000(产品寿命超过8000小时)
因:该批产品的使用寿命超过了8000小时是
我们想通过收集数据予以支持的观点。
13
确定原假设和备择假设的 一些原则和注意事项:
(1)原假设与备择假设互斥。 (2)假设检验是概率意义下的反证法,
一般情况下把“不能轻易否定的命题”作 为原假设,而把希望得到的结果或想收集 数据予以支持的假设作为备择假设。
3
6.1.1 假设检验的基本概念
4
6.1.2 假设检验的基本形式
假设基本形式
H0 :原假设,H1 :备择假设
H 0 : m = m 0 , H 1 : m m 0 (双侧备择假设)
H 0
:m
m ,H
01
:m
>
m 0 (右单侧备择假设)
H 0
:
m
m
0
,H 1
:
m
<
m
管理统计学第6章相关与回归PPT课件

2
4
6
8
10
12
30.09.2020
14
● (4)从变量相关的程度看 完全相关 不相关 不完全相关
30.09.2020
25
20
15
10
5
0
0
2
4
6
8
10
12
35 30 25 20 15 10
5 0
0
5
10
15
25
20
15
10
5
0
0
2
4
6
8
10
12
15
3. 相关关系的描述
对现象变量之间是否存在相关关系以及存 在怎样的相关关系进行分析、作出判断,这是进 行相关分析的前提。通过编制相关表和相关图, 可以直观地、大致地判断现象变量之间是否存在 相关关系以及关系的类型。
第六章 相关与回归分析
30.09.2020
1
第一节 相关分析 第二节 一元线性回归分析
30.09.2020
2
相关分析和回归分析有什么用?
▪ 一个国家香烟的消费量与癌症的发病率有关系吗? ▪ 父母的身高是否影响其子女的身高? ▪ 公司股票的市盈率与老总的薪酬有关联吗? ▪ 接受高学历教育的人是否比低学历的人有更高的薪水?…… ▪ 现实世界中存在着大量诸如此类的问题,用统计语言来概况,
30.09.2020
8
2)相关关系(correlation)
✓ 当一个或几个相互联系的变量取一定数值时,与之 相对应的另一变量的值虽然不确定,但它仍按某种 规律在一定的范围内变化。变量间的这种相互关系, 称为具有不确定性的相关关系。
✓ 用相关与回归分析方法研究
卫生统计学课件_第六章_假设检验

16
公式:t
自由度:对子数 - 1
适用条件:两组配对计量资料。 例题:p. 34, 例8
三、两个小样本均数比较的 t 检验
▲目的:由两个样本均数的差别推断两样本
所代表的总体均数间有无差别。 ▲计算公式及意义: t 统计量: 自由度:n1 + n2 –2
18
▲ 适用条件:
(1)已知/可计算两个样本均数及它们的标准差 ;
38
(2)当不能拒绝
II 类错误的概率 β 值的两个规律:
1. 当样本量一定时, α 愈小, 则 β 愈大,反之…; 2.当 α 一定时, 样本量增加, β 减少.
39
4. 正确理解P值的意义, P值很小时“拒绝H0 ”,P值的
大小不要误解为总体参数间差异的大小; 拒绝H0 只是说 差异不为零。 统计学中的差异显著或不显著,和日常生活中所说的差 异大小概念不同. (不仅区别于均数差异的大小,还区别 于均数变异的大小)
统计推断
用样本信息推论总体特征的过程。
包括:
参数估计: 运用统计学原理,用从样本计算出来的统计
指标量,对总体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差
别对样本所代表的总体间是否存在着差别做出判断。
第一节
▲显著性检验;
假设检验
▲科研数据处理的重要工具;
▲某事发生了:
是由于碰巧?还是由于必然的原 因?统计学家运用显著性检验来 处理这类问题。
45
41
是非判断: ( )1.标准误是一种特殊的标准差,其 表示抽样误差的大小。 ( )2.N一定时,测量值的离散程度越 小,用样本均数估计总体均数的抽样误差 就越小。 ( )3.假设检验的目的是要判断两个样 本均数的差别有多大。
公式:t
自由度:对子数 - 1
适用条件:两组配对计量资料。 例题:p. 34, 例8
三、两个小样本均数比较的 t 检验
▲目的:由两个样本均数的差别推断两样本
所代表的总体均数间有无差别。 ▲计算公式及意义: t 统计量: 自由度:n1 + n2 –2
18
▲ 适用条件:
(1)已知/可计算两个样本均数及它们的标准差 ;
38
(2)当不能拒绝
II 类错误的概率 β 值的两个规律:
1. 当样本量一定时, α 愈小, 则 β 愈大,反之…; 2.当 α 一定时, 样本量增加, β 减少.
39
4. 正确理解P值的意义, P值很小时“拒绝H0 ”,P值的
大小不要误解为总体参数间差异的大小; 拒绝H0 只是说 差异不为零。 统计学中的差异显著或不显著,和日常生活中所说的差 异大小概念不同. (不仅区别于均数差异的大小,还区别 于均数变异的大小)
统计推断
用样本信息推论总体特征的过程。
包括:
参数估计: 运用统计学原理,用从样本计算出来的统计
指标量,对总体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差
别对样本所代表的总体间是否存在着差别做出判断。
第一节
▲显著性检验;
假设检验
▲科研数据处理的重要工具;
▲某事发生了:
是由于碰巧?还是由于必然的原 因?统计学家运用显著性检验来 处理这类问题。
45
41
是非判断: ( )1.标准误是一种特殊的标准差,其 表示抽样误差的大小。 ( )2.N一定时,测量值的离散程度越 小,用样本均数估计总体均数的抽样误差 就越小。 ( )3.假设检验的目的是要判断两个样 本均数的差别有多大。
统计学第六章抽样调查

n
N
例题2
xf
x
f
8400 200
42
s (x x)2 f 12200 7.81
f
200
2 (1 n ) 7.812 (1 200 ) 0.55
x
n
N
200
2000
例题3
❖某冷库的10万只冻鸡合格率为97%, 如果按重复抽样与不重复抽样各抽 取1000只和2000只,分别计算抽样 平均误差。
A
B
较小的样本容量
X
成数
❖ 总体成数
每个总体单位标志值设为0或1 1:具有某种属性的总体单位标志值 0:不具有某种属性的总体单位标志值 总体中具有某种特征的单位占全部总体单位
数的比例称为总体成数,记作P 成数总体方差:P(1-P)
总体成数和样本成数
❖ 样本成数
从成数总体中抽取样本容量为n的样本 样本中具有此种特征的单位占全部样本单位
从1、2 、3、4中随机抽取2个的样本数
重复抽样考虑顺序
16
1、1 2、1 3、1 4、1
1、2 2、2 3、2 4、2
1、3 2、3 3、3 4、3
1、4 2、4 3、4 4、4
从1、2 、3、4中随机抽取2个的样本数
不重复抽样考虑顺序 12
2、1 3、1 4、1
1、2
3、2 4、2
1、3 2、3
- 2.58x
-1.65 x
+1.65x + 2.58x
x
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
区间估计
❖ 根据一个样本的观察值给出总体参数的估计范围 ❖ 给出总体参数落在这一区间的概率 ❖ 例如: 总体均值落在50~70之间,置信度为 95%
第6章统计量及其抽样分布PowerPoint统计学.pptx
2. t 分布是类似正态分布的一种对称分布,它 通常要比正态分布平坦和分散
3. 一个特定的分布依赖于称之为自由度的参数 。随着自由度的增大,分布也逐渐趋于正态
统计学
STATISTICS (第三版)
标准正态分布
t 分布
t 分布图示
标准正态分布
t (df = 13) t (df = 5)
z
统计学
STATISTICS (第三版)
次序统计量
1. 一组样本观测值X12,…由小到大的排序
2.
X(1)≤X(2)≤…≤ X(i)≤…≤ X
(n)
3. 后,称X(1),X(2),…,X(n) 为次序统计量
4. 中位数、分位数、四分位数等都是次序统
统计学
STATISTICS (第三版)
6.2 关于分布的几个概念
6.2.1 抽样分布 6.2.2 渐进分布 6.2.3 随机模拟获得的近似分布
1. 样本比例的数学期望
E(p)
2. 样本比例的方差
3. 重复抽样
p2
(1)
n
统计学
STATISTICS (第三版)
6.6 两个样本均值之差的抽样分布
统计学
STATISTICS
两个样本均值之差的抽样分布
(第三版)
1. 两个总体都为正态分布,即 X1~N(1,12),
X2~N(2,22)
2. 两个样本均值之差 x1 x2的抽样分布服从正态分 布,其分布的数学期望为两个总体均值之差
E (x1x2)12
统计学
STATISTICS (第三版)
6.7 关于样本方差的分布
6.7.1 样本方差的分布 6.7.2 两个样本方差比的分布
统计学基础课件 第6章 指数分析
2020年11月27日/下午5时46分
【例 6-4】根据表 6-6 所示的资料,计算商品价格总指数。
产品类别 1
计量单位 万件
表 6-6 价格平均指数计算表
价格指数 kp
p1 p0
报告期销售额 q1 p1
1.10
3850
q1 p1 k
3500
2
万件
1.00
1820
1820
3
台
1.10
1188
1080
指数。下面分别加以阐述。
2020年11月27日/下午5时46分
6.2 总指数
2. 加权算术平均指数 加权算术平均指数,是以个体数量指标指数以及基期的总量指标为基础编制 而成的。其计算公式为:
kq
kq q0 p0 q0 p0
q1 q0
q0 p0
q0 p0
式中: kq ——加权算术平均指数;
kq
2020年11月27日/下午5时46分
6.2 总指数
3. 质量指标综合指数的编制 编制质量指标综合指数采用报告期的数量指标作同度量因素,计算公式为:
kp
q1 p1 q1 p0
式中, k p 为质量指标综合指数。
通过以上的介绍可以看出,无论是数量指标综合指数还是质量指标综合指数, 其编制的关键是合理确定同度量因素。在确定同度量因素时,应特别注意以下两 点:一是同度量因素的确定要符合指标之间的经济联系;二是为了起到同度量的 作用,计算某一综合指数时分于和分母的同度量因素,必须固定在同一时期。
建立指数体系的依据是现象之间客观存在的经济联系,并且这种经济联系可 以通过相应的指标关系式表现出来。如:
总产值=产品产量×价格 总成本=产品产量×单住成本
空间统计学第六章终优秀课件
空间数据分析与传统统计分析主要有两大差异: (1)空间数据间并非独立,而是在维空间中具有某种
空间相关性,且在不同的空间分辨率下呈现不同 之相关程度; (2)地球只有一个,大多数空间问题仅有一组(空间 分布不规则的)观测值,而无重复观测数据。因 此,空间现象的了解与描述是极为复杂的,而传 统方法,尤其是建立在独立样本上的统计方法, 不适合分析空间数据。
/wiki/Waldo_R._Tobler
FLG的一般性: 自然地理、人文地理、社会经济
空间自相关是普遍存在的,否则 地理分析便没有多大意义。 经典统计:独立
空间自相关的存在,使得经典统计学所 要求的样本独立性假设不满足。
如果地理学从根本上值得研究, 必然是因为地理现象在空间上的 变化不是随机的。 经典统计:随机
的寄生物可能是病源。
➢ 空间统计学可以帮助我们处理大的复杂数 据集, 这是GIS经常面对的事情。
Conten ts
一 区域化变量理论
二 空间自相关
三 变异函数及结构分析 四 克里格估计方法
一、区域化变量理论
• 基本概念
随机函数:Z称(x1Z,(xx21,,x2,, x为,nx,n定,)义) 在
上{X的1, X一2,个X n随}
变量时,称该随机函数为随机场。最常用的是
有3个自变量Xu,Xv,Xw(空间点X的3个直角坐
标)的随机场Z,( x记1,为x2 ,Z(X,uxn,X, v,)Xw)。
They are exploratory tools that help you measure spatial processes, spatial distributions, and spatial relationships.
There are a lot of different types of spatial statistics, but they are all designed to examine spatial patterns and processes.
空间相关性,且在不同的空间分辨率下呈现不同 之相关程度; (2)地球只有一个,大多数空间问题仅有一组(空间 分布不规则的)观测值,而无重复观测数据。因 此,空间现象的了解与描述是极为复杂的,而传 统方法,尤其是建立在独立样本上的统计方法, 不适合分析空间数据。
/wiki/Waldo_R._Tobler
FLG的一般性: 自然地理、人文地理、社会经济
空间自相关是普遍存在的,否则 地理分析便没有多大意义。 经典统计:独立
空间自相关的存在,使得经典统计学所 要求的样本独立性假设不满足。
如果地理学从根本上值得研究, 必然是因为地理现象在空间上的 变化不是随机的。 经典统计:随机
的寄生物可能是病源。
➢ 空间统计学可以帮助我们处理大的复杂数 据集, 这是GIS经常面对的事情。
Conten ts
一 区域化变量理论
二 空间自相关
三 变异函数及结构分析 四 克里格估计方法
一、区域化变量理论
• 基本概念
随机函数:Z称(x1Z,(xx21,,x2,, x为,nx,n定,)义) 在
上{X的1, X一2,个X n随}
变量时,称该随机函数为随机场。最常用的是
有3个自变量Xu,Xv,Xw(空间点X的3个直角坐
标)的随机场Z,( x记1,为x2 ,Z(X,uxn,X, v,)Xw)。
They are exploratory tools that help you measure spatial processes, spatial distributions, and spatial relationships.
There are a lot of different types of spatial statistics, but they are all designed to examine spatial patterns and processes.
概率统计第六章-课件
单侧检验 H0:0 H0:0
H1:0 H1:0
2)检验方法
(1)根据已知条件提出原假设H 0 和备择 假设 H 1 ;
(2)构造统计量 U 并在H 0 成立的条件 下确定统计量 U 的分布;
(3)根据备择假设 H 1 构造小概率事件 {U 1 or U 2}
{U 3} {U 4}
使得
P{U 1orU 2}
R ( , 1 .96 ] [1 .96 , )
因为
Z1.0 48 1.0 50.51 6R 4 0.15 / 15
所以接受 H 0 ,即 0.05 下可以认为 机器处于正常工作状态。
例2 (习题六第9题)设总体 X~N(,32)
(X 1,X 2, ,X 2)5是 X的样本,检验
H 0: 0 H 1: 0
5. 假设检验的错误
6. 由样本对总体状况作出判断,实质 是
7. 用部分推断整体,因而可能出现两类 错
8. 9.
误1)H。0弃真错误(第一类错误) H 0
10. 即 正确,但检验结果拒绝了
11. 犯弃真错误的概率是
2)采伪错误(第二类错误) 即H 0 不正确,但检验结果不能否定 H 0
犯采伪错误的概率是
解 因为 =0.15(cm)已知,由样本
观测值计算得到
1 15
x 15
xi
i1
10 .48
提出假设 H 0 : 10 .5 H 1 : 10 .5
H 0 成立时统计量 Z X 10 .5 ~ N ( 0 ,1)
0 .15 / 15
拒绝域
0 .05
z 0 .025 1 .96
7. 取
通常由与原假设相悖的状态或
8. 值、检验者希望由样本观测值获得 支