统计学贾俊平课件ppt课件
合集下载
统计学课件(贾俊平)人大课件4_课件

Me
L
N 2
Sm1 fm
i
4. 该公式假定中位数组的频数在该组内均匀分布
数值型分组数据的中位数 (算例)
【例4.3】根据第 三章表3-5中的数 据,计算50 名工
人日加工零件数 的中位数
表3-5 某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
累积频数
105~110
3
3
110~115
5
8
按零件数分组
频数(人)
累积频数
105~110
3
3
110~115
5
8
115~120
8
16
120~125
14
30
125~130
10
40
130~135
6
46
135~140
4
50
合计
50
—
M 0 12 (1 0 4 8 1 ) (4 1 8 4 1) 05 1(2 个 )3
定序数据:中位数和分位数
中位数 (概念要点)
值并不适用于低层次的测量数据 5. 选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定
定类数据:众数
众数 (概念要点)
1. 集中趋势的测度值之一 2. 出现次数最多的变量值 3. 不受极端值的影响 4. 可能没有众数或有几个众数 5. 主要用于定类数据,也可用于定序数据和数值型数据
是个定类变量,不同类型的广告就是
广告类型
人数(人)
比例
频率变(量%值) 。我们看到,在所调查的200
商品广告
人当中,关注商品广告的人数最多,
112
0.560
5为6.1012 人 , 占 总 被 调 查 人 数 的 56% ,
统计学PPT完整袁卫贾俊平

5. 原始数据和次级数据
原始数据:指直接从各个调查单位搜集的、尚未经过 整理的统计数据资料,也称一手数据。
次级数据:指那些已经加工整理过的,往往是公开发表 的数据,也称二手数据。
如从报纸杂志、统计年鉴、会计报表上取得的数据 。
(四)数据的来源
1. 从政府机构、各种行业组织、公司和企业所公布的 数据中获取。
总体群数R=16 样本群数r=4 样本容量
A D E
B F G
CM L
J K
H
N P
O
I
LP HD
nndnpnl nh
适合:比简单随机抽样的方法能节约更多的成本,特别 当总体的分布地域非常辽阔 时。
四、有关数据调查的几个问题
调查的目的 判断调查误差的大小
调 登记性误差:登记、汇总、过录时产生的误差,
4. 进行一次调查。它对所调查人们的行为不进行任 何控制,仅提出诸如出生年月、爱好、消费习惯、对 某一事件的看法和其他特征方面的问题,然后对他们 回答的结果进行整理、编码、列表和分析。
调查方 案的主 要内容
确定调查目的 确定调查对象和调查单位 拟订调查提纲 确定调查时间
编制调查的组织计划
三、数据搜集的组织方式
连续型变量的数据可以取介于两个数 值之间的任意数值。
如销售额、经济增长率等。
3. 数据的四个等级 定类数据 也称定名数据,这种数据只对事物的某
种属性和类别进行具体的定性描述。
例如,对人口按性别划分为男性和女性 两类。
定类数据
能够进行的唯一运算是计数,即计算每一 个类型的频数或频率(即比重)。
定序数据,也称序列数据,是对事物所具 有的属性顺序进行描述。
查 误
以及无回答误差和测量误差等
原始数据:指直接从各个调查单位搜集的、尚未经过 整理的统计数据资料,也称一手数据。
次级数据:指那些已经加工整理过的,往往是公开发表 的数据,也称二手数据。
如从报纸杂志、统计年鉴、会计报表上取得的数据 。
(四)数据的来源
1. 从政府机构、各种行业组织、公司和企业所公布的 数据中获取。
总体群数R=16 样本群数r=4 样本容量
A D E
B F G
CM L
J K
H
N P
O
I
LP HD
nndnpnl nh
适合:比简单随机抽样的方法能节约更多的成本,特别 当总体的分布地域非常辽阔 时。
四、有关数据调查的几个问题
调查的目的 判断调查误差的大小
调 登记性误差:登记、汇总、过录时产生的误差,
4. 进行一次调查。它对所调查人们的行为不进行任 何控制,仅提出诸如出生年月、爱好、消费习惯、对 某一事件的看法和其他特征方面的问题,然后对他们 回答的结果进行整理、编码、列表和分析。
调查方 案的主 要内容
确定调查目的 确定调查对象和调查单位 拟订调查提纲 确定调查时间
编制调查的组织计划
三、数据搜集的组织方式
连续型变量的数据可以取介于两个数 值之间的任意数值。
如销售额、经济增长率等。
3. 数据的四个等级 定类数据 也称定名数据,这种数据只对事物的某
种属性和类别进行具体的定性描述。
例如,对人口按性别划分为男性和女性 两类。
定类数据
能够进行的唯一运算是计数,即计算每一 个类型的频数或频率(即比重)。
定序数据,也称序列数据,是对事物所具 有的属性顺序进行描述。
查 误
以及无回答误差和测量误差等
贾俊平版统计学课件 第8章

▽与原假设对立的假设称备择假设,记为 H1 ,用 、 或 表示。 对于新生儿体重的例子,可以表示为
H 0 : 3190
H1 : 3190
(2)确定检验统计量及其分布
▽用于检验假设的统计量称为检验统计量
▽根据 H 0 及相应条件选择适当的统计量,并确定统计量
的分布 对于新生儿体重的例子,可利用 x 0 构造检验统计量. 若新生儿体重为正态分布 N ( , 2 ) ,且 已知,则在 H 0 为真 时,用 z 作为检验统计量,并且
H 0 : 3190 H1 : 3190
并已知 x 3210, 80, n 100 ,则
z0 x 0
n
3210 3190 80 100
2.5
于是
p 2Pz z0 2 0.00621 0.01242
双侧检验的P值
/ 2
/ 2 拒绝
▽犯第二类错误的概率为 。
表8-1 假设检验中各种可能结果的概率
实际情况
H 0 为真 H 0 不真
决策
接受 H 0
1
拒绝 H 0
1
假设检验中的两类错误(决策结果)
H0: 无罪
假设检验就好像一场审判过程 统计检验过程
陪审团审判
实际情况 裁决 无罪 无罪 有罪 正确 错误 有罪 错误 正确 接受H0 拒绝H0 决策
若p-值 /2, 不能拒绝 H0 若p-值 < /2, 拒绝 H0
8.1.6 假设检验的形式
研究的问题 假设
双侧检验
H0 H1
左侧检验
右侧检验
= 0 ≠0
统计学PPT完整袁卫贾俊平

就是把定量数据按从大到小或从小到大的顺序排列, 把定性数据按习惯的文字顺序排列,便于我们研究其 条理。
统计分组
对于定性数据就是依据属性的不同将数据划分成若干 组,对于定量数据就是依据属性数值的不同将数据划 分成若干组。
组内同质性,组间差异性。
频数分布编制
分组的关键 变量的选择,选择与研究的问题有关的 变量 。 组限的确定。应遵循穷尽和互斥原则 。
4.重点调查
特点:在总体中选择个别或部分重点单位进行调查。
重点单位指在总体中有举足轻重地位的单位, 其标志值在总体标志总量中占有绝大比重。
任务:及时了解总体基本情况,为主管部门指导工 作服务。
方式:经常性调查;同报表制度结合,用统计报表 调查。
例如,要了解全国钢铁生产的基本情况,只要调 查鞍钢、宝钢、首钢、武钢、包钢等十几家特大 型的钢铁企业就可以掌握全国钢铁企业生产的基 本情况 。
(二)抽样的优点
1.适用的范围广。
对于有限总体,从理论上讲,既可以进行普查也可以 进行抽样;
对于无限总体,就只能进行抽样。若理论上可以而实 际上很难采用全面普查的情况,也只能采用抽样。
如产品质量的破坏性检验、居民住户调查等。
2.与全面普查相比,抽样最大的优点是节省人、财、物 力和时间。 3.随机抽样可以比普查更为精确。
就是把政府机构、各种组织和公司所公布的数据作为 来源,这种数据往往是次级数据。 2. 设计一次试验以获取必要的数据。
例如,在检验洗衣机洗净程度的研究中,研究人员通 过实际洗涤脏衣服,来研究哪种牌子的洗衣机效果最 佳。
3.从观察研究中获取。研究人员通常是在自然状态下, 进行直接的观察。
例如,观察路口的交通流量、观察顾客在商场的购买 行为和观察流水线上的产品质量等。
统计分组
对于定性数据就是依据属性的不同将数据划分成若干 组,对于定量数据就是依据属性数值的不同将数据划 分成若干组。
组内同质性,组间差异性。
频数分布编制
分组的关键 变量的选择,选择与研究的问题有关的 变量 。 组限的确定。应遵循穷尽和互斥原则 。
4.重点调查
特点:在总体中选择个别或部分重点单位进行调查。
重点单位指在总体中有举足轻重地位的单位, 其标志值在总体标志总量中占有绝大比重。
任务:及时了解总体基本情况,为主管部门指导工 作服务。
方式:经常性调查;同报表制度结合,用统计报表 调查。
例如,要了解全国钢铁生产的基本情况,只要调 查鞍钢、宝钢、首钢、武钢、包钢等十几家特大 型的钢铁企业就可以掌握全国钢铁企业生产的基 本情况 。
(二)抽样的优点
1.适用的范围广。
对于有限总体,从理论上讲,既可以进行普查也可以 进行抽样;
对于无限总体,就只能进行抽样。若理论上可以而实 际上很难采用全面普查的情况,也只能采用抽样。
如产品质量的破坏性检验、居民住户调查等。
2.与全面普查相比,抽样最大的优点是节省人、财、物 力和时间。 3.随机抽样可以比普查更为精确。
就是把政府机构、各种组织和公司所公布的数据作为 来源,这种数据往往是次级数据。 2. 设计一次试验以获取必要的数据。
例如,在检验洗衣机洗净程度的研究中,研究人员通 过实际洗涤脏衣服,来研究哪种牌子的洗衣机效果最 佳。
3.从观察研究中获取。研究人员通常是在自然状态下, 进行直接的观察。
例如,观察路口的交通流量、观察顾客在商场的购买 行为和观察流水线上的产品质量等。
统计学第六版贾俊平第5章ppt课件

精品教材
统计学
概率的性质和运算法则
5 - 13
精品教材
互斥事件及其概率
统计学 (mutually exclusive events)
在试验中,两个事件有一个发生时,另一个 就不能发生,则称事件A与事件B是互斥事件 ,(没有公共样本点)
A B
5 - 14
互斥事件的文氏图(Venn diagram)
掷一颗骰子,观察其出现的点数
从一副52张扑克牌中抽取一张,并观察其结果 (纸牌的数字或花色)
2. 试验的特点
可以在相同的条件下重复进行
每次试验的可能结果可能不止一个,但试验的 所有可能结果在试验之前是确切知道的
在试验结束之前,不能确定该次试验的确切结 果
5 -6
精品教材
统计学
事件
(event)
1. 事件:试验的每一个可能结果(任何样本 点集合)
掷一颗骰子出现的点数为3 用大写字母A,B,C,…表示
2. 随机事件(random event):每次试验可能 出现也可能不出现的事件
掷一颗骰子可能出现的点数
5 -7
精品教材
统计学
事件
(event)
1. 简单事件(simple event) :不能被分解成其他 事件组合的基本事件
此,抛掷两枚硬币,恰好有一枚出现正面的概率 等于H1T2或T1H2发生的概率,也就是两种事件 中每个事件发生的概率之和
5 - 18
精品教材
统计学
互斥事件的加法规则
(addition law)
加法规则
1. 若两个事件A与B互斥,则事件A发生或事 件B发生的概率等于这两个事件各自的概 率之和,即
P(A∪B) =P(A)+P(B)
统计学课件贾俊平人大课件-2024鲜版

统计软件
常用的统计软件包括SPSS、SAS、Stata、R等,这些软件提供了丰富的统计功能和数据分析工具,方便研 究者进行数据分析和挖掘。
6
02
描述统计学
2024/3/28
7
数据收集与整理
数据来源
明确数据的来源,包括观察、实 验、调查等。
数据类型
区分数据的类型,如定量数据、 定性数据。 2024/3/28
时间序列图
将时间序列数据绘制成图形,直观展示数据的波动情况。
自相关图
展示时间序列数据与其自身不同时间延迟版本之间的相关性。
2024/3/28
偏自相关图
在给定其他时间延迟的情况下,展示时间序列数据与其自身某个 时间延迟版本之间的相关性。
26
时间序列的预测方法
移动平均法
通过计算历史数据的移动平均值来预测 未来值。
无交互作用的双因素方差分析
当两个因素相互独立时,分别考虑各自对试 验结果的影响
2024/3/28
有交互作用的双因素方差分析
当两个因素存在交互作用时,需同时考虑两 个因素及其交互作用对试验结果的影响
19
05
相关与回归分析
2024/3/28
20
相关分析
2024/3/28
相关关系的概念
介绍相关关系的定义、特点和分类,阐述相关分析与回归分析的关 系。
相关系数的计算与检验
详细讲解皮尔逊相关系数、斯皮尔曼等级相关系数的计算方法和假 设检验,包括检验步骤、检验统计量和决策规则。
相关系数的解释
阐述相关系数的大小、方向和显著性水平对所研究变量的意义,以 及需要注意的问题。
21
一元线性回归分析
一元线性回归模型
介绍一元线性回归模型的形式、 假设和参数估计方法,包括最小 二乘法和最大似然法。
常用的统计软件包括SPSS、SAS、Stata、R等,这些软件提供了丰富的统计功能和数据分析工具,方便研 究者进行数据分析和挖掘。
6
02
描述统计学
2024/3/28
7
数据收集与整理
数据来源
明确数据的来源,包括观察、实 验、调查等。
数据类型
区分数据的类型,如定量数据、 定性数据。 2024/3/28
时间序列图
将时间序列数据绘制成图形,直观展示数据的波动情况。
自相关图
展示时间序列数据与其自身不同时间延迟版本之间的相关性。
2024/3/28
偏自相关图
在给定其他时间延迟的情况下,展示时间序列数据与其自身某个 时间延迟版本之间的相关性。
26
时间序列的预测方法
移动平均法
通过计算历史数据的移动平均值来预测 未来值。
无交互作用的双因素方差分析
当两个因素相互独立时,分别考虑各自对试 验结果的影响
2024/3/28
有交互作用的双因素方差分析
当两个因素存在交互作用时,需同时考虑两 个因素及其交互作用对试验结果的影响
19
05
相关与回归分析
2024/3/28
20
相关分析
2024/3/28
相关关系的概念
介绍相关关系的定义、特点和分类,阐述相关分析与回归分析的关 系。
相关系数的计算与检验
详细讲解皮尔逊相关系数、斯皮尔曼等级相关系数的计算方法和假 设检验,包括检验步骤、检验统计量和决策规则。
相关系数的解释
阐述相关系数的大小、方向和显著性水平对所研究变量的意义,以 及需要注意的问题。
21
一元线性回归分析
一元线性回归模型
介绍一元线性回归模型的形式、 假设和参数估计方法,包括最小 二乘法和最大似然法。
《统计学》PPT完整_袁卫_贾俊平共229页

❖ 知识就是财富 ❖ 丰富你的人生
71、既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下去。——康德 72、家庭成为快乐的种子在外也不致成为障碍物但在旅行之际却是夜间的伴侣。——西塞罗 73、坚持意志伟大的事业需要始终不渝的精神。——伏尔泰 74、路漫漫其修道远,吾将上下而求索。——屈原 75、内外相应,言行相称。——韩非
《统计学》PPT完整_袁卫_贾俊平
16、云无心以出岫,鸟倦飞而知还。 17、童孺纵行歌,斑白欢游诣。 18、福不虚至,祸不易来。 19、久在樊笼里,复得返自然。 20、羁鸟恋旧林,
71、既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下去。——康德 72、家庭成为快乐的种子在外也不致成为障碍物但在旅行之际却是夜间的伴侣。——西塞罗 73、坚持意志伟大的事业需要始终不渝的精神。——伏尔泰 74、路漫漫其修道远,吾将上下而求索。——屈原 75、内外相应,言行相称。——韩非
《统计学》PPT完整_袁卫_贾俊平
16、云无心以出岫,鸟倦飞而知还。 17、童孺纵行歌,斑白欢游诣。 18、福不虚至,祸不易来。 19、久在樊笼里,复得返自然。 20、羁鸟恋旧林,
贾俊平统计参数估计.pptx

34 28 39 36 44 40
39 49 38 34 48 50
34 39 45 48 45 32
第23页/共74页
总体均值的区间估计
(例题分析)
解:已知n=36, 1- = 90%,z/2=1.645。根据样本数
据计算得:x 39.5 ,s 7.77
总体均值在1- 置信水平下的置信区间为
x
z
2
s n
N n ( 未知)
N 1
【例】某职业介绍所的职员从申请某一职业的1000名 申请者中采用不重复抽样方式随机抽取了200名申请 者,借此来估计1000名申请者考试的平均成绩。已知 由200名申请者构成的样本平均分78分,由已往的经 验已知总体方差为90,但该职员不知道总体服从何种 分布。试求总体均值的90%的置信区间。
第25页/共74页
总体均值的区间估计
(例题分析)
解:根据中心极限定理,n=200为大样本,因此,可看做总体近似服从 正态分布、又因为是有限总体的不重复抽样,所以在计算标准差时需乘 以有限总体修正系数,即:
x
n
Nn N 1
90 200
1000 200 1000 1
0.60
z/2=1.645
36 Sample Size 95%Confidence Level
1.60934769 3.31666667
36 99%
Intermediate Calculations
Intermediate Calculations
Intermediate Calculations
Standard Error of the Mean 0.26822462 Standard Error of the Mean 0.26822462 Standard Error of the Mean 0.26822462
39 49 38 34 48 50
34 39 45 48 45 32
第23页/共74页
总体均值的区间估计
(例题分析)
解:已知n=36, 1- = 90%,z/2=1.645。根据样本数
据计算得:x 39.5 ,s 7.77
总体均值在1- 置信水平下的置信区间为
x
z
2
s n
N n ( 未知)
N 1
【例】某职业介绍所的职员从申请某一职业的1000名 申请者中采用不重复抽样方式随机抽取了200名申请 者,借此来估计1000名申请者考试的平均成绩。已知 由200名申请者构成的样本平均分78分,由已往的经 验已知总体方差为90,但该职员不知道总体服从何种 分布。试求总体均值的90%的置信区间。
第25页/共74页
总体均值的区间估计
(例题分析)
解:根据中心极限定理,n=200为大样本,因此,可看做总体近似服从 正态分布、又因为是有限总体的不重复抽样,所以在计算标准差时需乘 以有限总体修正系数,即:
x
n
Nn N 1
90 200
1000 200 1000 1
0.60
z/2=1.645
36 Sample Size 95%Confidence Level
1.60934769 3.31666667
36 99%
Intermediate Calculations
Intermediate Calculations
Intermediate Calculations
Standard Error of the Mean 0.26822462 Standard Error of the Mean 0.26822462 Standard Error of the Mean 0.26822462