社会统计学第七章(一)
《统计学》-第7章-习题答案

第七章思考与练习参考答案1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。
2.答:相关和回归都是研究现象及变量之间相互关系的方法。
相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。
3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数,样本相关系数。
复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。
偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。
4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。
根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:tt X Y 10ˆˆˆββ+=。
总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。
两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。
第二,总体回归函数中的0β和1β是未知的参数,表现为常数;而样本回归直线中的0ˆβ和1ˆβ是随机变量,其具体数值随所抽取的样本观测值不同而变动。
统计学例子——第七章例子整群抽样1

-
106
计算:
每分钟为一群,总体被分为: R = 24×60 = 1 440 群 r = 1 440÷144 = 10 样本平均数:
x 1010 101 公 斤 ) x (
r 10
组间方差:
δx
2
( x x)
r 1
2
106 11.78 况表:
样本编号
1 2 3 4 5 6 7 8 9 10
各群每袋平均重量 x
98 102 104 106 100 98 100 96 100 106
( x x)
-3 1 3 5 -1 -3 -1 -5 -1 5
( x x )2
9 1 9 25 1 9 1 25 1 25
合 计
1 010
δx R r 11.78 1440 10 (公斤) 1.082 r R 1 10 1440 1
2
μx
统计学例子第七章例子整群抽样1整群抽样例子整群抽样的例子统计学第七章课后答案统计学抽样方法统计学抽样调查统计学抽样统计学随机抽样统计学例子误用统计学方法的例子
整群抽样平均误差计算:
某水泥厂大量连续100公斤装水泥,一昼夜产量 为14 400袋。现每隔144分钟抽取1分钟的产量( 10袋为一群),共10群,全部检验。相关数据如 下,试求抽样平均误差。
第七章--统计指数

8240
Q1P1
1 kp
Q1P1
10400
8240
2160元
【例2】计算甲、乙两种商品旳销售量总指数
商品 名称
计量 单位
销售额
(万元) 基期 报告期
销售量比上年 增长(%)
甲 •件
20
25
10
乙 • 公斤 30
45
20
合计 — 50 70
——
K Q
Q1P0
Q1 Q0
Q0 P0
1.1 20 1.2 30 116%
到同度量 和权数 旳作用
基本编制原理
根据客观现象间旳内在联络,引入 同度量原因; 将同度量原因固定,以消除同度量 原因变动旳影响; 将两个不同步期旳总量指标对比, 以测定指数化指标旳数量变动程度。
一般编制原则和措施
⒈数量指标综合指数旳编制:
—采用基期旳质量指标作为同度量原因
KQ
Q1P0 Q0 P0
统计指数是研究社会经济现象数量关系旳变 动情况和对比关系旳一种特有旳分析措施。
指因为各个部分旳不同性质 而在研究其数量时,不能直 接进行加总或对比旳总体
从广义上讲,指数是指反应社会经济现象总体
数量变动旳比较指标;
从狭义上讲,指数是指反应复杂社会经济现象
总体数量变动情况和对比关系旳特殊相对数。
《统计学》第七章 统计指数
对象 指数
销售额 销售量 价格 指数 指数 指数
(总动态指数)
原因 指数
指数体系旳基本形式
⑴ 相对数形式:——对象指数等于各个 原因指数旳连乘积
Q1P1
Q0 P0
k PQ
Q1P0 Q0 P0
K Q Q1P1 Q1P0
统计学原理第七章 抽样调查

合
计
x A 2 x A ( d ) f ( d )f d σ f f
2
256 72 σ 50 11504 50 53.63 200 200
2
30
第三节 全及指标的推断
一、全及指标的点估计
22
不具有某一标志的单位数用N0表示。 ► 总体成数和标准差与样本成数和标准差的计 算方法相同。只是总体指标用大写字母表示, 样本指标用小写字母表示。例如: ► 具有某一标志的单位数占总体的比重:
N1 P N
总体成数
n1 p n
样本成数
不具有某一标志的单位数占总体的比重:
N0 Q 1 P N
13
► 2.
(二)中心极限定律 ► 1. 独立同分布中心极限定理:证明不论变量 总体服从何种分布,只要它的数学期望和方 差存在,从中抽取容量为n 的样本,则这个 样本的总和或平均数是个随机变量,当n 充 分大时,样本的总和或平均数趋于正态分布.
► 2.
德莫佛-拉普拉斯中心极限定理:证明属性 总体的样本成数和样本方差,在n足够大时, 同样趋于正态分布。
σ N n σ n μx ( ) μx (1 ) n N 1 n N
2 2
总体单位总数
样本单位总数
抽样比例
21
(一)抽样成数的抽样平均误差μp ► 属性总体的标志值是用文字表示的,且标志 只有两个取值,非此即彼,故将属性总体的 标志称为“交替标志”或“是非标志”。 ► 交替标志也可以计算平均数(即成数)和标 准差。为了计算交替标志的平均数和标准差 必须将交替变异的标志过渡到数量标志。 ► 交替标志仍以x表示,设:x =1表示单位具有 某一标志, x = 0表示单位不具有某一标志。 具有某一标志的单位数用N1表示;
电大 社会统计学 第七章 统计推断

(二)置信水平和置信空间
置信区间是在区间估计中,由样本统计量所构造的 总体参数的估计区间,它有估计量加减抽样误差构 成,我们将区间的最小值称为置信下限,区间的最 大值称为置信上限。 置信水平就是将构造置信区间的步骤重复很多次, 置信区间包含总体参数真值的次数所占的比例。
求置信区间的步骤
(四)区间估计
(三)样本均值抽样分布的特征
• 假设从容量N的总体中抽取容量为n的样本,其中总体的均值 为μ,方差为σ2,样本均值的数学期望为E( X ),方差为σ2x
三、样本比例的抽样分布
• 用π表示总体比例,用P表示样本比例。
第三节 参数估计
• 参数估计是统计推断的一个重要部分,它是用样本统计量推 断总体参数的过程。 • 参数估计可分为点估计和区间估计两种类型。 • 一、点估计 • 点估计就是直接用估计量作为总体参数θ的估计值。用样本均 值直接作为总体均值μ的估计值,用样本比例P直接作为总体 比例π的估计值,用样本方差直接作为总体方差的估计值 等。例如,随机样本的均值为6分,我们用6分直接作为总体 的估计值,认为这次考试总体平均分为6分,这就是点估计。
• 假设检验的基本思想可以用小概率原理解释。 • 小概率原理,就是在一次试验中小概率事件是几乎 不可能发生的。也就是说,如果我们对总体的某个 假设是真实的,那么极端值(不支持假设的事件) 是几乎不可能发生的。如果发生了,我们就有理由 怀疑这一假设的真实性,拒绝这一假设。
第四节 假设检验
• 二、虚无假设和替换假设
• (3)有效性。是指当总体参数的无偏估计不止一个统计量时, 标准差小的估计量更有效,标准差大的有效性就相对差。也 就是说,估计量与总体参数的离散程度也要较小。 • (4)充分性。是指一个容量为的样本统计量,是否充分反映 了全部个数据所反映总体的信息,这就是充分性。
社会统计学,卢淑华(第4版),第7,8章.pptx

假设检验的基本步骤
第1步:提出原假设和备择假设。 支持的命题为:备择假设 备择假设的对立面则为原假设 第2步:选择适当的检验统计量(test statistic) ,并 根据样本信息计算检验统计量的值
估计量-假设(H 0 )值 标准化检验统计量= 标准误差
第3步:选择显著性水平,确定临界值
总体参数的区间估计
用样本信息检验总体信息
第七章 假设检验 Hypothesis testing
一、假设检验的基本内容
(一)假设检验的基本思想 假设检验(hypothesis testing)是除参数估计之 外的另一类重要的统计推断问题。它的基本思想可以 用小概率原理来解释。所谓小概率原理,就是认为小 概率事件在一次试验中是几乎不可能发生的。也就是 说,如果对于总体的某个假设是真实的,那么不利于 或不可能支持这一假设的小概率事件A在一次试验中 几乎是不可能发生的,要是一次试验中事件A竟然发 生了,我们就有理由怀疑这一假设的真实性,拒绝这 一假设。
原假设 H0 原假设(null hypothesis)通常是研究 者想收集证据予以反对的假设,也称为 零假设,用表示。一般来说,原假设建 立的依据都是已有的、具有稳定性的, 从经验看,没有发生条件的变化,是不 会被轻易否定的。换句话讲,进行假设 检验的基本目的,就在于作出决策:接 受原假设还是拒绝原假设。
临界值计算 比较判断
由于 z 2.77 z 1.645
故不能拒绝原假设。
例6(P251) H0:μ≤20
右侧检验 H1:μ>20 假设设定
分析:正态总体,方差未知,小样本
统计量选择
统计量计算
23.5 20 t 3.5 s/ n 3/ 9
x 0
社会统计学(卢淑华),第七章

3、给出小概率 4、用样本统计量的观测值进行判断
例:某地收入水平调查状况如下:x 870 s 21 n 50 问:该地上报的平均收入为880元是否 可信?(显著性水平为 0.05)
(二)两类错误 1、弃真错误: 把一次观测中出现在拒绝域的小概率事件 当作对原假设的拒绝,此时会发生。犯错 误的大小为 2、纳伪错误:
在接受原假设时犯的错误,犯错误的概率 为 。 0 越小, 数值越大
2
拒绝 H 0 ;反之接受 2)单边检验
H
0
右侧:只有当样本计算统计量的值过大:
z z 才会落入拒绝域;如果 z z 接受。
左侧: pz z
三、假设检验的步骤不两类错误
其分布
0
3、假设检验的基本原理: 小概率原理: 1)小概率事件是在一次观察中是不可能出现的事 件。 2)如果在一次观察中出现了小概率事件,那么, 合理的想法是否定原有事件具有小概率的说法。 假设检验思想在统计学中的描述:经过抽样获得 一组数据(即样本):根据样本计算的统计量, 如果:原假设成立的条件下几乎不可能发生的, 就拒绝或否定原假设;如果在原假设成立的条件 下,根据样本计算的统计量发生的可能性不是 小,则接受。
第七章 假设检验的基本概念
一、统计假设 1、统计假设:
收集资料的范围仅是全体的一部分,是一 个随机样本,那么,这种和抽样手段联系 在一起,并且依靠抽样数据进行验证的假 设,即统计假设。
2、原假设和备择假设
1)原假设(虚无假设或解消假设)H 0 : 根据已有资料周密考虑后确定 2)备择假设(研究假设)H 1 : 原假设的逻辑对立假设 三种形式:单边(左、右) 双边
统计学 第 七 章 相关与回归分析

(一)回归分析与相关分析的关系
回归分析与相关分析是研究现象 之间相互关系的两种基本方法。
区别:
1、相关分析研究两个变量之间相关的 方向和相关的密切程度。但是相关分析不 能指出两变量相互关系的具体形式,也无 法从一个变量的变化来推测另一个变量的 变化关系。
2、按研究变量多少分为单相关和 复相关
单相关即一元相关,亦称简单相 关,是指一个因变量与一个自变量 之间的依存关系。复相关又称多元 相关,是指一个因变量与两个或两 个以上自变量之间的复杂依存关系。
3、按相关形式分为线性相关和非 线性相关
从相关图上观察:观察的样本点的 分布近似表现为直线形式,即观察点近 似地分布于一直线的两边,则称此种相 关为直线相关或线性相关。如果这些样 本点近似地表现为一条曲线,则称这种 相关为曲线相关或非线性相关(curved relationship).
不确定性的统计关系 —相关关系
Y= f(X)+ε (ε为随机变量)
在这种关系中,变量之间的关系值 是随机的,当一个(或几个)变量的值 确定以后,另一变量的值虽然与它(们) 有关,但却不能完全确定。然而,它们
之间又遵循一定的统计规律。
相关关系的例子
▪ 商品的消费量(y)与居民收入(x)
之间的关系
▪ 商品销售额(y)与广告费支出(x)
▲相关系数只反映变量间的线性相关程度,不 能说明非线性相关关系。
▲相关系数不能确定变量的因果关系,也不能 说明相关关系具体接近于哪条直线。
例题1: 经验表明:商场利润额与 其销售额之间存在相关关系。下表为 某市12家百货公司的销售额与利润额 统计表,试计算其相关系数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
20
• 拒绝H0,接受H1。 我们要么作出了正确的判断, 要么所犯错误为显著度(p)。
这是研究者最想看到的情况:我们提出的研究假设 被证实了,即便犯错误,错误也很小。
21
(三)H0与真实情况不符合。不拒绝H0。 • 真实情况不是H0 假定的情况。但是样本值出现的 概率不小。没有办法根据小概率的原则拒绝H0 , 只好认为H0的情况是有可能真实的,此时,我们 会犯错误:乙种误差(β)。
6
例子:
研究假设H1:同意人数≠反对人数(P ≠ Q) 虚无假设H0 :同意人数=反对人数(P = Q) 随机样本的情况是p ≠ q。(n=10,r=9) 根据H0成立二项抽样分布: 得:p(9)=0.010 随机样本的情况在H0假设的总体中出现概率很小, 因此否定H0 ,转而认为H1可能正确。 结论:总体的情况是同意人数≠反对人数。
第三篇
统计推论:单变量与双变量
1
• 第五章:抽样与统计推论 • 第六章:参数值的估计
• 第七章:假设检定:均值与百分率
• 第八章:假设检定:两个变量的相关
2
第一节 基本知识
一、研究假设(H1)与虚无假设(H0) 二、否定域与显著度 三、一端检定与两端检定 四、甲种误差与乙种误差 五、参数检定法与非参数检定法
29
六、检定假设的步骤
一般步骤:
①根据研究假设(H1),写出虚无假设(H0)。 ②选择适当的检定法,并列举相关要求。 ③确定抽样分布,根据H0的假定成立抽样分布。 ④决定显著度,并依据H1的性质选择一端或两端假 定,从抽样分布中计算否定域的大小和位置。 ⑤根据样本资料计算检定值。从而做出决策(是否 拒绝H0),得出结论。
14
同样的显著度下, 两端检定比一端检定更难否定H0。
15
选择一端或两端检定的原则:
• 研究假设可以定出方向就使用一端检定,
如果H1:P>Q,则使用二项分布的右端 如果H1:P<Q,则使用二项分布的左端
• 不能定出方向则使用两端检定。 H Nhomakorabea:P ≠ Q
16
四、甲种误差和乙种误差
• 当我们用样本统计值来检验假设的时候,无论是 否接受H0,都可能犯错误。 • 如果我们否定H0 ,但是实际上H0是对的,那么我 们就会犯甲种误差(α)(又称第一类误差)。这个 可能性就是我们选择的显著度。
提问:能不能根据这个结果证明研究假设正确呢?
• 因为这个结果的出现, ①既可能因为总体情况就是如此, ②也可能是因为抽样误差造成的:总体中同意和不 同意的人数相同,但是我们抽取的样本中却不同。
5
假设检定的原理
• 假设检定的基本原则是直接检定H0,从而间接检 定H1。检定H0的目的是排除抽样误差的可能。 原理: ①根据H0成立抽样分布,检测随机样本的情况在这 种分布中出现的概率的大小。 ②如果概率较小则否定H0,转而认为H1可能正确; 如果概率不那么小,则不能否定H0,那么则认为 H1可能不正确。
3
一、研究假设和虚无假设
• 研究假设(H1):研究者提出来的假设。我们的 最终目的是要检验这个假设是否成立。 • 虚无假设(零假设)(H0):与研究假设对立的 假设,是我们直接进行检验的假设。我们通过检 验这个假设来间接检验研究假设。 • 检验虚无假设的目的是为了排除抽样误差。
4
例子:
• 研究假设H1:同意人数≠反对人数(P ≠ Q) • 随机样本的情况是p ≠ q。
• 纳伪的错误。
22
(四)H0与真实情况符合。不拒绝H0。 • 样本值在H0的总体出现的概率不小。样本有可能 就是在H0的总体中抽出的,因此接受H0 。我们据 此怀疑H1 ,就是正确的。 • 然而在总体未知的情况下,我们不知道总体的情 况是哪一种情况,接受H0,只能说明的H0总体中 可能抽出这样的样本, H1的总体中也能抽出这样 的样本,我们无法判断,样本更能代表哪一种总 体。
11
12
显著度(p):
• 否定域在整个抽样分布中所占的比例。 • 也就是在H0的抽样分布中,抽出现有样本的可能性。 • 社会学研究中常用的显著度是p ≦0.05,有时也使 用p ≦0.01。 • 显著度越小,越难否定H0,也就越难证明H1是正 确的。
13
三、一端检定和两端检定
• 在检定虚无假设时, 选择抽样分布的一 端作为否定域,叫 做一端检定(单尾 检定)。 • 选择抽样分布的两 端作为否定域,叫 做两端检定(双尾 检定)。
30
23
不拒绝H0, 要么正确,但是对总体仍然认识不清。 要么所犯错误未知(β)。
24
25
两种误差之间的关系
• 在样本量和统计方法确定的前提下,甲种误差和 乙种误差是对立的,成反比。 • 在研究时要减少否定正确(弃真)的可能性(甲 种误差)就会增加接受错误(纳伪)的可能性。
• 要完全消除两种误差的矛盾是不可能的,但是增 大样本量可以在一定程度上同时减少两种误差。
• 相反,如果我们不能否定H0 ,但是实际上H0是不 对的,我们所犯的错误称为乙种误差(β)(又称 第二类误差)。
17
真实情况:未知 研究假设H1 虚无假设H0
• 检验H0有四种结果: 考察①H0是否为真实情况(是与否), 和②对待H0的两种态度(拒绝和不拒绝)
18
假设检定的四种结果
(一)H0与真实情况不符合。拒绝H0。
9
二、否定域和显著度
这个事先选定的,用来否定H0的范围叫做否定域。
这个否定域占整个抽样分布的比例就是我们所说的 “小到这个程度”,这个比例叫做显著度(p)。
10
否定域(CR)
• 在抽样分布一端或者两端的小区域,如果样本的 统计值在此区域范围内,则否定虚无假设。 • 否定域是一端还是两端取决于研究假设的性质。
• 否定H0就是排除了抽样误差的可能。即:在H0假 定的总体中出现样本值的概率很小,我们根据小 概率原则否定了它,是正确的。
• 此时我们认为研究假设H1可能是正确的(反映了 总体的情况。)
19
(二)H0与真实情况符合。拒绝H0。 • 真实情况是H0 假定的情况。否定了H0 ,即样本 的值有可能恰巧从这样总体中抽出来的,概率虽 然很小,但还是发生了。否定了这种情况,我们 就会犯错:甲种误差。 • 在总体中抽出这样的样本的概率最大不会超过我 们选定的显著度。因此甲种误差最大值是显著度 (α≤p)。 • 弃真的错误。
• 非参数检定法(分布自由检定法) :这类统计
推论的方法不要求总体具备特殊条件。也不要求 定距变量,因此可以推论定类或者定序资料。 (χ²)
28
选择检定法的原则: • 总体如果具备某些条件,最好使用参数检定法, 这样检定力比较高。 • 总体如果不具备这些条件,最好使用非参数检定 法。 • 但只要样本量足够大,两类检定法的检定力都会 增大。
26
五、检定力:参数法和非参数法
统计法的检定力: 该统计法能够准确判断虚无假设正误的能力。
• 统计推论时,甲种误差的大小是确定的,因此检 定力的大小取决于乙种误差的大小:统计推论时 所犯的乙种误差越小,该统计法的检定力就越大。
27
• 参数检定法:这类统计推论的方法要求总体备
具某些条件。一般要求定距变量。(Z/t/F) 统计法要求总体具备的条件越多,检定力就越强。 但如果总体不符合这些条件,检定力就大大下降。
7
如果:n=10,r=7 那么,p(7)=0.117 • 我们有11.7%的可能性在H0假定的总体中抽出这 样的样本,这个概率并不太小,因此我们不能够 否定H0 ,因此要怀疑H1的正确性. • 结论:我们不能认为总体中同意人数≠反对人数 (P ≠ Q)
8
样本在H0的抽样分布下,出 现的概率要小到什么程度才能 否定H0呢?