统计学概论05
统计学 第五章习题 正确答案

第五章 概论与概率分布重点知识1.样本、样本空间、随机事件的定义;2.事件的运算:交、并、对立事件、互斥事件;3.概论的定义:古典定义、统计定义、经验定义;4.概率的计算:加法公式,乘法公式,条件概率,事件的独立性,全概率公式,贝叶斯公式; 5.随机变量的定义,有几种类型;6.离散型随机变量及其分布的定义与性质,数学期望与方差:重点了解二项分布及其简单性质; 7.连续型随机变量及其分布的定义与性质,数学期望与方差:重点了解正态分布及其简单性质,会根据标准正态分布计算任何正态分布随机变量的概率;复习题一、填空1.用古典法求算概率.在应用上有两个缺点:①它只适用于有限样本点的情况;②它假设 。
2.若事件A 和事件B 不能同时发生,则称A 和B 是 事件。
3.在一副扑克牌中单独抽取一次,抽到一张红桃或爱司的概率是 ;在一副扑克牌中单独抽取一次,抽到一张红桃且爱司的概率是 。
4.甲、乙各射击一次,设事件A 表示甲击中目标,事件B 表示乙击中目标,则甲、乙两人中恰好有一人不击中目标可用事件 表示.5.已知甲、乙两个盒子里各装有2个新球与4个旧球,先从甲盒中任取1个球放入乙盒,再从乙盒中任取1个球,设事件A 表示从甲盒中取出新球放入乙盒,事件B 表示从乙盒中取出新球,则条件概率P(B A )=__.6.设A,B 为两个事件,若概率P (A )=41,P(B)=32,P(AB)=61,则概率P(A+B)=__.7.设A,B 为两个事件,且已知概率P(A)=0.4,P(B)=0.3,若事件A,B 互斥,则概率P(A+B)=__. 8.设A,B 为两个事件,且已知概率P(A)=0.8,P(B)=0.4,若事件A ⊃B ,则条件概率P(B A )=__. 9.设A,B 为两个事件,若概率P(B)=103,P(B A )=61,P(A+B)=54,则概率P(A)=__.10.设A,B 为两个事件,且已知概率P(A )=0.7,P(B)=0.6,若事件A,B 相互独立,则概率P(AB)=__. 11.设A,B 为两个事件,且已知概率P(A)=0.4,P(B)=0.3,若事件A,B 相互独立,则概率P(A+B)=__. 12.设A,B 为两个事件,若概率P(B)=0.84,P(A B)=0.21,则概率P(AB)=__. 13.设离散型随机变量X 的概率分布如下表ccccPX 4322101-则常数c =__.14.已知离散型随机变量X 的概率分布如下表414121P321X则概率P {3<X }=__.15.已知离散型随机变量X 的概率分布如下表6632P213-X11则数学期望)(X E =__.16.设离散型随机变量X 服从参数为p 的两点分布,若离散型随机变量X 取1的概率p 为它取0的概率q 的3倍,则方差)(X D =__.17.设连续型随机变量的概率X 密度为⎪⎩⎪⎨⎧<<-=其他,0210,1)(2x x k x ϕ 则常数k =__.18.设连续型随机变量X 的概率密度为⎩⎨⎧≤≤=其他,00,24)(2rx x x ϕ 则常数r =__.19.已知连续型随机变量X 的概率密度为⎪⎩⎪⎨⎧≥=-其他,00,2)(2x xex xϕ 则概率}11{<<-X P =__.20.已知连续型随机变量X 的概率密度为⎪⎩⎪⎨⎧≤≤=其他,021,2)(2x x x ϕ 则数学期望)(X E =_____.21.设X 为随机变量,若数学期望1)12(=-X E ,则数学期望)(X E =__.22.设X 为随机变量,若方差3)63(=-X D ,则方差)(X D =__.二、单项选择1.设A,B 为两个事件,若事件A ⊃B ,则下列结论中( )恒成立.(a)事件A,B 互斥 (b)事件A,B 互斥 (c)事件A ,B 互斥 (d)事件A ,B 互斥 2.设A,B 为两个事件,则事件B A +=( ).(a)A +B (b)A-B (c)A B (d)AB3.投掷两颗均匀骰子,则出现点数之和等于6的概率为( ).(a)111 (b)115 (c)361 (d)3654.盒子里装有10个木质球与6个玻璃球,木质球中有3个红球、7个黄球,玻璃球中有2个红球、4个黄球,从盒子里任取1个球.设事件A 表示取到玻璃球,事件B 表示取到红球,则条件概率P(A B )=( ).(a)114 (b)74 (c)83 (d)535.设A,B 为两个事件,若概率P(A)=31,P(A B )=32,P(A B )=53,则概率P(B)=__.(a)51 (b)52 (c)53 (d)546.设A,B 为两个事件,且已知概率P(A)>O ,P(B)>0,若事件A ⊃B,下列等式中( )恒成立.(a)P(A+B)=P(A)+P(B) (b)P(A-B)=P(A)-P(B)(c)P(AB)=P(A)P(B) (d)P(B A )=17.设A,B 为两个事件,则概率P(A+B)=( ).(a)P(A)+P(B) (b)P(A)+P(B)-P(A)P(B)(c)1-P (B A ) (d)1-P( A )P(B ) 8.设A,B 为两个事件,若概率P(A)=31,P(B)=41,P(AB)=121,则( ).(a)事件A 包含B (b)事件A ,B 互斥但不对立 (c)事件A ,B 对立 (d)事件A ,B 相互独立 9.设A,B 为两个事件,且已知概率P(A)=53,P(A+B)=107,若事件A,B 相互独立,则概率P(B)=( ).(a)161 (b)101 (c)41 (d)5210.设A,B 为两个事件,且已知概率P(A)>O ,P(B)>O ,若事件A,B 相互独立,则下列等式中( )恒成立.(a)P(A+B)=P(A)+P(B) (b)P(A+B)=P(A) (c)P(A-B)=P(A)-P(B) (d)P(A-B)=P(A)P(B )11.中( )可以作为离散型随机变量X 的概率分布.(a)6321-P321X11 (b)653-21P321X1(c)6321P321X 11 (d)65321P321X 112.已知离散型随机变量X 的概率分布如下表52511015110142101PX-则下列概率计算结果中( )正确.(a)0}3{==X P (b)0}0{==X P . (c)1}1{=->X P (d)1}4{=<X P13.设离散型随机变量X 的所有可能取值为-1与l ,且已知离散型随机变良X 取-1的概率为)10(<<p p ,取1的概率为q ,则数学期望=)(2X E ( ).(a)O (b)l (c)p q - (d)2)(p q - 14.设连续型随机变量X 的概率密度为⎪⎩⎪⎨⎧≥+=其他,00,1)(2x x kx ϕ 则常数k =( ).(a)π1(b)π (c)π2(d)2π15.下列函数中( )不能作为连续型随机变量X 的概率密度.(a)⎩⎨⎧≤≤-=其他,001,3)(2x x x f (b)⎪⎩⎪⎨⎧≤≤-=其他,021,2)(x x x g(c)⎪⎩⎪⎨⎧≤≤=其他,020,cos )(πx x x h (d)⎪⎩⎪⎨⎧≤≤=其他,02,sin )(ππx x x h 16.设X 为连续型随机变量,若b a ,皆为常数,则下列等式中( )非恒成立.(a)}{}{a X P a X P ==≥ (b)}{}{b X P b X P <=≤ (c)1}{=≠a X P (d)0}{==b X P 17.已知连续型随机变量X 的概率密度为⎪⎩⎪⎨⎧<<=其他,040,81)(x x x ϕ 则数学期望)(X E =( ).(a)21 (b)2 (c)83 (d)3818.设X 为随机变量,若数学期望)(X E 存在,则数学期望))((X E E =( ).(a)O (b))(X E (c))(2X E (d)2))((X E 19.设X 为随机变量,若方差)(X D =4,则方差)43(+X D =( ).(a)12 (b)16 (c)36 (d)4020.设X ,Y 为随机变量,已知随机变量X 的标准差等于4,随机变量Y 的标准差等于3,若随机变量X ,Y 相互独立,则随机变量X -Y 的标准差等于( ).(a)1 (b)7 (c)5 (d)7四、名词解释1、 数学期望:2、 对立事件:3、 随机事件:4、 事件和:5、 事件积:6、 互斥事件:7、 互相独立事件:五、判断题1.对于连续型随机变量,讨论某一点取值的概率是没有意义的。
统计学概论

统计学概论统计学是一门研究数据收集、整理、分析和解释的学科。
它为我们理解和解释数据的特征,以及数据之间的关系提供了有力的工具和方法。
这门学科在各个领域中具有极其重要的作用,既能揭示现象背后的规律,又能为决策提供科学依据。
统计学的重要性在于它能够帮助我们理解和解释现实世界的数据。
不论是社会科学、自然科学、医学、经济学还是工程学,统计学都扮演着非常重要的角色。
通过分析数据,我们能够揭示数据之间的关系、趋势和模式,从而为决策制定提供科学依据。
总体和样本是统计学中的重要概念。
总体是指我们想要了解和研究的整个群体或现象,而样本是从总体中抽取出来的一部分数据。
通过对样本进行研究和分析,我们可以推断出对总体的结论。
在统计学中,数据可以分为定量数据和定性数据。
定量数据是可以进行数值度量的,如身高、年龄、收入等;定性数据则是用于描述特征或属性的,如性别、颜色、评级等。
为了有效地处理数据,我们需要将其进行分类,并选择合适的统计方法和技术进行分析。
概率是统计学中另一个重要的概念。
概率是用来描述事件发生的可能性的度量。
通过概率理论,我们可以量化不同结果的可能性,并进行推断和预测。
概率在统计学的假设检验、推断和预测中起着关键作用。
统计学提供了多种方法和技术来处理数据。
描述统计学旨在通过总结和可视化数据来了解数据的特征和分布。
它包括均值、中位数、标准差、频率分布等。
推断统计学则通过对样本数据进行推断,从而对总体进行估计和推断。
常用的推断统计学方法包括置信区间和假设检验。
回归分析是统计学中广泛应用的技术之一。
它通过建立变量之间的关系模型,来研究自变量对因变量的影响程度和方向。
回归分析可以用于预测和解释数据之间的关系,帮助我们理解变量之间的因果关系。
方差分析是一种用于比较多个样本之间差异的统计技术。
它可以用于确定不同因素对数据的影响程度,例如比较不同处理组与对照组的效果是否显著。
方差分析广泛应用于实验设计和社会科学研究中。
除了这些方法外,统计学还包括时间序列分析、聚类分析、因子分析等其他技术和方法。
05087统计学概论

一.统计调查的意义?1.统计调查是认识世界和社会的有力工具;2.统计调查是统计工作过程的基础;3.统计调查理论和实践方法在统计原理中占有重要地位;二.标志变异指标的作用?1.评价平均指标代表性;2.反映数据分布的分散程度。
三.类型抽样与整群抽样的区别?1. 类型抽样是在所分的各类进行抽样,抽样单位仍然是总体单位;2. 整群抽样是只抽取部分群,并在抽中的群内进行全面调查。
四.统计标志与统计指标的区别及联系?区别:1. 标志是说明总体单位特征的,而指标是说明总体特征的;2. 标志中的品质标志是用文字来描述的,不能用数值表示,而指标都能用数字表示;3. 标志中的数量标志不一定经过汇总,可直接取得,而指标数值是经过一定的汇总得到的;4. 标志一般不具备时间、地点等条件,但作为一个完整的指标一定要讲时间、地点、范围;联系:1.大多数指标的数值是从总体单位的数量标志综合而来的,既可指总体各单位标志值的总和,也可指总体单位数的总和;2.两者之间存在着一定的变换关系;五.影响抽样平均误差或极限误差的因素?1.总体变量的变动程度;2.样本的容量N;3.抽样方法;4.抽样的组织形式;六.编制时间序列要遵守的基本原则?1.时间长短应该相等;2.总体范围要一致;3.经济内容要一致;4.计算方法要一致;七.时期指标与时点指标的区别?1.时期指标的值是通过连续记录并累计而得到的,时点指标的值不是连续记录的,而是间断的;2.时期指标具有累加性,时点指标则不具有累加性,相加是没有意义的;3.时期指标值的大小与时间长短有直接关系,面时点指标值的大小与时间长短没有直接关系;八.抽样推断有那些主要的特点?1.以部分单位的数量特征去推断总体的数量特征;2.抽样时必须遵守随机原则;3.抽样推断是具有一定概率保证的估计和推断;4.抽样推断的误差可以计算并加以控制;九.编制时间序列要遵守的基本原则?1.时间长短应该要一致;2.总体范围要一致;3.经济内容要一致;4.计算方法要一致;十.相对指标具有那些重要的作用?1.表现出各种事物发展之间的比例关系,确切地反映事物发展绩效;2.对于一些不能直接对比的事物,采用相对指标能找到比较的基础;3.相对指标便于记忆、易于保密;十一.国民经济核算的作用有那些?1.是反映国民经济运行状况的有效工具;2.可以有效地协调经济统计,并在一定程度上起到数据检验的作用;3.是制定和检验宏观经济政策的重要依据;4.是进行国际比较的工具;5.影响到我国的经济利益和政治利益,关系到党和政府的声誉;二.统计分组的含义及其作用?1.含义:根据统计研究的目的和要求以及总体的内在差异,按照其一标志将社会经济现象总体区分为若干部分或若干组的方法;2.作用:划分现象的类型;提示现象内部结构;分析现象之间的数量依存关系;三.构成时间序列的两个要素及作用?1.两个要素:①资料所属的时间;②各个时间上的统计指标数值;2.作用:①可以反映社会经济现象的发展状况和水平;②可以对相互联系的数列进行对比分析或相关分析;③可以研究社会经济现象的发展速度\趋势\规律等;四.统计调查方案包括的内容?1.确定调查目的;2.确定调查对象和调查单位;3.确定调查项目和调查表;4.确定调查时间\期限\和地点;5.制定调查的组织实施计划;五.统计指数的作用有那些?1.分析现象复杂经济总体的变动方向和程度;2.分析现象总量指标的总变动中受各个因素变动的影响方向和程度;3.分析现象平均指标的总变动中受各个因素变动的影响方向和程度;4.利用指数间的数量关系,进行各种推算;六.正确选择分组标志定义及原则?1.定义:分组标志是统计分组的依据,正确选择分组标志,能使分组作用得以充分发挥,也是使统计研究获得正确结论的前提;2.原则:①根据研究问题的目的来选择;②要选择能够反映事物本质或主要特征的标志;③要结合历史条件和经济条件来选择;七.变量的定义及种类?1.定义:变量是说明现象某种特征的概念;2.种类:分类变量\顺序变量\数值变量; 按性质不同分为:确定性变量和随机变量;八.统计指标体系包括那些内容?1.反映经济循环账户的指标体系;2.反映国内生产总值的指标体系;3.反映投入产出核算的指标体系;4.反映资金流量核算的指标体系;5.反映资产负债核算的指标体系;6.反映国际收支核算的指标体系;九.平均指标有什么作用?1.对于由于条件不同引起的不可直接对比的同类事物,通过平均指标可进行对比;2.用来作为评价的一种数量标准或者参考;3.用来分析事物之间的关系,进行数量上的估算和预测;十.抽样推断的作用有哪些?1.能完成其他统计调查形式无法或很难完成的任务;2.可以对全面调查的结果加以补充或订正;3.可以对生产过程中的产品质量进行经常性的检查和控制;4.对于资料信息的时效性要求很强的现象往往采用抽样推断;5.可以对于某种总体假设进行检验,并判断这种假设的真假;一.什么是总体和总体单位?说明两者的关系?1.总体:是指客观存在\在同质基础上结合起来的许多个别单位的整体,总体具有同质性;2.总体单位:是构成总体的各个单位,是统计所研究的属性和特征的原始\直接\具体的承担者;3.总体与总体单位的划分是相对的,它们会随着统计研究对象和研究目的的变化而相互转化;二.为什么抽取样本要遵从随机原则?1.保证每个总体单位都以相同的机会被抽中;2.保证总体内各单位的分布是均匀的;3.符合概率论中的大数定律;三.国民经济核算体系的基本框架?1.由基本核算表、国民经济账户、附属表三部分构成2.基本核算表包括:国内生产总值表、投入产出表、资金流量表,国际收支表,资产负债表等;3.国民经济帐户包括:总体账户、国内机构部门账户、国外部门账户等;4.附属表包括:自然资源实物量核算表、人口资源与人力资本实物量核算表等;四.强度相对数与平均指标有什么区别?1.强度相对数是两个性质不同但是存在一定联系的指标的对比,用来反映事物的强度、密度和普遍程度;2.平均指标是将总体单位某一变量值的具体差异抽象化,用以反映总体在具体条件下的一般水平;五.定基发展速度与环比发展速度的关系?1.定基发展速度等于环比发展速度的连乘积,但环比增长速度的连乘积并不等于定基增长速度,所以两种增长速度之间不能直接进行数量上的相互推算。
最新大学统计学原理经典课件第五章统计指数教学课件

2021/4/18
19
例如:研究多种商品销售量和销售价格的综合 变动情况
当研究销售量的变动时,销售量是指数化指标,则 与之相联系的质量指标——价格,就是同度量因素。
∑(商品销售量× 商品销售价格) = 商品销售总额
所研究的指数化指标 同度量因素 价值量指标
指数等。
2021/4/18
13
(二)按照统计指标的内容不同分为数 量指标指数和质量指标指数。
数量指标指数——简称数量指数,主要是 说明总体规模变动情况的指数,例如商品 销售量指数、工业产品产量指数等等。
质量指标指数——简称质量指数,是指综 合反映总体内涵变动情况的指数,例如物 价指数、产品成本指数等等。
进 入 夏 天 ,少 不了一 个热字 当头, 电扇空 调陆续 登场, 每逢此 时,总 会想起 那 一 把 蒲 扇 。蒲扇 ,是记 忆中的 农村, 夏季经 常用的 一件物 品。 记 忆 中 的故 乡 , 每 逢 进 入夏天 ,集市 上最常 见的便 是蒲扇 、凉席 ,不论 男女老 少,个 个手持 一 把 , 忽 闪 忽闪个 不停, 嘴里叨 叨着“ 怎么这 么热” ,于是 三五成 群,聚 在大树 下 , 或 站 着 ,或随 即坐在 石头上 ,手持 那把扇 子,边 唠嗑边 乘凉。 孩子们 却在周 围 跑 跑 跳 跳 ,热得 满头大 汗,不 时听到 “强子 ,别跑 了,快 来我给 你扇扇 ”。孩 子 们 才 不 听 这一套 ,跑个 没完, 直到累 气喘吁 吁,这 才一跑 一踮地 围过了 ,这时 母 亲总是 ,好似 生气的 样子, 边扇边 训,“ 你看热 的,跑 什么? ”此时 这把蒲 扇, 是 那 么 凉 快 ,那么 的温馨 幸福, 有母亲 的味道 ! 蒲 扇 是 中 国传 统工艺 品,在 我 国 已 有 三 千年多 年的历 史。取 材于棕 榈树, 制作简 单,方 便携带 ,且蒲 扇的表 面 光 滑 , 因 而,古 人常会 在上面 作画。 古有棕 扇、葵 扇、蒲 扇、蕉 扇诸名 ,实即 今 日 的 蒲 扇 ,江浙 称之为 芭蕉扇 。六七 十年代 ,人们 最常用 的就是 这种, 似圆非 圆 , 轻 巧 又 便宜的 蒲扇。 蒲 扇 流 传 至今, 我的记 忆中, 它跨越 了半个 世纪, 也 走 过 了 我 们的半 个人生 的轨迹 ,携带 着特有 的念想 ,一年 年,一 天天, 流向长
统计学概论高教版教学课件完整版

统计具有具体性特点。
社会性
社会经济统计以社
会经济现象作为研究
对象,有明显的社会
性的特点;社会经济
统计本身也是一种社会实践活
动,更具备社会性的特征。
第一章 总论
四、统计的认识过程
统计作为一种认识活动,其认识过程可以从两个方面来理解。
另一方面,从个体与总体的关系看,
统计的认识过程是从对个体数量的认
统计学概论
第一章 总论
第一章 总论
【学习目标】
★知识点
了解统计发展简史、“政治算术学派”;理解统计研究的对象、社会
经济统计的特点、统计研究的具体方法;掌握统计的含义、统计工作
过程、统计的基本职能、统计学的几个基本概念。
★能力点
知道如何采用大量观察法进行研究;了解标志、指标之间的区别和联
系;会结合现实中遇到的具体事例说明总体、总体单位、标志、指标、
特勒
(A.Quetelet,17961874)。其代表作有
《社会物理学》。凯特
勒把概率论引入统计学,
使统计方法在准确性方
面有了质的跃进
19世纪下半叶,德国人
克尼斯和梅尔在继承政
治算术学派和在凯特勒
的影响下创立了社会统
计学派,社会统计学派
的代表人物还有恩格尔。
社会统计学派认为统计
学是一门实质性的社会
科学
统计咨询职能是指统计具有提
供咨询意见和对策建议的服务
功能,也就是指统计部门利用
所掌握的大量的统计信息资源,
经过进一步地分析、综合、判
断,为宏观、微观决策,为科
学管理提供咨询意见和对策建
议。统计咨询分为有偿咨询和
无偿咨询两种。统计咨询应更
统计学原理第5章

Nn = 42
=16 (个样本)
不重复抽样
N(N-1)(N-2)……. 4×3 = 12(个样本)
AB、AC、AD、
BA、BC、BD、
CA、CB、CD、
DA、DB、DC
第二节
抽 样 误 差
一、抽样误差的含义
1
1
1
1
0
P=0.8
p =0.4
抽样平均数平均误差的计算方法
采用重复抽样:
x
n
此公式说明,抽样平均误差与总体标准差成正比, 与样本容量成反比。(当总体标准差未知时,可 用样本标准差代替)
通过例题可说明以下几点: ①样本平均数的平均数等于总体平均数。 ②抽样平均数的标准差仅为总体标准差的
x
n 1 n N
x2f 1058400 830060 349920 270400 182250
495
445 540 420
1.1
1 0.9 0.8
544.5
445 486 336
269527.5
198025 262440 141120
合计
5
2531.5
1303113
合计
6
3911
2691030
x甲
xf f
1 n
③可通过调整样本单位数来控制抽样平均误差。
某电子产品使用寿命在3000小时以下为不合格品,从5000个产品 中抽取100件调查,结果如下: 求1:平均寿命的抽样平均误差. 2:求合格品率的抽样平均误差.
使用寿命(小时) 3000以下 3000-4000 4000-5000 5000以上 合计
《统计学概论》第五章课后练习题答案

《统计学概论》第五章课后练习题答案一、思考题1.什么叫时间序列,构成时间序列的基本要素有哪些?P1212.序时平均数与一般平均数有何异同?P1273.时间数列与时点数列有哪些区别?P124-1254.环比增长速度与定基增长速度之间有什么关系?P1365.什么是平均发展速度?说说水平法和累计法计算平均发展速度的基本思路,各在什么情况下选用?P1386.测定长期趋势有哪些常用的方法?测定的目的是什么?P1367.实际中如何根据时间序列的发展变化的数列特征来判断合适的趋势方程形式?P1458.影响时间序列指标数值大小的因素有哪些?这些因素共同作用的理论模型有哪些?P140二、判断题1.时间序列也称动态数列,它是变量数列的一种形式。
(×)【解析】时间序列是数列,而变量数列是静态数列。
2.时间数列和时点数列属于总量指标时间序列。
(√)3.所谓序时平均数是指将同一总体的不同时期的平均数按时间先后顺序排列起来。
(×)【解析】序时平均数是将不同时期的发展水平加以平均而得到的平均数。
4.间隔相等的时期数列计算平均发展水平时,应用首末折半法。
(×)【解析】间隔相等的时点数列计算平均发展水平时,应用首末折半法。
5.平均增长速度等于各期环比增长速度连乘积开n次方。
(×)【解析】平均发展速度等于各期环比发展速度连乘积开n次方,平均增长速度=平均发展速度-1(或100%)6.两个相邻时期的定基发展速度之比等于相应的环比发展速度。
(√)7.用移动平均法测定长期趋势时,移动平均项数越多越好。
(×)【解析】移动平均法所取项数的多少,应视资料的特点而定。
8.某一时间序列有25年的数据,若采用五项移动平均,则修匀后的数列缺少4项数据。
(√)9.如果时间序列是年度数据,则不存在季节变动。
(√)10.用相同方法拟合趋势方程时,t的取值不同,则得到的趋势方程也不同,但趋势预测值不变。
(√)三、单项选择题1.时间序列的构成要素是()。
统计学概论

1. 导论
统计学是一探讨如何搜集数据与分析数据的科学研究方法。
在不确定的状态下,藉由样本数据所提供的讯息,经归纳分析、推论检定、决策与预测等过程。
『以事实(数字)作决策』
2.1认识统计
◎自古以来,人类从事各项研究活动均是为求真理,亦是社会文明进步的原动力。
然而通往真理的路上充满混沌与挫折,如何厘清真相,统计学自然就成为一门极重要的科学研究工具。
◎统计学是由搜集数据、整理数据、分析数据及解释意义等规则与程序所组成。
◎统计学研究过程:。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5-18
总体标准差未知时对总体均值检验经常用t统 计量: X 0
t s n ~ t (n 1)
但是,在大样本场合(样本容量n大于30时), t-统计量与标准正态分布统计量近似,通常用 z检验代替t检验。
5-19
总体成数的检验
当样本容量较大时,下列统计量服从标准正 态分布:
z p n
5-26
z检验的p-值: z0 检验统计量为z统计量的p-值计算公式, 表示 检验统计量的抽样数据,则p-值的计算方法 如下: 如果:H 1 , 0 p-值=2 pz z0 如果:H 1 , 0 p-值= pz z 0 如果:H 1 , 0 p-值= pz z 0
5-11
二、参数检验
参数检验都是先对样本所属总体的性质作出 若干的假定,或对总体的分布形状加以限定, 然后对总体的有关参数情况进行统计假设检 验。因此,参数检验又称为限定分布检验。 如在总体服从正态分布条件下,对其均值进 行检验。下面通过具体例子来说明参数检验 方法。
5-12
在例1中,按历史资料,总体的标准差是4毫 升。我们通过检验总体均值是否等于250毫升, 来判断饮料厂商是否欺骗了消费者。程序如 下:
5-6
构造一个统计量来决定是“接受原假设,拒绝备选 假设”,还是“拒绝原假设,接受备选假设”。对 不同的问题,要选择不同的检验统计量。检验统计 量确定后,就要利用该统计的分布以及由实际问题 中所确定的显著性水平,来进一步确定检验统计量 拒绝原假设的取值范围,即拒绝域。在给定的显著 性水平α下,检验统计量的可能取值范围被分成两部 分:小概率区域与大概率区域。小概率区域就是概 率不超过显著性水平α的区域,是原假设的拒绝区域; 大概率区域是概率为1-α的区域,是原假设的接受区 域。
5-13
第一步:确定原假设与备选假设。 : H 0 : =250; H 1 <250 以上的备选假设是总体均值小于250毫升,因 为消费者协会希望通过样本数据推断出厂商 的欺骗行为(大于250毫升一般不会发生)。因 此使用左侧检验。
5-14
第二步:构造出检验统计量。 我们知道,如果总体的标准差已知,则正态 总体(正常情况下,生产饮料的容量服从正态 分布)的抽样平均数,也服从正态分布,对它 进行标准化变换,可得到:
5-25
三、p-值检验
p-值检验就是通过计算p-值,再将它与显著性 水平α作比较,决定拒绝还是接受原假设。所 谓p-值就是拒绝原假设所需的最低显著性水 平。p-值判断的原则是:如果p-值小于给定的 显著性水平α,则拒绝原假设;否则,接受原 假设。或者,更直观来说就是:如果p-值很 小,拒绝原假设,p-值很大,接受原假设。 请大家注意的是这里的p-值是指概率,不要 与成数指标相混淆。
5-38
(二)配对样本场合的符号检验
样本配对场合与单样本场合的符号检验,基 本原理是一致的。设从两个总体中分别抽出 一个容量相等的样本,然后将两样本的数据 进行一一配对,得到一组配对值。再将各对 配对值相减,记录下差数的符号,计算出“+” 的个数n+与“-”的个数n-。如果两个样本的总 体差异不显著,配对值之差的正负号出现的 概率各是1/2,则n+与n-应当非常接近;如果 n+、n-相差太大的话,说明两总体存在显著 差异。例子见书上的。
5-4
消费者协会实际要进行的是一项统计检验工 作。检验总体平均 =250是否成立。这就是一 个原假设(null hypothesis),通常用 H 0表示, 即: H 0 : =250
5-5
与原假设对立的是备选假设(alternative hypothesis) H 1,备选假设是在原假设被否定时 另一种可能成立的结论。备选假设比原假设 还重要,这要由实际问题来确定,一般把期 望出现的结论作为备选假设。
5-23
第四步:计算检验统计量的数值。 样本成数p=220/600=0.37,总体假设的成数ρ =0.3,代入z检验统计量得:
z p 0.37 0.3 0.3 1 0.3 / 600 3.5
1
n
5-24
第五步:判断。 检验统计量的样本取值z=3.5>1.645,落入拒 绝域。拒绝原假设,接受备选假设,认为样 本数据证明该企业声明属实。
1
上式中,ρ代表总体的成数,p代表样本的成 数。 以上的z统计量可以用作总体成数检验的检验 统计量。
5-20
例2:某企业声明有30%以上的消费者对其产 品质量满意。如果随机调查600名消费者,表 示对该企业产品满意的有220人。试在显著性 水平α=0.05下,检验调查结果是否支持企业 的自我声明。
5-21
解:第一步:作出假设。 H 0 :ρ =30%, H:ρ> 30%。 1 以上的备选假设是企业自我声明的结论,我 们希望该企业说的是实话。因此使用右侧检 :构造z检验统计量。 第三步:确定拒绝域。 显著水平α=0.05,查标准正态分布表得临界 值:z =1.645,拒绝域是z>1.645。
5-33
二、符号检验
该方法是建立在以正、负号表示样本数据与 假设参数值差异关系基础上的,因此称之为 符号检验。该方法既适用于单样本场合,也 适用于配对样本场合。
5-34
(一)单样本场合的符号检验
中位数检验 : H 0 : e =A M 样本每个数据都减去A,只记录其差数的符号。 n+与n-分别是正、负符号的个数,当原假设 为真是时 ,n+与n-应该很接近;若两者相差 太远,就有有理由拒绝原假设。
5-7
二、两种类型的错误
接受
H0
拒绝 H 0 弃真错误(第一 类错误或α 错误 )
H 0真实
判断正确
H 0 不真实
取伪错误(第二类 判断正确 错误或β错误)
5-8
三、检验功效
在犯第一类错误概率得到控制的条件下,犯 取伪错误的概率也要尽可能地小,或者说, 不取伪的概率1-β应尽可能增大。1-β越大,意 味着当原假设不真实时,检验判断出原假设 不真实的概率越大,检验的判别能力就越好; 1-β越小,意味着当原假设不真实时,检验结 论判断出原假设不真实的概率越小,检验的 判别能力就越差。可见1-β是反映统计检验判 别能力大小的重要标志,我们称之为检验功 效或检验力。
5-29
第五步:判断。 p-值小于给出的显著性水平(0.05),拒绝原假 设,接受备选假设,与例1的结论相同。
5-30
第三节 非参数检验
非参数检验是对总体的分布不作任何限制的 统计检验。故非参数检验又称为自由分布检 验。正因为如此,非参数检验成为管理科学 中应用较为广泛的一种统计检验方法。
5-9
第二节
总体参数检验
一、单侧检验与双侧检验
α/2 -Zα/2
1–α
α/2 Zα/2
α –Zα 0 0
α Zα
双侧检验
左侧检验
右侧检验
5-10
用单侧检验还是双侧检验,使用左侧检验还 是右侧检验,决定于备选假设中的不等式形 式与方向。与“不相等”对应的是双侧检验, 与“小于”相对应的是左侧检验,与“大于” 相对应的是右侧检验。
5-32
自由分布检验缺点: 由于它对原始数据中包含的信息利用得不够 充分,检验的功效相对较弱。当总体的分布 形式已知时,基于这种分布类型的参数方法, 一般说来比非参数方法为佳。例如,对于一 批资料,可同时适用于参数的t-检验、非参数 的符秩检验和符号检验。其检验功效是,t-检 验的最好,符秩检验次之,符号检验最差。 这主要是由于符号检验对信息的利用最不充 分。
e
5-37
第三步:确定拒绝域。 显著水平α= 0.10,由于进行双侧检验,拒绝域分布 在两边,每侧概率α/2=0.05,查二项分布临界值表, 得到拒绝域的临界值是13。 第四步:选择n+、n-较大者,再与临界值比较。 结果是15>13。 第五步:判断。 由于上一步的比较结果可知,样本落入拒绝域,所 以拒绝原假设,认为样本数据不能证明总体中位数 等于160件。
第五章 假设检验
第一节 假设检验概述 第二节 总体参数检验 第三节 非参数检验
5-1
第一节 假设检验概述
一、假设检验的基本概念 假设检验是统计推断的另一种方式,它与区 间估计的差别主要在于:区间估计是用给定 的大概率推断出总体参数的范围,而假设检 验是以小概率为标准,对总体的状况所做出 的假设进行判断。假设检验与区间估计结合 起来,构成完整的统计推断内容。假设检验 分为两类:一类是参数假设检验,另一类是 非参数假设检验。本章分别讨论这两类检验 方法。
5-2
小概率原理:即指概率很小的事件在一次试 验中实际上不可能出现。这种事件称为“实 际不可能事件”。
5-3
例1:消费者协会接到消费者投诉,指控品牌 纸包装饮料存在容量不足,有欺骗消费者之 嫌。包装上标明的容量为250毫升。消费者协 会从市场上随机抽取50盒该品牌纸包装饮品, 测试发现平均含量为248毫升,小于250毫升。 这是生产中正常的波动,还是厂商的有意行 为?消费者协会能否根据该样本数据,判定 饮料厂商欺骗了消费者呢?
5-35
例4:设有20个工人,他们一天生产的产品件 数,抽样结果如下: 168,163,160,172,162,168,152,153, 167,165,164,142,173,166,160,165, 171,186,167,170。 试以α=0.10的检验水平,判定总体中位数是 否是160。