统计学抽样方案复习过程

统计学抽样方案复习过程
统计学抽样方案复习过程

2006年海宁市公众科学素养调查抽样方案

一、调查目的、范围及对象

海宁地处中国长江三角洲南翼、浙江省北部,东距上海100公里,西离杭州60公里,南濒钱塘江,内陆面积近700平方公里,地势平坦,河流众多,水源丰富,是典型的江南水乡。海宁现辖8个镇,4个街道,总人口64万。 海宁经济发达,市场繁荣,是我国首批沿海对外开放县(市)之一,连续三届跻身“全国综合实力百强县(市)”行列,县域社会经济发展综合评价全国第19位,是浙江省首批“小康县(市)”之一。 海宁的目标是实现由小康向现代化的历史性跨越,到2010年建成经济文化强市。

提高公众科学文化素质,是实施科教兴国战略和可持续发展战略,是建设经济文化强市的重要内容之一。为深入地了解海宁市公众科学素养的状况,为政府和相关机构以及科普研究提供详尽的数据,海宁市科协决定于2006年6月至11月开展海宁市公众科学素养抽样调查。

● 本次调查的范围是海宁市包括:斜桥镇、许村镇、长安镇、周王庙镇、盐官镇、丁桥镇、袁花镇、黄湾镇、硖石街道、海洲街道、海昌街道、马桥街道。

● 本次调查对象是在海宁市境内居住半年以上,年龄在18~69岁的成年人(智力障碍者除外)。

● 本次调查的内容主要是了解海宁市公众的科学素养水平、获得科技知识的渠道、对科技发展的态度等方面的基本情况。

二、调查方案的设计

从数据上看,海宁市各地区的经济、文化等各方面差异不是很大。但非农业与农村的差异还是明显的。本次调查采用分层抽样三阶段的方法,各阶段的抽样单位如下:

第一阶段:海宁市所有镇及街道均入选为抽样单位;

第二阶段:以社区或村委会为二级抽样单位;

第三阶段:以家庭住户并在每户中确定1人为最终单位;

(一) 调查样本量的确定

● 样本量的定量分析:

纯净样本量是指去掉不合格或未回答的调查对象以后的剩余量,由于调查的结果主要是估计各种比例数据以及比例数据的之间的比较,所以在决定调查样本量时采用估计简单

随机抽样的总体比例时的样本量为基础,一般用公式22)1(d

p p u N -=α来计算,其中N 为纯净样本量,αu 为一定置信度下所对应的临界值,p 为样本比例,2d 为误差率。类似调查中,大多数取95%的置信度(即仍有5%的不确定性或5%的误差),本调查也采用95%的置信度,此时α

u =1.96,由于p 值较难估计,可采用保守策略,取5.0=p ,上述公式转化为

225.05.096.1d

N ??= 。一般误差率(最大允许绝对误差) d 取值为3%或更小。 ● 样本量的确定:

在95%的置信度下按抽样绝对误差不超过3%的要求进行计算,由于我们可能要计算各种比较的大小,所以没办法精确地估计p 的大小,采用保守策略,取5.0=p 计,即所应抽取样本量为:

22022(1) 1.960.50.510670.03

u p p n d α-??==≈ 根据经验,一般分层抽样的设计效应为1.8,故抽取总样本数为1920.6个(人),为了便于计算和分组,设定本次的样本量为1920个(人)。

(二) 抽样方法

考虑本项目所调查的地点仅为海宁市,所调查区域相对集中,并且海宁市所属的镇和街道只有12个分别为斜桥镇、许村镇、长安镇、周王庙镇、盐官镇、丁桥镇、袁花镇、黄湾镇、硖石街道、海洲街道、海昌街道、马桥街道。抽样方法采取分层的三阶段与人口成比例的PPS 概率抽样,即分层、多阶段概率与规模成比例系统抽样法。首先将海宁市按非农村人口和农村人口分为两个层,分层标准主要为居民性质(按海宁市科协所提供资料)。分层后,分别采用三级子抽样,即小层→社区或村→家庭户→人。

(三)分层

全市的镇和街道为一级抽样单元,共有12个基本单位。对第一阶段的抽样,全市各地区农村居民与非农村居民的科学水平差异较大,并且考虑到海宁市的具体情况,所以,将海宁市按非农村和农村分为两个层进行抽样。

● 农业与非农业人口的比例的确定

海宁市的非农业人口(即由海宁市科协提供的农村社区人口和城镇社区社区人口之和)与农业人口(即海宁市科协提供的农村人口)的比例为23.39:76.61。依据按比例抽样的原则,同时也兼顾可操作性,确定抽样时农业人口与非农业人口的样本数分别为:1464个(人)和456个(人)。现根据海宁市各镇或街道农业与非农业人口比例,确定非农业与农业的样本量比例如下:

(四)多阶抽样步骤:

1.初级抽样单位的抽选

全市的12个镇、街道均为初级抽样单位。

2.二级抽样单位的抽选

在各的街道、镇抽取若干个社区或村委会,由已经取得的社区和村的人口资料编号排序(随机进行,没有规定的先后次序)。然后用产生随机数的方法抽取社区或村。(可见表2,表3)。

4.三级抽样单位的抽选

将以上抽中的社区或村委会中所含居民户数编号排序。仍随机抽样法,从每个社区或村委会中抽取24或12户居民(具体样本的分配见下表3),将从社区中抽取的样本为非农业人口的代表,从村中抽到的样本为农业人口的代表。再用二维随机数表决定具体18-69岁(智力障碍者除外)的居民。

三、第二阶段抽样——街道和镇对社区和村的抽样

根据上述的抽样原则,确定抽取社区和村的个数如下:

利用海宁市科协提供的资料,按人口总数的PPS抽样,经发生随机数产生下面的样本社区和村。

第五章+统计学教案(假设检验)

第五章+统计学教案(假设检验)参数估计和假设检验是统计推断的两个组成部分,它们分别从不同的角度利用样本信息对总体参数 进行推断。前者讨论的是在一定的总体分布形式下,借助样本构造的统计量,对总体未知参数作出估计 的问题;后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证, 从而作出真假判断。通俗地、简单地说,前者是利用样本信息估计总体参数将落在什么范围里;而后者 则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。 通过本章学习,要求学生在充分理解有关抽样分布理论的基础上,理解掌握假设检验的有关基本概 念;明确在假设检验中可能犯的两种错误,以及这两种错误之间的联系;熟练掌握总体均值和总体成数 的检验方法,主要是 Z 检验和 t 检验;对于非参数的检验,也应有所了解,包括符号检验、秩和检验与游程检验等。 2 一、假设检验概述与基本概念 1、假设检验概述 2、假设检验的有关基本概念 二、总体参数检验 1、总体平均数的检验 2、总体成数的检验

3、总体方差的检验 三、总体非参数检验 1、符号检验 2、秩和检验 3、游程检验 一、假设检验的有关基本概念; 二、总体平均数与总体成数的检验; 三、非参数检验; 一、假设检验的基本思路与有关概念; 二、两类错误的理解及其关系; 一、假设检验概述 假设检验:利用统计方法检验一个事先所作出的假设的真伪,这一假设称为统计假设,对这一假设 所作出的检验就是假设检验。 基本思路:首先,对总体参数作出某种假设,并假定它是成立的。然后,根据样本得到的信息(统 计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个 假设。 所谓合理性,就是看是否在一次的观察中出现了小概率事件。 小概率原理:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。这种事件可以称其 为“实际不可能事件”。 二、假设检验的基本概念

统计学作业

统计学作业 文稿归稿存档编号:[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-

第二章习题(离散程度指标) 1.[习题集P23第9题]某车间有两个小组,每组都是7人,每人日产量数如下:第一组:20、40、60、70、80、100、120;第二组:67、68、69、70、71、72、73。已知两组工人每人平均日产量件数为70件,试计算:(1)R;(2)A.D;(3)S.D,并比较哪个组的平均数代表性大? 要求:如计算过程有小数,请保留至小数点后两位,余均同。 试据此分别计算其平均日产量,并说明哪个班的平均日产量代表性大? 假定生产条件相同,试计算这两个品种的收获率(产量/播种面积),确定哪一品种具有较大的稳定性和推广价值。 注意:播种面积是“f”,而产量等于收获率乘以播种面积,因而是“xf”。 4.[习题集P25第15题]各标志值对任意数的方差为500,而这个任意数与标志值平均数之差为12,试确定标志值的方差(提示:方差是离差平方的平均数。本题中的500是标志值与任意数的方差,即所测度的离差发生在标志值与某一任意数之间,而所求的方差是标志值与均值之间的方差)。 第二章习题(平均指标)

试计算该局企业平均职工人数以及第20百分位数。 2.[习题集P21第3题]某乡播种2800亩早稻,其中35%的稻田使用良种,平均亩产50斤,其余的稻田平均亩产仅480斤。试问:(1)全部耕地早稻平均亩产是多少?(2)早稻的全部产量是多少? 试计算产品计划与实际的平均等级和平均出厂价格,指出两者间的经济联系(提示:可对产品等级进行赋值,尔后计算)。 根据该资料计算亩产的中位数和众数,并判断其分布态势。 第三章《时间序列分析》作业

统计学原理作业三答案

统计学原理作业三答案 一、判断题 1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。(×) 2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(×) 3、在总体方差一定的条件下,样本单位数越多,则抽样平均误差越大(×) 4、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。√ 5、在其它条件不变的情况下,提高抽样估计的可*程度,可以提高抽样估计的精确度。(×) 6、抽样极限误差总是大于抽样平均误差。(×) 7、相关系数是测定变量之间相关关系的唯一方法(×) 8、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高(√ ) 9、利用一个回归方程,两个变量可以互相推算( ×) 10、估计标准误指的就是实际值y与估计值yc 的平均误差程度(√) 二、单项选择题 1、在一定的抽样平均误差条件下( A ) A、扩大极限误差范围,可以提高推断的可*程度 B、扩大极限误差范围,会降低推断的可*程度 C、缩小极限误差范围,可以提高推断的可*程度 D、缩小极限误差范围,不改变推断的可*程度 2、反映样本指标与总体指标之间的平均误差程度的指标是( C ) A、抽样误差系数 B、概率度 c、抽样平均误差D、抽样极限误差 3、抽样平均误差是(D ) A、全及总体的标准差 B、样本的标准差 c、抽样指标的标准差 D、抽样误差的平均差 4、当成数等于( C )时,成数的方差最大 A、1 B、0 c、0.5 D、-1 5、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是(C ) A、等于78% B、大于84% c、在此76%与84%之间 D、小于76% 6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差( B ) A、甲厂比乙厂大 B、乙厂比甲厂大 c、两个工厂一样大 D、无法确定 7、反映抽样指标与总体指标之间抽样误差可能范围的指标是(B)。 A、抽样平均误差;B、抽样极限误差;C、抽样误差系数;D、概率度。 8、如果变量x 和变量y 之间的相关系数为1 ,说明两变量之间( D ) A.不存在相关关系 B.相关程度很低 C.相关程度显著 D.完全相关 9、相关关系中,两个变量的关系是对等的,从而变量x 对变量y 的相关,同变量y 对变量x 的相关

统计学原理第六章习题及答案

第六章抽样调查 1.当研究目的一旦确定,全及总体也就相应确定,而从全及总体中抽取的抽样 总体则是不确定的。(V )2.从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样 本。( X )3.在抽样推断中,作为推断的总体和作为观察对象的样本都是确定的、唯一的。 (X )4.我们可以任取某一次抽样所得的抽样误差,来作为衡量抽样指标对于全及指 标的代表性程度。(X ) 5.由于没有遵守随机原则而造成的误差,通常称为随机误差。(X ) 6.抽样平均误差是表明抽样估计的准确度,抽样极限误差则是表明抽样估计准 确程度的范围;两者既有区别,又有联系。( V ) 7.抽样平均均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于 抽样平均误差,也可能小于抽样平均误差。( V ) 8.所有可能的样本平均数的平均数等于总体平均数。(V ) 9.按有关标志排队,随机起点的等距抽样可能产生系统性误差。( V ) 10.抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法, 因此不可避免的会产生误差,这种误差的大小是不能进行控制的。(X )11.重复抽样时,其他条件不变,允许误差扩大一倍,则抽样数目为原来的2倍。 (X) 12.扩大或缩小抽样误差范围的倍数叫概率度,其代表符号是V。(V) 13.重复抽样时若其它条件一定,而抽样单位数目增加3倍,则抽样平均误差为 原来的2倍。(X) 14.由于抽样调查存在抽样误差,所以抽样调查资料的准确性要比全面调查资料 的准确性差。(X) 15.在保证概率度和总体方差一定的条件下允许误差大小与抽样数目多少成正 比。(X) 16.扩大或缩小了以后的抽样误差范围叫抽样极限误差。(X) 17.如果总体平均数落在区间(960,1040)内的概率为0.9545,则抽样平均误 差等于30。(X) 18.抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概 率保证程度。(V )19.扩大抽样误差的范围,会降低推断的把握程度,但会提高推断的准确度。(X)

统计学抽样与抽样分布练习题

第6章 抽样与抽样分布 练习题 6.1 从均值为200、标准差为50的总体中,抽取100=n 的简单随机样本,用样本均值x 估计总体均值。 (1) x 的数学期望是多少? (2) x 的标准差是多少? (3) x 的抽样分布是什么? (4) 样本方差2 s 的抽样分布是什么? 6.2 假定总体共有1000个单位,均值32=μ,标准差5=σ。从中抽取一个样本量为30的简单随机样本用于获得总体信息。 (1)x 的数学期望是多少? (2)x 的标准差是多少? 6.3 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。样本均值的抽样标准差x σ等于多少? 6.4 设总体均值17=μ,标准差10=σ。从该总体中抽取一个样本量为25的随机样本,其均值为25x ;同样,抽取一个样本量为100的随机样本,样本均值为100x 。 (1)描述25x 的抽样分布。 (2)描述100x 的抽样分布。 6.5 从10=σ的总体中抽取样本量为50的随机样本,求样本均值的抽样标准差: (1)重复抽样。 (2)不重复抽样,总体单位数分别为50000、5000、500。 6.6 从4.0=π的总体中,抽取一个样本量为100的简单随机样本。 (1)p 的数学期望是多少? (2)p 的标准差是多少? (3)p 的分布是什么? 6.7 假定总体比例为55.0=π,从该总体中分别抽取样本量为100、200、500和1000的样本。

(1) 分别计算样本比例的标准差p σ。 (2) 当样本量增大时,样本比例的标准差有何变化? 6.8 假定顾客在超市一次性购物的平均消费是85元,标准差是9元。从中随机抽取40个顾 客,每个顾客消费金额大于87元的概率是多少? 6.9 在校大学生每月的平均支出是448元,标准差是21元。随机抽取49名学生,样本均值 在441~446之间的概率是多少? 6.10 假设一个总体共有8个数值:54,55,59,63,64,68,69,70。从该总体中按重复 抽样方式抽取2=n 的随机样本。 (1) 计算出总体的均值和标准差。 (2) 一共有多少个可能的样本? (3) 抽出所有可能的样本,并计算出每个样本的均值。 (4) 画出样本均值的抽样分布的直方图,说明样本均值分布的特征。 (5) 计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行比较,得 到的结论是什么? 6.11 从均值为5.4=μ,方差为25.82=σ的总体中,抽取50个由5=n 个观测值组成的 随机样本,结果见Book6.11。 (1) 计算每一个样本的均值。 (2) 构造50个样本均值的相对频数分布,以此代表样本均值x 的抽样分布。 (3) 计算50个样本均值的平均值和标准差x σ。 6.12 来自一个样本的50个观察值见Book6.12。 (1) 用组距为10构建频数分布表,并画出直方图。 (2) 这组数据大概是什么分布?

《统计学原理》作业(三)参考答案

《统计学原理》作业(三) (第五~第七章) 一、判断题 1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。(×) 2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(×) 3、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。(√) 4、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。(×) 5、抽样极限误差总是大于抽样平均误差。(×) 6、相关系数是测定变量之间相关关系的唯一方法(×) 7、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高(√)。 8、利用一个回归方程,两个变量可以互相推算(×)。 9、估计标准误指的就是实际值y与估计值y c的平均误差程度(√)。 10、抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的。(×) 11、总体参数区间估计必须具备的三个要素是估计值、抽样误差范围、概率保证程度。(√) 12、在一定条件下,施肥量与收获率是正相关关系。(√) 二、单项选择题 1、在一定的抽样平均误差条件下(A)。 A、扩大极限误差范围,可以提高推断的可靠程度 B、扩大极限误差范围,会降低推断的可靠程度 C、缩小极限误差范围,可以提高推断的可靠程度 D、缩小极限误差范围,不改变推断的可靠程度 2、反映样本指标与总体指标之间的平均误差程度的指标是(C)。 A、抽样误差系数 B、概率度 C、抽样平均误差 D、抽样极限误差 3、抽样平均误差是(C)。 A、全及总体的标准差 B、样本的标准差 C、抽样指标的标准差 D、抽样误差的平均差 4、当成数等于(C)时,成数的方差最大。 A、1 B、0 c、0.5 D、-1

统计学 第五章 抽样推断课后答案

第五章 抽样推断 一、单项选择题 1 2 3 4 5 6 7 8 9 10 C B A D B D C B A C 11 12 13 14 15 16 17 18 19 20 A D C A D C A C B D 二、多项选择题 1 2 3 4 5 ABCE ABDE BCE ABCE ABDE 6 7 8 9 10 ACE ADE ACD ABE CDE 11 12 13 14 15 BDE CD BC ABCD ABCDE 16 17 18 19 20 AD AC BCE ABDE ACE 三、判断题 1 2 3 4 5 6 7 8 9 10 × × × √ √ × √ √ × × 四、填空题 1、变量 属性 2、正 反 3、重复抽样 不重复抽样 4、抽样总体 样本 5、大于 N n - 1 N n 6、标准差 7、样本 总体 抽样平均误差 抽样平均误差 △x = Z x σ 8、合适的样本估计量 一定的概率保证程度 允许的极限误差范围 9、随机抽样 统计分组 10、增大 增大 降低 11、大数定律 中心极限定理 12、样本容量不小(不小于30个单位) 13、大 0.5

14、缩小 3 3 (即0.5774) 扩大 1.1180 15、估计量(或统计量) 参数 五、简答题(略) 六、计算题 1、已知条件:P = 0.5 ,n = 100 且重复抽样 求:p ≤0.45的概率 解: Z = 1100 ) 5.01(5.05.045.0)1(=-?-= --n P P P p 则F (Z = 1) = 0.6827 所以p ≤0.45的概率为: 2 6827 .01-= 0.15865 2、解 E (x 1) = E (0.5X 1 + 0.3X 2 + 0.2X 3) = 0.5 E (X ) + 0.3 E (X ) + 0.2E (X ) = E (X ) = X E (x 2) = E (0.5X 1 + 0.25X 2 + 0.25X 3) = 0.5 E (X ) + 0.25 E (X ) + 0.25E (X ) = E (X ) = X E (x 3) = E (0.4X 1 + 0.3X 2 + 0.3X 3) = 0.4 E (X ) + 0.3 E (X ) + 0.3E (X ) = E (X ) = X 所以x 1、x 2、x 3都是X 的无偏估计量。 D (x 1) = D (0.5X 1 + 0.3X 2 + 0.2X 3) = 0.25 D (X ) + 0.09 D (X ) + 0.04D (X ) = 0.38 D (x 2) = D (0.5X 1 + 0.25X 2 + 0.25X 3)

《统计学原理》作业(三)(第五章-第七章)

《统计学原理》作业(三)(第五章-第七章) 一、判断题 1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。() 2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。() 3、抽样成数的特点是,样本成数越大,则成数方差越大。6、在总体方差一定的条件下,样本单位数越多,则抽样平均误差越大() 4、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。 5、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。() 6、抽样极限误差总是大于抽样平均误差。() 7、相关系数是测定变量之间相关关系的唯一方法() 8、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高( ) 9、利用一个回归方程,两个变量可以互相推算() 的平均误差程度() 10、估计标准误指的就是实际值y与估计值y c 二、单项选择题 1、在一定的抽样平均误差条件下() A、扩大极限误差范围,可以提高推断的可靠程度 B、扩大极限误差范围,会降低推断的可靠程度 C、缩小极限误差范围,可以提高推断的可靠程度 D、缩小极限误差范围,不改变推断的可靠程度 2、反映样本指标与总体指标之间的平均误差程度的指标是() A、抽样误差系数 B、概率度 c、抽样平均误差 D、抽样极限误差 3、抽样平均误差是() A、全及总体的标准差 B、样本的标准差 c、抽样指标的标准差 D、抽样误差的平均差 4、当成数等于()时,成数的方差最大 A、1 B、0 c、0.5 D、-1 5、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是() A、等于78% B、大于84% c、在此76%与84%之间 D、小于76% 6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差() A、甲厂比乙厂大 B、乙厂比甲厂大 c、两个工厂一样大 D、无法确定 7、反映抽样指标与总体指标之间抽样误差可能范围的指标是()。 A、抽样平均误差;B、抽样极限误差;C、抽样误差系数;D、概率度。 8、如果变量x 和变量y 之间的相关系数为 1 ,说明两变量之间( ) A.不存在相关关系 B.相关程度很低 C.相关程度显著 D.完全相关

统计学习题答案 第4章 抽样与抽样分布

统计学习题答案第4章抽样与抽样分布

第4章抽样与抽样分布——练习题(全免) 1. 一个具有64 n个观察值的随机样本抽自于均 = 值等于20、标准差等于16的总体。 ⑴给出x的抽样分布(重复抽样)的均值和标 准差 ⑵描述x的抽样分布的形状。你的回答依赖于 样本容量吗? ⑶计算标准正态z统计量对应于5.15 = x的值。 ⑷计算标准正态z统计量对应于23 x的值。 = 解: 已知n=64,为大样本,μ=20,σ=16, ⑴在重复抽样情况下,x的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。 ⑴x<16;⑵x>23;⑶x>25;⑷.x落在16和22之间;⑸x<14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 3. 一个具有100 n个观察值的随机样本选自于 = μ、16=σ的总体。试求下列概率的近似值:30 =

解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。 ⑴ 你预计x 的最大值和最小值是什么? ⑵ 你认为x 至多偏离μ多么远? ⑶ 为了回答b 你必须要知道μ吗?请解释。 解:a. 101, 99 b. 1 c. 不必 5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。假设x 的取值的可能性是相同的。则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。对于每一个样本容量,构造x 的500个值的相对频率直方图。当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。 解:趋向正态 6. 美国汽车联合会(AAA )是一个拥有90个俱 乐部的非营利联盟,它对其成员提供旅行、

《统计学》抽样调查习题和答案

六.计算题部分 1、对一批成品按重复抽样方法抽选100件,其中废品4件,当概率为95.45%(t=2)时,可否认为这批产品的废品率不超过6%? 答案:解:2%,4100 4,100====t p n 0196 .0100 ) 04.01(04.0) 1(=-= -= n p p p μ 039.00196.02=?==? p p t μ p p p P p ?+≤≤? - 039.004.0039.004.0+≤≤-P 0.1%------7.9% ∴废品率不超过6% 2、某乡有5000农户,按随机原则重复抽取100户调查,得平均每户年纯收入12000元,标准差2000元。 要求:(1)以95%的概率(t=1.96)估计全乡平均每户年纯收入的区间。(2)以同样概率估计全乡农户年纯收入总额的区间范围。 答案: 解: 200100 2000===n x σμ 39220096.1=?==?x x t μ x x x X x ?+≤≤?- 3921200039212000+≤≤-X 11608-----12392(元) 5000×11608------5000×12392(元) 3、某企业生产一种新的电子元件,用简单随机重复抽样方法抽取100只作耐用时间试验,测试结果,平均寿命6000小时,标准差300小时,试在95.45%(t=2)概率保证下,估计这种新电子元件平均寿命区间。 答案: 解:2,300,6000,100====t x n σ (小时)30100 300===n x σμ (小时)60302=?==?x x t μ x x x X x ?+≤≤?- 606000606000+≤≤-X 5940-----6060(小时) 4、 从某年级学生中按简单随机抽样方式抽取50名学生,对邓小平理论课的考试成绩进行检查,得知其平均分数为75.6分,样本标准差10分,试以95.45%(99.73%t=3、68.27%t=1)的概率保证程度推断全年级学生考试成绩的区间范围。如果其它条件不变,将允许误差缩小一半,应抽取多少名学生? 答案:解:2,10,6.75,50====t x n σ 4142 .150 10== = n x σ μ 8284 .24142.12=?==?x x t μ 2426 .44142.13=?==?x x t μ x x x X x ?+≤≤?- 8284 .26.758284 .26.75+≤≤-X 2426.46.752426.46.75+≤≤-X 72.77----78.43 71.3574---79.8426

统计学答案解析最新版本

统计学课本课后作业题(全) 题目: 第1章:P11 6,7 第2章:P52 练习题3、9、10、11 第3章:P116思考题12、14 练习题16、25 第4章:P114 思考题6,练习题2、4、6、13 第5章:P179 思考题4、练习题3、4、6、11 第6章:P209 思考题4、练习题1、3、6 第7章:P246思考题1、练习题1、7 第8章:P287 思考题4、10 练习题2、3 第一章 6..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体;最近的一个集装箱内的全部油漆; (2)描述研究变量;装满的油漆罐的质量; (3)描述样本;最近的一个集装箱内的50罐油漆; (4)描述推断。50罐油漆的质量应为4.536×50=226.8 kg。 7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求:答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第二章 3.某百货公司连续40天的商品销售额如下(单位:万元):

统计学习题第五章_抽样与抽样估计答案

一、填空题 1、在实际工作中,人们通常把 n≥30 的样本称为大样本,而把 n<30 的样本称为小样本。 2、在抽样估计中,常见的样本统计量有样本均值、样本比例、样本标准差或样本方差以及它们的函数。 3、在研究目的一定的条件下,抽样总体是唯一确定的,而样本则有许多个。 4、在抽样调查中,登记性误差和系统性误差都可以尽量避免,而抽样误差则是不可避免的,但可以计算并加以控制。 5、在抽样估计中,抽样估计量是指用于估计总体参数的样本指标(统计量),评价估计量优劣的标准有无偏性、有效性和一致性。 二、选择题 单选题: 1、在其它条件不变的情况下,要使抽样平均误差为原来的1/3,则样本单位数必须 ((2)) (1)增加到原来的3倍(2)增加到原来的9倍 (3)增加到原来的6倍(4)也是原来的1/3 2、在总体内部情况复杂,且各单位之间差异程度大,单位数又多的情况下,宜采用 ((3)) (1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 3、某厂产品质量检查,确定按5%的比率抽取,按连续生产时间顺序每20小时抽1 小时的全部产进行检验,这种方式是((4)) (1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 4、其它条件一定,抽样推断的把握程度提高,抽样推断的准确性就会((2)) (1)提高(2)降低(3)不变(4)不一定降低 5、在城市电话网的100次通话中,通话持续平均时间为3分钟,均方差为分钟,则概率为时,通话平均持续时间的抽样极限误差为((2)) (1)(2)(3)(4)

6、假定11亿人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽样方法抽取本国人口的1%计算平均年龄,则平均年龄抽样平均误差((3))(1)两者相等(2)前者比后者大(3)前者比后者小(4)不能确定大小 多选题: 1、降低抽样误差,可以通过下列那些途径((2)(4)(5)) (1)降低总体方差(2)增加样本容量。 (3)减少样本容量(4)改重复抽样为不重复抽样 (5)改简单随机抽样为类型抽样 2、抽样推断中的抽样误差((1)(5)) (1)是不可避免要产生的 (2)是可以通过改进调查方法来消除的 (3)只有调查后才能计算 (4)即不能减少,也不能消除 (5)其大小是可以控制的 3、抽样极限误差((1)(2)(4)) (1)是所有可能的样本指标与总体指标之间的误差范围 (2)也叫允许误差(3)与所做估计的概率保证程度成反比 (4)通常用来表示抽样结果的精确度 4、影响样本容量的因素有((1)(2)(3)(4)(5)) (1)总体方差 (2)所要求的概率保证程度 (3)抽样方法 (4)抽样的组织形式 (5)允许误差法范围的大小 5、不重复抽样的抽样平均误差((2)(4)) (1)总是大于重复抽样的抽样平均误差

电大统计学原理期末测验考试题库

单选: 1、连续生产的电子管厂,产品质量检验是这样安排的,在一天中,每隔一小时抽取5分钟的产品进行检验,这是(D ) D.整群抽样 2、统计分组的关键是(A ) A.正确选择分组标志 3、直接反映总体规模大小的指标是( C ) C.总量指标 4、抽样调查的主要目的是( A ) A.用样本指标推算总体指标 5、相关系数的取值范围是( C ) C. -l≤r

统计学第五章课后题及答案解析

第五章 练习题 一、单项选择题 1.抽样推断的目的在于() A.对样本进行全面调查B.了解样本的基本情况 C.了解总体的基本情况D.推断总体指标2.在重复抽样条件下纯随机抽样的平均误差取决于() A.样本单位数B.总体方差 C.抽样比例D.样本单位数和总体方差 3.根据重复抽样的资料,一年级优秀生比重为10%,二年级为20%,若抽样人数相等时,优秀生比重的抽样误差() A.一年级较大B.二年级较大 C.误差相同D.无法判断 4.用重复抽样的抽样平均误差公式计算不重复抽样的抽样平均误差结果将()A.高估误差B.低估误差 C.恰好相等D.高估或低估 5.在其他条件不变的情况下,如果允许误差缩小为原来的1/2 ,则样本容量() A.扩大到原来的2倍B.扩大到原来的4倍 C.缩小到原来的1/4D .缩小到原来的1/2 6.当总体单位不很多且差异较小时宜采用() A.整群抽样B.纯随机抽样 C.分层抽样D.等距抽样 7.在分层抽样中影响抽样平均误差的方差是() A.层间方差B.层内方差 C.总方差D.允许误差二、多项选择题 1.抽样推断的特点有() A .建立在随机抽样原则基础 上 B.深入研究复杂的专门问 题 C .用样本指标来推断总体指 标 D.抽样误差可以事先计算 E .抽样误差可以事先控制 2.影响抽样误差的因素有() A .样本容量的大小B.是有限总体还是无限总 体 C .总体单位的标志变动度D.抽样方法 E .抽样组织方式 3.抽样方法根据取样的方式不同分为() A .重复抽样 B .等距抽样 C .整群抽样 D .分层抽样 E .不重复抽样 4.抽样推断的优良标准是() A .无偏性 B .同质性 C .一致性 D .随机性 E .有效性 5.影响必要样本容量的主要因素有() A . 总体方差的大小B.抽样方法

3统计学原理作业3答案

统计学原理作业3 第五章-第七章 一、判断题 1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。(×) 2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(×) 3、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。(√) 4、抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的。(×) 5、总体参数区间估计必须具备的三个要素是估计值、抽样误差范围、概率保证程度。(×) 6、在一定条件下,施肥量与收获率是正相关关系。(√) 7、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高(√ ) 8、利用一个回归方程,两个变量可以互相推算(×) 二、单项选择题 1、在一定的抽样平均误差条件下( A ) A、扩大极限误差范围,可以提高推断的可*程度 B、扩大极限误差范围,会降低推断的可*程度 C、缩小极限误差范围,可以提高推断的可*程度 D、缩小极限误差范围,不改变推断的可*程度 2、反映样本指标与总体指标之间的平均误差程度的指标是( C ) A、抽样误差系数 B、概率度 c、抽样平均误差 D、抽样极限误差 3、抽样平均误差是( D ) A、全及总体的标准差 B、样本的标准差 c、抽样指标的标准差 D、抽样误差的平均差 4、当成数等于( C )时,成数的方差最大 A、1 B、0 c、0.5 D、-1

5、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是( C ) A、等于78% B、大于84% c、在此76%与84%之间 D、小于76% 6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差( B ) A、甲厂比乙厂大 B、乙厂比甲厂大 c、两个工厂一样大 D、无法确定 7、反映抽样指标与总体指标之间抽样误差可能范围的指标是( B )。 A、抽样平均误差;B、抽样极限误差;C、抽样误差系数;D、概率度。 8、如果变量x 和变量y 之间的相关系数为 1 ,说明两变量之间( D ) A.不存在相关关系 B.相关程度很低 C.相关程度显著 D.完全相关 9、一般说,当居民的收入减少时,居民的储蓄款也会相应减少,二者之间的关系是( C ) A.直线相关 B.完全相关 C.非线性相关 D.复相关 11、当所有的观察值y都落在直线y=a+bx上时,则x与y之间的相关系数为( B )A、γ=0B、γ=1C、-1<γ<1D、0<γ<1 10、年劳动生产率x(千元)和工人工资y(元)之间的回归方程为yc=30+60x ,意味着劳动生产率每提高2千元时,工人工资平均增加( B ) A.60元 B.120元 C.30元 D.90元 11、如果变量x 和变量y 之间的相关系数为-1,说明两个变量之间是( B ) A.高度相关关系 B.完全相关关系 C.完全不相关 D.低度相关关系 12、价格不变的条件下,商品销售额和销售量之间存在着( D ) A.不完全的依存关系 B.不完全的随机关系 C.完全的随机关系 D.完全的依存关系 三、多项选择题 1、影响抽样误差大小的因素有( ABCD ) A、抽样调查的组织形式 B、抽取样本单位的方法 c、总体被研究标志的变异程度 D、抽取样本单位数的多少 E、总体被研究标志的属性

统计学作业抽样推断

第六章抽样推断 单项选择题 1. 抽样调查的主要目的在于( A. 计算和控制误差 B. 了於总休门占忖况C .用样本来推断总体D.对调查单位作深入的研究 2. 抽样调查所必须遵循的基本原则是( A. 随意原则 B. 可比性原则 C.准确性原则 D. I?琳,Q!l] 3. 下列属于抽样调查的事项有(I, A.勾了测卫丫、川勺1上1弍交.炖们剧対:—y 丨ii悄一爪匚人进i「讥育 B. 为了解某大学生食堂卫生状况,对该校的一个食堂进行了调查 c.对某城市居民1%旳宗應询&,以妙.工玄城liji/- /■:旳消赞水半 D. *4找可】个分,"I帆俱一人分!甘讦讦杳,L):佟研究该「術渐和L徴杲 4. 无偏性是指( A.抽样指标等于总体指标 B.fl-木平均数询平均K^T总体平均数 c .样本平均数等于总体平均数 D. 样木成数需」血依成敖 5. 一致性是指当样本的单位数充分大时,抽样指标( A.小于总体指标 B.等于总体指标 C .大于总体指标 D.充分靠近总体指标 6. 有效性是指作为优良估计量的方差与其他估计量的方差相比,有()。 A.前者小于后者 B. 前者大于后者C .两者相等 D. 不计 7. 能够事先加以计算和控制的误差是():: A.抽样误差 B. 登记误差 C.代表性误差 D. 系號件汉辛 8. 对两个工厂工人平均工资进行不重复的随机抽样调查,抽查的工人人数一样,两工厂工人工资方差相同,但第二个厂工人数比第一个厂工人数整整多一倍。抽样平均误差(汇 A.第一工厂大 B. 第二个工厂大 C .两工厂一样大D. 无f ■.浪「I沽壬 9. 抽样平均误差是指抽样平均数(或抽样成数)的(L A.平均数 B. 平均差C .标准差D. 标准去丸数 10. 在同样情况下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比, 是( A.两者相等 B. 两者不等 C.前者小于后者 D. IPJ 11. 反映抽样指标与总体指标之间抽样的可能范围的指标是(

统计学答案 第八章 抽样与抽样分布

第八章抽样与抽样分布 一、名词解释 1、统计抽样:按照随机原则从被研究现象的总体中,抽取一部分单位进行观察,然后根据 观察的结果运用数理统计的原理,来估计总体综合指标或者对总体综合指标的某种假设进行 检验。 2、重复抽样:是从总体中每抽出一个样本单位后,把结果记录下来,随即将该单位放回到 总体中去,使它和其余的单位在下一次抽选中具有同等被抽中的机会,再抽取第二个单位,直至抽取n个单位为止。 3、不重复抽样:一个单位被抽中后不再放回总体,然后再从所剩下的单位中抽取第二个单位,直到抽出n个单位为止,这样的抽样方法不可能使一个总体单位被重复抽中,所以称为 不重复抽样。 4、简单随机抽样:在从总体中随机抽取n个单位作为样本时,要使得每一个总体的单位都 有相同的机会(概率)被抽中。 5、分层抽样:在抽样之前先将总体的单位划分为若干层(类),然后从各个层中抽取一定数 量的单位组成一个样本,这样的抽样方式称为分层抽样,也称为分类抽样。 6、系统抽样:在抽样中先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点, 然后,每隔一定的间隔抽取一个单位,直至抽取n个单位形成一个样本。这样的抽样方式称 为系统抽样,也称等距抽样或机械抽样。 7、整群抽样:调查时,先将总体划分成若干群,然后再以群作为调查单位从中抽取部分群, 进而对抽中的各个群中所包含的所有个体单位进行调查或观察,这样的抽样方式称为整群抽样。 8、总体分布:总体是我们关心的若干个元素的集合,总体中每个元素的取值是不同的,这些 观察值所形成的相对频数分布就是总体分布。 9、样本分布:是指一个样本中各观察值所形成的相对频数分布。 10.抽样分布:某个样本统计量的抽样分布,从理论上说就是在重复选取容量为n的样本时, 由该统计量的所有可能取值形成的相对频数分布。 11、比率:是指总体(或样本)中具有某种属性的单位与全部单位总数之比。 12、样本比率的抽样分布:在重复选取容量为n的样本时,由样本比率的所有可能取值形成 的相对频数分布称为样本比率的抽样分布。 二、判断题 1、× 2、√ 3、× 4、× 5、√ 6、× 7、√ 8、√ 9、× 10、√ 三、选择题 1、A 2、A 3、B 4、B 5、C 6、D 7、D 8、D 9、C 10、D 11、C 12、B 13、C 14、C 15、A 16、D 17、A 18、B 19、C 20、B 21、B 22、B 23、B 24、A 25、A 四、简答题 1、简述统计抽样的基本特点。

统计学原理b试题a(

山东理工大学成人高等教育统计学原理试卷(A 卷) 共三个大题,满分100分。 一、单项选择题(每题2分,共20分) 1、某县男性人口占52%,这个指标属于( B )。 A .结构相对数 B .比例相对数 C .强对相对数 D .平均数 2、“统计”一词的基本含义是( B ) A.统计调查 、统计整理 、统计分析 B. 统计科学、 统计工作 、统计资料 C .统计方法、 统计分析 、统计计算 D. 统计设计、 统计分组 、统计计算 3、某企业计划产量比去年提高8%,而实际产量提高了12%,则计划完成程度为( C ) A. 150% % C. % D. % 4、相关系数接近于1,表明两变量间( D )。 A .没有相关关系 B .线性相关关系较弱 C .负线性相关关系较强 D .高度正相关 5、已知某地的工业总产值2012年比2005年增长%,2011年比2005年增长150%,则2012年比2011年增长( A )。 A .15% B .125% C .115% D .% 6、编制数量指标指数的一般原则是采用( C )作同度量因素。 A. 报告期数量指标 B. 基期数量指标 C. 基期质量指标 D. 报告期质量指标 7、在同样情况下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比,是( C ) A .两者相等 B .两者不等 C .前者小于后者 D .前者大于后者 8、一个总体单位( ) A .可以有多个标志 B .可以有多个指标 C .只能有一个标志 D .只能有一个指标 9、某灯泡厂为了掌握产品质量,拟进行一次质量大检查,应选择( A ) A. 抽样调查 B. 全面调查 C. 重点调查 D. 统计报表 10、将对比基数为1而计算出来的相对数称为( c ) A .千分数 B .倍数 C .成数 D .百分数 二、简答题(每题8分,共40分) 1、 影响样本容量大小的因素有哪些 样本容量的大小不取决于总体的多少,而取决于:1、研究对象的变化程度;2、 所要求或误差的大小(即精确要求);3、要求推断的置信程度。 2、影响抽样误差的因素有哪些 ①抽样单位的数目。在其他条件不变的情况下,抽样单位的数目越多,抽样误差越小;抽样单位数目越少,抽样误差越大。这是因为随着样本数目的增多,样本结构越接近总体。抽样调查也就越接近全面调查。当样本扩大到总体时,则为全面调查,也就不存在抽样误差了。 ②总体被研究标志的变异程度。在其他条件不变的情况下,总体标志的变异程度越小,抽样误差越小。总体标志的变异程度越大,抽样误差越大。抽样误差和总体标志的变异程度成正比变化。这是因为总体的变异程度小,表示吝惜体各单位标志值之间的差异小。则样本指标与总体指标之间的差异也可能小;如果总体各单位标志值相等,则标志变动度为零,样本指标等于总体指标,此时不存在抽样误差。 ③抽样方法的选择。重复抽样和不重复抽样的抽样误差的大小不同。采用不重复抽样比采用重复抽样的抽样误差小。 ④抽样组织方式不同。采用不同的组织方式,会有不同的抽样误差,这是因为不同的抽样组织所抽中的样本,对于总体的代表性也不同。通常,我们不常利用不同的抽样误差,做出判断各种抽样组织方式的比较标准。 3、简述统计指数的作用 1.反映复杂的社会经济现象总体的综合变动程序 2.分析各个因素对复杂社会经济现象总体综合变动 3.研究社会经济现象总体的结构变动对平均水平变动的影响 4.考察计划任务的完成程度 4、简述平均指标的应用原则。 1.计算和应用平均指标必须注意现象总体的同质性。 2.用组平均数补充说明平均数 3、计算和运用平均数时,要注意极端数值的影响。 4、在运用平均数分析时还应注意用分配数列补充说明平均数。 5、把平均数与典型事例相结合。 5、简述相关分析的主要内容。 适用专业 工商管理、国贸、人力 资源 层 次 本专科 考试时间 90分钟 题号 一 二 三 总分 分数 级 年 ) 站 授 函 ( 院 学 业 专 名 姓 号 学 共4页第1页 共4页第2页

相关文档
最新文档