2021统计学考研应用统计硕士专硕考研真题库

2021统计学考研应用统计硕士专硕考研真题库
2021统计学考研应用统计硕士专硕考研真题库

2021统计学考研应用统计硕士专硕考研真题库

一、选择题部分

某政府机构想尽快了解社会公众对其出台的一项政策的态度,最恰当的数据搜集方式是()。

A.面访

B.深度访谈

C.计算机辅助电话调查

D.邮寄调查

【答案】C ~~

【解析】C项,计算机辅助电话调查是利用现代化电脑程控通讯设备进行的随机电话访问方式,采用这种访问调查方式,具有调查内容客观真实、保密性强、访问效率高等特点。A项,面访即调查者直接走访被调查者,当面听取被调查者的意见,可以比较全面、深入,能获得大量真实的研究资料,但这种方法容易使研究结论带有主观成分;B项,深度访谈是一种无结构的、直接的、一对一的访问形式。最常应用于探测性调查,但是这种访谈方法所得的资料难以进行统计处理和定量分析,而且特别耗费时间,使得访谈的规模受到较大的限制;D 项,邮寄调查法,是指将事先设计好的调查问卷,通过邮政系统寄给被调查者,由被调查者根据要求填写后再寄回,是市场调查中一种比较特殊的调查方法。这种调查方法的调查周期通常比较长,时效性差。

4.将一颗质地均匀的硬币先后抛掷3次,至少出现2次正面的概率是()。A.1/4

B.3/8

C.1/2

D.5/8

【答案】C ~~

【解析】记为抛掷3次硬币出现正面的次数,根据古典概率计算公式可知:

5.设函数f(x)在区间(a,b)上等于0.4,在此区间之外等于0,如果f(x)可以作为某连续型随机变量的密度函数,则区间(a,b)可以是()。A.(0,0.5)

B.(0.5,2.5)

C.(1.5,2.5)

D.(0,2.5)

【答案】D ~~

【解析】根据概率密度函数的性质可知:

解得:,只有D项满足条件。

6.2000年的一项调查发现,新购买小汽车的人中有40%是女性,在今年将再做一项调查旨在检验新车主中女性的比例是否有显著增加,建立的原假设和备择假设为()。

A.H0:π=40%,H1:π≠40%

B.H0:π≥40%,H1:π<40%

C.H0:π≤40%,H1:π>40%

D.H0:π<40%,H1:π≥40%

【答案】C ~~

【解析】通常将研究者要证明的结论作为备择假设。原假设与备择假设互斥,肯定原假设,意味着放弃备择假设;否定原假设,意味着接受备择假设。由题意可知原假设H0为π≤40%,备择假设H1为π>40%。

7.已知数列{1,3,3,5,5,7,7,9,122},下面说法错误是()。A.算数平均数是18

B.中位数是5

C.众数是5

D.极差是121

【答案】C ~~

【解析】众数是一组数据中出现次数最多的数值,由题干可知,众数分别是3,5,7。

8.在多元线性回归分析中,t检验是用来检验()。

A.总体线性关系的显著性

B.各回归系数的显著性

C.样本线性关系的显著性

D.H0:β1=β2=…=βk=0

【答案】B ~~

【解析】在多元线性回归分析中,F检验用来检验回归方程整体线性关系的显著性;t检验用来检验各回归系数的显著性;是进行回归方程整体线性关系显著性检验时的原假设。

9.以下关于“非抽样误差”说法正确的是()。

A.只有非全面调查中才有

B.只有全面调查中才有

C.全面调查和非全面调查中都有

D.全面调查和非全面调查都没有

【答案】C ~~

【解析】抽样误差是由于抽样的随机性引起的样本结果与总体真值之间的误差;非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体真值之间的差异。抽样误差是一种随机性误差,只存在于概率抽样中;非抽样误差则不同,无论是概率抽样、非概率抽样,或是在全面性调查中,都有可能产生非抽样误差。

10.把数据中的每个数值减去最小值然后除以极差是一种常用的数据预处理方法。对于经过这一变换之后的数据,以下说法不正确的是()。

A.服从正态分布

B.没有计量单位

C.取值在0和1之间

D.是相对数

【答案】A ~~

【解析】极差等于一组数据中的最大值减去最小值,将数据中的每个数值减去最小值然后除以极差得到一个相对数,其取值在0和1之间。经题干中的方法处理后,消除了量纲,数据没有计量单位了,并且数据仍保持原分布。11.一名研究人员希望通过图形来说明4月份以来北京地区二手房租金每天的变化,如下哪个图形最合适()。

A.直方图

B.散点图

C.折线图

D.茎叶图

【答案】C ~~

【解析】直方图是用于展示分组数据分布的一种图形,它是用矩形的宽度和高度(即面积)来表示频数分布的;散点图是用二维坐标展示两个变量之间关系的一种图形;茎叶图是反映原始数据分布的图形;如果数值型数据是在不同时间上取得的,即时间序列数据,则可以绘制线图,线图主要用于反映现象随时间变化的特征。

12.以下关于参数和统计量的说法正确的是()。

A.总体参数是随机变量

B.样本统计量都是总体参数的无偏估计量

C.对一个总体参数进行估计时,统计量的表达式是惟一的

D.样本统计量是随机变量

【答案】D ~~

【解析】参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值,研究者所关心的参数通常有总体平均数、总体标准差、总体比例等;由于总体数据通常是不知道的,所以参数是一个未知的常数。在对总体参数进行估计时,可以采用最小二乘估计、极大似然估计等估计方法,不同方法得到的估计量可能不同,也不一定具有无偏性的性质。统计量是用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一个量,是样本的函数;由于抽样是随机的,因此统计量是随机变量。

13.关于有常数项的一元线性回归方程,以下正确的是()。

A.判定系数等于自变量和因变量的相关系数

B.判定系数等于自变量和因变量相关系数的平方

C.自变量和因变量相关系数等于判定系数正的平方根

D.修正的判定系数等于自变量和因变量相关系数的平方

【答案】B ~~

【解析】在一元线性回归中,自变量和因变量的相关系数实际上是判定系数的平方根,且它与回归系数的符号一致。

14.如果Y关于X的回归方程为,而且这个回归方程的,则x与y之间的相关系数()。

A.r=1

B.r=-1

C.r=0.9

D.r=-0.9

【答案】D ~~

【解析】在一元线性回归中,自变量和因变量的相关系数实际上是判定系数的平方根。

由y=2-x知,x与y是负相关的,所以其相关系数为-0.9。

15.95%置信水平的区间估计中95%的置信水平是指()。

A.总体参数落在一个特定的样本所构造的区间内的概率为95%

B.总体参数落在一个特定的样本所构造的区间内的概率为5%

C.在用不同的样本构造的总体参数的多个区间中,包含总体参数的区间比例为95%

D.在用不同的样本构造的总体参数的多个区间中,包含总体参数的区间比例约为95%

【答案】C ~~

【解析】如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么用该方法构造的区间称为置信水平为95%的置信区间?

16.关于单因素方差分析中的F检验()。

A.拒绝域在F分布曲线的右侧

B.F统计量的样本观测值可能为负值

C.拒绝域在F分布曲线的左侧和右侧

D.以上表述都不对

【答案】A ~~

【解析】在单因素方差分析中,若,则拒绝原假设H0;若,则不能拒绝原假设H0。

17.在假设检验中,如果所计算出的P值越小,说明检验的结果()。A.越显著

B.越不显著

C.越真实

D.越不真实

【答案】A ~~

【解析】P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,则有理由拒绝原假设;P值越小,拒绝原假设的理由就越充分。18.某商场2008年12月的商品销售额为100万元,该月的季节指数等于125%(乘法模型),在消除季节因素后该月的销售额为()。

A.80万元

B.100万元

C.125万元

D.以上都不对

【答案】A ~~

【解析】计算出季节指数后,将各实际观察值除以相应的季节指数,即

可将季节性成分从时间序列中分离出去。即。

19.在一次问卷调查中要求被调查者直接填写出个人的民族、婚姻状况、居住地的邮政编码、年龄和收入。以下说法不正确的是()。

A.民族是定性变量

B.邮政编码是定量变量

C.年龄的计量尺度是定比尺度

D.收入数据是定量数据

【答案】B ~~

【解析】变量分为定性变量和定量变量。定性变量是指观测的个体只能归属于几种互不相容类别中的一种,一般是用非数字来表达其类别的变量。定量变量是指可以用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异的变量。定距尺度也称等距尺度或区间尺度,是一种不仅能将变量(社会现象)区分类别和等级,而且可以确定变量之间的数量差别和间隔距离的方法。定比尺度也称比例尺度或等比尺度,是一种除有定距尺度的全部性质之外,还能测量不同变量(社会现象)之间的比例或比率关系的方法;以定比尺度测量的数据具有绝对零点。由于邮政编码只是对应于行政区域的一个标签,其数值并没有实际意义,故它是定性变量。

20.下列指数中属于质量指数的是()。

A.消费者价格指数

B.销售量指数

C.GDP增长率

D.销售额指数

【答案】A ~~

【解析】数量指标指数是反映数量指标变动程度的相对数,如商品销售量指数、工业产品产量指数等,数量指标通常采用实物计量单位。质量指数指标

是反映品质指标变动程度的相对数,如产品价格指数、产品单位成本指数等,质量指标通常采用货币计量单位。

二.简答题(本题包括1~5题共5个小题,每小题10分,共50分)。1.简述假设检验的过程。

答:假设检验的过程如下:

(1)根据所研究问题的要求提出原假设(或称为零假设、无效假设)和备择假设;确定显著性水平,显著性水平为作假设检验时犯第一类错误的概率。(2)选择合适的检验方法,构造适当的检验统计量,确定统计量的分布,并代入样本数据计算在原假设成立条件下它的数值。

(3)根据计算出的检验统计量观测值,查阅统计表,确定相对应的值;将值与显著性水平比较,若,则拒绝H 0,接受H1;若,则不能拒绝H0。

2.请给出你所知道的概率抽样的组织方式。

答:概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。

调查的实践中经常采用的概率抽样方式有以下几种:

(1)简单随机抽样。简单随机抽样指从包括总体N个单位的抽样框中随机地、逐个地抽取n个单位作为样本,每个单位入样的概率是相等的;

(2)分层抽样。分层抽样是指将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计;

(3)整群抽样。整群抽样是指首先将总体中若干个单位合并为组,这样的组称为群,抽样时直接随机抽取一个群,然后对中选群中的所有单位全部实施调查;(4)系统抽样。系统抽样是指将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位;

(5)多阶段抽样。采用类似整群抽样的方法,首先抽取群,但并不是调查群内的所有单位,而是再进一步抽样,从选中的群中抽取出若干个单位进行调查;因为取得这些接受调查的单位需要两个步骤,所以将这种抽样方式称为二阶段抽样;这里,群是初级抽样单位,第二阶段抽取的是最终抽样单位。将这种方法推广,使抽样的段数增多,就称为多阶段抽样。

3.在盒子图(箱线图)的作图中,会使用哪些描述指标。

答:箱线图(Boxplot)也称箱须图(Box-whisker Plot),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。故箱线图使用的描述指标有:最小值、第一四分位数、中位数、第三四分位数与最大值。

4.下列调查问卷中的提问都有问题,请修改。

(1)您和您爱人是否对现有住房满意?

(2)您最近一次是几点上班的?

(3)绝大多数喝过明光牛奶的人都认为它口味纯正,您认为是这样的吗?答:(1)您对现有住房满意吗?您爱人呢?

(2)您最近一次是几点离开家去上班的?

(3)您认为明光牛奶的口味纯正吗?

5.如果有百分之五的人是左撇子,而小明和他弟弟都是左撇子;那么小明和他弟弟都是左撇子这个事件的概率是不是0.05×0.05=0.0025?为什么?

答:不是。

显然,小明和他弟弟都是左撇子的事件不是独立的,所以这种计算方法错误。当两个事件相互独立时:

(1)

当两个事件不相互独立时:

(2)

记事件A为小明是左撇子,事件B为小明的弟弟是左撇子。显然小明是左撇子和他弟弟是左撇子这两个事件不相互独立,所以选择第二个公式计算小明和他弟弟都是左撇子这个事件的概率。

三.计算与分析题(本题包括1~3题共3个小题,第1题10分,第2、3题30分,共70分)

1.离散型随机变量X的概率分布率如下。

(1)确定概率分布率中a的值。

(2)试给出随机变量X的分布F(x)。

(3)计算随机变量X的均值和方差。

解:(1)根据离散型随机变量的概率分布列的正则性,即可知:

得。

(2)当时,;

当时,;

当时,;

当时,;

当时,。

所以随机变量的分布为:

(3)

2.一家紧急救护中心目前每天的值班护士人数相同。表1是2010年11月1日至2010年11月26日到紧急救护中心的病人数(紧急救护中心周六,周日不营业),表2和表3分别是表1数据的描述统计和方差分析的结果。

根据表1、表2和表3中的数据和统计分析结果,请你替这家紧急救护中心的主任给他的上级主管部门撰写一份报告,阐明根据一周每天病人人数安排相应的值班护士人数的理由。

报告至少涵盖下面两项内容:

(1)一周中每天的病人人数是否存在差异?(2)如果存在差异,哪些天似乎是最繁忙的?

答:(1)提出假设:

由表3可知,方差分析中F检验的P-value=6.26E-12,故拒绝原假设,认为周一至周五每天病人的平均人数之间有显著差异。

(2)由表二我们知道周一至周五每天病人的平均人数里周一和周五最多,周四病人的平均人数最少,故可减少周四相应的值班护士人数增派安排到周一和周五,以达到护士人员的合理安排优化配置。

报告略。

3.某汽车租赁公司的财务主管发现有位司机报销的年度维修费用过高,你怀疑他和汽车维修公司合伙,开出虚高的发票。这位财务主管收集了6位非常可靠的司机的汽车年度维修费用和对应的汽车使用年限数据(见表4)。以年度维修费用为因变量y,相应汽车的使用年限为自变量x,建立回归模型

或者

在EXCEL中,通过回归分析,得到表5和表6的输出结果。这位司机提交的年度维修费用发票共8001元,他的汽车的使用年限为5年。根据表5和表6,可

以计算使用年限为5年的汽车对应的年度维修费用的95%置信预测区间为[4498.722,7348.021]。

请你为这位财务主管给他的上级主管部门撰写一个500字以内的报告,阐明调查这位司机的理由。

报告至少涵盖下面两项内容:

(1)解释模型的合理性;

(2)区间预测的合理性。

注:在计算预测区间时使用了下面的公式。给定汽车的使用年限x p,汽车年度维修费用的置信度为1-α的预测区间为:[,

]。

其中,

s是ε标准差的估计。

表4 维修费用记录表

表5 方差分析

表6 系数估计

答:

(1)

表7 回归结果

由表6可以得到,线性回归方程为:

回归系数表示:汽车的使用年限每延长1年,汽车的年度维修费用平均增加814.7429元。

由表7可知R2=92.8704%,表明在汽车年度维修费用的变差中被汽车的使用年限与年度维修费用的线性关系所解释的比例为92.8704%,回归方程的拟合程度十分好。

估计标准误差s e=0.558497,表示,当用汽车的使用年限来预测年度维修费用时,平均的预测误差为0.558497%,表明预测误差十分小。

(2)由表5可知,Significance F=0.001953<α=0.05,即回归方程的线性关系显著。回归系数检验的

表明回归系数显著,即汽车使用年限是影响汽车年度维修费用的显著性因素。表明该模型十分合理,故可以用来进行预测。通过计算使用年限为5年的汽车对应的年度维修费用的95%置信预测区间为[4498.722,7348.021],表4中汽车使用年限为5年的年度维修费用为6449元,显然落在了置信区间内,由此可说明区间预测的合理性。据此可判断这位司机提交的年度维修费用发票共8001元未落在置信区间内,明显不合常理,不能排除他和汽车维修公司合伙,开出虚高的发票的疑点。

报告略。

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

卫生统计学 考研

卫生统计学 (Health Statistics) 课程编号:学分数 5 周学时 4 课程性质:医学基础课 预修课程: 教学目的:掌握研究设计方法、基本的统计原理和方法,并能够将其应用于居 民健康状况研究、医疗卫生研究和医学科研。通过本课程的教学,帮助学生培养透过偶然现象探测事物内在规律的思维能力,使学生能应用统计的思维分析方法,有效地开展各项医疗卫生工作和研究工作。 基本内容:研究设计、基本统计原理、常用的统计推断方法 基本要求:学生应按本大纲具体要求,掌握统计学基本原理、常用的统计分析 方法和科学的研究设计方法。能够进行合理地研究设计,科学地搜集、整理、分析数据资料,作出合理推断,能够理论联系实际,分析解决实际问题。 教学用书:倪纵瓒主编《卫生统计学》,人民卫生出版社,2001年1月 教学内容、要求和课时安排: 一、绪论(学时数:2) 教学内容 卫生统计学的内容,统计工作的步骤,统计资料的类型,统计中的几个基本概念,学习卫生统计学应注意的问题。 教学要求 1.掌握:统计中的几个基本概念:随机现象,概率,总体,样本,抽样误 差,统计资料的类型。 2.熟悉:统计工作的一般步骤。 3.了解卫生统计学的主要内容,学习过程中应该注意的问题。 二、计量资料的描述(学时数:6+2) 教学内容 1.计量资料的频数表、图 2.计量资料的统计描述指标 集中趋势:均数,几何均数,中位数,百分位数; 离散趋势:极差和四分位数间距,方差和标准差,变异系数3.正态分布的概念和特征,正态曲线下面积分布规律,正态分布的应用,对数正态分布。 教学要求 1.掌握:计量资料的频数表。常用集中趋势指标的意义及适用范围。正态 分布曲线下的面积分配规律。 2.熟悉:常用集中趋势、离散趋势指标的计算方法。正常值范围的意义和 制定方法。

卫生统计学 案例版丁元林课后思考题答案

第一章:ECDBB 第二章:BDABC 第三章:DEBCD AEA 第四章:DCCDD DCBD 第五章:DCBDB AEEEC 第六章:CBEDC DDDDA 第七章:ACCBB DACEA 第八章:ABCDD BDADB 第九章:DDBCD AEA 第十章:BDCCE BDAEA 第十一章:CAEDC DBCCD 第十二章:BCAEE BA 第十三章:DDBCC BCDE 第十四章:无 第十五章:无 第十六章:无 第十七章:DBABC BDE 第十八章:无 第十九章:BDCDC CCADC 《卫生统计学》思考题参考答案 第一章绪论 1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的? 答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。 2、统计工作可分为那几个步骤? 答:设计、收集资料、整理资料、分析资料四个步骤。 3、举例说明小概率事件的含义。 答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。 第二章调查研究设计 1、调查研究有何特点? 答:(1)不能人为施加干预措施 (2)不能随机分组 (3)很难控制干扰因素 (4)一般不能下因果结论 2、四种常用的抽样方法各有什么特点? 答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。 (2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。 (3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

生物统计学习题集

生物统计学 姓名: 班级: 学号:

第一章概论 一、填空 1 变量按其性质可以分为_______变量和_______变量。 2 样本统计数是总体_______的估计量。 3 生物统计学是研究生命过程中以样本来推断_______的一门学科。 4 生物统计学的基本内容包括_______、_______两大部分。 5 统计学的发展过程经历了_______、_______、_______3个阶段。 6 生物学研究中,一般将样本容量_______称为大样本。 7 试验误差可以分为_______、_______两类。 二、判断 ()1 对于有限总体不必用统计推断方法。 ()2 资料的精确性高,其准确性也一定高。 ( ) 3 在试验设计中,随机误差只能减少,而不可能完全消除。()4 统计学上的试验误差,通常指随机误差。 三、名词解释 样本 总体 连续变量 非连续变量 准确性 精确性

第二章试验资料的整理与特征数的计算 一、填空 1 资料按生物的性状特征可分为_______变量和_______变量。 2 直方图适合于表示_______资料的次数分布。 3 变量的分布具有两个明显基本特征,即_______和______。 4 反映变量集中性的特征数是_______,反映变量离散性的特征数是_______。 5 样本标准差的计算公式s=_______。 二、判断 ( ) 1 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。( ) 2 条形图和多边形图均适合于表示计数资料的次数分布。 ()3 离均差平方和为最小。 ()4 资料中出现最多的那个观测值或最多一组的中点值,称为众数。()5 变异系数是样本变量的绝对变异量。 三、名词解释 资料 数量性状资料 质量性状资料 计数资料 计量资料 普查 抽样调查 全距(极差) 组中值 算数平均数 中位数 众数 几何平均数 方差 标准差 变异系数

实用卫生统计学试题含答案

医学统计方法概述 l.统计中所说的总体是指:A根据研究目的确定的同质的研究对象的全体 2.概率P=0,则表示B某事件必然不发生 3.抽签的方法属于D单纯随机抽样 4.测量身高、体重等指标的原始资料叫:B计量资料 5.某种新疗法治疗某病患者41人,治疗结果如下:该资料的类型是:D有序分类资料 治疗结果治愈显效好转恶化死亡 治疗人数8 23 6 3 1 6.样本是总体的C有代表性的部分 7.将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤:C整理资料 8.统计工作的步骤正确的是C设计、收集资料、整理资料、分析资料 9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:B系统误差10.以下何者不是实验设计应遵循的原则D交叉的原则 11.表示血清学滴度资料平均水平最常计算B几何均数 12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择C M 13.各观察值均加(或减)同一数后:B均数改变,标准差不变 14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),问该食物中毒的平均潜伏期为多少小时 C 6 15.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:D变异系数 16.下列哪个公式可用于估计医学95%正常值范围 A X±1.96S 17.标准差越大的意义,下列认识中错误的是B观察个体之间变异越小 18.正态分布是以E均数为中心的频数分布 19.确定正常人的某项指标的正常范围时,调查对象是B排除影响研究指标的疾病和因素的人20.均数与标准差之间的关系是E标准差越小,均数代表性越大 21.从一个总体中抽取样本,产生抽样误差的原因是A总体中个体之间存在变异 22.两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则E愈有理由认为两总体均数不同 23.由10对(20个)数据组成的资料作配对t检验,其自由度等于C 9 24.t检验结果,P>0.05,可以认为B两样本均数差别无显着性 25.下列哪项不是t检验的注意事项D分母不宜过小 26.在一项抽样研究中,当样本量逐渐增大时B标准误逐渐减少 27.t<t0.05(v),统计上可认为C两样本均数,差别无显着性 28.两样本均数的t检验中,检验假设(H0)是 B μ1=μ2 29.同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠A. Sx 30.标准差与标准误的关系是:C前者大于后者 31在同一正态总体中随机抽取含量为n的样本,理论上有95%的总体均数在何者范围内C均数加减1.96倍的标准误 32.同一自由度下,P值增大C t值减小 33.两样本作均数差别的t检验,要求资料分布近似正态,还要求D两样本总体方差相等 34.构成比的重要特点是各组成部分的百分比之和C一定等于1 35.计算相对数的目的是C为了便于比较

2017福师《生物统计学》答案

一、单选题(共 32 道试题,共 64 分。) V 1. 最小二乘法是指各实测点到回归直线的 A. 垂直距离的平方和最小 B. 垂直距离最小 C. 纵向距离的平方和最小 D. 纵向距离最小 2. 被观察到对象中的()对象称为() A. 部分,总体 B. 所有,样本 C. 所有,总体 D. 部分,样本 3. 必须排除______因素导致“结果出现”的可能,才能确定“结果出现”是处理因素导致的。只有确定了______,才能确定吃药后出现的病愈是药导致的。 A. 非处理因素,不吃药就不可能出现病愈 B. 处理因素,不吃药就不可能出现病愈 C. 非处理因素,吃药后确实出现了病愈 D. 处理因素,吃药后确实出现了病愈 4. 张三观察到李四服药后病好了。由于张三的观察是“个案”,因此不能确定______。 A. 确实进行了观察 B. 李四病好了 C. 病好的原因 D. 观察结果是可靠的 5. 四个样本率作比较,χ2>χ20.05,ν可认为

A. 各总体率不同或不全相同 B. 各总体率均不相同 C. 各样本率均不相同 D. 各样本率不同或不全相同 6. 下列哪种说法是错误的 A. 计算相对数尤其是率时应有足够的观察单位或观察次数 B. 分析大样本数据时可以构成比代替率 C. 应分别将分子和分母合计求合计率或平均率 D. 样本率或构成比的比较应作假设检验 7. 总体指的是()的()对象 A. 要研究,部分 B. 观察到,所有 C. 观察到,部分 D. 要研究,所有 8. 以下叙述中,除了______外,其余都是正确的。 A. 在比较未知参数是否不等于已知参数时,若p(X>x)<α/2,则x为小概率事件。 B. 在比较未知参数是否等于已知参数时,若p(X=x)<α,则x为小概率事件。 C. 在比较未知参数是否大于已知参数时,若p(X>x)<α,则x为小概率事件。 D. 在比较未知参数是否小于已知参数时,若p(X

2007级硕士研究生卫生统计学试卷(答案)

2007级硕士研究生卫生统计学试卷(答案及评分标准) 学号班级姓名考试成绩 一、名词解释(每小题2分,共12分) 1、复相关系数 R,度量应变量Y与多个自变量间得线性相关程度得指标,即观察值Y与回用R表示,R=2 归估计值y?之间得相关程度。 2、统计描述 指由统计指标、统计表、图等方法,对资料得数量特征及分布规律进行测定与描述,不涉及由样本推论总体得问题。 3.主效应 在析因设计资料得方差分析种,指某一因素各水平间得平均差别。 4、非参数检验 不依赖于总体分布得类型,对总体分布不做严格规定,对两个或多个总体分布得位置进行假设检验得方法。 5、假设检验 就是利用小概率反证法思想,从问题得对立面(H0)出发间接判断要解决得问题(H1)就是否成立。然后在H0成立得条件下计算检验统计量,最后获得P值来判断。这一过程称为假设检验。 6、平均发展速度 就是各环比发展速度得几何均数,说明某事物在一个较长时期中逐期平均发展得程度。 二、填空(每空0、5分,共10分) 1、调查144名30-40岁男子得血清胆固醇值近似服从正态分布,其均数为90 、3mg/dl,标准差为3 2、7mg/dl,则可推出该地30-40岁男子中约有__0、5 _%胆固醇在174、7mg/dl

以上,共有多少人 0、72(或1) 。 2、 拒绝H 0,只可能犯 第一类 错误,“接受” H 0只可能犯 第二类 错误。 3、 甲、乙、丙三地某两种传染病得发病率时,宜绘制_复式直条条__图、 4、 男、女两组儿童,人数分别为300及时250人,蛔虫感染率分别为35%及24%,其总感染 率为 30% ,总感染率得95%得置信区间为??? ? ? ??+?-550 7.03.096.13.0,550 7.03.096.13.0。 5、多个样本均数比较得方差分析其应用条件 各独立样本正态分布 与 方差齐性 。 6、 等级相关适用得条件就是 双变量非正态分布 , 总体分布型未知 , 等级资料 。 7、 两因素析因设计实验方差分析将处理组间变异分解为 A 因素得主效因、 B 因素得主效因 与 AB 得交互效应 。 8、 R ?C 表得2 χ检验,若表格中有一个方向按多个等级分类时,则称之为单向有序行列表, 当等级数大于3时,如检验各处理组各等级下得构成比有无差别时采用 2 χ检验 ,如检验各处理组各等级下得程度上有无差别时采用 秩与检验 。 9、 多元线性回归分析中自变量得选择方法有 全局择优法 与 逐步选择法 。 10、 r 就是 直线相关系数 (或称Pearson 积差相关系数) ,表示 具有直线关系得两变量间相关得密切程度与相关方向 。 三、最佳选择题(每小题1分,共20分) 1、 要表示某地区2003年SARS 患者得职业分布,可以绘制( C ) A 直条图 B 散点图 C 圆图 D 直方图 E 线图 2. 关于频数表得说法正确得就是( C ) A 都分为10个组段 B 每一个组段必须组距相等 C 从频数表中可以初步瞧出资料得频数分布类型 D 不就是连续型得资料没有办法编制频数表 E 频数表中得每一个组段不一定就是半开半闭得区间,可以任意指定

卫生统计学试题6含答案

. 统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

. A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

生物统计学试题及答案

一、填空 变量按其性质可以分为连续变量和非连续变量。 样本统计数是总体参数的估计量。 生物统计学是研究生命过程中以样本来推断总体的一门学科。 生物统计学的基本内容包括试验设计、统计分析两大部分。 统计学的发展过程经历了古典记录统计学、近代描述统计学、现代推断统计学3 个阶段。 生物学研究中,一般将样本容量n >30称为大样本。 试验误差可以分为随机误差、系统误差两类。 资料按生物的性状特征可分为数量性状资料变量和质量性状资料变量。 直方图适合于表示连续变量资料的次数分布。 变量的分布具有两个明显基本特征,即集中性和离散性。 反映变量集中性的特征数是平均数,反映变量离散性的特征数是变异数。 林星s= 样本标准差的计算公式s= 如果事件A和事件B为独立事件,则事件A与事件B同时发生地概率P (AB) = P(A)*P(B)。 二项分布的形状是由n和p两个参数决定的。 正态分布曲线上,卩确定曲线在x轴上的中心位置,c确定曲线的展开程度。样本平均数的标准误等于c Wi。 t分布曲线和正态分布曲线相比,顶部偏低,尾部偏高。

统计推断主要包括假设检验和参数估计两个方面。

参数估计包括点估计和区间估计假设检验首先要对总体提出假设,一般应作两个假设,一个是无效假设,一个是备择假设。 对一个大样本的平均数来说,一般将接受区和否定区的两个临界值写作卩-U a^x_ 卩+U a c x 在频率的假设检验中,当np或nq v30时,需进行连续性矫正。 2检验主要有3种用途:一个样本方差的同质性检验、适应性检验和独立性检验。 2检验中,在自由度df = (1)时,需要进行连续性矫正,其矫正的2 = ( p85 )。 2分布是连续型资料的分布,其取值区间为[0.+ %)。 猪的毛色受一对等位基因控制,检验两个纯合亲本的F2代性状分离比是否符合 孟德尔第一遗传规律应采用适应性检验法。 独立性检验的形式有多种,常利用列联表进行检验。 根据对处理效应的不同假定,方差分析中的数学模型可以分为固定模型、随机模型和混合模型混合模型3类。 在进行两因素或多因素试验时,通常应该设置重复,以正确估计试验误差,研究因素间的交互作用。 在方差分析中,对缺失数据进行弥补时,应使补上来数据后,误差平方和最小。方差分析必须满足正态性、可加性、方差同质性3个基本假定。 如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有平方根转换、对数转换、正反弦转换等。 相关系数的取值范围是[-1,1]O

生物统计学期末复习题库及答案

生物统计学期末复习题 库及答案 https://www.360docs.net/doc/9415653869.html,work Information Technology Company.2020YEAR

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 122--∑∑n n x x )(

判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1.下列变量中属于非连续性变量的是( C ). A.身高 B.体重 C.血型 D.血压 2.对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A.条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A.正态分布的算术平均数和几何平均数相等. B.正态分布的算术平均数和中位数相等. C.正态分布的中位数和几何平均数相等. D.正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a,其标准差(D)。 A.扩大√a倍 B.扩大a倍 C.扩大a2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是(C)。 A.标准差 B.方差 C.变异系数 D.平均数 第三章 填空

生物统计学试题及答案

生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() A.31 - x ~N(0,1) B.11 - x ~N(0,1) C.91 - x ~N(0,1) D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 C.前者比后者小 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() A.应用标准正态概率表查出u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 D.置信水平 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计 上称为( )。 A.方差的齐性检验 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 在一个有限总体中要随机抽样应采用放回式抽样方法。 12. 在实际抽样工作中,为了减小标准误,最常用的办法就是增大样品容量。 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F分布的临界值为 0.25 14. 衡量优良估计量的标准有无偏性、有效性和相容性。 15. 已知随机变量x服从 N (8,4),P(x < 4.71)= 0.05 。(填数字) 四.综合分析题(共60分) 16.何谓“小概率原理”?算术平均数有两条重要的性质,是什么? 小概率的事件,在一次试验中,几乎是不会发生的。若根据一定的假设条件,计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,从而否定假设。 算术平均数的性质: 1.离均差之和为零 2. 离均差平方之和最小 17.计算5只山羊产绒量:450, 450,500, 550, 550(g)的标准差。 标准差 18.一农场主租用一块河滩地,若无洪水则年终可获利20000元,若发洪水则会损失12000

《生物统计学》试题A

《生物统计学》基本知识题 一、填空题 第一章 1.填写下列符号的统计意义:①SS ②S x ③ S2 ④ SP xy。 2.t检验、u检验主要用于____ 组数据的差异显著性检验; F 检验主要用于____ _ 组数据的差异显著性检验。 3.试验误差指由因素引起的误差,它不可,但可 以和。 4.参数是由____计算得到的,统计量是由____计算得到的。 5.由样本数据计算得到的特征数叫,由总体数据计算 得到的特征数叫。 9.一般将原因产生的误差叫试验误差,它避免, 但可以和。 第二章 4.变异系数可用于当两个样本的、不同时 变异程度的比较。变异系数的计算公式为。 5.变异系数可用于当两个样本的、不同时 的比较。变异系数的计算公式为。 7.连续性随机变量等组距式次数分布表的编制方法步骤为: ①_____、②____、③____、④____、⑤___。 8.计算标准差的公式是S=。 9.变异系数的计算公式是CV=。 10. 标准差的作用是①、②、③。 12.算术平均数的两个重要性质是①②。 13.样本平均数的标准差叫。它与总体标准差的关系 是。 第三章 1.若随机变量x~N(μ,σ2),欲将其转换为u~N(0,1),则 标准化公式为u=。 第四 1.统计量与参数间的误差叫,其大小受①② ③的影响,其大小可以用来描述,计算公式 为。 2.抽样误差是指之差。抽样误差的大小可用来表 示。影响抽样误差的因素有、和。 6.在两个均数的显著性检验中,若检验结果是差异显著,则说 明。 7.在显著性检验时,当H0是正确的,检验结果却否定了H0,这 时犯的错误是:型错误。 8. 显著性检验时,犯Ⅰ型错误的概率等于。 9.显著性检验分为_______ 检验和______检验。 10.显著性检验的方法步骤为:、、。 12.若服从N(, 2)分布,则值服从分布, 值服从分布。 第五章 1.方差分析是以为检验对象的。在实际分析时常常以 作为它的估计值。 2.多重比较的方法有①和②两类;①一般适用于 组均数的检验,②适用于组均数间的检验。 3.多重比较的LSD法适用于组均数比较;LSR法适用于 组均数间的比较。 4.多重比较的方法有和两类。前者一般用于 组均数检验,后者又包含和法,适用于组 均数的比较。第六章 1.χ2 检验中,连续性矫正是指用性分布检验性数据所产生的差异,当或时,必须进行矫正。 2.在χ2检验时,当和时必须进行连续性矫正。3.χ2检验中,当或时,必须进行连续性矫正,矫正方法有_____ 和_____ 两种。 4.χ2检验的计算公式为χ2=,当、时,必须矫正,其矫正方法为、。 第七章 1.在直线相关回归分析中,相关系数显著,说明两变量间直线相关关系。 2.相关系数的大小,说明相关的紧密程度,其说明相关的性质。 相关系数r是用来描述两变量之间相关的和的指标,r 的正负号表示相关的,r的绝对值大小说明相关的。 3.变量间存在的关系,统计上称为相关关系。 4.回归分析中表示,byx表示,。 5.在回归方程中,表示依变量的,b表示,a表示。 6.已知r=-0.589*,则变量间存在的直线相关关系。 7.统计分析中,用统计量来描述两个变量间的直线相关关系,其取值范围为,其绝对值的大小说明相关的,其正负符号说明相关的。 第九章 1.试验设计的基本原则是、和。 二、单选题 1.比较胸围与体重资料的变异程度,以最好。 a.标准差b.均方c.全距d.变异系数 2.比较身高与体重两变量间的变异程度,用统计量较合适。 ①CV ②S ③R ④S2 4.若原始数据同加(或同减)一个常数,则。 a不变,S改变b.S不变,改变 c.两者均改变d.两者均不改变 5.比较身高和体重资料的变异程度,以指标最好。 a.CV b.Sc.Rd.S2 6.离均差平方和的代表符号是。 a.∑(x- )2 b.SP c.SS 7 .样本离均差平方和的代表符号是。 ①S2 ②③ ④SS 8. 愈小,表示用该样本平均数估计总体均数的可靠性愈大。 ①变异系数②标准差 ③全距④标准误 1.二项分布、Poisson分布、正态分布各有几个参数:() A、 (1,1,1 ) B、 (2,2,2) C、 (2,1, 2) D、 (2,2,1 ) 2.第一类错误是下列哪一种概率:()

硕士研究生卫生统计学试卷(答案)

2007级硕士研究生卫生统计学试卷(答案及评分标准) 学号班级姓名考试成绩 一、名词解释(每小题2分,共12分) 1. 复相关系数 用R表示,R=2 R,度量应变量Y与多个自变量间的线性相关程度的指标,即观察值Y 与回归估计值y?之间的相关程度。 2. 统计描述 指由统计指标、统计表、图等方法,对资料的数量特征及分布规律进行测定和描述,不涉及由样本推论总体的问题。 3.主效应 在析因设计资料的方差分析种,指某一因素各水平间的平均差别。 4. 非参数检验 不依赖于总体分布的类型,对总体分布不做严格规定,对两个或多个总体分布的位置进行假设检验的方法。 5. 假设检验 是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。这一过程称为假设检验。 6. 平均发展速度 是各环比发展速度的几何均数,说明某事物在一个较长时期中逐期平均发展的程度。 二、填空(每空0.5分,共10分)

1. 调查144名30-40岁男子的血清胆固醇值近似服从正态分布,其均数为90 .3mg/dl ,标准差为3 2.7mg/dl ,则可推出该地30-40岁男子中约有__0.5 _%胆固醇在174.7mg/dl 以上,共有多少人 0.72(或1) 。 2. 拒绝H 0,只可能犯 第一类 错误,“接受” H 0只可能犯 第二类 错误。 3. 甲、乙、丙三地某两种传染病的发病率时,宜绘制_复式直条条__图. 4. 男、女两组儿童,人数分别为300及时250人,蛔虫感染率分别为35%及24%,其总感 染率为 30% ,总感染率的95%的置信区间为??? ? ? ??+?-550 7.03.096.13.0,550 7.03.096.13.0。 5.多个样本均数比较的方差分析其应用条件 各独立样本正态分布 和 方差齐性 。 6. 等级相关适用的条件是 双变量非正态分布 , 总体分布型未知 , 等级资料 。 7. 两因素析因设计实验方差分析将处理组间变异分解为 A 因素的主效因、 B 因素的主效因 和 AB 的交互效应 。 8. R ?C 表的2 χ检验,若表格中有一个方向按多个等级分类时,则称之为单向有序行列表, 当等级数大于3时,如检验各处理组各等级下的构成比有无差别时采用 2 χ检验 ,如检验各处理组各等级下的程度上有无差别时采用 秩和检验 。 9. 多元线性回归分析中自变量的选择方法有 全局择优法 和 逐步选择法 。 10. r 是 直线相关系数 (或称Pearson 积差相关系数) ,表示 具有直线关系的两变量间相关的密切程度与相关方向 。 三、最佳选择题(每小题1分,共20分) 1. 要表示某地区2003年SARS 患者的职业分布,可以绘制( C ) A 直条图 B 散点图 C 圆图 D 直方图 E 线图 2. 关于频数表的说法正确的是( C ) A 都分为10个组段 B 每一个组段必须组距相等

卫生统计学试题6含答案

统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

关于生物统计学复习题

生物统计学复习题 一、名词解释 交互作用:表示当两种或几种因素水平同时作用时的效果较单一水平因素作用的效果加强或者减弱的作用。当因素间的互作效应为零时,称该因素间无交互作用,此时的因素是相互独立的因素。 回归系数:回归分析中度量依变量对自变量的相依程度的指标,它反映当自变量每变化一个单位时,依变量所期望的变化量。 整群抽样:就是将总体划分为若干个小群体,再随机抽取部分小群体组成样本。 F检验:即统计假设的显著性检验,用于推断处理间的差异是否存在。在计算F值时,以被检验因素的均方(即处理间均方S t2)作分子,以误差均方(即处理内均方S e2)作分母。(没找到) 无效假设:不管样本是否真的属于总体A,都首先假设是,即假定“X与μ间的差异源自误差,并非本质差异”,这就是无效假设,记H0。 相关变量:统计学把存在关联但并非确定的数量关系称为相关关系, 把存在相关关系的变量称为相关变量。 决定系数:是变量X引起Y变异的回归平方和占Y变异总平方和的比率,为相关系数r的平方。取值范围:0~1。 独立变量:一个量改变不会引起除因变量以外的其他量的改变,则称这个量为独立变量。 相关系数:就是两变量离均差乘积和平均数的标准化值。 分层抽样:又叫分类抽样。先按某种特征将总体分为若干个层次(strata),在每一层内随机抽取亚层,直到最后一层对观察单位随机抽样。(比如资源调查中按片区→地区→局部区域等分成若干个地域层次。) 单位组:(相当于一个区组) 在盆栽和动物试验中,为随机分配到各个处理而挑选出来的尽可能一致的一组试验单位。不同单位组可分别安排在有条件差异的场所。 随机样本:在抽样过程中, 通过一定的方法和条件控制, 尽可能确保总体中的每一个体都有同等的机会被抽到, 这样的抽样方法叫随机抽样(random sampling)。通过随机抽样所得到的样本叫随机样本, 通常简称样本。 概率抽样:又叫随机抽样,就是调查研究对象的总体中每个部分都有被抽中的相同几率,是一种完全依照机会均等的原则进行的等概率抽样。随机抽样又有四种不同的方法。 局部控制:将存在明显差异的整个试验环境分成若干个小区域,使小区域内的差异尽可能小,然后将处理内的试验单位随机分组并随机安排到各个区域中,从而实现不同处理在小区域内相互比较,这就是局部控制。 参数估计:是统计推断除假设检验的另一个方面,是指由样本结果对总体参数在一定概率水平下所作出的估计。包括区间估计和点估计。 统计量:由样本观测值计算得到的描述样本特征的数值称为统计量或统计数。 系统误差:是由试验因素以外的某些确定性原因引起的误差, 也称偏差(bias)或片面误差(lopsided error) 中心极限定理:如果原总体呈偏态态分布, 则随着样本容量n的增大,样本均数或率的抽样分布就逐步趋近于正态分布, 这就是中心极限定理。 点估计:就是直接用标定μ可能出现的位置,并指出在一定概率(1—α)保证下μ以这个位置点为中心的可能出现 范围。 因素水平:是指实验中每个因素的不同设置或组别,简称水平。 总体:是指包含了具有某种共同属性的所有个体的集合, 这里的“共同属性”依研究目的、研究对象不同而变。 参数:由总体各观测值所计算得到的用来描述总体特征的数值称为参数(parameter) 完全事件系:若事件A1、A2、…、An两两互斥, 且每次试验必有一件发生, 则“事件A1、A2、…、An任中发生一件”就是必然事件, 这样的一系列事件就是一个完全事件系。 小概率事件:从概率密度函数曲线两端开始向中间累加概率值,到累积概率值 一特定值α时为止就划定出变量的两个区域,变量值出现在这两个区域内就是小概率事件。 试验因素:是指对性状表现可能有影响的试验研究项目或内容, 简称因素。 样本:从总体抽出的对总体具有代表性的一小部分个体组成的小群体就叫样本(sample)。 随机误差:由于试验过程中各种偶然因素的影响而造成的误差。一个观察值上的随机误差大小, 事先完全没有确定性, 找不出引起误差的确切原因, 所以也叫偶然性误差 概率分布:概率随变量实际取值Xi不同而变的变化规律与特征就是概率分布, 可用图表或函数式描述。

2002级硕士研究生卫生统计学考试试题

2002级硕士研究生卫生统计学考试试题 一、最佳选择题(每题2分,共30分) 1.二项分布、Poisson分布和正态分布各有几个参数: A1,1,1 B 2,2,2 C 2,1,2 D 2,2,1 2.假定某细菌的菌落数服从Poisson分布,今观察得平均菌落数为9,问菌落数的标准差为:A18 B 9 C 3 D 81 3.开展一项科学研究,何时开始运用统计学知识? A有了实验数据之后 B 有了试验设计之后 C 从最初的试验设计开始D 从计算机算出结果开始 4.某疗养院测得1096名飞行员红细胞数(万/mm)经检验该资料服从正态分布,其均值为414.1万/mm,标准差为42.8万/mm,求得的区间(303.67,524.52万/mm)称为红细胞数的:A99%的正常值范围 B 95%的正常值范围 C 95%可信区间 D 99%可信区间5.在众多的变异指标中,有一种可以用于比较单位不同的任何两组定量资料的变异性大小,它就是: A标准差 B 相关系数 C 变异系数 D 标准误 6.在进行成组设计的t检验或进行方差分析之前,要注意两个前提条件,一要考查各样本是否来自正态总体,二要: A核对数据 B 作方差齐性检验 C 作变量变换 D 求均数、标准差和标准误 7.将样本含量n的值、观测指标的一系列具体的值和某些特定的常数代入某统计公式计算,得一个具体的值。通常称此公式所代表的变量为: A参数 B 均值 C 统计量 D 标准误 8.对于t分布来说,固定显著性水平α的值,随着自由度的增大,t的临界值将会怎样变化: A 增大 B 减少 C 不变 D可能变大,也可能变小 9.标准正态分布的均数与标准差分别为。 A 0与1 B 1与0 C 1与1 D 0与0 10.成组设计的方差分析中,必然有。 A SS 组内〈 SS 组间 B MS 组间 〈 MS 组内 C MS 总 =MS 组间 +MS 组内 D SS 总 =SS 组间 +SS 组内 11.四个样本率作比较,X2>X2 0.01(3) ,可认为。 A 各总体率不同或不全相同 B 各总体率均不相同 C 各样本率均不相同 D 各样本率不同或不全相同 12.等级资料比较宜用。 A t检验 B X2检验 C 秩和检验 D F检验 13.有两个独立随机的样本,样本含量分别为n 1和n 2 ,在进行成组设计资料的t检验时, 自由度应该是。 A n 1+n 2 B n 1 +n 2 -1 C n 1 +n 2 +1 D n 1 +n 2 –2 14.统计推断的内容。 A 是用样本指标估计相应总体指标 B 是检验统计上的“假设” C a,b均不是 D a,b均是 15. 调查200名学生,记录每一名学生中口腔中有几颗龋齿,该资料是A定性资料 B 定量资料 C 连续资料 D 等级资料

相关文档
最新文档