南京财经大学考研真题统计学2011(专硕)

南京财经大学

2011年攻读硕士学位研究生入学考试（初试）试卷A

考试科目：432统计学适用专业：应用统计硕士满分150分

考试时间：2011年1月16日下午2：00——5：00

注意事项：所有答案必须写在答题纸上，做在试卷或草稿纸上无效；

请认真阅读答题纸上的注意事项，试题随答卷一起装入试题袋中交回。注：答题过程中可能要用到的数据：u0.975=1.96,u0.95=1.65,t0.95(9)=1.833, t0.95(10)=1.812, t0.975(9)=2.262, t0.975(10)=2.228

一、单项选择题（本题包括1-30题共30个小题，每小题1分，共30分。在每小题给出的四个选项中，只有一个符合题目要求，把所选项前的字母填在答题纸相应的序号内）。

1.从含有N个元素的总体中，抽取n个元素作为样本，使得总体中的每一个元素都有相同的机会（概率）被抽中，这样的抽样方式称为（）。

A.简单随机抽样

B.分层抽样

C.系统抽样

D.整群抽样

2.一家公司的人力资源部主管需要研究公司雇员的饮食习惯，改善公司餐厅的现状。他将问卷发给就餐者，填上后再收上来。他的收集数据的方法属于（）。

A.自填式问卷调查

B.面访式问卷调查

C.实验调查

D.观察式调查

3.将全部变量值依次划分为若干个区间，并将这一区间的变量值作为一组，这样的分组方法称为（）。

A.单变量值分组

B.组距分组

C.等距分组

D.连续分组

4.将某企业职工的月收入依次分为2000元以下、2000元-3000元、3000元-4000元、4000元-5000元。5000元以上几个组。第一组的组中值近似为（）。

A.2000

B.1000

C.1500

D.2500

5.经验法则表明，当一组数据对称分布时，在平均数加减1个标准差的范围内大约有（）。

A.68%的数据

B. 95%的数据

C. 99%的数据

D. 89%的数据

6.在比较两组数据的离散程度时，不能直接比较它们的标准差，因为两组数据的（）。

A.标准差不同

B.方差不同

C.数据个数不同

D.计量单位不同

7.在一家宾馆门口等待出租车的时间是左偏的，均值为12分钟，标准差为3分钟。如果从宾馆门口随机抽取100名顾客并记录他们等待出租车的时间，则该样本均值的分布服从（）。

A.正态分布，均值为12分钟，标准差为0.3分钟

B.正态分布，均值为12分钟，标准差为3分钟

C.左偏分布，均值为12分钟，标准差为3分钟

D.左偏分布，均值为12分钟，标准差为0.3分钟

8.一个95%的置信区间是指（）。

A.总体参数有95%的概率落在这一区间内

B.总体参数有5%的概率未落在这一区间内

C.在用同样方法构造的总体参数的多个区间中，有95%的区间包含该总体参数

D.在用同样方法构造的总体参数的多个区间中，有95%的区间不包含该总体参数

9.从一个正态总体中随机抽取n=20的一个样本，样本均值为17.25，样本标准差为3.3。则总体均值的95%的置信区间为（）。

A.（15.97, 18.53）

B.（15.71，18.79）

C.（15.14，19.36）

D.（14.89，20.45）

10.一项研究表明，司机驾车时因接打手机而发生事故的比例超过20%，用来检验这一结论的原假设和备择假设应为（）。

A.01:20%,:20%H H ππ=≠

B. 01:20%,:20%H H ππ≠=

C. 01:20%,:20%H H ππ≥<

D. 01:20%,:20%H H ππ≤>

11.一项调查表明，5年前每个家庭每天看电视的平均时间为6.7小时。而最近对200个家庭的调查结果是：每个家庭每天看电视的平均时间为7.25小时，标准差为2.5小时。在0.05α=的显著性水平下，检验假设01: 6.7,: 6.7H H μμ≤>，得到的结论为（）。

A.拒绝0H

B.不拒绝0H

C.可以拒绝也可以不拒绝0H

D. 可能拒绝也可能不拒绝0H

12.如果变量之间的关系近似地表现为一条直线，则称两个变量之间为（）。

A.正线性相关关系

B.负线性相关关系

C.线性相关关系

D.非线性相关关系

13.在一元线性回归方程中，回归系数1β的实际意义是（）。

A.当x=0时，y 的期望值

B.当x 变动一个单位时，y 的平均变动数量

C.当x 变动一个单位时，y 增加的总数量

D.当y 变动一个单位时，x 的平均变动数量

14.残差平方和SSE 反映了y 的总变差中（）。

A.由于x 和y 之间的线性关系引起的y 的变化部分

B.除了x 对y 的线性影响之外的其他因素对y 变差的影响

C.由于x 和y 之间的非线性关系引起的y 的变化部分

D.由于x 和y 之间的函数关系引起的y 的变化部分

15.在多元线性回归分析中，如果t 检验表明回归系数i β不显著，则意味着（）。

A.整个回归方程的线性关系不显著

B.整个回归方程的线性关系显著

C.自变量i x 与因变量之间的线性关系不显著

D.自变量i x 与因变量之间的线性关系显著

16.一家出租车公司为确定合理的管理费用，需要研究出租车司机每天的收入（元）与他的行驶时间（小时）、行驶的里程（公里）之间的关系，为此随机调查了20位出租车司机，根据每天的收入（y ）、行驶时间（1x ）和行驶的里程（2x ）的有关数据进行回归，得到下面的有关结果（0.05α=）：

方程的截距0?β=42.38 截距的标准差0

?s β=36.59 回归平方和SSR=29882 回归系数1?β=9.16 回归系数的标准差1

?s β=4.78 残差平方和SSE=5205 回归系数2?β=0.46 回归系数的标准差2

?s β=0.14 根据以上结果计算的判定系数为（）。

A.0.9229

B.1.1483

C.0.3852

D.0.8516

17.多重相关系数2R 的平方根度量了（）。

A.k 个自变量之间的相关程度

B.因变量同k 个自变量之间的相关程度

C.因变量之间的相关程度

D.因变量同某个自变量之间的相关程度

18.时间序列在长期内呈现出来的某种持续向上或持续下降的变动称为（）。

A.趋势

B.季节性

C.周期性

D.随机性

19.某地区农民家庭的年平均收入2004年为1500元，2005年增长了8%，那么2005年比2004年相比，每增长1个百分点增加的收入额为（）。

A.7元

B.8元

C.15元

D.40元

20.拉氏指数方法是指在编制价格综合指数时（）。

A.用基期的销售量加权

B.用报告期的销售量加权

C.用固定某一时期的销售量加权

D.选择有代表性时期的销售量加权

21.指出下列指数公式中哪个是帕氏价格指数公式（）。 A.∑∑0011q p q p B. ∑∑101

1q p q p C. ∑∑0001

q p q p D. ∑∑0111q p q p

22.某地区2009年的零售价格指数为108%，这说明（）。

A.商品销售量增长了8%

B.商品销售价格平均增长了8%

C.由于价格变动使销售量增长了8%

D.由于销售量变动使价格增长了8%

23.对于正偏（右偏）分布，平均数、中位数和众数之间的关系是（）。

A.平均数>中位数>众数

B.中位数>平均数>众数

C.众数>中位数>平均数

D.众数>平均数>中位数

24.指出下面的说法哪一个是正确的（）。

A.置信水平越大，估计的可靠性越大

B.置信水平越大，估计的可靠性越小

C.置信水平越小，估计的可靠性越大

D.置信水平的大小与估计的可靠性无关

25.在多元回归分析中，多重共线性是指模型中（）。

A.两个或两个以上的自变量彼此相关

B.两个或两个以上的自变量彼此无关

C.因变量与一个自变量相关

D.因变量与两个或两个以上的自变量相关

26.设1)(0<

27.设)4,(~2μN X ，)5,(~2

μN Y ，

记1)4(p X P =-≤μ，2)5(p Y P =+≥μ，则（）。 A.对任意实数μ有21p p = B. 21p p <

C. 21p p >

D. 只对μ的个别值才有21p p =

28.设两个相互独立的随机变量X 和Y ，分别服从正态分布N(0,1)和N(1,1)，则（）。

29.已知),(~p n B X ，EX =2.4，DX =1.44，则二项分布的参数为（）。

30.一家计算机软件开发公司的人事部门最近做了一项调查，发现在最近两年内离职的公司员工中有40%是因为对工资不满意，有30%是因为对工作不满意，有15%是因为他们对工资和工作都不满意。则两年内离职的员工中，离职原因是因为对工资不满意、或者对工作不满意、或者两者皆有的概率为（）。

二、简要回答下列问题（本题包括1-6题共6个小题，每小题5分，共30分）。

1.举例说明总体、样本、参数、统计量这几个概念及他们之间的区别和联系。

2.简述众数、中位数和平均数的特点和应用场合。

3.简述影响抽样误差大小的因素有哪些。

4.简述假设检验的基本思想。

5.简述大数定理在统计研究中的方法论意义。

6.正态分布的概率密度函数)(X f 有两个参数μ和σ，请结合函数)(X f 的几何形状说明

μ和σ这两个参数的意义。

三、计算与分析题（本题包括1-6题共6个小题，每小题15分，共90分）

1. 某公司所属三个企业生产同种产品，2009年实际产量、计划完成情况及产品优质品率资料如下：

要求：（1）计算该公司产量计划完成百分比；

（2）计算该公司实际的优质品率。

2.现从某公司职工中随机抽取60人调查其工资收入情况，得到有关资料在下表，假定职工的月收入服从正态分布。

（1）以95%的置信度估计该公司工人的月平均工资所在范围；

（2）以95%的置信度估计月收入在1000元及以上工人所占比重。

3.为研究产品销售额和销售利润之间的关系，某公司对所属7家企业进行调查，设产品销售额为X （万元），销售利润为Y （万元）。对调查资料进行整理和计算，其结果如下：

∑x =795 ∑2x =72925 ∑y =1065 ∑2y =121475 ∑xy =93200

要求：（1）计算销售额与销售利润之间的相关系数：

（2）配合销售利润对销售额的直线回归方程bx a y c +=。

（3）解释回归系数b 的经济意义。

4.某企业声明有30%以上的消费者对其产品质量满意。如果随机调查600名消费者，表示对该企业产品满意的有220人。试在显著性水平0.05下，检验调查结果是否支持企业的自我声明。

要求：(列表并写出计算公式及计算过程)

(1)计算三个地区总的平均价格指数。

(2)用相对数和绝对数分析说明三个地区总的平均价格变动中，各地区价格变动和销售

量结构的变动的影响。

6.有一大批产品，其验收方案如下，先作第一次检验：从中取10件，经检验无次品接受这批产品，次品数大于2拒收；否则作第二次检验，其做法是从中再任取5件，仅当5件中无次品时接受这批产品。若产品的次品率为10%，求：

（1）这批产品经第一次检验就能接受的概率。

（2）需作第二次检验的概率。

（3）这批产品按第二次检验的标准被接受的概率。

（4）这批产品在第一次检验未能做决定且第二次检验时被通过的概率。

（5）这批产品被接受的概率。

卫生统计学考研

卫生统计学（Health Statistics）课程编号：学分数 5 周学时 4 课程性质：医学基础课预修课程：教学目的：掌握研究设计方法、基本的统计原理和方法，并能够将其应用于居民健康状况研究、医疗卫生研究和医学科研。通过本课程的教学，帮助学生培养透过偶然现象探测事物内在规律的思维能力，使学生能应用统计的思维分析方法，有效地开展各项医疗卫生工作和研究工作。基本内容：研究设计、基本统计原理、常用的统计推断方法基本要求：学生应按本大纲具体要求，掌握统计学基本原理、常用的统计分析方法和科学的研究设计方法。能够进行合理地研究设计，科学地搜集、整理、分析数据资料，作出合理推断，能够理论联系实际，分析解决实际问题。教学用书：倪纵瓒主编《卫生统计学》，人民卫生出版社，2001年1月教学内容、要求和课时安排：一、绪论（学时数：2）教学内容卫生统计学的内容，统计工作的步骤，统计资料的类型，统计中的几个基本概念，学习卫生统计学应注意的问题。教学要求 1.掌握：统计中的几个基本概念：随机现象，概率，总体，样本，抽样误差，统计资料的类型。 2.熟悉：统计工作的一般步骤。 3.了解卫生统计学的主要内容，学习过程中应该注意的问题。二、计量资料的描述（学时数：6+2）教学内容 1．计量资料的频数表、图 2．计量资料的统计描述指标集中趋势：均数，几何均数，中位数，百分位数；离散趋势：极差和四分位数间距，方差和标准差，变异系数3．正态分布的概念和特征，正态曲线下面积分布规律，正态分布的应用，对数正态分布。教学要求 1.掌握：计量资料的频数表。常用集中趋势指标的意义及适用范围。正态分布曲线下的面积分配规律。 2.熟悉：常用集中趋势、离散趋势指标的计算方法。正常值范围的意义和制定方法。

卫生统计学案例版丁元林课后思考题答案

第一章:ECDBB 第二章:BDABC 第三章:DEBCD AEA 第四章:DCCDD DCBD 第五章:DCBDB AEEEC 第六章:CBEDC DDDDA 第七章:ACCBB DACEA 第八章:ABCDD BDADB 第九章:DDBCD AEA 第十章:BDCCE BDAEA 第十一章:CAEDC DBCCD 第十二章:BCAEE BA 第十三章:DDBCC BCDE 第十四章:无第十五章:无第十六章:无第十七章:DBABC BDE 第十八章:无第十九章:BDCDC CCADC 《卫生统计学》思考题参考答案第一章绪论 1、统计资料可以分为那几种类型？举例说明不同类型资料之间是如何转换的？答：（1）1定量资料（离散型变量、连续型变量）、2无序分类资料（二项分类资料、无序多项分类资料）、3有序分类资料（即等级资料）；（2）例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级，应归为等级资料，若将该五个等级赋值为5、4、3、2、1，就可按定量资料处理。 2、统计工作可分为那几个步骤？答：设计、收集资料、整理资料、分析资料四个步骤。 3、举例说明小概率事件的含义。答：某人打靶100次，中靶次数少于等于5，那么该人一次打中靶的概率≤0.05，即可称该人一次打中靶的事件为小概率事件，可以视为很可能不发生。第二章调查研究设计 1、调查研究有何特点？答：（1）不能人为施加干预措施（2）不能随机分组（3）很难控制干扰因素（4）一般不能下因果结论 2、四种常用的抽样方法各有什么特点？答：（1）单纯随机抽样：优点是操作简单，统计量的计算较简便；缺点是当总体观察单位数量庞大时，逐一编号繁复，有时难以做到。（2）系统抽样：优点是易于理解、操作简便，被抽到的观察单位在总体中分布均匀，抽样误差较单纯随机抽样小；缺点是在某些情况下会出现偏性或周期性变化。（3）分层抽样：优点是抽样误差小，各层可以独立进行统计分析，适合大规模统计；缺点是事先要进行分层，操作麻烦。

2007级硕士研究生卫生统计学试卷(答案)

2007级硕士研究生卫生统计学试卷(答案及评分标准) 学号班级姓名考试成绩一、名词解释(每小题2分,共12分) 1、复相关系数 R,度量应变量Y与多个自变量间得线性相关程度得指标,即观察值Y与回用R表示,R=2 归估计值y?之间得相关程度。 2、统计描述指由统计指标、统计表、图等方法,对资料得数量特征及分布规律进行测定与描述,不涉及由样本推论总体得问题。 3.主效应在析因设计资料得方差分析种,指某一因素各水平间得平均差别。 4、非参数检验不依赖于总体分布得类型,对总体分布不做严格规定,对两个或多个总体分布得位置进行假设检验得方法。 5、假设检验就是利用小概率反证法思想,从问题得对立面(H0)出发间接判断要解决得问题(H1)就是否成立。然后在H0成立得条件下计算检验统计量,最后获得P值来判断。这一过程称为假设检验。 6、平均发展速度就是各环比发展速度得几何均数,说明某事物在一个较长时期中逐期平均发展得程度。二、填空(每空0、5分,共10分) 1、调查144名30-40岁男子得血清胆固醇值近似服从正态分布,其均数为90 、3mg/dl,标准差为3 2、7mg/dl,则可推出该地30-40岁男子中约有__0、5 _％胆固醇在174、7mg/dl

以上,共有多少人 0、72(或1) 。 2、拒绝H 0,只可能犯第一类错误,“接受” H 0只可能犯第二类错误。 3、甲、乙、丙三地某两种传染病得发病率时,宜绘制_复式直条条__图、 4、男、女两组儿童,人数分别为300及时250人,蛔虫感染率分别为35%及24%,其总感染率为 30% ,总感染率得95%得置信区间为??? ? ? ??+?-550 7.03.096.13.0,550 7.03.096.13.0。 5、多个样本均数比较得方差分析其应用条件各独立样本正态分布与方差齐性。 6、等级相关适用得条件就是双变量非正态分布 , 总体分布型未知 , 等级资料。 7、两因素析因设计实验方差分析将处理组间变异分解为 A 因素得主效因、 B 因素得主效因与 AB 得交互效应。 8、 R ?C 表得2 χ检验,若表格中有一个方向按多个等级分类时,则称之为单向有序行列表, 当等级数大于3时,如检验各处理组各等级下得构成比有无差别时采用 2 χ检验 ,如检验各处理组各等级下得程度上有无差别时采用秩与检验。 9、多元线性回归分析中自变量得选择方法有全局择优法与逐步选择法。 10、 r 就是直线相关系数 (或称Pearson 积差相关系数) ,表示具有直线关系得两变量间相关得密切程度与相关方向。三、最佳选择题(每小题1分,共20分) 1、要表示某地区2003年SARS 患者得职业分布,可以绘制( C ) A 直条图 B 散点图 C 圆图 D 直方图 E 线图 2．关于频数表得说法正确得就是( C ) A 都分为10个组段 B 每一个组段必须组距相等 C 从频数表中可以初步瞧出资料得频数分布类型 D 不就是连续型得资料没有办法编制频数表 E 频数表中得每一个组段不一定就是半开半闭得区间,可以任意指定

硕士研究生卫生统计学试卷(答案)

2007级硕士研究生卫生统计学试卷（答案及评分标准）学号班级姓名考试成绩一、名词解释（每小题2分，共12分） 1. 复相关系数用R表示，R=2 R，度量应变量Y与多个自变量间的线性相关程度的指标，即观察值Y 与回归估计值y?之间的相关程度。 2. 统计描述指由统计指标、统计表、图等方法，对资料的数量特征及分布规律进行测定和描述，不涉及由样本推论总体的问题。 3.主效应在析因设计资料的方差分析种，指某一因素各水平间的平均差别。 4. 非参数检验不依赖于总体分布的类型，对总体分布不做严格规定，对两个或多个总体分布的位置进行假设检验的方法。 5. 假设检验是利用小概率反证法思想，从问题的对立面（H0）出发间接判断要解决的问题（H1）是否成立。然后在H0成立的条件下计算检验统计量，最后获得P值来判断。这一过程称为假设检验。 6. 平均发展速度是各环比发展速度的几何均数，说明某事物在一个较长时期中逐期平均发展的程度。二、填空（每空0.5分，共10分）

1. 调查144名30-40岁男子的血清胆固醇值近似服从正态分布，其均数为90 .3mg/dl ，标准差为3 2.7mg/dl ，则可推出该地30-40岁男子中约有__0.5 _％胆固醇在174.7mg/dl 以上，共有多少人 0.72(或1) 。 2. 拒绝H 0，只可能犯第一类错误，“接受” H 0只可能犯第二类错误。 3. 甲、乙、丙三地某两种传染病的发病率时，宜绘制_复式直条条__图. 4. 男、女两组儿童，人数分别为300及时250人，蛔虫感染率分别为35%及24%，其总感染率为 30% ，总感染率的95%的置信区间为??? ? ? ??+?-550 7.03.096.13.0,550 7.03.096.13.0。 5.多个样本均数比较的方差分析其应用条件各独立样本正态分布和方差齐性。 6. 等级相关适用的条件是双变量非正态分布，总体分布型未知，等级资料。 7. 两因素析因设计实验方差分析将处理组间变异分解为 A 因素的主效因、 B 因素的主效因和 AB 的交互效应。 8. R ?C 表的2 χ检验，若表格中有一个方向按多个等级分类时，则称之为单向有序行列表，当等级数大于3时，如检验各处理组各等级下的构成比有无差别时采用 2 χ检验，如检验各处理组各等级下的程度上有无差别时采用秩和检验。 9. 多元线性回归分析中自变量的选择方法有全局择优法和逐步选择法。 10. r 是直线相关系数（或称Pearson 积差相关系数），表示具有直线关系的两变量间相关的密切程度与相关方向。三、最佳选择题（每小题1分，共20分） 1. 要表示某地区2003年SARS 患者的职业分布，可以绘制（ C ） A 直条图 B 散点图 C 圆图 D 直方图 E 线图 2．关于频数表的说法正确的是（ C ） A 都分为10个组段 B 每一个组段必须组距相等

2002级硕士研究生卫生统计学考试试题

2002级硕士研究生卫生统计学考试试题一、最佳选择题（每题2分，共30分） 1．二项分布、Poisson分布和正态分布各有几个参数： A1，1，1 B 2，2，2 C 2，1，2 D 2，2，1 2．假定某细菌的菌落数服从Poisson分布，今观察得平均菌落数为9，问菌落数的标准差为：A18 B 9 C 3 D 81 3．开展一项科学研究，何时开始运用统计学知识？ A有了实验数据之后 B 有了试验设计之后 C 从最初的试验设计开始D 从计算机算出结果开始 4．某疗养院测得1096名飞行员红细胞数（万/mm）经检验该资料服从正态分布，其均值为414.1万/mm，标准差为42.8万/mm，求得的区间（303.67，524.52万/mm）称为红细胞数的：A99%的正常值范围 B 95%的正常值范围 C 95%可信区间 D 99%可信区间5．在众多的变异指标中，有一种可以用于比较单位不同的任何两组定量资料的变异性大小，它就是： A标准差 B 相关系数 C 变异系数 D 标准误 6．在进行成组设计的t检验或进行方差分析之前，要注意两个前提条件，一要考查各样本是否来自正态总体，二要： A核对数据 B 作方差齐性检验 C 作变量变换 D 求均数、标准差和标准误 7．将样本含量n的值、观测指标的一系列具体的值和某些特定的常数代入某统计公式计算，得一个具体的值。通常称此公式所代表的变量为： A参数 B 均值 C 统计量 D 标准误 8．对于t分布来说，固定显著性水平α的值，随着自由度的增大，t的临界值将会怎样变化: A 增大 B 减少 C 不变 D可能变大，也可能变小 9．标准正态分布的均数与标准差分别为。 A 0与1 B 1与0 C 1与1 D 0与0 10．成组设计的方差分析中，必然有。 A SS 组内〈 SS 组间 B MS 组间〈 MS 组内 C MS 总 =MS 组间 +MS 组内 D SS 总 =SS 组间 +SS 组内 11．四个样本率作比较，Ｘ2＞Ｘ2 0．01（3），可认为。 A 各总体率不同或不全相同 B 各总体率均不相同 C 各样本率均不相同 D 各样本率不同或不全相同 12.等级资料比较宜用。 A t检验 B Ｘ2检验 C 秩和检验 D F检验 13．有两个独立随机的样本，样本含量分别为n 1和n 2 ，在进行成组设计资料的t检验时，自由度应该是。 A n 1+n 2 B n 1 +n 2 -1 C n 1 +n 2 +1 D n 1 +n 2 –2 14.统计推断的内容。 A 是用样本指标估计相应总体指标 B 是检验统计上的“假设” C a，b均不是 D a，b均是 15. 调查200名学生，记录每一名学生中口腔中有几颗龋齿，该资料是A定性资料 B 定量资料 C 连续资料 D 等级资料

浙大卫生综合考研真题353解析卫生统计学部分资料全

卫生统计真题考点一、名词解释 1.抽样误差：从同一样本中反复多次的随机抽取相同样本量的若干份样本，由于个体差异和偶然因数的影响，使得样本统计量与总体参数之间存在差异，这种差异就叫抽样误差，可通过增大样本量来减小抽样误差。 2.误差：实际观察值与客观真实值之差，样本指标与总体指标之差，包含系统误差，随机误差，非系统误差 3.动态数列：按照一定的时间顺序，将描述的某事物的一系列统计指标依次排列起来。用以观察和比较该事物在时间上的变化和发展趋势。统计指标可以是相对数、绝对数或平均数。动态分析指标有：绝对增长量、发展速度和增长速度、平均发展速度和平均增长速度。 4.死因构成：指全部死亡人数中，死于某死因者所占百分比，说明各种死因的相对重要性。 5.疾病分类：是在疾病命名法的基础上，考虑到对疾病的认识及防治需要，将一些具有共同特性的疾病归纳在一起，加以分类。 6.婴儿死亡率：IMR指某年活产儿中不满一周岁的死亡频率。是反映社会卫生状况、婴儿保健工作以及人群健康状况的重要指标之一，也是死亡统计指标中较敏感的指标。 7.人口金字塔：是将人口的性别和年龄资料结合起来，以图形的方式表达人口的性别和年龄构成。以年龄为纵轴，人口数为横轴，左男，右女而制定的两个相对应的直方图，可以分析过去人口的出生死亡情况以及今后人口的发展趋势。 8.生存率：病人能活到某一时点的概率。常用于对慢性疾病如恶性肿瘤及心血管疾病等的治疗效果评价或预后估计。 9.总和生育率：（表示每一个妇女一生平均生多少个孩子。是15-49岁年龄别生育率的总和。）假定同时出生的一代妇女，按照某年的年龄别生育水平度过其一生的生育历程，各年龄别生育率之和乘以年龄组组距，就是这一代妇女平均每人可能生育的子女数。 10.总生育率：指某年某地平举每千名育龄妇女的活产数，国际上以15-49作为育龄妇女的年龄界限。 11.负担系数：又称抚养比，是人口中非劳动年龄人数占劳动年龄人数之比，一般以15-64为劳动年龄， ≦14 ≧65为非劳动年龄。 12.发病率和患病率：发病率IR表示一定时期内，在可能发生某病的一定人群中新发生该病的强度。患病率PR指某时点上受检人数中现患某种疾病的频率。在一定人群是时间内有PR=IR*D。发病率表示发病危险性的直接指标，分子只包括新发病例，分母是总人年数，是个动态指标；而患病率常用于描述病程较长或发病时间不明确的疾病患病情况，分子包括新旧病例，分母是受检总人数，是个静态指标。 13.生存率和生存曲线：生存率是指观察对象经历tk个时段后仍存活的可能性。以生存时间为横轴，生存率为纵轴，将各个时间点所对应的生存率连接在一起的曲线称为生存曲线。 14.期望寿命：ex是指同时出生的一代人活到X岁时，尚能生存的平均年数。 15.总体和样本：根据研究目的所确定的同质观察单位的全体。可分为有限总体和无限总体。从总体中随机抽取部分观察单位，其观测结果的集合称谓样本，应具有代表性。 16.总体：根据研究目的所确定的同质观察单位的全体。可分为有限总体和无限总体。

南京医科大学考研卫生统计学统计基本复习题

医学统计学基础理论复习题一、是非题：（如判断该题正确则在题后括号内打“√”，判断该题错误则在题后括号内打“×”） 1．农村妇女生育情况调查结果如下所示，该资料类型为计量资料。（）生育胎次0 1 2 3 4 妇女人数 5 25 70 30 14 2．观察到50例某传染病的潜伏期，整理成频数表如下：这是计量资料。（）潜伏期(小时) 12～36～60～84～108～例数8 22 12 6 2 3. 身高的标准差比体重的大，因此，身高的变异程度比体重的大。（） 4. 所谓均数的标准误，其实就是样本均数的标准差。（） 5．在进行简单直线相关与回归分析时，相关系数r的显著性检验结果和回归系数b的显著性检验结果完全一致。（） 6. 从总体中抽出一部分个体就构成一个样本。（） 7.在进行成组设计资料的t检验中，H0：μ1=μ2，H1：μ1≠μ2，α=0.05。若检验的结果为P=0.065，则结论为两总体均数相等。（） 8.进行多元线性回归时，进入方程的自变量越多越好。（） 9.同一组资料作团体t检验，双侧检验的P值是单侧检验的2倍。（）10．医学统计学的全部内容就是对收集来的数据进行统计分析。（） 11.在直线回归分析中，要求因变量服从正态分布。（） 12.在进行三组均数的方差分析中，若检验的结果为P=0.015，则结论为三个总体均数都不相等。（） 13.进行多元线性回归时，如偏回归系数b1>b2，则指标X1对Y的作用大于X2对Y的作用（） 14.如果理论上A药确实有减肥作用，但在一次临床试验中，它的降低体重值和安慰剂的差异无统计学意义，可能是样本量太小。（） 15.如X1和Y之间的简单相关系数有统计学意义，则在多元逐步回归中， X1一定会被选入方程。（） 16.如X1和Y之间的简单相关系数无统计学意义，则在多元逐步回归中， X1一定不会被选入方程。（） 17.二个率进行比较的显著性检验中，用确切概率计算是最正确的。（） 18.如显著性检验的结论为A组均数大于B组，P＝0.0021，这时P表示该结论犯错误的可能性的大小。（） 19.回归分析中，回归系数越大，回归系数的标准误也越大。（） 20.正态分布的均数不一定比标准差大。（）二、填充题 1．当拒绝了实际上成立的H0时，称为犯______________误差，常用α表示；当不拒绝实际上不成立的H0时，称为犯______________误差，常用β表示；1–β又称为______________。要同时降低α和β值的唯一方法是_____________________。 2．服从正态分布的计量资料常用_________________表示其平均水平，用 _________________表示其离散程度；服从对数正态分布的计量资料常用_________________表示其平均水平；非正态分布的计量资料常用________________表示其平均水平，用_________________表示其离散程度。 3．方差分析的应用条件为_________________，_________________和

卫生统计学试题及答案解析1

卫试题1 一、选择题 1.对两个定量变量同时进行了直线相关和直线回归分析，r有统计学意义（P<0.05），则_____. A.b无统计学意义 B.b有高度统计学意义 C.b有统计学意义 D.不能肯定b有无统计学意义 E.a有统计学意义【答案】C 2.关于基于秩次的非参数检验，下列说法错误的是_____. A.符号秩和检验中，差值为零不参加编秩 B.两样本比较的秩和检验方法中的正态近似法为参数检验 C.当符合正态假定时，非参数检验犯II类错误的概率较参数检验大 D.当样本足够大时，秩和分布近似正态 E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异【答案】B 3.随机事件的概率为______. A.P=1 B.P=0 C.P=－0.5 D.0≤P≤1 E.－0.5 < p=""> 【答案】D 4.两样本均数比较，经t检验得出差别有统计学意义的结论时，P越小，说明______. A.两样本均数差别越大 B.两总体均数差别越大

C.越有理由认为两总体均数不同 D.越有理由认为两样本均数不同 E.越有理由认为两总体均数相同【答案】C 5.为研究缺氧对正常人心率的影响，有50名志愿者参加试验，分别测得试验前后的心率，应用何种统计检验方法来较好地分析此数据_____. A.配对t检验 B.成组t检验 C.成组秩和检验 D.配对秩和检验 E.两组方差齐性检验【答案】A 6.作符号秩和检验时，记统计量T为较小的秩和，则正确的是_____. A.T值越大P值越小 B.T值越大越有理由拒绝H0 C.P值与T值毫无联系 D.T值越小P值越小 E.以上都不对【答案】D 7.方差分析中要求______. A.各个样本均数相等 B.各个总体方差相等 C.各个总体均数相等 D.两样本方差相等 E.两个样本来自同一总体【答案】B 8.比较非典型肺炎和普通肺炎患者的白细胞计数水平，若，可作单侧检验。 A.已知二组患者的白细胞计数均降低

卫生统计学试题及答案1

一、选择题 1.对两个定量变量同时进行了直线相关和直线回归分析，r有统计学意义（P<），则_____. 无统计学意义有高度统计学意义有统计学意义 D.不能肯定b有无统计学意义有统计学意义【答案】C 2.关于基于秩次的非参数检验，下列说法错误的是_____. A.符号秩和检验中，差值为零不参加编秩 B.两样本比较的秩和检验方法中的正态近似法为参数检验 C.当符合正态假定时，非参数检验犯II类错误的概率较参数检验大 D.当样本足够大时，秩和分布近似正态 E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异【答案】B 3.随机事件的概率为______. =1

=－ ≤P≤1 E.－ < p=""> 【答案】D 4.两样本均数比较，经t检验得出差别有统计学意义的结论时，P越小，说明______. A.两样本均数差别越大 B.两总体均数差别越大 C.越有理由认为两总体均数不同 D.越有理由认为两样本均数不同 E.越有理由认为两总体均数相同【答案】C 5.为研究缺氧对正常人心率的影响，有50名志愿者参加试验，分别测得试验前后的心率，应用何种统计检验方法来较好地分析此数据_____. A.配对t检验 B.成组t检验 C.成组秩和检验

D.配对秩和检验 E.两组方差齐性检验【答案】A 6.作符号秩和检验时，记统计量T为较小的秩和，则正确的是_____. 值越大P值越小值越大越有理由拒绝H0 值与T值毫无联系值越小P值越小 E.以上都不对【答案】D 7.方差分析中要求______. A.各个样本均数相等 B.各个总体方差相等 C.各个总体均数相等 D.两样本方差相等 E.两个样本来自同一总体【答案】B 8.比较非典型肺炎和普通肺炎患者的白细胞计数水平，若，可作单侧检验。

2007级硕士研究生卫生统计学试卷(答案)

是利用小概率反证法思想，从问题的对立面（H0）出发间接判断要解决的问题（H1）是否成立。然后在H0成立的条件下计算检验统计量，最后获得P值来判断。这一过程称为假设检验。 6. 平均发展速度是各环比发展速度的几何均数，说明某事物在一个较长时期中逐期平均发展的程度。二、填空（每空0.5分，共10分） 1. 调查144名30-40岁男子的血清胆固醇值近似服从正态分布，其均数为90 .3mg/dl，标准差为3 2.7mg/dl，则可推出该地30-40岁男子中约有__0.5 _％胆固醇在174.7mg/dl以上，共有多少人0.72(或1) 。 2. 拒绝H0，只可能犯第一类错误，“接受”H0只可能犯第二类错误。 3. 甲、乙、丙三地某两种传染病的发病率时，宜绘制_复式直条条__图. 4. 男、女两组儿童，人数分别为300及时250人，蛔虫

感染率分别为35%及24%，其总感染率为 30% ，总感染率的95%的置信区间为???? ???+?-5507.03.096.13.0,5507.03.096.13.0。 5.多个样本均数比较的方差分析其应用条件各独立样本正态分布和方差齐性。 6. 等级相关适用的条件是双变量非正态分布，总体分布型未知，等级资料。 7. 两因素析因设计实验方差分析将处理组间变异分解为 A 因素的主效因、 B 因素的主效因和 AB 的交互效应。 8. R ?C 表的2χ检验，若表格中有一个方向按多个等级分类时，则称之为单向有序行列表，当等级数大于3时，如检验各处理组各等级下的构成比有无差别时采用 2χ检验，如检验各处理组各等级下的程度上有无差别时采用秩和检验。 9. 多元线性回归分析中自变量的选择方法有全局择优法和逐步选择法。

2005级研究生卫生统计学考试题1

2005级研究生卫生统计学考试题1 一、最佳选择题（每题1.5分，共30分） 1.表示（） A.总体均数标准误 B.总体均数离散程度 C.总体标准差 D.反映以固定n从正态总体中随机抽样获得的样本均数的离散程度 2.t分布比标准正态分布（） A.中心位置左移，但分布曲线相同 B.中心位置右移，但分布曲线相同 C.中心位置不变，但分布曲线峰高 D.中心位置不变，但分布曲线峰低，两侧较伸展 3.用计数器测得某放射性物质10分钟内发出的脉冲数为660个，据此可估计该放射性物质平均每分钟脉冲计数的95%可信区间为（） A．6601.96 B. 6602.58 C. 661.96 D. 6601.96 4．直线回归中，如果自变量X乘以一个不为0或1的常数，则有（） A．截距改变 B.回归系数改变 C.两者都改变 D.两者都不改变 5．参数是指（） A．参与个体数 B.总体的统计指标 C.样本的统计指标 D.样本的总和 6．两样本秩和检验与t检验相比（） A. 秩和检验比t检验好 B.检验效能相同 C. t检验比秩和检验好 D.应根据资料决定优劣 7．血清学滴度资料最常用来表示其平均水平的指标是（） A.算术平均数 B.中位数 C.几何平均数 D.百分位数 8．设某实验因素A有K（K≥3）个水平，观测数据是连续性资料，且满足各种参数检验的前提条件。用多次t检验取代方差分析和q检验。将会（） A.明显增大犯第Ⅱ类错误的概率 B.使结论更加具体 C.明显增大犯第Ⅰ类错误的概率 D.使计算更加简便 9. 某血库提供6094例ABO血型分布资料如下：血型O A B AB，人数分别为1823 1598 2032 641，该资料的类型是: A.计量资料 B.有序资料 C.计数资料 D.名义资料 10.两样本均数比较时,P越小,说明( ) A.两样本均数相差越大 C.越有理由认为两总体均数不同 B.两总体均数相差越大 D.越有理由认为两样本均数不同 11．下列哪种资料不适用t-检验( ) A.一个小样本均数和总体均数的比较 B.四格表资料的比较 C.两个小样本均数的比较 D.两个大样本均数的比较 12．比较某地两种传染病发病率高低用（） A. t-检验 B. U-检验 C. F-检验 D. X2-检验 13．R×C表的卡方检验中，P<0.05说明( ) A.被比较的任何两个率之间差别均有显著性 B. 样本率之间没有显著性差别 C.至少某两个率之间有显著性差别 D.只有两个率之间有显著性差别 14．关于四分位数间距，下列哪一项是错误的（） A.适用条件同中位数 B.反映数值变量资料的离散趋势 C.考虑了每个变量值的变异情况 D.较极差稳定

浙大卫生综合考研真题353解析(卫生统计学部分)

精心整理卫生统计真题考点一、名词解释 1. 抽样误差：从同一样本中反复多次的随机抽取相同样本量的若干份样本，由于个体差异和偶然因数的影响，使得样本统计量与总体参数之间存在差异，这种差异 2. 3. 4. 5. 6. 婴儿保健工作以及人群健康状况的重要指标之一，也是死亡统计指标中较敏感的指标。 7. 人口金字塔：是将人口的性别和年龄资料结合起来，以图形的方式表达人口的性别和年龄构成。以年龄为纵轴，人口数为横轴，左男，右女而制定的两个相对应的直方图，可以分析过去人口的出生死亡情况以及今后人口的发展趋势。

8.生存率：病人能活到某一时点的概率。常用于对慢性疾病如恶性肿瘤及心血管疾病等的治疗效果评价或预后估计。 9.总和生育率：（表示每一个妇女一生平均生多少个孩子。是15-49岁年龄别生育率的总和。）假定同时出生的一代妇女，按照某年的年龄别生育水平度过其一生的生育历程，各年龄别生育率之和乘以年龄组组距，就是这一代妇女平均每人可 10. 11. 12. 13. 线称为生存曲线。 14.期望寿命：ex是指同时出生的一代人活到X岁时，尚能生存的平均年数。 15.总体和样本：根据研究目的所确定的同质观察单位的全体。可分为有限总体和无限总体。从总体中随机抽取部分观察单位，其观测结果的集合称谓样本，应具有代表性。

16.总体：根据研究目的所确定的同质观察单位的全体。可分为有限总体和无限总体。 17.检验效能和检验水准：1—b是指当两总体确实有差异时，按规定的检验水准a能发现该差异的能力。检验水准是假设检验中预先规定的允许犯一类错误的概率最大值。通常取0.05或0.01 18.第一类错误和第二类错误：指拒绝了实际上成立的H0，这类弃“真”的错误称为 N一定时 19. 20. 21. 22. 23.Y平系数的点估计。 24.标准差和标准误：标准差是方差的平方根，标准差的量纲和原始数据的一致，它适用于近正态分布的资料。标准误是样本均数的标准差，反应样本均数之间的离散程度及抽样误差的大小，当样本含量一定时标准误随着标准差的大小而变化。

浙大卫生综合考研真题解析卫生统计学部分

浙大卫生综合考研真题解析卫生统计学部分 Document serial number【KK89K-LLS98YT-SS8CB-SSUT-SST108】

卫生统计真题考点一、名词解释 1.抽样误差：从同一样本中反复多次的随机抽取相同样本量的若干份样本，由于个体差异和偶然因数的影响，使得样本统计量与总体参数之间存在差异，这种差异就叫抽样误差，可通过增大样本量来减小抽样误差。 2.误差：实际观察值与客观真实值之差，样本指标与总体指标之差，包含系统误差，随机误差，非系统误差 3.动态数列：按照一定的时间顺序，将描述的某事物的一系列统计指标依次排列起来。用以观察和比较该事物在时间上的变化和发展趋势。统计指标可以是相对数、绝对数或平均数。动态分析指标有：绝对增长量、发展速度和增长速度、平均发展速度和平均增长速度。 4.死因构成：指全部死亡人数中，死于某死因者所占百分比，说明各种死因的相对重要性。 5.疾病分类：是在疾病命名法的基础上，考虑到对疾病的认识及防治需要，将一些具有共同特性的疾病归纳在一起，加以分类。 6.婴儿死亡率：IMR指某年活产儿中不满一周岁的死亡频率。是反映社会卫生状况、婴儿保健工作以及人群健康状况的重要指标之一，也是死亡统计指标中较敏感的指标。 7.人口金字塔：是将人口的性别和年龄资料结合起来，以图形的方式表达人口的性别和年龄构成。以年龄为纵轴，人口数为横轴，左男，右女而制定的两个相对应的直方图，可以分析过去人口的出生死亡情况以及今后人口的发展趋势。 8.生存率：病人能活到某一时点的概率。常用于对慢性疾病如恶性肿瘤及心血管疾病等的治疗效果评价或预后估计。 9.总和生育率：（表示每一个妇女一生平均生多少个孩子。是15-49岁年龄别生育率的总和。）假定同时出生的一代妇女，按照某年的年龄别生育水平度过其一生的生育历程，各年龄别生育率之和乘以年龄组组距，就是这一代妇女平均每人可能生育的子女数。 10.总生育率：指某年某地平举每千名育龄妇女的活产数，国际上以15-49作为育龄妇女的年龄界限。 11.负担系数：又称抚养比，是人口中非劳动年龄人数占劳动年龄人数之比，一般以15-64为劳动年龄，≦14≧65为非劳动年龄。 12.发病率和患病率：发病率IR表示一定时期内，在可能发生某病的一定人群中新发生该病的强度。患病率PR指某时点上受检人数中现患某种疾病的频率。在一定人群是时间内有 PR=IR*D。发病率表示发病危险性的直接指标，分子只包括新发病例，分母是总人年数，是个动态指标；而患病率常用于描述病程较长或发病时间不明确的疾病患病情况，分子包括新旧病例，分母是受检总人数，是个静态指标。 13.生存率和生存曲线：生存率是指观察对象经历tk个时段后仍存活的可能性。以生存时间为横轴，生存率为纵轴，将各个时间点所对应的生存率连接在一起的曲线称为生存曲线。 14.期望寿命：ex是指同时出生的一代人活到X岁时，尚能生存的平均年数。 15.总体和样本：根据研究目的所确定的同质观察单位的全体。可分为有限总体和无限总体。从总体中随机抽取部分观察单位，其观测结果的集合称谓样本，应具有代表性。

(仅供参考)卫生统计学考研总结

1、试述正态分布、标准正态分布以及对数正态分布的联系和区别？ 2、说明频数分布表的用途？描述频数分布的特征、描述频数分布的类型、便于发现一些特大或特小的可疑值、便于进一步做统计分析和处理 3、变异系数的用途？常用于观察指标单位不同时，如身高与体重的变异程度的比较；或均数相差较大时，如儿童与成人身高变异程度的比较。 4、试举例说明均数的标准差与标准误的区别与联系？例如某医生从某地2000年的正常成年男性中，随机抽取25人，算得其血红蛋白的均数X 为138.5g/l ，标准差S 为5.20g/L,标准误x S 为1.04g/L ，。在本例中标准差就是描述25名正常成年男性血红蛋白变异程度的指标，它反映了这25个数据对其均数的离散情况。因此标准差是描述个体值变异程度的指标，为方差的算述平方根，该变异不能通过统计方法来控制。而标准误则是指样本统计量的标准差，均数的标准误实质要均数的标准差，它反映了样本均数的离散程度，也反映了样本均数与总体均数的差异，说明了均数的抽样误差。本例均数的标准误X S 此式将标准差和标准误从数学上有机地联系起来了，同是可以看出通过增加样本含量方法可以减少标准误。 5、标准正态分布与t 分布有何不同？ T 分布为抽样分布，标准正态分布为理论分布。T 分布比标准正态分布的峰值低，且尾部翘起得要高。随着自由度的增大，t 分布逐渐趋近于标准正态分布，即当v →∞时，t 分布→标准正态分布。 6、假设检验时，一般当P<0.5时，则拒绝0H ，理论根据是什么？ P 值是指从0H 规定的总体随机抽得等于及大于（或/和等于及小于）现有样本获得的检验统计量值（如t 值或u 值）的概率。当P<0.5时，说明在0H 成立的条件下，得到现有检验结果的概率小于通常确定的小概率事件标准0.05.因小概率事件在一次试验中几乎不可能发生，现在的确发生了，说明现有样本信息不支持0H ，所以怀疑原假设0H 不成立，故拒绝0H 。在下“有差别”的结论的同时，我们能够知道可犯I 型错误的概率不会大于0.05（即通常的检验水准），这在概率上有了保证。