医学统计学三
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学复习题三
一、名词解释
1.可信区间
(1)按一定的概率或可信度(1-α)用一个区间来估计总体参数所在的范围,该范围通常称为参数的可信区间或者置信区间(confidence interval,CI),预先给定的概率(1-α)称为可信度或者置信度(confidence level),常取95%或99%。
(2)置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”。这个概率被称为置信水平。置信区间的两端被称为置信极限。对一个给定情形的估计来说,置信水平越高,所对应的置信区间就会越大。
2.统计推断
推断统计是研究如何利用样本数据来推断总体特征的统计方法。其包含两个内容:参数估计,即利用样本信息推断总体特征;假设检验,即利用样本信息判断对总体的假设是否成立。
做法包括:1.假设检验:原假设和对立假设。2.单边检验与双边检验。3.抽样误差计算4.p-值决策5.效应量计算。
3.参数估计
parameter estimation
根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。它是统计推断的一种基本形式,是数理统计学的一个重要分支,分为点估计和区间估计两部分。
点估计是依据样本估计总体分布中所含的未知参数或未知参数的函数。通常它们是总体的某个特征值,如数学期望、方差和相关系数等。
区间估计是依据抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,作为总体分布的未知参数或参数的函数的真值所在范围的估计。
估计量的评价标准:(1)无偏性,(2)一致性,(3)有效性,(4)充分性。
3.构成比
构成比(constituent ratio)表示某事物内部各组成部分在整体中所占的比重,常以百分数表示,计算公式如下:构成比=(某一组成部分的观察单位数/同一事物各组成部分的观察单位总数)X100%
4.率
率,rate,频率指标或强度指标。它表示某现象发生的频率和强度。,说明某现象实际发生的例数占可能发生某现象的比值。
公式:
(一)古典概率是最简单的随机现象的概率计算。(二)统计概率上述“事件”是指不能再进行分解或不能由其它事件构成的基本事件。
5.抽样误差
指在遵循了随机原则的条件下,不包括等级误差和系统误差在内的,用样本指标代表总体指标而产生的不可避免的误差,由于总体平均数、总体成数是唯一确定的,而样本平均数、样本成数是随机变量,因而抽样误差也是一个随机变量。抽样误差越小,说明样本的代表性越高;反之,样本的代表性越低。同时抽样误差说明样本指标与总体指标的相差范围,因此,它总是推断总体指标的依据。抽样误差是统计推断固有的,无法避免,但可以运用数学公式计算。因此,抽样误差也称为可控制的误差。
6.直线相关系数
如果通过绘制散点图,发现两变量存在线性相关,就可以进一步计算相关系数来定量描述两变量相关程度。
直线相关系数又称积差相关系数,常用r表示样本相关系数,Ρ表示总体相关系数。它是说明具有直线关系的两变量间,相关关系的密切程度与相关方向的统计指标。其公式为:
相关系数的特点是:1)没有单位,2)取值范围是-1≤r≤1。当两变量呈同向变化,0<r<1,为正相关;两变量呈反向变化,-1<r<0,为负相关;r=0,为零相关,表示无直线相关。
二、单项选择
1.观察单位为研究中的( D )。
A.样本
B.全部对象
C.影响因素
D.个体
E.观察指标
2.总体是由( D )组成。
A.部分个体
B.全部对象
C.全部个体
D.同质个体的所有观察值
E.相同的观察指标
3.抽样的目的是( B )。
A.研究样本统计量
B.由样本统计量推断总体参数
C.研究典型案例
D.研究总体统计量
E.研究特殊个体的特征
4.参数是指( D ) 。
A.参与个体数
B.总体中研究对象的总和
C.样本的统计指标
D.样本的总和
E.总体的统计指标
5.关于随机抽样,下列哪一项说法是正确的( A )。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取
B.研究者在抽样时应精心挑选个体,以使样本更能代表总体
C.随机抽样即随机抽取个体
D.为确保样本具有更好的代表性,样本量应越大越好
E.选择符合研究者意愿的样本
6.抽样的目的是( B )。
A.研究样本统计量
B.由样本统计量推断总体参数
C.研究典型案例
D.研究总体统计量
E.研究特殊个体的特征
7.表示总体均数的符号是( B ) 。
A.σ
B.μ
C.X
D.S
E.M
8.下述( C )种资料为计量资料。
A.血型
B.性别
C.抗体滴度
D.肝炎发病人数
E.职业
9.以下适宜描述计量资料离散趋势的指标有( B )。
A.均数、标准差、方差
B.极差、标准差、中位数
C.均数、中位数、变异系数
D.标准差、四分位数间距、变异系数
E.几何均数、标准差、变异系数
10.描述一组分布不清的偏态分布资料的集中位置用( A )。
A.中位数
B.均数
C.极差
D.几何均数
E.标准差
11.方差分析的应用条件为( D )。
A.随机性
B.正态性
C.方差齐性
D.A+B+C
E.以上都不对
12.在方差分析中,如果P≤α,则结论为( C )。
A.各个总体均数全相等
B.至少有两个总体均数不等
C.至少有两个样本均数不等
D.各个样本均数不全相等
E. 各个总体均数不全相等
13.某地某年肝炎的发病人数占同年传染病人数的10.1%,该指标为( B )。
A.率
B.构成比
C.发病率
D.集中趋势
E.时点患病率
14.已知男性的钩虫病感染率高于女性。要比较两地居民的钩虫总的感染率,但是两地的性别构成不同,适当的比较方法是( D )。
A. 分性别进行比较
B. 两个率比较的x2检验
C. 不具有可比性,不能比较
D. 对性别进行标准化后再比较
E. 作两个率差别的假设检验
15. x2分布的形状( D )。
A.同正态分布
B.同t分布
C.为对称分布
D.与自由度υ有关
E.与样本量n有关
16. 当四格表的周边合计不变时,如果某格的实际频数有变化,则其理论频数( C )。
A.增大
B.减小
C.不变
D.不确定
E.随该格实际频数的增减而增减
17. R×C表x2检验的自由度为( D )。
A.R-1
B.C-1
C. R×C-1
D.(R-1)(C-1)
E.R×C-2
18.对统计图和统计表标题的要求是( D )。
A. 两者标题都在上方
B.两者标题都在下方
C.统计表标题在下方,统计图标题在上方
D.统计表标题在上方,统计图标题在下方
E. 可由研究者随意设定位置
19. 要反映某一城市连续五年甲肝发病率的变化情况,宜选择的统计图是( B )。
A.直条图
B.线图
C.直方图
D.圆图
E.散点图
20. 描述某地某年流行性乙脑患者的年龄分布,宜选择的统计图是( A )。
A.直方图
B.线图
C.直条图
D.圆图
E.箱式图
21.实验研究中设立实验组和对照组的原则是( D )。
A. 实验因素和非实验因素在两组中均不同
B.实验因素和非实验因素在两组中均相同
C.实验因素在两组中齐同,非实验因素在两组中不同
D.实验因素在两组中不同,非实验因素在两组中齐同
E. 以上都不是