医学统计学上机试题-U知识分享

医学统计学上机试题-U知识分享
医学统计学上机试题-U知识分享

习题集(分析应用题)

1、某卫生防疫站对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度资料如下:请问:要反映其平均滴度,用何指标?为什么?

抗体滴度 1:8 1:16 1:32 1:64 1:128 1:256 1:512 合计例数 2 6 5 10 4 2 1 30

2、测得某地300名正常人尿汞值,其频数表如下。欲根据此资料制定95%正常值范围。请问:用何种估计方法?(列出计算公式,不用计算)

300例正常人尿汞值(ug/L)频数表

尿汞值例数尿汞值例数尿汞值例数

0- 49 24- 16 48- 3

4- 47 28- 9 52- -

8- 58 32- 9 56- 2

12- 40 36- 4 60- -

16- 35 40- 5 64- -

20- 22 44- - 68-72 1

3、某医师在研究血管紧张素I转化酶(ACE)基因I/D多态与Ⅱ型糖尿病肾病(DN)的关系时,将249例Ⅱ型糖尿病患者按有无糖尿病肾病分为两组,资料见下表。拟比较两组Ⅱ型糖尿病患者的ACE基因型分布有无差别,用何统计分析方法?

DN组与无DN组2型糖尿病患者ACE基因型分布的比较

组别DD ID II 合计

DN组42(37.8)48(43.3)21(18.9)111

无DN组30(21.7)72(52.2)36(26.1)138

合计72(28.9)120(48.2)57(22.9)249

4、某单位研究胆囊腺癌、腺瘤的P53基因表达,对同期手术切除的胆囊腺癌、腺瘤标本各10份,用免疫组化法检测P53基因,资料见下表。欲分析胆囊腺癌和胆囊腺瘤的P53基因表达阳性率有无差别,用何统计分析方法?

胆囊腺癌与胆囊腺瘤P53基因表达阳性率的比较

病种阳性阴性合计

胆囊腺癌 6 4 10

胆囊腺瘤 1 9 10

合计7 13 20

5、145名食物中毒病人的潜伏期如下表。

145名食物中毒病人的潜伏期

潜伏期0- 6- 12- 18- 24- 30- 36- 42-48

人数17 46 38 32 6 0 4 2

问:欲求其平均潜伏期,用何指标代表性较好?为什么?

6、某医生用一种新药治疗贫血,以Hb为观察疗效指标,共治疗了10人,一个疗程后,Hb含量平均增加了1.2g/100ml,增加量的标准差为3.5 g/100ml。据此,该医生认为此药对贫血有效。你是否同意此医生的观点?请说出理由。

7、用两种方法检查已确诊的乳腺癌患者120名。甲法的检出率为60%,乙法的检出率为50%,甲、乙两法一致检出率为35%,比较两种方法何者为优,用何统计方法?

8、某医院比较急性黄疸型肝炎与正常人在超声波波型上的表现,见下表。欲比较两组肝波型有无差异,用何统计方法?

急性黄疸型肝炎与正常人的超声波波型

组别

波型

合计正常可疑较密

黄疸型肝炎12 43 232 287 正常人277 39 11 327

合计289 82 243 614

9、1980年甲乙两医院病死率如下表,如何分析两医院的总病死率有无差别。

甲院乙院

科别病人数死亡数病死率(%) 病人数死亡数病死率(%)

内科 1500 180 12.0 500 80 16.0

外科 500 20 4.0 1500 90 6.0

其他科 500 30 6.0 500 40 8.0

合计 2500 230 9.2 2500 210 8.4

10、某山区10名健康儿童的头发中与血中硒的含量如下。

编号 1 2 3 4 5 6 7 8 9 10

发硒 74 66 88 69 91 73 66 96 58 73

血硒 13 10 13 11 16 9 7 14 5 10

问:

(1)健康儿童血中硒的含量与头发中硒的含量是否相同?

(2)头发中与血中硒的含量是否有关联?

(3)能否由头发中硒含量推算血中硒含量?如何推算?

11、调查七处饮用水中的含碘量与当地甲状腺的患病率如下表,试问饮用

水中的碘含量与甲状腺肿患病率是否有关?

含碘量(mg/L) 71 81 126 154 155 178 201

患病率(%) 16.9 4.4 2.5 0.8 1.1 0.6 0.2

12、从278例尸解记录得下表资料,问:(1)欲分析年龄与冠状动脉粥样硬化程度有无相关关系?用何分析方法?(2)欲比较不同年龄组冠状动脉粥样硬化程度有无差别?用何分析方法?

年龄(岁)

硬化等级 21- 31- 41-≥51 合计

- 70 37 16 9 122

+ 22 24 23 20 89

++ 4 9 13 15 41

+++ 2 3 7 14 26

合计 98 63 59 58 278

13、某实验用两种探针平行检测86例乙肝患者血清HBV-DNA,结果如下表。问:(1)欲两种探针的阳性检出率有无差别?用何分析方法?

(2)欲分析两种探针的检出结果是否有关联?用何分析方法?

P探针

生物探针 + - 合计

+ 40 4 44

- 3 39 42

合计 43 43 86

14、某医院用三种方案治疗急性无黄疸型病毒性肝炎254例,结果如下,欲比较三组疗效有无差别?用何分析方法?

无效好转显效痊愈合计

西药组 49 31 5 15 100

中药组 45 9 22 4 80

中西药组 15 28 11 20 74

合计 109 68 38 39 254

15、某医生随机抽取正常人和脑病病人各11例,测定尿中类固醇排出量(mg/dl),结果如表1。该医生根据此资料算得正常人尿中类固醇排出量的均数=4.266mg/dl,标准差S

=0.985mg/dl;脑病病人尿中类固醇排出量的均数

1

=1.626mg/dl,配对t检验结果,t=–3.098,P < 0.05,=5.732mg/dl,标准差S

2

故认为脑病病人尿中类固醇排出量高于正常人。

表1 正常人和脑病病人尿中类固醇排出量(mg/dl)测定结果

分组尿中类固醇排出量(mg/dl)

正常人 2.90 5.41 5.48 4.60 4.03 5.10 4.97 4.24 4.37 3.05 2.78 脑病病人 5.28 8.79 3.84 6.46 3.79 6.64 5.89 4.57 7.71 6.02 4.06 问:(1)该资料属于何种设计方案?

(2)该医生的统计处理是否正确?为什么?

16、某医师用某种中草药治疗不同类型的小儿肺炎,其中病毒性肺炎60例,细

χ检验,得菌性肺炎60例,治疗结果见表2。该医师对此资料采用行×列2 2

χ=7.077,P=0.069,差异无统计学意义,故认为此种中草药对不同类型小儿肺炎的疗效分布无差别。

表2某种中草药治疗不同类型小儿肺炎的疗效比较

小儿肺炎类型治愈显效有效无效合计病毒性肺炎21 17 11 11 60 细菌性肺炎11 13 17 19 60 合计32 30 28 30 120 问:(1)该研究是什么设计?

(2)统计分析的目的是什么?统计方法是否正确?

17、某医院分别用中西药治疗胃炎患者,结果西药组治疗80人,有效64人,有效率80.0%,中药组治疗55人,有效49人,有效率89.1%。欲比较两种药物的疗效有无差别。

问:(1)这是什么资料?

(2)能否根据有效率直接下结论,为什么?

(3)若要比较两药有效率有无差别,应选用何种统计方法?(写出步骤,

不必计算)

18、在用中药溃疡灵治疗溃疡病的研究中,研究者用中药溃疡灵结合其他治疗措施,治疗胃溃疡40例(其中15例合用西药胃舒平,15例加服云南白药,10例加针灸),结果40例均全部治愈。该研究者据此认为:“以中药溃疡灵为主,治疗胃溃疡40例,临床治愈率100%,效果非常满意”。试从统计学角度对其过程和结论进行分析评价(不必计算)。

19、两种药物治疗扁平足资料如下表,拟分析两种药物疗效是否不同。

病例号 1 2 3 4 5 6 7 8 9 10 中药好好中好好中好好中好西药中中中好中差中中差差

问:(1)这是什么资料?

(2)检验两种药物疗效有无差别,应选用何种统计方法?

20、某防疫站研究甲、乙两种方法测定血清钙含量的差别,随机对10名正常成年男子分别用甲、乙两种方法测得其血清钙含量(mg/L)如下表:

编号 1 2 3 4 5 6 7 8 9 10 甲法7.2 10.5 8.1 9.6 8.3 10.8 8.7 9.1 12.0 9.9 乙法8.1 10.4 9.9 8.2 9.1 12.3 9.5 8.8 11.7 12.5 假设血清钙含量数据服从正态分布。问:比较甲乙两种方法测定的血清钙含量有无差别?应选用何种统计方法?写出步骤,不必计算。

21、某地检查健康男性工人225人的血液红细胞,得均数为470万/mm3,标准差为30万/mm3(写出公式,代入数据解释,不必计算)

(1)推测该地健康工人的血液红细胞数平均含量。

(2)现有一男性工人的红细胞数为420万/mm3 ,问该男性工人的红细胞数是否正常?

22、某医师研究果胶治疗铅中毒疗效时,对研究对象采取脱离铅作业现场后,给予果胶治疗。然后采用治疗前后血铅和尿铅作为观察指标,治疗40名铅中毒患者,结果治疗前测得血铅为0.181±0.029mg/L,尿铅为0.116±0.009mg/L;治疗后血铅为0.073±0.019mg/L,尿铅为0.087±0.010mg/L。血铅、尿铅治疗前后比较P值均小于0.01,差异有统计学意义,结论为:果胶有良好的驱铅作用,

可以用于治疗铅中毒患者。请你从统计学角度进行分析。(不必计算)。

23、某厂工人保健站在“职工健康状况报告”中写道:“在946名工人中,患慢性病的有274人,其中女工219人,占80%,男工55人,占20%,所以女工易患慢性病”。你认为是否正确?为什么?

24、某医师自称舌须草用水煎后制成的舌须草合剂对慢性气管炎有较好的疗效。但经有关专家检验后发现,所谓的舌须草合剂中含有百部和桔梗这两种对该病有一定治疗作用的药物,因而怀疑“舌须草对该病有较好疗效的结论”是不正确的。请你设计一个试验方案,验证“舌须草对该病有较好疗效的结论”的真伪。

O),结果如下表,并25、某医生测得脑病病人和一般病人的脑脊液压力(mmH

2

据t检验结果认为脑病病人的脑脊液压力高于一般病人。

脑病病人和一般病人的脑脊液压力比较

问:(1)该资料属于何种设计方案?

(2)该医生的统计处理是否正确?为什么?

26、为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者

χ检验,得连续性随机分成两组,分别给予中药和西药治疗,结果见下表。经2

χ=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞校正2

的疗效基本相同。

两种药物治疗急性心肌梗塞的疗效比较

药物有效无效合计有效率(%)中药12(9.33)2(4.67)14 85.7

西药 6(8.67)7(4.33)13 46.2

合计18 9 27 66.7

问:(1)这是什么资料?

(2)该资料属于何种设计方案?

(3)该医师统计方法是否正确?为什么?

27、为评价环境噪音强度对社区居民生活的影响程度,某市疾病预防控制中心监测了该市10个社区的环境噪音强度,同时调查各社区居民的失眠患病率(%),结果见下表。经对噪音强度数量化(+ =1,++ =2,+++ =3,++++ =4,+++++ =5)后,某医师对该资料采用Pearson直线相关分析,得r=0.853,P<0.005,认为环境噪音强度与居民失眠患病率之间存在正相关关系。

某市10个社区环境噪音强度与居民失眠患病率

问:(1)这是什么资料?

(2)该医师处理方法是否正确?为什么?

(3)该资料应该用何种统计方法分析?

28、某医生研究有不同程度腹水的肝硬化患者血浆肾素活性,随机抽取并测得不同程度腹水的肝硬化患者血浆肾素活性结果如下表所示,欲分析三组血浆肾素活性有无差别,用何种统计分析方法?

同程度腹水的肝硬化患者血浆肾素活性(g/ml)

参考答案

1、答:本资料为抗体滴度资料,符合对数正态分布,应用几何均数。

2、答:从频数分布看,该组正常人的尿汞值的分布为偏态分布,用百分位数法

估计,由于尿汞仅过高为异常,应制定单侧上限值,即计算P

95

3、答:这是两组构成比资料。比较两组Ⅱ型糖尿病患者的ACE基因型分布有无

χ检验。

差别,应用行列表2

4、答:这是两样本率比较资料。可用四格表2χ检验。但由于n=20<40,应改用Fisher 确切概率法。

5、这145名食物中毒病人的潜伏期的分布为偏态分布,故应计算中位数。

6、答:不同意。理由:一是没有进行假设检验,应用配对t检验进行统计推断;二是:样本例数过少,仅为10例。

7、答:该资料为配对设计计数资料,应用配对2χ检验。

8、答:该资料为等级资料,应用完全随机设计两样本比较秩和检验

9、答:由于各科病人的病死率不同,两医院各科的病人构成也不同。因此,应先进行率的标准化,然后再比较甲乙两医院的总病死率有无差别。

10、(1)答:这是配对设计计量资料比较,可用配对t检验。如不满足t 检验的条件,可改用配对秩和检验。

(2)答:分析二者的关系,可用相关分析。如呈线性关系,可用Pearson线性相关分析;如不满足线性关系,可改用Spearman秩相关。

(3)答:用头发中硒含量x推算血中硒含量y,可用线性回归分析。公式:=

y+

a

bx

11、答:分析二者的关系,可用相关分析。由于患病率不满足正态分布,即不满足线性相关双变量正态分布的要求,故只能用Spearman秩相关。

12、(1)答:欲分析年龄与冠状动脉粥样硬化程度有无相关关系,这是双向有序

χ检验,并计算其列联系数;或用Spearman秩相关。

列联表资料,可用2

(2)答:欲比较不同年龄组冠状动脉粥样硬化程度有无差别,这是单向有序列联表资料,应用秩和检验。

13、这是配对四格表资料。 (1)答:应用配对2χ检验。

(2)答:用普通四格表2χ检验,并计算其列联系数。 14、答:这是三样本等级资料,应用三样本比较的秩和检验。 15、答:(1)这是完全随机设计实验设计方法。

(2)该医生统计分析方法不正确,因为他误用了配对设计的t 检验。

16答:(1)这是完全随机设计实验设计方法。

(2)该医生统计分析的目的是检验两种小儿肺炎的疗效有无差别,由于属等级资料,应用秩和检验,故统计分析方法不正确。 17、答:(1)这是完全随机设计计数资料。

(2)不能根据有效率直接下结论,因为这仅为样本资料,即使两样本率

不同,也可能是抽样误差造成的,必须做假设检验后才能下结论。

(3)要比较两药有效率有无差别,应选用四格表2χ检验。具体步骤为: ①建立假设和确定检验水准:H 0: 21ππ=; H 1: 21ππ≠; 05.0=α ②计算统计量2χ: 用四格表2χ检验,可用相关统计软件实现。 ③根据计算所得的P 值,进行判断下结论。

18、答:该研究没有遵循试验设计基本原则。主要问题是:(1)处理因素混杂不清,结论依据不可靠。除采用中药溃疡灵外,部分病例还加用西药胃舒平、云南白药、针灸等,但却把功劳全部归于中药溃疡灵。(2)缺乏对照:应该设立不用中药溃疡灵的对照组:除不用中药溃疡灵外,其余情况应完全相同。(3)必须进行假设检验后,才能判断下结论。 19、答:(1)这是配对设计等级资料

(2)检验两种药物疗效有无差别,应选用配对设计秩和检验 20、答:这是配对设计计量资料,检验步骤是:

①建立假设和确定检验水准:H 0: 0=d μ; H 1: 0≠d μ; 05.0=α ②计算统计量t 值: 用配对t 检验计算公式计算,也可用相关统计软件实现。 ③根据计算所得的P 值,进行判断下结论。

21、答:(1)根据题意,应估计该地健康工人的血液红细胞数的总体均数,即估计其95%可信区间,计算公式为:225/3096.147096.1?±=±x S x

(2)判断该男性工人是否正常,应根据95%正常值范围来判断。计算公

式为:3096.147096.1?±=±S x 。如果在该范围内则为正常;如超出该范围则为异常。

22、答:该结论不可靠。主要原因是采用的对照形式不恰当。因为脱离铅作业现场后即使果胶治疗无效,前后血铅和尿铅也会通过代谢等自然排除体外。因此,设前后自身对照是不恰当的。正确方法应是:设空白对照(对照组不给予任何治疗措施)或标准对照(采用常规方法治疗),这样才能说明果胶是否有效。 23、答:结论是错误的。这里的百分数仅为构成比,可能该厂女工人数多,患病的绝对数也多,构成比也就大。正确方法应该分别计算男女患病率,即男女患病人数,分别除于男女工人数。

24、答:舌须草合剂中含有对慢性气管炎有治疗效果的百部和桔梗的药物,因此,在研究设计中,必须设立只用百部和桔梗治疗的对照组。最简单的设计方案为完全随机设计:即把研究对象统一编号,采用随机数字表法,将研究对象随机地分配到实验组(舌须草+百部+桔梗)和对照组(百部+桔梗)中,观察两组的疗效。如果要研究舌须草与百部和桔梗有无交互作用,可采用析因设计。 25、答:(1)该资料属于完全随机设计设计方案。

(2)该资料完全随机设计两个独立样本均数的比较,可采用t 检验。因

此,该医生的统计处理方法正确。

26、答:(1)这是计数资料,两样本率比较。 (2)这是完全随机设计

(3)该医生的统计处理方法不正确。因为总例数n=27<40,应用Fisher

确切概率法。

27、答:(1)环境噪音强度为等级资料;居民失眠患病率为计数资料。 (2)该医生的统计处理方法不正确。因为该资料不满足双变量正态分布,不能采用Pearson 直线相关分析。

(3)应该采用Pearson 秩相关分析

28、答:(1)这是完全随机设计三样本均数比较,采用完全随机设计方差分析

(Oneway ANOV A);

(2)首先判断方差齐性:方差齐性检验,P=0.207>0.10,说明方差齐。

(3)方差分析结果:F=7.458,P=0.004。由于P=0.004<0.05,因此,可认为差异有统计学意义。即可认为各组血浆肾素活性不全相同。

(4)经两两比较(SNK):有腹水的肝硬化患者血浆肾素活性高于无腹水的肝硬化患者和正常人;无腹水的肝硬化患者和正常人无差别。

29、自行作答(注意:只要求描述抽样方法,即介绍如何把该校1/10学生抽出来。)

医学统计学试题及答案

医学统计学试题及答案 The latest revision on November 22, 2020

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同

6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

医学统计学基本概念

习题-医学统计学基本概念 选择题: 1. 若以舒张期血压大于等于1 2.7kPa 为为高血压,调查某地1000 人,记录每人是否患有高血压。最后清点结果,其中有10 名高血压患者,有990 名非高血压患者。() A.这是计量数据 B.这是等级数据 C.还看不出是记数还是计量数据 D.这是连续型数据 E.这是计数数据 2、统计学中所说的样本是指() A.随意抽取的总体中任意的部分 B.有意识的选择总体中的典型部分 C.依照研究者要求选取总体中有意义的一部分 D.依照随机原则抽取总体中有代表性的一部分 E.按研究目的随意抽取有代表性的一部分 3、下列资料属等级资料的是() A.白细胞计数 B.住院天数 C.门、急症就诊人数 D.病人的病情分级(轻、中、重) E.疾病疗效(有效、无效) 4、总体是由() A.个体组成 B.研究对象组成 C.同质个体组成 D.研究指标组成 E.观察单位组成 5、抽样的目的是() A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例研究误差 D.研究总体参数 E.研究样本特征 6、参数是() A.参与个体数 B.总体的统计指标 C.样本的统计指标 D.样本的总和 E.参考值范围 7、关于随机抽样,下列哪一项说法是正确的() A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽样个体 D.为确保样本具有更好的代表性,样本量应越大越好 E.以上均不对 8、统计工作各个步骤的首要基础是() A.收集资料 B.整理资料 C.核对资料 D.分析资料 E.医学研究设计 9、统计工作的基本步骤是:() A.调查资料、核对资料、整理资料 B调查资料、归纳资料、整理资料 C收集资料、核对资料、整理资料

医学统计学基础理论和上机考试模拟复习题答案解析

“医学统计学”上机考试模拟题A卷 1.测得10例某指标值治疗前后情况如下: 例号 1 2 3 4 5 6 7 8 9 10 治疗前76 64 60 62 72 68 62 66 70 60 治疗后74 62 64 58 68 70 56 60 66 56 1.用参数方法比较治疗前后该指标值的差异有无统计学意义,结果填入下表: 例数均数标准差治疗前 治疗后 差值(前-后) H0:治疗前后该指标值无差异。 H1:治疗前后该指标值有差异。 统计量t=2.512 P=0.0332 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即治疗前后该指标值有差异。 2.上题资料,用非参数方法比较治疗前后该指标值的差异有无统计学意义。结果填入下面空格。 H0:治疗前后该指标值无差异。 H1:治疗前后该指标值有差异。 统计量s=19.5 P=0.0547 统计结论:P>0.05,不拒绝H0,认为在α=0.05水平上差异无统计学意义,即治疗前后该指标值无差异。

3.测得10例正常儿童身高(cm)和体重(kg)如下: 例号 1 2 3 4 5 6 7 8 9 10 身高(X)120 133 126 130 121 122 131 128 110 124 体重(Y)20 27 23 25 25 18 22 25 15 22 (1)求身高和体重的相关系数,并作显著性检验。 相关系数r =0.81211 H0:p=0 H1:p≠0 P= 0.0043 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即认为身高和体重存在正相关。 (2)求身高推算体重的直线回归方程,并作显著性检验。 直线回归方程:y=-32.964+0.443*x H0:β=0 H1:β≠0 P=0.0043 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即认为身高和体重之间存在直线回归关系。 三.10名氟作业工人在工作前后测定尿氟(mg/L)排出量结果如下: 编号 1 2 3 4 5 6 7 8 9 10 工前 1.7 1.6 1.4 2.3 1.9 0.8 1.4 2.0 1.6 1.1 工后 2.7 3.1 3.2 2.1 2.7 2.4 2.6 2.4 2.3 1.4 1.计算工后比工前尿氟排出量增加值的均数,标准差,标准误,变异系数和中位数。 均数0.91,标准差0.635,标准误 0.201,变异系数 69.78,中位数 0.900 2.检验氟作业工人在工作前后尿氟排出量的差异有无统计学意义。 H0:氟作业工人在工作前后尿氟排出量的差异无统计学意义。 H1:氟作业工人在工作前后尿氟排出量的差异有有统计学意义 统计量t=4.532 P=0.0014

医学统计学知识点范文.doc

第一章绪论 1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象:具有不确定性结果的事物。 3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。 4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。 5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异 同质,指根据研究目的所确定的观察单位其性质应大致相同。 变异,指总体内的个体间存在的、绝对的差异。 统计学通过对变异的研究来探索事物。 (2) 变量与数据类型 变量,是反映实验或观察对象生理、生化、解剖等特征的指标。 变量的观测值,称为数据 分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等) 定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等) 有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。 统计方法的选用与数据类型有密切的关系。 (3)总体与样本 总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。 样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。抽样,是从研究总体中随机抽取部分有代表性的观察单位。 参数,指描述总体特征的指标。 统计量,指描述样本特征的指标。 (4)误差 误差,指观测值与真实值、统计量与参数之间的差别。 可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。 随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。 抽样误差,是抽样引起的统计量与参数间的差异。 抽样误差主要来源于个体的变异。 统计学主要研究抽样误差。 (5)概率 概率,是描述某事件发生可能性大小的量度。 必然事件,事件肯定发生,概率P(U)=1; 随机事件,事件可能发生,可能不发生,概率介于0≤P(A)≤ 1; 不可能事件,事件肯定不发生,概率P(∮)=0; 小概率事件,事件发生的可能性很小,概率P(A)≤ 0.05、或P(A)≤ 0.01。 医学科研中,P(A)≤0.05作为事物差别有统计意义,P(A)≤ 0.01作为事物差别有高度统

研究生医学统计学上机试题

医学科研中的统计学方法上机试题 时间:2014-12-15 共4题,共100分 1.某医院病理科研究人体两肾的重量,20例男性尸解时的左、右肾的称重记录见下表,问左、右肾重量有无不同? 表1:20例男性尸解时左、右肾的称重记录 编号左肾(克)右肾(克) 1 170 150 2 155 145 3 140 105 4 11 5 100 5 235 222 6 125 115 7 130 120 8 145 105 9 105 125 10 145 135 11 155 150 12 110 125 13 140 150 14 145 140 15 120 90 16 130 120 17 105 100 18 95 100 19 100 90 20 105 125 2. 在评价某药物耐受性及安全性的I期临床试验中,对符合纳入标准的40名健康自愿者随机分为4组,每组10名,各组注射剂量分别为0.5U、1U、2U、3U,观察48小时后部分凝血活酶时间(s)。试比较任意两两剂量间的部分凝血活酶时间有无差别?

表2 各剂量组48小时部分凝血活酶时间(s) 0.5 U 1 U 2 U 3 U 36.8 40.0 32.9 33.0 34.4 35.5 37.9 30.7 34.3 36.7 30.5 35.3 35.7 39.3 31.1 32.3 33.2 40.1 34.7 37.4 31.1 36.8 37.6 39.1 34.3 33.4 40.2 33.5 29.8 38.3 38.1 36.6 35.4 38.4 32.4 32.0 31.2 39.8 35.6 33.8 3. 某神经内科医师观察291例脑梗塞病人,其中102例病人用西医疗法,其它189 例病人采用西医疗法加中医疗法,观察一年后,单纯用西医疗法组的病人死亡13例,采用中西医疗法组的病人死亡9例,请分析两组病人的死亡率差异是否有统计学意义? 4. 某省卫生防疫站对八个城市进行肺癌死亡回顾调查,并对大气中苯并(a)芘进行监测,结果如下,试检验两者有无相关? 表4 八个城市的肺癌标化死亡率和大气中苯并(a)芘浓度城市编号肺癌标化死亡率(1/10万)苯并(a)芘(μg/100m3) 1 5.600.05 2 18.50 1.17 3 16.23 1.05 4 11.400.10 5 13.800.75 6 8.130.50 7 18.000.65 8 12.10 1.20

医学统计学-知识梳理

均数±2.58标准差:表示集中位置、离散程度均数±2.58标准误:表示平均水平、抽样误差大小P75 一、标准差的主要作用是估计正常值的范围 实际应用中,估计观察值正常值范围应该用标准差(s),表示为“Mean±SD”。此写法综合表达一组观察值的集中和离散特征的变异情况,说明样本平均数对观察值的代表性。s 的大或小说明数据取值的分散或集中。s与样本均数合用, 主要是在大样本调查研究中, 对正态或近似正态分布的总体正常值范围进行估计。如果不是为了正常值范围估计,一般不用。当数据与正态分布相差很大,或者虽为正态分布, 但样本容量太小(小于30 或100),也不宜用估计正常值范围。 二、标准差还可用来计算变异系数(CV) 当两组观察值单位不同, 或两均数相差较大时,不能直接用标准差比较其变异程度的大小, 须用变异系数系数来做比较。: 2.2 标准误的正确使用 一、标准误用来衡量抽样误差的大小和了解用样本平均数来推论总体平均数的可靠程度。在抽样调查中,往往通过样本平均数来推论总体平均数,样本标准误适用于正态或近似正态分布的数据, 是主要描述小样本试验中,样本容量相同的同质的多个样本平均均数间的变异程度的统计量。即如果多次重复同一个试验, 它们之间的变异程度用。显然它越小,样本平均数变异越小,越稳定,用样本平均数估计总体均数越可靠。因此,为说明它的稳定性、可靠性或通过几个对几组数据进行比较(这是科研论文中最常见的),应当用描述数据。实际应用中应该写成“平均数±标准误”或而英文表示为“Mean±SE”的形式。 二、标准误还可以进行总体平均数的区间估计与点估计(置信区间)。 根据正态分布原理,与合用还可以给出正态总体平均数的可信区间估计即推论总体平均数的可靠区间,例如常用(其中t0.05 (n-1) 为样本容量是n的t界值)表示总体均值的95%可信区间, 意指总体平均数有95%的把握在所给范围内。 三、标准误还可用来进行平均数间的显著性检验,从而判断平均数间的差别是否是由抽样误差引起的。例如:某当地小麦良种的千粒重=34克,现在从外地引入一新品种,通过多小区的田间试验得到千粒重的平均数=35.2克,问新引进品种千粒重与当地良种有无显著差异?新引进品种千粒重与当地良种有无显著差异实质是判断与的差别是否是有田间试验是抽样误差引起,所以要进行显著性检验,这里用t测验进行检验,而,由于,故,所以认为新引进品种千粒重与当地良种千粒重的不同是由于田间试验是抽样 误差引起,因此他们之间无显著差异。所以在进行平均数间的显著性检验是必须用到。 总之,标准差和标准误最常用的统计量,二者都是衡量样本变量(观察值) 随机性的指标,只是从不同角度来反映误差,二者在统计推断和误差分析中都有重要的应用。如果没有标准差,人们就无法看出一组观察值间变异程度有多大,这些数字到底有无代表性,如果没有标准误又很难看出我们的样本平均数是否可以代表总体平均数。所以二者都非常重要。

第二节 医学统计学的基础知识习题及答案

【单项选择题】 1. 医学统计学的主要内容不包括()。 A. 变量计算 B. 统计设计 C. 统计描述 D. 统计推断 【答案】A 【解析】P111;医学统计学的主要内容; 1)统计设计; 2)统计描述; 3)统计推断。 2. 医学统计工作的基本步骤不包括()。 A. 研究设计

B. 健康教育 C. 收集资料 D. 整理资料 【答案】B 【解析】P112;医学统计工作的基本步骤:研究设计、收集资料、整理资料和分析资料是统计工作的4个基本步骤。这4个步骤是紧密联系不可分割的,某一环节发生问题,都将影响最终的统计分析结果。 3. 描述集中趋势的指标有()。 A. 算数均数 B. 方差与标准差 C. 极差 D. 百分位数 【答案】:A 【解析】:P115;描述集中趋势的指标:

1)算术均数,简称均数; 2)中位数(median); 3)几何均数(geometry mean)。 4. 统计学中的总体是指()。 A. 根据研究目的确定的同质观察单位的全体 B. 根据地区划分的研究对象的全体 C. 根据时间划分的研究对象的全体 D. 根据人群划分的研究对象的全体 【答案】A 【解析】P114;总体( population)是根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种变量值的集合。 5. 下列不属于离散趋势的描述指标是()。 A. 极差

B. 百分位数 C. 方差与标准差 D. 几何均数 【答案】D 【解析】P116;描述离散趋势的指标; 1)方差与标准差; 2)极差:亦称全距(range),用符号R表示; 3)百分位数(percentile):是一个位置指标,用符号Px表示;4)变异系数(coefficient of variation):用符号CV表。 而几何均数是描述集中趋势的指标。 6. 血清学滴度资料最常用来表示其平均水平的指标是()。 A. 算术平均数 B. 中位数

医学统计学上机试题-U

习题集(分析应用题) 1、某卫生防疫站对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度资料如下:请问:要反映其平均滴度,用何指标?为什么? 抗体滴度 1:8 1:16 1:32 1:64 1:128 1:256 1:512 合计 例数 2 6 5 10 4 2 1 30 2、测得某地300名正常人尿汞值,其频数表如下。欲根据此资料制定95%正常值范围。请问:用何种估计方法?(列出计算公式,不用计算) 300例正常人尿汞值(ug/L)频数表 尿汞值例数尿汞值例数尿汞值例数 0-4924-1648-3 4-4728-952-- 8-5832-956-2 12-4036-460--

16-3540-564-- 20-2244--68-721 3、某医师在研究血管紧张素I转化酶(ACE)基因I/D多态与Ⅱ型糖尿病肾病(DN)的关系时,将249例Ⅱ型糖尿病患者按有无糖尿病肾病分为两组,资料见下表。拟比较两组Ⅱ型糖尿病患者的ACE基因型分布有无差别,用何统计分析方法? DN组与无DN组2型糖尿病患者ACE基因型分布的比较 组别DD ID II合计 DN组42(37.8)48(43.3)21(18.9)111 无DN组30(21.7)72(52.2)36(26.1)138 合计72(28.9)120 (48.2) 57(22.9)249 4、某单位研究胆囊腺癌、腺瘤的P53基因表达,对同期手术切除的胆囊腺癌、腺瘤标本各10份,用免疫组化法检测P53基因,资料见下表。欲分析胆囊腺癌和胆囊腺瘤的P53基因表达阳性率有无差别,用何统计分析方法? 胆囊腺癌与胆囊腺瘤P53基因表达阳性率的比较 病种阳性阴性合计 胆囊腺癌6410

医学统计学知识点汇总(精华)

医学统计学知识点汇总(精华) 一.概论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。 A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断

4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每 个观察单位的某项特征进行测量或观察,这种特征称为变量变量值:变量的观察结果或测量值。 5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某 变量值的集合。总体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。 样本必须具有代表性。代表性是指样本来自同质总体,足够的样 本含量和随机抽样的前提。

医学统计学知识点梳理图文稿

医学统计学知识点梳理集团文件版本号:(M928-T898-M248-WU2669-I2896-DQ586-M1988)

医学统计学知识点梳理 医学统计学:是用统计学原理和方法研究生物医学问题的一门学科。他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。 统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。 统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征: ①参数估计:用样本的指标去推断总体相应的指标 ②假设检验:由样本的差异推断总体之间是否可能存在的差异 同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。 总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。

随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。 概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。

医学统计学上机考试题样题及评分标准

上机考试题样题及评分标准 姓名__________ 学号__________________ 成绩_________ 1、某监测站拟用极谱法替代碘量法来测定水中溶解氧含量,今对12 个水样同时用两种方法测定,结果如下,问能否用极谱法推算碘量法 ? ━━━━━━━━━━━━━━━━ 极 谱 法 碘 量 法 (微安值) (溶解氧) ──────────────── 5.3 5.84 5.3 5.85 5.2 5.80 2.1 0.33 3.0 1.96 3.3 2.27 2.8 1.58 3.4 2.32 2.3 0.76 6.8 7.79 6.3 7.56 4.8 5.00 ━━━━━━━━━━━━━━━━ 评分标准: 题意分析:根据题意,应做回归分析。(方法正确得10分) ⑴经绘制散点图,两指标间基本呈直线趋势,可以用直线回归分析。(5分) ⑵计算结果(10分):以极谱法结果为x,碘量法结果为y,经 SPSS计算得: a=-3.113, b=1.668, F=1944.118(或t=44.092), P=0.000(或

P<0.0005) ⑶结论(9分):由于P<0.05,可认为极谱法与碘量法存在回归关系(或依存关系),可以用极谱法结果推算碘量法结果(6分),推算方程为: Y=-3.113+1.668X(3分) 2、某医院对比两种疗法对活动期+二指肠球部溃疡的疗效,一组口服呋喃硝胺;另一组口服甲氰咪呱。结果如下,问两组的疗法是否有差别? 例数 愈合 好转 无效 呋喃硝胺组 62 54 7 1 甲氰咪呱组 64 44 11 9 合 计 126 98 18 10 评分标准: 题意分析:该资料为等级资料,可采用秩和检验。(方法正确得10分) ①建立假设,确定检验水准(3分) H0:两组疗效的分布无差别 H1:两组疗效的分布有差别 α=0.05 ②计算结果(10分):经SPSS计算得, U=1594.00(或W=3547或Z=-2.624),P=0.009 ③推断结论(6分,其中,统计结论3分,专业结论3分):由于 P=0.009<0.05,按α=0.05,拒绝H0,接受H1,可认为两组疗效差异有统计学意义,呋喃硝胺的疗效高于甲氰咪呱。 3、现有170例已确诊的乳癌患者,请问:两种诊断方法的诊断结果是否有关系?两种方法何者为优 ? ──────────────── 临床诊断 X线诊断 ───────── 乳癌 非乳癌 ──────────────── 乳癌 24 30

医学统计学知识点梳理

医学统计学知识点梳理 Revised as of 23 November 2020

医学统计学知识点梳理 医学统计学:是用统计学原理和方法研究生物医学问题的一门学科。他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。 统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。 统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征: ①参数估计:用样本的指标去推断总体相应的指标 ②假设检验:由样本的差异推断总体之间是否可能存在的差异 同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。 总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。

流行病学和医学统计学基础知识答案及解析

第五章流行病学和医学统计学基础知识 一、单选题 1、以下对流行病学的任务,表述错误的是()。 A. 流行病学第二阶段的任务是“找出原因、影响或决定因素” B. “健康风险评估”对应流行病学第一阶段的任务 C. “健康危险因素干预”对应流行病学第三阶段的任务 D. 流行病学第一阶段的任务是“揭示现象” E. 流行病学第三阶段的任务是“提供措施” 网校答案:B 网校解析:流行病学的任务大体上可以分为三个阶段 第一阶段的任务是“揭示现象”,即揭示流行(主要是传染病)或分布(其他疾病、伤害与健康)的现象。 第二阶段为“找出原因、影响或决定因素”,即从分析现象入手找出流行与分布的规律、原因或影响因素。 第三阶段为“提供措施”,即合理利用前两个阶段的结果,找出预防或干预的策略与措施。结合健康管理的实际,流行病学第一、二和三阶段的任务分别对应的是“健康信息收集”“健康风险评估”“健康指导和健康危险因素干预”。 2、流行病学主要研究()。 A. 医院内的患者及患病有关因素 B. 正常人群的健康水平 C. 亚健康人群的健康水平 D. 人群中疾病与健康状况的分布及其影响因素 E. 社区内高危人群及其健康水平 网校答案:D 网校解析:流行病学的主要研究内容如下: ①疾病分布及影响分布的原因:即“揭示现象”。 ②研究疾病的流行因素和病因:即“找出原因”。 ③研究与制定预防对策和措施:即“提供措施”。 ④评价策略和措施的效果:即“评价效果”。 3、下列关于流行病学,说法错误的是()。 A. 流行病学是从群体角度研究疾病与健康 B. 流行病学研究的病种仅限于传染病 C. 流行病学属于预防医学的范畴 D. 流行病学已深入临床医学的研究中 E. 流行病学是从疾病分布入手探讨疾病的流行因素 网校答案:B 网校解析:流行病学是研究疾病、健康状态和事件在人群中的分布、影响和决定因素,用以预防和控制疾病、促进健康的学科。该定义的基本内涵有四点: ①它的研究对象是人群,是研究所关注的具有某种特征的人群; ②它不仅研究各种疾病,而且研究健康状态和事件; ③它的重点是研究疾病、健康状态和事件的分布、影响和决定因素;

医学统计学知识点梳理

医学统计学知识点梳理 医学统计学:是用统计学原理和方法研究生物医学问题的一门学科。他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。 统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。 统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征: ①参数估计:用样本的指标去推断总体相应的指标 ②假设检验:由样本的差异推断总体之间是否可能存在的差异 同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。 总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。

变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。 概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。 随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A ) A.四格表检验 B. 四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H 不拒绝H

H 正确Ⅰ型错误(ɑ) 0 推断正确(1?ɑ) 不正确推断正确(1?β) H Ⅱ型错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H 为假时却被接受,取伪错误 Ⅱ型错误(β错误): H 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同 等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的 可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意 扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数)

㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示 =S/√n 为S x ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n 7.方差分析 方差分析:又称F检验,是通过对数据变异按设计类型的不同,分解成两个或多个样本均数所代表总体均数是否有差别的一种统计学方法。 (方差分析的基本思想:把全部观察值间的变异按设计类型的不同,分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义) 二、问题 1.集中趋势与离散趋势描述的常用指标、适用范围与优缺点 ㈠描述集中趋势的常用指标:

第五章-医学统计学的基本知识(五)

第五章医学统计学的基本知识 第二节医学统计学的基本知识 一、基本概念 (一)医学统计学的定义和研究对象 1.医学统计学定义: 根据统计学的原理和方法,研究医学数据收集、表达和分析的一门应用学科。 2. 医学统计学研究对象: 是具有不确定性的医学数据,其基本的研究方法是通过收集大量资料,通常是人、动物或生物材料的测量值,发现蕴含其中的统计学规律。 (二)医学统计学的主要内容 1.统计设计 2.统计描述 3.统计推断 (三)医学统计资料的类型 计量资料、计数资料和等级资料三类。 1.计量资料——数值变量: 为定量测量的结果,通常用专用仪器测量,并有计量单位,如身髙(cm)、体重(kg)等。 2.计数资料——定性观察的结果。 二分类:两种相互对立的属性如:阳性/阴性、正常/异常 多分类:定性观察结果有两种以上互不包含的属性, 如新生儿出生缺陷、某病患者的死亡原因等。 这类资料之所以称为计数资料,因为在统计时通常将各种 观察结果按属性分类计数,如阳性人数、阴性人数、 死于某病的人数等。 3.等级资料: 介于定量测量和定性观察之间的半定性观察结果,通常有两个以上等级, 如阴性、阳性、强阳性,治愈、好转、有效、无效等。 (四)医学统计工作的基本步骤 研究设计、收集资料、整理资料和分析资料是统计工作的4个基本步骤。 (五)统计学的几个重要概念 1.同质与变异 同质:研究对象具有相同的背景、条件、属性称为同质。 变异:同一性质的事物,其个体观察值(变量值)之间的差异,在统计学上称为变异。 统计学所研究的对象是以同质为基础,并具有变异的事物或现象。

2.总体与样本 总体:是根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种变量值的集合。 观察单位——个体,是统计研究中最基本的单位。 样本:即从总体中随机抽取有代表性的一部分观察单位,其测量值(或观察值)的集合称为样本(sample)。 抽样研究的目的是用样本信息推论总体特征。 3.参数与统计量 参数:指总体指标,如总体均数、总体率、总体标准差等。 统计量:指样本指标,如样本均数、样本率、样本标准差等。 4.误差 医学科学研究中的误差: 通常指测量值与真实值之差,其中包括系统误差和随机测量误差; 以及样本指标与总体指标之差,即抽样误差。 5.概率与频率 概率是对总体而言,频率是对样本而言。 概率:指某随机事件发生的可能性大小的数值,常用符号P来表示。 随机事件的概率在0与1之间,即0≤P≤1,常用小数或百分数表示。P越接近1,表明某事件发生的可能性越大,P越接近0,表明某事件发生的可能性越小。 频率:指一次实验结果计算得到的样本率。 二、统计描述 (一)数值变量资料的统计描述 1.频数表:最小值、最大值、组段之间首尾相接。 2.频数分布图:直接反映连续变量各种取值出现的机会。 3.描述离散趋势的指标:方差与标准差、极差、百分位数、变异系数。 4.描述集中趋势的指标:算数均数、中位数、几何均数。 (二)分类资料的统计描述 1.频数表:表5-4 108例患者随访方式频数表。 2.相对数:比和率(见本章第一节)。

相关文档
最新文档