医学统计学案例分析 2

医学统计学案例分析 2
医学统计学案例分析 2

案例分析—四格表确切概率法

【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。

表1-4 两种药物治疗急性心肌梗塞的疗效比较

药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7

西药 6(8.67)7(4.33)1346.2

合计1892766.7【问题1-5】

(1)这是什么资料?

(2)该资料属于何种设计方案?

(3)该医师统计方法是否正确?为什么?

【分析】

(1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。

(2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。

(3) 患者总例数n=27<40,该医师用χ2检验是不正确的。当n<40或T<1时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率

案例分析-卡方检验(一)

【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t =2.848,P=0.005,差异有统计学意义检验,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】

(1)这是什么资料?(2)该资料属于何种设计方案?

(3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法?【分析】 (1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。 (2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料,不能用于计数资料的比较。 (4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的X2检验(chi-square test)。

【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见表1-1。

表1-1 中药和西药治疗非典病人有效率的比较

药物有效无效合计有效率(%)

中药西药14(11.2)

2 (4.8)

14(16.8)

10 (7.2)

28

12

50.0

16.7

步骤如下:

1.建立检验假设,确定检验水准

H 0:两药的有效率相等,即π

1

=π

2

H 1:两药的有效率不等,即π

1

≠π

2

2.计算检验统计量值

(1) 计算理论频数根据公式计算理论频数,填入表7-2的括号内。

(2) 计算χ2值

具体计算略。

3.确定P值,做出统计推断

查附表6(χ2界值表),X20.05,1=3.84得0.025<P<0.05,按α=0.05 水准,拒绝H0,接受H1,差异有统计学意义,可认为两药的有效率不等,中药疗效高于西药。【问题1-2】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?

【分析】

(1) 中西药的疗效按有效和无效分类,该医师认为此资料是二分类资料即计数资料是正确的。

(2) 40例患者随机分配到西药组和中药组,属于完全随机设计方案。

(3) 该医师用四格表X2检验是正确的,但计算值的公式不对。因为有一个理论频数(T21=4.8)小于5大于1,应用连续性校正公式计算χ2值。具体计算略。

查附表6(χ2界值表),得0.250>P>0.100,按α=0.05水准,不拒绝H0,差别无统计学意义,尚不能认为两药的有效率不相同,中药疗效与西药疗效基本相同。结论与前述相反。

案例分析-卡方检验(二)

【例1-3】某医师用某种中草药治疗不同类型的小儿肺炎,其中病毒性肺炎60例,细菌性肺炎60例,治疗结果见表1-2。该医师对此资料采用行×列检验,得χ2 =7.077,P=0.069,差异无统计学意义,故认为此种中草药对不同类型小儿肺炎的疗效分布无差别。

表1-2 某种中草药治疗不同类型小儿肺炎的疗效比较

【问题1-3】(1)该研究是什么设计?(2)统计分析的目的是什么?统计方法是否正确?

【分析】(1) 该资料为完全随机设计方案。(2) 欲比较两组的疗效是否有差别,其比较的结局变量(分析变量)是等级资料,为单向有序分类资料。用χ 2 检验不妥,因为如果对其中的两列不同疗效的数值进行调换,值不会有变化,但秩和检验统计量有变化,所以该资料应该采用利用等级信息较好的秩和检验或Ridit分析。(经秩和检验,结果为Z= -2.570,P=0.010,差异有统计学意义。该结论与上述结论相反。)

案例分析-卡方检验(三)

【例1-4】某医院采用甲乙两种方法测定60例恶性肿瘤患者体内ck20基因表达阳性率,甲法测定阳性率为70.0%,乙法测定阳性率为38.3%,两种方法一致测定阳性率为26.7%。为比较甲乙两种方法的测定阳性率是否有差异,该医生首先将资料整理为表1-3。然后采用四格表检验进行假设检验,得χ

2=12.118,P<0.005,差异有统计学意义,故认为甲乙两种方法的测定结果有差

别,甲法测定阳性率较高。

表1-3 两种方法测定结果比较

【问题1-4】(1)这是什么资料?(2)该资料属于何种设计方案?

(3)该医师统计方法是否正确?为什么?(4)该资料应采用何种统计方法?【分析】(1) 该资料是按两种方法测定结果(阳性、阴性)二分类的计数资料。

(2) 该设计为同一受试对象接受两种不同的处理,属于自身配对设计方案。(3)

该医师用完全随机设计资料的四格表χ2检验分析配对设计资料,其统计表和统计方法均不正确。

(4) 比较甲乙两种方法测定结果的阳性率是否有差别,应采用配对χ2检验(或McNemar检验)。

案例分析-t检验

【例1-1】某医生随机抽取正常人和脑病病人各11例,测定尿中类固醇排出量(mg/dl),结果如表1-1。该医生根据此资料算得正常人尿中类固醇排出量的均数=4.266mg/dl,标准差S1=0.985mg/dl;脑病病人尿中类固醇排出量的均数=5.732mg/dl,标准差S2=1.626mg/dl,配对t检验结果,t = –3.098,P < 0.05,故认为脑病病人尿中类固醇排出量高于正常人。

表1-1 正常人和脑病病人尿中类固醇排出量(mg/dl)测定结果

分组尿中类固醇排出量(mg/dl)

正常人 2.90 5.41 5.48 4.60 4.03 5.10 4.97 4.24 4.37 3.05 2.78 脑病病人 5.28 8.79 3.84 6.46 3.79 6.64 5.89 4.57 7.71 6.02 4.06

【问题1-1】 1.该资料属于何种设计方案? 2.该医生的统计处理是否正确?

为什么?

【分析】 (1) 该资料是随机从两人群(研究的两个总体)中抽取样本,测量尿

中类固醇排出量,属于完全随机设计。 (2)该统计处理不正确。对完全随机设计

的资料不宜用配对t检验。本资料应用完全随机设计两样本均数比较的t检验,目的是判断两样本均数分别代表的两总体均数和是否相同。

【例1-2】 2005年某县疾病预防控制中心为评价该县小学生卡介苗抗体效价,

随机抽取了30名小学生,测定结果见表1-2。经完全随机设计两样本均数比较

的t检验(方差齐,F=0.096,P>0.05),t = 0.014,P>0.05,故认为该县小学生卡介苗抗体效价无性别差异。

表1-2 2005年某县30名小学生卡介苗抗体滴度测定结果

卡介苗抗体滴度(倒数)

40 20 160 40 320 80 40 20 40 80 160 40 80 40 40 40 生

80 20 160 40 40 160 40 20 40 160 160 40 80 40

【问题1-2】1.该资料属于何种设计方案? 2.统计处理是否正确?为什么?【分析】 (1) 该资料是随机抽取当地30名小学男生和女生作为样本,测定每个观察对象的卡介苗抗体滴度,属于完全随机设计。 (2) 由于抗体滴度值是等比资料,服从对数正态分布,各组的平均滴度应用几何均数(G)描述,其假设检验不能直接用完全随机设计两样本均数比较的t检验, 而应将观察值进行对数

变换后再用t检验。

方差分析

【例6-1】某研究者为研究核黄素缺乏对尿中氨基氮的影响,将60只Wistar大白鼠随机分为核黄素缺乏、限食量、不限食量三组不同饲料组。每组20只大白鼠。一周后测尿中氨基氮的三天排出量,结果如表6-1。该研究者对上述资料采用了两样本均数t检验进行两两比较,得出结论:三组之间均数差异均有统计学意义(P<0.05)。

表6-1 3组大白鼠在进食一周后尿中氨基氮的三天排出量(mg)

【问题6-1】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该研究者处理方法是否正确?为什么?

【分析】(1) 由于测定的是三组大白鼠尿中氨基氮含量,属于多组计量资料。(2) 60只大白鼠随机分为三组,属于完全随机设计方案。(3) 该研究者统计处理方法不正确,因为t

检验适用于完全随机设计的两组计量资料的比较,不适用于多组计量资料的比较。(4) 要比较检验多组完全随机设计计量资料的多个样本均数有无差别,需用完全随机设计计量资料的方差分析,即单因素方差分析。

2.【例6-2】某医师研究A、B、C三种药物治疗肝炎的效果,将30只大白鼠感染肝炎后,按性别相同、体重接近的条件配成10个区组,然后将各配伍组中3只大白鼠随机分配到各组:分别给予A、B和C药物治疗。一定时间后,测定大白鼠血清谷丙转氨酶浓度(IU/L),如表6-7。该医师用完全随机设计资料的方差分析方法对资料进行了假设检验,F=12.63,P<0.001,故认为三种药物的疗效不全相同。

表6-2 A、B、C三种药物治疗后大白鼠血清谷丙转氨酶浓度(IU/L)

区组号 1 2 3 4 5 6 7 8 9 10 处理A 652.40 741.30 675.60 582.80 491.80 412.20 494.60 379.50 679.48 588.78 处理B 624.30 772.30 632.50 473.60 462.80 431.80 484.90 380.70 634.93 474.56 处理C 445.10 432.50 362.70 348.70 345.90 312.80 296.30 228.40 372.26 352.77

【问题6-2】 (1) 该资料是什么资料? (2) 该研究是什么设计? (3) 统计分析方法是否恰当?

【分析】 (1) 由于测定的是血清谷丙转氨酶浓度(IU/L),属于多组计量资料。

(2) 30只大白鼠,按性别相同、体重接近划分为10个区组。每个区组3只大白鼠随机采用A、B、C三种药物治疗,故属于随机区组设计方案。 (3) 该医师应用完全随机设计计量资料的方差分析进行检验是不正确的,应该选用随机区组设计的方差分析方法进行检验。

案例分析-秩和检验

例1-1】某医师用改良的Seldinger’s插管技术对8例经临床和病理证实的恶性滋养细胞肿瘤进行选择性盆腔动脉插管灌注化疗。测定治疗前后血中的HCG含量如表1-1。该医师考虑到数据相差较大,采用对数变换后进行两样本均数比较的t检验,得t =2.460,P<0.05,差异有统计学意义,故认为治疗前后血中HCG的含量有差别。

表1-1 灌注化疗前后HCG含量测定结果(pmol/L)

病例号(1) 灌注前(X1)

(2)

灌注后(X2)

(3)

lg X1

(4)

lg X2

(5)

1 1280000 210000 6.107

2 5.3222

2 75500 3300 4.8779 3.5185

3 12450 2210 4.0952 3.3444

4 1500000 9.3 6.1761 0.9685

5 10000 2500 4.0000 3.3979

6 9700 1203 3.9868 3.0803

7 15588 4825 4.1928 3.6835

8 4223 914 3.6256 2.9609

【问题1-1】

1.这是什么资料?

2.该实验属于何种设计方案?

3.该医师统计方法是否正确?为什么?

【分析】

(1) 该资料为计量资料。

(2) 该实验属自身配对设计方案。

(3) 该医师统计方法不正确。首先,配对资料一般采用对每对数据求差值后进行比较,而该医师采用完全随机设计资料的检验方法,统计方法与设计类型不

符;其次,该医师考虑了数据相差较大,即不满足t检验的前提条件正态分布,采用了对数变换,基本思想正确。但治疗前后的数据经对数变换后,其差值的变异仍然较大(经正态性检验,P<0.05),因此仍不满足配对t检验的条件,故该资料宜采用非参数检验方法,即Wilcoxon配对设计的符号秩和检验,目的是推断配对资料的差值是否来自中位数为零的总体。

【例1-2】某医生用某种中药治疗I型糖尿病患者和II型糖尿病患者共45例,结果见表1-2。为评价该中药对两型糖尿病的疗效有无差异,该医生对此资料进行χ2检验,得χ2=5.289,P>0.05,差异无统计学意义,故认为该中药对两型糖尿病患者的疗效基本相同。

表1-2 某种中药治疗两型糖尿病的疗效比较

疗效等级I型糖尿病II型糖尿病合计

无效 9 3 12

好转 8 9 17

显效 5 11 16

合计22 23 45

【问题 1-2】

1.该资料是什么资料?

2.该研究是什么设计?

3.统计分析中有无不妥之处?

【分析】

(1) 该资料的分组变量(两型糖尿病)是二分类资料,分析变量(疗效等级)是等级资料,称为单向有序分类资料。

(2) 研究设计为完全随机设计。

(3) 统计分析不正确。该医生的研究目的是比较中药治疗两型糖尿病的疗效,用χ2检验只能说明各处理组的效应在分布上有无不同,而不能说明各处理组效应的平均水平有无差别,也就是说χ2检验没有利用等级信息,因此效率较低。该资料宜用非参数检验的Wilcoxon秩和检验。

案例分析-直线相关与回归分析

【例1-1】为评价环境噪音强度对社区居民生活的影响程度,某市疾病预防控制中心监测了该市10个社区的环境噪音强度,同时调查各社区居民的失眠患病率(%),结果见表1-1。经对噪音强度数量化(+ =1,++ =2,+++ =3,++++ =4,+++++ =5)后,某医师对该资料采用Pearson直线相关分析,得r=0.853,P<0.005,认为环境噪音强度与居民失眠患病率之间存在正相关关系。

表1-1 某市10个社区环境噪音强度与居民失眠患病率

1 2 3 4 5 6 7 8 9 10 噪音强度++++ +++ + ++ +++ +++++ + +++ ++ ++++ 失眠患病率

21.20 23.40 11.40 16.90 17.50 26.30 13.60 25.60 11.60 25.30

(%)

【问题1-2】 1.这是什么资料? 2.该医师处理方法是否正确?为什么? 3.该资料应该用何种统计方法分析?

【分析】 (1) 该资料包含环境噪音强度与居民失眠患病率两个变量,一个属于等级资料,一个属于计量资料。 (2) 该医师处理方法不正确,因为环境噪音强度为等级资料,不服从正态分布,因此,不能用Pearson直线相关分析。 (3) 该资料应选用非参数统计方法,可采用Spearman的等级相关,即秩相关(Spearman’s rank correlation)来分析两者的关系。

不服从正太分布,总体分布未知,存在极端值或原始数据用等级表示的资料

【例1-2】某地对血吸虫流行区进行血吸虫与大肠癌关系的调查研究,抽查39

个乡的资料,各乡抽查人数相同。血吸虫感染率最低为8.9%,最高为79.3%。将血吸虫感染率(%)作x,大肠癌标化死亡率(1/10万)为y,作相关回归分析,得r=0.6315,P<0.01,b=0.1344,a=4.152。【问题1-2】

(1)能否用直线回归方程描述两者的关系,为什么?

(2)若血吸虫感染率为20%,则大肠癌标化死亡率平均是多少?

(3)若血吸虫感染率为90%,大肠癌标化死亡率平均又是多少?

【分析】

(1)能用直线回归方程描述两变量间的关系,因为回归系数的假设检验与相关系数的假设检验等价,既然r的假设检验P<0.01,可认为两变量有直线关系,所以能用直线回归方程来描述两变量间的关系:

y=4.152+0.1344x

(2)将x=20代入方程,求得y=6.84,则血吸虫感染率为20%时,大肠癌标化死亡率平均是6.84/10万,因为没有提供所需的数据,不可能求大肠癌标化死亡率的容许区间,所以到此结束。

(3)由于血吸虫感染率的实测值范围是8.9%~79.3%,90%已超出此范围,不宜用该回归方程来估计大肠癌标化死亡率。

案例分析-实验设计

1.案例11-1 某医师观察某新药治疗急性气管炎的疗效,用氨苄青霉素作对照。病人入院时,体温在39℃以下分入治疗组,39℃及以上分入对照组,结果新药疗效优于氨苄青霉素。

【问题11-1】(1)该医师的结论是否正确?(2)实验设计有何缺陷?(3)应该怎样正确设计?

【分析】(1) 该医师的结论不正确。(2) 该实验设计违犯了均衡性原则和随机化原则,实验结果没有可比性。因为体温在39℃及以上者病情较重,39℃以下者病情较轻,治疗组和对照组病人的病情程度不同即病情不均衡,治疗组为轻病人,对照组为重病人,这类试验必然导致错误的试验结果。如果治疗组和对照组交换一下,对照组为轻病人,该新药可能就没有效果。(3) 正确的实验设计:随机抽取足够样本含量的急性气管炎病人,采用随机方法,将39℃及以上病人随机分成治疗组和对照组,将39℃以下病人也随机分成治疗组和对照组,两组除了治疗药物不同外,其它条件尽可能相同,采用盲法进行治疗和观察,结果进行假设检验以后再下结论。

上述分析表明:临床科研结果的好坏取决于临床试验设计的好坏,良好的实验设计才能得到较好的科研结果。

2.案例11-2 某研究者欲评价多糖铁复合物治疗儿童轻度缺铁性贫血的疗效,在城北小学抽取60名确诊为轻度缺铁性贫血的儿童,服用多糖铁复合物为实验组;在城南小学抽取60名确诊为轻度缺铁性贫血的儿童,未服用多糖铁复合物为对照组,观察指标是血红蛋白含量。结果城北小学观察对象血红蛋白均值明显上升,城南小学观察对象血红蛋白略有提高,但比城北小学低,故认为多糖铁复合物有升血红蛋白作用,能有效治疗缺铁性贫血。

【问题11-2】

(1)该研究者遵循的均衡原则是否合理?为什么?

(2)该研究的混杂因素是什么?

(3)应该怎样正确设计?

【分析】(1) 该实验设计的缺陷是违背了均衡原则,即不清楚两所小学儿童的家庭经济条件、地理位置、儿童饮食习惯、营养条件是否相同或很相近,如果明显不同,则影响血红蛋白含量的因素除药物外,也可能是儿童饮食营养条件,不能将血红蛋白量升高这一结果完全归之于多糖铁复合物的疗效。因此认为这个没计是不均衡设计。(2) 本研究的混杂因素是饮食习惯和营养条件等。这些混杂因素得不到控制,就不能得出上述结论。但要通过改变儿童饮食习惯和营养条件来控制这些混杂因素是比较困难的,可通过交叉均衡设计,以达到均衡目的。(3) 正确设计:将城南小学60名儿童随机分成两组,30名服用多糖铁复合物,30

名不服药;城北小学60名儿童也随机分成两组,30名服药,30名不服药。观察一段时间后,对城南和城北小学分开比较试验组和对照组即服药与不服药的血红蛋白有无差别,也可将测得城南小学30名服药儿童和城北小学30名服药儿童合并,作为实验组求平均值,再将两小学各30名未服药儿童的测定结果合并,作

为对照组求平均值。对实验组和对照组的平均值进行假设检验,如果实验组的血红蛋白值高于对照组,且差异有统计学意义,可认为多糖铁复合物对血红蛋白有影响,对儿童轻度缺铁性贫血有治疗作用。

3.案例11-3 为评价某种国产抗菌新药的疗效,某医生抽取患有某种疾病且符合入选条件的60例患者,按入院后床位的单双号分为两组,每组30人。试验组服用该新药,对照组服用同类公认有效的进口药,临床观察结果见表

11-9。经四格表卡方检验,得卡方=3.750,P>0.05,差异无统计学意义,故认为该国产抗菌新药与同类进口药的疗效基本相同。

%国产抗菌新药30 21 70.0

同类进口药30 27 90.0

表11-1 两组患者用药后有效率比较

【问题11-3】

(1)该研究属何种类型?

(2)在设计的过程中是否遵循了实验设计的基本原则?

(3)该临床试验为何种对照?

(4)该医师的结论是否可靠?为什么?

【分析】(1) 该研究属临床试验设计。(2) 在设计与实施的过程中,该医生是按照床位号码将入选的60例患者随意分组,未能按照随机化的原则分组。(3) 该临床试验为标准对照。(4) 由于该医生未遵循随机化原则,样本的代表性差,两组患者的非处理因素不均衡,可比性差,因此其结论不可靠。

4.例11-4某研究者欲评价佳加学生钙治疗儿童轻度缺钙的疗效,在实验幼儿园抽取80名确诊为轻度缺钙的儿童,服用佳加学生钙为试验组;在该地机关幼儿园抽取80

名确诊为轻度缺钙的儿童,未服用佳加学生钙为对照组,观察指标是头发中钙的含量。结果试验组实验幼儿园的儿童发钙均值明显上升,机关幼儿园的观察对象

发钙略有提高,但比试验组低,故认为佳加学生钙有补钙作用,能有效治疗儿童缺钙。

佳加学生钙为试验组;在该地机关幼儿园抽取80名确诊为轻度缺钙的儿童,未服用佳加学生钙为对照组,观察指标是头发中钙的含量。结果试验组实验幼儿园的儿童发钙均值明显上升,机关幼儿园的观察对象发钙略有提高,但比试验组低,故认为佳加学生钙有补钙作用,能有效治疗儿童缺钙。

【问题11-4】

(1)该研究者遵循了均衡原则吗?为什么?

(2)该研究的混杂因素是什么?

(3)应该怎样正确设计?

【分析】

(1) 该实验设计的缺陷是违背了均衡原则,即不清楚两所幼儿园儿童的家庭经济条件、地理位置、儿童饮食习惯、营养条件是否相同或很相近,如果明显不同,则影响发钙含量的因素除药物外,也可能是儿童饮食习惯、营养条件是否相同或很相近,如果明显不同,则影响发钙含量的因素除药物外,也可能是儿童饮食营养条件,不能将发钙升高这一结果完全归之于佳加学生钙的疗效。因此认为这个没计是不均衡设计。

(2) 本研究的混杂因素是饮食习惯和营养条件等。这些混杂因素得不到控制,就不能得出上述结论。但要通过改变儿童饮食习惯和营养条件来控制这些混杂因素是比较困难的,可通过交叉均衡设计,以达到均衡目的。

(3) 正确设计:将实验幼儿园80名儿童随机分成两组,40名服用佳加学生钙,40名不服药;机关幼儿园80名儿童也随机分成两组,40名服药,40名不服药。观察一段时间后,对两个幼儿园分开比较试验组和对照组即服药与不服药的血清钙和发钙有无差别,也可将测得实验幼儿园40名服药儿童和机关幼儿园40名服药儿童合并,作为实验组求平均值,再将两幼儿园各40名未服药儿童的

测定结果合并,作为对照组求平均值。对实验组和对照组的平均值进行假设检验,如果实验组的血清钙和发钙值高于对照组,且差异有统计学意义,可认为佳加学生钙对发钙有影响,对儿童轻度缺钙有治疗作用。

医学统计学案例分析 (1)

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学案例分析(1) 案例分析四格表确切概率法【例 1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将 27 例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表 1-4。 经检验,得连续性校正 2 =3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表 1-4 两种药物治疗急性心肌梗塞的疗效比较药物中药西药合计有效 12(9.33) 6(8.67)无效 2(4.67) 7(4.33)合计 14 13 27 有效率(%) 85.7 46.2 66.7 18 9 【问题 1-5】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27 例患者随机分配到中药组和西药组,属于完全随机设计方案。 (3) 患者总例数 n=27<40,该医师用 2 检验是不正确的。 当 n<40 或 T<1时,不宜计算 2 值,需采用四格表确切概率法(exact probabilities in 22 table)直接计算概率案例分析-卡方检验(一)【例 1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取 140 例胃炎患者分成中药组和西药组,结果中药组治疗 80 例,有效 64 例,西药组治疗 60例,有效 35 例。 1 / 5

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007

医学统计学试题与答案

医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。

医学统计学案例分析(1)

案例分析—四格表确切概率法 【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表1-4 两种药物治疗急性心肌梗塞的疗效比较 药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7 西药 6(8.67)7(4.33)1346.2 合计1892766.7【问题1-5】 (1)这是什么资料? (2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么? 【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。 (3) 患者总例数n=27<40,该医师用χ2检验是不正确的。当n<40或T<1时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率 案例分析-卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】 (1)这是什么资料?(2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法?【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料,不能用于计数资料的比较。(4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的 X2检验(chi-square test)。 【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见表1-1。 表1-1 中药和西药治疗非典病人有效率的比较 药物有效无效合计有效率(%) 中药西药14(11.2) 2 (4.8) 14(16.8) 10 (7.2) 28 12 50.0 16.7 步骤如下: 1.建立检验假设,确定检验水准 H 0:两药的有效率相等,即π 1 =π 2 H 1:两药的有效率不等,即π 1 ≠π 2 2.计算检验统计量值 (1) 计算理论频数根据公式计算理论频数,填入表7-2的括号内。 (2) 计算χ2值 具体计算略。

医学统计学分析计算题-答案

第二单元 计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指 标 性 别 例 数 均 数 标准差 标准值* 红细胞数/1012·L -1 男 360 4.66 0.58 4.84 女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。 女性红细胞数的变异系数0.29 100%100% 6.94%4.18 S CV X = ?=?= 女性血红蛋白含量的变异系数10.2 100%100%8.67%117.6 S CV X =?=?= 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。 男性红细胞数的标准误0.031 X S = ==(1210/L ) 男性血红蛋白含量的标准误0.374 X S = ==(g/L )

女性红细胞数的标准误0.018X S = ==(1210/L ) 女性血红蛋白含量的标准误0.639X S = ==(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。σ未知,但n 足够大 ,故总体均数的区间估计按 (/2/2X X X u S X u S αα-+ , )计算。 该地男性红细胞数总体均数的95%可信区间为: (4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)1210/L 。 该地女性红细胞数总体均数的95%可信区间为: (4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)1210/L 。 (4) 两成组大样本均数的比较,用u 检验。 1) 建立检验假设,确定检验水准 H 0:12μμ=,即该地健康成年男、女血红蛋白含量均数无差别 H 1:12μμ≠,即该地健康成年男、女血红蛋白含量均数有差别 0.05α= 2) 计算检验统计量 22.829X X u === 3) 确定P 值,作出统计推断 查t 界值表(ν=∞时)得P <0.001,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。 (5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u 检验。 1) 男性红细胞数与标准值的比较 ① 建立检验假设,确定检验水准 H 0:0μμ=,即该地男性红细胞数的均数等于标准值

医学统计学案例分析

案例分析—四格表确切概率法 【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表1-4 两种药物治疗急性心肌梗塞的疗效比较 药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7 西药6(8.67)7(4.33)1346.2 合计1892766.7【问题1-5】 (1)这是什么资料? (2)该资料属于何种设计方案? (3) 该医师统计方法是否正确?为什么? 【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。(3) 患者总例数n=27<40,该医师用χ2检验是不正确的。当n<40或T<1 时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率 案例分析-卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】 (1)这是什么资料?(2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法? 【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料,不能用于计数资料的比较。(4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的检验(chi-square test)。 【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见 表1-1。 表1-1 中药和西药治疗非典病人有效率的比较 药物有效无效合计有效率(%) 中药西药14(11.2) 2 (4.8) 14(16.8) 10(7.2) 28 12 50.0 16.7 步骤如下: 1.建立检验假设,确定检验水准 H 0:两药的有效率相等,即π 1 =π 2 H 1:两药的有效率不等,即π 1 ≠π 2 2.计算检验统计量值 (1) 计算理论频数根据公式计算理论频数,填入表7-2的括号内。 (2) 计算χ2值

医学统计学分析计算题答案

第二单元计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指标性别例数均数标准差标准值* 红细胞数/1012·L-1男360 4.66 0.58 4.84 女255 4.18 0.29 4.33 血红蛋白/g·L-1男360 134.5 7.1 140.2 女255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV)比较二者的变异程度。 女性红细胞数的变异系数 女性血红蛋白含量的变异系数 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误来表示,由表4计算各项指标的标准误。 男性红细胞数的标准误(/L) 男性血红蛋白含量的标准误(g/L)

女性红细胞数的标准误(/L) 女性血红蛋白含量的标准误(g/L) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。未知,但足够大,故总体均数的区间估计按()计算。 该地男性红细胞数总体均数的95%可信区间为: (4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)/L。 该地女性红细胞数总体均数的95%可信区间为: (4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)/L。 (4) 两成组大样本均数的比较,用u检验。 1) 建立检验假设,确定检验水准 H0:,即该地健康成年男、女血红蛋白含量均数无差别 H1:,即该地健康成年男、女血红蛋白含量均数有差别 2) 计算检验统计量 3) 确定P值,作出统计推断 查t界值表(ν=∞时)得P<0.001,按水准,拒绝H0,接受H1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。 (5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u检验。 1) 男性红细胞数与标准值的比较 ①建立检验假设,确定检验水准 H0:,即该地男性红细胞数的均数等于标准值

医学统计学案例分析报告.doc

医学统计学案例分析评述 医学期刊论著:《口岸出入境人员预防接种统计分析》 【题目】口岸出入境人员预防接种统计分析 【研究目标】对口岸出入境人员的预防接种情况进行统计分析,为各种跨国传染性疾病的预防提供参考数据。 【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位,其基本资料如下:男3678 人,女3021 人;年龄在3-79 岁之 间,平均年龄45.6 岁。经免疫前检查和询问,研究对象均无严重 的疾病,且无接种疫苗过敏史及禁忌症。 【资料类型】本资料是计数资料。 (1)原文:研究对象:选择我处2010 年1 月-2011 年4 月,2011 年5 月-2012 年5月两个时间段6870 位出入境人员,将其按公务人员、船员、劳 务人员、留学人员、旅游探亲及商务等进行分组。 (2)问题:①文献中未明确“我处”的具体含义,没有明确研究对象的来源。 ②文献中未提及“6870 位出入境人员”是如何产生的,即是普查, 还是抽样调查?如果是抽样调查,未明确抽样的方法,是如何应用 随机抽样的方法选择这6870 位研究对象的? 【统计方法】 (1)本论著未明确使用了何种统计学方法,我们组认为:首先应对资料进行正态性检验和方差齐性检验,若满足正态、方差齐,选择χ2检验,否则应选用秩和检验。 一篇论文结论的正确与否,需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理,就无法知道检验结果是否出错,也就无法对结论进行准确判断。 (2)文献尽管在“1.4 统计学处理”中提及了“使用SPSSl5.2 软件进行统计学分析”,注明所采用的统计软件,但方法中未注明统计推断方法,没有明确

医学统计学分析题

五、分析应用题(4题,共40分) 1、为观察某病西医治疗及中西医结合治疗的疗效, 单纯型用西医治疗, 疑难型用中西医结合治疗, 疗效如下: 某病西医治疗及中西医结合治疗疗效比较 疗法例数治愈数治愈率(%) 西医治疗 70 50 74.29 中西医治疗 60 22 36.67 X2 =5.29 0.05>P>0.01, 西医治疗的疗效较好。你认为如何?请说出理由(6分) 1、答:结论不可信(2分);因为在设计分组上不科学,两组间不具有可比性(4分)。 2、24名志愿者完全随机地分成两组,接受降胆固醇试验。甲组为特殊饮食组,乙组为药物处理组,受试者在试验前后各测量一次血清胆固醇(mmol/L),数据如下表, 甲组乙组 受试者试验前试验后受试者试验前试验后 1 6.11 6.00 1 6.90 6.93 2 6.81 6.8 3 2 6.40 6.35 3 6.48 6.49 3 6.48 6.41 4 7.59 7.28 4 7.00 7.10 5 6.42 6.30 5 6.53 6.41 6 6.94 6.64 6 6.70 6.68 7 9.17 8.42 7 9.10 9.05 8 7.33 7.00 8 7.31 6.83 9 6.94 6.58 9 6.96 6.91 10 7.67 7.22 10 6.81 6.73 11 8.15 6.57 11 8.16 7.65 12 6.60 6.17 12 6.98 6.52 (1)欲分析两种治疗方法是否有效,采用何种统计分析方法?(6分) (2)欲判断两种降血清胆固醇措施效果是否相当,又采用何种统计分析方法?(6分) 2、答:(1)欲分析两种治疗方法是否有效,可用治疗前后比较,属配对设计(2分),应用配对t检验(3分)。(2)如判断两种方法的效果有无差别,则属成组设计(2分),应用两样本均数比较的t检验(3分)。 3、检验血磷含量有甲、乙两种方法,其中,乙法具有快速、简便等优点。现用甲、乙两法检测相同的血液样品,所得结果如下表。 样本号 1 2 3 4 5 6 7 乙法 2.74 0.54 1.20 5.00 3.85 1.82 6.51 甲法 4.49 1.21 2.13 7.52 5.81 3.35 9.61 问:⑴若要判断能否用乙法推算甲法,又用何统计方法?(6分) ⑵欲比较甲乙两法检出血磷是否相同,用何统计方法?(6分) 3、答:(1)根据题意,应用回归分析(6分) (2)这是配对设计计量资料(2分),应用配对t检验(4分) 4、某单位对常住本市5年以上,从未接触过铅作业,也未服过含铅药物或其它重金属,饮用自来水,无肝、肾疾患及贫血,近日未使用利尿剂的健康成年,用乙酸乙酰法测24小时尿δ-ALA的结果如下,欲制定其95%正常值范围。请问:用何种估计方法?说出理由并给出计算公式。(10分) δ-ALA 0.5- 1.0- 1.5- 2.0- 2.5- 3.0- 3.5- 4.0 -4.5- 5.0-5.5 合计

医学统计学试题及答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

医学统计学题库完整

第一章绪论习题 一、选择题 1.统计工作与统计研究得全过程可分为以下步骤:(D) A、调查、录入数据、分析资料、撰写论文 B、实验、录入数据、分析资料、撰写论文 C、调查或实验、整理资料、分析资料 D、设计、收集资料、整理资料、分析资料 E、收集资料、整理资料、分析资料 2、在统计学中,习惯上把(B )得事件称为小概率事件。 A、B、或C、 D、E、 3~8 A、计数资料 B、等级资料 C、计量资料 D、名义资料 E、角度资料 3、某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料得类型就是( A)。 4、分别用两种不同成分得培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长得活菌数如下,A:48、84、90、123、171;B:90、116、124、22 5、84。该资料得类型就是(C )。 5、空腹血糖测量值,属于( C)资料。 6、用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料得类型就是(B )。 7、某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。该资料得类型就是(D )。 8、100名18岁男生得身高数据属于(C )。 二、问答题 1.举例说明总体与样本得概念、 答:统计学家用总体这个术语表示大同小异得对象全体,通常称为目标总体,而资料常来源于目标总体得一个较小总体,称为研究总体。实际中由于研究总体得个体众多,甚至无限多,因此科学得办法就是从中抽取一部分具有代表性得个体,称为样本。例如,关于吸烟与肺癌得研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取得一定量得个体则组成了研究得样本。 2.举例说明同质与变异得概念 答:同质与变异就是两个相对得概念。对于总体来说,同质就是指该总体得共同特征,即该总体区别于其她总体得特征;变异就是指该总体内部得差异,即个体得特异性。例如,某地同性别同年龄得小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析得关系 答:统计设计与统计分析就是科学研究中两个不可分割得重要方面。一般得,统计设计在前,然而一定得统计设计必

医学统计学案例分析

医学统计学案例分析评述 医学期刊论着:《口岸出入境人员预防接种统计分析》 【题目】口岸出入境人员预防接种统计分析 【研究目标】对口岸出入境人员的预防接种情况进行统计分析,为各种跨国传染性疾病的预防提供参考数据。 【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位,其基本资料如下:男3678 人,女3021 人;年龄在3-79 岁之 间,平均年龄岁。经免疫前检查和询问,研究对象均无严重 的疾病,且无接种疫苗过敏史及禁忌症。 【资料类型】本资料是计数资料。 (1)原文:研究对象:选择我处2010 年1 月-2011 年4 月,2011 年5 月-2012 年5月两个时间段6870 位出入境人员,将其按公务人员、船员、劳 务人员、留学人员、旅游探亲及商务等进行分组。 (2)问题:①文献中未明确“我处”的具体含义,没有明确研究对象的来源。 ②文献中未提及“6870 位出入境人员”是如何产生的,即是普查, 还是抽样调查如果是抽样调查,未明确抽样的方法,是如何应用 随机抽样的方法选择这6870 位研究对象的 【统计方法】 (1)本论着未明确使用了何种统计学方法,我们组认为:首先应对资料进行正态性检验和方差齐性检验,若满足正态、方差齐,选择χ2检验,否则应选 用秩和检验。 一篇论文结论的正确与否,需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理,就无法知道检验结果是否出错,也就无法对结论进行准确判断。

(2)文献尽管在“统计学处理”中提及了“使用软件进行统计学分析”,注明所采用的统计软件,但方法中未注明统计推断方法,没有明确采用了那种统计方法,即是卡方检验还是秩和检验等。 (3)在没有提及统计方法的前提下,全文也没有表示统计结果,即具体的计算值和相对应的P值,只有P<,表述不完整。 正确的统计分析方法、具体的统计量值和P值是最终准确推断结论的重要依据,三者缺一不可。所以,具体的P值和统计量应在论文表格或文字描述中说明。 (4)统计符号书写不规范: 检验水准表述有误,原文“检验水平取P=”,应改为“检验水准ɑ=”。 【结果表达】 (1)在“不同时间段接种人数比较”中: ①原文:研究将研究对象按照2010 年1 月-2011 年4 月,2011 年5月-2012 年 5 月分为两个时间段进行研究,第一个时间段接种人数为460 6 人,第 二时间段接种人数为2264 人。第二时间段较第一时间段接种人数明显 减少,且具有显着差异性(P<)。 ②错误:结果表述有误:“第二时间段较第一时间段接种人数明显减少,且具有 显着差异性”。2个时间段研究对象数量不同,通过统计分析不能得出 “人数明显较少”的结论,应表述为:按ɑ=水准,差别有统计学意 义,可以认为2个时间段接种人数不同。 (2)在“结果和”的结论中: ①错误:均未明确具体的统计值及相对应的P值,“具有显着性差异”应改为“差 别有统计学意义”。 (3)统计表表示不正确: ①统计表为三线表,在有“合计”一项时,应加一条分隔线。

医学统计学试题及其答案

l.统计中所说的总体是指: A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫: B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡

治疗人数82363 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: B

A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对 第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E C V 13.各观察值均加(或减)同一数后: B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、l O、2、24+(小时),问该食物中毒的平均潜伏期为多少小时 C A5B5.5C6D10E1 2

医学统计学题库完整

第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计

医学统计学分析计算题-答案 (1)要点

第二单元 计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指 标 性 别 例 数 均 数 标准差 标准值* 红细胞数/1012·L -1 男 360 4.66 0.58 4.84 女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。 女性红细胞数的变异系数0.29 100%100% 6.94%4.18 S CV X = ?=?= 女性血红蛋白含量的变异系数10.2 100%100%8.67%117.6 S CV X =?= ?= 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。 男性红细胞数的标准误0.031 X S = ==(1210/L ) 男性血红蛋白含量的标准误0.374 X S = ==(g/L )

女性红细胞数的标准误0.018X S = ==(1210/L ) 女性血红蛋白含量的标准误0.639X S = ==(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。σ未知,但n 足够大 ,故总体均数的区间估计按 (/2/2X X X u S X u S αα-+ , )计算。 该地男性红细胞数总体均数的95%可信区间为: (4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)1210/L 。 该地女性红细胞数总体均数的95%可信区间为: (4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)1210/L 。 (4) 两成组大样本均数的比较,用u 检验。 1) 建立检验假设,确定检验水准 H 0:12μμ=,即该地健康成年男、女血红蛋白含量均数无差别 H 1:12μμ≠,即该地健康成年男、女血红蛋白含量均数有差别 0.05α= 2) 计算检验统计量 22.829X X u === 3) 确定P 值,作出统计推断 查t 界值表(ν=∞时)得P <0.001,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。 (5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u 检验。 1) 男性红细胞数与标准值的比较 ① 建立检验假设,确定检验水准 H 0:0μμ=,即该地男性红细胞数的均数等于标准值

医学统计学案例分析

医学统计学案例分析 案例分析—四格表确切概率法 【例1-5】为比较中西药治疗急性心肌梗塞de疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检2验,得连续性校正χP,0.05,差异无统计学意义,故认为中西药治=3.134,疗急性心肌梗塞de疗效基本相同。 表1-4 两种药物治疗急性心肌梗塞de疗效比较药物有效无效合计有效率(,) 中药 12(9.33) 2(4.67) 14 85.7 西药 6(8.67) 7(4.33) 13 46.2 合计 18 9 27 66.7 【问题1-5】 (1) 这是什么资料, (2) 该资料属于何种设计方案, (3) 该医师统计方法是否正确,为什么, 【分析】 (1) 该资料是按中西药de治疗结果(有效、无效)分类de计数资料。 (2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。 2(3) 患者总例数n=27,40,该医师用χ检验是不正确de。当n,40或T,1时, 2不宜计算χ值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率 案例分析,卡方检验(一)

【例1-1】某医师为比较中药和西药治疗胃炎de疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结检验(有效=1,无效=0)进行进行果t,2.848,P,0.005,差异有统计学意义 假设检验,结果t,2.848,P,0.005,差异有统计学意义,故认为中西药治疗胃炎de疗效有差别,中药疗效高于西药。 【问题1-1】 (1)这是什么资料,(2)该资料属于何种设计方案, (3)该医师统计方法是否正确,为什么,(4)该资料应该用何种统计方法, 【分析】 (1) 该资料是按中西药疗效(有效、无效)分类de二分类资料,即计数资料。 (2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布de计量资料,不能用于计数资料de比较。 (4) 该资料de目de是通过比较两样本率来推断它们分别代表de两个总体率有无差别,应用四格表资料de 检验(chi-square test)。 【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见表1-1。 表1-1 中药和西药治疗非典病人有效率de比较 药物有效无效合计有效率(,) 中药 (11.2) (16.8) 28 50.0 1414 西药 2 (4.8) 10 (7.2) 12 16.7 合计 16 24 40 40.0 某医师认为这是完全随机设计de2组二分类资料,可用四格表de检验。其步骤如下: 1(建立检验假设,确定检验水准

医学统计学试题(卷)与答案解析

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A ) A.四格表检验 B. 四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

相关文档
最新文档