中医药统计学 复习重点

中医药统计学 复习重点
中医药统计学 复习重点

某市12岁男童110人的身高(cm )如下:

身高组段 124— 128— 132— 136— 140— 144— 148— 152— 156— 160—164 频数(f ) 1 2 9 20 35 24 13 3 2 1

(2)写出该市男童身高95%的参考值范围。

(1)110名男童身高的均数、标准差为:

∑=

f fx x =140.9cm 1

/)(1

)(22

2

--=

--=

∑∑∑∑∑∑f f

fx fx

f x x f s =5.99cm

(2)该市男童身高95%的参考值范围:

百分位数法:(5..2P ,5.97P )=(128,156)cm 正态分布法:(s x

96.1-,s x 96.1+)

=(140.9-1.96×5.99,140.9+1.96×5.99)

=(129.2,152.6)cm

某市12岁男童110人的身高(cm )如下: 身高组段 124— 128— 132— 136— 140— 144— 148— 152— 156— 160—164 频数(f ) 1 2 9 20 35 24 13 3 2 1

1、对该资料作正态性检验;

2、求这110名男童身高的均数、标准差、变异系数;

3、写出该市男童身高95%的参考值范围; 1、 用SAS/INSIGHT 建立如下形式的数据集: A B 124 1

128 2 ………… 156 2 160 1

2、 SAS 处理主要步骤:

鼠标点击Edit →Variables →Other →将变量A 移到Y 框下,选a+b*Y 后在a:出键入2,点击OK ,形成组中值变量A-A 。鼠标点击Analyze →Distribution(Y),将变量A-A 移到Y 框下,将B 移到Freq 框下→点击Output,选Tests for Normality →OK. 3、 SAS 输出结果: 正态性检验:p=0.0007,

均数Mean :140.8727cm ,标准差Std. Deviation :5.99405cm

该市男童身高95%的参考值范围(p2.5,p97.5)=(128.5455,154.8000)cm

某市12岁男童110人的身高(cm )如下:

身高组段 124— 128— 132— 136— 140— 144— 148— 152— 156— 160—164 频数(f ) 1 2 9 20 35 24 13 3 2 1

2、写出该市男童身高95%的参考值范围。 )99.596.187.144,99.596.187.144()96.1,96.1(?+?-=+-s x s x

cm )61.156,13.133(=

或用百分位数法(

5.2p ,5.97p )=(131.50,15

6.50)cm

三、按随机设计,对功能性子宫出血的实热型患者12例与虚寒型患者10例的血液皮质醇含量进行测定,数据如下: 实热组1x :25.5 24.5 26.5 26.0 25.0 23.5 24.5 24.0 23.0 25.5 27.0 26.5

虚寒组2x :12.5 10.5 14.5 15.0 13.5 13.0 12.5 11.5 12.0 13.5 试比较两种类型患者的血液皮质醇含量有无差别?(假定资料满足正态性)

(1) 基本计算如下:

=1n 12 =1x 25.125 =1s 1.2636 =2

n 10 =2x 12.85 =2s 1.355

(2) 方差齐性检验

假设210

:σσ=H 211:σσ≠H 05.0=α

15.12636

.1355.12

2

2122===s s F 查F 界值表得)11,9(05.0F =3.59

因为 F>)11,9(05.0F 所以05.0>p

按05.0=α

水准,不拒绝0H ,两总体方差相等。

(3) t 检验

假设210:μμ=H 211:μμ≠H 05.0=α

)

1

1(2)1()1(2

12122

22

1

12

1n n n n s n s n x x t

+-+-+--=

=21.96

=-+=221n n ν12+10-2=20

查t 界值表得)20(05.0t =2.086 因为 t>)20(01.0t 所以

05.0

按05.0=α

水准,拒绝0H ,接受1H ,

可认为功能性子宫出血实热型患者的血液皮质醇含量比虚寒型患者的高。

2.按随机设计,对功能性子宫出血的实热型患者12例与虚寒型患者10例的血液皮质醇含量进行测定,数据如下: 实热组1x :25.5 24.5 26.5 26.0 25.0 2

3.5 2

4.5 24.0 23.0 2

5.5 27.0 2

6.5 虚寒组2x :12.5 10.5 14.5 15.0 13.5 13.0 12.5 11.5 12.0 13.5 试比较两种类型患者的血液皮质醇含量有无差别?(假定资料满足正态性和方差齐性。)

(4) 基本计算如下:

=1n 12 =1x 25.125 =1s 1.2636 =2

n 10 =2x 12.85 =2s 1.355

(5) t 检验

假设210:μμ=H 211:μμ≠H 05.0=α

)

1

1(2)1()1(2

12122

22

1

12

1n n n n s n s n x x t

+-+-+--=

=21.96

=-+=221n n ν12+10-2=20

查t 界值表得)20(05.0t =2.086 因为 t>)20(01.0t 所以

05.0

按05.0=α

水准,拒绝0H ,接受1H ,可认为功能性子宫出血实热型患者的血液皮质醇含量比虚寒型患者的高。

四、某中医院将45例血栓闭塞性脉管炎III 期2-3级患者随机分成甲乙两组,甲组使用活血温经汤,乙组使用通塞脉I

号治疗,结果如下表,问两药的疗效有无差别?

两药疗效比较

组别 有效人数 无效人数 合计

活血温经汤组 17 18 35 通塞脉I 号组 9 1 10 合 计 26 19 45

因45=N

,422=T .22,所以用校正的2x 检验;或Fisher 的确切概率法。

假设210

:ππ=H 211:ππ≠H 05.0=α

()91.319

261035452/45918117))()()(()2(222=????-?-?=++++--=d b c a d c b a n n bc ad x >3.84

所以

05.0

或Fisher 确切概率法 0288.0=p

按05.0=α

水准,拒绝0H ,接受1H ,

可认为通塞脉I 号治疗血栓闭塞性脉管炎疗效好于活血温经汤。

某中医院将45例血栓闭塞性脉管炎III 期2-3级患者随机分成甲乙两组,甲组使用活血温经汤,乙组使用通塞脉I 号治疗,结果如下表,作两药的疗效有无差别比较,可采用哪几种统计方法来分析,试用其中的一种方法进行分析?

两药疗效比较 组 别 有效人数 无效人数 合计

活血温经汤组 21 14 35 通塞脉I 号组 9 1 10 合 计 30 15 45

可采用校正的2

x 检验和Fisher 确切概率法进行分析。 因45=N

,33.32.2=T ,所以用校正的2x 检验。

9446.12=x 1632.0=p

或Fisher 确切概率法

1288.0=p

根据现有资料还不能认为两药的疗效有差别。

五 20只大白鼠配成10对,要求配对时,毛色、窝别、体重、雌雄及健康状况等条件尽量相同。然后,随机将两只条件

相同的大白鼠分配到实验组与对照组中去。一组是正常饲料组,一组是维生素E 缺乏组。测定两组大白鼠肝中的维生素A 含量,结果见下表,试比较两组大白鼠肝中维生素含量A 有无差别?

不同饲料鼠肝中维生素A 含量(IU/g ) 大白鼠对别 正常饲料组 维生素E 缺乏组

1 3050 1750

2 3550 2450

3 3450 2550

4 2100 2400

5 3100 1850

6 3800 3250

7 3950 3250

8 3850 3200

9 3750 2750

10 3700 2700

假设:0H :0=d

μ 1H :0≠d μ

05.0=α

n

s d t d /=

56.510

/2.4630.815==

9101=-=-=n ν

查t 值表得262.2)9(05.0=t

今)9(05.0t t

>,故05.0

按05.0=α

水准拒绝0H ,接受1H ;两组大白鼠肝中维生素含量有差别,维生素E 缺乏组大白鼠肝中维生素A 含量低于

正常饲料组的。

六为研究血清唾液酸含量对慢性胃疾病的诊断价值,测定了随机抽样得到的正常人、慢性胃炎、胃溃疡和胃癌患者的血清唾液酸含量(mg/dl ),结果如下:

正常人组: 43.10 41.46 42.35 41.42 42.01 43.12 42.05 40.20 慢性胃炎组:45.68 47.20 47.50 44.39 47.80 48.11 46.45 47.01 胃溃疡组: 44.04 45.12 44.77 46.28 48.56 44.87 48.58 47.32 胃癌患者组:68.21 67.40 66.12 65.38 66.44 62.21 66.15 60.36 进行四组患者血清唾液酸含量有无差别的方差分析, (1)填写下列方差分析表空缺项

方差分析表

──────────────────────────────────

变异来源 SS V MS F P

──────────────────────────────────

总 2642.3524 31

组间 2554.5074

组内 28

──────────────────────────────────

(2)作四组患者血清唾液酸含量两两组间有无差别,可采用什么统计方法进行分析? (3)上述资料若不满足参数检验的条件,应采用什么统计方法进行分析? (1) 方差分析表

──────────────────────────────────

变异来源 SS V MS F P

──────────────────────────────────

总 2642.3524 31

组间 2554.5074 3 851.5025 271.4107 0.0000 组内 87.8450 28 3.1373

──────────────────────────────────

(2)作四组患者血清唾液酸含量两两组间有无差别,可采用q 检验,也称SNK 检验。 (3)上述资料若不满足参数检验的条件,应采用秩和检验和相应的q 检验。

七用甲乙两种方法检测鼻咽癌患者93例,结果见下表,试问两种检测结果是否有一致性?是否有差别?

两种检测结果 乙法

甲法 + - 合计

+ 45 22 67 - 6 20 26 合 计 51 42 93

(1) 一致性检验

假设0H :两种检测方法检测结果无一致性

1H :两种检测方法检测结果有一致性 05.0=α

因为93=N

,每个理论数都大于5,所以用不校正的2x 检验。

70.1442

51266793

)6222045())()()(()(222

=?????-?=++++-=

d b c a d c b a n bc ad x >6.63 所以

01.0

(2) 差异性检验

假设0H :C B = 1H :C B ≠ 05.0=α

因为4028622<=+=+c

b ,所以用校正的McNemar-2x 检验。

63.604.86

22)1622()1(2

2

2

>=+--=

+--=

c

b c b x

所以

01.0

为甲法的检测阳性率高于乙法的。

用甲乙两种方法检测鼻咽癌患者73例,结果见下表,试问两种检测结果是否有一致性?是否有差别?

两种检测结果 乙法

甲法 + - 合计

+ 35 12 47 - 6 20 26 合 计 41 32 73

4、 :建立如下形式的数据集:

a b c 1.00 1.00 35.00 1.00 2.00 12.00 2.00 1.00 6.00 2.00 2.00 20.00 2、SPSS 处理主要步骤:

鼠标点击Data ,将频数变量c 权重→Analyze →Descriptive Statistics →Crosstable →将变量a ,b 分别移置到Row(s)和Column(s)框下→Statistics →选Chi-square/McNemar →Continue →Cell →选Observed/Expected/Row →Continue →OK 5、 输出结果:

每个格子的理论数均大于5,Pearson Chi-Square 为17.957,双侧p=.000;McNemar Test 为p=.238 6、 结论:

按照0.05检验水准,两者有相关关系,两者无差别:

八在研究人参的免疫调节作用时,测得不同人参浓度(mg/ml )培养液中异种淋巴靶细胞溶解率(%)的数据如下表。以人参浓度为自变量(X ),异种淋巴靶细胞溶解率为应变量(Y ),试作直线回归分析。

人参浓度与淋巴细胞溶解率 编号 人参浓度(X ) 淋巴细胞溶解率(Y ) 1 0.000 47.7

2 0.125 46.0

3 0.250 42.7

4 0.500 42.7

5 1.000 35.7

6 2.000 29.4

7 4.000 4.8

1、散点图:略。(3分)

2、直线回归的假设检验:方差分析 8218.439=F

01.0

可认为人参浓度与淋巴细胞溶解率有直线回归关系。

3、其直线回归方程为:

x y

3178.101789.47?-=(3分) 4、绘制回归直线:略。(3分)

九20只大白鼠配成10对,要求配对时,毛色、窝别、体重、雌雄及健康状况等条件尽量相同。然后,随机将两只条件相同的大白鼠分配到实验组与对照组中去。一组是正常饲料组,一组是维生素E 缺乏组。测定两组大白鼠肝中的维生素A 含量,结果见下表,试比较两组大白鼠肝中维生素A 含量A 有无差别?(假定资料满足正态性)

不同饲料鼠肝中维生素A 含量(IU/g ) 大白鼠对别 正常饲料组 维生素E 缺乏组

1 3050 1750

2 3550 2450

3 3450 2550

4 2100 2400

5 3100 1850

6 3800 3250

7 3950 3250

8 3850 3200

9 3750 2750

10 3700 2700 7、 建立如下形式的数据集:

a b 3050.00 1750.00 3550.00 2450.00 …………

3750.00 2750.00 3700.00 2700.00 8、 SPSS 处理主要步骤:

Analyze →Compare Means →Paired-Samples T Test →移变量a,b →OK 9、 输出结果:

正常饲料组与维生素E 缺乏组及两者差值的均数Mean 分别为:3430.0000、2615.0000和815.00000IU/g ;配对t 检验:t=5.558,p=.000 10、结论:

按照0.05检验水准,差别有统计学意义,可认为大白鼠肝中维生素A 含量正常饲料组高于维生素E 缺乏组。 五、统计分析3(本题15分)

研究单味中药对小白鼠细胞免疫机能的影响,把40只小白鼠随机分成四组,每组10只,雌雄各半,用药15天后,进行E-玫瑰花结形成率(E-SFC )测定,结果见下表,试比较三种单味中药的免疫作用是否有差别?(假定资料满足正态性)

不同中药对小白鼠E-SFC (%)的影响 对照组 党参组 黄芪组 淫羊藿组 14 21 24 35 10 24 20 27 12 18 22 33 16 17 18 29 13 22 17 31

14 19 21 36 12 18 18 35 10 23 22 30 13 20 19 28 9 18 23 36

11、建立如下形式的数据集:

a b 14.00 1.00 10.00 1.00

………… 28.00 4.00 36.00

4.00 12、SPSS 处理主要步骤:

Analyze →Compare Means →One-Way ANOVA →……→OK 13、输出结果:

1至4组均数Mean 分别为:12.3000、20.0000、20.4000、32.0000;方差齐性检验:p=.099;方差分析F=94.816,p=.000;两两比较:2与3组在一个分类区里。 14、结论:

按照0.05检验水准,方差齐;2与3组样本均数差别无统计学意义,其它组两两样本均数差别均有统计学意义。

为研究血清唾液酸含量对慢性胃疾病的诊断价值,测定了正常人、慢性胃炎、胃溃疡和胃癌患者的血清唾液酸含量(mg/dl ),结果如下:

正常人组: 43.10 41.46 42.35 41.42 42.01 43.12 42.05 40.20 慢性胃炎组:45.68 47.20 47.50 44.39 47.80 48.11 46.45 47.01 胃溃疡组: 44.04 45.12 44.77 46.28 48.56 44.87 48.58 47.32 胃癌患者组:68.21 67.40 66.12 65.38 66.44 62.21 66.15 60.36 试比较四组患者血清唾液酸含量有无差别?(假定资料满足正态性和方差齐性) 1、基本计算

组别 例数 均数 标准差 正常人组 8 41.9638 0.9597 慢性胃炎组 8 46.7675 1.2298 胃溃疡组 8 46.1925 1.7784

2、方差分析 9825.271=F 01.0

3、q 检验

q 检验结果 对比组 排序号 q 值

p 值

第4组与第2组 1与2 29.4245 <0.01 第4组与第3组 1与3 30.3384 <0.01 第4组与第1组 1与4 37.0582 <0.01

第2组与第3组 2与3 0.9137 >0.05 第2组与第1组 2与4 7.6337 <0.01 第3组与第1组 3与4 6.7200 <0.01

除第慢性胃炎组与第胃溃疡组差别无统计学意义外,其它组两两差别均有统计学意义

为研究血清唾液酸含量对慢性胃疾病的诊断价值,测定了正常人、慢性胃炎、胃溃疡和胃癌患者的血清唾液酸含量(mg/dl ),结果如下:

正常人组: 43.10 41.46 42.35 41.42 42.01 43.12 42.05 40.20 慢性胃炎组:45.68 47.20 47.50 44.39 47.80 48.11 46.45 47.01 胃溃疡组: 44.04 45.12 44.77 46.28 48.56 44.87 48.58 47.32 胃癌患者组:68.21 67.40 66.12 65.38 66.44 62.21 66.15 60.36 试比较四组患者血清唾液酸含量有无差别?(假定资料满足正态性)

1、方差齐性检验 7485.72

=x

3=ν 0515.0== 方差齐性

2、方差分析 9825.271=F 01.0

3、q 检验 组别 例数 均数 标准差 正常人组 8 41.9638 0.9597 慢性胃炎组 8 46.7675 1.2298 胃溃疡组 8 46.1925 1.7784

检验结果

对比组 排序号 q 值

p 值

第4组与第2组 1与2 29.4245 <0.01 第4组与第3组 1与3 30.3384 <0.01 第4组与第1组 1与4 37.0582 <0.01

第2组与第3组 2与3 0.9137 >0.05 第2组与第1组 2与4 7.6337 <0.01 第3组与第1组 3与4 6.7200 <0.01

除第慢性胃炎组与第胃溃疡组差别无统计学意义外,其它组两两差别均有统计学意义。

1、随机抽取了128名一年级大学生,测得空腹血糖为4.5mmol/L ,标准差为0.62 mmol/L 。(1)求标准误?(2)试估计一年级大学生空腹血糖总体均数的95%可信区间和99%可信区间? 1.标准误为

X

s =

0.055(3分) 2.总体均数95%可信区间为(x -1.96x s ,x +1.96x s ) 即总体均数95%可信区间为(4.39,4.61)mmol/l (4分) 总体均数99%可信区间为(x -2.58x s ,x +2.58x s ) 即总体均数99%可信区间为(4.36,4.64)mmol/l (4分)

2、成年男子血红蛋白的平均值为155g/L ,某研究者随机抽取25名高原地区成年男性进行检查,其血红蛋白均数为175g/L ,标准差25g/L 。请检验此假设。(符合参数检验的条件) 解:

H0:高原地区成年男性血红蛋白均数与一般成年男子相同μ=μ0

H1:高原地区成年男性血红蛋白均数与一般成年男子不等μ≠μ0(2分) α=0.05(2分)

175155

4.025t

-=

= (4分)

双侧t 0.05,24=2.064,所以P<0.05.按α=0.05水准,拒绝H0,接受H1, 高原地区成年男性血红蛋白均数高于一般成年男子。(2分)

3、分泌型免疫球蛋白A (SIgA )是胃肠道分泌液、泪液等外分泌液中的主要免疫球蛋白类,某院测定了三组不同人群的SIgA ,结果如表,三组SIgA 量有无差别,试作方差分析。

组别 SIgA 含量(μg/ml)

1 1.9

2 1.80 2.08 2.00 2 2.21 2.2 2.12 2.57

3 3.27 2.75 2.90 3.10 、解:

H0:三组SIgA 含量相同

H1:三组SIgA 含量不同或不全相同(2分) α=0.05(2分)

方差分析表 变异来源 离均差平方和 自由度 均 方 F

总 变 异 2.6357 11 组间变异 2.3223 2 1.1612 33.368 组内变异

0.3134

9

0.0348

(4分)

F 0.05(2,9)=4.26,所以P<0.05.按α=0.05水准,拒绝H 0,接受H 1, 三组SIgA 量不同。

4、测定7名健康成人血液的一般凝血酶浓度(单位/毫升)及血液的凝固时间(秒),测定结果如表,试作血凝时间与凝血酶浓度间相关分析?

编号 1 2 3 4 5 6 7 凝血酶浓度X 1.1 1.2 1.0 0.9 1.2 1.1 0.9 凝血时间Y 14 13 15 15 13 14 16

1)散点图:略。(2分)

(2)相关系数r =-0.863(4分)

(3)假设检验:0H :ρ=0,1H :ρ≠0。α=0.05(2分)

查表得0.05(5)r =0.754, P<0.05.按α=0.05水准,拒绝H 0,接受H 1,二者有负相关关系。

5、某中医院将80例高血压患者随机分成甲乙两组,甲组用中医治疗,乙组用西医治疗,结果如下表,比较两组的疗效。

两组疗效比较 组 别 总例数 有效人数

中医组 40 35 西医组 40 15 H 0:π1=π2; H 1:π1≠π2(2分) α=0.05(2分) 因为4021≥+=n n N

,每个理论数5≥T 时,可采用一般2

x 检验

-=T

T A x 2

2

)(=21.3(4分)

20.05(1)x =3.84,所以P<0.05.按α=0.05水准,拒绝H 0

,接受H 1

, 两组的疗效不同,中医组疗效优于西医组。

(2分)

假定缓老九(A 人参、B 丹参、C 当归、D 何首乌)正交设计小鼠耐氧时间结果如下,试作方差分析且找出最佳搭配。

列号、药物及交互作用 耐氧时间 1(A) 2(B) 3(AB) 4(C) 5(AC) 6(BC) 7(D) (分钟T ) 处方 人叁 丹参 人参×丹参 当归 人参×当归 丹参×当归 何首乌 (重复数m=3) 1 1 1 1 1 1 1 1 36 38 36 2 1 1 1 2 2 2 2 40 41 42 3 1 2 2 1 1 2 2 58 56 58 4 1 2 2 2 2 1 1 50 52 51 5 2 1 2 1 2 1 2 60 59 58 6 2 1 2 2 1 2 1 58 57 57 7 2 2 1 1 2 2 1 62 60 61 8 2 2 1 2 1 1 2 68 69 70 正交设计方差分析结果:

因素 F 值

p 值

A 1365.0417 0.0000

B 737.0417 0.0000 AB 108.3750 0.0000

C 7.0417 0.0173 AC 26.0417 0.0001 BC 0.3750 0.5489

D 155.0417 0.0000

A1B1=233 A1B2=307 A2B1=349 A2B2=390 A1C1=282 A1C2=276 A2C1=360 A2C2=379 最佳搭配为:A2B2C2D2即人参2丹参2当归2何首乌2。

1、有8名志愿受试者服用某减肥药服药前和服药一个疗程后各测量一次体重(kg ),数据如下,试判断此减肥药是否有效。(假定满足参数统计)

服药后

100 136 126

150

128

126

116

105

0H :0=d μ 1H :0≠d μ

05.0=α

n

s d t d /=

=0.0448

P=0.9656>0.05

按05.0=α水准不拒绝0H ,故尚不能认为此减肥药有效。

2、某社区随机抽取了30名糖尿病患者、IGT 异常和正常人进行载脂蛋白(mg/dL )结果如下:

糖尿病患者:85.70 105.20 109.50 96.00 115.20 95.30 110.00 100.00 125.60 111.00 106.50 IGT 异常者:96.00 124.50 105.10 76.40 95.30 110.00 95.20 99.00 120.00

正常人:144.00 117.00 110.00 109.00 103.00 123.00 127.00 121.00 159.00 115.00 问三种人的载脂蛋白有无差别?(假定资料满足正态性和方差齐性)

0H :三种人载脂蛋白的总体均数相等,即123μμμ==

1H :三种人载脂蛋白的总体均数不等或不全相等。 05.0=α

变异来源

SS υ

MS F

P 组间 2384.03 2 1192.01 5.8540 <0.05 组内 5497.84 27 203.62 总

7811.87

29

所以,按α=0.05水准上拒绝0H ,接受1H ,可以认为三种人的载脂蛋白不同。

3. 一个产科医师收集了10例待产妇24小时的尿,测量其中的雌三醇含量(X),同时记录产儿的体重(Y),结果如下。试作尿中雌三醇含量与产儿体重之间的回归分析。

尿雌三醇含量与产儿体重关系

编号

1 2 3 4 5 6 7 8 9 10 尿雌三醇含量mg/24h

(X ) 7 9 12 14 16 17 20 25 24 22 产儿体重kg

(Y)

2.5

2.7

2.7

2.7

3.5

3.2

3.8

3.9

3.6

4.0

1、 散点图:略。(3分)

2、 其直线回归方程为:

? 1.85550.0864y

x =+(4分) 3、直线回归的假设检验:方差分析 41.2269F = 01.0

关系。(5分)

4、绘制回归直线:略。(3分)

4. 某医院分别用中西药治疗胃癌患者结果如下,问两种方法的疗效有无差别?

组别 有效 例数

西药组 7 13 中药组 13 16

四格表基本数据:

────────────────────────────── 阳性数 阴性数 合计 阳性率(%) ────────────────────────────── 甲组 7 6 13 53.8462 乙组 13 3 16 81.2500 ───────────────────────── 合 计 20 9 29 68.9655 ────────────────────────────── 2个格子的理论数T:1≤T< 5 卡方检验:

未校正卡方值= 2.5166,概率 P = 0.1127

校正卡方值 = 1.3991,概率 P = 0.2369

四格表资料的确切概率法:双侧 概率 P= 0.2256;单侧 概率 P= 0.1186

5. 甲乙两方治疗糖尿病,比较疗效,问何者为优?

组别 控制 显效 有效 无效

甲组 20 12 8 20 乙组 47 39 23 6

各样本平均R

─────────────────── 样本名 频数合计 平均R

─────────────────── 第1组 60 0.5798 第2组 115 0.4584 ─────────────────── U 检验:

统 计 量 u= 2.6417,单侧概率 P= 0.0041,双侧概率 P= 0.0082 ,乙法优于甲法

1、对某人群随机抽取25人,用某批号的结核菌素作皮试,平均浸润直径为10.9cm ,标准差为3.86cm 。问这批结核菌素在该人群中使用时,皮试的平均浸润直径的95%可信区间是多少? 解:

该例n =25, n 较小。ν=25-1=14,查t 界值表,得

0.05,24t =2.064 (4分)

估计这批结核菌素在该人群中使用,皮试的平均浸润直径的95%可信区间为(10.9-2.064*3.86/,

)cm 即(9.306592,12.493408)cm 。(11分

2、有3组进食高脂饮食的家兔,接受不同处理后,测定其血清肾素血管紧张素转化酶(ACE )浓度,试比较三组家兔的血清ACE 浓度。(资料满足正态分布和方差齐性条件,不做两两比较)

对照组及各实验组家兔血清ACE 浓度(u/ml )

对照组 61.24 58.65 46.79 37.43 66.54 59.27 A 降脂药 82.35 56.47 61.57 48.79 62.54 60.87 B 降脂药

26.23

46.87

24.36

38.54

42.16

30.33

20.68

解:

H 0:三组家兔的血清ACE 浓度总体均数相等,μ1=μ2=μ3

H 1:三组家兔的血清ACE 浓度总体均数不等或不全相等。(4分) α=0.05(2分)

方差分析表

变异来源 SS

ν

MS

F

总变异 4882.0181 18

组间变异 3095.4532 2 1547.7266 13.8610

组内变异

1786.5649

16

111.6603

(8分) 以1v =2和2v =16查F 界值表(方差分析用),得P <0.01,按=α

0.05水准拒绝H 0

,接受H 1

,可认为四总体均数不同或不

全相同。

卫生统计学整理笔记

如何绘制频数表? 求组距 确定各组段的两个端点 归组计数 频数分布表与分布图作用 1.揭示变量分布形态 2.揭示变量分布趋势 3.便于发现特大的或特小的极端值 4.便于进一步计算统计指标和分析 5.作为一种数据陈述的形式 算数应用条件: 对称分布,尤其正态分布 几何应用条件: 1.对数对称分布、等比资料 2.变量值中不能有0;不能同时有正值和负值;若全是负值,计算时可先把负号去掉,得出结果后再加上负号。 中位数条件: 所有分布、尤其偏态分布: 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清 极差应用条件:所有分布、尤其偏态分布 不足: 不能全面的反映所有值的偏离程度 不稳定、小样本小于大样本、样本小于总体 四分位数间距应用条件 所有分布、尤其偏态分布: 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清 方差应用条件: 对称分布,尤其正态分布 变异系数应用 1.量纲不一致

散点图作用 观察两组数据的总体趋势和明显偏离趋势的观察点 判断两组数据的关联形式、方向和密切程度 相关分类 线性相关 秩相关 分类变量相关 线性相关意义 r>0表示正相关,r=1表示完全正相关;r<0表示负相关,r=-1表示完全负相关。 |r|→0表示相关性越弱,|r|→1表示相关性越强。 r=0表示没有线性相关,不代表没有相关。 如何判断线性相关 画散点图 计算线性相关系数 假设检验 如何进行秩相关 编秩次 计算秩相关系数 假设检验 回归分析:利用样本信息,找到变量间数量依存关系。 线性回归分析:利用样本信息,找到变量间线性数量依存关系。 决定系数:反映回归贡献的相对程度,即Y的变异被X解释的比例。 如何进行分类变量的相关分析 交叉表的制作,计算各种概率 计算列联系数 假设检验 相关分析的条件 线性相关系数:二元正态分布的定量变量 秩相关系数:非二元正态分布的定量变量、有序分类变量 列联系数:无序分类变量 轶闻数据:由坊间流传或各种媒体报道的一些个案数据,由于其特殊性往往给公众留下突出和深刻的印象。 特点:缺乏代表性,常诱导人们进行简单的推论,得到一些具有倾向性的结论。 可得数据:为了某些特定目的已收集或积累的数据。如:各类监测数据、统计年鉴等。

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料 08生物技术曾洋and林阳第一章绪论 名词解释 统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。 总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。总体可分为有限总体与无限总体。总体中得所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。样本应具有代表性。所谓有代表性得样本,就是指用随机抽样方法获得得样本。 抽样:从研究总体中抽取少量有代表性得个体,称为抽样。 概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。0﹤P(A)﹤1。 频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。当试验重复很多次时P(A)= m/n。 变量:表现出个体变异性得任何特征或属性。 随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。 系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计与完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。它受多种因素得影响,使观察值不按方向性与系统性而随机得变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 变异:在自然状态下,个体间测量结果得差异称为变异(variation)。变异就是生物医学研究领域普遍存在得现象。严格得说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值得参差不齐。 抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异得存在,在抽样过程中产生得样本统计量与总体参数之间得差异。 分布:随机现象得规律性通过概率来刻画,而随机事件得所有结局及对应概率得排列称为分布。 第二章定量资料得统计描述 名词解释 算术均数:描述一组数据在数量上得平均水平。总体均数用μ表示,样本均数用X表示。 几何均数:用以描述对数正态分布或数据呈倍数变化资料得水平。记为G。 中位数:将一组观察值由小到大排列,n为奇数时取位次居中得变量值;为偶数时,取位次居中得两个变量得平均值。

卫生统计学考试试题及答案

卫生统计学试题及答案(一) 1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______. A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图 【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布) 直方图(适用于数值变量,连续性资料的频数表变量) 直条图(适用于彼此独立的资料) 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图(一个检测指标,两个分组变量) 【答案】E 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______. A.直方图 B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势) C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度) D.直条图 E.复式直条图 【答案】E 4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果,则______. A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童 【答案】D 5.若要通过样本作统计推断,样本应是__________. A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 【答案】C 6.下面关于均数的正确的说法是______.

大学统计学期末考试试题

河南科技学院2016-2017学年第一学期期终考试 统计学试卷(A 卷) 适用班级:人力141-人力145。 注意事项:1.在试卷的标封处填写院(系)、专业、班级、姓名和准考证号。 2. 考试时间共100分钟。 一、名词解释 参数 分层抽样 离散系数 中心极限定理 参数估计 号证考准

、选择题. 1、统计学的研究对象是( ) A 、各种现象的内在规律 B C 、统计活动过程 D 、各种现象的数量方面 、总体与样本的关系 2、以产品的等级来衡量某种产品的质量好坏,则该产品等级是( A 、数量指标 B 、质量指标 C 、数量标志 3、一个统计总体( )。 A 、只能有一个标志 B C 、可以有多个标志 D D 品质标志 、只能有一个指标 、可以有多个指标 4、对某企业500名职工的工资收入状况进行调查, 则总体单位是( ) A 、每一名职工 B C 、500名职工 D 5、在全国人口普查中,( )。 A 、女性是品质标志 B C 、人口的平均寿命是数量指标 D 6重点调查的重点单位是( )。 A 、收集数据资料的重点单位 、每一名职工的工资水平 、500名职工的工资总额 、某人的年龄30岁是变量 、全国人口总数是统计指标 B 、在全局工作中处于重要地位的单位 C 这些单位的标志值在总体标志总量中占有很大比重 D 这些单位数量占总体单位数的很大比重 7、 要了解我国煤炭生产的基本情况,最适合的调查方式是( ) A 、抽样调查 B 、重点调查 C 、典型调查 D 普查 8、 对一批商品进行质量检验,最适宜采用的方法( )。 A 、全面调查 B 、抽样调查 C 、典型调查 D 重点调查 9、 目前我国城镇职工家庭收支情况调查是采用( )。 A 、普查 B 抽样调查 C 、典型调查 D 重点调查 10、 下列分组中属于按品质标志分组的是( ) A 、学生按考试分数分组 E 、产品按品种分组

卫生统计学考试重点总结复习

一、绪论 1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变量值的集合。 2.样本:从总体中随机抽取部分观察单位所组成的集合。 3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。 4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。 5.变量的类型及其转换: ①定性变量:a.分类变量(计数资料)i.二分类变量 ii.多项无序分类 b.有序变量(等级资料) ②定量变量:a.连续型变量 b.离散型变量 变量只能由“高级”向“低级”转化:定量→有序→分类→二值。 6.概率:是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象:有变异的事物。 10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。 11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异:同一总体内的个体间存在差异又是绝对的,这种现象称为变异。 13.误差可分为:系统误差、随机测量误差、抽样误差。 14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与总体参数之间可能存在差异,这种差异称为抽样误差。 二、定量资料的统计描述 1.频率分布表的编制步骤: ①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。 2.频率分布表的用途: ①揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时,可用各组段的频率作为概率的估计值。 3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。 4.四分位数间距:表示百分位数P75和百分位数P25之差,定义为Q=P75-P25,恰好包括总体中50%的个体观察值,用来描述偏态分布资料的离散趋势的指标。 5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,则离散度大,标准差小,则离散度小。 6.变异系数:变异的大小S相对于其平均水平X的百分比,主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。 三、定性资料的统计描述 1.构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型:

卫生统计学试题6含答案

. 统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

. A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

统计学期末考试题库及答案

第一章绪论 一、填空题 1.标志是说明特征的,指标是说明数量特征的。 2.标志可以分为标志和标志。 3.变量按变量值的表现形式不同可分为变量和变量。4.统计学是研究如何、、显示、统计资料的方法论性质的科学。 5.配第在他的代表作《》中,用数字来描述,用数字、重量和尺度来计量,为统计学的创立奠定了方法论基础。 二、判断题 1.企业拥有的设备台数是连续型变量。() 2.学生年龄是离散型变量。() 3.学习成绩是数量标志。() 4.政治算术学派的创始人是比利时的科学家凯特勒,他把概率论正式引进统计学。() 5.指标是说明总体的数量特征的。() 6.对有限总体只能进行全面调查。() 7.总体随着研究目的的改变而变化。() 8.要了解某企业职工的文化水平情况,总体单位是该企业的每一位职工。() 9.数量指标数值大小与总体的范围大小有直接关系。() 10.某班平均成绩是质量指标。() 三、单项选择题 1.考察全国的工业企业的情况时,以下标志中属于数量标志的是( )。 A.产业分类 B.劳动生产率 C.所有制形式 D.企业名称 2.要考察全国居民的人均住房面积,其统计总体是( )。 A.全国所有居民户 B.全国的住宅 C.各省市自治区 D.某一居民户 3.若要了解全国石油企业采油设备情况,则总体单位是( )。 A.全国所有油田 B.每一个油田 C.每一台采油设备 D.所有采油设备

4.关于指标下列说法正确的是( )。 A.指标是说明总体单位数量特征的 B.指标都是用数字表示的 C.数量指标用数字表示,质量指标用文字表示 D.指标都是用文字表示的 5.政治算术学派的代表人物是 ( )。 A.英国人威廉·配第 B.德国人康令 C.德国人阿亨瓦尔 D.比利时人凯特勒 6.关于总体下列说法正确的是( )。 A.总体中的单位数都是有限的 B.对于无限总体只能进行全面调查 C.对于有限总体只能进行全面调查 D.对于无限总体只能进行非全面调查 7.关于总体和总体单位下列说法不正确的是( )。 A.总体和总体单位在一定条件下可以相互转换 B.总体和总体单位是固定不变的 C.构成总体的个别单位是总体单位 D.构成总体的各个单位至少具有某种相同的性质 8.关于标志下列说法不正确的是( )。 A.标志是说明总体单位特征的 B.品质标志是用文字表示的 C.数量标志是用数字表示的 D.数量标志说明总体量的特征 9.关于变量下列说法不正确的是( )。 A.只能取整数的变量是离散变量 B.可以用小数表示的是连续变量 C.只能用小数表示的是连续变量 D.数量标志的具体表现称为变量值 10.关于指标下列说法不正确的是( )。 A.数量指标说明总体规模和水平 B.数量指标用绝对数表示 C.质量指标只能用相对数表示 D.质量指标用相对数或平均数表示 四、多项选择题 1.属于连续型变量的有( )。 A.国内生产总值 B.企业数 C.身高 D.体重 E.人数2.属于离散型变量的有( )。 A.增加值 B.学校数 C.机器台数 D.销售额 E.粮食产量3.下列属于品质标志的有( )。

卫生统计学重点笔记之令狐文艳创作

医师资格考试蓝宝书-预防医学 令狐文艳 医学统计学方法 第一节基本概念和基本步骤(非常重要) 一、统计工作的基本步骤 设计(最关键、决定成败)、搜集资料、整理资料、分析资料。 总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。 实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。样本的指标为统计量。 由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。 某事件发生的可能性大小称为概率,用P表示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件,<0.05或0.01为小概率事件。

二、变量的分类 变量:观察单位的特征,分数值变量和分类变量。 第二节数值变量数据的统计描述(重要考点) 一、描述计量资料的集中趋势的指标有 1.均数均数是算术均数的简称,适用于正态或近似正态分布。 2.几何均数适用于等比资料,尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。 3.中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。不能求均数和几何均数,但可求中位数。百分位数是个界值,将全部观察值分为两部分,有X%比小,剩下的比大,可用于计算正常值范围。 二、描述计量资料的离散趋势的指标 1.全距和四分位数间距。 2.方差和标准差最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。均为数值越 小,观察值的变异度越小。 3.变异系数多组间单位不同或均数相差较大的情况。变

卫生统计学试题6含答案

统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

卫生统计学试题

卫生统计学习题 定量资料的统计描述 1. 1985年某省农村30例6-7岁正常男童胸围(cm)测量结果如下:51.654. 154.056.9 57.755. 558.355. 453.857. 751.353. 857.354. 852.155. 354.854.7 53.457. 153.155. 951.454. 656.161. 859.356. 859.853.9 (1)试编制以上数据的频数表,绘制直方图,概括其分布特征。(2)用合适的统计量描述其集中趋势和离散趋势。 (3)对样本进行正态性检验

第三章定性资料的统计描述 1.某地通过卫生服务的基线调查得到如下资料,试作如下分析:(1)计算全人口的性别比; (2)计算育龄妇女(15~49岁)占总人口的百分比; (3)计算总负担系数; (4)计算老年人口系数 某地人口构成情况 年龄组(岁)男(%)女(%)年龄组(岁)男(%)女(%)0~ 4.24.045~ 2.42.7 5~ 3.23.150~ 2.12.4 10~ 4.44.255~ 1.2 2.2 15~ 5.55.360~ 1.3 2.4 20~

5.15.265~ 1.11.4 25~ 6.06.170~ 0.81.2 30~ 4.34.575~ 0.50.9 35~ 3.23.380~ 0.20.5 40~ 2.32.585~ 0.10.2 第四章常用概率分布 1.假定虚症患者中,气虚型占30%。现随机抽查30名虚症患者,求其中没有1名气虚型的概率、有4名气虚型的概率。 2.某溶液平均1毫升中含有大肠杆菌3个。摇均后,随机抽取1毫升该溶液,内含大肠杆菌2个和低于2个的概率各是多少? 3.某人群中12岁男童身高的分布近似正态分布,均数为 144.00cm,标准差为 5.77cm,试估计

统计学考试题库

一、判断题(4个) 1.统计学的研究对象是社会经济总体现象的质量方面。(×) 2.重点调查中的重点单位是根据当前工作的重点来确定的。(×) 3.对于连续型变量,其组限是按照“上限不包括在内”的原则进行汇总的。(√)4.平均数是测定总体各单位的离散程度。(×) 5.在时间序列的乘法合成模型中,季节变动成分S通常是季节的个数(F) 6.用最小二乘法拟合时间序列的直线趋势方程Y=a+bt时,若0≤b≤1则该时间序列的趋势为逐步上升的趋(T) 7.从计算方式看,综合评价指数是一种算术平均指数(F) 8.特殊原因偏差表示过程中固有的偏差,这些偏差随机或偶然出现。(F) 9.当样本量给定时,置信区间的宽度随着置信系数的增大而增大;而当置信水平固定时,置信区间的宽度随着样本量的增大而减小。(√) 10.置信区间是一个随机区间,它因样本量的不同而不同,而且所有的区间都包含总体参数的真值。(×) 11通常是在控制犯取伪错误概率的条件下,尽可能使弃真错误的概率小一点。(×) 12抽样单位既可以是一个简单的个体,也可以是一组个体。(√) 13. 第一类错误是假设检验中出现的第一种错误,是将不真实的现象检验为真实的现象(错误) 14. 正态分布总体有两个参数,即均值与方差,当这两个参数确定以后,一个正态分布也就确定了。(正确) 15. 在一元线性回归模型中,回归模型的标准差等于随机干扰项的标准差。(正确) 16. 根据最小二乘估计,可以得到总体回归方程。(错误) 17.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。 答:对,因果关系的判断还有赖于实质性科学的理论分析。 18.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。 答:错。两者是精确的函数关系。 19.X2检验不适用于定类变量和定序变量的相关统计。(错) 20.多样本计量资料的比较,当分布类型不清时选择H检验。(对) 21在多元回归分析中,多重共线性是指模型中因变量与一个自变量相关。(×) 22对回归模型y=β0 +β1X1 +β2X2+…+βpXP+ε的假定有自变量X1 ,X2,…,XP 相互之间不存在较强的线性关系。(√) 23如果经检验所有回归系数都是显著的,则可以判定不存在多重共线性问题。(√) 24.DW 值越接近2, t 序列的自相关性就越小。(√) 二、选择题(4个) 1. “统计”一词的三种涵义是(B )。 A、统计调查、统计资料、统计分析 B、统计工作、统计资料、统计学 C、统计设计、统计调查、统计整理 D、大量观察法、分组法、综合指标法 2. 下列属于品质标志的是(D )。

9住院医师规培考试 卫生统计学方法与应用(下)

1、某地进行甲型病毒性肝炎的调查中,共发现病人231例。其中男性158例占68.40%,女性73例占31.60%,提示()* ? A.男性因在外就餐机会多发病机会就高 ? B.男性病人比例高于女性病人 ? C.男性发病率高 ? D.男性患病率高 ? E.不能说明任何问题 2、甲乙两地某病的死亡率进行标准化计算时,其标准选择()* ? A.不能用甲地数据 ? B.不能用乙地数据 ? C.不能用甲地和乙地的合并数据 ? D.可能用甲地或乙地的数据 ? E.以上都不对 3、若已知该省成年男性血红蛋白平均水平,欲了解某县正常成年男性的血红蛋白含量是否高于该省正常水平,应采用()* ? A.样本均数与总体均数比较的t检验 ? B.配对t检验 ? C.成组t检验 ? D.配对设计差值的符号秩和检验 ? E.成组设计两样本比较的秩和检验 4、对于一组服从双变量正态分布的资料,经直线相关分析得相关系数r=0.9,对该资料拟合回归直线,则其回归系数b值()*

? A.b>0 ? B.b=0 ? C.b<0 ? D.b=1 ? E.不能确定正负 5、对原始统计资料的要求是()* ? A.及时收集完整、准确的资料 ? B.综合资料 ? C.方差分析时要求个样本所在总体的方差相等 ? D.完全随机设计的方差分析时,组内均方就是误差均方 ? E.完全随机设计的方差分析时,F=MS组间/MS组内 6、实验设计应遵循的基本原则是()* ? A.随机化、对照、盲法 ? B.随机化、盲法、配对 ? C.随机化、重复、配对 ? D.随机化、齐同、均衡 ? E.随机化、对照、重复 7、作符号秩和检验时,统计量T为较小的秩和,则正确的是()* ? A.T值越大越有理由拒绝HO ? B.T值越大越有理由拒绝HO ? C.P值与T值毫无关系

统计学考试重点题目

1、某车间30 要求:累计 要求:按考试成绩分组编制组距式变量数列,并计算出各组频率和组中值。 比上期增长多少;又该企业产品单位成本计划在上期699元水平上降低12元,实际上本期单位成本为672元,试计算单位成本计划完成百分数。 (2)某企业2001年产品销售计划为上年的108%,实际为上年的114%,

试计算该企业2001年度产品销售计划完成百分数。 (3)某企业2001年劳动生产率增长计划完成102%,这一年劳动生产率为2000年的107%,试计算该企业2001年劳动生产率计划比2000年增长百分数。 (1)(1+5%)÷103%-1=1.94% 672÷(699-12)=97.82% (2)114%÷108%=105.56% (3)107%÷102%-1=14.90% 3、已知甲、乙两农贸市场某种农产品分等级的销售资料如下表: 要求:通过计算比较甲、乙两农贸市场哪一个的平均价格高,并说明两市场平均价格不一致的理由。 ∑∑===(元)甲38.14/5.5/f Xf X (元) 乙33.14/3.5/===∑∑f Xf X 4、某厂生产的某种零件,要经过三道工序,已知各工序的合格率分别为95%、93%和98%。要求:计算该零件在各道工序的总合格率和平均合格率。 总合格率=%583.86%98%93%95=?? 平均合格率=%31.95%98%93%953=?? 5、某商业局系统所属20个商店2000年的商品销售额与流通费用率资料如下表: 要求:计算该系统所属商店的平均流通费用率和销售额计划平均完成百分数。

M/m/x ym/m 6、(1)某数列的平均数为1000,标准差系数为0.256,求标准差; (2)某数列的平均数为12,各变量值平方的平均数为169,求标准差系数; (3)某数列的标准差为3,各变量值平方的平均数为25,求平均数; (4)某数列的标准差为30,平均数为50,求变量值对90的方差; (5)设y = x ± a ,若y σ=28,求x σ; (6)设y = 0,若y σ=12,求x σ。 (1)2561000256.0=?=?=X V σ(2)5)12(169222=-=-=X X σ 4167.012/5/===X V σ (3)4325222=-=-=σX X (4)2500)5090(30)90(2222 2 90=-+=-+=X X σσ (5)28==y x σσ (6)158.0/12||/===a y x σσ 9、设甲县农民人均收入为5880元,标准差为680元,农业人口为88.2万人;乙县农民人均收入6240元,标准差860元,农业人口89.50万人。要求:计算甲、乙两县农民人均纯收入的平均数、方差和标准差系数。

卫生统计学知识点(笔记)

第一章绪论 1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。可分为目标总体和研究总体。若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。需要谨慎的是,就研究总体所下的结论未必适用于目标总体。 3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。获取样本的过程称为抽样(sampling)。抽样研究的目的是用样本数据推断总体的特征。需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。 4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。 5.▲变异(variation)是指同质的个体之间存在的差异。 6.▲变量的类型 二分类变量 分类变量或名义变量 定性变量多分类变量 变量有序变量或等级变量 定量变量离散型变量 连续型变量 变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值 7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总

体均数μ,总体标准差σ。 8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。 统计学的任务就是依据样本统计量来推断总体参数。 9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。 10.▲误差:表示统计量与参数之间的差别或测量值与真值之间的差别。可分为系统误差和随机误差,其中系统误差呈现倾向性偏大或偏小现象,是可以避免的;而随机误差,是非人为偶然因素所致,不可避免,但可通过增大样本量等措施使其减小。 11.因果与联系:存在联系未必有因果关系,需排除虚假关联、间接关联。大多数观察性研究,单靠统计学分析只能考察变量之间的联系,难以证明因果关系。

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

卫生统计学考试题及答案要点

《卫生统计学》 一、名词解释 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.抽样误差 7.频数表 8.算术均数 9.中位数 10.极差 11.方差 12.标准差 13.变异系数 14.正态分布 15.标准正态分布 16.统计推断 17.抽样误差 18.标准误 19.可信区间 20.参数估计 P的含义假设检验中21. 型错误II I型和22. 检验效能23. 24.检验水准方差分析25. 26.随机区组设计27.相对数- 1 - 28.标准化法 29.二项分布 30.Yates校正 31.非参数统计 32.直线回归 33.直线相关 34.相关系数 35.回归系数 36.人口总数 37.老年人口系数 38.围产儿死亡率 39.新生儿死亡率 40.婴儿死亡率 41.孕产妇死亡率 42.死因顺位 43.人口金字塔 二、单项选择题

1.观察单位为研究中的( D )。 A.样本B.全部对象 C.影响因素D.个体 2.总体是由(C )。 A.个体组成B.研究对象组成 C.同质个体组成D.研究指标组成 3.抽样的目的是(B )。 A.研究样本统计量B.由样本统计量推断总体参数 C.研究典型案例研究误差D.研究总体统计量 4.参数是指( B )。 A.参与个体数B.总体的统计指标 C.样本的统计指标D.样本的总和 5.关于随机抽样,下列那一项说法是正确的(A )。 - 2 - .抽样时应使得总体中的每一个个体都有同等的机会被抽取A .研究者在抽样时应精心挑选个体,以使样本更能代表总体B .随机抽样即随意抽取个体C .为确保样本具有更好的代表性,样本量应越大越好D B )。6.各观察值均加(或减)同一数后( .均数改变,标准差不变BA.均数不变,标准差改变 .两者均改变 D .两者均不变C )。7.比较身高和体重两组数据变异度大小宜采用(A B.方差.变异系数 A D.标准差C.极差 D )可用来描述计量资料的离散程度。8.以下指标中( .几何均数 B A.算术均数 D.标准差C.中位数 )。9.血清学滴度资料最常用来表示其平均水平的指标是(C B.中位数A.算术平均数 D.平均数C.几何均数 。)10.两样本均数的比较,可用(C 检验B.t A.方差分析 .方差齐性检验 D C.两者均可 ?。D 11.配伍组设计的方差分析中,)等于(配伍???? A.--B.总误差总处理?????? D.---C.+处理总误差总处理误差??|X??|?,的正态总体中随机抽样,)的概率为5% 。12.在均数为标准差为( B tSst?1.96 C.D. A. B.?1.96??,,X20.0520.05X13.完全随机设计方差分析的检验假设是(D )。 A.各处理组样本均数相等B.各处理组总体均数相等 C.各处理组样本均数不相等D.各处理组总体均数不全相等 14.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是( D )。 2检验χB A.分别进行比较.两个率比较的 - 3 -

统计学试题库及答案

《统计学》试题库 知识点一:统计基本理论和基本概念 一、填空题 1、统计是、和的统一体,是统计工作的成果,是统计工作的经验总结和理论概括。 2、统计研究的具体方法主要有、、和。 3、统计工作可划分为、、和四个阶段。 4、随着的改变,总体和是可以相互转化的。 5、标志是说明,指标是说明。 6、可变的数量标志和所有的统计指标称为,变量的具体数值称为。 7、变量按分,可分为连续变量和离散变量,职工人数、企业数属于变量;变量按分,可分为确定性变 量和随机变量。 8、社会经济统计具有、、、等特点。 9、一个完整的统计指标应包括和两个基本部分。 10、统计标志按是否可用数值表示分为和;按在各个单位上的具体表现是否相同分为 和。 11、说明特征的名称叫标志,说明特征的名称叫指标。 12、数量指标用表示,质量指标用或平均数表示。 13、在统计中,把可变的和统称为变量。 14、由于统计研究目的和任务的变更,原来的变成,那么原来的指标就相应地变成标志,两者变动方向相 同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。 3、统计学是对统计实践活动的经验总结和理论概括。 4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。 5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。 6、某同学计算机考试成绩80分,这是统计指标值。 7、统计资料就是统计调查中获得的各种数据。 8、指标都是用数值表示的,而标志则不能用数值表示。 9、质量指标是反映工作质量等内容的,所以一般不能用数值来表示。 10、总体和总体单位可能随着研究目的的变化而相互转化。 11、女性是品质标志。 12、以绝对数形式表示的指标都是数量指标,以相对数或平均数表示的指标都是质量指标。 13、构成统计总体的条件是各单位的差异性。 14、变异是指各种标志或各种指标之间的名称的差异。

山东大学2019考研:353卫生综合参考书目及真题笔记资料汇总

山东大学2019考研:353卫生综合参考书目及真题笔记资料汇总由于山东大学部分专业课官方没有公布参考书目由此给很多考生带来了很大的不便,对此精都考研网整理了山东大学本专业研究生初试用书及配套资料供大家参考 一、353卫生综合参考书目: ①《环境卫生学》 ②《流行病学》 ③《卫生统计学》 ④《营养与食品卫生学》 ⑤《职业卫生与职业医学》 二、配套精编复习资料 山东大学353卫生综合《复习全程通》精都考研组编 三、复习全程通内容简介 《复习全程通》由精都考研工作室依托多年为各大机构编写考研专业课资料以及学员辅导的经验,由本团队组织目标院校本专业的高分研究生共同合作编写而成,全书考点知识面覆盖全面,权威细致,编排结构科学合理,是专门为本届考研的考生量身定制的必备专业课资料。 通过本精编资料四大模块内容,结合考生每个阶段的复习,有助于考生深入了解目标院校以及专业考点重点,提高复习效率,拓展解题思路。 NO.1历年真题汇编 通过目标院校原版真题,了解命题老师的出题思路,且分析考点重点,快速了解目标院校出题风格及命题思路,提高复习效率,拓展解题思路 NO.2教辅一本通 本部分内容主要是由目标院校本专业研究生对应其初试参考书目整理汇编章节重点考点以及对应章节历年典型考题及答案解析,通过本书的配套复习,分析专业考点侧重,通过大量典型考题让充分掌握本门科目重点,确保考场应对自如。 NO.3冲刺模拟套卷 书在遵循专业课最新参考书目,结合历年考研真题规律,制定的模拟卷,并有详细的配套答案讲解,适用于考生在冲刺模拟阶段的专业课复习。 NO.4电子版赠送内容 本部分内容为购买全套资料的同学附赠的内容,主要是初试参考书目主编老师的教学讲义以及相关的扩充习题,此部分内容对于跨考的考生相对比较重要,通过讲义了解专业课基础复习侧重,达到专业知识点不缺不漏。 四、解析备考辅导班: 专业课一对一无忧全程班 专业课一对一标准全程班 山东大学在读研究生授课 以上内容是【精都考研网】整理发布,每天及时发布最新考研资讯、考研经验、考研真题。目前很多同学已加入2019山东大学考研总群640030269,抓紧时间加入了解你所不知道的考研信息。

相关文档
最新文档