常用医学科研中的统计学方法(1).doc

合集下载

医学统计学(MedicalStatistics)

（1）连续变量：身高值 (cm) ：1.65，1.70 1.58 ….. 体重值 (kg)： 52，55，61….. （2）比率变量脑电图波形变化率（%）：29%，37%….
2. 分类数据（categorical）：
• 变量值表现为按某属性划分的定性类别。清点各类别个数后得到的资料称计数资料。
• 2）多分类（无序）：例：副作用（有重复选择）
• 3.等级（有序）
• 疗效：痊愈=4、显效=3、有效=2、无效=1
例：105人心脏外科病人心理反应情况
• 心理反应病例
• 症状
数
• 焦虑
102
• 抑郁
57
• 自我认同紊乱 10
• 恐惧
5
• 合计
174
百分比反应发生率（%）（%） 58.6 97.14 32.8 54.28
• 例：病情分级（Ｘ1）：Ⅰ ， Ⅱ，Ⅲ
• 疗效（X２）：痊愈、显效、有效、无效
• 病人满意度（X３）：好、中、差
•
人数
50 25 5
数据类型及赋值
• 数据（变量）类型变量的表现
• 1.计量变量：
血压值：12.3kap
• 2.分类（定性）
• 1）两分类：疗效：有效=1，无效=0
•
性别：男=1，女=2
六、科研工作的步骤根据研究的目的
1.研究设计
设计考虑：
研究对象、指标、例数、如何准确得到数据。
2.收集资料
来源：
3.整理资料
目的：
1.日常工作记录、病历。
2.专门的调查和实验。
使资料系统化，便于进一步统计分析
4.分析资料
方法：用统计方法分析资料，阐述规律性，得出结论。

常用医学科研中的统计学方法（1）

常用医学科研中的统计学方法（1）正确答案错误答案1.从同一总体抽样,则样本标准差（）A随着样本含量增大而增大B样本含量增大而标准差不变C随着样本含量减少而减少D随着样本含量增大而减小2.用图表示某地区近30年三种疾病的发病率，在各年度的动态发展速度情况,宜绘制（）A普通线性图B.直方图C.百分条图D.半对数线图。

3.均数与标准误的关系（）A.均数越大,标准误越大B.均数越大,标准误越小C标准误越小，用均数推测总体均数的可靠性越大。

E标准误越大，用均数推测总体均数的可靠性越大。

4.多重线性回归分析中，度量一组自变量与应变量线性相关程度的统计量是()A.负相关系数B.决定系数C.偏相关系数D.偏回归系数5.变异系数cv的数值()A.一定大于1B.一定小于1C.可以大于1，也可以小于1D.一定小于标准差。

6.在样本量为n，自变量个数为3的线性回归方程的假设检验中，回归变异和剩余变异的自由度分别为（）A. 3和n-3B. 3和n-4C. 2和n-2D. 2和n-37.比较某地区解放以来三种病的发病率在各个年度的发展速度,应该绘制（）A.半对数线图B.圆图C.直方图D.普通线图8.在同一总体中随机抽取多个样本，用样本均数估计总体均数95%的可信区间，则估计精密度高的是（）A.均数小的样本B.标准差小的样本C.标准误大的样本D.标准误小的样本9.均数的标准误反映了（）A.个体的变异程度B.集中趋势的位置C.指标的分布规律D.样本均数与总体均数的差异10.由样本均数估计总体均数可靠性大小的指标是（）A.标准差B.标准误C.方差D.变异系数11.表示血清抗体滴度资料平均水平最常用的指标是（）A.算术平均数B.中位数C.几何均数D.变异系数12.抽样误差产生的原因是（）A.观察对象不纯B.非正态分布资料C.个体差异D.非分类变量资料13.95%置信区间的含义为（）A.此区间包含总体参数的概率是95%B.此区间包含总体参数的可能性是95%C.此区间包含总体参数，这句话可信的程度是95%D.此区间包含样本统计量的概率是95%14.各观察值乘以一个大于0的常数后，（）不变A.算数均数B.标准差C.中位数D.几何均数15.总体均数的可信区间（）A.随总体均数而变化B.不随总体均数而变化C.是一个固定区间D.随样本不同而变化16.对数正态分布资料最好计算（）以表示离散趋势。

医学科研中的统计学-概论

①癌症分期：早、中、晚。 ②药物疗效：治愈、好转、无效、死
亡。 ③尿蛋白： ,,,++,+++及以上
• 某妇产科医生为了调查住院天数、分娩方式、妊娠结局是否与年龄、身高、体重、职业、文化程度有关，该研究者利用常规保存的病案首页数据，在某医院搜集了2004－ 2005年共计1402名妊娠分娩妇女的资料（全数据见光盘data1-1.xls），按住院号排序后排在前面的10名妇女的有关数据见表1-1。职业、文化程度、分娩方式、妊娠结局等变量的分类见表1-2。
现场调查实验室做实验
• 3．整理资料（Sorting data）就是将收集来的资料有目的，有计划地进行科学加工。目前数据管理一般采用统计软件，如：Ｅpi Data、SPSS、SAS。
• 4．分析资料(Analysis of data)就是将经过统计整理的结果，作一系列统计描述和统计推断，阐明事物的规律性。采用统计分析软件，如：SAS、SPSS、STATA。
特点：无固有计量单位，如肤色（黑、白）、血型（ABO）、职业（工人、医生、教师等）、性别（男女）
• 3．等级资料（Ranked data）将观察单位按某项指标的等级顺序分组，再清点各组观察单位的个数所得的资料。
特点：半定性或半定量的观察结果。有序多分类（ordinal category data）
《女士品茶》又名《统计，改变了世界》 (台湾译)，中国统计出版社。
关于现代科学如何逐步被统计思想所影响的科普读物。
1.发现不确定现象背后隐藏的规律性
2.阅读医学科技书刊杂志和撰写论文
60年代到80年代，国外医学杂志调查结果：有统计错误的论文20%-72%。 1996年对4586篇论文统计（中华医学会系列杂志占6.9%），数据分析方法误用达 55.7%。

医学科研论文统计方法

3. 抽样误差因个体差异及样本只能是总体的一部分，而产生的样本统计量与总体参数之间的差异。抽样误差愈小，用样本推断总体的精确度愈高
统计量依据样本观察值所定出的量。如：样本均数、样本标准差、样本率。
参数总体的统计指标数值。如：总体均数、总体标准差、总体率。
4. 概率 probability
2.计数资料，enumeration data
由无序分类变量组成
将观察单位按某种属性或类别分组所得各组的观察单位数
1）二项分类：阳性、阴性
2）多项分类：A、B、O、AB血型。
3.等级资料
半定量资料
介于计量和计数资料之间，由有序分类变量组成。观察单位的分组是按照程度上的差异或等级大小来分。
3、线条：无竖线及斜线
4、数字：对齐；如缺失用“-” 或“…”表示
5、如有备注：出，写在用“*”标
表1 某医院1998年各科住院危重病人抢救成功率
科别内科
外科
危重人数 315
322
抢救成功数 252
249
成功率% 80.0
77.3
医学统计学研究的基本步骤
1.资料设计 3.资料整理 2.资料收集 4.资料分析
1、资料设计，design 按研究者是否对观察对象施加干预分为：（1）、调查设计，survey design 研究者只是“被动”地观察客观实际情况（ 2 ）、实验设计， experiment design 研究者主动地施加干预
2.统计推断： 1)推断总体均数的可信区间 2)假设检验：
t检验，u检验，秩和检验和方差分析（检验）
1）样本推断总体 95％或者99％总体均数可信区间估计注意：该方法表示在一个总体中，用统计量如何来估计总体水平的大致范围，不能用来评价个体的水平。最常用的公式： X 1.96 S x 表示在大样本情况下95％总体均数可

常用统计学方法分析

31护士业务骨干组非护士业务骨干组人数百分比人数百分比357混合型偏外2500混合型偏内1346432810000非护士业务骨干组无数据空缺3233病例对照研究48方法只能分析一个因素适用条件和特点用于两个或两个以上样本比较各个样本例数可以相等或不等检验单因素方差分析49适用条件和特点适用于同体比较同体比较时前后间隔时间不宜过长统计分析方法配对t检验秩和检验50适用条件和特点设置配伍组的条件和配对条件相同此设计增强了各组间的均衡性研究的效率等统计分析方法配伍组设计方差分析51方法两次观察时间不宜过长前后无后期效应影响适用条件和特点多适用于各种慢性病治疗设计节省样本容易控制条件统计分析方法秩和检验方差分析52方法是一种多因素的交叉分组试验设计可检验各因素间的交互作用可以节约样本含量统计分析方法方差分析53适用条件和特点必须是3个因素的试验且3个因素的水平数相等行间列间处理间均无交互作用各行列处理的方差齐各行各列各处理的观察个数相等试验效率高可进行行列间均数的比较统计分析方法方差分析54适用条件和特点用于找出各因素对指标的影响并指出哪个是主要的哪个是次要的哪个起独立作用哪个起交互作用选出各因素中的一个最佳水平统计分析方法直观分析方差分析55适用条件和特点常用于控制的临床试验药物评价要能较快获得结果仅以单一指标作结论依据节省样本数检验56continuecontinuecontinue576061logisticcox6263统计符号反映计量正态资料的离散趋势均数标准差计量配对资料研究
• 估计样本含量的方法
45
• 影响样本大小的因素
⑴ 研究总体的变异程度
⑵ 容许误差的大小 ⑶ 检验效能
⑷ Ⅰ型错误的概率水准
46
三、常用的实验设计方法：完全随机设计
配对设计配伍组设计交叉设计析因设计拉丁方设计正交设计序贯试验队列研究病例对照研究

常见的几种统计方法

注意：
（1）不同类型的资料采用的统计分析方法不同；
（2）三类资料类型可以相互转化。
例：某地调查高血压的患病情况。
每人的血压：以mmHg计
计量资料
以舒张压≥90mmHg为高血压，结果在1000
人中有10名高血压患者，990名非高血压患
者，整理后的资料
计数
按低血压、正常、高血压分
资料
组所得资料。
等级资料
60年代到80年代，国外医学杂志调查表明：20%~72%的论文有统计错误。
1984年对《中华医学杂志》、《中华内科杂志》、《中华外科杂志》、《中华妇产科杂志》、《中华儿科杂志》595篇论文的调查结果为：
相对数误用占 11.2%，抽样方法误用占15.9%，统计图表误用占 11.7%
1996年对4586篇论文统计（中华医学会系列杂志占6.9%），数据分析方法误用达55.7%。
2001年《中华预防医学杂志》：中华医学会系列杂志误用约54% （1995）。
伪造统计数据违反科学道德
➢ 1976年New Science 杂志关于科研舞弊行为的调查
（1）74%的调查表反映有不正当修改数据的情况
（2）17%拼凑实验结果（3）7%凭空捏造数据（4）2%故意曲解结果
二、统计工作的基本步骤
四、统计学中的基本概念
（一）总体与样本
1、总体(population)
根据研究目的所确定的同质的所有
观察单位某项变量值的集合。
有关总体的三个要点：
研究目的、同质的、全体
例如：了解某地2002年正常成人白细胞数目的：了解某地2002年正常成人白细胞数观察对象：该地2002年全部正常成人观察单位：每个人
2

医学科研中如何用好应用统计学的方法

医学科研中如何用好应用统计学的方法统计学是一门透过同质事物的变异性、揭示内在事物规律性和实质性的科学，确切地讲，是一门关于客观数据分析的科学，研究数据的收集、整理和分析，包括理论和应用两个方面。

医学应用统计学，侧重于实际应用，是在传承和借鉴传统医学统计学“理论·原理·公式·应用”模式基础上，创造性地以“目的·数据库一变量类型一变量间关系”模式为指导的统计学。

它遵循简单实用的原则，力避复杂的数学原理和公式推导，以解决实际问题为导向，以建立统计数据库、分清变量类型为基础，以分析变量与变量间关系为核心阐述统计学分析方法，对于广大医学科研工作者，具有内容简单、思维明确、操作可行、方法实用的特点。

因此，学好用好医学应用统计学需要掌握如下一些基本方法。

一、明确研究目的和研究设计研究目的是研究设计的目标和方向，科学研究的基本要素及其基本原则是科研设计的基础和指南。

完整的科研设计包括专业设计和统计设计两部分：专业设计是指课题的实际意义和研究价值，入选对象的诊断标准、纳入标准及排除标准等，决定研究课题的先进性和实用性；统计设计包括选择研究类型与设计方案，确定研究总体、样本量、观察指标、随机化分组或抽样方法，以及数据的质量控制和统计分析方法等，影响课题的可信度和科学价值。

因此，正确的统计学分析一定要建立在明确的研究目的和研究设计的基础之上，那些事先没有研究目的和研究设计，事后找来一堆数据进行统计分析都是不可取的。

在医学论文的撰、编、审、读过程中经常遇到的问题是研究的题目与课题设计、论文内容不符，包括文章的方法解决不了论文的目的、文章的结果说明不了论文的题目、文章的讨论偏离了论文的主题；还有是目的不明确、设计不合理。

如题目过小，论文不够字数，而一些无关紧要的变量指标或结果被分析被讨论；又如题目过大，论文的全部内容不足以说明研究的目的，使论文的论点难以立足。

所以，合理明确的论文题目或目的以及研究设计方案是撰、编、审、读者应当关注的首要问题。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

v1.0可编辑可修改
正确答案错误答案
1.从同一总体抽样 , 则样本标准差（）
A 随着样本含量增大而增大
B 样本含量增大而标准差不变
C随着样本含量减少而减少
D随着样本含量增大而减小
2. 用图表示某地区近30 年三种疾病的发病率，在各年度的动态发展速度情况, 宜绘制（）
A普通线性图
B.直方图
C.百分条图
D.半对数线图。

3.均数与标准误的关系（）
A.均数越大 , 标准误越大
B.均数越大 , 标准误越小
C标准误越小，用均数推测总体均数的可靠性越大。

E标准误越大，用均数推测总体均数的可靠性越大。

4. 多重线性回归分析中，度量一组自变量与应变量线性相关程度的统计量是()
A.负相关系数
B.决定系数
C.偏相关系数
D.偏回归系数
5.变异系数 cv 的数值 ()
A.一定大于 1
B.一定小于 1
C.可以大于 1，也可以小于 1
D.一定小于标准差。

6. 在样本量为n，自变量个数为 3 的线性回归方程的假设检验中，回归变异和剩余变异的
自由度分别为（）
A. 3 和 n-3
B. 3 和 n-4
C. 2 和 n-2
D. 2 和 n-3
7. 比较某地区解放以来三种病的发病率在各个年度的发展速度, 应该绘制（）
A.半对数线图
B.圆图
C.直方图
D.普通线图
8. 在同一总体中随机抽取多个样本，用样本均数估计总体均数95%的可信区间，则估计精
密度高的是（）
A.均数小的样本
B.标准差小的样本
C.标准误大的样本
D.标准误小的样本
9.均数的标准误反映了（）
A.个体的变异程度
B.集中趋势的位置
C.指标的分布规律
D.样本均数与总体均数的差异
10.由样本均数估计总体均数可靠性大小的指标是（）
A.标准差
B.标准误
C.方差
D.变异系数
11.表示血清抗体滴度资料平均水平最常用的指标是（）
A.算术平均数
B.中位数
C.几何均数
D.变异系数
12.抽样误差产生的原因是（）
A.观察对象不纯
B.非正态分布资料
C.个体差异
D.非分类变量资料
13.95%置信区间的含义为（）
A.此区间包含总体参数的概率是95%
B.此区间包含总体参数的可能性是95%
C.此区间包含总体参数，这句话可信的程度是95%
D.此区间包含样本统计量的概率是95%
14.各观察值乘以一个大于 0 的常数后，（）不变
A.算数均数
B.标准差
C.中位数
D.几何均数
15.总体均数的可信区间（）
A.随总体均数而变化
B.不随总体均数而变化
C.是一个固定区间
D.随样本不同而变化
16.对数正态分布资料最好计算（）以表示离散趋势。

A.平均数
B.几何均数
C.中位数
D.标准差
17.若要得到残差平方和最小的回归方程，最好选用（）
A.全局选择法
B.逐步回归法
C.后退法
D.前进法
18.各观察值均加（或减）同一数后（）
A.均数不变，标准差改变
B.均数改变，标准差不变
C.两者均不变
D.两者均改变
19.某地区两年的三种死因别死亡率。

若用统计图表示出来可能选用（）
A.复式线图
B.百分条图
C.复式直条图
D.直方图
20.以下关于参数估计的说法正确的是（）
A.区间估计优于点估计
B.样本含量越大，置信区间范围越大
C.样本含量越小，参数估计越精确
D.对于一个参数可以获得几个估计值
21. 作多重线性回归分析时，若降低入选的 F 界的值，则进入方程的变量一般会（）
A.增多
B.减少
C.不变
D.可增多，可减少
22.均数 95%置信区间主要用于（）
A.估计”正常人群” 某指标 95%观察值所在的范围 X
B.反应总体均数有 95%的可能在某范围内
C.反应某指标的可能取值范围
D.反映某指标的观察值波动范围
23.在多重线性回归中，若对某个自变量的值都增加一个常数，则相应地偏回归系数（）
A.不变
B.增加相同的常数
C.减少相同的常数
D.增加但数值不定
24.描述一组偏态（偏锋）分布资料的变异程度，用（）指标较好
A.全距
B.标准差
C.变异系数
D.四分位数间距
25.少数几个数据比大部分数据大几百倍，宜用（）表示其平均水平
A.平均数
B.几何均数
C.中位数
D.标准差
26.多重线性回归分析中，可用来对自变量的作用大小进行比较的统计量是（）
A.偏回归系数
B.标准偏回归系数
C.复相关系数
D.决定系数
27. 在多重线性回归中，若对某个自变量的值都乘以一个相同的常数k，则相应地偏回归系
数（）
A.不变
B.都变为 1/k 倍
C.变为原来的 k 倍
D.改变，但数值不定
28.减少均数的抽样误差的可行方法之一是（）
A.严格执行随机抽样
B.增大样本含量
C.设立对照
D.选一些处于中间状态的个体。

常用医学科研中的统计学方法(1).doc

医学统计学(MedicalStatistics)

常用医学科研中的统计学方法（1）

最新临床研究中常用统计分析方法及选择

医学科研中的统计学-概论

医学科研论文统计方法

常用统计学方法分析

常见的几种统计方法

医学科研中如何用好应用统计学的方法