课堂笔记——医学统计学

合集下载

卫生统计学笔记整理

卫生统计学笔记整理

卫生统计学笔记整理第1章绪论1、卫生统计学的概念:2、统计工作的基本步骤:3、卫生统计学的几个基本概念(attention:资料的分类)第2章调查研究设计1、调查研究的特点:2、调查研究的类型,按调查抽样比例划分.第3章实验设计1、实验设计的特点.2、实验设计的三要素四原则。

3、常用的实验设计方案:(attention:正确区别完全随机设计和配对设计)第4章定量资料的统计描述1、频数表的编制步骤和频数表的用途2、集中趋势的描述。

(P55知识点4-2)3、离散趋势的描述。

(P58知识点4-3)4、正态分布的特征5、制定医学参考值范围第5章定性资料的统计描述1、相对数是对定性资料进行统计描述的一类指标。

2、常用相对数(率、构成比、相对比)的定义3、应用相对数需要注意的问题[知识点5-3] P694、标准化法的意义和基本思想5、标准化率的计算方法与注意事项[知识点5-5] P74补充:1、该方法便于比较,但不能反映实际情况。

2、并非所有资料都可以计算标准化率,若各组间出现交叉,不宜用该方法。

3、两样本做标准化率后应做假设检验第6章总体均数和总体率的估计1、抽样误差的概念。

2、标准误的概念。

[知识点6-2] P793、t分布(了解)(一)t分布的概念与计算公式(二)t分布的特征与t界值表4、可信区间的概念。

5、总体均数的估计方法:[知识点6-3] P83第7章假设检验1、假设检验的基本思想及基本步骤[知识点7-1] P922、Ⅰ型错误与Ⅱ型错误。

[知识点7-2] P933、单侧检验与双侧检验区分。

[知识点7-3] P954、假设检验应该注意的问题。

[知识点7-3] P97第8章 t检验第一节样本与总体均数的比较1.检验步骤2.[知识点8-1] P1003.当样本数量n≧50或总体均数已知时用z检验[知识点8-2] P102第二节配对设计均数的比较1.检验步骤2.[知识点8-3] P103第三节两样本均数的比较1.检验步骤2.z检验的适用条件第9章方差分析第一节方差分析的基本思想和应用条件(1)总变异、组间变异、组内变异的定义与公式(2)条件:符合定量资料,具有独立性正态分布方差齐性的特征,多样本(3或3个以上)间的比较第二节完全随机设计的方差分析(1)检验步骤(2)注意事项:[知识点9-2] P120第四节多个样本均数的两两比较1.q检验适用范围:当方差分析得出结论拒绝H0接受H1假设时需进行q检验2.掌握检验步骤第10章 X2检验第一节2x2表的X2 检验(一)完全随机设计X2 检验1.检验步骤及公式2.注意事项:[知识点10-2] p141(二)配对设计X2 检验1.检验步骤及公式2.[知识点10-3] p142第二节RⅹC表的X2 检验1.注意事项:[10-4] p143第11章非参数检验适用条件:(1)总体分布形式未知或分布类型不明(2)偏态分布的资料(3)等级资料不能精确测定,只能以严重程度优劣等级次序先后等表示(4)不满足参数检验条件资料各组方差明显不齐(5)数据的一端或两端为不确定数值的资料、等级资料(6)[知识点11-1] p153第一节秩和检验1.检验步骤:详读p154 (2)(3)3.第二节两样本比较的秩和检验1.掌握编秩的方法2.注意条件详看p157的3第12章双变量关联性分析第一节直线相关1、直线相关的概念:又称简单相关,是用来描述具有直线关系的两变量x、y相互关系的统计方法,要求两变量均来自双变量正态分布的随机变量,且两变量不分主次,处于同等地位。

医学统计学笔记12

医学统计学笔记12

---------------------------------------------------------------最新资料推荐------------------------------------------------------医学统计学笔记12医学统计学笔记统计学:是收集、分析、解释与阐述数据资料的一门科学。

通过收集、分类、分析来处理数据变化的科学与艺术,获得可信结果。

医学统计学:将概率论和数理统计的原理和方法应用于医疗卫生实践和医学科研,研究其数据的搜集、整理与分析的一门科学。

是认识人群健康与疾病数量特征的重要工具,是进行医药卫生科学研究的重要手段。

国外统计学家:统计学并不能证明事物,但它能进行推断,发现线索,提供信息,使得人们有根据去改善事物。

科研原则:随机化原则,对照原则,重复原则,齐同原则(均衡原则)。

统计内容:设计,总体指标估计,假设检验,现象联系关系的分析,多因素分析,健康估计。

统计三大内容:科研设计,统计描述,统计推断。

变量:1/ 25被观察和测量单位的特征。

变量值:对变量的测量值。

同质:被研究指标的影响因素相同或具有相同性质的事物。

变异:在同质的基础上各观察单位之间的差异或同质事物之间的差别。

总体:根据研究目的确定的同质的研究对象的全体。

(无限总体,有限总体)个体:是构成总体最基本的观察单位。

样本:从总体中按照一定的目的随机抽取的有代表性的部分观察单位。

(随机性,可比性,可靠性)。

从总体中按照一定的目的随机抽取的有代表性的部分观察单位。

(随机性,可比性,可靠性)。

样本含量:样本中包含的个体数。

样本含量要大,越大越具代表性,随机抽。

参数:刻画总体特征的指标(用希腊字母表示)是常数。

统计量:---------------------------------------------------------------最新资料推荐------------------------------------------------------ 样本系统指标(用拉丁字母表示)是变化的。

职称考试卫生统计学重点学习笔记

职称考试卫生统计学重点学习笔记

卫生统计学第一章统计学的基本内容第一节医学统计学的含义1、医学统计学定义医学统计学(statistics)作为一门学科的定义是:关于医学数据收集、表达和分析的普遍原理和方法。

2、医学统计学研究方法:通过大量重复观察,发现不确定的医学现象背后隐藏的统计学规律。

3、医学统计推论的基础:在一定条件下,不确定的医学现象发生可能性,即概率。

第二节、统计学的几个重要概念一.资料的类型1、计量资料(数值变量):对每一观察对象用定量的方法,测定某项指标所得的资料。

一般有度量衡单位,每个对象之间有量的区别。

2、计数资料(分类变量):对观察对象按属性或类型分组计数所得的资料。

每个对象之间没有量的差异,只有质的不同。

3、等级资料(有序分类变量):对观察对象按属性或类型分组计数,但各属性或类型之间又有程度的差别。

注意:不同类型的资料采用的统计分析方法不同;三类资料类型可以相互转化。

二、总体根据研究目的所确定的同质的所有观察对象某项变量值的集合1、有限总体:只包括在确定时间、空间范围内的有限个观察对象。

2、无限总体:没有时间、空间范围的限制,观察对象的数量是不确定的,无限的三、样本从总体中随机抽取部分观察对象,其某项变量值的集合。

从总体中随机抽取样本的目的是: 用样本信息来推断总体特征。

四、随机事件可以发生也可以不发生,可以这样发生也可以那样发生的事件。

亦称偶然事件。

五、概率描述随机事件发生可能性大小的数值,记作P,其取值范围0≤P≤1,一般用小数表示。

P=0,事件不可能发生必然事件(随机事件的特例);P=1,事件必然发生;P→0,事件发生的可能性愈小;P→1,事件发生的可能性愈大六、小概率事件习惯上将P≤0.05或P≤0.01 的随机事件称小概率事件。

表示某事件发生的可能性很小。

七、参数和统计量参数:总体指标,如总体均数、总体率,一般用希腊字母表示统计量:样本指标,如样本均数、样本率,一般用拉丁字母表示八、学习医学统计学的方法1、重点掌握“四基”:基本知识、基本概念、基本原理和基本方法;2、重视统计方法在实际中应用,重视实习和综合训练;注意学习每种统计方法的应用范围、应用条件,大多数公式只要求了解其意义和使用方法,不用记忆和探究数理推导。

医学统计学学习笔记

医学统计学学习笔记

医学统计学笔记一、绪论及基本概念1. 资料类型①计量资料(定量资料、数值变量资料):连续型、离散型②计数资料(定性资料、无序分类变量、名义变量):二分类、多分类③等级资料(半定量资料、有序分类变量)信息量:计量资料>等级资料>计数资料2.误差类型①过失误差:可避免②系统误差:具有明确的方向性,可避免③随机误差:分为随机测量误差和随机抽样误差,没有固定的大小和方向,不可避免3.核心概念参数:u、σ;固定的常数,总体的统计指标,参数大小客观存在,但往往未知。

统计量:X̅,S,P;样本的统计指标,参数附近波动的随机变量。

概率为参数,频率为统计量。

4.医学统计工作的基本步骤:设计、收集资料、整理资料、分析资料二、计量资料的统计描述1.集中趋势的描述a.算术均数,简称均数(mean):主要适用于对称分布或偏度不大的资料,尤其适合正态分布资料。

不能用于开口型资料。

u(总体均数),X(样本均数)。

b.几何均数(geometric mean,G):适用于经对数转换后呈对称分布。

观察值不能为0 、不能同时有正有负。

同一资料算得的几何均数小于算术均数。

c.中位数(median, M)和百分位数(precentile, Px):适用于各种分布类型资料。

当计量资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。

用频数表法计算百分位数时,组距不一定要相等。

P x=L x+i x(n∗x%−∑f L)f xL x:第x百分位数所在组段的下限i x:第x百分位数所在组段的组距f x:第x百分位数所在组段的频数∑f L:第x百分位数所在组段上一组段累计频数d.调和均数(harmonic mean,H):适用于表达呈极严重的正偏态分布资料的平均水平。

计算方法为求倒数的均值后再取其倒数。

SPSS:在Transform中输入公式。

2.离散(dispersion)趋势的描述a.极差(range,R):也称为全距。

b.四分位数间距(quartile range,Q):即统计图中箱子的高度,常用于偏态资料离散度的描述,多与M 合用。

[医学]课堂笔记——医学统计学

[医学]课堂笔记——医学统计学

第一章医学统计中的基本概念一、医学统计工作的内容:实验设计(experiment design)、收集资料(collecting data)、整理资料(sorting data)和分析资料(analyzing data)二、变异:医学研究的对象是有机的生命体,其功能十分复杂,不同的个体在相同的条件下,对外界环境因素可以发生不同的反应,这种现象称为个体差异或称为变异三、总体(population)和样本(sample):总体是同质的个体所构成的全体。

从总体中抽取部分个体的过程称为抽样,所抽的部分称为样本,在一个样本里含有的个体数可以不同,样本包含的个体数目称为样本容量。

四、样本的特性:代表性(representation)——要求样本能够充分反应总体的特征;随机性(randomization)——需要保证总体中的每个个体都有相同的几率被抽做样本;可靠性(reliability)——实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度;可比性(comparability)——指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。

五、误差:①系统误差(system error)②③六、概率(probability):是描述某一件事发生的可能性大小的一个量度。

习惯将P≤0.05或P≤0.01的事件称为小概率事件第二章集中趋势的统计描述一、频数表(frequency table):①概念:一种格式的统计表,即同时列出观察指标的可能取值区间及其在各区间内出现的频数。

由于这种资料的表达方式较完整地体现了观察值的分布规律,所以也称为频数分布表。

②制作图标的步骤:确定组数、确定组距、确定组段、对各组段计数及手工编制划记表。

二、直方图(histogram):①概念:直方图是以垂直条段代表频数分布的一种图形,条段的高度代表各组的频数,由纵轴标度;各组的组限由横轴标度,条段的宽度表示组距。

医学统计学学习笔记

医学统计学学习笔记

医学统计学学习笔记第一章绪论冉美岭康复0931班学号09260431201、医学统计学:是运用数理统计、概率论的原理和方法于医学科研和实践,研究医学资料和信息的收集、整理和分析的一门应用科学。

统计方法的两个特点:用数量反映质量,利用样本推断总体。

2、医学统计学的意义:为了预防疾病,研究病因,促进健康,必须运用医学统计学方法透过偶然现象来探其规律性,得出科学推断。

3、总体:是根据研究目的所确定的同质的研究对象的全体。

4、样本:是根据随机的原则从总体中抽出有代表性的一部分观察单位。

5、描述总体特征的有关指标称为参数:如总体平均数、总体标准差、总体率等。

6、反映样本特征的有关指标称为统计量:如样本均数、样本标准差、样本率等。

7、抽样误差是不可避免的,一般来说,样本越大则抽样误差越小,越和总体的情况相接近,用样本推断总体的精确度越高,反之亦然。

8、随机化:是抽样研究和抽样分配时十分重要的原则。

具有代表性、随机性、独立性、可比性。

9、概率:是描述某事件发生的可能性大小的一个量度。

10、医学统计资料的类型:①计量资料:是对每个观察单位用定量方法测定某项指标量的大小,一般有度量衡单位。

②计数资料:是将观察单位按某种属性或类别分组,所得各组的观察单位数,没有度量衡单位。

③等级资料:是将观察单位按某种属性的不同程度分组,所得各组的观察单位数。

11、医学统计工作的基本步骤:①统计设计②搜集资料③整理资料④分析资料第二章计量资料的统计描述1、计量资料的统计描述分为两个方面:集中趋势、离散趋势2、频数表:是一种统计表:即同时列出观察值的可能取值及其出现的频数。

3、频数表的编制步骤:①计算全距R=X max—X min②确定拟分组数(k)和组距(i),根据全距的大小和组段数来计算组距i= R K③划分组段:划分组段的基本要求是第一个组段应包括最小值,最后一个组段应包括最大值。

各组段只包含下限值但不包含上限值,故在列组段时只列出下限值,不列出上限值,但最后一个组段要依据具体情况进行封口,即要同时列出下限值和上限值。

医学统计学复习笔记

医学统计学复习笔记

统 计1. 统计工作步骤: 研究设计、收集资料、整理资料、分析资料 。

2. 定量资料: 以定量值表达每个观察单位的某项观察指标,如血脂、心率等,各观察值 间只有量的差别,有连续性。

3. 定性资料: 以定性方式表达每个观察单位的某项观察指标,如血型、性别等,各观察 值间有质的区别,无连续性。

4. 等级资料: 以等级方式表达每个观察单位的某项观察指标,如疗效等级,各观察值间 有质的区别,无数值大小5. 总体:是指按照研究目的所确定的研究对象中所有观察单位某项指标取值的集合。

分 为有限和无限两种。

6. 样本:是指从研究总体中随机抽取具有代表性的部分观察单位某项指标取值的集合。

7. 同质性:同一总体或其样本的观察单位在取值方面必须有相同的性质,称为同质性。

8. 描述某总体特征的指标称为参数;描述样本特征的指标称为统计量。

9. 概率:是指随机事件发生的可能性的大小的一个度量,常用 P 表示,其小于等于 0.05 时称为小概率事件。

10. 变异: 是以具有统治性的观察单位为载体, 某项观察指标在其观察单位之间现实的 差别。

包括同质事物间的、不同观察单位间的、同一单位不同阶段的差别。

11. 整理数据最有效的形式是频数分布,根据频数分布可以初步判断指标分布的特征是 集中趋势还是离散趋势, 发现某些特大或特小的可疑值,揭示资料分布类型,便于资 料进一步分析。

12. 频数分布分为对称分布和非对称分布, 非对称分布又称为偏态分布, 包括正偏态(大 ——小)和负偏态(小——大) 。

13. 集中趋势指标: 1) 算术均数(Xbar ),最适合单峰对称资料; 2) 几何均数(G),如 抗体滴度、细菌计数,应用于等比数列、对数数列; 3)中位数(M )和百分位数,适 用于偏态分布、开口资料、分布不明资料。

14. 离散趋势指标: 1)全距(R ),又称极差,极差大说明变异度大; 2)四分位间距; 3) 方差和标准差(s ),标准差大离散程度大,及波动明显; 4) 变异系数 CV=标准差/均 数,可应用于单位不同的两组资料或均数相差悬殊的两组资料。

医学统计学知识点笔记

医学统计学知识点笔记

2012 级临床五年五班 LCM勤医学统计学笔记——xxx 级临床x 年x 班整理一.绪论1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。

2,医学统计学的主要内容:1)统计研究设计 调查研究设计和实验研究设计2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。

A :资料的搜集与整理B :常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图C : 统计推断,如参数估计和假设检验。

3)医学多元统计方法 多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic 回归与Cox 回归分析。

3,统计工作步骤:1)设计 明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。

2)搜集材料A , 搜集材料的原则 及时、准确、完整B , 统计资料的来源医学领域的统计资料的来源主要有三个方面。

一是统计报表,二是经常性工作记录,三是专题调查或专题实验。

C , 资料贮存3)整理资料 a 检查核对b 设计分组c 拟定整理表d 归表4)分析资料 统计分析包括统计描述和统计推断4,同质(homogeneity ):指被研究指标的影响因素相同。

变异(variation):同质基础上的各观察单位间的差异。

变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,这种特征称为变量变量值:变量的观察结果或测量值。

变量类型变量值表现实例资料类型离散型产前检查次数计量资料数值变量连续型定量测量值,有计量单位身高二分类对立的两类属性性别(男女)无序多分类不相容的多类属性血型(A,B,O,AB )计数资料分类变量有序多分类类间有程度差异的属性受教育程度(小学,中学,高中,大学…)等级资料5,总体(population )根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章医学统计中的基本概念
一、医学统计工作的内容:实验设计(experiment design)、收集资料(collecting data)、整理资料(sorting data)和分析资料(analyzing data)
二、变异:医学研究的对象是有机的生命体,其功能十分复杂,不同的个体在相同的条件下,对外界环境因素可以发生不同的反应,这种现象称为个体差异或称为变异
三、总体(population)和样本(sample):总体是同质的个体所构成的全体。

从总体中抽取部分个体的过程称为抽样,所抽的部分称为样本,在一个样本里含有的个体数可以不同,样本包含的个体数目称为样本容量。

四、样本的特性:代表性(representation)——要求样本能够充分反应总体的特征;随机性(randomization)——需要保证总体中的每个个体都有相同的几率被抽做样本;可靠性(reliability)——实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度;可比性(comparability)——指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。

五、误差:①系统误差(system error)②③
六、概率(probability):是描述某一件事发生的可能性大小的一个量度。

习惯将P≤0.05或P≤0.01的事件称为小概率事件
第二章集中趋势的统计描述
一、频数表(frequency table):①概念:一种格式的统计表,即同时列出观察指标的可能取值区间及其在各区间内出现的频数。

由于这种资料的表达方式较完整地体现了观察值的分布规律,所以也称为频数分布表。

②制作图标的步骤:确定组数、确定组距、确定组段、对各组段计数及手工编制划记表。

二、直方图(histogram):①概念:直方图是以垂直条段代表频数分布的一种图形,条段的高度代表各组的频数,由纵轴标度;各组的组限由横轴标度,条段的宽度表示组距。

②用途:作为陈述资料的形式,可以代替原始资料,便于进一步分析;便于观察数据的分布类型;便于发现资料中某些远离群体的特大或特小的可疑值;当样本含量比较大时,可用各组段的频数作为概率的估计值。

三、平均数(average):是描述一组观察值集中位置或平均水平的统计指标,它常作为一组数据的代表值用于分析和进行组间的比较。

平均数优点缺点使用数据
算术平均数考虑每个观察值受到极值影响适用于正态或近似对称分布的资料
几何平均数取对数后正态或者
对称资料的描述不能有0或负数观
察值
对数正态分布或者取对数后呈对
称分布的资料
中位数稳定不利于进一步计算偏态分布两端无确定值Measures of Central Tendency:Mean and Median
One of the most important numerical measures is a measure of center-a measure along the horizontal axis that location or center of the distribution.
There are several commonly used measures to describe the location or center of a population or sample. The most widely utilized measure of central tendency is the arithmetic mean or average.
The arithmetic average of a set of measurement is very common and useful measure. To distinguish between the mean for the sample and the mean for the population, we will use the symbol X for a sample mean and μfor a population mean.
One measure of central tendency that is not as sensitive to the value of each measurement is the median. The median can be used as a summary measure for ordinal observations as well as for discrete and continuous data. The median is defined as the 50th percentile of a set of measurements; if a list of observations is ranked from smallest to largest, half the values are greater than or equal to the median, where the other half are less than or equal to it. Therefore, if a set of date contains a total of n observations where n is odd, the median is the meddle value, or the[(n+1)/2]th largest measurement; if n is even, the median is usually taken to the average of the two middlemost values, the(n/2)th and[(n/2)+1]th observations.
Although both the mean and the median are good measures of the center of the population, the median is less sensitive to the extreme values or outliers.。

相关文档
最新文档