医学统计学知识点总结

医学统计学知识点总结
医学统计学知识点总结

知识点

1.统计学是应用概率论和数理统计的基本原理和方法,研究数据的搜集、整理、分析、表

达和解释的一门学科。

2.医学统计学是应用统计学的基本原理和方法,研究医学及其有关领域数据信息的搜集、

整理、分析、表达和解释的一门学科。

3.统计软件包是对资料进行各种统计处理分析的一系列程序的组合。

4.统计工作的基本步骤:研究设计、搜集资料、整理资料和分析资料。

5.科研结果的好坏取决于研究设计的好坏,研究设计是统计工作中的基础和关键,决定着

整个统计工作的成败。

6.统计分析包括统计描述和统计推断。统计描述是对已知的样本(或总体)的分布情况或

特征值进行分析表述;统计推断是根据已知的样本信息来推断未知的总体。

7.医学原始资料的类型有:计量资料、计数资料、等级资料。

8.计量资料是用定量的方法对每一个观察单位的某项指标进行测定所得的资料。

9.计数资料是把观察单位按某种属性(性质)或类别进行分组,清点各组观察单位数所得

资料。

10.等级资料是把观察单位按属性程度或等级顺序分组,清点各组观察单位数所得资料。各

属性之间有程度的差别。等级资料的等级顺序不能任意颠倒。

11.同质:是指所研究的观察对象具有某些相同的性质或特征。

12.变异:是同质个体的某项指标之间的差异,即个体变异或个体差异性。

13.总体是根据研究目的确定的同质研究对象的总体。样本是总体中具有代表性的一部分个

体。

14.抽样研究是通过从总体中随机抽取样本,对样本信息进行分析,从而推断总体的研究方

法。抽样误差是由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异,其根源在于总体中的个体存在变异性,只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。

15.统计学的主要任务是进行统计推断,包括参数估计和假设检验。

16.概率是某随机事件发生可能性大小(或机会大小)的数值度量。概率的取值为0≤P≤1。

小概率事件是指P≤0.05的随机事件。

17.频数表和频数分布图的用途:(1)揭示计量资料的分布类型。(2)揭示计量资料分布的重

要特征—集中趋势与离散趋势。(3)便于发现特大或特小的可疑值。(4)作为陈述资料的形式。例数大时,可以频率估计概率。(5)便于资料的进一步统计分析。

18.均数应用于计量资料的正态分布或近似正态分布资料。

19.当资料呈正态分布时,均数位于分布的中心。

20.每个观察值都加一个常数a,则均数为原均数加常数a;每个观察值都乘以一个常数b,

则均数为原均数的b倍。

21.几何均数应用于对数正态分布或近似正态分布资料,也可用于呈倍数关系的等比资料。

在医院中主要用于抗原(体)滴度资料。

22.计算几何均数的资料一般不能有观察值为0,也不能同时包含正负观察值。

23.中位数可用于描述任何分布类型计量资料的集中趋势,但对于正态分布或近似正态分布

的资料,中位数不利于进一步的统计分析,故对正态分布或近似正态分布资料应首选均数描述其集中趋势。

24.中位数适用于描述偏态分布资料、一端或两端无确定数据的资料和分布不明资料的集中

趋势。

25.极差与四分位数间距可用于描述计量资料的离散程度,但都比较粗略,而四分位数间距

较极差稳定,他们用于描述偏态分布资料。

26.中位数M是一个特殊的百分位数,即第50百分位数P50,。百分位数是一种位置指标,

样本的第X百分位数记为Px,它表示将全部观测值X1、X2,…,Xn由小到大依次排列后位于第X百分位置的数值。

27.方差和标准差用于描述正态分布计量资料的离散程度。

28.均数与标准差结合用于全面描述正态分布计量资料的集中趋势与离散趋势。

29.变异系数描述的是相对离散程度,无度量衡单位。用于单位不同,或虽单位相同,但均

数相差较大的资料间变异程度的比较。

30.正态分布是横轴上方以均数处最高的单峰对称分布,以均数为中心,左右两侧对称。正

态分布N(μ,σ2)中有两个参数:总体均数μ和总体标准差σ。μ是位置参数,σ是变异度参数。

31.正态分布曲线下的面积是1,其分布有一定的规律,x±1.64s内的面积为90%,x±

1.96s内的面积为95%,x±

2.58s内的面积为99%。

32.常用相对数有:率、构成比、相对比。

33.率是说明某现象发生的频率或强度。某一分率的改变不影响其他分率变化。

34.构成比是表示某事物内部各组成部分所占的比重或分布。某一部分构成比的改变将影响

其他构成比的变化。

35.相对比表示两个有关事物指标,用以说明一个指标是另一个指标的几倍或几分之几。两

个指标可以是绝对比、相对数或平均数。

36.应用相对数注意事项:(1)计算相对数时分母应该有足够数量即例数不能太小。(2)计算

合计率或平均率时,不能把n个率相加后除以n,应该绝对数相加后再计算相对数。(3)正确区分构成比与率,分析时不能以构成比代替率。(4)相对数的比较应注意其可比性。

对比组之间除了被研究的因素不同以外,其他相对数造成影响的因素应可能在构成比代替率。(5)样本率或样本构成比在比较时应做假设检验。

37.常用的标准化方法有直接标准化法、间接标准化法和反推标准法,简称直接法、间接法

和反推法。

38.一般选择“标准”的方法有两种:(1)选择具有代表性的,较稳定的、数量较大的人群

作为“标准”;(2)互相比较资料中任选一组数据作“标准”。

39.标准化死亡比(SMR)是被标化组的实际死亡数与预期死亡数之比,若SMR>1,表示被

标化组死亡率高于标准组;若SMR<1,表示被标化组死亡率低于标准组;

40.计算标准化率的步骤:⑴根据资料所具备的条件选用直接法或间接法;⑵选定标准构成;

⑶选择公式计算标准化率。

41.应用标准化法的注意事项:(1)标准化法只适用于内部构成不同影响到总率比较的情况;

(2)由于选择的标准不同,算出的标准化率也不同,但比较的结论一致;(3)标准化后的

标准化率,已经不再反映当时当地的实际水平,它只表示相互比较的资料间的相对水平;

(4)样本标准化率也存在抽样误差,也需要进行假设检验。

42.发病率是计算一定期间内某人群中的新发病例数,而患病率是计算调查时点被调查人群

中的现患病例数。

43.在一定期间内某人可能发病一次以上而成为多个病例,所以发病率可能会大于100%;;

而患病率不会出现大于100%的情况。

44.发病率高的疾病称为多发病;患病率高的疾病称为常见病。患病率高,发病率也高的疾

病称为常见多发病。

45.统计表一般由标题、标目、线条、数字和备注等部分组成。统计表的编制应:⑴重点突

出,简单明了,一张统计表至应包括一个中心内容;⑵主谓分明,层次清楚;⑶结构完

整,有自明性。

46.常用的统计图有条图、圆图、百分条图、直方图、线图、半对数线图、散点图、箱式图

和统计地图等。

47.单个构成比的描述,可选用圆图或百分条图;多个构成比的描述和比较,宜选用百分条

图。

48.普通线图适用于描述某项指标随某个连续型数值变量变化而变化的幅度(绝对变化趋

势);半对数线图适用于描述某项指标随某个连续型数值变量变化而变化的速度(相对变化趋势)。

49.箱式图通常选用5个描述统计量来绘制,即最小值、下四分位数(P25)、中位数(M)、

上四分位数(P75)、最大值;可用于描述某个连续型数值变量的分布特征,也可用于比较不同类别之间某个连续型数值变量分布特征的差异。

50.均数抽样误差是抽样产生的由于个体差异所导致的样本均数与样本均数之间、样本均数

与总体均数之间的差异。

51.标准误是样本均数的标准差,是描述均数抽样误差大小的指标。增加样本含量可减小样

本均数的标准误,从而降低抽样误差。

52.参数估计是指用样本指标(统计量)来推断总体指标(参数)。估计方法有点估计和区

间估计,区间估计是按预先给定的概率1-α,由样本指标确定的包含总体参数的一个范围。

53.可信区间是指总体均数可能所在的范围。用于推断总体参数所在的范围。总体均数95%

可信区间的意义为:总体均数在x±t0.05,νS x或x±1.96S x范围内的可能性为95%。

54.在抽样研究中,由于有抽样误差存在,不能直接通过比较样本均数与样本均数之间、样

本均数与总体均数之间的大小得出结论,要进行假设检验。

55.假设检验的基本思想包括小概率思想和反证法思想。

56.假设检验是先对总体作出某种假定(检验假设),然后根据样本信息来推断其是否成立

的一类统计方法的总称。用于推断总体参数是否相等。

57.假设检验的基本步骤:⑴建立检验假设,确定检验水准;⑵计算检验统计量;⑶确定P

值,作出统计判断。

58.单样本t检验的目的是推断样本均数所代表的总体均数与已知总体均数是否相同,它要

求样本取自正态总体。

59.配对设计包括:⑴两个受试对象按某特征相同或相近配成对子,分别给予不同的处理;

⑵同一受试对象给予不同处理或处理前后比较。它可以降低抽样误差,提高统计效率。

60.配对t检验适用于配对设计的计量资料的比较,且要求差值服从正态分布。

61.完全随机设计可以将一批同质受试对象随机分配到各组,也可以是随机抽取几组不同的

受试对象,观察其实验效应。

62.完全随机设计两样本均数比较的t检验是推断计量资料的两个总体均数之间有无差别的

假设检验方法,要求样本来自正态总体,且两总体方差相等(方差齐)。

63.方差齐性检验的适用条件是两样本均来自正态分布的总体,方差齐性检验中的检验统计

量F服从F分布,有两个自由度,分子的自由度(较大方差)和分母的自由度(较小方差)。F值越大,P值越小。

64.两个样本均数比较,方差不齐时刻选择:⑴近似t′检验;⑵通过一定的变量变换以达

到方差齐;⑶选用非参数统计,如秩和检验等。

65.Z检验适用于大样本资料的假设检验。

66.第Ⅰ类错误:检验假设H0本来是成立的,经过检验后被拒绝了,即“弃真”。其发生

的的概率为α,为已知。

67.第Ⅱ类错误:检验假设H0本来是不成立的,经过检验后被接受了,即“存伪”。其发

生的概率为β,属未知数。

68.假设检验的注意事项:⑴要有严密的研究设计;⑵选用的假设检验方法应符合应用条件;

⑶有统计学意义不等于有实际意义;⑷结论不能绝对化;⑸正确理解P值与差别有无统

计意义;⑹平衡Ⅰ类错误和Ⅱ类错误。

69.方差分析是一种以分析数据的变异为基础,以F值为检验统计量的计量资料的假设检验

方法,主要用于推断计量资料单因素k水平(k≧3)或多因素不同水平总体均数间的差异性,其前提条件为资料服从正态分布,各组方差齐。

70.随机区组设计资料的总变异被分解为3个部分,即处理组间变异、区组间变异和误差。

区组变异和误差两部分相当于单因素方差分析的组内变异。

71.两两比较的方法很多,常用q检验、LSD—t检验等;q检验适用于探索性研究,对每两

个样本均数都进行检验;LSD—t检验适用于事先有明确假设的证实性研究。

72.常用数据变换的方法有对数变换、平方根变换、平方根反正弦变换、倒数变换。

73.X2检验是一种以Χ2分布为基础,以Χ2值为检验统计量的计数资料的假设检验方法。

74.X2值反映实际频数(A)和理论频数(T)的符合程度。

75.X2检验的主要用途:⑴推断两个或两个以上总体率(或构成比)之间有无差别;⑵两变

量间有无相关关系;⑶检验频数分布的拟合优度。

76.四格表X2检验的注意事项:(1)当n≥40,T≥5时,用四格表x2检验的基本公式或专用

公式计算X2值;(2)当n≥40,1≤T<5时,需要用校正公式计算X2值; (3)当n<40或T

77.行×列表资料X2检验的注意事项:(1) 行×列表X2检验允许有1/5的基本格子的理论

频数小于5大于1,但不能有理论频数小于1。⑵如果有1/5以上格子的理论频数小于5大于1,或有一个格子的理论频数小于1,可采用以下处理方法:①增加样本含量:可以增大理论频数;②将理论频数太小的行或列与性质相近的邻行或邻列中的实际频数合并;③删去理论频数太小的格子所对应的行或例。

78.依次增减四格表中某个格子(一般选用行合计与列合计均为最小的那个格子)的数据,

可列出周边合计不变条件下各种组合的四格表(一般可列出最小周边合计数加1个四格表)。

79.非参数检验是一类不依赖于总体分布类型的检验,即在应用中可以不考虑被研究对象为

何种分布以及分布是否已知,检验假设中没有包括总体参数的一类统计方法。

80.秩和检验的适用范围:⑴未加精确测量的资料(包括等级资料);⑵偏态分布且无法转

化为正态分布的资料;⑶分布不清的资料。

81.配对资料的秩和检验用于配对设计计量资料差值的比较和单一样本与总体中位数的比

较。

82.直线相关是分析服从正态分布的两个随机变量x和y有无线性相关关系的一种统计分析

方法。

83.相关系数是描述两个变量间线性相关关系的密切程度与方向的统计指标。相关系数的符

号表示两变量的线性相关的方向。其特点为:⑴相关系数r没有单位;⑵取值范围在﹣1和1之间;⑶r为正表示正相关,r为1表示完全正相关;r值为负表示负相关,r为﹣1表示完全负相关;⑷r绝对值越接近1,表示两个变量间相关关系密切程度越高;越接近0,则相关关系越不密切。

84.相关分析的前提条件:两个随机变量;散点图呈线性相关;服从双变量正态分布。

85.在有相关关系时,根据r值判断两变量相关的密切程度:⑴|r|≥0.7,两变量有高度

相关关系;⑵0.7>|r|≥0.4,两变量有中度相关关系;⑶|r|<0.4,两变量有低度相关关系。

86.直线回归分析的前提条件:⑴线性:两个变量间存在线性关系;⑵独立性:任意两个观

察值互相独立;⑶正态性:应变量y是服从正态分布的随机变量;⑷方差齐:给定x后,应变量y的方差相等。

87.等级相关应用范围:⑴不服从双变量正态分布或偏态分布;⑵总体分布类型未知;⑶原

始数据是等级变量。

88.对同一资料,相关系数t检验与回归系数t 检验效果相同。

89.决定系数r2决定回归效果的好坏,r2越接近1,回归的效果越好。

90.直线回归方程:y=a+bx其中a为回归直线在Y轴上的截距:⑴a>0表示直线与纵轴

的交点在原点的上方;⑵a<0则交点在原点的下方;⑶a=0则回归直线通过原点;b为回归系数,即直线的斜率:⑴b>0表示直线从左下方走向右上方,即y随x的增大而增大;⑵b<0表示直线从左上方走向右下方,即y随x的增大而减小;⑶b=0表示直线与x轴平行,即x与y无直线关系;⑷b的统计学意义是x每增(减)一个单位,y 平均改变b个单位。

91.实验设计的特点:⑴研究者能人为设置处理因素;⑵受试对象接受何种处理因素或水平

是由随机分配而定的。

92.医学实验设计包括处理因素或研究因素,受试对象和实验效应三个基本要素。

93.常用对照的形式为空白对照、安慰剂对照、实验对照、标准对照、自身对照、相互对照

及历史对照等。

94.随机化包括随机抽样和随机分组,随机抽样指保证总体中的每一个个体都有同等的机会

被抽出来作为样本;随机分组指保证样本中的每一个个体都有同等的机会被分配到实验组或对照组。

95.实验设计的基本原则:对照、随机、重复、均衡。

96.重复是指研究样本要有一定的数量,即在保证研究结果具有一定可靠性的条件下,确定

最少的样本例数。

97.均衡原则又称齐同对比原则,指实验组和对照组或各实验组之间,除了处理因素以外,

其他一切条件应尽可能相同或一致。

98.完全随机设计又称随机对照试验,属于单因素研究设计。

99.样本含量估计需要确定四个基本因素:α、1-β、σ、δ。α、δ与样本含量成反比,

σ(或s)、1-β与样本含量成正比。

100.剂量反应是实验物质引起实验动物总体中产生某种反应的剂量。

医学统计学知识点范文.doc

第一章绪论 1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象:具有不确定性结果的事物。 3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。 4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。 5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异 同质,指根据研究目的所确定的观察单位其性质应大致相同。 变异,指总体内的个体间存在的、绝对的差异。 统计学通过对变异的研究来探索事物。 (2) 变量与数据类型 变量,是反映实验或观察对象生理、生化、解剖等特征的指标。 变量的观测值,称为数据 分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等) 定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等) 有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。 统计方法的选用与数据类型有密切的关系。 (3)总体与样本 总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。 样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。抽样,是从研究总体中随机抽取部分有代表性的观察单位。 参数,指描述总体特征的指标。 统计量,指描述样本特征的指标。 (4)误差 误差,指观测值与真实值、统计量与参数之间的差别。 可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。 随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。 抽样误差,是抽样引起的统计量与参数间的差异。 抽样误差主要来源于个体的变异。 统计学主要研究抽样误差。 (5)概率 概率,是描述某事件发生可能性大小的量度。 必然事件,事件肯定发生,概率P(U)=1; 随机事件,事件可能发生,可能不发生,概率介于0≤P(A)≤ 1; 不可能事件,事件肯定不发生,概率P(∮)=0; 小概率事件,事件发生的可能性很小,概率P(A)≤ 0.05、或P(A)≤ 0.01。 医学科研中,P(A)≤0.05作为事物差别有统计意义,P(A)≤ 0.01作为事物差别有高度统

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

医学统计学章节重点归纳

医学统计学章节重点归纳 第一节概述 1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。 2、 卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。 4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。 5、变异:是指客观事物的多样性和不确定性。 6、变量: 观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。 7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。 9、概率:事件发生的可能性大小的量度,通常以符号P表示。 10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。 第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。 2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。 3、集中趋势指标:算术平均数(均数)、几何均数、中位数。 指标使用条件计算公式 算术平均数适用于正态或近似正态分布 的数值变量资料 几何均数①对数正态分布,即数据经 过对数变换后呈正态分布的 资料;②等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。 中位数①非正态分布资料(对数正 态分布除外);②频数分布 的一端或两端无确切数据的 资料③总体分布不清楚的资 料。为奇数 , 为偶数, 4、离散型趋势指标:极差、标准差和变异系数 指标计算公式主要优缺点 极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映 组内其它观察值的变异度,不稳定,受样本量影响很大。

医学统计学总结

医学统计学总结 一、绪论 1,医学统计学:运用概率论与数理统计学得原理与方法,研究医学领域中随机现象有关数据得搜集、整理、分析与推断,进而阐明其客观规律性得一门应用科学。 2,医学统计学得主要内容: 1) 统计研究设计调查研究设计与实验研究设计 2) 医学统计学得基本原理与方法研究设计与数据处理中得基本统计理论与方法。A:资料得搜集与整 理 B:常用统计描述,集中趋势与离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计与假设检验。 3)医学多元统计方法多元线性回归与逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、 logistic回归与Cox回归分析。 3,统计工作步骤: 1) 设计明确研究目得与研究假说,确定观察对象与观察单位,样本含量与抽样方法,拟定研究方案,预 期分析指标,误差控制措施,进度与费用。 2) 搜集材料 A, 搜集材料得原则及时、准确、完整 B, 统计资料得来源医学领域得统计资料得来源主要有三个方面。一就是统计报表,二就是经常性工作记录,三就是专题调查或专题实验。 C, 资料贮存 3) 整理资料 a检查核对b设计分组c拟定整理表d归表 4) 分析资料统计分析包括统计描述与统计推断 4,同质(homogeneity):指被研究指标得影响因素相同。 变异(variation):同质基础上得各观察单位间得差异。 变量(variable):收集资料过程中,根据研究目得确定同质观察单位,再对每个观察单位得某项 特征进行测量或观察,这种特征称为变量 变量值:变量得观察结果或测量值。 5,总体(population) 根据研究目得所确定得同质研究对象中所有观察单位某变量值得集合。总体 具有得基本特征就是:同质性 样本(sample) 从总体中随机抽取部分观察单位,其变量值得集合构成样本。样本必须具有代表 性。代表性就是指样本来自同质总体,足够得样本含量与随机抽样得前提。 统计量(statistics)描述样本变量值特征得指标(样本率,样本均数,样本标准差)。 参数(parameter)描述总体变量值特征得指标(总体率,标准差,总体均数)。

医学统计学知识点总结

医学统计学 1. 对定量资料进行统计描述时,如何选择适宜的指标 定量资料统计描述常用的统计指标及其适用场合描述内容指 标 意义适用场合 平均水平;均 数 个体的平均值· 对称分布 几何均数平均倍数取对数后对称分布 中位数[ 位次居中的观察值 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 众 数 频数最多的观察值不拘分布形式,概略分析 ? 调和均数 基于倒数变换的平均值正偏峰分布资料 变异度全 距 观察值取值范围不拘分布形式,概略分析 标准差 (方差) 观察值平均离开均数的 程度对称分布,特别是正态分布资料 四分位数 间距 ? 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但 数量级相差悬殊的变量间比较 定性资料:阳性事件的概率,概率分布,强度和相对比。 ¥ 2. 应用相对数时应注意哪些问题 答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。 (2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。 (3)观察单位数不等的几个相对数,不能直接相加求其平均水平。 (4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。 3. 常用统计图有哪些分别适用于什么分析目的 常用统计图的适用资料及实施方法 < 图形 适用资料实施方法 条图组间数量对比用直条高度表示数量大小 直方图用直条的面积表示各组段的频数或频率

( 定量资料的分布 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 、 线图 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标 系 散点图} 双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布' 用茎表示组段的设置情形,叶片为个体值,叶长为频数 第3章概率分布(连续随机变量的正态分布;离散随机变量的二项分布及Poisson分布)1. 服从二项分布及Poisson分布的条件分别是什么 二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。 Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试验次数n很大,而所关心的事件发生的概率 很小。 、 2. 二项分布、Poisson分布分别有什么特征 ①二项分布、Poisson分布都是离散型分布。 ②二项分布的形状取决于π与n的大小。π=时,不论n大小,对称分布。π≠时,图形呈偏态,随n增大而逐渐对称。当n足够大,π或1-π不太小,二项分布近似正态。 ③Poisson分布μ越小,分布越偏。μ越大,分布越对称。当n足够大时,分布接近正态。 4、正态分布应用 ①估计变量值的频数分布 《 ②制定参考值范围 ③质量控制 ④正态分布是很多统计方法的基础 5. 正态分布特征 ①以均数为中心,左右对称 ②正态曲线在横轴上方均数处取得最高点 ~ ③正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)(μ,σ2 ;标准0,1)

健康管理师考试重点归纳总结

第一章健康管理概论 健康管理是以现代健康概念(生理、心理和社会适应能力)和新的医学模式(生理、心理、社会)以及中医治未病为指导,通过采用现代医学和现代管理学的理论、技术、方法和手段,对个体或群体整体健康状况及其影响健康的危险因素进行全面检测、评估、有效干预与连续跟踪服务的医学行为及过程。 其目的是以最小投入获取最大健康效益。 健康管理的八大目标: 1.完善健康和福利 2.减少健康危险因素 3.预防疾病高危人群患病 4.易化疾病的早期诊断 5.增加临床效用、效率 6.避免可预防的疾病相关并发症的发生 7.消除或减少无效或不必要的医疗服务 8.对疾病结局作出度量并提供持续的评估和改进 健康管理的特点: 标准化足量化个体化系统化 健康管理的三个基本步骤: 1.了解和掌握健康,开展健康信息收集和健康检查 2.关心和评价健康,开展健康风险评价和健康评估 3.干预和促进健康,开展健康风险干预和健康促进 健康风险评估是手段,健康干预是关键,健康促进是目的 健康管理的五个服务流程: 1.健康调查与健康体检 2.健康评估 3.个人健康咨询 4.个人健康管理后续服务 5.专项的健康和疾病管理服务 健康管理的六个基本策略: 1.生活方式管理 2.需求管理 3.疾病管理 4.灾难性病伤管理 5.残疾管理 6.综合群体健康管理 生活方式管理的特点: 1.以个体为中心,强调个体的健康责任和作用

2.以预防为主,有效整合三级预防 生活方式的四大干预技术: 教育激励训练营销 影响需求管理的四大主要因素: 1.患病率 2.感知到的需要 3.消费者选择偏好 4.健康因素以外的动机(残疾补贴、请病假的能力等) 需求管理的策略: 1.小时电话就诊和健康咨询 2.转诊服务 3.基于互联网的卫生信息数据库 4.健康课堂 5.服务预约 疾病管理的三个特点: 1.目标人群是患有特定疾病的个体 2.不以单个病例和(或)其单次就诊事件为中心,而关注个体或群体连续性的健康状况与 生活质量 3.医疗卫生服务以及干预措施的综合协调至关重要 灾难性病伤管理的五大特点: 1.转诊及时 2.综合考虑各方面因素,制订出适宜的医疗服务计划 3.具备一支包含多种医学专科及综合业务能力的服务队伍,能够有效应对可能出现的多种 医疗服务需要 4.最大程度地帮助病人进行自我管理 5.尽可能使患者及其家人满意 残疾管理的八大目标: 1.防止残疾恶化 2.注重功能性能力 3.设定实际康复和返工的期望值 4.详细说明限制事项和可行事项 5.评估医学和社会心理学因素 6.与病人和雇主进行有效沟通 7.有需要时要考虑复职情况 8.实行循环管理 《健康中国2030规划纲要》 1.强调预防为主,防患未然

医学统计学知识点汇总(精华)

医学统计学知识点汇总(精华) 一.概论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。 A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断

4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每 个观察单位的某项特征进行测量或观察,这种特征称为变量变量值:变量的观察结果或测量值。 5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某 变量值的集合。总体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。 样本必须具有代表性。代表性是指样本来自同质总体,足够的样 本含量和随机抽样的前提。

医学统计学重点总结

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。 统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean)简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三 中位数(M)与百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数

医学统计学知识点梳理

医学统计学知识点梳理 Revised as of 23 November 2020

医学统计学知识点梳理 医学统计学:是用统计学原理和方法研究生物医学问题的一门学科。他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。 统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。 统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征: ①参数估计:用样本的指标去推断总体相应的指标 ②假设检验:由样本的差异推断总体之间是否可能存在的差异 同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。 总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。

预防医学与医学统计学总结

绪论 进和维护健康,预防疾病、失能和早逝 二.预防医学特点:1.工作对象包括个体及确定的群体,主要着眼于健康和无症状患者;2研究方法注重微观和宏观相结合,但更侧重于影响健康的因素与人群的关系;3.采取的对策更具积极的预防作用,具有较临床医学更大的人群健康效应。 三.健康决定因素:指决定个体和人群健康状态的因素。包括:1、社会经济环境。2、物质环境3.个人因素。4卫生服务。 四.三级预防策略:1.第一级预防:又称病因预防,即防止疾病的发生。2.第二级预防:在疾病的临床前期做好早起发现、早期诊断、早起治疗的“三早”预防工作,以控制疾病的发展和恶化。3.第三级预防:对已患某些病者,采取及时的、有效的治疗措施,防止病情恶化,预防并发症和伤残,延长生命。 第一章流行病学概论 进健康的策略和措施的科学。 流行病学定义涵:1.流行病学的研究对象时人群。2.流行病学关注的事件包括疾病与健康状况。3.流行病学主要研究容是:(1)揭示现象(2)找出原因(3)评价效果。4.流行病学研究和实践的目的是防治疾病、促进健康。 二.流行病学基本原理:1.分布论。2.病因论。3.健康-疾病连续带。4预防控制理论(三级预防理论)5.数理模型。6.流行病学的几个基本原则:(1)群体原则(2)现场原则(3)对比原则(核心)(4)代表性原则 三.流行病学的用途:1.描述疾病及健康状况的分布。2.探讨疾病的病因。3.研究疾病自然史,提高临床诊断、治疗水平和预后评估。4.疾病的预防控制及其效果评价。5.流行病学分支。 第二章疾病分布 的存在方式及其发生、发展规律。 二.疾病分布的测量指标:1.发病率:指在一定期间(一般为1年)特定群中某病新病例出现的频率。 病频率的测量(日、周、旬、月),常用于疾病暴发或流行时的调查。 例。患病率=发病率*病程。 病的人数占所有易感接触者总数的百分率。 5.死亡率:指在一定时间期间(通常为1年),某人群中死于某病(或死于所有原因)的频率。死亡率是测量入群死亡危险最常用的指标。 6.病死率:表示一定时期,患某病的全部病人中因该病死亡者所占的比例。 三.疾病的分布形式(“三间分布”) 1.地区分布:疾病的地方性:由于自然环境和社会因素的影响而使一些疾病无需从外地输入,只存在于某一地区,或在某一地区的发病率水平总是较高,这种现象称为疾病的地方性。 2.时间分布 3.人群分布:出生队列分析:将同一时期出生的人划归为一组称为一个出生队列,对其随访观察若干年,观察死亡等情况。 4.判断疾病地方性的依据:(1)该病在当地居住的各群组

医学统计学重点图表总结

描述内容 指 标 意 义 适 用 场 合 平均水平 均 数 个体的平均值 对称分布 几何均数 平均倍数 取对数后对称分布 中 位 数 位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 众 数 频数最多的观察值 不拘分布形式,概略分析 调和均数 基于倒数变换的平均值 正偏峰分布资料 变 异 度 全 距 观察值取值范围 不拘分布形式,概略分析 标 准 差 (方 差) 观察值平均离开均数的程度 对称分布,特别是正态分布资料 四分位数间距 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 变异系数 标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图 形 适 用 资 料 实 施 方 法 条 图 组间数量对比 用直条高度表示数量大小 直 方 图 定量资料的分布 用直条的面积表示各组段的频数或频率 百分条图 构成比 用直条分段的长度表示全体中各部分的构成比 饼 图 构成比 用圆饼的扇形面积表示全体中各部分的构成比 线 图 定量资料数值变动 线条位于横、纵坐标均为算术尺度的坐标系 半对数线图 定量资料发展速度 线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范 围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97.5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99.5 P 1 P 99

医学统计学总结

医学统计学总结 一。绪论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学. 2,医学统计学的主要内容: 1) 统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法.A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验. 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析. 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B, 统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断 4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某项 特征进行测量或观察,这种特征称为变量 变量值:变量的观察结果或测量值。 变量类型变量值表现实例资料类型 数值变量离散型 定量测量值,有计量单位产前检查次数 计量资料 连续型身高 分类变量无 序 二分类对立的两类属性性别(男女) 计数资料多分类不相容的多类属性血型(A,B,O,AB) 有 序 多分类类间有程度差异的属性受教育程度(小学,中 学,高中,大学…)等级资料5,总体(population) 根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。样本必须具有代表性.代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。 统计量(statistics)描述样本变量值特征的指标(样本率,样本均数,样本标准差)。

医学统计学期末重点总结

误差:观测值与真实值、样本计量与总体参数之间的差别。 相对数:两个有关的绝对数之比,也可以是两个有关联统计指标之比。 相对比:相对比是A、B两个有关联指标值之比,用以描述两者的对比水平,说明A是B 的若干倍或百分之几。 统计描述:描述及总结一组数据的重要特征,目的是使实验或观察得到的数据表达清楚并便于分析。 统计推断:指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 同质:指根据研究目的所确定的观察单位其性质应大致相同。 变量:反映实验或观察对象生理、生化、解剖等特征的指标,变量的观测值称为数据。 定量数据:也称计量资料。变量的观测值是定量的,其特点是能够用数值大小衡量其水平的高低,一般有计量单位。根据变量的取值特征可分为连续型数据和离散型数据。 有序数据:也称半定量数据或等级资料。变量的观测值是定性的,但各类别(属性)之间有程度或顺序上的差别。 总体:根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。样本:从研究总体中抽取部分有代表性的观察单位,对变量进行观测得到的数据。 参数:描述总体特征的指标称为参数。 统计量:描述样本特征的指标称为统计量。 概率:描述某事件发生可能性大小的度量。 小概率事件:习惯上将P≤0.05的事件称为小概率事件。 平均数:是描述一组观察值集中位置或平均水平的统计指标,常用的有算术均数、几何均数和中位数。 率:率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比。 构成比:表示某事物内部各组成部分在整体中所占的比重,常以百分数表示,计算公式为区间估计:是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。 线性相关的概念:研究两个变量之间是否具有直线相关关系。 相关系数:是说明具有线性相关关系的两个数值变量间相关的密切程度与相关方向的统计量。 研究对象:根据研究目的而确定的观察总体,也可称为受试对象或实验对象。 处理因素:根据研究目而欲施研究对象的干预措施。 处理水平:处理因素在实验中所处的状态称为因素的水平(level),亦称处理水平。 对照:指在实验中应设立对照组,其目的是通过与对照组效应对比鉴别出实验组的效应大小。随机化:是指每个受试对象有相同的概率或机会被分配到不同的处理组。 重复:是指在相同实验条件下重复进行多次观察。 统计学的基本内容:统计设计,数据整理,统计描述,统计判断 数据类型:定量数据,定性数据,有序数据 误差的类型:系统误差,随机测量误差,抽样误差 配对样本t检验配对设计:同源配对,异源配对,自身配对 方差分析的基本思想:将全部观测值的总变异按影响因素分解为相应的若干部分变异,在此基础上,计算假设检验的统计量F 值,实现对总体均数是否有差别的推断。 非参数检验的适用范围:①总体分布类型未知或非正态分布数据;②有序或半定量资料;③数据两端无确定的数值。 标准差与标准误的区别与联系:区别:标准差:意义,描述个体观察值变异程度的大小,标准差越小,均数对一组观察值的代表性越好。应用,与X拔结合,用以描述个体观察值的

医学统计学总结

医学统计学总结 一.绪论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断 4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某 项特征进行测量或观察,这种特征称为变量 变量值:变量的观察结果或测量值。 5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总 体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。样本必须具有代 表性。代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。 统计量(statistics)描述样本变量值特征的指标(样本率,样本均数,样本标准差)。

医学统计学知识点梳理

第一章绪论 一、名词解释 1.统计学:是一门关于收集、分析、解释和表达数据的科学。 2.设计(design):根据研究的问题与目的,从统计学的角度对各步提前做出的周密计 划和安排。是整个研究的基础,是关键的一步。 3.收集资料(data collection):获得研究所需要的原始数据的过程。 4.整理资料(data storing):对收集到的原始资料进行归类整理汇总的过程。 5.分析资料(data analysis):对整理的资料进行统计分析,获取资料中有关信息的过程。 6.n同质(homogeneity):对观察指标影响较大且可以控制的主要因素尽可能的相同。 7.n变异(variation):同质基础上个体间的差异。 8.n.总体(population):根据研究目的确定的,所有同质研究对象的某些指标的集合。 9.n样本(sample):从总体中随机抽取的、数量足够的、能代表总体特征的部分研究 对象某些指标的集合。 10.参数(parameter):描述总体特征的指标称为参数。 11.统计量(statistic):描述样本特征的指标 12.变异(variation):对同质研究对象某指标值得波动性称为变异。 13.误差(error):实际观察值与客观真实值之差 14.系统误差(systematic error):在实际观测过程中,由受试对象、研究者、仪器设备、 研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。 15.过失误差:由科研工作者的失误或过错造成的误差。 16.n.抽样误差(Sampling error):由个体变异产生的,由于抽样造成的样本统计量与总 体参数的差异,称为抽样误差。 17.随机误差(random error):在没有过失误差和系统误差的条件下仍存在大量偶然无 法消除的不确定因素所引起的误差为随机误差。 18.n频率(frequency):在相同条件下,独立重复实验n次,其中事件A出现了m次, 那么事件A发生的频率记为f(A)=m/n,0≤f(A)≤1 19.变量(variable):观察结果的取值不能事先确定的某一特征叫随机变量(random variable)简称变量 20.n概率(Probability):描述随机事件发生可能性大小的度量(P)。取值范围:不可能 事件0~1。估计方法:当n足够大时,用频率估计概率。小概率事件:P ≤0.05(5%)或P ≤0.01(1%)称为小概率事件(习惯),统计学上认为不大可能发生。小概率原理即某事件发生的概率很小,可以视为只进行一次实验时,我们说这个事件是“不会发生的”,这句话在大多数情况下是正确的,但他一定有犯错误的时候。 21.资料(data):变量全部或部分测量值构成资料 22.计量资料(measurement data):每个研究对象的变量值为一数值,表现出有量的大 小,由这样一组研究对象定量观测值所构成的资料为计量资料。 23.计数资料(enumeration data):每个研究对象的变量值为互不相同的属性之一,由 这样一组研究对象定性变量值组成的资料为技术资料。 24.等级资料(ranked data):每个研究对象变量值为互不相容的属性之一,且这些属性 间有程度的递进或递减关系,有这样一组研究对象变量值组成的资料为等级资料。 25.实验因素(study factor):研究者根据研究目的在实验中需要观察并阐明其效应的因 素

医学统计学重点总结

<<医学统计学>>重点总结 1. 总体:根据研究的目的确定的同质研究对象中所有的观察单位变量值的集合。 2. 样本:按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。 3. 同质:影响研究指标的主要因素易控制的因素基本上相同。 4. 抽样误差:在抽样研究中,由于变异的存在,即使在同一总体中抽取的几个样本,各样本统计量往往不等。样本统计量与总体参数也不等,这种由于抽样研究所至样本之间和样本与总体之间的差异称为。。。 5. 变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。 6. 截尾数据:生存时间观察过程被人为的截止称为截尾,又称删失或终检。原因:失访/退出/ 终止(研究时限已到而终止观察)。 7. 卡方基本思想:X2分布是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相等等问题。X2反应实现了实际频数与理论频数的吻合程度。如果检验假设成立,则A-T 一般不大,X2应很小,即出现大X2值概率很小。即X2越大,P越小,若P≤a时,就怀疑假设的成立,拒绝H0。若P>a则没有理由拒绝H0。 8. X2用途: (1)实际频数与拟合频数拟合优度:A推断两个或两个以上总体率或构成比有无差别(四格表/行x 列表)。B两变量之间有无相互关系。C频数分布的拟合优度检验(判断次样本是否来自某种分布)。(2)某些分布可用X2近似。 (3)间接应用:如t分布和F分布就是在X2分布基础上推导出来的。 9. 方差分析的基本思想:根据研究目的和设计类型,把总体变异中离均差平方和分解成两部分或更多部分,也把总变异中的自由度相应分成两部分或更多部分,然后再进行比较,评价由某种因素引起的变异是否具有统计学意义。 10. 假设检验中P,a,b(倍他)的关系及统计学意义: a:检验水准,即显著性检验,在此概率之下的认为是小概率事件,统计学上以为此事件“不可能发生”,以此判断是否不拒绝H0无效假设,在假设检验中,按a检验水准,拒绝了原来正确的H0,即犯了第1类错误,犯此错误的概率为a。 b:在T假设检验中,按照a检验标准,没有拒绝原来错误的无效假设,即犯了第2类错误,犯次错误的概率是b。 P:是在H0成立时大于等于用样本计算的统计值出现的概率用P值与检验水准a比较,根据比较的结果作出统计判断。如果P≤a时,就怀疑假设的成立,拒绝H0。若P>a则接受H0拒绝H1。P值越小只能说明作出拒绝H0,接受H1的推论时犯错误的机会越小。 11.行x列表X2检验应注意: (1)行x列表中不宜有1/5以上格子的理论频数小于5或有一个格子的理论频数小于1,若发生上述情况可采用:A将理论频数过小的格子所在的行或列与性质相近的邻近行或列中的实际频数合并,使重新计算的理论频数增大。B删去理论频数过小的行或列。C增大样本含量以增大理论频数。 (2)当效应按强弱分为若干级别,则按实验结果可整理为单向有序行x列表,在比较各处理组的效应有无差别时,宜用秩和检验,ridit分析等。如作X2检验只说明各组构成比的差异有无统计学意义。

医学统计学知识点

实用标准 文档大全第一章绪论 1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象:具有不确定性结果的事物。 3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。 4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。 5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异 同质,指根据研究目的所确定的观察单位其性质应大致相同。 变异,指总体内的个体间存在的、绝对的差异。 统计学通过对变异的研究来探索事物。 (2) 变量与数据类型 变量,是反映实验或观察对象生理、生化、解剖等特征的指标。 变量的观测值,称为数据 分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等) 定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB 等) 有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。 统计方法的选用与数据类型有密切的关系。 (3)总体与样本 总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。 样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。抽样,是从研究总体中随机抽取部分有代表性的观察单位。 参数,指描述总体特征的指标。 统计量,指描述样本特征的指标。 (4)误差 误差,指观测值与真实值、统计量与参数之间的差别。 可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。 随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。 抽样误差,是抽样引起的统计量与参数间的差异。 抽样误差主要来源于个体的变异。 统计学主要研究抽样误差。 (5)概率 概率,是描述某事件发生可能性大小的量度。 必然事件,事件肯定发生,概率P(U)=1; 随机事件,事件可能发生,可能不发生,概率介于0≤P(A)≤ 1; 不可能事件,事件肯定不发生,概率P(∮)=0; 小概率事件,事件发生的可能性很小,概率P(A)≤ 0.05、或P(A)≤ 0.01。

相关文档
最新文档