医学统计学名解

合集下载

医学统计学名解

医学统计学名解

医学统计学名解一.名词解释1.医学统计学:是应用统计学的基本原理和方法,研究医学及其有关领域数据信息的搜集、整理、分析、表达和解释的一门学科。

2..统计推断:通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断。

3.参数估计:指用样本指标值(统计量)估计总体指标值(参数)。

参数估计有两种方法:点估计和区间估计。

4.假设检验:亦称显著性检验,是用来判断样本与样本,样本与的总体之间的差异是由抽样误差引起还是本质差别造成的统计推断方法。

5.同质与变异:同质是指所研究的观察对象具有某些相同的性质或特征。

变异是同质个体的某项指标之间的差异,即个体变异或个体差异性。

6.总体与样本:总体是根据研究目的确定的同质的研究对象的全体(或全部同质观察单位)。

从总体中随机抽取的部分研究对象称为样本。

7.抽样研究与抽样误差:通过从总体中随机抽取样本,对样本信息进行分析,从而推断总体特征的研究方法称为抽样研究。

由随机抽样造成的样本指标与总体指标之间、样本与样本指标之间的差异称为抽样误差。

8.参数与统计量:反映总体特征的指标称为参数,确定的研究总体的参数是常数。

而通过样本资料计算出来的相应指标称为统计量。

9.概率:随机事件发生可能性大小的数值度量。

10.计量资料:(或定量资料)计量指标也称数值变量或定量变量。

计量资料是用定量的方法对每一个观察单位的某项指标进行测定所得的资料。

一般具有度量衡单位,如身高(cm)、体重(kg)等。

11.计数资料;(或定性资料,或分类资料)把观察单位按某种属性(性质)或类别进行分组,清点各组观察单位数所得资料。

一般无度量衡单位,如性别、职业、血型等。

12.等级资料:把观察单位按属性程度或等级顺序分组,清点各组观察单位数所得资料。

各属性之间有程度的差别,互不相容。

14.正态分布和正态曲线:又称高斯分布,频数分布的高峰在中间,两端基本对称,逐步减少,这种分布称为近似正态分布,如果两端完全对称则称为正态分布。

名解(医学统计学名词解释)

名解(医学统计学名词解释)

小概率原理:某一事件发生的概率很小,称为小概率事件;进而认为在一次事件中不会发生。

抽样误差:由于个体变异及随机抽样而导致的样本统计量之间的差异及样本统计量与总体参数之间的差异。

95%可信区间:用某一范围去估计总体参数所在的位置,可信度是95%。

95%可信区间的可信度:从某总体中随机抽样100次,可计算100个可信区间,理论上来说,其中有95个包含了总体均数。

相关系数:用以说明具有直线关系的两变量间相关关系的密切程度和相关方向的指标。

回归系数b:lxy/lxx 回归直线的斜率表示x每增加一个单位y平均改变b个单位回归中S y·x :称剩余标准差。

指在总变异中,扣除可由X解释的部分后剩余部分的变异。

假设检验中:P含义:从H0总体中抽样,获得现有差别或更大差别样本的概率。

α水准:在假设检验之前设定的,说明按不超越多大的误差为条件作结论,是犯I型错误的最大风险。

I型错:H0成立,但假设检验拒绝H0接受H1,即弃真,这时所犯的错误。

II型错:H1成立,但假设检验没有接受H1(不拒绝H0),即存伪,这时所犯的错误。

检验效能:又称把握度,(1-β),两总体确有差别,按α水准能发现它们有差别的能力。

中心极限:从均数为u,标准差为sigm的总体中独立随机抽样,当样本含量n增加时,样本均数的分布将趋于正态分布,此分布均数为u,标准差为sigm X bar.描述集中趋势的指标有?各用于何情况?答:有算术均数:适用于单峰对称分布的资料。

几何均数:适用于对数变换后单峰对称的资料。

中位数和百分位数:适用于任何资料。

描述离散趋势的指标有?各用于何情况?答:极差:适合任何资料。

四分位数间距:适用于不对称的资料。

方差和标准差:适用于单峰对称分布的资料。

变异系数:用于度量单位不同或均数相差悬殊的两组或多组资料。

标准差和标准误的区别和联系:区别:1)概念不同:标准差是由个体变异造成的,标准误是由抽样误差引起的。

将样本统计量的标准差称为标准误。

医学统计学名解

医学统计学名解

同质(homogeneity):给个体规定的一些相同性质(使研究变量的已知影响因素齐同) 变异(variation):同质个体的变量值的差异。

个体(individual ),观察单位:统计研究中的基本单位——据研究目的而定 总体(population ):即根据研究目的确定的特定研究对象中的所有观察单位的测量值。

总体的统计指标称为总体参数(param-eter ) ,是固定的常数。

无限总体(infinite population ), 总体中所有所有观察单位不能够标识。

计量资料(数值变量):用仪器、工具或其它定量方法获得的定量结果,一般带有计量单位。

变量值是定量的,表现为数值大小。

计数资料(无序分类变量):定性观察结果,先将观察单位按事物的属性或性质分组,然后清点每组的观察单位数。

是一群分类个体数 等级资料(半定量资料或有序分类变量):半定性或半定量观察结果,先将观察单位按照事物的某种属性的不同程度或某项指标量的大小分成等级,然后清点每个等级的观察单位数。

是一群分级个体数误差(error )指实际观察值与观察真值之差、样本指标与总体指标之差。

系统误差 由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值两侧,而是有方向性、系统性或周期性地偏离真值。

随机误差(偶然误差) 是指排除了系统误差后尚存的误差。

它受多种因素的影响,使观察值不按方向性和系统性而随机地变化,误差变量一般服从正态分布。

频率(frequency ) ,假设在相同条件下,独立地重复做n 次试验,A 在n 次试验中出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率。

当试验重复很多次时,有 P (A )≈ m/n 概率又称为机率(probability ),是度量某一随机事件A 发生可能性大小的一个数值,记作P (A ),0< P (A )<1 。

P (A )越大,A 发生的可能性越大,反之亦然。

医学统计学复习资料(名解+简答)

医学统计学复习资料(名解+简答)

医学统计学复习资料(名解+简答)一、名词解释1.统计量 (statistic):统计量是统计理论中用来对数据进行分析、检验的变量。

2.同质 (homogeneity):是指观察单位(研究个体)间被研究指标的影响因素相同。

3. 抽样误差 (sampling error):由于随机抽样造成的样本均数与总体均数的差别。

4. 总体 (population):根据研究目的而确定的同质观察单位的全体称为总体,更确切的说,它是同质的所有观察单位某种观察值的集合。

5. 变异 (variation):变异就是标志在同一总体不同总体单位之间的差别。

6. 参数 (parameter):参数,也叫参变量,是一种变量。

7. 样本 (sample):研究中实际观测或调查的一部分个体称为样本,研究对象的全部称为总体。

8. 概率 (probability):概率是对随机事件发生的可能性的度量,一般以一个在0到1之间的实数表示一个事件发生的可能性大小。

越接近1,该事件更可能发生;越接近0,则该事件更不可能发生。

1. 正态分布 (normal distribution):靠近均数分布的频数最多,离开均数越远,分布的数据越少,左右两侧基本对称,这种中间多、两侧逐渐减少的基本对称的分布,称为正态分布2. 中位数 (median):一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数,注意:和众数不同,中位数不一定在这组数据中)3. 方差 (variance):是各个数据与其算术平均数的离差平方和的平均数,通常以σ2表示。

4. 四分位数间距 (quartile interval):是上四分位数与下四分位数之差,用四分位数间距可反映变异程度的大小。

5. 正偏态分布 (positively skewed distribution):为统计学概念,即统计数据峰值与平均值不相等的频率分布。

如果频数分布的高峰向左偏移,长尾向右侧延伸称为正偏态分布,也称右偏态分布。

医学统计学名词解释

医学统计学名词解释

1.总体:总体(population)是根据研究目的确定的。

同质的所有观察单位某种观察值(变量值)的集合。

总体中的所有单位都能够标识者为有限总体,反之为无限总体。

样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。

样本应具有代表性。

2.随机抽样:(random sampling)是指按照随机化的原则,从总体中抽取部分观察单位的过程。

随机抽样是样本具有代表性的保证。

3.变异(variation):在自然状态下,个体间测量结果的差异称为变异。

变异是生物医学研究领域普遍存在的现象。

4.计量资料(measurement data):对每个观察单位用定量的方法测定某项指标量的大小,一般有度量衡单位。

计数资料(count data):将观察单位按某种属性或类别分组,所得的观察单位。

其观察值是定性的,表现为互不相容的类别或属性。

等级资料(ordinal data):将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,5.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P (A),P(A)越大,说明A事件发生的可能性越大。

0﹤P(A)﹤1。

频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。

当试验重复很多次时P(A)= m/n。

6. 随机误差:(random error)又称偶然误差,是指排除了系统误差后尚存的差。

它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。

误差变量一般服从正态分布。

随机误差可以通过统计处理来估计。

抽样误差(sampling error )是指样本统计量与总体参数的差别统计量是在总体参数附近波动的随机变量。

7.系统误差: (systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。

医学统计学名词解释

医学统计学名词解释

医学统计学1、Medical Statistics(医学统计学):是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。

2、Variable(变量):是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示。

3、Numerical/Quantitative/Measurement date/variable数值变量/定量变量/计量资料/定量资料:是以定量的方式来表示观察单位某项观察指标的大小,所得的资料称之为~,有度量单位。

4、Unordered categorical/Qualitative/Enumeration date/variable无序分类变量/定性变量/计数资料/定性资料:是以定性的方式来表示观察单位某项观察指标,所得的资料称之为~,无固有度量单位。

5、Ordinal categorical/Semi-quantitative/Ranked date/variable有序分类变量/半定量资料/等级资料:是以等级的方式来表示观察单位某项观察指标,所得的资料称之为~,为半定量的观察结果,有大小顺序。

6、Homogeneity(同质):是指事物的性质、影响条件或背景相同或相近。

7、Variation(变异):是指同质的个体之间的差异。

8、Population(总体):是根据研究目的所确定的同质观察单位的全体或集合,分为有限总体和无限总体。

9、Sample(样本):是从总体中随机抽取的一部分观察单位所组成的集合。

10、Random variable(随机变量):是指取值不能事先确定的观察结果。

11、Parameter(参数):是总体特征的统计指标,采用小写的希腊字母,为固定的常数。

12、Statistic(统计量):是样本特征的统计指标,采用拉丁字母表示,由样本信息推算而得,是参数附近波动的随机变量。

13、Random Sampling(随机抽样):为了保证样本的可靠性和代表性,需要采用随机的抽样方法,使总体中每个个体均有相同的机会被抽到。

医学统计学名解

1、总体(population):是根据研究目的确定的同质研究对象的全体。

2、样本(sample):从总体中抽取的一部分有代表性的个体。

3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。

4、变异(variation):指同质个体的某项指标之间的差异。

5、参数(parameter):反映总体特征的指标称为参数。

6、统计量(statistic):通过样本资料计算出来的相应指标称为统计量。

7、抽样误差(sampling error):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。

8、概率(probability):某事件发生的可能性大小。

9、正态分布(normal distribution):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。

10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标。

11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。

12、医学参考值范围(medical reference range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。

13、方差(variance):是各个数据与平均数之差的平方的平均数。

14、标准差(standard deviation):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。

15、标准误(standard error):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。

16、均数的抽样误差(sampling error of mean):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。

17、假设检验(hypothesis testing):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。

医学统计学名词解释

统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。

总体(population):大同小异的研究对象全体。

更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。

样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。

样本应该具有代表性,能反映总体的特征。

利用样本信息可以对总体特征进行推断。

抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。

表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。

可用标准误描述其大小。

标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。

样本均数的标准差称为均数的标准误。

均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。

参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常置信区间揭示的是按一定置信度估计总体参数所在的范围。

t分布法、正态分布法(标准误)、二项分布法。

置信区间估计总体参数所在范围参数统计(parametric statistics)非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。

变异(variation):对于同质的各观察单位,其某变量值之间的差异同质(homogeneity):研究对象具有的相同的状况或属性等共性。

回归系数有单位,而相关系数无单位β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。

医学统计学名词解释名解复习资料

1. 总体(population):根据研究目的所确定的同质观察单位的全体。

只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体(finite population)。

假想的,无时间和空间概念的,称为无限总体(infinite population)。

2. (总体)参数(parameter):总体的统计指标或特征值。

总体参数是事物本身固有的、不变的。

3. 样本(sample):从总体中随机抽取的部分个体。

4. 样本含量(sample size):样本中所包含的个体数。

5. 变量(variable):观察对象个体的特征或测量的结果。

由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。

变量的取值称为变量值或观察值(observation)。

根据变量的取值特性,分为数值变量和分类变量。

6. 数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。

对每个观察单位用定量的方法测定某项指标的数值,组成的资料。

7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。

分类变量(categorical variable):或称定性变量,其取值是定性的,表现为互不相容的类别或或属性,有两种情况:1)无序分类(unordered categories):包括①二项分类,如上述“性别”变量,表现为互相对立的结果;②多项分类,如上述“血型”变量,表现为互不相容的多类结果。

2)有序分类(ordered categories):各类之间有程度上的差别,或等级顺序关系,有“半定量”的意义,亦称等级变量。

等级资料:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。

8. 抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。

医学统计学名词解释

医学统计学:是运用运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。

1、观察单位(observed unit)亦称个体,是统计研究中的基本单位。

2、总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体。

3、有限总体(finite population)明确规定了空间、时间、人群范围内有限个观察单位。

4、无限总体(infinite population)没有时间和空间范围的限制,其观察单位的全体数只是理论上存在的,因而可视为“无限”。

5、抽样(sampling)从总体中抽取部分观察单位的过程。

6、样本从总体中随机抽的的部分观察单位,其实测值的集合。

7、样本含量(sample size)该样本所包含的观察单位数。

8、变量(variable)能表现观察单位的变异性的特性称为变量。

8、同质(Homogeneity):指被研究指标的有关影响因素相同。

8、变异(Variation):指同质基础上的各种观察单位间的异同。

9、变量值(value of variable)或观察值(observed value)变量的观测值称为10、计量资料(measurement data)又称定量资料(quantitative data)或数值变量(numerical variable)资料。

为观测每个观测单位某项指标的大小,而获得的资料。

其变量值是定量的,表现为数值大小,一般由度量单位。

根据其观测值取值是否连续,又可分为连续型和离散型两类。

11、计数资料(enumeration data)又称定性资料(qualitative data)或无序分类变量资料、名义变量资料。

为将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。

其变量值是定性的,表现为互不相容的属性或类别。

12、等级资料(ranked data)又称半定量资料或有序分类变量资料。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.同质:指符合研究目的所确定的纳入对象和排除对象的条件组合。

观察单位性质大致相同
2.变异:同质研究对象某种效应指标测量值的波动性。

性质相同的同质对象的某个或某几个特征的差异,而使得测量结果不同,这种个体间的差异即为变异。

3.计量资料(定量数据):通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。

4.计数资料(定性数据):将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。

5.总体:根据研究目的确定的同质研究对象测量值的全体,其某种变量值的集合。

6.样本:从总体中随机抽取的部分观察单位,其实测值的集合。

7.参数:总体的统计指标。

8.统计量:样本的统计指标,如样本均数、标准差。

9.系统误差:大小恒定、倾向性、周期性、累加性的偏离真值。

可以通过严格的实验设计预防和技术措施消除。

10.随机误差:排除系统误差后尚存的误差,受多种无法控制的因素的影响。

特点:大小方向不一的随机变化,客观不可避免。

11.小概率事件:P ≤0.05的随机事件称为小概率事件。

12.小概率原理:在统计学上,小概率事件在一次抽样或一次实验中当作不发生。

13.统计描述:用适当的统计统计图(表)和统计指标对原始数据的分布规律及
其数量特征进行测定和描述。

14.统计推断:用样本信息推论总体特征的过程。

15.正态分布:是统计学中一种最常见、最重要的连续型变量的对称分布,中间
组段频数最多,两侧对称,规律下降。

16.偏态分布:指集中位置偏向一侧,频数分布不对称。

17.标准差:表示每一个数对均值的离散程度,是绝对变异指标。

18.标准误:样本统计量的标准差。

19.95%医学参考值范围:参考值范围是指特定健康人群的解剖、生理、生化等各
种数据的波动范围。

习惯确定包括95%的人的界值即95%医学参考值范围。

20.95%可信区间:表示该区间包括总体均数的概率为95%。

21.率:说明某现象发生的频率或强度。

22.构成比:说明某一事物内部各组成部分所占的比重或分布。

*构成比是用以说明事物内部某种构成所占比重或分布,并不说明某现象发的频率或强度。

*若比较的两组或多组率当其内部构成不相同时,需要统一的标准进行调整,使之具有可比性,称为“率的标准化法”,标准化后的标准化率,已经不再反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平。

23.统计表:以表格的形式,表达被研究对象的特征、内部构成及研究项目分组
之间的数量关系。

数据代替文字描述,便于统计结果的精确、简洁的表达和对比分析。

24.统计图:是用点的位置、线段的升降、直条的长短以及面积的大小等几何图
形表达统计指标的大小、对比关系及变化趋势。

直观、形象,易于理解表达数据和结果。

25.准确度:指观察值与真值的接近程度,主要受系统误差的影响。

26.精密度:指重复观察时,观察值与其均数的接近程度,其差值属于随机误差。

27.参数估计:用样本统计量推断总体参数。

28.假设检验:又称显著性检验,是指通过样本间存在的差别对样本所代表的总
体间是否存在着差别做出判断。

29.点估计:用相应样本统计量直接作为其总体参数的估计值。

30.区间估计:按预先给定的概率所确定的包含未知总体参数的一个范围。

31.第Ⅰ类错误:拒绝原本成立的原假设,导致推断结论错误(弃真)。

32.第Ⅱ类错误: 不拒绝原本不成立的原假设,则导致了另一种推断错误(存伪)。

33.最小二乘法:即可保证各实测点至直线的纵向距离的平方和最小。

34.相关系数:用来说明具有直线关系的两变量间相关的密切程度与相关方向。

*相关系数没有单位,其值为-1≤r ≤1。

r值为正表示正相关,r值为负表示负相关,r绝对值反应两变量间相关关系的密切程度,绝对值越大说明相关关系越密切,r的绝对值等于1为完全相关,r=0为零相关。

35.回归系数:X 每改变一个单位,Y 平均改变b 个单位。

相关文档
最新文档