医学统计学名词解释
医学统计学名词解释

医学统计学名词解释总体:根据研究目的确定的同质的全部研究单位的观测值,即某个随机变量X可取值的全体。
样本:总体中随机抽取的有代表性的部分观察单位其实测量值的集合。
变量:观察对象个体的特征或测量的结果。
由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量,简称变量。
统计量:由样本所算出的统计指标或特征值。
分层抽样:先按对主要研究指标影响较大的某种特征,将总体分为若干类别再从每一层随机抽取一定数量的观察单位,合起来组成样本。
随机抽样:总体中的每一个观察单位都有同等机会进入样本。
整群抽样:是以个体自然集结的或人为划分的群体作为抽样单元,总体中含有K个群,从中用随机化的方法抽取k个群,对抽中的k个群体内所有个体构成调查样本。
系统抽样:又称为等间隔抽样或机械抽样。
首先必须确定总体的范围和样本例数n,将总体等分为n份,每一份k个个体,再从第一份中随机抽取第r号个体,然后依次等间隔地从每份中均抽第r个观察单位组成样本。
抽样误差:由个体变异产生的,随机抽样引起的样本统计量之间以及样本统计量和总体参数之间的差异。
(由于样本的随机性引起的统计量与参数的差别,或同一总体相同统计量之间的差别成为抽样误差)标准差:是描述个体值变异程度的指标,为方差的算术平方根。
标准误(SE):统计学上通常把统计量的标准差称为标准误,是反映样本均数抽样误差大小的指标。
系统误差:是指在同一条件下,多次测量时,误差的大小和符号均保持不变,或当条件改变时,按某一确定的已知规律而变化的误差。
标准化法:采用统一的标准对内部构成不同的各组频率进行调整和对比的方法,称为标准化法。
调整后的率未标准化率,简称标化率,亦称调整率。
Ⅰ类错误:拒绝了实际上成立的HO,这类弃真的错误称为Ⅰ类错误。
Ⅱ类错误:指接受了实际上不成立的HO,这类存伪的错误称为Ⅱ类错误。
参数:反应总体统计学特征的数字。
计数资料:将研究对象按照某种属性的不同程度进行分组,然后计数每组里的观察系数。
医学统计学名词解释[教育]
![医学统计学名词解释[教育]](https://img.taocdn.com/s3/m/274ba3d90408763231126edb6f1aff00bfd57042.png)
医学统计学名词解释1、总体population:根据研究目的确定的所有观察单位的某种变量值的集合。
分为有限总体:是指个数确定,空间、时间范围限制的总体;无限总体:是指个数不确定,没有空间、时间限制的总体2、样本sample:从总体中随机抽取部分观察单位,其测量结果的集合称为样本3、变异:即同质的观察单位之间某项特征所存在的差异4、计量资料measurement data:又称定量资料或数值变量资料。
为观测每个观察单位的某项指标的大小,而获得的资料。
一般有度量衡单位。
根据其观测值取值是否连续,又可分为连续型或离散型两类5、计数资料count data:又称定性资料或者无序分类变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料6、等级资料ordinal data:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料7、圆形分布资料:具有周期性或循环性的资料8、抽样误差sampling error:是指由于抽样研究所造成样本统计量与总体参数的差别9、系统误差systematic error:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差10、统计量statistic:是指样本的统计指标11、概率probability:描述随机事件发生可能性大小的数值,用P 表示,0≤P≤112、统计描述:对数据包含的信息加以整理、概括和浓缩,用适当的统计图表和统计指标来表达资料的特征和规律13、平均数average:描述一组变量值的集中位置或平均水平。
常用的平均数有算术平均数、几何平均数和中位数14、算术均数:描述一组数据在数量上的平均水平15、中位数median:将一组观察值由小到大排列,位次居中的那个数16、变异指标:反应一组观察值的离散趋势。
医学统计学名词解释

医学统计学名词解释统计名词解释1、统计学:是运用数理统计的基本原理和方法研究预防医学和卫生事业管理中资料的收集,整理和分析的一门应用科学。
具体地讲,是按照设计方案去收集、整理、分析数据,并对数据结果进行解释,从而做出比较正确的结论。
2、总体:是根据研究目的确定同质的所有观察单位某种变量的集合。
3、变异:同一性质的事物,其观察值(变量值)之间的差异。
4、抽样研究:从所研究的总体中随机抽取一部分有代表性的样本进行研究,用样本指标推论总体,最终达到了解总体的目的。
这种用样本指标推论总体参数的方法称为抽样研究。
5、统计描述:用统计图表或计算统计指标的方法表达一个特定群体的某种现象或特征。
6、统计推断:根据样本资料的特性对总体的特性作估计或推论的方法称统计推断,常用方法是参数估计和假设检验。
7、概率:是指某事件出现可能性大小的度量,以符号P表示。
8、医学参考值范围:参考值范围又称正常值范围。
医学上常把包括绝大多数人某项指标的数值范围称为该指标的参考值范围。
9、正态分布规律:实际工作中,经常需要了解正态曲线下横轴上的一定区域的面积占总面积的百分数,用以估计该区间的观察例数占总例数的百分数,或变量值落在该区间的频数或概率。
10、可比性:是指对研究结果有影响的非处理因素在各处理组之间尽可能相同或相近。
11、动态数列:是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用以说明事物在时间上的变化和发展趋势。
12、抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异。
13、标准误:表示样本均数间变异程度。
14、率的抽样误差:抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差,率之间的差异称为率的抽样误差。
15、参数估计:是指用样本指标(称为统计量)估计总体指标(称为参数)。
16、可信区间:总体参数的所在范围通常称为参数的可信区间或置信区间,即该区间以一定的概率(如95%或99%)包含总体参数。
医学统计学名词解释

医学统计学名词解释医学统计学:是运用运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。
1、观察单位(observed unit)亦称个体,是统计研究中的基本单位。
2、总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体。
3、有限总体(finite population)明确规定了空间、时间、人群范围内有限个观察单位。
4、无限总体(infinite population)没有时间和空间范围的限制,其观察单位的全体数只是理论上存在的,因而可视为“无限”。
5、抽样(sampling)从总体中抽取部分观察单位的过程。
6、样本从总体中随机抽的的部分观察单位,其实测值的集合。
7、样本含量(sample size)该样本所包含的观察单位数。
8、变量(variable)能表现观察单位的变异性的特性称为变量。
8、同质(Homogeneity):指被研究指标的有关影响因素相同。
8、变异(Variation):指同质基础上的各种观察单位间的异同。
9、变量值(value of variable)或观察值(observed value)变量的观测值称为10、计量资料(measurement data)又称定量资料(quantitative data)或数值变量(numerical variable)资料。
为观测每个观测单位某项指标的大小,而获得的资料。
其变量值是定量的,表现为数值大小,一般由度量单位。
根据其观测值取值是否连续,又可分为连续型和离散型两类。
11、计数资料(enumeration data)又称定性资料(qualitative data)或无序分类变量资料、名义变量资料。
为将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。
其变量值是定性的,表现为互不相容的属性或类别。
12、等级资料(ranked data)又称半定量资料或有序分类变量资料。
医学统计学名词解释

统计名词解释1、统计学:是运用数理统计的基本原理和方法研究预防医学和卫生事业管理中资料的收集,整理和分析的一门应用科学。
具体地讲,是按照设计方案去收集、整理、分析数据,并对数据结果进行解释,从而做出比较正确的结论。
2、总体:是根据研究目的确定同质的所有观察单位某种变量的集合。
3、变异:同一性质的事物,其观察值(变量值)之间的差异。
4、抽样研究:从所研究的总体中随机抽取一部分有代表性的样本进行研究,用样本指标推论总体,最终达到了解总体的目的。
这种用样本指标推论总体参数的方法称为抽样研究。
5、统计描述:用统计图表或计算统计指标的方法表达一个特定群体的某种现象或特征。
6、统计推断:根据样本资料的特性对总体的特性作估计或推论的方法称统计推断,常用方法是参数估计和假设检验。
7、概率:是指某事件出现可能性大小的度量,以符号P表示。
8、医学参考值范围:参考值范围又称正常值范围。
医学上常把包括绝大多数人某项指标的数值范围称为该指标的参考值范围。
9、正态分布规律:实际工作中,经常需要了解正态曲线下横轴上的一定区域的面积占总面积的百分数,用以估计该区间的观察例数占总例数的百分数,或变量值落在该区间的频数或概率。
10、可比性:是指对研究结果有影响的非处理因素在各处理组之间尽可能相同或相近。
11、动态数列:是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用以说明事物在时间上的变化和发展趋势。
12、抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异。
13、标准误:表示样本均数间变异程度。
14、率的抽样误差:抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差,率之间的差异称为率的抽样误差。
15、参数估计:是指用样本指标(称为统计量)估计总体指标(称为参数)。
16、可信区间:总体参数的所在范围通常称为参数的可信区间或置信区间,即该区间以一定的概率(如95%或99%)包含总体参数。
医学统计学名词解释

1.总体:总体(population)是根据研究目的确定的。
同质的所有观察单位某种观察值(变量值)的集合。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
2.随机抽样:(random sampling)是指按照随机化的原则,从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
3.变异(variation):在自然状态下,个体间测量结果的差异称为变异。
变异是生物医学研究领域普遍存在的现象。
4.计量资料(measurement data):对每个观察单位用定量的方法测定某项指标量的大小,一般有度量衡单位。
计数资料(count data):将观察单位按某种属性或类别分组,所得的观察单位。
其观察值是定性的,表现为互不相容的类别或属性。
等级资料(ordinal data):将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,5.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P (A),P(A)越大,说明A事件发生的可能性越大。
0﹤P(A)﹤1。
频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。
当试验重复很多次时P(A)= m/n。
6. 随机误差:(random error)又称偶然误差,是指排除了系统误差后尚存的差。
它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。
误差变量一般服从正态分布。
随机误差可以通过统计处理来估计。
抽样误差(sampling error )是指样本统计量与总体参数的差别统计量是在总体参数附近波动的随机变量。
7.系统误差: (systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。
医学统计学 名词解释

29、统计表:是以表格的形式列出统计分析的事物及其指标,它可避免长篇文字叙述,并具体列出数据。
30、统计图:是用点的位置、线段的升降、直条的长短或面积的大小等形式表达统计资料,它可直观醒目地反映出事物间的数量关系。
31、正态分布:靠近均数分布的频数最多,两边频数逐渐减少并且近似对称,这种两头低中间高、略呈钟形、左右近似对称的连续性分布称为~。
4、分类变量/定性变量/计数资料/定性资料:是以定性的方式来表示观察单位某项观察指标,所得的资料 称之为~,无固有度量单位。
5、有序分类/等级资料:是以等级的方式来表示观察单位某项观察指标,所得的资料称之为~,为半定量的观察结果,有大小顺序。
6、同质:是指事物的性标准差:方差是指样本观察值的离均差平方和的均值,方差的正平方根为标准差,表示一组数据的平均偏离程度。
24、变异系数:是指标准差与均数之比,常用百分数表示,没有单位,主要用于度量衡单位不同或均数相差悬殊的几组资料间的比较。
25、相对比:是指A、B两个有联系的指标之比,用于说明A为B的若干倍或百分之几,是对比的最简单形式。
20、平均数:是反应一组观察值的集中趋势、中心位置或平均水平的指标体系,常用的指标有均数、几何均数、中位数。
21、中位数:是将一组观察值从小到大按顺序排列,位次居中的观察值就是中位数,适用于任何分布、开口资料、偏态分布。
22、百分位数:是指一种位置指标,用Px表示,一个百分位数将按大小顺序排列的变量值分为100份,旦论上有x%的变量值比它小,有(100-x)%的变量值比它大,对应x%位次的数值。
7、变异:是指同质的个体之间的差异。
8、总体:是根据研究目的所确定的同质观察单位的全体或集合,分为有限总体和无限总体。
医学统计学名词解释

医学统计学1、Medical Statistics(医学统计学):是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。
2、Variable(变量):是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示。
3、Numerical/Quantitative/Measurement date/variable数值变量/定量变量/计量资料/定量资料:是以定量的方式来表示观察单位某项观察指标的大小,所得的资料称之为~,有度量单位。
4、Unordered categorical/Qualitative/Enumeration date/variable无序分类变量/定性变量/计数资料/定性资料:是以定性的方式来表示观察单位某项观察指标,所得的资料称之为~,无固有度量单位。
5、Ordinal categorical/Semi-quantitative/Ranked date/variable有序分类变量/半定量资料/等级资料:是以等级的方式来表示观察单位某项观察指标,所得的资料称之为~,为半定量的观察结果,有大小顺序。
6、Homogeneity(同质):是指事物的性质、影响条件或背景相同或相近。
7、Variation(变异):是指同质的个体之间的差异。
8、Population(总体):是根据研究目的所确定的同质观察单位的全体或集合,分为有限总体和无限总体。
9、Sample(样本):是从总体中随机抽取的一部分观察单位所组成的集合。
10、Random variable(随机变量):是指取值不能事先确定的观察结果。
11、Parameter(参数):是总体特征的统计指标,采用小写的希腊字母,为固定的常数。
12、Statistic(统计量):是样本特征的统计指标,采用拉丁字母表示,由样本信息推算而得,是参数附近波动的随机变量。
13、Random Sampling(随机抽样):为了保证样本的可靠性和代表性,需要采用随机的抽样方法,使总体中每个个体均有相同的机会被抽到。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。
总体(population):大同小异的研究对象全体。
更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。
样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。
样本应该具有代表性,能反映总体的特征。
利用样本信息可以对总体特征进行推断。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可用标准误描述其大小。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。
样本均数的标准差称为均数的标准误。
均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数
区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。
参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常
置信区间揭示的是按一定置信度估计总体参数所在的范围。
t分布法、正态分布法(标准误)、二项分布法。
置信区间估计总体参数所在范围
参数统计(parametric statistics)
非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。
变异(variation):对于同质的各观察单位,其某变量值之间的差异
同质(homogeneity):研究对象具有的相同的状况或属性等共性。
回归系数有单位,而相关系数无单位
β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。
线性相关系数(linear correlation coefficient):又称Pearson积差相关系数(Pearson product moment coefficient),是定量描述两个变量间线性关系的密切程度与相关方向的统计指标。
参数(parameter):描述总体特征的统计指标。
统计量(statistic):描述样本特征的统计指标。
实验设计的基本原则
对照 (control) 对受试对象不施加处理因素的状态。
在确定接受处理因素的实验组时,要同时设立对照组
重复 (replication)相同实验条件下进行多次实验或多次观察。
整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。
作用是估计变异大小和降低变异
随机化(randomization) 采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组和对照组。
I类错误(假阳性错误)真实情况为H0是成立的,但检验结果为H0不成立,这样的错误称为I类错误。
其发生的概率用表示。
在假设检验中作为检验水准。
一般取0.05或0.01。
II类错误(假阴性错误)真实情况为H1是成立的,但检验结果为H1不成立,这样的错误称为II类错误。
其发生的概率用表示。
由于其取值取决于H1 ,因此在假设检验中无法确定。
变异指标是用于描述一组观察值围绕中心位置散布的范围,即描述离散趋势的统计指标。
数值越大,说明数据越离散,反之越集中。
极差 (range);四分位数间距(quartile range);方差(variance);标准差(standard deviation);变异系数(coefficient of variation
平均数指标用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。
算术均数(arithmetic mean);几何均数(geometric mean);中位数(median);众数(mode)
单纯抽样将调查总体的全部观察单位编号,从而形成抽样框架,在抽样框架中随机抽取部分观察单位组成样本。
每个观察对象都有相同的机会被抽中
系统抽样又称机械抽样。
按照某种顺序给总体中的个体编号,然后随机地抽取一个号码作为第一个调查个体,其他的调查个体则按照某种确定的规则“系统”地抽取。
最常用的方法是等距抽样
分层抽样先将总体中全部个体按某种特征分成若干“层”,再从每一层内随机抽取一定数量的个体组成样本。
分层特征与研究目的有关。
按各层比例抽样。
为减少抽样误差,要求层内误差最小,层间误差最大。
整群抽样先将总体分成若干“群”,从中随机抽取几个群,抽取群内的所有观察单位组成调查样本。
“群”的确定与研究目的无关。
为减少抽样误差,需多抽几个“群”。
一、统计表有哪些要素构成的?制表的注意事项有哪些?
一般来说,统计表由标题、标目、线条和数字、备注五部分组成。
但备注并不是必需的内容,可以根据需要出现。
1简明扼要,重点突出:最好一张表突出一个中心,不易太多中心,如果需要说明多个中心,可分成多张统计表。
2合理安排主语和谓语的位置:对于表中任意一行,从左至右,通过简短的连接词,可连成成一句通顺的句子。
3表中数据要认真核对,保证准确可靠
二、为什么不宜用t 检验对多组均数进行比较?
如果用t检验进行多个样本均数的两两比较,则会增加犯I 类错误的概率。
经检验得到拒绝H0 ,认为两组之间有差别的结论可能犯I类错误的概率为,不犯I类错误的概率为1- .每次判断均不犯I类错误的概率为(1- )k, k为比较的次数,上例=0.05, k=3,则均不犯错误的概率为( 1- 0.05)3 =0.86. 至少有一次判断犯I类错误的概率为1-(1- )k
三、方差分析的基本思想是什么?
按实验设计的类型,将全部观察值间的变异分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较(每个部分的变异可由某因素的作用来解释),以判断各部分的变异是否具有统计学意义,从而推断不同样本所代表的总体均数是否相同。
四、简述标准差与标准误的区别与联系
均数标准误大小与样本标准差大小成正比,与样本含量的平方根成反比。
标准误越小,说明样本均数作为总体均数估计值的准确性越大。
均数的标准误标准差意义反映样本均数抽样误差的大小反映一组个体值的变异程度
符号,
总体标准差 ,样本标准
差
计算
公式
控制方法增大样本含量可减小标准误
个体差异或自然变异不能通过统计方
法来控制
五、简述直线相关与回归的区别与联系
区别:1.回归说明依存关系,直线回归用于说明两变量间数量依存变化的关系,描述y如何依赖于x而变化;相关说明相关关系,直线相关用于说明两变量间的直线相关关系,此时两变量的关系是平等的
2.r与b有区别:r说明具有直线关系的两个变量间相关的密切程度与相关方向; b表示x每改变一个单位,y平均增(减)多少个单位;
3.资料要求不同:直线回归要求应变量y是来自正态总体的随机变量,而x 可以是来自正态总体的随机变量,也可以是严密控制、精确测量的变量,相关分析则要求x,y是来自双变量正态分布总体的随机变量。
4.取值范围:-∞<b<+∞;-1≤r≤1.单位:b有单位;r无单位。
联系:1.对同一样本,若同时计算b和r,其正负号是一致的。
2.对同一样本,b和r的假设检验是等价的,二者的t值相等,tb=tr。
3. 回归可解释相关。
相关系数的平方r2(又称决定系数)是回归平方和与总的离均差平方和之比,故回归平方和是引入相关变量后总平方和减少的部分。
六、简述实验设计的基本要素
1.处理因素(study factor,treatment)
• 研究者根据研究目的欲施加或欲观察的能作用于受试对象并引起直接或间接效应的因素。
• 处理因素可以是主动施加的某种外部干预或措施,也可以是客观存在的因素。
非处理因素
• 与处理因素同时出现、也能使受试对象产生效应的因素。
• 当非处理因素夸大或缩小了处理因素与实验效应间的真实联系时,称为混杂因素
2.受试对象/试验单位(object/experiment unit)
• 处理因素作用的客体,是根据研究目的而确定的观察目标总体。
可以是人、动物,也可以是生物材料,试验单位的基本条件
3.处理/试验效应(experimental effect)
• 处理因素作用于试验单位的反应和结果,通过观察指标来表达。
• 选择指标的依据:客观性、特异性和敏感性。
文档已经阅读完毕,请返回上一页!。