卫生统计学名词解释
卫生统计学名词解释

1.变量:研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量2.定量变量:是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位;例如:体重与身高3.定性变量:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数4.二分类变量:称为0-1变量;例如,性别男、女、疾病有、无和结局生、死等;二分类变量常用0和1来编码,0-1变量常称为假变量dummy variable或哑变量,可以和真变量一样参与计算5.等级资料:是先将观察单位按某种属性或类别的不同等级分成若干组,再清点各组观察单位个数所得到的资料6.同质:在调查和实验研究中,除了实验因素外,影响被研究指标的非实验因素相同被称为同质7.变异:同质事物个体间的差异8.总体:根据研究目的确定的同质研究对象所有观察单位某变量值的集合;简言之,研究对象的全体;9.样本:从总体中抽取的部分观察单位,某变量值的实测值构成样本;简言之,总体中有代表性的一部分;10.参数parameter:是统计模型的特征指标,是对总体而言,其大小是客观存在的,然而往往是未知的,如总体均数mean和总体方差variance11.统计量statistic:由观察资料计算出来的量,如计算观察样本中的个体得到的样本均数,样本方差;12.因果关系causality:在排除了人为联系、虚假联系后仍然存在的、无法用其他联系解释的两个变量之间的关系;但也需要时间顺序等标准进行因果判断13.误差:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差;主要有以下二种:系统误差和随机误差随机测量误差,抽样误差;14.系统误差:指数据搜集和测量过程中由于仪器不准确、标准试剂未经校正,操作人员掌握的标准不准等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差;特点:具有累加性;有倾向性;可以消除15.随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的;特点:随测量次数增加而减小;16.随机测量误差:在消除了系统误差的前提下,由于非人为的偶然因素,对于同一测量对象多次测定结果不完全一致;特点:没有倾向性;不可消除,但多次测量计算平均值可以减小随机测量误差;17.抽样误差消除了系统误差,并把随机测量误差控制在一定的范围内,在抽样研究中由于个体差异的存在,造成的样本统计量与总体参数以及样本统计量之间的差别;特点:无倾向性;不可避免;统计上可以计算并在一定范围内控制抽样误差;18.概率:描述随机事件发生的可能性大小的数值,常用P来表示;19.小概率事件:一次试验中不可能发生的事件;通常P﹤或P﹤的事件为小概率事件20.方差:为了能反映每个观察值之间的离散情况,同时又能考虑到观察单位数多少的影响,可取离均差平方和的均数,简称方差21.标准差:由于每一离均差都经过平方,使原来观察值的度量单位也都变为平方单位了;为了还原成为原来的度量单位,所以又将方差开平方,这就是标准差22.变异系数:标准差与均数之比用百分数表示23.率:指某现象实际发生数与可能发生某现象的总数之比,用以说明某现象发生的频率或强度,常以百分率、千分率、万分率或十万分率表示24.构成比:事物内部某一部分的观察数与事物内部各部分的观察单位数总和之比,以百分数表示;说明事物内部各部分所占的比重或分布率构成比概念发生的频率或强度各组成部分所占的比重强调点随机发生事件各部分的构成资料获得较难容易特点不一定合计为100%25.死亡率:指某地某年平均每千人口中的死亡数,它反映居民总的死亡水平26.死因构成:指全部死亡人数中,死于某死因者所占的百分比,说明各种死因的相对重要性27.死因顺位:是指按各类死因构成比的大小由高到低排列的位次,说明各类死因的相对重要性28.发病率:表示一定时期内,在可能发生某病的一定人群中,新发生的某病的频率强度;29.患病率:指某时点检查时可能发生某病的一定人群中现患某种疾病的频率;30.二项分布:如果每个观察对象阳性结果的发生概率均为,阴性结果的发生概率均为1-;而且各个观察对象的结果是相互独立的,那么,重复观察n个人,发生阳性结果的人次数X的概率分布为二项分布,记作BX ;n,π;31. Poisson 分布:是一种离散型分布,用以描述罕见事件发生次数的概率分布;常用于研究单位时间内或单位空间内某事件发生不同次数的分布32. 正态分布:正态分布是一种重要的连续型分布;若资料X 的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布;通常用记号),(2σμN 表示均数为μ,标准差为σ的正态分布均数为0、标准差为1的正态分布被称为标准正态分布,通常记为2(0,1)N ;33. 假设检验:又称显着性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断;34. 样本均数抽样误差:抽样造成的这种样本均数与样本均数之间、样本均数与总体均数之间的差异;35. 样本均数标准误:用于表示均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度36. 参数估计的概念:指用样本指标统计量估计总体指标参数;37. 95%可信区间:总体均数的95%置信区间的涵义是指:从理论上来说,做100次抽样,可算得100个可信区间,平均有95个可信区间包括μ估计正确,只有5个可信区间不包括μ估计错误;38. I 型和II 型错误:I 型错误指拒绝了实际上成立的H 0,这类“弃真”的错误称为I 型错误,其概率大小用α表示;II 型错误,指接受了实际上不成立的H 0,这类“存伪”的错误称为II 型错误,其概率大小用β表示;39. 1-β称为假设检验的功效power of a test;其意义是,当所研究的总体与H 0确有差别时,按检验水平α能够发现它拒绝H 0的概率40. 检验水准:是预先规定的,当假设检验结果拒绝H 0,接受H 1,下“有差别”的结论时犯错误的概率称为检验水准,记为α;41. 相关系数:又称Pearson 积差相关系数,用来说明具有直线关系的两变量间相关的密切程度与相关方向;42. 确定系数: 复相关系数的平方称为确定系数, 或决定系数,记为R2,表示回归平方和占总平方和的比例,用以反映线性回归模型能在多大程度上解释反应变量Y 的变异性;其定义为:43. 复相关系数 :确定系数的算术平方根44. 偏相关系数:一般地,扣除其他变量的影响后,变量Y 与X 的相关,成为Y 与X 的45. 实验效应是处理因素作用于受试对象的反应response 和结局outcome,它通过观察指标统计学常将指标称为变量来体现46. 单盲法:受试对象不知道自己分在哪一组;47. 双盲法:受试对象和实验执行者均不知道受试对象分在哪一组;48. 三盲法:受试对象、实验执行者和统计分析人员三者均不知道受试对象分在哪一组;49.寿命表life table,又称生命表、死亡表、死亡率表等,是根据某一特定人群的年龄别死亡率编制出来的一种统计表;50.m x是根据各年龄组的平均人口数P X与相应的死亡数D X计算,它近似地反映X岁年龄组人口在X~X+n年内的死亡率,用公式表示为:51.q x是同时出生的一代人死于某年龄组X~X+n的概率,表示X 岁尚存活者l x在今后n年内死亡的可能性概率;52.尚存人数l x是同时出生的一代人到刚活满X岁时尚生存的人数53.死亡人数d x是同时出生的一代人死于各年龄组X~X+n的人数54.生存人年数是同时出生的一代人,X岁尚存者在今后X~X+n 岁期间的生存人年数,亦称寿命表人口数55.生存总人年数是同时出生的一代人中活到X岁者今后尚能生存的总人年数,是X岁以上各年龄组生存人年数L x的累计和56.期望寿命是同时出生的一代人活到X岁时,尚能生存的平均年数,也称平均可享寿命或平均余年;。
卫生统计学名词解释

卫生统计学health statistics:卫生统计学是运用概率论、数理统计原理和方法,研究医学事物或现象的群体数量特征的科学。
总体population:总体是根据研究目的而确定的同质个体的全体。
样本sample:样本是从总体中随机抽取的一部分个体或个体值的集合。
数值变量numerical variable:其变量值是定量的,表现为数值的大小,通常有度量衡单位。
分类变量categorical variable:其变量值是定性的,表现为互不相容的类别或属性,没有度量衡单位。
同质homogeneity:指观察单位(研究个体)间被研究指标的影响因素。
概率probablity:概率是描述随机事件可能发生的量度,用P表示,其波动在0~1之间。
不可能事件发生的概率为0,必然事件发生的概率为1.抽样误差sampling error:抽样误差是指由抽样造成的样本统计量和总体参数的差别。
中位数median:是指把一组观察值,按大小顺序排列,位置居中的变量值(n为奇数)或位置居中的两个变量值的均数(n为偶数)。
标准差standard deviation:是描述一组计量资料离散趋势的指标,说明数据间参差不齐的程度。
正态分布normal distribution:是指频数分布以均属为中心,左右两侧基本对称,靠近均属两侧频数较多,离均数越远,频数越少,形成一个中间多、两侧逐渐减少、基本对称的分布。
区间估计interval estimation:是根据选定的置信度(用概率表示)估计总体参数所在的区间。
率rate:又称频率指标,表示一定时间内,实际发生某现象的观察单位数与可能发生该现象的观察单位总数之比,用以说明某现象发生的频率或强度。
构成比constituent ratio:指事物内部某一组成部分的观察单位数与该事物各组成部分观察单位总数之比,常用来说明事物内部各组成部分所占的比重或分布情况。
相对比relative ratio:至两个有联系的指标之比,常用百分数或倍数表示。
卫生统计学 名词解释

1、动态数列dynamic series--按时间顺序将一系列统计指标(可以使绝对数、相对数或平均数)排列起来,用以观察和比较该事物在时间上的变化和发展趋势。
2、统计表的种类---简单表sample table--只按单一变量分组,由一组横标目和一组纵标目组成。
复合表--将两个或两个以上变量结合起来分组,即由一组横标目和两组及以上纵标目结合起来。
3、编制统计表应注意的事项--简明扼要,重点突出;合理安排主语谓语的位置;表内数据要认真核对、准确可靠;4、条图bar chart--用等宽直条的长短表示相互独立的各项指标数量的大小,所比较的数据可以是绝对数也可以是相对数(单式条图/复式条图)。
5、百分条图percent bar chart--表示事物内部各部分的比重或所占比例。
与圆图pie chart类似。
6、线图line chart--线图是用线段的升降表示统计指标的变化趋势,或某现象随另一现象的变迁情况,适用于连续性变量。
7、半对数线图semi-logarithmic line chart--用于表示事物的发展速度(相对比);横轴为算术尺度,纵轴为对数尺度;线图上的数量关系为相对数关系。
在比较几组数据的变化速度时,特别是两组数据相差悬殊时,宜选用半对数线图。
8、散点图scatter chart--用点的密集程度、趋势表示两变量间的相关关系。
9、直方图histogram--表示连续型变量的频数或频率分布10、统计地图statistical chart--表示某种现象在地域空间上的分布。
11、箱式图box plot--描述连续型变量的分布特征(5个特征值-最小值、下四分位数、中位数、上四分位数、最大值)12、中心极限定理设从均值为μ,方差为σ的任意一个总体中抽取样本量为n的样本,当n足够大时,样本均值的抽样分布近似服从均值为μ,方差为σ的正态分布。
13.。
卫生统计学

第一章绪论一,名词解释参数:根据总体分布的特征而计算的总体统计指标。
总体:研究目的确定的同质观察单位的全体。
同质:总体中个体具有相同的性质。
变异:同质基础上的个体差异。
样本:从总体中随机抽取的有代表性的一部分观察单位,其实测值的集合。
统计量:由总体中随机抽取样本而计算的相应样本指标。
概率:描述随机事件发生的可能性大小的数值。
(概率的统计定义:在一定条件下,重复做n次试验,nA为n 次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在某一数值p附件,则数值p称为事件A在该条件下发生的概率。
)抽样误差:由个体变异的存在和抽样引起样本统计量与相应的总体参数间以及各样本统计量之间的差别。
二,问答题。
统计学的基本步骤有哪些?答:统计学是一门处理数据中变异性的科学与艺术,它包括收集数据、分析数据、解释数据,以及表达数据。
总体与样本的区别与关系?答:区别:样本是总体的一部分,联系:如果样本的均衡性较好,就能够代表总体的特征。
抽样误差产生的原因有哪些?可以避免抽样误差吗?答:一,个体差异引起;二,抽样方法引起。
抽样误差不能避免,但可以随着样本含量的增大而减小。
何为概率及小概率事件?答:概率是指在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在某一数值p附件,则数值p称为事件A在该条件下发生的概率。
小概率事件是指习惯上将P<=0.05或P<=0.01称为小概率事件,表示某事件发生的可能性很小。
第二章定量资料的统计描述一、名词解释频数:对一个随机事件进行反复观察,其中某变量值出现的次数被称为频数。
方差:用来度量随机变量和数学期望(即均值)之间的偏离程度。
标准差:也称均方差,是各数据偏离平均数的距离的平均数。
中位数:是指将原始观察值从小到大或从大到小排序后,位次局中的那个数。
几何均数:变量对数值的算数均数的反对数。
四分位数间距:百分位数P75和百分位数P25之差。
卫生统计学名词解释

卫生统计学名词解释一、基础概念1.总体(Population):在一定时空范围内同质的所有观察单位或个体的集合。
2.样本(Sample):从总体中随机抽取的一部分观察单位的集合。
3.变量(Variable):观察单位的基本特征或特性,可以分为定量变量和定性变量。
4.总体参数(Population Parameter):描述总体特征的概括性数值,如总体均数、总体率等。
5.样本统计量(Sample Statistic):描述样本特征的数值,如样本均数、样本率等。
二、资料类型与搜集方法1.计数资料(Count Data):通过计数或分类得到的资料,一般用相对数(率)表示。
2.计量资料(Measure Data):通过测量得到的数值资料,一般用均数、中位数等表示。
3.等级资料(Ordinal Data):具有一定顺序或等级的资料,一般用等级或有序分类表示。
4.调查法(Survey Method):通过问卷、访谈等方式收集资料的方法,常用于大样本调查。
5.实验法(Experimental Method):通过实验设计、随机分组等方式收集资料的方法,常用于实验研究。
6.观察法(Observational Method):通过观察记录收集资料的方法,常用于临床观察、生态学研究等。
7.纵向研究(Longitudinal Study):对同一组观察单位在不同时间点进行重复观察的方法,可获取纵向数据。
8.横向研究(Cross-sectional Study):在某一时间点对不同组观察单位进行同时观察的方法,可获取横截面数据。
9.随机抽样(Random Sampling):按照随机原则从总体中抽取样本的方法,保证每个观察单位被抽中的概率相等。
10.系统抽样(Systematic Sampling):按照某种规则或顺序从总体中抽取样本的方法,如每隔一定数量的观察单位抽取一个样本。
三、卫生统计学方法1.描述性统计(Descriptive Statistics):通过对数据进行整理、归类、简化和表示,描述数据的基本特征和分布情况。
卫生统计学名词解释

【下载本文档,可以自由复制内容或自由编辑修改内容,更多精彩文章,期待你的好评和关注,我将一如既往为您服务】卫生统计学名词解释总体(population):根据研究目的确定的同质观察单位的观察值全体所构成的集合。
样本(sample):从研究总体中抽取的一部分满足代表性的个体观察值所构成的集合。
计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。
计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。
等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料变量:观察单位或个体的某种属性或标志称为变量变量值:对变量进行测量或观察的值称为变量值。
分类变量变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
数值变量:概率:又称几率,是度量某一随机事件A发生可能性大小的一个数值,随机事件A发生的概率记为P(A),随机事件的概率取值在0~1之间,即0≤P≤1.小概率事件:如果随机事件发生的概率P≤0.05,或P≤0.01,表示该事件发生的可能性很小,对于一次随机抽样,一般认为是不可能发生的事件。
频数表:用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。
对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…20个病人的天数。
对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。
算术均数:描述一组数据在数量上的平均水平。
总体均数用μ表示,样本均数用X 表示。
几何均数:用以描述对数正态分布或数据呈倍数变化资料的水平。
记为G。
中位数:将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。
卫生统计学名词解释

卫生统计学名词解释
1、健康统计学:健康统计学是一门应用统计学原理分析健康情况的科学。
它主要着
重于研究健康、疾病和死亡的结构与模式。
2、疾病统计学:疾病统计学是一种应用统计学方法来研究疾病发生状况,以及发病
病因、发病风险、具体确诊、基因变异、治疗策略与预后等。
3、预防医学统计学:预防医学统计学是一门研究应用统计学原理来预测,诊断和控
制疾病发生和传播的科学学科,其目的是为了健康提供预防措施。
4、流行病学统计学:流行病学统计学是指利用统计学方法,对流行病的起源、传播、疫情的时序、拓展及最终的控制,以及社会和环境因素如生活方式、卫生保健和营养等与
疾病发生关系的研究。
5、生活质量统计学:生活质量统计学是研究利用统计学方法,评价疾病和对某项病
症所面临的威胁及疾病治疗和护理所产生的影响。
它可用于有效评估患者的最终疗效情况,改进患者的健康状况,以及优化改善患者的生活质量。
6、母婴卫生统计学:母婴卫生统计学是指利用统计学方法研究分析母婴的健康状况,以及母婴卫生保健服务、母婴健康管理和干预护理方法对母婴健康状况的影响,以及可能
存在的风险和危害因素。
7、公共卫生统计学:公共卫生统计学是了解、识别和控制公共卫生行业中复杂健康
问题的科学。
它结合统计学方法、生物数据学和社会行为研究的原理,分析卫生问题,并
找出有效的应对之道。
卫生统计学 名词解释

1.变量:研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量2.定量变量:是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位。
例如:体重与身高3.定性变量:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数4.二分类变量:称为0-1变量。
例如,性别(男、女)、疾病(有、无)和结局(生、死)等。
二分类变量常用0和1来编码,0-1变量常称为假变量(dummy variable)或哑变量,可以和真变量一样参与计算5.等级资料:是先将观察单位按某种属性或类别的不同等级分成若干组,再清点各组观察单位个数所得到的资料6.同质:在调查和实验研究中,除了实验因素外,影响被研究指标的非实验因素相同被称为同质7.变异:同质事物个体间的差异8.总体:根据研究目的确定的同质研究对象所有观察单位某变量值的集合。
简言之,研究对象的全体。
9.样本:从总体中抽取的部分观察单位,某变量值的实测值构成样本。
简言之,总体中有代表性的一部分。
10.参数(parameter):是统计模型的特征指标,是对总体而言,其大小是客观存在的,然而往往是未知的,如总体均数(mean)和总体方差(variance)11.统计量(statistic):由观察资料计算出来的量,如计算观察样本中的个体得到的样本均数,样本方差。
12.因果关系(causality):在排除了人为联系、虚假联系后仍然存在的、无法用其他联系解释的两个变量之间的关系。
但也需要时间顺序等标准进行因果判断13.误差:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。
主要有以下二种:系统误差和随机误差(随机测量误差,抽样误差)。
14.系统误差:指数据搜集和测量过程中由于仪器不准确、标准试剂未经校正,操作人员掌握的标准不准等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
卫生统计学名词解释总体(population):根据研究目的确定的同质观察单位的观察值全体所构成的集合。
样本(sample):从研究总体中抽取的一部分满足代表性的个体观察值所构成的集合。
计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。
计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。
等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料变量:观察单位或个体的某种属性或标志称为变量变量值:对变量进行测量或观察的值称为变量值。
分类变量变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
数值变量:概率:又称几率,是度量某一随机事件A发生可能性大小的一个数值,随机事件A发生的概率记为P(A),随机事件的概率取值在0~1之间,即0≤P≤1.小概率事件:如果随机事件发生的概率P≤0.05,或P≤0.01,表示该事件发生的可能性很小,对于一次随机抽样,一般认为是不可能发生的事件。
频数表:用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。
对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…20个病人的天数。
对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。
算术均数:描述一组数据在数量上的平均水平。
总体均数用μ表示,样本均数用 X 表示。
几何均数:用以描述对数正态分布或数据呈倍数变化资料的水平。
记为G。
中位数:将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。
极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。
百分位数:是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。
百分位数的另一个重要用途是确定医学参考值范围。
四分位数间距:是由第 3 四分位数和第 1 四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。
方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。
标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。
变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。
用CV表示。
正态分布:二项分布:标准正态变换:将服从正态分布的原始变量x~n(u,σ),进行变量变换u=(x-u)/σ,这种变换叫标准正态变换。
正常值范围:抽样误差(标准误):在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本与总体指标的差异,称为抽样误差。
可信区间:总体参数所在的范围。
正常值范围:医学上常把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围。
构成比:又称构成指标,它表示事物内部个组成部分所占的比重或分布。
相对数:是由两个联系的指标之比,是分类变量常用的描述性统计指标,常用的相对数有率、构成比、相对比。
率的标准化法:是用于内部构成不同的两个或多个率比较的一种方法。
统计描述:用统计图表或计算统计指标的方法表达一个群体的某项特征,称为统计描述。
假设检验:是先对总体做出某种假定(检验假设),然后根据样本信息推断其是否成立的一类统计方法。
或推论的方法称统计推断,常用方法是参数估计和假设检验。
抽样研究:从所研究的总体中随机抽取一部分有代表性的样本进行研究,用样本指标推论总体,最终达到了解总体的目的。
这种用样本指标推论总体参数的方法称为抽样研究。
参数估计:是指用样本统计量估计总体参数,主要有两种方法:点估计和区间估计。
统计表:是以表格的形式列出统计指标,它是对资料进行统计描述时的一种常用手段。
统计图:是以各种几何图形(如点、线、面或立体)显示数据的大小、升降、分布以及关系等,它也是对资料统计描述时一种常用手段。
均方:均方差(MS)或方差,是由离均差平方和被自由度相除而得。
方差分析:方差分析(analysis of variance,ANOVA)就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。
通过各变异来源的均方与误差均方比值的大小,借助F分布作出统计推断,判断各因素对观测指标有无影响。
总变异:样本中全部实验单位差异称为总变异。
其大小可以用全部观察值的均方(方差)表示。
组间变异:各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其大小可用组间均方表示。
组内变异: 各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。
完全随机设计:只考虑一个处理因素,将全部受试对象随机分配到各处理组,然后观察实验效应,这种设计叫做完全随机设计。
随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相同或相近,且受试对象数与处理因素的水平数相等。
然后再将每个区组内的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。
非参数检验:是一种不依赖总体分布类型,也不对总体参数进行统计推断的假设检验。
随机抽样:是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。
等级资料又称有序资料。
如患者的治疗结果可分为治愈好转、有效、无效、死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量。
参数:是指总体的统计指标,如总体均数、总体率等。
总体参数是固定的常数。
多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。
统计量:是指样本的统计指标,如样本均数、样本率等。
样本统计量可用来估计总体参数。
总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
直线回归:建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。
直线回归是回归分析中最基本、最简单的一种,故又称简单回归在直线回归方程中用b表示,b的统计意义为X每增(减)一个单位时,Y 平均改变b个单位。
直线相关:又称简单相关,用于双变量正态分布资料。
有正相关、负相关和零相关等关系。
直线相关的性质可由散点图直观的说明。
相关系数:又称积差相关系数,以符号r表示样本相关系数,ρ表示总体相关系数。
它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。
秩相关又称等级相关,是用双变量等级数据作直线相关分析,适用于下列资料:⑴不服从双变量正态分布而不宜作积差相关分析;⑵总体分布型未知;⑶用等级表示的原始数据。
参数统计:通常要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行估计和检验,称为参数统计。
秩次:变量值按照从小到大顺序所编的秩序号称为秩次。
秩和:各组秩次的合计称为秩和,是非参数检验的基本统计量。
、随机抽样:是指调查者用随机抽样的方法抽取样本,然后以样本统计量推断总体参数的一种研究方法。
常用的随机抽样方法有:单纯随机抽样、系统抽样、整群抽样和分层抽样。
检验水准:也称显著性水准,符号位a,是预先规定的概率值,通常取0.05,它是“是否拒绝H0的界限”。
检验效能:又称检验功效(1-β),它的含义是:当两总体确实有差别时,按规定的检验水准a,能够发现两总体间差别的能力。
可比性:是指除了处理因素外,其他可能影响结果的非处理因素在各组间应该尽可能相同或相近,即“齐同”。
发病率:指一定时期内,可能发生某病的人群中发生某病新病例数的强度,常用于描述急性病的发病情况。
患病率:可分为时点患病率与时期患病率,常用于描述在这个时间点或时期是否曾处于患病状态,适用于慢性病或发病时间不易确定的疾病患病情况,时期患病率也可以用于估计就医的需求状况。
某病病死率:指在某一期间内患某病者因该病死亡的百分比,可说明一种疾病的严重程度,也可以反映一个医疗单位医疗水平和医疗质量。
某病死亡率:是一定时期内某人群因某病而死亡的频率。
动态数列:按时问顺序将一系列统计指标(可以为绝对数,相对数或平均数)排列起来,用以观察和比较该事物在时间上的变化和发展趋势人口金字塔:人口金字塔:是将人口的性别和年龄资料结合起来,以图形的方式表达人口的性别和年龄构成。
它以年龄为纵轴,人口数构成为横轴,左侧为男,右侧为女而绘制的两个相对应的直方图,可以分析过去人口的出生死亡情况以及今后人口的发展趋势。
总和生育率:假定同时出生的一代妇女,按照某年的年龄别生育水平度过其一生的生育历裎,各年龄别生育率之和乘以年龄组组距,就是这一代妇女平均每人可能生育的子女数。