主要环境统计指标名词解释

〖工业废水排放总量〗指经过企业厂区所有排放口排到企业外部的工业废水量。包括生产废水、外排的直接冷却水、超标排放的矿井地下水和与工业废水混排的厂区生活污水，不包括外排的间接冷却水（清污不分流的间接冷却水应计算在内）。

〖直接排入海的〗指经企业位于海边的排放口，直接排入海的废水量。直接排放是指废水经过工厂的排污口直接排入海，而未经过城市下水道或其他中间体，也不受其他水体的影响。

〖工业废水排放达标量〗指各项指标都达到国家或地方排放标准的外排工业废水量，包括经过处理后外排达标的和未经处理外排达标的两部分。排放标准见GB 8978—1996。

〖工业废水排放达标率〗指工业废水排放达标量占工业废水排放量的百分率。计算公式是：

工业废水排放达标率＝（工业废水排放达标量÷工业废水排放量）×100%。

〖工业废水处理量〗指经各种水治理设施实际处理的工业废水量，包括处理后外排的和处理后回用的工业废水量。虽经处理但未达到国家或地方排放标准的废水量也应计算在内。计算时，如遇有车间和厂排放口均有治理设施，并对同一废水分级处理时，不应重复计算工业废水处理量。

〖工业废水中污染物排放量〗指排放的工业废水中所含汞、镉、六价铬、铅等重金属和砷、

挥发酚、氰化物、化学需氧量、石油类等一般无机物和有机物等污染物本身的纯重量。它可以通过工业废水排放量和其中污染物的浓度相乘求得，也可以通过物料衡算或经验计算公式求得（可参考《工业污染物产生和排放系数手册》）。

污染物纯重量＝污染物的平均浓度×报告期工业废水排放量

污染物的浓度，均以在企业排放口所测的数字为准（含有一类污染物的废水一律在车间或车间处理设施排出口取样测定），无论测出的浓度是否符合排放标准，均应统计在内。

〖废水治理设施数〗指企业用于防治水污染和经处理后综合利用水资源的实有设施（包括构筑物）数，以一个废水治理系统为单位统计。附属于设施内的水治理设备和配套设备不单独计算。已报废的设施不统计在内。

〖废水治理设施运行费用〗指维持废水治理设施运行所发生的费用，包括能源消耗、设备折旧、设备维修、人员工资、管理费、药剂费及与设施运行有关的其他费用等。

〖工业废水中污染物去除量〗指企业生产过程排出的废水，经过各种水治理设施处理后，除去废水中所含挥发酚、氰化物、化学需氧量、石油类、氨氮等一般无机物和有机物等污染物本身的纯重量。计算公式是：

污染物去除量＝（处理前污染物的平均浓度－处理后污染物的平均浓度）×处理的工业废水量

〖工业废气排放总量〗指企业燃料燃烧和生产工艺过程中产生的各种排入空气的含有污染物的气体的总量，以标准状态（273 K，101 325 Pa）计。

工业废气排放总量＝燃料燃烧过程废气排放量+生产工艺过程废气排放量

〖燃料燃烧废气排放量〗指燃煤、油、气锅炉、锻造加热炉、退火炉及其他工业炉窑在燃烧过程中所排废气的总量（即燃料和物料不混合的燃烧纯加热过程所产生的废气量）。

〖生产工艺废气排放量〗指生产工艺过程中排放的废气总量。如化工、冶炼、建材、化纤、

造纸等行业生产工艺过程中排放的废气。

〖工业二氧化硫排放量〗指企业在燃料燃烧和生产工艺过程中排入大气的二氧化硫量。

〖工业二氧化硫去除量〗指燃料燃烧和生产工艺废气经过各种废气治理设施处理后，去除的二氧化硫量。

〖工业烟尘排放量〗指企业厂区内的燃料燃烧产生的烟气中夹带的颗粒物的量。

〖工业烟尘去除量〗指企业燃料燃烧过程中产生的废气，经过各种废气治理设施处理后去除的烟尘量。

〖工业粉尘排放量〗指企业在生产工艺过程中排放的颗粒物重量。如钢铁企业的耐火材料粉尘、焦化企业的筛焦系统粉尘、烧结机的粉尘、石灰窑的粉尘、建材企业的水泥粉尘等。不包括电厂排入大气的烟尘。它可以通过排尘系统的排风量和除尘设备出口排尘浓度相乘求得，计算公式是：

工业粉尘排放量= 排尘系统排风量×除尘设备出口气体含尘平均浓度×除尘系统运行时间

除尘系统出口的含尘浓度，均以所测的数字为准，无论测出的浓度是否符合排放标准，均应统计在内。

〖工业粉尘去除量〗指企业在生产工艺过程中产生的废气，经过各种废气治理设施处理后，

去除的粉尘重量（不包括电厂去除的烟尘）。

〖废气治理设施数〗指企业用于减少在燃料燃烧和生产工艺过程中排向大气的污染物或对污染物加以回收利用的废气治理设施数。附属于设施内的治理设备和配套设备不单独计算。已报废的设施不统计在内。

〖脱硫设施数〗指在治理设施中有专用（或兼用）的脱硫设备（或系统），其脱硫效率要达到40％及以上，脱硫后不再释放出二氧化硫，比如使系统中有足够的碱性物质与二氧化硫反应，生成稳定的盐类物质或采用活性炭吸附制酸等方法进行脱硫的设施数。

〖燃料煤消费量〗指企业用作燃料的煤炭（非标准煤）消费量。包括企业厂区内生产、生活用燃料煤，也包括砖瓦、石灰等产品生产用的内燃煤，不包括炼焦等行业的原料用煤。

〖原料煤消费量〗指企业在生产工艺中用作原料并能转换成新的产品实体的煤炭消费量。如转换为焦炭、水泥、煤气、碳素、活性炭、氨氮等的煤炭称为原料煤。

〖工业固体废物产生量〗指企业在生产过程中产生的固体状、半固体状和高浓度液体状废弃物的总量，包括危险废物、冶炼废渣、粉煤灰、炉渣、煤矸石、尾矿、放射性废物和其他废物等；

不包括矿山开采的剥离废石和掘进废石（煤矸石和呈酸性或碱性的废石除外）。酸性或碱性废石是指采掘的废石其流经水、雨淋水的pＨ值小于4 或大于10.5 者。

〖危险废物〗指列入国家危险废物名录或根据国家规定的危险废物鉴别标准和鉴别方法认定的，具有爆炸性、易燃性、易氧化性、毒性、腐蚀性、易传染疾病等危险特性之一的废物。

〖冶炼废渣〗指在冶炼生产中产生的高炉渣、钢渣、铁合金渣以及有色金属矿渣等。

〖粉煤灰〗指燃煤电厂锅炉、煤粉炉在燃煤过程中产生的固体颗粒物。

〖炉渣〗指企业燃烧设备从炉膛排出的灰渣。不包括燃料燃烧过程中去除的烟尘。

〖煤矸石〗指与煤层伴生的一种含碳量低、比煤坚硬的黑色岩石。通常由煤矿开采、洗煤及耗煤单位排出。

〖尾矿〗指选矿厂和水冶厂排出的废物，包括赤泥。赤泥指以铝土矿为原料的氧化铝厂的生产废料。选矿厂包括各种金属和非金属矿石的选矿厂。

〖放射性废渣〗指含有天然放射性核素，并其比活度大于2×104 贝可/千克的尾矿砂、废矿石及其他放射性固体废物（指放射性浓度或比活度或污染水平超过规定下限的固体废弃物）。

〖其他废物〗指工业垃圾、污泥及燃料燃烧过程中去除的烟尘等工业固体废物。工业垃圾，

指机械工业切削碎屑、研磨碎屑、废砂型等；食品工业的活性炭渣；硅酸盐工业和建材工业的砖、瓦、碎砾、混凝土碎块等。污泥指工业废水处理中排出的固体沉淀物（以干泥量计）。

〖工业固体废物综合利用量〗指通过回收、加工、循环、交换等方式，从固体废物中提取或者使其转化为可以利用的资源、能源和其他原材料的固体废物量（包括当年利用往年的工业固体废物累计贮存量）。如用作农业肥料、生产建筑材料、筑路等。综合利用量由原产生固体废物的单位统计。

〖工业固体废物综合利用率〗指工业固体废物综合利用量占工业固体废物产生量的百分率。

计算公式是：工业固体废物综合利用率＝工业固体废物综合利用量÷（工业固体废物产生量+综合利用往年贮存量）×100%。

〖工业固体废物贮存量〗指以综合利用或处置为目的，将固体废物暂时贮存或堆存在专设的贮存设施或专设的集中堆存场所内的量。专设的固体废物贮存场所或贮存设施必须有防扩散、防流失、防渗漏、防止污染大气、水体的措施。

〖工业固体废物处置量〗指将固体废物焚烧或者最终置于符合环境保护规定的场所并不再回取的工业固体废物量（包括当年处置往年的工业固体废物累计贮存量）。

处置方式如: 填埋（其中危险废物应安全填埋）、焚烧、专业贮存场（库）封场处理、深层灌注、回填矿井等。

〖工业固体废物排放量〗指将所产生的固体废物排到固体废物污染防治设施、场所以外的量。

不包括矿山开采的剥离废石和掘进废石（煤矸石和呈酸性或碱性的废石除外）。

〖“三废”综合利用产品产值〗指利用“三废”[废水（液）、废气、废渣]作为主要原料生产的产品产值（现行价），已经销售或准备销售的，应计算产品产值；但留作生产上自用的，不应计算产品产值。

〖工业锅炉数〗指企业用于生产和生活的大于1 蒸吨（含1 蒸吨）的蒸汽锅炉、热水锅炉总数，不包括茶炉。

〖工业炉窑数〗指企业生产用的炉窑总数，如炼铁高炉、炼钢炉、冲天炉、烘干炉窑、锻造加热炉、水泥窑、石灰窑等。

〖生活及其他污染〗指除工业生产活动以外的所有社会、经济活动及公共设施的经营活动产生的污染。

〖本年施工项目数〗指本年内正在施工的，以治理污染、“三废”综合利用为主要目的的治理废水、废气、固体废物、噪声及其他（如电磁波、恶臭等）环境污染的治理工程的总数。不包括“三同时”项目。

〖污染治理项目本年完成投资合计〗指企业实际用于治理废水、废气、固体废物、噪声和其他环境污染（如电磁波、恶臭等）的资金总额。

污染治理项目本年完成投资合计＝治理废水资金＋治理废气资金＋治理固体废物资金＋治理噪声资金＋治理其他污染资金

〖本年完成投资及资金来源〗指在报告期内，企业实际用于环境治理工程的投资额。投资额中的资金来源，是指投资单位在本年内收到的用于污染治理项目投资的各种货币资金，包括排污费补助、政府其他补助、企业自筹。各种来源的资金均为报告期投入的资金，不包括以往历年的投资。

本年污染治理资金合计＝排污费补助+政府其他补助+企业自筹

〖排污费补助〗指从征收的排污费中提取的用于补助重点排污单位治理污染源以及环境污染综合性治理措施的资金。

〖政府其他补助〗指用于补助重点排污单位治理污染源以及环境污染综合性治理措施的除排污费补助以外的政府其他补助资金。

〖企业自筹〗指除排污费补助、政府其他补助资金以外的其他用于污染治理的资金，包括国内贷款（不包括环保贷款）、利用外资、银行贷款等其他来源资金。

〖银行贷款〗指企业向银行借入的用于污染治理项目建设投资的贷款，属于企业自筹资金。

〖本年竣工项目数〗指本年竣工投入运行的治理废水、废气、固体废物、噪声及治理其他污染的环境工程项目的总数。

〖本年竣工项目新增设计处理能力〗指本年竣工的污染治理项目设计文件规定的处理、利用“三废”的能力。其中：“治理废气”为治理燃料燃烧和生产工艺（含工业粉尘）废气的能力之和。

〖办理设立的建设项目数〗指当年经各级有关主管部门依审批权限批准开工的建设项目数。

〖环境影响评价制度执行率〗指当年执行环境影响评价制度的建设项目数占当年开工建设的建设项目总数的比率。

〖应执行“三同时”项目数〗指在环境影响评价审批中规定应有环保设施的当年投产建设项目数。

〖实际执行“三同时”项目数〗指竣工验收（或已经运行）时环保设施已全部建成的项目数。

〖实际执行“三同时”项目环保投资〗指实际执行“三同时”建设项目的环保设施实际投资额。

〖“三同时”合格率〗指“三同时”的合格项目数占实际执行“三同时”项目数的比率。

〖“三同时”合格项目数〗指建设项目环保设施竣工验收合格的项目数。

〖“三同时”执行合格率〗指“三同时”合格项目数占应执行“三同时”项目数的比率。

〖交纳排污费单位数〗指所辖区域内已交排污费的排污单位的总数。

〖排污费收入总额〗指当年按规定征收的废水、废气、固体废物、噪声四项收入总额。收入中包括超标排污费，小型、三产排污费，二氧化硫排污费，危险废物排污费等。

〖环境污染与破坏事故〗指由于违反环境保护法规的经济、社会活动与行为，以及意外因素的影响或不可抗拒的自然灾害等原因，致使环境受到污染，国家重点保护的野生动植物、自然保护区受到破坏，人体健康受到危害，社会经济和人民财产受到损失，造成不良社会影响的突发性事件。

〖特大事故〗指由于污染或破坏行为造成直接经济损失在10 万元以上，人员中毒死亡，对环境造成严重危害，使当地经济、社会的正常活动受到严重影响或捕杀、砍伐国家一类保护的野生动植物的事故。

〖重大事故〗指由于污染或破坏行为造成直接经济损失在5 万元以上，10 万元以下（不含10万元），人员发生明显中毒症状，辐射伤害或可能导致伤残后果，因污染对环境造成较大危害，使社会安定受到影响或捕杀、砍伐国家二、三类保护的野生动植物的事故。

〖较大事故〗指由于污染或破坏行为造成直接经济损失在万元以上，5 万元以下（不含5 万

元），人员发生中毒症状，因环境污染引起厂群冲突，对环境造成危害的事故。

〖一般事故〗指由于污染或破坏行为造成直接经济损失在千元以上，万元以下（不含万元）

的事故。

〖自然保护区〗指对有代表性的自然生态系统、珍稀濒危野生动植物物种的天然分布区、水源涵养区、有特殊意义的自然历史遗迹等保护对象所在的陆地、陆地水体或海域，依法划出一定面积进行特殊保护和管理的区域。以县及县以上各级人民政府正式批准建立的自然保护区为准。风景名胜区、文物保护区不计在内。

〖生态示范区〗指经省级以上环境保护行政主管部门批准，以省、地、县政府为主按批准的生态示范区建设规划实施的行政区域。包括已经过国家或省级环境保护行政主管部门验收的和正在开展试点工作的。__

生物统计学第四版知识点总结

一、田间试验的特点 1、田间试验具有严格的地区性和季节性，试验周期长。 2、田间试验普遍存在试验误差 3、研究的对象和材料是农作物，以农作物生长发育的反应作为试验指标研究其生长发育规律、各项栽培技术或栽培条件的效果。二、田间试验的基本要求结果重演性、结果可靠性、条件先进代表性、目的明确性三、单因素试验的处理数就是该因素的水平数。四、例如：甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组合数是？ 3因素3水平的处理组合数是？多因素试验的处理数是各因素不同水平数的所有组合。五、如进行一个喷施叶面肥的试验，如果设置两个叶面肥浓度，对照应为喷施等量清水。六、简单效应的计算 N 的简单效应为40-30=10 在N1水平下，P2与P1的简单效应为38-30=8；在N2水平下，P2与P1的简单效应为54-40=14。七、平均效应的计算 P的主效（8+14）/2=11； N的主效（10+16）/2=13；八、互作的计算 N与P的互作为（16-10）/2=3或（14-8）/2=3 九、田间试验误差可分为系统误差和随机误差两种。（1、系统误差影响试验的准确性，随机误差影响试验的精确性。2、准确度受系统误差影响，也受随机误差影响；精确度受随机误差影响。3、若消除系统误差，则精确度=准确度。）十、小区面积扩大，误差降低，但扩大到一定程度，误差降低就不明显了。适当的时候可以考虑增加重复次数来降低误差。小区面积一般在 6-60m2，而示范小区面积不小于330m2 。十一、通常情况下，狭长小区误差比方形小区误差小。小区的长边必须与肥力梯度方向平行，即与肥力变化最大的方向平行。一般小区长宽比为3-10：1，甚至达20：1 十二、何时采用方形小区？（1）肥水试验；（2）边际效应值得重视的试验。十三、一般小区面积较小的试验，重复次数可相应增多，可设3-6次重复；小区面积较大的试验可设2-4次重复。十四、将对照或早熟品种种在试验田四周，一般4行以上。目的？（目的是防止外来因素破坏及边际效应的影响。）十五、算术平均数的主要特征 ?1、样本各观测值与平均数之差的和为零，即离均差之和为0。 2、离均差的平方和最小。十六、【例3·1】在1、2、3、…、20这20个数字中随机抽取1个，求下列随机事件的概率。（1）A=“抽得1个数字≤4”；

卫生统计学名词解释

卫生统计学health statistics：卫生统计学是运用概率论、数理统计原理和方法，研究医学事物或现象的群体数量特征的科学。总体population：总体是根据研究目的而确定的同质个体的全体。样本sample：样本是从总体中随机抽取的一部分个体或个体值的集合。数值变量numerical variable：其变量值是定量的，表现为数值的大小，通常有度量衡单位。分类变量categorical variable：其变量值是定性的，表现为互不相容的类别或属性，没有度量衡单位。同质homogeneity：指观察单位（研究个体）间被研究指标的影响因素。概率probablity：概率是描述随机事件可能发生的量度，用P表示，其波动在0~1之间。不可能事件发生的概率为0，必然事件发生的概率为1. 抽样误差sampling error：抽样误差是指由抽样造成的样本统计量和总体参数的差别。中位数median：是指把一组观察值，按大小顺序排列，位置居中的变量值（n为奇数）或位置居中的两个变量值的均数（n为偶数）。标准差standard deviation：是描述一组计量资料离散趋势的指标，说明数据间参差不齐的程度。正态分布normal distribution：是指频数分布以均属为中心，左右两侧基本对称，靠近均属两侧频数较多，离均数越远，频数越少，形成一个中间多、两侧逐渐减少、基本对称的分布。

区间估计interval estimation：是根据选定的置信度（用概率表示）估计总体参数所在的区间。率rate：又称频率指标，表示一定时间内，实际发生某现象的观察单位数与可能发生该现象的观察单位总数之比，用以说明某现象发生的频率或强度。构成比constituent ratio：指事物内部某一组成部分的观察单位数与该事物各组成部分观察单位总数之比，常用来说明事物内部各组成部分所占的比重或分布情况。相对比relative ratio：至两个有联系的指标之比，常用百分数或倍数表示。标化法比standardization：是指在进行几个总率比较时，先采用统一的标准对几个总率的内部够成作调整，然后进行比较。这种按统一标准调整两个率内部构成使之具有可比性的方法称标准化法。生存分析surival analysis：是将事件的结局和出现这一结局所经历的实践结合起来分析的一种统计分析方法。失效事件（死亡事件或终点事件）：标志某种处理措施失败或失效的特征事件，即研究者所关心的特定事件，一般在设计阶段根据研究目的确定。生存时间survival time：指观察到的存活时间，可用小时、天、周、月、年等时间单位记录，常用符号t表示。完全数据complete date：指从观察起点到发生死亡事件所经历的时间。截尾数据：简称截尾值，又称删失值或终检值，指生存时间观察过程的截止不是由于死亡事件，而是由于其他原因引起的，称为截尾。截尾的主要原因有失访、退出和终止。

统计学名词解释

1、统计学统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学，是一门独立的、实用性很强的通用方法论科学。 2、指标和标志标志是说明总体单位属性或特征的名称。指标是说明总体综合数量特征和数量关系的数字资料。 3、总体、样本和单位统计总体是统计所要研究的对象的全体，它是由客观存在的、具有某种共同性质的许多个体所构成的整体。简称总体。构成总体的个体则称为总体单位，简称单位。样本是从总体中抽取的一部分单位。 4、统计调查统计调查是根据统计研究的目的和要求、采用科学的方法，有组织有计划的搜集统计资料的工作过程。它是取得统计数据的重要手段。 5、统计绝对数和统计相对数反映总体规模的绝对数量值，在社会经济统计中称为总量指标。统计相对数是两个有联系的指标数值之比，用以反映现象间的联系和对比关系。 6、时期指标和时点指标时期指标是反映总体在一段时期内累计总量的数字资料，是流量。时点指标是反映总体在某一时刻上具有的总量的数字资料，是存量。 7、抽样估计和假设检验抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。假设检验是先对总体的某一数据提出假设，然后抽取样本，运用样本数据来检验假设成立与否。 8、变量和变异标志的具体表现和指标的具体数值会有差别，这种差别就称为变异。数量标志和指标在统计中称为变量。 9、参数和统计量参数是反映总体特征的一些变量，包括总体平均数、总体方差、总体标准差等。统计量是反映样本特征的一些变量，包括样本平均数、样本方差、样本标准差等。 10、抽样平均误差样本平均数与总体平均数之间的平均离散程度称之为抽样平均误差，简称为抽样误差。重复抽样的抽样平均误差为总体标准差的1/n。 11、抽样极限误差抽样极限误差是指样本统计量和总体参数之间抽样误差的可能范围。我们用样本统计量变动的上限或下限与总体参数的绝对值表示抽样误差的可能范围，称为极限误差或允许误差。 12、重复抽样和不重复抽样重复抽样也称为回置抽样，是从总体中随机抽取一个样本时，每次抽取一个样本单位时都放回的抽样方式。不重复抽样也叫不回置抽样，它是在每次抽取样本单位时都不放回的抽样方式。13、点估计和区间估计点估计也叫定值估计，就是直接用抽样平均数代替总体平均数，用抽样成数代替总体成数。区间估计是在一定概率保证下，用样本统计量和抽样平均误差去推断总体参数的可能范围的估计方法。 14、统计指数广义上来说，它是表明社会经济现象的数量对比关系的相对指标。狭义上来说，它是反映不能直接相加对比的复杂总体综合变动的动态相对数。 15、综合法总指数凡是一个总量指标可以分解为两个或两个以上的因素指标时，将其中一个或一个以上的因素指

统计学名词解释

统计学名词解释第一章绪论 1.随机变量：在统计学上，把取值之间不能预料到什么值的变量。 2.总体：又称母全体、全域，指具有某种特征的一类事物的全体。 3.个体：构成总体的每个基本单元称为个体。 4.样本：从总体中抽取的一部分个体，称为总体的一个样本。 5.次数：指某一事件在某一类别中出现的数目，又称为频数。 6.频率：又称相对次数，即某一事件发生的次数被总的事件数目除，亦即某一数据出现的次数被这一组数据总个数去除。 7.概率：某一事物或某一情在某一总体中出现的比率。 8.观测值：一旦确定了某个值。就称这个值为某一变量的观测值。 9.参数：又称为总体参数，是描述一个总体情况的统计指标。 10.统计量：样本的那些特征值叫做统计量，又称特征值。第二章统计图表 1.统计表：是由纵横交叉的线条绘制，并将数据按照一定的要求整理、归类、排列、填写在内的一种表格形式。一般由表号、名称、标目、数字、表注组成。 2.统计图：一般采用直角坐标系，通常横轴表示事物的组别或自变量x，称为分类轴。纵轴表示事物出现的次数或因变量，称为数值轴。一般由图号及图题、图目、图尺、图形、图例、图组成。 3.简单次数分布表：依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表，适合数据个数和分布范围比较小的时候用。 4.分组次数分布表：数据量很大时，应该把所有的数据先划分在若干区间，然后将数据按其数值大小划归到相应区域的组别内，分别统计各个组别中包括的数据个数，再用列表的形式呈现出来，适合数据个数和分布范围比较大的时候用。 5.分组次数分布表的编制步骤：（1）求全距（2）定组距和组数（3）列出分组组距（4）登记次数（5）计算次数 6.分组次数分布的意义：（1）优点：A．可将杂乱无章数据排列成序，以发现各数据的出现次数及分布状况。B．可显示一组数据的集中情况和差异情况等。（2）缺点：原始数据不见了，从而依据这样的统计表算出的平均值会与用原始数据算出的值有出入，出现误差，即归组效应。 7.相对次数分布表：用频数比率或百分数来表示次数 8.累加次数分布表：把各组的次数由下而上，或由上而下加在一起。最后一组的累加次数等于总次数。 9.双列次数分布表：对有联系的两列变量用同一个表表示其次数分布。

生物统计学 (2)

生物统计学名词解释： 1.生物统计学：是数理统计在生物学研究中的应用，它是应用数理统计的原理，运用统计方法来认识、分析、推断和解释生命过程中的各种现象和试验调查资料的科学。 2.总体：具有相同性质或属性的个体所组成的集合称为总体，它是指研究对象的全体； 3.个体：组成总体的基本单元称为个体； 4.样本：从总体中抽出若干个体所构成的集合称为样本； 5.样本容量：样本中所包含的个体数目称为样本容量。 6.集中性：资料中的观测值从某一数值为中心而分布的性质。 7.离散性：是变量有差离中心分散变异的性质。 8.变量（变数）：指相同性质的事物间表现差异性或差异特征的数据。 9.常数：表示能代表事物特征和性质的数值，通常由变量计算而来，在一定过程中是不变的。 10.参数：描述总体特征的数量称为参数，也称参量。常用希腊字母表示参数，例如用 μ表示总体平均数，用σ表示总体标准差； 11.统计数：描述样本特征的数量称为统计数，也称统计量。常用拉丁字母表示统计数，例如用x表示样本平均数，用S表示样本标准差。 12.效应：通过施加试验处理，引起试验差异的作用称为效应。效应是一个相对量，而非绝对量，表现为施加处理前后的差异。效应有正效应与负效应之分。 13.互作（连应）：是指两个或两个以上处理因素间相互作用产生的效应。互作也有正效应（协同作用）与负效应（拮抗作用）之分。 14.准确性：也叫准确度，指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。 15.精确性：也叫精确度，指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。 16.随机误差（抽样误差）：这是由于试验中无法控制的内在和外在的偶然因素所造成。随机误差越小，试验精确性越高。 17.系统误差（片面误差）：这是由于试验条件控制不一致、测量仪器不准、试剂配制不当、试验人员粗心大意使称量、观测、记载、抄录、计算中出现错误等人为因素而引起的。系统误差影响试验的准确性。只要以认真负责的态度和细心的工作作风是完全可以避免的。 18.试验误差：在试验过程中，由于试验条件及人为的一些因素而造成的试验结果与真实值之间的偏差，来源于试验材料固有的差异和外界因素（管理措施、试验条件等）。 19.数量性状：是指能够以计数和测量或度量的方式表示其特征的性状。 20.质量性状：是指能观察到而不能直接测量的性状 21.次数资料：由质量性状量化得来的资料叫做次数资料。 22.试验：是对已有的或没有的事物加以处理的方法。 23.大数定律：是概率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称。主要内容：样本容量越大，样本统计数与总体参数之差越小。 24.泊松分布：是一种可以用来描述和分析随机地发生在单位空间或时间里的稀有事件的概率分布，也是一种离散型随机变量的分布。 25.假设检验：又称显著性检验,就是根据总体的理论分布和小概率原理，对未知或不完全知道的总体提出两种彼此对立的假设，然后由样本的实际原理，经过一定的计算，

医学统计学名词解释复习资料

1. 总体(population)：根据研究目的所确定的同质观察单位的全体。只包括(确定的时间和空间范围内)有限个观察单位的总体，称为有限总体(finite population)。假想的，无时间和空间概念的，称为无限总体(infinite population)。 2. (总体)参数(parameter)：总体的统计指标或特征值。总体参数是事物本身固有的、不变的。 3. 样本(sample)：从总体中随机抽取的部分个体。 4. 样本含量(sample size)：样本中所包含的个体数。 5. 变量(variable)：观察对象个体的特征或测量的结果。由于个体的特征或指标存在个体差异，观察结果在测量前不能准确预测，故称为随机变量(random variable)，简称变量(variable)。变量的取值称为变量值或观察值(observation)。根据变量的取值特性，分为数值变量和分类变量。 6. 数值变量(Numerical variable)：又称为计量资料、定量资料，指构成其的变量值是定量的，其表现为数值大小，有单位。对每个观察单位用定量的方法测定某项指标的数值，组成的资料。 7. 计数资料：将全体观测单位按照某种性质或特征分组，然后再分别清点各组观察单位的个数。 8. 抽样(sampling)：从总体中抽取部分观察单位的过程称为抽样。 9. 抽样误差(sampling error)：由于抽样造成的统计量与参数之间的差别，特点是不能避免的，可用标准误描述其大小。 10. 误差(error)：统计上所说的误差泛指测量值与真值之差，样本指标与总体指标之差。主要有以下二种：系统误差和随机误差。 11. 可信区间(confidence interval, CI)：按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围，这个范围称作可信度1-α的可信区间，又称置信区间。 12. 总体均数的可信区间：按一定的概率大小估计总体均数所在的范围(CI)。常用的可信度为95％和99％，故常用95％和99％的可信区间。 13. 变异(variation)：同质事物间的差别。由于观察单位通常即为观察个体，故变异亦称为个体变异(individual variation)。 16. 平均数(average)：也叫平均值，是一组(群)数据典型或有代表性的值。这个值趋向于落在根据数据大小排列的数据的中心，包括算术平均数(arithmetic mean)、几何平均数(geometric mean)、中位数(median)等。 17. 中位数(median)：将一组观察值按升序或降序排列，位次居中的数，常用M 表示。适用于偏态分布资料或不规则分布资料和开口资料。所谓“开口”资料，是指数据的一端或两端有不确定值。当n 为奇数时，M=X (n+1)/2；当n 为偶数时，M=[X n/2+ X n/2+1]/2。 18. 百分位数(percentile)：是一种位置指标，以P x 表示，一个百分位数Px 将全部观察值分为两个部分，理论上有x%的观察值小于Px 小，有(1-x%)的观察值大于Px 。 19. 变异系数(coefficient of variance, CV)：亦称离散系数(coefficient of dispersion)，为标准差与均数之比，常用百分数表示。100%X s/CV ?=, 变异系数没有度量衡单位，常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 20. 频率(relative frequency)：在n 次随机试验中，事件A 发生了m 次，则比值 22. 概率(probability)：在重复试验中，事件A 的频率，随着试验次数的不断增加将愈来愈接近一个常数p ，这个常数p 就称为事件A 出现的概率(probability)，记作P(A)或P 。描述随机事件发生的可能性大小的数值，常用P 来表示。 23. 统计量(statistic)：由样本所算出的统计指标或特征值。 24. 相关系数(correlation coefficient)：用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标，称为相关系数，又称为积差相关系数(coefficient of product-moment correlation)，总体相关系数用希腊字母ρ表示，而样本相关系数用r 表示，取值范围均为[-1, 1]。 25. 回归系数(regression coefficient)：直线回归方程Y ?= a+b X 的系数b 称为回归系数，也就是回归直线的斜率(slope)，表示X 每增加一个单位，Y 平均改变 b 个单位。 26. 参考值范围(reference range)：也称为正常值范围(normal range)，医学上常把绝大多数正常人的某指标值范围称为该指标的正常值范围。绝大多数：可以是90%、95%、99%等等，最常用的是95%。正常人：不是指健康人，而是指排除了影响所研究指标的疾病和有关因素的同质人群。又称参考值范围，是指特定健康人群的解剖、生理、生化等各种数据的波动范围。习惯上是确定包括95%的人的界值。 28. 统计推断(statistic inference)：从总体中随机抽取一定含量的样本进行研究，目的是通过样本的信息判断总体的特征，这一过程称为统计推断。 29. 标准误(standard error, SE)：在统计理论上将样本统计量的标准差称为标准误，用来衡量抽样误差的大小。据此，样本均数的标准差X σ称为标准误。 30. 参数估计(parameter estimation)：由样本信息估计总体参数。它包括两种：点估计和区间估计。点估计：直接用样本统计量作为对应的总体参数的估计值。区间估计：按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围，这个范围称作可信度1-α的可信区间(confidence interval, CI )，又称置信区间。这种估计方法称为区间估计。 33. 95%可信区间含义：如果重复若干次样本含量相同的抽样，每个样本均按同一方法构建95%可信区间，则在这些可信区间中，理论上有95个包含了总体参数，还有5个未估计到总体均数。 34.Ⅰ类错误(type Ⅰerror)：统计学上规定，拒绝了实际上成立的H 0，这类“弃真”的错误称为Ⅰ型错误或第一类错误，Ⅰ型错误的概率用α表示。 35.Ⅱ类错误(type Ⅱerror)：统计学上规定，不拒绝实际上不成立的H 0，这类“存伪”的错误称为Ⅱ型错误或第二类错误，Ⅱ型错误的概率用β表示。 36. 检验效能(power of a test)：又称把握度，即两总体确有差别，按α水准能发现它们有差别的能力。 37. 参数检验：总体分布已知，对其中一些未知参数进行估计或检验。这类统计推断的方法叫参数统计或参数检验。 38. 参数检验：假定比较数据服从某分布,通过参数的估计量(x , s)对比较总体的参数(μ)作检验，统计上称为参数法检验(parametric test)。如t 、u 检验、方差分析。 39. 率(rate)：又称频率指标，用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。其计算公式为： 40. 构成比(proportion)：又称构成指标，它说明一种事物内部各组成部分所占的比重或分布，常以百分数表示。 41. 比(ratio)：又称相对比，是A 、B 两个有关指标之比，说明A 为B 的若干倍或百分之几，它是对比的最简单形式。其计算公式为：比=A/B 。统计学（Statistics ）：运用概率论、数理统计的原理与方法，研究数据的搜集；分析；解释；表达的科学。总体（population ）：大同小异的研究对象全体。更确切的说，总体是指根据研究目的确定的、同质的全部研究单位的观测值。样本（sample ）：来自总体的部分个体，更确切的说，应该是部分个体的观察值。样本应该具有代表性，能反映总体的特征。利用样本信息可以对总体特征进行推断。

生物统计学重要知识点

生物统计学重要知识点（说明：下列知识点为考试内容，没涉及的不需要复习。注意加粗的部分为重中之重，一定要弄懂。大家要进行有条理性的复习，望大家考出好成绩！）第一章概论（容易出填空题和名词解释） 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差（随机误差和系统误差）与错误以及产生的原因 5、会区分准确度和精确度第二章试验资料的整理与特征数的计算（容易出填空和名词解释） 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图，会计算全距、组数、组距、组限和组中值 3、会求平均数（算数、加权和几何）、中位数、众数，算术平均数的重要特性 4、会求极差、方差、标准差和变异系数，理解标准差的性质第三章概率与概率分布（选择、填空和计算） 1、理解事件、频率及概率，事件的相互关系，加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征，会计算概率值 4、理解分位数的概念，弄清什么时候用单尾，什么时候用双尾 5、样本平均数差数的分布第四章统计推断（计算） 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误，会根据小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验（例4.5）成组数据平均数比较的t检验（例4.6和4.7） 4、一个样本频率的假设检验（例4.11），知道连续性矫正 5、参数的区间估计（置信区间）和点估计

卫生统计学名词解释

1.总体：总体（population）是根据研究目的确定的同质的观察单位的全体，更确切的说，是同质的所有观察单位某种观察值（变量值）的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体，反之为无限总体。样本：从总体中随机抽取部分观察单位，其测量结果的集合称为样本（sample）。样本应具有代表性。所谓有代表性的样本，是指用随机抽样方法获得的样本。 2.随机抽样：随机抽样（random sampling）是指按照随机化的原则（总体中每一个观察单位都有同等的机会被选入到样本中），从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 3.变异：在自然状态下，个体间测量结果的差异称为变异（variation）。变异是生物医学研究领域普遍存在的现象。严格的说，在自然状态下，任何两个患者或研究群体间都存在差异，其表现为各种生理测量值的参差不齐。 4.计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data）。计量资料亦称定量资料、测量资料。.其变量值是定量的，表现为数值大小，一般有度量衡单位。如某一患者的身高（cm）、体重(kg)、红细胞计数(1012/L)、脉搏（次/分）、血压（KPa）等计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。如调查某地某时的男、女性人口数；治疗一批患者，其治疗效果为有效、无效的人数；调查一批少数民族居民的A、B、AB、O 四种血型的人数等。等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡，各种结果既是分类结果，又有顺序和等级差别，但这种差别却不能准确测量；一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。等级资料与计数资料不同：属性分组有程度差别，各组按大小顺序排列。等级资料与计量资料不同：每个观察单位未确切定量，故亦称为半计量资料。 5．概率：概率(probability)又称几率，是度量某一随机事件A发生可能性大小的一个数值，记为P（A），P（A）越大，说明A事件发生的可能性越大。0﹤P（A）﹤1。频率：在相同的条件下，独立重复做n 次试验，事件A 出现了m 次，则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P（A）= m/n。 2.概率是描述随机事件发生可能性大小的数值，常用P表示。随机事件概率的大小在0与1之间，P越接近1，表示某事件发生的可能性越大；P越接近0，表示某事件发生的可能性越小。习惯上将P≤0.05的事件，称为小概率事件，表示在一次实验或观察中该事件发生的可能性很小，可视为不发生。 6. 随机误差：随机误差（random error）又称偶然误差，是指排除了系统误差后尚存的差。它受多种因素的影响，使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。抽样误差（sampling error ）是指样本统计量与总体参数的差别。在总体确定的情况下，总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。 7．系统误差：系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因，使观察值不是分散在真值的两侧，而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 8．随机变量：随机变量（random variable）是指取指不能事先确定的观察结果。随机量的具体内容虽然是各式各样的，但共同的特点是不能用一个常数来表示，而且，理论上讲，每个变量的取值服从特定的概率分布。 9．参数：参数（paramater）是指总体的统计指标，如总体均数、总体率等。总体参数是固定的常数。多数情况下，总体参数是不易知道的，但可通过随机抽样抽取有代表性的样本，用算得的样本统计量估计未知的总体参数。 10．统计量：统计量（statistic）是指样本的统计指标，如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。 11.频数表（frequency table）用来表示一批数据各观察值或在不同取值区间的出现的频繁程度（频数）。对于离散数据，每一个观察值即对应一个频数，如某医院某年度一日内死亡0，1，2…个病人的天数。对于散布区间很大的离散数据和连续型数据，数据散布区间由若干组段组成，每个组段对应一个频数。 12.算术均数（arithmetic mean）描述一组数据在数量上的平均水平。总体均数用μ表示，样本均数用X 表示。 13.几何均数（geometric mean）用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。 14.中位数（median）Md将一组观察值由小到大排列，n 为奇数时取位次居中的变量值；为偶数时，取位次居中的两个变量的平均值。反映一批观察值在位次上的平均水平。 15.极差（range）亦称全距，即最大值与最小值之差，用于资料的粗略分析，其计算简便但稳定性较差。 16.百分位数（percentile）是将n 个观察值从小到大依次排列，再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。

统计学名词解释

一、名词解释总体:指在同一组条件下所有成员的某种状态变量的集合;或者说是某一变数的全部可能值的集合;或性质相同的个体组成的整个集团. 样本:从总体中取出来用作分析、研究的个体称样本。随机样本：总体中的每个总体单位都有同等的机会被抽取为样本单位,由这种方法抽得的样本叫随机样本.（用随机抽样的方法,从总体中抽出一个部分；等概率抽取的样本。）随机抽样：保证总体中的每一个体在每一次抽样中都有同等的机会被取为样本。复置抽样:保证总体中的每个个体在每次抽样中都有同等的概率被取为样本。样本容量：样本中包含的单位数称为样本容量。（样本中变量的个数.）观察值：每一个体的某一性状测定值叫做观察值。变数：若干有变异的观察值叫随机变数，简称变数。连续性变数：指在任意两个变量之间都有可能存在只有微量差异的第三个变量存在，这样一类变数称为连续性变数. 间断性变数：只能取整数的一类变数。参数：由总体获得的代表总体的特征数.（描述总体的特征数,如μσ .)统计数：由样本获得的代表样本的特征数。（描述样本的特征数。）数量资料(数量性状资料）：以测量或称重的方式获取的试验资料称为数量资料。计量资料、质量性状资料次数资料：凡是试验结果以次数表示的资料称为次数资料。算术平均数、众数几何平均数：变量对数的算术平均数的反对数, (lg) lg Y G n = ∑ 调和平均数:变量倒数的算术平均数的反倒数， 1 () n H Y = ∑ 中位数:将变量顺序排列,处在中间的变量称中位数，计作M d。极差:一组资料中最大值与最小值的差值为极差. 方差：变数变异程度的度量,对于总体 ()2 2i Y N μ σ - = ∑ ,对于样本 2 2 () 1 Y y s n - = - ∑ 。 (描述变量平均变异程度的统计量.定义为 2 1 2 () 1 n j j Y y s n = - = - ∑ 。）ＥMS:期望均方，是对均方MＳ的期望值。标准差:变数变异程度的度量,总体标准差： () N Y ∑- = 2 μ σ ，样本标准差: () 1 2 - - = ∑ n y Y s .（变数的平均变异量.) 标准误：统计数变异度的度量，12 y y y s s - == 。(统计数的标准差。）

生物统计学名词解释大全

1.样本: 样本从总体中抽出的若干个体所构成的集合称为样本。 2.总体: 总体指具有相同性质的个体所组成的集合称为总体。 3.连续变量：表示在不变量范围内可抽出某一范围的所有值。 4.非连续变量:也称为离散型变量，表示在变量数列中，仅能取得固定数值，并且通常是整数。准确性:指在调查或实验中某一试验指标或形状的观测值与真值接近的程度。精确性：指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小。资料：指在一定条件下，在生物学实验和调查中，能够获得大量原始数据，对某种具体事务或现象观察的结果。数量性状资料：指一般是由计数和测量或度量得到的。质量性状资料：是指对某种现象只能观察而不能测量的资料，也称属性资料。计数资料;指由计数得到的数据。计量资料：有测量或度量得到的数据。普查：指对研究对象的每一个个体都进行测量或度量的一种全面调查。抽样调查：是一种非全面调查，它是根据一定的原则对研究对象抽取一部分个体进行测量或度量，把得到抽样调查的数据资料作为样本进行统计处理，然后利用样本特征数对总体进行推断。全距（极差）：是指样本数据资料中最大观测值与最小观测值的差值。组中值：是指两个组限下线和上限的中间值。算数平均数：是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。中位数：是指将试验或调查资料中所有观测值以大小顺序排列，居中位置的观测值。众数：资料中出现次数最多的那个观测值或次数最多一组的中点值。几何平均数：指资料中有几个观测值，其乘积开几次方所得的数值。方差：指用样本容量n 来除离均差平方和，得到平均的平方和。标准差：指方差的平方根和。变异系数:指将样本标准差除以样本平均数得出的百分比。概率:指某事件 A 在n 次重复试验中，发生了几次，当试验次数n 不断增大时，事件 A 发生的频率W（A）概率就越来越接近某一确定值P，于是则定P 为事件 A 发生的概率. 和事件：指事件 A 和事件 B 至少有一件发生而构成的新事件称为事件 A 和事件 B 的事件。积事件:指事件 A 和事件 B 同时发生而构成的新事件，称为事件 A 和事件 B 的积事件。互斥事件：指事件 A 和事件 B 不能同时发生，称为事件 A 和事件 B 互斥。对立事件：指事件 A 和事件 B 必有一个事件发生，但两者不能同时发生。独立事件：指事件 A 的发生与事件 B 的发生毫无关系。完全事件系：指如果多个事件A1、A2、、、、、、An 两两相斥，且每次试验结果必然发生其一，则称事件A1、完全事件系A2、、、、、、An 为一个完全事件系。概率加法定理：指互斥事件 A 和 B 的和事件的概率等于事件 A 和事件 B 的概率之和，P(A+B)=P(A)+P(B)。概率乘法定理：指事件 A 和事件 B 为独立事件，则事件 A 与 B 同时发生的概率等于事件 A 和事件 B 各自概率乘法定理的乘积，即:P(A*B)=P(A)*P(B)。伯努利大数定律：设M 是n 次独立试验中事件 A 出现的次数，而不是事件 A 在每次试验中出现的概率，则对于任意小的正数ε ，有如下关系:limp{m/n-p< ε }=1

实用卫生统计学复习题与答案2

《卫生统计学》一、名词解释 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.抽样误差 7.频数表 8.算术均数 9.中位数 10.极差 11.方差 12.标准差 13.变异系数 14.正态分布 15.标准正态分布 16.统计推断 17.抽样误差 18.标准误 19.可信区间 20.参数估计 21.假设检验中P的含义 22.I型和II型错误 23.检验效能 24.检验水准 25.方差分析 26.随机区组设计 27.相对数

28.标准化法 29.二项分布 30.Yates校正 31.非参数统计 32.直线回归 33.直线相关 34.相关系数 35.回归系数 36.人口总数 37.老年人口系数 38.围产儿死亡率 39.新生儿死亡率 40.婴儿死亡率 41.孕产妇死亡率 42.死因顺位 43.人口金字塔 44.灵敏度 45.特异度 46.误诊率 47.漏诊率 48.阳性似然比 49.阴性似然比 50.Youden指数 51.ROC曲线 52.统计图二、单项选择题 1．观察单位为研究中的( )。 A．样本B．全部对象C．影响因素D．个体2．总体是由（）。

A．个体组成B．研究对象组成 C．同质个体组成D．研究指标组成 3．抽样的目的是（）。 A．研究样本统计量B．由样本统计量推断总体参数C．研究典型案例研究误差D．研究总体统计量 4．参数是指（）。 A．参与个体数B．总体的统计指标 C．样本的统计指标D．样本的总和 5．关于随机抽样，下列那一项说法是正确的（）。 A．抽样时应使得总体中的每一个个体都有同等的机会被抽取B．研究者在抽样时应精心挑选个体，以使样本更能代表总体C．随机抽样即随意抽取个体 D．为确保样本具有更好的代表性，样本量应越大越好 6．各观察值均加（或减）同一数后（）。 A．均数不变，标准差改变B．均数改变，标准差不变C．两者均不变D．两者均改变 7．比较身高和体重两组数据变异度大小宜采用（）。 A．变异系数B．方差 C．极差D．标准差 8．以下指标中（）可用来描述计量资料的离散程度。 A．算术均数B．几何均数 C．中位数D．标准差 9．血清学滴度资料最常用来表示其平均水平的指标是（）。A．算术平均数B．中位数 C．几何均数D．平均数 10．两样本均数的比较，可用（）。 A．方差分析B．t检验 C．两者均可D．方差齐性检验 11．配伍组设计的方差分析中，ν配伍等于（）。 A．ν总-ν误差B．ν总-ν处理

统计名词解释

1.参数(parameter)：总体的统计指标或特征值。总体参数是事物本身固有的、不变的。统计量(statistic)：由样本所算出的统计指标或特征值。 2.正态分布：以均数u为中心左右完全对称的分布，记为X～N(u, ) 标准正态分布：以均数为0，标准差为1的正态分布，记为u～N(0,1) 3.平均数：也叫平均值，是一组(群)数据典型或有代表性的值。这个值趋向于落在根据数据大小排列的数据的中心，包括算术平均数、几何平均数、中位数等。标准差S：将方差开方，得到标准差，它是最常用的变异指标，标准差越大，说明数据的变异程度越大。标准误S X：在统计理论上将样本统计量的标准差称为标准误，用来衡量均数抽样误差的大小。据此，样本均数的标准差称为标准误。 S p(样本率的标准差)：率的标准误，用来描述样本率的抽样误差。 4.参数检验：总体分布已知，对其中一些未知参数进行估计或检验。这类统计推断的方法叫参数统计或参数检验。参数检验：假定比较数据服从某分布,通过参数的估计量( , s)对比较总体的参数(μ)作检验，统计上称为参数法检验(parametric test)。如t、u检验、方差分析。非参数检验：是指在统计检验中不需要假定总体分布形式和用参数估计量，直接对比较数据的分布进行统计检验的方法，称为非参数检验(nonparametric test). 5.率(rate)：强度相对数，用以说明某现象发生的频率或强度。是某事物或现象发生的实际数与可能数的比例关系。构成比(proportion)：结构相对数，它说明一种事物内部各组成部分所占的比重或分布，常以百分数表示，其计算公式为：比(ratio):又称相对比，是A、B两个有关指标之比，说明A为B的若干倍或百分之几，它是对比的最简单形式。其计算公式为：比=A/B。 6.相关系数：用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标，称为相关系数，又称为积差相关系数。复相关系数：是决定系数的平方根，相对系数的绝对值，用来度量应变量与多个自变量间的线性相关程度。决定系数：是反映回归贡献相对程度的指标，是回归平方和与总体平方和之比。无单位，取值在0到1之间。回归系数：直线回归方程= a+bX的系数b称为回归系数，也就是回归直线的斜率(slope)，表示X 每增加一个单位，Y平均改变 b 个单位。偏回归系数：是多元线性回归方程中的各个自变量的回归系数。标准偏回归系数：将原始数据实施标准化变换后的直线回归方程中的偏回归系数，反映各变量对因变量的贡献大小。零相关：指两个变量间没有直线相关的关系。 7. 统计描述：指选用恰当的统计指标，选用合适的统计表和统计图，对资料的数量特征及其分布规律进行测定和描述。统计推断：从总体中随机抽取一定含量的样本进行研究，目的是通过样本的信息判断总体的特征，这一过程称为统计推断。 8.X检验：以卡方分布为理论依据，用途颇广的假设检验方法。秩和检验：推断一个总体表达分布位置的中位数M和已知M0，两个或多个总体的分布是否有差别。 9.生存率：是指接受某种治疗的病人或患某病的病人中，经若干年的随访后，尚存活的病人数所占的比例。

统计学名词解释汇总

统计学名词解释汇总 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

1什么是统计学？统计方法可分为哪两大类？统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。方法有描述统计和推断统计两类2统计数据可分为哪几种类型？不同类型数据各有什么特点？按采取计量尺度，分类、顺序、数值型数据；按统计数据收集方法，观测、实验数据；按被描述对象与时间关系，截面、时间序列数据统计数据；按所采用的计量尺度不同分；（定性数据）分类数据：只能归于某一类别的非数字型数据，它是对事物进行分类的结果，数据表现为类别，用文字来表述；（定性数据）顺序数据：只能归于某一有序类别的非数字型数据。它也是有类别的，但这些类别是有序的。（定量数据）数值型数据：按数字尺度测量的观察值，其结果表现为具体的数值。统计数据；按统计数据都收集方法分；观测数据：是通过调查或观测而收集到的数据，这类数据是在没有对事物人为控制的条件下得到的。实验数据：在实验中控制实验对象而收集到的数据。统计数据；按被描述的现象与实践的关系分；

截面数据：在相同或相似的时间点收集到的数据，也叫静态数据。时间序列数据：按时间顺序收集到的，用于描述现象随时间变化的情况，也叫动态数据。 3举例说明总体、样本、参数、统计量、变量这几个概念：对一千灯泡进行寿命测试，那么这千个灯泡就是总体，从中抽取一百个进行检测，这一百个灯泡的集合就是样本，这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数，这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量，变量就是说明现象某种特征的概念，比如说灯泡的寿命。 4什么是有限总体和无限总体？举例说明有限总体指总体的范围能够明确确定，而且元素的数目是有限可数的，如若干个企业构成的总体，一批待检查的灯泡。无限总体指总体包括的元素是无限不可数的，如科学实验中每个试验数据可看做是一个总体的一个元素，而试验可无限进行下去，因此由试验数据构成的总体是无限总体 5变量可分为哪几类？变量可以分为分类变量，顺序变量，数值型变量。变量也可以分为随机变量和非随机变量。经验变量和理论变量。 6举例说明离散型变量和连续型变量

生物统计学最新复习题

《生物统计学》复习题一、填空题（每空1分，共10分） 1．变量之间的相关关系主要有两大类：（），（） 2．在统计学中，常见平均数主要有（）、（）、（） 3．样本标准差的计算公式（） 4．小概率事件原理是指（） 5．在标准正态分布中，P（－1≤u≤1）=（）（已知随机变量1的临界值为0．1587） 6．在分析变量之间的关系时，一个变量X确定，Y是随着X变化而变化，两变量呈因果关系，则X称为（），Y称为（）二、单项选择题（每小题1分，共20分） 1、下列数值属于参数的是： D A A、总体平均数 B、自变量 C、依变量 D、样本平均数 2、下面一组数据中属于计量资料的是 D A、产品合格数 B、抽样的样品数 C、病人的治愈数 D、产品的合格率 3、在一组数据中，如果一个变数10的离均差是2，那么该组数据的平均数是 B C A、12 B、10 C、8 D、2 4、变异系数是衡量样本资料 A 程度的一个统计量。 A、变异 B、同一 C、集中 D、分布 5、方差分析适合于， A 数据资料的均数假设检验。 A、两组以上 B、两组 C、一组 D、任何 6、在t 检验时，如果t = t0、01，此差异是：B A、显著水平 B、极显著水平 C、无显著差异 D、没法判断 7、生物统计中t检验常用来检验 A A、两均数差异比较 B、两个数差异比较 C、两总体差异比较 D、多组数据差异比较 8、平均数是反映数据资料 B 性的代表值。 A、变异性 B、集中性 C、差异性 D、独立性 9、在假设检验中，是以 A 为前提。 A、肯定假设 B、备择假设 C、原假设 D、有效假设 10、抽取样本的基本首要原则是 B A、统一性原则 B、随机性原则 C、完全性原则 D、重复性原则 11、统计学研究的事件属于 D 事件。 A、不可能事件 B、必然事件 C、小概率事件 D、随机事件 12、下列属于大样本的是 A A、40 B、30 C、20 D、10 13、一组数据有9个样本，其样本标准差是0.96，该组数据的标本标准误（差）是 D