《卫生统计学》考试重点复习资料
《卫生统计学》考试重点复习资料

《卫生统计学》复习资料08生物技术曾洋and林阳第一章绪论名词解释统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。
其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。
总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。
总体可分为有限总体与无限总体。
总体中得所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。
样本应具有代表性。
所谓有代表性得样本,就是指用随机抽样方法获得得样本。
抽样:从研究总体中抽取少量有代表性得个体,称为抽样。
概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。
0﹤P(A)﹤1。
频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。
当试验重复很多次时P(A)= m/n。
变量:表现出个体变异性得任何特征或属性。
随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。
随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。
系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。
系统误差可以通过实验设计与完善技术措施来消除或使之减少。
随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。
《卫生统计学》考试重点复习资料

卫生统计学Statistics第一章绪论统计学:是一门通过收集、分析、解释、表达数据,目的是求得可靠的结果。
总体:根据研究目的确定的同质(大同小异)的观察单位的全体。
分为目标总体和研究总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
抽样:从研究总体中抽取少量有代表性的个体。
变量:表现出个体变异性的任何特征或属性。
分定型变量和定量变量。
定型变量:1)分类变量或名义变量:最简单的是二分类变量。
0-1变量也常称为假变量或哑变量。
2)有序变量或等级变量。
定量变量:分离散型变量和连续型变量。
变量只能由高级向低级转化:定量→有序→分类→二值。
常见的三种资料类型1)计量或测量或数值资料,如身高、体重等。
2)计数资料或分类资料,如性别、血型等。
3)等级资料,如尿蛋白含量-、+、++、+++、…第一章定量变量的统计描述此章节x即为样本均数(X拔)1.离散型定量变量的取值是不连续的。
累计频数为该组及前面各组的频数之和。
累计频率表示各组累计频数在总例数中所占的比例。
可用直条图表达。
2.编制频数表的步骤与要点步骤:1确定极差2确定组数3确定各组段的上下限4列表要点(注意事项)1)制表是为了揭示数据的分布特征,故分组不宜过粗或过细。
2)为计算方便,组段下限一般取较整齐的数值3)第一组段应包含最小值,最后一个组段应包含最大值。
3.频率分布表(图)的用途1)描述变量的分布类型2)揭示变量的分布特征3)便于发现某些离群值或极端值4)便于进一步计算统计指标和统计分析。
4.描述平均水平的统计指标算术均数(mean):描述一组数据在数量上的平均水平。
总体均数用μ表示,样本均数用X表示。
适用于服从对称分布变量的平均水平描述,这时均数位于分布的中心,能反应全部观察值的平均水平。
分:直接法和频率表法。
即所有变量值加和除以总数n或所有频数f k乘以组中值X0k后求和再除以总数n。
卫生统计学考试复习题库大全附答案

卫生统计学考试复习题库大全附答案1 、统计推断的两个方面为A 、点估计与区间估计B 、参数估计与假设检验 ( 正确答案 )C 、统计图表与假设检验D 、统计图表与参数估计E 、统计预测与统计控制2. 总体的定义是指根据研究目的确定的总体是根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种观察值变量值的集合。
A 、所有样本的全体B 、观察单位的全体C 、根据研究目的确定的同质观察单位的全体 ( 正确答案 )D 、观察单位某种变量值的集合E 、样本中同质观察单位某种变量值的集合3. 计量资料的正确定义是指计量资料又称数值变量,其变量值是定量的,表现为数值大小,一般有度量衡单位。
A 、每个观察单位的观测值都是绝对数的资料B 、每个观察单位的观测值都是相对数的资料C 、每个观察单位的观测值都是平均数的资料D 、每个观察单位都有 1 个数值,无论该观测值是绝对数、相对数还是平均数的资料 ( 正确答案 )E 、将每个观察单位按某种属性或类别分组,然后清点各组的观测单位数得到的资料4. 下列关于总体和样本说法正确的是总体:根据研究的目的所划定范围内的同质的个体构成的全体,所有同质观察单位某种观察值(即变量值)的集合。
样本:总体中随机抽取的一部分观察单位的观测值的集合。
A 、总体的指标称为参数,用拉丁字母表示B 、样本的指标称为统计量,用希腊字母表示C 、总体中随机抽取的部分观察单位组成了样本D 、总体中随机抽取的部分观察单位的变量值组成了样本 ( 正确答案 )E 、总体中随意抽取的部分观察单位的变量值组成了样本5. 欲测量某地 2002 年正常成年男子的血糖值,其总体为A 、该地所有成年男子B 、该地所有成年男子血糖值C 、 2002 年该地所有正常成年男子血糖值 ( 正确答案 )D 、 2002 年所有成年男子E 、 2002 年所有成年男子的血糖值答案解析:欲测量某地 2002 年正常成年男子的血糖值,其总体为 2002 年该地所有正常成年男子的血糖值,所以答案选 C 。
职称考试卫生统计学重点

卫生统计学要点笔记第一章统计学的基本内容第一节医学统计学的含义1、医学统计学定义医学统计学(statistics)作为一门学科的定义是:关于医学数据收集、表达和分析的普遍原理和方法。
2、医学统计学研究方法:通过大量重复观察,发现不确定的医学现象背后隐藏的统计学规律。
3、医学统计推论的基础:在一定条件下,不确定的医学现象发生可能性,即概率。
第二节、统计学的几个重要概念一.资料的类型1、计量资料(数值变量):对每一观察对象用定量的方法,测定某项指标所得的资料。
一般有度量衡单位,每个对象之间有量的区别。
2、计数资料(分类变量):对观察对象按属性或类型分组计数所得的资料。
每个对象之间没有量的差异,只有质的不同。
3、等级资料(有序分类变量):对观察对象按属性或类型分组计数,但各属性或类型之间又有程度的差别。
注意:不同类型的资料采用的统计分析方法不同;三类资料类型可以相互转化。
二、总体根据研究目的所确定的同质的所有观察对象某项变量值的集合1、有限总体:只包括在确定时间、空间范围内的有限个观察对象。
2、无限总体:没有时间、空间范围的限制,观察对象的数量是不确定的,无限的三、样本从总体中随机抽取部分观察对象,其某项变量值的集合。
从总体中随机抽取样本的目的是: 用样本信息来推断总体特征。
四、随机事件可以发生也可以不发生,可以这样发生也可以那样发生的事件。
亦称偶然事件。
五、概率描述随机事件发生可能性大小的数值,记作P,其取值范围0≤P≤1,一般用小数表示。
P=0,事件不可能发生必然事件(随机事件的特例);P=1,事件必然发生;P→0,事件发生的可能性愈小;P→1,事件发生的可能性愈大六、小概率事件习惯上将P≤0.05或P≤0.01 的随机事件称小概率事件。
表示某事件发生的可能性很小。
七、参数和统计量参数:总体指标,如总体均数、总体率,一般用希腊字母表示统计量:样本指标,如样本均数、样本率,一般用拉丁字母表示八、学习医学统计学的方法1、重点掌握“四基”:基本知识、基本概念、基本原理和基本方法;2、重视统计方法在实际中应用,重视实习和综合训练;注意学习每种统计方法的应用范围、应用条件,大多数公式只要求了解其意义和使用方法,不用记忆和探究数理推导。
卫生统计学复习笔记

卫生统计学复习笔记一、概述1、卫生统计学的概念(熟练掌握)统计学是研究数据的收集、整理和分析的一门科学,帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。
卫生统计学是应用数统计学的原理与方法研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。
由此看出:统计学是处理资料中变异性的科学和艺术,是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科.这里强调了“过程”,但在实际工作中,许多人往往是忽略了设计、收集和归类(整理),到了分析数据时才想到统计学,此时难免发生“悔之晚矣”的憾事。
作为统计学的应用者应充分认识到这一点。
卫生统计学的内容(了解):1)健康统计:医学人口统计、疾病统计和生长发育统计等;2)卫生服务统计:包括卫生资源利用、医疗卫生服务的需求、医疗保健体制改革等方面的统计学问题。
2、卫生统计学的工作步骤(熟练掌握)统计学对统计工作的全过程起指导作用,任何统计工作和统计研究的全过程都可分为以下四个步骤:1)、设计:在进行统计工作和研究工作之前必须有一个周密的设计.设计是在广泛查阅文献、全面了解现状、充分征询意见的基础上,对将要进行的研究工作所做的全面设想。
其内容包括:明确研究目的和研究假说,确定观察对象、观察单位、样本含量和抽样方法,拟定研究方案、预期分析指标、误差控制措施、进度与费用等。
设计是整个研究工作中最关键的一环,也是指导以后工作的依据2)、收集资料:遵循统计学原理采取必要措施得到准确可靠的原始资料.及时、准确、完整是收集统计资料的基本原则。
卫生工作中的统计资料主要来自以下三个方面:①统计报表:是由国家统一设计,有关医疗卫生机构定期逐级上报,提供居民健康状况和医疗卫生机构工作的主要数据,是制定卫生工作计划与措施、检查与总结工作的依据。
如法定传染病报表,职业病报表,医院工作报表等。
②经常性工作记录:如卫生监测记录、健康检查记录等。
卫生统计学-重点整理资料

卫生统计学第一章绪论1、卫生统计学的概念(P1)卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。
2、卫生统计学的4个基本步骤(P3):设计、收集资料、整理资料、分析资料3、卫生统计学的几个基本概念(P4):⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称之为同质,或具有同质性。
⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。
⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。
⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。
样本中包含的观察单位个数成为样本含量。
⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总体均数μ、总体率π等。
⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本均数⎺x 、样本率ρ等。
⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变量;变量值的集合成为资料。
⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般有度、量、衡单位。
⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,一般无度、量、衡单位。
可细分为:①计数资料;②等级资料第二章调查研究设计★1、调查研究的特点(P7):①不能人为施加干预措施;②不能随机分组;③很难控制干扰因素;④一般不能下因果结论2、常用抽样方法(名称、原理):⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。
⑵系统抽样:又称机械抽样或等距抽样。
事先将总体内全部观察单位按某一顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。
《卫生统计学》考试重点复习资料

②权衡两类错误的危害以确定α的大小。 ③正确理解 P 值的意义,如果 P<α,宜说差异“有统计学意义”。
第八章 方差分析
名词解释
总变异:样本中全部实验单位差异称为总变异。其大小可以用全部观察值的均方(方差)表 示。 组间变异:各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其 大小可用组间均方表示。 组内变异: 各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。 随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象 的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对 象随机地分配到各处理组,这种设计叫做随机区组设计。
构成比
某一组成部分的观察单 位数 同一事物各组成部分的 观察单位总数
100 %
③比又称相对比,是 A、B 两个有关指标之比,说明两者的对比水平,常以倍数或百分数表
示,其公式为:相对比=甲指标 / 乙指标(或 100%)
甲乙两个指标可以是绝对数、相对数或平均数等。
应用相对数时应注意哪些问题?
答:应用相对数时应注意的问题有:
相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、
构成比、比等。
标准化法:是常用于内部构成不同的两个或多个率比较的一种方法。标准化法的基本思想就
是指定一个统一“标准”(标准人口构成比或标准人口数),按指定“标准”计算调整率,使
之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
料间的相对水平。 3) 报告比较结果时必须说明所选用的“标准”和理由。 4) 两样本标准化率是样本值,存在抽样误差。当样本含量较小时,还应作假设检验。
卫生统计学复习题及参考答案.doc

中南大学网络教育课程专试3C习题及参考答案一、名词解释:1.计量资料3.等级资料5.样本7.频数表9.中位数11.方差13.变异系数15.标准正态分布17.抽样误差19.可信区间21.假设检验中P的含义23.检验效能25.方差分析27.相对数29.构成比31.非参数统计33.相关系数35.回归系数卫生统计学2.计数资料4.总体6.变异8.算术均数10.极差12.标准差14.正态分布16.统计推断18.标准误20.参数估计22.1型和II型错误24.检验水准26.随机区组设计28.标准化法30.Y ates 校正32.直线回归34.统计图二、单项选择题:1.观察单位为研究中的A.样本B.全部对象2 .总体是由A.个体组成B.研究对象组成3.抽样的目的是A.研究样本统计量C.研究典型案例研究误差4.参数是指A.参与个体数C.样本的统计指标C.影响因素D.个体C.同质个体组成D.研究指标组成B.由样本统计量推断总体参数D.研究总体统计量B.总体的统计指标D.样本的总和5.关于随机抽样,下列哪一项说法是正确的?A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变7.比较身高和体重两组数据变异度大小宜采用A.变异系数B.方差C.极差D.标准差8.以下指标中()可用来描述计量资料的离散程度。
A.算术均数B.儿何均数C.中位数D.标准差9.血清学滴度资料最常用来表示其平均水平的指标是A.算术平均数B.中位数C.儿何均数D.平均数10.两样木均数的比较,可用B.距宜线的纵向距离的平方和最小D.与直线的垂直距离的平方和最小 B.随机化、重复、设置对照D.处理因素、受试对象、实验效应16. 非参数统计应用条件是 A. 总体是正态分布 C. 不依赖于总体分布 17. 下述哪些不是非参数统计的特点? A.不受总体分布的限定C. 适用于等级资料B. 若两组比较,耍求两组的总体方差相等 D. 要求样本例数很大B. 多数非参数统计方法简单,易于掌握 D.检验效能总是低于参数检验22. 两个小样本比较的假设检验,应首先考虑A. t 检验B.秩和检验C. 任选一种检验方法D.资料符合哪种检验的条件 23. 对于配对比较的秩和检验,其检验假设为A. 样本的差数应来自均数为0的正态总体B. 样本的差数应来自均数为0的非正态总体C. 样本的差数来自中位数为0的总体D. 样本的差数来自方差齐性和正态分布的总体24. 用最小二乘法确定直线|口【归方程的原则是各观察点A.距直线的纵向距离相等 C.与直线的我直距离相等25. 实验设计的三个基本要素是A.受试对象、实验效应、观察指标 C.齐同对比、均衡性、随机化26. 实验设计的基本原则A.方差分析B. t 检验C.两者均可11. 配伍组设计的方差分析中,U 配伍等于A. V &-V 误差B. V 总一 1/处理C. V 总-V 处理+ V 误巷D. V 处理一 V 误差 12. 在均数为耳,标准差为b 的正态总体中随机抽样,|兄一//|2()的概率为5%。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《卫生统计学》复习资料08生物技术曾洋and林阳第一章绪论名词解释统计学:是一门通过收集、整理和分析数据来认识社会和自然现象数量特征的方法论科学。
其目的是通过研究随机事件的局部外在数量特征和数量关系, 从而探索事件的总体内在规律性,而随机性的数量化,是通过概率表现出来。
总体:总体是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
抽样:从研究总体中抽取少量有代表性的个体,称为抽样。
概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。
0﹤P(A)﹤1。
频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。
当试验重复很多次时P(A)= m/n。
变量:表现出个体变异性的任何特征或属性。
随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。
随机变量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。
系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。
系统误差可以通过实验设计和完善技术措施来消除或使之减少。
随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。
它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。
误差变量一般服从正态分布。
随机误差可以通过统计处理来估计。
变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异的存在,在抽样过程中产生的样本统计量与总体参数之间的差异。
分布:随机现象的规律性通过概率来刻画,而随机事件的所有结局及对应概率的排列称为分布。
第二章定量资料的统计描述名词解释算术均数:描述一组数据在数量上的平均水平。
总体均数用μ表示,样本均数用X表示。
几何均数:用以描述对数正态分布或数据呈倍数变化资料的水平。
记为G。
中位数:将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。
众数:众数原指总体中出现机会最高的数值。
样本众数则是在样本中出现次数最多的数值。
极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。
四分位数间距:是由第3四分位数和第1四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。
方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。
标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。
变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较,用CV 表示。
问答题常见的描述集中趋势的指标有哪些,概念分别是什么?答:常见的描述集中趋势的指标有算数均数、几何均数、中位数和众数。
概念见名解。
常见的描述离散趋势的指标有哪些,概念分别是什么?答:常见的描述离散趋势的指标有极差、四分位数间距、方差、标准差和变异系数。
概念见名解。
第三章 定性资料的统计描述名词解释相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、构成比、比等。
标准化法:是常用于内部构成不同的两个或多个率比较的一种方法。
标准化法的基本思想就是指定一个统一“标准”(标准人口构成比或标准人口数),按指定“标准”计算调整率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
问答题常用的相对数指标有哪些?它们的意义和计算上有何不同?答:常用的相对数指标有:率、构成比和相对比。
意义和计算公式如下:①率又称频率指标,说明某现象发生的频率或强度,常以100%、1000‰等表示。
②构成比又称构成指标,说明某一事物内部各组成部分所占的比重或分布。
常以百分数表示。
③比又称相对比,是A 、B 两个有关指标之比,说明两者的对比水平,常以倍数或百分数表示,其公式为:相对比=甲指标 / 乙指标(或100%)甲乙两个指标可以是绝对数、相对数或平均数等。
应用相对数时应注意哪些问题? 答:应用相对数时应注意的问题有:⑴ 计算相对数的分母一般不宜过小。
⑵ 分析时不能以构成比代替率。
⑶ 不能用构成比的动态分析代替率的动态分析。
⑷ 对观察单位数不等的几个率,不能直接相加求其总率。
⑸ 在比较相对数时应注意可比性。
⑹ 对样本率(或构成比)的比较应随机抽样,并做假设检验。
应用标准化法的注意事项有哪些?%100⨯=单位总数可能发生某现象的观察数发生某现象的观察单位率%100⨯=观察单位总数同一事物各组成部分的位数某一组成部分的观察单构成比答:应用标准化法时应注意的问题有:1) 标准化法的应用范围很广,其主要目的就是消除混杂因素的影响。
2) 标准化后的标准化率,已经不再反反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平。
3) 报告比较结果时必须说明所选用的“标准”和理由。
4) 两样本标准化率是样本值,存在抽样误差。
当样本含量较小时,还应作假设检验。
第四章 统计表和统计图名词解释统计表:将统计资料及其指标以表格形式列出,称为统计表(statistical table )。
狭义的统计表只表示统计指标。
统计图:统计图(statistical graph)是将统计指标用几何图形表达,即以点的位置、线段的升降、直条的长短或面积的大小等形式直观的表示事物间的数量关系。
问答题常用统计图的定义和制图要求。
名 称定 义 制 图 要 求 条 图 用等宽直条的长短来表示相互独立的各统计指标的数值大小起点为0的等宽直条,条间距相等,按高低顺序排列。
普通线图 适用于连续性资料。
用线段的升降来表示一事物随另一事物变化的趋势。
纵横两轴均为算术尺度,相邻两点应以折线相连。
图内线条不宜超过3条。
半对数线图 用线段的升降来表示一事物随另一事物变化的速度。
横轴为算术尺度,纵轴为对数尺度。
余同普通线图。
圆 图 以圆面积表示事物的全部,用扇形面积表示各部分的比重 以圆面积为100%,将各构成比分别乘以3.6度得圆心角度数后再绘扇形面积。
通常以12点为始边依次绘图。
直方图 用矩形的面积来表示某个连续型变量的频数分布常以横轴表示连续型变量的组段(要求等距),纵轴表示频数或频率,其尺度从“0”开始,各直条间不留空隙。
散点图 以点的密集程度和趋势表示两种事物间的相关关系 绘制方法同线图,只是点与点之间不连接。
第五章 常用概率分布名词解释正态分布:若指标X 的频率曲线对应于数学上的正态曲线,则称该指标服从正态分布(normal distribution )。
通常用记号),(2σμN 表示均数为μ,标准差为σ的正态分布。
标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布(standard normal distribution ),通常记为2(0,1)N 。
问答题正态概率密度曲线的位置与形状具有哪些特点?答:正态概率密度曲线的位置与形状具有以下特点:1)关于x=μ对称。
2)在x=μ处取得该概率密度函数的最大值,在x=μ±σ处有拐点。
3)曲线下面积为1。
4) μ决定曲线在横轴上的位置,μ增大,曲线沿横轴向右移;反之,μ减小,曲线沿横轴向左移。
5) σ决定曲线的形状,当μ恒定时,σ越大,数据越分散,曲线越“矮胖”;σ越小,数据越集中,曲线越“瘦高”。
第六章 参数估计基础名词解释抽样误差:由个体变异产生的,抽样造成的样本统计量与总体参数的差异,称为抽样误差。
标准误及X σ:通常将样本统计量的标准差称为标准误。
许多样本均数的标准差X σ称为均数的标准误,它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。
点估计:是直接利用样本统计量的一个数值来估计总体参数。
区间统计:用统计量X 和x S 确定一个有概率意义的区间,以该区间具有较大的可信度包含总体均数。
可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的可信区间。
它的确切含义是:可信区间包含总体参数的可能性是1-α,而不是总体参数落在该范围的可能性为1-α。
第七章 假设检验基础名词解释I 型和II 型错误:I 型错误(type I error ),指拒绝了实际上成立的H 0,这类“弃真”的错误称为I 型错误,其概率大小用α表示;II 型错误(type II error ),指接受了实际上不成立的H 0,这类“存伪”的误称为II 型错误,其概率大小用β表示。
检验效能:1-β称为检验效能(power of test ),它是指当两总体确有差别,按规定的检验水准α所能发现该差异的能力。
问答题假设检验的基本步骤是什么?答:①建立假设、选用单侧或双侧检验、确定检验水准;②选用适当检验方法,计算统计量;③确定P 值并作出推断结论。
假设检验与区间估计的关系式什么?答:①置信区间具有假设检验的主要功能②置信区间课提供假设检验没有提供的信息。
置信区间在回答差别有无统计学意义的同时,还可以提示差别是否具有实际意义。
③假设检验比置信区间多提供的信息:假设检验可以报告确切的P 值。
应用假设检验需要注意的问题有哪些?答:①应用检验方法必须符合其适用条件。
②权衡两类错误的危害以确定α的大小。
③正确理解P 值的意义,如果P<α,宜说差异“有统计学意义”。
第八章方差分析名词解释总变异:样本中全部实验单位差异称为总变异。
其大小可以用全部观察值的均方(方差)表示。
组间变异:各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其大小可用组间均方表示。
组内变异:各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。
随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相同或相近,且受试对象数与处理因素的水平数相等。