【孙振球第三版】医学统计学复习题
医学医学统计学孙振球计量资料的统计描述共85页文档

37、我们唯一不会改正的缺点是软弱。——拉罗什福科
xiexie! 38、我这个人走得很慢,但是我从不后退。——亚伯拉罕·林肯
39、勿问成功的秘诀为何,且尽全力做你应该做的事吧。——美华纳
40、学而不思则罔,思而不学则殆。——孔子
医学医学统计学孙振球计量资料的统计 描述
1、合法而稳定的权力在使用得当时很 少遇到 抵抗。 ——塞 ·约翰 逊 2、权力会使人渐渐失去温厚善良的美 德。— —伯克
3、最大限度地行使权力总是令人反感 ;权力 不易确 定之处 始终存 在着危 险。— —塞·约翰逊 4、权力会奴化一切。——塔西佗
5、虽然权力是一头固执的熊,可是金 子可以 拉着它 的鼻子 走。— —莎士 比
《医学统计学》计算题答案

《医学统计学》计算分析题参考答案孙振球主编. 医学统计学.第3版. 北京:人民卫生出版社,2010第二章计量资料的统计描述计算分析题(P26)1. 根据某单位的体检资料,116名正常成年女子的血清甘油三酯测量结果如下,请据此资料:(1)描述集中趋势应选择何指标?并计算之。
(2)描述离散趋势应选择何指标?并计算之。
(3)求该地正常成年女子血清甘油三酯的95%参考值范围。
(4)试估计该地正常成年女子血清甘油三脂在0.8mmol/L以下者及1.5mmol/L者各占正常成年女子总人数的百分比?表2-1某单位116名正常成年女子的血清甘油三酯(mmol/L)测量结果组段频数0.6~ 10.7~ 30.8~ 90.9~ 131.0~ 191.1~ 251.2~ 181.3~ 131.4~ 91.5~ 51.6~1.7 1合计116(1)数据文件数值变量名:组段,频数;用Compute产生新变量“组中值”(也可直接输入组中值)。
(2)操作步骤Analyze èData èWeight Cases ;Weight Cases by 频数。
Analyze èDescriptives èDescriptives ;将“组中值”选入V ariable 框中;单击OK 。
(3)结果解释表2-1显示某单位116名正常成年女子的血清甘油三酯测量结果呈正态分布,故选择均数描述集中趋势,选择标准差描述离散趋势。
某单位116名正常成年女子的血清甘油三酯测量结果的均数为1.16(mmol/L ),标准差为0.20(mmol/L );该地正常成年女子血清甘油三酯的95%参考值范围是(0.77,1.55)mmol/L 。
计算过程根据公式s x 96.1±,即1.16±1.96×0.20。
该单位正常成年女子血清甘油三酯在0.8 mmol/L 以下者估计占总人数的3.59%,1.5 mmol/L 以下者估计占总人数的95.54%。
考试题医学统计学第三版

考试题医学统计学第三版1,统计设计的基本原则有哪些?(1)对照:以排除偶然的非处理因素的干扰,如成组对照、配对对照。
(2)随机:总体中每一个体都有同等的机会被抽中,其目的是使样品有代表性,如抽签、随机数字表等。
(3)均衡:处理组与对照组的内部构成一致,如性别一致、年龄一致等。
(4)重复(样本含量):样本一般要求≧30例。
2. 怎样的数据资料属分类资料?数据不代表数值大小,只是一种编码,每个编码代表一种属性,这种资料叫分类资料,又称分类变量或定性资料。
其观察值是定性的,表现为互不相容的类别或属性。
有无序分类、有序分类两种情况。
3. 简述什么叫总体和样本,医学研究中的样本有什么要求?总体:是指根据研究目的确定的同质观察单位的全体,是同质的所有观察单位某中观察值(变量值)的集合。
样本:用随机方法从总体中抽出的、有代表性的部分观察单位的某变量值的集合。
医学研究中的样本应按随机化原则获取,即总体中每一个观察单位都有同等的机会被选入到样本中来,以避免误差和偏倚对研究结果有所影响。
4. 统计描述的基本方法有哪些,各自有何特点?(1)频数表与频数图:由组段和频数两栏组成的整理表即频数表,将频数表数据在直角坐标系上绘制成图即频数图。
特点:①.较具体、直观的描述一组数据的特征;②便于发现可疑的异常值;③有助于正确选用统计指标和便于计算。
(2)描述性统计量可以用来定量的刻画统计分布的特征,常用的有三类:描述集中趋势的有算术均数,几何均数,中位数。
描述离散趋势的有极差,四分位数间距,方差,标准差,变异系数,描述分布类型的偏度系数峰度系数。
(3)百分位数是一种位置参数既可用干描述离散趋势又可描述集中趋势可用于各种连续型分布。
5. 统计描述的意义是什么?试举例说明。
统计描述,是指用适当的统计指标、统计表、统计图等方法对资料的数量特征及其分布规律进行测定和描述,其目的是用直观、简单的形式揭示大量数据所蕴涵的内在信息。
例如随机抽取某市六十名十二岁男孩测身高面对这六十个不同的数据,无论多认真审视也无法说清这些男孩的身高情况,这就要用统计描述来解决这些问题,对数据进行整理归纳总结分析制作频数表图这样就能具体直观的描述这些数据的特征如有三组同龄男孩体重如下,其平均体重是30千克,由表面看这三组资料的均数相等,即集中趋势相同,但各组的数据参差不齐,也就是离散趋势不同,描述这组同质数值变量数据离散程度就用全距、四分位数间距、方差、标准差等6. 描述计量资料集中趋势(一般水平)的指标有哪些,各适用于什么情况?描述计量资料集中趋势的指标有:算术平均数、几何平均数、中位数。
统计学医学复习题及答案

医学统计学复习题(一)选择题:1统计上小概率事件通常是指 BA 一次实验或观察中该事件一定不发生的事件B 一次实验或观察中该事件发生的可以性很小C 一次实验或观察中该事件一定发生的事件D 一次实验或观察中该事件可能发生也可能不发生的事件E 一次实验或观察中该事件发生的可以性很大2在统计学上的参数是指BA 总体均数B 描述总体特征的指标C 描述样本特征的指标D 描述人群特征的指标E 描述变量特征的指标3能通过校正的方法将其消除的误差是 DA 随机测量误差B 抽样误差C 系统误差D 观察误差E 以上均不对4抽样研究的目的是 AA 用样本的信息推断总体的特征B 研究样本的特征C 研究总体的均数D 用总体的信息推断样本的特征E 以上均不对5 统计分析包括 EA 统计描述B 参数估计C 假设检验D 参数估计和假设检验E 统计描述和统计推断6研究一组数据的分布规律时,画频数表的第一个步骤应该是 DA 确定组距B 确定组数C 列表划计D 找出这组数据的最大值和最小值,并计算出极差E 以上都不是7、均数与标准差中。
AA、均数会是负数,标准差不会B、标准差会是负数,均数不会C、两者都不会D、两者都会8、原始数据减去一常数后原始数据的。
BA、均数不变,标准差变B、均数变,标准差不变C、两者都变D、两者都不变9、用均数和标准差可全面描述资料的特征。
CA、正偏态分布B、负偏态分布C、正态分布和近似正态分布D、对称分布10、表示一群性质相同的变量值的集中趋势的统计指标是。
BA、全距B、平均数C、标准差D、标准误E、方差11、t≥t0.05(γ)统计学上可认为。
A、两总体均数不同B、两总体均数相同C、两样本均数不周D、两样本均数相同12、同样性质的两项研究工作,都作两样本均数的显著性检验P值越小,则。
A、两样本均数不同B、两总体均数差别越大C、越有理由说两总体均数不同D、理由说两样本均数不同13、时,作单侧检验。
A、已知A药肯定优于B药B、当不能明确是A药好还是B药好C、已知A药一定不会比B药差D、已知A药与B药差不多14、两组数据均数差别的显著性检验,要求数据分布近似正态并且。
《医学统计学》习题及答案

《医学统计学》习题及答案一、最佳选择题(每题共有A、B、C、D,请选出最适答案,每题1分,共50分。
)1.理论上,正态分布总体N(μ,σ)中有95%变量值X在______范围内。
A.x±1.96σB.μ±1.96σC.μ±1.96xD.x±1.96x s2.在同一总体中随机抽样,样本含量n越大,则理论上____越小。
A.样本标准差B.中位数C.标准差的抽样误差D.第95百分位数3.血清滴度(X )资料常用几何均数表示平均水平是由于_____。
A.按等比级数分组B.X近似正态分布C.lg X近似于对数正态分布D.X近似于对数正态分布4.算术均数与中位数相比,。
A.抽样误差更大B.不易受极端值的影响C.更充分利用数据信息D.更适用于分布不明及偏态分布资料5.标准正态分布是指。
A.N(μ,σ)B.N(0,0)C.N(1,1)D.N(0,1)6.以中位数表示集中趋势,资料。
A.不能用于正态分布的B.不能用于严重偏态的连续分布的C.可用于任何分布的计量D.可用于任何一种属性(分类)7.直方图可用于。
A.2001年5种疾病发病率比较B.10个年龄组患病率比较C.身高和患病率的关系分析D.描述O型血者血红蛋白含量分布8.标准正态分布中,单侧u0.05值为。
A.1.96B.0.05C.1.64D.0.0259.随机抽查某地成年女子身高,算得均数x=160cm,标准差s=5cm,则可计算变异系数CV= 。
A.160/5B.5/160C.(160/5)cmD.(5/160)cm10.标准正态分布曲线下,横轴上从-1到1.96的面积为__%。
A.>95.0B.81.64C.84.14D.68.2711.如果一批数据全是负数,则。
A.x>0,s≥0B.s<xC.x<0,s<0D.s>x12.表示。
xA.总体均数标准误B.总体均数标准误的估计值C.样本均数标准误D.样本均数标准误的估计值13.实际工作中,两均数作差别的统计检验,要求数据近似正态分布及。
医学统计学复习题

预防医学复习题(统计部分)复习重点(及简答题)1. 医学统计学的基本概念如:总体与样本的联系区别2. 资料的分类如:请列举资料的类型并举例说明3. 定量资料统计描述的指标(集中与离散趋势)如:定量统计描述指标有哪些?如:正态分布与偏态分布资料统计描述方法有何区别4. 定性资料统计描述的指标5. 正态分布、标准正态分布、t分布的概念、特征、曲线下面积规律如:正态分布、标准正态分布与t分布的区别联系6. 小概率事件在医学统计学的应用(P值的含义)如:P值的含义是什么,对统计结论有何意义7. 假设检验的基本原理与步骤8. 四种主要统计假设检验方法及其应用场合9. 统计表的绘制选择题1.样本是总体中:A、任意一部分B、典型部分C、有意义的部分D、有代表性的部分E、有价值的部分2、参数是指:A、参与个体数B、研究个体数C、总体的统计指标D、样本的总和E、样本的统计指标3、抽样的目的是:A、研究样本统计量B、研究总体统计量C、研究典型案例D、研究误差E、样本推断总体参数4、脉搏数(次/分)是:A、观察单位B、数值变量C、名义变量 D.等级变量 E.研究个体5、疗效是:A、观察单位B、数值变量C、名义变量D、等级变量E、研究个体6、统计学常将P≤0.05或P≤0.01的事件称A、必然事件B、不可能事件C、随机事件D、小概率事件E、偶然事件7.统计中所说的总体是指:A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体8.概率P=0,则表示A某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对9.总体应该由A.研究对象组成B.研究变量组成C.研究目的而定D.同质个体组成E.个体组成10. 在统计学中,参数的含义是A.变量B.参与研究的数目C.研究样本的统计指标D.总体的统计指标E.与统计研究有关的变量11.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于A.计数资料 B.计量资料 C.总体 D.个体 E.样本12.统计学中的小概率事件,下面说法正确的是:A.反复多次观察,绝对不发生的事件B.在一次观察中,可以认为不会发生的事件C.发生概率小于0.1的事件D.发生概率小于0.001的事件 E.发生概率小于0.1的事件13、统计上所说的样本是指:A、按照研究者要求抽取总体中有意义的部分B、随意抽取总体中任意部分C、有意识的抽取总体中有典型部分D、按照随机原则抽取总体中有代表性部分E、总体中的每一个个体14、以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属()资料。
医学统计学(孙振球)练习

例2-1 从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇(mmol/L)的测量结果如下,试编制频数分布表。
2.35 4.213.32 5.354.17 4.13 2.78 4.26 3.58 4.34 4.84 4.414.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.913.914.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.914.15 4.55 4.80 3.41 4.12 3.955.08 4.53 3.92 3.58 5.35 3.843.60 3.514.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.964.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.875.713.304.73 4.175.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.284.065.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.254.15 4.36 4.95 3.00 3.26例2-2 用直接法计算例2-1某单位101名正常成年女子的血清总胆固醇的均数。
例2-3 利用表2-1计算101名正常成年女子的血清总胆固醇均数。
例2-4 某地5例微丝蚴血症患者治疗7年后用间接荧光抗体试验测得其抗体滴度倒数分别为10,20,40,40,160,求几何均数。
例2-5 69例类风湿关节炎(RA )患者血清EBV-VCA-lgG 抗体滴度的分布见表2-5第(1)、(2)栏,求其平均抗体滴度。
表2-5 69例RA 患者血清EBV-VCA-lgG 抗体测定结果抗体滴度 人数f 滴度倒数Xlg Xlg f X⑴ ⑵ ⑶ ⑷ ⑸ 1: 10 1: 20 1: 40 1: 80 1: 160 1: 320 1: 640 1: 1280 4 3 10 10 11 15 14 2 10 20 40 80 160 320 640 1280 1.0000 1.3010 1.6021 1.9031 2.2041 2.5051 2.8062 3.1072 4.0000 3.9030 16.0210 19.0310 24.2451 37.5765 39.2868 6.2144 合 计69——150.2778例2-6 7名病人患某病的潜伏期分别为2,3,4,5,6,9,16天,求其中位数。
医学统计学第三版习题答案

医学统计学第三版习题答案医学统计学第三版习题答案医学统计学是医学领域中的一门重要学科,它通过收集、整理和分析医学数据,为医学研究和临床实践提供科学依据。
而习题是学习医学统计学的重要方式之一,通过解答习题可以帮助我们巩固所学知识,提高分析和解决实际问题的能力。
下面将给出医学统计学第三版习题的答案,希望对大家的学习有所帮助。
第一章:医学统计学概述1. 医学统计学是什么?医学统计学是应用统计学原理和方法研究医学问题的学科,它通过收集、整理和分析医学数据,为医学研究和临床实践提供科学依据。
2. 医学统计学的应用领域有哪些?医学统计学的应用领域包括流行病学、临床试验、医学决策分析、质量控制等。
3. 为什么医学统计学对医学研究和临床实践至关重要?医学统计学通过数据的收集和分析,可以帮助医学研究者和临床医生进行科学的研究和决策。
它可以帮助我们了解疾病的发病率和死亡率,评估治疗方法的效果,预测疾病的发展趋势等。
第二章:数据的收集和整理1. 什么是数据?数据是用于描述和表示事物特征、属性或变化的信息。
在医学统计学中,数据可以是疾病患者的年龄、性别、病情等信息。
2. 数据的收集方法有哪些?数据的收集方法包括问卷调查、观察记录、实验、抽样调查等。
3. 数据的整理方法有哪些?数据的整理方法包括数据的录入、清理、编码和校验等。
第三章:描述性统计学1. 描述性统计学的主要内容是什么?描述性统计学主要研究如何对数据进行整理、总结和描述,以便更好地理解和分析数据的特征和规律。
2. 描述性统计学的常用指标有哪些?描述性统计学的常用指标包括频数、频率、平均数、中位数、众数、标准差等。
3. 描述性统计学在医学研究中的应用有哪些?描述性统计学可以帮助医学研究者对疾病的发病率、死亡率、治疗效果等进行描述和分析,为医学研究和临床实践提供科学依据。
第四章:概率与概率分布1. 什么是概率?概率是描述事件发生可能性的数值,它介于0和1之间。
2. 什么是概率分布?概率分布是描述随机变量取值可能性的分布情况,常见的概率分布有正态分布、泊松分布、二项分布等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、名词解释:1、总体:根据研究目的确定的同质观察单位的全体。
是同质所有观察单位的某种变量值的集合。
2、有限总体:是指空间、时间范围限制的总体。
3、无限总体:是指没有空间、时间限制的总体。
4、样本:从总体中随机抽取部分观察单位,其实测值的集合。
5、计量资料:又称定量资料或数值变量资料。
为观测每个观察单位的某项指标的大小,而获得的资料。
其变量值是定量的,表现为数值大小,一般有度量衡单位。
根据其观测值取值是否连续,又可分为连续型或离散型两类。
6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
其变量值是定性的,表现为互不相容的性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
9、平均数:描述一组变量值的集中位置或水平。
常用的平均数有算术平均数、几何平均数和中位数。
10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。
11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。
检验水平,就是预先规定的允许犯I型错误概率的最大值。
I型错误概率大小也用α表示,α可取单尾亦可取双尾。
12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。
其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。
13、相对数:两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数学的大小。
如率、构成比、比等。
14、率:强度相对数,说明某现象发生的频率或强度。
15、构成比:结构相对数字,表示事物内部某一部分的个体与该事物各个部分个体数的和之比。
用来说明各构成部分在总体所占的比重或分布。
16、相对比:简称比,是两个相关联指标之比,说明两指标间的比例关系。
两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示。
两指标可以是绝对数、相对数或平均数。
17、标准化:采用某影响因素的统一标准构成以消除内部构成不同对总率的影响,使通过标化后的标准率具有可比性。
18、动态数列:是一系列按时间顺序排列起来的统计指标,用以观察和比较该事物在时间上的变化和发展趋势。
常用指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。
19、非参数检验:相对于参数检验而言,不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验方法,称为参数检验。
20、相关系数:又称Pearson积差相关系数,以符号r来表示。
说明两正态变量间相关关系的密切程度和方向的指标。
无单位,其值为-1≤r≤1。
相关系数的检验假设常用t检验。
21、回归系数:即线性回归方程的斜率b,其统计意义是当X变化一个单位时Y的平均改变的估计值。
在直线回归中对回归系数的t检验与F检验等价。
22、随机原则:是指在实验分组时,每个受试对象均有相同的概率或机会被分陪配到实验组和对照组。
23、分类变量资料:计数资料,又称定性资料或无序分类变量资料。
是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
其变量值是定性的,表现为互不相容的性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
24、无序分类变量资料:计数资料,又称定性资料。
是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
其变量值是定性的,表现为互不相容的性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
25、寿命期望:指同时出生的一代人活满x岁以后尚能生存的年数(即岁数)。
26、检验效能:表达式为1-β,以往称把握度。
其意义为当两总体确有差异,按规定检验水准所能发现该差异的能力。
27、观察单位:亦称个体,是统计研究中的基本单位。
它可以是一个人、一只动物,也可以是特指的一群人;可以是一个器官,甚至一个细胞。
28、样本含量:样本中包含观察单位数称为该样本的样本含量。
29、变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,成为变量。
30、变量值:对变量的观测值称为变量值或观察值。
31、误差:泛指实测值与真实值之差,按产生原因和性质可粗分为(1)随机误差;(2)非随机误差①系统误差②非系统误差。
32、系统误差:实验过程中产生的误差,它的值或恒不变,或遵循一定的变化规律,其产生的原因往往是可知的或可能掌握的。
应尽可能设法预见到各种系统误差的具体来源,力求通过周密的研究设计和严格的技术措施施加以消除或控制。
33、非系统误差:在实验过程中由于研究者偶然失误造成的误差。
这类误差应当通过认真检查核对予以清除,否则将影响研究结果的准确性。
34、频率:一个随机试验有几种可能,在结果重复进行试验时,个别结果看来是偶然发生,但当重复试验次数相当大时,总有规律出现。
在重复多次后,出现结果的比例称之为频率。
35、概率:概率是描述随机事件发生可能性大小的一个度量。
36、医学参考值:是直指包括绝大多数正常人的人体形态、功能和代谢产物等个各种生理指标常数,也称正常值。
由于存在个体差异,生物医学数据并非常数而是在一定范围内波动,故医学参考值范围作为判定正常和异常的参考标准。
37、正态分布:正态分布又称高斯分布,是一种很重要的连续型分布,应用很广。
若指标X的频率分布曲线对应于数学上的正态分布曲线,则称该指标服从正态分布。
38、偏态分布:指集中位置偏向一侧,频数分布不对称。
(1)正偏态分布:集中位置偏向数值小的一侧。
(2)负偏态分布:集中位置偏向数值大的一侧。
39抽样:在医学研究中,为节省人力、物力、财礼和时间,一般都采取从总体中抽取样本,根据样本信息来推断总体特征的方法,即抽样研究的方法来实现,这种从总体中随机抽取部分观察单位的过程称为抽样。
为保证样本的代表性,抽样时必须遵循随机化原则。
二、填空题1、医学统计工作的基本步骤:设计、搜集资料、整理资料、分析资料。
2、医学统计资料的主要来源的四个方面:统计报表、经常性工作记录、专题调查、统计年鉴和数据库专集。
3、正态分布的规律的应用:估计频数分布情况、质量控制、统计处理方法的理论基础、估计医学参考值范围。
4、计量资料统计描述的方法:频数分布表、频数分布图、统计指标。
5、CV(变异系数):常用于度衡量单位不同和均数相悬殊的多组资料变异度的比较。
6、统计推断是从总体中随机抽样本,由样本信息推断总体特征的过程,包括参数估计和假设检验两方面内容。
参数估计包括点估计和区间估计。
7、可信区见估计的优劣取决于两要素:(1)可信度1-α(准确度),即区间包含总体均数µ的理论概率大小,可信度愈接近1愈好。
(2)区间宽度β(精密度),即区间的长度,区间愈窄愈好。
8、变量变换的方法有:对数变换、平方跟变换、倒数变换、平方根反正弦变换。
9、常用的相对数:率、构成比、相对比。
10、动态数列常用指标有:绝对增长量、发展速度与增长速度、平均发展速度、平均增长速度。
11、二项式分布的参数是n和π。
n,n次独立重复实验数目;π,每次实验的“阳性”概率。
12、二项式分布在n很大,而π很小,且nπ=λ为常数时,二项式分布近似Poisson分布。
13、总体均数λ与总体方差σ2相等是Poisson分布的重要特征。
14、Poisson分布具备可加性。
15、当λ(总体率)增大时,Poisson分布渐近正态分布。
16、四格表中四格子基本数值为两对实测的实际频数和理论频数。
17、R*C表的卡方检验,若表格中有一个方向按多个等级分类时,则称之为单向有序行列表,当等级数大于3时,如检验各处理组各等级下的构成比有无差别时采用Χ2检验,如检验各处理组各等级下的程度上有无差别时采用非参数检验。
18、配对比较秩和检验,以正秩或负秩的和(T)为检验统计量,其中T越小则P的值小于相应的检验水平。
19、正态分布的两个参数µ和σ2,前者决定分布的位置,后者决定分布的形态(形状、变异度)。
20、四格表Χ2的校正条件为n≥40而且1<T<5。
21、R*C表资料Χ2检验,如果有T<1,应该采取的措施有:(1)增加样本含量,使理论频数增大;(2)根据专业知识考虑能否删除理论频数太小的行或列,能否将理论频数太小的行或列与性质相近的行或列合并。
(3)改用双向无序R*C表资料的Fisher确切概率法。
22、Poisson分布中,总体的方差与均数的关系是λ=σ2,当均数较大时,Poisson分布趋近于正态分布。
23、要分析某个资料是否属于二项分布,可用频数分布的拟合优度的Χ2检验。
24、r是相关系数,表示具有直线关系的两变量间相关密切程度和相关方向。
25、变异系数的应用条件是均数相差较大、观察指标单位不同。
26、Χ2表示理论频数与实际频数的符合程度。
27、常用相对数的指标有强度相对数字(率)、结构相对数(构成比)、相对比(比)。
28、常用的描述构成比的统计图有圆图和百分比条图。
29、方差分析的应用条件为相互独立的随机样本、来自正态总体、方差齐性。
30、实验设计的基本原则随即机原则、对照原则、重复原则。
31、常用的几种统计图有直条图、圆图和百分比条图、线图、直方图、统计地图、其它特殊分析图。
32、写出四种变量变换的方法:倒数变换、平方根变换、平方根反正弦变换、对数变换。
33、在F检验中如有各比较组方差不齐时应用变量变换、近似t 检验、Wilcoxon秩和检验的方法。
34、四格表资料Χ2适用条件:(1)n≥40且T≥5时用Χ2检验的基本公式,当P≈α时,改用四格资料表的Fisher的确切概率法;(2)n≥40且1<T<5时用,用四格资料表Χ2检验的校正公式,或改用四格资料表的Fisher的确切概率法;(3)n<40,或T<1时,改用四格资料表的Fisher的确切概率法。
35、当总体率λ很小时,当n很大时,二项分布可用泊松分布来近似。
36、率的标准化的计算方法有直接标准化方法和间接标准化方法。
37、Χ2检验的用途:(1)推断两个总体率或构成比之间有无差别;(2)多个总体率或构成比之间有无差别;(3)两分类变量间有无关联性;(4)多个样本间的多重比较;(5)频数分布拟合优度的Χ2检验。