18年北交大理学院统计学[071400]考试科目、参考书目、复习经验考试科目、参考书目、复习经验--新祥旭考研

2018年北京交通大学理学院统计学[071400]考试科目、参考书目、复

习经验

一、招生信息

所属学院：理学院

所属门类代码、名称：理学[07]

所属一级学科代码、名称：统计学[0714]

二、研究方向

01金融统计

02数据统计分析

03风险统计与管理

04运筹学中的统计分析

三、考试科目

①101思想政治理论

②201英语一

③607数学分析

④872高等代数

四、复习指导

一、参考书的阅读方法

（1）目录法：先通读各本参考书的目录，对于知识体系有着初步了解，了解书的内在逻辑结构，然后再去深入研读书的内容。

（2）体系法：为自己所学的知识建立起框架，否则知识内容浩繁，容易遗忘，最好能够闭上眼睛的时候，眼前出现完整的知识体系。

（3）问题法：将自己所学的知识总结成问题写出来，每章的主标题和副标题都是很好的出题素材。尽可能把所有的知识要点都能够整理成问题。

二、学习笔记的整理方法

（1）第一遍学习教材的时候，做笔记主要是归纳主要内容，最好可以整理出知识框架记到笔记本上，同时记下重要知识点，如假设条件，公式，结论，缺陷等。记笔记的过程可以强迫自己对所学内容进行整理，并用自己的语言表达出来，有效地加深印象。第一遍学习记笔记的工作量较大可能影响复习进度，但是切记第一遍学习要夯实基础，不能一味地追求速度。第一遍要以稳、细为主，而记笔记能够帮助考生有效地达到以上两个要求。并且在后期逐步脱离教材以后，笔记是一个很方便携带的知识宝典，可以方便随时查阅相关的知识点。

（2）第一遍的学习笔记和书本知识比较相近，且以基本知识点为主。第二遍学习的时候可以结合第一遍的笔记查漏补缺，记下自己生疏的或者是任何觉得重要的知识点。再到后期做题的时候注意记下典型题目和错题。

（3）做笔记要注意分类和编排，便于查询。可以在不同的阶段使用大小合适的不同的笔记本。也可以使用统一的笔记本但是要注意各项内容不要混杂在以前，不利于以后的查阅。同时注意编好页码等序号。另外注意每隔一定时间对于在此期间自己所做的笔记进行相应的复印备份，以防原件丢失。统一的参考书书店可以买到，但是笔记是独一无二的，笔记是整个复习过程的心血所得，一定要好好保管。

2017统计学考试复习资料

统计学考试复习资料简答题（12题选5个） 1、统计数据的类型有哪些？（1）、按计量层次分类： a.分类数据：只能归于某一类别的非数字型数据；对事物进行分类的结果，数据表现为类别，用文字来表述，例如：人口按性别分为男、女两类。 b.顺序数据：只能归于某一有序类别的非数字型数据；对事物类别顺序的测度，数据表现为类别，用文字来表述，例如：产品分为一等品、二等品、三等品、次品等。 c.数值型数据：按数字尺度测量的观察值，结果表现为具体的数值，对事物的精确测度，例如：身高为175cm、168cm、183cm。 (2).按收集方法分类： a.观测的数据：通过调查或观测而收集到的数据在没有对事物人为控制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据。 b.试验的数据：在试验中控制试验对象而收集到的数据,比如，对一种新药疗效的试验，对一种新的农作物品种的试验等自然科学领域的数据大多数都为试验数据。 (3).按时间状况分类： a.截面数据：在相同或近似相同的时间点上收集的数据描述现象在某一时刻的变化情况，比如，2005年我国各地区的国内生产总值数据。 b.时间序列数据：在不同时间上收集到的数据描述现象随时间变化的情况比如，2000年至2005年国内生产总值数据。 2、简述数据误差的来源？ (1)抽样误差：由于抽样的随机性带来的误差，所有样本可能的结果与总体真值

之间的平均性差异，影响抽样误差的大小的因素为样本量的大小和总体的变异性。 (2)非抽样误差：相对抽样误差而言，除抽样误差之外的，由于其他原因造成的样本观察结果与总体真值之间的差异。存在与所有的调查之中：概率抽样、非概率抽样、全面性调查。有抽样框误差、回答误差、无回答误差、调查员误差、测量误差。 3、衡量数据离散程度的指标有哪些？衡量数据离散程度的指标有：(1).异众比率，用于测度分类数据的离散程度，衡量众数对一组数据的代表程度；(2).四分位差，用于测量顺序数据的离散程度，衡量中位数对一组数据的代表程度；(3).方差和标准差，用于测度数据离散程度的最常用测度值，衡量均值对一组数据的代表程度。 4、为什么说正态分布是客观现象中最主要的分布？正态分布有极其广泛的实际背景，生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。一般来说，如果一个量是由许多微小的独立随机因素影响的结果，那么就可以认为这个量具有正态分布。从理论上看，正态分布具有很多良好的性质，许多概率分布可以用它来近似；还有一些常用的概率分布是由它直接导出的，例如对数正态分布、t分布、F分布等。 5、请你说明小概率原理的含义？在概率论中，我们将发生概率很小一般来说不超过百分之五的事件称为小概率事件，小概率原理指的是在假设检验中，我们提出一个假设，用小概率事件去检验，如果小概率事件发生了，证明我们的假设有问题。 6、评价估计量的标准有哪些？并解释他们的含义。在实际工作中，总体参数往往是未知的，需要使用样本统计量来估计总体参数。衡量估计量优劣的标准一般有以下三个： (1)无偏性：无偏性不是要求估计量与总体参数不得有偏差，因为这是不可能的，既然是抽样，必然存在抽样误差，不可能与总体完全相同。无偏性指的是如果对这同一个总体反复多次抽样，则要求各个样本所得出的估计量（统计量）的平均值等于总体参数。符合这种要求的估计量被称为无偏估计量。(2)有效性：估计量与总体之间必然存在着一定的误差，衡量这个误差大小的一个指标就是方差，

医学统计学考试重点整理

一、基本概念 1.总体与样本总体：所有同质观察单位某种观察值（即变量值）的全体样本：是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查普查：就是全面调查，即调查目标总体中全部观察对象抽样调查：是一种非全面调查，即从总体中抽取一定数量的观察单位组成样本，对样本进行调查 3.参数与统计量参数：总体的某些数值特征统计量：根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误假设检验的结论真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误（ɑ错误）: H0为真时却被拒绝，弃真错误 Ⅱ型错误（β错误）: H0为假时却被接受，取伪错误 5.随机化原则与安慰剂对照随机化原则:是将研究对象随机分配到实验组和对照组，使每个研究对象都有同等机会被分配到各组中去，以平衡两组中已知和未知的混杂因素，从而提高两组的可比性，避免造成偏倚。（意义:①是提高组间均衡性的重要设计方法；②避免有意扩大或缩小组间差别导致的偏倚；③各种统计学方法均建立在随机化基础上）安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物，是一种无药理作用的制剂，不含试验药物的有效成分，但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样，不能被受试对象和研究者所识别。（安慰剂对照主要用于临床试验，其目的在于控制研究者和受试对象的心理因素导致的偏倚，并提高依从性。安慰剂对照还可以控制疾病自然进程的影响，显示试验药物的效应） 6.误差与标准误（区分率与均数）㈠均数抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。标准误：是指样本均数的标准差，反映抽样误差大小的定量指标，其公式表示为S x =S/√n ㈡样本率率的抽样误差:样本率p和总体率π的差异率的标准误:样本率的标准差,公式为σp=√π（1-π）/n

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料 08生物技术曾洋and林阳第一章绪论名词解释统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。总体可分为有限总体与无限总体。总体中得所有单位都能够标识者为有限总体,反之为无限总体。样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。样本应具有代表性。所谓有代表性得样本,就是指用随机抽样方法获得得样本。抽样:从研究总体中抽取少量有代表性得个体,称为抽样。概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。0﹤P(A)﹤1。频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。当试验重复很多次时P(A)= m/n。变量:表现出个体变异性得任何特征或属性。随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计与完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。它受多种因素得影响,使观察值不按方向性与系统性而随机得变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。变异:在自然状态下,个体间测量结果得差异称为变异(variation)。变异就是生物医学研究领域普遍存在得现象。严格得说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值得参差不齐。抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异得存在,在抽样过程中产生得样本统计量与总体参数之间得差异。分布:随机现象得规律性通过概率来刻画,而随机事件得所有结局及对应概率得排列称为分布。第二章定量资料得统计描述名词解释算术均数:描述一组数据在数量上得平均水平。总体均数用μ表示,样本均数用X表示。几何均数:用以描述对数正态分布或数据呈倍数变化资料得水平。记为G。中位数:将一组观察值由小到大排列,n为奇数时取位次居中得变量值;为偶数时,取位次居中得两个变量得平均值。

医学统计学试题及答案

医学统计学试题及答案 The latest revision on November 22, 2020

医学统计学一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制（ B ） A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式Ｂ负偏态分布Ｃ正偏态分布Ｄ正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮，其统计方法是（ A ） A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用（ A ） A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是（ A ） A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同

6. 男性吸烟率是女性的10倍，该指标为（ A ）（A）相对比（B）构成比（C）定基比（D）率 7、统计推断的内容为（ D ） A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验，其目的是检验（ C ） A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本，样本含量分别为n1和n2，在进行成组设计资料的t 检验时，自由度是（ D ）（A） n1+ n2 （B） n1+ n2 –1 （C） n1+ n2 +1 （D） n1+ n2 -2 10、标准误反映（ A ） A 抽样误差的大小 B总体参数的波动大小

统计学期末考试复习题及参考答案-高起本

《统计学》复习题一、单项选择题 1、“统计”的基本含义是（）。 A. 统计调查、统计整理、统计分析 B. 统计设计、统计分组、统计计算 C. 统计方法、统计分析、统计预测 D. 统计科学、统计工作、统计资料 2、调查某高校500名学生的学习成绩，则总体单位是（）。 A. 500名学生 B. 每一名学生 C. 500名学生的学习成绩 D. 每一名学生的学习成绩 3、统计总体的基本特征是（）。 A．同质性、大量性、差异性B．数量性、大量性、差异性 C．数量性、综合性、具体性 D．同质性、大量性、可比性 4、对某市占成交额比重大的5个大型集贸市场的成交额进行调查，这种调查的组织方式是（）。 A. 普查 B. 抽样调查 C. 重点调查 D. 典型调查 5、某连续变量数列，其末组为500以上，其邻组的组中值为480，则末组的组中值为（）。 A. 510 B. 520 C. 530 D. 540 6、统计分组的结果表现为（）。 A. 组内同质性,组间差异性 B. 组内差异性,组间同质性 C. 组内同质性,组间同质性 D. 组内差异性,组间差异性 7、某地区2012年完成产值4亿元，2013年计划增长10%，实际完成产值5亿元，超额完成计划为（）。 A. 10% B. 25% C. 112.56% D. 13.64% 8、下列标志变异指标中易受极值影响的指标是（）。 A. 全距 B. 平均差 C. 标准差 D. 标准差系数

9、某企业的产值逐年有所增长，2013年比2012年增长6%，2012年比2011年增长5%，2011年比2010年增长8%，则2013年比2010年定基增长速度为（）。 A. 6%+5%+8% B. 6%×5%×8% C.（106%×105%×108%）－1 D.（6%×5%×8%）—1 10、已知某公司1980年至2013年各年的各年年销售收入，计算该地区销售收入的年平均发展速度，应开（）。 A. 30次方 B. 31次方 C. 32次方 D. 33次方 11、在抽样调查中（）。 A. 总体是客观存在的，是唯一确定的 B. 总体不是客观存在和唯一确定的 C. 样本是客观存在的，是唯一确定的 D. 以上三种情况都不是 12、对于某一项调查来说，根据客观要求应有一个允许的误差限度，这个概念是（）。 A. 抽样平均误差 B. 抽样极限误差 C. 概率保证程度 D. 概率度 13、某企业某产品总成本今年比去年增长了50%，产量比去年增长25%，则单位成本比去年上升了（）。 A. 25% B. 75% C. 20% D. 37.5% 14、现象间相互依存关系程度越高，则相关系数值（）。 A. 越接近于0 B. 越接近于－1 C. 越接近于1 D. 越接近于－1或1 15、设某种产品的产量为1000件时，其生产成本为30000元，其中不变成本为6000元，则生产成本对产量的一元线性回归方程为（）。 A. Y＝6＋0.4X B. Y＝6000＋24X C. Y＝24000＋6X D. Y＝24＋6000X 16、就一次统计活动来说，一个完整的统计工作过程包括的阶段有（）。 A. 统计调查、统计整理、统计分析、统计预测 B. 统计调查、统计整理、统计分析、统计决策 C. 统计设计、统计调查、统计整理、统计分析

(完整word版)医学统计学试题和答案

（一）单项选择题 3．抽样的目的是（b ）。 A．研究样本统计量 B. 由样本统计量推断总体参数 C．研究典型案例研究误差 D. 研究总体统计量 4．参数是指（b ）。 A．参与个体数 B. 总体的统计指标 C．样本的统计指标 D. 样本的总和 5．关于随机抽样，下列那一项说法是正确的（ a ）。 A．抽样时应使得总体中的每一个个体都有同等的机会被抽取 B．研究者在抽样时应精心挑选个体，以使样本更能代表总体 C．随机抽样即随意抽取个体 D．为确保样本具有更好的代表性，样本量应越大越好 6.各观察值均加（或减）同一数后（ b ）。 A.均数不变，标准差改变 B.均数改变，标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用（ a ）。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中（d）可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用（c）描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后，（b）不变。 A．算术均数 B.标准差 C.几何均数 D.中位数 11.（ a ）分布的资料，均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种（ c ）分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料，可用（ c ）描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.（ c ）小，表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是（ c ）。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

卫生统计学考试重点总结复习

一、绪论 1.总体：根据研究目的确定的同质观察单位的全体，确切的说是同质的所有观察单位某种变量值的集合。 2.样本：从总体中随机抽取部分观察单位所组成的集合。 3.参数：用样本的指标来推算或估计出来的，用来说明总体情况的统计指标。 4.统计量：根据观察值计算出来的量，是用来描述和分析样本的统计指标。 5.变量的类型及其转换： ①定性变量：a.分类变量（计数资料）i.二分类变量 ii.多项无序分类 b.有序变量（等级资料） ②定量变量：a.连续型变量 b.离散型变量变量只能由“高级”向“低级”转化：定量→有序→分类→二值。 6.概率：是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括：统计学是一门处理数据中变异性的科学与艺术，内容包括收集、分析、解释和表达数据，目的是求得可靠的结果。 8.卫生统计学：运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象：有变异的事物。 10.统计工作的一般步骤：设计资料、搜集资料、整理资料、分析资料。 11.同质：指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异：同一总体内的个体间存在差异又是绝对的，这种现象称为变异。 13.误差可分为：系统误差、随机测量误差、抽样误差。 14.抽样误差：由于个体差异的存在，从某一总体中随机抽取一个样本，所得样本统计量与总体参数之间可能存在差异，这种差异称为抽样误差。二、定量资料的统计描述 1.频率分布表的编制步骤： ①计算极差R、②确定组段数与组距（一般为8-15组）、③确定各组段的上下限、④列表。 2.频率分布表的用途： ①揭示频数分布的分布特点和分布类型，文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时，可用各组段的频率作为概率的估计值。 3.中位数：指将原始观察值从小到大或从大到小排序后，位次居中的那个数。 4.四分位数间距：表示百分位数P75和百分位数P25之差，定义为Q=P75-P25，恰好包括总体中50%的个体观察值，用来描述偏态分布资料的离散趋势的指标。 5.标准差：即方差的算术平方根，是衡量对称分布资料的离散程度的指标，标准差大，则离散度大，标准差小，则离散度小。 6.变异系数：变异的大小S相对于其平均水平X的百分比，主要用于量纲不同的变量间，或均数差别较大的变量间变异程度的比较。三、定性资料的统计描述 1.构成比：说明一事物内部各组成部分在总体中所占的比重或分布，常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型：

统计学期中考试复习参考资料

统计学期中考试复习参考资料一、判断题(正确的填T,错误的填F) 1.统计分组的关键是确定组距和组数。( ) 2.假设检验指的是对样本均值、样本成数、样本方差的检验。( ) 3.双尾检验的原假设H0的陈述表达式用“=”号。 ( ) 4.假设检验中犯第一类错误的概率就是显著性水平α。 ( ) 5.抽样极限误差总是大于抽样平均误差。( ) 6．指标和标志一样，都是由名称和数值两部分组成的。（） 7．重点调查和抽样调查都是非全面调查，其调查结果都可以用于推算总体指标。（） 8．恩格尔系数属定类数据。（） 9．加权算术平均数和加权调和平均数都用变量值所出现的次数作为权数。（）10．所有可能的样本平均数的平均数，等于总体平均数。（） 11．单边检验中，由于所提出的原假设的不同，可分为左边检验和右边检验。（） 12．样本均值的方差大于总体方差。( ) 13．众数< 中位数< 平均数是正偏分布。( ) 14．对全国粮食生产基本情况进行调查最有效的调查方法是重点调查。( ) 15．相对指标属定序数据。( ) 16．总体参数是唯一确定的常量。( ) 17．调查某地区工业企业生产设备的利用情况，该地区的工业企业，既是调查单位，又是报告单位。（） 18．各变量值的次数相同时，众数不存在。（） 19．平均指标反映总体的离中趋势，标志变异指标反映总体的集中趋势。（） 20．如果总体平均数落在区间[960，1040] 内的概率保证程度为0.9545，则抽样平均误差等于30。（） 21．假设检验中，显著性水平为0.01时原假设被拒绝，则用0.05的显著性水平时原假设一定会被拒绝。（）二、单项选择题 1.下列指标中属于数量指标是（） A.劳动生产率 B.产量 C.人口密度 D.利润率 2．在全国人口普查中，总体单位是（） A.每一户 B.每个人 C.每个地区的人 D.全国总人口

医学统计学考试重点

考试题型：名词解释10个选择20个填空题20个简答4-5个讨论分析1-2题计算1-2题绪论 2选1 总体：总体（population）指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体，反之为无限总体。样本：从总体中随机抽取部分观察单位，其测量结果的集合称为样本（sample）。样本应具有代表性。所谓有代表性的样本，是指用随机抽样方法获得的样本。 3选1 小概率事件：我们把概率很接近于0（即在大量重复试验中出现的频率非常低）的事件称为小概率事件 P值：结果的统计学意义是结果真实程度（能够代表总体）的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义小概率原理：一个事件如果发生的概率很小的话，那么可认为它在一次实验中是不会发生的，数学上称之小概率原理。统计学中，一般认为等于或小于0.05或0.01的概率为小概率。资料的类型（3选1）（1）计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data）。计量资料亦称定量资料、测量资料。.其变量值是定量的，表现为数值大小，一般有度量衡单位。如某一患者的身高（cm）、体重(kg)、红细胞计数(1012/L)、脉搏（次/分）、血压（KPa）等。（2）计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。如调查某地某时的男、女性人口数；治疗一批患者，其治疗效果为有效、无效的人数；调查一批少数民族居民的A、B、AB、O 四种血型的人数等。（3）等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡，各种结果既是分类结果，又有顺序和等级差别，但这种差别却不能准确测量；一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。等级资料与计数资料不同：属性分组有程度差别，各组按大小顺序排列。等级资料与计量资料不同：每个观察单位未确切定量，故亦称为半计量资料。 2选1 抽样误差（sampling error ）是指样本统计量与总体参数的差别。在总体确定的情况下，总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。系统误差：由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是

卫生统计学试题6含答案

统计试题题库 1. 下列那个是对标化后总死亡率的正确描述？ A A．仅仅作为比较的基础，它反映了一种相对水平 B．它反映了实际水平 C．它不随标准选择的变化而变化 D．它反映了事物实际发生的强度 E．以上都不对 2. 两样本作均数差别的t检验，要求资料分布近似正态，还要求： D A．两样本均数相近，方差相等 B．两样本均数相近 C．两样本方差相等 D．两样本总体方差相等 E．两样本例数相等 3. 四格表资料的卡方检验时无需校正，应满足的条件是: D A．总例数大于40 B．理论数大于5 C．实际数均大于l D．总例数大于40且理论数均大于或等于5 E．总例数小于40 4. 总体应该是由： D

A．研究对象组成 B．研究变量组成 C．研究目的而定 D．同质个体组成 E．任意个体组成 5. 两样本均数比较的t检验中，结果为P<0.05，有统计意义。P愈小则: E A．说明两样本均数差别愈大 B．说明两总体均数差别愈大 C．说明样本均数与总体均数差别愈大 D．愈有理由认为两样本均数不同 E．愈有理由认为两总体均数不同 6. 抽样误差是指: D A．总体参数与总体参数间的差异 B．个体值与样本统计量间的差异 C．总体参数间的差异 D．样本统计量与总体统计量间的差异 E．以上都不对 7. 抽签的方法属于下列那种抽样： D A．分层抽样 B．系统抽样 C．整群抽样 D．单纯随机抽样 E．分级抽样

8. 以舒张压≥12.7KPa为高血压，测量1000人，结果有990名非高血压患者，有10名高血压患者，该资料属下列那类资料： B A．计算 B．计数 C．计量 D．等级 E．都对 9. 实验设计中要求严格遵守四个基本原则，其目的是为了： D A．便于统计处理 B．严格控制随机误差的影响 C．便于进行试验 D．减少和抵消非实验因素的干扰 E．以上都不对 10. 两个样本作t检验，除样本都应呈正态分布以外，还应具备的条件是： B A．两样本均数接近 B．两S2数值接近 C．两样本均数相差较大 D．两S2相差较大 E．以上都不对 11. 同一总体的两个样本中，以下哪种指标值小的其样本均数估计总体均数更可靠？A A．Sx B．S C．X D．CV

医学统计学考试(详细)

医学统计学基本概念 1.医学统计学是以医学理论为指导，应用概率论与数理统计的有关原理和方法，研究医学资料的搜集、整理、分析和推断的一门应用科学。 2.统计工作的步骤：（1）设计（2）收集资料（3）整理资料（4）分析资料；或者分三步：（1）研究设计（2）资料分析（3）结论。 3.定量资料：又称为数值变量资料，特点：（1）各观察值之间有量的差别；（2）数据间有连续性。它是指变量的取值不止是可列个，而是可取某区间[a,b]，（-oo,oo）上的一切值。 4.定性资料：又称为分类资料、分类变量资料（包括二项分类、多项分类资料），特点：（1）各观察值之间有质的差别；（2）数据间有离散性。它是指变量的取值有限的，至多是可列多个。附：无序分类：二项分类、多项分类 5.等级资料：又称为半定量资料，有序分类，指各类之间有程度的差别。特点：（）各观察单位间或者相同，或者存在质的差别；（2）各等级间只有顺序，而无数值大小，故等级之间不可度量。 6.个体individual：即每个观察单位。 7.总体population：根据研究目的确定的同质观察单位的全体。 8.样本：是从总体中随机抽取部分观察单位，其实测值的集合。样本包含的观察单位数称为样本含量或样本大小。 9.参数parameters：描述某总体特征的统计指标称为总体参数，简称参数。如总体均数、总体标准差等。特点：参数是未知的，固有的，不变的！ 10.统计量：描述某样本特征的的统计指标称为样本统计量，简称统计量。特点：统计量是已知的，变化的，有误差的！ 11.概率probability：是描述随机事件发生的可能性大小的数值。常用P表示。它的大小界于0和1之间。 12.随机事件：（1）可重复性：相同条件下可重复进行；（2）随机性：出现两种机两种以上结果；（3）偶然性：实验前不能肯定将出现哪种结果。 13.频率的稳定性：在重复试验中，事件A的频率随着试验次数的不断增加将愈来愈接近一个常数p，频率的这一特性称为频率的稳定性。 14.概率的统计定义：频率的稳定性充分说明随机事件出现的可能是事物本身固有的一种客观属性，因而是可以被认识和度量的。这个常数p就称为事件A出现的概率(probability)，记作P(A) 或P。这一定义称为概率的统计定义。它是事件A发生的可能性大小的一个度量。容易看出，频率为一变量，是样本统计量，而概率为常数，是一总体参数。实践中，当试验次数足够多时，可以近似地将频率作为概率的一个估计。 15.小概率原理：当某事件发生的概率小于或等于0.05时，统计学通常称该事件为小概率事件，其涵义为该事件发生的可能性很小，进而认为其在一次抽样中不可能发生，此即为小概率原理。 16.同质（homogeneity）：性质相同的事物称为同质的。 17.变异(variation)：同质的事物内个体之间或同一个体重复测量间的差别称为变异。 18.参考值范围(reference interval)又称正常值范围(normal range)。由于正常人的形态、功能、生化等各种指标的数据因人而异，而且同一个人的某些指标还会随着时间、机体内外环境的改变而变化，因此需要确定其波动范围，即正常值范围，简称正常值(normal value)。 19.正常值范围(normal ranges)，是指绝大多数正常人的某指标范围。 20.抽样误差(sampling error):由于抽样造成的样本统计量和总体参数之间的差异。 21.标准误(standard error)：样本统计量的标准差称为标准误。样本均数的标准差称为均数的标准误。 22.参数估计：由样本信息估计总体参数称为参数估计，包括点估计和区间估计。 23.点估计(point estimation) ：直接用样本统计量作为总体参数的估计值。这种估计方法简单，但未考虑抽样误差的大小。 24.区间估计(interval estimation) ：按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围，这个范围称作可信度为1-α的可信区间(confidence interval, CI)，又称置信区间。这种估计方法称为区间估计。 25.可信度为1-α的可信区间的确切涵义是：每100个样本所算得的100(1-α)％可信区间，平均有100(1-α)个包含了总体参数。如取α=0.05，则每100个样本所算得的100个95％可信区间，平均有95个包含总体参数在内，有5个不包含总体参数。 26.可信区间的两个要素：第一个要素是可靠性，常用可信度1-α的大小表示；第二个要素是精确性，常用可信区间的长度CU-CL衡量。 27.均数95%可信区间，其涵义是：如果重复100次抽样，每次样本含量均为n，每个样本均按（见课本P42）构建可信区间，则在此100个可信区间内，理论上有95个包含总体均数，而有5个不包含总体均数。 28.可信度为95%的CI的涵义：每100个样本，按同样方法计算95%的CI，平均有95%的CI包含了总体参数。这里的95%，指的是方法本身！而不是某个区间！ 29.第一类错误（I型错误）：拒绝了实际上成立的H0假设，称为“假阳性”, 用α来表示。 30.第二类错误（II型错误）：不拒绝实际上不成立的H0，称为“假阴性”,用β来表示。 31.检验效能(power of a test)或检验功效：1-β称检验效能(power of a test)，过去称把握度。为当两总体确有差异，按检验水准α所能发现该差异的能力。1-β只取单尾。 32.完全随机设计：根据某一试验因素，将试验对象完全按随机设计分为若干个组，每个组的样本例数可以相等，也可以不等，分别求出各组试验结果的均数，即为单因素多个样本均数，单个因素可以有多个水平，R>2 33.随机区组设计又称配伍组设计(Random Block Design)：即两因素多个样本均数的比较(或称两因素方差分析，two way analysis of variance）。 34.绝对数：在计数资料中，各组的观察数称绝对数。 35.相对数：是两个有联系的指标的比，计数资料的统计描述主要是相对数（relative number）。 36.率（rate）：说明某现象发生的频率或强度，常用%、‰、1/万、1/10万等作单位，表示在一定范围内,某现象的发生数与可能发生某现象的总数之比。率的结果常以保留1-2位整数为宜。

期末考试复习--统计学

习题课 1、有两个班同学参加统计学考试，甲班的平均分数81分，标准差9.9分，乙班的考试成绩如下：要求：（1）计算乙班的平均分数和标准差。（2）比较哪个班的平均分数更有代表性。解题过程参考教材和作业。 2、某钢铁厂2002年—2007年钢铁产量如下表。（1）计算出表中各动态分析指标的数值，并填入表内的相应格中，

（2）计算2002年—2007年的平均增长量。需要掌握的时间序列的动态分析指标有： 1．增长量： (1) 逐期增长量：12312;;;----n n a a a a a a (2) 累积增长量：00201;;;a a a a a a n --- (3) 平均增长量 = 逐期增长量之和/逐期增长量个数 = 累积增长量/(时间序列项数－1) 2．发展速度与增长速度： (1) 环比发展速度：123 12,,,-n n a a a a a a (2) 定基发展速度： 02 01,,a a a a a a n (3) 增长速度 = 发展速度－1 (4) 平均发展速度 = n n a a 0 (5) 平均增长速度 = 平均发展速度－1 3、某厂生产的三种产品的有关资料如下:

要求: (1)计算三种产品的价格总指数以及由于价格变动使销售总额变动的绝对额 (2)计算三种产品的销售量总指数以及由于销售量变动而使销售总额变动的绝对额 (3)利用指数体系分析说明销售总额(相对程度和绝对额)变动的情况解:列表计算如下:

(1)三种产品的价格指数： %11515.126100 30100 11 1或== = ∑∑z q z q k z 由于价格变动影响的销售总额绝对额： ∑∑0111-z q z q =30100-26100=4000元 (2)三种产品的销售量总指数： %10303.125350 26100 001或== = ∑∑z q z q k q 由于销售量变动影响的销售总额绝对额： ∑∑0001-z q z q =26100-25350=750元 (3) 销售总额指数： %7.118187.125350 30100 01 1或== = ∑∑z q z q k qz 销售总额的绝对额： ∑∑0011-z q z q =30100-25350=4750元指数体系:118.7%=115%*103% 4750万元=4000万元+750万元分析说明:………….….。 4、宁波新四方快餐厅连续3个星期抽查49位顾客，以调查顾客的平均消费额，得样本平均消费额为25元，并假设总体的标准差为10.5元，要求：

9住院医师规培考试卫生统计学方法与应用(下)

1、某地进行甲型病毒性肝炎的调查中，共发现病人231例。其中男性158例占68.40%，女性73例占31.60%，提示（）* ? A.男性因在外就餐机会多发病机会就高 ? B.男性病人比例高于女性病人 ? C.男性发病率高 ? D.男性患病率高 ? E.不能说明任何问题 2、甲乙两地某病的死亡率进行标准化计算时，其标准选择（）* ? A.不能用甲地数据 ? B.不能用乙地数据 ? C.不能用甲地和乙地的合并数据 ? D.可能用甲地或乙地的数据 ? E.以上都不对 3、若已知该省成年男性血红蛋白平均水平，欲了解某县正常成年男性的血红蛋白含量是否高于该省正常水平，应采用（）* ? A.样本均数与总体均数比较的t检验 ? B.配对t检验 ? C.成组t检验 ? D.配对设计差值的符号秩和检验 ? E.成组设计两样本比较的秩和检验 4、对于一组服从双变量正态分布的资料，经直线相关分析得相关系数r=0.9，对该资料拟合回归直线，则其回归系数b值（）*

? A.b>0 ? B.b=0 ? C.b<0 ? D.b=1 ? E.不能确定正负 5、对原始统计资料的要求是（）* ? A.及时收集完整、准确的资料 ? B.综合资料 ? C.方差分析时要求个样本所在总体的方差相等 ? D.完全随机设计的方差分析时，组内均方就是误差均方 ? E.完全随机设计的方差分析时，F=MS组间/MS组内 6、实验设计应遵循的基本原则是（）* ? A.随机化、对照、盲法 ? B.随机化、盲法、配对 ? C.随机化、重复、配对 ? D.随机化、齐同、均衡 ? E.随机化、对照、重复 7、作符号秩和检验时，统计量T为较小的秩和，则正确的是（）* ? A.T值越大越有理由拒绝HO ? B.T值越大越有理由拒绝HO ? C.P值与T值毫无关系

卫生统计学考试复习题参考答案

、单项选择题 1．观察单位为研究中的( )。 A ．样本 B ．全部对象 C ．影响因素 D ．个体 2．总体是由（）。 A ．个体组成 B ．研究对象组成 C ．同质个体组成 D ．研究指标组成 3．抽样的目的是（）。 A ．研究样本统计量 B ．由样本统计量推断总体参数 C ．研究典型案例研究误差 D ．研究总体统计量 4．参数是指（）。 A ．参与个体数 B ．总体的统计指标 C ．样本的统计指标 D ．样本的总和 5．关于随机抽样，下列那一项说法是正确的（）。 A ．抽样时应使得总体中的每一个个体都有同等的机会被抽取 B ．研究者在抽样时应精心挑选个体，以使样本更能代表总体 C ．随机抽样即随意抽取个体 D ．为确保样本具有更好的代表性，样本量应越大越好 6．各观察值均加（或减）同一数后（）。 A ．均数不变，标准差改变 B ．均数改变，标准差不变 C ．两者均不变 D ．两者均改变 7．比较身高和体重两组数据变异度大小宜采用（）。 A ．变异系数 B ．方差 C ．极差 D ．标准差 8．以下指标中（）可用来描述计量资料的离散程度。 A ．算术均数 B ．几何均数 C ．中位数 D ．标准差 9．血清学滴度资料最常用来表示其平均水平的指标是（）。 A ．算术平均数 B ．中位数 C ．几何均数 D ．平均数 10．两样本均数的比较，可用（）。 A ．方差分析 B ．t 检验 C ．两者均可 D ．方差齐性检验 11．配伍组设计的方差分析中，ν配伍等于（）。 A ． ν总-ν误差 B ．ν总-ν处理 C ． ν总-ν处理+ν误差 D ．ν总-ν处理 - ν误差 12．在均数为 μ，标准差为σ 的正态总体中随机抽样， ≥-||μX （）的概率为5%。 A ．1.96σ B ． 1.96X σ C ． 0.052,t s ν D. 0.052,X t S ν 13．完全随机设计方差分析的检验假设是（）。 A ．各处理组样本均数相等 B ．各处理组总体均数相等 C ．各处理组样本均数不相等 D ．各处理组总体均数不全相等 14．已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率，但甲乡人口女多于男，而乙乡男多于女，适当的比较方法是（）。 A ．分别进行比较 B ．两个率比较的χ2检验 C ．不具备可比性，不能比较 D ．对性别进行标准化后再比较 15．率的标准误的计算公式是（）。 A ． )1(p p - B ．n p p ) 1(- Ｃ． 1-n p Ｄ．n p p )1(- 16．非参数统计应用条件是（）。 A ．总体是正态分布 B ．若两组比较，要求两组的总体方差相等 C ．不依赖于总体分布 D ．要求样本例数很大 17．下述哪些不是非参数统计的特点（）。 A ．不受总体分布的限定 B ．多数非参数统计方法简单，易于掌握 C ．适用于等级资料 D ．检验效能总是低于参数检验 18．设配对设计资料的变量值为X1和X2，则配对资料的秩和检验（）。 A ．把X1与X2的差数绝对值从小到大编秩 B ．把X1和X2综合从小到大编秩 C ．把X1和X2综合按绝对值从小到大编秩 D ．把X1与X2的差数从小到大编秩 19．秩和检验和t 检验相比，其优点是（）。 A ．计算简便，不受分布限制 B ．公式更为合理

预防医学考试重点完整最新版

预防医学医学统计学第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异：由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。总体：总体（population）指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体，反之为无限总体。样本：从总体中随机抽取部分观察单位，其测量结果的集合称为样本（sample）。样本应具有代表性。所谓有代表性的样本，是指用随机抽样方法获得的样本。样本特性代表性随机性可靠性可比性 3选1 小概率事件：我们把概率很接近于0（即在大量中出现的频率非常低）的事件称为小概率事件。 P值：结果的统计学意义是结果真实程度（能够代表总体）的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。小概率原理：一个事件如果发生的概率很小的话，那么可认为它在一次实验中是不会发生的，数学上称之小概率原理。统计学中，一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型（3选1）（1）计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data）。计量资料亦称定量资料、测量资料。.其变量值是定量的，表现为数值大小，一般有度量衡单位。如某一患者的身高（cm）、体重(kg)、红细胞计数(1012/L)、脉搏（次/分）、血压（KPa）等。（2）计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。如调查某地某时的男、女性人口数；治疗一批患者，其治疗效果为有效、无效的人数；调查一批少数民族居民的A、B、AB、O 四种血型的人数等。（3）等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡，各种结果既是分类结果，又有顺序和等级差别，但这种差别却不能准确测量；一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。等级资料与计数资料不同：属性分组有程度差别，各组按大小顺序排列。等级资料与计量资料不同：每个观察单位未确切定量，故亦称为半计量资料。 3选1 抽样误差（sampling error ）是指样本统计量与总体参数的差别。在总体确定的情况下，总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。系统误差：由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。随机测量误差:在收集原始资料时，仪器由于各种偶然因素造成同一对象多次测定的结果不一致。统计的步骤（考填空题，四个空）医学统计工作的内容１．实验设计：设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研究中最关键的一环，是今后工作应遵循的依据。２．收集资料：应采取措施使能取得准确可靠的原始数据。３．整理资料：简化数据，使其系统化、条理化，便于进一步分析计算。４．分析资料：计算有关指标，反映事物的综合特征，阐明事物的内在联系和规律。分析资料包括统计描述和统计推断。实验设计的基本原则（考填空题，三个空）随机化原则、对照的原则（对照的类型，对照的设置）、重复的原则。对照的类型空白对照实验对照标准对照自身对照相互对照历史对照安慰剂对照 2选1 参数：参数（ｐａｒａｍａｔｅｒ）是指总体的统计指标，如总体均数、总体率等。总体参数是固定的常数。多数情况下，总体参数是不易知道的，但可通过随机抽样抽取有代表性的样本，用算得的样本统计量估计未知的总体参数。统计量：统计量（ｓｔａｔｉｓｔｉｃ）是指样本的统计指标，如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。完全随机设计常用的几种实验设计方法：配对设计和完全随机设计（名解2选1）完全随机设计：完全随机设计仅涉及一个处理因素（但可为多水平），故又称单因素（one-way）设计。它是将受试对象按随机化的方法分配到各个处理组中，观察实验效应，临床试验中的随机对照试验也属于此类设计。配对设计：是将受试对象按一定条件配成对子，再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。第二章集中趋势的统计描述频数表的制作步骤以及频数分布表的用途（问答题）频数分布表的编制步骤：例：某市1982年50名7岁男童的身高(cm)资料如下，试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1