统计学二项分布习题,DOC
医学统计学二项分布

率20的21/抽12样/11误差
从 =中随机抽样,样本含量为100的 10000个样本率的频率分布图
率20的21/抽12样/11分布特点 当总体率时为正偏态;当时为负偏态,当时为对称分布。 在n较大,且率和(1- )都不太小时即n和n(1-)均大于5,率的抽样分布近似正态分布。
率20的21/标12准/11误
二20项21/分12布/11(binomial distribution)
二分类资料:观察对象的结局只有相互对立的两种结果。
例如:
生存、死亡 阳性、阴性 发病、不发病 治愈、未愈
先20看21/一12个/11例子
已知:小白鼠接受某种毒物一定剂量时, 死亡概率=80% 生存概率=20%
每只鼠独立做实验,相互不受影响 若每组各用3只小白鼠(甲、乙、丙) 3只小白鼠的存亡方式符合二项分布
医学统计学二项分布
主20要21/内12容/11
数据分布 二项分布
数20据21/分12布/11
对于一组变量值,若以该变量为横轴,数据出现的频数(或频率)为纵轴作图,该数据在坐标 系中呈一定的图形,称为数据的分布。
数20据21/分12布/11
分布是统计方法产生的基础 常用的数据分布有正态分布、二项分布、Poisson分布等
Page 17
2021/12/11
如已知n=3,,则恰有1例阳性的概率P(1)为:
P(1)
C
1 n
(1
) n1
1
3! 1!(3 1)!
(1
0.8)31 0.81
0.096
二项分布的概率
2021/12/11
• 例已知某种动物关于某毒物的50%致死剂量(LD50),现有5只这样的动物注射了该剂量,试 分别计算死亡动物数X=0,l,2,3,4,5的概率。
统计学》课程习题参考答案(部分)

《统计学》课程部分习题参考答案(龚凤乾)1.试针对统计学的三种任务各举一例。
答:见授课题板。
2.举例说明统计分组可以完成的任务。
答:见授课题板。
3.举一个单向复合分组表的例子,再举一个双向复合分组表的例子。
答:单向复合分组表的例如下4.某市拟对该市专业技术人员进行调查,想要通过调查来研究下列问题:(1)通过描述专业技术人员队伍的学历结构来反映队伍的整体质量;(2)研究专业技术人员总体的职称结构比例是否合理;(3)描述专业技术人员总体的年龄分布状况;(4)研究专业技术人员完成的科研成果数是否与其最后学历有关。
请回答:(1)该项调查研究的调查对象是该市全部专业技术人员;(2)该项调查研究的调查单位是该市每一位专业技术人员;(3)该项调查研究的报告单位是该市每一位专业技术人员;(4)为完成该项调查研究任务,对每一个调查单位应询问下列调查项目学历、职称、年龄、科研成果数。
5根据上表指出:(1)上表变量数列属于哪一种变量数列;(2)上表中的变量、变量值、上限、下限、次数(频数);(3)计算各组组距、组中值、频率。
答:(1)连续型组距式分组;(2)连续型组距式分组的组距=本组上限—本组下限;组中值=(上限+下限)/2;频率= ii f f /6.某地区人口统计数据如下表,请在此表的空白处添加以下数字:组距、组中值、频率、上限以下累计频数。
注:年龄以“岁”为单位计算,小数部分按舍尾法处理。
7.对下列指标进行分类。
(只写出字母标号即可)A 手机拥有量B 商品库存额C 市场占有率D 人口数E 出生人口数F 单位产品成本G 人口出生率H 利税额 (1)时期性总量指标有: EH ;(2)时点性总量指标有: ABD ; (3)质量指标有: CFG ;(4)数量指标有: ABDEH ; (5)离散型变量有: ADE ;(6)连续型变量有: BCFGH 。
8.现在把某地区1999年末全部个体经营工业单位作为研究对象。
对这个统计总体,设计了“1999年末全部个体经营工业单位总数”和上述这个个体经营工业单位总体的“1999年全年产品销售收入”两个统计指标。
张勤主编的生物统计学方面的习题作业及答案

第一章绪论一、名词解释总体个体样本样本含量随机样本参数统计量准确性精确性二、简答题1、什么是生物统计?它在畜牧、水产科学研究中有何作用?2、统计分析的两个特点是什么?3、如何提高试验的准确性与精确性?4、如何控制、降低随机误差,避免系统误差?第二章资料的整理一、名词解释数量性状资料质量性状资料半定量(等级)资料计数资料计量资料二、简答题1、资料可以分为哪几类?它们有何区别与联系?2、为什么要对资料进行整理?对于计量资料,整理的基本步骤怎样?3、在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好?4、统计表与统计图有何用途?常用统计图、统计表有哪些?第三章平均数、标准差与变异系数一、名词解释算术平均数几何平均数中位数众数调和平均数标准差方差离均差的平方和(平方和)变异系数二、简答题1、生物统计中常用的平均数有几种?各在什么情况下应用?2、算术平均数有哪些基本性质?3、标准差有哪些特性?4、为什么变异系数要与平均数、标准差配合使用?三、计算题1、10头母猪第一胎的产仔数分别为:9、8、7、10、12、10、11、14、8、9头。
试计算这10头母猪第一胎产仔数的平均数、标准差和变异系数。
2、随机测量了某品种120头6月龄母猪的体长,经整理得到如下次数分布表。
试利用加权法计算其平均数、标准差与变异系数。
组别组中值(x)次数(f)80—84 288—92 1096—100 29104—108 28112—116 20120—124 15128—132 13136—140 33、某年某猪场发生猪瘟病,测得10头猪的潜伏期分别为2、2、3、3、4、4、4、5、9、12(天)。
试求潜伏期的中位数。
4、某良种羊群1995—2000年六个年度分别为240、320、360、400、420、450只,试求该良种羊群的年平均增长率。
5、某保种牛场,由于各方面原因使得保种牛群世代规模发生波动,连续5个世代的规模分别为:120、130、140、120、110头。
《统计学》(贾俊平,第五版)分章习题及答案

《统计学》分章习题及答案(贾俊平,第五版)主编:杨群目录习题部分 (2)第1章导论 (3)第2章数据的搜集 (4)第3章数据的整理与显示 (5)第4章数据的概括性度量 (6)第5章概率与概率分布 (10)第6章统计量及其抽样分布 (11)第7章参数估计 (11)第8章假设检验 (13)第9章分类数据分析 (14)第10章方差分析 (16)第11章一元线性回归 (17)第12章多元线性回归 (19)第13章时间序列分析和预测 (22)第14章指数 (25)答案部分 (30)第1章导论 (30)第2章数据的搜集 (30)第3章数据的图表展示 (30)第4章数据的概括性度量 (31)第5章概率与概率分布 (32)第6章统计量及其抽样分布 (33)第7章参数估计 (33)第8章假设检验 (34)第9章分类数据分析 (34)第10章方差分析 (36)第11章一元线性回归 (37)第12章多元线性回归 (38)第13章时间序列分析和预测 (40)第14章指数 (41)习题部分第1章导论一、单项选择题1.指出下面的数据哪一个属于分类数据()A.年龄B.工资C.汽车产量D.购买商品的支付方式(现金、信用卡、支票)2.指出下面的数据哪一个属于顺序数据()A.年龄B.工资C.汽车产量D.员工对企业某项制度改革措施的态度(赞成、中立、反对)3.某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的人均收入4.了解居民的消费支出情况,则()A.居民的消费支出情况是总体B.所有居民是总体C.居民的消费支出情况是总体单位D.所有居民是总体单位5.统计学研究的基本特点是()A.从数量上认识总体单位的特征和规律B.从数量上认识总体的特征和规律C.从性质上认识总体单位的特征和规律D.从性质上认识总体的特征和规律6.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。
统计学二项分布习习题

欢迎阅读(一)单项选择题1.某地人群中高血压的患病率为π,由该地区随机抽查n 人,则( )A .样本患病率p =X /n 服从B (n , π)B .n 人中患高血压的人数X 服从B (n , π)C .患病人数与样本患病率均不服从B (n , π)D .患病人数与样本患病率均服从B (n , π)答案:B[评析] 本题考点:二项分布概念的理解。
二项分布中所指的随机变量X 代表n 次试验中出现某种结果的次数,具体到本题目就是指抽查的n2 [n ,π)案为D 。
3. A C [记。
4. 95% A C [评析]本题考点:Poisson 分布的正态近似性。
当X 较大(一般大于50)时,Poisson 分布近似正态分布,按照正态分布资料的计算公式计算该地区井水中平均每升细菌含量的95%可信区间,再除以1000即得平均每毫升井水中细菌的平均含量(设1000X Y =,有1000100001000==X Y S S )。
(二) 是非题从装有红、绿、蓝三种颜色的乒乓球各500、300、200只的暗箱中随机取出10个球,以X 代表所取出球中的红色球数,则X 服从二项分布B (10,0.5)。
( )答案:正确。
[评析] 本题考点:二项分布的定义。
二项分布成立的条件是:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。
此题目所述情况完全满足后两个条件,关键在于第一个条件的判断,从表面上看,每次试验的结果有三种,但本题目所关心的试验结果是“红色与否”,因而该试验结果仍为两种互斥的情况—“红色”和“非红色”。
所以,此题目所述情况满足以上三个条件,X服从二项分布B (10,0.5)。
(三)计算题炮击命中目标的概率为0.2,共发射了14发炮弹。
已知至少要两发炮弹命中目标才能摧毁之,试求摧毁目标的概率。
答案:0.802[评析]本题的考点:二项分布概率函数的理解和应用能力。
摧毁目标的概率即有两发或两发以上炮弹命中目标的概率,此概率又等于1减去只有一发命中1. = X1+X22.4.5.的数量,若进行100次这样的抽查,其中的95次所得数据应在以下范围内()。
统计学习题

考核分为3部分:1. 平时成绩,主要以到课情况为依据。
一般占总成绩10%左右。
2. 上机SAS软件操作考试。
一般占总成绩的20%~40%。
3. 期末卷面理论考核,占总成绩的50%~70%。
下面的统计学试题供同学们参考:《卫生统计学》考试题库目录第一章绪论第二章定量资料的统计描述第三章正态分布第四章总体均数的估计和假设检验第五章方差分析第六章分类资料的统计描述第七章二项分布与Poisson分布及其应用第八章χ2检验第九章秩和检验第十章回归与相关第十一章常用统计图表第十二章实验设计第十三章调查设计第十四章医学人口统计与疾病统计常用指标第十五章寿命表第十六章随访资料的生存分析附录:单项选择题参考答案第一章绪论一、名词解释1. 参数 (parameter)2. 统计量 (statistic)3. 总体(population)4. 样本 (sample)5. 同质 (homogeneity)6. 变异(variation)7. 概率 (probability) 8. 抽样误差 (sampling error)二、单选题1.在实际工作中,同质是指:A.被研究指标的影响因素相同B.研究对象的有关情况一样C.被研究指标的主要影响因素相同D.研究对象的个体差异很小E.以上都对2. 变异是指:A.各观察单位之间的差异B.同质基础上,各观察单位之间的差异C.各观察单位某测定值差异较大D.各观察单位有关情况不同E.以上都对3.统计中所说的总体是指:A.根据研究目的而确定的同质的个体之全部B.根据地区划分的研究对象的全体C.根据时间划分的研究对象的全体D.随意想象的研究对象的全体E.根据人群划分的研究对象的全体4. 统计中所说的样本是指:A.从总体中随意抽取一部分B.有意识地选择总体中的典型部分C.依照研究者的要求选取有意义的一部分D.从总体中随机抽取有代表性的一部分E.以上都不是5.按随机方法抽取的样本特点是:A.能消除系统误差B.能消除随机测量误差C.能消除抽样误差D.能减少样本偏性E.以上都对6.统计学上的系统误差、测量误差、抽样误差在实际工作中:A.均不可避免B.系统误差和测量误差不可避免C.测量误差和抽样误差不可避免D.系统误差和抽样误差不可避免E.只有抽样误差不可避免7.统计工作的基本步骤是:A.设计、调查、审核、整理资料B.收集、审核、整理、分析资料C.设计、搜集、整理、分析资料D.调查、审核、整理、分析资料E.以上都不对8.统计工作的关键步骤是:A.调查或实验设计B.整理分组C.收集资料D.审核资料E.分析资料9.欲研究某种药物对高血压病的疗效,临床观察300名病人的血压情况,确切地说,研究总体是:A.这300名高血压患者B.这300名高血压患者的血压值C.所有的高血压患者D.所有的高血压患者的血压值E.这种药物10.抽样误差是由:A.计算引起B.测量引起C.抽样引起D.采样结果不准引起E.试剂、仪器未经校正引起11.抽样误差指的是:A.个体值和总体参数值之差B.个体值和样本统计量值之差C.样本统计量值和总体参数值之差D.不同的总体参数之差E.以上都不是12.习惯上,下列属于小概率事件的为:A. P=0.09B. P=0. 10C. P=0.15D. P=0.03E.以上都不是13.治疗效果判定资料属于A. 计量资料B. 计数资料C. 等级资料D. 无序分类资料E. 以上都不是14.概率P的范围:A. -1≤P≤1B. 0<P<1C. P≥1D. -1≤P≤0E. 0≤P≤1三、简答题1、统计学的基本步骤有哪些?2、总体与样本的区别与关系?3、抽样误差产生的原因有哪些?可以避免抽样误差吗?4、何为概率及小概率事件?第二章定量资料的统计描述第三章正态分布一、名词解释1. 正态分布 (normal distribution)2. 中位数 (median)3. 四分位数间距 (quartile interval)4. 方差 (variance)5. 正偏态分布 (positively skewed distribution)6. 负偏态分布 (negatively skewed distribution)7. 对数正态分布 (logarithmic normal distribution )8. 医学参考值范围 (medical reference range)二、单选题1.μ确定后,δ越大, 则正态曲线:A.越陡峭B. 形状不变C. 越平缓D.向左移动E.向右移动2. 平均数可用于分析下列哪种资料:A.统计资料B.等级资料C.计数资料D.计量资料E.调查资料3. 常用的平均数指标有:A.样本均数、总体均数、中位数B.算术均数、总体均数、几何均数C.算术均数、几何均数、中位数D.中位数、样本均数、几何均数E.以上都不对4. 描述一组正态或近似正态分布资料的平均水平用:A.算术均数B.几何均数C.中位数D.平均数E.以上均是5. 用/n公式计算均数的方法称为:A.加权法B.简捷法C.目测法D.平均法E.直接法6. 用频数表计算均数时, 若以各组段下限值作为组中值计算均数, 要使所得值等于原均数, 则应:A.减一个组距B.加一个组距C.减半个组距D.加半个组距E.以上均不对7. 对于一组呈负偏态分布的资料,反映其平均水平应用哪个指标:A.几何均数B.中位数C.平均数D.均数E.算术均数8. 用频数表法计算均数时,组中值应为:A.(本组段下限值+本组段上限值)/2B.(本组下限值+下组下限值)/2C.(本组下限值+下组上限值)/2D.本组段的上限值E.本组段的下限值9. 原始数据加上一个不为0的常数后:A. 不变、CV变B. 变或CV变C. 不变、CV不变D. 变、CV不变E. 、CV均改变10. 对于对称分布的资料来说:A.均数比中位数大B.均数比中位数小C.均数等于中位数D.均数与中位数无法确定孰大孰小E.以上说法均不准确11. 血清学滴度资料最常计算_______以表示其平均水平。
统计学练习题最新版本

第一部分:单选题(一)1、一位教授计算了全班20个学生考试成绩均值、中数和众数,发现大部分同学的考试成绩集中于高分段,下面哪句话不可能是正确的?()A 全班65%的同学的考试成绩高于平均值B全班65%的同学的考试成绩高于中数C全班65%的同学的考试成绩高于众数D全班同学的考试成绩是负偏态2、一个N=10的总体,若其离差平方和是200,则其离差的和Σ(X i-μ)是()A 14.14B 200C 数据不足,无法计算D 以上都不对3、中数在一个分布中的百分等级是()。
A 50B 75C 25D 50~514、平均数是一组数据的()。
A 平均差B 平均误C 平均次数D 平均值5、六名考生在作文题上的得分为12、8、9、10、13、15,其中数为()。
A 12B 11C 10D 96、下列描述数据集中情况的统计量是()。
A M M dμB M0 M d SC S ωσD M M d M g7、对于下列实验数据:1,108,11,8,5,6,8,8,7,11,描述其集中趋势用()最为适宜,其值是()A 平均数,14.4B 中数,8.5C 众数,8 D众数,118、一个n=10的样本其均值是21,在这个样本中增添了一个分数,得到的新样本均值是25,这个增添的分数值为()。
A 40B 65C 25D 219、有一组数据其均值是20,对其中的每一个数据都加上10,那么得到的这组新数据的均值是()。
A 20B 10C 15D 3010、有一组数据其均值是25,对其中的每一个数据都乘以2,那么得到的这组新数据的均值是()。
A 25B 50C 27D 211、一个有10 个数据的样本,它们中的每一个分别与20相减后所得的差相加是100,那么这组数据的均值是()。
A 20B 10C 30D 5012、下列数列4、6、7、8、11、12的中数为()。
A 7.5B 15C 7D 813、下列易受极端数据影响的统计量是()。
医学统计学第6章二项分布与泊松分布(108页)

简历
返回总目录 返回章目录 第7章 二项分布与泊松分布
第1页
结束
MEDICAL STATISTICS
简历
返回总目录 返回章目录 第7章 二项分布与泊松分布
第2页
结束
《医学统计学》目录
第1章 绪论 第2章 定量资料的统计描述 第3章 总体均数的区间估计和假设检验 第4章 方差分析 第5章 定性资料的统计描述 第6章 总体率的区间估计和假设检验 第7章 二项分布与Poisson分布 第8章 秩和检验 第9章 直线相关与回归 第10章 实验设计 第11章 调查设计 第12章 统计表与统计图
3.二项分布名称: 也称为贝努里分布(Bernoulli distribution)或贝努里模型,是由法国数学家 J.Bernoulli于1713年首先阐述的概率分布。
简历
返回总目录 返回章目录 第7章 二项分布与泊松分布
第7页
结束
贝努里模型应具备下列三个基本条件。
1. 试验结果只出现对立事件A或AA,两者只能出
x
Pn ( X x) P( X ) X 0
X=0,1,2,…,x (7.4)
至少有x例阳性的概率为:
n
Pn ( X x) P( X ) X x
X=x,x+1,…,n (7.5)
公式(7.4)为下侧累计概率,公式(7.5)为上侧累计概率。
简历
返回总目录 返回章目录 第7章 二项分布与泊松分布
8. 了解:常用的拟合优度检验方法。
简历
返回总目录 返回章目录 第7章 二项分布与泊松分布
第5页
结束
第一节 二项分布及其应用
一、二项分布的概念及应用条件
1.二项分布(binominal distribution) 是一种重要的离散型分布,在医学上常遇到属 于两分类的资料,每一观察单位只具有相互独 立的一种结果,如检查结果的阳性或阴性,动 物试验的生存或死亡,对病人治疗的有效或无 效等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(一)单项选择题
1.某地人群中高血压的患病率为π,由该地区随机抽查n 人,则()
A .样本患病率p =X /n 服从
B (n ,π)
[评析]本题考点:二项分布的正态近似特性。
从对二项分布特性的描述中可知:当n 较大,π不接近0也不接近1时,二项分布B (n ,π)近似正态分布N (n π,)1(ππ-n )。
π不接近0也不接近1,等同于π接近0.5,因而此题目答案为D 。
3. 以下分布中,其均数和方差总是相等的是()
A.正态分布B.对称分布
C.Poisson分布D.二项分布
答案:C
[评析]本题考点:Poisson分布的特性。
Poisson分布P(μ)的参数只有一个,即μ。
它的均数和方差均
C
从装有红、绿、蓝三种颜色的乒乓球各500、300、200只的暗箱中随机取出10个球,以X代表所取出球中的红色球数,则X服从二项分布B(10,0.5)。
()
答案:正确。
[评析]本题考点:二项分布的定义。
2
二项分布成立的条件是:①每次试验只能是互斥的两个结果之一;
②每次试验的条件不变;③各次试验独立。
此题目所述情况完全满足后两个条件,关键在于第一个条件的判断,从表面上看,每次试验的结果有三种,但本题目所关心的试验结果是“红色与否”,因而该试验结果仍为两种互斥的情况—“红色”和“非红色”。
所以,此题目
3.Bernoulli试验
(二)单项选择题:
1.X1、X2分别服从二项分布B(n1,p1)、B(n2,p2),且X1、
X
相互独立,若要X=X1+X2也服从二项分布,则需满足下列条件()。
2
A.X1=X2B.n1=n2
C.p1=p2D.n1p1=n2p2
2.二项分布B(n,p)的概率分布图在下列哪种条件下为对称分布()。
A.n=50B.p=0.5
C.np=1D.p=1
C.95~105D.74.2~125.8
(三)简答题
1.服从二项分布及Poisson分布的条件分别是什么?
2.二项分布、Poisson分布分别在何种条件下近似正态分布?
3.在何种情况下,可以用率的标准误S p描述率的抽样误差?
4
(四)计算题
1.已知我国成人乙肝病毒表面抗原平均阳性率为10%,现随机抽查某地区10位成人的血清,其中3人为阳性。
该地区成人乙肝表面抗原阳性率是否高于全国平均水平?
2.对甲、乙两种降压药进行临床疗效评价,将某时间段内入院的
则称此随机变量X服从以n、π为参数的二项分布(B i n o m i a l D i s t r i b u t i o n),记为X~B(n,π)。
2.Poisson分布:若离散型随机变量X的取值为0,1,…,n,且相应的取值概率为
6
μμ-==e k k X P k
!)((μ>0)
则称随机变量X 服从以μ为参数的Poisson 分布(PoissonDistribution ),记为X ~P (μ)。
3.Bernoulli 试验:将感兴趣的事件A 出现的试验结果称为“成功”,事件A 不出现的试验结果称为“失败”,这类试验就称为Bernoulli
20),其分布近似于正态分布。
3.当率P 所来自的样本近似服从正态分布时,即n 较大,P 不接近0也不接近1时,可以用率的标准误S p 描述率的抽样误差。
(四)计算题
1.建立检验假设
H0:该地区成人乙肝表面抗原阳性率为10%;
H1:该地区成人乙肝表面抗原阳性率大于10%。
α=0.05。
从总体率为10%的人群随机抽取10人,3人或3人以上阳性的概
著差别,甲药比乙药有效率高。
3.放射性物质含量为4克/千克的矿石每千克的平均脉冲记数为μ=100*4=400/小时,μ值较大,可利用Poisson分布的近似正态分布特性进行计算。
H0:两矿区矿石中该放射性物质含量相等,即后一矿区矿石发生
8 脉冲频率的总体均数为400/小时;H 1:两矿区矿石中该放射性物质含量不相等,即后一矿区矿石发生脉冲频率的总体均数不等于400/小时。
α=0.05。
30400400
1000=-=u >2.58,P <0.01。
在α=0.05水平上,拒绝H 0,接受H 1,即两矿区矿石中该放射性。