第2章 统计描述思考与练习参考答案

合集下载

《统计学原理》(财经版、黄立华)第二章思考与练习答案

《统计学原理》(财经版、黄立华)第二章思考与练习答案

思考与练习〔第二章〕一、单项选择题1.对城市居民户的家庭收支调查,通过提问、算账方式进行的调查,属于〔B 〕。

A.直接调查B.派员调查C.问卷调查D.凭证调查2.调查工业企业设备状况时,工业企业是〔C 〕。

A.调查对象B.调查单位C.报告单位D.调查单位和报告单位3.调查企业经济效益时,工业企业是〔D 〕。

A.调查对象B.调查单位C.报告单位D.调查单位和报告单位4.统计调查项目是〔B 〕。

A.统计分组B.统计标志C.统计指标D.统计数值5.对武钢、宝钢等特大型钢铁企业的钢铁产量调查是〔B 〕。

A.抽样调查B.重点调查C.典型调查D.普查6.对无限总体进行调查的最有效方式是〔D 〕。

A.重点调查B.普查C.典型调查D.抽样调查7.进行全市物价大检查,要求11月25日至12月10日全部完成,这一时间是〔 C 〕。

A.调查时间B.标准时间C.调查时限D.登记时间8.全面调查中〔 B 〕。

A.既有代表性误差,又有登记误差B.没有代表性误差,只有登记误差C.只有代表性误差,没有登记误差D.既没有代表性误差,也没有登记误差9.有意识的选择班级上十名同学,调查学生生活费开支情况,这种调查方法是〔 D 〕。

A.普查B.抽样调查C.重点调查D.典型调查10.划分全面调查和非全面调查的依据是〔 B 〕。

A.资料是否齐全B.调查单位是否齐全C.调查时间是否连续D.调查项目是否齐全二、多项选择题1.统计调查按收集资料的方法有〔ABCE 〕。

A.直接观察法B.报告法C.问卷调查法D.专门调查法E.网络调查法2.全国人口普查中〔BCD 〕。

A.调查对象是每一个人B.调查单位是每一个人C.填报单位是调查人员D.调查对象是全国人口E.填报对象是每户家庭3.以下调查中,调查单位与报告单位一致的有〔〕。

A.人口普查B.工业设备普查C.全国经济普查D.牲畜存栏数调查E.学校教师健康状况调查4.代表性误差存在于〔BCD 〕。

A.普查B.抽样调查C.重点调查D.典型调查E.全面调查5.选择重点单位的标准有〔BCD 〕。

第2章-统计描述思考与练习参考答案

第2章-统计描述思考与练习参考答案

第2章统计描述思考与练习参考答案一、最佳选择题1. 编制频数表时错误的作法是( E )。

A. 用最大值减去最小值求全距B. 组距常取等组距,一般分为10~15组C. 第一个组段须包括最小值D. 最后一个组段须包括最大值E. 写组段,如“1.5~3,3~5, 5~6.5,…”2. 描述一组负偏峰分布资料的平均水平时,适宜的统计量是(A)。

A. 中位数B. 几何均数C. 调和均数D. 算术均数E. 众数3. 比较5年级小学生瞳距和他们坐高的变异程度,宜采用(A)。

A. 变异系数B. 全距C. 标准差D. 四分位数间距E. 百分位数P2.5与P97.5的间距4. 均数X和标准差S的关系是(A)。

A. S越小,X对样本中其他个体的代表性越好B. S越大,X对样本中其他个体的代表性越好C. X越小,S越大D. X越大,S越小E. S必小于X5. 计算乙肝疫苗接种后血清抗-HBs的阳转率,分母为(B)。

A. 阳转人数B. 疫苗接种人数C. 乙肝患者数D. 乙肝病毒携带者数E. 易感人数6. 某医院的院内感染率为5.2人/千人日,则这个相对数指标属于(C)。

A. 频率B. 频率分布C. 强度D. 相对比E. 算术均数7. 纵坐标可以不从0开始的图形为(D)。

A. 直方图B. 单式条图C. 复式条图D. 箱式图E. 以上均不可二、简答题1. 对定量资料进行统计描述时,如何选择适宜的指标?答:详见教材表2-18。

教材表2-18 定量资料统计描述常用的统计指标及其适用场合描述内容指标意义适用场合平均水平均数个体的平均值对称分布几何均数平均倍数取对数后对称分布中位数位次居中的观察值①非对称分布;②半定量资料;③末端开口资料;④分布不明众数频数最多的观察值不拘分布形式,概略分析调和均数基于倒数变换的平均值正偏峰分布资料变异度全距观察值取值范围不拘分布形式,概略分析标准差(方差)观察值平均离开均数的程度对称分布,特别是正态分布资料四分位数间距居中半数观察值的全距①非对称分布;②半定量资料;③末端开口资料;④分布不明变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较2. 举例说明频率和频率分布的区别和联系。

统计课后思考题答案

统计课后思考题答案

统计课后思考题答案统计课后思考题答案第一章思考题1.1什么是统计学统计学是关于数据的一门学科它收集处理分析解释来自各个领域的数据并从中得出结论。

1.3解释描述统计和推断统计描述统计它研究的是数据收集处理汇总图表描述概括与分析等统计方法。

推断统计它是研究如何利用样本数据来推断总体特征的统计方法。

1.5解释分类数据顺序数据和数值型数据统计数据按所采用的计量尺度不同分定性数据分类数据只能归于某一类别的非数字型数据它是对事物进行分类的结果数据表现为类别用文字来表述定性数据顺序数据只能归于某一有序类别的非数字型数据。

它也是有类别的但这些类别是有序的。

定量数据数值型数据按数字尺度测量的观察值其结果表现为具体的数值。

统计数据按统计数据都收集方法分观测数据是通过调查或观测而收集到的数据这类数据是在没有对事物人为控制的条件下得到的。

实验数据在实验中控制实验对象而收集到的数据。

统计数据按被描述的现象与实践的关系分截面数据在相同或相似的时间点收集到的数据也叫静态数据。

时间序列数据按时间顺序收集到的用于描述现象随时间变化的情况也叫动态数据。

1.6举例说明总体样本参数统计量变量这几个概念对一千灯泡进行寿命测试那么这千个灯泡就是总体从中抽取一百个进行检测这一百个灯泡的集合就是样本这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量变量就是说明现象某种特征的概念比如说灯泡的寿命。

1.7变量的分类变量可以分为分类变量顺序变量数值型变量。

变量也可以分为随机变量和非随机变量。

经验变量和理论变量。

1.8举例说明离散型变量和连续性变量离散型变量只能取有限个值取值以整数位断开比如“企业数”连续型变量取之连续不断不能一一列举比如“温度”。

1.8统计应用实例人口普查商场的名意调查等。

1.9统计应用的领域经济分析和政府分析还有物理生物等等各个领域。

第二章思考题2.4自填式面访式和电话式各自的长处和弱点自填式优点 1调查组织者管理容易2成本低可进行大规模调查3对被调查者可选择方便时间答卷减少回答敏感问题压力。

生物医学研究的统计学方法_课后习题解答

生物医学研究的统计学方法_课后习题解答

思考与练习参考答案第1章绪论一、选择题1. 研究中的基本单位是指( D)。

A.样本 B. 全部对象C.影响因素D. 个体E. 总体2. 从总体中抽取样本的目的是( B )。

A.研究样本统计量 B. 由样本统计量推断总体参数C.研究典型案例 D. 研究总体统计量E. 计算统计指标3. 参数是指( B )。

A.参与个体数 B. 描述总体特征的统计指标C.描述样本特征的统计指标 D. 样本的总和 E. 参与变量数4. 下列资料属名义变量的是(E)。

A.白细胞计数B.住院天数C.门急诊就诊人数D.患者的病情分级 E. ABO血型5.关于随机误差下列不正确的是(C)。

A.受测量精密度限制B.无方向性 C. 也称为偏倚D.不可避免 E. 增加样本含量可降低其大小二、名称解释(答案略)1. 变量与随机变量2. 同质与变异3. 总体与样本4. 参数与统计量5. 误差6. 随机事件7. 频率与概率三、思考题1. 生物统计学与其他统计学有什么区别和联系?答:统计学可细分为数理统计学、经济统计学、生物统计学、卫生统计学、医学统计学等,都是关于数据的学问,是从数据中提取信息、知识的一门科学与艺术。

而生物统计学是统计学原理与方法应用于生物学、医学的一门科学,与医学统计学和卫生统计学很相似,其不同之处在于医学统计学侧重于介绍医学研究中的统计学原理与方法,而卫生统计学更侧重于介绍社会、人群健康研究中的统计学原理与方法。

2. 某年级甲班、乙班各有男生50人。

从两个班各抽取10人测量身高,并求其平均身高。

如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?答:不能。

因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。

样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。

即使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。

因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。

统计学 第二章习题参考答案(书上习题)向蓉美

统计学 第二章习题参考答案(书上习题)向蓉美

第二章习题参考答案1.可分情况讨论:若经费允许且调查范围较小,如一个村镇,或者一个贫困区县,或者要求的精度很高,那么可以进行普查,因为普查的结果准确,但费时费力。

一般情况下,应该选择抽样调查。

因为抽样调查具有以下优点:(1)可以减少调查的工作量,调查内容可以求多、求全或求专,可以保证调查对象的完整性。

(2)可以从数量上以部分推算总体,利用概率论和数理统计原理,以一定的概率保证推算结果的可靠程度,起到全面调查认识总体的功能,可以在一定程度上保证调查的精度。

(3)可以大大减少调查费用,提高调查效率。

(4)收集、整理数据、综合样本的速度快,能够保证调查的时效性。

5.两者选其一:①粗略分组:②按分组规则分组X max:296X min:57R=X max−X min=296−57=239确定组数:k=1+3.31(logn)= k=1+3.31(1ogn)=1+3.31(log100)=7.62≈8一般由于正态分布为对称形,故常取k为奇数,所以取k=9确定组距:n=X max−X mink =2399≈27为了便于分析,组距宜取5或10的倍数(书P32),因此n取30确定组界:通常从最小值开始。

先把最小值放在第一组的中间位置上。

最小值为57,因此第一组的下界为57−302=42,上界为57+302=72,分组:6.画折线图和柱形图皆可。

柱形图既可以用来表示定性数据的分布,也可以用来进行同类现象在不同空间、不同时间的对比(书P39);折线图主要用于显示时间序列数据,反映现象随时间变化的特征(书P40)但折线图能够更加清晰地反映出事物变化的趋势,因为本题中可能更注重整体趋势而非单个点的比较,所以折线图更好。

2、3、4题大家都做的不错哈。

概率论与数理统计第二章课后习题及参考答案.

概率论与数理统计第二章课后习题及参考答案.

概率论与数理统计第二章课后习题及参考答案1.离散型随机变量X 的分布函数为⎪⎪⎩⎪⎪⎨⎧≥<≤<≤--<=≤=.4,1,42,7.0,21,2.0,1,0)()(x x x x x X P x F 求X 的分布律.解:)0()()(000--==x F x F x X P ,∴2.002.0)01()1()1(=-=----=-=F F X P ,5.02.07.0)02()2()2(=-=--==F F X P ,3.07.01)04()4()4(=-=--==F F X P ,∴X 的分布律为2.设k a k X P 32()(==, ,2,1=k ,问a 取何值时才能成为随机变量X 的分布律.解:由规范性,a a a n n k k 2321]32(1[32lim)32(11=--=⋅=+∞→∞+=∑,∴21=a ,此时,k k X P 32(21)(⋅==, ,2,1=k .3.设离散型随机变量X 的分布律为求:(1)X 的分布函数;(2)21(>X P ;(3))31(≤≤-X P .解:(1)1-<x 时,0)()(=≤=x X P x F ,11<≤-x 时,2.0)1()()(=-==≤=X P x X P x F ,21<≤x 时,7.0)1()1()()(==+-==≤=X P X P x X P x F ,2≥x 时,1)2()1()1()()(==+=+-==≤=X P X P X P x X P x F ,∴X 的分布函数为⎪⎪⎩⎪⎪⎨⎧≥<≤<≤--<=.2,1,21,7.0,11,2.0,1,0)(x x x x x F .(2)方法1:8.0)2()1()21(==+==>X P X P X P .方法2:8.02.01)21(121(1)21(=-=-=≤-=>F X P X P .(3)方法1:1)2()1()1()31(==+=+-==≤≤-X P X P X P X P .方法2:101)01()3()31(=-=---=≤≤-F F X P .4.一制药厂分别独立地组织两组技术人员试制不同类型的新药.若每组成功的概率都是0.4,而当第一组成功时,每年的销售额可达40000元;当第二组成功时,每年的销售额可达60000元,若失败则分文全无.以X 记这两种新药的年销售额,求X 的分布律.解:设=i A {第i 组取得成功},2,1=i ,由题可知,1A ,2A 相互独立,且4.0)()(21==A P A P .两组技术人员试制不同类型的新药,共有四种可能的情况:21A A ,21A A ,21A A ,21A A ,相对应的X 的值为100000、40000、60000、0,则16.0)()()()100000(2121====A P A P A A P X P ,24.0)()()()40000(2121====A P A P A A P X P ,24.0)()()()60000(2121====A P A P A A P X P ,36.0)()()()0(2121====A P A P A A P X P ,∴X 的分布律为5.对某目标进行独立射击,每次射中的概率为p ,直到射中为止,求:(1)射击次数X 的分布律;(2)脱靶次数Y 的分布律.解:(1)由题设,X 所有可能的取值为1,2,…,k ,…,设=k A {射击时在第k 次命中目标},则k k A A A A k X 121}{-== ,于是1)1()(--==k p p k X P ,所以X 的分布律为1)1()(--==k p p k X P , ,2,1=k .(2)Y 的所有可能取值为0,1,2,…,k ,…,于是Y 的分布律为1)1()(--==k p p k Y P , ,2,1,0=k .6.抛掷一枚不均匀的硬币,正面出现的概率为p ,10<<p ,以X 表示直至两个面都出现时的试验次数,求X 的分布律.解:X 所有可能的取值为2,3,…,设=A {k 次试验中出现1-k 次正面,1次反面},=B {k 次试验中出现1-k 次反面,1次正面},由题知,B A k X ==}{,=AB ∅,则)1()(1p p A P k -=-,p p B P k 1)1()(--=,p p p p B P A P B A P k X P k k 11)1()1()()()()(---+-=+=== ,于是,X 的分布律为p p p p k X P k k 11)1()1()(---+-==, ,3,2=k .7.随机变量X 服从泊松分布,且)2()1(===X P X P ,求)4(=X P 及)1(>X P .X 100000060000400000P0.160.240.240.36解: )2()1(===X P X P ,∴2e e2λλλλ--=,∴2=λ或0=λ(舍去),∴224e 32e !42)4(--===X P .)1()0(1)1(1)1(=-=-=≤-=>X P X P X P X P 222e 31e 2e 1----=--=.8.设随机变量X 的分布函数为⎩⎨⎧<≥+-=-.0,0,0,e )1(1)(x x x x F x 求:(1)X 的概率密度;(2))2(≤X P .解:(1)⎩⎨⎧<≥='=-.0,0,0,e )()(x x x x F x f x ;(2)2e 31)2()2(--==≤F X P .9.设随机变量X 的概率密度为xx Ax f e e )(+=-,求:(1)常数A ;(2))3ln 210(<<X P ;(3)分布函数)(x F .解:(1)⎰⎰+∞∞--+∞∞-+==xAx x f xx d e e d )(1A A x A x x x 2|e arctan d e 21e 2π==+=∞+∞-∞+∞-⎰,∴π2=A .(2)61|e arctan 2d e e 12)3ln 210(3ln 2103ln 210==+=<<⎰-x xx x X P ππ.(3)x xx x xx t t f x F e arctan 2d e e 12d )()(ππ=+==⎰⎰∞--∞-.10.设连续型随机变量X 的分布函数为⎪⎪⎩⎪⎪⎨⎧>≤<-+-≤=.a x a x a a x B A a x x F ,1,,arctan ,,0)(其中0>a ,试求:(1)常数A ,B ;(2)概率密度)(x f .解:(1) 2arcsin (lim )0()(0)(π⋅-=+=+-=-=+-→B A a x B A a F a F a x ,1)(lim )0()(2==+==⋅++→x F a F a F B A a x π,∴21=A ,π1=B .(2)⎪⎩⎪⎨⎧≥<-='=.a x a x x a x F x f ,0,,1)()(22π.11.设随机变量X 的概率密度曲线如图所示,其中0>a .(1)写出密度函数的表达式,求出h ;(2)求分布函数)(x F ;(3)求)2(a X aP ≤<.解:(1)由题设知⎪⎩⎪⎨⎧≤≤-=其他.,0,0,)(a x x ah h x f 2d )(d )(10ahx x a h h x x f a=-==⎰⎰+∞∞-,∴ah 2=,从而⎪⎩⎪⎨⎧≤≤-=其他.,0,0,22)(2a x x a a x f .y hO a x(2)0<x 时,0d 0d )()(===⎰⎰∞-∞-xxt t t f x F ,a x <≤0时,220202d )22(d 0d )()(a x a x t t a a t t t f x F xx-=-+==⎰⎰⎰∞-∞-,a x ≥时,1)(=x F ,∴X 的分布函数为⎪⎪⎩⎪⎪⎨⎧≥<≤-<=.a x a x axa x x x F ,1,0,2,0,0)(22.(3)41411(1)2()()2(=--=-=≤<a F a F a X a P .12.设随机变量X 在]6,2[上服从均匀分布,现对X 进行三次独立观察,试求至少有两次观测值大于3的概率.解:由题意知⎪⎩⎪⎨⎧≤≤=其他.,0,62,41)(x x f ,记3}{>=X A ,则43d 41)3()(63==>=⎰x X P A P ,设Y 为对X 进行三次独立观测事件}3{>X 出现的次数,则Y ~43,3(B ,所求概率为)3()2()2(=+==≥Y P Y P Y P )(()(333223A P C A P A P C +=3227)43(41)43(333223=+⋅=C C .13.设随机变量X 的概率密度为⎩⎨⎧<<=其他.,0,10,3)(2x x x f 以Y 表示对X 的三次独立重复观察中事件}21{≤X 出现的次数,求:(1)}21{≤X 至少出现一次的概率;(2)}21{≤X 恰好出现两次的概率.解:由题意知Y ~),3(p B ,其中81d 321(2102==≤=⎰x x X P p ,(1)}21{≤X 至少出现一次的概率为512169)811(1)1(1)0(1)1(33=--=--==-=≥p Y P Y P .(2)}21{≤X 恰好出现两次的概率为51221811(81()1()2(223223=-=-==C p p C Y P .14.在区间],0[a 上任意投掷一个质点,以X 表示这个质点的坐标.设这个质点落在],0[a 中任意小区间内的概率与这个小区间的长度成正比例.试求X 的分布函数.解:0<x 时,事件}{x X ≤表示X 落在区间],0[a 之外,是不可能事件,此时0)()(=≤=x X P x F ;a x ≤≤0时,事件}{x X ≤发生的概率等于X 落在区间],0[x 内的概率,它与],0[x 的长度x 成正比,即x k x X P x F =≤=)()(,a x =时,1)(=≤x X P ,所以a k 1=,则此时axx F =)(;a x ≥时,事件}{x X ≤是必然事件,有1)(=x F ,综上,⎪⎪⎩⎪⎪⎨⎧≥<≤<=,a x a x a x x x F ,1,0,,0,0)(.15.设X ~),2(2σN ,又3.0)42(=<<X P ,求)0(>X P .解:)24222()42(σσσ-<-<-=<<X P X P 3.0)0(2(=Φ-Φ=σ,∴8.03.0)0()2(=+Φ=Φσ,∴8.0)2()2(1)0(1)0(=Φ=-Φ-=≤-=>σσX P X P .16.设X ~)4,10(N ,求a ,使得9.0)10(=<-a X P .解:)10()10(a X a P a X P <-<-=<-)22102(a X a P <-<-=)2()2(a a -Φ-Φ=9.01)2(2=-Φ=a,∴95.0)2(=Φa,查标准正态分布表知645.12=a,∴290.3=a .17.设X ~)9,60(N ,求分点1x ,2x ,使得X 分别落在),(1x -∞,),(21x x ,),(2∞x 的概率之比为3:4:5.解:由题知5:4:3)(:)(:)(2211=><<<x X P x X x P x X P ,又1)()()(2211=>+<<+<x X P x X x P x X P ,∴25.041)(1==<x X P ,33.031)(21==<<x X x P ,125)(2=>x X P ,则5833.0127)(1)(22==>-=≤x X P x X P .25.0)360()360360()(111=-Φ=-<-=<x x X P x X P ,查标准正态分布表知03601<-x ,∴03601>--x ,则75.0)360(1)360(11=-Φ-=--Φx x 查标准正态分布表,有7486.0)67.0(=Φ,7517.0)68.0(=Φ,75.02)68.0()67.0(=Φ+Φ,∴675.0268.067.03601=+=--x ,即975.571=x .5833.0360()360360()(222=-Φ=-≤-=≤x x X P x X P ,查标准正态分布表知5833.0)21.0(=Φ,∴21.03602=-x ,即63.602=x .18.某高校入学考试的数学成绩近似服从正态分布)100,65(N ,如果85分以上为“优秀”,问数学成绩为“优秀”的考生大致占总人数的百分之几?解:设X 为考生的数学成绩,则X ~)100,65(N ,于是)85(1)85(≤-=>X P X P )1065851065(1-≤--=X P 0228.09772.01)2(1=-=Φ-=,即数学成绩为“优秀”的考生大致占总人数的2.28%.19.设随机变量X 的分布律为求2X Y =的分布律.解:Y 所有可能的取值为0,1,4,9,则51)0()0(====X P Y P ,307)1()1()1(==+-===X P X P Y P ,51)2()4(=-===X P Y P ,3011)3()9(====X P Y P ,∴Y 的分布律为20.设随机变量X 在)1,0(上服从均匀分布,求:(1)X Y e =的概率密度;(2)X Y ln 2-=的概率密度.解:由题设可知⎩⎨⎧<<=其他.,0,10,1)(x x f ,(1)当0≤y 时,=≤}{y Y ∅,X 2-1-013P5161511513011X 0149P51307513011∴0)()(=≤=y Y P y F Y ,0)(=y f Y ;e 0<<y 时,)e ()()(y P y Y P y F X Y ≤=≤=)(ln )ln (y F y X P X =≤=,此时,yy f y y y F y F y f X XY X 1)(ln 1)(ln )(ln )()(=='⋅'='=;e ≥y 时,1)()(=≤=y Y P y F Y ,0)(=y f Y ;∴⎪⎩⎪⎨⎧<<=其他.,0,e 0,1)(y y y f Y .(2)当0≤y 时,=≤}{y Y ∅,∴0)()(=≤=y Y P y F Y ,0)(=y f Y ;当0>y 时,)e ()ln 2()()(2y Y X P y X P y Y P y F -≥=≤-=≤=)e (1)e (122y X y F X P ---=<-=,此时,222e 21)e ()e ()()(yy y X Y X F y F y f ---='⋅'-='=;∴⎪⎩⎪⎨⎧≤>=-.0,0,0,e 21)(2y y y f yY .21.设X ~)1,0(N ,求:(1)X Y e =的概率密度;(2)122+=X Y 的概率密度;(3)X Y =的概率密度.解:由题知22e 21)(x X xf -=π,+∞<<∞-x ,(1)0≤y 时,=≤=}e {y Y X ∅,∴0)()(=≤=y Y P y F Y ,0)(=y f Y ;0>y 时,)(ln )ln ()e ()()(y F y X P y P y Y P y F X X Y =≤=≤=≤=,此时,2)(ln 2e 21)(ln 1)(ln )(ln )()(y X XY X y f yy y F y F y f -=='⋅'='=π;综上,⎪⎩⎪⎨⎧≤>=-.0,0,0,e 21)(2)(ln 2y y y f y Y π.(2)1<y 时,=≤+=}12{2y X Y ∅,∴0)()(=≤=y Y P y F Y ;1≥y 时,21()12()()(22-≤=≤+=≤=y X P y X P y Y P y F Y )2121(-≤≤--=y X y P 当1=y 时,0)(=y F Y ,故1≤y 时,0)(=y F Y ,0)(=y f Y ;当1>y 时⎰⎰------==210221212d e22d e21)(22y x y y x Y x x y F ππ,此时,41e)1(21)()(---='=y Y Y y y F y f π,综上,⎪⎩⎪⎨⎧≤>-=--.1,0,1,e )1(21)(41y y y y f y Y π.(3)0<y 时,=≤=}{y X Y ∅,∴0)()()(=≤=≤=y X P y Y P y F Y ,0≥y 时,)()()()(y X y P y X P y Y P y F Y ≤≤-=≤=≤=)()(y F y F X X --=,0=y 时,0)(=y F Y ,∴0≤y 时,有0)(=y F Y ,0)(=y f Y ;0>y 时,22e 22)()()()()(y X X Y Y Y yf y f y F y F y f -=-+=-'+'=π,综上,⎪⎩⎪⎨⎧≤>=-.0,0,0,e 22)(22y y y f yY π.22.(1)设随机变量X 的概率密度为)(x f ,+∞<<∞-x ,求3X Y =的概率密度.(2)设随机变量X 的概率密度为⎩⎨⎧>=-其他.,00,e )(x x f x 求2X Y =的概率密度.解:(1)0=y 时,0)()(=≤=y Y P y F Y ,0)(=y f Y ;0≠y 时,)()()()()(333y F y X P y X P y Y P y F X Y =≤=≤=≤=,3233331())(()()(-⋅=''='=y y f y y F y F y f XY Y ;∴⎪⎩⎪⎨⎧=≠=-.0,0,0),(31)(332y y y f y y f Y .(2)由于02≥=X Y ,故当0<y 时,}{y Y ≤是不可能事件,有0)()(=≤=y Y P y F Y ;当0≥y 时,有)()(()()()(2y F y F y X y P y X P y Y P y F X X Y --=≤≤-=≤=≤=;因为当0=y 时,0)0()0()(=--=X X Y F F y F ,所以当0≤y 时,0)(=y F Y .将)(y F Y 关于y 求导数,即得Y 的概率密度为⎪⎩⎪⎨⎧≤>-+=.,;,000)](([21)(y y y f y f y y f X X Y ,⎪⎩⎪⎨⎧≤>+=-.0,0,0),e e (21y y yyy .23.设随机变量X 的概率密度为⎪⎩⎪⎨⎧<<=其他.,0,0,2)(2ππx xx f 求X Y sin =的概率密度.解:由于X 在),0(π内取值,所以X Y sin =的可能取值区间为)1,0(,在Y 的可能取值区间之外,0)(=y f Y ;当10<<y 时,使}{y Y ≤的x 取值范围是),arcsin []arcsin ,0(ππy y - ,于是}arcsin {}arcsin 0{}{ππ<≤-≤<=≤X y y X y Y .故)arcsin ()arcsin 0()()(ππ<≤-+≤<=≤=X y P y X P y Y P y F Y ⎰⎰-+=ππyX y X x x f x x f arcsin arcsin 0d )(d )(⎰⎰-+=ππππyy x xx xarcsin 2arcsin 02d 2d 2,上式两边对y 求导,得22222121)arcsin (21arcsin 2)(yyy yyy f Y -=--+-=ππππ;综上,⎪⎩⎪⎨⎧<<-=其他.,0,10,12)(2y y y f Y π.。

第二章 练习与思考

第二章  练习与思考

第二章统计资料的收集、整理与显示学习目的和要求:通过本章的学习,能够了解和识别统计数据的类型;了解各种统计调查方式的特点和适用场合,正确地采用调查方式和方法组织搜集准确、及时的统计资料;熟练掌握品质型数据和数值型数据的整理与图示方法;能够对数值型数据编制频数分布表,并选择适当的图形进行展示、解释。

难点释疑:(一)几个基本概念及其相互联系。

一是调查对象、调查单位、填报单位的含义及其联系,可以联系总体和总体单位的概念来把握;二是五种调查方式之间的关系,五种调查方式各有利弊,在实际中应结合运用。

(二)问卷调查表的设计,问卷调查表的关键在于表的结构设计及指标的设计,要想做出高质量的问卷调查表,一是要不断的知识积累,二是要不断的实践。

(三)不能把统计整理简单地理解为就是统计资料的汇总,统计整理比统计汇总包括的范围要广泛的多,除了包括原始资料的整理外,还包括次级统计资料的整理。

(四)统计分组是统计整理的核心。

统计分组的中心问题是选择分组标志和划分各组的界限。

分组标志的选择一定要坚持目的性、本质性和具体性原则。

还要明确简单分组不一定分的组就少,客观对象就简单;复合分组也不一定分的组就多,客观对象就复杂。

(五)掌握分布数列的编制方法关键是要确定好组数和组距,组数和组距的确定必须能够全面、准确反映客观事物的分布特征。

练习题:(一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内)1.统计调查的基本要求是()。

①准确性、及时性、完整性②准确性、整体性、及时性③全面性、及时性、完整性④全面性、准确性、完整性2.在统计调查中,填报单位是()。

①调查项目的承担者②构成调查对象的每一个单位③负责向上报告调查内容的单位④构成统计总体的每一个单位3.在统计调查中,调查单位和填报单位之间()。

①是一致的②是无区别的③是无关联的两个概念④一般是有区别的,但有时也一致4.某地区对小学学生情况进行普查,则每所小学是()。

数理统计课后习题答案第二章

数理统计课后习题答案第二章
代入可得所求置信区间为(-0.002016 0.008616)。
30.解:由题意用U统计量
计算得置信区间为

代入计算得置信区间
31.解:由题意, 未知,则

经计算得
解得 的置信区间为
查表:
带入计算得 的置信区间为: 。
32.
解: 未知,则 即:
有: 则单侧置信下限为:
将 带入计算得
即钢索所能承受平均张力在概率为 的置信度下的置信下限为 。
33.解:总体服从(0,1)分布且样本容量n=100为大子样。
令 为样本均值,由中心极限定理
又因为 所以
则相应的单侧置信区间为 ,
将 =0.06
代入计算得所求置信上限为0.0991
即为这批货物次品率在置信概率为95%情况下置信上限为0.0991。
34.解:由题意:
解得 的单侧置信上限为
其中n=10, =45,查表 3.325
。一元回归的线性模型为 试求 , 的最小二乘估计。
8.对于自变量和因变量都分组的情形,经验回归直线的配置方法如下:对 和 作 次试验得 对试验值,把自变量的试验值分成 组,组中值记为 ,各组以组中值为代表;把因变量的试验值分为 组,组中值记为 ,同样地各组以组中值为代表。如果 取 有 对, , ;而 。用最小二乘法配直线 ,试求 的估计量23
77
7
9.4
44
46
81
8
10.1
31
117
93
9
11.6
29
173
93
10
12.6
58
112
51
11
10.9
37
111
76
12
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第2章统计描述
思考与练习参考答案
一、最佳选择题
1. 编制频数表时错误的作法是( E )。

A. 用最大值减去最小值求全距
B. 组距常取等组距,一般分为10~15组
C. 第一个组段须包括最小值
D. 最后一个组段须包括最大值
E. 写组段,如“~3,3~5, 5~,…”
2. 描述一组负偏峰分布资料的平均水平时,适宜的统计量是(A)。

A. 中位数
B. 几何均数
C. 调和均数
D. 算术均数
E. 众数
3. 比较5年级小学生瞳距和他们坐高的变异程度,宜采用(A)。

A. 变异系数
B. 全距
C. 标准差
D. 四分位数间距
E. 百分位数与的间距
4. 均数X和标准差S的关系是(A)。

A. S越小,X对样本中其他个体的代表性越好
B. S越大,X对样本中其他个体的代表性越好
C. X越小,S越大
D. X越大,S越小
E. S必小于X
5. 计算乙肝疫苗接种后血清抗-HBs的阳转率,分母为(B)。

A. 阳转人数
B. 疫苗接种人数
C. 乙肝患者数
D. 乙肝病毒携带者数
E. 易感人数
6. 某医院的院内感染率为人/千人日,则这个相对数指标属于(C)。

A. 频率
B. 频率分布
C. 强度
D. 相对比
E. 算术均数
7. 纵坐标可以不从0开始的图形为(D)。

A. 直方图
B. 单式条图
C. 复式条图
D. 箱式图
E. 以上均不可
二、简答题
1. 对定量资料进行统计描述时,如何选择适宜的指标
答:详见教材表2-18。

教材表2-18 定量资料统计描述常用的统计指标及其适用场合
描述内容指标意义适用场合
平均水平均数个体的平均值对称分布
几何均数平均倍数取对数后对称分布
中位数位次居中的观察值
①非对称分布;②半定量资料;③末端开
口资料;④分布不明
众数频数最多的观察值不拘分布形式,概略分析
调和均数基于倒数变换的平均值正偏峰分布资料
变异度全距观察值取值范围不拘分布形式,概略分析
标准差(方差)观察值平均离开均数的
程度
对称分布,特别是正态分布资料
四分位数
间距居中半数观察值的全距
①非对称分布;②半定量资料;③末端开
口资料;④分布不明
变异系数标准差与均数的相对比
①不同量纲的变量间比较;②量纲相同但
数量级相差悬殊的变量间比较
2. 举例说明频率和频率分布的区别和联系。

答:2005年某医院为了调查肺癌患者接受姑息手术治疗1年后的情况,被调查者150人,分别有30人病情稳定,66人处于进展状态,54人死亡。

当研究兴趣只是了解死亡发生的情况,则只需计算死亡率54/150=36%,属于频率指标。

当研究者关心患者所有可能的结局时,则可以算出反映3种结局的频率分别为20%、44%、36%,它们共同构成所有可能结局的频率分布,是若干阳性率的组合。

两者均为“阳性率”,都是基于样本信息对总体特征进行估计的指标。

不同的是:频率只是一种结局发生的频率,计算公式的分子是某一具体结局的发生数;频率分布则由诸结局发生的频率组合而成,计算公式的分子分别是各种可能结局的发生数,而分母则与频率的计算公式中分母相同,是样本中被观察的单位数之和。

3. 应用相对数时应注意哪些问题
答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。

(2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。

(3)观察单位数不等的几个相对数,不能直接相加求其平均水平。

(4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。

4. 常用统计图有哪些分别适用于什么分析目的
答:详见教材表2-20。

教材表2-20 常用统计图的适用资料及实施方法
图形适用资料实施方法
条图组间数量对比用直条高度表示数量大小
直方图定量资料的分布用直条的面积表示各组段的频数或频率
百分条图构成比用直条分段的长度表示全体中各部分的构成比
饼图构成比用圆饼的扇形面积表示全体中各部分的构成比
线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系
半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形,叶片为个体值,叶长为频数
三、计算题
1. 某内科医生调查得到100名40~50岁健康男子总胆固醇(mg/dl),结果如下
227190224259225238180193214195213193209172244 199155208203199253181196224210220255257216249 235220190203197149175236202209174184174185167 235167210171248201266189222199197214199198230 246209202186217206200203197161247138186156195 163273178190207259186194246172234232189172235 207208231234226174199278277181
(1)编制频数表,绘制直方图,讨论其分布特征。

答:频数表见练习表2-1。

根据直方图(练习图2-1),可认为资料为基本对称分布,其包络线见练习图2-2。

练习表2-1 某地100名40~50岁健康男子总胆因醇/(mg·dl-1)
Frequency
Perce
nt
Valid
Percent
Cumulative
Percent
Valid 130~
145~
160~
175~
190~
205~
220~
235~
250~
265~28
1
3
11
12 25 15 13 11
5
4 100
Total
答:利用原始数据,求出算术均数4.207=X mg/dl 和标准差8.29=S mg/dl 。

(3)计算P 25,P 75和P 95。

答:利用原始数据,求出P 25= mg/dl ,P 75= mg/dl ,P 95= mg/dl 。

2. 某地对120名微丝蚴血症患者治疗3个疗程后,用IFA 间接荧光抗体试验测得抗体滴度如下,求抗体滴度的平均水平。

抗体滴度 1:5 1:10 1:20 1:40 1:80 1:160 1:320 例 数
5
16
27
34
22
13
3
利用上述频数表,得平均滴度为1:。

3. 某地1975-1980年出血热发病和死亡资料如教材表2-21,设该地人口数在此6年间基本保持不变。

教材表2-21 某地6年间出血热的发病与死亡情况
年份发病数病死数
1975324
1976565
197716212
197824113
197933010
19802745
试分析:
(1)粗略判断发病率的变化情况怎样。

答:该地人口数在此6年间基本保持不变,发病人数在1979年前逐年上升,1980年略有下降。

可以认为发病率大致呈上升趋势,1980年略有下降。

(2)病死率的变化情况怎样
答:病死率由各年度病死数除以发病数获得,病死率依次为%、%、%、%、%和%,呈逐年下降趋势。

(3)上述分析内容可用什么统计图绘制出来
答:由于没有给出该地人口数,故不能计算发病率,可用普通线图表示发病数变化情况。

病死率的下降情况可以用普通线图表示,下降速度则可以用半对数线图表示。

(4)评述该地区出血热防治工作的效果。

答:随着时间的推移,预防工作做得不好,治疗水平则逐年提高(体现在病死率下降)。

(张晋昕)。

相关文档
最新文档