9第九章两个相关样本的t检验-刘红云版心理统计教材课后习题
生物统计学习题答案第九章

生物统计学习题答案第九章第九章生物统计学习题答案第一节:描述统计学习题答案1. 样本的均值是样本观测值的算术平均数。
计算样本均值的方法是将所有观测值相加,然后除以样本的大小。
2. 样本的中位数是将样本观测值按照大小排序,然后找出中间位置的观测值。
如果样本的大小为奇数,中位数就是排序后的中间值;如果样本的大小为偶数,中位数就是排序后中间两个值的平均数。
3. 样本的众数是样本中出现次数最多的观测值。
一个样本可以有一个或多个众数,也可以没有众数。
4. 样本的范围是最大观测值与最小观测值之间的差异。
计算样本范围的方法是将最大观测值减去最小观测值。
5. 样本的方差是观测值与样本均值之间的差异的平方的平均数。
计算样本方差的方法是将每个观测值与样本均值之间的差异平方,然后将所有差异平方相加,最后除以样本的大小减一。
6. 样本的标准差是样本方差的平方根。
计算样本标准差的方法是将样本方差的结果开根号。
第二节:推断统计学习题答案1. 置信区间是用来估计总体参数的范围。
置信区间的计算方法是使用样本统计量和置信水平来计算。
2. 假设检验是用来判断总体参数是否等于某个特定值的方法。
假设检验的步骤包括建立原假设和备择假设、选择适当的检验统计量、计算观测值的p值、根据p值来判断是否拒绝原假设。
3. 单样本t检验是用来比较一个样本的均值与总体均值之间是否存在显著差异的方法。
单样本t检验的步骤包括建立原假设和备择假设、计算t值、计算p 值、根据p值来判断是否拒绝原假设。
4. 独立样本t检验是用来比较两个独立样本的均值是否存在显著差异的方法。
独立样本t检验的步骤包括建立原假设和备择假设、计算t值、计算p值、根据p值来判断是否拒绝原假设。
5. 配对样本t检验是用来比较同一组样本在两个不同时间点或条件下的均值是否存在显著差异的方法。
配对样本t检验的步骤包括建立原假设和备择假设、计算差异值、计算差异值的均值和标准差、计算t值、计算p值、根据p值来判断是否拒绝原假设。
高中数学:必修第二册第九章-统计教学教案:变量间的相关关系(习题含答案)

高中数学:第二册第九章:变量间的相关关系一、基础知识梳理1.变量之间的相关关系当自变量取值一定时,因变量的取值带有一定的_________,则这两个变量之间的关系叫相关关系.由于相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断. 注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系. 2.散点图将样本中的n 个数据点(,)(1,2,,)i i x y i n =⋅⋅⋅描在平面直角坐标系中,所得图形叫做散点图.根据散点图中点的分布可以直观地判断两个变量之间的关系.(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为_________,如图(1)所示;(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将它称为_________,如图(2)所示.3.两个变量的线性相关(1)如果散点图中点的分布从整体上看大致在_________附近,我们就称这两个变量之间具有_________,这条直线叫做回归直线.回归直线对应的方程叫做回归直线方程(简称回归方程).(2)设已经得到两个具有线性相关关系的变量的一组数据1122(,),(,),,(,)n n x y x y x y ⋅⋅⋅,直线方程y bx a =+,其中,a b 是待定参数.经数学上的推导,,a b 的值由下列公式给出:1122211()()()nni i i ii i nni i i i x x y y x y nx yb x x x nxa y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑.其中,回归直线的斜率为b ,截距为a ,即回归方程为y bx a =+.上述求回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做_________. (3)利用回归方程,我们可以进行预测并对总体进行估计. 4.相关关系的强与弱若相应于变量x 的取值i x ,变量y 的观测值为(1)i y i n ≤≤,则变量x与y 的相关系数()()niix x y y r --=∑,即ni ix y nx yr -=∑,通常用r 来衡量x 与y 之间的线性关系的强弱.r 的范围为11r -≤≤,r 为正时,x 与y 正相关;r 为负时,x 与y 负相关.||r 越接近于1,x 与y 的相关程度越大;||r 越接近于0,二者的相关程度越小.当||1r =时,所以数据点都在一条直线上.习题参考答案: 1.随机性2.(1)正相关 (2)负相关3.(1)一条直线 线性相关关系 (2)最小二乘法二、重点知识梳理b 的公式或混淆b 的位置1.回归方程的求解(1)求回归方程的步骤:列表→计算相关量的值→代入公式计算a ,b 的值→写出回归方程. (2)回归直线一定经过样本点的中心.【例1】假设关于某设备的使用年限x (年)和所支出的年平均维修费用y (万元)(即维修费用之和除以使用年限),有如下的统计资料:使用年限x 2 3 4 5 6 维修费用y2.23.85.56.57.0(1)画出散点图;(2)从散点图中发现使用年限与所支出的年平均维修费用之间关系的一般规律; (3)求回归方程;(4)估计使用年限为10年时所支出的年平均维修费用是多少? 【答案】答案详见解析.【解析】(1)画出散点图如图所示:(2)由上图可知,各点散布在从左下角到右上角的区域里,因此,使用年限与所支出的年平均维修费用之间成正相关,即使用年限越长,所支出的年平均维修费用越多.(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,两变量呈线性相关关系. 由题表数据可得552114,5,112.3,90i ii i i x y x yx ======∑∑,由公式可得2112.3545 1.23,5 1.ˆ2340.089054ˆba y bx -⨯⨯===-=-⨯=-⨯, 即回归方程是 1.230.08y x =+.(4)由(3)知,当10x =时, 1.23100.0812.38y =⨯+=. 故估计使用年限为10年时所支出的年平均维修费用是12.38万元.2.回归直线的理解及其应用在回归方程y bx a =+中,b 是回归直线的斜率,它代表x 每增加一个单位,y 的平均增加单位数,而不是增加单位数.对于具有线性相关关系的两个变量,在求出回归方程后,就可以对总体的数据进行估计或者由已知数据的趋势去预测未知数据的值.【例2】根据如下样本数据得到的回归方程为y bx a =+,若 5.4a =,则x 每增加1个单位,y 就A .增加0.9个单位B .减少0.9个单位C .增加1个单位D .减少1个单位【答案】B【解析】(5,0.9)在回归直线上,∴0.95 5.4b =+,解得0.9b =-,故回归方程为0.9 5.4y x =-+,则x 每增加1个单位,y 就减少0.9个单位,故选B .【例3】中国柳州从2011年起每年国庆期间都举办一届国际水上狂欢节,到2016年已举办了六届,旅游部门统计在每届水上狂欢节期间,吸引了不少外地游客到柳州,这将极大地推进柳州的旅游业的发展,现将前五届水上狂欢节期间外地游客到柳州的人数统计如下表:(1)求y 关于x 的线性回归方程y bx a =+;(2)旅游部门统计在每届水上狂欢节期间,每位外地游客可为本市增加100元左右的旅游收入,利用(1)中的线性回归方程,预测2017年第7届柳州国际水上狂欢节期间外地游客可为本市增加的旅游收入达多少?参考公式:121()()()niii nii x x y y b x x ==--=-∑∑,a y bx =-.3.弄错回归方程中a ,b 的位置【例4】某班5名学生的数学和物理成绩如下表:(1)画出散点图.(2)求物理成绩y 对数学成绩x 的线性回归方程. 【答案】答案详见解析. 【错解】(1)散点图如图所示:(2)计算得1(8876736663)73.25x =⨯++++=,1(7865716461)67.85y =⨯++++=, 518878766573716664636125054i ii x y=⨯+⨯+⨯+⨯+⨯==∑,52222221887673666327174ii x==++++=∑,所以5152221525054573.267.80.6ˆ2527174573.25i ii i i x y x ybx x==--⨯⨯==≈-⨯-∑∑,67.80.625ˆˆ73.222.05a y bx =-=-⨯=. 所以y 对x 的线性回归方程是22.0502ˆ.65yx =+. 【错因分析】错解中回归方程记忆错误,应为y bx a =+. 【正解】(1)散点图如图所示:(2)计算得1(8876736663)73.25x =⨯++++=, 1(7865716461)67.85y =⨯++++=,518878766573716664636125054i ii x y=⨯+⨯+⨯+⨯+⨯==∑,52222221887673666327174i i x ==++++=∑, 所以5152221525054573.267.80.6ˆ2527174573.25i ii i i x yxybx x==--⨯⨯==≈-⨯-∑∑,67.80.625ˆˆ73.222.05a y bx =-=-⨯=. 所以y 对x 的线性回归方程是0.62520ˆ 2.5yx =+.三、习题强化训练1.下列两个变量之间的关系不具有线性关系的是 A .小麦产量与施肥值 B .球的体积与表面积 C .蛋鸭产蛋个数与饲养天数D .甘蔗的含糖量与生长期的日照天数 2.下列命题正确的是①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究. A .①③④ B .②③④C .③④⑤D .②④⑤3.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图图2.由这两个散点图可以判断A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关4.下列变量是线性相关的是 A .人的体重与视力 B .圆心角的大小与所对的圆弧长 C .收入水平与购买能力D .人的年龄与体重5.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为A .y ^=1.5x +2 B .y ^=-1.5x +2 C .y ^=1.5x -2D .y ^=-1.5x -26.下列关系中,属于相关关系的是________ ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系.7.若施肥量x (kg )与水稻产量y (kg )的线性回归方程为y ^=5x +250,当施肥量为80 kg 时,预计水稻产量约为________kg.8.正常情况下,年龄在18岁到38岁的人,体重y (kg )对身高x (cm )的回归方程为y ^=0.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg 左右.9.下表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对应数据:x 3 4 5 6 y2.5t44.5根据上表提供的数据,求出y 关于x 的线性回归方程y ^=0.7x +0.35,那么表中t 的值为________. 10.下列两个变量之间的关系是相关关系的是____________.①正方体的棱长和体积;②单位圆中圆心角的度数和所对弧长; ③单产为常数时,土地面积和总产量;④日照时间与水稻的亩产量.11.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是A .直线l 过点(x ,y )B .回归直线必通过散点图中的多个点C .直线l 的斜率必在(0,1)D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同12.设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是 A .y 与x 具有正的线性相关关系 B .回归直线过样本的中心点(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 13.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^A .不能小于0B .不能大于0C .不能等于0D .只能小于014.某考察团对全国10大城市职工人均工资x 与居民人均消费y 进行统计调查,y 与x 具有线性相关关系,线性回归方程ˆy=0.66x +1.562(单位:千元),若某城市居民消费水平为7.675,估计该城市消费额占人均工资收入的百分比约为____________.15.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的人数5~32人,船员人数y 关于吨位x 的回归方程为y ^=9.5+0.006 2x , (1)若两艘船的吨位相差1 000,求船员平均相差的人数. (2)估计吨位最大的船和最小的船的船员人数.16.某工厂对某种产品的产量与成本的资料分析后有如下数据:(1)画出散点图;(2)求成本y 与产量x 之间的线性回归方程; (3)预计产量为8千件时的成本.17.某城市理论预测2014年到2018年人口总数y (单位:十万)与年份(用2014+x 表示)的关系如表所示:年份中的x 0 1 2 3 4 人口总数y5781119(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归方程y ∧=bx +a ; (3)据此估计2019年该城市人口总数.(参考数据:0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30)参考公式:线性回归方程为y bx a =+,其中()()()1122211n ni i i i i i n n i i i i x x y y x y nxy b x x x nx====---==--∑∑∑∑.习题参考答案:6.【答案】②④ 7.【答案】650 8.【答案】69.96 9.【答案】310.【答案】④14.【答案】83%15.【答案】(1)船员平均相差6人;(2)吨位最大和最小的船的船员数分别为29人和10人. 16.【答案】(1)详见解析;(2)y ^=1.1x +4.6;(3)产量为8千件时,成本约为13.4万元. 17.【答案】(1)详见解析;(2)y =3.2x +3.6;(3)估计2019年该城市人口总数约为196万.。
统计学第九章课后习题答案

9.1(1)设原假设为H:不同收入群体对某种特定商品的购买习惯相同:即不同收入群体对某种特定商品的购买习惯不完全相同H1(2)由SPSS计算可得χ2值为17.626(3)自由度=(3-1)×(4-1)=6,当α=0.1时,χ0.12(6)=10.64∵χ2=17.626>10.64=χ0.12(6)故拒绝原假设,即不同收入群体对某种特定商品的购买习惯不完全相同。
(4)由SPSS计算可得φ系数为0.183、c系数为0.180、V系数为0.1299.2解:设原假设为H0:现在情况与经验数据相比没有发生变化;H1:现在情况与经验数据相比发生了变化。
由已知条件可得χ2值为:χ2=(28−0.1×200)20.1×200+(56−0.2×200)20.2×200+(48−0.3×200)20.3×200+(36−0.2×200)20.2×200+(32−0.2×200)20.2×200=14P[χ2(5−1)>14]=0.007295<0.1=α,故拒绝原假设。
9.3设原假设为H0:π1=π2=π3=π4(即阅读习惯与文化程度无关)H1:π1,π2,π3,π4不完全相等(即阅读习惯与文化程度有关)表中各项的期望值:E11=n1×n1n=77×50254=15.16E12=n2×n1n=91×50254=17.91E13=n3×n1n=42×50254=8.27E14=n4×n1n=44×50254=8.66E21=n1×n2n=77×44254=13.34E22=n2×n2n=91×44254=15.76E23=n3×n2n=42×44254=7.28E24=n4×n2n=44×44254=7.62E31=n1×n3n=77×95254=28.80E32=n2×n3n=91×95254=34.04E33=n3×n3n=42×95254=15.71E34=n4×n3n=44×95254=16.46E41=n1×n4n=77×65254=19.70E42=n2×n4n=91×65254=23.29E43=n3×n4n=42×65254=10.75E44=n4×n4n=44×65254=11.26所以χ2=(6-15.16)2/15.16+(12-13.34)2/13.34+……+(13-11.26)2/11.26=31.86。
第9章方差分析思考与练习带答案讲解

知识是人类进步的阶梯第九章方差分析【思考与练习】一、思考题1. 方差分析de根本思想及其应用条件是什么?2. 在完全随机设计方差分析中SS、、SS且间、SS且内各表示什么含义?3. 什么是交互效应?请举例说明.4. 重复测量资料具有何种特点?5. 为什么总de方差分析de结果为拒绝原假设时,假设想进一步了解两两之间de差别需要进行多重比拟?二、最正确选择题1. 方差分析de根本思想为A. 组问均方大丁组内均方B. 误差均方必然小丁组问均方C. 总变异及其自由度按设计可以分解成几种不同来源D. 组内方差显著大丁组问方差时,该因素对所考察指标de影响显著E. 组问方差显著大丁组内方差时,该因素对所考察指标de影响显著2. 同一两样本均数比拟de资料,方差分析de结果与f检验de结果卜A.理论上不同*完全等价AF PC.完全等价F = F /D不同,,检验de结果更可靠wE.不同,方差分析de结果更可靠3. 完全随机设计de方差分析中,以下式子正确de选项是A.SS皇=$羽十5&时B., A£S t= US.E +A£f a_ +-1c. ss成巧> SS成内+JD,担Sjj闻> MS皿,E一% <54. 总de方差分析结果有P<0.05,那么结论应为A. 各样本均数全相等B. 各总体均数全相等C. 各样本均数不全相等D. 各总体均数全不相等E. 至少有两个总体均数不等5. 对有k个处理组,b个随机区组de资料进行双因素方差分析, 其误差de自由度为A. kb - k - bB. kb - k - b -1C. kb -k - b -2D. kb - k - b 1E. kb -k - b 26. 2 2析因设计资料de方差分析中,总变异可分解为A. MS 总=MS B+MS AB. MS 总=MS B+MS误差C. S&、= SS B SS吴差D. SS = S$ SS SS吴差E. SS、=SS +S& +SS A B +SS吴差7. 观察6只狗服药后不同时间点〔2小时、4小时、8小时和24小时〕血药浓度de 变化,本试验应选用de统计分析方法是A. 析因设计de方差分析B. 随机区组设计de方差分析C. 完全随机设计de方差分析D. 重复测量设计de方差分析E. 两阶段交义设计de方差分析8. 某研究者在4种不同温度下分别独立地重复10次试验,共测得某定量指标de 数据40个,假设采用完全随机设计方差分析进行统计处理,其组问自由度是A. 39B. 36C. 26D. 9E. 39. 采用单因素方差分析比拟五个总体均数得P < 0.05 ,假设需进一步了解其中一个对照组和其它四个试验组总体均数有无差异,可选用de检验方法是A. Z检验B. t检验C. DunnettT 检验D. SNK -q 检验E. Levene 检验三、综合分析题1. 某医生研究不同方案治疗缺铁性贫血de 效果,将36名缺铁性贫血患者随机等分为3组,分别给予一般疗法、一般疗法+药物A低剂量,一般疗法+药物A高剂量三种处理,测量一个月后患者红细胞de升高数〔102/L〕,结果如表9-1所示.问三种治疗方案有无差异?表9-1三种方案治疗一个月后缺铁性贫血患者红细胞de升高数〔102/L〕编亏一般疗法一般疗法+A1 一般疗法+A21 0.81 1.32 2.352 0.75 1.41 2.503 0.74 1.35 2.434 0.86 1.38 2.365 0.82 1.40 2.446 0.87 1.33 2.46 7 0.75 1.43 2.408 0.74 1.38 2.439 0.72 1.40 2.21 10 0.82 1.40 2.45 110.80 1.34 2.38 120.751.462.402. 在药物敏感试验中,欲比拟三种弥散法de 抑菌效果,每种方法均采用三种药 物,观察其抑菌效果,以抑菌环de 直径为观察指标,结果如表 9-2所示,试比拟三种方法de 抑菌效果.表9-2 三种药物在不同弥散法下de 抑菌效果 (mm) 药物 -挖洞27.524.3 20.0 黄艮27.6 24.6 21.0 26.9 25.0 20.627.327.7 20.820.9 24.6 19.1 炒21.2 24.7 19.3 20.5 23.9 18.721.324.818.527.422.0 29.6 青霉素27.6 21.7 30.2 26.9 21.8 29.526.722.330.43. 某试验研究饮食疗法和药物疗法降低高胆固醇血症患者胆固醇de 效果有无差 别,随机选取14名高胆固醇血症患者,随机等分为两组,分别采用饮食疗法和 药物疗法治疗一个疗程,测量试验前后患者血胆固醇含量,结果如表 9-3所示,请问两种疗法降胆固醇效果有无差异.表9-3不同治疗方法下胆固醇变化情况 (mmol/L)4 6.94 6.64 7.31 6.835 9.17 8.42 6.81 6.736 7.61 7.22 8.16 7.657 6.60 6.65 6.98 6.524. 为研究某中学初一年级、初二年级和初三年级学生周日锻炼时间情况,从这三个年级中各随机抽取20名学生,调查得到学生周日锻炼时间如下表9-4所示问这三个年级学生周日锻炼时间是否不同?表9-4初中不同年级学生de锻炼时间〔分〕三年级37.856 59.164 48.77870.793 36.650 51.05786.928 38.511 47.60958.785 48.945 48.42873.923 29.367 42.81461.435 41.988 52.30364.130 69.419 54.32767.169 33.109 35.59149.099 38.872 55.01362.728 53.401 36.08452.534 62.814 21.30745.230 38.454 46.41940.400 32.802 41.83644.399 37.683 37.48133.091 48.944 35.78163.469 48.869 31.35441.704 41.920 45.19062.268 46.859 40.92458.209 65.067 38.87763.319 38.403 27.259经数据分析结果见下表:表9-5 三个年级之间de t检验结果组别t P一年级和二年级2.85 0.0071一年级和三年级4.09 0.0002二年级和三年级1.12 0.2710问:(1)该资料采用de是何种统计分析方法?(2) 所使用de统计分析方法是否正确?为什么?(3) 假设不正确,可以采用何种正确de统计分析方法.请作分析?【习题解析】一、思考题1. 方差分析de根本思想是把全部观察值de总变异按设计和需要分解成两个或多个组成局部,然后将各局部de变异与随机误差进行比拟, 来判断总体均数问de差别是否具有统计学意义.应用条件:各样本是相互独立de随机样本,且服从正态分布,各样本方差齐性.2. S&是各观测值与总均值之差de平方和, 即总离均差平方和,表示总变异de大小;SS且间表示组问变异,指各处理组均值大小de不同,是由处理因素和随机误差造成de;SS且内表示组内变异,指同一处理组内部各观察值之间de变异,是由随机误差造成de.3. 交互效应是指某一因素de效应随另一因素不同水平■de变化而变化,称这两个因素之间存在交互效应.例如:某实验研究A、B两种药物在不同剂量情况下对某病de治疗效果,药物A 在不同剂量时,B药de效应不同,或者药物B在不同剂量时,A药de效应不同,那么A、B两药问存在交互效应.4. 重复测量资料中de处理因素在受试者问是随机分配de,受试者内de因素即时间因素是固定de,不能随机分配;重复测量资料各受试者内de数据彼此不独立, 具有相关性,后一个时间点de数据可能受到前面数据de影响, 而且时间点离得越近de数据相关性越高.5. 方差分析中备择假设是多个总体均数不等或不全相等,拒绝原假设只说明多个总体均数总de 来说差异有统计学意义,并不能说明任意两总体均数之间均有差别.因此,假设希望进一步了解两两问de差异,需进行多重比拟.二、最正确选择题1. C2. C3. A4. E5. D6. E7. D8. E9. C三、综合分析题1.解:此题采用完全随机设计de方差分析表9-6 二种万荣治疗个月后缺铁性贫血患者红细胞de升高数: (102/L)一般疗法一般疗法+A1 一般疗法+A2 合计0.81 1.32 2.350.75 1.41 2.500.74 1.35 2.430.86 1.38 2.360.82 1.40 2.440.87 1.33 2.46X 0.75 1.43 2.400.74 1.38 2.430.72 1.40 2.210.82 1.40 2.450.80 1.34 2.380.75 1.46 2.40n i 12 12 12 36 (n)'X i 9.43 16.60 28.81 54.84( ' X )X i 0.7858 1.3833 2.4008'X i27.4385 22.9828 69.2281 299.6494(、X ) (1) 方差分析1)建立检验假设,确定检验水准H.:即三种方案治疗后缺铁性贫血患者红细胞升高数相同Hi :九、匕、气不全相同,即三种方案治疗后缺铁性贫血患者红细胞升高数不全相同:=0.052)计算检验统计量C =('X)2/N = (54.84)2/36=83.5396-- . —2 _ 2 _SS、= ' (X -X) 八X -C =99.6494-83.5396=16.1098v总=N -1 =36-1=3 5SS且间=' ng -X)2= \' X j)2,n i -C一.2 一一 2 __ __ 2,9.43 16.60 28.81、=(-------- ---------- ----------- )-83.5396 =16.002212 12 12v 组间=k —1 =3—1 = 2S 两内=S&、一S 寄间=16.1098—16.0022= 0.1076v 组内=N —k=33-MS 绢间 SS 祯/v 绢间 F — • = 2452.7216MS 组内SS 且内/v 组内 方差分析结果见表9-7表9-7完全随机资料de 方差分析表3〕确定P 值,作出统计推断查F 界值表〔附表4〕得P<0.01,按a =0.05水准,拒绝H 0 ,接受H 1 ,差异有 统计学意义,可以认为三种不同方案治疗后患者红细胞升高数de 总体均数不全相 同. ⑵ 用Dunnett-t 法进行多重比拟 1〕建立检验假设,确定检验水准H0:任一实验组与对照组de 总体均数相同 H 1 :任一实验组与对照组de 总体均数不同-=0.052〕计算检验统计量MS e =0.0033 n 〔 = n 2 = n 3=12 「「 1 1 1 1S i= \MSe(n T 、「"0033(12 12)=0.02表9-8 多个样本均数de Dunnett-t 检验计算表将表9-8中t D 取绝对值,并以计算 MS e 时de 自由度 *=33和实验组数 a=k-1=2〔不含对照组〕查Dunnett-t 界值表得P 值,列丁表中.按a =0.05水准, 一般疗法+A1与一般疗法相比,疗效差异有统计学意义,可以认为一般疗法+A1与一般疗法治疗缺铁性贫血疗效不同. 同理,可以认为一般疗法+A2与一般疗法治疗缺铁性贫血疗效不同SPSS操作数据录入:翻开SPSS Data Editor® 口,点击Variable View标签,定义要输入de变量, group表示组另U 〔1为一般疗法,2为一般疗法+药物A低剂量,3为一般疗法+ 药物A高剂量〕,x表示患者红细胞de升高数〔102/L〕;再点击Data View标签,录入数据〔见图9-1,图9-2〕.图9-1 Variable View窗口内定义要输入de变量group和x图9-2 Data View窗口内录入数据分析:Analyze Compare Means one-Way ANOV ADependent List 框:xFactor 框:groupPost Hoc—> Equal Variances Assumed:【♦Dunnett: Control Category : firstContinuEOption... r Statistics:I/ Homogeneity of Variances testContinueOK输出结果Test of Homogeneity of Variances(102/L)红细胞升高数(102/L)Multiple Comparisons2 Dependent Variable:红细胞升局数(10 /L)- 一一 _ aa Dunnett t-tests treat one group as a control, and compare all other groups against it.2. 解:此题采用析因设计de方差分析.表9-9 九种不同处理情况下抑菌环de直径(mm)纸片弥散法a〔挖洞弥散a2 钢圈弥散a3稣地青霉素青霉素青霉素合计b1 b2b3 b1 b2b3 b1 b2b327.5 20.9 27.4X 24.3 24.6 22.0 20.0 19.1 29.627.6 21.2 27.6 24.6 24.7 21.7 21.0 19.3 30.226.920.5 26.9 25.0 23.9 21.8 20.6 18.7 29.527.3 21.3 26.7 27.7 24.8 22.3 20.8 18.5 30.4n i 4 44 4 4 4 4 4 4 36 "X i 109.3 83.9 108.6101.698.087.882.4 75.6 119.7866.9n A1212 12n B1212 12、XA301.8 287.4 277.7、XB293.3 257.5316.1(1)建立检验假设,确定检验水准 因素AH o :三种弥散方法抑菌环直径de 总体均数相等H i :三种弥散方法抑菌环直径de 总体均数不全相等 因素B Ho :三种药物抑菌环直径de 总体均数相等 H 1 :三种药物抑菌环直径de 总体均数不全相等 AB 交互作用Ho :不同药物对三种弥散方法de 抑菌效果无影响 H i :不同药物对三种弥散方法de 抑菌效果有影响 :=0.05 (2)计算检验统计量C =(' X)2/N =(866.9)2/36 = 20875.4336 S&、=' X 2 -C =21322.83-20875.4336=447.3964=N —1=36—1 =35283.92 119.72 -+ +川+ )-20875.4336=436.6339 4 4v 处理=k 一1 = 82 -rr -2287土 玄7二)—20875.4336 = 24.50721212% = A de 水平■数-1=22 :109.383.9S —"C=(二2 SS A 八(' XAf.'nA-CT 30!812MS A=竺=24507= 12.2536 '••A22Q3 32257 52316 12SS B (' X B)2n B—C =(. —— ― )- 20875.4336 = 145.4289 12 12 12v B = B de 水平■数-1 =2SS 145.4289MS B = * =72.7145'.•BS&B = S$里- S& - S& = 266.6978AB ='.•处理 一'3 一" =4SS AB 266.6978MS AB =」B = ------- = 66.6745 '•ABSS 吴差=SS 、-S$M 理= 10.7625.误差=N —k =36-9 =27SS 吴差 10.76250.398627MS 误差FBF ABM S AMS 1 2. 253 0. 39860. 74 1 6=些=*^=182.4247MS 误差 0.3986MSAB66.6745167.2717MS 吴差0.3986方差分析结果见表9-10变异来源 SS VMS FP总变异 447.3964 35处理436.6339 8A 24.5072 2 12.2536 30.7416 <0.05B 145.4289 2 72.7145 182.4247 <0.05 AB266.6978 4 66.6745167.2717<0.05误差10.7625270.3986表9-10析因设计资料de 方差分析表根据V,查F界值表〔附表4〕得相应P值.交互作用de F=167.2717, P<0.05, 按a =0.05水准,拒绝H0,接受H1 ,差异有统计学意义,可以认为弥散方法和药物抑菌效果两者之间存在交互作用. 这时,如要分析A因素或B因素de单独效应,应固定在A因素de基线水平■来分析B因素de作用,或者固定在B因素de基线水平■来分析A因素de作用.SPSS操作数据录入:翻开SPSS Data Editor® 口,点击Variable View标签,定义要输入de变量,g1表示三种弥散方法〔1为纸片,2为挖洞,3为钢圈〕,g2表示三种药物〔1为黄共,2为大黄,3为宵霉素〕,x表示抑菌效果〔mm〕;点击Data View标签,录入数据〔见图9-3,图9-4〕.图9-3 Variable View窗口内定义要输入de变量g1、g2和x图9-4 Data View窗口内录入数据分析:Analyze General Linear Model UnivariateDependent List 框:xFixed Factor 框:g1、g2OK输出结果Tests of Betw een-Subjects Effects3. 解:此题可采用t检验分析,但最好采用重复测量资料de方差分析. 因重复测量资料de方差分析计算量较大,故此题不给出笔算结果,仅提供SPSS软件分析结果.(1) 建立检验假设,确定检验水准处理因素KH0 :饮食疗法和药物疗法降低胆固醇值de总体均数相同H I :饮食疗法和药物疗法降低胆固醇值de总体均数不相同时间因素IH0:试验前后患者胆固醇值de总体均数相同H I :试验前后患者胆固醇值de总体均数不相同交互作用KIH0:时间对两种方法降低胆固醇de效果无影响H1 :时间对两种方法降低胆固醇de效果有影响:=0.05(2) 计算检验统计量本例是最简单de重复测量设计,时间因素只有两个水平,可以用重复测量de 方差分析进行计算,由丁时间点只有两个水平, 可以不考虑球形对称问题.列出方差分析表见表9-11:表9-11重复测量资料de方差分析表SS V MS F P总变异14.197 27处理0.168 1 0.168 0.153 0.703个体间误差13.196 12 1.100时间0.445 1 0.445 13.921 0.003处理州间0.004 1 0.004 0.122 0.733个体内误差0.384 12 0.032⑶确定P值,作出统计推断时间因素和治疗方法之间de交互作用,F值为0.122, P值为0.733,按口=0.05 水准,不拒绝H.,差异无统计学意义,尚不能认为时间和疗法之间存在交互作用;对丁时间因素,F值为13.921, P值为0.003, P<0.001,按a =0.05水准, 拒绝H0,接受H1 ,差异有统计学意义,可以认为试验前后患者胆固醇de值不同;两种治疗方法de F值为0.153, P值为0.703, P>0.05,按a =0.05水准,不拒绝H0 , 差异无统计学意义,尚不能认为饮食疗法和药物疗法之间具有差异.SPSS操作数据录入:翻开SPSS Data Editor® 口,点击Variable View标签,定义要输入de变量, no表示编号,g 表示分组〔1为饮食疗法,2为药物疗法〕,t1表示实验前患者胆固醇de值〔mmol/L〕 , t2表示实验后患者胆固醇de值〔mmol/L〕;击Data View标签, 录入数据〔见图9-5,图9-6〕.Filt Edit View Data transform Ainalyifr Graphs Utili ti nd&w Melp诊Q|A|风]J tdJd M|通蓟圜剑匿I栏剑< | ►|\ Data View | ♦SPSS Processor is ready图9-5 Variable View窗口内定义要输入de变量no、g、t1和t2图9-6 Data View窗口内录入数据分析:Analyze General Linear Model Repeated MeasuresWithin-Subject Factor name :改为tNumber of Levels :键入 2 Add |Define :Within-Subjects Variables [t] : t1 〜t2Between- Subjects Factor [s] : g Model : • Customr Within-Subjects Model : tr Between-Subjects Model : g Continue函输出结果Mauchly's Test of Sphericity(b)Tests of W ithin-Subjects EffectsTests of Betw een-Subjects EffectsMeasure: MEASURE_14. (1)该资料采用de是两独立样本t检验作两两比拟.(2) 所使用de统计分析方法错误.欲比拟三组均数是否两两不同,用两独立样本t检验作屡次比拟,会增大犯I型错误de概率.(3) 应领先采用完全随机设计方差分析,假设分析结果拒绝H0,那么进一步采用SNK法作三组问de两两比拟.完全随机设计方差分析1)建立检验假设,确定检验水准H.:三个年级锻炼时间de总体均数相等H I :三个年级锻炼时间de总体均数不全相等,即至少有两个总体均数不等:=0.052)计算检验统计量C =('X)2/N = (2887.142) 2/60=138926.4821 22SS 、= *X _X)2 八 X 2 -C =148914.9985-138926.4821=9988.5164v 总=N 』=60—1=59SS 且间=' MX ] -又)2 =、(' XS.n -C911.241838.432)-138926.4821「2431.72312020¥组间=k -1 =3 -1 = 2SS 且内=SS 、- SS 且间=7556.7933v 组内=N -k=57亡MS 组间SS 且间/v 组间…… F = --------- = ---------------- = 9.1711MS 组内SS 且内/v 组内 方差分析结果见表9-12.表9-12方差分析表SS vMSFP总变异 9988.5164 59组间2431.7231 2 1215.86159.17<0.01组内7556.793357132.5753多个样本均数问比拟见表9-13表9-13 SNK 检验计算表q 界值A 与BX A - XB标准误q包含组数--P& XA Ba0.05 0.01(1) (2) (3) (4)=(2)(3) (5) (6) (7) (8) 1与3 14.9519 2.5746 5.8075 3 3.44 4.37 <0.01 1与2 11.3114 2.5746 4.3935 2 2.86 3.82 <0.01 2与33.64052.57461.414022.863.82>0.053〕确定P 值, 作出统计推断方差分析结果P<0.01,按« =0.05水准,拒绝H 0,接受H 1 ,差异有统计学意义,可以认为三个年级锻炼时间de 总体均数不全相等; 多个均数问de 两两比拟 de SNK 检验结果提示:可以认为一年级和二年级、一年级和三年级de 锻炼时间 不同;尚不能认为二年级和三年级de 锻炼时间不同.1137.469220SPSS操作数据录入:翻开SPSS Data Editor® 口,点击Variable View标签,定义要输入de变量, group表示组另U 〔1为一年级,2为二年级,3为三年级〕,x表示锻炼时间〔分〕;再点击Data View标签,录入数据〔见图9-7,图9-8〕.图9-7 Variable View窗口内定义要输入de变量x、g图9-6 Data View窗口内录入数据分析:Analyze — Compare Means^ ONEWAY-ANOVADependent List 框:锻炼时间(x)Factor 框:gPost Hoc 卜Equal Variances Assumed " S-N-KContinueOption... — Statistics: v Homogeneity of Variances testContinue知识是人类进步的阶梯亟输出结果Test of Homogeneity of Variances 锻炼时间ANOVA锻炼时间文档如有冒犯,请站内留言,谢谢!。
浙江大学《概率论、数理统计与随机过程》课后习题答案张帼奋主编第九章 方差分析与回归分析

第九章 方差分析与回归分析注意: 这是第一稿(存在一些错误)1.解:()()()211,,n niii i i i L f y y f y x αβσεαβ======--∏∏()()()221222211ni i i i i y x y x nni eαβαβσσ=------=∑==()())()22212,,ln ,,ln2ni i i y x l L n αβαβσαβσσ=--==--∑()()()()()()212212221242,,0,,0,,1022ni i i n i i i i n i i i y x l y x x l y x l n αβαβσασαβαβσβσαβαβσσσσ===⎧--⎪∂⎪==∂⎪⎪--⎪∂⎪==⎨∂⎪⎪--⎪∂⎪=-=⎪∂⎪⎩∑∑∑ 解得2ˆˆ,ˆ,ˆ.xyxxy x s s SSE n αββσ⎧⎪=-⎪⎪=⎨⎪⎪=⎪⎩则α、β的极大似然估计与最小二乘估计一致。
2σ的极大似然估计为SSE n ,最小二乘估计为2SSE n -,为2σ的无偏估计。
2.解: (1)由题意,知0123:H μμμ==,1123:,,H μμμ不全相等计算有112312.54ni i i x n x n n n ⋅===++∑ 321()0.738i A i i S n x x ⋅==-=∑,321() 5.534in T ij i i jS x x ===-=∑∑4.796E T A S S S =-=,/(31)0.369A A MS S =-=123/(3)0.178E E MS S n n n =++-=,/ 2.077A E F MS MS ==由于 2.077F =<(2,27) 3.3541F α=,接受0H(2)2σ的无偏估计量为:123/(3)0.178E E MS S n n n =++-=3.解:(1)61n =,4r =,(2)0.05(3,57) 2.76 3.564F ≈<,则拒绝原假设,即认为不同年级学生的月生活费水平有显著差异。
(完整word版)应用回归分析,第9章课后习题参考答案

第9章 含定性变量的回归模型思考与练习参考答案9.1 一个学生使用含有季节定性自变量的回归模型,对春夏秋冬四个季节引入4个0—1型自变量,用SPSS 软件计算的结果中总是自动删除了其中的一个自变量,他为此感到困惑不解。
出现这种情况的原因是什么?答:假如这个含有季节定性自变量的回归模型为:t t t t kt k t t D D D X X Y μαααβββ++++++=332211110其中含有k 个定量变量,记为x i 。
对春夏秋冬四个季节引入4个0—1型自变量,记为D i ,只取了6个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则样本设计矩阵为:⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛=000110010110001010010010100011)(616515414313212111k k k k k k X X X X X X X X X X X XD X,显然,(X ,D)中的第1列可表示成后4列的线性组合,从而(X ,D)不满秩,参数无法唯一求出。
这就是所谓的“虚拟变量陷井",应避免。
当某自变量x j 对其余p —1个自变量的复判定系数2j R 超过一定界限时,SPSS 软件将拒绝这个自变量x j 进入回归模型.称Tol j =1—2j R 为自变量x j 的容忍度(Tolerance ),SPSS 软件的默认容忍度为0。
0001。
也就是说,当2j R >0.9999时,自变量x j 将被自动拒绝在回归方程之外,除非我们修改容忍度的默认值。
而在这个模型中出现了完全共线性,所以SPSS 软件计算的结果中总是自动删除了其中的一个定性自变量。
⎪⎪⎪⎪⎪⎭⎫⎝⎛=k βββ 10β⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=4321ααααα9。
2对自变量中含有定性变量的问题,为什么不对同一属性分别建立回归模型,而采取设虚拟变量的方法建立回归模型?答:原因有两个,以例9.1说明。
一是因为模型假设对每类家庭具有相同的斜率和误差方差,把两类家庭放在一起可以对公共斜率做出最佳估计;二是对于其他统计推断,用一个带有虚拟变量的回归模型来进行也会更加准确,这是均方误差的自由度更多。
0导论练习题-刘红云版心理统计教材课后习题

导论统计学入门1.如果在符合一定条件的100所大学中随机抽取20所大学,那么,此时的样本量等于多少?2.请简要说明统计量和参数的区别与联系?3.某一次美国总统选举前,某机构在进行民意调查时,把他们每周抽样的样本量大小从1500增加到5000人。
这个比较大的随机样本是否使得调查结果的偏差降低?是否使得调查结果的变异性降低?4.已有研究表明,不同颜色的食物会引起人们不同程度的食欲。
现在有两个研究者分别进行研究。
第一个研究者调查人们最喜欢吃什么颜色的食物。
第二个研究者让被试在同样的环境条件中选择自己带某种颜色的食物。
请问:(1)这两个研究使用的方法一样吗?为什么?(2)请指出每一个研究的变量是什么?5.假设某学校对该校所有学生进行了一项调查,用于了解父母的教养方式与学生在校行为的表现。
现在截取部分数据如下表:编号年级是否是独生子女父母教养方式自尊分数受欢迎程度1 高一是民主型34 62 高一是专制型21 43 高一否民主型37 74 高一是民主型28 95 高一是民主型30 86 高一是专制型27 67 高一否放任型19 78 高一是专制型25 5请据表回答下面的问题:(1)该测量包括几个变量?哪些不是数值型变量?那些是常量?(2)如果要了解学生的父母教养方式与在校受欢迎程度的关系,应该属于哪一种研究方法?(3)该样本的平均自尊分数和平均受欢迎程度是多少?[提示:∑X=∑[(X-C)+C]=∑(X-C)+NC利用这一特点进行转换,可以方便运算]6.请将例0.1中表0-4中的数据整理成类似下方的表格,然后计算给出的式子:编号X Y1 5 12 2 43 6 34 7 25 5 76 9 6(1)∑X+∑Y(2)∑X2+∑Y2(3)(∑X)2 +(∑Y)2(4)(∑X-Y)2+∑X∑Y(5)∑XY+∑0.5(X-Y)。
人教版高中数学必修二《第九章 统计》课后作业及答案解析

人教高中数学必修二《第九章统计》课后作业《9.1.1 简单随机抽样》课后作业基础巩固1.用简单随机抽样的方法从含有10个个体的总体中抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是()A.110,110B.310,15C.15,310D.310,3102.《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5B.0.6C.0.7D.0.83.总体由编号01,,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为A.08 B.07 C.02 D.014.下面抽样方法是简单随机抽样的是( )A.从平面直角坐标系中抽取5个点作为样本B.可口可乐公司从仓库中的1 000箱可乐中一次性抽取20箱进行质量检查C.某连队从200名战士中,挑选出50名最优秀的战士去参加抢险救灾活动D.从10个手机中逐个不放回地随机抽取2个进行质量检验(假设10个手机已编好) 5.为了了解某班学生的身高情况,决定从50名学生(已编号为00~49)中选取10名进行测量,利用随机数法进行抽取,得到如下4组编号,则正确的编号是()A.26,94,29,27,43,99,55,19,81,06 B.20,26,31,40,24,36,19,34,03,48C .02,38,22,41,38,24,49,44,03,11D .04,00,45,32,44,22,04,11,08,496.采用抽签法从含有3个个体的总体{}138,,中抽取一个容量为2的样本,则所有可能的样本为______.7.总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行第5列的数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为_________.8.某单位拟从40名员工中选1人赠送电影票,可采用下面两种选法:选法一:将这40名员工按1~40进行编号,并相应地制作号码为1〜40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的员工幸运入选;选法二:将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中摸取一个球,则摸到红球的员工幸运入选.试问:(1)这两种选法是否都是抽签法,为什么?(2)这两种选法中每名员工被选中的可能性是否相等?能力提升9.随机抽取某商场4月份5天的营业额(单位:万元)分别为3.4,2.9,3.0,3.1,2.6,则这个商场4月份的营业额大约是( )A .90万元B .450万元C .3万元D .15万元10.在容量为100的总体中用随机数表法抽取5个样本,总体编号为0001,0299,,,,给出下列几组号码:①00,01,02,03,04;②10,30,50,70,90;③49,19,46,04,67;④11,22,33,44,55.则可能成为所得样本编号的是________(填相应序号).11.选择合适的抽样方法抽样,写出抽样过程.(1)现有一批电子元件600个,从中抽取6个进行质量检测;(2)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个入样.素养达成12.某些商家为消费者提供免费塑料袋,使购物消费更加方便快捷,但是我们更应关注它对环境的潜在危害.为了解某市所有家庭每年丢弃塑料袋个数的情况,统计人员采用了科学的方法,随机抽取了200户,对他们某日丢弃塑料袋的个数进行了统计,结果如下表:(1)求当日这200户家庭平均每户丢弃塑料袋的个数;(2)假设某市现有家庭100万户,据此估计全市所有家庭每年(以365天计算)丟弃塑料袋的总数.《9.1.1 简单随机抽样》课后作业答案解析基础巩固1.用简单随机抽样的方法从含有10个个体的总体中抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是()A.110,110B.310,15C.15,310D.310,310【答案】A【解析】在抽样过程中,个体a每一次被抽中的概率是相等的,因为总体容量为10,故个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性均为1 10.故选A.2.《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5B.0.6C.0.7D.0.8【答案】C【解析】由题意得,阅读过《西游记》的学生人数为90-80+60=70,则其与该校学生人数之比为70÷100=0.7.故选C.3.总体由编号01,,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为A.08 B.07 C.02 D.01【答案】D【解析】从第一行的第5列和第6列起由左向右读数划去大于20的数分别为:08,02,14,07,01,所以第5个个体是01,选D.4.下面抽样方法是简单随机抽样的是( )A.从平面直角坐标系中抽取5个点作为样本B.可口可乐公司从仓库中的1 000箱可乐中一次性抽取20箱进行质量检查C.某连队从200名战士中,挑选出50名最优秀的战士去参加抢险救灾活动D.从10个手机中逐个不放回地随机抽取2个进行质量检验(假设10个手机已编好) 【答案】D【解析】A中平面直角坐标系中有无数个点,这与要求总体中的个体数有限不相符,故错误;B中一次性抽取不符合简单随机抽样逐个抽取的特点,故错误;C中50名战士是最优秀的,不符合简单随机抽样的等可能性,故错误.故选D5.为了了解某班学生的身高情况,决定从50名学生(已编号为00~49)中选取10名进行测量,利用随机数法进行抽取,得到如下4组编号,则正确的编号是()A.26,94,29,27,43,99,55,19,81,06 B.20,26,31,40,24,36,19,34,03,48C.02,38,22,41,38,24,49,44,03,11 D.04,00,45,32,44,22,04,11,08,49【答案】B【解析】对于选项A :有不在00~49内的编号,故选项A 排除;选项C ,D 中都有重复的编号,故选项C 和D 排除;故选: B6.采用抽签法从含有3个个体的总体{}138,,中抽取一个容量为2的样本,则所有可能的样本为______.【答案】{}1,3,{}1,8,{}38, 【解析】从总体中任取两个个体即可组成样本,即所有可能的样本为{}1,3,{}1,8,{}38,. 故答案为:{}1,3,{}1,8,{}38, 7.总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行第5列的数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为_________.【答案】01【解析】选取的数据依次为08,02,14,07,01,所以选出来的第5个个体的编号为018.某单位拟从40名员工中选1人赠送电影票,可采用下面两种选法:选法一:将这40名员工按1~40进行编号,并相应地制作号码为1〜40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的员工幸运入选;选法二:将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中摸取一个球,则摸到红球的员工幸运入选.试问:(1)这两种选法是否都是抽签法,为什么?(2)这两种选法中每名员工被选中的可能性是否相等?【答案】(1)见解析;(2)这两种选法中每名员工被选中的可能性相等,均为140. 【解析】(1)选法一:满足抽签法的特征,是抽签法;选法二:不是抽签法抽签法要求所有的号签编号互不相同,而选法二中的39个白球无法相互区分(2)这两种选法中每名员工被选中的可能性相等,均为140能力提升9.随机抽取某商场4月份5天的营业额(单位:万元)分别为3.4,2.9,3.0,3.1,2.6,则这个商场4月份的营业额大约是( )A .90万元B .450万元C .3万元D .15万元 【答案】A 【解析】样本平均数为()1 3.4 2.9 3.0 3.1 2.635⨯++++=,所以这个商场4月份营业额约为3×30=90(万元)故选:A 10.在容量为100的总体中用随机数表法抽取5个样本,总体编号为0001,0299,,,,给出下列几组号码:①00,01,02,03,04;②10,30,50,70,90;③49,19,46,04,67;④11,22,33,44,55.则可能成为所得样本编号的是________(填相应序号).【答案】①②③④【解析】随机数表法是一种简单随机抽样方法,因此每一个个体都有可能被抽到,且被抽到的可能性相同,因此所列几组都可能成为所得样本的编号.答案:①②③④11.选择合适的抽样方法抽样,写出抽样过程.(1)现有一批电子元件600个,从中抽取6个进行质量检测;(2)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个入样.【答案】(1)见解析;(2)见解析【解析】(1)总体中个体数较大,用随机数法.第一步,给元件编号为1,2,3,...,99,100, (600)第二步,用随机数工具产生1~600范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的电子元件进入样本;第三步,依次操作,如果生成的随机数有重复,则剔除并重新产生随机数,直到样本量达到6;第四步,以上这6个号码对应的元件就是要抽取的对象.(2)总体中个体数较小,用抽签法.第一步,将30个篮球,编号为1,2, (30)第二步,将以上30个编号分别写在外观、质地等无差别的小纸条上,揉成小球状,制成号签;第三步,把号签放入一个不透明的盒子中,充分搅拌;第四步,从盒子中不放回地逐个抽取3个号签,并记录上面的号码;第五步,找出和所得号码对应的篮球.素养达成12.某些商家为消费者提供免费塑料袋,使购物消费更加方便快捷,但是我们更应关注它对环境的潜在危害.为了解某市所有家庭每年丢弃塑料袋个数的情况,统计人员采用了科学的方法,随机抽取了200户,对他们某日丢弃塑料袋的个数进行了统计,结果如下表:(1)求当日这200户家庭平均每户丢弃塑料袋的个数;(2)假设某市现有家庭100万户,据此估计全市所有家庭每年(以365天计算)丟弃塑料袋的总数.【答案】(1)3;(2)109500万个【解析】(1)()11115260365435520656003200200⨯⨯+⨯+⨯+⨯+⨯+⨯=⨯= 故当日这200户家庭平均每户丢弃塑料袋的个数为3.(2)3365100109500⨯⨯=故全市所有家庭每年丢弃塑料袋109500万个.《9.1.2 分层随机抽样》课后作业基础巩固1.从某地区中小学生中抽取部分学生,进行肺活量调查.经了解,该地区小学、初中、高中三个学段学生的肺活量有较大差异,而同一学段男女生的肺活量差异不大.在下面的抽样方法中,最合理的抽样方法是()A.抽签法 B.按性别分层随机抽样 C.按学段分层随机抽样 D.随机数法2.某实验中学共有职工150人,其中高级职称的职工15人,中级职称的职工45人,一般职员90人,现采用分层抽样抽取容量为30的样本,则抽取的高级职称、中级职称、一般职员的人数分别为()A.5、10、15 B.3、9、18 C.3、10、17 D.5、9、16A B C三个专业共有1200名学生,为了调查这些学生勤工俭学的情况,3.某学院、、拟采用分层抽样的方祛抽取一个容量为120的样本,已知该学院的A专业有380名学生,B 专业有420名学生,则在该学院的C专业应抽取的学生人数为()A.30 B.40 C.50 D.604.某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作样本,若用分层抽样方法,则40岁以下年龄段应抽取( )A.10人B.15人C.20人D.25人5.某房地产公司为了解小区业主对户型结构——平层与复式结构的满意度,采取分层随机抽样方式对华润中央公园小区的业主进行问卷调查.20位已购买平层户型的业主满意度平均分为8,30位已购买复式户型的业主满意度平均分为9,用样本平均数估计该小区业主对户型结构满意度的平均分为()A.8.4 B.8.5 C.8.6 D.8.76.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区有10个特大型销售点,要从中抽取7个销售点调查其销售收入和售后服务等情况,记这项调查为②,则完成①②这两项调查宜采用的抽样方法分别为_____.7.甲、乙两套设备生产的同类产品共4800件,采用分层抽样的方法从中抽取一个容量为80 的样本进行检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.8.选择合适的抽样方法抽样,写出抽样过程.(1)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个;(2)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个.能力提升9.某校有高一学生n名,其中男生数与女生数之比为6:5,为了解学生的视力情况,现的样本,若样本中男生比女生多12人,则n=要求按分层抽样的方法抽取一个样本容量为n10()A.990 B.1320 C.1430 D.156010.我国古代数学算经十书之一的《九章算术》中有一“衰分”问题.“今有北乡八千七百五十人,西乡七千二百五十人,南乡八千三百五十人,凡三乡,发役四百八十七人.则西乡遣___________人”.11.某公司总体由1000人组成,按收入情况分成两层,第—层(高收入层)20人,第二层(低收入层)980人.从第一层随机抽取2人,调查上月收入得12000元和16000元;从第二层随机抽取8人,上月收入分别为2200元、2300元、1800元、3200元、4000元、3400元、2800元及3600元.如何来估计这月1000人的月收入?素养达成12.某单位2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?(3)若要抽20人调查对北京9月3日阅兵情况的了解,则应怎样抽样?《9.1.2 分层随机抽样》课后作业答案解析基础巩固1.从某地区中小学生中抽取部分学生,进行肺活量调查.经了解,该地区小学、初中、高中三个学段学生的肺活量有较大差异,而同一学段男女生的肺活量差异不大.在下面的抽样方法中,最合理的抽样方法是()A.抽签法 B.按性别分层随机抽样 C.按学段分层随机抽样 D.随机数法【答案】C【解析】小学、初中、高中三个学段学生的肺活量有较大差异∴学段对统计结果影响较大同一学段男女生肺活量差异不大∴性别对统计结果无明显影响∴最合理的抽样方法是按学段分层随机抽样故选:C2.某实验中学共有职工150人,其中高级职称的职工15人,中级职称的职工45人,一般职员90人,现采用分层抽样抽取容量为30的样本,则抽取的高级职称、中级职称、一般职员的人数分别为A.5、10、15 B.3、9、18 C.3、10、17 D.5、9、16【答案】B【解析】高级职称应抽取3015=3150⨯;中级职称应抽取3045=9150⨯;一般职员应抽取3090=18150⨯.3.某学院、、A B C三个专业共有1200名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方祛抽取一个容量为120的样本,已知该学院的A专业有380名学生,B 专业有420名学生,则在该学院的C专业应抽取的学生人数为()A.30 B.40 C.50 D.60【答案】B【解析】C 专业的学生有1200380420400--= 由分层抽样原理,应抽取400120401200⨯=名 故选B4.某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作样本,若用分层抽样方法,则40岁以下年龄段应抽取( )A .10人B .15人C .20人D .25人【答案】C【解析】由年龄分布情况图可得40岁以下年龄段应抽取40×50%=20人. 故选:C .5.某房地产公司为了解小区业主对户型结构——平层与复式结构的满意度,采取分层随机抽样方式对华润中央公园小区的业主进行问卷调查.20位已购买平层户型的业主满意度平均分为8,30位已购买复式户型的业主满意度平均分为9,用样本平均数估计该小区业主对户型结构满意度的平均分为( )A .8.4B .8.5C .8.6D .8.7【答案】C【解析】估计小区业主对户型结构满意度的平均分为2030898.620302030W =⨯+⨯=++.故选:C .6.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区有10个特大型销售点,要从中抽取7个销售点调查其销售收入和售后服务等情况,记这项调查为②,则完成①②这两项调查宜采用的抽样方法分别为_____.【答案】分层随机抽样、简单随机抽样【解析】由调查①可知个体差异明显,故宜用分层随机抽样;调查②中个体较少,且个体没有明显差异,故宜用简单随机抽样.故答案为:分层随机抽样、简单随机抽样7.甲、乙两套设备生产的同类产品共4800件,采用分层抽样的方法从中抽取一个容量为80 的样本进行检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.【答案】1800【解析】由题共有产品4800名,抽取样本为80,则抽取的概率为;801480060P==,再由50件产品由甲设备生产,则乙设备生产有30件,则乙设备在总体中有;30601800⨯=.8.选择合适的抽样方法抽样,写出抽样过程.(1)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个;(2)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个.【答案】(1)抽签法.见解析(2)分层随机抽样.见解析【解析】(1)总体容量较小,用抽签法.①将30个篮球编号,编号为00,01, (29)②将以上30个编号分别写在完全一样的小纸条上,揉成小球,制成号签;③把号签放入一个不透明的袋子中,充分搅拌;④从袋子中逐个抽取3个号签,并记录上面的号码;⑤找出和所得号码对应的篮球即可得到样本.(2)总体由差异明显的两个层次组成,需选用分层随机抽样.①确定抽取个数.因为30310=,所以甲厂生产的篮球应抽取2173=(个),乙厂生产的篮球应抽取933=(个);②用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个,这些篮球便组成了我们要抽取的样本.能力提升9.某校有高一学生n名,其中男生数与女生数之比为,为了解学生的视力情况,现要求按分层抽样的方法抽取一个样本容量为的样本,若样本中男生比女生多12人,则()A.990 B.1320 C.1430 D.1560【答案】B【解析】依题意可得,解得,故选:B 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
练习题
1.重复测量设计相对独立样本设计的主要优点是什么?解释重复测量设计和匹配被试设计的区别。
2.分别简述单样本t检验、独立样本t检验和相关样本t检验的适用条件。
3.举例说明分别适用于独立样本t检验和相关样本t检验的实际研究。
4.以下关于相关样本t检验的假设的说法中正确的是()
(A)每种处理条件下的观测值是独立的
(B)差异值(D)的总体分布服从正态分布
(C)被试内的观测值独立
(D)总体方差已知
5.以下是一个重复测量研究样本差值的描述:
样本1:n=10,⎺x D=+4.00,S=10;
样本2:n=10,⎺x D=+12.00,S=10。
a.使用每个样本的平均数和标准差描述其分布(或者简要描述分布),并确定数据中零值的位置。
b.虚无假设是总体平均差值为0(u D=0),哪个样本更可能拒绝虚无假设?并做出解释。
6.样本量n=9的重复测量t检验的差值(D值)的SS=288。
a.样本差值均值⎺x D=3在α=0.05的双侧检验中是否可以拒绝虚无假设。
b.样本差值均值⎺x D=6在α=0.05的双侧检验中是否可以拒绝虚无假设。
7.Strack,Martin,和Stepper(1998)研究发现与将铅笔置于嘴唇上时(被试皱眉头)相比,将铅笔置于牙齿上时(被试微笑)被试认为卡通图片有趣的概率更高。
研究者对40~45岁之间的16个成年人被试重复上述实验。
研究者记录了每个被试微笑和皱眉头时判断卡通图片有趣概率的差异。
平均来讲,被试在微笑时认为卡通图片有趣的概率更高,⎺x D=3.6,SS=960。
数据是否表明被试在微笑时认为卡通图片有趣的概率显著更高。
α=0.05,单侧检验。