2020版人教A版数学选修2-3同步配套__第三章 统计案例第三章检测(B)
【最新推荐】2019-2020学年人教A版高中数学选修2-3配套限时规范训练:第3章 统计案例 3.1 Word版含解析

第三章 3.1【基础练习】1.对两个变量y 与x 进行回归分析,得到一组样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则下列说法不正确的是( )A .若求得相关系数r =-0.89,则y 与x 具备很强的线性相关关系且为负相关B .同学甲根据这组数据得到的回归模型1的残差平方和E 1=1.8,同学乙根据这组数据得到的回归模型2的残差平方和E 2=2.4,则模型1的拟合效果更好C .用相关指数R 2来刻画回归效果,模型1的相关指数R 21=0.48,模型2的相关指数R 22=0.91,则模型1的拟合效果更好 D .该回归分析只对被调查样本的总体适用 【答案】C2.设有一个线性回归方程y ^=2-3.5x ,则变量x 增加1个单位时( ) A .y 平均增加3.5个单位 B .y 平均增加2个单位 C .y 平均减少3.5个单位 D .y 平均减少2个单位【答案】C3.在对两个变量y 与x 进行回归分析时,分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合效果最好的模型是( )A .模型1,相关指数R 2为0.98B .模型2,相关指数R 2为0.80C .模型3,相关指数R 2为0.50D .模型4,相关指数R 2为0.25 【答案】A4.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 【答案】D5.已知x 与y 之间的一组数据如下,则y 与x 的线性回归方程为y ^=bx +a 必过点________.x134【答案】(2,4)6.某次测量发现一组数据(x i ,y i )具有较强的相关性,并计算得y ^=x +1,其中数据(1,y 0)因书写不清,只记得y 0是[0,3]上任意一个值,则该数据对应的残差的绝对值不大于1的概率为________.(残差=真实值-预测值)【答案】23【解析】由题意,其预测值为1+1=2,该数据对应的残差的绝对值不大于1时,1≤y 0≤3,其概率可由几何概型求得,即该数据对应的残差的绝对值不大于1的概率p =3-13=23. 7.(2017年烟台期中)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)(2)已知该厂技术改造前100吨甲产品的生产能耗为90吨标准煤,试根据(1)求出的线性回归方程预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤.参考公式:b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x .【解析】(1)x =14×(3+4+5+6)=4.5,y -=14×(2.5+3+4+4.5)=3.5,∑i =14x i y i =3×2.5+4×3+5×4+6×4.5=66.5,∑i =14x 2i =32+42+52+62=86,b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a ^=y --b ^x =3.5-0.7×4.5=0.35, 所以所求的回归方程为y =0.7x +0.35. (2)x =100时,y =100×0.7+0.35=70.35,预测生产100吨甲产品的生产能耗比技改前降低了90-70.35=19.65(吨标准煤). 8.某运动员训练次数与成绩之间的数据关系如下:(1)(2)求出回归方程; (3)作出残差图; (4)计算相关指数R 2.【解析】(1)作出该运动员训练次数(x )与成绩(y )之间的散点图如图所示,由散点图可知,它们之间具有线性相关关系.(2)x =39.25,y =40.875,∑i =18x 2i =12 656,∑i =18y 2i =13 731,∑i =18x i y i =13 180,∴b ^=∑i =18x i y i -8x y∑i =18x 2i -8x2≈1.041 5.∴a ^=y -b ^x ≈-0.003 02. ∴回归方程为y ^=1.041 5x -0.003 02. (3)作残差图如图所示,由图,可知残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适. (4)计算得相关指数R 2=0.985 5,说明了该运动员的成绩的差异有98.55%是由训练次数引起的.【能力提升】9.(2019年天津期末)某研究机构在对具有线性相关的两个变量x,y 进行统计分析时,得到如下数据,由表中数据求得y 关于x 的回归方程为^y=0.7x+a ,则在这些样本点中任取一点,该A.14B.12C.34D.0【答案】B【解析】由题意得_x=6,_y=3,所以3=0.7×6+a ,解得a=-1.2,则^y=0.7x-1.2.四个样本点中,(3,1),假设根据上表数据所得线性回归直线方程为y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y ′=b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′ D.b ^<b ′,a ^<a ′【答案】C【解析】计算得x =3.5,y -=136,画出散点图,并根据各个点和回归中心画出回归直线的大致图形如图所示,由图易知b ^<b ′,a ^>a ′.故选C.11.(2018年珠海阶段性测试)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,计算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i=184,∑i =110x 2i =720.已知家庭的月储蓄y 关于月收入x 的线性回归方程为y ^=b ^x +a ^,则变量y与x________(填“正相关”或“负相关”);若该居民区某家庭月收入为8千元,预测该家庭的月储蓄是________千元.【答案】正相关 2【解析】由题意知x=110∑i=110x i=8,y-=110∑i=110y i=2,∴b^=184-10×8×2720-10×82=0.3,a^=2-0.3×8=-0.4,∴y^=0.3x-0.4.∵0.3>0,∴变量y与x正相关.当x=8时,y^=0.3×8-0.4=2(千元).12.(2016年唐山二模)二手车经销商小王对其所经营的某一型号二手汽车的使用年数x(0<x≤10)与销售价格y(单位:万元/辆)进行整理,得到如表的对应数据:(1)试求y关于x(2)已知每辆该型号汽车的收购价格为w=0.05x2-1.75x+17.2万元,根据(1)中所求的回归方程,预测x为何值时,小王销售一辆该型号汽车所获得的利润z最大.【解析】(1)由表中数据得,x=15×(2+4+6+8+10)=6,y=15×(16+13+9.5+7+4.5)=10,所以b^=2×16+4×13+6×9.5+8×7+10×4.5-5×6×1022+42+62+82+102-5×62=-1.45,a^=10-(-1.45)×6=18.7.所以y关于x的回归直线方程为y=-1.45x+18.7.(2)z=y-w=(-1.45x+18.7)-(0.05x2-1.75x+17.2)=-0.05x2+0.3x+1.5,当x=-0.32×(-0.05)=3时,二次函数z取得最大值,即预测x=3时,小王销售一辆该型号汽车所获得的利润z最大.。
2020学年高中数学第三章统计案例单元质量测评新人教A版选修2-3(2021-2022学年)

第三章单元质量测评本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.满分150分,考试时间120分钟.第Ⅰ卷(选择题,共60分)一、选择题(本大题共12小题,每小题5分,共60分)1.下列属于相关关系的是( )A.利息与利率B.居民收入与储蓄存款C.电视机产量与苹果产量D.某种商品的销售额与销售价格答案B解析A与D是函数关系,C中两变量没有关系,B中居民收入与储蓄存款是相关的,但不具有函数关系.2.已知一个线性回归方程为错误!=1.5x+45,其中x的取值依次为1,7,5,13,19,则错误!未定义书签。
=( )A.58。
5ﻩB.46.5C.60 D.75答案A解析错误!=错误!未定义书签。
=9,因为回归直线必过样本点的中心(错误!,错误!未定义书签。
),所以错误!=1.5×9+45=13.5+45=58。
5.故选A。
3.利用独立性检验来考察两个分类变量X和Y是否有关系时,通过查阅下表来确定“X与Y有关系”的可信程度.如果k≥5.024,那么就有把握认为“X与Y有关系”的百分比为()A.25% B.75%ﻬC.2.5% D.97。
5%答案D解析k=5。
024对应的0.025是“X和Y有关系"不合理的程度,因此两个分类变量有关系的可信程度约为97.5%.4.工人月工资(元)依劳动生产率(千元)变化的回归方程为错误!=50+80x,下列判断正确的是()①劳动生产率为1000元时,则工资为130元;②劳动生产率提高1000元时,则工资提高80元;③劳动生产率提高1000元时,则工资提高130元;④当月工资210元,劳动生产率为200元.A.①ﻩB.②C.③ D.④答案B解析∵回归直线斜率为80,∴x每增加1千元,错误!增加80,即劳动生产率提高1000元时,工资提高80元.5.如图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是( )A.相关系数r变大B.残差平方和变大C.R2变大D.解释变量x与预报变量y的相关性变强答案B解析由散点图知,去掉D后,x,y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.6.如图所示的是一组观测值的四个线性回归模型对应的残差图,则对应的线性回归模型的拟合效果最好的残差图是()答案A解析因为残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.故选A.7.已知方程错误!=0。
人教A版选修2-3第三章+统计案例+同步练测(数学选修2-3).docx

高中数学学习材料马鸣风萧萧*整理制作第三章 统计案例 同步练测(数学北京师大版选修2-3)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.对于散点图,下列说法中正确的是( ) A.通过散点图一定可以看出变量之间的变化规律 B.通过散点图一定不可以看出变量之间的变化规律C.通过散点图可以看出正相关与负相关有明显区别D.通过散点图看不出正相关与负相关有什么区别2.若回归直线方程为y 2 3 5x ,则变量x 增加一个单位,变量y 平均( ) A.减少3.5个单位 B.增加2个单位 C.增加3.5个单位 D.减少2个单位3.观察图中各图形:① ②③ ④其中两个变量x ,y 具有相关关系的图是( ) A.①②B.①④C.③④D.②③4.在画两个变量的散点图时,下面叙述正确的 是( )A.预报变量在x 轴上,解释变量在y 轴上B.解释变量在x 轴上,预报变量在y 轴上C.可以选择两个变量中的任意一个变量在x 轴上D.可以选择两个变量中的任意一个变量在y 轴上5.下列关系中,是相关关系的为 ( )①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系. A.①② B.①③ C.②③ D.②④6.为了考察两个变量x 、y 之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l 1和l 2.已知在两人的试验中发现变量x 的观测数据的平均值恰好相等,都为s ,变量y 的观测数据的平均值也恰好相等,都为t ,那么下列说法中正确的是( ) A.直线l 1,l 2有交点(s ,t )B.直线l 1,l 2相交,但是交点未必是(s ,t )C.直线l 1,l 2由于斜率相等,所以必定平行D.直线l 1,l 2必定重合建议用时实际用时满分 实际得分120分钟150分7.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y =3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③曲线上的点与该点的坐标之间具有相关关系; ④在一个2×2的列联表中,由计算得2χ=13.079,则其两个变量间有关系的可能性是90%. 其中错误的个数是( )A.1B.2C.3D.48.若两个分类变量x 和y 的列联表为:y 1 y 2 x 1 5 15 x 24010则x 与y 之间有关系的可能性为 ( ) A.0.1% B.99.9% C.97.5% D.0.25% 9.若对于变量y 与x 的10组统计数据的回归模型中,相关指数95.02=R ,又知残差平方和为53.120,那么∑=-1012)(i iy y的值为( )A.06.241B.6.2410C.08.253D.8.253010.下表是对于喜欢足球与否的统计列联表依据表中的数据,得到( )A. 2χB.2χC. 2χ706.22<KD. 2χ841.32>K11.由一组样本数据 x y x y x y 得到的回归直线方程为y bx a =+,那么下面说法正确的是( ) A.直线y bx a =+必过点),(--y xB.直线ybx a =+必经过 x ,y , x ,y ,, x y 中的一点 C.直线ybx a =+经过 x ,y , x y , ,x ,y 中某两个特殊点 D.直线ybx a =+必不过点),(--y x12.根据下面的列联表得到如下四个判断:①有0099的把握认为患肝病与嗜酒有关;②认为患肝病与嗜酒有关的出错的可能为 ;③认为患肝病与嗜酒有关的出错的可能为 .其中正确命题的个数为( ) A.0 B.1C.2D.3二、填空题(本大题共4小题,每小题4分,共16分.将答案填写在题中的横线上)13.面对竞争日益激烈的消费市场,众多商家不断扩大自已的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量x (千箱)与单位成本y (元)的资料进行线性回归分析,结果如下:()6621127717914812714816712 1.818277962771 1.818277.362i i i i i x y x x y b a ======-⨯⨯=≈-⎛⎫-⨯ ⎪⎝⎭≈--⨯≈∑∑,,,,,,则销量每增加1 000箱,单位成本约下降_______元.14.下表是关于出生男婴与女婴调查的列联表:晚上 白天 总计 男婴45女婴 35 总计98180那么, , , , , .15.如下表中给出的五组数据),(y x ,从中选出四组使其线性相关最大,且保留第一组)3,5(--,那么,应去掉第 组.x y16.某学校对课程《人与自然》的选修情况进行了统计,得到如下数据:那么,选修《人与自然》与性别有关的把握是 .三、解答题(本大题共6小题,共74分.解答应写出文字说明、证明过程或演算步骤)17.(本小题满分12分)为研究是否喜欢饮酒与性别之间的关系,在某地区随机抽取290人,得到如下列联表:喜欢饮酒 不喜欢饮酒总计 男 101 45 146 女 124 20144 总计22565290利用列联表的独立性检验是否有超过95%的把握认为饮酒与性别有关系?18.(本小题满分12分)有甲、乙两个班,进行数学考试,按学生考试及格与不及格统计成绩后,得到如下的列联表根据表中数据,你有多大把握认为成绩及格与班级有关?19.(本小题满分12分)一机器可以按不同的速度运转,其生产物件有一些会有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x 表示转速(单位:转/秒),用y 表示每小时生产的有缺点物件的个数,现观测得到),(y x 的四组观测值为)11,16(),9,14(),8,12(),5,8(.若实际生产中所允许的每小时有缺点物件数不超过10,则机器的速度每秒不得超过多少转?20.(本小题满分12分)在大街上,随机调查339名成人,有关吸烟、不吸烟、患肺炎、不患肺炎的数据如下表:患肺炎 未患肺炎 总计 吸烟 43 162 205 不吸烟 13 121 134 总计 56283339(1)判断:吸烟与患肺炎是否有关?(2)用假设检验的思想予以证明.21.(本小题满分13分)假设关于某种设备的使用年限x (年)与所支出的维修费用y (万元)有如下统计资料:x 2 3 4 5 6 y2.23.85.56.57.0已知∑i =15x 2i =90,∑i =15y 2i =140.8,∑i =15x i y i =112.3.(1)求x ,y ;(2)如果x 与y 具有线性相关关系,求出线性回归 方程;(3)估计使用年限为10年时,维修费用约是多少?22.(本小题满分13分)在综合素质评价的某个维度的测评中,依据评分细则,学生之间相互打分,最终将所有的数据合成一个分数.满分100分,按照大于等于80分为优秀,小于80分为合格.为了解学生在该维度的测评结果,从毕业班中随机抽出一个班的数据.该班共有60名学生,得到如下的列联表.优秀 合格总计 男生 6 女生 18 总计60已知在该班随机抽取1人,测评结果为优秀的概率为13.(1)请完成上面的列联表;(2)能否在犯错误的概率不超过0.10的前提下认为性别与测评结果有关系?(3)现在如果想了解全校学生在该维度的表现情况,采取简单随机抽样的方式在全校学生中抽取少数一部分人来分析,请你选择一个合适的抽样方法,并解释理由.第三章 统计案例 同步练测(数学北京师大版选修2-3)答题纸得分:一、选择题题号 1 2 3 4 5 6 7 8 9 10 11 12 答案二、填空题13. 14. 15. 16.三、计算题17.18.19.20.21.22.第三章 统计案例 同步练测(数学北京师大版选修2-3)答案一、选择题 1.C2.A 解析:由回归直线方程可得3.5,b =-则变量x 增加一个单位,变量y 平均减少3.5个单位.3.C 解析:由相关关系的定义,当散点图中的点集中在一条直线或曲线附近时就称两变量具有相关关系.4.B5.A 解析:学生的学习成绩与学生的学习态度和教师的执教水平是相关的,与学生的身高和家庭经济条件不相关.6.A 解析:由,y bx a a y bx =+=-可知,当x x =时,y y =,故回归方程过定点()x y ,.所以回归直线1l 过点()s t ,,回归直线2l 也过点()s t ,,所以1l 与2l 有交点()s t ,.7.C 解析:根据方差的计算公式,可知①正确,②③④不正确.8.B 解析:()()225154010510401518.822>6.635(515)(4010)(540)(1510)χ+++⨯-⨯≈++++=,∴ 有 以上的把握认为x 与y 之间有关系. 9.B10.D 解析:由2χ841.3722.4))()()(()(22>=++++-=d b c a d c b a bc ad n K .11.A12.C 解析:由2χ635.6828.10632.56))()()(()(22>>=++++-=d b c a d c b a bc ad n K ,可判断出①②正确.二、填空题13.1.818 2 解析:由分析可得,y x ,销量每增加1千箱,则单位成本约下降 元. 14.47 92 88 82 53 15.3 解析:画散点图可以发现.16. 解析:2χ828.108.163))()()(()(22>=++++-=d b c a d c b a bc ad n K ,即有 的把握,认为选修《人与自然》与性别有关. 三、计算题17.解:由列联表中的数据得2χ=290×(101×20-124×45)2146×144×225×65≈11.953.∵ ,∴ 有 的把握认为“是否喜欢饮酒与性别有关”. 18.解:由列联表中的数据,得2χ706.26527.073174545)3573810(90))()()(()(22<=⨯⨯⨯⨯-⨯⨯=++++-=d b c a d c b a bc ad n K ,没有充分的证据显示“成绩及格或不及格与班级有关”. 19.解:由于5.12)1614128(41=+++=x ,25.8)11985(41=+++=y , 5.25))((41=--∑=i i iy y x x,35)(412=-∑=i i x x ,75.18)(412=-∑=i i y y ,那么75.0995.075.18355.25>=⨯=r ,因此,y 与x 之间具有很强的线性相关关系.于是由公式,得0.7290.863b a ≈≈-,,那么y 与x 之间的回归直线方程为0.7290.863y x =-,由0.7290.86310y x =-≤,得14.9015x ≤≈,即每小时有缺点的物件数不超过10时,机器的速度每秒不得超过15转. 20. 解:(1)由列联表中的数据,得2χ635.6469.728356134205)1214316213(339))()()(()(22>=⨯⨯⨯⨯-⨯⨯=++++-=d b c a d c b a bc ad n K ,所以有0099的把握认为吸烟与患肺炎有关.(2)假设吸烟与患肺炎无关,由于2( 6.635)0.01A P χ=>≈,即A 为小概率事件,而小概率事件发生了,进而得出假设错误,得到吸烟与患肺炎有关. 21. 解:(1)x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+7.05=5.(2) 5152215()iii ii x y x yb xx =--==∑∑=112.3-5×4×590-5×42=1.23,51.2340.08.a y bx =-⨯=-= 所以线性回归方程为 1.23.0.08y x =+(3)当10x =时,1.23100.0812.38()y ⨯=+=万元,即估计使用10年时,维修费用约为12.38万元.22.解:(1)优秀 合格 总计 男生 6 22 28 女生141832总计 204060(2)提出统计假设:性别与测评结果没有关系,则2=60 6 18 22 14240 20 32 28≈3.348>2.706,因此,有90%的把握认为性别与测评结果有关系.(3)由(2)可知性别很有可能对是否优秀有影响,所以采用分层抽样按男、女生比例抽取一定的学生,这样 得到的结果对学生在该维度测评中的总体表现情况会比较符合实际情况.。
2019-2020学年高中数学人教A版选修2-3同步训练:第三章 章末检测 Word版含答案

第三章 章末检测1、如果散点图中所有的样本点均在同一条直线上,那么残差平方和与相关系数的绝对值分别为( ) A.1,0B.0,1C.0.5,0.5D.0.43,0.572、为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取60名高中生做问卷调查,得到以下数据:由以上数据,计算得到2K 的观测值9.643k ≈,根据临界值表,以下说法正确的是( ) A.在样本数据中没有发现足够证据支持结论"作文成绩优秀与课外阅读量大有关" B.在犯错误的概率不超过0.001的前提下,认为作文成绩优秀与课外阅读量大有关 C.在犯错误的概率不超过0.05的前提下,认为作文成绩优秀与课外阅读量大有关 D.在犯错误的概率不超过0.005的前提下,认为作文成绩优秀与课外阅读量大有关 3、某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位: t )和年利润z (单位:千元)的影响.对近8年的年宣传费i x 和年销售量()1,2,,8i y i =⋯数据作了初步处理,得到下面的散点图及一些统计量的值.有下列5个曲线类型:①;y bx a =+②;y c d =+③;y p qlnx =+④12;y k ek x =⑤122,y c x c =+则较适宜作为年销售量y 关于年宣传费x 的回归方程的是( )A.①②B.②③C.②④D.③⑤ 4、假设有两个变量X 与,Y 它们的取值分别为12,x x 和12,,y y 其列联表为:以下各组数据中,对于同一样本能说明X 与,Y 有关系的可能性最大的一组为( ) A. 50,40,30,20a b c d ==== B. 50,30,40,20a b c d ==== C. 20,30,40,50a b c d ==== D. 20,30,50,40a b c d ====5、某饮料店在某5天的月销售收入y (单位:百元)与当天平均气温x (单位:℃)之间的数据如下表甲、乙、丙、丁四位同学对上述数据进行了研究,分别得到了x 与y 之间的四个线性回归方程①3? y x =-+ ②2ˆ.8yx =-+ ③ 2.6y x =-+ ④ 2.4y x =-+ 其中正确的方程是( )A.①B.②C.③D.④ 6、在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则实验效果与教学措施( )A.有关B.无关C.关系不明确D.以上都不正确 7、为预测某种产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取了8组观察值.计算知52,228,478, 1 849i i iyi ====,则y 对x 的回归方程是( ) A. 11.47 2.62y x =+ B. 11.47 2.62y x =-+ C. 2.6211.47y x =+ D. 11.47 2.62y x =-8、下表给出5组数据(),,x y 为选出4组数据使得线性相关程度最大,且保留第1组数据()5,3,--则应去掉()A.第2组数据B.第3组数据C.第4组数据D.第5组数据 9、已知x,y 的值如下表所示:如果y 与x 呈线性相关且回归直线方程为7,2y bx =+则b 等于( ) A. 12- B.12 C. 110-D. 11010、某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )A. 10200ˆyx =-+ B. 10200ˆyx =+ C. 10200ˆyx =-- D. 10200ˆyx =- 11、种植小麦的施肥量()x kg 、与产量()y kg 之间的回归直线方程为2504ˆyx =+,当施肥量为50kg 时,预计小麦产量为__________. 12、以下三个命题:①若两个变量的线性相关性越强,则它们的相关系数的值越接近于1; ②在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;③对分类变量X 与Y 的随机变量2K 的观测值k 来说, k 越小,判断“X 与Y 有关系”的把握越大.其中假命题的序号为________.13、在2013年元旦期间,某市物价部门对本市五个商场销售的某商品一天的销售量及其价格进行了调查,五个商场的价格x 元和销售量y 件之间的一组数据如下表所示:通过分析,发现销售量y 与商品的价格x 具有线性相关关系,则销售量y 关于商品的价格x 的线性回归方程为__________.参考公式: 1221,ˆˆˆni ii nii x y nxybay bx xnx ==-==--∑∑ 14、出下列命题:① 样本方差反映了所有样本数据与样本平均值的偏离程度;② 若随机变量()20.43,0.18X N ~,则此正态曲线在: 0.43x =处达到峰值; ③ 在回归分析模型中,残差平方和越小,说明模型的拟合效果越差;④ 某市政府调査该市市民收入与市民旅游欲望的关系时,抽查了3000人.经过计算得2 6.023K =,根据这一数据査阅下表,则市政府有97.5%以上的把握认为市民收入与旅游欲望有关系.其中正确的命题是__________.15、从某居民区随机抽取10个家庭,获得第i 个家庭的月收入i x (单位:千元)与月储蓄i y (单位:千元)的数据资料,算得10180ii x==∑,10120i i y ==∑,101184i i i x y ==∑,1021720i i x ==∑。
高中数学人教A版选修2-3课件第三章统计案例

^
(2)现有第二个线性模型:y=7x+17,且 R 2=0.82.
若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说
明理由.
专题归纳
高考体验
^
^
解:(1)依题意设 y 与 x 的线性回归方程为=6.5x+.
2+4+5+6+8
=
=5,
=
^
5
30+40+60+50+70
来粗略地判断两个变量的相关性.
2
(-)
(2)通过公式 K2=
(+)(+)(+)(+)
表作比较,最后得出结论.
先计算观测值k,再与临界值
专题归纳
高考体验
跟踪训练 2某学生对其亲属30人的饮食习惯进行了一次调查,并
用茎叶图表示30人的饮食指数,如图所示.(说明:图中饮食指数低于
愿意
不愿意
男生
20
10
女生
10
20
性别
(1)用分层抽样的方法在愿意提供志愿者服务的学生中抽取6人,
其中男生抽取多少人?
专题归纳
高考体验
(2)你能否在犯错误的概率不超过0.01的前提下认为该校高中生
是否愿意提供志愿者服务与性别有关?
下面的临界值表供参考:
P(K2≥k0) 0.15
k0
0.10
0.05
5
=50,
^
∵=6.5x+经过(, ),
^
^
∴50=6.5×5+,∴=17.5,
^
∴y 与 x 的线性回归方程为=6.5x+17.5.
人教版数学高二A版选修2-3单元测试第三章统计案例

第三章过关检测(时间90分钟,满分100分)知识点分布表知识点题号散点图1,11线性回归方程2,3,11回归方程的截距、斜率4,8非线性回归7残差平方和9独立性检验6,12回归分析5,10一、选择题(每小题4分,共40分)1.如下图所示,4个散点图中,不适合用线性回归模型拟合其中两个变量的是( )2.已知呈线性相关关系的变量x,y之间的关系如下表所示,则回归直线一定过点( )x0.10.20.30.5y 2.11 2.85 4.0810.15A.(0.1,2.11)B.(0.2,2.85)C.(0.3,4.08)D.(0.275,4.797 5)3.两个变量满足如下关系:x510152025y103105110111114则两个变量线性相关程度( )A.很强B.很弱C.无相关性D.不确定4.一位母亲记录了儿子3~9岁的身高,数据如下表.由此建立的身高与年龄的回归模型为y =7.19x +73.93.用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )A.身高一定在145.83 cmB.身高在145.83 cm 以上C.身高在145.83 cm 左右D.身高在145.83 cm 以下5.对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程的截距和斜率的最小二乘法估计公式分别为_______和∑∑==---=ni ini i ix xy y x xb121)())((ˆ.( )A.a =y -bxB.x by a ˆ-= C.bx y a -=ˆ D.x b y a ˆˆ-= 6.(2009山东潍坊一模)下列关于等高条形图说法正确的是( ) A.等高条形图表示高度相对的条形图 B.等高条形图表示的是分类变量的频数 C.等高条形图表示的是分类变量的百分比 D.等高条形图表示的是分类变量的实际高度 7.身高与体重有关系,可以用分析的方法来判断( )A.残差B.回归C.等高条形图D.独立性检验 8.下列关于K 2的说法中正确的是( )A.K 2在任何相互独立问题中都可以用于检验有关还是无关B.K 2的值越大,两个事件的相关性就越大C.K 2是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合D.K 2的观测值k 的计算公式为))()()(()(d b c a d c b a bc ad n k ++++-=9.设在海拔x m 处的大气压强是y Pa,y 与x 之间的关系为kxce y =,其中c 、k 为常量,如果某游客从大气压为1.01×105 Pa 的海平面地区,到了海拔为2 400 m,大气压为0.90×105 Pa 的一个高原地区,则k 与c 的取值分别是( )A.⎩⎨⎧⨯-=⨯=-5510805.41001.1k cB.⎩⎨⎧⨯-=⨯=-54105.31024.2k cC.⎩⎨⎧⨯=⨯=-54103.2106.3k cD.⎩⎨⎧⨯-=⨯=-54103.2107.2k c10.为了探究色盲是否与性别有关,在调查的500名男性中有39名色盲患者,在500名女性中有6名患有色盲,那么你认为色盲与性别有关的把握为( ) A.0 B.95% C.99% D.都不正确 二、填空题(每小题4分,共16分)11.对于一组数据的两个函数模型,其残差平方和分别为180.2和290.7,若从中选取一个拟合程度较好的函数模型,应选_______.12.(2009广东中山一模)许多因素都会影响贫穷,教育也许是其中之一.在研究这两个因素的关系时,收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的回归直线方程为6.48.0ˆ+=x y.斜率的估计值为0.8说明________________________________________________.13.若一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )之间满足y i =a +bx i +e i (i =1,2,…,n),若e i 恒为0,则R 2为______.14.下列说法:①回归方程适用于一切样本和总体;②回归方程一般都有时间性;③样本取值的范围会影响回归方程的适用范围;④回归方程得到的预报值是预报变量的精确值,其中正确的是_______.三、解答题(共44分)15.(10分)某地区的人口普查表明,该地区共有男性15 729 245人,其中3 497个是聋哑人,共有女性16 799 031人,其中3 072个是聋哑人,判断该地区性别与是否为聋哑人之间是否有关系.16.(10分)假设关于某设备的使用年限x 和所支出的维修费用y(万元),有如下的统计资料:(1)y 与x 间是否有线性相关关系?若有,求出线性回归方程; (2)估计使用年限为10年时,维修费用是多少? 17.(12分)下表所示是一组试验数据:y 64 138 205 285 360(1)作出散点图,并猜测y 与x 之间的关系; (2)利用所得的模型预报x =10时y 的值.18.(12分)弹簧长度y(cm)随所挂物体质量x(g)不同而变化的情况如下: 物体质量x 5 10 15 20 25 30 弹簧长度y7.258.128.959.9010.9611.80(1)画出散点图;(2)求y 对x 的回归直线方程;(3)预测所挂物体质量为27 g 时的弹簧长度(精确到0.01 cm).参考答案1解析:题图A 中的点不成线性排列,故两个变量不适合线性回归模型.故选A. 答案:A2 解析:回归直线一定过点),(y x ,通过表格中的数据计算出x 和y ,易知选D. 答案:D3 解析:画出散点图如下:由散点图知线性相关性很强. 答案:A4解析:将x =10代入得y =145.83,但这种预测不一定准确,应该在这个值的左右.故选C. 答案:C5解析:由回归方程系数公式可得. 答案:D6解析:由等高条形图的特点及性质进行判断. 答案:C7解析:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,显然,身高和体重具有相关关系. 答案:B8 解析:独立性检验的实质就是利用随机变量K 2来判断“两个分类变量有关系”. 答案:C9解析:将⎩⎨⎧⨯==51001.1,0y x 和⎩⎨⎧⨯==51090.0,4002y x 分别代入kxe c y •=,⎩⎨⎧⨯-=⨯=-,10805.4,1001.155k c 故选A. 答案:A10解析:根据题意可知相关数据的列联表如下:利用公式,可计算得随机变量k 的值约为25.34>6.635,所以色盲与性别有关的把握为99%,故选C. 答案:C11解析:残差平方和越小,函数模型对数据拟合效果越好,反之残差平方和越大,说明函数模型对数据拟合程度效果越差. 答案:第一种12答案:美国一个地区的成年人受过9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右13解析:若e i 恒为0,则残差平方和0)ˆ(1212==-∑∑==ni i ni i ie yy, 而101)()ˆ(112122=-=---=∑∑==n i ini i iy yyyR . 答案:114解析:①回归方程只适用于我们所研究的样本总体,故①错误.④回归方程得到的预报值可能是取值的平均值,故④错误. 答案:②③ 15解:作列联表:聋哑人 不是聋哑人 总计 男 3 497 15 725 748 15 729 245 女 3 072 16 795 959 16 799 031 总计6 56932 521 70732 528 276828.1063.627075213256960317991624572915)748725150723959795164973(276528322≥≈⨯⨯⨯⨯-⨯⨯=k ,所以有99%的把握认为性别与是否为聋哑人有关. 16 解:(1)作散点图,如图:由散点图可知,y 与x 呈线性相关关系, ,5,4==y x ∑==51290i ix,∑==513.112i i i y x ,所以23.1103.1245905453.112ˆ2==⨯-⨯⨯-=b, 08.0423.15ˆˆ=⨯-=-=x b y a. 所以线性回归方程为yˆ=1.23x +0.08. (2)当x =10年时,yˆ=1.23×10+0.08=12.3+0.08=12.38(万元), 即估计使用10年时,维护费用是12.38万元.17 解:(1)散点图如图所示,从散点图可以看出y 与x 不具有线性相关关系.根据已有知识发现样本点分布在函数a xby +=的图象的周围,其中a,b 为待定参数.设y y xx ='=',1,由已知数据制成下表:序号i x i ′ y i ′ x i ′2 y i ′2 x i ′y i ′ 1 2 64 4 4 096 128 2 4 138 16 19 044 552 3 6 205 36 42 025 1 230 4 8 285 64 81 225 2 280 5 10 360 100 129 600 3 600 ∑301 052220275 9907 7904.210,6='='y x , 故∑=='-'5122405i i x x ,∑=='-'51222.649545i iy y ,计算知b =36.95,a =210.4-36.95×6=-11.3, 所以y′=-11.3+36.95x′. 所求y 对x 的回归曲线方程为3.1195.36-=xy . (2)当x =10时,605.73.111095.36-=-=y . 18 解:(1)散点图如图:(2)采用列表的方法计算aˆ与回归系数b ˆ.50.998.566,5.171056≈⨯==⨯=y x , 183.05.176275250.95.1767.0771ˆ2≈⨯-⨯⨯-=b , 30.65.17183.050.9ˆ≈⨯-=a, y 对x 的回归直线方程为yˆ=6.30+0.183x. (3)当质量为27 g 时,有yˆ=6.30+0.183×27≈11.24 cm. 所以当挂物体的质量为27 kg 时,弹簧的长度大约为11.24 cm.。
(必考题)高中数学高中数学选修2-3第三章《统计案例》检测(含答案解析)

一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值3.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:2()P K k≥0.0500.0250.0100.0050.001k 3.841 5.024 6.6357.87910.828由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是() A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关5.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bcKa cb d a d b c-++++,其中n a b c d=+++.2()P K k≥0.100.050.010.005k 2.706 3.841 6.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”6.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%7.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -8.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0019.给出以下四个说法:①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;②在刻画回归模型的拟合效果时,R2的值越大,说明拟合的效果越好;③设随机变量ξ服从正态分布N(4,22),则P(ξ>4)=12;④对分类变量X与Y,若它们的随机变量K2的观测值k越小,则判断“X与Y有关系”的犯错误的概率越小.其中正确的说法是()A.①④B.②③C.①③D.②④10.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差 B.回归分析C.独立性检验 D.概率11.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bcka b c d a c b d-=++++并参照附表,得到的正确结论是A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”12.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K=,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是()2()P K k≥…0.250.150.100.0250.0100.005…k… 1.323 2.072 2.706 5.024 6.6357.879…A.90%B.95%C.97.5%D.99.5%二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R的值判断模型的拟合效果,2R越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A:“甲、乙中至少一人击中目标”与事件B:“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”.参考附表:(参考公式:K2=()()()()()2n ad bca b c d a c b d-++++,其中n=a+b+c+d)15.某市电信宽带私人用户月收费标准如下表:假定每月初可以和电信部门约定上网方案.若某用户每月上网时间为66小时,应选择__________方案最合算.16.下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y与月份x 之间有较好的线性相关关系,其线性回归方程是=﹣0.7x+,则= . 月 份x 1 2 3 4 用水量y4.5432.517.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”.18.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到≈4.844,则认为选修文理科与性别有关系出错的可能性约为________. 19.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异? 人数 男生 女生身高h ≥ 身高h <参照公式:()()()()()22n ad bc k a b c d a c b d -=++++()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.828175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.22.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,23.某科研小组为了验证一种治疗新冠肺炎的新药的效果,选60名患者服药一段时间后,记录了这些患者的生理指标x 和y 的数据,并统计得到如下的22⨯列联表(不完整):在生理指标 1.8x >的人中,设A 组为生理指标65y ≤的人,B 组为生理指标65y >的人,将他们服用这种药物后的康复时间(单位:天)记录如下: A 组:10,11,12,13,14,15,16,17,19. B 组:12,13,14,15,16,17,20,21,25.(1)填写上表,并判断是否有95%95%的把握认为患者的两项生理指标x 和y 有关系; (2)从A ,B 两组人中随机各选1人,A 组选出的人记为甲,B 组选出的人记为乙,求乙的康复时间比甲的康复时间长的概率.附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)20k0.2524.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.25.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.26.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下:(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e=.故选:B.【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.3.D解析:D【解析】【分析】根据公式()()()()()22n ad bcKa b c d a c b d-=++++,分别利用4个选项中所给数据求出2K的值,比较所求值的大小即可得结果.【详解】选项A:22160(535155)3204010502K⨯⨯-⨯==⨯⨯⨯,选项B:22260(5251515)152040204016K⨯⨯-⨯==⨯⨯⨯,选项C:22360(5201520)24204025357K⨯⨯-⨯==⨯⨯⨯,选项D:22 460(5101530)96 204035257K⨯⨯-⨯==⨯⨯⨯,可得222431K K K>>22K>,所以由选项D中的数据得到的2K值最大,说明X与Y有关系的可能性最大,故选D.【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2K越大两个变量有关的可能性越大这一性质.4.D解析:D【解析】【分析】由题意结合独立性检验的结论和临界值表给出结论即可.【详解】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.本题选择D选项.【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.B解析:B【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人,又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530)4.762 3.8412109075225K⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.6.A解析:A【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.8.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)9.B解析:B 【解析】①中各小长方形的面积等于相应各组的频率;②正确,相关指数R 2越大,拟合效果越好,R 2越小,拟合效果越差;③随机变量ξ服从正态分布N (4,22),正态曲线对称轴为x =4,所以P (ξ>4)=;④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则说明“X 与Y 有关系”的犯错误的概率越大.故选B.10.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.11.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”12.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
数学人教A版选修2-3本章解说:第三章统计案例 含解析

第三章统计案例
本章解说
知识概要
在现实生活中,我们经常会遇到类似下面的问题:肺癌是严重威胁人类生命的一种疾病,吸烟与患肺癌有关系吗?
肥胖是影响人类健康的一个重要因素,身高与体重之间是否存在线性相关关系?等等. 为了回答这些问题,必须明确问题涉及的对象(总体)是什么,用怎样的量来描述要解决的问题,并确定获取变量值(数据)的方法.然后用恰当的方法分析数据,以得到最可靠的结论.
在必修模块中,我们学习过关于抽样,用样本估计总体,线性回归等基础知识.本章中,我们将在此基础上,通过对典型案例的讨论,进一步讨论线性回归分析方法及其应用,并初步了解独立性检验的基本思想,认识统计方法在决策中的作用.
1.本章的主要内容有随机误差、残差、残差分析、列联表及独立性检验等概念.
2.用残差分析、判断线性回归模型的拟合效果.
3.建立回归模型的基本步骤.
4.通过对典型案例的研究,了解回归的基本思想、方法及初步应用.
5.通过对典型案例的研究,了解独立性检验的基本思想、方法及初步应用.
6.根据题目所给的列联表判断结论的可能性.
学法指导
1.在实际问题中,经常会面临需要推断的问题.比如研制出一种新药,需要推断此药是否有效?有人怀疑吸烟的人更易患肺癌,那么吸烟是否与患肺癌有关呢?等等.在对类似的问题作出推断时,我们不能仅凭主观意愿作出结论,需要通过试验来收集数据,并依据独立性检验的原理作出合理的推断.
2.统计方法是可能犯错误的:不管是回归分析还是独立性检验,得出的结论都可能犯错误,好的统计方法就是要尽量降低犯错误的概率,比如在推断吸烟与患肺癌是否有关时,通过收集数据、整理分析数据得到“吸烟与患肺癌有关”的结论,而且这个结论出错的概率在0.01以下.实际上,这是统计思维与确定性思维差异的反应.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章检测(A)(时间:90分钟满分:120分)附:K2-一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)1在建立两个变量y与x的回归模型时,分别选择了4个不同的模型,它们的R2如下,其中拟合得最好的模型为 ()A.模型1的R2为0.75B.模型2的R2为0.90C.模型3的R2为0.25D.模型4的R2为0.552的值越大,意味着残差平方和越小,也就是说拟合效果越好.2随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.由K2-得K2的观测值k-9.616.则正确的结论是()A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C.在犯错误的概率不超过0.005的前提下,认为“生育意愿与城市级别有关”D.在犯错误的概率不超过0.005的前提下,认为“生育意愿与城市级别无关”3工人月工资y(单位:元)与劳动生产率x(单位:千元)变化的线性回归方程为下列说法中正确的是A.劳动生产率每提高1 000元,月工资提高150元左右B.劳动生产率每提高1 000元,月工资提高90元左右C.劳动生产率为1 000元时,月工资提高90元D.以上说法都不正确,而是预报变量可能取值的平均值,因此当劳动生产率每提高1 000元,月工资提高90元左右.故选B.4根据如下样本数据:x345678得到的回归方程为则ACy值总体上是随x值的增大而减少的,故又回归直线过第一象限故纵截距故选5已知变量x与y正相关,且由观测数据算得样本平均数则由该观测数据算得的线性回归方程可能是ACx与y正相关,可知x的系数为正,排除C,D.而所有的回归直线必经过点由此排除B,故选A.6为考察A,B两种药物预防某疾病的效果,进行动物试验,分别得到如下等高条形图:药物A试验结果药物B试验结果根据图中信息,在下列各项中,说法最佳的一项是()A.药物A,B对该疾病均没有预防效果B.药物A,B对该疾病均有显著的预防效果C.药物A的预防效果优于药物B的预防效果D.药物B的预防效果优于药物A的预防效果,药物A试验显示不服药与服药时患病的差异较药物B试验显示明显大,所以药物A的预防效果优于药物B的预防效果.故选C.7下列说法:①若r>0,则x增大时,y也相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.正确的有() A.①② B.②③C.①③D.①②③①③正确.8为了考察某种病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表,可得出()A.在犯错误的概率不超过0.05的前提下,认为“小动物是否被感染与有没有服用疫苗有关”B.在犯错误的概率不超过0.05的前提下,认为“小动物是否被感染与有没有服用疫苗无关”C.在犯错误的概率不超过0.005的前提下,认为“小动物是否被感染与有没有服用疫苗有关”D.在犯错误的概率不超过0.005的前提下,认为“小动物是否被感染与有没有服用疫苗无关”2的观测值k-4.762>3.841,所以在犯错误的概率不超过0.05的前提下,认为“小动物是否被感染与有没有服用疫苗有关”.故选A.9已知x与y之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为根据表中的两组数据和求得的直线方程为则以下结论正确的是AC,n=6故-故可得-把代入可得比较可得故选而由直线方程的求解可得b'--10在利用最小二乘法求回归方程时用到了下表中的组数据则表格中的值为A.68B.70C.75D.72得因为回归直线过样本点的中心点所以解得故选二、填空题(本大题共5小题,每小题5分,共25分.把答案填在题中的横线上)11为了判断高三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如图所示2×2列联表:已知P(K≥3.841)≈0.05,P(K≥5.024)≈0.025.根据表中数据,得到K的观测值k-4.844,则在犯错误的概率不超过的前提下认为选修文科与性别有关.-4.844,因为5.024>4.844>3.841,所以在犯错误的概率不超过由题意知,K20.05的前提下,认为选修文科与性别有关..0512假设关于某设备的使用年限x(单位:年)和所支出的维修费用y(单位:万元)有如下的统计资料:若由资料可知y对x呈线性相关关系,且线性回归方程为其中已知请估计使用年限为年时维修费用约为,∵回归直线一定经过样本点的中心∴5∴线性回归方程为故估计使用年限为20年时,维修费用约为y=1.23×20+0.08=24.68(万元)..68万元13某社会实践调查小组,在对高中学生“能否良好使用手机”的调查中,随机发放了120份问卷.对收回的100份有效问卷进行统计,得到如下2×2列联表:如果认为“能否良好使用手机与性别有关”犯错误的概率不超过p,那么根据临界值表,最精确的p的值应为.,k≈3.03,因为2.706<3.03<3.841,所以能够在犯错误的概率不超过0.10的前提下认为“能否良好使用手机与性别有关”,即最精确的p的值为0.1..114为了了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:则在犯错误的概率不超过的前提下认为喜爱打篮球与性别有关.(请用百分数表示)K2的观测值k-8.33>7.879,则在犯错误的概率不超过0.005的前提下认为“喜爱打篮球与性别有关”..5%15对有关数据的分析可知,每立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的抗压度y(单位:kg/cm2)之间具有线性相关关系,其线性回归方程为根据建设项目的需要天后混凝土的抗压度不得低于则每立方米混凝土的水泥用量最少应为精确到,得0.30x+9.99≥89.7,解得x≥265.7..7 kg三、解答题(本大题共5小题,共45分.解答时应写出文字说明、证明过程或演算步骤)16(8分)某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:能否在犯错误的概率不超过0.001的前提下认为学生的学习积极性与对待班级工作的态度有关系?并说明理由.运用古典概型概率公式求值.(2)求出随机变量,说明关系.积极参加班级工作的学生有24人,不太主动参加班级工作且学习积极性一般的学生有19人,总人数为50人,∴抽到积极参加班级工作的学生的概率为抽到不太主动参加班级工作且学习积极性一般的学生的概率为(2)k-11.5.∵k>10.828,∴在犯错误的概率不超过0.001的前提下认为学生的学习积极性与对待班级工作的态度有关系.17(8分)某个服装店经营某种服装,在某周内获纯利y(单位:元)与该周每天销售这种服装数x(单位:件)之间的一组数据关系见下表:已知(1)求(2)判断纯利y(单位:元)与每天销售件数x之间是否线性相关,如果线性相关,求出回归方程.(2)画出散点图如图,可知y与x有线性相关关系,设回归直线方程为-51.36.-故回归方程为18(9分)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:(1)估计该地区老年人中需要志愿者提供帮助的老年人的比例;(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中需要志愿者提供帮助的老年人的比例?说明理由.调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要志愿者提供帮助的老年人的比例的估计值为(2)k-9.967.因为9.967>6.635,所以在犯错误的概率不超过0.01的前提下,认为该地区的老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法,比采用简单随机抽样方法更好.19(10分)在关于人的脂肪含量(单位:百分比)和年龄x(单位:岁)的关系的研究中,研究人员获得了一组数据如下表:(1)作出散点图,并判断y与x是否线性相关,若线性相关,求线性回归方程;(2)求R2,并说明其含义;(3)给出37岁时人的脂肪含量的预测值.,进而求出回归模型,并依据公式求出R2,进而说明拟合效果.散点图如图.由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系.设线性回归方程为则由计算器算得0.576所以线性回归方程为(237.78.644.99.R2=10.941.R2≈0.941,表明年龄解释了94.1%的脂肪含量变化.(3)当x=37时20.9,故37岁时人的脂肪含量约为20.9%.20(10分)一只红铃虫的产卵数y和温度x有关,现收集了 7 组观测数据列于表中,现有模型①y=c x+c与模型②y两种模型作为产卵数和温度的回归方程来建立两个变量之间的关系已知--21.38--0.323.57.(1)根据表中数据,分别建立两个模型下y关于x的回归方程;(2)假设根据模型①,②计算得出数据--的值分别为与试计算模型的相关指数并根据相关指数选择出拟合效果较好的模型(3)能否用第(2)问选择的模型来预测在100 ℃时一只红铃虫的产卵数,只给出判断,不用说明理由.对于模型①:C1--21.38,由y=C1x+C2,可得C280-21.38×26=-475.88.∴模型①的回归方程为对于模型②:C3--0.32,由y可得3.57-0.32×26=-4.75.∴模型②的回归方程为(2)在模型①中--在模型中--因为所以模型②拟合效果较好.(3)不能.(因为样本的取值范围会影响回归方程的使用范围)。