2021【暑假作业】新高三数学 考点18 统计与统计案例(教师版)

合集下载

高考数学复习统计与统计案例概率节变量间的相关关系与统计案例文新人教A版PPT课件

高考数学复习统计与统计案例概率节变量间的相关关系与统计案例文新人教A版PPT课件

解析 易求-x=9,-y=4,样本点中心(9,4)代入验证,满足y^=0.7x-2.3.
答案 C
3.两个变量y与x的回归模型中,分别选择了4个不同模型,它 们的相关指数R2如下,其中拟合效果最好的模型是( ) A.模型1的相关指数R2为0.98 B.模型2的相关指数R2为0.80 C.模型3的相关指数R2为0.50 D.模型4的相关指数R2为0.25 解析 在两个变量y与x的回归模型中,它们的相关指数R2越
最新考纲 1.会作两个有关联变量的数据的散点图,会利用 散点图认识变量间的相关关系;2.了解最小二乘法的思想, 能根据给出的线性回归方程系数公式建立线性回归方程(线性 回归方程系数公式不要求记忆);3.了解独立性检验(只要求 2×2列联表)的基本思想、方法及其简单应用;4.了解回归分 析的基本思想、方法及其简单应用.

的区
域,两个变量的这种相关关系称为一负条相直关线.
(3)如果散点图中点的分布从整体上看大致在
2.线性回归方程
(1)最小二乘法:使得样本数据的点到回归直线的 距离的平方最和小的方法叫做最
小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,
yn),其回归方程为
知识
1.相关关系与回归分析 梳 理 回归分析是对具有相关关系的两个变量进行统计分析的一种
常用方法;判断相散关点性图的常用统计图是:
;统左计下量角有相关右系上数角与相关指数.
(1)在散点图中,点散布在从

的区
域,对于两个变量的这左种上相角关关系右,下我角们将它称为正相关.
(2)在散点图中,点散布在从
≈4.844.


2021版高中数学第三章统计案例课时训练18回归分析新人教B版选修23

2021版高中数学第三章统计案例课时训练18回归分析新人教B版选修23

2021版高中数学第三章统计案例课时训练18回归分析新人教B 版选修23(限时:10分钟)1.下列是x 和Y 之间的一组数据,x 0 1 2 3 Y 1 3 5 7则Y 关于x 的回来直线方程必过点( ) A .(2,2) B .(1.5,0) C .(1,2) D .(1.5,4)解析:由题意可知,x =0+1+2+34=1.5,y =1+3+5+74=4.又因为回来直线方程必过样本点的中心(x ,y ),故Y 关于x 的回来直线方程必过点(1.5,4).答案:D2.从某高中随机选取5名高三男生,其身高和体重的数据如下表所示:身高x (cm) 160 165 170 175 180 体重Y (kg) 63 66 70 72 74依照上表可得回来直线方程y ^=0.56x +a ^,据此模型推测身高为172 cm 的高三男生的体重为( )A .70.09 kgB .70.12 kgC .70.55 kgD .71.05 kg解析:x =160+165+170+175+1805=170,y =63+66+70+72+745=69.因为回来直线过点(x ,y ),因此将点(170,69)代入y ^=0.56x +a ^中得a ^=-26.2,因此回来直线方程为y ^=0.56x -26.2, 代入x =172 cm ,则其体重约为70.12 kg. 答案:B3.在研究两个变量的相关关系时,观看散点图发觉样本点集中于某一条指数曲线y =e bx +a的周围,令z ^=ln y ,求得回来直线方程为z ^=0.25x -2.58,则该模型的回来方程为________.解析:因为z ^=0.25x -2.58,z ^=ln y .因此y =e 0.25x -2.58.答案:y =e 0.25x -2.584.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x (元) 8 8.2 8.4 8.6 8.8 9 销量Y (件) 90 84 83 80 75 68(1)求回来直线方程y ^=b ^x +a ^,其中b ^=-20,a ^=y -b ^x .(2)估量在今后的销售中,销量与单价仍旧服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解析:(1)x =16×(8+8.2+8.4+8.6+8.8+9)=8.5.y =16×(90+84+83+80+75+68)=80.a ^=y +20x =80+20×8.5=250,y ^=-20x +250.(2)工厂获得利润z =(x -4)y =-20x 2+330x -1 000,由二次函数知识可知当x =334时,z max =361.25(元).故该产品的单价应定为8.25元.(限时:30分钟)1.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel 软件运算得y ^=0.577x -0.448(x 为人的年龄,y 为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( )A .年龄为37岁的人体内脂肪含量都为20.90%B .年龄为37岁的人体内脂肪含量为21.01%C .年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%D .年龄为37岁的大部分的人体内脂肪含量为31.5%解析:x =37时,y =0.577×37-0.448=20.90,因为回来方程得到的y ^值只是近似的,故选C.答案:C2.在两个变量Y 与x 的回来模型中,分析选择了四个不同的模型,它们的相关系数r 如下,其中拟合成效最好的为( )A .模型①的相关系数为0.876 5B .模型②的相关系数为0.735 1C .模型③的相关系数为0.001 2D .模型④的相关系数为0.215 1解析:由于相关系数越接近于1,拟合成效越好,因此选A. 答案:A3.为了解亲小孩身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身高x (cm) 174 176 176 176 178 亲小孩身高Y (cm) 175 175 176 177 177则Y 对x 的线性回来方程为( ) A.y ^=x -1 B.y ^=x +1C.y ^=88+12x D.y ^=176解析:设Y 对x 的线性回来方程为y ^=b ^x +a ^,因为b ^=-2×-1+0×-1+0×0+0×1+2×1-22+22=12,a ^=y ^-b ^ x =176-12×176=88,因此Y 对x 的回来直线方程为y ^=12x +88.答案:C则从表中数据分析,________回来方程更好(即与实际数据更贴近).解析:能够依照表中数据分析,两个回来方程对数据推测的正确率进行判定,甲回来方程的数据准确率为3240=45,而乙回来方程的数据准确率为4060=23.明显甲的准确率高些,因此甲回来方程好些.答案:甲9.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:推销员编号 1 2 3 4 5 工作年限x /年 3 5 6 7 9 推销金额Y /万元 2 3 3 4 5(1)求年推销金额Y 关于工作年限x 的回来直线方程;(2)若第6名推销员的工作年限为11年,试估量他的年推销金额.参考数据: 1.04=1.02;由检验水平0.01及n -2=3,查表得r 0.01=0.959.参考公式:线性回来方程系数公式:y ^=b ^x +a ^,其中b ^=∑i =1nx i -xy i -y∑i =1nx i -x2,a ^=y -b ^x .解析:(1)设所求的回来直线方程为y ^=b ^x +a ^,则b ^=∑i =1nx i -xy i -y∑i =1nx i -x2=1020=0.5,a ^=y -b ^x =0.4. 因此年推销金额Y 关于工作年限x 的回来直线方程为y ^=0.5x +0.4.(2)当x =11时,y ^=0.5x +0.4=0.5×11+0.4=5.9万元. 因此能够估量第6名推销员的年推销金额为5.9万元. 10.假设关于某种设备的使用年限x (年)与所支出的修理费用y (万元)有如下统计资料:x 2 3 4 5 6 y 2.2 3.8 5.5 6.5 7.0已知∑i =15x 2i =90,∑i =15y 2i ≈140.8,∑i =15x i y i =112.3,79≈8.9,2≈1.4,n -2=3时,r 0.05=0.878.(1)求x ,y ;(2)对x ,y 进行线性相关性检验;(3)假如x 与y 具有线性相关关系,求出回来直线方程; (4)假设使用年限为10年时,修理费用约是多少万元?解析:(1)x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+7.05=5.(2)步骤如下:①作统计假设:x 与y 不具有线性相关关系;。

高考数学(命题热点提分)专题18 统计与统计案例 理(2021年最新整理)

高考数学(命题热点提分)专题18 统计与统计案例 理(2021年最新整理)

2017年高考数学(深化复习+命题热点提分)专题18 统计与统计案例理编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2017年高考数学(深化复习+命题热点提分)专题18 统计与统计案例理)的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2017年高考数学(深化复习+命题热点提分)专题18 统计与统计案例理的全部内容。

专题18 统计与统计案例1.某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人.现采取分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为()A.15,5,25 B.15,15,15C.10,5,30 D.15,10,20解析:先确定抽样比为错误!=错误!,则依次抽取的人数分别为错误!×300=15,错误!×200=10和错误!×400=20。

故选D。

答案:D2.某同学进入高三后,4次月考的数学成绩的茎叶图如图.则该同学数学成绩的方差是()A.125 B.55C.45 D.3错误!解析:由茎叶图知平均值为114+126+128+1324=125,∴s2=错误![(125-114)2+(125-126)2+(125-128)2+(125-132)2]=45.答案:C3.为了判定两个分类变量X和Y是否有关系,应用K2独立性检验法算得K2的观测值为5,又已知P(K2≥3。

841)=0.05,P(K2≥6。

635)=0.01,则下列说法正确的是()A.有95%的把握认为“X和Y有关系”B.有95%的把握认为“X和Y没有关系”C.有99%的把握认为“X和Y有关系”D.有99%的把握认为“X和Y没有关系”解析:依题意,K2=5,且P(K2≥3。

高中数学第九章统计之统计分析案例(精讲)(必修第二册)(教师版含解析)

高中数学第九章统计之统计分析案例(精讲)(必修第二册)(教师版含解析)

9.3 统计分析案例(精讲)考法一数据分析【例1】(多选)(2021·福建泉州市·高三其他模拟)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述正确的有( )A.各月的平均最低气温都在0℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20℃的月份有5个【答案】ABC【解析】对于选项A,由图易知各月的平均最低气温都在0℃以上,A正确;对于选项B,七月的平均最高气温点与平均最低气温点间的距离大于一月的平均最高气温点与平均最低气温点间的距离,所以七月的平均温差比一月的平均温差大,B正确;对于选项C,三月和十一月的平均最高气温均为10℃,所以C正确;对于选项D,平均最高气温高于20℃的月份有七月、八月,共2个月份,故D错误.故选:ABC.【举一反三】1.(多选)(2020·全国专题练习)某装修公司为了解客户对照明系统的需求,对照明系统的两种设计方明系统评分面达图案在稳固性、创新性、外观造型、做工用料以及成本五个方面的满意度评分进行统计,根据常见考法统计结果绘制出如图所示的雷达图,则下列说法错误的是( )A.客户对两种设计方案在外观造型上没有分歧B.客户对设计一的满意度的总得分高于设计二的满意度的总得分C.客户对设计二在创新性方面的满意度高于设计一在创新性方面的满意度D.客户对两种设计方案在稳固性和做工用料方面的满意度相同【答案】ACD【解析】根据雷达图可列表如下:评分类别稳固性创新性外观造型做工用料成本设计一得分8分8分8分10分10分设计二得分8分8分10分8分9分根据表格分析可得A、C、D错误,选项B正确.故选:ACD.2.(多选)(2020·全国专题练习)如图是某公司2018年1月至12月空调销售任务及完成情况的统计图,如10月份销售任务是400台,完成率为90%,下列叙述正确的是( )A .2018年3月的销售任务是400台 B .2018年月销售任务的平均值不超过600台 C .2018年总销售量为4870台 D .2018年月销售量最大的是6月份 【答案】ABC【解析】由题图可知选项A 正确; 2018年月销售任务的平均值为10020033003400500700800100045060012++⨯+⨯++++=<,故选项B 正确;2018年总销售量为1000.82001300(0.5 1.50.6)400(1.20.90.9)500 1.17000.8⨯+⨯+⨯+++⨯+++⨯+⨯800110000.74870+⨯+⨯=,故选项C 正确;2018年月销售量最大的是5月份,为800台,故选项D 不正确. 故选:ABC3.(多选)(2020·湖南永州市)某地区城乡居民储蓄存款年底余额(单位:亿元)变化情况如图所示,下列判断一定正确的是()A .该地区城乡居民储蓄存款年底余额总数逐年上升B.到2019年农村居民存款年底总余额已超过了城镇居民存款年底总余额C.城镇居民存款年底余额逐年下降D.2017年城乡居民存款年底余额增长率大约为225%【答案】AD【解析】由条形图可知,余额总数逐年上升,故A项正确;由城乡储蓄构成百分比可知,2019年农村居民存款年底总余额占36.1%,城镇居民存款年底总余额占63.9%,没有超过,故B项错误;城镇居民存款年底余额所占的比重逐年下降,但城镇居民存款年底余额2014年,2017年,2019年分别为6.8198(亿元),155.085(亿元),973.197(亿元),总体不是逐年下降的,故C项错误,2017年城乡居民存款年底余额增长率大约为21165225%65-≈,故D项正确.故选:AD.考法二统计案例运用【例2】(2020·全国高一专题练习)某制造商3月生产了一批乒乓球,随机抽样100个进行检查,测得每个球的直径(单位:mm),将数据分组如下表分组频数频率)39953997,,,⎡⎣10)39973999⎡⎣,,,20)39994001⎡⎣,,,50[]40014003,,,20合计100(1)请在上表中补充完成频率分布表(结果保留两位小数),并在上图中画出频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值(例如区间[)39.9940.01,的中点值是40.00作为代表.据此估计这批乒乓球直径的平均值(结果保留两位小数). 【答案】(1)见解析;(2) 40.00(mm) 【解析】(1)频率分布表如下:分组频数频率频率组距[39.95,39.97)10 0.10 5 [39.97,39.99)20 0.20 10 [39.99,40.01)50 0.50 25 [40.01,40.03] 20 0.20 10 合计 1001注:频率分布表可不要最后一列,这里列出,只是为画频率分布直方图方便. 频率分布直方图如下:(2)整体数据的平均值约为39.96×0.10+39.98×0.20+40.00×0.50+40.02×0.20≈40.00(mm). 【举一反三】1.(2020·全国高一课时练习)深夜,一辆出租车被牵涉进一起交通事故,该市有两家出租车公司——红色出租车公司和蓝色出租车公司,其中蓝色出租车公司和红色出租车公司分别占整个城市出租车的85%和15%.据现场目击证人说,事故现场的出租车是红色的,并对证人的辨别能力进行了测试,测得他辨认的正确率为80%,于是警察就认定红色出租车具有较大的肇事嫌疑.请问警察的认定对红色出租车公平吗?试说明理由.【答案】不公平的.【解析】设城市的出租车有1000辆,那么依题意可得如下信息:从表中可以看出,当证人说出租车是红色的,它确定是红色的概率为1200.41290≈,而它是蓝色的概率为1700.59290≈,在实际数据面前,作为警察以证人的证词作为推断的依据,对红色出租车来说显然是不公平的.2.某地教育部门对某学校学生的阅读素养进行检测,在该校随机抽取了M名学生进行检测,实行百分制,现将所得的成绩按照[40,50),[50,60),[60,70),[70,80),[80,90),[90,100)分成6组,并根据所得数据作出了如下所示的频数与频率的统计表和频率分布直方图.分组 频数 频率 [40,50)[50,60) 25p[60,70)s0.30[70,80) mn[80,90)100.10[90,100]合计M1(1)求出表中,M p 及图中a 的值;(2)估计该校学生阅读素养的成绩中位数以及平均数. 【答案】(1)100,0.25,0.02M p a ===;(2)中位数是2003,平均数是68.5. 【解析】(1)由频率统计表可知:101000.1M ==,250.25100p ∴== 由频率分布直方图可知:(0.0050.0250.030.010.01)101a +++++⨯=,解得0.02a = (2)∵前两组的频率和为0.050.250.30.5+=<,前三组的频率和为0.050.250.30.60.5++=> ∴中位数在[60,70)内,设中位数为x ,则0.050.25(60)0.030.5x ++-⨯=,解得2003x =,即中位数为2003. 平均数为450.05550.25650.3750.2850.1950.168.5⨯+⨯+⨯+⨯+⨯+⨯= ∴估计该校学生阅读素养的成绩中位数是2003,平均数是68.5.。

2021版新高考数学一轮复习课件:第10章 统计、统计案例(共3个课时)

2021版新高考数学一轮复习课件:第10章 统计、统计案例(共3个课时)

可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合
适的抽样方法是____________.
分层抽样
• [解析] 因为不同年龄段客户对其服务的评价有较大差异,所以根据三 种抽样方法的特点可知最合适的抽样方法是分层抽样.
• 5.(2019·课标全国Ⅰ)某学校为了解1 000名新生的身体素质,将这些
• 知识点四 分层抽样
• 一般地,在抽样时将总体分成互不交叉的层,然后按一照定的比例 ______________,从各层独立地抽取一定数量的个体,将各层取出的 个体合在一起作为样本,这种抽样方法叫做分层抽样.
• 分层抽样的应用范围:当总体是由______________________组成时,
往往选用分层抽样的方法.
第十章 统计、统计案例
第一讲 随机抽样
1 知识梳理 • 双基自测 2 考点突破 • 互动探究 3 名师讲坛 • 素养提升
知识梳理 • 双基自测
• 知识点一 总体、个体、样本、样本容量的概念
• 统计中所考察对象的全体构成的集合看做总体,构成总体的每个元素 作样为本个 中体 个, 体从 的总___体__中_一_抽_部叫取分做的个样_体_本___容_量___._____所组成的集合叫做样本,
()
• A.33,34,33 B.25,56,19
B
• C.30,40,30 D.30,50,20
• [解析] 因为125 280 95=25 56 19,所以抽取人数分别为 25,56,19.
• 3取.一(P个59容T2)量某为班4共的有样5本2人,,已现知根3号据,学2生9号的,学4号2号,学用生系在统样抽本样中的,方那法么,样抽
本中还有一个学生的学号是
()

(新高三)暑期作业高考复习方法策略17讲_第17讲 统计与统计案例(含答案解析)

(新高三)暑期作业高考复习方法策略17讲_第17讲 统计与统计案例(含答案解析)

第17讲统计与统计案例统计与现实生活联系较为紧密,应用性非常强,理论要求低,难度不大,在复习中要深入课本,牢牢把握统计的基本思想和统计方法,掌握随机抽样、用样本估计总体、线性回归分析的方法.对于统计案例,知道回归分析、独立性检验的基本思想、方法及简单应用,会解决简单独立性检验问题.1.把握统计的基本思想.通过复习课本,从中提炼出统计的基本思想,即用样本估计总体,它主要研究两个主要问题,一是如何从总体中抽取样本,二是如何通过对所抽取的样本进行数据处理、分析,对总体的情况作出判断和分析.把握了统计的基本思想,就抓住了统计方法的主线.2.能根据样本的特点正确抽样.明确简单随机抽样、分层抽样与系统抽样的共同点,各自特点,适用范围,清楚它们之间的相互联系,用表格的形式把它们作一对比.3.掌握用样本估计总体的方法.利用图表分析数据是统计的基本要求,频率分布表、频数分布表、2×2列联表是统计数据的数字体现,频率分布直方图、茎叶图、散点图是统计数据的直观体现.会用样本的频率分布直方图、茎叶图估计总体分布,会用样本的数字特征估计总体的数字特征,会根据散点图判断两组变量的相关关系.4.了解回归分析、独立性检验的原理.对于回归分析、独立性检验,了解其基本思想、方法及简单应用即可,知道独立性检验的步骤,会按照公式计算,能和临界值表对照得出正确结论.例1某单位有840名职工,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()A.11 B.12 C.13 D.14解后反思利用简单随机抽样抽取出的样本号码没有规律性;分层抽样中,在每一层抽取的号码个数m等于该层所含个体数目与抽样比的积,并且应该恰有m个号码在该层的号码段内;利用系统抽样取出的样本号码有规律性,其号码按从小到大的顺序排列,则所抽取的号码是:l,l+k,l+2k,…,l+(n-1)k.其中,n为样本容量,l是第一组中的号码,k为分段间隔=总体容量/样本容量.例2某市2013年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表.(2)作出频率分布直方图.(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.解后反思1.用样本估计总体是统计的基本思想,当样本容量较大时,将样本数据恰当分组,通过频率分布表或频率分布直方图,用各组的频率分布描述总体的分布.2.在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.例3从某居民区随机抽取10个家庭,获得第i个家庭的月收入x i(单位:千元)与月储蓄y i(单位:千元)的数据资料,算得(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;(2)判断变量x与y(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.解后反思2.在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.例4某高校共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均体育运动时间超过4小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”..附:K2=(a+b)(c+d)(a+c)(b+d)解后反思独立性检验是一种假设检验(先假设,再推翻假设),其基本思想类似反证法:(1)提出假设:即假设两个分类变量没有关系;(2)在此假设下随机变量K2应该很小,如果由观测数据计算得到K2的观测值k很大,则在一定程度上说明假设不合理.然后根据随机变量K2的含义,评价该假设不合理的程度,继而得出在多大程度上认为两个分类变量有关系.总结感悟1.用样本估计总体是统计的基本思想,科学的统计方法是保证.一要合理抽样,使样本更具有代表性,二要对所抽取的样本进行数据处理、分析,对总体的情况作出判断.2.利用图表分析数据是统计的基本方法,能熟练作频率分布表、频数分布表、2×2列联表,它们是作图、计算的基础,频率分布直方图、茎叶图、散点图,是统计数据的直观体现,是识图和用图的基础.3.独立性检验是一种假设检验(先假设,再推翻假设),其基本思想类似反证法.A级1.为了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样2.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480C.450 D.1203.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为y^=0.85x-85.71,则下列结论中不正确...的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg4.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为()A.0.2 B.0.4 C.0.5 D.0.65.一个容量为20的样本,数据的分组及各组的频数如下:[10,20),2;[20,30),3;[30,40),x;[40,50),5;[50,60),4;[60,70),2;则x=________;根据样本的频率分布估计,数据落在[10,50)的概率约为________.6.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号,分为40组,分别为1~5,6~10,…,196~200,第5组抽取号码为22,第8组抽取号码为________.若采用分层抽样,40岁以下年龄段应抽取________人.7.下面茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,若乙的平均分是89,求被污损的数字.B级8.已知变量x与y正相关,且由观测数据算得样本平均数x=3,y=3.5,则由该观测数据算得的线性回归方程可能是()A.y=0.4x+2.3 B.y=2x-2.4C.y=-2x+9.5 D.y=-0.3x+4.49.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e,众数为m o,平均值为x,则()A.m e=m o=x B.m e=m o<xC.m e<m o<x D.m o<m e<x10.(2015·全国Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图.以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关11.某中学为了解学生数学课程的学习情况,在 3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测这3 000名学生在该次数学考试中成绩小于60分的学生数是________.12.下表是某数学老师及他的爷爷、父亲和儿子的身高数据:身高为________.13.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n.14.为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:kg),并将所得数据分组,画出频率分布直方图(如图所示).(1)在下面表格中填写相应的频率;(2)估计数据落在[1.15,1.30中的概率为多少;(3)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条.请根据这一情况来估计该水库中鱼的总条数.第17讲 统计与统计案例题型分析例1 B [由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12(人).] 例2 解 (1)频率分布表:(2)频率分布直方图如图所示.(3)答对下述两条中的一条即可:①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,共有17天,占当月天数的1730,超过50%;说明该市空气质量有待进一步改善.例3 解 (1)由题意知n =10,x =1n ∑i =1n x i =8010=8,y =1n ∑i =1n y i =2010=2,又l xx =错误!i y i -n x y =184-10×8×2=24,由此得b=l xyl xx=2480=0.3,a=y-b x=2-0.3×8=-0.4,故所求线性回归方程为y=0.3x-0.4.(2)由于变量y的值随x值的增加而增加(b=0.3>0),故x与y之间是正相关.(3)将x=7代入回归方程可以预测该家庭的月储蓄为y=0.3×7-0.4=1.7(千元).例4解(1)300×4 50015 000=90,所以应收集90位女生的样本数据.(2)由频率分布直方图得1-2×(0.025+0.100)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由(2)知,300位学生中有300×0.75=225(人)的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生,所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表结合列联可算得K 2=300×(45×60-165×30)275×225×210×90=10021≈4.762>3.841.所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”. 线下作业1.C [不同的学段在视力状况上有所差异,所以应该按照学段分层抽样.] 2.B [少于60分的学生人数600×(0.05+0.15)=120(人), ∴不少于60分的学生人数为480人.]3.D [根据线性回归方程中各系数的意义求解. 由于线性回归方程中x 的系数为0.85,因此y 与x 具有正的线性相关关系,故A 正确. 又线性回归方程必过样本点的中心(x ,y ),因此B 正确.由线性回归方程中系数的意义知,x 每增加1 cm ,其体重约增加0.85 kg ,故C 正确.当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,而不是具体值,因此D 不正确.]4.B [10个数据落在区间[22,30)内的数据有22,22,27,29,共4个,因此,所求的频率为410=0.4.故选B.] 5.4 0.7解析 x =20-(2+3+5+4+2)=4, P =2+3+4+520=0.7或P =1-4+220=0.7.6.37 20解析 将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x 人,则40200=x100,解得x =20.7.解 设污损的数字对应的成绩是x ,由茎叶图可得89×5=83+83+87+x +99,所以x =93,故污损的数字是3.8.A [因为变量x 和y 正相关,则回归直线的斜率为正,故可以排除选项C 和D.因为样本点的中心在回归直线上,把点(3,3.5)分别代入选项A 和B 中的直线方程进行检验,可以排除B ,故选A.]9.D [由题目所给的统计图示可知,30个得分中,按大小顺序排好后,中间的两个得分为5,6,故中位数m e =6+52=5.5, 又众数m o =5,平均值x =3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230=17930,∴m o <m e <x .]10.D [从2006年起,将每年的二氧化硫排放量与前一年作差比较,得到2008年二氧化硫排放量与2007年排放量的差最大,A 选项正确; 2007年二氧化硫排放量较2006年降低了很多,B 选项正确;虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体呈递减趋势,即C 选项正确;自2006年以来我国二氧化硫年排放量与年份负相关,D 选项错误,故选D.] 11.600解析 由频率分布直方图易得,成绩低于60分的频率为0.002×10+0.006×10+0.012×10=0.2,故3 000名学生中成绩低于60分的学生数为:3 000×0.2=600(人).12.185 cm13.解总体容量为6+12+18=36.当样本容量是n时,由题意知,系统抽样的间隔为36n,分层抽样的比例是n36,抽取的工程师人数为n36×6=n6,技术员人数为n36×12=n3,技工人数为n36×18=n2,所以n应是6的倍数,36的约数,即n=6,12,18.当样本容量为(n+1)时,总体容量是35人,系统抽样的间隔为35n+1,因为35n+1必须是整数,所以n只能取6.即样本容量n=6.14.解(1)根据频率分布直方图可知,频率=组距×(频率/组距),故可得下表:(2)0.30+0.15+0.02=0.47,所以数据落在[1.15,1.30)中的概率约为0.47.(3)120×1006=2 000,所以水库中鱼的总条数约为2 000.。

2021【暑假作业】新高三数学 考点18 统计与统计案例(学生版)

2021【暑假作业】新高三数学 考点18 统计与统计案例(学生版)
教育的人口百分比相差 10%,则其人均收入相差_________.
5
三、解答题 15. BIM 指数是用体重公斤数除以身高米数的平方得出的数字,是国际上常用的衡量人体胖瘦程度以及是 否健康的一个标准.对于高中男体育特长生而言,当 BIM 数值大于或等于 20.5 时,我们说体重较重,当 BIM
数值小于 20.5 时,我们说体重较轻,身高大于或等于170cm 我们说身高较高,身高小于 170cm 我们说身高 较矮.
yi)(i=1,2,…,n),用最小二乘法建立的回归方程为 y =0.85x-85.71,则下列结论中不正确的是( )
A.y 与 x 具有正的线性相关关系
B.回归直线过样本点的中心( x , y )
C.若该大学某女生身高增加 1cm,则其体重约增加 0.85kg D.若该大学某女生身高为 170cm,则可断定其体重必为 58.79kg 3.如图是调查某学校高三年级男女学生是否喜欢数学的等高条形图,阴影部分的高表示喜欢数学的频率.已 知该年级男生女生各 500 名(所有学生都参加了调查),现从所有喜欢数学的同学中按分层抽样的方式抽 取 32 人,则抽取的男生人数为( )
(1)根据茎叶图找出 40 岁以上网友中满意度得分的众数和中位数;
(2)根据茎叶图完成下面列联表,并根据以上数据,判断是否有 99% 的把握认为满意度与年龄有关;
满意
不满意
合计
40 岁以下
40 岁以上
合计
(3)先采用分层抽样的方法从 40 岁及以下的网友中选取 7 人,再从这 7 人中随机选出 2 人,将频率
1
A.16
B.32
C.24
D.8
4.某学校为落实学生掌握社会主义核心价值观的情况,用系统抽样的方法从全校 2400 名学生中抽取 30 人

(完整版)高中数学统计、统计案例知识点总结和典例

(完整版)高中数学统计、统计案例知识点总结和典例

统计一.简单随机抽样:抽签法和随机数法1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。

2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。

抽签法的一般步骤:a、将总体的个体编号。

b、连续抽签获取样本号码。

3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。

随机数表法的步骤:a、将总体的个体编号。

b、在随机数表中选择开始数字。

c、读数获取样本号码。

4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。

二.系统抽样:1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。

系统抽样的一般步骤:(1)采用随机抽样的方法将总体中的N个个编号。

(2)将整体按编号进行分段,确定分段间隔k=N/n。

(k∈N,L≤k).(3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。

(4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。

在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。

三.分层抽样:1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

专题18 统计与统计案例基础巩固一、选择题1.某学校近几年来通过“书香校园”主题系列活动,倡导学生整本阅读纸质课外书籍.下面的统计图是该校2013年至2018年纸质书人均阅读量的情况,根据统计图提供的信息,下列推断不合理的是( )A .从2013年到2016年,该校纸质书人均阅读量逐年增长B .2013年至2018年,该校纸质书人均阅读量的中位数是46.7本C .2013年至2018年,该校纸质书人均阅读量的极差是45.3本D .2013年至2018年,该校后三年纸质书人均阅读量总和是前三年纸质书人均阅读量总和的2倍 【答案】D【解析】对于A ,根据统计图分析可知,从2013年到2016年,该校纸质书人均阅读量分别是:15.5,38.5,43.3,58.4是逐年增长的,故A 是合理的;对于B ,2013年至2018年,该校纸质书人均阅读量按从小到大的顺序排列为:15.5,38.5,43.3,50.1,58.4,60.8,其中位数为43.350.146.72+=本,故B 是合理的;对于C ,因为最大阅读量为60.8本,最小阅读量为15.5本,所以极差为60.815.545.3-=本,故C 是合理的;对于D ,2013年至2018年,该校后三年纸质书人均阅读量总和为58.450.160.8169.3++=本,前三年纸质书人均阅读量总和为15.538.543.397.3++=本,169.397.32194.6≠⨯=, 故D 是不合理的. 故选D.2.设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg【答案】D【解析】根据y与x的线性回归方程为y=0.85x﹣85.71,则b=0.85>0,y与x具有正的线性相关关系,A正确;回归直线过样本点的中心(,x y),B正确;该大学某女生身高增加1cm,预测其体重约增加0.85kg,C正确;该大学某女生身高为170cm,预测其体重约为0.85×170﹣85.71=58.79kg,D错误.故选D.3.如图是调查某学校高三年级男女学生是否喜欢数学的等高条形图,阴影部分的高表示喜欢数学的频率.已知该年级男生女生各500名(所有学生都参加了调查),现从所有喜欢数学的同学中按分层抽样的方式抽取32人,则抽取的男生人数为()A.16B.32C.24D.8【答案】C【解析】由等高条形图可知:喜欢数学的女生和男生的比为1:3,所以抽取的男生数为24人.故选C.4.某学校为落实学生掌握社会主义核心价值观的情况,用系统抽样的方法从全校2400名学生中抽取30人进行调查.现将2400名学生随机地从1~2400编号,按编号顺序平均分成30组(1~80号,81~160号,…,2321~2400号),若第3组与第4组抽出的号码之和为432,则第6组抽到的号码是()A.416B.432C.448D.464【答案】A【解析】设第n 组抽到的号码是n a ,则{}n a 构成以80为公差的等差数列, 所以311802160a a a =+⨯=+,411803240a a a =+⨯=+, 所以3412805432a a a +=+⨯=,解得116a =, 所以616805416a =+⨯=. 故选A5.下列有关线性回归分析的四个命题:①线性回归直线必过样本数据的中心点(),x y ;②回归直线就是散点图中经过样本数据点最多的那条直线; ③当相关性系数0r >时,两个变量正相关;④如果两个变量的相关性越强,则相关性系数r 就越接近于1. 其中真命题的个数为( ) A .1个B .2个C .3个D .4个【答案】B【解析】①线性回归直线必过样本数据的中心点(,x y ),故①正确; ②回归直线在散点图中可能不经过任一样本数据点,故②错误; ③当相关性系数0r >时,则两个变量正相关,故③正确;④如果两个变量的相关性越强,则相关性系数r 就越接近于1或-1,故④错误. 故真命题的个数为2个, 故选B二、填空题6.回归方程ˆˆ 2.50.2x y=+在样本(4,1.2)处的残差为________. 【答案】9-【解析】由题当x =4时,4ˆ 2.50.210.2y=+=⨯, 1.2-10.2=-9所以回归方程ˆˆ 2.50.2x y=+在样本(4,1.2)处的残差为-9. 故填-97.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的22⨯列联表:则在犯错误的概率不超过________的前提下认为喜爱打篮球与性别有关.附:()()()()()22n ad bcKa b c d a c b d-=++++.【答案】0.005【解析】根据所给的列联表,得到()225020151058.3337.87930202525K⨯-⨯==⨯⨯⨯>∴至少有99.5%的把握说明喜爱打篮球与性别有关,即在犯错误的概率不超过0.005的前提下认为喜爱打篮球与性别有关.故填0.0058.某药厂选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17),将其按从左到右的顺序分别编号为第一组,第二组,……,第五组,如图是根据实验数据制成的频率分布直方图,已知第一组与第二组共有20人,则第三组中的人数为_________.【答案】18【解析】由直方图可得分布在区间第一组与第二组共有20人,分布在区间第一组与第二组的频率分别为0.24,0.16,设总的人数为n,则200.240.160.4,50.nn=+=∴=所以第3小组的人数为500.36=18⨯人.故填18三、解答题9.某校两个班级100名学生在一次考试中的成绩的频率分布直方图如图所示,其中成绩分组区如下表:(1)求频率表分布直方图中a的值;(2)根据频率表分布直方图,估计这100名学生这次考试成绩的平均分;(3)现用分层抽样的方法从第三、四、五组中随机抽取6名学生,将该样本看成一个总体,从中随机抽取2名,求其中恰有1人的分数不低于90分的概率.【解析】(1)由题意得10a+0.01×10+0.02×10+0.03×10+0.035×10=1,所以a=0.005.(2)由直方图分数在[50,60]的频率为0.05,[60,70]的频率为0.35,[70,80]的频率为0.30,[80,90]的频率为0.20,[90,100]的频率为0.10,所以这100名学生期中考试数学成绩的平均分的估计值为:55×0.05+65×0.35+75×0.30+85×0.20+95×0.10=74.5(3)由直方图,得:第3组人数为0.3×100=30,第4组人数为0.2×100=20人,第5组人数为0.1×100=10人.所以利用分层抽样在60名学生中抽取6名学生,每组分别为:第3组:306360⨯=人,第4组:206260⨯=人,第5组:106160⨯==1人.所以第3、4、5组分别抽取3人、2人、1人.设第3组的3位同学为A1,A2,A3,第4组的2位同学为B1,B2,第5组的1位同学为C1,则从六位同学中抽两位同学有15种可能如下:(A1,A2),(A1,A3),(A2,A3),(B1,B2),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(A1,C1),(A2,C1),(A3,C1),(B1,C1),(B2,C1),其中恰有1人的分数不低于90(分)的情形有:(A1,C1),(A2,C1),(A3,C1),(B1,C1),(B2,C1),共5种.所以其中第4组的2位同学至少有一位同学入选的概率为51 153=.10.随着资本市场的强势进入,互联网共享单车“忽如一夜春风来”,遍布了各级城市的大街小巷,为了解我市的市民对共享单车的满意度,某调查机构借助网络进行了问卷调查,并从参与调查的网友中随机抽取了50人进行分析.若得分低于60分,说明不满意,若得分不低于60分,说明满意,调查满意度得分情况结果用茎叶图表示如图1.(1)根据茎叶图找出40岁以上网友中满意度得分的众数和中位数;(2)根据茎叶图完成下面列联表,并根据以上数据,判断是否有99%的把握认为满意度与年龄有关;(3)先采用分层抽样的方法从40岁及以下的网友中选取7人,再从这7人中随机选出2人,将频率视为概率,求选出的2人中至少有1人是不满意的概率.参考格式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++【解析】(1)由题意可得,40岁以上网友中满意度得分的众数为75,中位数为57.52=.(2)由茎叶图可得22⨯列联表如下:可知2250(2012108) 3.463 6.63528223020k ⨯-⨯=≈<⨯⨯⨯所以没有99%的把握认为满意度与年龄有关.(3)从所选取的40岁以下的网友中,采用分层抽样的方法选取7人,其中满意度为满意的有5人,分别为1A ,2A ,3A ,4A ,5A ,不满意的有2人, 分别为1B ,2B , 所有组合的情况为()12,A A ,()13,A A ,()14,A A ,()15,A A ,()11,A B ,()12,A B ,()23,A A , ()24,A A ,()25,A A ,()21,A B ,()22,A B ,()34,A A , ()35,A A ,()31,A B ,()32,A B ,()45,A A ,()41,A B , ()32,A B ,()51,A B ,()52,A B ,()12,B B ,共有21种.其中选出的2人中至少有1人是不满意的有11种, 故所求的概率1121P =.知能提升一、选择题11.已知,x y 的取值如下表:若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( )A .1B .12C .13D .12-【答案】A【解析】设2t x =,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=, 所以点(6,4)在直线12y t a =+上,求出1a =,故选A.12.某运动制衣品牌为了成衣尺寸更精准,现选择15名志愿者,对其身高和臂展进行测量(单位:厘米),左图为选取的15名志愿者身高与臂展的折线图,右图为身高与臂展所对应的散点图,并求得其回归方程为 1.160.5ˆ37yx =-,以下结论中不正确的为( )A .15名志愿者身高的极差小于臂展的极差B .15名志愿者身高和臂展成正相关关系,C .可估计身高为190厘米的人臂展大约为189.65厘米D .身高相差10厘米的两人臂展都相差11.6厘米, 【答案】D【解析】A ,身高极差大约为25,臂展极差大于等于30,故正确;B ,很明显根据散点图像以及回归直线得到,身高矮臂展就会短一些,身高高一些,臂展就长一些,故正确;C ,身高为190厘米,代入回归方程可得到臂展估计值等于189.65厘米,但是不是准确值,故正确;D ,身高相差10厘米的两人臂展的估计值相差11.6厘米,但并不是准确值,回归方程上的点并不都是准确的样本点,故说法不正确. 故选D.二、填空题13.已知一组数据1x ,2x ,3x ,4x ,5x 的方差为2,则数据123x +,223x +,323x +,423x +,523x +的方差为______.【答案】8【解析】设x ,2s 为数据1x ,2x ,3x ,4x ,5x 的平均数,方差,X ,2S 为数据123x +,223x +,323x +,423x +,523x +的平均数,由题意可得方差为()()()222125125x x x x x x ⎡⎤-+-++-=⎣⎦,所以()()()22212510x x x x x x ⎡⎤-+-++-=⎣⎦,()125235235x x x X x ++++⨯==+,()()()222125212323232323235x x x x S x x ⎡⎤+--++--++--=+⎣⎦()()()22225151444x x x x x x ⎡⎤=-+-++-⎣⎦41085=⨯=故填814.如图所示是世界20个地区受教育程度的人口百分比与人均收入的散点图,样本点基本集中在一个条型区域,因此两个变量呈线性相关关系.利用散点图中的数据建立的回归方程为ˆ 3.19388.193yx =+,若受教育的人口百分比相差10%,则其人均收入相差_________.【答案】31.93美元【解析】设所受教育百分比分别为%,%a b ,且10a b -= 根据回归方程为 3.19388.193y x ∧=+, 收入相差大约为:()3.19388.193 3.19388.193 3.1931031.93a b ⨯+-⨯+=⨯=,即受教育的人口百分比相差10%,则其人均收入相差约31.93美元. 故填31.93美元.三、解答题15.BIM指数是用体重公斤数除以身高米数的平方得出的数字,是国际上常用的衡量人体胖瘦程度以及是否健康的一个标准.对于高中男体育特长生而言,当BIM数值大于或等于20.5时,我们说体重较重,当BIM数值小于20.5时,我们说体重较轻,身高大于或等于170cm我们说身高较高,身高小于170cm我们说身高较矮.(1)已知某高中共有32名男体育特长生,其身高与BMI指数的数据如散点图,请根据所得信息,完成下述列联表,并判断是否有95%的把握认为男生的身高对BMI指数有影响.(2)①从上述32名男体育特长生中随机选取8名,其身高和体重的数据如表所示:根据最小二乘法的思想与公式求得线性回归方程为0.8 75.9y x.利用已经求得的线性回归方=-程,请完善下列残差表,并求2R(解释变量(身高)对于预报变量(体重)变化的贡献值)(保留两位有效数字);②通过残差分析,对于残差的最大(绝对值)的那组数据,需要确认在样本点的采集中是否有人为的错误,已知通过重新采集发现,该组数据的体重应该为58(kg).小明重新根据最小二乘法的思想与公式,已算出0.675y x a ∧∧=+,请在小明所算的基础上求出男体育特长生的身高与体重的线性回归方程.参考数据:2222222(0.1)(0.3)(0.9)( 1.5)(0.5)( 2.3)(0.5)8.95+++-+-+-+-=,168=x ,()821226i i y y=-=∑,0.675168113.4⨯=,参考公式:()()221211nii i n ii yy R yy==-=--∑∑,()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---⋅==--∑∑∑∑,a y bx =-,i i i e y bx a =--,22(),()()()()()n ad bc K n a b c d a b c d a c b d -==+++++++. 【解析】(1)由于2232(65615)1603 3.8411220211177⨯-⨯==<<⨯⨯⨯K ,因此没有95%的把握认为男生的身高对BMI 指数有影响.(2)①对编号为8的数据8660.817375.9 3.5e =-⨯+=,完成残差表如下所示:()22228222221(0.1)(0.3)(0.9)( 1.5)(0.5)( 2.3)(0.5)(3.5)21.2iii y y =-=+++-+-+-+-+=∑()()221218821.2110.91226iii i i y y R y y==-=-=-≈-∑∑. 所以解释变量(身高)对于预报变量(体重)变化的贡献值2R 约为0.91. ②由①可知,第八组数据的体重应为58.此时,易知,168=x ,57.5=y ,ˆ57.50.67516855.9a=-⨯=-, 所以重新采集数据后,男体育特长生的身高与体重的线性回归方程为ˆ0.67555.9yx =-.。

相关文档
最新文档