学习探究诊断必修三单元测试三 统计
(常考题)北师大版高中数学必修三第一章《统计》检测题(含答案解析)(3)

一、选择题1.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+2.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示: 价格99.510.5 11销售量 1186 5由散点图可知,销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的( ) A .10B .11C .12D .10.53.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为( )A .1167B .365C .36D 674.通过实验,得到一组数据如下:2,5,8,9,x ,已知这组数据的平均数为6,则这组数据的方差为( )A.3.2 B.4 C.6 D.6.55.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为()A.0795 B.0780 C.0810 D.08156.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x (万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程ˆˆˆy bx a=+,其中ˆˆˆ0.76,b a y bx==-,据此估计,该社区一户收入为15万元家庭年支出为()A.11.4万元B.11.8万元C.12.0万元D.12.2万元7.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x为()A.64 B.96 C.144 D.1608.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是()A.90.5 B.91.5 C.90 D.919.已知x,y的取值如表:x2678y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是A.B.C.D.10.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位11.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据:11(,)x y ,22(,)x y ,33(,)x y ,44(,)x y ,55(,)x y .根据收集到的数据可知12345150x x x x x ++++=,由最小二乘法求得回归直线方程为0.6754.9y x =+,则12345y y y y y ++++的值为( )A .75B .155.4C .375D .466.212.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .7二、填空题13.如图是某地区2018年12个月的空气质量指数以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述正确的是______.①2月相比去年同期变化幅度最小,3月的空气质量指数最高;②第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小; ③第三季度空气质量指数相比去年同期变化幅度的方差最小; ④空气质量指数涨幅从高到低居于前三位的月份为6、8、4月.14.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高[)120130,,[)130140,,[]140,150三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[]140,150内的学生中抽取的人数应为________.15.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.16.《数术记遗》相传是汉末徐岳(约公元2世纪)所著.该书主要记述了:积算(即筹算)、太乙算、两仪算、三才算、五行算、八卦算、九宫算、运筹算、了知算、成数算、把头算、龟算、珠算、计数共14种计算方法.某研究学习小组共6人,他们搜集整理该14种算法的相关资料所花费的时间(单位:min )分别为:93,93,88,81,94,91则这组时间数据的标准差为___________.17.下图是华师一附中数学讲故事大赛7位评委给某位学生的表演打出的分数的茎叶图.记分员在去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是____________.18.某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为_________19.为了了解2100名学生早晨到校时间,计划采用系统抽样的方法从全体学生中抽取容量为100栋样本,则分段间隔为__________.20.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组没有疗效的有6人,则第三组中有疗效的人数为__________.三、解答题21.据了解,温带大陆性气候,干燥,日照时间长,昼夜温差大,有利于植物糖分积累.某课题研究组欲研究昼夜温差大小()/x ℃与某植物糖积累指数()/y GI 之间的关系,得到如下数据:组数 第一组 第二组第三组第四组第五组第六组昼夜温差/℃x1011 13 12 8 6某植物糖积累指数/y GI20 24 30 28 18 15下的2组数据进行检验,假设这剩下的2组数据恰好是第一组与第六组数据.(1)求y 关于x 的线性回归方程ˆˆˆybx a =+ (2)若由线性回归方程得到的估计数据与所选出的检验数据的差的绝对值均不超过2.58,则认为得到的线性回归方程是理想的,试问(1)中所得线性回归方程是否理想?(参考公式:回归直线方程ˆˆˆybx a =+的斜率和截距的最小二乘估计()()()211ˆˆˆ,iii ni ni x x y y bay bx x x ==--==--∑∑ 22.某北方村庄4个草莓基地,采用水培阳光栽培方式种植的草莓个大味美,一上市便成为消费者争相购买的对象.光照是影响草莓生长的关键因素,过去50年的资料显示,该村庄一年当中12个月份的月光照量X (小时)的频率分布直方图如下图所示(注:月光照量指的是当月阳光照射总时长).(1)求月光照量X (小时)的平均数和中位数;(2)现准备按照月光照量来分层抽样,抽取一年中的4个月份来比较草莓的生长状况,问:应在月光照量[160,240)X ∈,[240,320)X ∈,[320,400]X ∈的区间内各抽取多少个月份?(3)假设每年中最热的5,6,7,8,9,10月的月光照量X 是大于等于240小时,且6,7,8月的月光照量X 是大于等于320小时,那么,从该村庄2018年的5,6,7,8,9,10这6个月份之中随机抽取2个月份的月光照量进行调查,求抽取到的2个月份的月光照量X (小时)都不低于320的概率.23.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元),有如下的统计资料:x (年)1 2 3 4 5y (万元) 5 6 7 8 10由资料可知y 对x 呈线性相关关系. (1)求y 关于x 的线性回归方程;(2)请估计该设备使用年限为15年时的维修费用.参考公式:线性回归方程y bx a =+的最小二乘法计算公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-,参考数据:5115263748510120i ii x y==⨯+⨯+⨯+⨯+⨯=∑24.某市为了解疫情过后制造业企业的复工复产情况,随机调查了100家企业,得到这些企业4月份较3月份产值增长率x 的频率分布表如下: x 的分组 [0.20,0)-[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数13403584(1)估计制造业企业中产值增长率不低于60%的企业比例及产值负增长的企业比例; (2)求制造业企业产值增长率的平均数与方差的估计值(同一组中的数据用该组区间的中点值为代表).25.某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分):甲班:82 84 85 89 79 80 91 89 79 74 乙班:90 76 86 81 84 87 86 82 85 83 (1)求两个样本的平均数; (2)求两个样本的方差和标准差; (3)试分析比较两个班的学习情况.26.某市举办了一次“诗词大赛”,分预赛和复赛两个环节,已知共有20000名学生参加了预赛,现从参加预赛的全体学生中随机地抽取100人的预赛成绩作为样本,得到如下的统计数据.地抽取2人,求恰有1人预赛成绩优良的概率;(2)由样本数据分析可知,该市全体参加预赛学生的预赛成绩Z 服从正态分布()2,N μσ,其中μ可近似为样本中的100名学生预赛成绩的平均值(同一组数据用该组数据的中间值代替),且2361σ=.利用该正态分布,估计全市参加预赛的全体学生中预赛成绩不低于72分的人数;(3)预赛成绩不低于91分的学生将参加复赛,复赛规则如下: ①参加复赛的学生的初始分都设置为100分;②参加复赛的学生可在答题前自己决定答题数量n ,每一题都需要“花”掉一定分数来获取答题资格(即用分数来买答题资格),规定答第k 题时“花”掉的分数为()0.21,2,k k n =; ③每答对一题得2分,答错得0分;④答完n 题后参加复赛学生的最终分数即为复赛成绩.已知学生甲答对每道题的概率均为0.75,且每题答对与否都相互独立,则当他的答题数量n 为多少时,他的复赛成绩的期望值最大?参考数据:若()2~,Z Nμσ,则() 6.827P Z μσμσ-<<+≈,()220.9545P Z μσμσ-<<+≈,()330.9973P Z μσμσ-<<+≈【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】根据散点图的分布可选择合适的函数模型. 【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D. 【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.2.A解析:A 【解析】 【分析】由表求得,,代入回归直线方程,联立方程组,即可求解,得到答案.【详解】由题意,5家商场的售价元和销售量件之间的一组数据, 可得,,又由回归直线的方程,则,即,又因为,解得,故选A. 【点睛】本题主要考查了回归直线方程的特征及其应用,其中解答中熟记回归直线方程的特征,准确计算是解答的关键,着重考查了推理与运算能力,属于基础题.3.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差. 【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x+++++=得x =4,∴5个分数的方差为:S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B 【点睛】本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.4.C解析:C 【解析】分析:利用平均数的公式,求得6x =,得到数据2,5,8,9,6,再利用方差的计算公式,即求解数据的方差.详解:由题意,一组数据2,5,8,9,x 的平均数为6,即258924655x xx +++++===,解得6x =,所以数据2,5,8,9,6的方差为2222221[(26)(56)(86)(96)(66)]65s =-+-+-+-+-=,故选C.点睛:本题主要考查了数据的数字特的计算,其中熟记数据的平均数的公式和数据的方差的计算公式是解答的关键,着重考查了推理与运算能力,属于基础题.5.A解析:A 【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为10002050= 所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.6.B解析:B 【解析】 试题分析:由题,,所以.试题 由已知,又因为ˆˆˆybx a =+,ˆˆˆ0.76,b a y bx ==- 所以,即该家庭支出为万元.考点:线性回归与变量间的关系.7.D解析:D 【解析】 【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数. 【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816, 因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D. 【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题8.A解析:A 【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可. 【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题.9.B解析:B 【解析】 【分析】根据所给的两组数据,做出横标和纵标的平均数,写出这组数据的样本中心点,根据线性回归方程一定过样本中心点,得到线性回归直线一定过的点的坐标. 【详解】根据题意可得,,由线性回归方程一定过样本中心点,.故选:B . 【点睛】本题考查线性回归方程的意义,线性回归方程一定过样本中心点,本题解题的关键是正确求出样本中心点,题目的运算量比较小,是一个基础题.10.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.11.C解析:C 【分析】首先求得x 的值,然后利用线性回归方程过样本中心点的性质求解12345y y y y y ++++的值即可. 【详解】由题意可得:12345305x x x x x x ++++==,线性回归方程过样本中心点,则:0.6754.975y x =⨯+=,据此可知:12345y y y y y ++++5375y ==. 本题选择C 选项. 【点睛】本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.12.B解析:B【解析】分析:首先写出所有学生的乘积,然后结合系统抽样的方法整理计算即可求得最终结果.详解:由题意可知,学生的成绩如下:111,111,112,113,113;116,117,117,118,118;120,120,121,122,122;123,124,124,126127;128,128,129,129,129;131,131,131,132,132;132,133,134,134,135;137,138,138,138,139;140,142,142,143,144.用系统抽样方法从中抽取9人,则每5人中抽取一人,即上述分组中每组抽取一人,120,135上的学生人数为5.则所抽取的学生的成绩在区间[]本题选择B选项.点睛:本题主要考查系统抽样的概念及其应用,茎叶图的识别等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.①②③【分析】根据折线的变化率得到相比去年同期变化幅度、升降趋势逐一验证即可【详解】根据折现统计图可得2月相比去年同期变化幅度最小3月的空气质量指数最高故①正确;第一季度的空气质量指数的平均值最大第解析:①②③【分析】根据折线的变化率,得到相比去年同期变化幅度、升降趋势,逐一验证即可.【详解】根据折现统计图可得,2月相比去年同期变化幅度最小,3月的空气质量指数最高,故①正确;第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小,故②正确;第三季度空气质量指数相比去年同期变化幅度的方差最小,故③正确;空气质量指数涨幅从高到低居于前三位的月份为6、8、9月,故④错误,故答案为:①②③.【点睛】本题考查条形统计图和折线图的应用,重点考查数据分析,从表中准确获取信息是关键,属于中档题型.14.3【分析】先由频率之和等于1得出的值计算身高在的频率之比根据比例得出身高在内的学生中抽取的人数【详解】身高在的频率之比为所以从身高在内的学生中抽取的人数应为故答案为:【点睛】本题主要考查了根据频率分解析:3【分析】先由频率之和等于1得出a 的值,计算身高在[)120,130,[)130,140,[]140,150的频率之比,根据比例得出身高在[]140,150内的学生中抽取的人数. 【详解】(0.0050.010.020.035)101a ++++⨯=0.03a ∴=身高在[)120,130,[)130,140,[]140,150的频率之比为0.03:0.02:0.013:2:1= 所以从身高在[]140,150内的学生中抽取的人数应为11836⨯= 故答案为:3 【点睛】本题主要考查了根据频率分布直方图求参数的值以及分层抽样计算各层总数,属于中档题.15.【分析】先根据平均数计算出的值再根据方差的计算公式计算出这组数的方差【详解】依题意所以方差为故答案为【点睛】本小题主要考查平均数和方差的有关计算考查运算求解能力属于基础题 解析:265【分析】先根据平均数计算出m 的值,再根据方差的计算公式计算出这组数的方差. 【详解】 依题意12674,45m m ++++==.所以方差为()()()()()22222114244464745⎡⎤-+-+-+-+-⎣⎦[]126944955=+++=. 故答案为265. 【点睛】本小题主要考查平均数和方差的有关计算,考查运算求解能力,属于基础题.16.【分析】由搜集算法所费的时间的数据求得数据的平均数再结合方差的计算公式即可求解【详解】由题意搜集算法所费的时间的数据可得数据的平均数为所以方差为所以标准差故答案为:【点睛】本题主要考查了数据的平均数解析:【分析】由搜集算法所费的时间的数据,求得数据的平均数,再结合方差的计算公式,即可求解. 【详解】由题意,搜集算法所费的时间的数据, 可得数据的平均数为939388819491906x +++++==,所以方差为2222222(9390)(9390)(8890)(8190)(9490)(9190)206s -+-+-+-+-+-==,所以标准差s ==故答案为: 【点睛】本题主要考查了数据的平均数和方差的计算,其中解答中熟记数据的平均数和方差的计算公式,准确计算是解答的关键,着重考查运算与求解能力.17.1【分析】因为题目中要去掉一个最高分所以对进行分类讨论然后结合平均数的计算公式求出结果【详解】若去掉一个最高分和一个最低分86分后平均分为不符合题意故最高分为94分去掉一个最高分94分去掉一个最低分解析:1 【分析】因为题目中要去掉一个最高分,所以对x 进行分类讨论,然后结合平均数的计算公式求出结果 【详解】若4x >,去掉一个最高分()90x +和一个最低分86分后,平均分为()1899291949291.65++++=,不符合题意,故4x ≤,最高分为94分,去掉一个最高分94分,去掉一个最低分86分后,平均分()18992909192915x +++++=,解得1x =,故数字x 为1 【点睛】本题考查了由茎叶图求平均值,理解题目意思运用平均数计算公式即可求出结果,注意分类讨论18.18【解析】【分析】由题意知抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为即可解得【详解】因为抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为解得【点睛】本题主要考解析:18 【解析】 【分析】由题意知,抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,即可解得. 【详解】因为抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,解得18x =. 【点睛】本题主要考查了系统抽样,属于中档题.19.【解析】【分析】根据系统抽样的特征求出分段间隔即可【详解】根据系统抽样的特征得:从2100名学生中抽取100个学生分段间隔为故答案是21【点睛】该题所考查的是有关系统抽样的组距问题应用总体除以样本容解析:21【解析】【分析】根据系统抽样的特征,求出分段间隔即可.【详解】根据系统抽样的特征,得:从2100名学生中抽取100个学生,分段间隔为210021 100=,故答案是21.【点睛】该题所考查的是有关系统抽样的组距问题,应用总体除以样本容量等于组距,得到结果,属于简单题目.20.12【解析】分析:由频率=以及直方图可得分布在区间第一组与第二组共有20人的频率即可求出第三组中有疗效的人数得到答案详解:由直方图可得分布在区间第一组和第二组共有20人分布唉区间第一组与第二组的频率解析:12【解析】分析:由频率=频数样本容量,以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案.详解:由直方图可得分布在区间第一组和第二组共有20人,分布唉区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人第三组的频率为0.36,所以第三组的人数为18人,第三组中没有疗效的有6人,第三组由疗效的有12人.点睛:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法,分布表在数量表示上比较准确,直方图比较直观.2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.三、解答题21.(1)171277y=⨯;(2)该小组所得线性回归方程是理想的.【分析】(1)根据数据求出ˆb与ˆa 的值,即可求出y 关于x 的线性回归方程; (2)分别计算出1月份和6月份对应的预测值,与检验数据作差取绝对值,再与2.58进行比较即可得到结论. 【详解】(1)由表中2月至5月份的数据, 得11(1113128)11,(24302818)2544x y =+++==+++=,故有()()520(1)2513(3)(7)34iii x x y y =--=⨯-+⨯+⨯+-⨯-=∑,()5222222021(3)14ii x x =-=+++-=∑,34171712,251114777b a y bx ∴===-=-⨯=-, 即y 关于x 的线性回归方程为171277y =⨯; (2)由171277y =⨯,当10x =时,171215810777y =⨯-=, 1581820 2.5877-=<, 当6x =时,1712906777y =⨯=, 901515 2.5877-=<, 则该小组所得线性回归方程是理想的. 【点睛】方法点睛:该题考查的是有关回归分析的问题,解题方法如下:(1)结合题中所给的数据,根据最小二乘法系数公式起的ˆb与ˆa 的值,得到回归直线方程;(2)将相应的变量代入,得到的值域题中条件比较,得到结论.22.(1)平均数为260(小时);中位数为240(小时)(2)2,1,1(3)15【分析】(1)利用各频率之和为1,计算出a ,然后根据频率分布直方图以及平均数,中位数的求法,可得结果.(2)根据月光照量[160,240)X ∈、[240,320)X ∈、[320,400]X ∈的频率之比为111::244,结合分层抽样的方法,可得结果. (3)采用列举法,将“6个月份之中随机抽取2个月份”所有情况列举出来,并计算“抽取到的2个月份的月光照量X (小时)都不低于320”的个数,结合古典概型可得结果. 【详解】(1)根据各频率之和为1, 则0.062580()801a a ⨯++⨯=, 解得0.003125a =.月光照量X (小时)的平均数为()802000.00625+2800.0031253600.003125X =⨯⨯+⨯所以260X =(小时)设月光照量X (小时)的中位数为0X , 则0[240,320]X ∈.根据中位数的定义, 其左右两边的频率相等,都为0.5,可得()00.00625802400.0031250.5X ⨯+-⨯=,解得0240X =.所以月光照量X (小时)的中位数为240(小时). (2)因为月光照量[160,240)X ∈、[240,320)X ∈、[320,400]X ∈的频率之比为111::244,所以若准备按照月光照量来分层抽样,抽取一年中的4个月份来比较草莓的生长状况,那么,抽取的月光照量[160,240)X ∈,[240,320)X ∈,[320,400]X ∈的月份数分别为11142,41,41244⨯=⨯=⨯=. (3)由题意,月光照量[240,320)X ∈的有5,9,10月, 月光照量[320,400]X ∈的有6,7,8月, 故从该村庄2018年的5,6,7,8,9,10月份 之中随机抽取2个月份的月光照量X (小时) 进行调查,所有的情况有:(5,9),(5,10),(5,6),(5,7),(5,8); (9,10),(9,6),(9,7),(9,8); (10,6),(10,7),(10,8); (6,7),(6,8);(7,8)共15种;其中,抽取到的2个月份的月光照量X (小时)都不低于320的情况有:(6,7),(6,8),(7,8)共3种;故所抽取到的2个月份的月光照量X (小时)都不低于320的概率31155P ==. 【点睛】本题考查频率分布直方图中平均数,中位数的计算,以及古典概型的应用,分清题意,熟悉公式,耐心计算,属中档题.23.(1) 1.2 3.6y x =+;(2)21.6万元. 【分析】(1)先求出年限x 和维修费用y 的平均值,即得到样本中心点,利用最小二乘法得到线性回归方程的系数,根据样本中心点在线性回归直线上,得到a 值,即得线性回归方程; (2)将15x =代入回归直线方程即可求得结果. 【详解】 (1)1234535x ++++==,5678107.25++++==y51120i ii x y==∑,522222211234555i i x ==++++=∑25945nx =⨯=,537.2108nx y =⨯⨯=∴1201081.25545b -==-,7.2 1.23 3.6a =-⨯=∴y 关于x 的线性回归方程为 1.2 3.6y x =+(2)在上述回归方程中,当15x =时得21.6y = ∴该设备使用年限为15年时的维修费用大约为21.6万元. 【点睛】本题考查回归直线方程的求解及其应用,其中认真审题,准确合理的运算是解决此类问题的关键,考查运算能力,属于基础题.24.(1)4%,13%.;(2)平均数为0.20,方差的估计值为0.0364. 【分析】(1)直接根据频率分布表即可得到答案.(2)首先根据频率分布表估计企业产值增长率的平均数,然后再求方差即可. 【详解】(1)制造业企业中产值增长率不低于60%的企业比例为4100%4%100⨯=, 产值负增长的企业比例13100%13%100⨯=, 所以制造业企业中产值增长率不低于60%的企业比例4%,产值负增长的企业比例13%. (2)100家制造业企业产值增长率的平均数为()1130.10400.10350.3080.5040.700.20100⎡⎤⨯-+⨯+⨯+⨯+⨯=⎣⎦, 方差为()222221130.100.2040(0.100.20)35(0.300.20)8(0.500.20)4(0.700.20)100⎡⎤⨯--+⨯-+⨯-+⨯-+⨯-⎣⎦0.0364=所以制造业企业产值增长率的平均数为0.20,方差的估计值为0.0364. 【点睛】本题第一问考查频率分布表,第二问考查根据频率分布表估计平均值和方差,同时考查学生的计算能力,属于中档题.25.(1)=83.2x 甲,=84x 乙;(2)22=26.36=13.2S S 甲乙,,=5.13S 甲,=3.63S 乙;(3)乙班的总体学习情况比甲班好 【解析】试题分析:每组样本数据有10个,求样本的平均数利用平均数公式,10个数的平均数等于这10个数的和除以10;比较平均分的大小可以看出两个班学生平均水平的高低,求样本的方差只需使用方差公式,求这10个数与平均数的差的平方方和再除以10;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 . 试题 (1)x 甲=110×(82+84+85+89+79+80+91+89+79+74)=83. 2, x 乙=110×(90+76+86+81+84+87+86+82+85+83)=84. (2)2S 甲=110×[(82-83. 2)2+(84-83. 2)2+(85-83. 2)2+(89-83. 2)2+(79-83. 2)2+(80-83. 2)2+(91-83. 2)2+(89-83. 2)2+(79-83. 2)2+(74-83. 2)2]=26. 36,2S 甲=110[(90-84)2+(76-84)2+(86-84)2+(81-84)2+(84-84)2+(87-84)2+(86-84)2+(82-84)2+(85-84)2+(83-84)2]=13. 2,则s 甲,s 乙≈3. 63.(3)由于x x <甲乙,则甲班比乙班平均水平低.由于S S >甲乙,则甲班没有乙班稳定. 所以乙班的总体学习情况比甲班好【点睛】怎样求样本的平均数,n 个数的平均数等于这n 个数的和除以n ;比较平均数的大小可以看出两个样本平均水平的高低,怎样求样本的方差,就是求这n 个数与平均数的差的平方方和再除以n ;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 . 26.(1)2552;(2)3173;(3)当他的答题数量7n =时,他的复赛成绩的期望值最大. 【分析】(1)由表可知,样本中成绩不低于60分的学生共有40人,其中成绩优良的人数为15。
(好题)高中数学必修三第一章《统计》检测(含答案解析)(1)

一、选择题1.某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成[)[)[)[)[)[)[)[]0,5,5,10,10,15,15,20,20,25,25,30,30,35,35,40时,所作的频率分布直方图如图所示,则原始茎叶图可能是( )A .B .C .D .2.为了解一片经济树林的生长情况,随机测量了其中100株树木的底部周长(单位:cm ),根据所得数据画出样本的频率分布直方图如图所示.那么在这100株树木中,底部周长小于110cm 的株数n 是 ( )A .30B .60C .70D .803.已知变量x ,y 的关系可以用模型kx y ce =拟合,设ln z y =,其变换后得到一组数据下:x 16 17 18 19 z50344131由上表可得线性回归方程4z x a =-+,则c =( ) A .4-B .4e -C .109D .109e4.一组数据的平均数为m ,方差为n ,将这组数据的每个数都加上(0)a a >得到一组新数据,则下列说法正确的是( ) A .这组新数据的平均不变 B .这组新数据的平均数为am C .这组新数据的方差为2a nD .这组新数据的方差不变5.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .166.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.97.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是 A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为38.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x (cm )174176176176178儿子身高y (cm )175175176177177则y 对x 的线性回归方程为A .y = x-1B .y = x+1C .y =88+12x D .y = 1769.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( ) A .60B .50C .40D .3010.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位11.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经统计,得到一个卖出的热饮杯数与当天气温的对比表: 温度℃ -5 0 4 7 12 15 19 23 27 31 36 热饮杯数15615013212813011610489937654根据上表数据确定的线性回归方程应该是( )A .ˆ 2.352147.767yx =-+ B .ˆ 2.352127.765yx =-+ C .ˆ 2.35275.501yx =+D .ˆ 2.35263.674yx =+ 12.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响.对近8年的年宣传费i x 和年销售量()1,2,...8i y i =数据作了初步处理,得到下面的散点图及一些统计量的值.有下列5个曲线类型:①ˆˆy bxa =+;②y x d =+;③ln y p q x =+;④21k xy k e =+;⑤212y c x c =+,则较适宜作为年销售量y 关于年宣传费x 的回归方程的是( ) A .①②B .②③C .②④D .③⑤二、填空题13.如图是某地区2018年12个月的空气质量指数以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述正确的是______.①2月相比去年同期变化幅度最小,3月的空气质量指数最高;②第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小; ③第三季度空气质量指数相比去年同期变化幅度的方差最小; ④空气质量指数涨幅从高到低居于前三位的月份为6、8、4月.14.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高[)120130,,[)130140,,[]140,150三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[]140,150内的学生中抽取的人数应为________.15.上海市普通高中学业水平等级考成绩共分为五等十一级,各等级换算成分数如表所示: 等级A + AB + BB -C + CC -D + DE 分数 7067646158555249464340上海某高中2018届高三()1班选考物理学业水平等级考的学生中,有5人取得A +成绩,其他人的成绩至少是B 级及以上,平均分是64分,这个班级选考物理学业水平等级考的人数至少为______人.16.一个车间为了规定工作原理,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下: 零件数x (个) 15 20 30 40 50 加工时间y (分钟)6570758090由表中数据,求得线性回归方程0.66y x a =+,则估计加工70个零件时间为__________分钟(精确到0.1).17.为了了解2100名学生早晨到校时间,计划采用系统抽样的方法从全体学生中抽取容量为100栋样本,则分段间隔为__________.18.某种活性细胞的存活率(%)y 与存放温度()x C ︒之间具有线性相关关系,样本数据如下表所示: 存放温度()x C ︒ 10 4 -2 -8 存活率(%)y20445680经计算得回归直线的斜率为-3.2.若存放温度为6C ︒,则这种细胞存活率的预报值为__________%.19.某超市统计了一个月内每天光顾的顾客人数,得到如图所示的频率分布直方图,根据该图估计该组数据的中位数为__________.20.某班60名学生参加普法知识竞赛,成绩都在区间[40100],上,其频率分布直方图如图所示,则成绩不低于60分的人数为___.三、解答题21.据了解,温带大陆性气候,干燥,日照时间长,昼夜温差大,有利于植物糖分积累.某课题研究组欲研究昼夜温差大小()/x ℃与某植物糖积累指数()/y GI 之间的关系,得到如下数据:组数 第一组 第二组第三组第四组第五组第六组昼夜温差/℃x1011 13 12 8 6某植物糖积累指数/y GI20 24 30 28 18 15下的2组数据进行检验,假设这剩下的2组数据恰好是第一组与第六组数据.(1)求y 关于x 的线性回归方程ˆˆˆybx a =+ (2)若由线性回归方程得到的估计数据与所选出的检验数据的差的绝对值均不超过2.58,则认为得到的线性回归方程是理想的,试问(1)中所得线性回归方程是否理想?(参考公式:回归直线方程ˆˆˆybx a =+的斜率和截距的最小二乘估计()()()211ˆˆˆ,iiini ni x x y y bay bx x x ==--==--∑∑ 22.“湖广熟,天下足”,鱼米之乡的湖北是全国重要的农产品生产地.而受疫情影响,像莲藕、小龙虾等湖北很多优质农副产品近期都面临销售难题.为了让淜北尽快恢复正常,央视主持人朱广权化身直播带货官,和网红们一起为湖北产品做公益直播.在为湖北某地区的小龙虾进行带货时,需大致了解该地区小龙虾的产量,通过调查发现湖北某地区近几年的小龙虾产量统计如下表: 年份 2014 2015 2016 2017 2018 2019 年份代码t123456(1)根据表中数据,建立关于t 的线性回归方程y bt a =+; (2)请你根据线性回归方程预测今年(2020年)该地区小龙虾的年产量.附:对于一组数据()11,t y ,()22,t y ,…,(),n n t y ,其回归直线y bt a =+的斜率和截距的最小二乘估计分别为:()()()121ˆniii ni i t t y y bt t ==--=-∑∑,a y bt =-.(参考数据:()()616.3ii i tty y =--=∑)23.为提高某作物产量,种植基地对单位面积播种数与每棵作物的产量之间的关系进行了研究,收集了10块试验田的数据,得到下表:技术人员选择模型21y a bx =+作为y 与x 的回归方程类型,令2i i u x =,1ii v y =. (1)由最小二乘法得到线性回归方程v u βα=+,求y 关于x 的回归方程; (2)利用(1)得出的结果,计算当单位面积播种数x 为何值时,单位面积的总产量w xy =的预报值最大?(计算结果精确到0.01)附:对于一组数据()11,u v ,()22,u v …(),n n u v 其回归直线v u βα=+的斜率和截距的最小二乘法估计分别为1221ni i i nii u v nu vunuβ==-⋅=-∑∑,v u αβ=-.参考数据:1500nii u==∑,140ni i v ==∑,12321n i i i u v ==∑,2135642ni i u ==∑ 5.48≈.24.假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:若由资料可知y 对x 呈线性相关关系,试求:(1)回归直线方程;(2)估计使用年限为10年时,维修费用约是多少?(参考:1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-)25.经营费用指流通企业对在经营过程中发生除经营成本以外的所有费用,如管理费用、财务费用、法律费用等,这些费用没有直接用于生产产品或提供服务,但它是影响公司收益的重要因素.某创业公司从2014年开始创业到2019年每年的经营费用y (万元)、年份及其编号t ,有如下统计资料: 年份 2014 2015 2016 2017 2018 2019 t 1 2 3 4 5 6 y9.512.214.617.419.6m已知该公司从2014年到2019年年平均经营费用为16万元,且经营费用y 与年份编号t 呈线性相关关系.(1)求2019年该公司的经营费用;(2)y 关于t 的回归方程为 2.6y t a =+,求a ,并预测2020年所需要支出的经营费用; (3)该公司对2019年卖出的产品进行质量指标值检测,由检测结果得如图所示频率分布直方图:预计2020年生产产品质量指标值分布与上一年一致,将图表中频率作为总体的概率.当每件产品质量指标值不低于215时为优质品,指标值在185到215之间是合格品,指标值低于185时为次品.出售产品时,每件优质品可获利1.5万元,每件合格品可获利0.7万元,次品不仅全额退款,还要对客户进行赔付,所以每件次品亏损1.3万元.若2020年该公司的产量为500台,请你预测2020年该公司的总利润(总利润=销售利润-经营费用).26.某花圃为提高某品种花苗质量,开展技术创新活动,在A ,B 实验地分别用甲、乙方法培育该品种花苗.为观测其生长情况,分别在A ,B 试验地随机抽选各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图.记综合评分为80及以上的花苗为优质花苗.(1)求图中a 的值,并求综合评分的平均数;(2)若优质花苗数中甲乙两种培育法的比列为1:3,填写下面的列联表,并判断是否有99%的把握认为优质花苗与培育方法有关.优质花苗 非优质花苗 合计甲培育法 乙培育法 合计附:下面的临界值表仅供参考.()20P K k ≥ 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0k2.0722.706 3.841 5.0246.635 7.87910.828(参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)【参考答案】***试卷处理标记,请不要删除一、选择题1.A 解析:A 【解析】由频率分布直方图可知:第一组的频数为20×0.01×5=1个, [0,5)的频数为20×0.01×5=1个, [5,10)的频数为20×0.01×5=1个, [10,15)频数为20×0.04×5=4个, [15,20)频数为20×0.02×5=2个, [20,25)频数为20×0.04×5=4个, [25,30)频数为20×0.03×5=3个, [30,35)频数为20×0.03×5=3个, [35,40]频数为20×0.02×5=2个, 则对应的茎叶图为A , 本题选择A 选项.点睛:茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.2.C解析:C 【解析】解:由图可知:则底部周长小于110cm 段的频率为(0.01+0.02+0.04)×10=0.7, 则频数为100×0.7=70人. 故选C .3.D解析:D 【分析】由已知求得x 与z 的值,代入线性回归方程求得a ,再由kxy ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+,结合z lny =,得z lnc kx =+,则109lnc =,由此求得c 值.【详解】 解:1617181917.54x +++==,50344131394z +++==. 代入4z x a =-+,得39417.5a =-⨯+,则109a =.∴4109z x =-+,由kxy ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+,令z lny =,则z lnc kx =+,109lnc ∴=,则109c e =. 故选:D .【点睛】本题考查回归方程的求法,考查数学转化思想方法,考查计算能力,属于中档题. 4.D解析:D【分析】考查平均数和方差的性质,基础题.【详解】设这一组数据为()1,n X a a =,由()()E X a E X a +=+,()()D X a D X +=,故选:D .【点睛】本题主要考查方差的性质,考查了运算能力,属于容易题. 5.A解析:A【分析】先弄清楚程序框图中是统计成绩不低于90分的学生人数,然后从茎叶图中将不低于90分的个数数出来,即为输出的结果.【详解】176A =,1i =,16i ≤成立,190A ≥不成立,112i =+=;279A =,2i =,16i ≤成立,290A ≥不成立,112i =+=;792A =,7i =,16i ≤成立,790A ≥成立,011n =+=,718i =+=;依此类推,上述程序框图是统计成绩不低于90分的学生人数,从茎叶图中可知,不低于90分的学生数为10,故选A .【点睛】本题考查茎叶图与程序框图的综合应用,理解程序框图的意义,是解本题的关键,考查理解能力,属于中等题.6.B解析:B【解析】分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程. 详解:123+4=2.54x ++=, 3 3.8 5.26 4.5,4y +++== ∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立,故选B. 点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题. 7.D解析:D 【详解】 试题分析:由于甲地总体均值为,中位数为,即中间两个数(第天)人数的平均数为,因此后面的人数可以大于,故甲地不符合.乙地中总体均值为,因此这天的感染人数总数为,又由于方差大于,故这天中不可能每天都是,可以有一天大于,故乙地不符合,丙地中中位数为,众数为,出现的最多,并且可以出现,故丙地不符合,故丁地符合.考点:众数、中位数、平均数、方差8.C解析:C【详解】试题分析:由已知可得176,176x y ==∴中心点为()176,176,代入回归方程验证可知,只有方程y =88+12x 成立,故选C 9.C解析:C【分析】设该样本中高三年级的学生人数为x ,则1800601200x=,解之即可 【详解】设该样本中高三年级的学生人数为x , 则1800601200x=,解得40x =, 故选C .【点睛】 本题考查了分层抽样方法的应用问题,属基础题.10.C解析:C【解析】【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论.【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位,即减少1.5个单位,故选C.【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目. 11.A解析:A【解析】分析:先观察表中数据的规律,确定回归系数b 的符号,再计算x 和y ,代入选项确定正确答案.详解:由表中数据规律发现:热饮杯数y 随当天气温x 升高而减少,则0b <,排除C 、D. 计算1169=(504712151923273136)1111x -++++++++++= 11228=(15615013212813011610489937654)111.641111y ++++++++++=≈ 将x 代入选项A ,得1692.352147.767111.6311ˆy =-⨯+= 将x 代入选项B ,得1692.352127.76591.6311ˆy=-⨯+= 所以选项A 正确.故选A. 点睛:本题考查线性回归方程的求法与应用,一次项系数b 符号的判断和回归直线过样本中心点(,)x y 是解题关键.12.B解析:B【解析】分析:先根据散点图确定函数趋势,再结合五个选择项函数图像,进行判断选择.详解:从散点图知,样本点分布在开口向右的抛物线(上支)附近或对数曲线(上部分)的附近,所以y =d 或y =p +q ln x 较适宜,故选B .点睛:本题考查散点图以及函数图像,考查识别能力.二、填空题13.①②③【分析】根据折线的变化率得到相比去年同期变化幅度、升降趋势逐一验证即可【详解】根据折现统计图可得2月相比去年同期变化幅度最小3月的空气质量指数最高故①正确;第一季度的空气质量指数的平均值最大第解析:①②③【分析】根据折线的变化率,得到相比去年同期变化幅度、升降趋势,逐一验证即可.【详解】根据折现统计图可得,2月相比去年同期变化幅度最小,3月的空气质量指数最高,故①正确;第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小,故②正确;第三季度空气质量指数相比去年同期变化幅度的方差最小,故③正确;空气质量指数涨幅从高到低居于前三位的月份为6、8、9月,故④错误,故答案为:①②③.【点睛】本题考查条形统计图和折线图的应用,重点考查数据分析,从表中准确获取信息是关键,属于中档题型.14.3【分析】先由频率之和等于1得出的值计算身高在的频率之比根据比例得出身高在内的学生中抽取的人数【详解】身高在的频率之比为所以从身高在内的学生中抽取的人数应为故答案为:【点睛】本题主要考查了根据频率分 解析:3【分析】先由频率之和等于1得出a 的值,计算身高在[)120,130,[)130,140,[]140,150的频率之比,根据比例得出身高在[]140,150内的学生中抽取的人数.【详解】(0.0050.010.020.035)101a ++++⨯=0.03a ∴=身高在[)120,130,[)130,140,[]140,150的频率之比为0.03:0.02:0.013:2:1= 所以从身高在[]140,150内的学生中抽取的人数应为11836⨯= 故答案为:3【点睛】本题主要考查了根据频率分布直方图求参数的值以及分层抽样计算各层总数,属于中档题. 15.15【解析】【分析】设取得A 成绩的x 人取得成绩的y 人取得B 成绩的z 人由题意可得:解得:结合xy 可求的最【详解】设取得A 成绩的x 人取得成绩的y 人取得B 成绩的z 人则即又xy 即当且仅当时取得最小值15取得解析:15【解析】【分析】设取得A 成绩的x 人,取得B +成绩的y 人,取得B 成绩的z 人,由题意可得:()70567x 64y 61z 645x y z ⨯+++=⨯+++,解得:z x 10-=,结合x ,y ,z N ∈,可求5x y z +++的最.【详解】设取得A 成绩的x 人,取得B +成绩的y 人,取得B 成绩的z 人,则()70567x 64y 61z 645x y z ⨯+++=⨯+++,即z x 10-=,又x ,y ,z N ∈,即当且仅当x 0=,y 0=,z 10=时,5x y z +++取得最小值15,取得A 成绩的0人,取得B +成绩的0人,取得B 成绩的10人,这个班级选考物理学业水平等级考的人数至少为15人,故答案为15【点睛】本题考查了实际问题通过数学问题解决,考查了阅读理解及数学建模的能力,属中档题. 16.7【解析】【分析】结合题意先求出线性回归方程然后再计算出结果【详解】由题意可得则线性回归方程为当时【点睛】本题考查了求线性回归方程然后求出估计结果需要掌握解题方法较为基础解析:7【解析】【分析】结合题意先求出线性回归方程,然后再计算出结果【详解】 由题意可得1520304050315x ++++== 6570758090765y ++++==, 760.6631a ∴=⨯+, 55.54a =,则线性回归方程为0.66 5.4ˆ55yx =+ 当70x =时,ˆ101.7y≈ 【点睛】本题考查了求线性回归方程,然后求出估计结果,需要掌握解题方法,较为基础 17.【解析】【分析】根据系统抽样的特征求出分段间隔即可【详解】根据系统抽样的特征得:从2100名学生中抽取100个学生分段间隔为故答案是21【点睛】该题所考查的是有关系统抽样的组距问题应用总体除以样本容 解析:21【解析】【分析】根据系统抽样的特征,求出分段间隔即可.【详解】根据系统抽样的特征,得:从2100名学生中抽取100个学生,分段间隔为210021100=, 故答案是21.【点睛】该题所考查的是有关系统抽样的组距问题,应用总体除以样本容量等于组距,得到结果,属于简单题目. 18.34【解析】分析:由题意求出代入公式求值从而得到回归直线方程代入代入即可得到答案详解:由题意设回归方程由表中数据可得:;代入回归方程可得当时可得故答案为34点睛:该题考查的是有关回归直线的有关问题在 解析:34【解析】 分析:由题意求出,x y ,代入公式求值^a ,从而得到回归直线方程,代入6x =代入即可得到答案. 详解:由题意,设回归方程 3.2ˆ,ˆyx a =-+ 由表中数据可得:1,50x y ==;代入回归方程可得ˆ53.2a=. 当6x =时,可得3.2653.234y =-⨯+=,故答案为34.点睛:该题考查的是有关回归直线的有关问题,在解题的过程中,涉及到的知识点有回归直线过均值点,即样本中心点,利用题中所给的表格中的数据,计算得出相应的量,代入式子求得对应的结果.19.75【解析】分析:由频率分布直方图算出各频率然后计算中位数详解:由图可知的频率为的频率为的频率为的频率为的频率为前两组频率前三组频率中位数在第三组设中位数为则解得故该组数据的中位数为点睛:本题考查了 解析:75.【解析】分析:由频率分布直方图算出各频率,然后计算中位数详解:由图可知,10~20的频率为0.1420~30的频率为0.2430~40的频率为0.3240~50的频率为0.250~60的频率为0.1前两组频率0.140.240.380.5=+=<前三组频率0.140.240.320.70.5=++=>∴中位数在第三组设中位数为x ,则()300.380.320.510x -+⨯= 解得33.75x =故该组数据的中位数为33.75点睛:本题考查了在频率分布直方图中求中位数,此类题目需要先确定中位数所在的组,然后根据公式计算求得结果,较为基础. 20.30【解析】由题意可得:则成绩不低于分的人数为人解析:30【解析】由题意可得:()400.0150.0300.0250.0051030⨯+++⨯=则成绩不低于60分的人数为30人三、解答题21.(1)171277y =⨯;(2)该小组所得线性回归方程是理想的. 【分析】 (1)根据数据求出ˆb与ˆa 的值,即可求出y 关于x 的线性回归方程; (2)分别计算出1月份和6月份对应的预测值,与检验数据作差取绝对值,再与2.58进行比较即可得到结论.【详解】(1)由表中2月至5月份的数据, 得11(1113128)11,(24302818)2544x y =+++==+++=, 故有()()520(1)2513(3)(7)34i i i x x y y =--=⨯-+⨯+⨯+-⨯-=∑, ()5222222021(3)14i i x x =-=+++-=∑, 34171712,251114777b a y bx ∴===-=-⨯=-, 即y 关于x 的线性回归方程为171277y =⨯; (2)由171277y =⨯,当10x =时,171215810777y =⨯-=,1581820 2.5877-=<, 当6x =时,1712906777y =⨯=, 901515 2.5877-=<, 则该小组所得线性回归方程是理想的.【点睛】方法点睛:该题考查的是有关回归分析的问题,解题方法如下:(1)结合题中所给的数据,根据最小二乘法系数公式起的ˆb与ˆa 的值,得到回归直线方程;(2)将相应的变量代入,得到的值域题中条件比较,得到结论.22.(1)0.36 6.24y x =+;(2)8.76万吨.【分析】(1)由题意求得知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,运用公式求得b ,代入可求得y 关于t 的线性回归方程.(2)由(1)得的线性回归方程,代入年份代码7t =计算,可预测2020年该地区小龙虾的年产量.【详解】(1)由题知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,()()()61621 6.30.3617.5ˆi ii i i t t y y b t t ==--===-∑∑, 又 6.24=-=a y bt .所以,y 关于t 的线性回归方程为0.36 6.24y x =+.(2)由(1)得,当年份为2020年时,年份代码7t =,此时0.367 6.248.76=⨯+=y .所以,可预测,2020年该地区小龙虾的年产量为8.76万吨.【点睛】本题考查线性回归方程的求解,利用线性回归方程对总体进行估计,属于中档题. 23.(1)212.50.03y x=+;(1)9.13x =棵2/m . 【分析】(1)先利用公式和数据计算,αβ,即得v 关于u 的线性回归方程,再代入得到y 关于x 的回归方程即可;(2)先利用(1)的结果计算w xy =,再利用基本不等式求其最大值即可.【详解】解:(1)由题意得115010n i i u u ===∑,11410ni i v v ===∑, ∴1011022212321105040.033564210501010i ii i i u v u v u uβ==-⨯⨯=⨯⋅--≈=-∑∑, 2.5v u αβ=-=. 所以v 关于u 的线性回归方程为0.03 2.5v u =+.则y 关于x 的回归方程为212.503ˆ0.y x =+. (2)根据(1)的结果并结合条件,单位面积的总产量的预报值21252.50.030.03x w x x x==++ 1.83≤=≈. 当且仅当2.50.03x x =时,等号成立,此时9.133x =≈. 即当9.13x =棵2/m 时,单位面积的总产量w 的预报值最大,最大值是1.83. 【点睛】本题考查了非线性回归方程的求法以及方程的应用,属于中档题.24.(1) 1.2308ˆ.0yx =+;(2)12.38万元.. 【分析】(1)由已知表格中的数据,易计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221n ii i n i i x y nxy b xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.(2)把使用年限10代入回归直线方程,即可估算出维修费用的值.【详解】(1)4x =,5y =,52190ii x==∑,51112.3i i i x y ==∑, 12215 1.235n ii i n ii x y xy b xx ==-==-∑∑,0.08a y bx =-=,所以回归直线方程为 1.2308ˆ.0yx =+; (2) 1.23100.0812.3ˆ8y=⨯+=,即估计用10年时维修费约为12.38万元.【点评】本题考查回归直线的方程求解,关键是要求出回归直线方程的系数,由已知的变量x ,y 的值,我们计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221n ii i n i i x y nxy b xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.属于中等题.25.(1)22.7万元;(2)6.9;25.1万元;(3)254.9万元.【分析】(1)根据均值定义列式计算;(2)求出t ,代入方程可得a ,令7t =代入可得估计值;(3)由频率分布直方图是三种产品的概率,得三种产品的件数,根据各产品赢利可计算出总赢利,注意减去(2)中估计的经营费用.【详解】(1)9.512.214.617.419.6166m y +++++==. 解得22.7m =,即2019年该公司的经营费用为22.7万元.(2) 3.5t =,16y =,所以 2.6 6.9a y t =-=,取7t =,代入得25.1y =,预测2020年所需要支出的经营费用为25.1万元. (3)由图可得生产优质品的概率是0.1,生产合格品的概率是0.79,生产次品的概率是0.11,则预测该公司2020年的总利润为1.50.15000.70.79500 1.30.1150025.1254.9⨯⨯+⨯⨯-⨯⨯-=(万元).【点睛】本题考查线性回归方程及其应用,考查频率分布直方图及其期望,考查学生的数据处理能力,运算求解能力,属于中档题.26.(1)0.04,81;(2)列联表见解析,有99%的把握认为优质花苗与培育方法有关【分析】(1)利用频率和为1列方程求出a 的值,再利用直方图平均值公式计算平均值;(2)由(1)结合直方图求出有关数据,可填写列联表,计算观测值,对照临界值得出结论.【详解】(1)因为(0.0050.0100.0250.020)101a ++++⨯=,解得0.040a =,综合评分的平均数为,(0.005550.010650.025750.040850.02095)1081⨯+⨯+⨯+⨯+⨯⨯=(2)由(1)结合直方图可知,80分以上的频数为()1000.40.260⨯+=,甲乙两种培育法的比列为1:3,所以,甲乙两种培育法的优质苗数分别为15、45填写列联表如下,计算2100(1554535)37,510.828 60405050K⨯⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为优质花苗与培育方法有关.【点睛】本题考查了频率分布直方图的性质与应用问题,也考查了列联表与独立性检验问题的实际应用,是中档题.。
(常考题)北师大版高中数学必修三第一章《统计》检测(答案解析)(3)

一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.如图1为某省2019年1~4月快递业务量统计图,图2是该省2019年1~4月快递业务收入统计图,下列对统计图理解错误的是( )A .2019年1~4月的业务量,3月最高,2月最低,差值接近2000万件B .2019年1~4月的业务量同比增长率超过50%,在3月最高C .从两图来看2019年1~4月中的同一个月快递业务量与收入的同比增长率并不完全一致D .从1~4月来看,该省在2019年快递业务收入同比增长率逐月增长3.2020年2月,受新冠肺炎的影响,医卫市场上出现了“一罩难求”的现象.在政府部门的牵头下,部分工厂转业生产口罩,下表为某小型工厂2-5月份生产的口罩数(单位:万) 月份x 2 3 4 5 口罩数y4.5432.5口罩数y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 的值为( ) A .6.1B .5.8C .5.95D .6.754.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是( )A .成绩B .视力C .智商D .阅读量5.某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成[)[)[)[)[)[)[)[]0,5,5,10,10,15,15,20,20,25,25,30,30,35,35,40时,所作的频率分布直方图如图所示,则原始茎叶图可能是( )A .B .C .D .6.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生B .200号学生C .616号学生D .815号学生7.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .8.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50B .70和67C .75和50D .75和679.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)30333639已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39B .42C .45D .5010.高二某班共有学生60名,座位号分别为01, 02, 03,···, 60.现根据座位号,用系统抽样的方法,抽取一个容量为4的样本.已知03号、18号、48号同学在样本中,则样本中还有一个同学的座位号是( ) A .31号B .32号C .33号D .34号11.为了考察两个变量x 和y 之间的线性相关性,甲.乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2.已知在两个人的试验中发现对变量x 的观测数据的平均值恰好相等,都为s ,对变量y 的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是( ) A .直线l 1和l 2有交点(s ,t)B .直线l 1和l 2相交,但是交点未必是点(s ,t)C .直线l 1和l 2由于斜率相等,所以必定平行D .直线l 1和l 2必定重合12.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据:11(,)x y ,22(,)x y ,33(,)x y ,44(,)x y ,55(,)x y .根据收集到的数据可知12345150x x x x x ++++=,由最小二乘法求得回归直线方程为0.6754.9y x =+,则12345y y y y y ++++的值为( )A .75B .155.4C .375D .466.2二、填空题13.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位: cm ),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有_______株树木的底部周长大于110cm .14.对两个变量y 和x 进行回归分析,得到一组样本数据()11,x y ,()22,x y ,…,(),n n x y ,则下列说法中正确的序号是______.①由样本数据得到的回归直线方程y bx a =+必过样本点的中心 ②残差平方和越小的模型,拟合的效果越好③用相关指数2R 来刻画回归效果,2R 越小说明拟合效果越好④若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间线性相关性强 15.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..16.一个项目由15个专家评委投票表决,剔除一个最高分96,一个最低分58后所得到的平均分为92,方差为16,那么原始得分的方差为______________.17.设一个回归方程为0.4 1.8y x =-,则当25x =时,y 的估计值是_______. 18.已知某人连续5次射击的环数分别是8,9,10,x ,8,若这组数据的平均数是9,则这组数据的方差为 .19.为弘扬我国优秀的传统文化,某小学六年级从甲、乙两个班各选出7名学生参加成语知识竞赛,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则的值为__________.20.为了解某地区某种农产品的年产量x (单位:吨)对价格y (单位:千元/吨)的影响,对近五年该农产品的年产量和价格统计如下表:x1 2 3 4 5y 7.0 6.5m3.8 2.2已知x 和y 具有线性相关关系,且回归方程为 1.238.69y x =-+,那么表中m 的值为__________.三、解答题21.某科研课题组通过一款手机APP 软件,调查了某市1000名跑步爱好者平均每周的跑步量(简称“周跑量”),得到如下的频数分布表: 周跑量 [)10,15 [)15,20 [)20,25 [)25,30 [)30,35 [)35,40 [)40,45 [)45,50 []50,55人数100120130180220150603010周跑量 小于20公 20公里到 不小于40 类别 休闲跑者 核心跑者 精英跑者 装备价格250040004500);(3)根据跑步爱好者的周跑量,将跑步爱好者分成以下三类,不同类别的跑者购买的装备的价格不一样(如表),根据以上数据,估计该市每位跑步爱好者购买装备,平均需要花费多少元?22.2018年8月8日是我国第十个全民健身日,其主题是:新时代全民健身动起来.某市为了解全民健身情况,随机从某小区居民中抽取了40人,将他们的年龄分成7段:[10,20),[20,30),[30,40),[40,50),[50,60),[60,70),[70,80]后得到如图所示的频率分布直方图.(1)试求这40人年龄的平均数的估计值;(2)(i )若从样本中年龄在[50,70)的居民中任取2人赠送健身卡,求这2人中至少有1人年龄不低于60岁的概率;(ⅱ)已知该小区年龄在[10,80]内的总人数为2000,若18岁以上(含18岁)为成年人,试估计该小区年龄不超过80岁的成年人人数.23.某电视机的广告支出x (单位:万元)与销售收入y (单位:万元)之间有下表所对应的关系:(1)求出y 对x 的回归直线方程;(2)若广告费为9万元,则销售收入为多少万元? (参考公式:1122222212n n n x y x y x y nx yb x x x nx +++-⋅=+++-,a y bx =-) 24.从某小区抽取100个家庭进行月用电量调查,发现其月用电量都在50度至350度之间,频率分布直方图如图所示.(1)根据直方图求x 的值,并估计该小区100个家庭的月均用电量(同一组中的数据用该组区间的中点值作代表);(2)从该小区已抽取的100个家庭中, 随机抽取月用电量超过300度的2个家庭,参加电视台举办的环保互动活动,求家庭甲(月用电量超过300度)被选中的概率.25.经营费用指流通企业对在经营过程中发生除经营成本以外的所有费用,如管理费用、财务费用、法律费用等,这些费用没有直接用于生产产品或提供服务,但它是影响公司收益的重要因素.某创业公司从2014年开始创业到2019年每年的经营费用y (万元)、年份及其编号t ,有如下统计资料: 年份 2014 2015 2016 2017 2018 2019 t 1 2 3 4 5 6 y9.512.214.617.419.6m已知该公司从2014年到2019年年平均经营费用为16万元,且经营费用y 与年份编号t 呈线性相关关系.(1)求2019年该公司的经营费用;(2)y 关于t 的回归方程为 2.6y t a =+,求a ,并预测2020年所需要支出的经营费用; (3)该公司对2019年卖出的产品进行质量指标值检测,由检测结果得如图所示频率分布直方图:预计2020年生产产品质量指标值分布与上一年一致,将图表中频率作为总体的概率.当每件产品质量指标值不低于215时为优质品,指标值在185到215之间是合格品,指标值低于185时为次品.出售产品时,每件优质品可获利1.5万元,每件合格品可获利0.7万元,次品不仅全额退款,还要对客户进行赔付,所以每件次品亏损1.3万元.若2020年该公司的产量为500台,请你预测2020年该公司的总利润(总利润=销售利润-经营费用).26.某城市200户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,280,[)280,300分组的频率分布直方图如图:(1)求直方图中x 的值;(2)在月平均用电量为[)220,240,[)240,260,[)260,280的三组用户中,用分层抽样的方法抽取20户居民,则月平均用电量在[)220,240的用户中应抽取多少户? (3)求月平均用电量的中位数和平均数.【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A . 【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.D解析:D 【分析】由题意结合所给的统计图确定选项中的说法是否正确即可. 【详解】对于选项A : 2018年1~4月的业务量,3月最高,2月最低, 差值为439724111986-=,接近2000万件,所以A 是正确的;对于选项B : 2018年1~4月的业务量同比增长率分别为55%,53%,62%,58%,均超过50%,在3月最高,所以B 是正确的;对于选项C :2月份业务量同比增长率为53%,而收入的同比增长率为30%,所以C 是正确的;对于选项D ,1,2,3,4月收入的同比增长率分别为55%,30%,60%,42%,并不是逐月增长,D 错误. 本题选择D 选项. 【点睛】本题主要考查统计图及其应用,新知识的应用等知识,意在考查学生的转化能力和计算求解能力.3.C解析:C 【分析】求得 3.5x y ==,得到样本中心点(3.5,3.5),再把样本中心点代入回归直线方程得解. 【详解】由表可得 3.5x y ==,带入线性回归方程中有 3.50.7 3.5 5.95=+⨯=a , 故选:C . 【点睛】本题考查利用线性相关关系求回归直线方程,属于基础题.4.D解析:D 【解析】试题分析:由表中数据可得 表1:()25262210140.00916362032K ⨯⨯-⨯=≈⨯⨯⨯;表2: ()2524201216 1.76916362032K ⨯⨯-⨯=≈⨯⨯⨯;表3: ()252824128 1.316362032K ⨯⨯-⨯=≈⨯⨯⨯;表4: ()25214302623.4816362032K ⨯⨯-⨯=≈⨯⨯⨯.其中23.48最大,所以阅读量与性别有关联的可能性最大.故D 正确. 考点:独立性检验.5.A解析:A 【解析】由频率分布直方图可知:第一组的频数为20×0.01×5=1个, [0,5)的频数为20×0.01×5=1个, [5,10)的频数为20×0.01×5=1个, [10,15)频数为20×0.04×5=4个, [15,20)频数为20×0.02×5=2个, [20,25)频数为20×0.04×5=4个, [25,30)频数为20×0.03×5=3个,[30,35)频数为20×0.03×5=3个, [35,40]频数为20×0.02×5=2个, 则对应的茎叶图为A , 本题选择A 选项.点睛:茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.6.C解析:C 【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案. 【详解】详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,则15n =,不合题意;若200610n =+,则19.4n =,不合题意; 若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C . 【点睛】本题主要考查系统抽样.7.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】 因为,所以,代入回归直线方程可求得,所以,故选D. 【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.8.B【解析】【分析】根据平均数、方差的概念表示出更正前的平均数、方差和更正后的平均数、方差,比较其异同,然后整体代入即可求解.【详解】设更正前甲,乙,…的成绩依次为a1,a2,…,a50,则a1+a2+…+a50=50×70,即60+90+a3+…+a50=50×70,(a1﹣70)2+(a2﹣70)2+…+(a50﹣70)2=50×75,即102+202+(a3﹣70)2+…+(a50﹣70)2=50×75.更正后平均分为x=150×(80+70+a3+…+a50)=70;方差为s2=150×[(80﹣70)2+(70﹣70)2+(a3﹣70)2+…+(a50﹣70)2]=150×[100+(a3﹣70)2+…+(a50﹣70)2]=150×[100+50×75﹣102﹣202]=67.故选B.【点睛】本题考查平均数与方差的概念与应用问题,是基础题.9.B解析:B【解析】分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果.详解:因为2523.52220.5330333639122,344442x y++++++====,所以1348022,3224ˆb-==-所以19(2)8042y=⨯-+=选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b,写出回归方程,回归直线方程恒过点(,)x y.10.C解析:C【解析】根据系统抽样知,组距为604=15÷,即可根据第一组所求编号,求出各组所抽编号.【详解】学生60名,用系统抽样的方法,抽取一个容量为4的样本,所以组距为604=15÷, 已知03号,18号被抽取,所以应该抽取181533+=号,故选C.【点睛】本题主要考查了抽样,系统抽样,属于中档题.11.A解析:A【分析】由题意知,两个人在试验中发现对变量x 的观测数据的平均值都是s ,对变量y 的观测数据的平均值都是t ,所以两组数据的样本中心点是(s ,t ),回归直线经过样本的中心点,得到直线l 1和l 2都过(s ,t ).【详解】∵两组数据变量x 的观测值的平均值都是s ,对变量y 的观测值的平均值都是t ,∴两组数据的样本中心点都是(s ,t )∵数据的样本中心点一定在线性回归直线上,∴回归直线l 1和l 2都过点(s ,t )∴两条直线有公共点(s ,t )故选A .【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与Y 之间的关系,这条直线过样本中心点.12.C解析:C【分析】 首先求得x 的值,然后利用线性回归方程过样本中心点的性质求解12345y y y y y ++++的值即可.【详解】 由题意可得:12345305x x x x x x ++++==, 线性回归方程过样本中心点,则:0.6754.975y x =⨯+=, 据此可知:12345y y y y y ++++5375y ==.本题选择C 选项.【点睛】本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.18【分析】根据频率小矩形的面积小矩形的高组距底部求出周长大于110的频率再根据频数样本容量频率求出对应的频数【详解】由频率分布直方图知:底部周长大于110的频率为所以底部周长大于110的频数为(株解析:18【分析】根据频率=小矩形的面积=小矩形的高⨯组距底部,求出周长大于110cm的频率,再根据频数=样本容量⨯频率求出对应的频数.【详解】由频率分布直方图知:+⨯=,底部周长大于110cm的频率为(0.0200.010)100.3⨯=(株),所以底部周长大于110cm的频数为600.318故答案是:18.【点睛】该题考查的是有关频率分布直方图的应用,在解题的过程中,注意小矩形的面积表示的是对应范围内的频率,属于简单题目.14.①②④【分析】根据两个变量线性相关的概念及性质逐项判定即可求解【详解】由题意根据回归直线方程的特征可得线性回归直线方程一定过样本中心所以①正确;根据残差的概念可得残差平方和越小的模型拟合效果越好所以解析:①②④【分析】根据两个变量线性相关的概念及性质,逐项判定,即可求解.【详解】由题意,根据回归直线方程的特征,可得线性回归直线方程一定过样本中心,所以①正确;根据残差的概念,可得残差平方和越小的模型,拟合效果越好,所以②正确;根据相关指数的概念,可得2R越大说明拟合效果越好,所以③不正确;r=-,则变量y和x之间负相关,且线性相关性若变量y和x之间的相关系数为0.946强,所以④正确;故答案为:①②④.【点睛】本题主要考查了两个变量的线性相关性的概念与判定,其中解答中熟记线性相关的基本概念和结论是解答的关键,属于基础题.15.5000【分析】由题意其他年级抽取200人其他年级共有学生2000人根据题意列出等式即可求出该校学生总人数【详解】由题意其他年级抽取200人其他年级共有学生2000人则该校学生总人数为人故答案是:5解析:5000【分析】由题意,其他年级抽取200人,其他年级共有学生2000人,根据题意列出等式,即可求出该校学生总人数.【详解】由题意,其他年级抽取200人,其他年级共有学生2000人, 则该校学生总人数为20005005000200⨯=人, 故答案是:5000.【点睛】该题考查的是有关分层抽样的问题,涉及到的知识点有分层抽样要求每个个体被抽到的概率是相等的,属于简单题目. 16.【解析】分析:根据方差与均值的关系求解即可详解:剔除最高分和最低分后的则原始平均分 原始原始方差即原始方差为88点睛:本题考查方差与均值的关系属基础题解析:88【解析】分析:根据方差与均值的关系()()()22D x E x E x ⎡⎤=-⎣⎦ 求解即可.详解:剔除最高分和最低分后的 222()()()92168480,E x E x D x =+=+=22()8480(152)110240,x E x n ∑=⨯=⨯-=则原始平均分()921?3? 96? 589015E x ;⨯++== 原始 22229658()8188,15x E x ∑++== 原始方差 222()?()?()81889088.D x E X E X =-=-=原始原始 即原始方差为 88 .点睛:本题考查方差与均值的关系,属基础题.17.2【解析】分析:直接利用回归方程将代入即可求得的估计值详解:∵回归方程为∴当时的估计值为故答案为82点睛:本题考查回归方程的运用考查学生的计算能力属于基础题解析:2【解析】分析:直接利用回归方程,将25x =代入,即可求得y 的估计值.详解:∵回归方程为0.4 1.8y x =-,∴当25x =时,y 的估计值为 0.425 1.88.2y =⨯-=.故答案为8.2.点睛:本题考查回归方程的运用,考查学生的计算能力,属于基础题.18.【解析】分析:先根据平均数求x 的值再求数据的方差详解:由题得所以数据的方差为故答案为点睛:(1)本题主要考查平均数和方差的计算意在考查学生对这些基础知识的掌握水平(2)方差公式为 解析:45 【解析】 分析:先根据平均数求x 的值,再求数据的方差.详解:由题得8+9+8109,10.5x x ++=∴= 所以数据的方差为22222214[(89)(99)(109)(109)(89)]55S =-+-+-+-+-=.故答案为45. 点睛:(1)本题主要考查平均数和方差的计算,意在考查学生对这些基础知识的掌握水平.(2) 方差公式为222121[()()()]n S x x x x x x n =-+-+⋅⋅⋅+-. 19.35【解析】79+78+80+80+x+85+92+967=85解得x=5根据中位数为83可知y=3故yx=35解析:【解析】,解得,根据中位数为,可知,故.20.5【解析】将样本中心代入回归方程得到m=55故答案为:55解析:5【解析】19.5,15,5m y x +== 将样本中心代入回归方程得到m=5.5. 故答案为:5.5. 三、解答题21.(1)见解析;(2)中位数29.2,众数32.5;(3)平均花费3720元.【分析】(1)由频数分布表能补全该市1000名跑步爱好者周跑量的频率分布直方图. (2)由频率分布直方图能求出样本的中位数.(3)分别求出休闲跑者、核心跑者、精英跑者的人数,由此能估计该市每位跑步爱好者购买装备平均需要花费多少钱.【详解】(1)补全该市1000名跑步爱好者周跑量的频率分布直方图,如下:(2)中位数的估计值:由50.0250.02450.0260.350.5⨯+⨯+⨯=<,0.3550.0360.530.5+⨯=>, 所以中位数位于区间[)25,30中,设中位数为x ,则()0.35250.0360.5x +-⨯=,解得29.2x ≈.即样本中位数是29.2.因为样本中频率最高的一组为[30,35),所以样本的众数为32.5.(3)依题意可知,休闲跑者共有()50.0250.024*******⨯+⨯⨯=人,核心跑者()50.02650.03650.04450.0301000680⨯+⨯+⨯+⨯⨯=人,精英跑者1000220680100--=人, 所以该市每位跑步爱好者购买装备,平均需要22025006804000100450037201000⨯+⨯+⨯=元. 即该市每位跑步爱好者购买装备,平均需要3720元.【点睛】本题考查频率分布直方图的作法,考查样本的中位数、平均数的求法,考查运算求解能力,是基础题.22.(1)37;(2)(ⅰ)35;(ⅱ)1760.(1)用每组数据中间点值乘以频率相加即得;(2)(i )年龄在[50,70)的人有6人,其中年龄在[50,60)的有4人,6人分别编号后用列举法写出任选2人的所有基本事件,同时得出至少有1人年龄不低于60岁的基本事件,计数后可得概率;(ⅱ)求出18岁以上的居民所占频率即可得.【详解】解:(1)平均数()150.15250.2350.3450.15550.165750.0537x =⨯+⨯+⨯+⨯+⨯++⨯=.(2)(ⅰ)样本中,年龄在[50,70)的人共有40×0.15=6人,其中年龄在[50,60)的有4人,设为a ,b ,c ,d ,年龄在[60,70)的有2人,设为x ,y .则从中任选2人共有如下15个基本事件:(a ,b ),(a ,c ),(a ,d ),(a ,x ),(a ,y ),(b ,c ),(b ,d ),(b ,x ),(b ,y ),(c ,d ),(c ,x ),(c ,y ),(d ,x ),(d ,y ),(x ,y ).至少有1人年龄不低于60岁的共有如下9个基本事件:(a ,x ),(a ,y ),(b ,x ),(b ,y ),(c ,x ),(c ,y ),(d ,x ),(d ,y ),(x ,y ).记“这2人中至少有1人年龄不低于60岁”为事件A ,故所求概率()93155P A ==. (ⅱ)样本中年龄在18岁以上的居民所占频率为1-(18-10)×0.015=0.88, 故可以估计,该小区年龄不超过80岁的成年人人数约为2000×0.88=1760.【点睛】本题考查频率分布直方图,考查古典概型,考查频率分布直方图的应用,考查了学生的数据处理能力,运算求解能力,属于中档题.23.(1)7325y x =-(2)129.4 【解析】试题分析:(1)观察散点图可知各点大致分布在一条直线附近,得到这组数据符合线性相关,求出利用最小二乘法所需要的数据,做出线性回归方程的系数,得到方程;(2)把x=9代入线性回归方程,估计出当广告费为9万元时,销售收入约为129.4万元 试题(1)52x =,692y =,所以735b = 2a y bx =-=-故y 对x 的回归直线方程为7325y x =- (2)当9x =时,129.4y =,故若广告费为9万元,则销售收入为129.4万元 考点:回归方程24.(1)x=0.0044, 月均用电量约为186度;(2).(1)由题意得, .设该小区100个家庭的月均用电量为S 则9+22.5+52.5+49.5+33+19.5=186.(2),所以用电量超过300度的家庭共有6个.分别令为甲、A 、B 、C 、D 、E ,则从中任取两个,有(甲,A )、(甲,B )、(甲,C )、(甲,D )、(甲,E )、(A,B )、(A,C )、(A,D )、(A,E )、(B,C )、(B,D )、(B,E )、(C,D )、(C,E )、(D,E )15种等可能的基本事件,其中甲被选中的基本事件有(甲,A )、(甲,B )、(甲,C )、(甲,D )、(甲,E )5种. 家庭甲被选中的概率. 25.(1)22.7万元;(2)6.9;25.1万元;(3)254.9万元.【分析】(1)根据均值定义列式计算;(2)求出t ,代入方程可得a ,令7t =代入可得估计值;(3)由频率分布直方图是三种产品的概率,得三种产品的件数,根据各产品赢利可计算出总赢利,注意减去(2)中估计的经营费用.【详解】(1)9.512.214.617.419.6166m y +++++==. 解得22.7m =,即2019年该公司的经营费用为22.7万元.(2) 3.5t =,16y =,所以 2.6 6.9a y t =-=,取7t =,代入得25.1y =,预测2020年所需要支出的经营费用为25.1万元. (3)由图可得生产优质品的概率是0.1,生产合格品的概率是0.79,生产次品的概率是0.11,则预测该公司2020年的总利润为1.50.15000.70.79500 1.30.1150025.1254.9⨯⨯+⨯⨯-⨯⨯-=(万元).【点睛】本题考查线性回归方程及其应用,考查频率分布直方图及其期望,考查学生的数据处理能力,运算求解能力,属于中档题.26.(1)0.0075;(2)10户;(3)224a =,225.6x =.【分析】(1)由频率和为1列出方程求解x ;(2)求出三组用户的月平均用电量的频率推出比例关系,用20乘以月平均用电量在[)220,240的用户所占比例即可得解;(3)根据中位数左边和右边的直方图面积相等列出等式估计中位数,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(1)由直方图的性质可得()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=,解得0.0075x =,所以直方图中x 的值是0.0075.(2)因为月平均用电量为[)220,240,[)240,260,[)260,280的三组用户的频率分别为0.25、0.15、0.1,所以这三组用户的月平均用电量比例为5:3:2,所以月平均用电量在[)220,240的用户中应抽取5201010⨯=(户). (3)因为()0.0020.00950.011200.450.5++⨯=<,所以月平均用电量的中位数在[)220,240内,设中位数为a ,则()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=,解得224a =.平均数 1700.041900.192100.222300.252500.152700.12900.05x =⨯+⨯+⨯+⨯+⨯+⨯+⨯ 225.6=,所以月平均用电量的中位数为224,平均数为225.6.【点睛】本题考查统计案例、分层抽样、根据频率分布直方图估计总体的数字特征,属于中档题.。
新教材高中数学章末综合检测三成对数据的统计分析新人教A版选择性必修第三册

章末综合检测(三) 成对数据的统计分析A 卷——基本知能盘查卷一、单项选择题1.可用来分析身高与体重有关系的是( ) A .残差分析 B .线性回归模型 C .等高堆积条形图D .独立检验解析:选B 因为身高与体重是两个具有相关关系的变量,所以要用线性回归模型来解决.2.两个变量y 与x 的经验回归模型中,分别选择了四个不同模型来拟合y 与x 之间的关系,它们的相关指数R 2如下,其中拟合效果最好的模型是( )A .模型1 C .模型3D .模型4解析:选A 两个变量y 与x 的经验回归模型中,它们的相关指数R 2越接近于1,这个模型的拟合效果越好,所给出的四个选项中0.98是相关指数最大的值,所以拟合效果最好的模型是模型1.3.已知一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )满足y i =a +bx i +e i (i =1,2,…,n ),若e i 恒为0,则R 2=( )A .0B .0.5C .0.9D .1选D4.如果有95%的把握说事件A 和B 有关系,那么具体计算出的数据为( ) A .χ2>3.841 B .χ2<3.841 C .χ2>6.635D .χ2<6.635解析:选A 由独立性判断的方法可知,如果有95%的把握,即小概率值α=0.05,则χ2>3.841.5.观察两个变量(存在线性相关关系)得如下数据:A.y ^=12x +1B.y ^=xC.y ^=2x +13D.y ^=x +1解析:选 B 根据表中数据得x -=18×(-10-6.99-5.01-2.98+3.98+5+7.99+8.01)=0,y -=18×(-9-7-5-3+4.01+4.99+7+8)=0,所以两变量x ,y 的经验回归方程过样本点的中心(0,0),可以排除A 、C 、D 选项,故选B.6.2020年初,新型冠状病毒(COVID 19)引起的肺炎疫情爆发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如下表所示:周数(x ) 1 2 3 4 5 治愈人数(y )2173693142由表格可得y 关于x 的二次回归方程为y ^=6x 2+a ,则此回归模型第4周的残差(实际值与预报值之差)为( )A .5B .4C .1D .0解析:选A 设t =x 2,则t -=15(1+4+9+16+25)=11,y -=15(2+17+36+93+142)=58,a =58-6×11=-8,所以y ^=6x 2-8.令x =4,得e 4=y 4-y ^4=93-6×42+8=5.7.通过随机询问100名性别不同的高二学生是否爱吃零食,得到如下的列联表:喜爱程度 性别合计 男(Y =0) 女(Y =1) 爱好(X =0) 10 40 50 不爱好(X =1)20 30 50 合计3070100参考数据及公式:P (χ2≥x α)0.10 0.05 0.01 x α2.7063.8416.635其中χ2=n ad -bc 2a +bc +d a +cb +d,n =a +b +c +d .则下列结论正确的是( )A .根据小概率值α=0.05的独立性检验,认为爱吃零食与性别有关B .根据小概率值α=0.05的独立性检验,认为爱吃零食与性别无关C .根据小概率值α=0.01的独立性检验,认为爱吃零食与性别有关D .根据小概率值α=0.1的独立性检验,认为爱吃零食与性别无关 解析:选A 零假设为H 0:是否爱吃零食与性别相互独立,即是否爱吃零食与性别无关.根据列联表中的数据,经计算得到 χ2=100×10×30-40×20250×50×30×70≈4.762>3.841=x 0.05,所以依据小概率值α=0.05的独立性检验,推断H 0不成立,即认为是否爱吃零食与性别有关.同理可得,根据小概率值α=0.01的独立性检验,认为爱吃零食与性别无关;根据小概率值α=0.1的独立性检验,认为爱吃零食与性别有关.8.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为y ^=0.66x +1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )A .83%B .72%C .67%D .66%解析:选A 将y ^=7.675代入回归方程,可计算得x ≈9.262,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.262≈0.83,即约为83%.二、多项选择题9.下列说法正确的是( )A .自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在线性经验回归模型中,相关系数r 的值越大,变量间的相关性越强C .在残差图中,残差点分布的水平带状区域的宽度越狭窄,其模型拟合的精度越高D .在经验回归模型中,R 2为0.98的模型比R 2为0.80的模型拟合的效果好解析:选ACD 由于线性相关系数|r |≤1,且当|r |越大,线性相关性越强,故r <0时,选项B 不正确,A 、C 、D 均正确.10.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,则下列结论正确的是( )A .y 与x 负相关且y ^=2.347x -6.423 B .y 与x 负相关且y ^=-3.476x +5.648 C .y 与x 正相关且y ^=5.437x +8.493 D .y 与x 正相关且y ^=-4.326x -4.578解析:选BC 正相关指的是y 随x 的增大而增大,负相关指的是y 随x 的增大而减小,故正确的为B 、C.11.以下关于线性经验回归的判断中,正确的选项为( )A .若散点图中所有点都在一条直线附近,则这条直线为经验回归直线B .散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的A ,B ,C 点C .已知线性经验回归方程为y ^=0.50x -0.81,则x =25时,y 的估计值为11.69 D .线性经验回归方程的意义是它反映了样本整体的变化趋势解析:选BCD 能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数a ^,b ^得到的直线y ^=b ^x +a ^才是回归直线,所以A 错误;B 正确;将x =25代入y ^=0.50x -0.81,得y ^=11.69,所以C 正确;D 正确.12.有两个分类变量X 与Y ,其2×2列联表如下表所示:X Y 合计 Y =0 Y =1X =0 a20-a 20 X =115-a 30+a 45 合计155065其中a,15-a 均为大于5的整数,根据小概率值α=0.05的独立性检验,认为X 与Y 之间有关,则a 等于( )A .7B .8C .9D .6解析:选BC 根据小概率值α=0.05的独立性检验,认为X 与Y 之间有关,需要χ2的值大于或等于3.841,由χ2=65×[a 30+a -20-a15-a ]220×45×15×50=1313a -6025 400≥3.841,解得a ≥7.69或a ≤1.54.而a >5且15-a >5,a ∈Z , 所以a =8或a =9. 三、填空题13.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:吸烟量年龄合计不超过40岁 (Y =0)超过40岁 (Y =1) 不多于20支/天(X =0) 50 1565多于20支/天 (X =1) 10 25 35 合计6040100则χ2=________(保留到小数点后两位有效数字). 解析:由列联表知χ2=100×10×15-50×25260×40×65×35≈22.16.答案:22.1614.某高校“统计初步”课程的教师随机调查了选该课程的一些学生情况,具体数据如下表:性别专业非统计专业 (Y =0)统计专业 (Y =1) 男(X =0) 13 10 女(X =1)720为了判断主修统计专业是否与性别有关系,根据表中数据,得到χ2=50×13×20-10×7223×27×20×30≈4.844>3.841,所以能根据小概率值α=________,我们断定主修统计专业与性别有关系.解析:因为P (χ2≥3.841)=0.05,所以小概率值α=0.05. 答案:0.0515.下表是降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对应数据,根据表中提供的数据,求出y 关于x 的线性经验回归方程y ^=0.7x +0.35,那么表中m 的值为________.x3 4 5 6y2.5 m 4 4.5解析:根据所给的表格可以求出x -=3+4+5+64=4.5,y -=2.5+m +4+4.54=11+m 4,因为这组数据的样本点的中心在线性经验回归直线上, 所以11+m4=0.7×4.5+0.35,所以m =3.答案:3 四、解答题16.(12分)为做好2022年北京冬季奥运会的宣传工作,组委会计划从某大学选取若干名大学生志愿者,某记者在该大学随机调查了1 000名大学生,以了解他们是否愿意做志愿者工作,得到的数据如表所示:性别 是否愿意做志愿者 合计 愿意(Y =0)不愿意(Y =1)男(X =0)610 女(X =1)90 合计800(1)根据题意完成表格.(2)依据小概率值α=0.05的独立性检验,分析愿意做志愿者工作与性别是否有关? 参考公式及数据:χ2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d .P (χ2≥x α)0.10 0.05 0.01 x α2.7063.8416.635解:(1)性别 是否愿意做志愿者 合计 愿意(Y =0)不愿意(Y =1)男(X =0) 500 110 610 女(X =1) 300 90 390 合计8002001 000(2)零假设为H 0:愿意做志愿者工作与性别是相互独立,即愿意做志愿者工作与性别是无关的.根据列联表中的数据,经计算得到 χ2=1 000×500×90-110×3002610×390×800×200=3 000793≈3.783<3.841=x 0.05, 所以依据小概率值α=0.05的独立性检验,没有充分证据推断H 0不成立,即愿意做志愿者工作与性别是无关的.17.(12分)自从高中生通过高校自主招生可获得加分进入高校的政策出台后,自主招生越来越受到高中生家长的重视.某机构为了调查A 城市和B 城市的高中家长对于自主招生的关注程度,在这两个城市中抽取了100名高中生家长进行了调查,得到下表:城市高中家长是否关注合计关注(Y =0)不关注(Y =1)A 城高中家长(X =0)2050B 城高中家长(X =1) 20 合计100(1)完成上面的列联表;(2)根据上面列联表的数据,能否根据小概率值α=0.05的独立性检验,判断家长对自主招生关注与否与所处城市有关系;(3)为了进一步研究家长对自主招生的看法,该机构从关注的学生家长里面,按照分层随机抽样方法抽取了5人,并再从这5人里面抽取2人进行采访,求所抽取的2人恰好A ,B 两城市各一人的概率.参考公式:χ2=n ad -bc 2a +bc +d a +cb +d(其中n =a +b +c +d ).附表:P (χ2≥x α)0.10 0.05 0.010 x α2.7063.8416.635解:(1)列联表如下: 城市高中家长是否关注合计关注(Y =0) 不关注(Y =1)A 城高中家长(X =0)203050B 城高中家长(X =1) 30 20 50 合计 5050100(2)零假设为H 0:家长对自主招生关注与否与所处城市相互独立,即家长对自主招生关注与否与所处城市无关.根据列联表中的数据,经计算得到 χ2=100×20×20-30×30250×50×50×50=4>3.841.所以根据小概率值α=0.05的独立性检验,我们推断H 0不成立,即认为家长对自主招生的关注与否与所处城市是有关的.(3)关注的人共有50人,按照分层随机抽样的方法,A 城市2人,B 城市3人,从5人中抽取2人有C 25=10种不同的方法,A ,B 两城市各取一人有C 12C 13=2×3=6种不同的方法,故所抽取的2人恰好A ,B 两城市各一人的概率为C 13C 12C 25=610=0.6.B 卷——高考能力达标卷一、单项选择题1.下列属于相关关系的是( ) A .利息与利率 B .居民收入与储蓄存款 C .电视机产量与苹果产量 D .某种商品的销售额与销售价格解析:选B A 与D 是函数关系,C 中两变量没有关系,B 中居民收入与储蓄存款是相关的,但不具有函数关系.2.已知一个经验回归方程为y ^=1.5x +45,其中x 的取值依次为1,7,5,13,19,则y -=( )A .58.5B .46.5C .60D .75解析:选A x -=1+7+5+13+195=9,因为经验回归直线必过样本点的中心(x -,y -), 所以y -=1.5×9+45=13.5+45=58.5.3.已知每一吨铸铁成本y (元)与铸件废品率x %建立的经验回归方程y ^=56+8x ,则下列说法正确的是( )A .废品率每增加1%,成本每吨增加64元B .废品率每增加1%,成本每吨增加8%C .废品率每增加1%,成本每吨增加8元D .如果废品率增加1%,则每吨成本为56元解析:选C 根据经验回归方程知y 是关于x 的单调增函数,并且由系数知x 每增加一个单位,y 平均增加8个单位.4.某商品销售量y (件)与销售价格x (元/件)负相关,则其经验回归方程可能是( ) A .y =-10x +200 B .y =10x +200 C .y =-10x -200D .y =10x -200解析:选A 由于销售量y 与销售价格x 成负相关,故排除B 、D.又当x =10时,A 中y =100,而C 中y =-300,C 不符合题意.5.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的经验回归方程为y ^=0.85x -85.71,则下列说法错误的是( )A .y 与x 具有正的线性相关关系B .经验回归直线过样本点的中心C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg解析:选D 选项中,若该大学某女生身高为170 cm ,则可断定其体重约为0.85×170-85.71=58.79(kg).故D 选项错误.6.如图所示的是调查某地区男、女中学生喜欢理科的等高堆积条形图,阴影部分表示喜欢理科的百分比,从图中可以看出( )A .性别与喜欢理科无关B .女生中喜欢理科的比例约为80%C .男生比女生喜欢理科的可能性大些D .男生中不喜欢理科的比例约为60%解析:选C 由题图可知女生中喜欢理科的比例约为20%,男生中喜欢理科的比例约为60%,因此男生比女生喜欢理科的可能性大些.7.如图,5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )A .相关系数r 变大B .残差平方和变大C .相关指数R 2变大D .解释变量x 与预报变量y 的相关性变强解析:选B 由散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小.8.为考察数学成绩与物理成绩的关系,某老师在高二随机抽取了300名学生,得到下面的列联表:物理成绩数学成绩合计85~100分 (Y =0)85分以下 (Y =1) 85~100分(X =0) 37 85 122 85分以下(X =1)35 143 178 合计72228300 根据表中数据,分析数学成绩与物理成绩有关联的出错率不超过( ) A .0.5% B .1% C .0.1%D .5%解析:选D 由表中数据代入公式得 χ2=300×37×143-85×352122×178×72×228≈4.514>3.841=x 0.05,所以判断的出错率不超过5%. 二、多项选择题9.给出下列实际问题,其中用独立性检验可以解决的问题有( ) A .一种药物对某种病的治愈率 B .两种药物治疗同一种病是否有区别 C .吸烟得肺病的概率 D .吸烟与性别是否有关系答案:BD10.对于经验回归方程y ^=b ^x +a ^,下列说法正确的是( ) A .直线必经过点(x -,y -)B .x 增加1个单位时,y 平均增加b ^个单位 C .样本数据中x =0时,可能有y =a ^D .样本数据中x =0时,一定有y =a ^解析:选ABC 经验回归方程是根据样本数据得到的一个近似曲线,故由它得到的值也是一个近似值.11.下列说法中正确的有( ) A .若r >0,则x 增大时,y 也相应增大 B .若r <0,则x 增大时,y 也相应增大C .若r =1或r =-1,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上D .|r |越接近1,相关关系越强解析:选ACD 若r >0,表示两个相关变量正相关,x 增大时,y 也相应增大,故A 正确.r <0,表示两个变量负相关,x 增大时,y 相应减小,故B 错误.|r |越接近1,表示两个变量相关性越高,|r |=1表示两个变量有确定的关系(即函数关系),故C 正确,D 正确.12.根据如下样本数据:得到的经验回归方程为y =b x +a ,则( ) A.a ^>0 B.a ^<0 C.b ^>0D.b ^<0解析:选AD 根据题意,画出散点图(图略).根据散点图,知两个变量为负相关,且经验回归直线与y 轴的交点在y 轴正半轴,所以a ^>0,b ^<0.三、填空题13.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y 对总成绩x 的回归直线方程为y ^=6+0.4x .由此可以估计:若两名同学的总成绩相差50分,则他们的数学成绩大约相差________分.解析:令两人的总成绩分别为x 1,x 2.则对应的数学成绩估计为y ^1=6+0.4x 1,y ^2=6+0.4x 2,所以|y ^1-y ^2|=|0.4(x 1-x 2)|=0.4×50=20. 答案:2014.为了判断高三年级学生选修文科是否与性别有关,现随机抽取70名学生,得到如图所示2×2列联表:已知P (≈4.667,则在犯错误的概率不大于________的前提下认为选修文科与性别有关.解析:由题意知, χ2≈4.667,因为6.635>4.667>3.841,所以在犯错误的概率不大于0.05的前提下认为选修文科与性别有关.答案:0.0515.已知x ,y 之间的一组数据如下表,对于表中数据,甲、乙两同学给出的拟合直线分别为l 1:y =13x +1与l 2:y =12x +12,利用最小二乘法判断拟合程度更好的直线是______________.解析:用y =13x +1作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 1=⎝⎛⎭⎪⎫1-432+(2-2)2+(3-3)2+⎝⎛⎭⎪⎫4-1032+⎝⎛⎭⎪⎫5-1132=73.用y =12x +12作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 2=(1-1)2+(2-2)2+⎝⎛⎭⎪⎫3-722+(4-4)2+⎝⎛⎭⎪⎫5-922=12. 因为S 2<S 1,故用直线l 2:y =12x +12拟合程度更好.答案:y =12x +12四、解答题16.(12分)微信是现代生活进行信息交流的重要工具,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余的员工每天使用微信的时间在一小时以上.若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,则使用微信的人中75%是青年人.如果规定每天使用微信时间在一小时以上为经常使用微信,那么经常使用微信的员工中,中年人有40人.(1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,请完成下面的2×2列联表;使用微信 年龄合计青年人(Y =0)中年人(Y =1)经常使用微信 (X =0)不经常使用微信(X =1) 合 计(2)根据列联表中的数据,依据小概率值α=0.001的独立性检验分析该公司经常使用微信的员工与年龄的关系.解:(1)由已知可得,该公司员工中使用微信的有200×90%=180(人). 经常使用微信的有180-60=120(人), 使用微信的人中青年人有180×75%=135(人), 故2×2列联表如下:使用微信 年龄合计青年人(Y =0)中年人(Y =1)经常使用微信 (X =0) 8040120不经常使用微信(X =1) 55 5 60 合 计 13545180(2)零假设为H 0:该公司经常使用微信的员工与年龄相互独立,即该公司经常使用微信的员工与年龄无关.将列联表中的数据代入公式可得, χ2=180×80×5-40×552135×45×120×60≈13.333>10.828=x 0.001,所以根据小概率值α=0.001的独立性检验,我们推断H 0不成立,即认为该公司经常使用微信的员工与年龄有关.17.(12分)淘宝网卖家在某商品的所有买家中,随机选择男女买家各50位进行调查,他们的评分等级如下:评分等级 [0,1] (1,2] (2,3] (3,4] (4,5] 女/人 2 7 9 20 12 男/人 3918128(1)从评分等级为(4,5]的人中随机选取2人,求恰有1人是男性的概率;(2)规定:评分等级在[0,3]为不满意该商品,在(3,5]为满意该商品.完成下面列联表,并根据小概率值α=0.05的独立性检验,分析性别与对商品满意度是否有关.性别评分等级合计满意该商品 (Y =0)不满意该商品(Y =1)女(X =0) 男(X =1) 合计解:(1)因为从评分等级(4,5]的20人中随机选取2人,共有C 220=190种选法,其中恰有1人为男性的共有C 112C 18=96种选法,所以所求概率P =96190=4895.(2)列联表如下:性别评分等级合计满意该商品 (Y =0)不满意该商品(Y =1) 女(X =0) 32 18 50 男(X =1) 20 30 50 合计5248100 零假设为H 0:性别与对商品满意度相互独立,即性别与对商品满意度无关.由公式得χ2=100×32×30-20×18250×50×52×48≈5.769>3.841=x 0.05,所以根据小概率值α=0.05的独立性检验,我们推断H 0不成立,即可以认为性别与对商品满意度有关.。
必修3第6章统计(含单元测试)参考答案

实用文档必修3 第6章 统计 参考答案6.1.1 简单随机抽样1.C 2.C 3.A 4.抽签法,随机数表法,向上、向下、向左、向右5.21 6.60,30 7.相等,Nn 8.略 9.(1)不是简单随机抽样,由于被抽取样本的总体的个数是无限的而不是有限的。
(2)不是简单随机抽样,由于它是放回抽样10.选法二不是抽签法,因为抽签法要求所有的签编号互不相同,而选法二中39个白球无法相互区分。
这两种选法相同之处在于每名学生被选中的概率都相等,等于401。
6.1.2 系统抽样1.A 2.B 3.B 4.B 5.A 、B 、D 6. 200450 7.(一)简单随机抽样(1) 将每一个人编一个号由0001至1003;(2) 制作大小相同的号签并写上号码;(3) 放入一个大容器,均匀搅拌;(4)依次抽取10个号签具有这十个编号的人组成一个样本。
(二)系统抽样(1)将每一个人编一个号由0001至1003;(2)选用随机数表法找3个号,将这3个人排除;(3)重新编号0001至1000;(4)在编号为0001至0100中用简单随机抽样法抽得一个号L;(5)按编号将:L,100+L,…,900+L共10个号选出。
这10个号所对应的人组成样本。
8.系统抽样适用于总体中的个体数较多的情况;系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段进行抽样时,采用的是简单随机抽样;与简单随机抽样相同的是,系统抽样也属于等可能抽样。
9.是用系统抽样的方法确定的三等奖号码的,共有100个。
10.略(参考第7小题)6.1.3 分层抽样实用文档Nm1.B 2.B 3.104 4.n5.70,80 6.系统抽样,100个7.总体中的个体个数较多,差异不明显;总体由差异明显的几部分组成中年:200人;青年:120人;老年:80人8.分层抽样,简单随机抽样9.因为总体共有彩电3000台,数量较大,所以不宜采用简单随机抽样,又由于三种彩电的进货数量差异较大,故也不宜用系统方法,而以分层抽样为妥。
高中数学单元训练3统计三含解析北师大版必修3

A.B.C.D.hmhmmhm,hA.B.C.D.200h,1000〔a,b90km/hB.200A.100 C.300 D.390^XiK.III.Xn : h, 'y1.y2JH.ym' k,A.B.C.2nh mkm nnk mhm n高中数学m n5、为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查 ,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异 ,而男女生视力情况差异不大•在下面的抽样方法中,最合理的抽样方法是( )A.简单的随机抽样 B.按性别分层抽样 C.按学段分层抽样D.系统抽样6、现从100件产品中随机抽出10件进行质量检测,下列说法中正确的是( )A.100件产品是总体B.10件产品是样本C.样本容量为100D.样本容量为107、下列抽样方式是简单随机抽样的是( )A.某工厂从老年、中年、青年职工中按 2:5:3的比例选取职工代表B. 某班45名同学,指定个子高的5名同学参加学校组织的某项活动C. 齐鲁福利彩票用摇奖机摇奖D. 规定凡买到的明信片的最后四位号码是“ 6637”的人获得三等奖 8、某学校随机抽取 20个班,调查各班中有网上购物经历的人数 示。
以组距为 5将数据分组成[0,5),[5,10),…,[30,35),[35,40] 图是()答案1. C解析:b -a 是组距,在频率分布直方图中,(频率/组距)是表示该组的小矩形的高 h ,所以,所得数据的茎叶图如图所时,所作的频率分布直方b「a, C.3. D90km / h(0.03+0.009『10 = 0.39, 0.39X000=390 ( ), D.4. Bnh mk,nh mk n m5.C6.D5100510100, 10, D.7.CC.8.A20, 5高中数学频率方法二:由茎叶图知落在区间[0,5)与[5,10)上的频数相等,故频率、违P也分别相等。
必修3第6章统计(含单元测试)参考答案

必修3 第6章 统计 参考答案6.1.1 简单随机抽样1.C 2.C 3.A 4.抽签法,随机数表法,向上、向下、向左、向右5.21 6.60,30 7.相等,Nn 8.略 9.(1)不是简单随机抽样,由于被抽取样本的总体的个数是无限的而不是有限的。
(2)不是简单随机抽样,由于它是放回抽样10.选法二不是抽签法,因为抽签法要求所有的签编号互不相同,而选法二中39个白球无法相互区分。
这两种选法相同之处在于每名学生被选中的概率都相等,等于401。
6.1.2 系统抽样1.A 2.B 3.B 4.B 5.A 、B 、D 6.200450 7.(一)简单随机抽样(1) 将每一个人编一个号由0001至1003;(2) 制作大小相同的号签并写上号码;(3) 放入一个大容器,均匀搅拌;(4) 依次抽取10个号签具有这十个编号的人组成一个样本。
(二)系统抽样(1) 将每一个人编一个号由0001至1003;(2) 选用随机数表法找3个号,将这3个人排除;(3) 重新编号0001至1000;(4) 在编号为0001至0100中用简单随机抽样法抽得一个号L ;(5) 按编号将:L ,100+L ,…,900+L 共10个号选出。
这10个号所对应的人组成样本。
8.系统抽样适用于总体中的个体数较多的情况;系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段进行抽样时,采用的是简单随机抽样;与简单随机抽样相同的是,系统抽样也属于等可能抽样。
9.是用系统抽样的方法确定的三等奖号码的,共有100个。
10.略(参考第7小题)6.1.3 分层抽样1.B 2.B 3.104 4.nNm 5.70,80 6.系统抽样,100个7.总体中的个体个数较多,差异不明显;总体由差异明显的几部分组成中年:200人;青年:120人;老年:80人8.分层抽样,简单随机抽样9.因为总体共有彩电3000台,数量较大,所以不宜采用简单随机抽样,又由于三种彩电的进货数量差异较大,故也不宜用系统方法,而以分层抽样为妥。
(好题)高中数学必修三第一章《统计》检测(答案解析)(3)

一、选择题1.某商场为了了解毛衣的月销售量y(件)与月平均气温x(C︒)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:︒171382月平均气温x C月销售量y(件)24334055由表中数据算出线性回归方程y bx a=+中的2b=-,气象部门预测下个月的平均气温为6C︒,据此估计该商场下个月毛衣销售量约为()A.58件B.40件C.38件D.46件2.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如下图),已知从左到右各长方形高的比为2:3:5:6:3:1,则该班学生数学成绩在(80,100)之间的学生人数是()A.32 B.27 C.24 D.333.为了解一片经济树林的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出样本的频率分布直方图如图所示.那么在这100株树木中,底部周长小于110cm的株数n是()A .30B .60C .70D .804.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,85.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+6.在一个容量为5的样本中,数据均为整数,已测出其平均数为8,但墨水污损了后面两个数据,其中一个数据的十位数字1未污损,即5,7,8, ,那么这组数据的方差2s 可能的最大值是( ) A .185B .18C .36D .67.有一个容量为200的样本,样本数据分组为[50,70),[70,90),[90,110),[110,130),[130,150),其频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在区间[90,110)内的频数为( )A .48B .60C .64D .728.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生B .200号学生C .616号学生D .815号学生9.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.910.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数( )A .40B .45C .48D .5011.已知一组数据12,,,n x x x 的平均数3x =,则数据1232,32,,32n x x x +++的平均数为( ) A .3B .5C .9D .1112.下列说法:①设有一个回归方程35y x =-,变量x 增加一个单位时,y 平均增加5个单位;②线性回归直线ˆybx a =+必过必过点(),x y ;③在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病;其中错误的个数是( ) A .0B .1C .2D .3二、填空题13.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也.”,清代·段玉裁《说文解字注》:“三十年为一世.按父子相继曰世”.“一世”又叫“一代”,到了唐朝,为了避李世民的讳,“一世”方改为“一代”,当代中国学者测算“一代”平均为25年.另据美国麦肯锡公司的研究报告显示,全球家庭企业的平均寿命其实只有24年,其中只有约30%的家族企业可以传到第二代,能够传到第三代的家族企业数量为总量的13%,只有5%的家族企业在第三代后还能够继续为股东创造价值.根据上述材料,可以推断美国学者认为“一代”应为__________年.14.上海市普通高中学业水平等级考成绩共分为五等十一级,各等级换算成分数如表所示:上海某高中2018届高三()1班选考物理学业水平等级考的学生中,有5人取得A +成绩,其他人的成绩至少是B 级及以上,平均分是64分,这个班级选考物理学业水平等级考的人数至少为______人. 15.已知由样本数据集合(){}11,1,2,3,...,x y i n =,求得的回归直线方程为1.2308ˆ.0y x =+,且ˆ4x =,若去掉两个数据点 (4.1,5.7)和(3.9,4.3)后重新求得的回归直线方程l 的斜率估计值为1.2,则此回归直线l 的方程为_______.16.数据1x ,2x ,…,n x 的平均数是3,方差是1,则数据15x -,25x -,…,5n x -的平均数和方差之和是__________.17.设一个回归方程为0.4 1.8y x =-,则当25x =时,y 的估计值是_______. 18.已知某人连续5次射击的环数分别是8,9,10,x ,8,若这组数据的平均数是9,则这组数据的方差为 .19.已知一组数据为2,3,4,5,6,则这组数据的方差为______.20.某校高三年级共有800名学生,现采用系统抽样的方法,抽取25名学生做问卷调查,将这800名学生按1,2,...,800随机编号,按编号顺序平均分组.若从第5组抽取的编号为136,则从第2组中抽取的编号为__________.三、解答题21.“湖广熟,天下足”,鱼米之乡的湖北是全国重要的农产品生产地.而受疫情影响,像莲藕、小龙虾等湖北很多优质农副产品近期都面临销售难题.为了让淜北尽快恢复正常,央视主持人朱广权化身直播带货官,和网红们一起为湖北产品做公益直播.在为湖北某地区的小龙虾进行带货时,需大致了解该地区小龙虾的产量,通过调查发现湖北某地区近几年的小龙虾产量统计如下表:(1)根据表中数据,建立关于t 的线性回归方程y bt a =+; (2)请你根据线性回归方程预测今年(2020年)该地区小龙虾的年产量.附:对于一组数据()11,t y ,()22,t y ,…,(),n n t y ,其回归直线y bt a =+的斜率和截距的最小二乘估计分别为:()()()121ˆniii ni i t t y y bt t ==--=-∑∑,a y bt =-.(参考数据:()()616.3ii i tty y =--=∑)22.班主任为了对本班学生的考试成绩进行分析,决定从本班24名女同学,18名男同学中随机抽取一个容量为7的样本进行分析.(1)如果按照性别比例分层抽样,可以得到多少个不同的样本?(写出算式即可,不必计算出结果)(2)如果随机抽取的7名同学的数学,物理成绩(单位:分)对应如下表:①若规定85分以上(包括85分)为优秀,从这7名同学中抽取3名同学,记3名同学中数学和物理成绩均为优秀的人数为ξ,求ξ的分布列和数学期望;②根据上表数据,求物理成绩y 关于数学成绩x 的线性回归方程(系数精确到0.01);若班上某位同学的数学成绩为96分,预测该同学的物理成绩为多少分? 附:线性回归方程y bx a =+,其中121()()()niii nii x x y y b x x ==--=-∑∑,a y bx =-.23.某地级市共有200000中学生,其中有7%学生在2017年享受了“国家精准扶贫”政策,在享受“国家精准扶贫”政策的学生中困难程度分为三个等次:一般困难、很困难、特别困难,且人数之比为5:3:2,为进一步帮助这些学生,当地市政府设立“专项教育基金”,对这三个等次的困难学生每年每人分别补助1000元、1500元、2000元.经济学家调查发现,当地人均可支配年收入较上一年每增加%n ,一般困难的学生中有3%n 会脱贫,脱贫后将不再享受“精准扶贫”政策,很困难的学生有2%n 转为一般困难学生,特别困难的学生中有%n 转为很困难学生.现统计了该地级市2013年到2017年共5年的人均可支配年收入,对数据初步处理后得到了如图所示的散点图和表中统计量的值,其中年份x 取13时代表2013年,x 取14时代表2014年,……依此类推,且x 与y (单位:万元)近似满足关系式y x βα=+.(2013年至2019年该市中学生人数大致保持不变)y521()ii yy =-∑51()()iii x x y y =--∑0.8 3.11(1)估计该市2018年人均可支配年收入为多少万元?(2)试问该市2018年的“专项教育基金”的财政预算大约为多少万元?附:对于一组具有线性相关关系的数据11(,)u υ,22(,)u υ,…,(,)n n u υ,其回归直线方程u υβα=+的斜率和截距的最小二乘估计分别为121()()()niii nii u u uu υυβ==--=-∑∑,u αυβ=-.24.为培养学生在高中阶段的数学能力,某校将举行数学建模竞赛.已知该竞赛共有60名学生参加,他们成绩的频率分布直方图如图所示.(1)估计这60名参赛学生成绩的中位数;(2)为了对数据进行分析,将60分以下的成绩定为不合格.60分以上(含60分)的成绩定为合格,某评估专家决定利用分层抽样的方法从这60名学生中选取10人,然后从这10人中抽取4人参加座谈会,记ξ为抽取的4人中,成绩不合格的人数,求ξ的分布列与数学期望;(3)已知这60名学生的数学建模竞赛成绩Z 服从正态分布()2,Nμσ,其中μ可用样本平均数近似代替,2σ可用样本方差近似代替(同一组数据用该区间的中点值作代表),若成绩在46分以上的学生均能得到奖励,本次数学建模竞赛满分为100分,估计此次竞赛受到奖励的人数(结果根据四舍五人保留整数).参考数据:()0.6827P Z μσμσ-<≤+≈,()220.9545P Z μσμσ-<≤+≈,()330.9973P Z μσμσ-<≤+≈.25.为研究冬季昼夜温差大小对某反季节大豆新品种发芽率的影响,某校课外兴趣小组记录了5组昼夜温差与100颗种子发芽数,得到如下资料: 组号 12 3 4 5 温差x (C ︒) 10 11 13 12 8 发芽数y (颗)2325302616经分析,这组数据具有较强的线性相关关系,因此该小组确定的研究方案是:先从这五组数据中选取3组数据求出线性回归方程,再用没选取的2组数据进行检验.(1)若选取的是第2,3,4组的数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+; (2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(参考公式:()()()1122211ˆnni i i i i i nn i i i i x x y y x y nxy bx x x nx====---==--∑∑∑∑,ˆˆay bx =-) 26.某“双一流”大学专业奖学金是以所学专业各科考试成绩作为评选依据,分为专业一等奖学金(奖金额3000元)、专业二等奖学金(奖金额1500元)及专业三等奖学金(奖金额600元),且专业奖学金每个学生一年最多只能获得一次.图(1)是统计了该校2018年500名学生周课外平均学习时间频率分布直方图,图(2)是这500名学生在2018年周课外平均学习时间段获得专业奖学金的频率柱状图.(Ⅰ)求这500名学生中获得专业三等奖学金的人数;(Ⅱ)若周课外平均学习时间超过35小时称为“努力型”学生,否则称为“非努力型”学生,列22⨯联表并判断是否有99.9%的把握认为该校学生获得专业一、二等奖学金与是否是“努力型”学生有关?(Ⅲ)若以频率作为概率,从该校任选一名学生,记该学生2018年获得的专业奖学金额为随机变量X ,求随机变量X 的分布列和期望.22()()()()()n ad bc K a b c d a c b d -=++++【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】试题分析:由表格得(),x y 为:()10,38,因为(),x y 在回归方程y bx a =+上且2b =-,()38102a ∴=⨯-+,解得58a =∴2ˆ58y x =-+,当6x =时,26ˆ5846y=-⨯+=,故选D. 考点:1、线性回归方程的性质;2、回归方程的应用.2.D解析:D 【详解】高的比就是频率的比,所以各区间上的频率可依次设为2x,3x,5x,6x,3x,x,,同它们的和为1235631,20x x x x x x x +++++=∴=,所以该班学生数学成绩在[80,100)之间的学生人数是1(56)6011603320x +⨯⨯=⨯⨯=,故选D 3.C解析:C 【解析】解:由图可知:则底部周长小于110cm 段的频率为(0.01+0.02+0.04)×10=0.7, 则频数为100×0.7=70人. 故选C .4.D解析:D 【分析】根据平均数的性质,方差的性质直接运算可得结果. 【详解】令23(1,2,,5)i i y x i =-=1234555x x x x x x ++++==,1234523232323232310375x x x x x y x -+-+-+-+-∴==-=-=,(也可()(23)2()32537E y E x E x =-=-=⨯-=) ()()()2y 232428D D x D x =-==⨯=故选:D 【点睛】本题主要考查方差及平均值的性质的简单应用,属于中档题.5.D解析:D 【分析】根据散点图的分布可选择合适的函数模型. 【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D. 【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.6.C解析:C 【分析】设出最后两个数,然后根据已知条件列方程,求得方程2s 的表达式,根据表达式的结构求得2s 的最大值. 【详解】设这组数据的最后2个分别是10x +,y 则5781085x y +++++=⨯, 得10x y +=,故10y x =-.∴()222211910(2)(2)21855s x x x ⎡⎤=+++++-=+⎣⎦, 显然当9x =时,2s 最大,最大为36. 故选:C 【点睛】本小题主要考查平均数和方差的计算,考查方程的思想,属于基础题.7.B解析:B 【分析】由(0.00500.00750.01000.0125)201a ++++⨯=,求出a ,计算出数据落在区间[90,110)内的频率,即可求解.【详解】由(0.00500.00750.01000.0125)201a ++++⨯=, 解得0.015a =,所以数据落在区间[90,110)内的频率为0.015200.3⨯=, 所以数据落在区间[90,110)内的频数2000.360⨯=, 故选B. 【点睛】本题主要考查了频率分布直方图,频率、频数,属于中档题.8.C解析:C 【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案. 【详解】详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,则15n =,不合题意;若200610n =+,则19.4n =,不合题意; 若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C . 【点睛】本题主要考查系统抽样.9.B解析:B 【解析】分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程. 详解:123+4=2.54x ++=, 3 3.8 5.264.5,4y +++==∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立, 故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.10.C解析:C 【分析】根据频数关系,求出前三段每段的频数,由直方图求出四五组的频率,进而求出前三组的频率和,从而可求该校报名学生的总人数. 【详解】从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,∴从左到右3个小组的频数分别为6,12,18,共有36人,第4,5小组的频率之和为()0.03750.012550.25+⨯=, 则前3小组的频率之和为10.250.75-=, 则该校报名学生的总人数为360.7548÷=,故选C. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标相乘后求和可得平均值;(4)直观图左右两边面积相等处横坐标表示中位数.11.D解析:D 【解析】分析:一组数据中的每一个数加或减一个数,它的平均数也加或减这个数;;依此规律求解即可.详解::∵一组数据12,,,n x x x 的平均数为3, ∴另一组数据1232,32,,32n x x x +++的平均数121211323232[32]33211n n x x x x x x n n n=++++⋯++=++⋯++=⨯+=()(), 故选D.点睛:本题考查了平均数,平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.12.C解析:C 【解析】分析:利用回归方程和独立性检验对每一个命题逐一判断.详解:对于①,一个回归方程35y x =-,变量x 增加一个单位时,y 应平均减少5个单位,所以该命题是错误的;对于②,线性回归直线ˆybx a =+必过必过点(),x y ,是正确的;对于③,在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,并不能说明他有99%的可能患肺病,所以该命题是错误的. 故答案为:C.点睛:本题主要考查回归方程和独立性检验,意在考查学生对这些知识的掌握水平和分析推理能力.二、填空题13.20【分析】设美国学者认为的一代为年然后可得出寿命在的家族企业的频率分别为然后利用平均数公式列方程解出的值即可得出所求结果【详解】设美国学者认为的一代为年然后可得出寿命在的家族企业的频率分别为则家族解析:20 【分析】设美国学者认为的一代为x 年,然后可得出寿命在(]0,x 、(],2x x 、(]2,3x x 、(]3,4x x 的家族企业的频率分别为0.52、0.3、0.13、0.05,然后利用平均数公式列方程解出x 的值,即可得出所求结果. 【详解】设美国学者认为的一代为x 年,然后可得出寿命在(]0,x 、(],2x x 、(]2,3x x 、(]3,4x x 的家族企业的频率分别为0.52、0.3、0.13、0.05, 则家族企业的平均寿命为0.5(10.30.130.05) 1.50.3 2.50.13 3.50.0512.124x x x x x ⨯---+⨯+⨯+⨯==,解得20x ≈,因此,美国学者认为“一代”应为20年,故答案为20. 【点睛】本题考查平均数公式的应用,解题的关键要审清题意,将题中一些关键信息和数据收集起来,结合相应的条件或公式列等式或代数式进行求解,考查运算求解能力,属于中等题.14.15【解析】【分析】设取得A 成绩的x 人取得成绩的y 人取得B 成绩的z 人由题意可得:解得:结合xy 可求的最【详解】设取得A 成绩的x 人取得成绩的y 人取得B 成绩的z 人则即又xy 即当且仅当时取得最小值15取得解析:15 【解析】 【分析】设取得A 成绩的x 人,取得B +成绩的y 人,取得B 成绩的z 人,由题意可得:()70567x 64y 61z 645x y z ⨯+++=⨯+++,解得:z x 10-=,结合x ,y ,z N ∈,可求5x y z +++的最. 【详解】设取得A 成绩的x 人,取得B +成绩的y 人,取得B 成绩的z 人, 则()70567x 64y 61z 645x y z ⨯+++=⨯+++, 即z x 10-=, 又x ,y ,z N ∈,即当且仅当x 0=,y 0=,z 10=时,5x y z +++取得最小值15, 取得A 成绩的0人,取得B +成绩的0人,取得B 成绩的10人, 这个班级选考物理学业水平等级考的人数至少为15人, 故答案为15 【点睛】本题考查了实际问题通过数学问题解决,考查了阅读理解及数学建模的能力,属中档题.15.【解析】【分析】由题意求出样本中心点然后求解新的样本中心利用回归直线的斜率估计值为求解即可得到答案【详解】有样本数据点集合求得的回归直线方程为且去掉两个数据点和重新求得的回归直线的斜率估计值为回归直解析: 1.20.2y x ∧=+. 【解析】 【分析】由题意求出样本中心点,然后求解新的样本中心,利用回归直线l 的斜率估计值为1.2,求解即可得到答案 【详解】 有样本数据点集合(){}11123,...,x y i n =,,,,求得的回归直线方程为 1.2308ˆ.0y x =+,且ˆ4x=, 1.2340.0ˆ85y=⨯+=, 去掉两个数据点()4.15.7,和()3.94.3,,ˆ4x =,ˆ5y =, 重新求得的回归直线l 的斜率估计值为1.2,回归直线方程设为 1.2ˆyx a =+,代入()45,,解得0.2a = ∴回归直线l 的方程为 1.2.2ˆ0y x =+ 故答案为 1.2.2ˆ0yx =+ 【点睛】本题主要考查的是数据的回归直线方程,利用回归直线方程恒过样本中心点是关键。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
单元测试三 统计(二)一、选择题1.从某年级1000名学生中抽取125名学生进行体重的统计分析,就这个问题来说,下列说法正确的是( )A .1000名学生是总体B .每个被抽查的学生是个体C .抽查的125名学生的体重是一个样本D .抽取的125名学生的体重是样本容量2.已知一组数据为35,40,45,50,50,50,65,75,85,其中平均数、中位数、众数的大小关系为( )A .平均数>中位数>众数B .平均数<中位数<众数C .中位数<众数<平均数D .中位数=众数<平均数3.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上的人,用分层抽样的方法抽取20人,各年龄段分别抽取的人数是( ) A .7,5,8 B .9,5,6 C .6,5,9 D .8,5,74.由小到大排列的一组数据x 1,x 2,x 3,x 4,x 5,其中每个数据都小于-1,那么对于样本1,x 1,-x 2,x 3,-x 4,x 5的中位数可以表示为( )A .)1(212x +B .)(2112x x - C .)1(215x +D .)(2143x x -5.已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是2,方差是31,那么另一组数3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数,方差分别是( ) A .31,2B .2,1C .32,4D .4,36.某社区有6000个家庭,其中高收入家庭1200户,中等收入家庭4200户,低收入家庭600户,为调查社会购买力的某项指标,要从中抽取一个容量为1000的样本,记作①;某学校高中二年级有15名男篮运动员,要从中选出3人调查学习负担情况,记作②;那么完成上述两项调查应采用的取样方法是( ) A .①简单随机抽样 ②系取抽样 B .①分层抽样 ②简单随机抽样 C .①系统抽样 ②分层抽样 D .①分层抽样 ②系统抽样7.对于数据2,2,3,2,5,2,10,2,5,2,3,(1)从数是2;(2)众数与中位数的值数不等;(3)中位数与平均数的数值相等;(4)平均数与众数的数值不相等.其中正确的结论有( ) A .1个 B .2个 C .3个 D .4个8.要从一编号(1~50)的50枚最新研制的某型号导弹中随机抽取5枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号是( ) A .5,10,15,20,25 B .2,4,8,16,32C .1,2,3,4,5D .3,13,23,33,439.期中考试以后,班长算出了全班40个人的数学成绩的平均分M ,如果把M 当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均值为N ,那么M ∶N 为( ) A .4140B .1C .4041 D .210.某中学人数相等的甲、乙两班学生参加了同一次数学测试,两班的平均分和方差分别为82=x 分,82=y 分,2甲s =245,2乙s =190,那么成绩较为整齐的是( )A .甲班B .乙班C .两班一样整齐D .无法确定11.设有一个回归方程yˆ=2-1,5x ,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位12.某车间生产一种玩具,为了要确定加工玩具所需要的时间,进行了10次实验,数据如下:玩具个数 2 4 6 8 10 12 14 16 18 20 加工时间471215212517313741A .a =11b -21B .a =21-11bC .a =11-21bD .a =21b -11 二、填空题13.一个样本容量是100的频率分布如图:(1)样本落在[60,70)内的频率为______; (2)样本落在[70,80)内的频率为______;(3)样本落在[90,100)内的频率是0.16,该小矩形的高是______. 14.经问卷调查,某班学生对摄影分别持“喜欢”、“不喜欢”和“一般”三种态度,其中持“一般”态度的比“不喜欢”态度的多12人,按分层抽样方法从全班选出部分学生座谈摄影,如果选出5位“喜欢”摄影的同学、1位“不喜欢”摄影的同学和3位持“一般”态度的同学,那么全班学生中“喜欢”摄影的比全班人数的一半还多______. 人.15x 3 5 2 8 9 12 y46391214假设得到的关于x 和y 之间的回归直线方程是a bx y+=ˆ,那么该直线必过的定点是______.16.样本容量为m,组数为n,第i组的频数为k,则该组频率为_____;若前i-1组的累积频率(前i-1组的频率之和)为p,则前i组的累积频率为______.三、解答题17.(1)从30名高一学生的考试卷中抽取6名学生的试卷进行成绩分析,写出抽取样本的过程;(2)若从高二年级两个班的120名学生中,抽取12名学生调查其身高情况,你觉得采取哪种抽样方法较为合适(其中男生50人,女生70人)?18(1)分别求这些运动员成绩的众数、中位数、平均数(保留3个有效数字);(2)分析这些数据的含义.19.对自行车运动员甲、乙两人在相同条件下进行了六次测试,测得他们的最大速度(m/s)的数据如下:求两人比赛成绩的平均数以及方差,并且分析比赛成绩的稳定性,从中选出一位参加决赛.20.甲乙两组数据如下:甲:11.29.812.38.99.010.713.1乙:10.38.913.09.78.611.212.3(1)求平均数;(2)画出茎叶图求中位数;(3)求方差;(4)对两组数据加以比较.2122.从高一学生中抽取50名参加调研考试,成绩的分组及各组的频数如下(单位:分):[40,50),2;[50,60);3;[60,70),10;[70,80),15;[80,90),12;[90,100),8(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在[70,80)分的学生所占总体的百分比;(4)估计成绩在[70,100)分的学生所占总体的百分比.测试卷参考答案单元测试三 统计(二)一、选择题1.C 解析:在初中学过:“在统计中,所有考察对象的全体叫做总体,其中每一个所要考察的对象叫做个体,从总体中抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本容量.”因此题中所指的对象应是体重,故A 、B 错误,样本容量应为125,故D 错误. 2.D 解析:平均数中位数55)857565505050454035(91=++++++++=x , 中位数=众数=50.3.B 解析:由45∶25∶30=8∶5∶6,设9x +5x +6x =20得x =1,故各年龄段分别抽取9人,5人,6人. 4.C 解析:由题意把样本从小到大排序为x 1,x 3,x 5,1,-x 4,-x 2,因此得中位数为()5121x + 5.D 解析:因为数据x 1,x 2,x 3,x 4,x 5的平均数是2,方差是31, 所以31)2(51,2251=-=∑=i i x x ,因此数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数为:42513)23(515151=-⨯=-∑∑==ii ii x x ,方差为:=--∑=251)23(51x x i i 9)63(51251=-∑=i i x 3319)2(51251=⨯=-⨯∑=i i x .6.B 解析:①中国各层之间的收入情况差异很大,故采用分层抽样法;②因总体和样本数量都较小,故采用抽样法.7.B 解析:众数是出现次数最多的数,故众数为2;把数从小到大排列为2,2,2,2,2,2,3,3,5,5,10,得中位数是2;又平均数约3.45,故(1),(4)正确.8.D 解析:由题意,以系统抽样分为5段,每段10名,并且每段取一名,间隔为10,符合此规律的只有D .9.B 解析:∵M =N ,∴M ∶N =1.10.B 解析:在平均数相同的情况下,方差较小的其数据波动较小,由于2甲s =245>2乙s =190因此乙班的成绩较为整齐.11.C 解析:回归直线斜率为-1.5,所以每增加一个单位,y 减少1.5,故选C . 12.B 解析:由112202=+=x , 21)413731172521151274(101=+++++++++=y 得:b x b y a 1121-=-=.二、填空题13.0.2 30 0.016解析:(1)由,得频率为0.2;(2)频率为0.3,又由频数=频率×样本容量,得频数为30; (3)由,得0.016.14.3 解析:由分层抽样可知“喜欢”、“不喜欢”和“一般”所占的比例为5∶1∶3,设每份为x ,则由题意3x -x =12,解得x =6.所以“喜欢”的有30人,全班人数为54,由于325430=-,故全班学生中“喜欢”摄影的比全班人数的一半还多3人. 15.(6.5,8) 解析:5.6)1298253(61=+++++=x ,8)14129364(61=+++++=y .由于回归直线方程a bx y+=ˆ恒过样本中心(x ,y ), 因此,回归直线方程a bx y+=ˆ必过定点(6.5,8). 16.mk P mk+解析:第i 组的频率为m k ,前i 组的频率为mk P +. 三、解答题17.解:(1)总体和样本数目较小,可采用抽签法较为简单易行.①先将30名学生进行编号、从1编到30,写在号签上(号签要形状,大小均相同);②将号签放入箱子中进行充分搅拌,然后逐个从箱子中取出6个号签,按这6个号签上的号码取出试卷即得到样本; (2)由于高二学生男、女身高有较大的差异,因此应按男、女分层,再按比例抽取,应抽取男生5人,女生7人.18.解:(1)在17个数据中,1.75出现了4次,次数最多,即众数是1.75;把成绩从小到大排列,中间一个数即第9个数据是1.70中的一个,即中位数是1.70;平均数)m (69.1)190.1360.1250.1(171≈⨯++⨯+⨯=Λx 因此,17名运动员成绩的众数、中位数、平均数依次为1.75m ,1.70m ,1.69m . (2)众数是1.75说明了跳1.75m 的人数最多;中位数是1.70m 说明了1.70m 以下和1.70m 以上的成绩个数相等;平均数是1.69m 说明了所有参赛运动员平均成绩是1.69m .19.解:平均速度为33)313537303827(61=+++++=甲x ,33)362834382933(61=+++++=乙x .所以方差为347])2(22)3(5)6[(612222222=-+++-++-=甲s , 338]3)5(15)4(0[612222222=+-+++-+=乙s .则,22乙甲s s >,即s 甲>s 乙因此,在平均数相同的情况下乙的成绩比甲的稳定,应选乙参加比赛比较合适. 20.解:(1)7.10)1.37.011.13.22.02.1(7110≈++--+-+=甲x , 6.10)3.22.14.13.031.13.0(7110≈++--+-+=乙x .(2)画出茎叶图如下:可见甲组数据的中位数是10.7,乙组数据的中位数是10.3; (3)22.2]4.207.1)8.1(6.1)8.0(5.0[7122222222≈+++-++-+=甲s , 35.2]6.16.029.04.27.13.0[7122222222≈++++++=乙s ;(4)此题甲的中位数大于乙的中位数,甲的平均数大于乙的平均数,数据乙波动较大. 21.解:画出散点图如下:由散点图可知:变量y 对x 成线性相关关系.算出如下的对应值表:i 1 2 3 4 5 6 x i 3 4 5 6 7 8 y i 40 50 55 60 67 70 x i y i120 200 275 360 469 560 2i x916253649645.5=x ,57=y∑==612199i ix,∑==611984i i i y x计算得:22261615.56199575.56198466⨯-⨯⨯-=--=∑∑==xx yx yx b i i ii i89.55.17103≈=, 61.245.589.557≈⨯-=-=x b y a .即得线性回归直线方程61.2489.5ˆ+=x y. 22.解:(1)成绩分组 频数 频率 [40,50) 2 0.04 [50,60) 3 0.06 [60,70) 10 0.2 [70,80) 15 0.3 [80,90) 12 0.24 [90,100) 8 0.16 合计501.00(2)(3)由频率分布直方图可知成绩在[70,80)分的学生所占总体的百分比是 0.03×10=0.3=30%;(4)由频率分布表可估计成绩在[70,100)分的学生所占总体的百分比是 0.3+0.24+0.16=0.7=70%.。