第1讲 统计与统计案例

合集下载

专题五 第1讲 统计与统计案例(解析版)

专题五   第1讲 统计与统计案例(解析版)

第1讲 统计与统计案【典例】【要点提炼】考点一 统计图表1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率组距.2.频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数. 频率分布直方图中:(1)最高的小长方形底边中点的横坐标即众数. (2)中位数左边和右边的小长方形的面积和相等.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.【热点突出】【典例】1 (1)(多选)(2020·新高考全国Ⅱ)我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是( )A .这11天复工指数和复产指数均逐日增加B .这11天期间,复产指数增量大于复工指数的增量C .第3天至第11天复工复产指数均增大都超过80%D .第9天至第11天复产指数增量大于复工指数的增量 【答案】 CD(2)学校为了了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于30分钟的学生称为“阅读霸”,则下列结论正确的是( ) A.抽样表明,该校约有一半学生为阅读霸B.该校只有50名学生不喜欢阅读C.该校只有50名学生喜欢阅读D.抽样表明,该校有50名学生为阅读霸【答案】 A【解析】根据频率分布直方图可列下表:阅读时间(分钟) [0,10)[10,20) [20,30) [30,40) [40,50) [50,60]抽样人数(名) 10 18 22 25 20 5抽样100名学生中有50名为阅读霸,占一半,据此可判断该校约有一半学生为阅读霸.易错提醒(1)对于给出的统计图表,一定要结合问题背景理解图表意义,不能似懂非懂.(2)频率分布直方图中纵坐标不要误以为频率.【拓展训练】1 (1)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温不低于20 ℃的月份有5个【答案】 D【解析】由题中雷达图易知A,C正确.七月份平均最高气温超过20 ℃,平均最低气温约为13 ℃;一月份平均最高气温约为6 ℃,平均最低气温约为2 ℃,所以七月的平均温差比一月平均温差大,故B正确.由题图知平均最高气温不低于20 ℃的月份为六、七、八月,有3个.(2)(多选)(2020·重庆模拟)新高考方案规定,普通高中学业水平考试分为合格性考试(合格考)和选择性考试(选择考),其中“选择考”成绩将计入高考总成绩,即将学生考试时的原始卷面分数由高到低进行排序,评定为A,B,C,D,E五个等级,再转换为分数计入高考总成绩.某试点高中2020年参加“选择考”总人数是2018年参加“选择考”总人数的2倍,为了更好地分析该校学生“选择考”的水平情况,统计了该校2018年和2020年“选择考”成绩等级结果,得到如图所示的统计图.针对该校“选择考”情况,2020年与2018年比较,下列说法正确的是( ) A .获得A 等级的人数增加了 B .获得B 等级的人数增加了1.5倍 C .获得D 等级的人数减少了一半 D .获得E 等级的人数相同 【答案】 AB【解析】 设2018年参加“选择考”的总人数为x ,则2020年参加“选择考”的总人数为2x ,根据图表得出2018年和2020年各个等级的人数如表所示.由表可知,获得A 等级的人数增加了,故A 正确;获得B 等级的人数增加了0.8x -0.32x0.32x =1.5倍,故B 正确;获得D 等级的人数增加了,故C 错误;获得E 等级的人数不相同,故D 错误.【要点提炼】考点二 回归分析在分析两个变量的相关关系时,可根据样本数据作出散点图来判断两个变量之间是否具有相关关系.若具有线性相关关系,则回归直线过样本点的中心(x ,y ),并且可通过线性回归方程估计预报变量的值.【热点突破】【典例】2 (2020·全国Ⅱ)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得i=60,i=1 200,(x i-x)2=80,(y i-y)2=9 000,(x i-x)(y i-y)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i,y i)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.【解析】解(1)由已知得样本平均数y=120i=60,从而该地区这种野生动物数量的估计值为60×200=12 000.(2)样本(x i,y i)(i=1,2,…,20)的相关系数r=80080×9 000=223≈0.94.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关关系.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.规律方法样本数据的相关系数r=∑ni=1x i-x y i-y∑ni=1x i-x2∑ni=1y i-y2,反映样本数据的相关程度,|r|越大,则相关性越强.【拓展训练】2 (1)已知某产品的销售额y与广告费用x之间的关系如下表:x(单位:万元) 0 1 2 3 4y(单位:万元)10 15 20 30 35若求得其线性回归方程为y ^=6.5x +a ^,则预计当广告费用为6万元时的销售额为( ) A .42万元 B .45万元 C .48万元 D .51万元 【答案】 C【解析】 由题意,根据上表中的数据, 可得x =2,y =22, 即样本点的中心为(2,22),又线性回归方程y ^=6.5x +a ^经过样本点的中心,所以22=6.5×2+a ^,解得a ^=9,所以y ^=6.5x +9,当x =6时,y ^=48.(2)(2020·河北衡水中学月考)有一散点图如图所示,在5个(x ,y)数据中去掉D(3,10)后,下列说法正确的是( )A .残差平方和变小B .相关系数r 变小C .相关指数R 2变小D .解释变量x 与预报变量y 的相关性变弱 【答案】 A【解析】 ∵从散点图可分析得出:只有D 点偏离直线远,去掉D 点,解释变量x 与预报变量y 的线性相关性变强, ∴相关系数变大,相关指数变大,残差平方和变小,故选A.【要点提炼】考点三独立性检验假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1 a b a+bx2 c d c+d总计a+c b+d a+b+c+dK2=n ad-bc2a+b a+c b+d c+d(其中n=a+b+c+d为样本容量).【热点突破】【典例】3 (2020·新高考全国Ⅰ)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:SO2PM2.5[0,50] (50,150] (150,475][0,35] 32 18 4(35,75] 6 8 12(75,115] 3 7 10(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:SO2PM2.5[0,150] (150,475][0,75](75,115](3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?附:K2=n ad-bc2a+b c+d a+c b+d,P(K2≥k0) 0.050 0.010 0.001k0 3.841 6.635 10.828【解析】解(1)由表格可知,该市100天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+6+18+8=64,所以该市一天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为64100=0.64.(2)由所给数据,可得2×2列联表:SO2PM2.5[0,150] (150,475][0,75] 64 16(75,115] 10 10(3)根据2×2列联表中的数据可得K2=n ad-bc2a+b c+d a+c b+d=100×64×10-16×102 80×20×74×26≈7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.规律方法独立性检验的关键(1)根据2×2列联表准确计算K 2,若2×2列联表没有列出来,要先列出此表. (2)K 2的观测值k 越大,对应的假设H 0成立的概率越小,H 0不成立的概率越大.【拓展训练】3 (1)随着国家二胎政策的全面放开,为了调查一线城市和非一线城市的二胎生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.非一线城市一线城市 总计 愿生 45 20 65 不愿生 13 22 35 总计5842100附表:P(K 2≥k 0)0.100 0.050 0.010 0.001 k 02.7063.8416.63510.828由K 2=n ad -bc 2a +bc +d a +cb +d计算得,K 2的观测值k =100×45×22-20×13258×42×35×65≈9.616,参照附表,得到的正确结论是( )A .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C .有99%以上的把握认为“生育意愿与城市级别有关”D .有99%以上的把握认为“生育意愿与城市级别无关” 【答案】 C【解析】 由题意知, K 2的观测值k ≈9.616>6.635,∴有99%以上的把握认为“生育意愿与城市级别有关”.(2)某校团委对“学生性别和喜欢某视频APP 是否有关”做了一次调查,其中被调查的女生人数是男生人数的一半,男生喜欢某视频APP 的人数占男生人数的16,女生喜欢某视频APP 的人数占女生人数的23,若有95%的把握认为喜欢某视频APP 和性别有关,则男生至少有( )附:P(K 2≥k 0)0.050 0.010 k 03.8416.635K 2=n ad -bc2a +bc +d a +cb +d.A .12人B .6人C .10人D .18人 【答案】 A【解析】 设被调查的男生人数为x ,则被调查的女生人数为x2,则2×2列联表为喜欢某视频APP不喜欢某视频APP总计男生 x 6 5x 6 x女生x 3 x 6x 2 总计 x 2x3x 2若有95%的把握认为喜欢某视频APP 和性别有关,则K 2≥3.841,即K 2=3x 2⎝ ⎛⎭⎪⎫x 6×x 6-5x 6×x 32x ×x 2×x 2×x =3x 8≥3.841,则x≥3.841×83≈10.243,又x 2,x 3,x6均为整数,所以男生至少有12人.专题训练一、单项选择题1.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9,已知这组数据的平均数为10,方差为2,则|x -y|的值为( ) A .4 B .3 C .2 D .1 【答案】 A【解析】 依题意有x +y +10+11+95=10,(x -10)2+(y -10)2+(10-10)2+(11-10)2+(9-10)2=5×2,解得x =8,y =12或x =12,y =8,故|x -y|=4.2.(2019·全国Ⅲ)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( ) A .0.5 B .0.6 C .0.7 D .0.8 【答案】 C【解析】 根据题意阅读过《红楼梦》《西游记》的人数用韦恩图表示如下:所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70100=0.7.3.(2020·全国Ⅰ)某校一个课外学习小组为研究某作物种子的发芽率y 和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i ,y i )(i =1,2,…,20)得到下面的散点图:由此散点图可以看出,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y =a +bx B .y =a +bx 2C .y =a +be xD .y =a +bln x【答案】 D【解析】 由散点图可以看出,点大致分布在对数型函数的图象附近.4.某生产车间的甲、乙两位工人生产同一种零件,这种零件的标准尺寸为85 mm ,现分别从他们生产的零件中各随机抽取8件进行检测,其尺寸(单位:mm)用茎叶图表示如图所示,则估计( )A .甲、乙生产的零件尺寸的中位数相等B .甲、乙生产的零件质量相当C .甲生产的零件质量比乙生产的零件质量好D .乙生产的零件质量比甲生产的零件质量好 【答案】 D【解析】 甲生产的零件尺寸是93,89,88,85,84,82,79,78;乙生产的零件尺寸是90,88,86,85,85,84,84,78.故甲生产的零件尺寸的中位数是85+842=84.5,乙生产的零件尺寸的中位数是85+852=85,故A 错误;根据数据分析,乙的数据较稳定,故乙生产的零件质量比甲生产的零件质量好,故B ,C 错误.5.某校进行了一次创新作文大赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在[40,90]之间,其得分的频率分布直方图如图所示,则下列结论错误的是( )A .得分在[40,60)之间的共有40人B .从这100名参赛者中随机选取1人,其得分在[60,80)之间的概率为0.5C .估计得分的众数为55D .这100名参赛者得分的中位数为65 【答案】 D【解析】 根据频率和为1,计算(a +0.035+0.030+0.020+0.010)×10=1,解得a =0.005, 得分在[40,60)之间的频率是0.4,估计得分在[40,60)之间的有100×0.4=40(人),A 正确;得分在[60,80)之间的频率为0.5,可得从这100名参赛者中随机选取1人,得分在[60,80)之间的概率为0.5,B 正确;根据频率分布直方图知,最高的小矩形对应的底边中点为50+602=55,即估计众数为55,C 正确;根据频率分布直方图知,得分低于60分的直方图面积为(0.005+0.035)×10=0.4<0.5,而得分低于70分的直方图面积为(0.005+0.035+0.030)×10=0.7>0.5,所以100名参赛者得分的中位数估计为60+0.5-0.40.030≈63.3,D 错误. 二、多项选择题6.(2020·烟台模拟)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下表所示的列联表,经计算K 2的观测值k ≈4.762,则可以推断出( )A.该学校男生对食堂服务满意的概率的估计值为35B .调研结果显示,该学校男生比女生对食堂服务更满意C .有95%的把握认为男、女生对该食堂服务的评价有差异D.有99%的把握认为男、女生对该食堂服务的评价有差异【答案】AC【解析】对于选项A,该学校男生对食堂服务满意的概率的估计值为3030+20=35,故A正确;对于选项B,该学校女生对食堂服务满意的概率的估计值为4040+10=45>35,故B错误;因为k≈4.762>3.841,所以有95%的把握认为男、女生对该食堂服务的评价有差异,故C正确,D错误.7.(2020·河北衡水中学月考)5G时代已经到来,5G的发展将直接带动包括运营、制造、服务在内的通信行业经济的快速增长,进而对GDP增长产生直接贡献,并通过产业间的关联效应和波及效应,间接带动国民经济各行业的发展,创造出更多的经济增加值.如图是某单位结合近几年数据,对今后几年的5G经济产出所做的预测.结合上图,下列说法正确的是( )A.5G的发展带动今后几年的总经济产出逐年增加B.设备制造商的经济产出前期增长较快,后期放缓C.信息服务商与运营商的经济产出的差距有逐步拉大的趋势D.设备制造商在各年的经济产出中一直处于领先地位【答案】ABC【解析】由图易知A,B,C正确,而设备制造商的经济产出在2029年和2030年将低于信息服务商的经济产出,故D错误.8.(2020·青岛模拟)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图、90后从事互联网行业岗位分布条形图,则下列结论正确的是( )注:90后指1990年及以后出生,80后指1980-1989年之间出生,80前指1979年及以前出生.A .互联网行业从业人员中从事技术和运营岗位的人数占总人数的三成以上B .互联网行业中从事技术岗位的人数超过总人数的20%C .互联网行业中从事运营岗位的人数90后比80前多D .互联网行业中从事技术岗位的人数90后比80后多 【答案】 ABC【解析】 选项A ,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术和运营岗位的人数占的比分别为39.6%和17%,则“90后”从事技术和运营岗位的人数占总人数的56%×(39.6%+17%)≈31.7%.“80前”和“80后”中必然也有从事技术和运营岗位的人,则总的占比一定超过三成,故选项A 正确; 选项B ,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术岗位的人数占的比为39.6%,则“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%.“80前”和“80后”中必然也有从事技术岗位的人,则总的占比一定超过20%,故选项B 正确;选项C ,“90后”从事运营岗位的人数占总人数的比为56%×17%≈9.5%,大于“80前”的总人数所占比3%,故选项C 正确;选项D ,“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%,“80后”的总人数所占比为41%,条件中未给出“80后”从事技术岗位的占比,故不能判断,所以选项D 错误. 三、填空题9.某企业的一种商品的产量与成本数据如下表:产量x(万件) 14 16 18 20 22 成本y(元/件)12107a3若根据表中提供的数据,求出y 关于x 的线性回归方程为y ^=-1.15x +28.1,则a 的值为________. 【答案】 5【解析】 由题意知x =14+16+18+20+225=905=18,y =12+10+7+a +35=32+a5,又y =-1.15×18+28.1=7.4, 所以32+a5=7.4,解得a =5.10.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量为________,抽取的高中生近视人数为________.【答案】 200 20【解析】 由题图甲知,总人数为3 500+2 000+4 500=10 000,所以样本容量为10 000×2%=200,抽样比【典例】为150,所以高中生抽取的学生数为40,所以抽取的高中生近视人数为40×50%=20.11.下面的折线图给出的是甲、乙两只股票在某年中每月的收盘价格,已知股票甲的极差是6.88元,标准差为2.04元;股票乙的极差为27.47元,标准差为9.63元,根据这两只股票在这一年中的波动程度,给出下列结论:①股票甲在这一年中波动相对较小,表现的更加稳定;②购买股票乙风险高但可能获得高回报;③股票甲的走势相对平稳,股票乙的收盘价格波动较大;④两只股票在全年都处于上升趋势.其中正确的结论是________.(填序号)【答案】 ①②③【解析】 由题意可知,甲的标准差为2.04元,乙的标准差为9.63元,可知股票甲在这一年中波动相对较小,表现的更加稳定,故①正确;甲的极差是6.88元,乙的极差为27.47元,可知购买股票乙风险高但可能获得高回报,故②正确;通过折线图可知股票甲的走势相对平稳,股票乙的收盘价格波动较大,故③正确;通过折线图可得乙在6月到8月明显是下降趋势,故④错误.12.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i=1,2,…,n),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是________.(填序号)①y 与x 具有正的线性相关关系; ②回归直线过样本点的中心(x ,y );③若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ; ④若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg. 【答案】 ④【解析】 由于线性回归方程中x 的系数为0.85,因此y 与x 具有正的线性相关关系,故①正确;因为回归直线必过样本点的中心(x ,y ),所以②正确;由线性回归方程的意义知,某女生的身高增加 1 cm ,其体重约增加0.85 kg ,故③正确;当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,这不是确定值,因此④不正确. 四、解答题13.某公司为了了解广告投入对销售收益的影响,在若干地区各投入3.5万元广告费用,并将各地的销售收益绘制成频率分布直方图,如图所示,由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从0开始计数的.(1)根据频率分布直方图计算图中各小长方形的宽度;(2)估计该公司投入3.5万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表该组的取值); (3)该公司按照类似的研究方法,测得另外一些数据,并整理得到下表:广告投入x(单位:万元) 1 2 3 4 5 销售收益y(单位:万元)2327表中的数据显示,x 与y 之间存在线性相关关系,请将(2)中的结果填入空白栏,并计算y 关于x 的线性回归方程.【解析】解 (1)设各小长方形的宽度为m ,由频率分布直方图中各小长方形面积总和为1,可知(0.08+0.10+0.14+0.12+0.04+0.02)·m =0.5m =1,故m =2.(2)由(1)知,各分组依次是[0,2),[2,4),[4,6),[6,8),[8,10),[10,12],其中点值分别为1,3,5,7,9,11,对应的频率分别为0.16,0.20,0.28,0.24,0.08,0.04,故可估计平均值为1×0.16+3×0.20+5×0.28+7×0.24+9×0.08+11×0.04=5. (3)空白栏中填5.由题意可知,x =1+2+3+4+55=3,y =2+3+2+5+75=3.8,∑5i =1x i y i =1×2+2×3+3×2+4×5+5×7=69,∑5i =1x 2i =12+22+32+42+52=55. 根据公式可求得b ^=69-5×3×3.855-5×32=1210=1.2, a ^=3.8-1.2×3=0.2,即线性回归方程为y ^=1.2x +0.2.14.(2020·全国Ⅲ)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):4(中度污染)7 2 0(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好 空气质量不好附:K 2=n ad -bc2a +bc +d a +cb +d .P(K 2≥k 0)0.050 0.010 0.001 k 03.8416.63510.828【解析】解 (1)由频数分布表可知,该市一天的空气质量等级为1的概率为2+16+25100=0.43,等级为2的概率为5+10+12100=0.27,等级为3的概率为6+7+8100=0.21,等级为4的概率为7+2+0100=0.09.(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100×20+300×35+500×45100=350.(3)2×2列联表如下:人次≤400人次>400 总计 空气质量好 33 37 70 空气质量不好22 8 30 总计5545100K 2=100×33×8-37×22255×45×70×30≈5.820>3.841,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.。

统计与统计案例(文科)教程文件

统计与统计案例(文科)教程文件

统计与统计案例(文科)统计与统计案例第一节随机抽样1.下面的抽样方法是简单随机抽样的是( )A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D.用抽签方法从10件产品中选取3件进行质量检验答案:D2.总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )答案:D3.为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )A.50 B.40 C.25 D.20答案: C4.某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A.11 B.12 C.13 D.14答案:B5.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.答案:46.某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )A.90 B.100C.180 D.300答案:C7.某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________.答案:58.某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n=()A.54 B.90 C.45 D.126答案:B9.某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人).个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为________.答案:3010.甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.答案:180011.某市有A、B、C三所学校,共有高三文科学生1 500人,且A、B、C三所学校的高三文科学生人数成等差数列,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B校学生中抽取________人.答案:40第二节用样本估计总体12.根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案: D13.某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.①直方图中的a=________;②在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.答案:①3 ②6 00014.某地政府调查了工薪阶层1 000人的月工资收入,并根据调查结果画出如图所示的频率分布直方图,为了了解工薪阶层对月工资收入的满意程度,要用分层抽样的方法从调查的1 000人中抽出100人做电话询访,则(30,35](百元)月工资收入段应抽出________人.答案:1515.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )答案:A16.某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:①分别估计该市的市民对甲、乙两部门评分的中位数; ②分别估计该市的市民对甲、乙两部门的评分高于90的概率; ③根据茎叶图分析该市的市民对甲、乙两部门的评价.答案:①由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67. ②由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.③由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大. 17.某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?答案:(1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1得x =0.007 5,∴直方图中x 的值为0.007 5.(2)月平均用电量的众数是220+2402=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5,∴月平均用电量的中位数在[220,240)内,设中位数为a ,则(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5,解得a =224,即中位数为224.(3)月平均用电量在[220,240)的用户有0.012 5×20×100=25(户),同理可求月平均用电量为[240,260),[260,280),[280,300)的用户分别有15户、10户、5户,故抽取比例为1125+15+10+5=15,∴从月平均用电量在[220,240)的用户中应抽取25×1=5(户).518.重庆市2013年各月的平均气温(℃)数据的茎叶图如下图,则这组数据的中位数是( )A.19 B.20 C.21.5 D.23答案:B19.为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为( )A.①③ B.①④ C.②③ D.②④答案:B20.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁平均环数x8.38.88.88.7方差s2 3.5 3.6 2.2 5.4A.甲 B.乙 C.丙 D.丁答案:C第三节变量间的相关关系、统计案例1.判断下列结论的正误.(正确的打“√”,错误的打“×”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( )(2)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系去表示.( )(3)通过回归方程y ^=b ^x +a ^可以估计和观测变量的取值和变化趋势.( ) (4)任何一组数据都对应着一个回归直线方程.( )(5)事件X ,Y 关系越密切,则由观测数据计算得到的K 2的观测值越大.( ) 答案:(1)× (2)√ (3)√ (4)× (5)√ 2.观察下列各图:其中两个变量x ,y 具有相关关系的图是( ) A .①② B .①④ C .③④ D .②③ 解析:选C 由散点图知③④具有相关关系.3.已知x ,y 的取值如下表,从散点图可以看出y 与x 线性相关,且回归方程为y ^=0.95x +a ,则a =( )x 0 1 3 4 y2.24.34.86.7A.3.25 B .2.6 C .解析:选B 由已知得x =2,y =4.5,因为回归方程经过点(x ,y ),所以a =4.5-0.95×2=2.6.4.若回归直线方程为y ^=2-1.5x ,则变量x 增加一个单位,y ( )A .平均增加1.5个单位B .平均增加2个单位C .平均减少1.5个单位D .平均减少2个单位解析:选 C 因为回归直线方程为y ^=2-1.5x ,所以b ^=-1.5,则变量x 增加一个单位,y 平均减少1.5个单位.5.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A .若K 2的观测值为k =6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B .从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,我们说某人吸烟,那么他有99%的可能患有肺病C .若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D .以上三种说法都不正确解析:选C 根据独立性检验的思想知C 项正确.6.下列四个散点图中,变量x 与y 之间具有负的线性相关关系的是( )答案:D7.为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x 轴、y 轴的单位长度相同),用回归直线方程y ^=bx +a 近似地刻画其相关关系,根据图形,以下结论最有可能成立的是( )A .线性相关关系较强,b 的值为1.25B .线性相关关系较强,b 的值为0.83C .线性相关关系较强,b 的值为-0.87D .线性相关关系较弱,无研究价值 答案:B8.已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( )A .x 与y 正相关,x 与z 负相关B .x 与y 正相关,x 与z 正相关C .x 与y 负相关,x 与z 负相关D .x 与y 负相关,x 与z 正相关 答案: C9.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归直线方程y =b x +a ; (2)利用(1)中所求出的回归直线方程预测该地2016年的粮食需求量.解:(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:x =0,y =3.2,b ^=(-4)×(-21)+(-2)×(-11)+2×19+4×29-5×0×3.2(-4)2+(-2)2+22+42-5×02=26040=6.5, a ^=y -b ^x =3.2.由上述计算结果,知所求回归直线方程为 y ^-257=b ^(x -2010)+a ^=6.5(x -2010)+3.2, 即y ^=6.5(x -2010)+260.2.(*)(2)利用回归直线方程(*),可预测2016年的粮食需求量为6.5(2016-2010)+260.2=6.5×6+260.2=299.2(万吨).10.某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩平均分(采用百分制),剔除平均分在40分以下的学生后,共有男生300名,女生200名.现采用分层抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生成绩分为6组,得到如下所示频数分布表.精品资料仅供学习与交流,如有侵权请联系网站删除 谢谢11看,数学成绩与性别是否有关;(2)规定80分以上为优分(含80分),请你根据已知条件作出2×2列联表,并判断是否有90%以上的把握认为“数学成绩与性别有关”.附表及公式K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )[听前试做](1)x 男=45×0.05+55×0.15+65×0.3+75×0.25+85×0.1+95×0.15=71.5,x女=45×0.15+55×0.1+65×0.125+75×0.25+85×0.325+95×0.05=71.5,从男、女生各自的平均分来看,并不能判断数学成绩与性别有关.(2)由频数分布表可知:在抽取的100名学生中,“男生组”中的优分有15人,“女生组”中的优分有15人,据此可得2×2列联表如下:可得K 2=100×(15×25-15×45)260×40×30×70≈1.79,因为1.79<2.706,所以没有90%以上的把握认为“数学成绩与性别有关”.。

统计和统计案列

统计和统计案列

统计与统计案例统计概述统计学是一门关于在数据中收集、准确描述、分析、解释和预测现象的科学和技术。

统计学不仅在学术研究中有应用,而且在商业、政治和政策制定中也具有重要作用。

统计学可以用来了解各种数据,并从中得出有关样本或总群体的。

统计学的原则和方法主要包括调查设计、数据描述、概率、假设检验和参数估计等。

其中,假设检验是根据样本数据推断总体特征的重要方法。

统计学的结果应该是客观、可验证的,并且可以用于系统决策。

统计案例(一)调查调研统计学最常见的应用之一是调查调研。

通过问卷调查、样本调查、群体访谈等方式,收集数据,从而更好地了解受访者的需求、看法和态度。

以下是一个调查调研的案例。

案例描述某地区政府正在确定针对失业人士的培训课程。

政府委托调查公司进行调查,以了解需要哪些课程。

调查结果将用于决策,以便提供实施这些培训计划的机构。

调查设计调查对象为失业者群体。

调查方式采用在线问卷的形式,问卷包括以下几个方面的问题:失业者的学历和技能水平、求职经历、兴趣、培训需求和意愿等。

数据收集和处理随机选中1000名失业者进行问卷调查。

数据收集后,统计调查结果,计算得出以下数据: - 60%的人表示需要技术培训 - 50%的人表示需要求职技巧培训 - 20%的人表示需要职业素养培训 - 10%的人表示需要创业培训分析和解读失业者的培训需求主要集中在技术培训和求职技巧培训上,政府可以在这些方面提供更多的培训机会。

与此同时,政府还需要按照实际情况开展其他培训项目,以更好地满足失业者的需求。

(二)产品质量控制统计学也可以应用于产品质量控制。

通过对生产过程中质量数据的监测和分析,可以实现产品质量的控制和优化。

以下是一个产品质量控制的案例。

案例描述某工厂生产塑料袋,需要通过质量控制确保产品达到标准。

为此,工厂制定了质量控制计划,包括每小时抽取5个样本、每个样本5个塑料袋,共记录10批次数据。

质量数据由于每个样本包含5个塑料袋,所以每批次共抽取了50个塑料袋。

统计教学案例

统计教学案例

统计教学案例(经典版)编制人:__________________审核人:__________________审批人:__________________编制单位:__________________编制时间:____年____月____日序言下载提示:该文档是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。

文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!并且,本店铺为大家提供各种类型的经典范文,如工作报告、合同协议、演讲致辞、条据文书、策划方案、规章制度、心得体会、教学资料、作文大全、其他范文等等,想了解不同范文格式和写法,敬请关注!Download tips: This document is carefully compiled by this editor. I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you!Moreover, our store provides various types of classic sample essays, such as work reports, contract agreements, speeches, policy documents, planning plans, rules and regulations, insights, teaching materials, complete essays, and other sample essays. If you want to learn about different sample formats and writing methods, please stay tuned!统计教学案例统计教学案例统计教学案例1作为义务教育阶段学习的继续,初中阶段的数学学习将巩固,加深学生已形成的对数裾分析方法的理解,扩展学生已经获得的对不确定性和概率的经验。

统计与统计案例

统计与统计案例

统计与统计案例第一部分:统计的基本概念和原理统计是一门研究收集、整理、分析和解释数据的学科。

它在各个领域都有广泛的应用,包括科学研究、社会调查、市场分析等等。

统计的基本概念和原理对于理解和应用统计方法非常重要。

1.1 统计的定义统计是通过收集、整理、分析和解释数据来推断总体特征和规律的学科。

它可以帮助我们认识事物的本质和变化规律,从而进行决策和预测。

1.2 数据的类型在统计学中,数据可以分为两大类:定性数据和定量数据。

定性数据是描述事物性质、特征和类别的数据,例如性别、政治取向、产品类型等等。

定性数据常用于描述和推断总体的特征和规律。

定量数据是具有数量意义的数据,可以进行数值计算和比较。

例如身高、体重、销售额等等。

定量数据常用于测量和比较事物的数量差异和变化趋势。

1.3 统计的基本原理统计的基本原理包括随机性、规模效应和抽样误差。

•随机性指的是在统计过程中,数据的选择和变异都是有机会发生的。

通过随机抽取和处理数据,可以将个体特征和规律推广到总体上。

•规模效应指的是样本容量对统计推断的影响。

样本容量越大,假设检验的准确性也越高,结果的可靠性也就越高。

•抽样误差是由于从总体中选取有限的样本而引入的估计误差。

通过使用合适的抽样方法和增加样本容量,可以减小抽样误差。

第二部分:统计案例分析2.1 假设检验假设检验是统计推断的一种方法,用于检验关于总体参数的假设。

主要包括以下几个步骤:1.建立原假设(H0)和备择假设(H1);2.选择适当的统计检验方法;3.根据样本数据计算统计量的值;4.根据显著性水平和自由度确定拒绝域;5.比较统计量的值与拒绝域,得出结论。

假设检验的目的是通过样本数据对总体参数进行推断,判断某种差异是否具有统计学意义。

2.2 方差分析方差分析是一种用于比较多个总体均值差异的统计方法。

它主要包括单因素方差分析和多因素方差分析两种类型。

单因素方差分析用于比较一个因素(如不同治疗方法)对一个响应变量(如疾病治愈率)的影响。

小学数学一年级下册《统计》教学案例-精品文档资料

小学数学一年级下册《统计》教学案例-精品文档资料

新人教版小学数学一年级下册《统计》教学案例一年级下册的《统计》这一节课,我在两个班是用不同的情境引入的,效果截然不同。

案例一:(一年级五班)课前谈话:同学们,你们爱看中央电视台的少儿频道吗?学生们异口同声地回答“愿意”。

师:那么,你们喜欢中央电视台少儿频道的哪个主持人?学生七嘴八舌的互相说起自己最喜欢的主持人。

有的说喜欢鞠萍,有的说喜欢小鹿姐姐,有的喜欢月亮姐姐,有的喜欢红果果,还有董浩叔叔、绿泡泡等等。

(有的学生互相说起自己喜欢的主持人主持的节目)师:那么我们统计一下喜欢哪个主持人的同学最多好不好?学生立刻表示出很大的兴致。

师:怎么来统计呢?谁能想出好办法啊?生1:老师说主持人的名字。

喜欢的就举手。

师:这个办法不错,我们可以试一试。

生2:报告给小组长,小组长汇总一下大约就可以了。

师:不错,利用估算的方法。

你是个爱动脑筋的好孩子。

我们也可以试一试。

生3迫不及待地说:他的方法仅仅是个大约数,不准确。

要是喜欢两个主持人的人数差不多怎么办?我看可以用起立的方法,这种方法最恰当。

生4:我看可以用我们平时选班级干部的方法来统计。

就是用投票的方法,然后找几个同学到黑板上去画票。

这时班级的气氛非常的热烈,孩子们纷纷起来说出自己的方法。

也有的学生仍然沉浸在少儿节目中,没有动脑去思考我提出的问题。

师:老师这里有鞠萍姐姐、小鹿姐姐、月亮姐姐和红果果的头像,我们就来统计这四位主持人各有多少人喜欢,好不好?师:那么我们就按照生1的方法来统计一下好吗?谁到前面来帮帮老师呢?找两个学生到讲台前数。

把数的人数写到黑板上。

结果,两个同学数的人数对照不到一起。

怎么办?师:那我们采用第三个同学的方法来试试?还是请两名学生到前面数并且记录一下好吗?结果还是有问题。

师:那么我们采用第二个同学的方法来试试看?请小组长统计一下本小组的情况,然后个小组汇报一下。

各小组立刻行动起来统计汇报。

师:最后我们再试一下第四个同学的方法好吗?立刻有学生说:有些字我们不会写怎办?对啊,有什么好法子吗?生:用不同颜色的笔,用红色水彩笔表示菊萍姐姐,用绿色水彩笔表示小鹿姐姐,用蓝色水彩笔表示月亮姐姐,用紫色水彩笔表示红果果。

统计与统计案例PPT课件

统计与统计案例PPT课件
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
用样本估计总体
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
用样本估计总体 (文)某学校为了调查学生平均每周的上网时间(单 位:h)对学习产生的影响,从高三年级随机抽取了 100 名学生, 将所得数据整理后,画出频率分布直方图(如图),其中频率分 布直方图从左到右前 3 个小矩形的面积之比为 1:3:5,试估 计:
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
疑难误区警示 1.当总体数 N 不能被样本容量整除,用系统抽样法剔除 多余个体时,必须随机抽样. 2.注意中位数与平均数的区别,中位数可能不在样本数 据中.
专题七 第一讲
走向高考 ·二轮专题复习 ·新课工厂甲、乙、丙三个车
间生产了同一种产品,数量分别为 120 件,80 件,60 件,为
了解它们的产品质量是否存在显著差异,用分层抽样方法抽
取了一个容量为 n 的样本进行调查,其中从丙车间的产品中
抽取了 3 件,则 n=( )
A.9
B.10
C.12
D.13
[答案] D
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
某市有大型超市 200 家、中型超市 400 家、小型超市 1400 家.为掌握各类超市的营业情况,现按分层抽样方法抽取一个 容量为 100 的样本,应抽取中型超市________家.
[答案] 20
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
[解析] 属简单题,关键是清楚每一层的抽取比例都一样 是Nn .
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学

(新课标)2020版高考数学二轮复习专题四概率与统计第1讲统计与统计案例学案文新人教A版(最新整理)

(新课标)2020版高考数学二轮复习专题四概率与统计第1讲统计与统计案例学案文新人教A版(最新整理)
2.(2019·广东省七校联考)假设要考察某公司生产的狂犬疫苗的剂量是否达标,现用 随机数法从 500 支疫苗中抽取 50 支进行检验,利用随机数表抽取样本时,先将 500 支疫苗按 000,001,…,499 进行编号,若从随机数表第 7 行第 8 列的数开始向右读,则抽取的第 3 支 疫苗的编号为________.(下面摘取了随机数表的第 7 行至第 9 行)
归方程;
(2)小李在该市开了一家洗车店,洗车店每天的平均收入与 AQI 指数存在相关关系如表
3:
表3
[0,
[400, [600,800 [800,1
M
[200,400)
200)
600)
)
000]
日均收入 (元)
- 2 000
- 1 000
2 000
6 000
8 000
根据表 3 估计小李的洗车店 2017 年 11 月份每天的平均收入.
(2)能否有 95%的把握认为男、女顾客对该商场服务的评价有差异?
附:K2=错误!。
P(K2≥k0) 0.050 0.010 0.001
10。
k0
3.841 6.635
828
解:(1)由调查数据知,男顾客中对该商场服务满意的比率为错误!=0.8,因此男顾客对该 商场服务满意的概率的估计值为 0.8.
s错误!=错误!×[(-7)2+(-4)2+42+22+52]=22, s2,2=错误!×[(-6)2+42+(-1)2+12+22]=11。6, 因为 88>85,11。6<22,所以获数学二等奖考生较获语文二等奖考生综合素质测试的平均 分高,但是成绩差距较大.
回归分析(综合型)
[典型例题]
某省的一个气象站观测点在连续 4 天里记录的 AQI 指数 M 与当天的空气水平可见度
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

增加.为调查该地区某种野生动物的数量,将其分成面积相近的 200 个地块,从这些
地块中用简单随机抽样的方法抽取 20 个作为样区,调查得到样本数据(xi,yi)(i=1,
2,…,20),其中 xi 和 yi 分别表示第 i 个样区的植物覆盖面积(单位:公顷)和这种野
20
20
20
生动物的数量,并计算得∑ i=1xi=60,i∑=1yi=1
A.10
7
B.18
C.20
真题感悟 考点整合
D.36
热点聚焦 分类突破
@《创新设计》
解析 因为直径落在区间[5.43,5.47)内的频率为0.02×(6.25+5.00)=0.225,所以 个数为0.225×80=18.故选B. 答案 B
8
真题感悟 考点整合
热点聚焦 分类突破
@《创新设计》
4.(2020·全国Ⅱ卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所
解析 X 的可能取值为 1,2,3,4,四种情形的数学期望 E(X)=1×p1+2×p2+3×p3 +4×p4 都为 2.5,方差 D(X)=[1-E(X)]2×p1+[2-E(X)]2×p2+[3-E(X)]2×p3+[4 -E(X)]2×p4,标准差为 D(X).A 选项的方差 D(X)=0.65;B 选项的方差 D(X)= 1.85;C 选项的方差 D(X)=1.05;D 选项的方差 D(X)=1.45.可知选项 B 的情形对应 样本的标准差最大.故选 B. 答案 B
4
且∑ i=1pi=1,则下面四种情形中,对应样本的标准差最大的一组是( ) A.p1=p4=0.1,p2=p3=0.4 B.p1=p4=0.4,p2=p3=0.1 C.p1=p4=0.2,p2=p3=0.3 D.p1=p4=0.3,p2=p3=0.2
5
真题感悟 考点整合
热点聚焦 分类突破
@《创新设计》
200,∑ i=1
(xi--x)2=80,i∑2=01
(yi--y)2=9 000,
20

i=1
(xi--x)(yi--y)=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种
野生动物数量的平均数乘以地块数);
9
真题感悟 考点整合
热点聚焦 分类突破
@《创新设计》
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01); (3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获
13
真题感悟 考点整合
热点聚焦 分类突破
(3)平均数:样本数据的算术平均数,即-x=1n(x1+x2+…+xn). (4)方差与标准差. s2=1n[(x1--x)2+(x2--x)2+…+(xn--x)2], s= 1n[(x1--x)2+(x2--x)2+…+(xn--x)2].
12
真题感悟 考点整合
热点聚焦 分类突破
@《创新设计》
考点整合 1.抽样方法
抽样方法包括简单随机抽样、分层抽样,两种抽样方法都是等概率抽样,体现了抽 样的公平性,但又各有其特点和适用范围. 2.统计中的四个数据特征 (1)众数:在样本数据中,出现次数最多的那个数据. (2)中位数:在样本数据中,将数据按大小顺序排列,位于最中间的数据.如果数据 的个数为偶数,就取中间两个数据的平均数作为中位数.
得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,
并说明理由. 附:相关系数 r=
∑ i=n∑i=1n1((xix-i--x-)x)2∑ i(=n1 y(i-y-yi-)-y)2, 2≈1.414.
10
真题感悟 考点整合
热点聚焦 分类突破
@《创新设计》
解 (1)由已知得样本平均数-y=210∑ i2=01yi=60,从而该地区这种野生动物数量的估计值
3
真题感悟 考点整合
热点聚焦 分类突破
@《创新设计》
真题感悟
1.(2019·全国Ⅱ卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的 成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效 评分与9个原始评分相比,不变的数字特征是( )
A.中位数
B.平均数
C.方差
@《创新设计》
1
真题感悟 考点整合
热点聚焦 分类突破
@《创新设计》
第1讲 统计与统计案例
2
真题感悟 考点整合
热点聚焦 分类突破
@《创新设计》
高考定位 1.抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要 以选择题、填空题形式命题,难度较小;2.注重知识的交汇渗透,统计与概率、回 归分析与概率是近年命题的热点,2018年、2019年和2020年在解答题中均有考查.
为 60×200=12 000.
(2)样本(xi,yi)(i=1,2,…,20)的相关系数 r=
20

i=1
(xi--x)(yi--y)
20

i=1
(xi--x)2∑ i2=01
(yi--y)2

800 80×9
=2 000
3
2≈0.94.
11
真题感悟 考点整合
热点聚焦 分类突破
@《创新设计》
(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样. 理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关性. 由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很 大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样 本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
6
真题感悟 考点整合
热点聚焦 分类突破
@《创新设计》
3.(2020·天津卷)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9 组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下 频 率 分 布 直 方 图 , 则 在 被 抽 取 的 零 件 中 , 直 径 落 在 区 间 [5.43 , 5.47) 内 的 个 数 为 ()
D.极差
解析 中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因
而去掉1个最高分和1个最低分,中位数是不变的,平均数、方差、极差均受影响.

答案 A
4
真题感悟 考点整合
热点聚焦 分类突破
@《创新设计》
2.(2020·全国Ⅲ卷)在一组样本数据中,1,2,3,4 出现的频率分别为 p1,p2,p3,p4,
相关文档
最新文档