统计.板块二.频率直方图.学生版(高中数学必修题库)

合集下载

部编版高中数学必修二第九章统计带答案重点归纳笔记

部编版高中数学必修二第九章统计带答案重点归纳笔记

(名师选题)部编版高中数学必修二第九章统计带答案重点归纳笔记单选题1、从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70)、[70,74)、⋯、[94,98],并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是()A.20B.40C.64D.802、有13名同学参加百米竞赛,预赛成绩各不相同,要取前6名参加决赛,小明同学已经知道了自己的成绩,为了判断自己是否能进入决赛,他还需要知道13名同学成绩的()A.平均数B.众数C.中位数D.方差3、如图,是根据某班学生在一次数学考试中的成绩画出的频率分布直方图,若由直方图得到的众数,中位数和平均数(同一组中的数据用该组区间的中点值为代表)分别为a,b,c,则()A.b>a>c B.a>b>c C.a+c2>b D.b+c2>a4、抽样统计甲射击运动员10次的训练成绩分别为86,85,88,86,90,89,88,87,85,92,则这10次成绩的80%分位数为()A.88.5B.89C.91D.89.55、设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为()A.0.01B.0.1C.1D.106、某学校在校学生有2000人,为了增强学生的体质,学校举行了跑步和登山比赛,每人都参加且只参加其中一项比赛,高一、高二、高三年级参加跑步的人数分别为a,b,c,且a:b:c=2:5:3,全校参加登山的人.为了了解学生对本次比赛的满意程度,按分层抽样的方法从中抽取一个容量为200的样本进数占总人数的14行调查,则应从高三年级参加跑步的学生中抽取()A.15人B.30人C.40人D.45人7、根据气象学上的标准,连续5天的日平均气温低于10℃即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下:①平均数x̅<4;②平均数x̅<4且极差小于或等于3;③平均数x̅<4且标准差s≤4;④众数等于5且极差小于或等于4.则4组样本中一定符合入冬指标的共有()A.1组B.2组C.3组D.4组8、国内生产总值(GDP)指按市场价格计算的一个国家(或地区)所有常住单位在一定时期内生产活动的最终成果.下图是我国2014~2018年连续5年的GDP及增速图,则下列结论错误的是()A.连续5年中我国GDP保持6%以上的增长B.2014~2018年我国GDP增速整体呈现下降趋势C.2018年GDP为这5年最高,GDP增速为这5年最低D.2018年GDP相对2014年GDP增长了一倍以上多选题9、2020年春节前后,一场突如其来的新冠肺炎疫情在全国蔓延.疫情就是命令,防控就是责任.在党中央的坚强领导和统一指挥下,全国人民众志成城、团结一心,掀起了一场坚决打赢疫情防控阻击战的人民战争.下侧的图表展示了2月14日至29日全国新冠肺炎疫情变化情况,根据该折线图,下列结论正确的是()A.16天中每日新增确诊病例数量在下降且19日的降幅最大B.16天中每日新增确诊病例的中位数小于新增疑似病例的中位数C.16天中新增确诊、新增疑似、新增治愈病例的极差均大于2000D.21日至29日每日新增治愈病例数量均大于新增确诊与新增疑似病例之和10、已知一组数据为-1,1,5,5,0,则该组数据的()A.众数是5B.平均数是2C.中位数是5D.方差是32511、在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间的中点值作代表,则下列说法中正确的是()A.成绩在[70,80)内的考生人数最多B.不及格的考生人数为1000C.考生竞赛成绩的平均分约为70.5分D.考生竞赛成绩的中位数为75分填空题12、在某网店购买之前未曾使用过的商品时,先翻看该商品的相关评价.从统计角度来看,这也是一种抽样调查,这种抽样调查______.(填写“具有代表性”“不具有代表性”)请说明理由.13、《中国诗词大会》是央视科教频道推出的一档以“赏中华诗词,寻文化基因,品生活之美”为宗旨的文化类演播室益智竞赛节目,邀请全国各个年龄段、各个领域的诗词爱好者共同参与诗词知识比拼.“百人团”由一百多位来自全国各地的不同年龄段的选手组成,按照年龄分组统计如下表:6人参加挑战,则从年龄组[7,20),[20,40),[40,80]中抽取的挑战者的人数分别为______.部编版高中数学必修二第九章统计带答案(四十)参考答案1、答案:D分析:利用频率分布直方图可计算出评分在区间[82,86)内的影视作品数量.由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为400×0.05×4=80.故选:D.2、答案:C分析:成绩由小到大排列,能否进入决赛就看小明成绩排名是否在第7以前即可得解.把13名同学成绩按由大到小排列,取成绩靠前的6个成绩进入决赛,即最中间一个数之前的6个成绩进入决赛,13个成绩按由大到小排列时,最中间一个数即是中位数.故选:C3、答案:B解析:根据频率分布直方图读出众数a,计算中位数b,平均数c,再比较大小.由频率分布直方图可知:众数a=70+802=75;中位数应落在70-80区间内,则有:0.01×10+0.015×10+0.015×10+0.03×(b−70)=0.5,解得:b=2203=7313;平均数c=0.01×10×40+502+0.015×10×50+602+0.015×10×60+702+0.03×10×70+802+0.025×10×80+902+0.005×10×90+1002=4.5+8.25+9.75+22.5+21.25+4.75=71所以a>b>c故选:B小提示:从频率分布直方图可以估计出的几个数据:(1)众数:频率分布直方图中最高矩形的底边中点的横坐标;(2)平均数:频率分布直方图每组数值的中间值乘以频率后相加;(3)中位数:把频率分布直方图分成两个面积相等部分的平行于y轴的直线横坐标.4、答案:D分析:将数据从小到大排列,计算10×80%=8,得到答案.甲射击运动员10次的训练成绩从小到大分别为:85,85,86,86,87,88,88,89,90,92.10×80%=8,这10次成绩的80%分位数为:89+90=89.5.2故选:D.5、答案:C分析:根据新数据与原数据关系确定方差关系,即得结果.因为数据ax i+b,(i=1,2,⋯,n)的方差是数据x i,(i=1,2,⋯,n)的方差的a2倍,所以所求数据方差为102×0.01=1故选:C小提示:本题考查方差,考查基本分析求解能力,属基础题.6、答案:D=1500,再根据分层抽样的方法求解即可得答案. 分析:由题知全校参加跑步的人数为2000×34=1500,解:由题意,可知全校参加跑步的人数为2000×34所以a+b+c=1500.因为a:b:c=2:5:3,所以c=1500×3=450.2+5+3因为按分层抽样的方法从中抽取一个容量为200的样本,=45.所以应从高三年级参加跑步的学生中抽取的人数为450×2002000故选:D7、答案:B分析:举反例否定①;反证法证明②符合要求;举反例否定③;直接法证明④符合要求.①举反例:0,0,0,4,11,其平均数x̅=3<4.但不符合入冬指标;②假设有数据大于或等于10,由极差小于或等于3可知,则此组数据中的最小值为10−3=7,此时数据的平均数必然大于7,与x̅<4矛盾,故假设错误.则此组数据全部小于10. 符合入冬指标;③举反例:1,1,1,1,11,平均数x̅=3<4,且标准差s=4.但不符合入冬指标;④在众数等于5且极差小于等于4时,则最大数不超过9.符合入冬指标.故选:B.8、答案:D分析:根据表中的数据,依次分析各选项即可得答案.解:根据表中数据,对于A选项,2018年国民生产总值增长率最低,为6.6%左右,故连续5年中我国GDP保持6%以上的增长,正确;对于B选项,根据增长率折线图可知,2014~2018年我国GDP增速整体呈现下降趋势,故正确;对于C选项,2018年GDP为90万亿,为5年最高,GDP增速为6.6%左右,为5年最低,故正确;对于D选项,由表中数据,2014年GDP为64万亿左右,2018年GDP为90万亿左右,故没有增长一倍以上,故错误.故选:D9、答案:BCD分析:根据折线图,中位数、极差的概念,判断各选项.20日新增确诊病例数量比19日多,A错;新增确诊病例的中位数小于新增疑似病例的中位数在21、22日左右,比较可得B正确;新增确诊极差>2500−500=2000、新增疑似极差>2300−200>2000、新增治愈病例的极差>3500−1500=2000,均大于2000,C正确;21日至29日每日新增治愈病例数量均大于新增确诊与新增疑似病例之和,D正确.故选:BCD.小提示:本题考查统计图表,考查折线图,中位数、极差等概念,解题关键是正确认识统计图,能从图表中抽象出所需数据,并对数据进行处理.10、答案:ABD,对比选项得到答案.分析:计算数据的众数为5,平均数为2,中位数为1,方差为325数据为-1,1,5,5,0,的众数为5,A正确;数据的平均数为−1+1+5+5+05=2,B正确;数据的中位数为1,C错误;数据的方差为(−1−2)2+(1−2)2+(5−2)2+(5−2)2+(0−2)25=325,D正确.故选:ABD.11、答案:ABC分析:读懂题目提供的直方图,根据图中的数据逐项分析即可.对于A,由频率分布直方图可得,成绩在[70,80)内的面积最大,因此考生人数最多,故A正确;对于B,由频率分布直方图可得,成绩在[40,60)内的频率为10×(0.01+0.015)=0.25,因此不及格的人数为4000×0.25=1000,故B正确;对于C,由频率分布直方图可得,平均分约为:45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5(分),故C正确;对于D,因为成绩在[40,70)内的频率为10×(0.01+0.015+0.02)=0.45,在[70,80)内的频率为0.3,所以中位数为70+10×0.5−0.450.3≈71.67,故D错误;故选:ABC.12、答案:不具有代表性分析:根据给定条件,利用抽样调查具有的性质去分析判断作答.这种抽样调查是对愿意写评价的购买者的调查,或者是对这个商品有强烈意愿(喜爱或憎恶)的购买者的调查,不具有广泛性,不具有代表性.所以答案是:不具有代表性13、答案:1,3,2分析:根据分层抽样的特点直接计算即可.“百人团”的总人数为18+54+36=108,则用分层抽样的方法抽取的挑战者的年龄在[7,20)的人数为6×18 108=1,年龄在[20,40)的人数为6×54108=3,年龄在[40,80]的人数为6×36108=2.所以从年龄组[7,20),[20,40),[40,80]中抽取的挑战者的人数分别为1,3,2.所以答案是:1,3,2.。

部编版高中数学必修二第九章统计带答案考点专题训练

部编版高中数学必修二第九章统计带答案考点专题训练

(名师选题)部编版高中数学必修二第九章统计带答案考点专题训练单选题1、下列抽样方法是简单随机抽样的是( )A .某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动B .从10个手机中逐个不放回地随机抽取2个进行质量检验C .从空间直角坐标系中抽取10个点作为样本D .饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查2、某工厂一年中各月份的收入、支出情况的统计如图所示,下列说法中错误的是( )A .收入最高值与收入最低值的比是3︰1B .结余最高的月份是7月C .1至2月份的收入的变化率与4至5月份的收入的变化率相同D .前6个月的平均收入为40万元3、3个数1,3,5的方差是( )A .23B .34C .2D .834、为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,某机构调查了当地的中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:①样本数据落在区间[300,500)的频率为0.45;②如果规定年收入在500万元以内的企业才能享受减免税政策,估计有55%的当地中小型企业能享受到减免税政策;③样本的中位数为480万元.其中正确结论的个数为A.0B.1C.2D.35、一组数据由10个数组成,将其中一个数由4改为1,另一个数由6改为9,其余数不变,得到新的10个数,则新的一组数的方差相比原先一组数的方差的增加值为()A.2B.3C.4D.56、某射击运动员6次的训练成绩分别为:88,91,89,88,86,85,则这6次成绩的第70百分位数为()A.89B.89.5C.90D.90.57、某老师为了解某班50名同学在家学习的情况,决定将本班学生依次编号为01,02,⋅⋅⋅,50.利用下面的随机数表选取10名学生调查,选取方法是从下面随机数表的第1行第2列开始由左到右依次读取两个数字,则选出来的第4名学生的编号为()7 2 5 6 0 8 1 3 0 2 5 8 3 2 4 9 8 7 0 2 4 8 1 2 9 7 2 8 0 19 8 3 1 0 4 9 2 3 1 4 9 3 5 8 2 0 9 3 6 2 4 4 8 6 9 6 9 3 87 4 8 1A.25B.24C.29D.198、为了进一步推动全市学习型党组织、学习型社会建设,某市组织开展“学习强国”知识测试,从全体测试人员中随机抽取了一部分人的测试成绩,得到频率分布直方图如图所示.假设同组中的每个数据都用该组区间的中点值代替,则估计这部分人的测试成绩的平均数和中位数分别是()A.85,87.5B.86.75,86.67C.86.75,85D.85,85多选题9、一组数据6,7,8,a,12的平均数为8,则此组数据的()A.众数为8B.极差为6C.中位数为8D.方差为22510、已知下列各组数据,则其平均数和中位数相等的是()A.18,32,−6,14,8,12B.21,4,7,14,−3,11C.5,4,6,5,7,3D.−1,3,1,0,0,−311、(多选)下列调查方式合适的是()A.为了了解炮弹的杀伤力,采用抽样调查的方式B.为了了解全国中学生的睡眠状况,采用普查的方式C.为了了解人们保护水资源的意识,采用抽样调查的方式D.检查一批待售袋装牛奶中的细菌是否超标,采用普查的方式填空题12、某单位有员工900人,其中女员工有360人,为做某项调查,拟采用分层抽样的方法抽取容量为150的样本,则应抽取的男员工人数是_______________________.13、由6个实数组成的一组数据的方差为S12,将其中一个数5改为2,另一个数4改为7 ,其余的数不变,得到新的一组数据的方差为S22,则S22−S12=________.部编版高中数学必修二第九章统计带答案(七)参考答案1、答案:B分析:根据简单随机抽样的特点逐项判断可得答案.对于A,某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动,每个人被抽到的机会不相等,故错误;对于B,从10个手机中逐个不放回地随机抽取2个进行质量检验,是简单随机抽样,故正确;对于C,从空间直角坐标系中抽取10个点作为样本,由于被抽取的样本的总体个数是无限的,所以不是简单随机抽样,故错误;对于D,饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查,不是逐个抽取,所以不是简单随机抽样,故错误.故选:B.2、答案:D分析:根据统计图对选项逐一分析,由此确定说法错误的选项.最高收入90万元,最低收入30万元,所以A正确.结余最高的为7月,结余60万元,所以B正确.根据两点连线的斜率可知,1至2月份的收入的变化率与4至5月份的收入的变化率相同,所以C正确.前6个月的平均收入为40+60+30+30+50+606=45万元,所以D选项错误.故选:D3、答案:D分析:由题得3个数的平均数为3,再利用方差公式求解.由题得3个数的平均数为3,所以S2=13[(1−3)2+(3−3)2+(5−3)2]=83.故选:D4、答案:D解析:根据直方图求出a=0.0025,求出[300,500)的频率,可判断①;求出[200,500)的频率,可判断②;根据中位数是从左到右频率为0.5的分界点,先确定在哪个区间,再求出占该区间的比例,求出中位数,判断③.由(0.001+0.0015+0,002+0.0005+2a)×100=1,a=0.0025,[300,500)的频率为(0.002+0.0025)×100=0.45,①正确;[200,500)的频率为(0.0015+0.002+0.0025)×100=0.55,②正确;[200,400)的频率为0.3,[200,500)的频率为0.55,中位数在[400,500)且占该组的45,故中位数为400+0.5−0.30.25×100=480,③正确.故选:D.小提示:本题考查补全直方图,由直方图求频率和平均数,属于基础题5、答案:B分析:先判断出平均数不变,然后分别表示出原先一组数的方差和新数据的方差,作差化简即可得到答案. 一个数由4改为1,另一个数由6改为9,故该组数据的平均数x不变,设没有改变的八个数分别为x1,x2,x3,⋯,x8,原先一组数的方差s12=110[(x1−x)2+(x2−x)2+(x3−x)2+⋯+(x8−x)2+(4−x)2+(6−x)2],新数据的方差s22=110[(x1−x)2+(x2−x)2+(x3−x)2+⋯+(x8−x)2+(1−x)2+(9−x)2所以s22−s12=110[(1−x)2+(9−x)2−(4−x)2−(6−x)2]=110(1−2x+x2+81−18x+x2−16+8x−x2−36+12x−x2)=3,故选:B.小提示:关键点点睛:该题考查了平均数与方差的求解,正确解题的关键是熟练掌握方差的计算公式.6、答案:A分析:先将数据按从小到大的顺序排列,计算6×70%=4.2不是整数,则所求的是从小到大排列的第5位数6次考试数学成绩从小到大为:85,86,88,88,89,91,6×70%=4.2,∴这名学生6次训练成绩的第70百分位数为89 .故选:A7、答案:C分析:利用随机表法从第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个即可求解.从题中随机数表的第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个可得:25 ,30 ,24,2 9,19,10 ,49 ,23,14,20,故选出来的第4名学生的编号为29.故选:C.8、答案:B分析:根据平均数和中位数的定义求解即可由题意可知,平均数约为(0.03×77.5+0.05×82.5+0.06×87.5+0.04×92.5+0.02×97.5)×5=86.75;因为前2组的频率和为5×0.03+5×0.05=0.4<0.5,前3组的频率和为5×0.03+5×0.05+5×0.06=0.7>0.5,所以中位数在[85,90)内,设中位数为x,则5×0.03+5×0.05+(x−85)×0.06=0.5,解得x≈86.67.所以估计这部分人的测试成绩的平均数和中位数分别是86.75,86.67.故选:B.9、答案:BD分析:利用平均数公式可求a=7,然后逐项分析即得.由题可得6+7+8+a+125=8,∴a=7,∴此组数据众数为7,极差为12−6=6,中位数为7,方差为(6−8)2+(7−8)2+(7−8)2+(8−8)2+(12−8)25=225.故选:BD.10、答案:ABCD分析:分别计算出四组数据的平均数和中位数,从而作出判断.运用计算公式x̅=1n(x1+x2+⋅⋅⋅+x n),可知四组数据的平均数分别为13、9、5、0,根据中位数的定义:把每组数据从小到大排列,取中间一位数(或两位的平均数)即为该组数据的中位数,可知四组数据的中位数分别为13、9、5、0,∴每组数据的平均数和中位数均对应相等,故选:ABCD11、答案:AC分析:根据普查和抽样方法的特点判断.了解炮弹杀伤力的过程中具有破坏性,所以采用抽样调查的方式;了解全国中学生的睡眠状况,工作量大,所以采用抽样调查的方式;了解人们保护水资源的意识,工作量大,所以采用抽样调查的方式;检查一批待售袋装牛奶中的细菌是否超标,具有毁损性,所以采用抽样调查的方式.故选:AC.12、答案:90分析:按照分层抽样的定义,按照比例抽取即可由题意,设应抽取的男员工人数是x则900−360900=x150解得:x=90所以答案是:9013、答案:2分析:根据平均数和方差的定义进行求解即可.因为将其中一个数5改为2,另一个数4改为7,其余的数不变,所以这6个实数组成的一组数据的平均数不变,设为x,设没有变化的4个数与平均数差的平方和为S,=2,所以S22−S12=[S+(2−x)2+(7−x)2]−[S+(5−x)2+(4−x)2]6所以答案是:2。

高二数学频率分布直方图和折线图正式版

高二数学频率分布直方图和折线图正式版

高二数学频率分布直方图和折线图正式版文档资料可直接使用,可编辑,欢迎下载第20课时频率分布直方图和折线图【学习导航】知识网络学习要求1.频率分布直方图的作法,频率分布直方图更加直观形象地反映出总体分布的情况; 2.频率分布折线图的作法,优点是反映了数据的变化趋势,如果样本容量足够大,分组的组距足够小,则这条折线将趋于一条曲线,称为总体分布的密度曲线。

【课堂互动】自学评价案例1 下表是某学校一个星期中收交来的失物件数,请将5天中收交来的失物数用条形图(1)在EXCEL 工作表中输入数据,光标停留在数据区中; (2)选择“插入/图表”,在弹出的对话框中点击“柱形图”;(3)点击“完成”,即可看到如下频数条形图.案例2 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm 。

试作出该样本的频率分布直方图和折线图. 【解】上一课时中, 已经制作好频率分布表,在此基础上, 我们绘制频率分布直方图. (1)作直角坐标系,以横轴表示身高,纵轴表示组距频率;(2)在横轴上标上150.5,153.5,156.5, …,180.5表示的点。

(为方便起见,起始点150.5可适当前移);(3)在上面标出的各点中,分别以连结相邻两点的线段为底作矩形,高等于该组的组距频率至此,就得到了这组数据的频率分布直方图,如下图频率同样可以得到这组数据的折线图. 频率150.5 153.5 156.5 159.5 162.5 165.5 168.5 171.5 174.5 177.5 180.8 【小结】1.利用直方图反映样本的频率分布规律, 这样的直方图称为频率分布直方图(frequencyhistogram, 简称频率直方图。

2. 频率直方图比频率分布表更直观、形象地反映了样本的分布规律。

3.如果将频率分布直方图中相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本组数据的频率折线图(frequency polygon4.频率分布折线图的的首、尾两端如何处理: 取值区间两端点须分别向外延伸半个组距,并取此组距上的x 轴上的点与折线的首、尾分别相连5.如果将样本容量取得足够大,分组的组距取得足够小,则这条折线趋于一条曲线,这一曲线称为总体分布的密度曲线。

高中数学必修二第九章统计知识点归纳总结(精华版)(带答案)

高中数学必修二第九章统计知识点归纳总结(精华版)(带答案)

高中数学必修二第九章统计知识点归纳总结(精华版)单选题1、下列问题中,最适合用简单随机抽样方法抽样的是()A.某县从该县中、小学生中抽取200人调查他们的视力情况B.从15种疫苗中抽取5种检测是否合格C.某大学共有学生5600人,其中专科生有1300人、本科生3000人、研究生1300人,现抽取样本量为280的样本调查学生利用因特网查找学习资料的情况,D.某学校兴趣小组为了了解移动支付在大众中的熟知度,要对15−75岁的人群进行随机抽样调查答案:B解析:依次判断每个选项的合适的抽样方法得到答案.A. 中学,小学生有群体差异,宜采用分层抽样;B. 样本数量较少,宜采用简单随机抽样;C. 中专科生、本科生、研究生有群体差异,宜采用分层抽样;D. 年龄对于移动支付的了解有较大影响,宜采用分层抽样;故选:B.小提示:本题考查了抽样方法,意在考查学生对于抽样方法的掌握情况.2、10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则有()A.a>b>c B.b>c>a C.c>a>b D.c>b>a答案:D分析:将数据从小到大重新排列(也可以是从大到小),计算出a,b,c的值即可比较大小.解:重新排列得:10,12,14,14,15,15,16,17,17,17.则有:a=110×(15+17+14+10+15+17+17+16+14+12)=14.7,b=12×(15+15)=15,c=17.所以c>b>a 故选:D.3、下列调查方式合适的是()A.为了了解一批炮弹的杀伤半径,采用普查的方式B.为了了解一批玉米种子的发芽率,采用普查的方式C.为了了解一条河流的水质,采用抽样调查的方式D.为了了解一个寝室的学生(共6个人)每周体育锻炼的时间,采用抽样调查的方式答案:C分析:根据普查和抽样调查的特征,即可求解.个体数少且易于完成的可以采用普查的方式;个体数量多,工作量大,或破坏性大,不易完成的可以采用抽样调查的方式.故选:C.4、为保障食品安全,某监管部门对辖区内一家食品企业进行检查,现从其生产的某种产品中随机抽取100件作为样本,并以产品的一项关键质量指标值为检测依据,整理得到如下的样本频率分布直方图.若质量指标值在[25,35)内的产品为一等品,则该企业生产的产品为一等品的概率约为()A.0.38B.0.61C.0.122D.0.75答案:B×组距,即可得解.分析:利用频率=频率组距根据频率分布直方图可知,质量指标值在[25,35)内的概率P=(0.080+0.042)×5=0.122×5=0.61故选:B5、某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图,90后从事互联网行业岗位分布条形图,则下列结论错误的是()注:90后指1990年及以后出生,80后指1980−1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中从事技术和运营岗位的人数占总人数的三成以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.互联网行业中从事运营岗位的人数90后一定比80前多D.互联网行业中从事技术岗位的人数90后一定比80后多答案:D解析:根据整个互联网行业从业者年龄分布饼状图、90后从事互联网行业岗位分布条形图,对四个选项逐一分析,即可得出正确选项.对于选项A,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术和运营岗位的人数占的比分别为39.6%和17%,则“90后”从事技术和运营岗位的人数占总人数的56%×(39.6%+17%)≈31.7%.“80前”和“80后”中必然也有从事技术和运营岗位的人,则总的占比一定超过三成,故选项A正确;对于选项B,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术岗位的人数占的比为39.6%,则“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%.“80前”和“80后”中必然也有从事技术岗位的人,则总的占比一定超过20%,故选项B正确;对于选项C,“90后”从事运营岗位的人数占总人数的比为56%×17%≈9.5%,大于“80前”的总人数所占比3%,故选项C正确;选项D,“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%,“80后”的总人数所占比为41%,条件中未给出从事技术岗位的占比,故不能判断,所以选项D错误.故选:D.小提示:关键点点睛:本题考查利用扇形统计图和条形统计图解决实际问题,解本题的关键就是利用条形统计图中“90后”事互联网行业岗位的占比乘以“90后”所占总人数的占比,再对各选项逐一分析即可.6、下表是某校校级联欢晚会比赛中12个班级的得分情况,则得分的30百分位数是()答案:D分析:根据百分位数的定义求解即可.12×30%=3.6,把12个班级的得分按照从小到大排序为7,7,8,9,9,10,10,10,11,13,13,14,可得30百分位数是第4个得分数,即9.故选:D7、为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间答案:C分析:根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.02+0.04=0.06=6%,故A正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.04+0.02×3=0.10=10%,故B正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.10+0.14+0.20×2=0.64=64%> 50%,故D正确;该地农户家庭年收入的平均值的估计值为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+ 9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),超过6.5万元,故C错误.综上,给出结论中不正确的是C.故选:C.小提示:本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的×组距.估计值.注意各组的频率等于频率组距8、下列调查方式合适的是().A.为了了解一批头盔的抗压能力,采用普查的方式B.为了了解一批玉米种子的发芽率,采用普查的方式C.为了了解一条河流的水质,采用抽查的方式D.为了了解一个寝室的学生(共5个人)每周体育锻炼的时间,采用抽查的方式答案:C分析:根据抽查和普查的特点,对每个选项进行逐一分析,即可判断和选择.对于选项A,采用普查的方式测试头盔的抗压能力,成本较高,不适合,故A错误;对于选项B,采用普查的方式测试玉米种子的发芽率,较为繁琐且工作量较大,不适合,故B错误;对于选项C,采用抽查的方式了解河流的水质,适合,故C正确;对于选项D,为了了解5个人每周体育锻炼的时间,适合采用普查的方式,故D错误.故选:C.多选题9、有一组互不相等....的数组成的样本数据x1、x2、⋯、x9,其平均数为a(a≠x i,i=1、2、⋯、9),若插入一个数a,得到一组新的数据,则()A.两组样本数据的平均数相同B.两组样本数据的中位数相同C.两组样本数据的方差相同D.两组样本数据的极差相同答案:AD分析:利用平均数公式可判断A选项;利用中位数的定义可判断B选项;利用方差公式可判断C选项;利用极差的定义可判断D选项.由已知可得x1+x2+⋯+x9=9a.(9a+a)=a,与原数据的平均数相等,A对;对于A选项,新数据的平均数为110对于B选项,不妨设x1<x2<⋯<x9,则原数据的中位数为x5,(max{a,x4}+x5)<x5,若a<x5,则中位数为12(x5+min{a,x6})>x5,B错;若a>x5,则中位数为12[(x1−a)2+(x2−a)2+⋯(x9−a)2+(a−a)2]对于C选项,新数据的方差为s′2=110[(x1−a)2+(x2−a)2+⋯(x9−a)2]=s2,C错;<19对于D选项,不妨设x1<x2<⋯<x9,则x1<a<x9,故新数据的极差仍为x9−x1,D对.故选:AD.10、某中学举行安全知识竞赛,对全校参赛的1000名学生的得分情况进行了统计,把得分数据按照[50,60),[60,70),[70,80),[80,90),[90,100]分成了5组,绘制了如图所示的频率分布直方图,根据图中信息,下列说法正确的是()A.这组数据的极差为50B.这组数据的众数为76D.这组数据的第75百分位数为85C.这组数据的中位数为5407答案:CD分析:根据频率分布直方图一一分析即可.解:对于A:由频率分布图无法得到这组数据的最大值和最小值,故这组数据的极差无法准确判断,故A错误;(70+80)=75,故B错误;数据的众数为12(0.005+0.02+0.035)×10=0.6>0.5,(0.005+0.02)×10=0.25<0.5,所以中位数位于[70,80)之间,设中位数为x,则(0.005+0.02)×10+(x−70)×0.035=0.5,解得x=540,7,故C正确;即这组数据的中位数为5407∵(0.005+0.02+0.035)×10=0.6,(0.005+0.02+0.035+0.03)×10=0.9,故估计第75分位数是80+0.75−0.6×10=85,故D正确;0.3故选:CD11、某环保局对辖区内甲、乙、丙、丁四个地区的环境治理情况进行检查督导,若连续10天,每天空气质量指数(单位:μg/m 3)不超过100,则认为该地区环境治理达标,否则认为该地区环境治理不达标.根据连续10天检查所得数据的数字特征推断,环境治理一定达标的地区是( ) A .甲地区:平均数为80,方差为40B .乙地区:平均数为50,众数为40 C .丙地区:中位数为50,极差为60D .丁地区:极差为10,80%分位数为90 答案:AD分析:根据平均数、方差、众数、中位数、极差、百分位数的知识对选项进行分析,从而确定正确选项. 设每天的空气质量指数为x i (i =1,2,⋯,10),则方差S 2=110∑(x i −x )210i=1. 对于A 选项,由110∑(x i −80)2=4010i=1,得∑(x i −80)210i=1=400,如果这10天中有1天的空气质量指数超过100,则必有∑(x i −80)210i=1>400矛盾, 所以这10天每天的空气质量指数都不超过100,A 正确.对于B 选项,有8天为40,有1天为150,有1天为30,此时:平均数为50,众数为40, 但该地区环境治理不达标,所以B 选项错误.对于C 选项,第1天为110,后面9天为50,此时中位数为50,极差为60, 但该地区环境治理不达标,所以C 选项错误.对于D 选项,如果最大值超过100,根据极差为10,则最小值超过90, 这与80%分位数为90矛盾,故最大值不超过100,D 正确. 故选:AD 填空题12、已知一组数据2x 1+4,2x 2+4,2x 3+4,2x 4+4,的平均数和方差均为4,则x 1+1,x 2+1,x 3+1,x 4+1的方差为______________. 答案:1分析:根据2x 1+4,2x 2+4,2x 3+4,2x 4+4,的平均数和方差均为4,得到x 1+x 2+x 3+x 4=0,x 12+x 22+x 32+x 42=4,从而求出x 1+1,x 2+1,x 3+1,x 4+1的平均数和方差.由题意得:2x 1+4+2x 2+4+2x 3+4+2x 4+4=16,解得:2x1+2x2+2x3+2x4=0,x1+x2+x3+x4=0,且14[(2x1+4−4)2+(2x2+4−4)2+(2x3+4−4)2+(2x4+4−4)2]=4,解得:x12+x22+x32+x42=4,故x1+1,x2+1,x3+1,x4+1的平均数为14(x1+1+x2+1+x3+1+x4+1)=1,故方差为14[(x1+1−1)2+(x2+1−1)2+(x3+1−1)2+(x4+1−1)2]=14(x12+x22+x32+x42)=1.所以答案是:113、某公司青年、中年、老年员工的人数之比为10∶8∶7,从中抽取100名作为样本,若每人被抽中的概率是0.2,则该公司青年员工的人数为__________.答案:200分析:先根据分层抽样的方法计算出该单位青年职工应抽取的人数,进而算出青年职工的总人数.由题意,从中抽取100名员工作为样本,需要从该单位青年职工中抽取1010+8+7×100=40(人).因为每人被抽中的概率是0.2,所以青年职工共有400.2=200(人).所以答案是:200.14、我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为___________.答案:0.98.分析:本题考查通过统计数据进行概率的估计,采取估算法,利用概率思想解题.由题意得,经停该高铁站的列车正点数约为10×0.97+20×0.98+10×0.99=39.2,其中高铁个数为10+20+10=40,所以该站所有高铁平均正点率约为39.240=0.98.小提示:本题考点为概率统计,渗透了数据处理和数学运算素养.侧重统计数据的概率估算,难度不大.易忽视概率的估算值不是精确值而失误,根据分类抽样的统计数据,估算出正点列车数量与列车总数的比值.解答题15、某学校组织“数学文化”知识竞赛,分为初赛和决赛,有400名学生参加知识竞赛的初赛(满分150分),根据初赛成绩依次分为[80,90),[90,100),[100,110),[110,120),[120,130),[130,140]这六组,得到如图所示的频率分布直方图.(1)求本次初赛成绩的平均数;(每组数据以区间中点值为代表)(2)若计划决赛人数为80,估计参加决赛的最低分数线.答案:(1)114.5(2)127.5分析:(1)根据矩形的面积之和为1计算出m,每个矩形的面积乘以对应的区间中点值再将每个积相加就得平均数.(2)设80%分位数为m(120<m<130),列方程解出m即可.(1)由题意有(0.005+0.010+0.020+m+0.020+0.015)×10=1,解得m=0.030.本次初赛成绩的平均数为85×0.05+95×0.1+105×0.2+115×0.3+125×0.2+135×0.15=114.5.(2)=0.8,所以决赛成绩的最低分为80%分位数.因为1−80400前四个矩形的面积之和为0.05+0.1+0.2+0.3=0.65,前五个矩形的面积之和为0 .05+0.1+0.2+0.3+ 0.2=0.85.设80%分位数为m(120<m<130),则0.65+(m−120)×0.02=0.8,解得m=127.5.因此,若计划决赛人数为80,估计参加决赛的最低分数线为127.5.。

第14章§14.3统计图表-2024-2025学年高中数学苏教版必修第二册(新教材)配套PPT

第14章§14.3统计图表-2024-2025学年高中数学苏教版必修第二册(新教材)配套PPT
积表示相应各组的频率.这样,频率直方图就以面积的形式反映 了数据落在各个小组内的频率大小. (2)在频率直方图中,各小矩形的面积之和等于1.
频数 (3)相应的频率=样本容量.
跟踪训练3 从某小区抽取100户居民进行月用电量调查,发现其用电 量都在50至350度之间,频率直方图如图所示.
(1)求频率直方图中x的值; 解 由频率直方图知[200,250)小组的频率为 1-(0.002 4+0.003 6+ 0.006 0+0.002 4+0.001 2)×50=0.22,于是 x=05.202=0.004 4.
12345
5.为了解今年某校高三毕业班准备报考飞行员学生 的体重(单位:千克)情况,将所得的数据整理后, 画出了频率直方图,如图所示,已知图中从左到右 的前三个小组的频率之比为1∶2∶3,其中第2小组 的频数为12.则该校报考飞行员的总人数为__4_8_.
D.估计总体数据大约有10%分布在[10,14)内
12345
解析 对于A,由题图可得,样本数据分布在 [6,10)内的频率为0.08×4=0.32,所以A正确. 对于B,由题图可得,样本数据分布在[10,14) 内的频数为100×(0.1×4)=40,所以B正确. 对 于 C , 由 题 图 可 得 , 样 本 数 据 分 布 在 [2,10) 内 的 频 数 为 100×(0.02 + 0.08)×4=40,所以C正确. 对于D,由题图可估计,总体数据分布在[10,14)内的比例为0.1×4=0.4 =40%,所以D错误,故选ABC.
(2)画出频率直方图; 解 频率直方图如图所示.
(3)估计成绩在[60,90)分的学生比例.
解 学生成绩在[60,90)分的频率为0.2+0.3+0.24=0.74=74%,所以估 计成绩在[60,90)分的学生比例为74%.

高中数学统计总体分布的估计频率分布直方图与折线图备课素材苏教版

高中数学统计总体分布的估计频率分布直方图与折线图备课素材苏教版

2。

2。

2 频率分布直方图与折线图备课资料典型例题在100名学生中,每人参加一个运动队,其中参加足球队的有30人,参加篮球队的有27人,参加排球队的有23人,参加乒乓球队的有20人.(1)列出学生参加运动队的频率分布表;(2)画出表示频率分布的条形图及频率折线图.解:由题意得频率分布表频率分布的条形图备用习题1。

某中学高一年级有400人,高二年级有320人,高三年级有280人,以每人被抽取的频率为0.2,向该中学抽取一个样本容量为n 的样本,则n=_______________.2.某商场4月份随机抽查了6天的营业额,结果分别如下(单位:万元):2。

8,3。

2,3。

4,3.7,3.0,3。

1,试估算该商场4月份的总营业额,大约是_______________万元.3.在边长为a 的正方形中随机撒一把豆子,落在阴影部分的豆子数为N,落在阴影外的豆子数为M,则可估计阴影部分的面积为________________.4.某班有50名学生,在学校组织的一次数学质量抽测中,如果按照抽测成绩的分数段[60,65),[65,70),…,[95,100]进行分组,得到的分布情况如图所示。

求:(Ⅰ)该班抽测成绩在[70,85)之间的人数;(Ⅱ)该班抽测成绩不低于85分的人数占全班总人数的百分比。

参考答案1。

答案:2002。

答案:96万元3。

答案:N M N a 24。

解:从分布图可以看出,抽测成绩各分数段的人数依次为:[60,65)1人;[65,70)2人;[70,75)10人;[75,80)16人;[80,85)12人;[85,90)6人;[90,95)2人;[95,100]1人。

因此,(Ⅰ)该班抽测成绩在[70,85)之间的人数为38人.(Ⅱ)该班抽测成绩不低于85分的占总人数的18%。

频率分布直方图-高中数学知识点讲解

频率分布直方图
1.频率分布直方图
【知识点的认识】
1.频率分布直方图:在直角坐标系中,横轴表示样本数据,纵轴表示频率与组距的比值,将频率分布表中的各组频率的大小用相应矩形面积的大小来表示,由此画成的统计图叫做频率分布直方图.
2.频率分布直方图的特征
①图中各个长方形的面积等于相应各组的频率的数值,所有小矩形面积和为 1.
②从频率分布直方图可以清楚地看出数据分布的总体趋势.
③从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息被抹掉.
3.频率分布直方图求数据
①众数:频率分布直方图中最高矩形的底边中点的横坐标.
②平均数:频率分布直方图各个小矩形的面积乘底边中点的横坐标之和.
③中位数:把频率分布直方图分成两个面积相等部分的平行于y 轴的直线横坐标.
【解题方法点拨】
绘制频率分布直方图的步骤:。

人教A版高中数学必修第二册教学课件 第9章 频率分布直方图

第九章 统计
9.2 用样本估计总体 9.2.1 总体取值规律的估计
第1课时 频率分布直方图
学习任务目标 1.理解用样本的频率分布估计总体分布的方法. 2.会列频率分布表,会画频率分布直方图.(数据分析) 3.能够利用图形解决实际问题.
01
自主化知识预习
知识衔接 自主学习
(1)如何对样本数据进行分组? 提示:对样本数据进行分组时,一般样本容量越大,所分组数越 多. (2)在频率分布直方图中,各小长方形的面积表示什么?它们的 总和是多少? 提示:各小长方形的面积表示样本中落在该组内的数据的频 率.总和等于 1.
8,由(1)可知,样本容量为
4 8÷25
=50.
(3)若[12,15)上的小长方形面积为 0.06,求样本数据在[18,33)内 的频数.
解:∵在[12,15)上的小长方形面积为 0.06,∴样本数据在[12,15) 内的频率为 0.06,故样本数据在[15,33)内的频数为 50×(1-0.06)= 47.又样本数据在[15,18)内的频数为 8,故样本数据在[18,33)内的频 数为 47-8=39.
人数
20
[146, 150) 11
[150, 154) 6
[154, 158]
5
(1)列出样本频率分布表; 解:样本频率分布表如下:
分组 频数 频率 [122,126) 5 0.04 [126,130) 8 0.07 [130,134) 10 0.08 [134,138) 22 0.18
分组 频数 频率 [138,142) 33 0.28 [142,146) 20 0.17 [146,150) 11 0.09 [150,154) 6 0.05 [154,158] 5 0.04

苏教版高中同步学案数学必修第二册精品课件 第14章 统计 用频率直方图估计总体分布 百分位数

2
95百分位数是第12个数据为9.9.
(2)因为共有12个数据,所以12×15%=1.8,则15百分位数是第2个数据为7.9.
即产品质量较小的前15%的产品有2个,它们的质量分别为7.8 g,7.9 g.
(3)由(1)可知样本数据的25百分位数是8.15 g,50百分位数为8.5 g,95百分位
数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于
A.900位
B.600位
C.300位
D.150位
)
答案 A
解析 由频率直方图得,年收入不超过6万元的居民的频率为
(0.005+0.010)×20=0.3,所以年收入不超过6万元的居民大约有
0.3×3 000=900(位).
知识点2 p百分位数
1.定义:一般地,一组数据的k百分位数是这样一个值pk,它使得这组数据中
(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的25,50,95百分位数;
(2)请你找出珍珠质量较小的前15%的珍珠质量;
(3)若用25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等
品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.
第14章
14.4.3 用频率直方图估计总体分布
14.4.4 百分位数




01
基础落实•必备知识全过关
02
重难探究•能力素养全提升
03
学以致用•随堂检测全达标
课标要求
1.结合实例,能用频率直方图估计总体分布.
2.能用样本估计百分位数,理解百分位数的统计含义.

人教A版高一数学必修第二册第九章《统计》单元练习题卷含答案解析 (36)

高一数学必修第二册第九章《统计》单元练习题卷11(共22题)一、选择题(共10题)1.天津市某中学组织高二年级学生参加普法知识考试(满分100分),考试成绩的频率分布直方图如图,数据(成绩)的分组依次为[20,40),[40,60),[60,80),[80,100],若成绩低于60分的人数是180,则考试成绩在区间[60,80)内的人数是( )A.180B.240C.280D.3202.关于频率分布直方图中小长方形的高的说法,正确的是( )A.表示该组上的个体在样本中出现的频率B.表示取某数的频率C.表示该组上的个体数与组距的比值D.表示该组上的个体在样本中出现的频率与组距的比值3.下列问题中,最适合用简单随机抽样方法抽样的是( )A.某学术厅有32排座位,每排有40个座位,座位号是1∼40,有一次报告会学术厅里坐满了观众,报告会结束以后听取观众的意见,要留下32名观众进行座谈B.从10台冰箱中抽取3台进行质量检验C.某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人.教育部门为了解大家对学校机构改革的意见,要从中抽取容量为20的样本D.某乡农田有山地8000亩,丘陵12000亩,平地24000亩,洼地4000亩,现抽取农田480亩估计全乡农田平均产量4.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分,1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A.中位数B.平均数C.方差D.极差5.从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),⋯,[5.45,5.47],[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A.10B.18C.20D.366.10名工人生产某一零件,生产的件数分别是10,12,14,14,15,15,16,17,17,17.设其平均数为a,中位数为b,众数为c,则( )A.a>b>c B.b>c>a C.c>a>b D.c>b>a7.某班由编号为01,02,03,⋯,50的50名学生组成,现在要选取8名学生参加合唱团,选取方法是从如下随机数表的第1行第11列开始由左到右依次选取两个数字,则该样本中选出的第8名学生的编号为( )495443548217379323783035209623842634916450258392120676572355068877044767217633502583921206764954A.20B.23C.26D.348.在一次体育测试中,某班的6名同学的成绩(单位:分)分别为66,83,87,83,77,96.关于这组数据,下列说法错误的是( )A.众数是83B.中位数是83C.极差是30D.平均数是839.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是A.12,24,15,9B.9,12,12,7C.8,15,12,5D.8,16,10,610.某学校随机抽取了部分学生,对他们每周使用手机的时间进行统计,得到如下的频率分布直方图.若从每周使用时间在[15,20),[20,25),[25,30)三组内的学生中用分层抽样的方法选取8人进行访谈,则应从使用时间在[20,25)内的学生中选取的人数为( )A.1B.2C.3D.4二、填空题(共6题)11.某次体检,8位同学的身高(单位:米)分别为 1.68,1.71,1.73,1.63,1.81,1.74,1.66,1.78,则这组数据的中位数是(米).12.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如图所示),已知从左到右各长方形高的比为2:3:5:6:3:1,则该班学生数学成绩在(80,100)之间的学生人数是.13.校本课程的学分,统计如表.甲811141522乙67102324用s12,s22分别表示甲、乙两班抽取的5名学生学分的方差,计算两个班学分的方差,得s22=,并由此可判断成绩更稳定的班级是班.14.众数、中位数、平均数(1)众数、中位数、平均数的概念.①众数:在一组数据中,出现最多的数据(即频率分布最大值所对应的样本数据)叫这组数据的众数.若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数.②中位数:将一组数据按大小依次排列,把处在位置的一个数据(或中间两个数据的平均数)叫这组数据的中位数.③平均数:指样本数据的算术平均数.即:x=.(2)众数、中位数、平均数与频率分布直方图的关系.众数众数是最高矩形的 所对应的数据,表示样本数据的中心值中位数①在频率分布直方图中,中位数左边和右边的直方图 相等,由此可以估计中位数的值,但是有偏差②表示样本数据所占频率的等分线平均数①平均数等于每个小长方形的面积乘以小长方形底边中点的横坐标之和②平均数是频率分布直方图的重心,是频率分布直方图的平衡点15.某学校高一、高二、高三年级的学生人数之比为3:3:4,现用分层随机抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取名学生.16.一汽车厂生产甲,乙,丙三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):轿车甲轿车乙轿车丙舒适型100120z标准型300480600按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有甲类轿车10辆,则z的值为,抽取的50辆车中,乙类舒适型的数量为.三、解答题(共6题)17.一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.18.作为北京副中心,通州区的建设不仅成为京津冀协同发展战略的关键节点,也肩负着医治北京市“大城市病”的历史重任,因此,通州区的发展备受啊目,2017年12月25日发布的《北京市通州区统计年鉴(2017)》显示:2016年通州区全区完成全社会固定资产投资939.9亿元,比上年增长17.4%,下面给出的是通州区2011∼2016年全社会固定资产投资及增长率,如图一.根据通州区统计局2018年1月25日发布:2017年通州区全区完成全社会固定资产投资1054.5亿元,比上年增长12.2%.(1) 在图二中画出2017年通州区全区完成全社会固定资产投资(柱状图),标出增长率并补全折线图;(2) 从2011∼2017这7年中随机选取续的2年份,求后一年份增长率高于前一年份增长率的概率;(3) 设2011∼2017这7年全社会固定资产投资总额的中位数为x0,平均数为x,比较x0与x的大小(写出结论即可).19.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.(1) 求这次测试数学成绩的众数; (2) 求这次测试数学成绩的中位数.20. 某公交公司为了估计某线路公交公司发车的时间间隔,对乘客在这条线路上的某个公交车站等车的时间进行了调查,以下是在该站乘客候车时间的部分记录:等待时间(分钟)频数频率[0,3) 0.2[3,6) 0.4[6,9)5x [9,12)2y [12,15) 0.05合计z 1 (1) 求 x ,y ,z ;(2) 画出频率分布直方图及频率分布折线图; (3) 计算乘客平均等待时间的估计值.21. 某校从高一全体男生中用简单随机抽样抽取了 20 人测量出体重情况如下:(单位 kg )6556708266725486706258726460767280685866试估计该校高一男生的平均体重,以及体重在 60∼75 kg 之间的人数所占比例.22. 平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有何缺点?答案一、选择题(共10题)1. 【答案】B【知识点】频率分布直方图2. 【答案】D,面积表示频率.【解析】频率分布直方图中小长方形的高是频率组距【知识点】频率分布直方图3. 【答案】B【知识点】简单随机抽样4. 【答案】A【解析】根据题意,从9个原始评分中去掉1个最高分,1个最低分,得到7个有效评分,7个有效评分与9个原始评分相比,最中间的一个数不变,即中位数不变.【知识点】样本数据的数字特征5. 【答案】B【解析】根据直方图,直径落在区间[5.43,5.47)之间的零件频率为:(6.25+5.00)×0.02=0.225,则区间[5.43,5.47)内零件的个数为:80×0.225=18.【知识点】频率分布直方图6. 【答案】D=14.7,【解析】依题意,得a=10+12+14+14+15+15+16+17+17+1710中位数b=15,众数c=17,故c>b>a.【知识点】样本数据的数字特征7. 【答案】D【解析】从样本中选出来的8名学生的编号分别为17,37,23,30,35,20,26,34.故该样本中选出的第8名学生的编号为34.【知识点】简单随机抽样8. 【答案】D【知识点】样本数据的数字特征9. 【答案】D【解析】高级职称应抽取:160×40800=8(人),中级职称应抽取:320×40800=16(人),初级职称应抽取:200×40800=10(人),其余人员:120×40800=6(人).【知识点】分层抽样10. 【答案】C【解析】由频率分布直方图可知:5×(0.01+0.02+a+0.04+0.04+0.06)=1,解得:a=0.03,即在[15,20),[20,25),[25,30)三组内的学生数之比为:4:3:1,则从每周使用时间在[15,20),[20,25),[25,30)三组内的学生中用分层抽样的方法选取8人进行访谈,则应从使用时间在[20,25)内的学生中选取的人数为38×8=3.【知识点】分层抽样、频率分布直方图二、填空题(共6题)11. 【答案】1.72【知识点】样本数据的数字特征12. 【答案】33【解析】数学成绩在(80,100)之间的学生人数是(520+620)×60=33.【知识点】频率分布直方图13. 【答案】62;甲【知识点】样本数据的数字特征14. 【答案】次数;最中间;1n(x1+x2+⋯+x n);中点;面积【知识点】样本数据的数字特征15. 【答案】15【解析】高二年级学生人数占总数的310,样本容量为50,则应从高二年级抽取的学生人数为50×310=15.【知识点】分层抽样16. 【答案】400;3【解析】由题意知抽样比为10100+300=140,则50100+300+120+480+z+600=140,解得z=400.可得甲,乙,丙三类车数量的比例为2:3:5,则乙类车抽到的数量为310×50=15,乙类车中,舒适型与标准型的数量比为1:4,所以舒适型的数量为15×15=3.【知识点】分层抽样三、解答题(共6题)17. 【答案】因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而应采用分层抽样的方法.具体过程如下:(1)将3万人分成5层,一个乡镇为一层.(2)按照各乡镇的人口比例随机抽取各乡镇的样本:300×315=60( 人),300×215=40(人),300×515=100( 人),300×215=40( 人),300×315=60( 人).各乡镇分别用分层抽样抽取的人数分别为60,40,100,40,60.(3)将抽取的这300人组到一起,即得到一个样本.【知识点】分层抽样18. 【答案】(1) 由题意在图二中画出2017年通州区全区完成全社会固定资产投资(柱状图),标出增长率并补全折线图,如图.(2) 从2011∼2017这7年里,随机选取连续的2个年份,共6组,分别为:(2011,2012),(2012,2013),(2013,2014),(2014,2015),(2015,2016),(2016,2017),设事件A表示“随机选取续的2年份,后一年份增长率高于前一年份增长率”,则事件A包含的基本事件有2个,分别为:(2011,2012),(2015,2016),所以随机选取续的2年份,后一年份增长率高于前一年份增长率的概率P(A)=26=13.(3) x0<x.【知识点】频率与频数、样本数据的数字特征、频率分布直方图19. 【答案】(1) 由题干图知众数为70+802=75.(2) 由题干图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x−70),所以x≈73.3,即中位数为73.3.【知识点】频率分布直方图、样本数据的数字特征20. 【答案】(1) 由上面表格得0.2+0.4+x+y+0.05=1即x+y=0.35,又52=xy,所以x=0.25,y=0.1.又5z=x=0.25,所以z=20(2) 根据上一问做出的数据画出频率分步直方图.(3) 由频率分步直方图可以知道x=1.5×0.2+4.5×0.4+7.5×0.25+10.5×0.1+13.5×0.05=5.7,即乘客平均等待时间的估计值是5.7.【知识点】频率分布直方图、样本数据的数字特征、频率与频数21. 【答案】这20名男生的平均体重为65+56+70+⋯+68+58+6620=67.85(kg).20名男生中体重在60∼75kg之间的人数为12,故这20名男生体重在60∼75kg之间的人数所占比例为1220=0.6.所以佔计该校高一男生的平均体重约为67.85kg,体重在60∼75kg之间的人数所占比例约为0.6.【知识点】样本数据的数字特征22. 【答案】平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但是平均数受数据中极端值的影响较大.【知识点】样本数据的数字特征。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一.随机抽样 1.随机抽样:满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法: ⑴简单随机抽样:从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. 抽出办法:①抽签法:用纸片或小球分别标号后抽签的方法. ②随机数表法:随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表.表中每一位置出现各个数字的可能性相同. 随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法. 简单随机抽样是最简单、最基本的抽样方法. ⑵系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法. 抽出办法:从元素个数为N的总体中抽取容量为n的样本,如果总体容量能被样本容量整

除,设Nkn,先对总体进行编号,号码从1到N,再从数字1到k中随机抽取一个数s作为起始数,然后顺次抽取第2(1)sksksnk,,,个数,这样就得到容量为n的样本.如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样. 系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样. ⑶分层抽样:当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样. 分层抽样的样本具有较强的代表性,而且各层抽样时,可灵活选用不同的抽样方法,应用广泛. 2.简单随机抽样必须具备下列特点: ⑴简单随机抽样要求被抽取的样本的总体个数N是有限的. ⑵简单随机样本数n小于等于样本总体的个数N. ⑶简单随机样本是从总体中逐个抽取的. ⑷简单随机抽样是一种不放回的抽样.

⑸简单随机抽样的每个个体入样的可能性均为nN.

3.系统抽样时,当总体个数N恰好是样本容量n的整数倍时,取Nkn; 若Nn不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量n整除.因为每个个体被剔除的机会相等,因而整个抽样过程中每个个体被抽取的机会仍然相等,为Nn. 二.频率直方图 列出样本数据的频率分布表和频率分布直方图的步骤: ①计算极差:找出数据的最大值与最小值,计算它们的差;

②决定组距与组数:取组距,用极差组距决定组数; ③决定分点:决定起点,进行分组; ④列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.

知识内容 板块二.频率直方图 ⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图,

知小长方形的面积=组距×频率组距=频率. 频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义. 总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()yfx来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律. 三.茎叶图 制作茎叶图的步骤: ①将数据分为“茎”、“叶”两部分; ②将最大茎与最小茎之间的数字按大小顺序排成一列,并画上竖线作为分隔线; ③将各个数据的“叶”在分界线的一侧对应茎处同行列出. 四.统计数据的数字特征 用样本平均数估计总体平均数;用样本标准差估计总体标准差. 数据的离散程序可以用极差、方差或标准差来描述. 极差又叫全距,是一组数据的最大值和最小值之差,反映一组数据的变动幅度; 样本方差描述了一组数据平均数波动的大小,样本的标准差是方差的算术平方根. 一般地,设样本的元素为12nxxx,,,样本的平均数为x,

定义样本方差为222212()()()nxxxxxxsn,

样本标准差22212()()()nxxxxxxsn 简化公式:22222121[()]nsxxxnxn. 五.独立性检验 1.两个变量之间的关系; 常见的有两类:一类是确定性的函数关系;另一类是变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的.当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系. 2.散点图:将样本中的n个数据点()(12)iixyin,,,,描在平面直角坐标系中,就得到了散点图. 散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系. 3.如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域. 反之,一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.此时,散点图中的点在从左上角到右下角的区域. 散点图可以判断两个变量之间有没有相关关系. 4.统计假设:如果事件A与B独立,这时应该有()()()PABPAPB,用字母0H表示此式,即0:()()()HPABPAPB,称之为统计假设. 5.2(读作“卡方”)统计量:

统计学中有一个非常有用的统计量,它的表达式为22112212211212()nnnnnnnnn,用它的大小可以用来决定是否拒绝原来的统计假设0H.如果2的值较大,就拒绝0H,即认为A与B是有关的. 2统计量的两个临界值:3.841、6.635;当23.841时,有95%的把握说事件A与B有

关;当26.635时,有99%的把握说事件A与B有关;当23.841≤时,认为事件A与B

是无关的. 独立性检验的基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立的. 1.独立性检验的步骤:统计假设:0H;列出22联表;计算2统计量;查对临界值表,作出判断. 2.几个临界值:222()0.10(3.841)0.05(6.635)0.01PPP≥2.706,≥,≥. 22联表的独立性检验: 如果对于某个群体有两种状态,对于每种状态又有两个情况,这样排成一张22的表,如下:

状态B 状态B 合计

状态A 11n 12n

1n

状态A 21n 22n 2n

1n 2n n

如果有调查得来的四个数据11122122nnnn,,,,并希望根据这样的4个数据来检验上述的两种状态A与B是否有关,就称之为22联表的独立性检验. 六.回归分析 1.回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性. 回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.最小二乘法: 记回归直线方程为:ˆyabx,称为变量Y对变量x的回归直线方程,其中ab,叫做回归系数. ˆy是为了区分Y的实际值y,当x取值

ix时,变量Y的相应观察值为iy,而直线上对应于ix

的纵坐标是ˆiiyabx. 设xY,的一组观察值为()iixy,,12in,,,,且回归直线方程为ˆyabx, 当x取值ix时,Y的相应观察值为iy,差ˆ(12)iiyyin,,,刻画了实际观察值iy与回归直线上相应点的纵坐标之间的偏离程度,称这些值为离差. 我们希望这n个离差构成的总离差越小越好,这样才能使所找的直线很贴近已知点.

记21()niiiQyabx,回归直线就是所有直线中Q取最小值的那条. 这种使“离差平方和为最小”的方法,叫做最小二乘法. 用最小二乘法求回归系数ab,有如下的公式:

1221ˆniiiniixynxybxnx



,ˆˆaybx,其中ab,上方加“^”,表示是由观察值按最小二乘法求得的

回归系数. 3.线性回归模型:将用于估计y值的线性函数abx作为确定性函数;y的实际值与估计值之间的误差记为,称之为随机误差;将yabx称为线性回归模型. 产生随机误差的主要原因有: ①所用的确定性函数不恰当即模型近似引起的误差; ②忽略了某些因素的影响,通常这些影响都比较小; ③由于测量工具等原因,存在观测误差. 4.线性回归系数的最佳估计值: 利用最小二乘法可以得到ˆˆab,的计算公式为

1122211()()()()nniiiiiinniiiixxyyxynxybxxxnx





,ˆˆaybx,其中11niixxn,11niiyyn

由此得到的直线ˆˆyabx就称为回归直线,此直线方程即为线性回归方程.其中ˆa,b分别为a,b的估计值,ˆa称为回归截距,b称为回归系数,ˆy称为回归值. 5.相关系数:

112222221111()()()()(())(())nniiiiiinnnniiiiiiiixxyyxynxyrxxyyxnxyny





 6.相关系数r的性质: ⑴||1r≤; ⑵||r越接近于1,xy,的线性相关程度越强; ⑶||r越接近于0,xy,的线性相关程度越弱. 可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. 7.转化思想: 根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数. 8.一些备案 ①回归(regression)一词的来历:“回归”这个词英国统计学家Francils Galton提出来的.1889年,他在研究祖先与后代的身高之间的关系时发现,身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们父母的平均身高高.Galton把这种后代的身高向中间值靠近的趋势称为“回归现象”.后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析. ②回归系数的推导过程: 22222[()]222iiiiiiiiQyabxyaynabxyabxbx



22222()2iiiiiinaabxybxbxyy



把上式看成a的二次函数,2a的系数0n,

因此当2()2iiiibxyybxann时取最小值.

同理,把Q的展开式按b的降幂排列,看成b的二次函数,当2iiiixyaxbx时取最小值.

相关文档
最新文档