高二8-1统计(随机抽样、直方图、茎叶图)知识点、经典例题及练习题带答案
第01讲 随机抽样、统计图表 (精练)(教师版)

由 知,100名学生中“锻炼达人”有10人,其中男生8人,女生2人,从10人中按性别分层抽取5人参加体育活动,则男生抽取4人,女生抽取1人.
2.(2022·全国·高一课时练习)某大型企业针对改善员工福利的 , , 三种方案进行了问卷调查,调查结果如下:
层次的男生有 (人),女生有18人,男生人数少于女生,选项 错误;
层次的女生人数最少,选项 正确.
故选:ABD.
三、填空题
11.(2022·全国·高一课时练习)经问卷调查,某班学生对摄影分别持“喜欢”、“不喜欢”和“一般”三种态度,其中持“一般”态度的比持“不喜欢”态度的多 人.按分层抽样的方法从全班选出部分学生参加摄影讲座,如果选出的是 位“喜欢”摄影的同学、 位“不喜欢”摄影的同学和 位持“一般”态度的同学,则全班学生中“喜欢”摄影的人数比全班学生人数的一半还多______人.
西部地区学生 20人,题中的说法正确;
②新生的人数较多,不适合用简单随机抽样的方法抽取人数,题中的说法错误;
③西部地区学生小刘被选中的概率为 ,题中的说法正确;
④中部地区学生小张被选中的概率为 ,题中的说法错误;
综上可得,正确的说法是①③.
本题选择B选项.
6.(2022·全国·高一课时练习)某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002,……,699,700.从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是
32 21 18 34 2978 64 54 07 3252 42 06 44 3812 23 43 56 7735 78 90 56 42
高二81统计随机抽样直方图茎叶图知识点经典例题及练习题带答案

环球雅思教育学科教师讲义讲义编号: ______________ 副校长/组长签字:签字日期:【考纲说明】1、理解随机抽样的必要性和重要性,了解分布、样本数据标准差的意义和作用,理解用样本估计总体的思想。
2、会画频率分布直方图、频率折线图、茎叶图,会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题【趣味链接】U2合唱团在17分钟内得赶到演唱会场,途中必需跨过一座桥,四个人从桥的同一端出发,你得帮助他们到达另一端,天色很暗,而他们只有一只手电筒。
一次同时最多可以有两人一起过桥,而过桥的时候必须持有手电筒,所以就得有人把手电筒带来带去,来回桥两端。
手电筒是不能用丢的方式来传递的。
四个人的步行速度各不同,若两人同行则以较慢者的速度为准。
BONO需花1分钟过桥,EDGE需花2分钟过桥,ADAM需花5分钟过桥,LARRY需花10分钟过桥,他们要如何在17分钟内过桥呢?【知识梳理】一、抽样方法与总体分布的估计1、随机抽样(1)总体:在统计学中, 把研究对象的全体叫做总体,把每个研究对象叫做个体,把总体中个体的总数叫做总体容量.总体与个体之间的关系类似于集合与元素的关系.(2)样本:从总体中随机抽取一部分个体叫做总体的一个样本,样本中个体的数目称为样本的容量,样本和总体之间的关系类似于子集和集合之间的关系.(3)简单随机抽样:一般地,从元素个数为N 的总体中不放回地抽取容量为的样本,如果每一次抽取时总体中的各个个体被抽到的可能性是相同的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本. 常用的方法有抽签法和随机数表法.(4)系统抽样:当总体中的个体比较多时,将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分中抽取一个个体,得到所需要的样本,这样的抽样方法称为系统抽样,也称作等距抽样.(5)分层抽样:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样. 2、频率分布直方图与茎叶图(1)频率分布:样本中所有数据(或数据组)的频数和样本容量的比就是该数据的频率,所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布表、频率分布折线图、茎叶图、频率分布直方图来表示. (2)频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图。
直方图统计练习题

直方图统计练习题在统计学中,直方图是一种用来表示数据分布情况的图表。
它将数据划分成一系列等宽的区间,并在横轴上绘制出这些区间的范围,纵轴表示数据在该区间内的频数或频率。
通过直方图,我们可以直观地观察到数据的分布形态、集中程度以及异常值等信息。
为了更好地理解和练习直方图的统计分析,下面将给出一些直方图统计练习题。
练习题1:某班级的学生体重数据如下(单位:kg):56 54 59 62 63 65 60 65 57 58 70 65 58 63 64请根据这组数据绘制出直方图,并回答以下问题:1. 该班级学生的体重数据大致呈什么样的分布形态?2. 最常见的体重区间是多少至多少kg?3. 体重在50kg至60kg之间的学生人数占总人数的百分比是多少?练习题2:一份调查统计了某国家不同年龄段的人口数量数据如下(单位:百万):0-18岁:250 18-35岁:320 35-50岁:280 50岁以上:220请根据这组数据绘制出直方图,并回答以下问题:1. 该国家人口数量在不同年龄段上的分布情况如何?2. 在哪个年龄段上,人口数量最多?3. 50岁以上的人口数量占总人口数量的百分比是多少?练习题3:一份统计调查了某公司员工的工作经验数据如下(单位:年):0-2年:20 2-5年:30 5-10年:40 10年以上:10请根据这组数据绘制出直方图,并回答以下问题:1. 该公司员工的工作经验分布情况如何?2. 在哪个工作经验区间上,员工数量最多?3. 具有5年以上工作经验的员工占总员工数量的百分比是多少?练习题4:一份调查记录了某城市不同民族的人口数量数据如下(单位:千人):汉族:900 苗族:120 壮族:300 回族:100请根据这组数据绘制出直方图,并回答以下问题:1. 该城市不同民族的人口分布情况如何?2. 哪个民族的人口数量最多?3. 除汉族外,其他民族的人口数量总和占该城市总人口数量的百分比是多少?通过以上的练习题,我们可以巩固对直方图及其统计分析的理解。
必考考点抽样方法频率分布直方图和茎叶图线专题二概

必考考点抽样方法,频率分布直方图和茎叶图,线专题二:概率与统计(文科)性回归方程,古典概型及其概率计算.考情分析1.从内容上看主要考查以下两点:(1)利用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题;(2)古典概型及其概率计算公式,以及一些随机事件所含的基本事件数及事件发生的概率的计算问题;2.从考查形式上看主要有以下特点:(1)背景熟悉、切入点实际,注重概念的形成:概率与统计的试题往往是由课本习题改编而成的,通过对基础知识的重新组合、变式和拓展,加工为立意高、情境新、设问巧、贴近学生生活的问题. (2)识图处理数据,追溯概念形成:概率与统计中有大量的数据与图形相关,如:频率分布直方图呈现样本的数字特征,茎叶图给出原始数据,散点图刻画变量间的相关关系等.(3)体现情感、态度与价值观,拓宽数学视野,增强数学应用意识:由于高考强调数学教育的基础性、现实性、大众性,重视素质教育与高考兼容,而概率与统计在社会现实中具有很高的应用价值,所以在近两年高考中,一些以生活实际、社会现象、经济建设、科技发展为背景的试题层出不穷.动向 1 随机抽样和用样本估计总体随机抽样方法是研究统计问题的最基本方法,主要包括简单随机抽样、系统抽样、分层抽样.通过抽取的样本的数字特征估计总体的数字特征是统计的基本思想方法,高考非常重视对抽样方法和样本特征数的考查,在高考试题中一般都有一道小题考查抽样方法或是样本特征数的计算,在解答题中也常和概率知识综合考查抽样方法、样本特征数的计算等.动向2 变量的相关性该部分主要考查的内容是变量的相关性、回归分析的基本思想及其初步应用.由于该部分内容的特殊性,高考对该部分的考查一直非常慎重.高考在该部分的主要命题点就是回归分析的基础知识和简单应用,也可能结合概率统计的其他内容命制综合解答题,但试题总体比较平稳.动向3 概率概率初步的主要内容是随机事件的概率、古典概型和几何概型,高考就是围绕这些知识点命制试题的.对于随机事件的概率和古典概型,高考一般是在选择题或者填空题中考查古典概型,在解答题中与概率统计的其他知识相结合考查古典概型和随机事件的概率.几何概型的考查既可以在选择题或者填空题中单独考查,也可以在解答题中和其他概率统计知识结合起来进行综合考查.动向 4 概率统计初步综合问题概率统计是高中数学中与实际生活联系最紧密的部分,因此,高考越来越重视对概率统计的考查,把随机抽样、用样本估计总体等统计知识和概率知识相结合命制概率统计解答题已经是一个新的命题趋向.概率统计初步综合解答题的主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键,因此在复习该部分时,要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计算方法、各类概率的计算方法.【真题风采】(2012·新课标高考)某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售.如果当天卖不完,剩下的玫瑰花作垃圾处理.(Ⅰ)若花店一天购进17枝玫瑰花,求当天的利润y(单位:元)关于当)的函数解析式;天需求量n(单位:枝,n N(Ⅱ)花店记录了100天玫瑰花的日需求量(单位:枝),整理得下表:(ⅰ)假设花店在这100天内每天购进17枝玫瑰花,求这100天的日利润(单位:元)的平均数;(ⅱ)若花店一天购进17枝玫瑰花,以100天记录的各需求量的频率作为各需求量发生的概率,求当天的利润不少于75元的概率.3.抽样方法例4为了保证食品安全,现采用分层抽样的方法对某市场甲、乙、丙、丁四个厂家生产的奶粉进行检测,若甲、乙、丙、丁四个厂家生产的奶粉分别为120袋、100袋、80袋、60袋,已知从甲、乙两个厂家抽取的袋数之和比从另外两个厂家抽取的袋数之和多8袋,则从四个厂家共抽取了________________袋.。
统计知识点及例题讲解(学生版)

必修3 统计【知识点、题型、方法、易错点总结】知识点(一):抽样方法1、简单随机抽样1、简单随机抽样的概念:注意:简单随机抽样必须具备下列特点:(1)简单随机抽样要求被抽取的样本的总体个数N是有限的。
(2)简单随机样本数n小于等于样本总体的个数N。
(3)简单随机样本是从总体中逐个抽取的。
(4)简单随机抽样是一种不放回的抽样。
(5)简单随机抽样的每个个体入样的可能性均为n/N。
思考:下列抽样的方式是否属于简单随机抽样?为什么?(1)从无限多个个体中抽取50个个体作为样本。
(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子。
2、抽签法和随机数法(1)、抽签法的定义抽签法的一般步骤:a、将总体的个体编号。
b、连续抽签获取样本号码。
思考:你认为抽签法有什么优点和缺点:当总体中的个体数很多时,用抽签法方便吗?(2)随机数表法:利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法.例1:人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?例2:某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?2、系统抽样1、系统抽样的定义:注意:系统抽样的特证:(1)当总体容量N较大时,采用系统抽样。
(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,N系统抽样又称等距抽样,这时间隔一般为k=[].n(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号。
2、系统抽样的一般步骤。
(1)采用随机抽样的方法将总体中的N个个编号。
(2)将整体按编号进行分段,确定分段间隔k(k∈N,L≤k).(3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。
高二数学统计试题答案及解析

高二数学统计试题答案及解析1.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是().A.若k2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,我们说某人吸烟,那么他有99%的可能患有肺病C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D.以上三种说法都不正确【答案】C.【解析】若k>6.635,我们有99%的把握认为吸烟与患肺病有关系,但不表示有99%的可能患有肺病,故A错误;也不表示在100个吸烟的人中必有99人患有肺病,故B错误;若从统计量中求出有95%的是吸烟与患肺病的比例,不表示有5%的可能性使得推断出现错误,故C错误;因此选D.【考点】独立性检验的基本思想.2.某考察团对全国10大城市进行职工人均工资水平(千元)与居民人均消费水平(千元)统计调查,与具有相关关系,回归方程为,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为()A.83%B.72%C.67%D.66%【答案】A【解析】将y=7.675代入回归方程,可计算得x≈9.26,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.26≈0.83,即约为83%.【考点】回归方程3.回归分析中,相关指数的值越大,说明残差平方和A.越小B.越大C.可能大也可能小D.以上都不对【答案】A【解析】相关系数越大,则相关性越强。
即数据的残差平方和越小。
【考点】线性相关关系的判断。
4.某校现有高一学生210人,高二学生270人,高三学生300人,学校学生会用分层抽样的方法从这三个年级的学生中随机抽取名学生进行问卷调查,如果已知从高一学生中抽取的人数为7,那么从高三学生中抽取的人数应为()A.10B.9C.8D.7【答案】B【解析】分层抽样是按比例进行抽样,据题中所给的学生人数比,可设高三学生中抽取的人数应为,可得,得.故本题选.【考点】分层抽样5.某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为()A.16B.17C.18D.19【答案】C【解析】第一组用简单随机抽样抽取的号码为,选C.【考点】系统抽样法6.若样本数据的标准差为,则数据的标准差为A.B.C.D.【答案】C【解析】样本数据的标准差为,数据的方差为标准差为16【考点】方差与标准差7.下表提供了某厂节能降耗技术改造后,在生产A产品过程中记录的产量x(吨)与相应的生产耗能y(吨)的几组相对应数据.根据上表提供的数据,求出y关于x的线性回归直线方程为,那么表中t=__________.【答案】3【解析】由题意可知,因为回归直线方程,经过样本中心,所以=0.7×4.5+0.35,解得t=3【考点】线性回归方程8.下列两个量之间的关系是相关关系的为()A.匀速直线运动的物体时间与位移的关系B.学生的成绩和体重C.路上酒后驾驶的人数和交通事故发生的多少D.水的体积和重量【答案】C【解析】略9.某射击选手连续射击5枪命中的环数分别为:9.7,9.9,10.1,10.2,10.1,则这组数据的方差为________.【答案】0.032【解析】平均数方差【考点】方差10.已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m,n的比值=()A.1B.C.D.【答案】D【解析】因为乙的中位数是,所以,可求得甲的平均数是,因此乙的平均数也是,进而得,,故选A.【考点】1、茎叶图的应用;2、中位数及平均数的应用.11.下列两个量之间的关系是相关关系的为()A.匀速直线运动的物体时间与位移的关系B.学生的成绩和体重C.路上酒后驾驶的人数和交通事故发生的多少D.水的体积和重量【答案】C【解析】略12.潮州统计局就某地居民的月收入调查了人,并根据所得数据画了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在)。
统计初步例题和知识点总结

统计初步例题和知识点总结在我们的日常生活和学习中,统计知识无处不在。
它帮助我们从大量的数据中提取有价值的信息,做出更明智的决策。
接下来,让我们通过一些例题来深入理解统计的初步知识。
一、知识点梳理1、数据的收集普查:对全体对象进行调查。
抽样调查:从总体中抽取部分个体进行调查。
抽样方法:简单随机抽样、分层抽样、系统抽样等。
2、数据的整理与表示频数分布表:将数据按照一定的范围进行分组,统计每组的频数。
频数分布直方图:用矩形的高度表示频数,直观展示数据的分布情况。
3、数据的集中趋势平均数:一组数据的总和除以数据的个数。
中位数:将一组数据从小到大(或从大到小)排列,位于中间位置的数。
众数:一组数据中出现次数最多的数据。
4、数据的离散程度极差:一组数据中的最大值减去最小值。
方差:每个样本值与全体样本值的平均数之差的平方值的平均数。
标准差:方差的算术平方根。
二、例题解析例题 1:为了解某小区居民的月用水量情况,随机抽取了 50 户居民进行调查,得到如下数据(单位:吨):10 12 15 18 20 22 25 28 30 32 11 13 16 19 21 23 26 29 31 33 12 14 17 20 22 24 27 30 32 34 10 13 15 18 21 23 25 28 31 33 35(1)请列出这组数据的频数分布表。
(2)绘制频数分布直方图。
解:(1)首先,确定组数和组距。
这里我们取组距为 5,组数=(最大值最小值)÷组距=(35 10)÷ 5 = 5。
|月用水量(吨)|频数||::|::|| 10 15 | 15 || 15 20 | 10 || 20 25 | 8 || 25 30 | 10 || 30 35 | 7 |(2)根据频数分布表绘制频数分布直方图,横坐标为月用水量,纵坐标为频数,每个矩形的宽度为组距,高度为频数。
例题 2:已知一组数据:2,3,5,7,8,9,10。
茎叶图练习题

茎叶图练习题 It was last revised on January 2, 20211.下列关于茎叶图的叙述正确的是()(A)将数据的数按位数进行比较,将数大小基本不变或变化不大的作为一个主杆(茎),将变化大的位数作为分枝(叶),列在主杆的后面(B)茎叶图只可以分析单组数据,不能对两组数据进行比较(C)茎叶图更不能表示三位数以上的数据(D)画图时茎要按照从小到大的顺序从下向上列出,共茎的叶可以随意同行列出2.下列关于茎叶图的叙述正确的是()(A)茎叶图可以展示未分组的原始数据,它与频率分布表以及频率分布直方图的处理方式不同(B)对于重复的数据,只算一个(C)茎叶图中的叶是“茎”十进制的上一级单位(D)画图时茎要按照从小到大的顺序从下向上列出,共茎的叶可以随意同行列出3.茎叶图012380 91 3 50 2 3 4 6中,茎2的叶子数为()(A)0 (B)1 (C)2 (D)34.数据8,51,33,39,38,23,26,28,13,16,14的茎叶图是()(A)01234583 4 636 83 8 91(B)1234583 4 636 83 8 91(C)1234583 4 636 83 8 91(D)1234583 4 636 83 8 9115.用茎叶图对两组数据进行比较时()(A )左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写 (B )左侧的叶按从大到小的顺序写,右侧的叶也按从大到小的顺序写 (C )左侧的叶按从小到大的顺序写,右侧的叶也按从小到大的顺序写 (D )左侧的叶按从小到大的顺序写,右侧的叶按从大到小的顺序写6.茎叶图0 4 9 1 1 6 6 7 94 5 2 5甲543210198 38 6 364 38乙中,甲组数据的中位数是 ( )(A )31(B )5.3323631=+ (C )36 (D )7.茎叶图43275 38 5 4 3 3 398 6 5 0的茎为 ,叶子最多的茎是 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
环球雅思教育学科教师讲义讲义编号: ______________ 副校长/组长签字:签字日期:【考纲说明】1、理解随机抽样的必要性和重要性,了解分布、样本数据标准差的意义和作用,理解用样本估计总体的思想。
2、会画频率分布直方图、频率折线图、茎叶图,会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题【趣味链接】U2合唱团在17分钟内得赶到演唱会场,途中必需跨过一座桥,四个人从桥的同一端出发,你得帮助他们到达另一端,天色很暗,而他们只有一只手电筒。
一次同时最多可以有两人一起过桥,而过桥的时候必须持有手电筒,所以就得有人把手电筒带来带去,来回桥两端。
手电筒是不能用丢的方式来传递的。
四个人的步行速度各不同,若两人同行则以较慢者的速度为准。
BONO需花1分钟过桥,EDGE需花2分钟过桥,ADAM需花5分钟过桥,LARRY需花10分钟过桥,他们要如何在17分钟内过桥呢?【知识梳理】一、抽样方法与总体分布的估计1、随机抽样(1)总体:在统计学中, 把研究对象的全体叫做总体,把每个研究对象叫做个体,把总体中个体的总数叫做总体容量.总体与个体之间的关系类似于集合与元素的关系.(2)样本:从总体中随机抽取一部分个体叫做总体的一个样本,样本中个体的数目称为样本的容量,样本和总体之间的关系类似于子集和集合之间的关系.(3)简单随机抽样:一般地,从元素个数为N 的总体中不放回地抽取容量为的样本,如果每一次抽取时总体中的各个个体被抽到的可能性是相同的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本. 常用的方法有抽签法和随机数表法.(4)系统抽样:当总体中的个体比较多时,将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分中抽取一个个体,得到所需要的样本,这样的抽样方法称为系统抽样,也称作等距抽样.(5)分层抽样:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样. 2、频率分布直方图与茎叶图(1)频率分布:样本中所有数据(或数据组)的频数和样本容量的比就是该数据的频率,所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布表、频率分布折线图、茎叶图、频率分布直方图来表示. (2)频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图。
(3)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光华曲线,即总体密度曲线。
(4)制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.茎叶图对于分布在0~99的容量较小的数据比较合适,此时,茎叶图比直方图更详尽地表示原始数据的信息. 在茎叶图中,茎也可以放两位,后面位数多可以四舍五入后再制图. 3、样本的数字特征(1)众数:出现次数最多的数叫做众数.(2)中位数:如果将一组数据按大小顺序依次排列,把处在最中间位置的一个数据或中间两个数据的平均是叫做这组数据的中位数.(3)平均数与加权平均数:如果有n 个数,,,,n x x x x ⋯⋯321那么12nx x x x n++⋅⋅⋅+=叫做这n 个数的平均数.如果在n 个数中,1x 出现次1f 次, 2x 出现次2f 次,……,k x 出现次2f 次,(这里),n f f f k =+⋯⋯++21那么11221()k k x x f x f x f n=++⋅⋅⋅+叫做这n 个数的加权平均数,其中k f f f ⋯⋯,,21叫做权.(4)标准差与方差:设一组数据123nx x x x ⋯,,,,的平均数为x ,则nx x x x x x s s n 222212)()()(-++-+-== ,其中2s 表示方差,s 表示标准差.【经典例题】【例1】(2009山东)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( ). A. 90 B.75 C. 60 D.45【例2】(2009上海)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”。
根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A. 甲地:总体均值为3,中位数为4B. 乙地:总体均值为1,总体方差大于0C. 丙地:中位数为2,众数为3D. 丁地:总体均值为2,总体方差为3【例3】(2009湖北)右图是样本容量为200的频率分布直方图。
根据样本的频率分布直方图估计,样本数据落在[6,10]内的频数为 ,数据落在(2,10)内的概率约为 . 【例4】(2008广东)为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[)45,55,[)[)[)55,65,65,75,75,85,[)85,95由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[)55,75的人数是 .【例5】(2009福建)点A 为周长等于3的圆周上的一个定点,若在该圆周上随机取一点B ,则劣弧AB 的长度小于1的概率为 .【例6】(2013江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下表, 则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.运动员第1次第2次第3次第4次第5次甲87 91 90 89 93乙89 90 91 88 92【例7】(2011广东)在某次测验中,有6位同学的平均成绩为75分.用x n表示编号为n(n=1,2,…,6)的同学所得成绩,且前5位同学的成绩如下:编号n 1 2 3 4 5成绩x n70 76 72 70 72(1)求第6位同学的成绩x6,及这6位同学成绩的标准差s;(2)从前5位同学中,随机地选2位同学,求恰有1位同学成绩在区间(68,75)中的概率.【例8】(2009广东)随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差(3)现从乙班这10名同学中随机抽取两名身高不低于173cm的同学,求身高为176cm的同学被抽中的概率.【例9】(2009山东)一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):轿车A 轿车B 轿车C舒适型100 150 z标准型300 450 600按类型分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆.(1)求z的值.(2)用分层抽样的方法在C类轿车中抽取一个容量为5的样本.将该样本看成一个总体,从中任取2辆,求至少有1辆舒适型轿车的概率;(3)用随机抽样的方法从B类舒适型轿车中抽取8辆,经检测它们的得分如下:9.4, 8.6, 9.2, 9.6, 8.7, 9.3, 9.0, 8.2.把这8辆轿车的得分看作一个总体,从中任取一个数,求该数与样本平均数之差的绝对值不超过0.5的概率.【例10】(2011北京)以下茎叶图记录了甲、乙两组各四名同学的植树棵树。
乙组记录中有一个数据模糊,无法确认,在图中以X表示。
(1)如果X=8,求乙组同学植树棵树的平均数和方差;(2)如果X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵树Y 的分布列和数学期望。
(注:方差()()()2222121n s x x x x x x n ⎡⎤=-+-++-⎢⎥⎣⎦,其中x 为1x ,2x ,…… n x 的平均数)【课堂练习】1、(2008山东)右图是根据《山东统计年整2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为( ) A. 304.6 B. 303.6 C. 302.6 D. 301.62、(2009四川)设矩形的长为a ,宽为b ,其比满足b ∶a =618.0215≈-,这种矩形给人以美感,称为黄金矩形,黄金矩形常应用于工艺品设计中。
下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本: 甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是( ) A. 甲批次的总体平均数与标准值更接近 B. 乙批次的总体平均数与标准值更接近 C. 两个批次总体平均数与标准值接近程度相同 D. 两个批次总体平均数与标准值接近程度不能确定3、(2009福建)一个容量100的样本,其数据的分组与各组的频数如下表,则样本数据落在(10,40)上的频率为( )组别 (0,10](20,20] (20,30) (30,40) (40,50] (50,60] (60,70]频数12A. 0.13B. 0.39C. 0.52D. 0.644、(2010湖北)将参加夏令营的600名学生编号为:001,002,……600,采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495住在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数一次为A .26, 16, 8,B .25,17,8C .25,16,9D .24,17,95、(2009浙江)某个容量为100的样本的频率分布直方图如下,则在区间[4,5) 上的数据的频数..为 .6、(2008广东)某初级中学共有学生2000名,各年级男、女生人数如下表:初一年级 初二年级初三年级女生 373 x y 男生377370z已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19. (1)求x 的值;(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名? (3)已知y ≥245,z ≥245,求初三年级中女生比男生多的概率.【课后作业】1、(2011湖北)已知随机变量ξ服从正态分布()22N ,a ,且P(ξ<4)=0.8,则P(0<ξ<2)=( ).A .0.6B .0.4C .0.3D .0.22.(2010重庆)某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本 . 若样本中的青年职工为7人,则样本容量为( ). A .7 B .15 C .25 D .353、某商场在国庆黄金周的促销活动中,对10月2日9时至14时的销售额进行统 计,其频率分布直方图如图所示.已知9时至10时的销售额为2.5万元,则11 时至12时的销售额为( ).A. 6万元B. 8万元C. 10万元D. 12万元4、(2010山东)在某项体育比赛中,七位裁判为一选手打出的分数如下:90、89、90、95、93、94、93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( ). A .92 , 2 B .92 , 2.8 C. 93 , 2 D .93 , 2.85、 某中学高三年级从甲、乙两个班级各选出7名学生参加数学竞 赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是 83,则x+y 的值为( ).A. 7B. 8C. 9D. 106、某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:学历 35岁以下 35~50岁 50岁以上本科 8030 20研究生x20y(1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,将该样本看成一个总体, 从中任取2人, 求至少有1人的学历为研究生的概率;(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N 个人,其中35岁以下48人,50岁以上10人,再从这N 个人中随机抽取出1人,此人的年龄为50岁以上的概率为539,求x 、y 的值.7、某校从高一年级学生中随机抽取40名学生,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六段:[)50,40,[)60,50,…,[]100,90后得到如图的频率分布直方图.0.00.00.020.02a频率组距甲乙78961 1 y 1 1 68 95 x 06 2(1)求图中实数a 的值;(2)若该校高一年级共有学生640人,试估计该校高一年级期中考试数学成 绩不低于60分的人数;(3)若从数学成绩在[)40,50与[]90,100两个分数段内的学生中随机选取两 名学生,求这两名学生的数学成绩之差的绝对值不大于10的概率.8、(2009全国)某车间甲组有10名工人,其中有4名女工人;乙组有10名工人,其中有6名女工人。