2014届高三数学(文)一轮总复习用样本估计总体
(新课标)高考数学大一轮复习-第十章 算法及概率、统计 10.6 用样本估计总体课件 文

授人以渔
题型一 用样本频率分布估计总体的分布
例 1 某制造商 3 月生产了一批乒乓球,随机抽样 100 个进
行检查,测得每个球的直径(单位:mm),将数据分组如下表:
分组
频数 频率
[39.95,39.97) 10
[39.97,39.99) 20
[39.99,40.01) 50
[40.01,40.03] 20
1.判断下面结论是否正确(打“√”或“×”). (1)平均数、众数与中位数从不同的角度描述了一组数据的集 中趋势. (2)一组数据的众数可以是一个或几个,那么中位数也具有相 同的结论. (3)一组数据的方差越大,说明这组数据越集中.
(4)从频率分布直方图得不出原始的数据内容,把数据表示成 直方图后,原有的具体数据信息就被抹掉了.
(3)整体数据的平均值约为 39.96×0.10+39.98×0.20+40.00 ×0.50+40.02×0.20≈40.00(mm).
【答案】 (1)略 (2)0.9 (3)40.00 mm
探究 1 (1)画频率分布直方图时,注意纵轴表示的不是频率, 而是频率与组距之比.
【解析】
分组
频数 频率 频率/组距
[39.95,39.97) 10 0.10
5
[39.97,39.99) 20 0.20
10
[39.99,40.01) 50 0.50
0.20
10
合计
100 1
频率分布直方图如下:
(2)误差不超过 0.03 mm,即直径落在[39.97,40.03]范围内, 其概率为 0.2+0.5+0.2=0.9.
请注意 1.本节是用样本估计总体,是统计学的基础.以考查频率 分布直方图、茎叶图、平均数、方差、标准差为主,同时考查对 样本估计总体的思想的理解. 2.本节在高考题中主要是以选择题和填空题为主,属于中 低档题目.
【成才之路】2014-2015学年高中数学 2.2.1 用样本的频率分布估计总体分布课件 新人教A版必修3

分组 [482.5,486.5) [486.4,490.5) [490.5,494.5) [494.5,498.5) [498.5,502.5) [502.5,506.5) [506.5,510.5) [510.5,514.5) [514.5,518.5] 合计
频数累计
正正正 正正正正 正正 正 正正正 正
样本容量 和分组情况的变化而变化的,因此不能用样本的 __________ 频率分布折线图 得到准确的总体密度曲线. ________________
4.茎叶图 茎 ,个位 (1)制作方法:将所有两位数的十位数字作为______
叶 ,茎相同者共用一个茎,茎按从 __________ 小到大 的 数字作为 _____ 顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的 顺序同行列出(也可以没有大小顺序). 较少 时,用茎叶图表示数据的效 (2)优缺点:在样本数据______ 记录 , 果较好.它不但可以保留所有信息,而且可以随时 _______ 较多 这对数据的记录和表示都能带来方便.但是当样本数据______ 时,茎叶图就显得不太方便,因为每一个数据都要在图中占据 一个空间,如果数据很多,枝叶就会很长.
499 505 496 501 510 496 487 511 501 496
(1)列出样本的频率分布表; (2)画频率分布直方图及频率分布折线图; (3)估计净重在494.5~506.5 g之间的频率.
[解析] (1)在样本数据中,最大值是518,最小值是483, 35 3 所以极差为35.取组距为4 g,由于 4 =84,故要分成9组.使分 点比数据多一位小数,且把第1组的起点稍微减小一点,得分 组如下:[482.5,486.5),[486.5,490.5),[490.5,494.5),„, [514.5,518.5].列出频率分布表如下:
高中数学2.2.2 用样本的数字特征估计总体的数字特征1

2.(1)由平均数公式得 x=
(182×27+80×21)≈81.13(分).
48
(2)因为男生的中位数是75分,所以至少有14人得分不超过75
分.
又因为女生的中位数是80分,所以至少有11人得分不超过80分.
所以全班至少有25人得分不超过80分.
(3)男生的平均分与中位数的差别较大,说明男生中两极分化现
2.2.2 用样本的数字特征估计总体的数字特征
1.正确理解样本数据标准差的意义和作用,学会计算数据的标 准差. 2.能根据实际问题的需要合理地选取样本,从样本数据中提取 基本的数字特征(如平均数、标准差),并作出合理的解释. 3.会用样本的基本数字特征估计总体的基本数字特征,形成对 数据处理过程进行初步评价的意识.
x1 x2 xn
则 x =_______n_______.
2.方差、标准差 假设样本数据是x1,x2,x3,…,xn, x 是平均数,则 (1)方差是
s2=__n1[___x1___x_2____x_2 __x__2 ______x_n__x__2_].
(2)标准差为
s=__n1_[__x_1__x__2___x_2___x_2____ __x_n___x__2 ]_.
【解题指南】1.由平均数和方差的定义直接求解.
2.先画出茎叶图,再利用平均数和方差结合的形式分析稳定性.
【自主解答】1.
s2
1 [ 21
a1
x
2
a2 x
2
a20 x
2
xx
2
]
1 20 0.20 4 0.19.
21
21
答案:0.19
2.(1)作出茎叶图如下:
(2)派甲参赛比较合适.理由如下:
《用样本估计总体》统计PPT课件(总体百分位数的估计)

地 理 课 件 : /kejian/dili/
历 史 课 件 : /kejian/lishi/
[教材提炼]
前面我们用频率分布表、频率分布直方图描述了居民用户月均用水量的样本数据,
通过对图表的观察与分析,得出了一些样本数据的频率分布规律,并由此推测了该
市全体居民用户月均用水量的分布情况,得出了“大部分居民用户的月均用水量集
试 卷 下 载 : /shiti/
教 案 下 载 : /jiaoan/
手 抄 报 : /shouchaobao/
PPT课 件 : /kejian/
语 文 课 件 : /kejian/yuwen/ 数 学 课 件 : /kejian/shuxue/
(3)四分位数:常用的分位数有第 25 百分位数、第 50 百分位数、第 75 百分位数, 这三个分位数把一组由小到大排列后的数据分成 四等 份,因此称为四分位数.其
中第 25 百分位数也称为第一四分位数或下四分位数等,第 75 百分位数也称为第三
四分位数或上四分位数等.
必修第二册·人教数学A版
返回导航 上页 下页
英 语 课 件 : /kejian/yingyu/ 美 术 课 件 : /kejian/meishu/
科 学 课 件 : /kejian/kexue/ 物 理 课 件 : /kejian/wuli/
化 学 课 件 : /kejian/huaxue/ 生 物 课 件 : /kejian/shengwu/
PPT图 表 : /tubiao/
PPT下 载 : /xiazai/
PPT教 程 : /powerpoint/
资 料 下 载 : /ziliao/
个 人 简 历 : /jianli/
(新高考专用)高考数学一轮复习精讲必备第31讲统计与统计模型(讲义)

第31讲统计与统计模型学校____________ 姓名____________ 班级____________一、知识梳理数据的收集与直观表示1.总体、个体、样本与样本容量考察问题涉及的对象全体是总体,总体中每个对象是个体,抽取的部分对象组成总体的一个样本,一个样本中包含的个体数目是样本容量.(1)普查:一般地,对总体中每个个体都进行考察的方法称为普查(也称为全面调查).(2)抽样调查:只抽取样本进行考察的方法称为抽样调查.(1)定义:一般地,简单随机抽样(也称为纯随机抽样)就是从总体中不加任何分组、划类、排队等,完全随机地抽取个体.(2)两种常用方法:抽签法,随机数表法.一般地,如果相对于要考察的问题来说,总体可以分成有明显差别的、互不重叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简称为分层抽样).(1)常见的统计图表有柱形图、折线图、扇形图、茎叶图、频数分布直方图、频率分布直方图等.(2)频率分布直方图①作频率分布直方图的步骤(ⅰ)找出最值,计算极差:即一组数据中最大值与最小值的差;(ⅱ)合理分组,确定区间:根据数据的多少,一般分5~9组;(ⅲ)整理数据:逐个检查原始数据,统计每个区间内数的个数(称为区间对应的频数),并求出频数与数据个数的比值(称为区间对应的频率),各组均为左闭右开区间,最后一组是闭区间;(ⅳ)作出有关图示:频率,每一组数对应的矩形高度与频率成正比,而且每个矩形的面积等于这一组数对应的组距频率,从而可知频率分布直方图中,所有矩形的面积之和为1.②频率分布折线图作图的方法都是:把每个矩形上面一边的中点用线段连接起来.为了方便看图,折线图都画成与横轴相交,所以折线图与横轴的左右两个交点是没有实际意义的.不难看出,虽然作频率分布直方图过程中,原有数据被“压缩”了,从这两种图中也得不到所有原始数据.但是,由这两种图可以清楚地看出数据分布的总体态势,而且也可以得出有关数字特征的大致情况.比如,估计出平均数、中位数、百分位数、方差.当然,利用直方图估计出的这些数字特征与利用原始数据求出的数字特征一般会有差异. 数据的数字特征、用样本估计总体 (1)最值一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况. (2)平均数①定义:如果给定的一组数是x 1,x 2,…,x n ,则这组数的平均数为x -=1n(x 1+x 2+…+x n ).这一公式在数学中常简记为x -=1n∑ni =1x i , ②性质:一般地,利用平均数的计算公式可知,如果x 1,x 2,…,x n 的平均数为x ,且a ,b 为常数,则ax 1+b ,ax 2+b ,…,ax n +b 的平均数为a x -+b .(3)中位数有奇数个数,且按照从小到大排列后为x 1,x 2,…,x 2n +1,则称x n +1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x 1,x 2,…,x 2n ,则称x n +x n +12为这组数的中位数. (4)百分位数①定义:一组数的p %(p ∈(0,100))分位数指的是满足下列条件的一个数值:至少有p %的数据不大于该值,且至少有(100-p )%的数据不小于该值.②确定方法:设一组数按照从小到大排列后为x 1,x 2,…,x n ,计算i =np %的值,如果i 不是整数,设i 0为大于i 的最小整数,取xi 0为p %分位数;如果i 是整数,取x i +x i +12为p %分位数. (5)众数一组数据中,出现次数最多的数据称为这组数据的众数. (6)极差、方差与标准差①极差:一组数的极差指的是这组数的最大值减去最小值所得的差,描述了这组数的离散程度. ②方差定义:如果x 1,x 2,…,x n 的平均数为x ,则方差可用求和符号表示为s 2=1n∑n i =1(x i -x -)2=1n∑ni =1x 2i -x -2. 性质:如果a ,b 为常数,则ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2. ③标准差定义:方差的算术平方根s 表示,即样本数据x 1,x 2,…,x n 的标准差为s =1n∑ni =1(x i -x )2. 性质:如果a ,b 为常数,则ax 1+b ,ax 2+b ,…,ax n +b 的标准差为|a |s .一般情况下,如果样本容量恰当,抽样方法合理,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可. 统计模型(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系. (2)相关关系的分类:正相关和负相关.(3)线性相关:如果变量x 与变量y 之间的关系可以近似地用一次函数来刻画,则称x 与y 线性相关.(1)r =∑ni =1(x i -x -)(y i -y -)∑ni =1(x i -x -)2∑ni =1(y i -y -)2=∑ni =1x i y i -nx -y-(∑ni =1x 2i -n x -2)(∑ni =1y 2i -ny 2).(2)当r >0时,成对样本数据正相关;当r <0时,成对样本数据负相关.(3)|r |≤1;当|r |越接近1时,成对样本数据的线性相关程度越强;当|r |越接近0时,成对样本数据的线性相关程度越弱.(1)我们将y ^=b ^x +a ^称为y 关于x 的回归直线方程,其中⎩⎪⎨⎪⎧b ^=∑n i =1(x i -x -)(y i -y -)∑ni =1(x i -x -)2=∑ni =1x i y i -n x -y -∑n i =1x 2i -n x-2,a ^=y ^-b ^x -.(2)残差:观测值减去预测值,称为残差. 4.2×2列联表和χ2如果随机事件A 与B 的样本数据的2×2列联表如下.记n =a +b +c χ2=n (ad-bc )2(a +b )(c +d )(a +c )(b +d ).统计学中,常用的显著性水平α以及对应的分位数k 如下表所示.要推断“A (1)作2×2列联表.(2)根据2×2列联表计算χ2的值.(3)查对分位数kχ2的值后,发现χ2≥k 成立,就称在犯错误的概率不超过α的前提下,可以认为A 与B 不独立(也称为A 与B 有关);或说有1-α的把握认为A 与Bχ2<k 成立,就称不能得到前述结论.这一过程通常称为独立性检验.二、考点和典型例题1、数据的收集与直观表示【典例1-1】北京2022年冬奥会期间,某大学派出了100名志愿者,为了解志愿者的工作情况,该大学学生会将这100名志愿者随机编号为1,2,…,100,再从中利用系统抽样的方法抽取一个容量为20的样本进行问卷调查,若所抽中的最小编号为3,则所抽中的最大编号为()A.96 B.97 C.98 D.99【典例1-2】某社区卫生室为了了解该社区居民的身体健康状况,对该社区1100名男性居民和900名女性居民按性别采用等比例分层随机抽样的方法进行抽样调查,抽取了一个容量为100的样本,则应从男性居民中抽取的人数为()A.45 B.50 C.55 D.60【典例1-3】已知某地区中小学生人数比例和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用分层抽样的方法随机抽取1%的学生进行调查,其中被抽取的小学生有80人,则样本容量和该地区的高中生近视人数分别为()A.200,25 B.200,2500 C.8000,25 D.8000,2500【典例1-4】将某市参加高中数学建模竞赛的学生成绩分成5组:[50,60),[60,70),[70,80),[80,90),[90,100),并整理得到频率分布直方图(如图所示).现按成绩运用分层抽样的方法抽取100位同学进行学习方法的问卷调查,则成绩在区间[70,80)内应抽取的人数为()A .10B .20C .30D .35【典例1-5】某学校为调查学生参加课外体育锻炼的时间,将该校某班的40名学生进行编号,分别为00,01,02,…,39,现从中抽取一个容量为10的样本进行调查,选取方法是从下面的随机数表的第1行第11列开始向右读取数据,直到取足样本,则抽取样本的第6个号码为( )90 84 60 79 80 24 36 59 87 38 82 07 53 89 35 96 35 23 79 18 05 98 90 07 3546 40 62 98 80 54 97 20 56 95 15 74 80 08 32 16 46 70 50 80 67 72 16 42 75 A .07 B .40C .35D .232、数据的数字特征、用样本估计总体【典例2-1】某学校举行诗歌朗诵比赛,10位评委对甲、乙两位同学的表现打分,满分为10分,将两位同学的得分制成如下茎叶图,其中茎叶图茎部分是得分的个位数,叶部分是得分的小数,则下列说法错误的是( )A .甲同学的平均分大于乙同学的平均分C .甲、乙两位同学得分的中位数相同D .甲同学得分的方差更小【典例2-2】已知数据1x ,2x ,…,n x 的平均值为2,方差为1,若数据11ax ,21ax +,…,()10n ax a +>的平均值为b ,方差为4,则b =( ).A .5B .4C .3D .2【典例2-3】某校高一年级1000名学生在一次考试中的成绩的频率分布直方图如图所示,现用分层抽样的方法从成绩40~70分的同学中共抽取80名同学,则抽取成绩50~60分的人数是( )A .20B .30C .40D .50【典例2-4】某高中为了了解本校学生考入大学一年后的学习情况,对本校上一年考入大学的同学进行了调查,根据学生所属的专业类型,制成饼图,现从这些同学中抽出100人进行进一步调查,已知张三为理学专业,李四为工学专业,则下列说法不正确的是( )A .若按专业类型进行分层抽样,则张三被抽到的可能性比李四大B .若按专业类型进行分层抽样,则理学专业和工学专业应抽取30人和20人C .采用分层抽样比简单随机抽样更合理D .该问题中的样本容量为100【典例2-5】如图是2021年青年歌手大奖赛中,七位评委为甲、乙两名选手打出的分数的茎叶图(其中m n 、均为数字09中的一个),在去掉一个最高分和一个是低分后,则下列说法错误的是( )A .甲选手得分的平均数一定大于乙选手得分的平均数B .甲选手得分的中位数一定大于乙选手得分的中位数C .甲选手得分的众数与m 的值无关D .甲选手得分的方差与n 的值无关 3、统计模型【典例3-1】已知下列命题:①回归直线y bx a =+恒过样本点的中心(),x y ;②两个变量线性相关性越强,则相关系数r 就越接近于1; ③两个模型中残差平方和越小的模型拟合的效果越好. 则正确命题的个数是( ). A .0B .1C .2D .3【典例3-2】下列说法错误的是( ) A .相关系数r 的绝对值越大,两个变量的线性相关性越强 B .在回归分析中,残差平方和越大,模型的拟合效果越好C .相关指数20.64R =,表示解释变量对于预报变量变化的贡献率为64%D .在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高 【典例3-3】如图是一组实验数据构成的散点图,以下函数中适合作为y 与x 的回归方程的类型是( )A .y ax b =+B .2y ax c =+C .log a y b x c =+D .x y ba c =+【典例3-4】当下,大量的青少年沉迷于各种网络游戏,极大地毒害了青少年的身心健康.为了引导青少年抵制不良游戏,适度参与益脑游戏,某游戏公司开发了一款益脑游戏,在内测时收集了玩家对每一关的平均过关时间,如下表:计算得到一些统计量的值为:661128.5,106.05i i i i i u x u ====∑∑,其中,ln i i u y =.若用模型e bx y a =拟合y 与x 的关系,根据提供的数据,求出y 与x 的经验回归方程;参考公式:对于一组数据(),i i x y (1,2,3,,i n =⋅⋅⋅),其经验回归直线ˆˆˆybx a =+的斜率和截距的最小二乘估计分别为1221ˆniii nii x ynxybxnx =-=-=-∑∑,ˆˆay bx =-. 【典例3-5】2022年北京冬奥会即第24届冬季奥林匹克运动会在2022年2月4日至2月20日在北京和张家口举行.某研究机构为了解大学生对冰壶运动是否有兴趣,从某大学随机抽取男生、女生各200人,对冰壶运动有兴趣的人数占总数的2740,女生中有80人对冰壶运动没有兴趣.(1)完成上面2×2列联表,并判断是否有99%的把握认为对冰壶运动是否有兴趣与性别有关?(2)按性别用分层抽样的方法从对冰壶运动有兴趣的学生中抽取9人,若从这9人中随机选出2人作为冰壶运动的宣传员,设X 表示选出的2人中女生的人数,求X 的分布列和数学期望.附:22()()()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.。
高考数学一轮复习第十章概率、随机变量及其分布课时规范练51随机抽样、用样本估计总体

课时规范练51随机抽样、用样本估计总体基础巩固组1.(2020天津耀华中学高一期末)已知一组数据为4,5,6,7,8,8,40%分位数是()A.8B.7C.6D.52.(多选)(2020江苏泗洪质检)某中学高一年级有20个班,每班50人;高二年级有30个班,每班45人.甲就读于高一,乙就读于高二.学校计划从这两个年级中共抽取235人进行视力调查,下列说法中正确的有()A.应该采用分层随机抽样法B.高一、高二年级应分别抽取100人和135人C.乙被抽到的可能性比甲大D.该问题中的总体是高一、高二年级的全体学生的视力3.(多选)(2020江苏启东高一期末)某人射箭9次,射中的环数依次为7,8,9,7,6,9,8,10,8,关于这组数据,下列说法正确的是()A.这组数据的众数是8B.这组数据的平均数是8C.这组数据的中位数是6D.这组数据的方差是434.将甲、乙两个篮球队10场比赛的得分数据整理成如图所示的茎叶图,由图可知()A.甲队得分的众数是3B.甲、乙两队得分在[30,39)内的频率相等C.甲、乙两队得分的极差相等D.乙队得分的中位数是38.55.(2020陕西榆林高三四模)港珠澳大桥位于中国广东省珠江口伶仃洋海域内,是中国境内一项连接香港、珠海和澳门的桥隧工程,因其超大的建筑规模、空前的施工难度和顶尖的建造技术而闻名世界.2018年10月24日上午9时开通运营后香港到澳门之间4个小时的陆路车程极大缩短.为了解实际通行所需时间,随机抽取了n台车辆进行统计,结果显示这些车辆的通行时间(单位:分钟)都在[35,50]内,按通行时间分为[35,38),[38,41),[41,44),[44,47),[47,50]五组,其中通行时间在[38,47)内的车辆有182台,频率分布直方图如图所示,则n=()A.280B.260C.250D.2006.(2020天津一中高三月考)某社区组织“学习强国”的知识竞赛,从参加竞赛的市民中抽出40人,将其成绩分成以下6组:第1组[40,50),第2组[50,60),第3组[60,70),第4组[70,80),第5组[80,90),第6组[90,100],得到如图所示的频率分布直方图.现采用分层随机抽样的方法,从第2,3,4组中抽取8人,则第2,3,4组抽取的人数依次为()A.1,3,4B.2,3,3C.2,2,4D.1,1,67.(2020山东泰安高一期末)某校从高一新生中随机抽取了一个容量为20的身高样本,数据从小到大排序如下(单位:cm):152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,x ,174,175,若样本数据的90%分位数是173,则x 的值为.8.(2020北京密云高三质检)某校高一年级三个班共有学生120名,这三个班的男生、女生人数如下表所示,已知在全年级中随机抽取1名学生,抽到二班女生的概率是0.2,则x=.现用分层随机抽样的方法在全年级抽取30名学生,则应在三班抽取的学生人数为.班级一班二班三班女生人数20x y 男生人数2020z 综合提升组9.(多选)(2020山东淄博高三质检)某学校为了调查学生一周内在生活方面的支出情况,抽出了一个容量为n 的样本,其频率分布直方图如图所示,其中支出在[50,60)内的学生有60人,则下列说法正确的是()A.样本中支出在[50,60)内的频率为0.03B.样本中支出不少于40元的人数为132C.n的值为200D.若该校有2000名学生,则定有600人支出在[50,60)内10.在《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱.欲以钱多少衰出之,问各几何?”其译文为:今有甲持560钱,乙持350钱,丙持180钱,甲、乙、丙三人一起出关,关税共100钱,要按照各人带钱多少的比例进行交税,问三人各应付多少税?则下列说法错误的是()A.甲应付5141109钱B.乙应付3224109钱C.丙应付1656109钱D.三者中甲付的钱最多,丙付的钱最少11.(多选)(2020山东嘉祥一中高三月考)在某次高中学科知识竞赛中,对4000名考生的参赛成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],60分以下视为不及格,若同一组中数据用该组区间中点值作代表,则下列说法中正确的是()A.成绩在[70,80)内的考生人数最多B.不及格的考生人数为1000C.考生竞赛成绩的平均分约为70.5分D.考生竞赛成绩的中位数为75分12.(2020江西九江高三模拟)一组数据中的每一个数据都乘以3,再减去50,得到一组新数据,若求得新的数据的平均数是1.6,方差是3.6,则原来数据的平均数和方差分别是()A.17.2,3.6B.54.8,3.6C.17.2,0.4D.54.8,0.413.(2020福建福州高二期中)为让学生适应新高考的赋分模式,某校在一次校考中使用赋分制给高二年级学生的生物成绩进行赋分,具体方案如下:A等级,排名等级占比7%,分数区间是83—100;B等级,排名等级占比33%,分数区间是71—82;C等级,排名等级占比40%,分数区间是59—70;D等级,排名等级占比15%,分数区间是41—58;E等级,排名等级占比5%,分数区间是30—40.现从全年段的生物成绩中随机抽取100名学生的原始成绩(未赋分)进行分析,其频率分布直方图如图所示:(1)求图中a的值;(2)以样本估计总体的办法,估计该校本次生物成绩原始分不少于多少分才能达到赋分后的C等级及以上(含C等级);(3)若采用分层抽样的方法,从原始成绩在[40,50)和[50,60)内的学生中共抽取5人,查看他们的答题情况来分析知识点上的缺漏,再从中选取2人进行调查分析,求这2人中至少一人原始成绩在[40,50)内的概率.创新应用组14.(多选)(2020重庆巴蜀中学高三月考)气象意义上从春季进入夏季的标志为:“连续5天每天日平均温度不低于22℃”.现有甲、乙、丙三地连续5天日平均温度的记录数据(数据都是正整数,单位:℃)满足以下条件:甲地:5个数据的中位数是24,众数是22;乙地:5个数据的中位数是27,平均数是24;丙地:5个数据有1个是32,平均数是26,方差是10.2,则下列说法正确的是()A.进入夏季的地区至少有2个B.丙地区肯定进入了夏季C.不能肯定乙地区进入夏季D.不能肯定甲地区进入夏季15.如图是某城市100户居民的月平均用电量(单位:度)的频率分布直方图.(1)求频率分布求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?参考答案课时规范练51随机抽样、用样本估计总体1.C因为有6位数,所以6×40%=2.4,所以40%分位数是第三个数6.2.ABD由于各年级的年龄段不一样,因此应采用分层随机抽样法.由于比例为23520×50+30×45=110,因此高一年级1000人中应抽取100人,高二年级1350人中应抽取135人,甲、乙被抽到的可能性都是110,因此只有C不正确,故选ABD.3.ABD数据从小到大排列为6,7,7,8,8,8,9,9,10,所以众数为8,故A正确;中位数为8,故C错误;平均数为6+7+7+8+8+8+9+9+109=8,故B正确;方差为19×[(6-8)2+(7-8)2×2+(8-8)2×3+(9-8)2×2+(10-8)2]=43,故D正确.4.D甲队得分的众数是33和35,故A错误;甲、乙两队得分在[30,39)内的频率分别为25和310,所以甲、乙两队得分在[30,39)内的频率不相等,故B错误;甲队得分的极差为51-24=27,乙队得分的极差为52-22=30,所以甲、乙两队得分的极差不相等,故C错误;乙队得分的中位数是34+432=38.5,故D正确.故选D.5.D由题意可知,通行时间在[38,47)内的频率为1-(0.01+0.02)×3=0.91,所以182=0.91,所以n=200.6.C由图可知第2,3,4组的频率之比为0.15∶0.15∶0.3,所以频数之比为1∶1∶2,现采用分层随机抽样的方法,从第2,3,4组中抽取8人,所以第2,3,4组抽取的人数依次为2,2,4.7.17290%分位数是173,所以r1742=173,x=172.8.249由题意可得120=0.2,解得x=24.三班总人数为120-20-20-24-20=36,用分层随机抽样的方法在全年级抽取30名学生,每个学生被抽到的概率为30120=14,故应从三班抽取的人数为36×14=9.9.BC样本中支出在[50,60)内的频率为1-(0.01+0.024+0.036)×10=0.3,故A错误;样本中支出不少于40元的人数为0.0360.03×60+60=132,故B正确;n=600.3=200,故n的值为200,故C正确;若该校有2000名学生,则可能有0.3×2000=600(人)支出在[50,60)内,故D错误.10.B依题意由分层随机抽样可知,100÷(560+350+180)=10109,则甲应付10109×560=5141109(钱);乙应付10109×350=3212109(钱);丙应付10109×180=1656109(钱).11.ABC由频率分布直方图可得,成绩在[70,80)内的频率最高,因此考生人数最多,故A正确;成绩在[40,60)内的频率为0.01×10+0.015×10=0.25,因此,不及格的人数为4000×0.25=1000,故B 正确;考生竞赛成绩的平均分约为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5(分),故C正确;因为成绩在[40,70)内的频率为0.45,在[70,80)内的频率为0.3,所以考生竞赛成绩的中位数为70+10×0.050.3≈71.67(分),故D错误.12.C设一组数据为x i(i=1,2,3,…,n),平均数为,方差为12,所得一组新数据为y i(i=1,2,3,…,n),平均数为,方差为22,则y i=3x i-50(i=1,2,3,…,n),=1+2+…+=1.6,即31-50+32-50+…+3-50=1.6,所以3-50=1.6,所以=51.63=17.2.22=1[(y1-)2+(y2-)2+…+(y n-)2]=1[(3x1-50-1.6)2+(3x2-50-1.6)2+…+(3x n-50-1.6)2]=1×9[(x1-17.2)2+(x2-17.2)2+…+(x n-17.2)2]=1×9[(x1-)2+(x2-)2+…+(x n-)2]=3.6,所以912=3.6,所以12=0.4.故选C.13.解(1)由题意(0.010+0.015+0.015+a+0.025+0.005)×10=1,所以a=0.030.(2)由已知等级达到C及以上所占排名等级占比为7%+33%+40%=80%,假设原始分不少于x分可以达到赋分后的C等级及以上,则有(0.005+0.025+0.030+0.015)×10+(60-x)×0.015=0.8,所以x≈57.估计原始分不少于57分才能达到赋分后的C等级及以上.(3)由题知评分在[40,50)和[50,60)内的频率分别为0.1和0.15,则抽取的5人中,评分在[40,50)内的有2人,评分在[50,60)内的有3人,记评分在[50,60)内的3位学生为a,b,c,评分在[40,50)内的2位学生为D,E,则从5人中任选2人的所有可能结果为:(a,b),(a,c),(a,D),(a,E),(b,c),(b,D),(b,E),(c,D),(c,E),(D,E),共10种,其中,这2人中至少一人评分在[40,50)内的可能结果为(a,D),(a,E),(b,D),(b,E),(c,D),(c,E),(D,E),共7种.所以这2人中至少一人评分在[40,50)内的概率为710.14.ABC甲地:5个数据由小到大排,则22,22,24,a,b,其中24<a<b,满足进入夏季的标志;乙地:将5个数据由小到大排,则a,b,27,c,d,其中a≤b≤27≤c≤d,则27+c+d≥81,而a+b+27+c+d=120,故a+b≤39,其中必有一个小于22,故不满足进入夏季的标志;丙地:设5个数据为a,b,c,d,32,且a,b,c,d∈N*,由方差公式可知:(a-26)2+(b-26)2+(c-26)2+(d-26)2+(32-26)2=10.2×5=51,则(a-26)2+(b-26)2+(c-26)2+(d-26)2=15=9+4+1+1,不妨设|a-26|=3,|b-26|=2,|c-26|=|d-26|=1,则a,b,c,d均大于22,满足进入夏季标准.综上,ABC正确.15.解(1)由频率分布直方图得20×(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)=1,解得x=0.0075.(2)由频率分布直方图知众数为230,用电量在[160,220)的频率是20×(0.002+0.0095+0.011)=0.45,用电量在[220,240)的频率为0.0125×20=0.25,设中位数为m,则-22020=0.5-0.450.25,解得m=224,即中位数是224.(3)由频率分布直方图知月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户的频率依次为0.25,0.15,0.1,0.05,则月平均用电量在[220,240)的用户中应抽取户数为0.250.25+0.15+0.1+0.05×11=5,应抽取5户.。
高考数学一轮总复习第十章统计与成对数据的统计分析第一节统计课件
(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ )
2.(多选)某高中为了了解本校学生考入大学一年后的学习情况,对本校上
一年考入大学的同学进行了调查,根据学生所属的专业类型,制成扇形图.
现从这些同学中抽出100人进一步调查,已知小张为理学专业,小李为工学
专业,则下列说法正确的是(
2.平均数、方差的推广
(1)若数据x1,x2,…,xn的平均数为 ,则mx1+a,mx2+a,mx3+a,…,mxn+a的平
均数是m +a.
(2)若数据x1,x2,…,xn的方差为s2,则数据ax1+b,ax2+b,…,axn+b的方差为a2s2.
1
(3)s2= ∑ xi2
=1
2
−x .
典例突破
例2.某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟
确定一个合理的月用水量标准x(单位:吨),一位居民的月用水量不超过x的
部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽
样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照
[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
人数为
.
答案 (1) AB
(2)B
(3)28
解析(1)根据抽样结果,此次抽样可能采用的是抽签法,A正确;
若按分层随机抽样,则抽得男生4人,女生3人,所以这次抽样不可能是按性
别分层随机抽样,B正确;
在随机抽样中,每个男生和每个女生被抽到的概率是相等的,C,D错误.故选
AB.
高三数学《概率统计(文科)》练习
文科数学《统计与概率》核心知识点与参考练习题一、统计(核心思想:用样本估计总体)1.抽样(每个个体被抽到的概率相等)(1)简单随机抽样:抽签法与随机数表法(2)系统抽样(等距抽样)(3)分层抽样2.用样本估计总体:(1)样本数字特征估计总体:众数、中位数、平均数、方差与标准差(2)样本频率分布估计总体:频率分布直方图与茎叶图3.变量间的相关关系:散点图、正相关、负相关、回归直线方程(最小二乘法)4.独立性检验二、概率(随机事件发生的可能性大小)1.基本概念(1)随机事件A的概率()()1,0∈AP(2)用随机模拟法求概率(用频率来估计概率)(3)互斥事件(对立事件)2.概率模型(1)古典概型(有限等可能)(2)几何概型(无限等可能)三、参考练习题1.某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_______ .2.某学校高一、高二、高三年级的学生人数之比是3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则该从高二年级抽取_____名学生.3.某校老年、中年和青年教师的人数见右表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为_______ .4.已知一组数据5.5,4.5,1.5,8.4,7.4,则该组数据的方差是_____.5.若1,2,3,4,m这五个数的平均数为3,则这五个数的标准差为____.6.重庆市2013年各月的平均气温(℃)数据的茎叶图如右图:则这组数据的中位数是________.7.某高校调查了200名学生每周的晚自习时间(单位:小时),制成了如图所示的频率分布直方图,其中晚自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.1408.(2016四川文)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查. 通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照 [0,0.5),[0.5,1),…,[4,4.5] 分成9组,制成了如图的频率分布直方图. (Ⅰ)求直方图中a的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(Ⅲ)估计居民月均用水量的中位数.类别人数老年教师900中年教师1800青年教师1600合计43009.(2015全国Ⅱ文)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表. A 地区用户满意度评分的频率分布直方图B 地区用户满意度评分的频数分布表 满意度评分分组[50,60) [60,70) [70,80) [80,90) [90,100]频 数2814106(Ⅰ)作出B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B 地区用户满意度评分的频率分布直方图(Ⅱ)根据用户满意度评分,将用户的满意度分为三个等级:试估计哪个地区用户的满意度等级为不满意的概率大?说明理由.10.(2014安徽文)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时). (Ⅰ)应收集多少位女生的样本数据?(Ⅱ)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;(Ⅲ)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:()()()()()d b c a d c b a bc d a n K ++++-=22满意度评分 低于70分 70分到89分不低于90分 满意度等级不满意满意非常满意()02k K P ≥ 0.10 0.05 0.01 0.005 0k 2.706 3.841 6.635 7.87911.(2014全国Ⅰ文)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125] 频数 6 26 38 22 8(Ⅰ)在下表中作出这些数据的频率分布直方图:(Ⅱ)估计这种产品质量指标值的平均数和方差(同一组中的数据用该组区间的中点值作代表);(Ⅲ)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?12.(2014广东文)某车间20名工人年龄数据如下表:(Ⅰ)求这20名工人年龄的众数与极差;(Ⅱ)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(Ⅲ)求这20名工人年龄的方差.13.(2016江苏)将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是_______ .14.从甲、乙等5名学生中随机选出2人,则甲被选中的概率为_______ .15.(2016全国乙卷文)为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是______ .16.(2016全国丙卷文)小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M、I、N中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是________ .17.(2016天津文)甲、乙两人下棋,两人下成和棋的概率为21,甲获胜的概率是31,则甲不输的概率为_________ .18.已知5件产品中有2件次品,其余为合格品.现从这5件产品中任选2件,恰有一件次品的概率为_________ .19.某单位N 名员工参加“社区低碳你我他”活动.他们的年龄在25岁至50岁之间.按年龄分区间 [25,30) [30,35) [35,40) [40,45) [45,50]人数 25 a b(Ⅰ)求正整数a ,b ,N 的值;(Ⅱ)现要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,则年龄在第1,2,3组的人数分别是多少?(Ⅲ)在(2)的条件下,从这6人中随机抽取2人参加社区宣传交流活动,求恰有1人在第3组的概率.20.(2016全国Ⅰ文)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( )A.31B.21C.32D.4321.(2016全国Ⅱ文)某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为( ) A.107 B.85 C.83 D.103 22.在区间[-2,3]上随机选取一个数x ,则1≤x 的概率为_____ .23.若将一个质点随机投入如图所示的长方形ABCD 中,其中AB=2,BC=1,则质点落在以AB 为直径的半圆内的概率是_______ .24.如图,在边长为1的正方形中随机撒1000粒豆子,有180粒落到阴影部分,据此估计阴影部分的面积为_________ .25.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x 的线性回归方程为( )A .1ˆ-=x yB .1ˆ+=x yC .x y 2188ˆ+= D .176ˆ=y26.某产品的广告费用x 与销售额y 的统计数据如下:根据上表可得回归方程a x b yˆˆˆ+=中的b ˆ为9.4,据此模型预报广告费用为6万元时销售额为 A .63.6万元 B .65.5万元 C .67.7万元 D .72.0万元27.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年 份 2011 2012 2013 2014 2015 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(Ⅰ)求y 关于t 的回归方程a t b yˆˆˆ+=; (Ⅱ)利用(Ⅰ)中的回归方程,分析2011年至2015年该地区城乡居民储蓄存款的变化情父亲身高x (cm ) 174 176 176 176 178 儿子身高y (cm )175175176177177广告费用x (万元) 4 2 3 5 销售额y (万元)49263954况,并预测该地区2016年(t =6)的人民币储蓄存款.附:回归方程a t b yˆˆˆ+=中,t b y atn tyt n y t b ni ini ii ˆˆ,ˆ1221-=--=∑∑==.28.甲、乙两所学校高三年级分别有1200人、1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样的方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下: 甲校:乙校:(1)计算y x ,的值;(2)若规定考试成绩在[120,150]内为优秀,请分别估计两所学校数学成绩的优秀率; (3)由以上统计数据填写下面2×2列联表,并判断是否有90%的把握认为两所学校的数学成绩有差异.参考数据与公式:由列联表中数据计算()()()()()d b c a d c b a bc ad n K ++++-=22;临界值表:29.一次考试中,5名学生的数学、物理成绩如下表所示:(1)要从5名学生中选2人参加一项活动,求选中的学生中至少有一人的物理成绩高于90分的概率;(2)根据上表数据作散点图,求y 与x 的线性回归方程(系数精确到0.01).附:回归直线的方程是:a x b y ˆˆˆ+=,其中()()()x b y ax x y y x x b ni ini iiˆˆ,ˆ121-=---=∑∑==; 90,93==y x ,()()()30,4051251=--=-∑∑==y y x x x x ii ii i .30.为调查市民对汽车品牌的认可度,在秋季车展上,从有意购车的500名市民中,随机抽取100名市民,按年龄情况进行统计得到下面的频率分布表和频率分布直方图.(1)求频率分布表中a 、b 的值,并补全频率分布直方图,再根据频率分布直方图估计有意购车的这500名市民的平均年龄;31.(2016新课标Ⅱ)某险种的基本保费为a (单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:上年度出险次数0 1 2 3 4 ≥5保费0.85aa1.25a1.5a1.75a2a设该险种一续保人一年内出险次数与相应概率如下:一年内出险次数0 1 2 3 4 ≥5概率0.300.150.200.200.100.05(Ⅰ)求一续保人本年度的保费高于基本保费的概率;32.袋中有形状、大小都相同的4只球,其中1只白球,1只红球,2只黄球,从中一次随机分组(岁) 频数 频数[20,25) 5 0.050 [25,30) 200.200 [30,35) a0.350[35,40) 30 b[40,45] 10 0.100 合计1001.000摸出2只球,则这2只球颜色不同的概率为____________ .33.现有6道题,其中4道甲类题,2道乙类题,某同学从中任取2道题解答.试求:(1)所取的2道题都是甲类题的概率;(2)所取的2道题不是同一类题的概率.A,两地区分别随机调查了20个用户,得到用34.某公司为了解用户对其产品的满意度,从B户对产品的满意度评分如下:A地区:62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B地区:73 83 62 51 91 46 53 73 64 8293 48 65 81 74 56 54 76 65 79(Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);。
高考(理)总复习资料:第9章 第2讲 用样本估计总体
• ①甲同学成绩的中位数大于乙同学成绩的中 位数;
• ②甲同学的平均分比乙同学高; • ③甲同学的平均分比乙同学低; • ④甲同学成绩的方差小于乙同学成绩的方
差. • 上解析面:说甲法的中正位确数的81,是乙_的__中_位__数_8_7..5,故①错, x 甲= 81•,答x 案乙=:85③,故④②错,③对,由茎叶图知甲成绩比较稳定,
D. x 甲> x 乙,m甲<m乙
• [审题视点] 仔细观察茎叶图.中位数为一列
数中最中间的那个,当数有偶数个时,中位
数[解为析]中甲间数两据个集中数于的前平半段均,数而.乙数es据集中于后半段,
所以
x
甲<
x
乙;m甲=
18+22 2
=20,m乙=
27+31 2
=29,所以m甲
<m乙,所以选B.
• [答案] B
• [答案] C
32
1.平均数和方差都是重要的数字特征,是对总体一种简 明的阐述.平均数、中位数、众数描述总体的集中趋势,方 差和标准差描述波动大小.
2. 平均数、方差公式的推广 若数据x1,x2,…,xn的平均数为 x ,方差为s2,则数据 mx1+a,mx2+a,…,mxn+a的平均数为m x +a,方差为 m2s2.
33
• [变式探究] [2013·西安质检]某校甲、乙两 个班级各有5名编号为1,2,3,4,5的学生进行投 篮练习,每人投10次,投中的次数如下表:
学生 1号 2号 3号 4号 5号
甲班 6
7
7
8
7
乙班 6
7
6
7
9
34
则以上两组数据的方差中较小的一个为s2,则s2=( )
2025高考数学一轮复习-第45讲-随机抽样的方法、用样本估计总体【课件】
举题说法
百分位数的估计
1 (1) 现有一组数据:663,664,665,668,671,664,656,674
,651,653,652,656.则这组数据的第85百分位数是
( C)
A.652
B.668
C.671
D.674
【解析】 由题意,这组数据共12个,则12×85%=10.2.将这组数据按从小到大的顺序 排列为651,652,653,656,656,663,664,664,665,668,671,674,故这组 数据的第85百分位数为第11个数,即671.
【解析】对于 A,设 x2,x3,x4,x5 的平均数为 m,x1,x2,…,x6 的平均数为 n,则 n-m=x1+x2+x3+6 x4+x5+x6-x2+x3+4 x4+x5=2(x1+x6)-(x122+x3+x4+x5),因为无 法确定 2(x1+x6),x2+x3+x4+x5 的大小关系,所以无法判断 m,n 的大小,如 1,2, 3,4,5,6,可得 m=n=3.5;如 1,1,1,1,1,7,可得 m=1,n=2;如 1,2, 2,2,2,2,可得 m=2,n=161,故 A 错误. 对于 B,不妨设 x1≤x2≤x3≤x4≤x5≤x6,可知 x2,x3,x4,x5 的中位数等于 x1,x2,…, x6 的中位数,均为x3+2 x4,故 B 正确.
【解答】 x =110×(545+533+551+522+575+544+541+568+596+548)=552.3, y =110×(536+527+543+530+560+533+522+550+576+536)=541.3,z = x - y =552.3-541.3=11,zi=xi-yi 的值分别为 9,6,8,-8,15,11,19,18,20,12, 故 s2=110×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+0+(19-11)2+ (18-11)2+(20-11)2+(12-11)2]=61.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
质疑探究 1:频率分布直方图中纵轴表示什 么含义?小长方形的面积表示什么?各小长 方形面积之和等于多少? 提示:
频率 组距
,频率,1.
2.频率分布折线图和总体密度曲线 (1)频率分布折线图 连接频率分布直方图中各小长方形上端的 中点,就得频率分布折线图. (2)总体密度曲线 随着样本容量的增加,作图时所分的组数增加, 组距减小,相应的频率折线图会越来越接近于 一条光滑曲线,即总体密度曲线.
(2)第三组的人数为 0.3×100=30, 第四组的人数为 0.2×100=20, 第五组的人数为 0.1×100=10, 三组共计 60 人,从中抽取 12 人,每组应抽 取的人数为 第三组:
30 60
×12=6;
第四组: 第五组:
20 ×12=4; 60 10 ×12=2, 60
所以第三、四、五组分别抽取 6,4,2 人.
从折线图看,甲的成绩基本呈上升状态,而乙的 成绩上下波动较小,可知甲的成绩在不断提高, 而乙的成绩则无明显提高.
(1)平均数和方差都是重要的数字 特征,是对总体一种简明的阐述.平均数、中 位数、 众数描述总体的集中趋势,方差和标准 差描述波动大小. (2)用样本的数字特征估计总体的数字特征 时,样本容量越大,估计就越精确.
解析:依题意得,后两个小组的频率之和为 (0.0125+0.0375)×5=0.25,因此前三个小组的 频率之和为 1-0.25=0.75,前两个小组的频率之
1 2 和为 ×0.75=0.375,所以体重小于 1 2 3
60 kg 的高三男生人数为 480×0.375=180. 答案:180
变式训练 2 1:(2013 重庆万州纯阳中学高三 月考)某样本数据的茎叶图如图所示,若该组 数据的中位数为 85,平均数为 85.5,则 x+y 等于( )
(A)12
(B)13
(C)14
(D)15
解析:∵中位数为 85,∴4+x=2×5,解得 x=6. 又平均数为 85.5, ∴73+79+3×84+86+87+88+93+90+y=855, ∴y=7.故 x+y=13.故选 B.
频率分布直方图的画法及应用 【例 1】 (2013 四川棠湖中学外语实验学校月 考)某班同学利用寒假进行社会实践,对年龄段 在[10,60]的人生活习惯是否符合环保理念进 行调查.现随机抽取若干人进行数据分析,得到 频率分布表和频率分布直方图:
组数 第一组 第二组 第三组 第四组 第五组 合计
分组 [10,20) [20,30) [30,40) [40,50) [50,60]
1 = 5
(80×2+90×3+8+9+2+1+0)=90,
1 x = (80×4+90×1+3+4+8+9+1)=87,x >x ; 5 2 1 s甲 = [(88-90) +(89-90) +(92-90) +(91-9 5
乙 甲 乙 2 2 2
0) +(90-90) ]=2,
2
2 2
2
2
1 s乙 = [(83-87) +(84-87) +(88-87) +(89-8 5 7) +(91-87) ]
4.会用样本的频率分布估计总体分布,会用样本的 基本数字特征估计总体的基本数字特征,理解用样 本估计总体的思想. 5.会用随机抽样的基本方法和样本估计总体的思想 解决一些简单的实际问题.
1.某部门计划对某路段进行限速,为调查限速 60 km/h 是否合理,对通过该路段的 300 辆汽车的车速 进行检测,将所得数据按 [40,50),[50,60),[60,70),[70,80]分组,
(1)第二小组的频率是多少?样本容量是多少? (2)若次数在 110 以上(含 110 次)为达标,试估 计该学校全体高一学生的达标率是多少? (3)在这次测试中,学生跳绳次数的中位数落 在哪个小组内?
解:(1)由从左到右各小长方形的面积之比为 2∶4∶17∶15∶9∶3, 且各小长方形面积之和为 1,知各小长方形的 面积(从左至右)分别为
绘制成如图所示的频率分布直方图.则这 300 辆 汽车中车速低于限速的汽车有( C ) (A)75 辆 (B)120 辆 (C)180 辆 (D)270 辆
解析:据直方图可得 300 辆中车速低于限速 的汽车所占的频率为 10×0.025+10× 0.035=0.6, 故其频数为 300×0.6=180. 故选 C.
2.(2013 四川成都外国语学校高三月考)对某商 店一个月内每天的顾客人数进行了统计,得到 样本的茎叶图(如图所示),则该样本的中位数、 众数、极差分别是( A )
1 2 3 4 5 6
2 5 0 2 3 3 1 2 4 4 8 9 5 5 5 7 7 8 8 9 0 0 1 1 4 7 9 1 7 8
(A)46,45,56 (B)46,45,53 (C)47,45,56 (D)45,47,53 解析:极差为 68-12=56,
45 47 中位数为 =46, 2
故选 A.
3.(2013 四川成都市铁路中学高三月考)为了解 我国 13 岁男孩的平均身高,从北方抽取了 300 个男孩,平均身高 1.60 m;从南方抽取了 200 个 男孩,平均身高为 1.50 m,由此可推断我国 13 岁 男孩的平均身高为 .
茎叶图的画法及应用 【例 2】 某良种培育基地正在培育一种小麦新品种 A. 将其与原有的一个优良品种 B 进行对照试验.两种小麦 各种植了 25 亩,所得亩产数据(单位:千克)如下: 品种 A:357,359,367,368,375,388,392,399,400,405, 412,414,415,421,423,423,427,430,430,434,443,44 5,445,451,454
变式训练 3-1:(2013 重庆万州纯阳中学高三 月考)甲、 乙两个数学兴趣小组各有 5 名同学, 在一次数学测试中,成绩统计用茎叶图表示 如图所示,若甲、 乙小组的平均成绩分别是 x
甲
,x 乙,则下列结论正确的是(
)
(A)x 甲>x 乙,甲比乙成绩稳定 (B)x 甲>x 乙,乙比甲成绩稳定 (C)x 甲<x 乙,甲比乙成绩稳定 (D)x 甲<x 乙,乙比甲成绩稳定 解析:依题意得 x甲
人数 5
频率 x
y n
(1)求出频率分布表中 n,x,y 的值; (2)现从第三、 四、 五组中,采用分层抽样法 抽取 12 人参加户外环保体验活动,则从这 三组中应各抽取多少人?
解:(1)由图表中的第一组数据可
5 知,n= =100, 0.05
x=0.035×10=0.35, 第四组的频率为 0.02×10=0.2, 所以 y=100×0.2=20.
思维导引:根据数据画出茎叶图,然后根据数 据分布特点进行推断和估计. 解:(1)
(2)结合茎叶图可知:①品种 A 的亩产平均数 比品种 B 高;②品种 A 的亩产标准差(或方差) 比品种 B 大,故品种 A 的亩产稳定性较差.
(1)茎叶图中保留了原始数据,便于 记录和表示. (2)当样本数据较少时,用茎叶图表示数据的 效果较好,而样本数据较多时,则不方便记录.
3.茎叶图的优点 茎叶图表示数据有两个突出的优点: (1)能够保留原始数据,所有信息都可以从 这个茎叶图中得到,(2)可以随时记录,方便 记录与表示.
4.样本的数字特征 见附表
质疑探究 2:平均数、 标准差与方差反映了数 据的哪些特征? 提示:平均数反映了数据取值的平均水平, 标准差、 方差反映了数据对平均数的波动情 况,即标准差、 方差越大,数据的离散程度越 大,越不稳定;反之离散程度越小,越稳定.
解:(1)由题图可得甲、乙两人五次测试的 成绩分别为 甲:10 分,13 分,12 分,14 分,16 分; 乙:13 分,14 分,12 分,12 分,14 分.
x甲 = 10 13 12 14 16 =13(分),
5 x乙 = 13 14 12 12 14 =13(分); 5
2 2 2
=9.2,
s甲
2
< s乙 ,因此甲比乙成绩稳定.故选 A.
2
在人 A 通用文 JC 上删去序化答题
【例 1】 为了了解高一学生的体能情况,某 校抽取部分学生进行一分钟跳绳次数测试, 将所得数据整理后,画出频率分布直方图, 图中从左到右各小长方 形面积之比为 2∶4∶ 17∶15∶9∶3,第二小组 频数为 12.
1 2 17 3 9 3 , , , , , , 25 25 50 10 50 50
2 故第二小组的频率为 25
又第二小组的频数为 12,
,
25 所以样本容量为 12× 2
(2)达标率为
=150.
17 3 9 3 44 =88%. 50 10 50 50 50
(3)因为
1 2 17 23 1 , 25 25 50 50 2 9 3 12 1 , 50 50 50 2
(1)频率分布表中体现频数与频 率的关系;(2)频率分布直方图中各组的频 率大小很直观,计算时要把图表结合起来 使用.
变式训练 1 1:(2013 四川自贡市高三第三 次诊断考试)某校为了解高三男生的身体状 况,检测了 480 名高三男生的体重(单 位:kg),所得数据都在区间[50,75]中,其频 率分布直方图如图所示.若图中从左到右的 前 3 个小组的频率之比为 1∶2∶3,则体重 小于 60 kg 的高三男生人数为 .
1 [(10-13)2+(13-13)2+(12-13)2+(14-13)2+ s = 5