高中数学必修3复习_统计的讲义与习题
数学北师大版高中必修3北师大版高中数学必修3第一章《统计》小结与复习课课件

各层中抽 样时采用 前两种方 式
11
分析样本,估计总体
几个公式
样本数据: 1 平均数:
x ,x2, ,xn
2
x1 x 2 x n x n
2 2
12
( x1 x ) ( xn x ) 标准差: s s n
分析样本的分布情况可用 样本的频率分布表 样本的频率分布直方图
(1)列出样本频率分布表﹔ (2)画出频率分布直方图; (3)估计身高小于134cm的人数占总人数的百 分比.。 分析:根据样本频率分布表、频率分布直方图 的一般步骤解题。
15
解:(1)样本频率分布表如下:
分组 [122,126) [126,130) [130,134) [134,138) [138,142) [142,146) [146,150) [150,154) [154,158) 合计 频数 5 8 10 22 33 20 11 6 5 120 频率 0.04 0.07 0.08 0.18 0.28 0.17 0.09 0.05 0.04 1
7
例题
某校高中三年级的295名学生已经 编号为1,2,……,295,为了了 解学生的学习情况,要按1:5的比 例抽取一个样本,用系统抽样的方 法进行抽取,并写出过程。
8
[分析]按1:5分段,每段5人,共分59段, 每段 抽取一人,关键是确定第1段的编号。 解:按照1:5的比例,应该抽取的样本容量为 295÷5=59,我们把259名同学分成59组,每组5 人,第一组是编号为1~5的5名学生,第2组是编 号为6~10的5名学生,依次下去,59组是编号为 291~295的5名学生。采用简单随机抽样的方法, 从第一组5名学生中抽出一名学生,不妨设编号为 k(1≤k≤5),那么抽取的学生编号为 k+5L(L=0,1,2,……,58),得到59个个体作为样 本,如当k=3时的样本编号为3,8,13,……, 288,293。
部编人教高中数学必修3《统计 复习参考题》陈翠英PPT课件 一等奖新名师优质课

(3)如果以“平均送达时间”的平均数作为决策依据,从 和 两款订餐软件中选择一款订餐,你会选择哪款?巩固练习三、总结
1、证明数列为等差等比数列的方法 2、列举统计题里中的古典概形的6选3,5选
的总结果不能错 3、重点要提高计算能力。
四、作业:《限时》P185-P186
与统计有关的试卷讲评
一、评讲17题
加深巩固
二、评讲19题
19原题:.随着移动互联网的发展,与餐饮美食相关的 手机 软件层出不穷,现从某市使用A和B两款订餐软件 的商家中分别随机抽取100个商家,对它们的“平均送达 时间”进行统计,得到频率分布直方图如下:
(1)已知抽取的100个使用A款订餐软件的商家中,甲商 家的“平均送达时间”为18分钟,现从使用A款订餐软件 的商家中“平均送达时间”不超过20分钟的商家中随机抽 取3个商家进行市场调研,求甲商家被抽到的概率;
高中数学第2章统计章末复习与总结课件新人教A版必修3

需要注意的是:通过样本数据的统计图表和数字特征,我 们能够估计总体的信息,而且样本容量越大,这种估计也就越 精确.当样本数据发生变化时,总体的这些信息不会变化.
【例 5】 某工厂甲、乙两个车间包装同一种产品,在自动 包装传送带上每隔一小时抽一包产品,称其重量(单位:克)是否 合格,分别记录抽查数据,获得重量数据茎叶图.
[答案] ①
【例 2】 某市为创建文明城市,面向全市征召志愿者,现 从符合条件的志愿者中随机抽取 100 名并按年龄(单位:岁)分 组:第 1 组[20,25),第 2 组[25,30),第 3 组[30,35),第 4 组[35,40), 第 5 组[40,45]得到频率分布直方图如图所示.
若从第 3,4,5 组中用分层抽样的方法抽取 6 名志愿者参与广 场的宣传活动,应从第 3,4,5 组各抽取多少名志愿者?
3.利用回归方程对总体进行估计 对具有线性相关关系的两个变量进行研究时,可以通过样 本所求出的回归方程对这两个变量确定的总体进行估计或预 测.利用回归方程对总体进行估计时,需要注意以下两点: (1)只有当两个变量之间存在线性相关关系时,才能用回归 方程对总体进行估计和预测.否则,如果两个变量之间不存在 线性相关关系,即使由样本数据求出回归方程,用其估计和预 测的结果也不可信.
[方 法 总 结] 频率分布直方图中,各个矩形的面积为对应数据中的频率 且所有矩形的面积和为 1. 2.估计总体的数字特征 通常我们用样本的平均数和方差(标准差)来近似代替总体 的平均数和方差(标准差),呈现样本数据的集中趋势及波动大 小,从而实现对总体的估计.
(1)一般情况下,需要将平均数和标准差结合,得到更多样 本数据的信息,从而对总体作出较好的估计.因为平均数容易 掩盖一些极端情况,使我们作出对总体的片面判断,而标准差 较好地避免了极端情况.
高中数学 统计单元复习(第2课时)课件 新人教A版必修3

能耗
y = 0.7x + 0.35 5
4
3
2
1
0
0
2
4
6
8
产量
0.7×100+0.35=70.35(吨)
作业: P101复习参考题 A组:8(1)(2)(3). B组:1,2.
求这100名学生中体重在56.5~64.5范围 内的人数.
例2 某商场为了调查旅游鞋的销售情况,
抽取了部分顾客购鞋的尺寸,将所得数据整
理后,画出频率分布直方图如下:频率源自组距已知图中从左到右前
3个小矩形的面积之
比为1︰2︰3,第二
0.0875
小组的频数为10.
0.0375
35.5 37.5 39.5 41.5 43.5 45.5 尺寸
第二章 统计 单元复习 第二课时
例1 为了了解某地区高中学生的身体 发育情况,抽查了该地区100名年龄在 17.5~18岁的男生体重(单位:kg), 得到频率分布直方图如下:
频率 组距
40
0.07
0.05
0.03
体重/kg
54.5 56.5 58.5 60.5 62.5 64.5 66.5 68.5 70.5 72.5
20
30
80
40
30
试估计总体寿命的平均数.
150×0.1 + 250×0.15 + 350×0.4 + 450×0.2 + 550×0.15=365(h)
例6 某工厂经过技术改造后,生产 某种产品的产量x吨与相应的生产能耗y 吨标准煤有如下几组样本数据:
x
3
4
y 2.5 3
5
6
4 4.5
人教A版高中数学必修三 统计复习题课ppt下载(20ppt)

第二章 统计复习
收集数据
(随机抽样)
本章知识框图
整理、分析数据 并估计、推断
用样本估 计总体
变量间的 相关关系
简 单 随 机 抽 样
分系
层统
抽 样
抽 样
用样本的 频率分布
估计总体
用样本的 数字特征 估计总体
线 性 回 归
分
析
一、抽样的常用方法
三类随机抽样中每个个体被抽取的可能性均相等.
人教A版高中数学必修三 统计复习题课ppt下载(20ppt)【PPT教研 课件】
二、用样本估计总体
2.用样本的数字特征估计总体
集中趋势:
平均数、中位数、众数
离散趋势:
方差、标准差
人教A版高中数学必修三 统计复习题课ppt下载(20ppt)【PPT教研 课件】
人教A版高中数学必修三 统计复习题课ppt下载(20ppt)【PPT教研 课件】
人教A版高中数学必修三 统计复习题课ppt下载(20ppt)【PPT教研 课件】
人教A版高中数学必修三 统计复习题课ppt下载(20ppt)【PPT教研 课件】
8.
人教A版高中数学必修三 统计复习题课ppt下载(20ppt)【PPT教研 课件】
人教A版高中数学必修三 统计复习题课ppt下载(20ppt)【PPT教研 课件】
二、用样本估计总体
1.用样本的频率分布估计总体
作样本频率分布直方图的步骤:
(1)求极差; (2)决定组距与组数; (组数=极差/组距) (3)将数据分组; (4)列频率分布表(分组,频数,频率); (5)画频率分布直方图。
人教A版高中数学必修三 统计复习题课ppt下载(20ppt)【PPT教研 课件】
人教版数学选择性必修三综合复习:统计与统计分析课件

(i)分别求5个年龄组和5个职业组成绩的平均数和方差;
(ii)以上述数据为根据,评价5个年龄组和5个职业组对“一带一路”的认知
程度,并谈谈你的感想.
(1)根据频率散布直方图得第一组的频率为0.01×5=0.05,
6
∴ =0.05, ∴x=120.
附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,
利用2010年至202X年的数据建立的线性模型ො =99+17.5t可以较好地描述2010
年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值
更可靠.
(ii)从计算结果看,相对于202X年的环境基础设施投资额220亿元,由模型①得
.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收
入构成比例,得到如下饼图:
则下面结论中不正确的是( A )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业
的人举行了一次“一带一路”知识比赛,满分为100分(90分及以上为认知程度
高).现从参赛者中抽取了x人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第
三组:[30,35),第四组:[35,40),第五组:[40,45),得到如图所示的频率散布直方图,已
设建设前经济收入为a,则建设后经济收入为2a,由题图可得下表:
种植收入
第三产业
人教版高中数学必修3第二章 统计章节复习
星火教育一对一辅导教案学生姓名性别年级学科数学授课教师上课时间年月日第()次课共()次课课时:2课时教学课题人教版必修3 第二章统计章节复习教学目标知识目标:会应用几种抽样的方法,学会散点图及线性回归方程的计算能力目标:数据的收集,整理分析,估计推断,得出结论情感态度价值观:联系实际生活,把统计可以应用到生活中去,提高学习乐趣教学重点与难点重点:随机抽样的方法,变量之间的相关关系,频率分布直方图难点:随机抽样的方法区分使用,直方图的绘制,线性回归方程的计算教学过程统计知识梳理本章知识结构框图简单随机抽样:(1)概念(2)抽签法概念及步骤(3)随机数表法概念及步骤分层抽样:(1)定义(3)注意事项(2)使用方法系统抽样:(1)定义(3)注意事项(2)使用方法简单随机抽样、系统抽样、分层抽样的比较:用样本估计总体:一、频率分布直方图频率分布是指一个样本数据在各个小范围内所占比例的大小。
一般用频率分布直方图反映样本的频率分布。
其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图频率分布直方图的特征:(1)、从频率分布直方图可以清楚的看出数据分布的总体趋势。
(2)、从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
二、频率分布折线图、总体密度曲线频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。
总体密度曲线:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。
它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。
三、茎叶图(1).茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。
高中数学必修3概率统计知识点归纳
高中数学必修3概率统计知识点归纳概率统计是高中数学必修3中的一门重要课程,它研究的是随机事件的发生规律和变化趋势。
概率统计知识点在高中数学习中占据着重要的位置,对于培养学生的逻辑思维、数学建模和解决实际问题的能力具有重要意义。
下面将对高中数学必修3概率统计知识点进行全面归纳。
1.基础概念概率统计的基础概念包括样本空间、随机事件、事件的概率等。
样本空间是指所有可能的结果组成的集合,用S表示;随机事件是样本空间的子集,用A、B、C等表示;事件的概率是指一个随机事件发生的可能性大小,用P(A)表示。
2.排列组合排列组合是概率统计中常用的工具,主要用于计算事件的可能性。
在排列中,元素的顺序是重要的,而在组合中,元素的顺序是不重要的。
排列可以表示为n!,组合可以表示为C(n,m)。
3.基本概率公式基本概率公式是指计算事件的概率的公式。
对于一个随机事件A,它的概率可以用公式P(A) = n(A) / n(S)来表示,其中n(A)表示事件A 的样本点数量,n(S)表示样本空间的样本点数量。
4.互斥事件与对立事件互斥事件是指两个事件不可能同时发生的事件,它们的概率相加等于两个事件发生的总概率。
对立事件是指两个事件互为对方的补集,它们的概率之和等于1。
5.条件概率条件概率是指在已知某个条件下,事件发生的概率。
条件概率可以用公式P(A|B) = P(A∩B) / P(B)来表示,其中P(A|B)表示在事件B发生的条件下,事件A发生的概率;P(A∩B)表示事件A和事件B同时发生的概率;P(B)表示事件B发生的概率。
6.全概率公式和贝叶斯公式全概率公式和贝叶斯公式是处理复杂事件概率的重要方法。
全概率公式可以用于计算一个事件在不同条件下发生的概率,贝叶斯公式可以用于根据已知条件计算相应的概率。
7.随机变量与概率分布随机变量是指与随机事件相对应的数值,概率分布是指随机变量各取值的概率情况。
常见的概率分布有离散型概率分布和连续型概率分布。
人教A版高中数学必修三第二章统计复习题课课件(共20张PPT)
0.018
0.36
(3)若广告费为9万元,则销售收入约为多少万元?
[170,190) S3:在第一段1~10号中用的
的方法
5 0.05 0.0025 在这个抽样中,某件产品被抽中的概率是
2009年义乌小商品博览会共设国际标准展位5000个。
[190,210) 36 0.36 0.018 请归纳求线性回归方程的一般步骤:
8.
(4)求b、a,写出方程.
150 170 190 210 230 250 为了解高一年级500名同学的视力情况,试用系统抽样从中抽取50名同学进行检查。 用样本的数字特征估计总体
区间中点与相应概率之积的和
150 170 190 210 230 250
到大依次分成
段,每段
人;
2009年义乌小商品博览会共设国际标准展位5000个。
定首号 S3:在第一段1~10号中用的简单随机抽样的方法
抽取一个号码,比如3;
取余号 S4:依次抽取 3,13,23,33, ……这50个号码。
这样就得到了一个容量为50的样本。
6. 某中学高一年级560人,高二年级540人,高三年
级520人,用分层抽样的方法抽取部分样本,若从
这样就高得到一了一个年容量级为50抽的样本取。 28人,则从高二、高三年级分别抽取
(4)求b、a,写出方程.
(2)求出y对x的线性回归方程;
用样本的数字特征估计总体
2009年义乌小商品博览会共设国际标准展位5000个。
2009年义乌小商品博览会共设国际标准展位5000个。
S3:在第一段1~10号中用的
的方法
S3:在第一段1~10号中用的
的方法
S1:把500人从1到500编号;
2020届高中数学分册同步讲义(必修3) 第2章 专题突破一 例析频率分布直方图中的统计问题
专题突破一例析频率分布直方图中的统计问题一、求样本中限制条件下的个体所占频率例1观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2 700,3 000)的频率为()A.0.001 B.0.1C.0.2 D.0.3思维切入求对应区间上的小矩形的面积.答案 D解析由直方图的意义可知,在区间[2 700,3 000)内取值的频率为(3 000-2 700)×0.001=0.3. 点评频率为直方图中相应小长方形的面积,即频率=纵坐标×横坐标差的绝对值.跟踪训练1某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分),现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如下图所示.已知图中从左到右的第一、三、四、五小组的频率分别为0.30,0.15,0.10,0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________. 答案 100 0.15解析 设参赛的人数为n ,第二小组的频率为1-(0.30+0.15+0.10+0.05)=0.4, 依题意40n=0.4,∴n =100,优秀的频率是0.10+0.05=0.15. 二、求样本中限制条件下的个体的频数例2 某市高三数学抽样考试中,对90分以上的成绩进行统计,其频率分布如图所示.若130~140分数段的人数为90,则90~100分数段的人数为________.思维切入 对应区间上的频数即为对应区间的频率×样本总体. 答案 810解析 由于90分以上的考试人数是样本总体,则图中5个分数段的频率之和等于1,设130~140分数段的频率为p ,则0.45+0.25+0.15+0.10+p =1,即0.95+p =1,则p =0.05,设该样本总体共有n 个学生的分数,且设90~100分数段的人数为x ,则由频率概念得⎩⎪⎨⎪⎧ 0.05×n =90,0.45×n =x ,解得⎩⎪⎨⎪⎧n =1 800,x =810,故90~100分数段的人数为810. 点评 本题是频率分布条形图.由于各分数段的人数与频率成正比,则可由x 90=0.450.05,求出x ;题设条形图的纵坐标是“频率”这是有别于常规的,在审题时不能混淆.跟踪训练2 为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.答案 12解析 志愿者的总人数为20(0.24+0.16)×1=50,所以第三组人数为50×0.36×1=18, 所以有疗效的人数为18-6=12. 三、求频率分布直方图中的参数问题例3 为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力,得到频率分布直方图,如图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a ,视力在4.6到5.0之间的学生数为b ,则a ,b 的值分别为( )A .0.27,78B .0.27,83C .2.7,78D .2.7,83思维切入 根据频率分布直方图的性质列方程求解. 答案 A解析 注意到纵轴表示频率组距,由图象可知,前4组的公比为3,最大频率a =0.1×33×0.1=0.27, 设后6组公差为d ,则0.01+0.03+0.09+0.27×6+5×62·d =1,解得d =-0.05,即后6组频率的公差为-0.05, 所以,视力在4.6到5.0之间的学生数为 (0.27+0.22+0.17+0.12)×100=78, 故选A.点评 解答本题关键是要利用频率分布直方图中残缺不全的数据,分析它们之间存在的内在关系.跟踪训练3 某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图所示),其中上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100]. (1)求频率分布直方图中x 的值;(2)如果上学所需时间不少于1小时的学生可申请在学校住宿,请估计学校600名新生中有多少名学生可以申请住宿.解(1)由频率分布直方图可得20×x+0.025×20+0.006 5×20+0.003×2×20=1,所以x=0.012 5.(2)由频率分布直方图可知,新生上学所需时间不少于1小时的频率为0.003×2×20=0.12.因为600×0.12=72,所以估计600名新生中有72名学生可以申请住宿.四、频率分布直方图中的数字特征例4从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).(1)由图中数据求a的值;(2)若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为多少?(3)估计这所小学的小学生身高的众数、中位数(保留两位小数)及平均数.思维切入众数即为出现次数最多的数,所以它的频率最大,在最高的小矩形中.中位数即为从小到大中间的数(或中间两数的平均数).解(1)因为直方图中的各个矩形的面积之和为1,所以10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.(2)由直方图知,身高在[120,130),[130,140),[140,150]三组的学生总数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]的学生人数为10,所以从身高在[140,150]内选取的学生人数为1860×10=3.(3)根据频率分布直方图知,身高在[110,120)的小矩形最高,所以这所小学的小学生身高的众数为110+1202=115(cm).又0.005×10+0.035×10=0.4<0.5,0.4+0.030×10=0.7>0.5,所以中位数在[120,130)内,可设为x,则(x-120)×0.030+0.4=0.5,解得x≈123.33,所以中位数为123.33 cm.根据频率分布直方图,计算平均数为105×0.05+115×0.35+125×0.3+135×0.2+145×0.1=124.5(cm).点评用频率分布直方图求得的众数、中位数不一定是样本中的具体数.跟踪训练4某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数为()A.20 B.25 C.22.5 D.22.75答案 C解析产品的中位数出现在频率是0.5的地方.自左至右各小矩形的面积依次为0.1,0.2,0.4,0.15,0.15,设中位数是x,则由0.1+0.2+0.08×(x-20)=0.5,得x=22.5,故选C.1.统计某校1 000名学生的数学水平测试成绩,得到样本的频率分布直方图如图所示.若满分为100分,规定不低于60分为及格,则及格率是()A.20% B.25% C.60% D.80%答案 D2.在中秋的促销活动中,某商场对9月14日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知12时到14时的销售额为7万元,则10时到11时的销售额为()A.1万元B.2万元C.3万元D.4万元答案 C3.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.答案94.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出________人.答案25解析由频率分布直方图可得[2 500,3 000)(元)月收入段共有10 000×0.000 5×500=2500(人),按分层抽样应抽出2 500×10010 000=25(人).5.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.估计居民月均用水量的中位数.解由(0.08+0.16+a+0.42+0.50+a+0.12+0.08+0.04)×0.5=1,解得a=0.30.设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.6.某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如图所示的频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/方立米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.解(1)由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1),[1,1.5),[1.5,2),[2,2.5),[2.5,3)内的频率依次为0.1,0.15,0.2,0.25,0.15.所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3.(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:根据题意,该市居民该月的人均水费估计为4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).一、选择题1.从向阳小区抽取100户居民进行月用电量调查,为制定阶梯电价提供数据,发现其月用电量都在50到350度之间,制作频率分布直方图(如图所示)的工作人员粗心大意,位置t处未标明数据,则t等于()A.0.004 1 B.0.004 2C.0.004 3 D.0.004 4答案 D解析由题意得50×(0.006+t+0.003 6+0.002 4×2+0.001 2)=1,故t=0.004 4.故选D. 2.有一容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12]内的频数为()A.18 B.36 C.54 D.72答案 B解析易得样本数据落在区间[10,12]内的频率为0.18,则样本数据落在区间[10,12]内的频数为36.3.测量某地新生婴儿的体重,得到其频率分布直方图如图所示,则新生婴儿的体重(单位:g)在[2 700,3 000)的频率为()A.0.001 B.0.1 C.0.2 D.0.3答案 D解析由频率分布直方图可知,所求频率为0.001×300=0.3.4.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图可知,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56 B.60 C.120 D.140答案 D解析设所求人数为N,则N=2.5×(0.16+0.08+0.04)×200=140,故选D.5.如图是某班50名学生身高的频率分布直方图,那么身高(单位:cm)在区间[150,170)内的学生人数为()A.16 B.20 C.22 D.26答案 B解析根据频率分布直方图可知身高在区间[150,170)内的频率为(0.01+0.03)×10=0.4,所以身高在区间[150,170)内的学生人数为50×0.4=20,故选B.6.某学校对高二年级一次考试进行抽样分析,如图是根据抽样分析后的考试成绩绘制的频率分布直方图,其中抽样成绩的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中成绩小于100分的人数是36.则样本中成绩大于或等于98分且小于104分的人数是()A.90 B.75 C.60 D.45答案 A解析因为样本中成绩小于100分的人数是36,其对应频率之和为0.050×2+0.100×2=0.3,所以样本总数为36÷0.3=120,所以样本中成绩大于或等于98分且小于104分的人数为120×2×(0.100+0.150+0.125)=90,故选A.7.如图是某校高一一次数学考试成绩的样本频率分布直方图(样本容量n=200),若成绩不低于60分为及格,则样本中的及格人数是()A.6 B.36 C.60 D.120答案 D解析由题中频率分布直方图得,成绩不低于60分的人数为(0.012+0.018)×20×200=120.8.为了解学生在课外活动方面的支出情况,抽取了n 个同学进行调查,结果显示这些学生的支出金额(单位:元)都在[10,50]内,其中支出金额在[30,50]内的学生有117人,频率分布直方图如图所示,则n 等于( )A .180B .160C .150D .200 答案 A解析 [30,50]对应的概率为1-()0.01+0.025×10=0.65,所以n =1170.65=180. 二、填空题9.为了解某一段公路汽车通过时的车速情况,现随机抽测了通过这段公路的200辆汽车的时速,所得数据均在区间[40,80]中,其频率分布直方图如图所示,则在抽测的200辆汽车中,时速在区间[40,60)内的汽车有________辆.答案 80解析 由频率分布直方图得:时速在区间[40,60)内的汽车的频率为(0.01+0.03)×10=0.4.∴时速在区间[40,60)内的汽车有0.4×200=80(辆).10.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用的时间的条形图(如图所示)根据条形图可得这50名学生这一天平均每人的课外阅读时间为________.答案0.9解析这50名学生这一天平均每人的课外阅读时间为(0×5+0.5×20+1.0×10+1.5×10+2.0×5)÷50=0.9(小时).故选B.三、解答题11.为了了解小学生的体能情况,抽取某校一个年级的部分学生进行一分钟跳绳次数的测试,将数据整理后,画出频率分布直方图如图所示.已知图中从左到右前三个小组的频率分别为0.1,0.3,0.4,且第一小组的频数为5.(1)求第四小组的频率;(2)求参加这次测试的学生的人数;(3)若一分钟跳绳次数在75次以上(含75次)为达标,试估计该年级学生跳绳测试的达标率.解(1)第四小组的频率为1-0.1-0.3-0.4=0.2.(2)设参加这次测试的学生有x人,则0.1x=5,解得x=50,故参加这次测试的学生有50人.(3)由题意及频率分布直方图知,样本数据的达标率约为0.3+0.4+0.2=0.9,∴可估计该年级学生跳绳测试的达标率为90%.12.为组织好“市九运会”,组委会征集了800名志愿者,现对他们的年龄调查统计后,得到如图所示的频率分布直方图,但是年龄在[25,30)内的数据不慎丢失,依据此图可得:(1)年龄分组[25,30)对应小长方形的高度为________.(2)这800名志愿者中年龄在[25,35)内的人数为________.答案(1)0.04(2)440解析(1)因为各个小长方形的面积之和为1,所以年龄分组[25,30)对应小长方形的高度为1-(5×0.01+5×0.07+5×0.06+5×0.02)5=0.04.(2)年龄在[25,35)内的频率为0.04×5+0.07×5=0.55,人数为0.55×800=440.13.某校100名学生的期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)若这100名学生的语文成绩在某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.解 (1)由频率分布直方图知(2a +0.02+0.03+0.04)×10=1,解得a =0.005.(2)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20. 由题中给出的比例关系知数学成绩在上述分数段的人数依次为 5,40×12=20,30×43=40,20×54=25.故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【知识点:统计】一.简单随机抽样1.总体和样本总体:在统计学中 , 把研究对象的全体叫做总体.个体:把每个研究对象叫做个体.总体容量:把总体中个体的总数叫做总体容量.为了研究总体的有关性质,一般从总体中随机抽取一部分:,,,研究,我们称它为样本.其中个体的个数称为样本容量。
2.简单随机抽样,也叫纯随机抽样。
就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其它各种抽样形式的基础。
通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
3.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。
在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。
4.抽签法:(1)给调查对象群体中的每一个对象编号;(2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。
5.随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。
二.系统抽样1.系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。
第一个样本采用简单随机抽样的办法抽取。
d(抽样距离)=N(总体规模)/n(样本规模)三.分层抽样1.分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。
2.分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。
3.分层的比例问题:(1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。
四.样本频率分布图1.作图步骤:(1)求极差(一组数据中最大值和最小值得差)(2)决定组距和组数;(3)将数据分组;(4)计算各小组的频率,列频率分布表;(5)画频率分布直方图2.特点:(1)以面积的形式反映数据落在各小组的频率大小;.13)2(总和等于)各小长方形的面积的(频率组距频率组距小长方形的面积=⨯=五.茎叶图适用范围:在样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录。
当样本数据较多时,茎叶图就不太方便了。
六.用样本的数字特征估计总体的数字特征1、本均值:2、.样本标准差:3.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。
在随机抽样中,这种偏差是不可避免的。
虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。
4.(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变(2)如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍五.两个变量的线性相关1、概念: (1)回归直线方程(2)回归系数2.最小二乘法3.直线回归方程的应用(1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系(2)利用回归方程进行预测;把预报因子(即自变量x)代入回归方程对预报量(即因变量Y)进行估计,即可得到个体Y值的容许区间。
(3)利用回归方程进行统计控制规定Y值的变化,通过控制x的范围来实现统计控制的目标。
(4)回归直线一定经过样本的中心点(,),据此性质可以解决有关的计算问题.【例题讲解】1. 某同学使用计算器求个数据的平均数时,错将其中一个数据输入为,那么由此求出的平均数与实际平均数的差是() ABCD2. 设有一个直线回归方程为,则变量增加一个单位时()A 平均增加个单位B 平均增加个单位C 平均减少个单位D 平均减少个单位3. 从个编号中抽取个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为()ABCD4.从某厂生产的802辆轿车中抽取80辆测试某项性能.请合理选择抽样方法进行抽样,并写出抽样过程.5. 为了了解参加运动会的名运动员的年龄情况,从中抽取名运动员;就这个问题,下列说法中正确的有;①名运动员是总体;②每个运动员是个体;③所抽取的名运动员是一个样本;④样本容量为;⑤这个抽样方法可采用按年龄进行分层抽样;⑥每个运动员被抽到的概率相等6. 数据的标准差是______________7. 数据的方差为,平均数为,则(1)数据的标准差为,平均数为(2)数据的标准差为,平均数为8. 用样本频率分布估计总体频率分布的过程中,下列说法正确的是()A 总体容量越大,估计越精确B 总体容量越小,估计越精确C 样本容量越大,估计越精确D 样本容量越小,估计越精确9 从两个班中各随机的抽取名学生,他们的数学成绩如下:甲班76 74 82 96 66 76 78 72 52 68 乙班86 84 62 76 78 92 82 74 88 85画出茎叶图并分析两个班学生的数学学习情况【课堂练习】1. 相关关系与函数关系的区别是2. 从个篮球中任取一个,检验其质量,则应采用的抽样方法为_______________3. 下列说法错误的是 ( )A 在统计里,把所需考察对象的全体叫作总体B 一组数据的平均数一定大于这组数据中的每个数据C 平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D 一组数据的方差越大,说明这组数据的波动越大4. 要了解全市高一学生身高在某一范围的学生所占比例的大小,需知道相应样本的( )A 平均数B 方差C 众数D 频率分布5. 要从已编号()的枚最新研制的某型导弹中随机抽取枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的枚导弹的编号可能是()ABCD6. 数据的方差为,则数据的方差为()ABCD7. 已知样本的平均数是,标准差是,则8. 有件产品编号从到,现在从中抽取件检验,用系统抽样确定所抽取的编号为()ABCD9.(2013·xx模拟)用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是________.10.(2012·xx)样本(x1,x2,…,xn)的平均数为,样本(y1,y2,…,ym)的平均数为(≠).若样本(x1,x2,…,xn,y1,y2,…,ym)的平均数=α+(1-α),其中0<α<,则n,m的大小关系为( ).A.n<mB.n>mC.n=mD.不能确定11.已知xx化肥量x与水稻产量y的试验数据如下表,则变量x与变量y是________相关(填“正”或“负”).施化肥量x 15202530354045水稻产量y 33034536540544545045512.(2013·xx 调研)已知x ,y 取值如下表:x 0 1 4 5 6 8 y1.31.85.66.17.49.3从所得的散点图分析可知:y 与x 线性相关,且=0.95x +a ,则a =( ).A .1.30B .1.45C .1.65D .1.8013.某班同学利用国庆节进行社会实践,对[25,55]岁的人群随机抽取n 人进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念,称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图:(1)补全频率分布直方图;(2)求n ,a ,p 的值.组数 分组 低碳族的人数占本组的频率第一组 [25,30) 120 0.6 第二组 [30,35) 195 p 第三组 [35,40) 100 0.5 第四组 [40,45) a 0.4 第五组 [45,50) 30 0.3 第六组[50,55]150.314 以下是某地搜集到的新房屋的销售价格和房屋的面积的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为时的销售价格15.(2012·xx调研)某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在[50,60]的频率及全班人数;(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高.16.已知某单位有50名职工,现要从中抽取10名职工,将全体职工随机按1~50编号,并按编号顺序平均分成10组,按各组内抽取的编号依次增加5进行系统抽样.(1)若第5组抽出的号码为22,写出所有被抽出职工的号码;(2)分别统计这10名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,求该样本的方差;(3)在(2)的条件下,从这10名职工中随机抽取两名体重不轻于73公斤(≥73公斤)的职工,求体重为76公斤的职工被抽取到的概率.【课后作业】1. 一个容量为的样本,已知某组的频率为,则该组的频数为__________2. 用随机数表法从名学生(男生人)中抽取人进行评教,某男生被抽取的机率是___________________3.(2013·xx质检)xx某高中有高一学生600人,xx学生500人,xx学生550人,现对学生关于消防安全知识了解情况进行分层抽样调查,若抽取了一个容量为n的样本,其中xx学生有11人,则n的值等于________4. 一个容量为的样本数据,分组后组距与频数如下表:组[)20,10[)30,20[)40,30[)50,40[)60,50[)70,60距2 3 4 5 4 2频数则样本在区间上的频率为__________________5. 某单位有老年人人,中年人人,青年人人,为调查身体健康状况,需要从中抽取一个容量为的样本,用分层抽样方法应分别从老年人、中年人、青年人中各抽取_________人、人、人6. 某学校共有教师人,其中不到岁的有人,岁及以上的有人为了了解普通话在该校中的推广xx情况,用分层抽样的方法,从全体教师中抽取一个容量为人的样本进行普通话水平测试,其中在不到岁的教师中应抽取的人数为多少人?7. 如图,从参加环保知识竞赛的学生中抽出名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:(1)这一组的频数、频率分别是多少?(2)估计这次环保知识竞赛的及格率(分及以上为及格)统计答案【例题答案】例1. B 少输入平均数少,求出的平均数减去实际的平均数等于例2.例3. C 剔除零头4.[审题视点] 因为802不能整除80,为了保证“等距”分段,应先剔除2个个体.解由于总体及样本中的个体数较多,且无明显差异,因此采用系统抽样的方法,步骤如下:第一步:先从802辆轿车中剔除2辆轿车(剔除方法可用随机数法);第二步:将余下的800辆轿车编号为1,2,…,800,并均匀分成80xx,每xx含k==10个个体;第三步:从第1段即1,2,…,10这10个编号中,用简单随机抽样的方法抽取一个编号(如5)作为起始编号;第四步:从5开始,再将编号为15,25,…,795的个体抽出,得到一个容量为80的样本.解决系统抽样问题的两个关键步骤为:(1)分段的方法应依据抽取的样本容量而定,即根据定义每段抽取一个样本.(2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定5.④,⑤,⑥ 名运动员的年龄情况是总体;每个运动员的年龄是个体;6.222215[(7071.5)(7171.5)(7271.5)(7371.5)]42s =-+-+-+-= 7 (1),(2),(1)22212222121[()()...()]1[()()...()]n n s ka b k b ka b k b ka b k b nk a a a k n μμμμμμσ=+--++--+++--=-+-++-=(2)22212222121[()()...()]1[()()...()]n n s ka kb k kb ka kb k kb ka kb k kb nka a a k n μμμμμμσ=+--++--+++--=-+-++-=8. C9. 解:甲班乙班2 56628 6 6 4 2 7 4 6 828 2 4 5 6 86 9 2乙班级总体成绩优于甲班【课堂练习】1.函数关系是两个变量之间有完全确定的关系,而相关关系是两个变量之间并没有严格的确定关系,当一个变量变化时,另一变量的取值有一定的随机性2. 简单随机抽样3. B 平均数不大于最大值,不小于最小值4 D5 B ,间隔应为6. D7. ,,222x y x y x y xy x y xy+-+=-+--+=-=-20()192,()220()192,968.D 间隔为9. 6 解析设第1组抽取的号码为b,则第n组抽取的号码为8(n-1)+b,∴8×(16-1)+b=126,∴b=6,故第1组抽取的号码为6.10.解析依题意得x1+x2+…+xn=n,y1+y2+…+ym=m,x1+x2+…+xn+y1+y2+…+ym=(m+n)=(m+n)α+(m +n)(1-α),∴n+m=(m+n)α+(m+n)(1-α),∴于是有n-m=(m+n)[α-(1-α)]=(m+n)(2α-1),∵0<α<,∴2α-1<0,∴n-m<0,即m>n.答案 A11 .正12.解析依题意得,=×(0+1+4+5+6+8)=4,=×(1.3+1.8+5.6+6.1+7.4+9.3)=5.25.又直线=0.95x+a必过样本中心点(,),即点(4,5.25),于是有5.25=0.95×4+a,由此解得a =1.45,选B.13.[审题视点] (1)要补全频率分布直方图,关键是计算出第二组的频率;(2)灵活运用关系式:×组距=频率,=频率求解.解(1)第二组的频率为1-(0.04+0.04+0.03+0.02+0.01)×5=0.3,所以小长方形的高为=0.06.频率分布直方图如图所示.(2)第一组的人数为=200,频率为0.04×5=0.2,所以n==1 000.由(1)知,第二组的频率为0.3,所以第二组的人数为1000×0.3=300,所以p ==0.65.第四组的频率为0.03×5=0.15,所以第四组的人数为1 000×0.15=150,所以a =150×0.4=60.(1)绘制频率分布直方图时需注意:①制作好频率分布表后可以利用各组的频率之和是否为1来检验该表是否正确;②频率分布直方图的纵坐标是,而不是频率.(2)由频率分布直方图进行相关计算时,需掌握下列关系式:×组距=频率.14. 解:(1)数据对应的散点图如图所示:(2),,308))((,2.2351=--==∑=y y x x l y i i i xy设所求回归直线方程为,则,故所求回归直线方程为(3)据(2),当时,销售价格的估计值为:(万元)15.解 (1)分数在[50,60]的频率为0.008×10=0.08.由茎xx知,分数在[50,60]之间的频数为2,所以全班人数为=25.(2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为÷10=0.016.16.解(1)由题意,第5组抽出的号码为22.因为k+5×(5-1)=22,所以第1组抽出的号码应该为2,抽出的10名职工的号码分别为2,7,12,17,22,27,32,37,42,47.(2)因为10名职工的平均体重为=(81+70+73+76+78+79+62+65+67+59)=71,所以样本方差为:s2=(102+12+22+52+72+82+92+62+42+122)=52.(3)从10名职工中随机抽取两名体重不轻于73公斤的职工,共有10种不同的取法:(73,76),(73,78),(73,79),(73,81),(76,78),(76,79),(76,81),(78,79),(78,81),(79,81).记“体重为76公斤的职工被抽取”为事件A,它包括的事件有(73,76),(76,78),(76,79),(76,81)共4个.故所求概率为P(A)==.【课后作业】1.2每个个体被抽取的机率都是3.解析由=,得n=33(人).高中数学必修3复习_统计的讲义与习题4.5总人数为6. 解:而抽取的比例为,在不到岁的教师中应抽取的人数为7.解:(1)频率为:,频数:(2)。