频率分布折线图与总体密度曲线思考

合集下载

高二数学教案:频率分布直方图与折线图

高二数学教案:频率分布直方图与折线图

高二数学教案:频率分布直方图与折线图总课题总体分布的估量总课时第14课时分课题频率分布直方图与折线图分课时第2 课时教学目标能列出频率分布表,能画出频数条形图、频率分布直方图及折线图;会用样本频率分布去估量总体分布.重点难点绘制频率直方图、条形图、折线图.引入新课1.列频率分布表的一样步骤是什么?能否依照频率分布表来绘制频率直方图?2.作频率分布直方图的方法为:3.假如将频率分布直方图中各相邻矩形的上底边中点并顺次连结起来,就得到_________,简称___________.4.频率折线图的优点是:__________________________.假如样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图将趋于一条光滑的曲线,我们称这条光滑的曲线为总体分布的___________.例题剖析例1 下表是某学校一个星期中收交来的失物件数,请将5天中收交来的失物数用条形图表示.星期一二三四五件数6 2 3 5 1累计6 8 11 16 17例2 作出例中数据的频率分布直方图.例3 为了了解一大片经济林生长情形,随机测量其中的株的底部周长,得到如下数据表(单位:cm)135 98 102 110 99 121 110 96 100 103125 97 117 113 110 92 102 109 104 112109 124 87 131 97 102 123 104 104 128105 123 111 103 105 92 114 108 104 102129 126 97 100 115 111 106 117 104 109111 89 110 121 80 120 121 104 108 118129 99 90 99 121 123 107 111 91 10099 101 116 97 102 108 101 95 107 101102 108 117 99 118 106 119 97 126 108123 119 98 121 101 113 102 103 104 108(1)编制频率分布表;(2)绘制频率分布直方图;(3)估量该片经济林中底部周长小于100cm的树木约占多少,周长不小于120cm的树木约占多少.巩固练习1.在频率分布直方图中,所有矩形的面积和为_________.2. 辆汽车通过某一段公路时的时速如下图所示,则时速在的汽车大约有______辆.课堂小结什么是频数条形图、频率直方图、折线图、密度曲线.课后训练班级:高二( )班姓名:____________一基础题1.在人中,有个学生,个干部,个工人,个农民,则是工人( )A.频数B.频率C.累计频率D.累计频数2.关于样本频率分布折线图与总体密度曲线的关系,下列说法中正确的是( )A.频率分布折线图与总体密度曲线无关;B.频率分布折线图确实是总体密度曲线;C.样本容量专门大的频率分布折线图确实是总体密度曲线;D.假如样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲折线.3.在频率分布直方图中,各个小长方形的面积表示( )A.落在相应各组的数据的频数B.相应各组的频率.C.该样本所分成的组数D.该样本的样本容量4.容量为的某个样本数据拆分为组,并填写频率分布表,若前七组频率之和为,而剩下的三组的频率依次差为,则剩下的三组中频率最大的一组的频率为_________.5.在一个小时内统计一传呼台接收到用户的呼吁次数,按每分钟统计如下:写出一分钟内传呼呼吁次数的频率分布表,并画出频率分布图.二提高题6.在一个容量为的样本,数据的分组及各组的频数如下:(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)依照频率分布直方图估量,数据落在的可能性约是多少?7.姚明在赛季常规赛场竞赛的前场中,带领休斯顿火箭队取得了较好的战绩,提早锁定了季后赛资格.以下是姚明在这场竞赛中的得分表现:(1)假如将那个数据分为组,作出这组数据的频率分布表;(2)画出频率分布直方图并作出频率折线图;要练说,得练听。

用样本估计总体

用样本估计总体

用样本估计总体一、用样本的频率分布估计总体分布(1)频数、频率将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。

每组数除以全体数据的个数的商叫做该组的频率。

频率反映数据在每组中所占比例的大小。

(2)样本的频率分布根据随机所抽样本的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值状况),就叫做样本的频率分布。

为了能直观地显示样本的频率分布情况,通常我们会将样本的容量、样本中出现该事件的频数以及计算所得的频率列在一张表中,叫做样本频率分布表。

(3)用样本频率分布估计总体的分布从一个总体得到一个包含大量数据的样本时,我们很难从一个个数字中直接看出样本所含的信息。

如果把这些数据形成频数分布或频率分布,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况。

用样本估计总体,是研究统计问题的一个基本思想方法,而对于总体分布,我们总是用样本的频率分布对它进行估计。

(4)频率分布直方图的特点从频率分布直方图可以清楚地看出数据分布的总体态势,但是从直方图本身得不出原始的数据内容,所以,把数据表示成直方图后,原有的具体数据信息就被抹掉了。

(5)频率分布折线图把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,如图所示。

为了方便看图,一般习惯于把频率分布折线图画成与横轴相连,所以横轴上的左右两端点没有实际意义。

(6)总体密度曲线①如果样本容量越大,所分组数越多,频率分布直方图中表示的频率分布就越接近于总体在各个小组内所取值的个数与总数比值的大小。

设想如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上是越来越接近于总体的分布,它可以用一条光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线。

y f x()②总体密度曲线精确地反映了一个总体在各个区域内取值的百分比。

a b内的百分比就是图中带斜线部分的面积。

对本例来说,总体密度曲线呈产品尺寸落在(,)中间高两边低的“钟”形分布,总体的数据大致呈对称分布,并且大部分数据都集中在靠近中间的区间内。

第九章第二节用样本估计总体

第九章第二节用样本估计总体
(A4,B1),(A4,B2),(A4,B3),(A4,B4),
返回
用C表示“选出的两名同学的植树总棵数为19”这一事件,则C中的结 果有4个,它们是:(A1,B4),(A2,B4),(A3,B2),(A4,B2).故所求 4 1 概率为P(C)=16=4.
返回
[巧练模拟]———————(课堂突破保分题,分分必保!)
解析:由茎叶图知平均值为
2
114+126+128+132 =125, 4
1 ∴s =4[(125-114)2+(125-126)2+(125-128)2+(125-132)2]=45.
答案: C
返回
4.一个容量为20的样本数据,分组后,组别与频数如下:
则样本在(20,50]上的频率为_____方图中,中位数左边和右边的直方图的 面积相等,由此可以估计中位数的值,而平均数的估 计值等于频率分布直方图中每个小矩形的面积乘以小
矩形底边中点的横坐标之和,众数是最高的矩形的中
点的横坐标.
返回
2.对标准差与方差的理解: 标准差、方差描述了一组数据围绕平均数波动的大 小.标准差、方差越大,数据的离散程度越大,标准 差、方差越小,数据的离散程度越小,因为方差与原 始数据的单位不同,且平方后可能夸大了偏差的程度, 所以虽然方差与标准差在刻画样本数据的分散程度上
返回
(1)求第6位同学的成绩x6,及这6位同学成绩的标准差s;
(2)从前5位同学中,随机地选2位同学,求恰有1位同学
成绩在区间(68,75)中的概率.
返回
[自主解答]
∵这6位同学的平均成绩为75分,
1 ∴6(70+76+72+70+72+x6)=75,解得x6=90. 这6位同学成绩的方差 1 s =6×[(70-75)2+(76-75)2+(72-75)2+(70-75)2+

高一必修3 2.2.2用样本的频示范课率分布估计总体的分布

高一必修3  2.2.2用样本的频示范课率分布估计总体的分布

不足:
当样本数据较多或数据位数较多时,茎叶图就 显得不太方便。
P71练习3、下面一组数据是某生产车间30名工人 某日加工零件的个数,请设计适当的茎叶图表示 这组数据,并由这图出发说明一下这个车间此日 的生产情况。 134 112 117 126 128 124 122 116 113 107 116 132 127 128 126 121 120 118 108 110 133 130 124 116 117 123 122 120 112 112
甲:13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 39 乙:49, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25, 36, 39 用茎叶图表示两人成绩,并比较甲、乙成绩并得出统计 结论 甲 乙 8 4, 6, 3 3, 6, 8 3, 8, 9 1 0 1 2 3 4 5 2, 5, 1, 4, 0 5 4 6, 1, 6, 7, 9 9



统计结论:
1、乙运动员的得分基本是对称的,叶的分布 是“单峰”的,有10/13集中在茎2,3,4上, 中位数是36;甲运动员的得分除一个特殊得 分(51分)外,中位数是2பைடு நூலகம்.
2、乙运动员的平均得分大于甲运动员的平均 得分(乙运动员得分普遍大于甲运动员的得 分)。
3、乙运动员的得分比甲运动员的得分更集 中。乙运动员更稳定。
频率分布直方图如下:
频率
组距
0.50 0.40 0.30 0.20 0.10 月均用水量 /t 4.5
0.5
1 1.5 2 2.5 3
3.5 4
作用:
能反映数据的变化趋势
二、总体密度曲线 利用样本频率分布对总体分布进行相应估计

样本估计整体

样本估计整体

探究: 我国是世界上严重缺水的 国家之一,城市 缺水问题较为突出。某市政府为了节约用 水,计划在 本市试行居民生活用水定额管 理,即确定一个居民月用水量标准a,用水 量不超过a的按平价收费,超过 a的按议价 收费。如果希望大部分居民的 日常生活不 受影响,那么标准a定为多少比较合理? 你认为,为了较为合理地确定出这个标准, 需要做什么工作?
2、中位数不受少数几个极端数据(即排序靠前或排序靠后的数据) 的影响,容易计算,它仅利用了数据中排在中间数据的信息。 当样本数据质量比较差,即存在一些错误数据(如数据的录入 错误、测量错误等)时,应该用抗极端数据强的中位数表示 数据的中心值。
3、平均数受样本中每一个数据的影响,“越离群”的数据,对平均 数的影响越大。与众数和中位数相比,平均数代表了数据更多 的信息。
表2-1
3.1 3.4 2.5 2.6
100位居民的月均用水量 (单位 :t )
2.0 2.2 2.0 1.5 1.0 1.6 1.8 1.9 1.6 2.2 1.5 1.2 0.2 0.4 0.3 0.4
3.2
3.3 3.2
2.7
2.8 2.9
2.3
2.3 2.4
2.1 1.6 1.2 3.7 1.5 0.5 3.8
图2.2-2 100位居民的月均用水量的频率分 布折线图
频率
组距
0
a
b
月均用水量/t
※总体密度曲线能够很好的反映总体在各个范围 内的百分比,能够提供更准确的信息。尽管有些 总体密度曲线是客观存在的,但是很难象函数图 象那样准确的地画出来。 ?思考一下图中阴影部分的面积表示什么?


8
4 6 3 3 6 8 3 8 9
思考1:2.03是通过频率直方图估计出来的中位数,

样本估计总体 系统抽样 统计与统计案例

样本估计总体 系统抽样 统计与统计案例

高考总复习:统计与统计案例【考纲要求】1.随机抽样(1)理解随机抽样的必要性和重要性;(2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法. 2.用样本估计总体(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题. 3.变量的相关性(1)会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系;(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆). 【知识网络】【考点梳理】考点一、随机抽样从调查的对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项统计图表用样本估计总体统计简单随机抽样数据的整 理分析数据的数字特征 分层抽样系统抽样变量的相关性指标做出推断,这就是抽样调查.调查对象的全体称为总体,被抽取的一部分称为样本.1.简单的随机抽样 简单随机抽样的概念:设一个总体的个体数为N .如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.① 用简单随机抽样从含有N 个个体的总体中抽取一个容量为n 的样本时,每次抽取一个个体时,任一个体被抽到的概率为1N;在整个抽样过程中各个个体被抽到的概率为n N;②简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等; ③简单随机抽样方法体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础. 简单抽样常用方法:①抽签法:先将总体中的所有个体(共有N 个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n 次,就得到一个容量为n 的样本.适用范围:总体的个体数不多.优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.②随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.2.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先制定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.系统抽样的步骤:①采用随机的方式将总体中的个体编号,为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号等等.②为将整个的编号分段 (即分成几个部分),要确定分段的间隔k .当Nn是整数时(N 为总体中的个体的个数,n 为样本容量),N k n =;当Nn 不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数'N 能被n 整除,这时'N k n=.③在第一段用简单随机抽样确定起始的个体编号l .④按照事先确定的规则抽取样本(通常是将l 加上间隔k ,得到第2个编号l k +,第3个编号2l k +,这样继续下去,直到获取整个样本).要点诠释:①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除再进行系统抽样.3.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层.4.常用的三种抽样方法的比较:要点诠释:(1)各种抽样的个体被抽到的概率相等;(2)抽样过程中个体被抽到的概率相等.5.不放回抽样和放回抽样:在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样随机抽样、系统抽样、分层抽样都是不放回抽样考点二、用样本估计总体1. 统计图表包括条形图、折线图、饼图、茎叶图.2.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差)(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布表3.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图(2)总体密度曲线:随着样本容量的增加,作图所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离,s = (2)方差: 2222121[()()...()]n s x x x x x x n=-+-++- (n x 是样本数据,n 是样本容量,x 是样本平均数)要点诠释:现实中的总体所包含个体数往往是很多的,如何求得总体的平均数和标准差呢?(通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差,这与有样本的频率分布近似代替总体分布是类似的,只要样本的代表性好,这样做就是合理的,也是可以接受的.)5.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和(3)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标 6. 频率分布直方图反映样本的频率分布 (1)频率分布直方图中横坐标表示组距,纵坐标表示组距频率,频率=组距×组距频率(2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. (4)众数为最高矩形中点的横坐标.(5)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标. 考点三、变量的相关性 1. 散点图将两个变量所对应的点描在直角坐标系中,这些点组成了变量之间的一个图,称为变量之间的散点图.散点图形象地反映了各对数据的密切程度.粗略地看,散点分布具有一定的规律.如果变量之间存在某种关系,这些点会有一个集中趋势,这种趋势通常可以用一条光滑的曲线来近似表示,这样近似的过程称为曲线拟合.2.两个变量的线性相关(1)相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系.(2)正相关在散点图中,点散布在从左下角到右上角的区域.对于两个变量的这种相关关系,我们将它称为正相关.(3)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (4)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.3.回归方程 (1)最小二乘法求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程方程$y bx a =+是两个具有线性相关关系的变量的一组数据1122(,),(,),(,),n n x y x y x y L 的回归方程,期中,a b 是待定参数.$1122211()()()n ni i i ii i n ni ii i x x y y x ynxy b x x xnx a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑$要点诠释:相关关系与函数关系的异同点: 相同点:两者均是指两个变量的关系.不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系; ②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. 考点四、统计案例 1.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法;(2)随机误差:线性回归模型用y bx a e =++表示,其中a,b 为模型的未知数,e 称为随机误差. (3)样本点的中心在具有线性相关关系的数据1122(,),(,),(,),n n x y x y x y L 中回归方程的截距和斜率的最小二乘估计公式分别为:$$121()(),=-()nii i nii xx y y ba y bxxx ==--=-∑∑$$ 其中111,=,(,,)nni i i i x x y x x y n ===∑∑称为样本点的中心.(4)相关系数①()()nii xx y y r --=∑②当>0r 时,表明两个变量正相关; 当<0r 时,表明两个变量负相关.r 的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常r 大于0.75时,认为两个变量有很强的线性相关性.2.残差分析 (1)总偏差平方和把每个效应(观测值减去总的平均值)的平方加起来即:21()nii yy =-∑(2)残差数据点和它回归直线上相应位置的差异µ2()i i y y -是随机误差的效应,称µµ=i ii e y y -为残差. (3)残差平方和µ21()nii i yy =-∑.(4)相关指数µ22121()()nii i n ii yy R yy ==-=-∑∑2R 的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中, 2R 表示解释变量对预报变量变化的贡献率, 2R 越接近于1,表示回归的效果越好.3.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y,它们的可能取值分别为1122{,}{,}x y x y 和,其样本频数列联表(称为2×2列联表)为2×2列联表1y 2y总计1x a b a b + 2xcd c d + 总计a c +b d +a b c d +++构造一个随机变量22()()()()()n ad bc K a b c d a c b d -=++++,其中a b c d +++为样本容量.(3)独立性检验利用随机变量2K 来确定是否能以一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.注: 在独立性检验中经常由2K 得到观测值k ,则k =2K 是否成立?(2K 与k 的关系并不是k =2K ,k 是2K 的观测值,或者说2K 是一个随机变量,它在a ,b ,c ,d )取不同值时,2K 可能不同,而k 是取定一组数a ,b ,c ,d 后的一个确定的值. 【典型例题】类型一、简单随机抽样【例1】某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?【思路点拨】简单随机抽样一般采用两种方法:抽签法和随机数表法.【解析】解法1:(抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个10个号签对应的轴的直径.解法2:(随机数表法)将100件轴编号为00,01,…99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的样本.【总结升华】从以上两种方法可以看出,当总体个数较少时用两种方法都可以,当样本总数较多时,方法2优于方法1.举一反三:【变式】某大学为了支持奥运会,从报名的24名大三的学生中选6人组成志愿小组,请用抽签法和随机数表法设计抽样方案.【思路点拨】(1)总体的个体数较少,利用抽签法或随机数表法可容易获取样本;(2)抽签法的操作要点:编号、制签、搅匀、抽取;(3)随机数表法的操作要点:编号、选起始数、读数、获取样本.【解析】抽签法第一步:将24名志愿者编号,编号为1,2,3, (24)第二步:将24个号码分别写在24张外形完全相同的纸条上,并揉成团,制成号签;第三步:将24个号签放入一个不透明的盒子中,充分搅匀;[来源:]第四步:从盒子中逐个抽取6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员.随机数表法第一步:将24名学生编号,编号为01,02,03,……24;第二步:在随机数表中任选一数开始,按某一确定方向读数;第三步:凡不在01~24中的数或已读过的数,都跳过去不作记录,依次记录下得数;第四步:找出号码与记录的数相同的学生组成志愿小组.类型二、系统抽样【例2】某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.【思路点拨】按1:5分段,每段5人,共分59段,每段抽取一人,关键是确定第1段的编号.【解析】按照1:5的比例,应该抽取的样本容量为295÷5=59,我们把259名同学分成59组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,59组是编号为291~295的5名学生.采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1≤k≤5),那么抽取的学生编号为k+5L(L=0,1,2,……,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,……,288,293.【总结升华】系统抽样可按事先规定的规则抽取样本. 本题采用的规则是第一组随机抽取的学生编号为k,那么第m组抽取的学生编号为k+5(m-1).举一反三:【变式】一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为l ,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第最小组中抽取的号码个位数字与m+k 的个位数字相同.若m=6,则在第7组中抽取的号码是 .【答案】∵6m =,7k =,∴13m k += ∴在第7小组中抽取的号码是63. 类型三、分层抽样【例3】某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是( )A .分层抽样法,系统抽样法B .分层抽样法,简单随机抽样法C .系统抽样法,分层抽样法D .简单随机抽样法,分层抽样法【思路点拨】此题为抽样方法的选取问题.当总体中个体较多而且差异又不大时宜采用系统抽样,采用系统抽样在每小组内抽取时应按规则进行;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.【解析】依据题意,第①项调查应采用分层抽样l 法、第②项调查应采用简单随机抽样法.故选B . 【总结升华】采用什么样的抽样方法要依据研究的总体中的个体情况来定. 举一反三:【变式】甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个样本容量为90人的样本,应在这三校分别抽取学生( )A.30人,30人,30人B.30人,45人,15人C.20人,30人,10人D.30人,50人,10人【答案】B ;根据样本容量和总体容量确定抽样比,最终得到每层中学生人数.【例4】一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.【思路点拨】采用分层抽样的方法.【解析】因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:(1)将3万人分为5层,其中一个乡镇为一层.(2)按照样本容量的比例随机抽取各乡镇应抽取的样本.300×3/15=60(人),300×2/15=40(人),300×5/15=100(人),300×2/15=40(人),300×3/15=60(人),因此各乡镇抽取人数分别为60人、40人、100人、40人、60 人.(3)将300人组到一起,即得到一个样本.【总结升华】分层抽样在日常生活中应用广泛,其抽取样本的步骤尤为重要,应牢记按照相应的比例去抽取.举一反三:【变式】某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的41,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定(Ⅰ)游泳组中,青年人、中年人、老年人分别所占的比例; (Ⅱ)游泳组中,青年人、中年人、老年人分别应抽取的人数. 【答案】(Ⅰ)设登山组人数为x ,游泳组中,青年人、中年人、老年人各占比例分别为a 、b 、c ,则有40%347.5%410%310%4x xbxx xc x ⋅+⎧=⎪⎪⎨⋅+⎪=⎪⎩,解得50%10%b c =⎧⎨=⎩故a=100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%. (Ⅱ)游泳组中,抽取的青年人数为320040%604⨯⨯=(人);抽取的中年人数为32004⨯⨯50%=75(人); 抽取的老年人数为32004⨯⨯10%=15(人).类型四、用样本估计总体【例4】甲、乙两小组各10名学生的英语口语测试成绩如下:(单位:分) 甲组 76 90 84 86 81 87 86 82 85 83 乙组 82 84 85 89 79 80 91 89 79 74 用茎叶图表示两小组的成绩,并判断哪个小组的成绩更整齐一些?【思路点拨】学会用茎叶图表示数据的方法;并会进行统计推断.【解析】用茎叶图表示两小组的成绩如图:甲茎乙6 7 4 9 97 6 6 5 4 3 2 1 8 0 2 4 5 9 90 9 1由图可知甲组成绩较集中,即甲组成绩更整齐一些.【总结升华】对各数据是二、三位数,且数据量不是很大时,用用茎叶图表示较为方便,也便于进行统计推断,否则,应改用其他方法.举一反三:【变式1】甲、乙两个学习小组各有10名同学,他们在一次数学测验中成绩的茎叶图如图所示,则他们在这次测验中成绩较好的是组.【答案】甲小组【变式2】甲、乙两名运动员的5次测试成绩如下图所示,设12,s s分别表示甲、乙两名运动员测试成绩的标准差,12,x x分别表示甲、乙两名运动员测试成绩的平均数,则有()A.12x x=,12s s<B.12x x=,12s s>C.12x x>,12s s> D.12x x=,12s s=【答案】B【例5】以下茎叶图记录了甲、乙两组各四名同学在某次数学测验中的成绩,甲组记录中有一个数据模糊,无法确认,在图中以X表示.甲组乙组6 X8 74 1 9 0 0 3甲茎乙5 7 16 88 8 2 2 3 6 7(Ⅰ)如果甲组同学与乙组同学的平均成绩一样,求X 及甲组同学数学成绩的方差;(Ⅱ)如果X=7,分别从甲、乙两组同学中各随机选取一名,求这两名同学的数学成绩之和大于180的概率.(注:方差2222121=[()()...()],n s x x x x x x n-+-++-其中12,,...,.n x x x x 为的平均数)【思路点拨】(Ⅰ)利用平均数的基本概念加以求解。

高考数学第一轮知识点总复习 第二节 用样本估计总体


平.因为公司中少数人的月工资额与大多数人的月工资额差别较大,
这样导致了平均数与中位数的偏差较大,所以平均数不能客观真实
地反映这个公司员工的工资水平.
题型四 综合问题
【例4】(12分)某种瓶装溶液,因为装瓶机的不稳定性,所以很可能每 瓶装的容量都不是标准的容量.我们随机抽出了20瓶,测得它们的容量 (单位:百毫升)如下: 12.1 11.9 12.2 12.2 12.0 12.1 12.9 12.1 12.3 12.5 11.7 12.4 12.3 11.8 11.3 12.1 11.4 11.6 11.2 12.2
1
(2)频率分布直方图如图:
(3)电子元件寿命在100 h~400 h以内的频数为130,则频率 为 13=00.65. 200
(4)寿命在400 h以上的电子元件的频数为70,则频率 为 =700.35. 200
学后反思利用样本的频率分布可近似地估计总体的分布.从本例可 以看出,要比较准确地反映出总体70 分布的情况,必须准确地作出
[140,15 0)
人数
4
8
x
5
3
生产能 力分组 人数
表2:
[110, 120)
6
[120,130) [130,14 0)
y
36
[140,15 0)
18
(1)先确定x、y,再完成下列频率分布直方图,就生产能力而言, A类工人中个体间的差异程度与B类工人中个体间的差异程度哪 个更小?(不用计算,可通过观察直方图直接回答结论)
比;所有组距的频率之和为1;每一组距的频率是频率分布直方图中该
组距所对应的矩形的面积.

(1)M=0.102
=50,m=50-(1+4+20+15+8)=2n,N =m1,

用样本的频率分布估计总体分布


2.2
用样本估计总体
2.2.1用样本的频率分布估计总体分布
第二课时
问题提出
1.列出一组样本数据的频率分布表 可以分哪几个步骤进行? 第一步,求极差.
第二步,决定组距与组数.
第三步,确定分点,将数据分组.
第四步,统计频数,计算频率,制成 表格.
2.频率分布直方图是在平面直角坐标 系中画若干个依次相邻的小长方形,这 些小长方形的宽、高和面积在数量上分 别表示什么? 组距、频率除以组距、频率.
0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
频率 组距
总体密度曲线
总体在区间 (a,b)内取 值的百分比.
O
a b 月均用水量/t
思考4:在上述背景下,相应的频率分布折线 图越来越接近于一条光滑曲线,统计中称这 条光滑曲线为总体密度曲线.那么图中阴影部 分的面积有何实际意义?
思考5:当总体中的个体数比较少或样 本数据不密集时,是否存在总体密度曲 线?为什么?
不存在,因为组距不能任意缩小. 思考6:对于一个总体,如果存在总体密 度曲线,这条曲线是否惟一?能否通过 样本数据准确地画出总体密度曲线?
探究(二):茎叶图
频率分布表、频率分布直方图和折 线图的主要作用是表示样本数据的分布 情况,此外,我们还可以用茎叶图来表 示样本数据的分布情况.
思考5:上表称为样本数据的频率分布表, 由此可以推测该市全体居民月均用水量 分布的大致情况,给市政府确定居民月 用水量标准提供参考依据,这里体现了 一种什么统计思想?
用样本的频率分布估计总体分布.
思考6:如果市政府希望85%左右的居民每 月的用水量不超过标准,根据上述频率分 布表,你对制定居民月用水量标准(即a的 取值)有何建议? 88%的居民月用水量在3t以下,可建议取a=3. 思考7:在实际中,取a=3t一定能保证85%以 上的居民用水不超标吗?哪些环节可能会导 致结论出现偏差? 分组时,组距的大小可能会导致结论出现偏 差,实践中,对统计结论是需要进行评价的.

《统计》知识点精华总结

《统计》知识点精华总结1、简单随机抽样的含义一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样简单随机抽样要特点:⑴总体的个体数有限;⑵样本的抽取是逐个进行的,每次只抽取一个个体;⑶抽取的样本不放回,样本中无重复个体;⑷每个个体被抽到的机会都相等,抽样具有公平性。

2.最常用的简单随机抽样方法有两种:⑴抽签法(抓阄法);⑵随机数法;★抽签法的操作步骤:第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.第二步,将号签放在一个容器中,并搅拌均匀第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。

●抽签法有哪些优点和缺点?优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大;误差相比其它抽样也比较大.★利用随机数表法从含有N个个体的总体中抽取一个容量为n的样本,其抽样步骤如下:第一步,将总体中的所有个体编号。

第二步,在随机数表中任选一个数作为起始数。

第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本。

系统抽样:3、系统抽样的含义一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。

★系统抽样有以下特征:⑴当总体容量N较大时,采用系统抽样。

⑵将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,间隔一般为N kn⑶预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号★系统抽样的一般步骤用系统抽样从总体中抽取样本时,首先要做的工作是将总体中的所有个体编号,如果用系统抽样从605件产品中抽取60件进行质量检查,由于605件产品不能均衡分成60部分,应先从总体中随机剔除5个个体,再均衡分成60部分。

总体密度曲线

3.将数据分组
[0,0.5 ),[0.5,1 ),…,[4,4.5]
4.列频率分布表
10频率分布直方图
频率/组距 0.50 0.40 0.30 0.20 0.10 0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t
画一组数据的频率分布直方图,可以按以 下的步骤进行:
(2)此种产品为二级品或三级品的概率约为0.27+0.43=0.7.
2.一个容量为100的样本,数据的分组和各组的相 关信息如下表,试完成表中每一行的两个空格.
分组 [12,15) [15,18) [18,21) [21,24) [24,27) [27,30) [30,33) [33,36]
合计
频数 6
2.2.1 用样本的频率分布 估计总体分布
目标导学
1、通过实例体会分布的意义和作用。学会列 频率分布表、画频率分布直方图、频率折线图、 茎叶图,体会它们各自的特点。 2、会解决一些简单的实际问题。
主体自学
看书: P65~66
统计的基本思想方法:
用样本估计总体,即通常不直接去研究总体, 而是通过从总体中抽取一个样本,根据样本的 情况去估计总体的相应情况.
(3)当样本容量无限增大,组距无限缩小, 那么频率分布直方图就会无限接近于一条光滑 曲线——总体密度曲线。
总体密度曲线反映了总体在各个范围内取值的百分比 ,精确地 反映了总体的分布规律。是研究总体分布的工具. 用样本分布直方图去估计相应的总体分布时,一般样本容量越 大,频率分布直方图就会无限接近总体密度曲线,就越精确地反 映了总体的分布规律,即越精确地反映了总体在各个范围内取值 百分比。
(1)乙运动员得分:
49,24,12,31,50,31,44,36,15,37,25,36,39
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

【问题】 某赛季甲、乙两名篮球运动员每场比赛 的得分情况如下:
甲运动员得分:13,51,23,8,26,38,16, 33,14,28,39;
乙运动员得分:49,24,12,31,50,31,44, 36,15,37,25,36,39.
助教在比赛中将这些数据记录为如下形式:

80 463 1 368 2 389 3
第三步,将各个数据的叶按大小次序写 在茎右(左)侧.
思考5:用茎叶图表示数据的分布情况是一种 好方法,你认为茎叶图有哪些优点?
(1)保留了原始数据,没有损失样本信息; (2)数据可以随时记录、添加或修改.
思考6:比较茎叶图和频率分布表,茎叶图中 “茎”和“叶”的数目分别与频率分 布表中哪些数目相当?
思考3:对于样本数据:3.1,2.5,2.0, 0.8,1.5,1.0,4.3,2.7, 3.1,3.5,用茎叶图如何表示?
茎叶 08 10 5 2057 3115 43
思考4:一般地,画出一组样本数据的茎 叶图的步骤如何?
第一步,将每个数据分为“茎”(高位) 和“叶”(低位)两部分;
第二步,将最小的茎和最大的茎之间的 数按大小次序排成一列,写在左(右) 侧;
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
频率 组距
总体密度曲线
总体在区间 (a,b)内取 值的百分比.
O
a
b 月均用水量/t
思考4:在上述背景下,相应的频率分布折线 图越来越接近于一条光滑曲线,统计中称这 条光滑曲线为总体密度曲线.那么图中阴影部 分的面积有何实际意义?
组距、频率除以组距、频率.
3.我们可以用样本数据的频率分布表 和频率分布直方图估计总体的频率分布, 当总体中的个体数较多或较少时,统计 中用什么方法提取样本数据的相关信息, 我们将进一步作些探究.
探究1:频率分布折线图与总体密度曲线
思考1:在城市居民月均用水量样本数据 的频率分布直方图中,各组数据的平均 值大致是哪些数?
2.总体密度曲线可看成是函数的图象,对一 些特殊密度曲线,其函数解析式是可求的.
3.茎叶图中数据的茎和叶的划分,可根据 样本数据的特点灵活决定.
巩固练习: 课本 P71练习:3. P81习题2.2 A组:
1.(1)(2)(3).
感谢下 载
思考5:当总体中的个体数比较少或样本 数据不密集时,是否存在总体密 度曲线?为什么?
不存在,因为组距不能任意缩小.
思考6:对于一个总体,如果存在总体 密度曲线,这条曲线是否惟一? 能否通过样本数据准确地画出总 体密度曲线?
探究(二):茎叶图
频率分布表、频率分布直方图和折 线图的主要作用是表示样本数据的分布 情况,此外,我们还可以用茎叶图来表 示样本数据的分布情况.
思考7:对任意一组样本数据,是否都适合用 茎叶图表示?为什么?
不适合样本容量很大或茎、叶不分明的样本 数据.
小结作业
1.用样本的频率分布估计总体分布,当总体 中的个体数取值很少时,可用茎叶图估计 总体分布;当总体中的个体数取值较多 时,可将样本数据适当分组,用频率分布 表或频率分布直方图估计总体分布.
2.2 用样本估计总体
2.2.1用样本的频率分布估计总体分布 第二课时
问题提出
1.列出一组样本数据的频率分布表 可以分哪几个步骤进行? 第一步:求极差. 第二步:决定组距与组数. 第三步:确定分点,将数据分组.
第四步:统计频数,计算频率,制成 表格.
2.频率分布直方图是在平面直角坐标系 中画若干个依次相邻的小长方形,这些 小长方形的宽、高和面积在数量上分别 表示什么?
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
思考3:当总体中的个体数很多时(如抽 样调查全国城市居民月均用水量),随 着样本容量的增加,作图时所分的组数 增多,组距减少,你能想象出相应的频 率分布折线图会发生什么变化吗?
频率 组距 0.5 0.4 0.3 0.2 0.1
4 15

25 54 1 6 1 6 79 49 0
甲运动员得分:13,51,23,8,26,38,16,33,
14,28,39;
乙运动员得分:49,24,12,31,50,31,44,
36,15,37,25,36,39.


80
463 1
25
368 2
54
389 3
1 6 1 6 79
4
49
15
0
思考1:你能理解这个图是如何记录这些数
据的吗?你能通过该图说明哪个运
动员的发挥更稳定吗?


80 463 1 368 2 389 3
4 15

25 54 1 6 1 6 79 49 0
思考2:在统计中,上图叫做茎叶图,它 也是表示样本数据分布情况的一 种方法,其中“茎”指的是哪些 数,“叶”指的是哪些数?
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
思考2:在频率分布直方图中,依次连接 各小长方形上端的中点,就得到一条折 线,这条折线称为频率分布折线图. 你 认为频率分布折线图能大致反映样本数 据的频率分布吗?
频率 组距 0.5 0.4 0.3 0.2 0.1
相关文档
最新文档