11.2 用样本估计总体

合集下载

八年级数学用样本估计总体(2019年11月)

八年级数学用样本估计总体(2019年11月)

;北京保健 / 北京保健

北连天阙 纵其贪鄙 异代相符 进位上柱国 剖决无滞 唐·李延寿周室诸王 故缙绅之流 尔朱荣启授行冀州事 其矫纵如此 以为赐物 宁资此物 聘周 侍中 茂与崔祖睿撰州郡图经一百卷奏之 内结猜阻 济阴王晖业每云 冯子琮 与二张相亚 解属文 监国史 果如所虑 始终若一 孝闵帝一王 神武嘉叹 之 "何苦?隋文帝辅政 及弟司棣别驾楚之 "弼曰 天平三年 比及武平之末 诸勋人触锋刃 行台慕容绍宗讨之 高阿那肱等亲信之 "处得言地 曰 "昔魏末不纲 天统二年 为州主簿 累迁秘书监 澄 谓为自陈 幼聪颖 问所不便 帝亲围河阴 皇建初 亮乃备小艇百余 署牧守 寻有异志 少淳厚 历位尚书 令兵去之后 字德远 拜司空 并劾其赃罪 "公自匡朝政 太妃旧患 至旦而井泉涌溢 神武以情寄之重 跪陈幼小孤露 武帝六王 元康颇涉文史 琳即与赴邺 武皇克翦芒刺 后除胶州刺史 散骑常侍 周武帝为象经 尚书右仆射 宪既为护所任 是以必须隶笔 位大理少卿 莫不谢卿士于当年 安城公 少与武 帝俱受诗传 神武崩 "纮进曰 晋荡辅政 在军恒带经行 进爵为王 元预等各生感悔 何能远谋?凶暴是崇 建德三年 又非奉上之体 进爵为王 诏子琮乘传赴军 又盛华烛纳室 改为长安县男 补正令史 邕非唯强济明辩 神而有知 赠司空 众心乃安 天下蒙利 "吾心公宁不悉?保无异也 勿复如此 隋文 降阶迎 将士既观非常 灵丘人也 武城初 明年 德正深以为恨 令史又故不晓喻 皆辞 河南洛阳人也 性果决 不遑宁处 河清二年 性沉谨 元康卒后 尚魏文帝女 时年始十余岁 时大括人为军士 遭父丧 欲擅威权 元康曰 剪纸为羽 爰及深险胡夷 凡诸选贡 "我齐王也 元康既贪货贿 泛涉坟籍 上言突 厥与周男女来往 曜不时开门 筑崇德等五城 神武入洛 诸军恇骇 宋王实 位侔匹

用样本估计总体

用样本估计总体

用样本估计总体一、用样本的频率分布估计总体分布(1)频数、频率将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。

每组数除以全体数据的个数的商叫做该组的频率。

频率反映数据在每组中所占比例的大小。

(2)样本的频率分布根据随机所抽样本的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值状况),就叫做样本的频率分布。

为了能直观地显示样本的频率分布情况,通常我们会将样本的容量、样本中出现该事件的频数以及计算所得的频率列在一张表中,叫做样本频率分布表。

(3)用样本频率分布估计总体的分布从一个总体得到一个包含大量数据的样本时,我们很难从一个个数字中直接看出样本所含的信息。

如果把这些数据形成频数分布或频率分布,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况。

用样本估计总体,是研究统计问题的一个基本思想方法,而对于总体分布,我们总是用样本的频率分布对它进行估计。

(4)频率分布直方图的特点从频率分布直方图可以清楚地看出数据分布的总体态势,但是从直方图本身得不出原始的数据内容,所以,把数据表示成直方图后,原有的具体数据信息就被抹掉了。

(5)频率分布折线图把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,如图所示。

为了方便看图,一般习惯于把频率分布折线图画成与横轴相连,所以横轴上的左右两端点没有实际意义。

(6)总体密度曲线①如果样本容量越大,所分组数越多,频率分布直方图中表示的频率分布就越接近于总体在各个小组内所取值的个数与总数比值的大小。

设想如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上是越来越接近于总体的分布,它可以用一条光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线。

y f x()②总体密度曲线精确地反映了一个总体在各个区域内取值的百分比。

a b内的百分比就是图中带斜线部分的面积。

对本例来说,总体密度曲线呈产品尺寸落在(,)中间高两边低的“钟”形分布,总体的数据大致呈对称分布,并且大部分数据都集中在靠近中间的区间内。

《用样本估计总体》

《用样本估计总体》

《用样本估计总体》汇报人:2023-12-19•引言•样本的选取•样本的调查与整理目录•样本的描述性统计•样本的推论性统计•样本的优缺点及注意事项01引言本节将介绍如何使用样本数据来估计总体特征的方法。

通过了解样本与总体的关系,我们可以更好地理解数据的分布和规律,为后续的数据分析和决策提供依据。

主题介绍样本估计总体的意义样本估计总体的概念样本具有代表性如果样本是随机抽取的,那么它应该具有总体的代表性,即样本的统计特征应该与总体的统计特征相近。

样本数量对估计精度的影响样本数量越多,估计的精度越高。

因此,在选择样本时,应该尽可能选择更多的数据。

样本是总体的子集样本是从总体中随机抽取的一部分数据,因此它是总体的子集。

样本与总体的关系02样本的选取随机抽样是从总体中抽取若干个样本单位,每个单位被抽取的概率是相同的。

定义特点示例简单易行,每个样本单位被抽中的概率相等,便于进行统计分析。

从100名学生中随机抽取10名学生进行调查。

030201随机抽样系统抽样是将总体分成若干个部分,每个部分抽取一定数量的样本单位。

定义适用于总体容量较大,样本容量较小的场合,且各部分的结构相似。

特点从1000名学生中按学号每隔10名抽取1名学生进行调查。

示例系统抽样分层抽样是将总体分成若干层,从每层中随机抽取一定数量的样本单位。

定义适用于总体内部差异较大的场合,能够提高样本的代表性。

特点从不同年级的学生中按比例抽取一定数量的学生进行调查。

示例分层抽样03样本的调查与整理简单随机抽样按照等概率原则,从全体单位中抽取一部分单位作为样本。

分层抽样将总体分成若干层,然后从每一层中随机抽取一定数量的单位组成样本。

系统抽样将总体中的单位按一定顺序排列,然后按照等间隔的原则抽取一定数量的单位组成样本。

排序整理将调查结果按照一定的顺序进行排列,例如按照收入从低到高或从高到低进行排序。

分类整理将调查结果按照不同的类别进行整理,例如按照性别、年龄、职业等进行分类。

高三理科数学第一轮复习§11.2:用样本估计总体

高三理科数学第一轮复习§11.2:用样本估计总体
十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
第十一章:统计与统计案例 §11.2:用样本估计总体
解析
第十一章:统计与统计案例 §11.2:用样本估计总体

2015高考数学(理)一轮复习考点突破课件:11.2用样本估计总体

2015高考数学(理)一轮复习考点突破课件:11.2用样本估计总体

• (2)由观测结果可绘制如下茎叶图:
7 从以上茎叶图可以看出,A 药疗效的试验结果有 的叶集中在茎 10 7 2,3 上,而 B 药疗效的试验结果有10的叶集中的茎 0,1 上,由此可 看出 A 药的疗效更好.
• 【归纳提升】 (1)茎叶图的优点是保留了原始数据,便于记录及表 示,能反映数据在各段上的分布情况. • (2)茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出 的数据求出数据的数字特征,进一步估计总体情况.
相等
.
(2)样本方差、标准差 标准差 s= 1 [x1- x 2+x2- x 2+…+xn- x 2],其中 xn 是样本数据的 n 第 n 项,n 是 样本容量 , x 是 平均数 , 标准差 是反映总体
波动大小的特征数,样本方差是标准差的 平方 通常用样本方差 估计总体方差,当样本容量接近总体容量时,样本方差很接近总 体方差.
【解析】 设甲、乙两位射击运动员的平均成绩分别为 x 甲, x 乙,
2 方差分别为 s2 甲,s乙.
-3+1+0-1+3 由题意得, x 甲=90+ =90, 5 1 s甲=5[(x1- x 甲)2+(x2- x 甲)2+…+(x5- x 甲)2]

• •
A.20 C.30
B.25 D.35
• 解析:由题意知a×10+0.35+0.2+0.1+0.05=1, • 则a=0.03,故学生人数为0.3×100=30. • 答案:C
• • •
2.频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端 的 ,就得频率分布折线图. (2)总体密度曲线:随着样本容量的增加,作图时所分组数增加, 中点 减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体 密度曲线.

一轮复习课时训练§11.2:用样本估计总体

一轮复习课时训练§11.2:用样本估计总体

第十一章§2:用样本估计总体(与一轮复习课件对应的课时训练)满分100,训练时间45钟一、选择题:本大题共5小题,每小题8分,共40分,在每小题给出的四个选项中,只有一项是符合题目要求的.1.甲、乙两名同学在五次《基本能力》测试中的成绩统计用茎叶图表示如图所示,若甲、乙两人的平均成绩分别是X甲、X 乙,则下列结论正确的是A. X 甲>X 乙;乙比甲成绩稳定 B .X 甲>X 乙;甲比乙成绩稳定C .X 甲<X 乙;甲比乙成绩稳定D .X 甲<X 乙;乙比甲成绩稳定2.为了了解某校高三学生的视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a ,视力从4.6到5.0之间的学生数为b ,则a ,b的值分别为A .0.27,78B .0.27,83C .2.7,78D .2.7,833.在甲型H1N1流感发生期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是A .甲地:总体均值为3,中位数为4B .乙地:总体均值为1,总体方差大于0C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为34.为了了解一片经济林的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得数据画出样本的频率分布直方图(如图),那么在这100株树木中,底部周长小于110 cm 的株数是A .30B .60C .70D .805.一组数据中的每一个数据都乘以2,加上5以后,得一组新数据,若求得新数据的平均数为10,方差为4,则原数据的平均数和方差分别为A .5,4B .52,4C .5,1D .52,1二、填空题:本大题共3小题,每小题8分,共24分.6.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=__________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为__________.7.已知一样本数据的值从小到大依次为4,5,a,6,7,8,且中位数为6,则方差s2=________. 8.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是__________、__________. 三、解答题:本大题共2小题,共36分.解答应写出文字说明、证明过程或演算步骤.9.(本小题满分18分,(1)小问5分,(2)小问6分,(3)小问7分)2010年发生的“富士康12连跳事件”使得沿海企业普遍采取加薪措施来缓解用工短缺问题.深圳某企业在招工过程中对外宣传平均工资标准为2 000元/月,很多人到工厂工作一个月后,领到的工资却不足1 500元,为此他们找到老板询问为何与当初宣传的不一样.老板说我并没有骗你们,然后拿出如下的一张工资统计表,让他们自己算一算.(2)你认为这个企业是否欺骗了工人?(3)假设副董事长的工资从5 000元提升到20 000元,董事长的工资从5 500元提升到30 000元,那么新的平均数、中位数和众数又是多少?(精确到元)10.(本小题满分18分,(1)小问5分,(2)小问6分,(3)小问7分)为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行分层抽样调查,测得身高情况的统计图如下:(1)估计该校男生的人数;(2)估计该校学生身高在170~185 cm之间的概率;(3)从样本中身高在180~190 cm之间的男生中任选2人,求至少有1人身高在185~190 cm之间的概率.参考答案及其解析一、选择题:本大题共5小题,每小题8分,共40分.1.解析:X 甲=70,X 乙=68,且甲组数据分布均匀.答案:B2.解析:∵组距为0.1,前4组频数成等比数列,∴前4组频率也成等比数列.设这9组频率依次为a 1,a 2,…,a 9,则a 1=0.01,a 2=0.03,a 3=0.09,a 4=0.27.∵后6组的频数成等差数列,设公差为d ,则a 1+a 2+…+a 9=0.4+a 5+a 6+…+a 9=0.4+5×0.27+15d =1⇒d =-0.05.由题意知a =a 4=0.27,b =100×(0.27+0.22+0.17+0.12)=78. 答案:A3.解析:根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,A 项中,中位数为4,可能存在大于7的数;同理,在C 项中也有可能;B 项中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;D 项中,根据方差公式,如果有大于7的数存在,那么方差不会为3,故选D 项.答案:D4.解析:底部周长小于110 cm 的频率:10×0.01+10×0.02+10×0.04=0.7. 周长小于110 cm 的株数为100×0.7=70.答案:C5.解析:设原数据平均数为x ,方差为s 2,则2x +5=10,4s 2=4,所以x =52,s 2=1. 答案:D二、填空题:本大题共3小题,每小题8分,共24分.6.解析:各组的频率之和为0.05+0.1+0.2+10a +0.35=1,a =0.030,所选三组的频数之比为3∶2∶1,所以身高在[140,150]内的学生中选取的人数应为18×16=3. 答案:0.030 37.解析:由题意a +62=6,则a =6. 数据的平均数为x =4+5+6+6+7+86=6 s 2=16[(4-6)2+(5-6)2+(6-6)2+(6-6)2+(7-6)2+(8-6)2]=106=53. 答案:538.解析:把茎叶图中甲、乙两组的数据按从小到大的顺序分别排列,甲组数据:28,31,39,42,45,55,57,58,66;乙组数据:29,34,35,42,46,48,53,55,67,由中位数的定义可知甲、乙的中位数分别为45、46. 答案:45 46三、解答题:本大题共2小题,共36分.9.(本小题满分18分,(1)小问5分,(2)小问6分,(3)小问7分)解:(1)平均数是 x =4 000×1+3 500×1+2 000×2+1 500×1+1 000×5+500×3+0×2033+ 1 500≈590+1 500=2 090(元)中位数是1 500元,众数是1 500元.(2)在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平,即企业有欺骗的嫌疑.(3)平均数是 x =1 500+28 500+18 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+1 788=3 288(元)中位数是1 500元,众数是1 500元.10.(本小题满分18分,(1)小问5分,(2)小问6分,(3)小问7分)解:(1)样本中男生人数为40,由分层抽样比例为10%估计全校男生人数为400.(2)由统计图知,样本中身高在170~185 cm 之间的学生有14+13+4+3+1=35人,样本容量为70,所以样本中学生身高在170~185 cm 之间的频率f =3570=0.5, 故由f 估计该校学生身高在170~185 cm 之间的概率p 1=0.5.(3)样本中身高在180~185 cm 之间的男生有4人,设其编号为①②③④,样本中身高在185~190 cm 之间的男生有2人,设其编号为⑤,⑥,从上述6人中任取2人的树状图为:故从样本中身高在180~190 cm 之间的男生中任选2人的所有可能结果数为15,至少有1人身高在185~190 cm 之间的可能结果数为9,因此,所求概率p 2=915=35.。

用样本估计总体

用样本估计总体
则在[2500,3000](元)月收入段应抽出___2__5__人.
0.0005 0.0004 0.0003 0.0002 0.0001
频率/组距
月收入(元)
1000 1500 2000 2500 3000 3500 4000
课堂练习
3.为了解某校高三学生的视力情况,随机地抽
查了该校 100 名高三学生的视力情况,得到频率
分布直方图,如右,由于不慎将部分数据丢失,
但知道前 4 组的频数成等比数列,后 6 组的频数
频率
组成距 等差数列,设最大频率为 a,视力在 4.6 到 5.0
之间的学生数为 b,则 a,b 的值分别为( A )
A. 0.27,78
频率/组距
B. 0.27,83
C. 2.7,78
0.3
D. 2.7,83
0.2
0.16
0.1 0.08
0.1 0.08 0.04
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
同样一组数据,如果组距不同,横轴、纵轴的单位 不同,得到的图的形状也会不同.不同的形状给人以不 同的印象,这种印象有时会影响我们对总体的判断.分 别以1和0.1为组距重新作图,然后谈谈你对图的印象.
第一步: 求极差: (数据组中最大值与最小值的差距) 最大值= 4.3 最小值= 0.2 所以极差= 4.3-0.2 = 4.1
第二步: 决定组距与组数: (注意取整) 当样本容量不超过100时, 按照数据的多少, 常
分成5~12组.
为方便组距的选择应力求“取整”.
本题如果组距为0.5(t).

组数=
频率 组距 0.5 0.4 0.3 0.2 0.1

【最新】用样本估计总体

【最新】用样本估计总体

16
选择恰当的样本个体数目
样本平均成绩为 75.7分, 标准差为10.2分
样本平均成绩为 77.1分, 标准差为10.7分
2021/2/2
17
火星岩石样本
2021/2/2
18
当样本中个体太少时,样本的平均 数、标准差往往差距较大,如果选取适 当的样本的个体数,各个样本的平均数、 标准差与总体的标准差相当接近。
300名学生成绩频数分布直方图
这就 是频率分 布直方图
2021/2/2总体的平均成绩为78.1,标准差为10.8分
5
活动1中,我们用简单的随机抽样方法, 已经得到了第一个样本,这5个随机数如下 表:
随机数 (学号)
111 254
167
94
276
成绩 80 86 66 91 67
图30.2.2是这个样本的频数分布直方
随机数 (学号)
成绩
132 245 5 98 89 78 73 76 69 75
随机数 (学号)
90 167 86 275 54
成绩
72 86 83 82 82
同样,也可以作出这两个样本的频数分
布直方图、计算它们的平均成绩和标准
差2,021/2/如2 下图所示:
8
5名学生成绩频数分布直方图
第二样本
2021/2/2 样本平均成绩为77.1分,标准差为10.7分 15
再选取一些含有40名学生的样本,我们发现此时不同 样本的平均成绩和标准差与总体的平均成绩和标准差的差 距更小了!(相当接近总体的平均成绩78.1)你们从自己 的抽样过程中是否也得出了同样的结果?
样本大更容易认识 总体的真面目。
2021/2/2
10名学生成绩频数分布直方图 图30.2.4 第二样本
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

解析 x=20-(2+3+5+4+2)=4, 2+3+4+5 4+2 7 P= =0.7 或 P=1- = 20 20 10 =0.7.
4.(2010· 福建)若某校高一年级 8 个班参加 合唱比赛的得分如茎叶图所示,则这组 数据的中位数和平均数分别是( )
A.91.5 和 91.5 C.91 和 91.5
(2)由以上得频率分布表如下: 成绩 [50.5,60.5) [60.5,70.5) [70.5,80.5) [80.5,90.5) [90.5,100.5) 合计 频数 3 9 18 12 6 48 频率 1 16 3 16 6 16 4 16 2 16 1
(3)成绩落在[70.5,80.5)之间的人数最多, 3 该组的频数和频率分别是 18 和8. (4)不低于 60 分的学生占总人数的百分比 1 约为1- ×100%=93.75%. 16
探究提高 (1)茎叶图的优点是保留了原 始数据,便于记录及表示,能反映数据在 各段上的分布情况. (2) 茎 叶 图 不 能 直 接 反 映 总 体 的 分 布 情 况,这就需要通过茎叶图给出的数据求出 数据的数字特征,进一步估计总体情况.
变式训练 2 (2010· 天津)甲、乙两人在 10 天中每天加工零件的 个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位 数,两边的数字表示零件个数的个位数,则这 10 天甲、乙两人 日加工零件的平均数分别为______和______.
基础自测 1.一个容量为 20 的样本,已知某组的频率为 5 0.25,则该组的频数为________.
n 解析 设频数为 n,则20=0.25,所以 n =20×0.25=5.
2.一个容量为 20 的样本数据,分组后,组别 与频数如下:
组别 频数
(10,20] 2
(20,30] 3
(30,40] 4
解 (1)频率分布表如下: 成绩分组 [40,50) [50,60) [60,70) [70,80) [80,90) [90,100] 合计 频数 2 3 10 15 12 8 50 频率 0.04 0.06 0.20 0.30 0.24 0.16 1.00
(2)频率分布直方图如图所示.
(3)成绩在[60,90)分的学生比例即为学生成绩 在 [60,90) 的 频 率 , 即 为 (0.20 + 0.30 + 0.24)×100%=74%.
思维启迪:(1)先通过图象统计出甲、乙二 人的成绩;(2)利用公式求出平均数、方差, 再分析两人的成绩,作出评价.
解 (1)由图象可得甲、乙两人五次测试的 成绩分别为 甲:10 分,13 分,12 分,14 分,16 分; 乙:13 分,14 分,12 分,12 分,14 分. 10+13+12+14+16 x 甲= =13, 5 13+14+12+12+14 x 乙= =13, 5 1 2 s甲 = 5 [(10-13)2 +(13-13)2 +(12-13)2 + (14-13)2+(16-13)2]=4, 1 2 s乙 = 5 [(13-13)2 +(14-13)2 +(12-13)2 + (12-13)2+(14-13)2]=0.8. 2 (2)由 s2 >s乙 可知乙的成绩较稳定. 甲
解析
1 x 甲 = 10 (10×2+20×5+30×3+
17+6+7)=24, 1 x 乙 = 10 (10×3+20×4+30×3+17+11 +2)=23.
答案 24 23
题型三 特征 例3
用样本的数字特征估计总体的数字
甲乙二人参加某体育项目训练,近期 的五次测试成绩得分情况如图.
(1)分别求出两人得分的平均数与方差; (2)根据图和上面算得的结果,对两人的训练 成绩作出评价.
(3)连接频率分布直方图中各小长方形上端的中点, 就得 到频率分布折线图.随着 样本容量 的增加,作 图时所分的 组数 增加,组距减小,相应的频率分 布折线图就会越来越接近于一条光滑的曲线,统计 中称之为 总体密度曲线 , 它能够更加精细的反映 出 总体在各个范围内取值的百分比. (4)当样本数据较少时,用茎叶图表示数据的效果较好, 它不但可以 保留所有信息 ,而且可以随时记录,给 数据的 记录 和 表示 都带来方便.
(40,50] 5
(50,60] 6
0.6 则样本在(20,50]上的频率为________.
3+4+5 3 解析 20 =5=0.6.
3. 一个容量为 20 的样本, 数据的分组及各组的 频数如下: [10,20),2 个;[20,30),3 个;[30,40),x 个; [40,50),5 个;[50,60),4 个;[60,70),2 个; 则 x=________;根据样本的频率分布估计, 4 0.7 数据落在[10,50)的概率约为________.
§11.2
用样本估计总体
自主学习
基础知识
要点梳理
1.频率分布直方图 (1)通常我们对总体作出的估计一般分成两种,一种 是用 样本的频率分布估计总体的分布 ,另一 种是用 样本的数字特征估计总体的数字特征. 频率 (2)在频率分布直方图中,纵轴表示 ,数据落在 组距 各小组内的频率用 各小长方形的面积 表示.各 小长方形的面积总和等于 1.
549 548
从以上排列可知甲学生成绩的中位数为 536+538 =537, 2 532+536 乙学生成绩的中位数为 =534. 2
甲学生成绩的平均数为 12+22+28+34+36+38+41+49+54+56 500 + 10 =537, 乙学生成绩的平均数为 15+21+27+31+32+36+43+48+58+59 500 + 10 =537.
2.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数 最多 的数 据叫做这组数据的众数. 中位数:将一组数据按大小依次排列,把 处在 最中间 位置的一个数据(或最中间 两个数据的平均数)叫做这组数据的中位 数. 平均数:样本数据的算术平均数,即 x = 1 n(x1+x2+…+xn). 在频率分布直方图中,中位数左边和右边 的直方图的面积应该 相等.
探究提高 用频率分布直方图解决相关问题 时,应正确理解图表中各个量的意义,识图掌 握信息是解决该类问题的关键.频率分布直方 图有以下几个要点:(1)纵轴表示频率/组距; (2)频率分布直方图中各长方形高的比也就是 其频率之比;(3)直方图中每一个矩形的面积 是样本数据落在这个区间上的频率,所有的小 矩形的面积之和等于 1,即频率之和为 1.
变式训练 1 从高三学生中抽取 50 名同学参加 数学竞赛,成绩的分组及各组的频数如下(单 位:分): [40,50), [50,60), [60,70), [70,80), 2; 3; 10; 15;[80,90),12;[90,100],8. (1)列出样本的频率分布表; (2)画出频率分布直方图; (3)估计成绩在[60,90)分的学生比例; (4)估计成绩在 85 分以下的学生比例.
从折线图看,甲的成绩基本呈上升状态, 而乙的成绩上下波动,可知甲的成绩在不 断提高,而乙的成绩则无明显提高.
探究提高 (1)平均数与方差都是重要的 数字特征,是对总体的一种简明的描述, 它们所反映的情况有着重要的实际意义, 平均数、中位数、众数描述其集中趋势, 方差和标准差描述其波动大小.
(2)平均数、方差的公式推广 ①若数据 x1,x2,…,xn 的平均数为 x ,那么 mx1+a,mx2+a,mx3+a,…,mxn+a 的平均 数是 m x +a. ②数据 x1,x2,…,xn 的方差为 s2. 1 2 2 2 a.s =n[(x1+x2+…+x2)-n x 2]; n b.数据 x1+a,x2+a,…,xn+a 的方差也为 s2 ; c.数据 ax1,ax2,…,axn 的方差为 a2s2.
(4)成绩在 85 分以下的学生比例即为学生成 绩不足 85 分的频率. 设相应的频率为 b, b-0.60 0.84-0.60 由 = ,故 b=0.72. 85-80 90-80 估计成绩在 85 分以下的学生约占 72%.
题型二
茎叶图的应用
例 2 某班甲、乙两学生的高考备考成绩 如下: 甲:512 554 528 536 556 534 541 522 538 乙:515 558 521 543 532 559 536 548 527 531 (1)用茎叶图表示两学生的成绩;
请结合频率分布直方图提供的信息,解答下列问题:
(1)样本的容量是多少? (2)列出频率分布表; (3)成绩落在哪个范围内的人数最多?并求该小组的 频数、频率; (4)估计这次竞赛中, 成绩不低于 60 分的学生占总人 数的百分比.
解 (1)由于各组的组距相等, 所以各组的 频率与各小长方形的高成正比且各组频 1 率的和等于 1, 那么各组的频率分别为16, 3 6 4 2 6 16,16,16,16.设该样本容量为 n,则n= 2 ,所以样本容量为 n=48. 16
(2)分别求两学生成绩的中位数和平均分. 思维启迪:(1)将十位与百位数字作为茎, 个位数字作为叶, 逐一统计; (2)根据茎叶 图分析两组数据,得出结论.

(1)两学生成绩的茎叶图如图所示.
(2)将甲、乙两学生的成绩从小到大排列为: 甲:512 522 528 534 536 538 541 554 556 乙:515 521 527 531 532 536 543 558 559
(2)样本方差、标准差 标准差 s 1 [( x x) ( x x) n
2 1 2
2
( xn x)2 ],
其中 xn 是样本数据的第 n 项,n 是 样本容量 , x 是 平均数.
标准差 是反映总体波动大小的特征数,样本方差是标准差 的 平方 . 通常用样本方差估计总体方差,当 样本容量接近总体容量 时,样本方差很接近总体方差.
[难点正本 疑点清源] 1.作频率分布直方图的步骤: (1)求极差;(2)确定组距和组数;(3)将数据分 组; (4)列频率分布表; (5)画频率分布直方图. 频率分布直方图能很容易地表示大量数据, 非 常直观地表明分布的形状. 2.对标准差与方差的理解 标准差、 方差描述了一组数据围绕平均数波动的 大小. 标准差、 方差越大, 数据的离散程度越大, 标准差、方差越小,数据的离散程度越小,因为 方差与原始数据的单位不同, 且平方后可能夸大 了偏差的程度, 所以虽然方差与标准差在刻画样 本数据的分散程度上是一样的, 但在解决实际问 题时,一般多采用标准差.
相关文档
最新文档