频率分布直方图与茎叶图

合集下载

高考数学易错题10.2 统计图表的应用-2019届高三数学提分精品讲义

高考数学易错题10.2 统计图表的应用-2019届高三数学提分精品讲义

专题十概率、统计问题二:统计图表的应用一、考情分析统计图表有频率分布直方图、茎叶图、折线图、条形图、饼形图、雷达图等,它们广泛应用于实际生活之中,也是历年高考的热点,求解此类的关键是由图表读出有用的数据,再根据数据进行分析.二、经验分享1.明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.学科-网2.对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.3.频率分布直方图是高考考查的热点,考查频率很高,题型有选择题、填空题,也有解答题,难度为低中档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.三、知识拓展统计图是利用点、线、面、体等绘制成几何图形,以表示各种数量间的关系及其变动情况的工具。

表现统计数字大小和变动的各种图形总称。

其中有条形统计图、扇形统计图、折线统计图、象形图等。

在统计学中把利用统计图形表现统计资料的方法叫做统计图示法。

其特点是:形象具体、简明生动、通俗易懂、一目了然。

其主要用途有:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况。

一般采用直角坐标系.横坐标用来表示事物的组别或自变量x,纵坐标常用来表示事物出现的次数或因变量y;或采用角度坐标(如圆形图)、地理坐标(如地形图)等。

2023年高考数学一轮复习(新高考地区专用)6-6 分布列基础(精练)(解析版)

2023年高考数学一轮复习(新高考地区专用)6-6 分布列基础(精练)(解析版)

6.6 分布列基础(精练)(基础版)1.(2022·云南·昆明市第一中学西山学校)国家“双减”政策落实之后,某市教育部门为了配合“双减”工作,做好校园课后延时服务,特向本市小学生家长发放调查问卷了解本市课后延时服务情况,现从中抽取100份问卷,统计了其中学生一周课后延时服务总时间(单位:分钟),并将数据分成以下五组:[)[)[)[)[]100,120,120,140,140,160,160,180,180,200,得到如图所示的频率分布直方图.(1)根据如图估计该市小学生一周课后延时服务时间的众数、平均数、中位数(保留小数点后一位);(2)通过调查分析发现,若服务总时间超过160分钟,则学生有不满情绪,现利用分层随机抽样的方法从样本问卷中随机抽取8份,再从抽取的8份问卷中抽取3份,记其中有不满情绪的问卷份数为X ,求X 的分布列及均值.【答案】(1)150,151,150.9;(2)分布列见解析,34.【解析】(1)众数:150;第1到5组频率分别为:0.05,0.15,0.55,0.2,0.05,平均数:1100.051300.151500.551700.21900.05151x =⨯+⨯+⨯+⨯+⨯=, 设中位数为x ,则中位数在第3组,则()0.21400.02750.5x +-⨯=,150.9x ≈; (2)用分层随机抽样抽取8份问卷,其中学生有不满情绪的有8×(0.2+0.05)=2份,∴X 的可能取值为0,1,2,∴()306238C C 5C 140P X ===,()216238C C 15C 281P X ===,()126238C C 3C 282P X ===,∴X 的分布列为:题组一 超几何分布∴()515330121428284E X =⨯+⨯+⨯=. 2.(2022·北京·高三专题练习)为迎接2022年冬奥会,北京市组织中学生开展冰雪运动的培训活动,并在培训结束后对学生进行了考核.记X 表示学生的考核成绩,并规定85X >为考核优秀.为了了解本次培训活动的效果,在参加培训的学生中随机抽取了30名学生的考核成绩,并作成如下茎叶图:.(1)从参加培训的学生中随机选取1人,请根据图中数据,估计这名学生考核为优秀的概率;(2)从图中考核成绩满足[]70,79X ∈的学生中任取3人,设Y 表示这3人中成绩满足8510X -≤的人数,求Y 的分布列和数学期望;(3)根据以往培训数据,规定当8510.510X P ⎛-⎫≤≥⎪⎝⎭时培训有效.请你根据图中数据,判断此次冰雪培训活动是否有效,并说明理由.【答案】(1)15(2)分布列见解析,()158E Y = (3)有效,理由见解析 【解析】(1)解:设该名学生的考核成绩优秀为事件A ,由茎叶图中的数据可知,30名同学中,有6名同学的考核成绩为优秀,故()15P A =. (2)解:由8510X -≤可得7595X ≤≤,所以,考核成绩满足[]70,79X ∈的学生中满足8510X -≤的人数为5,故随机变量Y 的可能取值有0、1、2、3,()3338C 10C 56P Y ===,()213538C C 151C 56P Y ===,()123538C C 152C 28P Y ===,()3538C 53C 28P Y ===,所以,随机变量Y 的分布列如下表所示:因此,()115155150123565628288E Y =⨯+⨯+⨯+⨯=. (3)解:由85110X -≤可得7595X ≤≤,由茎叶图可知,满足7595X ≤≤的成绩有16个, 所以851610.51030X P ⎛-⎫≤=≥⎪⎝⎭,因此,可认为此次冰雪培训活动有效. 3.(2022·宁夏中卫·三模(理))共享电动车(sharedev )是一种新的交通工具,通过扫码开锁,实现循环共享.某记者来到中国传媒大学探访,在校园喷泉旁停放了10辆共享电动车,这些电动车分为荧光绿和橙色两种颜色,已知从这些共享电动车中任取1辆,取到的是橙色的概率为0.4P =,若从这些共享电动车中任意抽取3辆.(1)求取出的3辆共享电动车中恰好有一辆是橙色的概率;(2)求取出的3辆共享电动车中橙色的电动车的辆数X 的分布列与数学期望. 【答案】(1)12;(2)分布列见解析,数学期望为65.【解析】(1)因为从10辆共享电动车中任取一辆,取到橙色的概率为0.4,所以橙色的电动车有4辆,荧光绿的电动车有6辆.记A 为“从中任取3辆共享单车中恰好有一辆是橙色”,则()2164310C C 1C 2P A ⨯==. (2)随机变量X 的所有可能取值为0,1,2,3.所以()3064310C C 10C 6P X ⨯===,()2164310C C 11C 2P X ⨯===, ()()1264310C C 32C 10P X P A ⨯====,()0364310C C 13C 30P X ⨯===.所以分布列为数学期望()1131601236210305E X =⨯+⨯+⨯+⨯=.4.(2022·广东·华南师大附中三模)“双减”政策实施后,为了解某地中小学生周末体育锻炼的时间,某研究人员随机调查了600名学生,得到的数据统计如下表所示:(1)估计这600名学生周末体育锻炼时间的平均数t ;(同一组中的数据用该组区间的中点值作代表) (2)在这600人中,用分层抽样的方法,从周末体育锻炼时间在[)40,60内的学生中抽取15人,再从这15人中随机抽取3人,记这3人中周末体育锻炼时间在[)50,60内的人数为X ,求X 的分布列以及数学期望()E X . 【答案】(1)58.5;(2)分布列答案见解析,数学期望:95.【解析】(1)估计这600名学生周末体育锻炼时间的平均数 350.1450.2550.3650.15750.15850.158.5t =⨯+⨯+⨯+⨯+⨯+⨯=.(2)依题意,周末体育锻炼时间在[)40,50内的学生抽6人,在[)50,60内的学生抽9人,则()363154091C P X C ===,()216931527191C C P X C ===,()12693152162455C C P X C ===,()3931512365C P X C ===,故X 的分布列为: 则()42721612901239191455655E X =⨯+⨯+⨯+⨯=. 5.(2022·云南保山·模拟预测(理))某高中学校为了解学生的课外体育锻炼时间情况,在全校学生中随机抽取了200名学生进行调查,并将数据分成六组,得到如图所示的频率分布直方图.将平均每天课外体育锻炼时间在[40,60)上的学生评价为锻炼达标,将平均每天课外体育锻炼时间在[0,40)上的学生评价为锻炼不达标(1)根据频率分布直方图估计这200名学生每天课外体育锻炼时间的众数、中位数;(2)为了了解学生课外体育锻炼时间不达标的原因,从上述锻炼不达标的学生中按分层抽样的方法抽取10人,再从这10人中随机抽取3人,记这三人中每天课外体育锻炼时间在[0,20)的人数为ξ,求ξ的分布列和数学期望.【答案】(1)中位数为28.125,众数等于25(2)分布列见解析,0.9【解析】(1)众数就是直方图中最高矩形底边中点的横坐标,则样本众数等于25.由频率分布直方图可得,在[0,10)上的频率为0.08,在[10,20)上的频率为0.16,在[20,30)上的频率为0.32,0.080.160.50.080.160.32<<+++,则中位数在区间[20,30)上.设中位数为0x ,则()00.24200.0320.5+-⨯=x ,028.125x =,即样本中位数为28.125.(2)根据题意,在[0,10),[10,20),[20,30),[30,40)上抽取的人数分别为1,2,4,3,其中在[0,20)上抽取的人数为3,则0ξ=,1,2,3.3127373310103576321(0),(1),1202412040ξξ⨯========C C C P P C C , 2133733310102171(2),(3)12040120C C C P P C C ξξ=====⨯==. 从而得到随机变量ξ的分布列如下表:随机变量ξ的期望72171()01230.9244040120E ξ=⨯+⨯+⨯+⨯=6.(2022·北京市朝阳区人大附中朝阳分校模拟预测)自“新型冠状肺炎”疫情爆发以来,科研团队一直在积极地研发“新冠疫苗”.在科研人员不懈努力下,我国公民率先在2020年年末开始使用安全的新冠疫苗,使我国的“防疫”工作获得更大的主动权.研发疫苗之初,为了测试疫苗的效果,科研人员以白兔为实验对象,进行了一些实验:(1)实验一:选取10只健康白兔,编号1至10号,注射一次新冠疫苗后,再让它们暴露在含有新冠病毒的环境中,实验结果发现:除2号、3号、7号和10号四只白兔仍然感染了新冠病毒,其他白兔未被感染.现从这10只白兔中随机抽取3只进行研究,将仍被感染的白兔只数记作X ,求X 的分布列和数学期望.(2)实验二:疫苗可以再次注射第二针、加强针,但两次疫苗注射时间间隔需大于三个月.科研人员对白兔多次注射疫苗后,每次注射的疫苗对白兔是否有效互相不影响.试问:若将实验一中未被感染新冠病毒的白兔的频率当做疫苗的有效率,那么一只白兔注射两次疫苗后的有效率能否保证达到90%?如若可以,请说明理由;若不可以,请你参考上述实验给出注射疫苗后有效率在90%以上的建议. 【答案】(1)分布列见解析;数学期望()65E X =; (2)无法保证;建议:需要将注射一次疫苗的有效率提高到90%以上. 【解析】(1)由题意得:X 所有可能的取值为0,1,2,3,()3631020101206C P X C ∴====;216431060111202C C P XC ; 1264310363212010C C P X C ;3431041312030C P XC ; X ∴的分布列为:∴数学期望()1131601236210305E X =⨯+⨯+⨯+⨯=; (2)由已知数据知:实验一中未被感染新冠病毒的白兔的频率为0.6,则注射一次疫苗的有效率为0.6, ∴一只白兔注射两次疫苗的有效率为:()2110.60.8484%90%--==<, ∴无法保证一只白兔注射两次疫苗后的有效率达到90%;设每支疫苗有效率至少达到x 才能满足要求,()21190%x ∴--≥,解得:0.990%x ≥=,∴需要将注射一次疫苗的有效率提高到90%以上才能保证一只白兔注射两次疫苗后的有效率达到90%.7.(2022·全国·高三专题练习(理))高二年级某班学生在数学校本课程选课过程中,已知第一小组与第二小组各有六位同学.每位同学都只选了一个科目,第一小组选《数学运算》的有1人,选《数学解题思想与方法》的有5人,第二小组选《数学运算》的有2人,选《数学解题思想与方法》的有4人,现从第一、第二两小组各任选2人分析选课情况.(1)求选出的4 人均选《数学解题思想与方法》的概率;(2)设ξ为选出的4个人中选《数学运算》的人数,求ξ的分布列和数学期望. 【答案】(1)415(2)分布列见解析,期望为1 【解析】(1)解:设“从第一小组选出的2人选《数学解题思想与方法》”为事件A ,“从第二小组选出的2人选《数学解题思想与方法》”为事件B ,由于事 件A 、B 相互独立,且22542266C C 22(),()C 3C 5P A P B ====, 所以选出的4人均选《数学解题思想与方法》的概率为224()()()3515P A B P A P B ⋅=⋅=⨯=.(2)解:由题意,随机变量ξ可能的取值为0,1,2,3,可得4(0)15P ξ==,211125524422226666C C C C C 22(1)C C C C 45P ξ==⋅+⋅=,152266C 11(3)C C 45P ξ==⋅=,2(2)1(0)(1)(3)9P P P P ξξξξ==-=-=-==, 所以随机变量ξ的分布列为:ξ0 1 23 P415224529145所以随机变量ξ的数学期望 42221012311545945E ξ=⨯+⨯+⨯+⨯=. 1.(2022·北京·人大附中三模)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图: 组号分组频数1[)0,262 [)2,48题组二 二项分布每周课外阅读时间小于6小时的学生我们称之为“阅读小白”,大于等于6小时且小于12小时的学生称之为“阅读新手”,阅读时间大于等于12小时的学生称之为“阅读达人”.(1)从样本中随机选取一名学生,已知这名学生的阅读时间大于等于6小时,问这名学生是“阅读达人”概率; (2)从该校学生中选取3人,用样本的频率估计概率,记这3人中“阅读新手和阅读小白”的人数和为X ,求X 的分布列和数学期望;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论) 【答案】(1)1069(2)分布列答案见解析,()2710E X =(3)第4组【解析】(1)解:从样本中随机选取一名学生,其中阅读时间大于等于6小时的学生人数为1003169-=, “阅读达人”的学生人数为10,故所求概率为1069. (2)解:从该校学生中任选一人,该学生是“阅读小白”或“阅读新人”的概率为90910010=, 所以,9~3,10X B ⎛⎫ ⎪⎝⎭,则()3110101000P X ⎛⎫=== ⎪⎝⎭,()397293101000P X ⎛⎫=== ⎪⎝⎭,()21391271C 10101000P X ⎛⎫==⋅⋅= ⎪⎝⎭,()223912432C 10101000P X ⎛⎫==⋅⋅= ⎪⎝⎭, 所以,随机变量X 的分布列如下表所示:()927310100E X =⨯=. (3)解:样本中的100名学生该周课外阅读时间的平均数为10.0630.0850.1770.2290.25110.12130.06150.02170.02⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=7.68.因此,样本中的100名学生该周课外阅读时间的平均数在第4组.2.(2022·安徽·合肥一六八中学模拟预测(理))《关于加快推进生态文明建设的意见》,正式把“坚持绿水青山就是金山银山”的理念写进中央文件,成为指导中国加快推进生态文明建设的重要指导思想.为响应国家号召,某市2020年植树节期间种植了一批树苗,2022年市园林部门从这批树苗中随机抽取100棵进行跟踪检测,得到树高的频率分布直方图如图所示:(1)求树高在225-235cm 之间树苗的棵数,并求这100棵树苗树高的平均值;(2)若将树高以等级呈现,规定:树高在185-205cm 为合格,在205-235为良好,在235-265cm 为优秀.视该样本的频率分布为总体的频率分布,若从这批树苗中机抽取3棵,求树高等级为优秀的棵数ξ的分布列和数学期望.【答案】(1)15;220.5(2)分布列见解析;期望为0.6【解析】(1)树高在225-235cm 之间的棵数为:()10010.00530.0150.02000250.011015⎡⎤⨯-⨯++++⨯=⎣⎦..树高的平均值为:0.051900.152000.22100.252200.152300.12400.052500.05260220.5⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=(2)由(1)可知,树高为优秀的概率为:0.10.050.050.2++=, 由题意可知()~3,0.2B ξ,则ξ的所有可能取值为0,1,2,3,()0330C 0.80.512P ξ===, ()1231C 0.80.20.384P ξ==⨯=, ()2232C 0.80.20.096P ξ==⨯=,()3333C 0.20.008P ξ===,故ξ的分布列为:因为()~3,0.2B ξ,所以()30.20.6E ξ=⨯=3.(2022·新疆克拉玛依·三模(理))第24届北京冬季奥林匹克运动会于2022年2月4日至2月20日在北京和张家口联合举办.这是中国历史上第一次举办冬季奥运会,它掀起了中国人民参与冬季运动的大热潮.某市举办了中学生滑雪比赛,从中抽取40名学生的测试分数绘制成茎叶图和频率分布直方图如下,后来茎叶图受到了污损,可见部分信息如图.(1)求频率分布直方图中的a 值,并根据直方图估计该市全体中学生的测试分数的中位数和平均数(同一组中的数据以这组数据所在区间中点的值作代表,结果保留一位小数);(2)将频率作为概率,若从该市全体中学生中抽取4人,记这4人中测试分数不低于90分的人数为X ,求X 的分布列及数学期望.【答案】(1)0.02a =,中位数为74.3,平均数为74.5;(2)分布列见解析,25.【解析】(1)由频率分布直方图和茎叶图知,测试分数在[50,60),[60,70),[70,80),[90,100]的频率依次为:0.1,0.25,0.35,0.1,因此,测试分数位于[)80,90的频率为10.10.250.350.10.2----=,则0.20.0210a ==, 显然测试分数的中位数t 在区间[70,80)内,则有:()700.0350.50.10.25t -⨯=--,解得:74.3t ≈, 测试分数的平均数为:550.1650.25750.35850.2950.174.5⨯+⨯+⨯+⨯+⨯=. (2)测试分数不低于90分的频率为110,X 的所有可能值是:0,1,2,3,4, 显然1(4,)10XB ,()4419C ()(),N,41010k k k P X k k k -==∈≤, 所以X 的分布列为:数学期望()124105E X =⨯=. 4.(2022·全国·模拟预测)为了中国经济的持续发展制定了从2021年2025年发展纲要,简称“十四五”规划,为了普及“十四五”的知识,某党政机关举行“十四五”的知识问答考试,从参加考试的机关人员中,随机抽取100名人员的考试成绩的部分频率分布直方图,其中考试成绩在[)70,80上的人数没有统计出来.(1)估算这次考试成绩的平均分数;(2)把上述的频率看作概率,把考试成绩的分数在[]80,100的学员选为“十四五”优秀宣传员,若从党政机关所有工作人员中,任选3名工作人员,其中可以作为优秀宣传员的人数为ξ,求ξ的分布列与数学期望.【答案】(1)70.5(2)分布列见解析,数学期望为0.9【解析】(1)设分数在[)70,80内的频率为x ,根据频率分布直方图得,()0.010.0150.020.0250.005101x ++++⨯+=,解得0.25x =,可知分数在[)70,80内的频率为0.25,则考试成绩的平均分数为450.10550.15650.2750.25850.25950.0570.5⨯+⨯+⨯+⨯+⨯+⨯=.(2)根据频率分布直方图可知考试成绩在[]80,100的频率为()0.0250.005100.3+⨯=,则0,1,2,3ξ=.()003334300.30.71000P C ξ==⨯=,()12344110.30.71000P C ξ==⨯=()22318920.30.71000P C ξ==⨯=,()3332730.31000P C ξ===,故随机变量ξ的分布列为因为该分布为二项分布,所以该随机变量的数学期望为()30.30.9E ξ=⨯=.5.(2022·江苏苏州·模拟预测)如图,在数轴上,一个质点在外力的作用下,从原点O 出发,每次等可能地向左或向右移动一个单位,质点到达位置的数字记为X .(1)若该质点共移动2次,位于原点O 的概率;(2)若该质点共移动6次,求该质点到达数字X 的分布列和数学期望. 【答案】(1)12;(2)分布列见解析,0.【解析】(1)质点移动2次,可能结果共有224⨯=种,若质点位于原点O ,则质点需要向左、右各移动一次,共有12C 2=种,故质点位于原点O 的概率2142P ==. (2)质点每次移动向左或向右,设事件A 为“向右”,则A 为“向左”,故1()()2P A P A ==, 设Y 表示6次移动中向左移动的次数,则1(6,)2Y B ,质点到达的数字62X Y =-,所以06611(6)(0)C ()264P X P Y =====,16613(4)(1)C ()232P X P Y =====,266115(2)(2)C ()264P X P Y =====, 36615(0)(3)C ()216P X P Y =====,466115(2)(4)C ()264P X P Y =-====, 56613(4)(5)C ()232P X P Y =-====,66611(6)(6)C ()264P X P Y =-====, 所以X 的分布列为:1()(62)2()626602E X E Y E Y =-=-+=-⨯⨯+=.6.(2022·北京通州·模拟预测)第24届冬季奥林匹克运动会,于2022年2月在北京市和张家口市联合举行.某校寒假期间组织部分滑雪爱好者参加冬令营集训.训练期间,冬令营的同学们都参加了“单板滑雪”这个项目相同次数的训练测试,成绩分别为A 、B 、C 、D 、E 五个等级,分别对应的分数为5、4、3、2、1.甲、乙两位同学在这个项目的测试成绩统计结果如图所示.(1)根据上图判断,甲、乙两位同学哪位同学的单板滑雪成绩更稳定?(结论不需要证明) (2)求甲单板滑雪项目各次测试分数的众数和平均数;(3)若甲、乙再同时参加两次测试,设甲的成绩为4分并且乙的成绩为3分或4分的次数为X ,求X 的分布列(频率当作概率使用).【答案】(1)乙比甲的单板滑雪成绩更稳定 (2)众数为3分,平均数为2.9分 (3)分布列答案见解析【解析】(1)解:由图可知,乙比甲的单板滑雪成绩更稳定.(2)解:因为甲单板滑雪项目测试中4分和5分成绩的频率之和为0.325, 3分成绩的频率为0.375,所以,甲单板滑雪项目各次测试分数的众数为3分,测试成绩2分的频率为10.20.3750.250.0750.1----=,所以,甲单板滑雪项目各次测试分数的平均数为10.220.130.37540.2550.075 2.9⨯+⨯+⨯+⨯+⨯=. (3)解:由题意可知,在每次测试中,甲的成绩为4分,并且乙的成绩为3分或4分的概率为30.250.375216⨯⨯=, 依题意,3~2,16X B ⎛⎫ ⎪⎝⎭,所以,()2131********P X ⎛⎫=== ⎪⎝⎭,()12313391C 1616128P X ==⋅⋅=,()239216256P X ⎛⎫=== ⎪⎝⎭, 所以,随机变量X 的分布列如下表所示:X0 1 2 P1692563912892561.(2022·全国·高三专题练习(理))冰壶是2022年2月4日至2月20日在中国举行的第24届冬季奥运会的比赛项目之一.冰壶比赛的场地如图所示,其中左端(投掷线MN 的左侧)有一个发球区,运动员在发球区边沿的投掷线MN 将冰壶掷出,使冰壶沿冰道滑行,冰道的右端有一圆形的营垒,以场上冰壶最终静止时距离营垒区圆心O 的远近决定胜负,甲、乙两人进行投掷冰壶比赛,规定冰壶的重心落在圆O 中,得3分,冰壶的重心落在圆环A 中,得2分,冰壶的重心落在圆环B 中,得1分,其余情况均得0分.已知甲、乙投掷冰壶的结果互不影响,甲、乙得3分的概率分别为13,14;甲、乙得2分的概率分别为25,12;甲、乙得1分的概率分别为15,16.(1)求甲所得分数大于乙所得分数的概率;(2)设甲、乙两人所得的分数之差的绝对值为X ,求X 的分布列和期望.题组三 独立重复实验【答案】(1)1130(2)分布列见解析,期望为:169180【解析】(1)由题意知甲得0分的概率为1211135515---=,乙得0分的概率为1111142612---=,甲所得分数大于乙所得分数分为:甲得3分乙得2或1或0分,甲得2分乙得1或0分,甲得1分乙得0分所以所求概率为1121111(1)()3456125123011⨯-+⨯++⨯=.(2)X 可能取值为0,1,2,3,()11211111290345256151290P X ==⨯+⨯+⨯+⨯=()112111111111++35565251283246121805P X ==⨯+⨯+⨯+⨯⨯⨯=()11111121231215180P X ==⨯+⨯+⨯+⨯=()11211121545334P X ==⨯+⨯=所以,随机变量X 的分布列为:所以()298331216918001239018018405E X =⨯+⨯+⨯+⨯= 2.(2022·全国·高三专题练习(理))为弘扬奥运精神,某校开展了“冬奥”相关知识趣味竞赛活动.现有甲、乙两名同学进行比赛,共有两道题目,一次回答一道题目.规则如下:∴抛一次质地均匀的硬币,若正面向上,则由甲回答一个问题,若反面向上,则由乙回答一个问题.∴回答正确者得10分,另一人得0分;回答错误者得0分,另一人得5分.∴若两道题目全部回答完,则比赛结束,计算两人的最终得分.已知甲答对每道题目的概率为45,乙答对每道题目的概率为35,且两人每道题目是否回答正确相互独立.(1)求乙同学最终得10分的概率;(2)记X 为甲同学的最终得分,求X 的分布列和数学期望. 【答案】(1)37100(2)分布列见解析,X 的数学期望为10【解析】(1)记“乙同学最终得10分”为事件A ,则可能情况为甲回答两题且错两题;甲、乙各答一题且各对一题;乙回答两题且对一题错一题, 则()1111141313123722252525252525100P A =⨯⨯⨯+⨯⨯⨯⨯+⨯⨯⨯⨯=,所以乙同学得10分的概率是37100. (2)甲同学的最终得分X 的所有可能取值是0,5,10,15,20. ()1111111313131640225252525252510025P X ==⨯⨯⨯+⨯⨯⨯⨯+⨯⨯⨯==,()111213121645222525252510025P X ==⨯⨯⨯⨯+⨯⨯⨯⨯==,()141114*********102225252525252510025P X ==⨯⨯⨯⨯+⨯⨯⨯⨯+⨯⨯⨯==,()1412164152252510025P X ==⨯⨯⨯⨯==,()141416420252510025P X ==⨯⨯⨯==.X 的分布列为()4191105101520102525252525E X =⨯+⨯+⨯+⨯+⨯=,所以X 的数学期望为10. 3.(2022·青海·海东市第一中学模拟预测(理))“民族要复兴,乡村必振兴”,为了加强乡村振兴宣传工作,让更多的人关注乡村发展,某校举办了有关城乡融合发展、人与自然和谐共生的知识竞赛.比赛分为初赛和复赛两部分,初赛采用选手从备选题中选一题答一题的方式进行,每位选手最多有5次答题机会,选手累计答对3题或答错3题即终止比赛,答对3题者直接进入复赛,答错3题者则被淘汰.已知选手甲答对每个题的概率均为35,且相互间没有影响.(1)求选手甲被淘汰的概率;(2)设选手甲在初赛中答题的个数为X ,试求X 的分布列和数学期望. 【答案】(1)9923125(2)分布列见解析,2541625【解析】(1)设“选手甲被淘汰”为事件A ,因为甲答对每个题的概率均为35,所以甲答错每个题的概率均为25.则甲答了3题都错,被淘汰的概率为33328C 5125⎛⎫= ⎪⎝⎭;甲答了4个题,前3个1对2错,被淘汰的概率为22323272C 555625⎛⎫⨯⨯= ⎪⎝⎭;甲答了5个题,前4个2对2错,被淘汰的概率为2224322432C 5553125⎛⎫⎛⎫⋅⨯= ⎪⎪⎝⎭⎝⎭. 所以选手甲被海的概率()87243299212562531253125P A =++=. (2)易知X 的可能取值为3,4,5,对应甲被淘汰或进入复赛的答题个数,则()3333333273C C 5525P X ⎛⎫⎛⎫==+= ⎪ ⎪⎝⎭⎝⎭,()2222333232322344C C 555555625P X ⎛⎫⎛⎫==⨯⨯+⨯⨯=⎪ ⎪⎝⎭⎝⎭, ()2224322165C 55625P X ⎛⎫⎛⎫==⨯=⎪ ⎪⎝⎭⎝⎭. X 的分布列为则()7234216256225413456255625E X =⨯+⨯+⨯=. 4.(2022·湖南·长沙一中模拟预测)某靶场有A ,B 两种型号的步枪可供选用,其中甲使用A B ,两种型号的步枪的命中率分别为14,13;,(1)若出现连续两次子弹脱靶或者子弹打光耗尽的现象便立刻停止射击,若击中标靶至少3次,则可以获得一份精美礼品,若甲使用B 型号的步枪,并装填5发子弹,求甲获得精美礼品的概率;(2)现在A B ,两把步枪中各装填3发子弹,甲打算轮流使用A B ,两种步枪进行射击,若击中标靶,则继续使用该步枪,若未击中标靶,则改用另一把步枪,甲首先使用A 种型号的步枪,若出现连续两次子弹脱靶或者其中某一把步枪的子弹打光耗尽的现象便立刻停止射击,记X 为射击的次数,求X 的分布列与数学期望. 【答案】(1)1381(2)分布列见解析;X 的数学期望为3512.【解析】(1)甲击中5次的概率为513⎛⎫ ⎪⎝⎭1243=,甲击中4次的概率为14511C (1)()33-⋅10243=,甲击中3次的概率为()322511C 3133⎛⎫⎛⎫-⋅- ⎪⎪⎝⎭⎝⎭28243=, 所以甲获得精美礼品的概率为11028391324324324324381++==. (2)X 的所有可能取值为2,3,4,5,(2)P X =11(1)(1)43=--321432=⨯=,(3)P X ==111113(1)(1)14434416⨯--+⨯⨯=,(4)P X ==1111111(1)1(1)(1)(1)4334334-⨯⨯⨯+-⨯⨯-⨯-524=,11111111(5)(1)(1)1(1)(1)144334334P X ==⨯-⨯⨯-⨯+-⨯⨯-⨯⨯1111(1)14433+⨯-⨯⨯⨯548=,所以X 的分布列为:所以1355()23452162448E X =⨯+⨯+⨯+⨯3512=. 5.(2022·全国·二模(理))“百年征程波澜壮阔,百年初心历久弥坚”.为庆祝中国建党一百周年,哈市某高中举办了“学党史、知党情、跟党走”的党史知识竞赛.比赛分为初赛和决赛两个环节,通过初赛选出两名同学进行最终决赛.若该高中A ,B 两名学生通过激烈的竞争,取得了初赛的前两名,现进行决赛.规则如下:设置5轮抢答,每轮抢到答题权并答对则该学生得1分,答错则对方得1分.当分差达到2分或答满5轮时,比赛结束,得分高者获胜.已知A ,B 每轮均抢答且抢到答题权的概率分别为23,13,A ,B 每一轮答对的概率都为12,且两人每轮是否回答正确均相互独立. (1)求经过2轮抢答A 赢得比赛的概率;:(2)设经过抢答了X 轮后决赛结束,求随机变量X 的分布列和数学期望.【答案】(1)14(2)分布列见解析;期望为134【解析】(1)记事件C 为“经过2轮抢答A 赢得比赛” A 学生每轮得一分的概率()2111132322P A =⨯+⨯=,B 学生每轮得一分的概率()1121132322P B =⨯+⨯=,()21124P C ⎛⎫== ⎪⎝⎭,所以经过2轮抢答A 赢得比赛的概率为14.(2)X 的可能取值为2,4,5.2轮比赛甲赢或乙赢的概率为()2221122C 22P X ⎛⎫=== ⎪⎝⎭,4轮比赛甲赢或乙赢的概率为()121111142C 22224P X ==⨯⨯⨯=, 5轮比赛甲赢或乙赢的概率为()11151424P X ==--=.X 的分布列为:()111132452444E X =⨯+⨯+⨯=,数学期望为134.6.(2022·湖南·长沙市明德中学二模)沙滩排球是一项每队由两人组成的两队在由球网分开的沙地上进行比赛的运动.它有多种不同的比赛形式以适应不同人、不同环境下的比赛需求.国家沙滩排球队为备战每年一次的世界沙滩排球巡回赛,在文昌高隆沙湾国家沙滩排球训练基地进行封闭式训练.在某次训练中,甲、乙两队进行对抗赛,每局依次轮流发球(每队不能连续发球),连续赢得2个球的队获胜并结束该局比赛,并且每局不得超过5个球.通过对甲、乙两队过去对抗赛记录的数据分析,甲队发球甲队赢的概率为23,乙队发球甲队赢的概率为12,每一个球的输赢结果互不影响,已知某局甲先发球. (1)求该局第二个球结束比赛的概率;(2)若每赢1个球记2分,每输一个球记0分,记该局甲队累计得分为ξ,求ξ的分布列及数学期望. 【答案】(1)12(2)分布列见解析,18754【解析】(1)记:“甲队发球甲队赢”为事件A ,“乙队发球甲队赢”为事件B ,“第二个球结束比赛”为事件C ,则()23P A =,()12P B =,()()1132P A P B ==,,C AB AB =,因为事件AB 与AB 互斥,所以()()()()P C P ABAB P AB P AB ==+()()()()P A P B P A P B =+2111132322=⨯+⨯=,所以该局第二个球结束比赛的概率为12.(2)依题意知随机变量ξ的所有可能取值为0246,,, ()()()()1110326P P AB P A P B ξ====⨯=;()()()()2P P ABA ABAB P ABA P ABAB ξ===+21111115323323236=⨯⨯+⨯⨯⨯=; ()()4P P AB ABAABABAABABA ξ==()()()()P AB P ABA P ABABA P ABABA=+++21112111112121153++=323233232332323108=⨯+⨯⨯⨯⨯⨯⨯⨯⨯⨯⨯; ()()()()()6P P ABAB ABABA ABABA P ABAB P ABABA P ABABAξ===++21212121211112113232323233232354=⨯⨯⨯+⨯⨯⨯⨯+⨯⨯⨯⨯=. 所以ξ的分布列为ξ0 2 46 P16536531081154故数学期望()15531118702466361085454E ξ=⨯+⨯+⨯+⨯=. 1.(2022·江苏省木渎高级中学模拟预测)2012年国家开始实施法定节假日高速公路免费通行政策,某收费站统计了2021年中秋节前后车辆通行数量,发现该站近几天车辆通行数量2100(,)0N ξσ~,若()(1200,80)01200P a P b ξξ>=<<=,则当82ab b a ≥+时下列说法正确的是( )A .12a =B .14b =C .34a b +=D .12a b -=【答案】C【解析】因2100(,)0N ξσ~,且()(1200,80)01200P a P b ξξ>=<<=,则有122b a +=,即21a b =-,不等式82ab b a ≥+为:24(1)1(21)0b b b -≥⇔-≤,则12b =,14a =, 所以34a b +=,14a b -=-,A ,B ,D 均不正确,C 正确.故选:C2.(2022·江苏·高三专题练习)随机变量()2,XN μσ,已知其概率分布密度函数22()21()e2x f x μσσπ-=在2x =处取得最大值为12π,则(0)P X >=( )附:()0.6827,(22)0.9545P X P X μσμσμσμσ-≤≤+=-≤≤+=. A .0.6827 B .0.84135C .0.97725D .0.9545【答案】B【解析】由题意2μ=,1122σππ=,2σ=,所以2(2)41()e2x f x π-=, (022)0.6827P X ≤≤=,所以1(0)(10.6827)0.158652P X <=-=, (0)10.158650.84135P X ≥=-=.故选:B .3.(2022·河南安阳·模拟预测(理))某房产销售公司有800名销售人员,为了了解销售人员上一个季度的房屋销量,公司随机选取了部分销售人员对其房屋销量进行了统计,得到上一季度销售人员的房屋销量题组四 正态分布(20,4)X N ,则全公司上一季度至少完成22套房屋销售的人员大概有( )附:若随机变量X 服从正态分布()2,N μσ,则()0.6827P X μσμσ-<≤+≈,(22)0.9545P X μσμσ-<≤+≈,(33)0.9973P X μσμσ-<≤+≈.A .254人B .127人C .18人D .36人【答案】B 【解析】因为(20,4)X N ,所以20μ=,2σ=,所以()1()10.6827220.1586522P X P X μσμσ--<≤+-≥===所以全公司上一季度至少完成22套房屋销售的人员大概有8000.15865127⨯≈(人);故选:B4.(2022·广东·大埔县虎山中学高三阶段练习)(多选)已知某校高三年级有1000人参加一次数学模拟考试,现把这次考试的分数转换为标准分,标准分的分数转换区间为(]60,300,若使标准分X 服从正态分布N()180,900,()0.6826P X μσμσ-<≤+=,(22)0.9545P X μσμσ-<≤+=,3309().973P X μσμσ-<≤+=,则( )A .这次考试标准分超过180分的约有450人B .这次考试标准分在(]90,270内的人数约为997C .甲、乙、丙三人恰有2人的标准分超过180分的概率为38D .()2402700.0428P X <≤= 【答案】BC【解析】依题意得180μ=,2900σ=,30σ=,因为()()11802P X P X μ>=>=, 所以这次考试标准分超过180分的约有110005002⨯=人,故A 不正确;()()90270180330180330P X P X <≤=-⨯<≤+⨯(33)P X μσμσ=-<≤+=0.9973,所以这次考试标准分在(]90,270内的人数约为10000.9973997⨯≈人,故B 正确; 依题意可知,每个人的标准分超过180分的概率为12,所以甲、乙、丙三人恰有2人的标准分超过180分的概率为223113C 1228⎛⎫⎛⎫⋅⋅-= ⎪⎪⎝⎭⎝⎭,故C 正确; ()240270P X <≤()180230180330P X =+⨯<≤+⨯()23P X μσμσ=+<≤+。

频率分布表

频率分布表
• 这样得出一系列的矩形,每个矩形的面积恰好是 该组上的频率,这些矩形就构成了频率分布直方 图。
例2、为了了解一大片经济林的生长情况,随机测量其中的100株的 底部周长,得到如下数据表(长度单位:cm):
135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112 109 124 87 131 97 102 123 104 104 128 105 123 111 103 105 92 114 108 104 102 129 126 97 100 115 111 106 117 104 109 111 89 110 121 80 120 121 104 108 118 129 99 90 99 121 123 107 111 91 100 99 101 116 97 102 108 101 95 107 101 102 108 117 99 118 106 119 97 126 108 123 119 98 121 101 113 102 103 104 108
合计
பைடு நூலகம்
100 1
频率分布表的制作
1、计算数据中最大值与最小值的差,
即全距。据此,决定组数和组距。
组距

全距 组数
2、分组:通常对组内数据所在区间取 左闭右开区间,最后一组取闭区间。
3、登记频数,计算频率,列出频率分 布表
练习1
1. 某电子元件厂生产一批同型号的电子元件,今 从中随机地抽取40个测得其电阻值如下:
168 165 171 167 170 165 170 152 175 174 165 170 168 169 171 166 164 155 164 158 170 155 166 158 155 160 160 164 156 162 160 170 168 164 174 171 165 179 163 172 180 174 173 159 163 172 167 160 164 169 151 168 158 168 176 155 165 165 169 162 177 158 175 165 169 151 163 166 163 167 178 165 158 170 169 159 155 163 153 155 167 163 164 158 168 167 161 162 167 168 161 165 174 156 167 166 162 161 164 166

频率分布表

频率分布表

B、1/14
C、0.03
D、3/14
3、将一个容量为50的样本数据分组后,组距和频数如下:
[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9; [21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),6; [30.5,33.5],3.
则估计小于30的数据大约占总体的( A)
161
165
174
156
167
166
162
161
164
166
168
165
171
167
170
165
170
152
175
174
165
170 160 180 151 177 178 167 161
170
155 170 174 168 158 165 163 165
168
166 168 173 158 175 158 164 174
练习1
1. 某电子元件厂生产一批同型号的电子元件,今 从中随机地抽取40个测得其电阻值如下:
101 101 107 92 99 97 102 98 99 113 93 106 103 101 90 87 95 99 98 103 102 96 94 100 94 97 110 103 99 103 108 102 102 100 94 105 98 97 107 101
问题情境
为了了解7月25日至8月24日北京地区的气温分布状况, 我们对以往年份此段时间的日最高气温进行抽样,得到如 下样本(单位:C )
7月25 日至8 月10 日
41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.3 32.5 34.6 33.0 30.8 31.0 28.6 31.5 28.8 28.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.1 32.8 29.4 25.6 24.7 30.0 30.1 29.5 30.3

茎叶图

茎叶图

知识探究(二)
自主学习课本
茎叶图
70 页内容,交流回答 骤; 重复的数据如何处理?
1. 归纳出制作茎叶图的步 2 . 在制作茎叶图时,出现 3 . 什么是中位数? 4 . 用茎叶图处理数据有何
优缺点?
探究展示
1. 归纳出制作茎叶图的步 骤;
第一步,将每个数据分为“茎”(高位)和 “叶”(低位)两部分; 第二步,将最小的茎和最大的茎之间的数 按小大次序排成一列; 第三步,将各个数据的叶按大小次序写在茎 右(左)侧. 第一步中,如果是两位数字,则茎为十位上的数字, 叶为个位上的数字,如89,茎:8,叶:9; 如果是三位数则茎为百位上的数字,叶为十位上的和 个位上的数字,如123,茎:1,叶:23.
频率
组距
总体密度曲线
月均用 水量/t
总体密度曲线反映了总体在各个范围内取 值的百分比,精确地反映了总体的分布规律。
是研究总体分布的工具.
3. 说出图 2 . 2 - 3中阴影部分表示的意义
频率 组距
月均用 水量/t
a
b
表示总体在某个区间 (a, b) 内取值的百分比)。 总体密度曲线的实际意义在于: 总体密度曲线与x轴,直线x=a,x=b围成的面积 等于x在[a,b]取值时的概率.
知识探究(一)频率分布折线图 总体密度曲线
自主学习课本 69 页内容,交流回答 图? 密度曲线有何联系?
1. 如何做出频率分布折线 2. 频率分布折线图与总体
3. 说出图 2 . 2 - 3中阴影部分表示的意义 4 . 对于一个总体,如果存 这条曲线是否唯一?能 确地画出总体密度曲线 在总体密度曲线, 否通过样本数据准 ?
4.已知样本:12,7,11,12,11,12,10,10, 9,8,13,12,10,9,6,11,8,9,8,10, 那么频率为0.25的样本的范围是( D ) A. [5.5,7.5) B. [7.5,9.5) C. [9.5,11.5) D. [11.5,13.5) 5.频率分布直方图中,小长方体的面积等于( A.相应各组的频数 B.相应各组的频率 C.组数 D.组距

第八章第一讲频率分布直方图

第八章第一讲频率分布直方图

第一讲 频率分布直方图一:考纲解读、有的放矢统计部分要求不太高,主要是考抽样方法与频率分布直方图和茎叶图有关的问题,最多一个小题(选择或填空)属容易题,但应充分注意以统计为载体、问题实质涉及期望与方差计算的综合解答题.二:核心梳理、茅塞顿开3. 作频率分布直方图的方法为:(1)把横轴分成若干段,每一线段对应一个组的组距;(2)以此线段为底作矩形,它的高等于该组的组距频率,这样得出一系列的矩形;(3)每个矩形的面积恰好是该组上的频率.4. 频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图.5. 作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.三:例题诠释,举一反三知识点1:利用频率分布直方图分析总体分布例题1:(2011中山期末A )2000辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,时速在[50,60)的汽车大约有 ( ) A .30辆 B .60辆 C .300辆D .600辆变式:(2009山东卷理B)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的 产品净重(单位:克)数据绘制的频率分布直方图,其中产品 净重的范围是[96,106],样本数据分组为[96,98),[98,100), [100,102),[102,104),[104,106],已知样本中产品净重小于 100克的个数是36,则样本中净重大于或等于98克并且 小于104克的产品的个数是 ( ). A.90 B.75 C. 60 D.45变式:(2011杭州质检B )某初一年级有500名同学,将他们的身高(单位:cm )数据绘制成频率分布直方图(如图),若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在[)130,140内的学生中选取的人数为 .知识点2:用样本分估计总体例题2(2010安徽卷B )某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91, 77,86,81,83,82,82,64,79,86,85,75,71,49,45, (Ⅰ) 完成频率分布表;(Ⅱ)作出频率分布直方图;(Ⅲ)根据国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染。

用样本估计总体

用样本估计总体
频率/组距 0.0005 0.0004 0.0003 0.0002 0.0001
月收入(元)
1000 1500 2000 2500 3000 3500 4000
练习1、如图是150辆汽车通过某路段 时速度的频率分布直方图,则速度在[60, 60 辆. 70)的汽车大约有______
在频率分布直方图中,依次连接各小长 方形上端的中点,就得到一条折线,这条 折线称为频率分布折线图.
练习3、以往招生Biblioteka 计显示,某所大学录 取的新生高考总分的中位数基本稳定在550 分,若某同学今年高考得了520分,他想报 考这所大学还需收集哪些信息?
要点: (1)查往年录取的新生的平均分数.若平均数 小于中位数很多,说明最低录取线较低,可以 报考; (2)查往年录取的新生高考总分的标准差.若 标准差较大,说明新生的录取分数较分散,最 低录取线可能较低,可以考虑报考.
标准差的取值范围是什么?标准差为0 的样本数据有何特点? s≥0,标准差为0的样本数据都相等. 方差的意义: 方差(或标准差)越大离散程度越大,数 据较分散; 方差(或标准差)越小离散程度越小,数 据较集中在平均数周围.
例 2 、有两个班级,每班各自按学号随 机选出 5 名学生,测验铅球成绩,以考察 体育达标程度,测验成绩如下:单位(米) 甲 9.1 7.8 8.5 6.9 5.2 乙 8.8 7.2 7.3 7.5 6.7 两个班相比较,哪个班整体实力强一些 ?
制作频率分布直方图的方法: (1)求极差(即一组数据中最大值与最小 值的差); (2)决定组距与组数;(样本容量不超过
100时,组数常分成5~12组)
(3)将数据分组; (4)列频率分布表; (5)画频率分布直方图.
注:频率分布直方图中

必修2数学第九章统计知识点

必修2数学第九章统计知识点

必修2数学第九章统计知识点一、随机抽样。

1. 简单随机抽样。

- 定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤ N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。

- 常用方法:抽签法和随机数法。

- 抽签法:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。

- 随机数法:利用随机数表、随机数生成器或统计软件来产生随机数,根据随机数抽取样本。

2. 系统抽样。

- 定义:将总体分成均衡的若干部分,然后按照预先规定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样。

- 步骤:- 先将总体的N个个体编号。

- 确定分段间隔k,对编号进行分段,当(N)/(n)(n是样本容量)是整数时,取k = (N)/(n);当(N)/(n)不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数N'能被n整除,这时k=(N')/(n)。

- 在第1段用简单随机抽样确定第一个个体编号l(l≤ k)。

- 按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l + k),再加k得到第3个个体编号(l+2k),依次类推,直到获取整个样本。

3. 分层抽样。

- 定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样。

- 步骤:- 根据已有的信息,将总体分成互不相交的层。

- 计算各层中个体的个数与总体个数的比。

- 按各层个体数占总体数的比确定各层应抽取的样本容量。

- 在每一层中进行简单随机抽样或系统抽样,获取相应的样本个体,合在一起得到分层抽样的样本。

- 特点:使样本具有较强的代表性,而且在各层抽样时,可灵活选用不同的抽样方法。

二、用样本估计总体。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

极差 4.1 组数= 8.2 组距 0.5
所以将数据分成9组较合适. 第三步: 将数据分组:( 给出组的界限) [0, 0.5), [0.5, 1), [1, 1.5),……[4, 4.5) 共9组.
第四步: 列频率分布表.
(包括分组、频数、频率、频率/组距)
组距=0.5
分组 [0-0.5) [0.5-1) [1-1.5) [1.5-2) [2-2.5) [2.5-3) [3-3.5) [3.5-4) [4-4.5) 合计
(2)解:如图:茎为成绩的整环数,叶为小数点后的数字


8
5 7
2 4 4
7
8
1 5 1 1 7 1 1 2 7 8
9
10
8
7
5
1
(2)乙成绩大致对称,甲成绩的中位数为9.05, 乙成绩的中位数为9.15,所以乙成绩较甲好,乙成绩较集中 于峰值,甲成绩分散所以乙发挥的稳定性好,甲波动大。
小结:
1.不易知一个总体的分布情况时,往往从总体中 抽取一个样本,用样本的频率分布去估计总体的 频率分布,样本容量越大,估计就越精确. 2. 目前有:频率分布表、直方图、茎叶图. 3.当总体中的个体取值很少时,用茎叶图估计总 体的分布;当总体中的个体取值较多时,将样本 数据恰当分组,用各组的频率分布描述总体的分 布,方法是用频率分布表或频率分布直方图。
当样本容量无限增大,分组的组距无限缩小,那么 频率分布折线图就会无限接近一条光滑曲线——总体密 度曲线. 总体密度曲线
频率 组距
月均用 水量/t
a
b
(图中阴影部分的面积,表示总体在 某个区间 (a, b) 内取值的百分比)。
思考
1.对于任何一个总体,它的密度曲线是不是一定存在?它 的密度曲线是否可以被非常准确地画出来? 2.图中阴影部分的面积表示什么?
1.实际上,尽管有些总体密度曲线是客观存在 的,但一般很难想函数图象那样准确地画出来, 我们只能用样本的频率分布对它进行估计,一 般来说,样本容量越大,这种估计就越精确
二、茎叶图
当数据是两位有效数字时,用中间的数字表示十位数,即第一 个有效数字,两边的数字表示个位数,即第二个有效数字,它 的中间部分像植物的茎,两边部分像植物茎上长出来的叶子, 因此通常把这样的图叫做茎叶图
频率分布直方图如下:
频率 组距
连接频率分布直方图 中各小长方形上端的 中点,得到频率分布折 线图
0.50 0.40 0.30 0.20 0.10 0.5 月均用水量 /t 4.5
1 1.5 2 2.5 3
3.5 4
思考:上例的样本容量为100,如果增至1000,其频率分布直方
图的情况会有什么变化(组距和组数)?假如增至10000呢?
茎 叶 0 8 1 345 2 36 8 3 389 4 5 1
阅读70页最后一段,说出茎叶图的 优缺点?
茎叶图的特征:
两个优点: 一是:没有原始数据信息的损失; 二是:茎叶图中的数据可以随时记录,随时添 加,方便记录与表示。 三个局限: 一是:只便于表示两位有效数字的数据; 二是:茎叶图只方便记录两组的数据; 三是:数据量不能太大
思考:从频率分布直方图中,你能得到任意 区间(a,b)的频率?有什么困难?
一、频率分布折线图与概率密度曲线
频率/组距 (取组距中点, 并连线 )
0.6
0.5
0.4
0.44
0.5
0.3
0.2
0.16
0.3
0.3
0.1 0.08 0
0.1
0.08
0.04
0.5
1 1.5
2
2.5
3
3.5 4
4.5
月均用水量/t
频数 4 8 15 22 25 15 5 4 2 100
频率
0.04
0.08 0.15 0.22 0.25 0.15 0.05 0.04 0.02 1
频率/组距 0.08
0.16
0.3 0.44 0.5 0.3
0.1 0.08 0.04 2.00
第 五 步: 画 出 频 率 分 布 直 方 图.
频率/组距 (组距=0.5)
甲的中位数为26,乙的中位数为36,所以乙较甲成绩要好, 另,乙的叶较甲的更集中,所以乙较甲发挥更稳定。
画茎叶图要注意什么:
1.将每个数据分为茎(高位)和叶(低位) 两部分,在此例中,茎为十位上的数字, 叶为个位上的数字; 2.将最小茎和最大茎之间的数按大小 次序排成一列,写在左(右)侧; 3.将各个数据的叶按大小次序 写在其茎右(左)侧.
总体密度曲线:
在样本频率分布直方图中,当样本容量增加,作图时所 分的组数增加,组距减少,相应的频率折线图会越来越 接近于一条光滑曲线,统计中称这条光滑曲线为总体密 度曲线. 它能够精确地反映了总体在各个范围内取值的 百分比,它能给我们提供更加精细的信息. 频率
组距
0
a
b
月均用水量/t
总体密度曲线
(1)极差为67-28=39,取组距为5,分为8组.
样本频率分布表: 分 组 [27,32) [32,37) [37,42) [42,47) [47,52) [52,57) [57,62) [62,67] 合 计 频数 3 3 9 16 7 5 4 3 50 频率 0.06 0.06 0.18 0.32 0.14 0.10 0.08 0.06 1.00
合作探究 :茎叶图
(一种被用来表示数据的图)
例: 甲乙两人比赛得分记录如下: 甲:13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 39 乙:49, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25, 36, 39 用茎叶图表示两人成绩,说明哪一个成绩好.
(2)样本频率分布直方图:
频率 组距
0.06 0.05 0.04 0.03 0.02 0.01
O 27 32 37 42 47 52 57 62 67 年龄
(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在32~52岁的知识分子约占70%.
理论迁移
2
频率 组距
某校共有5000名学生,该校 0.036 学生每月课外读物方面的支 出总体上在20—60元之间其 0.024 频率分布直方图如右图所示 0.01 ,为具体了解同学们购买课 外读物的具体情况,按支出 的情况进行分层抽样,抽出 一个容量为100的样本进行分 析,其中支出在 [50,60 ) 元的同学应抽取 30 人。
频数 2 11 13 4 茎 10 11 12 13 叶 7, 8 2, 7, 6, 3, 6, 8, 6, 7, 2, 2,0 6, 8, 4, 2, 7, 8, 6, 1, 0, 4, 3, 2, 0 4, 2, 3, 0
练习2:
某次运动会甲乙两名射击运动员的成绩(环数) 如下: 甲:9.4,8.7,7.5,8.4,10.1,10.5,10.7, 7.2,7.8,10.8 乙:9.1,8.7,7.1,9.8,9.7,8.5,10.1,9.2, 10.1,9.1 (1)用茎叶图表示甲乙的成绩 (2)根据茎叶图分析甲乙的成绩
0.6
0.5 0.5请大家阅读第 0.44 67页,直方图有 0.4 哪些优点和缺 0.3 0.3 0.3 点?
小长方形的面 月均用水量最 多的在哪个区 积总和 积=?=? 间?
0.2
0.16
0.1 0.08 0
0.1
0.08
0.04
0.5
1 1.5
2
2.5
3
3.5 4
4.5
月均用水量/t
频率分布直方图的特征: 从频率分布直方图可以清楚的看出数据分布 的总体趋势。 从频率分布直方图得不出原始的数据内容, 把数据表示成直方图后,原有的具体数据信 息就被抹掉了。
练习1:
下表一组数据是某车间30名工人加工零件的个数, 设计一个 茎叶图表示这组数据,并说明这一车间的生产情况.
134 112 117 126 128 124 122 116 113 107 116 132 127 128 126 121 120 118 108 110 133 130 124 116 117 123 122 120 112 112
用样本的频率分布估计总体分布
衡阳县六中高一年级 刘碧华
用样本的频率分布估计总体分布 一 频率分布图和频率分布直方图
二 频率分布折线图 和总体密度曲线

莖叶图
理论迁移
1
某地区为了了解知识分子的年龄结构, 随机抽样50名,其年龄分别如下: 42,38,29,36,41,43,54,43,34,44, 40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44, 42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58. (1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计年龄在32~52岁的知识分子所占的比 例约是多少.

8 4, 6, 3 3, 6, 8 3, 8, 9 1 0 1 2 3 4 5

2, 5, 1, 4, 0
5 4 6, 1, 6, 7, 9 9



甲 8 4 6 3 3 6 8 0 1 2 2 5

5 4
3 8 9
3
4
1 6 1 6 7 9
4 0 9
1
5
主要从对称性,中位数(体现成绩好坏), 稳定性(即集中程度)来分析 分析:甲得分除51分外大致对称,乙基本上也对称。
频率
组距
0
a
b
月均用水量/t
相关文档
最新文档