2017高考数学理一轮总复习教学案: 第13章 统计案例

合集下载

高中数学统计单元教案

高中数学统计单元教案

高中数学统计单元教案教学目标:1. 了解统计学的基本概念和方法。

2. 掌握数据的收集、整理和分析方法。

3. 能够应用统计学知识解决实际问题。

教学重点和难点:重点:数据的收集和整理方法;频数分布和频率分布的表示方法;统计图表的绘制。

难点:统计方法在实际问题中的应用。

教学内容:1. 统计学的基本概念及分类。

2. 数据的收集、整理和分析方法。

3. 频数分布和频率分布。

4. 统计图表的绘制。

5. 统计学在实际问题中的应用。

教学过程:一、导入为学生展示一组数据,并引导学生分析数据的规律性和特点,引出统计学的重要性。

二、教学内容讲解1. 简要介绍统计学的基本概念和分类。

2. 详细讲解数据的收集、整理和分析方法,包括数据的分类、整理和处理。

3. 讲解频数分布和频率分布的表示方法,引导学生计算频数和频率。

4. 演示统计图表的绘制方法,包括直方图、饼图和折线图等。

5. 分析统计学在实际问题中的应用,如调查、统计学习等。

三、练习与讨论1. 给学生布置一些练习题,让学生熟练掌握数据处理和统计图表绘制方法。

2. 进行小组讨论,让学生分享统计学在实际问题中的应用案例。

四、总结与反思总结本节课学习的内容,引导学生思考统计学在现实生活中的重要性和应用价值。

五、作业布置布置作业,巩固和拓展学生的学习内容,如完成一些实际调查或统计问题。

六、拓展延伸引导学生对统计学进行拓展学习,了解更多统计学知识和方法,如相关性分析、假设检验等。

教学资源:1. 教科书和教学辅助资料。

2. 实际数据和统计软件。

3. 课堂展示资料,如图表、案例等。

教学评价:1. 可以设置课堂小测验或作业考核学生对基本概念和方法的掌握情况。

2. 观察学生在课堂练习和讨论中的表现,评价学生对统计学知识的理解和运用能力。

教学反馈:及时对学生的学习情况进行反馈,鼓励学生积极参与课堂讨论和实践活动,帮助学生提升统计学习效果。

高考数学一轮复习 讲义统计教案

高考数学一轮复习 讲义统计教案

第十一讲 复习统计一、本讲进度《统计》复习 二、本讲主要内容1、本章内容是初中《统计初步》与高中《概率》内容的深入和扩展,对数理统计中要研究的两个基本问题;如何从总体中抽取样本以及如何通过对所抽取的样本进行计算和分析,从而对总体的相应情况作出推断,作了初步的介绍。

几个基本名词:在统计中,考察对象的全体称为总体,总体中的每一个对象称为个体。

若记总体中N 个个体取值分别为x 1,x 2,…,x N ,则称)x x x (N1N 21+++=μ 为总体平均数(μ为N 个个体的算术平均数)若记])x ()x ()x [(N12N 22212μ-+μ-+μ-=σ ,则称σ2为总体方差,σ称为总体标准差。

初中《统计初步》的主要内容⎪⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎪⎨⎧⎩⎨⎧⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧→⎪⎪⎪⎩⎪⎪⎪⎨⎧⎩⎨⎧⎪⎩⎪⎨⎧平均数样本平均数去估计总体样本容量等样本个体总体样本去估计总体频率分布从整体分布上描述标准差方差描述其被动大小中位数众数平均数描述集中趋势从特征数上描述描述一组数据的方法,,, 2、抽样方法的分类:按照抽取样本时总体中的每个个体被抽取的概率是否相等⎩⎨⎧不等概率抽样等概率抽样本章只研究等概率抽样 等概率抽样⎩⎨⎧不放回抽样放回抽样常用的三种抽样方法的比较:3、用样本的频率分布估计总体分布,分两种情况:(1)当总体中的个数体取不同数值很少时,其频率分布表由所取样本的不同数值及其相应的频率来表示,其几何表示就是相应的条形图。

例如射击的环数,掷单粒骰子时出现的点数等;(2)当总体中的个体取不同值较多甚至无限时,此时需要对样本数据进行整理,其频率分布表列出的是在各个不同区间内取值的频率,相应的直方图是用图形面积的大小来表示在各个区间内取值的频率。

画第二种情况频率分布图的步骤是: ①计算最大值与最小值的差; ②决定组距与组数;③决定分点,通常使分点比数据多一位小数,并且把第一小组的起点稍微减小一点; ④列出频率分布表; ⑤画出频率分布直方图频率分布将随着样本容量的增大而更加接近总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布直方图就会演变成一条光滑曲线——反映总体分布的概率密度曲线。

高考第一轮复习数学:12.3 统 计 高考数学第一轮复习教案集 新课标 人教版 高考数学第一轮复习教

高考第一轮复习数学:12.3 统 计 高考数学第一轮复习教案集 新课标 人教版 高考数学第一轮复习教
生产的这批砖是否合格?为什么?
分析:由于在一次试验中ξ落在区间(μ-3σ,μ+3σ)内的概率为0.997,故ξμ=30,σ=0.8代入,算出区间(μ-3σ,μ+3σ (27.6,32.4).∴据此认为这批砖不合格.
【例3】已知测量误差ξ~N(2,100)(cm),必须进行多少次测量,才能使至少有一次测量误差的绝对值不超过8 cm的频率大于0.9?
解:对第一个方案,有x~N(8,32),于是P(x>5)=1-P(x≤5)=1-F(5)=1-Φ( )=1-Φ(-1)=1-[1-Φ(1)]=Φ(1)=0.8413.
对第二个方案,有x~N(6,22),于是P(x>5)=1-P(x≤5)=1-F(5)=1-Φ( )=1-Φ(-0.5)=Φ(0.5)=0.6915.
(3)在这个累积频率分布图上,
横坐标为22,
落在21~24的区间内,
折线图在这段区间上的线段所在的直线方程是y-0.3= (x-21),
即yx-1.17.
当x=22时,y=1.54-0.17=0.37.
因此,总体中小于22的数据大约占37%.
●思悟小结
类别
共同点
相互联系
适用X围
各自特点
简单随机抽样
抽样过程中每个个体被抽到的概率相等
(2)画出频率分布直方图和累积频率分布图;
(3)根据累积频率分布图,总体中小于22的样本数据大约占多大的百分比?
解:(1)
分组
频数
频率
累积频率
[12,15)
6
[15,18)
8
[18,21)
16
[21,24)
21
[24,27)
18
[27,30)

高三数学一轮教案统计(二)

高三数学一轮教案统计(二)

芯衣州星海市涌泉学校§1统计〔二〕【复习目的】通过统计案例,会用样本频率分布估计总体分布;理解频率分布表和频率分布直方图的绘制;掌握用样本的平均数去估计总体期望值;理解方差和标准差的意义,会求样本方差和标准差。

【课前预习】在统计中,为了考察一个总体的情况,通常是从总体中抽取一个样本,用样本的有关情况去估计总体的相应情况。

这种估计大体分为两类,一类是,一类是。

总体平均数(又称为总体期望值)描绘了一个总体的平均程度。

对很多总体来说,它的平均数不易求得,常用容易求得的样本平均数:x=对它进展估计。

方差和标准差计算公式:样本方差:2s=;样本标准差:s=。

方差和标准差的意义:描绘一个样本和总体的的特征数。

标准差大说明波动大。

在频率分布直方图中,各个长方形的面积表示〔〕A.落在相应各组的数据的频数B.相应各组的频率C.该样本所分成的组数D.该样本的样本容量一个容量为40的样本,把它分成六组:第一组到第四组的频数分别是:5,6,7,10,第五组的频率是0.2,那么第六组的频数是,频率为。

假设M个数的平均数是X,N个数的平均数是Y,那么这M+N个数的平均数是〔〕A.2X Y+B.X YM N++C.MX NYM N++D.MX NYX Y++下面哪有个数不为总体特征数的是〔〕A.总体平均数B.总体方差C.总体标准差D.总体样本【典型例题】例1某人有资金10万元,准备用于投资经营甲,乙两种商品,根据统计资料:经营甲经营乙问:应该选择经营哪种商品?例2甲、乙两学生连续五次数学测验成绩如下,甲:80、75、80、90、70;乙:70、70、75、80、65。

问哪一位同学的数学成绩比较稳定?【稳固练习】假设样本a1,a2,a3的方差是2,那么样本2a1+3,2a2+3,2a3+3的方差是。

甲、乙两种棉花,各抽取50根棉花纤维检验长度,样本方差分别是s甲=2,s乙=0.93,这两种棉花质量较好的是。

某校要从两名短跑运发动中选拔一名代表去运动会参赛,为此对甲、乙两名运发动进展了6次短跑成绩测验,结果说明两运发动平均成绩一样,但甲成绩的方差为0.008,乙成绩的方差为0.027,由此可以估计______的成绩比______的成绩稳定,应选派______运发动去参加运动会为佳.样本:1086101381012117 8911912910111212那么频率为0.3的范围是〔〕A.5.5~7.5B.7.5~9.5C.9.5~11.5D.11.5~13.5有甲、乙两种水稻,测得每种水稻各10穴的分蘖数后,计算出样本方差分别为s2=11、s2=,由此可以估计〔〕A.甲种水稻比乙种水稻分蘖整齐B.乙种水稻比甲种水稻分蘖整齐C.甲、乙两种水稻分蘖整齐程度一样D.甲、乙两种水稻分蘖整齐程度不能比较27.为了理解某地区高三学生的身体发育情况,抽查了地区内100名年龄为1岁~18岁的男生的体重情况,频率直方图如右图。

高三数学理一轮配套教案:《统计、统计案列》人教B版

高三数学理一轮配套教案:《统计、统计案列》人教B版

§11.1随机抽样1. 简单随机抽样(1)定义:从元素个数为N 的总体中不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样的方法:抽签法和随机数表法. 2. 系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本. (1)先将总体的N 个个体编号;(2)确定分段间隔k ,对编号进行分段,当N n (n 是样本容量)是整数时,取k =Nn ;当Nn 不是整数时,可随机地从总体中剔除余数,再确定分段间隔; (3)在第1段用简单随机抽样确定第一个个体编号s (s ≤k );(4)按照一定的规则抽取样本,通常是将s 加上间隔k 得到第2个个体编号(s +k ),再加k 得到第3个个体编号(s +2k ),依次进行下去,直到获取整个样本. 3. 分层抽样(1)分层抽样的定义:在抽样时,将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.(2)当总体由有明显差异的几部分组成时,往往选用分层抽样.1. 判断下面结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样是一种不放回抽样.( √ ) (2)简单随机抽样每个个体被抽到的机会不一样,与先后有关. ( × ) (3)系统抽样在起始部分抽样时采用简单随机抽样.( √ )(4)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( × ) (5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( × )2. 在某班的50名学生中,依次抽取学号为5、10、15、20、25、30、35、40、45、50的10名学生进行作业检查,这种抽样方法是( )A .随机抽样B .分层抽样C .系统抽样D .以上都不是答案 C3. 将参加英语口语测试的1 000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为( )A .700B .669C .695D .676 答案 C解析 由题意可知,第一组随机抽取的编号l =15,分段间隔数k =N n =1 00050=20,则抽取的第35个编号为a 35=15+(35-1)×20=695.4. 大、中、小三个盒子中分别装有同一种产品120个、60个、20个,现在需从这三个盒子中抽取一个样本容量为25的样本,较为恰当的抽样方法为________________. 答案 简单随机抽样解析因为三个盒子中装的是同一种产品,且按比例抽取每盒中抽取的不是整数,所以将三盒中产品放在一起搅匀按简单随机抽样法(抽签法)较为适合.5.一支田径队有男运动员48人,女运动员36人.若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.答案12解析样本的抽取比例为2148+36=14,所以应抽取男运动员48×14=12(人).题型一简单随机抽样例1下列抽取样本的方式是否属于简单随机抽样?(1)从无限多个个体中抽取100个个体作为样本.(2)盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.(3)从20件玩具中一次性抽取3件进行质量检验.(4)某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.思维启迪判断一个抽样是否为简单随机抽样,要判断是否符合简单随机抽样的特征.解(1)不是简单随机抽样.因为被抽取的样本总体的个体数是无限的,而不是有限的.(2)不是简单随机抽样.因为它是放回抽样.(3)不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.(4)不是简单随机抽样.因为不是等可能抽样.思维升华(1)简单随机抽样需满足:①被抽取的样本总体的个体数有限;②逐个抽取;③是不放回抽取;④是等可能抽取.(2)简单随机抽样常有抽签法(适用总体中个体数较少的情况)、随机数表法(适用于个体数较多的情况).(2013·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A.08答案 D解析从第1行第5列、第6列组成的数65开始由左到右依次选出的数为08,02,14,07,01,所以第5个个体编号为01.题型二系统抽样例2将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为()A.26,16,8 B.25,17,8C.25,16,9 D.24,17,9思维启迪系统抽样又称“等距抽样”.可以根据“等距”确定各营区被抽中的人数.答案 B解析由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(k∈N+)组抽中的号码是3+12(k-1).令3+12(k-1)≤300得k≤103,因此第Ⅰ营区被抽中的人数是25;4令300<3+12(k-1)≤495得1034<k≤42,因此第Ⅱ营区被抽中的人数是42-25=17.结合各选项知,选B.思维升华(1)系统抽样的特点——机械抽样,又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取的样本号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.(2)系统抽样时,如果总体中的个体数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.(2013·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )A .11B .12C .13D .14 答案 B解析 由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12(人). 题型三 分层抽样例3(2013·湖南)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n等于()A.9 B.10 C.12 D.13思维启迪分层抽样,抽样比是一个定值.答案 D解析∵360=n120+80+60,∴n=13.思维升华在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即n i∶N i=n∶N.某校共有学生2 000名,各年级男、女生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为()一年级二年级三年级女生373x y男生377370zA.24 B.18 C.答案 C解析依题意我们知道二年级的女生有380人,那么三年级的学生人数应该是2 000-373-377-380-370=500,即总体中各个年级的人数比为3∶3∶2,故在分层抽样中应在三=16.年级抽取的学生人数为64×28五审图表找规律典例:(12分)某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:人数管理技术开发营销生产共计老年40404080200中年80120160240600青年40160280720 1 200小计160320480 1 040 2 000(1)(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?(3)若要抽20人调查对广州亚运会举办情况的了解,则应怎样抽样?抽取40人调查身体状况↓(观察图表中的人数分类统计情况) 样本人群应受年龄影响↓(表中老、中、青分类清楚,人数确定) 要以老、中、青分层,用分层抽样 ↓要开一个25人的座谈会 ↓(讨论单位发展与薪金调整)样本人群应受管理、技术开发、营销、生产方面的影响 ↓(表中管理、技术开发、营销、生产分类清楚,人数确定) 要以管理、技术开发、营销、生产人员分层,用分层抽样 ↓要抽20人调查对广州亚运会举办情况的了解↓可认为亚运会是大众体育盛会,一个单位人员对情况了解相当 将单位人员看作一个整体↓(从表中数据看总人数为2 000人) 人员较多,可采用系统抽样 规范解答解 (1)按老年、中年、青年分层,用分层抽样法抽取, [1分] 抽取比例为402 000=150.[2分] 故老年人,中年人,青年人各抽取4人,12人,24人.[4分](2)按管理、技术开发、营销、生产分层,用分层抽样法抽取, [5分]抽取比例为252 000=180,[6分]故管理,技术开发,营销,生产各抽取2人,4人,6人,13人. [8分](3)用系统抽样,对全部2 000人随机编号,号码从0001~2000,每100号分为一组,从第一组中用随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1 900,共20人组成一个样本.[12分]温馨提醒 (1)本题审题的关键有两点,一是对图表中的人员分类情况和数据要审视清楚;二是对样本的功能要审视准确.(2)本题易错点是,对于第(2)问,由于对样本功能审视不准确,按老、中、青三层分层抽样.方法与技巧三种抽样方法的比较进行分层抽样时应注意几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠;(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同;(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.A组专项基础训练(时间:30分钟)一、选择题1.(2012·四川)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为()A.101 B.808 C.1 212 D.2 012答案 B解析由题意知抽样比为1296,而四个社区一共抽取的驾驶员人数为12+21+25+43=101,故有1296=101N,解得N=808.2. 某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( )A .6B .8C .10D .12 答案 B解析 设样本容量为N ,则N ×3070=6,∴N =14,∴高二年级所抽人数为14×4070=8. 3. 某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为( )A .7B .15C .25D .35 答案 B解析 由题意知青年职工人数∶中年职工人数∶老年职工人数=350∶250∶150=7∶5∶3.由样本中青年职工为7人得样本容量为15.4. 为规范学校办学,省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应为 ( )A .13B .19C .20D .51 答案 C解析 抽样间隔为46-33=13, 故另一位同学的编号为7+13=20,选C.5. 某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生是高一学生的两倍,高二学生比高一学生多300人,现在按1100的抽样比例用分层抽样的方法抽取样本,则高一学生应抽取的人数为( ) A .8 B .11 C .16 D .10 答案 A解析 设高一学生有x 人,则高三学生有2x 人,高二学生有(x +300)人,学校共有4x +300=3 500(人),解得x =800(人),由此可得按1100的抽样比例用分层抽样的方法抽取样本,高一学生应抽取的人数为1100×800=8(人),故应选A.二、填空题6. (2012·天津)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校. 答案 18 9解析 150×30150+75+25=150×30250=18,75×30250=9.7. 将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是________. 答案 16,28,40,528. (2012·福建)一支田径队有男女运动员98人,其中男运动员有56人,按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是________. 答案 12解析 依题意,女运动员有98-56=42(人). 设应抽取女运动员x 人,根据分层抽样特点, 得x 42=2898,解得x =12. 9. 课题组进行城市空气质量调查,按地域把24个城市分成甲、乙、丙三组,对应的城市数分别为4,12,8,若用分层抽样抽取6个城市,则丙组中应抽取的城市数为________. 答案 2解析 由已知得抽样比为624=14,∴丙组中应抽取的城市数为8×14=2.10.用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为123,则第2组中应抽出个体的号码是______________. 答案 11解析 由题意可知,系统抽样的组数为20,间隔为8,设第1组抽出的号码为x ,则由系统抽样的法则可知,第n 组抽出个体的号码应该为x +(n -1)×8,所以第16组应抽出的号码为x +(16-1)×8=123,解得x =3,所以第2组中应抽出个体的号码为3+(2-1)×8=11.B 组 专项能力提升 (时间:30分钟)1. 某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270,使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况: ①7,34,61,88,115,142,169,196,223,250 ②5,9,100,107,111,121,180,195,200,265 ③11,38,65,92,119,146,173,200,227,254 ④30,57,84,111,138,165,192,219,246,270 关于上述样本的下列结论中,正确的是( )A .②、③都不能为系统抽样B .②、④都不能为分层抽样C .①、④都可能为系统抽样D .①、③都可能为分层抽样答案 D解析 因为③为系统抽样,所以选项A 不对;因为②为分层抽样,所以选项B 不对;因为④不为系统抽样,所以选项C 不对,故选D.2. (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )A .7B .9C .10D .15 答案 C解析 由系统抽样的特点知:抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 3. 为了解1 200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k 为________. 答案 404. 200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号分为40组,分别为1~5,6~10,…,196~200,第5组抽取号码为22,第8组抽取号码 为______.若采用分层抽样,40岁以下年龄段应抽取______人. 答案 37 20解析 将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x 人, 则40200=x100,解得x =20. 5. 一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m +k 的个位数字相同,若m =8,则在第8组中抽取的号码是________. 答案 76解析 由题意知:m =8,k =8,则m +k =16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.6. 某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n . 解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为36n ,分层抽样的比例是n36,抽取的工程师人数为n 36×6=n 6,技术员人数为n 36×12=n 3,技工人数为n 36×18=n2,所以n 应是6的倍数,36的约数,即n =6,12,18.当样本容量为(n +1)时,总体容量是35人,系统抽样的间隔为35n +1,因为35n +1必须是整数,所以n 只能取6.即样本容量n =6.。

北师大版版高考数学一轮复习算法初步统计与统计案例统计图表用样本估计总体教学案理解析版

北师大版版高考数学一轮复习算法初步统计与统计案例统计图表用样本估计总体教学案理解析版

[考纲传真] 1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题.1.常用统计图表(1)频率分布表的画法:第一步:求极差,决定组数和组距,组距=错误!;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图.横轴表示样本数据,纵轴表示错误!,每个小矩形的面积表示样本落在该组内的频率.(3)频率分布折线图和总体密度曲线1频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.(4)茎叶图的画法:第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将各个数据的茎按大小次序排成一列;第三步:将各个数据的叶依次写在其茎的右(左)侧.2.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把错误!=错误!称为x1,x2,…,x n这n个数的平均数.(4)标准差与方差:设一组数据x1,x2,x3,…,x n的平均数为错误!,则这组数据的标准差和方差分别是s=错误!;s2=错误![(x1—错误!)2+(x2—错误!)2+…+(x n—错误!)2].错误!1.频率分布直方图中各小矩形的面积之和为1.2.频率分布直方图与众数、中位数与平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.3.若数据x1,x2,…,x n的平均数为错误!,方差为s2,则数据mx1+a,mx2+a,mx3+a,…,mx n+a的平均数是m错误!+a,方差为m2s2.[基础自测]1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.(2)一组数据的方差越大,说明这组数据越集中. ()(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.()[答案] (1)√(2)×(3)√(4)×2.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数B[标准差反映样本数据的离散波动大小,故选B.]3.数据1,3,4,8的平均数与方差分别是()A.2,2.5B.2,10.5C.4,2D.4,6.5D[平均数为错误!=4,方差为错误!=6.5.]4.某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为()A.117 B.118C.118.5D.119.5B[22次考试中,所得分数最高的为98,最低的为56,所以极差为98—56=42,将分数从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为42+76=118.]5.(教材改编)某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的80名教师按年龄分组,分组区间为[35,40),[40,45),[45,50),[50,55),[55,60],由此得到频率分布直方图如图,则这80名教师中年龄小于45岁的有________人.48 [由频率分布直方图可知45岁以下的教师的频率为5×(0.040+0.080)=0.6,所以共有80×0.6=48(人). ]样本的数字特征的计算与应用1.在某次测量中,得到的A样本数据为81,82,82,84,84,85,86,86,86,若B样本数据恰好是A样本数据分别加2后所得的数据,则A,B两个样本的下列数字特征对应相同的是()A.众数B.平均数C.标准差D.中位数C[由题意可得A,B两组数据的众数分别是86和88,排除A;B组数据的平均数比A组数据的平均数大2,排除B;B组数据的中位数比A组数据的中位数大2,排除D;A,B两组数据的标准差相同,C正确,故选C.]2.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()甲乙A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差C[根据条形统计图可知甲的中靶情况为4环、5环、6环、7环、8环;乙的中靶情况为5环、5环、5环、6环、9环.错误!甲=错误!(4+5+6+7+8)=6,错误!乙=错误!(5×3+6+9)=6,甲的成绩的方差为错误!=2,乙的成绩的方差为错误!=2.4;甲的成绩的极差为4环,乙的成绩的极差为4环;甲的成绩的中位数为6环,乙的成绩的中位数为5环,综上可知C正确,故选C.]3.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x—y|的值为()A.1B.2C.3D.4D[由题意可知错误!∴错误!∴(x+y)2=x2+y2+2xy,即208+2xy=400,∴xy=96.∴(x—y)2=x2+y2—2xy=16,∴|x—y|=4,故选D.][规律方法] 众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)方差的简化计算公式:s2=错误![(x错误!+x错误!+…+x错误!)—n错误!2],或写成s2=错误!(x错误!+x错误!+…+x错误!)—错误!2,即方差等于原数据平方的平均数减去平均数的平方.【例1】某良种培育基地正在培育一小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产量的数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454.品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)作出品种A与B亩产量数据的茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.[解] (1)画出茎叶图如图所示.(2)由于每个品种的数据都只有25个,样本容量不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且可以随时记录新的数据.(3)通过观察茎叶图可以看出:1品种A的亩产量的平均数(或均值)比品种B高;2品种A的亩产量的标准差(或方差)比品种B大,故品种A的亩产量的稳定性较差.[规律方法] 茎叶图中的两个关注点(1)重复出现的数据要重复记录,不能遗漏.(2)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.易错警示:茎叶图中数字大小排列不一定从小到大排列,一定要看清楚.气质量状况的指数,空气质量按照AQI大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI记录数据中,随机抽取10个,用茎叶图记录如图.根据该统计数据,估计此地该年AQI大于100的天数约为________.(该年为365天)(2)如图所示的茎叶图是甲、乙两位选手在某次比赛中的比赛得分,则下列说法正确的是()A.甲的平均数大于乙的平均数B.甲的中位数大于乙的中位数C.甲的方差大于乙的方差D.甲的平均数等于乙的中位数(1)146 (2)C[(1)该样本中AQI大于100的频数是4,频率为错误!,由此估计该地全年AQI大于100的频率为错误!,估计此地该年AQI大于100的天数约为365×错误!=146.(2)由茎叶图可知,错误!甲=错误!×(59+45+32+38+24+26+11+12+14)=29,错误!乙=错误!×(51+43+30+34+20+25+27+28+12)=30,s错误!=错误!×(302+162+32+92+52+32+182+172+152)≈235.3,s错误!=错误!×(212+132+02+42+102+52+32+22+182)≈120.9,甲的中位数为26,乙的中位数为28.所以甲的方差大于乙的方差.故选C.]频率分布直方图【例2】某城市100户居民的月平均用电量(单位:千瓦时),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值.(2)求月平均用电量的众数和中位数.(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240]的用户中应抽取多少户?[解] (1)(0.002+0.009 5+0.011+0.0125+x+0.005+0.0025)×20=1,解得x=0.007 5.即直方图中x的值为0.007 5.(2)月平均用电量的众数是错误!=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5,(0.002+0.009 5+0.011+0.0125)×20=0.7>0.5,∴月平均用电量的中位数在[220,240)内.设中位数为a,则0.45+0.0125×(a—220)=0.5,解得a=224,即中位数为224.(3)月平均用电量在[220,240]的用户有0.0125×20×100=25(户).同理可得月平均用电量在[240,260)的用户有15户,月平均用电量在[260,280)的用户有10户,月平均用电量在[280,300]的用户有5户,故抽取比例为错误!=错误!.∴月平均用电量在[220,240)的用户中应抽取25×错误!=5(户).[规律方法] 频率、频数、样本容量的计算方法(1)错误!×组距=频率.(2)错误!=频率,错误!=样本容量,样本容量×频率=频数.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125]频数62638228(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?[解] (1)如图所示:(2)质量指标值的样本平均数为错误!=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(—20)2×0.06+(—10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.1.(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了1月至12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳A[对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;对于选项C,D,由图可知显然正确.故选A.2.(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半A[设新农村建设前经济收入的总量为x,则新农村建设后经济收入的总量为2x.建设前种植收入为0.6x,建设后种植收入为0.74x,故A不正确;建设前其他收入为0.04x,建设后其他收入为0.1x,故B正确;建设前养殖收入为0.3x,建设后养殖收入为0.6x,故C正确;建设后养殖收入与第三产业收入的总和占建设后经济收入总量的58%,故D正确.]。

2017届高三第一学期数学(理科)进度表

2017届高三第一学期数学(理科)进度表

节名称
第二章函数、 导数及其应用
第三章 三角函 数、解三角形
第四章 平面向 量、复数
第五章 数列
第六章 不等式 、推理与证明
第七章 立体几 何初步
第八章平面解 析几何第九章 算法、 统计、统计案来自例第十章计数原 理、 概率
选修4-4 选修4-5
2017年高考数学(理科)一轮复习进度计划表
一轮复习时间段 章(单元)名称 第一章集合与 常用逻辑用语 开始:2016.8.4------结束:2017.3.18 复习上课时间 计划复习时间 课时 实际时间课时 出入原因 第一节 集合 8.4-8.6 4 第二节 命题及其关系、充分条件与必要条件 8.7-8.8 4 第三节 简单的逻辑联结词、全称量词与存在量词 4 8.9-8.12 第一节 函数及其表示 8.13-15 4 第二节 函数的单调性与最值 4 8.16-19 第三节 函数的奇偶性与周期性 8.20-8.22 4 第四节 指数函数 5 8.23-8.26 第五节 对数函数 8.27-8.29 5 第六节 幂函数与二次函数 8.31-9.2 5 第七节 函数的图像 9.3-9.5 5 第八节 函数与方程 9.7-9.8 4 第十节 导数及其应用(一) 6 9.9-9.14 第十一节导数及其应用(二) 4 9.17-9.18 第十二节定积分的概念与微积分基本定理、定积分的简单应用 9.19-9.22 5 第十三节导数的综合应用 5 9.23-9.24 第一节任意角和弧度制及任意角的三角函数 4 9.26-9.28 第二节同角三角函数的基本关系式及诱导公式 4 9.29-9.30 第三节三角函数的图像和性质 10.5-10.6 4 第四节函数y=Asin(ωx+φ)的图像及三角函数模型的简单应用 10.7-10.8 4 第五节两角和与差的正弦、余弦和正切公式 10.9-10.10 4 第六节简单的三角恒等变换 10.12-10.14 4 第七节正弦定理和余弦定理 10.15-10.17 5 第一节平面向量的概念及其线性运算 10.18-10.20 4 第二节平面向量基本定理及其向量坐标运算 10.21-10.22 4 第三节平面向量的数量积 10.24-10.25 4 第四节数系的扩充与复数的引入 10.26-10.27 4 第一节数列的概念与简单表示法 10.28-10.30 5 第二节等差数列及其前n项和 10.31-11.3 5 第三节等比数列及其前n项和 11.4-11.5 5 第四节数列求和 11.6-11.7 5 第一节不等关系与不等式 11.9-11.10 4 第二节一元二次不等式及其解法 11.11-11.12 4 第三节二元一次不等式(组)与简单的线性规划问题 11.13-11.14 4 第四节基本不等式 11.16-11.17 4 第五节合情推理与演绎推理 11.18-11.19 2 第六节直接证明与间接证明 第七节数学归纳法 11.21-11.22 2 第一节空间几何体的结构及其三视图和直观图 11.23-11.25 5 第二节空间几何体的表面积与体积 11.25-11.29 5 第三节空间点、直线、平面之间的位置关系 11.30-12.3 5 第四节直线、平面平行的判定及性质 12.4-12.7 5 第五节直线、平面平行的判定及性质 12.8-12.10 5 第六节空间向量及其运算和空间位置关系 12.11-12.14 5 第七节空间向量和空间角 12.15-12.17 5 第八节立体几何中的综合问题 12.18-12.21 5 第一节直线的倾斜角与斜率、直线的方程 12.22-12.24 5 第二节直线的交点坐标与距离公式 12.25-12.28 5 第三节圆的方程 12.29-12.30 5 第四节直线与圆、圆与圆的位置关系 12.31-1.2 5 第五节椭圆 1.4-1.5 5 第六节双曲线 1.6-1.8 5 第七节抛物线 1.9-1.12 5 第八节曲线与方程 1.13-1.15 5 第九节直线与圆锥曲线的位置关系 1.16-1.19 5 第一节随机抽样 2 2.8-2.9 第二节用样本估计总体 2 2.10-2.11 第三节变量间的相互关系与统计案例 2 2.12-2.13 第四节算法与程序框图、基本算法语句 2.14 2 第一节分类加法计数原理与分布乘法计数原理 2.15 3 第二节排列与组合 2.16-2.17 3 第三节二项式定理 2.18-2.19 3 第四节随机事件的概率 2.20-2.21 3 第五节古典概型 2.22-2.23 3 第六节几何概型 3 2.25-2.28 第七节离散型随机变量及其分布列 4 3.1-3.3 第八节n次独立重复试验与二项分布 4 3.4-3.7 第九节离散型随机变量的均值与方差、正态分布 4 3.8-3.11 坐标系与参数方程 4 3.13-3.15 不等式选讲 4 3.16-3.18

高三数学一轮精品复习学案:第十章 统计、统计案例

高三数学一轮精品复习学案:第十章  统计、统计案例

高三数学一轮精品复习学案:第十章统计、统计案例【知识特点】1.统计中所学的内容是数理统计中最基本的问题,通过这些内容主要来介绍相关的统计思想和方法,了解一些有关统计学的基本知识,并能够应用几个基本概念、基本公式来处理实际生活中的一些基本问题。

2.统计案例为新课标中新增内容,主要是通过案例体会运用统计方法解决实际问题的思想和方法。

增加了统计和统计案例后,使得高中数学的整个体系更加完善了,有利于开阔数学视野,丰富数学思想和方法。

【重点关注】1.从对新课标高考试题的分析可以发现,主要考查抽样方法、各种统计图表、样本数字特征等。

对这部分的考查主要以选择题和填空题的形式出现。

2.统计案例中的独立性检验和回归分析也会逐步在高考题中出现,难度不会太大,多数情况下是考查两种统计分析方法的简单知识,以选择题和填空题为主。

【地位与作用】《全国新课程标准高考数学考试大纲》中对考生能力要求明确界定为空间想象能力、抽象概括能力、推理论证能力、运算求解能力、数据处理能力以及应用意识和创新意识等六个方面,其中数据处理能力是首次提出的一个能力要求,这定义为:会收集数据、整理数据、分析数据,能从大量数据中抽取对研究问题有用的信息,并作出判断。

数据处理能力主要依据统计(高考考试大纲对知识点要求如下表所示)或统计案例中的方法对数据进行整理、分析,并解决给定的实际问题,对统计的要求已提升到能力的高度。

统计的思想方法广泛应用于自然科学和社会科学的研究中,统计的语言不仅是数学的语言,也是各学科经常引用的大众语言,统计知识是作为一个新时期公民所比备的知识。

统计学就是应用科学的方法收集、整理、分析、描述所要研究的数据资料,然后根据所得到的结果,进行推断或决策的一门实用性很强的科学。

统计这部分内容,在高中数学新课程中,主要分布在必修3第二章(约16课时)与选修2—3第三章(约9课时)。

相对于高中学生的认知水平和生活经历还相对不是很高,所以它只能属于非重点内容,所出的相关题目一般来说都相对比较简单。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第十三章 统计案例高考导航考纲要求备考策略1.理解随机抽样的必要性和重要性,会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法.2.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点,理解样本数据标准差的意义和作用,会计算数据标准差,能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想,会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.3.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系,了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆).统计案例是高中数学中应用性的章节,也是高考必考内容,高考中多数以选择、填空题形式考查,属于中、低档题,主要考查抽样方法、频率分布直方图及回归分析等内容.复习时采用以下应对策略:1.立足课本,突出基础,重视概念的辨析与理解.2.注重“操作”训练,如抽样方法的操作步骤,频率分布表和频率分布直方图、茎叶图的绘制等,要熟练掌握.3.重视统计与概率的综合运用,会用样本频率分布估计总体分布,会用样本平均数估计总体期望值,会用样本的方差估计总体方差;提高搜集处理信息及分析解决问题的能力.4.加强统计应用性的训练,能用统计的方法提供决策、制定方案.知识网络13.1 抽样方法与用样本估计总体考点诠释重点:三种抽样方法的区别、联系与操作步骤,样本频率分布直方图和茎叶图,用样本估计总体的思想.难点:简单随机抽样,总体的期望与方差概念的建立.典例精析题型一 抽样方法【例1】某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的14,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层次的职工对本次活动的满意程度,现用分层抽样方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:(1)游泳组中,青年人、中年人、老年人分别所占的比例; (2)游泳组中,青年人、中年人、老年人分别应抽取的人数.【思路分析】(1)设出游泳组各年龄段人数比例,利用和登山组的比例关系,建立在总单位所占的比例关系,解方程求得结果;(2)据分层抽样的比例关系求得各年龄段人数.【解析】(1)设登山组人数为x ,游泳组中青年人、中年人、老年人各占比例分别为a ,b ,c ,则有x ·40%+3xb 4x =47.5%,x ·10%+3xc4x=10%,解得b =50%,c =10%,则a =40%,即游泳组中,青年人、中年人、老年人各占比例分别为40%,50%,10%.(2)游泳组中,抽取的青年人人数为200×34×40%=60人;抽取的中年人人数为200×34×50%=75人;抽取的老年人人数为200×34×10%=15人.【方法归纳】(1)分层抽样适用于总体由有明显差异的几部分组成的情况,并且在各层抽取个体时宜采用简单随机抽样方法,分层抽样中每个个体被抽取的可能性相等,体现了抽样的公平性;(2)分层抽样与系统抽样的区别分层抽样是从各层独立地抽取个体,而系统抽样各段上的抽取是按事先定好的规则进行的,各层编号有联系,不是独立的.故系统抽样不同于分层抽样.【举一反三】1.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( C )A.7B.9C.10D.15【解析】采用系统抽样方法从960人中抽取32人,将整体分成32组,每组30人,第k 组的号码为30(k -1)+9,令451≤30(k -1)+9≤750,而k ∈Z ,解得16≤k ≤25,则满足16≤k ≤25的整数k 有10个.题型二 频率分布直方图【例2】(1)在样本频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形面积和的14,且样本容量为160,则中间一组的频数为( )A.32B.0.2C.40D.0.25 (2)某区高二年级的一次数学统考中,随机抽取200名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……第五组,成绩大于等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.则这200名同学中成绩大于等于80分且小于90分的学生有 名.【思路分析】根据频率分布直方图的含义可求.【解析】(1)A.由频率分布直方图的性质,可设中间一组的频率为x ,则x +4x =1,解得x =0.2.故中间一组的频数为160×0.2=32.(2)40.由题知,成绩大于等于80分且小于90分的学生所占的频率为1-(0.005×2+0.025+0.045)×10=0.2,所以这200名同学中成绩大于等于80分且小于90分的学生有200×0.2=40名.【方法归纳】解决该类问题时应正确理解图表中各个量的意义,识图获取信息是解决该类问题的关键.频率分布指的是一个样本数据在各个小范围内所占的比例的大小,一般用频率分布直方图反映样本的频率分布.频率分布直方图中各长方形高的比也就是其频率之比.【举一反三】2.已知一个样本容量为100的样本数据的频率分布直方图如图所示,样本数据落在[6,10)内的样本频数为 32 ,样本数据落在[2,10)内的频率为 0.4 .【解析】样本数据落在[6,10)内的样本频数为0.08×4×100=32,样本数据落在[2,10)内的频率为(0.02+0.08)×4=0.4.题型三 平均数、方差的计算【例3】甲、乙两人在相同条件下各射靶10次,每次命中环数如下: 甲 4 7 10 9 5 6 8 6 8 8 乙 7 8 6 8 6 7 8 7 5 9 试问谁10次射靶的情况较稳定?【思路分析】首先利用公式求出平均数、方差,再分析两人的成绩,作出评价.【解析】x 甲=110(4+7+…+8)=7.1,x 乙=110(7+8+…+9)=7.1,s 2甲=110[(4-7.1)2+(7-7.1)2+…+(8-7.1)2]=3.09, s 2乙=110[(7-7.1)2+(8-7.1)2+…+(9-7.1)2]=1.29. 因为s 2甲>s 2乙,所以乙10次射靶比甲10次射靶情况稳定.【方法归纳】平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.【举一反三】3.某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min 抽取一包产品,称其重量,分别记录抽查数据如下:甲:102,101,99,98,103,98,99; 乙:110,115,90,85,75,115,110. (1)这种抽样方法是哪一种? (2)将这两组数据用茎叶图表示;(3)将这两组数据比较,说明哪个车间的产品较稳定.【解析】(1)因为间隔时间相同,所以是系统抽样.(2)茎叶图如下: (3)甲车间:平均值x 1=17(102+101+99+98+103+98+99)=100,方差s 21=17[(102-100)2+(101-100)2+…+(99-100)2]≈3.428 6;乙车间:平均值x 2=17(110+115+90+85+75+115+110)=100,方差s 22=17[(110-100)2+(115-100)2+…+(110-100)2]≈228.571 4.因为x 1=x 2,s 21<s 22,所以甲车间的产品较稳定.体验高考(2015新课标Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关【解析】D.由柱形图可知:A ,B ,C 均正确,2006年以来我国二氧化硫年排放量在逐渐减少,所以排放量与年份负相关,所以D 不正确.【举一反三】(2015安徽)若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1, 2x 2-1,…,2x 10-1的标准差为( C )A.8B.15C.16D.32 【解析】设样本数据x 1,x 2,…,x 10的标准差为s ,则s =8,可知数据2x 1-1,2x 2-1,…,2x 10-1的标准差为2s =16.13.2 两变量间的相关性、回归分析和独立性检验考点诠释重点:了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程,了解独立性检验的基本思想、方法及其简单应用.难点:对独立性检验、回归分析的基本思想方法的理解.典例精析题型一 求回归直线方程【例1】某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到以下数据:(1)求回归直线方程y ^=b ^x +a ^,其中b ^=-20,a ^=y --b ^x -;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【思路分析】(1)利用回归方程系数公式求出回归方程;(2)利用回归方程进行分析预测.【解析】(1)由于x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80.所以a ^=y -b ^x -=80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得 L =x (-20x +250)-4(-20x +250) =-20x 2+330x -1 000=-20⎝⎛⎭⎫x -3342+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.【方法归纳】当x 与y 呈线性相关关系时,可直接求出回归直线方程,再利用回归直线方程进行计算和预测.【举一反三】1.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.x 3 4 5 6y 2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 【解析】(1)由题意,作散点图如图.(2)由对照数据,计算得=66.5,=32+42+52+62=86,x =4.5,y =3.5, b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7, a ^=y -b ^x =3.5-0.7×4.5=0.35,所以回归方程为y ^=0.7x +0.35. (3)x =100,y =100×0.7+0.35=70.35(吨标准煤),预测生产100吨甲产品的生产能耗比技改前降低90-70.35=19.65(吨标准煤).题型二 独立性检验【例2】衡阳市第一次联考后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀.统计成绩后,得到如下的2×2列联表,且已知在甲、乙两个文科班全部110人中随机抽取1人为优秀的概率为311.优秀 非优秀 合计甲班10 乙班30合计110 (1)请完成上面的列联表;(2)根据列表中的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”;参考公式与临界值表:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )P (K 2≥k 0)0.1000.0500.0250.0100.001k 0 2.706 3.841 5.024 6.635 10.828 【思路分析】本题主要考查独立性检验,解题关键是正确列出2×2列联表,求出K 2的值. 【解析】(1)列联表如下:优秀 非优秀 合计甲班 10 50 60 乙班203050合计30 80 110 (2)根据列联表中的数据,得到K 2=110×(10×30-20×50)260×50×30×80≈7.486<10.828. 因此,按99.9%的可靠性要求,不能认为“成绩与班级有关系”.【方法归纳】判断两个变量之间关系的方法有两种:一是利用二维条形图判断,但图形不能给我们两个分类之间的有关或无关的精确的可信程度;二是利用独立性检验,能作出精确的判断.【举一反三】2.通过随机询问某校110名高中学生在购买食物时是否看营养说明,得到如下的列联表:性别与看营养说明列联表 单位:名男 女 总计看营养说明 50 30 80 不看营养说明102030总计60 50 110 (1)从这50名女生中按是否看营养说明采取分层抽样,抽取一个容量为5的样本,那么样本中看与不看营养说明的女生各多少名?(2)从(1)中的5名女生样本中随机选取两名作深度访谈,求选到看与不看营养说明的女生各一名的概率;(3)根据以上列联表,问有多大把握认为“性别与在购买食物时看营养说明”有关?参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .参考数据:P (K 2≥k 0)0.10 0.05 0.025 0.010 0.005 k 02.7063.8415.0246.6357.879【解析】(1)根据分层抽样可得:样本中看营养说明的女生有550×30=3名,样本中不看营养说明的女生有550×20=2名.(2)记样本中看营养说明的3名女生为a 1,a 2,a 3,不看营养说明的2名女生为b 1,b 2,从这5名女生中随机选取2名,共有10个等可能的基本事件:a 1,a 2;a 1,a 3;a 1,b 1;a 1,b 2;a 2,a 3;a 2,b 1;a 2,b 2;a 3,b 1;a 3,b 2;b 1,b 2.其中事件A “选到看与不看营养说明的女生各一名”包含了6个基本事件:a 1,b 1;a 1,b 2;a 2,b 1;a 2,b 2;a 3,b 1;a 3,b 2.所以所求的概率为P (A )=610=35.(3)假设H 0:该校高中学生性别与在购买食物时看营养说明无关,则K 2应该很小.根据题中的列联表得K 2=110×(50×20-30×10)280×30×60×50=53972≈7.486. 由P (K 2≥6.635)=0.010,P (K 2≥7.879)=0.005可知,有99%的把握认为该校高中学生“性别与在购买食物时看营养说明”有关.体验高考(2015新课标Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x ,根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为=,【解析】(1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^==108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值 z ^=0.2×(100.6+68x )-x =-x +13.6x +20.12,所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.【举一反三】(2015福建)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x (万元)8.2 8.6 10.0 11.3 11.9 支出y (万元)6.27.5 8.0 8.5 9.8根据上表可得回归直线方程y ^=b ^x +a ^,其中b ^=0.76,a ^=y -b ^x .据此估计,该社区一户年收入为15万元家庭的年支出为( B )A.11.4万元B.11.8万元C.12万元D.12.2万元 【解析】由统计数据表可得x =8.2+8.6+10.0+11.3+11.95=10.0,y =6.2+7.5+8.0+8.5+9.85=8.0,则a ^=8.0-0.76×10.0=0.4,所以回归直线方程为y ^=0.76x +0.4,当x =15时,y ^=0.76×15+0.4=11.8,故估计年收入为15万元家庭的年支出为11.8万元,故选B.。

相关文档
最新文档