2015届高考数学(理)二轮专题配套练习:专题7_第3讲_统计与统计案例(含答案)
第3讲 统计与统计案例
考情解读 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等.
2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交
汇点处命题,也会出现解答题,都属于中、低档题.
1.随机抽样
(1)简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少.
(2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.
(3)分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成. 2.常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距×
频率
组距
=频率; ②各小长方形的面积之和等于1;
③小长方形的高=频率组距,所有小长方形的高的和为1
组距.
(2)茎叶图
在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数
(2)方差:s 2
=1
n
[(x 1-x )2+(x 2-x )2+…+(x n -x )2].
标准差:s =
1
n
[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 4.变量的相关性与最小二乘法
(1)相关关系的概念、正相关和负相关、相关系数.
(2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q =∑i =1
n
(y i -a -bx i )2最小
时,得到线性回归方程y ^
=b ^
x +a ^
的方法叫做最小二乘法. 5.独立性检验
对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是
则K 2
(χ2
)=n (ad -bc )2
(a +b )(c +d )(a +c )(b +d
)
(其中n =a +b +c +d 为样本容量).
热点一 抽样方法
例1 (1)(2013·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A .11 B .12 C .13 D .14
(2)(2014·石家庄高三调研)某学校共有师生3 200人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是________.
思维启迪 (1)系统抽样时需要抽取几个个体,样本就分成几组,且抽取号码的间隔相同;(2)分层抽样最重要
的是各层的比例.
思维升华 (1)随机抽样各种方法中,每个个体被抽到的概率都是相等的;(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.
(1)某校高一、高二、高三分别有学生人数为495,493,482,现采用系统抽样方法,抽取49人做
问卷调查,将高一、高二、高三学生依次随机按1,2,3,…,1 470编号,若第1组有简单随机抽样方法抽取的号码为23,则高二应抽取的学生人数为( ) A .15 B .16 C .17 D .18
(2)(2014·广东)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
A .200,20
B .100,20
C .200,10
D .100,10 热点二 用样本估计总体
例2 (1)(2014·山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(
)
A .6
B .8
C .12
D .18
(2)PM 2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,如图是根据某地某日早7点至晚8点甲、乙两个PM 2.5监测点统计的数据(单位:毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是( )
A .甲
B .乙
C .甲乙相等
D .无法确定
甲 乙 2 0.04 1 2 3 6 9 3 0.05 9 6 2 1 0.06 2 9 3 3 1 0.07 9 6 4 0.08 7
7
0.09
2
4 6
思维启迪 (1)根据第一组与第二组的人数和对应频率估计样本总数,然后利用第三组的频率和无疗效人数计算;(2)直接根据公式计算方差.
思维升华 (1)反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的均值、众数和中位数、方差等.
(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.
(1)某商场在庆元宵促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图
如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为________万元.
(2)(2014·陕西)设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( ) A .1+a,4 B .1+a,4+a C .1,4 D .1,4+a 热点三 统计案例
例3 (1)以下是某年2月某地区搜集到的新房屋的销售价格y 和房屋的面积x 的数据.
根据上表可得线性回归方程y =b x +a 中的b =0.196 2,则面积为150 m 2的房屋的销售价格约为________万元. (2)(2014·江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )
表1
表4
A .成绩
B .视力
C .智商 思维启迪 (1)回归直线过样本点中心(x ,y ); (2)根据列联表,计算K 2的值
思维升华 (1)线性回归方程求解的关键在于准确求出样本点中心.回归系数的求解可直接把相应数据代入公式中求解,回归常数的确定则需要利用中心点在回归直线上建立方程求解;(2)独立性检验问题,要确定2×2列联表中的对应数据,然后代入K 2(χ2)计算公式求其值,根据K
2(χ2)取值范围求解即可.
(1)已知x 、y 取值如下表:
从所得的散点图分析可知:y 与x 线性相关,且y =0.95x +a ,则a 等于( ) A .1.30 B .1.45 C .1.65 D .1.80
(2)某研究机构为了研究人的脚的大小与身高之间的关系,随机抽测了20人,若“身高大于175厘米”的为“高个”,“身高小于等于175厘米”的为“非高个”,“脚长大于
42码”的为“大脚”,“脚长小于等于42码”的为“非大脚”.得以下2×2列联表:
则在犯错误的概率不超过 (附:
P (K 2>k ) 0.05 0.01 0.001 k
3.841
6.635
10.828
)
1.随机抽样的方法有三种,其中简单随机抽样适用于总体中的个体数量不多的情况,当总体中的个体数量明
显较多时要使用系统抽样,当总体中的个体具有明显的层次时使用分层抽样.系统抽样最重要的特征是“等距”,分层抽样,最重要的是各层的“比例”.
2.用样本估计总体
(1)在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为1.
(2)众数、中位数及平均数的异同:众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.
(3)当总体的个体数较少时,可直接分析总体取值的频率分布规律而得到总体分布;当总体容量很大时,通常从总体中抽取一个样本,分析它的频率分布,以此估计总体分布.
①总体期望的估计,计算样本平均值x =1n ∑n i =1
x i .②总体方差(标准差)的估计:方差=1n ∑n i =1 (x i
-x )2
,标准差=方差,方差(标准差)较小者较稳定.
3.线性回归方程y ^
=b ^
x +a ^
过样本点中心(x ,y ),这为求线性回归方程带来很多方便. 4.独立性检验
(1)作出2×2列联表.(2)计算随机变量K 2(χ2)的值.(3)查临界值,检验作答.
真题感悟
1.(2014·江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.
2.(2014·重庆)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )
A .y ^
=0.4x +2.3 B .y ^
=2x -2.4 C .y ^
=-2x +9.5 D .y ^
=-0.3x +4.4 1.24 2.A 1.20 2.24 3.3 4.C 押题精练
1.某地区对某路段公路上行驶的汽车速度实施监控,从中抽取50辆汽车进行测速分析,得到如图所示的时速的频率分布直方图,根据该图,时速在70 km/h 以下的汽车有________辆.
2.某教育出版社在高三期末考试结束后,从某市参与考试的考生中选取600名学生对在此期间购买教辅资料的情况进行调研,得到如下数据:
人数为________.
3.下表提供了某厂节能减排技术改造后在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对应数据:
根据上表提供的数据,求出y 关于x 的线性回归方程为y =0.7x +0.35,那么表中t 的值为________. 4
.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:
附:
K 2=n (ad -bc )
2
(a +b )(c +d )(a +c )(b +d )
参照附表,得到的正确结论是( )
A .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”
B .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”
C .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”
D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”
(推荐时间:40分钟)
一、选择题
1.(2014·湖南)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( ) A .p 1=p 2
2.某中学高中一年级有400人,高中二年级有320人,高中三年级有280人,现从中抽取一个容量为200人
的样本,则高中二年级被抽取的人数为( ) A .28 B .32 C .40 D .64
3.(2013·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )
A.08 B .07 C 4.为了了解某城市今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如
图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为120
,则抽取的学生人数是( )
A .240
B .280
C .320
D .480
5.某产品在某零售摊位上的零售价x (单位:元)与每天的销售量y (单位:个)的统计资料如下表所示:
由上表可得线性回归方程y ^
=b ^
x +a ^
中的b =-4,据此模型预计零售价定为15元时,每天的销售量为( ) A .48个 B .49个 C .50个 D .51个
6.某校为了研究学生的性别和对待某一活动的态度(支持和不支持的两种态度)的关系,运用2×2
列联表进行独立性检验,经计算K 2=7.069,则所得到的统计学结论是:有________的把握认为“学生性别与支持该活动有关系.”( ) 附:
A.0.1% B .1% C 7.某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随
机抽取了10株树苗,用茎叶图表示上述两组数据,对两块地抽取树苗的高度的平均数x 甲,x 乙和中位数y 甲,y 乙进行比较,下面结论正确的是( )
A .x 甲>x 乙,y 甲>y 乙
B .x 甲 C .x 甲 D .x 甲>x 乙,y 甲 8.从某中学高一年级中随机抽取100名同学,将他们的成绩(单位:分)数据绘制成频率分布直方图(如图).则这100名学生成绩的平均数、中位数分别为________. 9.某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是__________. 10.(2013·辽宁)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________. 三、解答题 11.(2014·课标全国Ⅱ)某地区2007年至2013年农村居民家庭人均纯收入y (单位:千元)的数据如下表: (1)求y (2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为:b ^ = ∑i =1 n (t i -t )(y i -y ) ∑i =1 n (t i -t )2 ,a ^ =y -b ^ t . 12.某城市随机抽取一年(365天)内100天的空气质量指数API 的监测数据,结果统计如下: (1 S =???? ? 0, 0≤w ≤1004w -400,100 2 000, w >300,试估计在本年度内随机抽取一天,该天经济损失S 大于200元且不超过600 元的概率; (2)若本次抽取的样本数据有30天是在供暖季,其中有8天为重度污染.完成下面2×2列联表,并判断能否有95%的把握认为该市本年空气重度污染与供暖有关? 附: K 2 =n (ad -bc )(a +b )(c +d )(a +c )(b +d ). 例1 (1)B (2)200 变式训练1 (1)C (2)A 例2 (1)C (2)A 变式训练2 (1)10 (2)A 例3 (1)31.244 2 (2)D 解析 (1)由表格可知x =1 5(115+110+80+135+105)=109, y =1 5 (24.8+21.6+18.4+29.2+22)=23.2. 所以a ^=y -b ^ x =23.2-0.196 2×109=1.814 2. 所以所求线性回归方程为y ^ =0.196 2x +1.814 2. 故当x =150时,销售价格的估计值为y ^ =0.196 2×150+1.814 2=31.244 2(万元). (2)A 中,a =6,b =14,c =10,d =22,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×(6×22-14×10)2 20×32×16×36 =131 440. B 中,a =4,b =16,c =12,d =20,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×(4×20-16×12)220×32×16×36 =637 360. C 中,a =8,b =12,c =8,d =24,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2 =52×(8×24-12×8)220×32×16×36 =13 10. D 中,a =14,b =6,c =2,d =30,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×(14×30-6×2)2 20×32×16×36 =3 757160. ∵ 131 440<1310<637360<3 757 160 , ∴与性别有关联的可能性最大的变量是阅读量. 变式训练3 (1)B (2)0.01 解析 (1)依题意得,x =16×(0+1+4+5+6+8)=4,y =1 6 (1.3+1.8+5.6+6.1+7.4+9.3)=5.25; 又直线y ^ =0.95x +a ^ 必过样本点中心(x ,y ),即点(4,5.25),于是有5.25=0.95×4+a ^ ,由此解得a ^ =1.45. (2)由题意得 K 2 =20×(5×12-1×2)2 6×14×7×13 ≈8.802>6.635. 而K 2>6.635的概率约为0.01,所以在犯错误的概率不超过0.01的前提下认为人的脚的大小与身高之间有关系. DDDDBCB 8.125,124 9.1 10.10 11.解 (1)由所给数据计算得t =1 7 (1+2+3+4+5+6+7)=4, y =1 7(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑i =1 7 =(t i -t )2=9+4+1+0+1+4+9=28, ∑i =1 7 (t i -t )(y i -y )=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14, b ^ = ∑i =1 7 (t i -t )(y i -y ) ∑i =1 7 (t i -t )2 =14 28 =0.5, a ^ =y -b ^t =4.3-0.5×4=2.3,所求线性回归方程为y ^ =0.5t +2.3. (2)由(1)知,b ^ =0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元. 将2015年的年份代号t =9代入(1)中的线性回归方程,得y ^ =0.5×9+2.3=6.8, 故预测该地区2015年农村居民家庭人均纯收入为6.8千元. 12.解 (1)设“在本年内随机抽取一天,该天经济损失S 大于200元且不超过600元”为事件A , 由200 100. (2)根据以上数据得到如下列联表: K 2 的观测值k =100×(63×8-22×7)85×15×30×70 ≈4.575>3.841. 所以有95%的把握认为空气重度污染与供暖有关. 最全高考数学统计专题解析版【真题】 -CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN 第十一章统计、统计案例 第一部分六年高考荟萃 2013年高考题 1 .(2013年高考陕西卷(理))某单位有840名职工, 现采用系统抽样方法, 抽取 42人做问卷调查, 将840人按1, 2, , 840随机编号, 则抽取的42人中, 编号 落入区间[481, 720]的人数为()A.11 B.12 C.13 D.14 2 .(2013年普通高等学校招生统一考试安徽数学(理)试题(纯WORD版))某班级有 50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名 女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名 女生的成绩分别为88,93,93,88,93.下列说法一定正确的是()A.这种抽样方法是一种分层抽样 B.这种抽样方法是一种系统抽样 C.这五名男生成绩的方差大于这五名女生成绩的方差 D.该班级男生成绩的平均数小于该班女生成绩的平均数 3 .(2013年普通高等学校招生统一考试福建数学(理)试题(纯WORD版))某校从高 一年级学生中随机抽取部分学生,将他们的模块测试成绩分为6组:[40,50), [50,60), [60,70), [70,80), [80,90), [90,100)加以统计,得到如图所示的频率分布 直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60 分的学生人数为()A.588 B.480 C.450 D.120 4 .(2013年高考江西卷(理))总体有编号为01,02,…,19,20的20个个体组成。利用下 面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字 7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481 )A.08 B.07 C.02 D.01 5.(2013年高考上海卷(理))盒子中装有编号为1,2,3,4,5,6,7,8,9的九个球,从中任意取出两个,则这两个球的编号之积为偶数的概率是 ___________(结果用最简分数表示) 1.【2015·新课标II】某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下: A地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89 B地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79 (Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,得出结论即可); 价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率. 2.【2015·福建】某银行规定,一张银行卡若在一天内出现3次密码尝试错误,该银行卡将被锁定,小王到银行取钱时,发现自己忘记了银行卡的密码,但是可以确定该银行卡的正确密码是他常用的6个密码之一,小王决定从中不重复地随机选择1个进行尝试.若密码正确,则结束尝试;否则继续尝试,直至该银行卡被锁定. (Ⅰ)求当天小王的该银行卡被锁定的概率; (Ⅱ)设当天小王用该银行卡尝试密码次数为X,求X的分布列和数学期望. 3.【2015·山东】若n是一个三位正整数,且n的个位数字大于十位数字,十位数字大于百位数字,则称n为“三位递增数”(如137,359,567等).在某次数学趣味活动中,每位参加者需从所有的“三位递增数”中随机抽取1个数,且只能抽取一次.得分规则如下:若抽取的“三位递增数”的三个数字之积不能被5整除,参加者得0分;若能被5整除,但不能被10 分;若能被10整除,得1分. 整除,得1 (I)写出所有个位数字是5的“三位递增数” ; (II)若甲参加活动,求甲得分X的分布列和数学期望EX. 4.【2015·安徽】已知2件次品和3件正品放在一起,现需要通过检测将其区分,每次随机检测一件产品,检测后不放回,直到检测出2件次品或者检测出3件正品时检测结束. (Ⅰ)求第一次检测出的是次品且第二次检测出的是正品的概率; (Ⅱ)已知每检测一件产品需要费用100元,设X表示直到检测出2件次品或者检测出3件正品时所 需要的检测费用(单位:元),求X的分布列和均值(数学期望). 统计和统计案例 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率和统计交汇等. 2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题. 1. 随机抽样 (1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2. 常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3. 用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 数字特征 样本数据 频率分布直方图 众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标 中位数 将数据按大小依次排列,处在最 中间位置的一个数据(或最中间两个数据的平均数) 把频率分布直方图划分左右两个面积相等的分界线和x 轴交点的横坐标 平均数 样本数据的算术平均数 每个小矩形的面积乘以小矩形底边中点的横坐标之和 (2)方差:s 2=n [(x 1-x )2+(x 2-x )2+…+(x n -x )2 ]. 标准差: s = 1n [ x 1-x 2 +x 2-x 2 +…+x n -x 2 ]. 4. 变量的相关性和最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q = i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5. 独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是: y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计 a +c b +d n 则K 2 = n ad -bc 2a +b c + d a +c b +d (其中n =a +b +c +d 为样本容量). 考点一 抽样方法 例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为 ( ) A .7 B .9 C .10 D .15 答案 C 分析 由系统抽样的特点知:抽取号码的间隔为 960 32 =30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分 成几个组,则分段间隔即为N n (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样 高中数学之概率与统计 求等可能性事件、互斥事件和相互独立事件的概率 解此类题目常应用以下知识: (1)等可能性事件(古典概型)的概率:P(A)=)()(I card A card =n m ; 等可能事件概率的计算步骤: 计算一次试验的基本事件总数n ; 设所求事件A ,并计算事件A 包含的基本事件的个数m ; 依公式 ()m P A n = 求值; 答,即给问题一个明确的答复. (2)互斥事件有一个发生的概率:P(A +B)=P(A)+P(B); 特例:对立事件的概率:P(A)+P(A )=P(A +A )=1. (3)相互独立事件同时发生的概率:P(A ·B)=P(A)·P(B); 特例:独立重复试验的概率:Pn(k)=k n k k n p p C --)1(.其中P 为事件A 在一次试验中发生的 概率,此式为二项式[(1-P)+P]n 展开的第k+1项. (4)解决概率问题要注意“四个步骤,一个结合”: 求概率的步骤是: 第一步,确定事件性质?? ?? ???等可能事件 互斥事件 独立事件 n 次独立重复试验 即所给的问题归结为四类事件中的某一种. 第二步,判断事件的运算 ?? ?和事件积事件 即是至少有一个发生,还是同时发生,分别运用相加或相乘事件. 第三步,运用公式()()()()()()()()(1) k k n k n n m P A n P A B P A P B P A B P A P B P k C p p -? =???+=+? ??=??=-??等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解 第四步,答,即给提出的问题有一个明确的答复. 例1. 在五个数字12345,,,,中,。 例2. 若随机取出三个数字,则剩下两个数字都是奇数的概率是 (结果用数值表示). [解答过程]0.3提示:13 35C 33. 54C 10 2P ===? 第十三章概率与统计本章知识结构图 第一节 概率及其计算 考纲解读 1.了解随机事件发生的不确定性、频率的稳定性、概率的意义、频率与概率的区别。 2.了解两个互斥事件的概率的加法公式。 3.掌握古典概型及其概率计算公式。 4.了解随机数的意义,能运用模拟方法估计概率。 5.了解几何概型的意义。 命题趋势探究 1.本部分为高考必考内容,在选择题、填空题和解答题中都有渗透。 2.命题设置以两种概型的概率计算及运用互斥、对立事件的概率公式为核心内容,题型及分值稳定,难度中等或中等以下。 知识点精讲 一、必然事件、不可能事件、随机事件 在一定条件下: ①必然要发生的事件叫必然事件; ②一定不发生的事件叫不可能事件; ③可能发生也可能不发生的事件叫随机事件。 二、概率 在相同条件下,做次重复实验,事件A 发生次,测得A 发生的频率为,当很大时,A 发生的频率总是在某个常数附近摆动,随着的增加,摆动幅度越来越小,这时就把这个常数叫做A 的概率,记作。对于必然事件A ,;对于不可能事件A ,=0. 三、基本事件和基本事件空间 在一次实验中,不可能再分的事件称为基本事件,所有基本事件组成的集合称为基本事件空间。 四、两个基本概型的概率公式 1、古典概型 条件:1、基本事件空间含有限个基本事件 2、每个基本事件发生的可能性相同 ()(A) = ()A card P A card = Ω包含基本事件数基本事件总数 2、几何概型 条件:每个事件都可以看作某几何区域Ω的子集A ,A 的几何度量(长度、面积、体积或时间)记为 A μ. ()P A = A μμΩ 。 五、互斥事件的概率 1、互斥事件 在一次实验中不能同时发生的事件称为互斥事件。事件A 与事件B 互斥,则 ()()() P A B P A P B =+U 。 2、对立事件 事件A,B 互斥,且其中必有一个发生,称事件A,B 对立,记作B A =或A B =。 ()() 1P A p A =- 。 3、互斥事件与对立事件的联系 对立事件必是互斥事件,即“事件A ,B 对立”是”事件A ,B 互斥“的充分不必要条件。 题型归纳及思路提示 题型176 古典概型 思路提示 首先确定事件类型为古典概型,古典概型特征有二:有限个不同的基本事件及各基本事件发生的可能性是均等的;其次计算出基本事件的总数及事件A 所包含的基本事件数;最后计算 ()A P A = 包含基本事件数 基本事件总数。 例13.1 设平面向量(),1m a m =,()2,n b n = ,其中{}, 1.2,3,4m n ∈ (1)请列出有序数组(),m n 的所有可能结果; (2) 若“使得()m m n a a b ⊥-成立的(),m n 为事件A ,求事件A 发生的概率。 分析:两向量垂直的充要条件是两向量的数量积为0,从而可得m 与n 的关系,再从以上 (),m n 的16个有序数组中筛选出符合条件的,即得事件A 包含的基本事件个数。 解析:(1)由{}, 1.2,3,4m n ∈,有序数组(),m n 的所有可能结果为()1,1 , ()()() 1,2,1,3,1,4, ()()()() 2,1,2,2,2,3,2,4, ()()()() 3,1,3,2,3,3,3,4, ()()()()4,1,4,2,4,3,4,4 共16个。 (2)因为(),1m a m =,()2,n b n =,所以()2,1m n a b m n -=-- .又()m m n a a b ⊥-,得 ()(),12,10m m n ?--= ,即22m 10m n -+-= ,所以()21n m =- 。故事件A 包含的 全国一卷真题分析---概率统计 1.(2011年)根据以往统计资料,某地车主购买甲种保险的概率为0.5,购买乙种保险但不购买甲种保险的 概率为0.3,设各车主购买保险相互独立. (Ⅰ)求该地1位车主至少购买甲、乙两种保险中的l种的概率; (Ⅱ)X表示该地的l00位车主中,甲、乙两种保险都不购买的车主数.求X的期望. 2.(2012年)某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售.如果 当天卖不完,剩下的玫瑰花作垃圾处理.(Ⅰ)若花店一天购进16朵玫瑰花,求当天的利润y(单位:元)关于当天需求量n(单位:枝,N n )的函数解析式;(Ⅱ)花店记录了100天玫瑰花的日需求量(单位:枝),整理得下表: 以100天记录的各需求量的频率作为 各需求量发生的概率. (ⅰ)若花店一天购进16枝玫瑰花,X表示当天的利润(单位:元),求X的分布列、数学期望及方差; (ⅱ)若花店计划一天购进16枝或17枝玫瑰花,你认为应购进16枝还是17枝?请说明理由. 3.(2013年)一批产品需要进行质量检验,检验方案是:先从这批产品中任取4件作检验,这4件产品中 优质品的件数记为n.如果n=3,再从这批产品中任取4件作检验,若都为优质品,则这批产品通过检验;如果n=4,再从这批产品中任取1件作检验,若为优质品,则这批产品通过检验;其他情况下, 这批产品都不能通过检验.假设这批产品的优质品率为50%,即取出的产品是优质品的概率都为1 2, 且各件产品是否为优质品相互独立. (1)求这批产品通过检验的概率; (2)已知每件产品检验费用为100元,凡抽取的每件产品都需要检验,对这批产品作质量检验所需的费用记为X(单位:元),求X的分布列及数学期望. 1 §10.2统计及统计案例 考纲解读 分析解读 从近几年的高考试题来看,本部分在高考中的考查点如下:1.主要考查分层抽样的定义,频率分布直方图,平均数、方差的计算,识图能力及借助概率知识分析、解决问题的能力;2.在频率分布直方图中,注意小矩形的高=频率/组距,小矩形的面积为频率,所有小矩形的面积之和为1;3.分析两个变量间的相关关系,通过独立性检验判断两个变量是否相关.本节内容在高考中分值为17分左右,属中档题. (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4. 所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为100-100×0.9-5=5. 所以总体中分数在区间[40,50)内的人数估计为400× =20. (3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60, 所以样本中分数不小于70的男生人数为60× =30. 所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2. 所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2. 五年高考 考点一 抽样方法 1.(2015北京,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( ) 11 12 13 3 5 7 2 2 4 6 9 1 5 5 7 图1 统计与概率专题 一、知识点 1、随机抽样:系统抽样、简单随机抽样、分层抽样 1、用简单随机抽样从100名学生(男生25人)中抽选20人进行评教,某男生被抽到的概率是( ) A . 1001 B .251 C .5 1 D . 5 1 2、为了解1200名学生对学校教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k 为( ) A .40 B .30 C .20 D .12 3、某单位有职工160人,其中业务员有104人,管理人员32人,后勤服务人员24人,现用分层抽样法从中抽取一容量为20的样本,则抽取管理人员( ) A .3人 B .4人 C .7人 D .12人 2、古典概型与几何概型 1、一枚硬币连掷3次,只有一次出现正面的概率是( ) A .83 B .32 C .31 D .4 1 2、如图所示,在正方形区域任意投掷一枚钉子,假设区域内每一点被投中的可能性相等,那么钉子投进阴影区域的概率为____________. 3、线性回归方程 用最小二乘法求线性回归方程系数公式1 2 211 ???n i i i n i x y nx y b a y bx x nx ==-==--∑∑,. 二、巩固练习 1、随机抽取某中学12位高三同学,调查他们春节期间购书费用(单位:元),获得数据的茎叶图如图1, 这12位同学购书的平均费用是( ) A.125元 B.5.125元 C.126元 D.5.126元 2、200辆汽车通过某一段公路时的时速频率分布直方图如图所示,时速在[50,60) 的汽车大约有( ) A .30辆 B . 40辆 C .60辆 D .80辆 3、某校有高级教师26人,中级教师104人,其他教师若干人.为了了解该校教师 的工资收入情况,若按分层抽样从该校的所有教师中抽取56人进行调查,已知从其 他教师中共抽取了16人,则该校共有教师 ______人. 4、执行下边的程序框图,若0.8p =,则输出的n = . 0.04 0.030.020.01频率 组距时速8070605040开始 10n S ==, S p 是 输入p 结束 输出n 12n S S =+ 否 1n n =+ (第12题图) 高考复习专题之:概率与统计 一、概率:随机事件A 的概率是频率的稳定值,反之,频率是概率的近似值. 1.随机事件A 的概率0()1P A ≤≤,其中当()1P A =时称为必然事件;当()0P A =时称为不可能事件P(A)=0; 注:求随机概率的三种方法: (一)枚举法 例1如图1所示,有一电路AB 是由图示的开关控制,闭合a ,b ,c , d , e 五个开关中的任意两个开关,使电路形成通路.则使电路形成通 路的概率是 . 分析:要计算使电路形成通路的概率,列举出闭合五个开关中的任意 两个可能出现的结果总数,从中找出能使电路形成通路的结果数,根据概率的意义计算即可。 解:闭合五个开关中的两个,可能出现的结果数有10种,分别是a b 、a c 、a d 、a e 、bc 、bd 、be 、cd 、ce 、de ,其中能形成通路的有6种,所以p(通路)= 106=5 3 评注:枚举法是求概率的一种重要方法,这种方法一般应用于可能出现的结果比较少的事件的概率计算. (二)树形图法 例2小刚和小明两位同学玩一种游戏.游戏规则为:两人各执“象、虎、鼠”三张牌,同时各出一张牌定胜负,其中象胜虎、虎胜鼠、鼠胜象,若两人所出牌相同,则为平局.例如,小刚出象牌,小明出虎牌,则小刚胜;又如, 两人同时出象牌,则两人平局.如果用A 、B 、C 分别表示小刚的象、虎、鼠三张牌,用A 1、B 1、C 1分别表示小明 的象、虎、鼠三张牌,那么一次出牌小刚胜小明的概率是多少? 分析:为了清楚地看出小亮胜小刚的概率,可用树状图列出所有可能出现的结果,并从中找出小刚胜小明可能出现的结果数。 解:画树状图如图树状图。由树状图(树形图)或列表可知,可能出现的结果有9种,而且每种结果出现的可能性相同,其中小刚胜小明的结果有3种.所以P (一次出牌小刚胜小明)= 31 点评:当一事件要涉及两个或更多的因素时,为了不重不漏地列出所有可能的结果,通过画树形图的方法来计算概率 (三)列表法 例3将图中的三张扑克牌背面朝上放在桌面上,从中随机摸出两张,并用这两张扑克牌上的数字组成一个两位数.请你用画树形(状)图或列表的方法求:(1)组成的两位数是偶数的概率;(2)组成的两位数是6的倍数的概率. 分析:本题可通过列表的方法,列出所有可能组成的两位数的可能情况,然后再找出组成的两位数是偶数的可能情况和组成两位数 统计概率大题题型总结 题型一 频率分布直方图与茎叶图 例1.(2013广东理17)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如 图所示,其中茎为十位数,叶为个位数. (Ⅰ) 根据茎叶图计算样本均值; (Ⅱ) 日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12名工人中有几名优秀工人; (Ⅲ) 从该车间12名工人中,任取2人,求恰有名优秀工人的概率. 例2.(2013新课标Ⅱ理)经销商经销某种农产品,在一个销售季度内,每售出t 该产品获利润500 元,未售出的产品,每t 亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130t 该农产品,以X (单位:t,150100≤≤X )表示下一个销售季度内的市场需求量,T (单位:元)表示下一个销售季度内销商该农产品的利润. (Ⅰ)将T 表示为X 的函数; (Ⅱ)根据直方图估计利润T 不少于57000元的概率; 1 7 9 2 0 1 5 3 0 第17题图 (Ⅲ)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若[100,110)X ∈,则取105X =,且105X =的概率等于需求量落入[100,110)的概率),求利润T 的数学期望. 变式1. 【2015高考重庆,理3】重庆市2013年各月的平均气温(o C )数据的茎叶图如下: 08912 58 200338312 则这组数据的中位数是( ) A 、19 B 、20 C 、21.5 D 、23 /频率组距0.010 0.0150.0200.0250.030100110120130140150需求量/x t 高考数学概率与统计 SANY GROUP system office room 【SANYUA16H- 第16讲概率与统计 概率内容的新概念较多,相近概念容易混淆,本课时就学生易犯错误作如下归纳总结: 类型一“非等可能”与“等可能”混同 例1 掷两枚骰子,求所得的点数之和为6的概率. 错解掷两枚骰子出现的点数之和2,3,4,…,12共11种基本事件,所以概率为 P=1 11 剖析以上11种基本事件不是等可能的,如点数和2只有(1,1),而点数之和为6有(1,5)、(2,4)、(3,3)、(4,2)、(5,1)共5种.事实上,掷两枚骰子共有36 种基本事件,且是等可能的,所以“所得点数之和为6”的概率为P=5 36 . 类型二“互斥”与“对立”混同 例2 把红、黑、白、蓝4张纸牌随机地分给甲、乙、丙、丁4个人,每个人分得1张,事件“甲分得红牌”与“乙分得红牌”是() A.对立事件 B.不可能事件 C.互斥但不对立事件 D.以上均不对 错解A 剖析本题错误的原因在于把“互斥”与“对立”混同,二者的联系与区别主要体现在: (1)两事件对立,必定互斥,但互斥未必对立;(2)互斥概念适用于多个事件,但对 立概念只适用于两个事件;(3)两个事件互斥只表明这两个事件不能同时发生,即至多只能发生其中一个,但可以都不发生;而两事件对立则表示它们有且仅有一个发生. 事件“甲分得红牌”与“乙分得红牌”是不能同时发生的两个事件,这两个事件可能恰有一个发生,一个不发生,可能两个都不发生,所以应选C. 类型三 “互斥”与“独立”混同 例3 甲投篮命中率为O .8,乙投篮命中率为,每人投3次,两人恰好都命中2次的 概率是多少? 错解 设“甲恰好投中两次”为事件A ,“乙恰好投中两次”为事件B ,则两人都恰好投中 两次为事件A+B ,P(A+B)=P(A)+P(B): 22223 30.80.20.70.30.825c c ?+?= 剖析 本题错误的原因是把相互独立同时发生的事件当成互斥事件来考虑,将两人都恰 好投中2次理解为“甲恰好投中两次”与“乙恰好投中两次”的和.互斥事件是指 两个事件不可能同时发生;两事件相互独立是指一个事件的发生与否对另一个 事件发生与否没有影响,它们虽然都描绘了两个事件间的关系,但所描绘的关 系是根本不同. 解: 设“甲恰好投中两次”为事件A ,“乙恰好投中两次”为事件B ,且A ,B 相互独 立, 则两人都恰好投中两次为事件A·B ,于是P(A·B)=P(A)×P(B)= 类型四 “条件概率P(B / A)”与“积事件的概率P(A·B)”混同 例4 袋中有6个黄色、4个白色的乒乓球,作不放回抽样,每次任取一球,取2次, 求第二次才取到黄色球的概率. 错解 记“第一次取到白球”为事件A ,“第二次取到黄球”为事件B,”第二次才取到黄球” 为事件C,所以P(C)=P(B/A)=6293 =. 剖析 本题错误在于P(A ?B)与P(B/A)的含义没有弄清, P(A ?B)表示在样本空间S 中,A 与B 同时发生的概率;而P (B/A )表示在缩减的样本空间S A 中,作为条件的 A 已经发生的条件下事件 B 发生的概率。 解: P (C )= P(A ?B)=P (A )P (B/A )= 46410915 ?=. 备用 专题10.2 统计与统计案例 一、填空题:请把答案直接填写在答题卡相应的位置........ 上(共10题,每小题6分,共计60分). 1.交通部门对某路段公路上行驶的汽车速度实施监控,从速度在 的汽车中抽取150辆进行分析,得到数据的频率分布直方图如图所示,则速度在 以下的汽车有辆. ) 【答案】75 2.某校高一年级有学生人,高二年级有学生人,现采用分层抽样的方法从全校学生中抽出人,其中从高一年级学生中抽出人,则从高三年级学生中抽取的人数为 ▲ . 【答案】17 【解析】高一高二人数之比为10:9,因此高二抽出的人数为18人,高三抽出的人数为55-20-18=17人 3.若一组样本数据9,8,x ,10,11的平均数为10,则该组样本数据的方差为▲. 【答案】2 【解析】由题意得,因此方差为 4.某校共有教师200人,男学生800人,女学生600人,现用分层抽样的方法从所有师生中抽取一个容量为的样本,已知从男学生中抽取的人数为100人,那么 ▲ . 【答案】200 【解析】男学生占全校总人数,那么 5.从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中的视力情况进行统计,其频率分布直方图如图所示。若某高校A 专业对视力的要求在0.9以上,则该班学生中能报A 专业的人数为. 【答案】20 【解析】根据频率分布直方图,得视力在0.9以上的频率为(1.00+0.75+0.25)×0.2=0.4, ∴该班学生中能报A专业的人数为50×0.4=20. 6.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人. 【答案】37,20 7.下图是2014年在怀化市举行的演讲比赛,七位评委为第一位演讲者打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为. 【答案】, 【解析】去掉一个最高分和一个最低分之后,剩余的五个数据依次是、、、、,平均数为 高考数学统计与统计案例1.小吴一星期的总开支分布如图 1 所示,一星期的食品开支如图 2 所示,则小吴一星期的鸡蛋开支占总开支的百分比为() A.1%B.2%C.3%D.5% C[ 由图 1 所示,食品开支占总开支的 30%,由图 2 所示,鸡蛋开支占食 品开支的30 = 1 , 30+40+100+80+ 50 10 1 ∴鸡蛋开支占总开支的百分比为30%×10=3%.故选 C.] 2.(2019 德·州模拟 )某人到甲、乙两市各7 个小区调查空置房情况,调查得到的小区空置房的套数绘成了如图所示的茎叶图,则调查中甲市空置房套数的中位数与乙市空置房套数的中位数之差为() A.4B. 3C.2D.1 B[ 由茎叶图可以看出甲、乙两市的空置房的套数的中位数分别是79,76,因此其差是 79- 76=3,故选 B.] 3.某工厂对一批新产品的长度(单位: mm)进行检测,如图是检测结果的频最全高考数学统计专题解析版【真题】
全国各地高考数学统计与概率大题专题汇编.doc
(典型题)高考数学二轮复习-知识点总结-统计与统计案例
高考数学概率与统计知识点汇编
(完整word版)2018年高考数学总复习概率及其计算
2020高考数学概率统计(大题)
高考数学统计及统计案例
高考数学复习专题:统计与概率(经典)
高考数学概率与统计专题复习
概率统计大题题型总结(理)学生版
高考数学概率与统计
2019年高考数学一轮复习专题10.2统计与统计案例测
高考数学统计与统计案例.doc