2020高考数学一轮复习第9章统计统计案例第3讲变量相关关系与统计案例增分练
【2019最新】精选高考数学一轮复习第9章统计统计案例第3讲变量
相关关系与统计案例增分练
板块四模拟演练·提能增分
[A级基础达标]
1.[2018·湖北模拟]已知变量x和y满足关系y=-0.1x+1,变量y与z正相
关.下列结论中正确的是( )
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
答案C
解析因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,
可设z=y+,>0,则z=y+=-0.1x++,
故x与z负相关.
2.[2018·桂林模拟]根据如下样本数据:
)
B.a>0,b<0
A.a>0,b>0
D.a<0,b<0
C.a<0,b>0
答案B
解析由表中数据画出散点图,如图,
由散点图可知b<0,a>0. 3.通过随机询问200名性别不同的大学生是否爱好踢键子运动,计算得到统计
量K2的观测值k≈4.892,参照附表,得到的正确结论是( )
B.有97.5%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别无关”
答案C
解析因为K2的观测值k≈4.892>3.841,所以有95%以上的把握认为“爱好该
项运动与性别有关”.4.[2018·洛阳模拟]为研究语文成绩和英语成绩之间是否具有线性相关关系,
统计某班学生的两科成绩得到如图所示的散点图(x轴、y轴的单位长度相同),用回归直线方程=bx+a近似地刻画其相关关系,根据图形,以下结论最有可能成立的是
( )
A.线性相关关系较强,b的值为1.25
B.线性相关关系较强,b的值为0.83
C.线性相关关系较强,b的值为-0.87
D.线性相关关系较弱,无研究价值
答案B
解析由散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关
关系较强,且应为正相关,所以回归直线方程的斜率应为正数,且从散点图观察,回归直线方程的斜率应该比y=x的斜率要小一些,综上可知应选B. 5.某产品的广告费用x(单位:万元)与销售额y(单位:万元)的统计数据如下表:
额为( )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
答案B
解析==3.5,==42.因为回归直线过点(,),所以42=9.4×3.5+,解得=
9.1.故回归方程为=9.4x+9.1.所以当x=6时,=6×9.4+9.1=65.5. 6.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,
得到如图所示2×2列联表:
测值k=≈4.844,则有________的把握认为选修文科与性别有关.
答案95%
解析由题意知,k=≈4.844,因为5.024>4.844>3.841,所以有95%的把握认
为选修文科与性别有关.7.[2018·沧州七校联考]某单位为了制定节能减排的计划,随机统计了某4天
的用电量y(单位:度)与当天气温x(单位:℃),并制作了对照表(如表所示).由表中数据,得线性回归方程=-2x+,当某天的气温为-5 ℃时,预测当天的用电量约
为________度.
答案70
解析气温的平均值=×(18+13+10-1)=10,用电量的平均值=×(24+34
+38+64)=40,因为回归直线必经过点(,),将其代入线性回归方程得40=-2×10
+,解得=60,故回归方程为=-2x+60.当x=-5时,=(-2)×(-5)+60=70,所以当某天的气温为-5 ℃时,预测
当天的用电量约为70度.
8.已知x,y之间的一组数据如下表:
x-;④y =x.则根据最小二乘法的思想求得拟合程度最好的直线是________(填序号).
答案③解析由题意知=4,=6,∴==,∴=-=-,∴=x-,∴填③. 9.由某种设备的使用年限xi(年)与所支出的维修费yi(万元)的数据资料算得如
下结果,=90,iyi=112,i=20,i=25.
(1)求所支出的维修费y对使用年限x的线性回归方程=x+;
(2)①判断变量x与y之间是正相关还是负相关;
②当使用年限为8年时,试估计支出的维修费是多少.
解(1)∵i=20,i=25,∴=i=4,
y ,1.2===∴,5=i = a
^0.2.=1.2×4-5=-= ∴线性回归方程为=1.2x +0.2.
(2)①由(1)知=1.2>0,∴变量x 与y 之间是正相关.
②由(1)知,当x =8时,=9.8,即使用年限为8年时,支出的维修费约是9.8
万元.
10.[2018·聊城模拟]在某校举行的航天知识竞赛中,参与竞赛的文科生与理科生人数之比为1∶3,且成绩分布在[40,100],分数在80以上(含80)的同学获奖.按文、理科用分层抽样的方法抽取200人的成绩作为样本,得到成绩的频率分布直方图
如图所示.
(1)求a 的值,并计算所抽取样本的平均值(同一组中的数据用该组区间的中点值
作代表);
(2)填写下面的2×2列联表,并判断能否有超过95%的把握认为“获奖与学生的
文、理科有关”?
文科生
理科生
合计 获奖
5 不获奖
合计
200
n ad -bc 2
a +
b
c +
d a +c
b +d
=
K2 )
0k ≥2
K (P 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0k
2.072 2.706
3.841 5.024 6.635 7.879 10.828
x
-69.=95×0.05+85×0.15+75×0.3+65×0.25+55×0.15+45×0.1= (2)2×2列联表如下:
文科生 理科生 合计 获奖
5 35 40 不获奖 45 115 160 合计 50 150
200
所以有超过95%的把握认为“获奖与学生的文、理科有关”.
[B 级 知能提升]
1.对具有线性相关关系的变量x ,y 有一组观测数据(xi ,yi)(i =1,2,…,8),其回归直线方程是=x +,且x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=6.则
实数的值是( ) 1
2
A. B. C. D. 答案 B
解析 依题意可知样本点的中心为,则=×+,解得=.
2.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非
优秀统计成绩,得到如下所示的列联表:
优秀 非优秀
总计 甲班 10 b 乙班
c
30 总计105
( )
n ad -bc 2
a +
b
c +
d a +c
b +d
=
K2参考公式: 附表:
)
k ≥2K (P 0.050 0.010 0.001 k
3.841 6.635 10.828
35B .列联表中c 的值为15,b 的值为50
C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”
D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关
系”
答案 C
解析 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,选项A ,B 错误.根据列联表中的数据,得到K2=≈6.109>3.841,因此
有95%的把握认为“成绩与班级有关系”,选项C 正确.
3.[2018·赣州模拟]在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散
点图中,若所有样本点(xi ,yi)(i =1,2,…,6)都在曲线y =bx2-附近波动.经计
算xi =11,yi =13,x =21,则实数b 的值为________.
57
答案 解析 令t =x2,则曲线的回归方程变为线性的回归方程,即y =bt -,此时=
=,==,代入y =bt -,得=b×-,解得b =.
4.某校开展“翻转合作学习法”教学试验,经过一年的实践后,对“翻转班”和“对照班”的220名学生的数学学习情况进行测试,按照大于或等于120分为“成
绩优秀”,120分以下为“成绩一般”统计,得到如下的2×2列联表:
成绩优秀 成绩一般 合计 对照班
20 90 110 翻转班 40 70 110 合计 60 160
220
(1)“成绩优秀与翻转合作学习法”有关;
(2)为了交流学习方法,从这次测试数学成绩优秀的学生中,用分层抽样的方法抽出6名学生,再从这6名学生中抽出3名交流学习方法,求至少抽到一名“对照班”
学生的概率.
n ad -bc 2
a +b
c +
d a +c
b +d
=
K2附: )
0k ≥2
K (P 0.10 0.05 0.025 0.010 0.005 0.001 0k
2.706
3.841 5.024 6.635 7.879 10.828
∴在犯错误的概率不超过0.001的前提下,不能认为“成绩优秀与翻转合作学习
法”有关.
(2)设从“翻转班”中抽取x 人,从“对照班”中抽取y 人,由分层抽样的定义
可知==,解得x =4,y =2.
在这6名学生中,设“对照班”的2名学生分别为A1,A2,“翻转班”的4名学
生分别为B1,B2,B3,B4.则所有的抽样情况如下,
{A1,A2,B1},{A1,A2,B2},{A1,A2,B3},{A1,A2,B4}, {A1,B1,B2},{A1,B1,B3},{A1,B1,B4},{A1,B2,B3}, {A1,B2,B4},{A1,B3,B4},{A2,B1,B2},{A2,B1,B3},
{A2,B1,B4},{A2,B2,B3},{A2,B2,B4},{A2,B3,B4}, {B1,B2,B3},{B1,B2,B4},{B1,B3,B4},{B2,B3,B4},
共20种.
其中至少有一名“对照班”学生的情况有16种.
记事件A 为至少抽到一名“对照班”学生交流学习方法,则P(A)===0.8. 5.[2018·太原模拟]假设关于某种设备的使用年限x(年)与所支出的维修费用
y(万元)有如以下的统计数据:
(1)求,;
(2)对x ,y 进行线性相关性检验;
(3)如果x 与y 具有线性相关关系,求出回归直线方程;
(4)估计使用年限为10年时,维修费用约是多少?
解 (1)==4,
y
-5.== (2)因为xiyi -5=112.3-5×4×5=12.3,
∑5
i =1,10=5×16-90=52-x ∑5i
=1,15.8=125-140.8=52-y 所以r ==≈0.987.
因为0.987>0.75,所以x 与y 之间具有很强的线性相关关系.
(3)因为===1.23,=-=5-1.23×4=0.08,所以所求的回归直线方程为=
1.23x +0.08.
(4)当x =10时,=1.23×10+0.08=12.38,即估计使用年限为10年时,维修
费用约为12.38万元.
最全高考数学统计专题解析版【真题】
最全高考数学统计专题解析版【真题】 -CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN
第十一章统计、统计案例 第一部分六年高考荟萃 2013年高考题 1 .(2013年高考陕西卷(理))某单位有840名职工, 现采用系统抽样方法, 抽取 42人做问卷调查, 将840人按1, 2, , 840随机编号, 则抽取的42人中, 编号 落入区间[481, 720]的人数为()A.11 B.12 C.13 D.14 2 .(2013年普通高等学校招生统一考试安徽数学(理)试题(纯WORD版))某班级有 50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名 女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名 女生的成绩分别为88,93,93,88,93.下列说法一定正确的是()A.这种抽样方法是一种分层抽样 B.这种抽样方法是一种系统抽样 C.这五名男生成绩的方差大于这五名女生成绩的方差 D.该班级男生成绩的平均数小于该班女生成绩的平均数 3 .(2013年普通高等学校招生统一考试福建数学(理)试题(纯WORD版))某校从高 一年级学生中随机抽取部分学生,将他们的模块测试成绩分为6组:[40,50), [50,60), [60,70), [70,80), [80,90), [90,100)加以统计,得到如图所示的频率分布 直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60 分的学生人数为()A.588 B.480 C.450 D.120 4 .(2013年高考江西卷(理))总体有编号为01,02,…,19,20的20个个体组成。利用下 面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字 7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481 )A.08 B.07 C.02 D.01 5.(2013年高考上海卷(理))盒子中装有编号为1,2,3,4,5,6,7,8,9的九个球,从中任意取出两个,则这两个球的编号之积为偶数的概率是 ___________(结果用最简分数表示)
统计与统计案例真题与解析
统计与统计案例 A 级 基础 一、选择题 1.某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n 人中抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n =( ) A .860 B .720 C .1 020 D .1 040 2.为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( ) A .13 B .19 C .20 D .51 3.“关注夕阳、爱老敬老”——某爱心协会从2013年开始每年向敬老院捐赠物资和现金,下表记录了第x 年(2013年是第一年)与捐赠的现金y (单位:万元)的对应数据,由此表中的数据得到了y 关于x 的线性回归方程y ^ =mx +0.35,则预测2019年捐赠的现金大约是( ) A.5万元 C .5.25万元 D .5.5万元 4.如图所示的茎叶图记录了甲乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )
A.3,5 B.5,5 C.3,7 D.5,7 5.(2019·衡水中学检测)某超市从2019年甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取100个,并按(0,10],(10,20],(20,30],(30,40],(40,50]分组,得到频率分布直方图如下: 记甲种酸奶与乙种酸奶的日销售量(单位:箱)的方差分别为s21,s22,则频率分布直方图(甲)中的a的值及s21与s22的大小关系分别是() A.a=0.015,s21 统计和统计案例 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率和统计交汇等. 2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题. 1. 随机抽样 (1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2. 常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3. 用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 数字特征 样本数据 频率分布直方图 众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标 中位数 将数据按大小依次排列,处在最 中间位置的一个数据(或最中间两个数据的平均数) 把频率分布直方图划分左右两个面积相等的分界线和x 轴交点的横坐标 平均数 样本数据的算术平均数 每个小矩形的面积乘以小矩形底边中点的横坐标之和 (2)方差:s 2=n [(x 1-x )2+(x 2-x )2+…+(x n -x )2 ]. 标准差: s = 1n [ x 1-x 2 +x 2-x 2 +…+x n -x 2 ]. 4. 变量的相关性和最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q = i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5. 独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是: y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计 a +c b +d n 则K 2 = n ad -bc 2a +b c + d a +c b +d (其中n =a +b +c +d 为样本容量). 考点一 抽样方法 例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为 ( ) A .7 B .9 C .10 D .15 答案 C 分析 由系统抽样的特点知:抽取号码的间隔为 960 32 =30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分 成几个组,则分段间隔即为N n (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样 第三章 统计案例 §3.1 独立性检验(1) 1. 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人, 不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病. 问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”? 为了研究这个问题,(1)引导学生将上述数据用下表来表示: 一.建构数学 1.独立性检验: (1)假设0H :患病与吸烟没有关系. 若将表中“观测值”用字母表示,则得下表: 如果实际观测值与假设求得的估计值相差不大,就可以认为所给数据(观测值)不能否定假设0H .否则,应认为假设0H 不能接受,即可作出与假设0H 相反的结论. (2)卡方统计量: 为了消除样本对上式的影响,通常用卡方统计量(χ22 ()-=∑ 观测值预期值预期值 )来进行估计. 卡方χ2统计量公式: χ2() ()()()() 2 n ad bc a b c d a c b d -=++++(其中n a b c d =+++) 由此若0H 成立,即患病与吸烟没有关系,则χ2的值应该很小.把37,183,21,274a b c d ====代入计算得 χ211.8634=,统计学中有明确的结论,在0H 成立的情况下,随机事件“2 6.635χ≥” 发生的概率约为0.01,即2 ( 6.635)0.01P χ ≥≈,也就是说,在0H 成立的情况下,对统计量χ2进行多次观测, 观测值超过6.635的频率约为0.01.由此,我们有99%的把握认为0H 不成立,即有99%的把握认为“患病与吸烟有关系”. 象以上这种用2 χ统计量研究吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检验. 1.【2015·新课标II】某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下: A地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89 B地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79 (Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,得出结论即可); 价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率. 2.【2015·福建】某银行规定,一张银行卡若在一天内出现3次密码尝试错误,该银行卡将被锁定,小王到银行取钱时,发现自己忘记了银行卡的密码,但是可以确定该银行卡的正确密码是他常用的6个密码之一,小王决定从中不重复地随机选择1个进行尝试.若密码正确,则结束尝试;否则继续尝试,直至该银行卡被锁定. (Ⅰ)求当天小王的该银行卡被锁定的概率; (Ⅱ)设当天小王用该银行卡尝试密码次数为X,求X的分布列和数学期望. 3.【2015·山东】若n是一个三位正整数,且n的个位数字大于十位数字,十位数字大于百位数字,则称n为“三位递增数”(如137,359,567等).在某次数学趣味活动中,每位参加者需从所有的“三位递增数”中随机抽取1个数,且只能抽取一次.得分规则如下:若抽取的“三位递增数”的三个数字之积不能被5整除,参加者得0分;若能被5整除,但不能被10 分;若能被10整除,得1分. 整除,得1 (I)写出所有个位数字是5的“三位递增数” ; (II)若甲参加活动,求甲得分X的分布列和数学期望EX. 4.【2015·安徽】已知2件次品和3件正品放在一起,现需要通过检测将其区分,每次随机检测一件产品,检测后不放回,直到检测出2件次品或者检测出3件正品时检测结束. (Ⅰ)求第一次检测出的是次品且第二次检测出的是正品的概率; (Ⅱ)已知每检测一件产品需要费用100元,设X表示直到检测出2件次品或者检测出3件正品时所 需要的检测费用(单位:元),求X的分布列和均值(数学期望). 一、选择题 1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( ) A .73 B .78 C .77 D .76 解析:样本的分段间隔为80 16=5,所以13号在第三组,则最大的编号为13+(16-3)×5 =78.故选B. 答案:B 2.某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量如下表所示: 则这20A .180,170 B .160,180 C .160,170 D .180,160 解析:用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B ,C ;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A. 答案:A 3.(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图,根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 解析:根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A 错误.由图可知,B 、C 、D 正确. 答案:A 4.(2018·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( ) A .5 B .7 C .10 D .50 解析:根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50. 答案:D 5.(2018·兰州模拟)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据: 根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为y ^ =6.5x +17.5,则表中m 的值为( ) A .45 B .50 C .55 D .60 解析:∵x =2+4+5+6+8 5=5, y = 30+40+50+m +705=190+m 5 , ∴当x =5时,y =6.5×5+17.5=50, ∴190+m 5=50,解得m =60. 答案:D §10.2统计及统计案例 考纲解读 分析解读 从近几年的高考试题来看,本部分在高考中的考查点如下:1.主要考查分层抽样的定义,频率分布直方图,平均数、方差的计算,识图能力及借助概率知识分析、解决问题的能力;2.在频率分布直方图中,注意小矩形的高=频率/组距,小矩形的面积为频率,所有小矩形的面积之和为1;3.分析两个变量间的相关关系,通过独立性检验判断两个变量是否相关.本节内容在高考中分值为17分左右,属中档题. (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4. 所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为100-100×0.9-5=5. 所以总体中分数在区间[40,50)内的人数估计为400× =20. (3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60, 所以样本中分数不小于70的男生人数为60× =30. 所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2. 所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2. 五年高考 考点一 抽样方法 1.(2015北京,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( ) 选修2-3第三章《统计案例》 (时间120分钟 满分150分) 一、选择题(共60分) 1.下列属于相关现象的是( ) A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 2.已知盒中装有3只螺口与7只卡口灯泡,这些灯泡的外形与功率都相 同且灯口向下放着,现需要一只卡口灯泡,电工师傅每次从中任取一只并不放回,则在他第1 次抽到的是螺口灯泡的条件下,第2次抽到的是卡口灯泡的概率为 ( ) A.310 B.29 C.78 D.79 3.如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4组数据的线性相关性最大( ) A.E B.C C.D D.A 4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人, 得到如下结果(单位:人) 根据表中数据,你认为吸烟与患肺癌有关的把握有( ) A.90% B.95% C.99% D.100% 5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表: 你认为婴儿的性别与出生时间有关系的把握为( ) A.80% B.90% C.95% D.99% 6.已知有线性相关关系的两个变量建立的回归直线方程为$ y a bx =+,方程中的回归系数b ( ) A.可以小于0 B.只能大于0 C.可以为0 D.只能小于0 7.每一吨铸铁成本c y (元)与铸件废品率x %建立的回归方程568c y x =+,下列说法正确的是( ) A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元 8.下列说法中正确的有:①若0r >,则x 增大时,y 也相应增大;②若0r <,则x 增大时,y 也相应增大;③若1r =,或1r =-,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上( ) A.①② B.②③ C.①③ D.①②③ 9.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表: 不患肺病 患肺病 合计 不吸烟 7775 42 7817 吸烟 2099 49 2148 合计 9874 91 9965 晚上 白天 合计 男婴 24 31 55 女婴 8 26 34 合计 32 57 89 高考复习专题之:概率与统计 一、概率:随机事件A 的概率是频率的稳定值,反之,频率是概率的近似值. 1.随机事件A 的概率0()1P A ≤≤,其中当()1P A =时称为必然事件;当()0P A =时称为不可能事件P(A)=0; 注:求随机概率的三种方法: (一)枚举法 例1如图1所示,有一电路AB 是由图示的开关控制,闭合a ,b ,c , d , e 五个开关中的任意两个开关,使电路形成通路.则使电路形成通 路的概率是 . 分析:要计算使电路形成通路的概率,列举出闭合五个开关中的任意 两个可能出现的结果总数,从中找出能使电路形成通路的结果数,根据概率的意义计算即可。 解:闭合五个开关中的两个,可能出现的结果数有10种,分别是a b 、a c 、a d 、a e 、bc 、bd 、be 、cd 、ce 、de ,其中能形成通路的有6种,所以p(通路)= 106=5 3 评注:枚举法是求概率的一种重要方法,这种方法一般应用于可能出现的结果比较少的事件的概率计算. (二)树形图法 例2小刚和小明两位同学玩一种游戏.游戏规则为:两人各执“象、虎、鼠”三张牌,同时各出一张牌定胜负,其中象胜虎、虎胜鼠、鼠胜象,若两人所出牌相同,则为平局.例如,小刚出象牌,小明出虎牌,则小刚胜;又如, 两人同时出象牌,则两人平局.如果用A 、B 、C 分别表示小刚的象、虎、鼠三张牌,用A 1、B 1、C 1分别表示小明 的象、虎、鼠三张牌,那么一次出牌小刚胜小明的概率是多少? 分析:为了清楚地看出小亮胜小刚的概率,可用树状图列出所有可能出现的结果,并从中找出小刚胜小明可能出现的结果数。 解:画树状图如图树状图。由树状图(树形图)或列表可知,可能出现的结果有9种,而且每种结果出现的可能性相同,其中小刚胜小明的结果有3种.所以P (一次出牌小刚胜小明)= 31 点评:当一事件要涉及两个或更多的因素时,为了不重不漏地列出所有可能的结果,通过画树形图的方法来计算概率 (三)列表法 例3将图中的三张扑克牌背面朝上放在桌面上,从中随机摸出两张,并用这两张扑克牌上的数字组成一个两位数.请你用画树形(状)图或列表的方法求:(1)组成的两位数是偶数的概率;(2)组成的两位数是6的倍数的概率. 分析:本题可通过列表的方法,列出所有可能组成的两位数的可能情况,然后再找出组成的两位数是偶数的可能情况和组成两位数 专题突破练20 统计与统计案例 1. (2020吉林辽源高三检测,18)某城市在进行创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数.满分为100分).从中随机抽取一个容量为120的样本.发现所有数据均在[40,100]内.现将这些分数分成以下6组并画出了样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,回答下列问题: (1)算出第三组[60,70)的频数,并补全频率分布直方图; (2)请根据频率分布直方图,估计样本的众数、中位数和平均数.(每组数据以区间的中点值为代表) 2.下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①;y ^ =-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^ =99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由. 3.(2020河南郑州高三检测,19)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m 的工人数填入下面的列联表: (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K2=n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) ,其中n=a+b+c+d. 专题10.2 统计与统计案例 一、填空题:请把答案直接填写在答题卡相应的位置........ 上(共10题,每小题6分,共计60分). 1.交通部门对某路段公路上行驶的汽车速度实施监控,从速度在 的汽车中抽取150辆进行分析,得到数据的频率分布直方图如图所示,则速度在 以下的汽车有辆. ) 【答案】75 2.某校高一年级有学生人,高二年级有学生人,现采用分层抽样的方法从全校学生中抽出人,其中从高一年级学生中抽出人,则从高三年级学生中抽取的人数为 ▲ . 【答案】17 【解析】高一高二人数之比为10:9,因此高二抽出的人数为18人,高三抽出的人数为55-20-18=17人 3.若一组样本数据9,8,x ,10,11的平均数为10,则该组样本数据的方差为▲. 【答案】2 【解析】由题意得,因此方差为 4.某校共有教师200人,男学生800人,女学生600人,现用分层抽样的方法从所有师生中抽取一个容量为的样本,已知从男学生中抽取的人数为100人,那么 ▲ . 【答案】200 【解析】男学生占全校总人数,那么 5.从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中的视力情况进行统计,其频率分布直方图如图所示。若某高校A 专业对视力的要求在0.9以上,则该班学生中能报A 专业的人数为. 【答案】20 【解析】根据频率分布直方图,得视力在0.9以上的频率为(1.00+0.75+0.25)×0.2=0.4, ∴该班学生中能报A专业的人数为50×0.4=20. 6.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人. 【答案】37,20 7.下图是2014年在怀化市举行的演讲比赛,七位评委为第一位演讲者打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为. 【答案】, 【解析】去掉一个最高分和一个最低分之后,剩余的五个数据依次是、、、、,平均数为 高考数学统计与统计案例1.小吴一星期的总开支分布如图 1 所示,一星期的食品开支如图 2 所示,则小吴一星期的鸡蛋开支占总开支的百分比为() A.1%B.2%C.3%D.5% C[ 由图 1 所示,食品开支占总开支的 30%,由图 2 所示,鸡蛋开支占食 品开支的30 = 1 , 30+40+100+80+ 50 10 1 ∴鸡蛋开支占总开支的百分比为30%×10=3%.故选 C.] 2.(2019 德·州模拟 )某人到甲、乙两市各7 个小区调查空置房情况,调查得到的小区空置房的套数绘成了如图所示的茎叶图,则调查中甲市空置房套数的中位数与乙市空置房套数的中位数之差为() A.4B. 3C.2D.1 B[ 由茎叶图可以看出甲、乙两市的空置房的套数的中位数分别是79,76,因此其差是 79- 76=3,故选 B.] 3.某工厂对一批新产品的长度(单位: mm)进行检测,如图是检测结果的频(典型题)高考数学二轮复习-知识点总结-统计与统计案例
数学选修23第三章统计案例教案
全国各地高考数学统计与概率大题专题汇编.doc
高中数学 专题 统计与统计案例
高考数学统计及统计案例
单元测试:选修2-3第三章《统计案例》
高考数学概率与统计专题复习
专题突破练20 统计与统计案例
2019年高考数学一轮复习专题10.2统计与统计案例测
高考数学统计与统计案例.doc