高考概率与统计专题复习:统计案例
超实用高考数学复习教学课件:专题4 概率与统计第2讲统计与统计案例

• D.从1~4月来看,该省在2019年快递业务收入同比增长率逐月 增长
• 【答案】 D
• (2)(2019·株洲二模)某企业对其生产的一批产品进行检测,得出
每件产品中某种物质含量(单位:克)的频率分布直方图如图所示.则
及抽样方法的选取
标准差的大小比较、方差公式的应用;
利用频数分布表计算频率和平均数、 17
独立性检验的应用
年份 2019 2018
卷别 Ⅰ卷 Ⅱ卷 Ⅲ卷 Ⅰ卷 Ⅱ卷 Ⅲ卷
题号
5 17 3 18 18
考查角度
分值
样本的数字特征
5
频率分布直方图、均值的应用
12
统计图的识别和分析
5
折线图、线性回归方程模型问题
• 众数、中位数、平均数与直方图的关系 • (1)众数为频率分布直方图中最高矩形的底边中点的横坐标. • (2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横
轴交点的横坐标. • (3)平均数等于频率分布直方图中每个小矩形的面积乘小矩形底
边中点的横坐标之和.
• 5.(2019·绵阳二诊)下图所示的茎叶图记录的是甲、乙两个班各
【解析】 样本a1、a2、a3的方差是2,设平均数为 x , 则样本2a1+3,2a2+3,2a3+3的平均数为2 x +3, 方差s2=13[(2a1-2 x )2+(2a2-2 x )2+(2a3-2 x )2], =13×4[(a1- x )2+(a2- x )2+(a3- x )2]=4×2=8. 故样本2a1+3,2a2+3,2a3+3的标准差为:2 2.
(2)根据频率分布直方图得出众数落在第三组[80,90)内, 所以众数为80+2 90=85; 含量在[60,70)之间的频率为0.1, 含量在[70,80)之间的频率为0.2, 含量在[80,90)之间的频率为0.4, 根据概率和为1,可得含量在[90,100)之间的频率为0.3, 所以频率分布直方图的平均数为 65×0.1+75×0.2+85×0.4+95×0.3=84.故选C.
高考数学专题2024概率与统计历年题目解析

高考数学专题2024概率与统计历年题目解析概率与统计作为高考数学的重要部分,占据了相当大的比重。
掌握概率与统计的相关知识对于考生来说是至关重要的。
本文将通过对2024年高考概率与统计专题历年题目的解析,帮助考生更好地理解和掌握这一部分知识点。
一、选择题解析选择题是高考中常见的题型,对于考生来说,熟练掌握解题技巧是很重要的。
题目1:某班有30名学生,其中男生占总人数的40%。
已知从该班随机抽取一名学生,他是男生的概率是多少?解析:根据题目可知男生的人数为30 × 40% = 12人,所以男生的概率是12/30 = 2/5。
题目2:某工厂生产零件,每天生产150个。
已知每个零件的质量标准为99%,A同学随机抽样抽取2个零件,请问这两个零件都合格的概率是多少?解析:每个零件合格的概率为99% × 1/100 = 0.99。
因为是随机抽取,所以这两个零件都合格的概率为0.99 × 0.99 = 0.9801。
二、解答题解析解答题在概率与统计中也占据重要地位,考察学生的综合应用能力和解题能力。
题目3:某校学生的身高服从正态分布,其中男生的平均身高为170cm,标准差为5cm;女生的平均身高为165cm,标准差为4cm。
已知该校男女生比例为2:3,请问在该校随机抽取一个学生,他身高超过175cm的概率是多少?解析:根据题目可知男生的概率为2/5,女生的概率为3/5。
设男生身高超过175cm的概率为p1,女生身高超过175cm的概率为p2。
根据正态分布的性质,可以计算出男生身高超过175cm的概率为0.5 × (1 - p1) = 2/5,女生身高超过175cm的概率为0.5 × (1 - p2) = 3/5。
解方程得到p1 = 1/5,p2 = 2/5,所以在该校随机抽取一个学生,他身高超过175cm的概率为(2/5) × (1/5) + (3/5) × (2/5) = 11/25。
概率与统计 第三讲 统计与统计案例——2023届高考理科数学大单元二轮复习串思路【新课标全国卷】

2023届高考理科数学大单元二轮复习串思路【新课标全国卷】专题八概率与统计第三讲统计与统计案例(一)高考考点解读(二)核心知识整合考点1:抽样方法,样本频率分布、数字特征1.抽样方法三种抽样方法包括:简单随机抽样、系统抽样、分层抽样2.统计图表在频率分布直方图中:①各小矩形的面积表示相应各组的频率,各小矩形的高=频率组距;②各小矩形面积之和等于1;③中位数左右两侧的直方图面积相等,因此可以估计其近似值.3.样本的数字特征(1)众数:在样本数据中,出现次数最多的那个数据.中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数;(2)样本平均数=11211=()nn i i x x x x x n n ⋯∑+++=;(3)样本方差22222=11211[()()()]()n i n i x s x x x x x x x n n ⋯∑=-+-++-=-;(4)样本标准差s .(5)现实中总体所包含的个体数往往较多,总体的平均数与标准差、方差是不知道(或不可求)的,所以我们通常用样本的平均数与标准差、方差来估计总体的平均数与标准差、方差.(6)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定. 『解题技巧』1.系统抽样与分层抽样的求解方法(1)系统抽样的最基本特征是“等距性”,每组内所抽取的号码需要依据第一组抽取的号码和组距唯一确定.每组抽取样本的号码依次构成一个以第一组抽取的号码m 为首项,组距d 为公差的等差数列{a n },第k 组抽取样本的号码a k =m +(k -1)d . (2)分层抽样的关键是根据样本特征差异进行分层,实质是等比例抽样,求解此类问题需先求出抽样比——样本容量与总体容量的比,则各层所抽取的样本容量等于该层个体总数与抽样比的乘积.在每层抽样时,应采用简单随机抽样或系统抽样进行.2.用样本估计总体的两种方法(1)用样本的频率分布(频率分布表、频率分布直方图、茎叶图等)估计总体的频率分布.(2)用样本的数字特征(众数、中位数、平均数、方差、标准差)估计总体的数字特征.3.方差的计算与含义计算方差首先要计算平均数,然后再按照方差的计算公式进行计算,方差和标准差是描述一个样本和总体的波动大小的特征数,方差、标准差大说明波动大. 4.众数、中位数、平均数与频率分布直方图的关系(1)众数为频率分布直方图中最高矩形的底边中点的横坐标.(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.(3)平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. [典型例题]1.某校进行了一次创新作文大赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在[40,90]之间,其得分的频率分布直方图如图,则下列结论错误的是( )A.得分在[40,60)之间的共有40人B.从这100名参赛者中随机选取1人,其得分在[60,80)的概率为0.5C.估计得分的众数为55D.这100名参赛者得分的中位数为65 [答案]:D[解析] 根据频率和为1,计算(0.0350.0300.0200.010)101a ++++⨯=,解得0.005a =,得分在[40,60)的频率是0.40,估计得分在[40,60)的有1000.4040⨯=(人),A 正确; 得分在[60,80)的频率为0.5,可得这100名参赛者中随机选取一人,得分在[60,80)的概率为0.5,B 正确;根据频率分布直方图知,最高的小矩形对应的底边中点为5060552+=,即估计得分众数为55,C 正确;中位数的估计值为0.4(60)0.030.5x +-⨯=,解得63.3x ≈,故D 错,故选D. [变式训练]2.已知在一次射击预选赛中,甲、乙两人各射击10次,两人成绩的条形统计图如图所示,则下列四个选项中判断不正确的是( )A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数小于乙的成绩的中位数C.甲的成绩的方差大于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差 [答案]:D[解析] 甲的成绩的平均数为 1(56272829210)7.510x =⨯+⨯+⨯+⨯+⨯+=甲,乙的成绩的平均数为1(673829310)810x =⨯+⨯+⨯+⨯+=乙,∴甲的成绩的平均数小于乙的成绩的平均数,故A 判断正确;甲的成绩的中位数为787.52+=,乙的成绩的中位数为8882+=,∴甲的成绩的中位数小于乙的成绩的中位数,故B 判断正确;由条形统计图得甲的成绩相对分散,乙的成绩相对稳定,∴甲的成绩的方差大于乙的成绩的方差,故C 判断正确;甲的成绩的极差为10 55-=,乙的成绩的极差为1064-=,∴甲的成绩的极差大于乙的成绩的极差,故D 判断不正确.故选D.考点2:线性回归分析与独立性检验在实际问题中的应用 1. 变量间的相关关系(1)利用散点图可以初步判断两个变量之间是否线性相关.如果散点图中的点从整体上看大致分布在一条直线的附近,我们说变量x 和y 具有线性相关关系. (2)用最小二乘法求回归直线的方程设线性回归方程为ˆˆˆy bx a =+,则()()()111112221ˆˆˆi i i i i n n i i i n n x x y y x y nxy b x x x nx a y bx--==⎧∑--∑-⎪==⎪⎨∑-∑-⎪⎪=-⎩.注意:回归直线一定经过样本的中心点(,)x y ,据此性质可以解决有关的计算问题. 2.回归分析()()1i i i x x y y r =∑--=叫做相关系数.相关系数用来衡量变量x 与y 之间的线性相关程度;|r |≤1,且|r |越接近于1,相关程度越高,|r |越接近于0,相关程度越低. 3.独立性检验假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为则2()()()()()()a b c d ad bc a b c d a c b K d +++-++++=,若2 3.841K >,则有95%的把握说两个事件有关; 若2 6.635K >,则有99%的把握说两个事件有关; 若2 2.706K <,则没有充分理由认为两个事件有关. 『解题技巧』1.正确理解计算,的公式和准确的计算,是求线性回归方程的关键.其中线性回归方程必过样本中心点(,x y ).2.在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.3. 进行独立性检验的步骤(1)假设两个分类变量X 与Y 无关; (2)找相关数据,列出2×2列联表;(3)由公式22()()()()()n ad bc a b c d a c b d K -++++= (其中n a b c d =+++)计算出2K 的值.(4)将2K 的值与临界值进行对比,进而做出统计推断.提醒:2K 的观测值越大,对应假设事件成立的概率越小,假设事件不成立的概率越大. [典型例题]1.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据()()()()()1122334455,,,,,,,,,x y x y x y x y x y .根据收集到的数据可知12345150x x x x x ++++=, 由最小二乘法求得回归直线方程为0.67549ˆ .y x =+,则12345y y y y y ++++的值为( )A.75B.155.4C.375D.466.2[答案]:C[解析] 由题意可得: 12345305x x x x x x ++++==,线性回归方程过样本中心点,则: 0.6754.975y x =⨯+=, 据此可知: 123455375y y y y y y ++++==. 本题选择C 选项. [变式训练]2.第24届冬季奥林匹克运动会将于2022年在北京举办.为了解某城市居民对冰雪运动的关注情况,随机抽取了该市100人进行调查统计,得到如下22⨯列联表.参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.附表:根据列联表可知( )A.该市女性居民中大约有5%的人关注冰雪运动B.该市男性届民中大约有95%的人关注冰雪运动C.有95%的把握认为该市居民是否关注冰雪运动与性别有关D.有99%的把握认为该市居民是否关注冰雪运动与性别有关[答案]:C[解析]由22⨯列联表中的数据可得()22352515251004.167 3.84160405050K⨯-⨯⨯=≈>⨯⨯⨯,因此,有95%的把握认为该市居民是否关注冰雪运动与性别有关.故选:C.。
概率论与数理统计案例

概率论与数理统计案例概率论与数理统计是数学学科的两个分支,它们研究与概率和随机变量相关的问题,可以应用于统计、经济、金融等领域。
下面将介绍一些概率论与数理统计的案例。
案例一:骰子游戏在玩一个骰子游戏时,每次掷一个骰子,如果骰子点数为1或6,则游戏结束,否则游戏继续。
假设你可以决定掷骰子的次数,掷的次数越多,结束游戏的概率越大,但可能会因为掷的次数过多而浪费时间。
现在假设你只能掷骰子n次,问你应该掷几次骰子可以使结束游戏的概率最大?解题思路:对于这个问题,我们可以使用概率论的方法来求解。
假设掷骰子的次数为k,那么结束游戏的概率为:$P_k$ = $\frac{1}{3} + \frac{4}{9}(\frac{2}{3})^k +\frac{2}{9}(\frac{1}{2})^k(\frac{2}{3})^{n-k}$为了使结束游戏的概率最大,我们需要求出这个概率关于k的一阶导数,并令其等于0。
对上式求导,得到:令$P'_k$ = 0,解得:$k$ = $\frac{n}{2}$因此,在保证掷骰子次数不超过n的情况下,掷骰子次数为$\frac{n}{2}$时可以使结束游戏的概率最大。
案例二:股票涨跌预测对于投资者来说,股票的涨跌是一个重要的决策因素,如果能准确预测股票涨跌,可以获得更高的投资收益。
根据概率论和数理统计的方法,我们可以尝试分析股票涨跌的概率和趋势,并根据分析结果制定投资策略。
对于股票涨跌的预测,我们可以使用概率论中的二项分布来进行分析。
假设一个股票价格在一段时间内有50%的概率上涨,50%的概率下跌,我们可以将上涨定义为成功事件,下跌定义为失败事件,那么在n次交易中,股票涨k次的概率为:$P(k) = \frac{n!}{k!(n-k)!}\times p^k\times (1-p)^{n-k}$其中,p为股票价格上涨的概率,k为股票涨的次数。
对于预测股票涨跌的趋势,我们可以使用时间序列分析的方法来进行分析。
人教版高中数学选修1-2《统计案例:复习参考题》【可编辑全文】

(2)建立销售总额为解释变量,利润为预报变量的回归 模型. (3)计算R2,你认为这个模型能较好地刻画销售总额和 利润之间的关系吗?请说明理由.
利润y
销售总额x与利润y的散点图
5000
4500
4000
3500
3000
2500 y = 0.0256x + 1334.5
2000
1500
R²= 0.4572
知识回顾 回归分析的思想及初步应用
1.函数关系与相关关系的区别?
函数关系是一种确定性关系,而相关关系是 一种非确定性关系.
2. 若y与x呈线性相关关系,则 回归直线方程
为
,满足
知识回顾 回归分析的思想及初步应用
3.回归分析的步骤:
解释变量
确定研究对象
预报变量
散点图
观察数据点的分布
两个变量 非线性相关
不吸烟 a
b a+b
吸烟
c
d c+d
总计 a+c b+d n (2)假设两变量无关;
(3)利用公式计算Κ2的观察值k;
,其中
(4)看下表,k与临界值k0比较; 两者无关的概率
P(K2≥k0) 0.10 0.05 0.025 0.010 0.001
k0 2.706 3.841 5.024 6.635 10.828 两者有关 90% 95% 97.5% 99% 99.9% 的概率 (5)下结论:两种角度,如
1000
500
0
0 20000 40000 60000 80000 100000 120000 140000
销售总额x
这个模型的销售总额x 对于利润y变化的 贡献率为45.72%
高考数学2024概率与统计历年题目全集

高考数学2024概率与统计历年题目全集概率与统计是高中数学中一门重要的学科,也是高考数学考试的一部分。
在概率与统计中,我们需要通过概率的计算和统计的方法来分析和解决实际问题。
为了帮助同学们复习和准备高考数学考试,本文整理了高考数学2024概率与统计历年题目全集,希望能对同学们有所帮助。
1. 单项选择题1) 已知概率为P(A) = 0.2,P(B) = 0.4,事件A、B相互独立,求P(A并B)的值。
2) 一次抛掷一硬币,设正面向上的概率为p,反面向上的概率为q。
连续抛掷3次硬币,求正面朝上的次数不超过2次的概率。
3) 某音乐社有男生40人,女生60人。
从中随机抽取一人,求抽到女生的概率。
2. 典型案例题1) 某超市中购买了100个某品牌产品,其中有5个是次品。
现从中不放回地连续抽取3个产品,求至少有一个次品的概率。
2) 某餐厅的饭菜有4个主食和6个副食。
现从中选择2个饭菜,求至少有一个主食的概率。
3. 解答题1) 设事件A与事件B相互独立,且P(A) = 0.3,P(B) = 0.5。
求下列事件的概率:a) P(A并B)b) P(A或B)c) P(A的对立事件)2) 设P(A) = 0.4,P(B) = 0.3,P(A并B) = 0.1,求下列事件的概率:a) P(A的对立事件)b) P(B的对立事件)c) P(A或B)3) 有一批产品,其中20%是次品。
现从中不放回地连续抽取3个产品,求以下事件的概率:a) 已抽出的3个产品都是次品;b) 至少有一个次品。
(提示:利用组合数学中的排列、组合知识进行计算)本文仅列举了一部分高考数学2024概率与统计历年题目,希望能给同学们提供一些复习和备考的参考。
在备考过程中,同学们还需结合教材和课堂上的知识,多进行习题训练和模拟考试,提高解题能力和应试技巧。
祝同学们取得优异的高考成绩!。
高考大题专项练六概率、统计与统计案例

概率、统计与统计案例1.(2016湖北武昌区五月调考)某工厂36名工人的年龄数据如下表:(1)用系统抽样的方法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样的方法抽到的年龄数据为44,列出样本的年龄数据; (2)计算(1)中样本的平均值x 和方差s 2;(3)求这36名工人中年龄在(x -s ,x +s )内的人数所占的百分比. 把工厂36名工人的年龄数据分为9组,每组4人.在第一分段里抽到的年龄数据44对应的编号为2, 故抽取的样本编号依次为2,6,10,14,18,22,26,30,34, 对应样本的年龄数据依次为44,40,36,43,36,37,44,43,37.(2)由(1)得, x =44+40+36+43+36+37+44+43+379=40,s 2=19[(44-40)2+(40-40)2+(36-40)2+(43-40)2+(36-40)2+(37-40)2+(44-40)2+(43-40)2+(37-40)2]=1009.(3)由(2)得x =40,s=103,则x -s=3623,x +s=4313.由表可知,这36名工人中年龄数据在(x -s ,x +s )内共有23人,所占的百分比为2336×100%≈63.89%.〚2.某地10户家庭的年收入和年饮食支出的统计资料如表所示:(1)根据表中数据,确定家庭的年收入和年饮食支出的相关关系; (2)若某家庭年收入为9万元,预测其年饮食支出.由题意,知年收入x 为解释变量,年饮食支出y 为预报变量,作散点图如图.从图中可以看出,样本点呈条状分布,年收入和年饮食支出有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.因为x =6,y =1.83,∑i =110x i 2=406,∑i=110y i 2=35.13.∑i =110x i y i =117.7,所以b ^=∑i =110x i y i -10x y∑i =110x i 2-10x2≈0.172,a ^=y −b ^x ≈1.83-0.172×6=0.798.从而得到线性回归方程为y ^=0.172x+0.798. (2)y ^=0.172×9+0.798=2.346(万元).所以家庭年收入为9万元时,可以预测年饮食支出为2.346万元.〚3.(2016全国乙卷,文19)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.(1)若n=19,求y与x的函数解析式;(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?当x≤19时,y=3 800;当x>19时,y=3 800+500(x-19)=500x-5 700.所以y与x的函数解析式为y=3800,x≤19,500x-5700,x>19(x∈N).(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为1100×(3 800×70+4 300×20+4 800×10)=4 000.若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机×(4 000×90+4 500×10)=4 050.器在购买易损零件上所需费用的平均数为1100比较两个平均数可知,购买1台机器的同时应购买19个易损零件.〚4.(2016北京,文17)某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3.(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:根据题意,该市居民该月的人均水费估计为4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=1 0.5(元).〚5.(2016湖北武汉二月调研)某商场经销某一种电器商品,在一个销售季度内,每售出一件该电器商品获利200元,未售出的商品,每件亏损100元.根据以往资料,得到销售季度内市场需求量的频率分布直方图如图所示,现在经销商为下一个销售季度购进了125件该种电器,以n(单位:件,95≤n≤155)表示下一个销售季度内市场需求量,Y(单位:元)表示下一个销售季度内销售该电器的利润.(1)将Y表示为n的函数;(2)求频率分布直方图中a的值;(3)根据直方图估计利润Y不少于22 000元的概率.依题意知下一个销售季度内经销该电器所获利润Y与需求量n之间的关系为Y=200n-100(125-n),95≤n≤125, 125×200,126≤n≤155.(2)由0.010×10×2+a×10+0.018×10+0.022×10+0.024×10=1,求得a=0.016.(3)而300n-100×125≥22 000,知n≥115(件).由频率分布直方图可知P(n≥115)=1-0.1-0.16=0.74,故估计利润Y不少于22 000元的概率为0.74.6.(2016山东淄博一模)学业水平考试后,某校对高二学生的数学、英语成绩进行了统计,结果如下(人数):已知英语、数学的优秀率分别为24%,30%(注:合格人数中不包含优秀人数).(1)求a,b的值;(2)现按照英语成绩的等级,采用分层抽样的方法,从数学不合格的学生中选取6人,若再从这6人中任选2人,求这两名学生的英语成绩恰为一人优秀一人合格的概率.设该校高二学生共有x人,已知英语优秀的有70+30+20=120人,依题意得120x =0.24,解得x=500.故70+60+a500=0.3,解得a=20,由学生总数为500人,得b=30.(2)由题意得,在抽取的数学不及格的6人中,英语优秀的应抽取2人,分别记为a1,a2;英语合格的应抽取3人,分别记为b1,b2,b3;英语不合格的应抽取1人,记为c,从中任取2人的所有结果有15种,这两名学生的英语成绩恰为一人优秀一人合格的基本事件有{a1,b1},{a1,b2},{a1,b3},{a2,b1},{a2,b2},{a2,b3},共6种,因此这两名学生的英语成绩恰为一人优秀一人合格的概率为615=25.〚7.某大学餐饮中心为了了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:(1)根据表中数据,问能否在犯错误的概率不超过0.05的前提下认为南方学生和北方学生在选用甜品的饮食习惯方面有差异;(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.将2×2列联表中的数据代入公式计算,得K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100×(60×10-20×10)2 70×30×80×20=10021≈4.762.因为4.762>3.841,所以在犯错误的概率不超过0.05的前提下认为南方学生和北方学生在选用甜品的饮食习惯方面有差异.(2)从5名数学系学生中任取3人的一切可能结果所组成的基本事件空间Ω={(a1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,b1,b2),(a1,b2,b3),(a1,b1,b3),(a2,b1,b2),(a2,b2, b3),(a2,b1,b3),(b1,b2,b3)}.其中a i表示喜欢甜品的学生,i=1,2,b j表示不喜欢甜品的学生,j=1,2,3.Ω由10个基本事件组成,且这些基本事件的出现是等可能的.用A表示“3人中至多有1人喜欢甜品”这一事件,则A={(a1,b1,b2),(a1,b2,b3),(a1,b1,b3),(a2,b1,b2),(a2,b2,b3),(a2,b1,b3),(b1,b2,b3)}.事件A是由7个基本事件组成,因而P(A)=7.〚〛108.(2016河南顶级名校二模)某中学高三年级从甲、乙两个班级各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83.(1)求x和y的值;(2)计算甲班7名学生成绩的方差s2;(3)从成绩在90分以上的学生中随机抽取两名学生,求甲班至少有一名学生的概率.因为甲班学生的平均分是85,所以92+96+80+80+x+85+79+78=85.所以x=5.7因为乙班学生成绩的中位数是83,所以y=3.(2)甲班7名学生成绩的方差为s2=1[(-6)2+(-7)2+(-5)2+02+02+72+112]=40.7(3)甲班成绩在90分以上的学生有两名,分别记为A,B;乙班成绩在90分以上的学生有三名,分别记为C,D,E;从这五名学生中任意抽取两名学生共有10种情况:(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),(C,D),(C,E),(D,E);其中甲班至少有一名学生共有7种情况:(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E).记“从成绩在90分以上的学生中随机抽取两名学生,甲班至少有一名学生”为事件M,则P(M)=7.1011。
教辅-高考数学大二轮专题复习:概率与统计之统计、统计案例

核心知识回顾
热点考向探究
真题VS押题
专题作业
考向 2 用样本估计总体
例 2 (1)“幸福感指数”是指某个人主观地评价他对自己目前生活状
态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近 10
表示满意程度越高,现随机抽取 6 位小区居民,他们的幸福感指数分别为 5,
6,7,8,9,5,则这组数据的中位数是( )
核心知识回顾
热点考向探究
真题VS押题
专题作业
2.某公司生产 A,B,C 三种不同型号的轿车,产量之比依次为 2∶3∶
4,为检验该公司的产品质量,用分层抽样的方法抽取一个容量为 n 的样本,
若样本中 A 种型号的轿车比 B 种型号的轿车少 8 辆,则 n=( )
A.96
B.72
C.48
D.36
答案 B 解析 由题意,得29n-39n=-8,∴n=72.选 B.
A.5
B.5.5
C.6.5
D.7
答案 C
核心知识回顾
热点考向探究
真题VS押题
专题作业
解析 将该组数据从小到大排列为 5,5,6,7,8,9.所以这组数据的 6+7
中位数是 2 =6.5.故选 C.
核心知识回顾
热点考向探究
真题VS押题
专题作业
(2)甲、乙两名学生在 5 次数学考试中的成绩统计如下: 甲:74 82 91 88 95 乙:77 86 78 92 77 若-x 甲,-x 乙分别表示甲、乙两人的平均成绩,则下列结论正确的是( ) A.-x 甲>-x 乙,乙比甲稳定 B.-x 甲>-x 乙,甲比乙稳定 C.-x 甲<-x 乙,乙比甲稳定 D.-x 甲<-x 乙,甲比乙稳定
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大题 规范
类型二 线性回归分析(难点)
(2)∵ x =9+10+152+11+8=10, y =23+25+350+26+21=25. ∴由公式,求得b^=2.1,a^= y -b^ x =4, ∴y关于x的线性回归方程为y^=2.1x+4, ∵当x=7时,y^=2.1×7+4=18.7, ∴该奶茶店这种饮料的销量大约为19杯(或18杯).
大题 规范
类型一 样本频率分布、数字特征(重点)
(2)A地区用户的满意度等级为不满意的概率大. 记CA表示事件:“A地区用户的满意度等级为不满意”;CB表示事 件:“B地区用户的满意度等级为不满意”.由直方图得P(CA)的估计 值为(0.01+0.02+0.03)×10=0.6,P(CB)的估计值为(0.005+0.02)×10 =0.25.(11分) 所以A地区用户的满意度等级为不满意的概率大.(12分)
大题 规范
类型一 样本频率分布、数字特征(重点)
得分点及踩点说明 (1)第一问中的频率分布直方图的每个长方形都要达到相应的高度;否 则,错一个扣1分 (2)第一问中的“评价”是从两个方面:平均数和分散情况,缺一方面 扣1分 (3)第二问中缺少结论或者概率计算错,每一种情况都扣1分
大题 规范
类型一 样本频率分布、数字特征(重点)
位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售 量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计 量的值.
8
x
y
w i=1 (xi- x )2
46.6 563 6.8
289.8
表中wi= xi, w =18i=81wi.
8
i=1 (wi- w )2 1.6
1
40
10
36
19
27
28
34
2
44
113120 Nhomakorabea43
29
39
3
40
12
38
21
41
30
43
4
41
13
39
22
37
31
38
5
33
14
43
23
34
32
42
6
40
15
45
24
42
33
53
7
45
16
39
25
37
34
37
8
42
17
38
26
44
35
49
9
43
18
36
27
4
36
39
大题 规范
类型一 样本频率分布、数字特征(重点)
满意度评 [50,60) [60,70) [70,80) [80,90) [90,100]
分分组
频数
2
8
14 10
6
图①
大题 规范
类型一 样本频率分布、数字特征(重点)
(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直
方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体
值,给出结论即可).
自我挑战
2.(2016·南宁市模拟)某位同学进行寒假社会实践活动,为了对白天平
均气温与某奶茶店的某种饮料销量之间的关系进行分析研究,他分别
记录了1月11日至1月15日的白天平均气温x(℃)与该奶茶店的这种饮料
销量y(杯),得到如下数据:
日期 1月11日 1月12日 1月13日 1月14日 1月15日
回归方程类型.(2分)
大题 规范
类型二 线性回归分析(难点)
(2)令w= x,先建立y关于w的线性回归方程.
8
wi- w yi- y
i=1
由于^d=
8
=110.86.8=68,
wi- w 2
i=1
c^= y -^d w =563-68×6.8=100.6,
所以y关于w的线性回归方程为y^=100.6+68w,
重要结论
4.独立性检验
对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频数列联 表是
y1
y2 总计
x1
a
b a+b
x2
c
d c+d
总计 a+c b+d n
则K2=a+bnc+add-ab+c2cb+d(其中n=a+b+c+d为样本容量).
知识 回扣
必记知识
重要结论
上的人数,
即40,40,41,…,39,共23人.
所以36名工人中年龄在
x
-s和
x
+s之间的人数所占的百分比为
23 36
×100%≈63.89%.
大题 规范
类型二 线性回归分析(难点)
[例2] (2015·高考全国卷Ⅰ)(本小题满分12分)某公司为确定下一年度投
入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单
用样本估计总体的两种方法 (1)用样本的频率分布(频率分布表、频率分布直方图、茎叶图等)估计 总体的频率分布.其频率视为概率. (2)用样本的数字特征(众数、中位数、平均数、方差、标准差)估计总 体的数字特征.注意从图中寻求这些数字方法
大题 规范
类型一 样本频率分布、数字特征(重点)
自我挑战
1.(2015·高考广东卷)某工厂36名工人的年龄数据如下表. 工人编号 年龄 工人编号 年龄 工人编号 年龄 工人编号 年龄
大题 规范
类型二 线性回归分析(难点)
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α
+βu的斜率和截距的最小二乘估计分别为
n
β^=i=1
ui- u vi-
n i=1
ui- u 2
v
,α^ =
v
-^β
u.
(1)由散点图可以判断,y=c+d x适宜作为年销售量y关于年宣传费x的
大题 规范
类型二 线性回归分析(难点)
1根据散点图中的点的分布规律作出判断.2若x,y 线性相关,可直接 求其线性回归方程,若x,y为非线性相关,可通过换元先建立线性回 归方程,然后再转化为非线性回归方程.3利用2中求出的回归方程求 最大预报值.
大题 规范
类型二 线性回归分析(难点)
平均数 样本数据的算术平均数
每个小矩形的面积乘以小矩 形底边中点的横坐标之和
知识 回扣
必记知识
重要结论
(2)方差:s2=1n[(x1- x )2+(x2- x )2+…+(xn- x )2].
标准差:s=
1n[x1- x 2+x2- x 2+…+xn- x 2].
知识 回扣
必记知识
重要结论
大题 规范
类型一 样本频率分布、数字特征(重点)
自我挑战
(2)由均值公式知: x =44+40+9 …+37=40,
由方差公式知:s2=91[(44-40)2+(40-40)2+…+(37-40)2]=1900. (3)因为s2=1900,s=130,
所以36名工人中年龄在 x -s和 x +s之间的人数等于年龄在区间[37,43]
平均
9
10
12
11
8
气温x(℃)
销量y(杯) 23
25
30
26
21
(1)若先从这5组数据中抽出2组,求抽出的2组数据恰好是相邻2天数据
的概率;
大题 规范
类型二 线性回归分析(难点)
自我挑战
(2)请根据所给5组数据,求出y关于x的线性回归方程y^=b^x+^a;并根据 线性回归方程预测当气象台预报1月16日的白天平均气温为7 ℃时奶茶 店这种饮料的销量. 附:线性回归方程y^=b^x+^a中,
1.从m个个体中抽取n个个体组成样本,每个个体被抽取的可能性都相 同,在整个抽样中,被抽取的概率为mn . 2.从m个个体中按系统抽样抽取n个个体,其抽样间隔为mn . 3.频率分布直方图
频率 (1)小长方形的面积=组距×组距=频率; (2)各小长方形的面积之和等于1; (3)小长方形的高=频 组率 距,所有小长方形的高的和为组1距.
知识 回扣
必记知识
重要结论
4.回归直线方程过定点( x , y ). 5.x1,x2,x3,…,xn的平均数为 x ,方差为s2,则bx1+a,bx2+a, bx3+a,…,bxn+a的平均数为b x +a,方差为b2s2. 6.散点在一条直线上时,其相关系数为1或-1.
大题 规范
类型一 样本频率分布、数字特征(重点)
因此y关于x的回归方程为y^=100.6+68 x.(6分)
大题 规范
类型二 线性回归分析(难点)
(3)①由(2)知, 当x=49时, 年销售量y的预报值y^=100.6+68 49=576.6, 年利润z的预报值^z=576.6×0.2-49=66.32.(9分) ②根据(2)的结果知,年利润z的预报值 ^z=0.2(100.6+68 x)-x=-x+13.6 x+20.12. 所以当 x=132.6=6.8,即x=46.24时,^z取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大.(12分)
3.变量的相关性与最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x1,y1),(x2,y2),…,(xn,
n
yn),通过求Q= (yi-a-bxi)2最小时,得到线性回归方程y^=^bx+^a的
i=1
方法叫做最小二乘法.
知识 回扣
必记知识
8
i=1 (xi- x )(yi- y ) 1 469
8
i=1 (wi- w )(yi- y ) 108.8