概率统计高考试题分析及备考建议

概率统计高考试题分析及备考建议
概率统计高考试题分析及备考建议

概率统计高考试题分析及备考建议

韩永权

一概率统计的重要性

17世纪中叶,由于赌博业的发展,需要解决公平赌博问题,导致概率的研究,当时人们常常用骰子,纸牌等工具进行赌博,遇到许多无法解决的问题,就求助于数学家,如费马,巴斯卡,惠更斯等著名数学家参加了有关的讨论,由此发展引出古典概型

19世纪末20世纪初,柯尔莫哥洛夫等人建立了概率论的公理化体系,奠定了概率论的严格数学基础,使得概率论作为一个数学分支得以迅速发展,目前,概率论在金融,保险,医药,工程技术,通信,地震,生物学,数学,物理学,化学,管理等各个领域都有广泛的应用。

统计学是通过收集数据和分析数据来认识未知现象的一门科学,它在政府管理,工业,农业,林业,商业,教育,军事,自然科学和社会科学等领域都有广泛的应用,在大数据的今天,统计学的基本思想和方法成为人们日常学习,工作和生活的必备修养。

《课标2017版》课程结构:高中数学课程分为必修课程、选择性必修课程和选修课程。高中数学课程内容突出函数、几何与代数、概率与统计、数学建模活动与数学探究活动四条主线,它们贯穿必修、选择性必修和选修课程。

所以说:概率与统计在高中数学课程中地位很重要,相对于其他数学分支内容很独特。

21世纪以来,相关研究者和课程设计者逐渐达成共识,统计课程地位得到提升,成为普通高中数学课程改革中的重要一环,值得一提的是,新一轮修订中数学课程标准仍然将统计内容作为基本内容,其重要性得到进一步加强。

——曹一鸣,王万松.高中概率统计内容设置的国际比较——基于15个国家数学课程标准的研究[j].数学教育学报,1995(2):40-41

数据统计是当代社会关注的热点之一,“大数据”已成为当前社会的热点词汇之一

——赵彦云.对大数据统计设计的思考[j]统计研究,2015,32(6):3-10

法国数学家拉普拉斯有句名言:“生活中最重要的问题,绝大部分其实只是概率问题”

二概率与统计的学科特点

概率是在总体被假设已知的情况下,研究从总体中抽取的样本的有关问题,这是关于随机现象规律演绎性的研究。统计学主要是在样本可以获得的情况下,研究如何从样本得出关于总体的一些结论。这是关于随机现象规律归纳性的研究。

演绎推理是从一般到特殊的推理,只要前提正确,推理有效,那么结论一定是正确的;而归纳推理是从特殊到一般的推理,即使前提正确,结论也未必正确。因些,概率的结论具有确定性,而统计推断的结论具有或然性(随机性)

(二)概率与统计的联系

由于样本具有随机性,依据样本构造的推断量也具有随机性,例如频率,样本均值等,因此据此推断得到的统计结论具有或然性(随机性)

度量随机的工具是概率。因此,对于随机的结论需要借助于概率进行刻画,也就是说给统计推断的结论以概率形式的刻画,是推断统计科学性的体现。

从概率与统计的逻辑关系来看,概率是统计的理论基础,而统计是概率的应用。

(三)【考纲解读】课本的必修三与选修2-3

说明: A.了解 B.理解 C.掌握(四)课标(实验)与课标(2017版)内容的变化1.删除的内容

与原文科相比与原理科相比

删除的内容 1.映射

2.三视图

3.系统抽样、茎叶图

4.几何概型

5.二元一次不等式组与简单线性规

划问题

6.推理与证明(其中数学归纳法移

到必修数列中,作为必修选学)

框图

7.命题的四种形式、逻辑联结词:

“或”,“且”映射

三视图

系统抽样、茎叶图

几何概型

二元一次不等式组与简单线性规划问题推理与证明(其中数学归纳法移到必修数列中,作为必修选学)

框图

命题的四种形式、逻辑联结词:“或”,“且”

8.生活中的优化举例

9.定积分与微积分基本定理

考试内容

要求层次

A B C

统计

随机抽样

简单随机抽样√

分层抽样和系统抽样√

用样本估计总

频率分布表、直方图、折线图、茎叶图√

样本数据的基本数字特征(如平均数、标准差)√

用样本的频率分布表估计总体分步,用样本的基本

数字特征估计总体的基本数字特征

√变量的相关性线性回归方程√

统计案例独立性检验

独立性检验(只要求2×2列联表)的基本思想、方

法及其简单应用。

√回归分析回归分析的基本思想、方法及其简单应用。√

概率事件与概率

随机事件的概率√

随机事件的运算√

两个互斥事件的概率加法公式√古典概型古典概型√

几何概型几何概型√概率

取有限值的离散型随机变量及其分布列√

超几何分布√

条件概率√

事件的独立性√

n次独立重复试验与二项分布√

取有限值的离散型随机变量的均值、方差√

正态分布√

2.增加的内容

3.弱化的内容

(五) 需要注意几个问题:

1.超几何分布与二项分布

2.事件的和积公式

3.全概率公式和贝叶斯公式

三近年高考概率统计分析

(一)近六年全国卷概率大题考查内容

2019年Ⅱ卷 18 相互独立事件的概率

文字语言

153 2019年Ⅲ卷 18 频率分布直方图,求平均值 频率分布直方图 248 2020年Ⅰ卷 19 概率的计算 文字语言 206 2020年Ⅱ卷 18 回归分析 公式数据

359 2020年Ⅲ卷 18 独立性检验

22?列联表

390

考查内容 年份

次数 回归直线方程 2015Ⅰ,2016年Ⅲ,2018年Ⅱ,2020年Ⅱ 4 统计图表求概率 2015年Ⅱ,2016年Ⅱ,2017年Ⅱ,2019年Ⅲ

4 正态分布的应用 2014Ⅰ,2017年Ⅰ

1 独立性检验 2018年Ⅲ,2019年Ⅱ,2020年Ⅲ

3 二项分布

2018年Ⅰ

1 求分布列,概率计算 2016年Ⅰ,2017年Ⅲ,2019年Ⅰ,2020年Ⅰ

5

考查内容 年份 次数 回归分析 2015 1 独立性检验 2010

1 产品检验 2013、2014、2018、2019 4 比赛模型

2020 1 二项分布、正态分布 2017

1 分段函数期望,决策

2011、2012、2016

3

(四)新课标(2010-2020)年全国1卷概率统计大题分析

1.(2010新课标文理19)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:

(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;

(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?

(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由. )(2k k P >)

0.050 0.010 0.001 k

3.841 6.635 10.828

)

d )()()(()

(2++++-=b c a d c b a bc ad n k

2.(2011新课标理19)某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品.现用两种新配方(分别称为A 配方和B 配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果: A 配方的频数分布表

指标值分组 [90,94) [94,98) [98,102) [102,106) [106,110] 频数 8 20 42 22 8

B 指标值分组 [90,94) [94,98) [98,102) [102,106) [106,110] 频数 4 12 42 32 10

(1)(2)已知用B 配方生产的一件产品的利润y(单位:元)与其质量指标值t 的关系式为2,942,941024,102t y t t -

=≤≤??≥?

从用B 配方生产的产品中任取一件,其利润记为X(单位:元),求X 的分布列及数学期望.(以试验结果中质量指标值落入各组的频率作为一件产品的质量指标值落入相应组的概率)

3.(2012新课标18)某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售,如果当天卖不完,剩下的玫瑰花作垃圾处理。

(1)若花店一天购进16枝玫瑰花,求当天的利润y (单位:元)关于当天需求量n (单位:枝,n N ∈)的函数解析式。

(2)花店记录了100天玫瑰花的日需求量(单位:枝),整理得下表:

以100天记录的各需求量的频率作为各需求量发生的概率。

(i )若花店一天购进16枝玫瑰花,X 表示当天的利润(单位:元),求X 的分布列,数学期望及方差; (ii )若花店计划一天购进16枝或17枝玫瑰花,你认为应购进16枝还是17枝 请说明理由。

4.(2013课标全国Ⅰ,理19)一批产品需要进行质量检验,检验方案是:先从这批产品中任取4件作检验,这4件产品中优质品的件数记为n.如果n =3,再从这批产品中任取4件作检验,若都为优质品,则这批产品通过检验;如果n =4,再从这批产品中任取1件作检验,若为优质品,则这批产品通过检验;其他情况下,这批产品都不能通过检验.假设这批产品的优质品率为50%,即取出的每件产品是优质品的概率都为

1

2

,且各件产品是否为优质品相互独立. (1)求这批产品通过检验的概率;

(2)已知每件产品的检验费用为100元,且抽取的每件产品都需要检验,对这批产品作质量检验所需的费用记为X(单位:元),求X 的分布列及数学期望.

5.(2014新课标18) 从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:

(I )求这500件产品质量指标值的样本平均数x 和相本方差2s ,(同一组中的数据用该组区间的中点值作代表)

(II )由直方图可以认为,这种产品的质量指标值Z 服从正态分布2

(,)N u σ,其中μ近似为样本平均数x ,

2δ近似为样本方差2s .

(i )利用该正态分布,求(187.8122.2)P Z <<

(ii) 某用户从该企业购买了100件这种产品,记X 表示这100件产品中质量指标位于区间(187.8,212.2)中的产品件数,种用(i )的结果,求EX 附:15012.2≈,若2(,)Z N μσ, 则

()0.6826P Z μσμσ-<<+=,(22)0.9544P Z μσμσ-<<+=

6.(2015新课标)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费i x 和年销售量

i y (i =1,2,···,8)数据作了初

步处理,得到下面的散点图及一些统计量的值.

日需求量n 14 15 16 17 18 19 20

频 数 20 20 16 16 15 13 10

x

y

w

2

8

1

)

(∑=-i i x x

2

8

1

)

(∑=-i i w w

∑=--8

1

)

)((i i i y y x x ∑=--8

1

)

)((i i i

y y w w

46.6

563

6.8

289.8 1.6 1469 108.8

表中i i x w =,∑==1

8i i w w

(Ⅰ)根据散点图判断,bx a y +=与x d c y +=哪一个适宜作为年销售量y 关于年宣传费x 的回归方程

类型?(给出判断即可,不必说明理由)

(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程; (Ⅲ)已知这种产品的年利润z 与x 、y 的关系为x y z -=2.0根据 (Ⅱ)的结果回答下列问题:

(i)年宣传费x =49时,年销售量及年利润的预报值是多少 (ii)年宣传费x 为何值时,年利率的预报值最大? 7.(2016新课标1)(19)某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:

以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X 表示2台机器三年内共需更换的易损零件数,n 表示购买2台机器的同时购买的易损零件数.

(I )求X 的分布列;

(II )若要求()0.5P X n ≤≥,确定n 的最小值;

(III )以购买易损零件所需费用的期望值为决策依据,在19n =与20n =之中选其一,应选用哪个? 8.(2017理科19)为了监控某种零件的一条生产线的生产流程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm),根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服

从正态分布),(2

σμN 。

加深生产状态正常,记X 表示一天内抽取的16个零件中其尺寸在)3,3(σμσμ+-之外的零件数,求)1(≥X P 及X 的数学期望;

一天内抽检零件中,如果出现了尺寸在)3,3(σμσμ+-之外的零件,就认为这条生产线在这一天的生产过程可能出现异常情况,需对当天的生产过程进行检查。

年宣传费(千元)

年销售量

试说明上述监控生产过程方法的合理性;

下面是检验员在一天内抽取的16个零件的尺寸: 10.12 9.96 9.96 10.01 9.92 9.98 10.04

10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95

经计算得97.9161161

==∑=i i x x —

,212.0)16(161)(161161

2_21612

≈-=-=∑∑==-i i i i x x x x s

其中i x 为抽取的第i 个零件的尺寸,16,,2,1 =i 。

用样本平均数

x

_

作为μ的估计值^

μ,用样本标准差s 作为σ的估计值^

σ,;利用估计值判断是否需对当天

的生产过程进行检查?剔除)3,3(^

^^^σμσμ+-之外的数据,用剩下的数据估计μ和σ(精确到0.01).

附:若随机变量Z 服从正态分布),(2

σμN ,则9974.0)33(=+<<-σμσμZ P 。

9592.09974.016≈,09.0008.0≈.

9.(2018理科20)工厂的某种产品成箱包装,每箱200 件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品。检验时,先从这箱产品中任取20 件作检验,再根据检验结果决定是否对余下的所有产品作检验。设每件产品为不合格品的概率都为)10(<

(1)记20件产品中恰有2件不合格品的概率为)(p f ,求)(p f 的最大值点0p .

(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的0p 作为p 的值。已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25 元的赔偿费用。 (ⅰ)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X ,求EX ; (ⅱ)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验? 解(1):方法1:20件产品中有2件不合格品的概率为

18

22

20)1()(p p C p f -=

)

101()1(2])1(18)1(2[)(172

2017

2

18

220

'

p p p C p p p p C p f --=---=

令0)('

=p f , 得1.0=p .

当)1.0,0(∈p 时,0)('>p f ;当)1,1.0(∈p 时,0)('

所以)(p f 的最大值点为1.00=p .

方法2: 设X 为20件产品中的不合格品个数 ),20(~X p B

18

21822

20)1(190)1()2()(p p p p C X P p f -=-===

2

22

21820202020

20

99119

()(9)(1)()()8181208110C C C p p p p f p p p ++-+-=

-≤=

等号成立当且仅当p p -=19 , 解得 1.00==p p 方法3.18

2220)1()(p p C p f -=两边取自然对数,可得 可得

)

1ln(18ln 2ln )(ln 2

20p p C p f -++=,设)1ln(18ln 2)(p p p t -+=

)1(2021182)(p p p p p p t --=--=

',令0)(='p t ,可得1.020

2==p (2)由(1)知,0.1p = (i)令Y 表示余下180件不合格品的个数,

)1.0,180(~Y B Y X 25220+?=即Y X 2540+=

所以 EY Y E EX 2540)2540(+=+==490

(ii )如果对余下的产品作检验,则这一箱产品所需的检验费用为400元。由于E 490400X =>,故应该对余下的产品检验

试题背景:

1.参数估计问题是利用从总体抽样得到的信息来估计总体的某些参数或者参数的某些函数

2.?

??????

?区间估计

极大似然估计矩法估计点估计参数估计

3.不合格品率p 的矩法估计

设某车间生产一批产品,为估计该批产品不合格品率,抽取了n 件产品进行检查.

分析: 设总体X 为抽的不合格产品数,相当于抽取了一组样本n x x x ,,21

且??

?=.

,

0,1次取到合格品第次取到不合格品;第i i X i 1,2,,.i n =

因EX p =, 故p 的矩估计量为∑====n

i n i A f X n X p

1

)(1?(即出现不合格产品的频率). 极大似然估计,只是一种概率论在统计学的应用,它是参数估计的方法之一。说的是已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就是通过若干次试验,观察其结果,利用结果推出参数的大概值。

在给定的分布模型下这个结果出现的概率最大,估计的意思就是求得此时分布模型的参数。可见似然也是概率,之所以叫做似然只是一种约定。通常说概率的时候,表示的是不同的结果在分布模型下的取值。此时结果已经出现了。

例如某位同学与一位猎人一起外出打猎,一只野兔从前方窜过.只听到一声枪响,野兔应声倒下.如果要你推测,是谁打中的呢?你会如何想呢?你就会想,只发一枪便打中,猎人命中的概率一般大于这位同学命中的概率.看来这一枪是猎人射中的.

这个例子所作的推断已经体现了极大似然法的基本思想.

极大似然估计是建立在这样的思想上:已知某个参数能使这个样本出现的概率最大,我们当然不会再去选择其他小概率的样本,所以干脆就把这个参数作为估计的真实值。

题目中第(1)小题要求学生用极大似然估计估计出产品的不合格率,没有出现极大似然估计这个统计学名词,完全用的是数学语言,求函数的极大值点。学生理所当然地把它当作数学题来做,求导数,

求导函数的零点。确定导函数的符号,确认1.00=P 就是函数)(P f 的最大值点。

对于(2)小问,题目说“现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的

0p 作为

p 的值”。

p 是什么?

题目中的大前提说到,设每件产品为不合格品的概率都为)10(<

1.020

2

=去估计不合格率p ,而要绕一个大圈子去求)(p f 的最大值点

既然命题者不愿让学生采用频数估计,而一定要用极大似然估计,那么在这里只有一种理解,那就还是要考数学,在考核学生通过求导求函数的最值和最值点

在本题的场合下,无论抽抽检的20件产品中所发现的不合格品的件数k 是多少,两种估计的结果都是相同的,都是20

k

方法一 k k k p p C p f --=2020)1()(,])1)(20()

1([)(1920120k k k

k k p k p p kp C p f -------='

)]20(p )1(][)1([191k 20k p k p p C k k ----=--,由0)(='p f 可得,20

k

p =

方法二 对k

k k p p C p f --=2020)1()(两边取自然对数

可得)1ln()20(ln ln )(ln 20p k p k C p f k

--++=,设)1ln()20(ln )(p k p k p t --+=

)1(20120)(p p p k p k p k p t --=---=

',令0)(='p t ,可得20

k p = 数学是建立在公理体系基础之上的演绎推理,由公理演绎知识体系,一个问题只有一个答案

统计学是建立在观测数据之上的归纳推理,由局部观测数据认识未知现象,对同一问题,可以有不同的答案,对同一参数,可以用频数估计,也可以用极大似然估计,它们往往不同。

10.(2019新课标Ⅰ卷·理21)为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得1-分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得1-分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X . (1)求X 的分布列;

(2)若甲药、乙药在试验开始时都赋予4分,(0i p i =,1,?,8)表示“甲药的累计得分为i 时,最终认为甲药比乙药更有效”的概率,则00p =,81p =,11(1i i i i p ap bp cp i -+=++=,2,?,7),其中(1)a P X ==-,(0)b P X ==,(1)c P X ==.假设0.5α=,0.8β=. ()i 证明:1{}(0i i p p i +-=,1,2,?,7)为等比数列; ()ii 求4p ,并根据4p 的值解释这种试验方案的合理性.

试验背景解读——评比方案

1.这里的试验次数是不确定的,运气好的,4次就搞定,运气不好的,就要不断地试验;

2.为什么是4个?如果设置为1个,则检验的随机性太大,不够可靠;如果设置的更多,虽能使得试验结果与真实结果接近,不过这样会让试验更繁杂;

3.生活中也有类似的规则,比如乒乓球、羽毛球的赛制:当达到赛点后,如果双方比分接近,再进行若干轮比赛,直到一方率先比另一方多2分,就判定领先的人获胜。这背后的思想与本题的思想是一致的。

试验背景解读——递推关系

1.马尔科夫链——概率论中时间、状态均为离散的随机过程,描述一类重要的随机动态系统(过程)的模型,系统在每个时期所处的状态是随机的,从一时期到下时期的状态按一定概率转移,下时期状态只取决于本时期状态和转移概率。

题目中甲药的累计分数就是这样一个随机过程的马尔科夫链,我们关心甲药的累积分数和最后“试验表明甲药更有效”的概率之间的关系,这就是关系到甲药在不同分数之间转移的概率,也就是题目中给出的式子:

这个式子本质上表达了这个马尔科夫链的传递规律,Pi 的定义是在累积分数i 的情况下继续试验,最后甲药获胜的概率。而当前状态Pi 下最终甲药获胜的概率,包含了三种情况,一种是通过概率a 转移到Pi-1最后获胜,一种是通过概率b 保持在Pi 最后获胜,还有一种是通过概率c 转移到Pi+1最后获胜。所以在当前这一步Pi 获胜的概率,就是这三种情况下获胜的概率乘以它们发生的概率,也就是题目中给的公式,这个递推公式是甲药在不同状态下获胜的递推公式,而不是若干次之后分数i 的公式。

对i P 及递推关系式的理解:

试验中,甲药的累计得分为分)7,2,1( =i i 时,甲药、乙药治愈白鼠的数量之差小于4只,试验得

继续进行。设)87,3,2,1(,

=i H i 为甲药累计得分为i 的事件,则)(8H P 即为认为甲药有效的事件的概率,)|(8i H H P 即为累计得分为i 时最终认为甲药有效的概率,即i i P H H P =)|(8,

在一轮试验中,施以乙药的白鼠治愈且施以甲药的白鼠未治愈记事件A ;}1{-==X A

若都治愈或都未治愈为事件B ,}0{==X B

施以甲药的白鼠治愈且施以乙药的白鼠未治愈为事件C ,}1{==X C

则A,B,C 两两互斥,Ω=??C B A (Ω为样本空间)。因为一轮试验中,A,B,C 发生的概率不受当时甲药累计得分的影响,所以A,B,C 与i H 独立,得)()|(A P H A P i =,)()|(B P H B P i =,)()|(C P H C P i = 由条件概率知,

)

|()|()()

()()()()()|(i i 8i i 8i i 88H A P A H H P H P AH P AH P AH H P H P AH H P H A H P i i i =?==

同理可得,

)|()|()|(i i 88H B P B H H P H B H P i ==,

)

|()|()|(i i 88H C P C H H P H C H P i ==

又易知1i 1i 88)|()|(--==P H H P A H H P i ,i i P H H P B H H P ==)|()|(i 88

11i 88)|()|(++==i i P H H P C H H P

)|()|()|()|()|(i 88i 88i 8H C H P H B H P H A H P H H P H H P P i i i ++=Ω==

)|()|()|()|()|()|(i 888i i i i i H C P C H H P H B P B H H P H A P A H H P ++= )

()()(11C P P B P P A P P i i i +-++=

由上知,1.0)(,5.0)(,4.0)(===C P B P A P ,所以,111.05.04.0--++=i i i i P P P P

引申1 求两轮试验后,甲得分的分布列

22)1()2(βα-=-=X P

))]1)(1([)1(2)1(βααββα--+-=-=X P

2)]1)(1([)1)(1(2)0(βααββαβα--++--==X P ))]1)(1()[1(2)1(βααββα--+-==X P 2)]1([)2(βα-==X P

三轮试验后,甲得分的取值为-3,-2,-1,0,1,2,3

四轮试验后,甲得分的取值为-4,-3,-2,-1,0,1,2,3,4

如果甲药、乙药在试验开始时都赋予4分,四轮试验后,甲得分的取值为0,1,2,3,4,5,6,7,8

引申2. 变换背景

甲乙两人篮投比赛,希望知道谁更优秀,比赛方案如下:一次投篮,甲进球的概率为α,乙进球的概率为 β,若两人同时进球或同时不进球,两人都记0分,若甲进球,乙不进球,则甲记1分,乙记-1分,若甲不进球,乙进球,则甲记-1分,乙记-1分,当一个进球比对方多四个时,就停止比赛。 (1)求比赛一次,求甲得分布列

(2)若甲乙在比赛开始时都赋予4分,(0i p i =,1,?,8)表示“甲的累计得分为i 时,最终认为甲比乙

更优秀”的概率,则00p =,81p =,11(1i i i i p ap bp cp i -+=++=,2,?,7),其中(1)a P X ==-,

(0)b P X ==,(1)c P X ==.假设0.5α=,0.8β=.

()i 证明:1{}(0i i p p i +-=,1,2,?,7)为等比数列; ()ii 求4p ,并根据4p 的值解释这种试验方案的合理性.

引申3.为什么不求5p ,并根据5p 的值解释这种试验方案的合理性.

11. (2020年全国1) 甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,

比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为1

2, (1)求甲连胜四场的概率;(2)求需要进行第五场比赛的概率;(3)求丙最终获胜的概率.

解答(1)甲连胜四场只能是前四场全胜,411

()216

P ==.

(2)根据赛制,至少需要进行四场比赛,至多需要进行五场比赛,

比赛四场结束,共有三种情况,

甲连胜四场的概率为116,乙连胜四场比赛的概率为1

16

丙上场后连胜三场的概率为18,∴需要进行五场比赛的概率为:1113

1161684

P =---=.

(3)丙最终获胜,有两种情况,

比赛四场结束且丙最终获胜的概率为1

8

比赛五场结束丙最终获胜,

则从第二场开始的四场比赛按丙的胜、负、轮空结果有三种情况:

胜胜负胜,胜负空胜,负空胜胜,概率分别为111

,,1688

∴丙最终获胜的概率11117

8168816

P =+++=.

本题的特点:

(1)每场比赛有一人为负,

(2)负者下一场必轮空,倒数第二场除外

(3)最终获胜者,最后一场必胜

引申1:求比赛次数的分布列?

引申2:求甲赢的概率,乙赢的概率?

甲4场赢:4

)2

1(

甲5场赢:表示甲负一场

负空胜胜胜,胜负空胜胜,胜胜负空胜,胜胜胜负胜

概率为327)2

1()21()21()21

(5

4

4

4

=

+++,故甲赢的概率为32

9 引申

3 若甲胜乙的概率为32,甲胜丙的概率为43,乙胜丙的概率为5

3

如何解决上述问题?

四 概率统计大题的考查类型 1.求回归直线方程 2.独立性检验

3.频率分布直方图+超几何分布+二项分布+最值型

4.频率分布直方图+正态分布+二项分布型+最值型

20.十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康。经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加。为了更好的制定2019年关于加快提升农民年收人力争早日脱贫的工作计划,该地扶贫办统计了2018年50位农民的年收人并制成如下频率分布直方图:

(1)根据频率分布直方图,估计50位农民的年平均收入x (单位:千元)(同一组数据用该组数据区间的中点值表示); (2)由频率分布直方图,可以认为该贫困地区农民年收入X 服从正态分布(

)2

,N μσ

,其中μ近似为年

平均收入x ,2σ近似为样本方差2s ,经计算得2 6. 92s =.利用该正态分布,求:

(i)在2019年脱贫攻坚工作中,若使该地区约有占总农民人数的84. 14%的农民的年收入高于扶贫办制定的最低年收入标准,则最低年收入大约为多少千元?

(ii )为了调研“精准扶贫,不落一人”的政策要求落实情况, 扶贫办随机走访了1000位农民。若每个农民的年收人相互独立,问:这1000位农民中的年收入不少于12.14千元的人数最有可能是多少? 附:参考数据与公式 6.92 2.63≈,若X ~(

)2

,N μσ

则①

()0.6827P X μσμσ-<≤+=;

(22)0.9545

P X μσμσ-<≤+=;

③(33)0.9973P X μσμσ-<≤+=.

5.线性回归+独立性检验+超几何分布(二项分布)

6.检验型 规则+产品数

20.(12分)某工厂生产某种产品,为了控制质量,质量控制工程师要在产品出厂前对产品进行检验.现有*(n n N ∈且2)n 份产品,有以下两种检验方式:(1)逐份检验,则需要检验n 次;(2)混合检验,将这n 份产品混合在一起作为一组来检验.若检测通过,则这n 份产品全部为正品,因而这n 份产品只要检验一次就够了;若检测不通过,为了明确这n 份产品究竟哪几份是次品,就要对这n 份产品逐份检验,此时这n 份产品的检验次数总共为1n +次.假设在接受检验的样本中,每份样本的检验结果是正品还是次品都是独立的,且每份样本是次品的概率为(01)p p <<.

(1)如果4n =,采用逐份检验方式进行检验,求检测结果恰有两份次品的概率;

(2)现对n 份产品进行检验,运用统计概率相关知识回答:当n 和p 满足什么关系时,用混合检验方式进行检验可以减少检验次数?

(3)①当*2(n k k N =∈且2)k 时,将这n 份产品均分为两组,每组采用混合检验方式进行检验,求检验总次数ξ的数学期望;

②当(n mk k =,*m N ∈,且2k ,2)m 时,将这n 份产品均分为m 组,每组采用混合检验方式进行检验,写出检验总次数ξ的数学期望(不需证明).

7.比赛型:规则+比赛人数

1.(2019全国I 理15)甲、乙两队进行篮球决赛,采取七场四胜制(当一队赢得四场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队以4∶1获胜的概率是____________. 2.(2019全国II 理18)11分制乒乓球比赛,每赢一球得1分,当某局打成10:10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10:10平后,甲先发球,两人又打了X 个球该局比赛结束. (1)求P (X=2);(2)求事件“X=4且甲获胜”的概率.

3.(2014山东)甲、乙两支排球队进行比赛,约定先胜3局者获得比赛的胜利,比赛随即结束.除第五局

甲队获胜的概率是1

2

外,其余每局比赛甲队获胜的概率是

2

3

.假设各局比赛结果互相独立.

(1)分别求甲队以3:0,3:1,3:2胜利的概率

(2)若比赛结果为3:0或3:1,则胜利方得3分,对方得0分;若比赛结果为3:2,则胜利方得2分、对方得1分,求乙队得分X的分布列及数学期望.

4.(2019高三2月月考)某市文化馆在春节期间举行高中生“蓝天海洋杯”象棋比赛,规则如下:两名选手比赛时,每局胜者得1分,负者得0分,比赛进行到有一人比对方多2分或打满6局时结束.假设选手甲

与选手乙比赛时,甲每局获胜的概率皆为2

3

,且各局比赛胜负互不影响.

(Ⅰ)求比赛进行4局结束,且乙比甲多得2分的概率;

(Ⅱ)设ξ表示比赛停止时已比赛的局数,求随机变量ξ的分布列和数学期望.

五概率统计解答题备考建议

1.回归课本

教材是学习数学基础知识,形成基本技能的“源泉”,是高考试题的重要知识载体.纵观高考试题中的统计与概率试题,大多数试题来源于教材,特别是大多数客观题是从课本的练习题或习题改编的,即使是解答题,也是由教材例题、习题的组合、加工和拓展而成,充分表现出教材的基础作用.复习阶段应该按《考试说明》对本部分内容的要求,以课本的例题、习题为素材,深入浅出、举一反三地加以类比、延伸和拓展,在“变式”上下功夫,力求对教材内容融会贯通,只有这样,才能“以不变应万变”,达到事半功倍的效果.当然,如果再做一些经典的高考试题,对考生的复习也很有效。例如:2015年19题,就是源于课本的很好的典范.

2.切实重视阅读能力,培养应用意识

(1)计算关即需要较强的计算能力

(2)事理关即读懂题意,需要一定的阅读理解能力

(3)文理关即把文字语言转化为数学语言

(4)数理关即构建相应的数学模型,构建之后还需要扎实的基础知识和较强的数理能力

3.强化方法的选择

由于这部分知识多而复杂,因此要对它们进行整理,使它们在大脑中构建良好的数学认知结构,形成条理化、有序化、网络化的有机体系.

几个重要结论要记好:

(1)在频率直方图中,最高矩形的中点对应值是众数;中位数的左右两边的直方图面积相等;平均数则是每组频率的中间值乘频数再相加.

(2)均值与方差的求法

①离散型随机变量②若X~B(n,p),直接利用公式③利用公式求E(aX+b), D(aX+b).

(3)线性回归方程一定过样本点中心.

4.注意与其它板块间的结合(数列,导数,函数)

概率统计应用题多以实际生活中的生产控制、风险与决策为背景,注重阅读理解、抽象概括、数据加工处理和数据应用能力,因此培养学生的应用意识、提高学生的应用能力显得尤为重要,以全国高考试题为抓手,提高分析和解决问题的能力.

(1)对二项分布最值的考查,与数列相联系

(2)与函数导数相联系

5.对概率统计题一题多变,引申拓展

概率统计为人们处理现实数据信息,分析、把握随机事件,提供了强有力的工具(计算随机事件发生的概率、求随机变量的数学期望与方差),也更加丰富、完善了中学数学思想方法,进一步拓宽了知识的应用空间,要引导学生审清概念、审清图表,审清符号,并善于对文字语言、图表语言、符号语言三者进行灵活的转化.在试题的讲解中,要进行一题多变,搞清题意,使学生在思维上的更大的提高。在对试题深入分析的过程,正好是提高学生思维的过程,往往是高考命题的方向。

6.高三复习一盘棋,月考周练合理规划概率题型

高三复习过程中,不能平均用力,重难点部分应多分配时间,进行专题突破,象解析几何,导数,概率统计部分。月考周练是学生独立思考,思维提升,熟练准确运算的最好途径。是学生掌握知识的重要环节。在月考和周考练习中,应分类型,分题型循环滚动,逐步加深加强,使学生在思维上有更深入的理解。

山西大学附属中学

2020年8月24日

相关主题
相关文档
最新文档