正态分布知识点

合集下载

正态分布的加减公式

正态分布的加减公式

正态分布的加减公式正态分布的加减公式正态分布是统计学中最为重要的一种分布,其表现形式是钟形曲线,也被称为高斯分布。

在实际应用中,我们经常需要对正态分布进行加减操作,因此正态分布的加减公式是必不可少的知识点。

本文将详细介绍正态分布的加减公式及其应用。

一、正态分布的基本概念1. 正态分布的定义正态分布是以期望值(μ)和标准差(σ)为参数的概率分布函数。

其概率密度函数可以表示为:f(f) = (1/σ√2π) * exp(−[(f−μ)/σ]²/2)其中,exp表示自然指数函数e^x。

2. 正态分布的性质正态分布的性质如下:(1)正态分布的曲线左右对称,中心峰值对应的区间为[μ-σ,μ+σ],面积为68.26%。

(2)μ越大,曲线整体向右平移;σ越小,曲线越集中。

(3)正态分布的标准化:将随机变量X转化为标准正态分布的随机变量Z,可以使用标准正态分布的表格。

二、正态分布的加减公式1. 两个正态分布的加法若X~N(μ1,σ1²),Y~N(μ2,σ2²),且X、Y相互独立,则X+Y服从正态分布,其期望值μ=μ1+μ2,方差σ²=σ1²+ σ2²。

即:X+Y~N(μ1+μ2,σ1²+ σ2²)2. 两个正态分布的减法若X~N(μ1,σ1²),Y~N(μ2,σ2²),且X、Y相互独立,则X-Y服从正态分布,其期望值μ=μ1-μ2,方差σ²=σ1²+ σ2²。

即:X-Y~N(μ1-μ2,σ1²+ σ2²)3. 一组正态分布的加法若X1,X2,......Xn相互独立,均服从正态分布N(μ,σ²),则它们的和服从正态分布N(nμ,nσ²)。

三、正态分布加减公式的应用场景正态分布的加减公式在实际应用中广泛存在。

例如,假设有一批手机待修理,其平均维修时间为t1秒,标准差为s1秒;另有一批手机待修理,其平均维修时间为t2秒,标准差为s2秒。

正态分布知识点总结

正态分布知识点总结

4.正态分布 (1)正态分布的定义态变量概率密度曲线的函数表达式为22()2()x f x μσ--=,x ∈R ,其中μ,σ是参数,且0σ>,μ-∞<<+∞.式中的参数μ和σ分别为正态变量的数学期望和标准差.期望为μ、标准差为σ的正态分布通常记作2(,)N μσ.(2)正态曲线的性质①曲线位于x 轴上方,与x 轴不相交,与x 轴之间的面积为1; ②曲线是单峰的,它关于直线x =μ对称; ③曲线在x =μ处达到峰值1σ2π;④当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散. (3)正态总体在三个特殊区间内取值的概率值①P (μ-σ<X ≤μ+σ)=0.682__6;②P (μ-2σ<X ≤μ+2σ)=0.954__4;③P (μ-3σ<X ≤μ+3σ)=0.997__4.④正态变量在()-∞+∞,内的取值的概率为1,在区间(33)μσμσ-+,之外的取值的概率是0.3%,故正态变量的取值几乎都在距x μ=三倍标准差之内,这就是正态分布的3σ原则.5.(2017·西安调研)已知随机变量X 服从正态分布N (3,1),且P (X >2c -1)=P (X <c +3),则c =________.①P (X <a )=1-P (X ≥a );②P (X <μ-σ)=P (X ≥μ+σ).【训练4】 (2017·常德一模)已知随机变量X ~N (1,σ2),若P (0<X <2)=0.4,则P (X ≤0)=( ) A.0.6B.0.4C.0.3D.0.28.设随机变量X ~B (2,p ),随机变量Y ~B (3,p ),若P (X ≥1)=59,则P (Y ≥1)=________.7.假设每天从甲地去乙地的旅客人数X 是服从正态分布N (800,502)的随机变量,记一天中从甲地去乙地的旅客人数800<X ≤900的概率为p 0,则p 0=________.【例1】 某单位为绿化环境,移栽了甲、乙两种大树各2株.设甲、乙两种大树移栽的成活率分别为56和45,且各株大树是否成活互不影响.求移栽的4株大树中: ⑴至少有1株成活的概率;⑴两种大树各成活1株的概率1.(2019·广东省汕头市联考)在某市高中某学科竞赛中,某一个区4 000名考生的参赛成绩统计如图所示.(1)求这4 000名考生的竞赛平均成绩x -(同一组中的数据用该组区间的中点值作代表);(2)由直方图可认为考生竞赛成绩Z 服从正态分布N (μ,σ2),其中μ,σ2分别取考生的平均成绩x -和考生成绩的方差s 2,那么该区4 000名考生成绩超过84.81分(含84.81分)的人数估计有多少?(3)如果用该区参赛考生成绩的情况来估计全市参赛考生的成绩情况,现从全市参赛考生中随机抽取4名考生,记成绩低于84.81分的考生人数为ξ,求P (ξ≤3)(精确到0.001).附:①s 2=204.75,204.75=14.31;②Z ~N (μ,σ2),则P (μ-σ<Z ≤μ+σ)=0.682 7,P (μ-2σ<Z ≤μ+2σ)=0.954 5; ③0.841 354=0.501.3.(2019·合肥一模)已知某公司生产的一种产品的质量X (单位:克)服从正态分布N (100,4),现从该产品的生产线上随机抽取10 000件产品,其中质量在[98,104]内的产品估计有( )(附:若X 服从N (μ,σ2),则P (μ-σ<X <μ+σ)=0.682 7,P (μ-2σ<X <μ+2σ)=0.954 5) A.4 093件 B.4 772件 C.6 827件D.8 186件(2017·常德一模)已知随机变量X ~N (1,σ2),若P (0<X <2)=0.4,则P (X ≤0)=( ) A.0.6B.0.4C.0.3D.0.24.设每天从甲地去乙地的旅客人数为随机变量X ,且X ~N (800,502),则一天中从甲地去乙地的旅客人数少于900的概率为( )(参考数据:若X ~N (μ,σ2),有P (μ-σ<X <μ+σ)=68.3%,P (μ-2σ<X <μ+2σ)=95.4%,P (μ-3σ<X <μ+3σ)=99.7%) A.97.7% B.68.3% C.99.7%D.95.4%5.某班有50名学生,一次考试的数学成绩ξ服从正态分布N (100,102),已知P (90<ξ<100)=0.3,估计该班学生数学成绩不小于110分的人数为________.10.若随机变量X ~N (μ,σ2),且P (X >5)=P (X <-1)=0.2,则P (2<X <5)=________.14.设X ~N (1,1),其正态分布密度曲线如图所示,那么向正方形ABCD 中随机投掷10 000个点,试估计落入阴影部分的点的个数.(注:若X ~N (μ,σ2),则P (μ-σ<X <μ+σ)=68.3%,P (μ-2σ<X <μ+2σ)=95.4%)15.已知随机变量X ~B (2,p ),Y ~N (2,σ2),若P (X ≥1)=0.64,P (0<Y <2)=p ,求P (Y >4)的值. 1 某项大型赛事,需要从高校选拔青年志愿者,某大学生实践中心积极参与,从8名学生会干部(其中男生5名,女生3名)中选3名参加志愿者服务活动.若所选3名学生中的女生人数为X ,求X 的分布列及均值.20.(本小题满分10分)在某校举行的数学竞赛中,全体参赛学生的竞赛成绩近似服从正态分布(70,100)N 。

正态分布原理

正态分布原理

正态分布原理
正态分布是统计学中常见的一种连续概率分布。

它的特点是呈钟形曲线,并且对称分布于均值两侧。

正态分布可以用于描述许多自然现象和社会现象,尤其是在大样本数量下。

正态分布的概率密度函数表示为:
f(x) = (1/σ√(2π)) * e^(-(x-μ)²/(2σ²))
其中,μ表示均值,σ表示标准差,e表示自然对数的底数。

正态分布有许多重要的特性。

首先,它的均值、中位数和众数都相等,并且重合于分布的中心。

其次,大约68%的数据落
在均值±1个标准差范围内,大约95%的数据落在均值±2个标
准差范围内,大约99.7%的数据落在均值±3个标准差范围内。

这被称为正态分布的“68-95-99.7规则”。

正态分布在许多领域中都有重要的应用。

例如,在自然科学中,正态分布可以用于描述测量误差、生物学特征的变异性等。

在工程学中,正态分布可以用于描述零件尺寸的变化、材料的强度分布等。

在社会科学中,正态分布可以用于描述智力水平、心理测量结果等。

总之,正态分布是一种重要的统计工具,可以帮助我们理解和描述自然和社会现象中的随机变量。

了解正态分布的原理和特性对于数据分析和推断是至关重要的。

高中数学必修三正态分布知识点

高中数学必修三正态分布知识点

高中数学必修三正态分布知识点正态分布的定义:如果随机变量ξ的总体密度曲线是由或近似地由下面的函数给定:x∈R,则称ξ服从正态分布,这时的总体分布叫正态分布,其中μ表示总体平均数,σ叫标准差,正态分布常用来表示。

当μ=0,σ=1时,称ξ服从标准正态分布,这时的总体叫标准正态总体。

叫标准正态曲线。

正态曲线x∈R的有关性质:(1)曲线在x轴上方,与x轴永不相交;(2)曲线关于直线x=μ对称,且在x=μ两旁延伸时无限接近x 轴;(3)曲线在x=μ处达到最高点;(4)当μ一定时,曲线形状由σ的大小来决定,σ越大,曲线越“矮胖”,表示总体分布比较离散,σ越小,曲线越“瘦高”,表示总体分布比较集中。

在标准正态总体N(0,1)中:二项分布:一般地,在n次独立重复的试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为p,则k=0,1,2,…n,此时称随机变量X服从二项分布,记作X~B(n,p),并记独立重复试验:(1)独立重复试验的意义:做n次试验,如果它们是完全同样的一个试验的重复,且它们相互独立,那么这类试验叫做独立重复试验.(2)一般地,在n次独立重复试验中,设事件A发生的次数为X,在每件试验中事件A发生的概率为p,那么在n次独立重复试验中,事件A恰好发生k次的概率为此时称随机变量X服从二项分布,记作并称p为成功概率.(3)独立重复试验:若n次重复试验中,每次试验结果的概率都不依赖于其他各次试验的结果,则称这n次试验是独立的.(4)独立重复试验概率公式的特点:是n次独立重复试验中某事件A恰好发生k次的概率.其中,n是重复试验的次数,p是一次试验中某事件A发生的概率,k是在n次独立重复试验中事件A恰好发生的次数,需要弄清公式中n,p,k的意义,才能正确运用公式.二项分布的判断与应用:(1)二项分布,实际是对n次独立重复试验从概率分布的角度作出的阐述,判断二项分布,关键是看某一事件是否是进行n次独立重复试验,且每次试验只有两种结果,如果不满足这两个条件,随机变量就不服从二项分布.(2)当随机变量的总体很大且抽取的样本容量相对于总体来说又比较小,而每次抽取时又只有两种试验结果时,我们可以把它看作独立重复试验,利用二项分布求其分布列.求独立重复试验的概率:(1)在n次独立重复试验中,“在相同条件下”等价于各次试验的结果不会受其他试验的影响,即2,…,n)是第i次试验的结果.(2)独立重复试验是相互独立事件的特例,只要有“恰好”“恰有”字样的用独立重复试验的概率公式计算更简单,要弄清n,p,k的意义。

高考正态分布知识点

高考正态分布知识点

高考正态分布知识点在统计学中,正态分布是一种重要的概率分布,也被称为钟形曲线或高斯分布。

在高考数学中,正态分布是一个常见的考察点,学生需要了解和掌握与正态分布相关的概念、性质和应用。

下面将详细介绍高考正态分布的知识点。

一、正态分布的定义和性质1. 正态分布的定义:正态分布是指在数理统计中,如果随机变量X服从一个数学期望为μ、方差为σ²的正态分布,则记为X~N(μ, σ²),其中N表示正态分布。

2. 正态分布的性质:(1)正态分布是对称的,其均值、中位数和众数都相等,即μ=中位数=众数。

(2)正态分布的图像呈现出典型的钟形曲线。

(3)正态分布的曲线在均值两侧呈现出逐渐减小的趋势,但是永远不会到达横轴。

(4)正态分布的曲线关于均值μ对称。

(5)正态分布的标准差σ越大,曲线越矮胖;标准差σ越小,曲线越瘦高。

(6)约68%的数据落在均值±1个标准差范围内;约95%的数据落在均值±2个标准差范围内;约99.7%的数据落在均值±3个标准差范围内。

二、正态分布的概率计算1. 标准正态分布:标准正态分布是指均值为0,标准差为1的正态分布。

记为Z~N(0, 1)。

对于标准正态分布,我们可以通过计算标准正态分布表来得到对应的概率值。

2. 普通正态分布:当随机变量X服从正态分布N(μ, σ²)时,可以进行标准化处理,将X转化为一个服从标准正态分布的随机变量Z。

即Z=(X-μ)/σ,这样就得到了一个标准正态分布。

对于普通正态分布,可以通过标准正态分布表和标准化公式来计算相应的概率值。

3. 概率计算:对于正态分布,我们常常需要计算在某个区间范围内的概率值。

对于标准正态分布,可以利用标准正态分布表查找对应的概率值。

对于普通正态分布,可以将其转化为标准正态分布进行计算。

三、正态分布的参数估计1. 样本均值的抽样分布:在统计学中,我们经常需要对总体的均值进行估计。

对于正态分布,样本均值的抽样分布也是一个正态分布,并且其均值等于总体均值,方差等于总体方差除以样本容量的平方根。

正态分布知识点总结

正态分布知识点总结

正态分布知识点总结正态分布(Normal distribution)是统计学中最为重要和常见的概率分布之一、其分布特点为钟形曲线,对称分布,均值为中心点,标准差决定了曲线的分散程度。

正态分布在实际应用中非常广泛,特别适用于描述大量独立随机变量之和的分布情况。

一、正态分布的定义和性质1.定义:若随机变量X服从一个均值为μ,标准差为σ的正态分布(记作X∼N(μ,σ)),则其概率密度函数为f(x)=1/(σ√(2π))*e^(-(x-μ)²/(2σ²))2.性质:a.对称性:正态分布是关于均值对称的,即平均值左右两侧的曲线是对称的。

b.中心极限定理:大量独立随机变量的和趋向于正态分布,即使原始数据并不服从正态分布,样本量足够大时,样本均值的分布也会接近正态分布。

c.峰度与偏度:正态分布的峰度为3,即其曲线边际趋于水平而不陡。

偏度为0,即左右两侧的概率密度完全对称。

d.累积分布函数:正态分布的累积分布函数可以用标准正态分布表查找,标准正态分布表给出了标准正态分布的累积概率,从而可以计算出任意正态分布的累积概率。

二、正态分布的参数1.均值(μ):正态分布的均值决定了分布曲线的中心位置。

在标准正态分布中,均值为0。

2.标准差(σ):正态分布的标准差决定了分布曲线的宽度和分散程度。

标准差越小,曲线越尖锐;标准差越大,曲线越平缓。

三、标准正态分布1. 定义:均值为0,标准差为1的正态分布称为标准正态分布(Standard Normal Distribution),记作Z∼N(0,1)。

2.标准化:通过标准化转换,将任意正态分布转化为标准正态分布。

转换公式为Z=(X-μ)/σ,其中X为原正态分布的随机变量,μ为原正态分布的均值,σ为原正态分布的标准差。

3.标准正态分布表:存储了标准正态分布的累积概率值,可用于求解任意正态分布的累积概率。

4.逆标准化:通过标准正态分布表,可以将给定累积概率对应的Z值逆向计算,得到对应的原始分布值。

2022年新高考数学总复习:正态分布

2022年新高考数学总复习:正态分布

2022年新高考数学总复习:正态分布知识点一正态曲线及其性质(1)正态曲线:函数f(x)=12πσe-(x-μ)22σ2,x∈(-∞,+∞),其中实数μ和σ(σ>0)为参数.我们称函数f(x)的图象为正态分布密度曲线,简称正态曲线,期望为μ、标准差为σ的正态分布通常记作__X~N(μ,σ2)__.(2)正态曲线的性质:①曲线位于x轴__上方__,与x轴不相交;②曲线是单峰的,它关于直线__x=μ__对称;③曲线在__x=μ__处达到峰值1σ2π;④曲线与x轴之间的面积为__1__;⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿着x轴平移;⑥当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越__集中__;σ越大,曲线越“矮胖”,表示总体的分布越__分散__.知识点二正态分布(1)正态分布的定义及表示.若对于任何实数a,b(a<b),随机变量X满足P(a<X≤b)=__⎠⎛abφμ,σ(x)d x__,则称X 服从正态分布,记作X~N(μ,σ2).(2)正态总体在三个特殊区间内取值的概率值:①P(μ-σ<X≤μ+σ)=__0.682_6__;②P(μ-2σ<X≤μ+2σ)=__0.954_4__;③P(μ-3σ<X≤μ+3σ)=__0.997_4__.归纳拓展对于正态分布N(μ,σ2),由x=μ是正态曲线的对称轴知(1)P(X≥μ)=P(X≤μ)=0.5;(2)对任意的a有P(X<μ-a)=P(X>μ+a);(3)P(X<x0)=1-P(x≥x0);(4)P(a<X<b)=P(X<b)-P(X≤a).注:在X服从正态分布,即X~N(μ,σ2)时,要充分利用正态曲线的关于直线x=μ对称和曲线与x轴之间的面积为1.双基自测题组一 走出误区1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)随机变量的均值是常数,样本的平均数是随机变量,它不确定.( √ )(2)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越小,则偏离变量的平均程度越小.( √ )(3)正态分布中的参数μ和σ完全确定了正态分布,参数μ是正态分布的均值,σ是正态分布的标准差.( √ )(4)若X ~N (0,1),则P (x <-12)<P (x ≥12).( × )题组二 走进教材2.(P 75B 组T2改编)设随机变量ξ服从正态分布N (4,3),若P (ξ<a -5)=P (ξ>a +1),则实数a 等于( B )A .7B .6C .5D .4[解析] 由题意知(a -5)+(a +1)2=4,∴a =6.题组三 走向高考3.(2015·山东)已知某批零件的长度误差ξ(单位:毫米)服从正态分布N (0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为( B )(附:正态分布N (μ,σ2)中,P (μ-σ<ξ<μ+σ)=0. 682 7,P (μ-2σ<ξ<μ+2σ)=0.954 5)A .0.045 6B .0.135 9C .0. 271 8D .0.317 4[解析] 因为P (-3<ξ<3)=0. 682 7,P (-6<ξ<6)=0.954 5,所以P (3<ξ<6)=12×(0.954 5-0.682 7)=0.135 9.故选B .4.(2015·湖北,5分)设X ~N (μ1,σ21),Y ~N (μ2,σ22),这两个正态分布密度曲线如图所示,下列结论中正确的是( C )A .P (Y ≥μ2)≥P (Y ≥μ1)B .P (X ≤σ2)≤P (X ≤σ1)C .对任意正数t ,P (X ≤t )≥P (Y ≤t )D .对任意正数t ,P (X ≥t )≥P (Y ≥t )[解析] 由正态分布密度曲线的性质可知,X ~N (μ1,σ21),Y ~N (μ2,σ22)的密度曲线分别关于直线x =μ1,x =μ2对称,因此结合题中所给图象可得,μ1<μ2,所以P (Y ≥μ2)<P (Y ≥μ1),故A 错误.又X ~N (μ1,σ21)的密度曲线较Y ~ N (μ2,σ22)的密度曲线“瘦高”,所以σ1<σ2,所以P (X ≤σ2)>P (X ≤σ1),B 错误.对任意正数t ,P (X ≤t )≥P (Y ≤t ),P (X ≥t )≤P (Y ≥t ),C 正确,D 错误.5.(2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N (μ,σ2).(1)假设生产状态正常,记X 表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P (X ≥1)及X 的数学期望;(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①试说明上述监控生产过程方法的合理性; ②下面是检验员在一天内抽取的16个零件的尺寸: 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95 经计算得x =116∑16i =1x i=9.97,s =116∑16i =1 (x i -x )2=116∑16i =1(x 2i -16x -2)≈0.212,其中x i 为抽取的第i 个零件的尺寸,i =1,2, (16)用样本平均数x 作为μ的估计值μ^,用样本标准差s 作为σ的估计值σ^,利用估计值判断是否需对当天的生产过程进行检查?剔除(μ^-3σ^,μ^+3σ^)之外的数据,用剩下的数据估计μ和σ(精确到0.01).附:若随机变量Z 服从正态分布N (μ,σ2),则P (μ-3σ<Z <μ+3σ)=0.997 4,0.997 416≈0.959 2,0.008≈0.09.[解析] (1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.997 4,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.002 6,故X ~B (16,0.002 6).因此P (X ≥1)=1-P (X =0)=1-0.997 416≈0.040 8.X 的数学期望为E (X )=16×0.002 6=0.041 6.(2)①如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.040 8,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.②由x -=9.97,s ≈0.212,得μ的估计值为μ^=9.97,σ的估计值为σ^=0.212,由样本数据可以看出有一个零件的尺寸在(μ^-3σ^,μ^+3σ^)之外,因此需对当天的生产过程进行检查.剔除(μ^-3σ^,μ^+3σ^)之外的数据9.22,剩下数据的平均数为115(16×9.97-9.22)=10.02,因此μ的估计值为10.02.∑16i =1x 2i =16×0.2122+16×9.972≈1 591.134, 剔除(μ^-3σ^,μ^+3σ^)之外的数据9.22,剩下数据的样本方差为115(1 591.134-9.222-15×10.022)≈0.008,因此σ的估计值为0.008≈0.09.考点突破·互动探究考点一 正态分布的性质——自主练透例1 (2021·河北唐山模拟)已知随机变量X 服从正态分布N (0,1),随机变量Y 服从正态分布N (1,1),且P (X >1)=0.158 7,则P (1<Y <2)=( B )A .0.158 7B .0.341 3C .0.841 3D .0.658 7[解析] 由正态曲线的性质知,随机变量X 、Y 的正态曲线形状相同,(如图).由题意P (Y >2)=P (X >1)=0.158 7,∴P (1<Y <2)=0.5-0.158 7=0.341 3.故选B .名师点拨对X ~N (μ,σ2)中的μ,σ的意义不清楚,特别是对μ的认识不清楚,就会在解题时无从下手,导致随便给出一个结果.这里μ是随机变量X 的均值,σ是标准差,x =μ是正态分布密度曲线的对称轴.〔变式训练2〕设两个正态分布N (μ1,σ21)(σ1>0)和N (μ2,σ22)(σ2>0)的密度函数分别为φ1(x )和φ2(x ),其图象如图所示,则下列结论正确的是( C )①μ1<μ2②μ1>μ2③σ1<σ2④σ1>σ2A.①②B.②③C.①③D.③④[解析]f(x)=12πσe-(x-μ)22σ2中x=μ是对称轴,故μ1<μ2;σ越大,曲线越“矮胖”,σ越小曲线越“高瘦”,故σ1<σ2.故选C.考点二正态分布——多维探究例1角度1正态曲线的对称性(1)(2021·山东新高考质量测评联盟联考)在2019年高中学生信息技术测试中,经统计,某校高二学生的测试成绩X~N(86,σ2),若已知P(80<X≤86)=0.36,则从该校高二年级任选一名考生,他的测试成绩大于92分的概率为(D)A.0.86B.0.64C.0.36D.0.14[解析]由题意P(86<x≤92)=P(80<x≤86)=0.36,∴P(X>92)=0.5-0.36=0.14,故选D.角度2确定正态曲线的对称轴(2)(2021·福建模拟)已知随机变量X服从正态分布N(μ,σ2),若P(X<3)+P(X≤1)=1,则μ=__2__.[解析]因为X服从正态分布N(μ,σ2),所以P(X<3)+P(X≥3)=1,所以P(X≤1)=P(X≥3),由正态曲线的对称性知对称轴为X=2,所以μ=2.角度3三个常用数据(3)(2020·安阳二模)2020年2月,受新冠肺炎的影响,医卫市场上出现了“一罩难求”的现象.在政府部门的牵头下,部分工厂转业生产口罩,已知某工厂生产口罩的质量指标ξ~N(15,0.002 5),单位为g,该厂每天生产的质量在(14.9 g,15.05 g)的口罩数量为818 600件,则可以估计该厂每天生产的质量在15.15 g以上的口罩数量为(D)参考数据:若ξ~N(μ,σ2),则P(μ-σ<ξ<μ+σ)=0.682 7,P(μ-2σ<ξ<μ+2σ)=0.954 5,P(μ-3σ<ξ<μ+3σ)=0.997 3.A.158 700B.22 750C .2 700D .1 350[解析] 由题意知,ξ~N (15,0.002 5), 即μ=15,σ2= 0.002 5,即σ=0.05;所以P (14.9<ξ<15.05)=P (μ-2σ<ξ<μ+σ)=0.682 7+0.954 52=0.818 6,所以该厂每天生产的口罩总量为 818 600÷0.818 6=1 000 000(件), 又P (ξ>15.15)=P (ξ>μ+3σ)=1- 0.997 32, 所以估计该厂每天生产的质量在15.15 g 以上的口罩数量为1 000 000×1-0.997 32=1350(件).故选D .[引申]本例(1)中若有1 000名学生参加测试,则测试成绩在80分以上的人数为__860__. [解析] 1 000×P (X >80)=1 000×[1-(0.5-0.36)]=860.名师点拨关于正态总体在某个区间内取值的概率求法(1)熟记P (μ-σ<X ≤μ+σ),P (μ-2σ<X ≤μ+2σ),P (μ-3σ<X ≤μ+3σ)的值; (2)充分利用正态曲线的对称性和曲线与x 轴之间面积为1.①正态曲线关于直线x =μ对称,从而在关于x =μ对称的区间上概率相等;②P (X <a )=1-P (X ≥a ),P (X <μ-a )=P (X ≥μ+a ).〔变式训练2〕(1)(角度1)(2021·江苏苏州调研)已知随机变量ξ服从正态分布N (1,σ2),且P (ξ<4)=0.9,则P (-2<ξ<1)=( C )A .0.2B .0.3C .0.4D .0.6(2)(角度2)(2021·江西模拟)已知随机变量ξ服从正态分布N (μ,σ2),若P (ξ<2)=P (ξ>8)=0.15,则P (2≤ξ<5)=( B )A .0.3B .0.35C .0.5D .0.7(3)(角度3)(2021·青岛模拟)已知某市居民在2019年用于手机支付的个人消费额ξ(单位:元)服从正态分布N (2 000,1002),则该市某居民手机支付的消费额在(1 900,2 200)内的概率为( C )附:随机变量ξ服从正态分布N (μ,σ2),则 P (μ-σ<ξ<μ+σ)=0.682 6,P (μ-3σ<ξ<μ+3σ)=0.997 4. A .0.975 9 B .0.84 C .0.818 5D .0.477 2[解析] (1)由P (ξ<4)=0.9,得P (ξ≥4)=0.1.又正态曲线关于x =1对称. 则P (ξ≤-2)=P (ξ≥4)=0.1,所以P (-2<ξ<1)=1-P (ξ≤-2)-P (ξ≥4)2=0.4.故选C .(2)根据题意,正态分布N (μ,σ2), 若P (ξ<2)=P (ξ>8)=0.15,则μ=5,即这组数据对应的正态曲线的对称轴x =5,则P (ξ<5)=0.5, 又由P (ξ<2)=0.15,得P (2≤ξ<5)=0.5-0.15=0.35.故选B . (3)∵服从正态分布N (2 000,1002), ∴μ=2 000,σ=100,则P (1 900<ξ<2 200)=P (μ-σ<ξ<μ+σ)+12[P (μ-2σ<ξ<μ+2σ)-P (μ-σ<ξ<μ+σ)]=0.682 6+12(0.954 4-0.682 6)=0.818 5.故选C .考点三,正态分布的综合应用例3 (1)(2021·贵州贵阳为明教育集团调研)如图,在正方形ABCD 中的阴影部分的上下边界分别是曲线C 1和C 2,其中C 1是正态分布N (0,0.52)的密度曲线,C 1与C 2关于x 轴对称,若在正方形中随机取一点,则该点取自阴影部分的概率是( C )参考数据:随机变量Z 服从正态分布N (μ,σ2)的概率为:P (μ-2σ<Z ≤μ+2σ)=0.954 4, P (μ-3σ<Z ≤μ+3σ)=0.997 4 A .0.682 6 B .0.954 4 C .0.477 2D .0.498 7(2)(2021·河南六市模拟)十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康.经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加,为了制定提升农民收入、实现2020年脱贫的工作计划,该地扶贫办统计了2019年50位农民的年收入并制成如下频率分布直方图:(ⅰ)根据频率分布直方图,估计50位农民的平均年收入x -(单位:千元);(同一组数据用该组数据区间的中点值表示);(ⅱ)由频率分布直方图,可以认为该贫困地区农民年收入X 服从正态分布N (μ,σ2),其中μ近似为年平均收入x -,σ2近似为样本方差s 2,经计算得s 2=6.92,利用该正态分布,求:①在扶贫攻坚工作中,若使该地区约有占总农民人数的84.14%的农民的年收入高于扶贫办制定的最低年收入标准,则最低年收入标准大约为多少千元?②为了调研“精准扶贫,不落一人”的政策要求落实情况,扶贫办随机走访了1 000位农民.若每位农民的年收入互相独立,问:这1000位农民中的年收入不少于12.14千元的人数最有可能是多少?附参考数据:6.92≈2.63,若随机变量X 服从正态分布N (μ,σ2),则P (μ-σ<X <μ+σ)=0.6827,P (μ-2σ<X <μ+2σ)=0.9545,P (μ-3σ<X <μ+3σ)=0.9973.[解析] (1)因为C 1是正态分布N (0,0.52)的密度曲线, 且P (μ-2σ<Z ≤μ+2σ)=0.954 4, 所以P (-1<Z ≤1)=0.954 4,则阴影部分的面积S =0.954 4×2=1.908 8,所以若在正方形中随机取一点,则该点取自阴影部分的概率是1.908 84=0.477 2.故选C .(2)(ⅰ)x -=12×0.04+14×0.12+16×0.28+18×0.36+20×0.10+22×0.06+24×0.04=17.40千元.故估计50位农民的年平均收入x -为17.40千元. (ⅱ)由题意知X ~N (17.40,6.92), ①P (X >μ-σ)=12+0.682 72≈0.841 4,所以μ-σ=17.40-2.63=14.77时,满足题意, 即最低年收入大约为14.77千元.②由P (x ≥12.14)=P (x ≥μ-2σ)=0.5+0.954 52≈0.977 3,每个农民的年收入不少于12.14千元的事件的概率为0.977 3, 记1 000个农民的年收入不少于12.14千元的人数为ξ 则ξ~B (1 000,p ),其中p =0.977 3于是恰好有k 个农民的年收入不少于12.14千元的事件概率为P (ξ=k )=C k 1 000p k (1-p )1 000-k , 从而由P (ξ=k )P (ξ=k -1)=(1 001-k )×p k ×(1-p )>1,得k <1 001p而1 001p =978.277 3,所以,当0≤k ≤978时,P (ξ=k -1)<P (ξ=k ); 当979≤k ≤1 000时,P (ξ=k -1)>P (ξ=k ),由此可知,在所走访的1 000位农民中,年收入不少于12.14千元的人数最有可能是978人.名师点拨解决正态分布问题的三个关键点 若随机变量ξ~N (μ,σ2),则 (1)对称轴x =μ; (2)标准差σ;(3)分布区间.利用对称性可求指定范围内的概率值;由μ,σ,分布区间的特征进行转化,使分布区间转化为3σ特殊区间,从而求出所求概率〔变式训练3〕(2021·广西柳州铁路一中、玉林一中联考)从某公司生产线生产的某种产品中抽取1 000件,测量这些产品的一项质量指标,由检测结果得如图所示的频率分布直方图:(1)求这1 000件产品质量指标的样本平均数x -和样本方差s 2(同一组中的数据用该组区间的中点值作代表);(2)由直方图可以认为,这种产品的质量指标值Z 服从正态分布N (μ,σ2),其中μ近似为样本平均数x -,σ2近似为样本方差s 2.①利用该正态分布,求P (175.6<Z <224.4);②已知每件该产品的生产成本为10元,每件合格品(质量指标值Z ∈(175.6,224.4))的定价为16元;若为次品(质量指标值Z ∉(175.6,224.4)),除了全额退款外且每件次品还须赔付客户48元,若该公司卖出100件这种产品,记Y 表示这些产品的利润,求E (Y ).附:150≈12.2,若Z ~N (μ,σ2),则P (μ-σ<Z <μ+σ)≈0.68,P (μ-2σ<Z <μ+2σ)≈0.95. [解析] (1)由题意得x -=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200s 2=(170-200)2×0.02+(180-200)2×0.09+(190-200)2×0.22+(200-200)2×0.33+(210-200)2×0.24+(220-200)2×0.08+(230-200)2×0.02=150.即样本平均数为200,样本方差为150. (2)①由(1)可知,μ=200,σ=150≈12.2, ∴Z ~N (200,12.22),∴P (175.6<Z <224.4) =P (μ-2σ<Z <μ+2σ)≈0.95 ②设X 表示100件产品的正品数, 题意得X ~B (100,0.95),∴E (X )=95, ∴E (Y )=16E (X )-48×5-100×10=280.名师讲坛·素养提升利用均值与方差求解决策性问题例4 (2021·湖南益阳调研)已知6名某疾病病毒密切接触者中有1名感染病毒,其余5名未感染,需要通过化验血液来确定感染者.血液化验结果呈阳性的即为感染者,呈阴性即为未感染者.(1)若从这6名密切接触者中随机抽取2名,求抽到感染者的概率;(2)血液化验确定感染者的方法有:方法一是逐一化验;方法二是平均分组混合化验,先将血液样本平均分成若干组,对组内血液混合化验,若化验结果呈阴性,则该组血液不含病毒,若化验结果呈阳性,则对该组的备份血液逐一化验;直至确定感染者.(ⅰ)采取逐一化验,求所需化验次数ξ的分布列及数学期望;(ⅱ)采取平均分成三组混合化验(每组血液份数相同),求该分组方法所需化验次数的数学期望.你认为选择哪种化验方案更合理?请说明理由.[解析] (1)抽到感染者的概率P =C 11C 15C 26=515=13.(2)(ⅰ)按逐一化验法,ξ的可能取值为1,2,3,4,5,P (ξ=1)=C 11C 16=16,P (ξ=2)=C 15C 11A 26=16,P (ξ=3)=A 25C 11A 36=16,P (ξ=4)=A 35C 11A 46=16,P (ξ=5)=A 45C 11+A 55A 56=13, 所以ξ的分布列为数学期望E (ξ)=1×16+2×16+3×16+4×16+5×13=103.(ⅱ)平均分成三组即按(2,2,2)分组, 记所需化验次数为η,则η=2,3, P (η=2)=13,P (η=3)=23×12+23×12=23所以η的分布列为数学期望E (η)=2×13+3×23=83.因为E (ξ)>E (η),所以按平均分组法较合理.名师点拨随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据.一般先比较均值,若均值相同,再用方差来决定.〔变式训练4〕(2021·湖南郴州质检)某蔬菜种植基地有一批蔬菜需要两天内采摘完毕,天气预报显示这两天每天是否有雨相互独立,无雨的概率都为0.8.现有两种方案可以选择:方案一:基地人员自己采摘,不额外聘请工人,需要两天完成,两天都无雨收益为2万元,只有一天有雨收益为1万元,两天都有雨收益为0.75万元.方案二:基地额外聘请工人,只要一天就可以完成采摘,当天无雨收益为2万元,有雨收益为1万元.额外聘请工人的成本为a 万元.(1)若不额外聘请工人,写出基地收益X 的分布列及基地的预期收益; (2)该基地是否应该外聘工人?请说明理由. [解析] (1)基地收益X 的可能值为2,1,0.75,则P (X =2)=0.8×0.8=0.64,P (X =1)=0.8×0.2+0.2×0.8=0.32, P (X =0.75)=(1-0.8)×(1-0.8)=0.04, 故X 的分布列为则E (X )=2×0.64(2)设基地额外聘请工人时的收益为Y 万元, 则其预期收益E (Y )=2×0.8+1×0.2-a =1.8 -a E (Y )-E (X )=0.17-a综上可得,当额外聘请工人的成本高于0.17万元时,E (X )>E (Y ),不外聘工人, 当成本低于0.17万元时E (X )<E (Y ),外聘工人,当成本恰为0.17万元时,E (X )=E (Y ),是否外聘工人均可以.高考大题规范解答系列(六)——概率与统计考点一 离散型随机变量的分布列与期望(理)例1 (2021·山西联考)已知甲盒中有三个白球和三个红球,乙盒中仅装有三个白球,球除颜色外完全相同.现从甲盒中任取三个球放入乙盒中.(1)求乙盒中红球个数X 的分布列与期望; (2)求从乙盒中任取一球是红球的概率. 【标准答案】——规范答题 步步得分 (1)由题意知X 的可能取值为0,1,2,3.P (X =0)=C 03C 33C 36=120,P (X =1)=C 13C 23C 36=920,P (X =2)=C 23C 13C 36=920,P (X =3)=C 33C 03C 36=120,所以X 的分布列为所以E (X )=0×120+1×920+2×920+3×120=32.(2)当乙盒中红球个数为0时,P 1=0,当乙盒中红球个数为1时,P 2=920×16=340,当乙盒中红球个数为2,P 3=920×26=320, 当乙盒中红球个数为3时,P 4=120×36=140,所以从乙盒中任取一球是红球的概率为P 1+P 2+P 3+P 4=14.【评分细则】(1)第一问中,正确算出P (X =0),P (X =1),P (X =2),P (X =3)各得1分,列出分布列得1分,求出期望得1分.(2)第二问中,分类讨论,每种情况各占1分. (3)其他方法按步骤酌情给分.例2 (2019·课标Ⅰ,21)为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈,则甲药得1分,乙药得-1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈,则乙药得1分,甲药得-1分;若都治愈或都未治愈,则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X .(1)求X 的分布列;(2)若甲药、乙药在试验开始时都赋予4分,p i (i =0,1,…,8)表示“甲药的累计得分为i 时,最终认为甲药比乙药更有效”的概率,则p 0=0,p 8=1,p i =ap i -1+bp i +cp i +1(i =1,2,…,7),其中a =P (X =-1),b =P (X =0),c =P (X =1).假设α=0.5,β=0.8.①证明:{p i +1-p i }(i =0,1,2,…,7)为等比数列; ②求p 4,并根据p 4的值解释这种试验方案的合理性. 【标准答案】——规范答题 步步得分(1)X 的所有可能取值为-1,0,1. P (X =-1)=(1-α)β, P (X =0)=αβ+(1-α)·(1-β), P (X =1)=α(1-β). 所以X 的分布列为(2)①由(1)得a =0.4,b =0.5,c =0.1.因此p i =0.4P i -1+0.5p i +0.1p i +1, 故0.1(p i +1-p i )=0.4(p i -p i -1), 即p i +1-p i =4(p i -p i -1). 又因为p 1-p 0=p 1≠0,所以{p i +1-p i }(i =0,1,2,…,7)是公比为4,首项为p 1的等比数列. ②由①可得p 8=p 8-p 7+p 7-p 6+…+p 1-p 0+p 0=(p 8-p 7)+(p 7-p 6)+…+(p 1-p 0)=48-13p 1.由于p 8=1,故p 1=348-1,所以p 4=(p 4-p 3)+(p 3-p 2)+(p 2-p 1)+(p 1-p 0) =44-13p 1=1257.p 4表示最终认为甲药更有效的概率.由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为p 4=1257≈0.003 9,此时得出错误结论的概率非常小,说明这种试验方案合理. 【评分细则】①每个式子1分,表格1分;给出X 的可能取值给1分; ②得出a 、b 、c 的值(有正确的)得1分; ③得到P i +1-P i =4(P i -P i -1)得1分; ④给出结论得1分;⑤得出P 8,P 4,P 1的表达式各得1分;⑥说明P 4非常小得1分; ⑦说明实验方案合理得1分. 【名师点评】1.核心素养:本题主要考查相互独立事件的概率、随机变量的期望、方差的应用、二项分布、决策问题等,考查数据处理能力、运算求解能力,考查或然与必然思想,考查的核心素养的逻辑推理、数学建模、数学运算、数据分析.2.解题技巧:破解此类题的关键:一是认真读题,读懂题意;二是会利用导数求最值;三是会利用公式求服从特殊分布的离散型随机变量的期望值;四是会利用期望值,解决决策型问题.〔变式训练1〕(2021·湖南五市十校教研教改共同体联考)某学校为了了解学生对新冠病毒的传播和预防知识的掌握情况,学校决定组织一次有关新冠病毒预防知识竞答.竞答分为必答题(共5题)和选答题(共2题)两部分.每位同学答题相互独立,且每道题答对与否互不影响.已知甲同学答对每道必答题的概率为45,答对每道选答题的概率为25.(1)求甲恰好答对4道必答题的概率;(2)在选答阶段,若选择回答且答对奖励5分,答错扣2分,选择放弃回答得0分.已知甲同学对于选答的两道题,选择回答和放弃回答的概率均为12,试求甲同学在选答题阶段,得分X 的分布列.[解析] (1)甲恰好答对4道必答题的概率为 P =C 45⎝⎛⎭⎫454×15=256625.(2)依题意,每道题选择回答并答对的概率为12×25=15,选择回答且答错的概率为12×35=310,选择放弃回答的概率为12.甲得分的可能性为-4分,-2分,0分,3分,5分和10分. 所以P (X =-4)=9100,P (X =-2)=C 1212×12×35=310, P (X =0)=12×12=14,P (X =3)=C 1212×12×25×35=325,P (X =5)=C 1212×12×25=15, P (X =10)=12×12×⎝⎛⎭⎫252=125.所以X 的分布列为考点一 随机抽样、频率分布直方图及其应用(文)例1 (2021·河南质量测评)“不忘初心、牢记使命”主题教育活动正在全国开展,某区政府为统计全区党员干部一周参与主题教育活动的时间,从全区的党员干部中随机抽取n 名,获得了他们一周参加主题教育活动的时间(单位:时)的频率分布直方图,如图所示,已知参加主题教育活动的时间在(12,16]内的人数为92.(1)估计这些党员干部一周参与主题教育活动的时间的平均值;(2)用频率估计概率,如果计划对全区一周参与主题教育活动的时间在(16,24]内的党员干部给予奖励,且参与时间在(16,20],(20,24]内的分别获二等奖和一等奖,通过分层抽样方法从这些获奖人中随机抽取5人,再从这5人中任意选取3人,求3人均获二等奖的概率.【分析】 (1)先利用频率分布“直方图中各小矩形面积为1”求出a 的值,再利用各小矩形中点横坐标与该矩形面积积的和求平均值;(2)利用分层抽样的性质先求出在(16,20],(20,24]内分别抽取的人数,再用列举法求概率.【标准答案】——规范答题 步步得分 (1)由已知可得a =1÷4-(0.025 0+0.047 5+0.050 0+0.012 5)=0.115 0,2分得分点①所以这些党员干部一周参加主题教育活动的时间的平均值为(6×0.025+10×0.047 5+14×0.115+18×0.05+22×0.012 5)×4=13.644分得分点②(2)因为0.115 0×4×n =92,所以n =920.115 0×4=200.6分得分点③故参与主题教育活动的时间在(16,20]的人数为 0.050 0×4×200=40,参与主题教育活动的时间在(20,24]的人数为 0.012 5×4×200=10.8分得分点④则利用分层抽样抽取的人数:在(16,20]内为4人,9分得分点⑤ 设为a ,b ,c ,d ;在(20,24]内为1人,设为A ,从这5人中选取3人的事件空间为:{(a ,b ,c ),(a ,b ,d ),(a ,b ,A ),(a ,c ,d ),(a ,c ,A ),(a ,d ,A ),(b ,c ,d ),(b ,c ,A ),(b ,d ,A ),(c ,d ,A )},共10种情况,10分其中全是二等奖的有4种情况.11分 故P =410=25.12分得分点⑥【评分细则】①列对算式计算错误得1分,全对得2分; ②列对算式计算错误得1分,全对得2分; ③计算错误不得分;④求对(20,24],(16,20]上人数各得1分; ⑤求对(20,24]或(16,20]内抽取人数得1分;⑥列举出事件空间得1分,数对数目得1分;求对概率得1分. 【名师点评】本题主要考查随机抽样、频率分布直方图及概率,考查学生数据处理能力、运算能力. 〔变式训练1〕(2020·四川成都诊断)2019年12月,《生活垃圾分类标志》新标准分布并正式实施.为进一步普及生活垃圾分类知识,了解居民生活垃圾分类情况,某社区开展了一次关于垃圾分类的问卷调查活动,并对随机抽取的1 000人的年龄进行了统计,得到如下的各年龄段频数分布表和各年龄段人数频率分布直方图:(1)请补全各年龄段人数频率分布直方图,并求出各年龄段频数分布表中m ,n 的值; (2)现从年龄在[30,40)段中采用分层抽样的方法选取5名代表参加垃圾分类的知识交流活动,应社区要求,从被选中的这5名代表中任意选2名作交流发言,求选取的2名发言者中恰有1名年龄在[35,40)段中的概率.[解析] (1)∵第三组的频率为1-(0.04+0.06+0.03+0.02+0.01)×5=0.2, ∴第三组直方图的高为0.25=0.04.补全频率分布直方图如下图:由频率分布直方图,知m =0.02×1 000=200, n =0.02×(50-45)×1 000=100.(2)由(1)知年龄在[30,35)段中的人数与年龄在[35,40)段中的人数的比值为300200=32,所以采用分层抽样法抽取5名,年龄在[30,35)段中的有3名,年龄在[35,40)段中的有2名.不妨设年龄在[30,35)段中的3名为A 1,A 2,A 3,年龄在[35,40)段中的2名为B 1,B 2由于从5名代表中任选2名作交流发言的所有可能情况有:{A 1,A 2},{A 1,A 3},{A 1,B 1},{A 1,B 2},{A 2,A 3},{A 2,B 1},{A 2,B 2},{A 3,B 1},{A 3,B 2},{B 1,B 2},共10种,其中选取的2名发言者中恰有1名年龄在[35,40)段的情况有:{A 1,B 1},{A 1,B 2},{A 2,B 1},{A 2,B 2},{A 3,B 2},{A 3,B 2},共6种.故所求概率为P =610=35.考点二 线性回归分析例3 (2018·全国2)下图是某地区2000年至2016年环境基础设施投资y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①;y ^=-30.4+13.5t ,根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^=99+17.5t .(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.【分析】 (1)模型①中取t =19,模型②中取t =9,求出对应的函数值即可;(2)利用所给折线图中数据的增长趋势,加以分析即可.【标准答案】——规范答题 步步得分(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为 y ^=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为 y ^=99+17.5×9=256.5(亿元). (2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y =-30.4+13.5t 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y ^=99+17.5t 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,答出其中任意一种或其他合理理由均可得分) 12分得分点④ 【评分细则】①根据模型①求出预测值给3分; ②根据模型②求出预测值给3分; ③判断模型②得到的预测值更可靠给2分; ④作出正确的判断,写出合理理由,给4分; 【名师点评】1.核心素养:本题主要考查线性回归方程的实际应用,考查考生的应用意识,分析问题与解决问题的能力以及运算求解能力,考查数学的核心素养是数据分析、数学建模、数学运算.2.解题技巧:统计中涉及的图形较多、常见的有条形统计图、折线图、茎叶图、频率分布直方图、应熟练地掌握这些图形的特点,提高识图与用图的能力.〔变式训练2〕(2021·安徽蚌埠质检)经销商小王对其所经营的某一型号二手汽车的使用年数x (0<x ≤10,x ∈N )与每辆的销售价格y (单位:万元)进行整理,得到如表的对应数据:(1)试求y 关于x 的回归直线方程;(2)已知每辆该型号汽车的收购价格ω(单位:万元)与使用年数x (0<x ≤10,x ∈N )的函数关系为ω=0.05x 2-1.75x +17.2,根据(1)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大.附:回归直线的斜率和截距的最小二乘估计公式分别为b ^=∑i =1nx i y i -n x -·y-∑i =1nx 2i -n x -2,a ^=y --b ^ x -. [解析] (1)由表中数据,得x -=15×(2+4+6+8+10)=6,。

高考正态分布知识点归纳

高考正态分布知识点归纳

高考正态分布知识点归纳作为中国高等教育的重要选拔方式,高考在很大程度上决定了学生的命运。

而统计学中的正态分布是高考中常出现的一个重要概念。

了解和掌握正态分布的相关知识点对于高考数学考试至关重要。

本文将从不同角度对高考正态分布知识点进行归纳和总结,以帮助考生更好地应对相关考题。

一、正态曲线和标准正态分布正态曲线是一种在统计学中经常使用的函数图形。

它呈现出钟形曲线的形状,具有中心对称、均值和标准差两个重要参数的特征。

高考中常见的正态分布问题会涉及到正态曲线的图形特点、标准差的计算等内容。

标准正态分布是指均值为0、标准差为1的正态分布。

对于任意一个正态分布,我们都可以通过标准化处理,将其转化为标准正态分布。

标准正态分布具有良好的性质,比如其面积一定等于1,可以使用标准正态分布表进行查找。

二、正态分布的性质和应用正态分布具有许多重要的性质,这些性质在高考中常常会涉及到。

首先是标准差的性质。

标准差越大,曲线越扁平;标准差越小,曲线越陡峭。

这个性质可以帮助我们察觉数据的分散程度。

其次是与正态分布有关的概率问题。

根据正态分布的特点,我们可以计算某个数值在一定范围内的概率。

例如,高考中常见的题目会要求计算某个班级或某个学生在全省排名中的百分位数。

最后是正态分布在抽样理论中的应用。

正态分布是许多统计方法的基础,比如样本均值的抽样分布、样本比例的抽样分布等。

这些应用在高考数学考试中也经常会出现。

三、正态分布与假设检验高考中的数学考卷通常涉及到学生的实际生活问题。

与实际问题相关的统计假设检验也常常和正态分布有关。

假设检验是一种通过收集样本数据,根据样本数据对总体参数进行推断的方法。

在高考中,常见的假设检验问题可能涉及到学生的身高、成绩等方面。

其中,若总体服从正态分布,则可以使用正态分布的性质进行假设检验。

对于高考数学考试中的假设检验问题,我们需要熟悉正态分布的假设检验步骤和相关公式,以便正确地解答相关题目。

四、高考试题中的正态分布问题在高考数学试卷中,正态分布相关的题目通常出现在概率与统计部分。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1. 正态分布的概念
随机变量的概率密度,称服从正态分布记作。

标准正态分布,其概率密度,分布函数为。

2. 设,则,,的数值有表可查,特别有。

3. 设,则。

4. 设,则。

若,,与相互独立,则。

若相互独立,,则
5. 二维随机变量服从二维正态分布,记作,其中,,。

设服从二维正态分布,则与相互独立的充分必要条件是。

6. 当充分大时,独立同分布的随机变量的和近似服从正态分布。

特别是当充分大时,若相互独立的随机变量都服从“0-1”分
布,则服从二项分布,近似服从正态分布,这时。

标准正态分布与一般正态分布的概率换算关系:。

相关文档
最新文档