第三讲描述统计..
第三章 统计 第三讲 几何概率

第三章统计第三讲几何概率【考点透视】一、几何概率1.几何概型的定义如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型,简称几何概型.2.几何概型的特点(1)试验中所有可能出现的结果(基本事件)有无限多个.(2)每个基本事件出现的可能性相等.3.几何概型的概率公式P(A)=构成事件A的区域长度(面积或体积)试验的全部结果所构成的区域长度(面积或体积).二、随机数1.均匀随机数的产生(1)计算器上产生[0,1]的均匀随机数的函数是RAND函数.(2)Excel软件产生[0,1]区间上均匀随机数的函数为“rand()”.2.用模拟的方法近似计算某事件概率的方法(1)试验模拟的方法:制作两个转盘模型,进行模拟试验,并统计试验结果.(2)计算机模拟的方法:用Excel软件产生[0,1]区间上均匀随机数进行模拟.注意操作步骤.3.[a,b]上均匀随机数的产生.利用计算器或计算机产生[0,1]上的均匀随机数x=RAND,然后利用伸缩和平移交换,x=x1*(b-a)+a就可以得到[a,b]内的均匀随机数,试验的结果是[a,b]上的任何一个实数,并且任何一个实数都是等可能的.【经典例题】例1判断下列试验中事件A发生的概型是古典概型,还是几何概型.(1)抛掷两颗骰子,求出现两个“4点”的概率;(2)问题3中,求甲获胜的概率.解(1)抛掷两颗骰子,出现的可能结果有6×6=36种,且它们都是等可能的,因此属于古典概型;(2)游戏中指针指向B区域时有无限多个结果,而且不难发现“指针落在阴影部分”,概率可以用阴影部分的面积与总面积的比来衡量,即与区域面积有关,因此属于几何概型.小结判断一个概率是古典概型还是几何概型的步骤:(1)判断一次试验中每个基本事件发生的概率是否相等,若不相等,那么这个概率既不是古典概型也不是几何概型;(2)如果一次试验中每个基本事件发生的概率相等,再判断试验结果的有限性,当试验结果有有限个时,这个概率是古典概型;当试验结果有无限个时,这个概率是几何概型.例2某公共汽车站每隔10分钟有一辆汽车到达,乘客到达车站的时刻是任意的,求乘客候车时间不超过6分钟的概率.解如下图所示,设上辆车于时刻T1到达,而下辆车于时刻T2到达,则线段T1T2的长度为10,设T是线段T1T2上的点,且TT2的长为6,记“等车时间不超过6分钟”为事件A,则事件A发生即当点t落在线段TT2上,即D =T1T2=10,d=TT2=6.所以P(A)=dD=610=35.故乘客候车时间不超过6分钟的概率为35.小结数形结合为几何概型问题的解决提供了简捷直观的解法.利用图解题的关键:首先用图形准确表示出试验的全部结果所构成的区域,由题意将已知条件转化为事件A 满足的几何区域,然后根据构成这两个区域的几何长度(面积或体积),用几何概型概率公式求出事件A 的概率.例3 在Rt △ABC 中,∠A =30°,过直角顶点C 作射线CM 交线段AB 于M ,求使|AM |>|AC |的概率.解 设事件D 为“作射线CM ,使|AM |>|AC |”.在AB 上取点C ′使|AC ′|=|AC |,因为△ACC ′是等腰三角形,所以∠ACC ′=180°-30°2=75°,μA =90-75=15,μΩ=90,所以P (D )=1590=16.小结 几何概型的关键是选择“测度”,如本例以角度为“测度”.因为射线CM 落在∠ACB 内的任意位置是等可能的.若以长度为“测度”,就是错误的,因为M 在AB 上的落点不是等可能的.例4 假设你家订了一份报纸,送报人可能在早上6:30~7:30之间把报纸送到你家,你父亲离开家去上班的时间在早上7:00~8:00之间,如果把“你父亲在离开家之前能得到报纸”称为事件A ,则事件A 的概率是多少? 分析1 在例1中,事件A 是哪种类型的事件?答 随机事件.分析2 设X 、Y 为[0,1]上的均匀随机数,6.5+X 表示送报人到达你家的时间,7+Y 表示父亲离开家的时间,若事件A 发生,则X 、Y 应满足什么关系?答 7+Y >6.5+X ,即Y >X -0.5.分析3 设送报人到达你家的时间为x ,父亲离开家的时间为y ,若事件A 发生,则x 、y 应满足什么关系?答⎩⎨⎧6.5≤x ≤7.5,7≤y ≤8,y ≥x .分析4 画出上述不等式组表示的平面区域.答分析5 根据几何概型的概率计算公式,事件A 发生的概率为多少?答 试验的全部结果所构成的区域的面积为边长为1的正方形,面积为1;图中的阴影部分面积为1-12×12×12=78,所以P (A )=781=78.分析6 你能设计一种随机模拟的方法近似计算上面事件A 发生的概率吗?答 方法一 (随机模拟的方法)做两个只带有分针的圆盘,标上时间,分别旋转两个圆盘,记下父亲在离家前能得到报纸的次数,则P (A )=父亲在离家前能得到报纸的次数试验的总次数.方法二 用计算机产生随机数模拟试验.X 是0~1之间的均匀随机数,Y 也是0~1之间的均匀随机数.如果Y +7>X +6.5,即Y >X -0.5,那么父亲在离开家前能得到报纸.在计算机上做M 次试验,查一下Y >X -0.5的Y 的个数,如果为N ,则所求概率为N /M .小结 用随机数模拟的关键是把实际问题中事件A 及基本事件总体对应的区域转化为随机数的范围.用转盘产生随机数,这种方法可以亲自动手操作,但费时费力,试验次数不可能很大.例5 利用随机模拟方法计算由y =1和y =x 2所围成的图形的面积. 解 以直线x =1,x =-1,y =0,y =1为边界作矩形, (1)利用计算器或计算机产生两组0~1区间的均匀随机数,a 1=RAND,b 1=RAND; (2)进行平移和伸缩变换,a =2(a 1-0.5);(3)数出落在阴影内的样本点数N 1,用几何概型公式计算阴影部分的面积. 例如做1 000次试验,即N =1 000,模拟得到N 1=698,所以P =阴影面积矩形面积=6981 000,即阴影面积S=矩形面积×6981 000=2×6981 000=1.396.小结解决本题的关键是利用随机模拟法和几何概率公式分别求得几何概率,然后通过解方程求得阴影部分面积的近似值,解决此类问题时注意两点:一是选取合适的对应图形,二是由几何概型正确计算概率.【小露一手】同步练习 几何概型一、基础过关1.在区间(15,25]内的所有实数中随机取一个实数a ,则这个实数满足17<a <20的概率是( )A.13B.12C.310D.5102.在长为10厘米的线段AB 上任取一点G ,用AG 为半径作圆,则圆的面积介于36π平方厘米到64π平方厘米的概率是( )A.925B.1625C.310D.153.当你到一个红绿灯路口时,红灯的时间为30秒,黄灯的时间为5秒,绿灯的时间为45秒,那么你看到黄灯的概率是( )A.112B.38C.116D.564.ABCD 为长方形,AB =2,BC =1,O 为AB 的中点,在长方形ABCD 内随机取一点,取到的点到O 的距离大于1的概率为( )A.π4B .1-π4C.π8D .1-π85.一只小蜜蜂在一个棱长为30的正方体玻璃容器内随机飞行,若蜜蜂在飞行过程中与正方体玻璃容器6个表面中至少有一个的距离不大于10,则就有可能撞到玻璃上而不安全;若始终保持与正方体玻璃容器6个表面的距离均大于10,则飞行是安全的,假设蜜蜂在正方体玻璃容器内飞行到每一位置可能性相同,那么蜜蜂飞行是安全的概率是______. 6.有一个圆面,圆面内有一个内接正三角形,若随机向圆面上投一镖都中圆面,则镖落在三角形内的概率为________.7.在圆心角为90°的扇形AOB 中,以圆心O 为起点作射线OC ,求使得∠AOC 和∠BOC 都不小于30°的概率.8.甲、乙两人约定在6时到7时之间在某处会面,并约定先到者应等候另一人一刻钟,过时即可离去.求两人能会面的概率. 二、能力提升9.在区间[-1,1]上任取两数x 和y ,组成有序实数对(x ,y ),记事件A 为“x 2+y 2<1”,则P (A )等于( )A.π4B.π2C .πD .2π10.有四个游戏盘,如下图所示,如果撒一粒黄豆落在阴影部分,则可中奖,小明希望中奖机会大,他应当选择的游戏盘为()11.在边长为2的正三角形ABC内任取一点P,则使点P到三个顶点的距离至少有一个小于1的概率是________.12.国家安全机关监听录音机记录了两个间谍的谈话,发现30 min长的磁带上,从开始30 s处起,有10 s长的一段内容包含两间谍犯罪的信息.后来发现,这段谈话的一部分被某工作人员擦掉了,该工作人员声称他完全是无意中按错了键,使从此处起往后的所有内容都被擦掉了.那么由于按错了键使含有犯罪内容的谈话被部分或全部擦掉的概率有多大?三、探究与拓展13.设关于x的一元二次方程x2+2ax+b2=0.(1)若a是从0,1,2,3四个数中任取的一个数,b是从0,1,2三个数中任取的一个数,求上述方程有实根的概率.(2)若a是从区间[0,3]上任取的一个数,b是从区间[0,2]上任取的一个数,求上述方程有实根的概率.答 案1.C 2.D 3.C 4.B 5.127 6.334π7.解 如图所示,把圆弧AB 三等分,则∠AOF =∠BOE =30°, 记A 为“在扇形AOB 内作一射线OC ,使∠AOC 和∠BOC 都 不小于30°”,要使∠AOC 和∠BOC 都不小于30°,则OC 就 落在∠EOF 内, ∴P (A )=30°90°=13.8.解 以x 轴和y 轴分别表示甲、乙两人到达约定地点的时间,则 两人能够会面的充要条件是|x -y |≤15.在如图所示的平面直角坐标 系下,(x ,y )的所有可能结果是边长为60的正方形区域,而事件 A “两人能够会面”的可能结果由图中的阴影部分表示.由几何概 型的概率公式得:P (A )=S A S =602-452602=3 600-2 0253 600=716.所以,两人能会面的概率是716. 9.A 10.A 11.3π612.解 包含两个间谍犯罪信息的录音部分在30 s 到40 s 之间,当按错键的时刻在这段时间之内时,部分被擦掉,当按错键的时刻在0 s 到30 s 之间,全部被擦掉,即在0 s 到40 s 之间,也就是0 min 到23 min 之间的时间按错键时,含有犯错内容的谈话部分或全部被擦掉.记A ={按错键使含有犯罪内容的谈话部分或全部被擦掉},A 发生在0 min 到23 min 时间段内按错键. 所以P (A )=2330=145.13.解 设事件A 为“方程x 2+2ax +b 2=0有实根”.当a ≥0,b ≥0时,方程x 2+2ax +b 2=0有实根的充要条件为a ≥b .(1)基本事件共有12个:(0,0),(0,1),(0,2),(1,0),(1,1),(1,2),(2,0),(2,1),(2,2),(3,0),(3,1),(3,2).其中第一个数表示a 的取值,第二个数表示b 的取值. 事件A 包含9个基本事件,故事件A 发生的概率为 P (A )=912=34.(2)试验的全部结果所构成的区域为{(a ,b )|0≤a ≤3,0≤b ≤2}. 构成事件A 的区域为{(a ,b )|0≤a ≤3,0≤b ≤2,a ≥b }. 所以所求的概率为P (A )=3×2-12×223×2=23.同步练习 随机数一、基础过关1.用计算器或计算机产生20个[0,1]之间的随机数x ,但是基本事件都在区间[-1,3]上,则需要经过的线性变换是 ( )A .y =3x -1B .y =3x +1C .y =4x +1D .y =4x -1 2.与均匀随机数特点不符的是( )A .它是[0,1]内的任何一个实数B .它是一个随机数C .出现的每一个实数都是等可能的D .是随机数的平均数3.质点在数轴上的区间[0,2]上运动,假定质点出现在该区间各点处的概率相等,那么质点落在区间[0,1]上的概率为( )A.14B.13C.12D .以上都不对4.一海豚在水池中自由游弋,水池为长30 m ,宽20 m 的长方形,海豚离岸边不超过2 m的概率为(注:海豚所占区域忽略不计)( )A.1150B.2125C.2375D.13005.方程x 2+x +n =0 (n ∈(0,1))有实根的概率为________.6. 已知右图所示的矩形,其长为12,宽为5.在矩形内随机地撒1 000颗黄豆,数得落在阴影部分的黄豆数为550颗,则可以估计出阴影部分的面积约为________.7.取一根长度为3 m 的绳子,拉直后在任意位置剪断,那么剪得两段的长都不小于1 m 的概率?(用模拟的方法求解)8.甲、乙两人约定6时到7时之间在某处会面,并约定先到者应等候另一人一刻钟,过时即可离去,请用随机模拟法估算两人能会面的概率. 二、能力提升9. 如图,边长为2的正方形中有一封闭曲线围成的阴影区域,在正方形中随机撒一粒豆子,它落在阴影区域内的概率为23,则阴影区域的面积约为( )A.43B.83C.23D .无法计算10. 向图中所示正方形内随机地投掷飞镖,则飞镖落在阴影部分的概率为( )A.14B.2536C.25144 D .111.向面积为S 的△ABC 内任投一点P ,则△PBC 的面积小于S 2的概率为________. 12. 利用随机模拟方法计算图中阴影部分(曲线y =2x 与x 轴、x =±1所围成的部分)的面积.三、探究与拓展13.将长为l 的棒随机折成3段,求3段能构成三角形的概率.答 案1.D 2.D 3.C 4.C 5.146.33 7.解 方法一 (1)利用计算器或计算机产生一组0到1区间的均匀随机数a 1=RAND.(2)经过伸缩变换,a =a 1]N 1,N )即为概率P (A )的近似值.方法二 做一个带有指针的圆盘,把圆周三等分,标上刻度[0,3](这里3和0重合).转动圆盘记下指针在[1,2](表示剪断绳子位置在[1,2]范围内)的次数N 1及试验总次数N ,则f n (A )=N 1N即为概率P (A )的近似值. 8.解 设事件A ={两人能会面}.(1)利用计算器或计算机产生两组0到1区间的均匀随机数,x 1=RAND ,y 1=RAND ;(2)经过伸缩变换,x =x 1]N 1,N ),即为概率P (A )的近似值.9.B 10.C 11.3412.解 (1)利用计算机产生两组[0,1]区间上的均匀随机数,a 1=RAND ,b 1=RAND ;(2)进行平移和伸缩变换得到一组[-1,1]区间上的均匀随机数和一组[0,2]区间上的均匀随机数;(3)统计试验总次数N 和落在阴影内的点数N 1(满足条件b <2a 的点(a ,b )的个数);(4)计算频率N 1N,即落在阴影部分的概率的近似值; (5)设阴影面积为S ,则用几何概型公式求得点落在阴影部分的概率为P =S 4. 所以N 1N ≈S 4, 所以S ≈4N 1N即为阴影部分面积的近似值. 13.解 设A =“3段能构成三角形”,x ,y 分别表示其中两段的长度,则第3段的长度为l -x -y . 则试验的全部结果可构成集合Ω={(x ,y )|0<x <l,0<y <l,0<x +y <l },要使3段构成三角形,当且仅当任意两段之和大于第3段,即x +y >l -x -y ⇒x +y >l 2, x +l -x -y >y ⇒y <l 2,y +l -x -y >x ⇒x <l 2. 故所求结果构成集合A =⎩⎨⎧⎭⎬⎫(x ,y )|x +y >l 2,y <l 2,x <l 2. 由图可知,所求概率为P (A )=A 的面积Ω的面积=12·⎝⎛⎭⎫l 22l 22=14.。
统计学02-第三讲 两个总体参数的区间估计_24

2 p
(n1
1)s12
(n2
1)s
2 2
n1 n2 2
3. 估计量x1-x2的抽样标准差
s
2 p
s
2 p
n1 n2
sp
11 n1 n2
两个总体均值之差的估计
(小样本: 1222 )
1. 两个样本均值之差的标准化
t
( x1
x2 ) 1
s p n1
(1
1 n2
2 )
~
t (n1
n2
2)
2. 两个总体均值之差1-2在1- 置信水平下的
x1
32.5
s12
15.996 x2
27.875
s
2 2
23.014
自由度为
15.996
23.014
2
v 12
8
13.188 13
15.996 122 23.014 82
12 1
8 1
(32.5 27.875) 2.1604 15.996 23.014 4.625 4.433
女学生: x2 480
s
2 2
280
试以90%置信水平估计男女学生生活费支出方 差比的置信区间
两个总体方差比的区间估计 (例题分析)
解 : 根 据 自 由 度 n1=25-1=24 , n2=25-1=24 , 查 得 F/2(24)=1.98, F1-/2(24)=1/1.98=0.505
12 /22置信度为90%的置信区间为
两个总体均值之差1-2在1- 置信水平下的置
信区间为
x1 x2 t 2 (v)
s12
s
2 2
n1 n2
自由度 v
第三讲-1 环境统计图表

复式线形高低图
/
500
400
微 克 300 立 方 200 米
100
0
-100 湖水
水源点
水库水
自来水
MA X MIN A VERA GE
nox浓度1 so2浓度2 烟尘1
差异线高低图
2.5
2.0
1.5
1.0
.5 湖水
水源点
水库水
MA X
MIN 自来水
mg/L
简单直条形高低图
2.5
2.0
1.5
3.注意:纵轴须从0开始。单位:%/频数
频 数
graphs
histogram
Variable=日照
只有 一种 类型
(4)箱式图box chart
箱式图:使用5个统计量反映连续型变量的 分布特征,即最小值、下四分位数、中位 数、上四分位数、最大值。 注意: 异常值:大于1.5倍四分位数间距的数值, 在图中常用“o”表示。 极端值:大于3倍四分位数间距的数值,在 图中常用“*”表示。 优点:显示异常值。
图中显示粉尘数的分布呈偏态分布,净 化厂粉尘数较少,非净化厂粉尘数较多。
除去异常值外的最大值
2.0
1.8
尘粒数(亿)
上1.四6 分位数 1.4 1.2 1.0 .8 .6
箱子越长,数据
中位数
变异程度越大。 中间横线在箱子
中点表明分布对
称,否则不对称
.4
.2
0.0
净化
非净化
粉类
下四分位数工厂类型
.46
新医疗法
32
16
50.0
眼保健操
32
9
28.1
分组标志为矫治方法
统计学02-第三讲 中心极限定理课件

第3讲 中心极限定理
1
中心极限定理
设从均值为,方差为 2的一个任意总体中抽取
容量为n的样本,当n充分大时,样本均值的抽样 分布近似服从均值为μ、方差为σ2/n的正态分布。
一个任意分 布的总体
x
n
x
X
当样本容量足够大时(n 30) ,样本均 值的抽样分布逐渐趋于正态分布
X 的分布趋于正态分布的过程
因此知,样本均值的抽样分布服从:
X~N
, 2
n
N
10,
0.62 36
N
10, 0.01
P
9.9<X<10.1=
P
9.9 10 0.1
<
X 10 0.1
<10.1 10 0.1
P
Z<10.1 10 0.1
P
Z<
9.9 10 0.1
P Z<1 P Z<-1 2P Z<1 1
(2)
2 1 1 0.6826
抽样分布与总体分布的关系
总体分布
正态分本
正态分布 非正态分布
抽样分布
例题
设从一个均值为μ=10,方差 σ2=0.36的总 体中随机抽取样本容量为n=36的样本,假 定该总体不是很有偏。
要求:计算样本均值在总体均值0.1范围内 的近似概率。
解:根据中心极限定理,样本容量>30,样本均 值的抽样分布近似服从正态分布。
第二章(第三讲): 孟德尔定律—— 遗传学数据的统计处理

28
二、二项式公式与通式及应用
同理,如果是三对基因杂种YyRrCc,其自交的F2群体 的表现型概率,可按二项式展开求得:
( p q)n
3
1 3 4 4
2
3
27 27 9 1 3 3 1 3 1 1 3 3 64 64 64 64 4 4 4 4 4 4
用于分析两对立事件(非此即彼)在多 次试验中每种事件组合发生的概率.
G. L. ZHOU
21
二、二项式公式与通式及应用
设A、B为对立事件,P(A)=p, P(B)=q, 可得: P(A+B)=p+q=1;设:
n为试验次数
r:在n次试验中A事件出现的次数 n-r:在n次试验中B事件出现的次数
n 3 3
n2
1 4
n
2
n(n 1)(n 2) 3 3! 4
G. L. ZHOU
1 1 4 4
27
二、二项式公式与通式及应用
例如,两对基因杂种YyRr自交产生的F2群体, 其表现型个体的概率按上述3/4:1/4的概率代 入二项式展开为: 2
G. L. ZHOU
26
二、二项式公式与通式及应用
n代表杂合基因对数,则其二项式展开为: n 3 1 n ( p q) 4 4
3 3 n 4 4
n
n 1
1 n( n 1) 3 2! 4 4
Chaptr 2
G. L. ZHOU
1
B-3 遗传学数据的统计处理
一、概率原理与应用 二、二项式展开与应用 三、 2测验(Chi平方测验)与应用
第三讲 描述定量资料集中趋势的指标

第三讲:描述定量资料集中趋势的指标
复习书目:人民卫生出版社《卫生统计学》第6版 主编:方积乾
算数均数(mean):简称均数,适用于正态 分布或近似正态分布资料。 适用条件:用于反映一组呈正态分布的变量 值在数量上的平均水平
几何均数(geometric mean,G):常用来 反映一组含多个数量级数据的集中位置。 适用条件:适用于原始数据观察值分布不对 称,但经过对数转换后呈正态分布的资料。
X 3.43+2.96+4.43+3.03+4.53+5.25+5.64+3.82+4.28+5.25 4.26 (mmol/L) 10
M 4.28+4.43 4.36 (mmol/L) 2
谢谢观看!
扫描二维码 关注微信官方平台,获取更多资料 微信号:gaojiao-edu
中位数(median,M):一组按大小顺序排列的观 察值中位次居中的数值。 适用条件:中位数适合用于各种分布的资料,特别 是偏锋分布资料、分布末端无确定值的资料等。
答案后血液尿素氮的含量 (mmol/L)分别为 3.43,2.96,4.43,3.03,4.53,5.25,5.64,3.82,4.28, 5.25,试计算其均数和中位数。
苏教版五年级数学下册第三讲折线统计图
第三讲:折线统计图知识提纲:本单元在认识条形统计图的基础上教学折线统计图,并已积累较多的统计活动经验的基础上要求同学了解其特点;能够看懂折线统计图中的数据内容,并利用数据进行简单的分析;能够在提供的方格纸上画折线表示数据及其变化态势。
知识点一:单式折线统计图单式折线统计图折线统计图的特点:不仅能够看出数量的多少,而且还能清楚地看出数量增减变化的情况。
单式折线统计图的画法:用一个单位长度表示一定数量,根据数量多少描出各点,然后把各点用线段顺次连接起来。
知识点二:完整的折线统计图由哪些部分组成?在制作时应该注意些什么呢?明确:(1)横轴:一般用于标明数字,每个段都要平均分;(2)纵轴:标明数据(相同间隔);(3)描点、连线:要找准数据,看清横轴和纵轴后再进行描点;(4)标注数据;(5)填写制表日期。
例题:双休日期间,明明和爸爸开车去动物园,在去的路上,明明画出了汽车的速度随时间的变化情况,如下图所示。
(1)汽车行驶了( )分?它的最大速度是( )。
(2)汽车在哪个范围内保持匀速行驶?速度是多少?(3)出发后8~10分钟这段时间可能出现什么情况?分析:(1)根据这幅折线统计图可以看出:汽车行了(8-0)+(18-10)=16(分),它的最大速度是30千米/时;(2)这个折线统计图在2~6分、12~16分两段的折线与横轴平行,且与横的距离最远,说明这两时间段速度最大,且保持匀速行驶,所对应的速度是30千米/时;(3)在8~10分这段时间内汽车停下,可能是加油、与熟人说话、或其他事情。
知识点四:复式折线统计图复式折线统计图和单式折线统计图的基本结构大体上是一样的,都是由图形名称和图形组成。
不同的是单式折线统计图中只有一条折线,表示一组数据,而复式折线统计图中有两条折线,表示两组数据,复式折线统计图中还增加了图例。
复式折线统计图便于进行两个统计项目的相关数量的比较。
(这里注意要加图例)例题:如图是一张甲、乙两车的行程图,仔细阅读后解答下列问题。
概率与统计 第三讲 统计与统计案例——2023届高考理科数学大单元二轮复习练重点【新课标全国卷】
专题八 概率与统计 第三讲 统计与统计案例——2023届高考理科数学大单元二轮复习练重点【新课标全国卷】1.在某次赛车中,50名参赛选手的成绩(单位:min )全部介于13到18之间(包括13和18).现将比赛成绩分为五组:第一组[13,14),第二组[14,15),…,第五组[17,18],其频率分布直方图如图所示.若成绩在[13,15)内的选手可获奖,则这50名选手中获奖的人数为( )A.11B.15C.35D.392.某学校组织学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[)20,40,[)40,60,[)60,80,[]80,100.若低于60分的人数是15人,则参加英语测试的学生人数是( )A.45B.50C.55D.603.我国是一个农业大国,从事农业工作的人员有5.4亿,如图为某县农村从业人员年龄结构图,为了解该县从业人员在从事农业工作中的实际困难,以推进县乡村振兴工作,某调查机构计划从某县的所有从业人员中随机抽取20人展开某项调研,则所抽取的20人中恰有2人的年龄在20岁以下的概率约为( ) (170.90.167≈,180.90.15≈,190.90.135≈,200.90.122≈)A.0.25B.0.29C.0.32D.0.354.某校高一年级在某次数学测验中成绩不低于80分的所有考生的成绩统计表如下:A.在[90,100]内B.在(100,110]内C.在(110,120]内D.在(120,130]内5.若某同学连续3次考试的名次(3次考试均没有出现并列名次的情况)不低于第3名,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续3次考试名次的数据,推断一定是尖子生的是( )A.甲同学:平均数为2,众数为1B.乙同学:平均数为2,方差小于1C.丙同学:中位数为2,众数为2D.丁同学:众数为2,方差大于16.2021年某省高考体育百米测试中,成绩全部介于12秒与18秒之间,抽取其中100个样本,将测试结果按如下方式分成六组:第一组[12,13),第二组[13,14),…,第六组[17,18],得到如下的频率分布直方图.则该100考生的成绩的平均数和中位数(保留一位小数)分别是( )A.15.2 15.3B.15.1 15.4C.15.1 15.3D.15.2 15.37.设样本数据1x ,2x ,…,10x 的平均数和方差分别为1和4,若i i y x a =+(a 为非零常数,1,2,,10i =),则1y ,2y ,…,10y 的平均数和方差分别为( ) A.1a +,4B.1a +,4a +C.1,4D.1,4a +8.已知变量x ,y 之间的一组数据如下表:若y 关于x 的线性回归方程为0.7y x a =+,则a =( ) A.0.1B.0.2C.0.35D.0.459.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得经验回归直线方程0.6754.9y x =+,表中有一个数据模糊不清,请你推断出该数据的值为( )C.68 10.第24届冬季奥林匹克运动会将于2022年在北京举办.为了解某城市居民对冰雪运动的关注情况,随机抽取了该市100人进行调查统计,得到如下22⨯列联表.参考公式:()()()()2n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.附表:A.该市女性居民中大约有5%的人关注冰雪运动B.该市男性届民中大约有95%的人关注冰雪运动C.有95%的把握认为该市居民是否关注冰雪运动与性别有关D.有99%的把握认为该市居民是否关注冰雪运动与性别有关11.一个项目由15个专家评委投票表决,剔除一个最高分96,一个最低分58后所得到的平均分为92,方差为16,那么原始得分的方差为_______.12.经市场调查,某款热销品的销售量y(万件)与广告费用x(万元)之间满足回归直线方程 3.5=+.若样本点中心为(45,35),则当销售量为52.5万件时,可估计投入y bx的广告费用为_________________万元.13.某学校为了制订治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的50份调查问卷,得到了如下的列联表:14.某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)8.602.15.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):1(优) (2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的22⨯列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.附:2()()()()K a b c d a c b d =++++,)2kk答案以及解析1.答案:A解析:由题意可得,成绩在[13,15)内的频率为10.080.320.380.22---=.又本次赛车中,共50名参赛选手,所以这50名选手中获奖的人数为500.2211⨯=.故选A. 2.答案:B解析:根据频率分布直方图的特点可知,低于60分的频率是(0.0050.01)200.3+⨯=,则所求学生人数是15500.3=. 3.答案:B解析:由频率分布直方图可得20岁以下的农村从业人员的概率为0.1,所以从所有从业人员中抽取20人,其中恰有2人的年龄在20岁以下的概率为221820C (0.1)(0.9)0.2850.29≈≈,故选B. 4.答案:B解析:由表可知,及格的考生共有401512105284+++++=人,在[90,100]内有40人,在(100,110]内有15人,故及格的所有考生成绩的中位数在(100,110]内.5.答案:B解析:甲同学:若平均数为2,众数为1,则有一次名次应为4,故排除A ;乙同学:平均数为2,设乙同学3次考试的名次分别为1x ,2x ,3x ,则方差()()()2222123122213s x x x ⎡⎤=-+-+-<⎣⎦,则()()()2221232223x x x -+-+-<,所以1x ,2x ,3x 均不大于3,符合题意;丙同学:中位数为2,众数为2,有可能是2,2,4,不符合题意;丁同学:众数为2,方差大于1,有可能是2,2,6,不符合题意.故选B. 6.答案:C解析:100名考生成绩的平均数12.50.1013.50.1514.50.15x =⨯+⨯+⨯+15.50.3016.50.2517.50.0515.1⨯+⨯+⨯=.因为前三组频率直方图面积和为0.100.150.150.4++=,前四组频率直方图面积和为0.100.150.150.300.7+++=,所以中位数位于第四组内,设中位数为a ,则(15)0.300.1a -⨯=,解得15.3a ≈,故选C.7.答案:A解析:由题意知i i y x a =+,即()1210110110y x x x a x a a =⨯++++=+=+,方差{}222212101()()()10x a x a x s a x a x a x a ⎡⎤⎡⎤⎡⎤=⨯+-+++-++++-+⎣⎦⎣⎦⎣⎦()()()22212101410x x x x x x ⎡⎤=⨯-+-++-=⎢⎥⎣⎦. 故选A. 8.答案:C解析:本题考查线性回归方程截距的求解.因为11(3456) 4.5,(2.534 4.5) 3.544x y =+++==+++=,所以0.7 3.50.7 4.50.35a y x =-=-⨯=,故选C. 9.答案:C解析:设表中模糊看不清的数据为m .由表中数据得30x =, 3075m y +=,将30730,5m x y +==代入经验回归方程0.6754.9y x =+,得68m =.故选C. 10.答案:C解析:由22⨯列联表中的数据可得()22352515251004.167 3.84160405050K ⨯-⨯⨯=≈>⨯⨯⨯,因此,有95%的把握认为该市居民是否关注冰雪运动与性别有关.故选:C.11.答案:88解析:根据题意,设剔除最高分、最低分之后的13个数据为1a ,2a ,3a ,…,13a ,由这13个数据的平均分为92,方差为16, 知()1231319213a a a a ++++=,()()()222121319292921613a a a ⎡⎤-+-++-=⎣⎦, 解得123131196a a a a ++++=,2221213110240a a a +++=,对于原始得分96,58,1a ,2a ,3a ,…,13a , 其平均数()12313196589015a a a a a =++++++=,其方差为()(()22222212131(9690)(5890)9090)908815s a a a ⎤⎡=-+-+-+-++-=⎣⎦. 12.答案:70解析:本题考查线性回归方程.依题意,将(45,35)代入回归直线方程 3.5y bx =+(提示:回归直线必过样本点中心),得3545 3.5b =⨯+,解得0.7b =,所以回归直线方程为0.7 3.5y x =+.令0.7 3.552.5y x =+=,得70x =. 13.答案:99.5%解析:因为2250(2015510)8.33325253020χ⨯⨯-⨯=≈⨯⨯⨯,又()27.8790.0050.5%P χ==≥,所以我们有99.5%的把握认为“是否同意限定区域停车与家长的性别有关”.14.答案:(1)产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为20%(2)平均数与标准差的估计值分别为30%,17%解析:(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为1470.21100+=.产值负增长的企业频率为20.02100=. 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为20%. (2)1(0.1020.10240.30530.50140.707)0.30100y =⨯-⨯+⨯+⨯+⨯+⨯=, ()52222111(0.40)2(0.20)100100i i i s n y y=⎡=-=⨯-⨯+-⨯⎣∑222240530.20140.4070.0296⎤+⨯+⨯+⨯=⎦,0.020.17s .所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.15.答案:(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:1(100203003550045)350100⨯+⨯+⨯=. (3)根据所给数据,可得22⨯列联表:根据列联表得25.82055457030K =≈⨯⨯⨯. 由于5.820 3.841>,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.。
2024届高考数学一轮总复习第八章统计与统计分析第三讲成对数据的统计分析课件
b^=x1yx1+21+xx2y22+2+……++xx2n-nynn--xn2x y ,a^=-y -b^-x . 参考数据:15×16+20×20+35×40+50×48=4 440, 152+202+352+502=4 350.
解:(1)散点图如图 D64:
(4)判断经验回归方程的拟合效果,可以利用样本相关系数判 断,|r|越趋近于 1,两变量的线性相关性越强.
【变式训练】
(2022 年金台区期中)某消费品企业销售部对去年各销售地的
居民年收入(即此地所有居民在一年内的收入的总和)及其产品销 售额进行抽样分析,收集数据整理如下:
销售地
A
B
C
D
年收入 x(亿元)
a^=-y -b^-x =31-0.96×30=2.2. ∴y 关于 x 的线性回归方程为^y=0.96x+2.2. (3)由题意,B 地今年居民收入为 20+20×20%=24, 把 x=24 代入^y=0.96x+2.2, 得^y=0.96×24+2.2=25.24(万元). ∴预测 B 地今年的销售额 y 将达到 25.24 万元.
答案:ABC
(2)某研究机构为调查人的最大可视距离 y(单位:米)和年龄 x(单位:岁)之间的关系,对不同年龄的志愿者进行了研究,收集 数据得到下表:
x
20
25
30
35
40
y
167
160
150
143
130
(1)根据上表提供的数据,求出 y 关于 x 的线性回归方程^y= b^x+a^;
(2)根据(1)中求出的线性回归方程,估计年龄为 50 岁的人的 最大可视距离.
第三讲 成对数据的统计分析
统计基础知识与统计实务(三)
n 1 = 80
n1 80 = = 20 % 则:样本成数 p = n 400
µp =
p (1 − p ) = n
0.2 × 0.8 = 0.02 400
即:根据样本资料推断全部学生中戴眼镜的学生所占 的比重时,推断的平均误差为2%。
例7-3: :
一批食品罐头共60000桶,随机抽查300桶,发现有6桶不合格, 求合格品率的抽样平均误差?
非概 率抽 样调 查
概率 抽样 调查
1
2 5 8
4 3 抽样组织方式 6 7
系统随即抽样 分层随机抽样
1 1
4 5 4
1
1 整群随机抽样
多阶抽样
6
1
与大小成比例抽样
系统随机抽样
分层随机抽样
整群随机抽样
多阶抽样
1、某小区4000户居民从1-4000编号,在1-100中随机抽取1个号码3, 某小区4000户居民从1 4000编号, 4000户居民从 编号 100中随机抽取1个号码3 中随机抽取 103、203…3903构成抽样调查样本 则3、103、203…3903构成抽样调查样本 系统随机抽样 2、为了解某地区职工家庭状况,将职工家庭按居委会分组,并以居 为了解某地区职工家庭状况,将职工家庭按居委会分组, 委会为单位进行简单随机抽样, 委会为单位进行简单随机抽样,在对抽中的居委会所辖每户职工 家庭进行调查 整群随机抽样 3、对农作物单位面积产量调查,按平原、丘陵、山区分组来抽选样 对农作物单位面积产量调查,按平原、丘陵、 本单位 分层随机抽样
总体成数的区间估计 表 达 式
p − ∆p ≤ P ≤ p + ∆p
§7.5 样本单位数的确定
一、影响样本单位数的因素 ①抽样推断的可靠程度 ②总体标志的变异程度 ③极限误差的大小 ④抽样方法与组织方式的不同 ⑤人力、物力和财力的可能条件