高考《概率与统计初步》知识点和高考题、配套练习题(很全面)(良心出品必属精品)

合集下载

高考数学概率与统计部分知识点梳理(DOC)

高考数学概率与统计部分知识点梳理(DOC)

高考复习专题之:概率与统计一、概率:随机事件A 的概率是频率的稳定值,反之,频率是概率的近似值.1.随机事件A 的概率0()1P A ≤≤,其中当()1P A =时称为必然事件;当()0P A =时称为不可能事件P(A)=0; 注:求随机概率的三种方法: (一)枚举法例1如图1所示,有一电路AB 是由图示的开关控制,闭合a ,b ,c ,d ,e 五个开关中的任意两个开关,使电路形成通路.则使电路形成通路的概率是 .分析:要计算使电路形成通路的概率,列举出闭合五个开关中的任意两个可能出现的结果总数,从中找出能使电路形成通路的结果数,根据概率的意义计算即可。

解:闭合五个开关中的两个,可能出现的结果数有10种,分别是a b 、a c 、a d 、a e 、bc 、bd 、be 、cd 、ce 、de ,其中能形成通路的有6种,所以p(通路)=106=53评注:枚举法是求概率的一种重要方法,这种方法一般应用于可能出现的结果比较少的事件的概率计算. (二)树形图法例2小刚和小明两位同学玩一种游戏.游戏规则为:两人各执“象、虎、鼠”三张牌,同时各出一张牌定胜负,其中象胜虎、虎胜鼠、鼠胜象,若两人所出牌相同,则为平局.例如,小刚出象牌,小明出虎牌,则小刚胜;又如,两人同时出象牌,则两人平局.如果用A 、B 、C 分别表示小刚的象、虎、鼠三张牌,用A 1、B 1、C 1分别表示小明的象、虎、鼠三张牌,那么一次出牌小刚胜小明的概率是多少?分析:为了清楚地看出小亮胜小刚的概率,可用树状图列出所有可能出现的结果,并从中找出小刚胜小明可能出现的结果数。

解:画树状图如图树状图。

由树状图(树形图)或列表可知,可能出现的结果有9种,而且每种结果出现的可能性相同,其中小刚胜小明的结果有3种.所以P (一次出牌小刚胜小明)=31点评:当一事件要涉及两个或更多的因素时,为了不重不漏地列出所有可能的结果,通过画树形图的方法来计算概率 (三)列表法例3将图中的三张扑克牌背面朝上放在桌面上,从中随机摸出两张,并用这两张扑克牌上的数字组成一个两位数.请你用画树形(状)图或列表的方法求:(1)组成的两位数是偶数的概率;(2)组成的两位数是6的倍数的概率.分析:本题可通过列表的方法,列出所有可能组成的两位数的可能情况,然后再找出组成的两位数是偶数的可能情况和组成两位数 是6的倍数的可能情况。

2023年高考数学客观题专题四 概率与统计

2023年高考数学客观题专题四 概率与统计

合计
a+c
b+d
n=a+b+c+d
统计中有一个有用的(读做“卡方”)统计量,它的表达式是:
2
n
(
ad

bc
)
K2 k
(a b)(c d )(a c)(b d )
经过对统计量分布的研究,已经得到了两个临界值:3.841与
6.635.
当根据具体的数据算出的k>3.841时,有95%的把握说事件A与
(A1,A2,B1),(A1,A3,B1),(A2,A3,B1),(A1,A2,B2),(A1,A3,B2),(A2,A3,B
2),(A1,B1,B2),(A2,B1,B2),(A3,B1,B2)共9种.
9
故P(M)=10.故选D.
2.有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位
同学参加各个小组的可能性相同,则这两位同学参加同一个兴趣
②每个基本事件出现的可能性相等.
五、两个变量的线性相关
1.两个相关变量数据的散点图,会利用散点图认识变量的相关
关系.
2.求回归直线方程:



b
y a bx, 其中



n
n
( x x)( y y) x y nx y
i
i 1
i

n
( x x)
i 1
2
2
2
(
x

x
)

(
x

x
)

...

(
x

x
)
2
n
样本方差计算公式: s 2 1

概率与统计高考知识点

概率与统计高考知识点

概率与统计高考知识点在高考数学中,概率与统计是一个重要的考点。

概率与统计不仅涉及到数学方面的知识,也与现实生活密切相关。

本文将通过几个具体的例子,深入探讨概率与统计相关的知识点,帮助考生更好地理解这一部分内容。

一、概率与事件概率与事件是概率与统计中的基础概念。

概率是描述事件发生可能性大小的数值,通常用P(A)表示。

事件是指随机试验中的一种结果,可以是一个单一结果或若干个结果的组合。

例如,投掷一枚骰子,出现点数小于等于3的事件记为A,则P(A)为1/2。

二、基本事件与对立事件基本事件是指随机试验中的最简单、最基础的事件,它不可再分解成其他事件。

对立事件是指两个事件发生的可能性互相排斥,即当一个事件发生时,另一个事件不发生。

例如,投掷一枚硬币,出现正面和出现反面就是对立事件。

三、概率的性质概率具有以下几个性质:1.非负性:对于任何事件A,有P(A)≥0;2.必然性:对于必然事件S(整个样本空间),有P(S)=1;3.可加性:对于任意两个互不相容的事件A和B,有P(A∪B)=P(A)+P(B)。

四、条件概率条件概率是指在已经发生一个事件的条件下,另一个事件发生的概率。

条件概率表示为P(A|B),其中A是已知发生的事件,B是条件事件。

例如,某班级男生占总人数的1/4,女生占总人数的3/4,已知某学生是女生,求其也是该班级的概率。

我们可以使用条件概率计算得出P(女生|学生) = P(女生∩学生) / P(学生) = 3/4。

五、独立事件独立事件是指两个事件的发生与否互相不影响。

如果事件A和事件B是独立事件,则有P(A∩B) = P(A) × P(B)。

例如,抛掷一枚硬币和掷一枚骰子,两个事件是独立的。

六、随机变量与概率分布随机变量是表示随机试验结果的变量。

离散型随机变量只能取有限个或可列个数值,连续型随机变量可以取任意实数值。

概率分布是随机变量取各个值的概率。

例如,抛掷一枚骰子,骰子的点数就是一个随机变量,其概率分布为离散型。

统计与概率高考知识点归纳

统计与概率高考知识点归纳

统计与概率高考知识点归纳统计与概率是数学中的重要分支,也是高考数学中的一个考点。

在统计与概率中,我们主要研究的是数据的收集、整理和分析,以及事件发生的可能性。

本文将对统计与概率的高考知识点进行归纳,以帮助同学们更好地备考。

统计学是将数据进行收集、整理、分析和解释的学科,其在日常生活中的应用非常广泛。

统计学的核心思想是通过数据来了解事物的规律,并作出科学的决策。

高考中可能涉及的统计学知识点主要包括:频数分布、频数分布直方图、统计图表、数据的度量指标等。

首先,我们来看一下频数分布。

频数分布是对数据集中的各个数值进行计数,并将其呈现在表格中。

通过频数分布,我们可以清晰地了解到每个数值出现的次数,从而更好地描述数据的分布情况。

频数分布在高考中常作为基础题出现。

其次,我们来讨论一下频数分布直方图。

频数分布直方图是对数据集中的各个数值进行统计,并将其用柱状图进行可视化呈现。

通过直方图,我们可以更直观地看到每个数值所占的比例,从而更全面地了解数据的分布情况。

高考中常常会出现要求根据一组数据绘制直方图的题目。

接下来,我们来了解一下统计图表。

统计图表是通过图形的形式来呈现数据的分布情况。

常见的统计图表有折线图、饼图、条形图等。

这些图表都有各自的特点和用途,可以根据数据集的特点选择合适的图表进行表示。

在高考中,可能会遇到要求根据一组数据绘制指定统计图表的题目。

最后,我们来讨论一下数据的度量指标。

数据的度量指标是对数据进行总结和描述的方法,可以帮助我们更好地理解数据的特点和规律。

常见的数据度量指标有平均数、中位数、众数、方差和标准差等。

这些指标可以反映出数据的集中趋势、离散程度等特征。

高考中常常会遇到要求计算某些数据的度量指标或者利用已知的指标进行推断的题目。

综上所述,统计与概率是高考数学中一个重要的知识点。

通过对统计与概率的归纳,希望同学们能够更加系统地掌握这一知识点,提高应对高考数学题的能力。

同时,也希望同学们能够在平时生活中多关注数据的收集和分析,增强对统计与概率的实际应用能力。

【高考数学精品】概率与统计知识点全归纳

【高考数学精品】概率与统计知识点全归纳

s 概率与统计知识点全归纳1.随机抽样(1)简单随机抽样:一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.样本的频率分布估计总体分布(1)在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积总和等于1.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.(3)茎叶图茎是指中间的一列数,叶是从茎的旁边生长出来的数.3.用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:xx1+x2+…+x n=,反映了一组数据的平均水平.n(4)标准差:是样本数据到平均数的一种平均距离,(5)方差:s2=1[(x1-x )2+(x2-x )2+…+(x n-x )2](x n是样本数据,n 是样本容量,x 是样本平均数).n4.概率和频率(1)在相同的条件S 下重复n 次试验,观察某一事件A 是否出现,称n 次试验中事件A 出现的次数n A为事件A 出现的频数,称事件A 出现的比例f n(A)=n A为事件A 出现的频率.n(2)对于给定的随机事件A,由于事件A 发生的频率f n(A)随着试验次数的增加稳定于概率P(A),因此可以用频率f n(A)来估计概率P(A).5.事件的关系与运算6. 概率的几个基本性质(1)概率的取值范围:0≤P (A )≤1. (2)必然事件的概率 P (E )=1.(3)不可能事件的概率 P (F )=0. (4)概率的加法公式:如果事件 A 与事件 B 互斥,则 P (A ∪B )=P (A )+P (B ). (5)对立事件的概率:若事件 A 与事件 B 互为对立事件,则 P (A )=1-P (B ).7. 古典概型具有以下两个特点的概率模型称为古典概率模型,简称古典概型:高中数学资料共享群(734924357)(1) 试验中所有可能出现的基本事件只有有限个;(2)每个基本事件出现的可能性相等. 8.古典概型的概率公式 P (A )=A 包含的基本事件的个数.基本事件的总数9. 相关关系与回归方程(1)相关关系的分类①正相关:在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. ②负相关:在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(2) 线性相关关系:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(3) 回归方程①最小二乘法:求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.^ ^ ^②回归方程:方程y =bx +a 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其n n⎧⎪ ^^中a ,b 是待定参数.⎪ ∑(x i - x )( y i - y ) ∑x i y i - nx y ⎪b ˆ = i =1 = i =1 , ⎨ (x - x )2 n x 2 - nx 2 ∑ i ⎪i =1 ∑ ii =1 ⎪⎩aˆ = y - b ˆx . (4) 回归分析①定义:对具有相关关系的两个变量进行统计分析的一种常用方法. ②样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中( x , y )称为样本点的中心. ③相关系数当 r >0 时,表明两个变量正相关;当 r <0 时,表明两个变量负相关.高中数学资料共享群(734924357)r 的绝对值越接近于 1,表明两个变量的线性相关性越强.r 的绝对值越接近于 0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于 0.75 时,认为两个变量有很强的线性相关性.10. 独立性检验(1) 分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2) 列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量 X 和 Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为 2×2 列联表)为2×2 列联表构造一个随机变量 K 2= n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d 为样本容量.(3) 独立性检验利用随机变量 K 2 来判断“两个分类变量有关系”的方法称为独立性检验.11. 分类加法计数原理与分步乘法计数原理nn n n +1 n nn n12. 排列、组合的定义13. 排列数、组合数的定义、公式、性质14. 二项式定理15. 二项式系数的性质(1)C 0=1,C n =1,C m=C m -1+C m . C m =C n -m(0≤m ≤n ).(2)二项式系数先增后减中间项最大.高中数学资料共享群(734924357)i=1 n nn +1 n +3当 n 为偶数时,第 +1 项的二项式系数最大,最大值为C 2 ,当 n 为奇数时,第 项和第 项的二项式系数最大,n -1最大值为Cn 22 n +1或C n2 .n 2 2(3)各二项式系数和:C 0+C 1+C 2+…+C n =2n ,C 0+C 2+C 4+…=C 1+C 3+C 5+…=2n -1.nnnnnnnnnn16. 离散型随机变量的分布列(1) 随着试验结果变化而变化的变量称为随机变量.所有取值可以一一列出的随机变量称为离散型随机变量. (2) 一般地,若离散型随机变量 X 可能取的不同值为 x 1,x 2,…,x i ,…,x n ,X 取每一个值 x i (i =1,2,…,n )的概率 P (X=x i )=p i ,则称表为离散型随机变量 X 的概率分布列,简称为 X 的分布列,具有如下性质: ①p i ≥0,i =1,2,…,n ;②p 1+p 2+…+p n =1.离散型随机变量在某一范围内取值的概率等于它取这个范围内各个值的概率之和.17. 两点分布如果随机变量 X 的分布列为其中 0<p <1,则称离散型随机变量 X 服从两点分布.其中 p =P (X =1)称为成功概率.高中数学资料共享群(734924357)18. 离散型随机变量的均值与方差一般地,若离散型随机变量 X 的分布列为(1) 均值称 E (X )=x 1p 1+x 2p 2+…+x i p i +…+x n p n 为随机变量 X 的均值或数学期望.它反映了离散型随机变量取值的平均水平.(2) 方差称 D (X )=Σn [xi -E (X )]2pi 为随机变量 X 的方差,它刻画了随机变量 X 与其均值 E (X )的平均偏离程度,并称其算术平方根 D (X )为随机变量 X 的标准差.19. 均值与方差的性质 (1) E (aX +b )=aE (X )+b .(2) D (aX +b )=a 2D (X ).(a ,b 为常数)n μ σ 20. 超几何分布C k C n -k一般地,在含有 M 件次品的 N 件产品中,任取 n 件,其中恰有 x 件次品,则 P (X =k)= M N -M (k =0,1,2,…,m ),即 n N其中 m =min{M ,n },且 n ≤N ,M ≤N ,n ,M ,N ∈N *.如果一个随机变量 X 的分布列具有上表的形式,则称随机变量 X 服从超几何分布.21. 条件概率及其性质(1) 对于任何两个事件 A 和 B ,在已知事件 A 发生的条件下,事件 B 发生的概率叫做条件概率,用符号 P (B |A )来表示,其公式为 P (B |A )=P (AB )(P (A )>0).P (A )在古典概型中,若用 n (A )表示事件 A 中基本事件的个数,则 P (B |A )=n (AB ).n (A )(2) 条件概率具有的性质①0≤P (B |A )≤1;②如果 B 和 C 是两个互斥事件, 则 P (B ∪C |A )=P (B |A )+P (C |A ). 22.相互独立事件(1) 对于事件 A ,B ,若事件 A 的发生与事件 B 的发生互不影响,则称事件 A ,B 是相互独立事件. (2) 若 A 与 B 相互独立,则 P (B |A )=P (B ).(3) 若 A 与 B 相互独立,则 A 与 B , A 与 B , A 与 B 也都相互独立. (4) P (AB )=P (A )P (B )⇔A 与 B 相互独立. 23. 独立重复试验与二项分布(1) 独立重复试验是指在相同条件下可重复进行的,各次之间相互独立的一种试验,在这种试验中每一次试验只有两种结果,即要么发生,要么不发生,且任何一次试验中发生的概率都是一样的.(2) 在 n 次独立重复试验中,用 X 表示事件 A 发生的次数,设每次试验中事件 A 发生的概率为 p ,则 P (X =k )=C k p k(1-p )n -k (k =0,1,2,…,n ),此时称随机变量 X 服从二项分布,记为 X ~B (n ,p ),并称 p 为成功概率.24. 两点分布与二项分布的均值、方差(1)若随机变量 X 服从两点分布,则 E (X )=p ,D (X )=p (1-p ). (2)若 X ~B (n ,p ),则 E (X )=np ,D (X )=np (1-p ).25. 正态分布(1) 正态曲线:函数φ(x )-( x -μ)22σ2,x ∈(-∞,+∞),其中实数μ和σ为参数(σ>0,μ∈R ).我们称函数φ , (x )C μ,σ的图象为正态分布密度曲线,简称正态曲线.(2) 正态曲线的特点①曲线位于 x 轴上方,与 x 轴不相交; ②曲线是单峰的,它关于直线 x =μ对称; ③曲线在 x =μ④曲线与 x 轴之间的面积为 1;⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿 x 轴平移,如图甲所示;⑥当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散,如图乙所示.(3) 正态总体在三个特殊区间内取值的概率值①P (μ-σ<X ≤μ+σ)≈0.682 7; ②P(μ-2σ<X ≤μ+2σ)≈0.954 5; ③P (μ-3σ<X ≤μ+3σ)≈0.997 3.。

高三数学《概率统计(文科)》练习

高三数学《概率统计(文科)》练习

文科数学《统计与概率》核心知识点与参考练习题一、统计(核心思想:用样本估计总体)1.抽样(每个个体被抽到的概率相等)(1)简单随机抽样:抽签法与随机数表法(2)系统抽样(等距抽样)(3)分层抽样2.用样本估计总体:(1)样本数字特征估计总体:众数、中位数、平均数、方差与标准差(2)样本频率分布估计总体:频率分布直方图与茎叶图3.变量间的相关关系:散点图、正相关、负相关、回归直线方程(最小二乘法)4.独立性检验二、概率(随机事件发生的可能性大小)1.基本概念(1)随机事件A的概率()()1,0∈AP(2)用随机模拟法求概率(用频率来估计概率)(3)互斥事件(对立事件)2.概率模型(1)古典概型(有限等可能)(2)几何概型(无限等可能)三、参考练习题1.某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_______ .2.某学校高一、高二、高三年级的学生人数之比是3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则该从高二年级抽取_____名学生.3.某校老年、中年和青年教师的人数见右表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为_______ .4.已知一组数据5.5,4.5,1.5,8.4,7.4,则该组数据的方差是_____.5.若1,2,3,4,m这五个数的平均数为3,则这五个数的标准差为____.6.重庆市2013年各月的平均气温(℃)数据的茎叶图如右图:则这组数据的中位数是________.7.某高校调查了200名学生每周的晚自习时间(单位:小时),制成了如图所示的频率分布直方图,其中晚自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.1408.(2016四川文)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查. 通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照 [0,0.5),[0.5,1),…,[4,4.5] 分成9组,制成了如图的频率分布直方图. (Ⅰ)求直方图中a的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(Ⅲ)估计居民月均用水量的中位数.类别人数老年教师900中年教师1800青年教师1600合计43009.(2015全国Ⅱ文)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表. A 地区用户满意度评分的频率分布直方图B 地区用户满意度评分的频数分布表 满意度评分分组[50,60) [60,70) [70,80) [80,90) [90,100]频 数2814106(Ⅰ)作出B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B 地区用户满意度评分的频率分布直方图(Ⅱ)根据用户满意度评分,将用户的满意度分为三个等级:试估计哪个地区用户的满意度等级为不满意的概率大?说明理由.10.(2014安徽文)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时). (Ⅰ)应收集多少位女生的样本数据?(Ⅱ)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;(Ⅲ)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:()()()()()d b c a d c b a bc d a n K ++++-=22满意度评分 低于70分 70分到89分不低于90分 满意度等级不满意满意非常满意()02k K P ≥ 0.10 0.05 0.01 0.005 0k 2.706 3.841 6.635 7.87911.(2014全国Ⅰ文)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125] 频数 6 26 38 22 8(Ⅰ)在下表中作出这些数据的频率分布直方图:(Ⅱ)估计这种产品质量指标值的平均数和方差(同一组中的数据用该组区间的中点值作代表);(Ⅲ)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?12.(2014广东文)某车间20名工人年龄数据如下表:(Ⅰ)求这20名工人年龄的众数与极差;(Ⅱ)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(Ⅲ)求这20名工人年龄的方差.13.(2016江苏)将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是_______ .14.从甲、乙等5名学生中随机选出2人,则甲被选中的概率为_______ .15.(2016全国乙卷文)为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是______ .16.(2016全国丙卷文)小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M、I、N中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是________ .17.(2016天津文)甲、乙两人下棋,两人下成和棋的概率为21,甲获胜的概率是31,则甲不输的概率为_________ .18.已知5件产品中有2件次品,其余为合格品.现从这5件产品中任选2件,恰有一件次品的概率为_________ .19.某单位N 名员工参加“社区低碳你我他”活动.他们的年龄在25岁至50岁之间.按年龄分区间 [25,30) [30,35) [35,40) [40,45) [45,50]人数 25 a b(Ⅰ)求正整数a ,b ,N 的值;(Ⅱ)现要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,则年龄在第1,2,3组的人数分别是多少?(Ⅲ)在(2)的条件下,从这6人中随机抽取2人参加社区宣传交流活动,求恰有1人在第3组的概率.20.(2016全国Ⅰ文)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( )A.31B.21C.32D.4321.(2016全国Ⅱ文)某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为( ) A.107 B.85 C.83 D.103 22.在区间[-2,3]上随机选取一个数x ,则1≤x 的概率为_____ .23.若将一个质点随机投入如图所示的长方形ABCD 中,其中AB=2,BC=1,则质点落在以AB 为直径的半圆内的概率是_______ .24.如图,在边长为1的正方形中随机撒1000粒豆子,有180粒落到阴影部分,据此估计阴影部分的面积为_________ .25.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x 的线性回归方程为( )A .1ˆ-=x yB .1ˆ+=x yC .x y 2188ˆ+= D .176ˆ=y26.某产品的广告费用x 与销售额y 的统计数据如下:根据上表可得回归方程a x b yˆˆˆ+=中的b ˆ为9.4,据此模型预报广告费用为6万元时销售额为 A .63.6万元 B .65.5万元 C .67.7万元 D .72.0万元27.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年 份 2011 2012 2013 2014 2015 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(Ⅰ)求y 关于t 的回归方程a t b yˆˆˆ+=; (Ⅱ)利用(Ⅰ)中的回归方程,分析2011年至2015年该地区城乡居民储蓄存款的变化情父亲身高x (cm ) 174 176 176 176 178 儿子身高y (cm )175175176177177广告费用x (万元) 4 2 3 5 销售额y (万元)49263954况,并预测该地区2016年(t =6)的人民币储蓄存款.附:回归方程a t b yˆˆˆ+=中,t b y atn tyt n y t b ni ini ii ˆˆ,ˆ1221-=--=∑∑==.28.甲、乙两所学校高三年级分别有1200人、1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样的方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下: 甲校:乙校:(1)计算y x ,的值;(2)若规定考试成绩在[120,150]内为优秀,请分别估计两所学校数学成绩的优秀率; (3)由以上统计数据填写下面2×2列联表,并判断是否有90%的把握认为两所学校的数学成绩有差异.参考数据与公式:由列联表中数据计算()()()()()d b c a d c b a bc ad n K ++++-=22;临界值表:29.一次考试中,5名学生的数学、物理成绩如下表所示:(1)要从5名学生中选2人参加一项活动,求选中的学生中至少有一人的物理成绩高于90分的概率;(2)根据上表数据作散点图,求y 与x 的线性回归方程(系数精确到0.01).附:回归直线的方程是:a x b y ˆˆˆ+=,其中()()()x b y ax x y y x x b ni ini iiˆˆ,ˆ121-=---=∑∑==; 90,93==y x ,()()()30,4051251=--=-∑∑==y y x x x x ii ii i .30.为调查市民对汽车品牌的认可度,在秋季车展上,从有意购车的500名市民中,随机抽取100名市民,按年龄情况进行统计得到下面的频率分布表和频率分布直方图.(1)求频率分布表中a 、b 的值,并补全频率分布直方图,再根据频率分布直方图估计有意购车的这500名市民的平均年龄;31.(2016新课标Ⅱ)某险种的基本保费为a (单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:上年度出险次数0 1 2 3 4 ≥5保费0.85aa1.25a1.5a1.75a2a设该险种一续保人一年内出险次数与相应概率如下:一年内出险次数0 1 2 3 4 ≥5概率0.300.150.200.200.100.05(Ⅰ)求一续保人本年度的保费高于基本保费的概率;32.袋中有形状、大小都相同的4只球,其中1只白球,1只红球,2只黄球,从中一次随机分组(岁) 频数 频数[20,25) 5 0.050 [25,30) 200.200 [30,35) a0.350[35,40) 30 b[40,45] 10 0.100 合计1001.000摸出2只球,则这2只球颜色不同的概率为____________ .33.现有6道题,其中4道甲类题,2道乙类题,某同学从中任取2道题解答.试求:(1)所取的2道题都是甲类题的概率;(2)所取的2道题不是同一类题的概率.A,两地区分别随机调查了20个用户,得到用34.某公司为了解用户对其产品的满意度,从B户对产品的满意度评分如下:A地区:62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B地区:73 83 62 51 91 46 53 73 64 8293 48 65 81 74 56 54 76 65 79(Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);。

高考数学必做题--统计概率 (后附参考答案与详解)

统计概率-高考必做题12从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是.②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是.3交强险是车主必须为机动车购买的险种,若普通座以下私家车投保交强险第一年的费用(基准元,在下一年续保时,实行的是费率浮动机制,保费与上一年度车辆发生道路交通事故的情况相联系,发生交通事故的次数越多,费率就越高,具体浮动情况如表:交强险浮动因素和浮动费率比率表浮动因素浮动比率上一个年度未发生有责任道路交通事故下浮上两个年度未发生有责任道路交通事故下浮上三个及以上年度未发生有责任道路交通事故下浮上一个年度发生一次有责任不涉及死亡的道路交通事故上一个年度发生两次及两次以上有责任道路交通事故上浮上一个年度发生有责任道路交通死亡事故上浮某机构为了解某一品牌普通座以下私家车的投保情况,随机抽取了辆车龄已满三年的该品牌同型号私家车的下一年续保时的情况,统计如下表:45 67 89 1011 12 131415 161718 19 20 212223最近,张师傅和李师傅要将家中闲置资金进行投资理财. 现有两种投资方案,且一年后投资盈亏的情况如下:投资股市:购买基金:2425 26 272829现甲、乙两人分别有分钟和分钟时间用于赶往火车站.30统计概率-高考必做题12从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是.②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是.2.数学①乙;②按照全年级排名答案为语文靠前,按照班级排名答案为数学靠前.用样本估计总体3交强险是车主必须为机动车购买的险种,若普通座以下私家车投保交强险第一年的费用(基准元,在下一年续保时,实行的是费率浮动机制,保费与上一年度车辆发生道路交通事故的情况相联系,发生交通事故的次数越多,费率就越高,具体浮动情况如表:交强险浮动因素和浮动费率比率表浮动因素浮动比率上一个年度未发生有责任道路交通事故下浮上两个年度未发生有责任道路交通事故下浮上三个及以上年度未发生有责任道路交通事故下浮上一个年度发生一次有责任不涉及死亡的道路交通事故上一个年度发生两次及两次以上有责任道路交通事故上浮4567取有限值的离散型随机变量及其分布列取有限值的离散型随机变量的均值、方差910111213 1415集合与集合的表示方法集合的表示方法不等式与线性规划绝对值不等式绝对值不等式的解法计数原理加法原理、乘法原理两个计数原理的应用排列与组合排列组合的应用16故答案选B.计数原理排列与组合排列组合的应用17181920随机变量的分布列取有限值的离散型随机变量及其分布列取有限值的离散型随机变量的均值、方差21超几何分布取有限值的离散型随机变量的均值、方差计数原理排列与组合排列组合的应用222324事件与概率随机事件的概率随机事件的运算两个互斥事件的概率加法公式2526排列与组合排列、组合的概念2728概率事件与概率随机变量的分布列计数原理29现甲、乙两人分别有分钟和分钟时间用于赶往火车站.30。

2023高考数学概率与统计基础知识清单

2023高考数学概率与统计基础知识清单概率与统计作为高中数学的重要组成部分,是2023年高考数学考试的核心内容之一。

掌握概率与统计的基础知识对于考生来说至关重要。

下面将为大家列出2023高考数学概率与统计的基础知识清单,帮助大家做好备考。

一、概率基础知识1. 事件与样本空间:事件是指一个或一组可能发生的结果,而样本空间是指所有可能结果的集合。

2. 概率的定义:概率是指某一事件发生的可能性大小,通常用P(A)表示,其中A是事件。

3. 概率的性质:概率的取值范围在0到1之间,且对于必然事件,其概率为1;对于不可能事件,其概率为0。

4. 概率的计算:计算概率可以通过频率方法、古典概型和几何概率等方法进行。

5. 条件概率:条件概率是指在已知事件B发生的条件下,事件A发生的概率,通常表示为P(A|B)。

6. 乘法定理:乘法定理用于计算联合事件的概率,即P(A∩B) = P(A) × P(B|A)。

7. 加法定理:加法定理用于计算两个事件的和事件的概率,即P(A∪B) = P(A) + P(B) - P(A∩B)。

二、统计基础知识1. 统计数据的分类:统计数据根据数量级的不同可以分为定性数据和定量数据。

2. 统计图形:统计图形常用于展示数据的分布情况,包括直方图、折线图、饼图等。

3. 中心趋势度量:中心趋势度量用于描述数据集中的一个典型值,包括平均数、中位数和众数。

4. 离散程度度量:离散程度度量用于描述数据的离散程度,包括极差、方差和标准差。

5. 点估计与区间估计:点估计是根据样本数据估算总体参数的一种方法,区间估计是给出一个可能范围的估计结果。

6. 抽样与抽样分布:抽样是指从总体中选取一部分样本进行统计分析,抽样分布是指样本统计量的概率分布。

7. 假设检验:假设检验是用于判断总体参数是否符合某种设定的方法,包括单样本假设检验和两样本假设检验等。

三、综合应用1. 概率与统计的应用:概率与统计在现实生活中有广泛的应用,例如随机事件的模拟、统计调查和贝叶斯定理等。

高考数学题型全归纳第十三章概率与统计第1节


的子集
1. 互斥事件
在一次试验中不能同时发生的事件称为互斥事件.
,A 的几A 何度量(长度、面积
A、B互斥 P( A B) P( A) P(B).
2. 对立事件
互斥,且其中必有一个发生,称
对立,记作
A,B
A,B
B A或A B.
六P(、A)条件1概P率(与A)独. A立,事B件互斥
A,B对立.
第十三章 概率与统计
✎考纲解读
第一节 概率及其计算
1. 了解随机事件发生的不确定性和频率的稳定性、概率的意义、频率与概率的区别.
2. 了解两个互斥事件的概率的加法公式.
3. 掌握古典概型及其概率计算公式.
4. 了解随机数的意义,能运用模拟方法估计概率.
5. 了解几何概型的意义.
✎知识点精讲
一、必然事件、不可能事件、随机事件 在一定条件下: ① 必然要发生的事件叫必然事件; ② 一定不发生的事件叫不可能事件; ③可能发生也可能不发生的事件叫随机事件.
(1)在事件 发生的条件下,事件 发生的概率叫作 发生时 发生的条件
概率,记 A ,条件概率公式为B
A
B
PB A
P B A P(AB) .
P( A)
(2)若 P B A P(,B)即 P( AB) P( A)P(B,) 称 为A相与互B独立事件.
A 与B 相互独立即 A发生与否对 B的发生与否无影响,反之亦然. 即 A,B 相互独立则有公式 P( AB) P( A)P(B).
A. 1 B.1 C. 2 D. 4
6
3
3
5
【解析】设AC x ,C则B 12 x 0 , x且 12
x,12所 x以
表示矩

高三概率与统计大题知识点

高三概率与统计大题知识点概率与统计是高中数学中的一门重要课程,也是高考中的一大重点内容。

在高三学习概率与统计时,我们需重点掌握与大题相关的知识点,以下将详细介绍这些知识点。

一、基础概念1. 概率:指某个事件在试验中发生的可能性大小。

2. 随机试验:具有多种可能结果,每次试验结果不确定的试验。

3. 样本空间:随机试验的所有可能结果的集合。

4. 事件:样本空间的一个子集,表示我们所关心的某一结果或几个结果的集合。

5. 频率和概率的关系:频率越接近概率,随着试验次数的增加,频率会趋于概率。

二、计算概率1. 等可能概型:指随机试验的所有可能结果发生的概率是相等的。

2. 排列与组合:排列是指从不同元素中取出若干元素进行排列,组合是指从不同元素中取出若干元素进行组合。

3. 互斥事件与对立事件:互斥事件是指两个事件不能同时发生的事件,对立事件是指两个事件中一个发生另一个不发生的事件。

三、离散型随机变量与概率分布1. 随机变量:指试验结果的某个确定性的函数。

2. 离散型随机变量:指取值有限或可数的随机变量。

3. 概率分布:指离散型随机变量的所有可能取值及其对应的概率。

4. 期望:指离散型随机变量的所有可能取值与其对应概率的乘积的总和。

5. 方差:指随机变量的离散程度。

6. 二项分布:指n次独立试验中某一事件发生k次的概率分布。

四、连续型随机变量与概率密度函数1. 连续型随机变量:指取值为连续数值的随机变量。

2. 概率密度函数:指连续型随机变量某区间上的概率。

3. 期望与方差:连续型随机变量的期望和方差的计算方法。

五、统计1. 统计指标:平均数(算术平均数、加权平均数、几何平均数)、中位数、众数、方差、标准差等。

2. 抽样调查与总体:抽样调查是从总体中抽取一部分作为样本,通过样本来推断总体。

3. 假设检验:通过对样本进行统计推断,判断总体参数的假设是否成立。

4. 相关与回归分析:用于研究两个变量之间的相关性及其拟合程度。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

专题十:《概率与统计初步》I、考纲1.统计与统计案例(1)随机抽样① 理解随机抽样的必要性和重要性。

② 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法。

(2)总体估计① 了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,了解它们各自的特点。

② 理解样本数据标准差的意义和作用,会计算数据标准差。

③ 能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释。

④ 会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想。

⑤ 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题。

(3)变量的相关性① 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系。

② 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(不要求记忆线性回归方程系数公式)。

(4)统计案例了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题。

①独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用。

②假设检验了解假设检验的基本思想、方法及其简单应用。

③回归分析了解回归的基本思想、方法及其简单应用。

2.概率(1)事件与概率① 了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别。

② 了解两个互斥事件的概率加法公式。

(2)古典概型① 理解古典概型及其概率计算公式。

② 会用列举法计算一些随机事件所含的基本事件数及事件发生的概率。

(3)随机数与几何概型①了解随机数的意义,能运用模拟方法估计概率。

②了解几何概型的意义。

II、高考考情解读本章知识的高考命题热点有以下两个方面:1.概率统计是历年高考的热点内容之一,考查方式多样,选择题、填空题、解答题中都可能出现,数量各1道,难度中等,主要考查古典概型、几何概型、分层抽样、频率分布直方图、茎叶图的求解.2.预计在2014年高考中,概率统计部分的试题仍会以实际问题为背景,概率与统计相结合命题.II 、基础知识和题型一、随机抽样1、简单随机抽样:(1).简单随机抽样的概念:设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2).最常用的简单随机抽样方法有两种——抽签法和随机数法.2、系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本:(1)先将总体的N 个个体编号;(2)确定分段间隔k ,对编号进行分段,当N n 是整数时,取k =N n; (3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);(4)按照一定的规则抽取样本. 通常是将l 加上间隔k 得到第2个个体编号l +k , 再加k 得到第3个个体编号l +2k ,依次进行下去,直到获取整个样本.【提醒】系统抽样的最大特点是“等距”,利用此特点可以很方便地判断一种抽样方法是否是系统抽样.3、分层抽样(1).分层抽样的概念: 在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.(2).当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.(3).分层抽样时,每个个体被抽到的机会是均等的.(一)简单随机抽样1.(2012·宁波月考)在简单随机抽样中,某一个个体被抽到的可能性( )A.与第几次抽样有关,第一次抽到的可能性最大B.与第几次抽样有关,第一次抽到的可能性最小C.与第几次抽样无关,每一次抽到的可能性相等D.与第几次抽样无关,与样本容量无关2. 下面的抽样方法是简单随机抽样的是( )A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2 709的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解学校机构改革的意见D.用抽签法从10件产品中选取3件进行质量检验3.(2013年高考江西卷(文5))(2013·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )【总结】采用随机数法时,若重复出现或超出范围的要去掉。

(二)系统抽样1.(教材习题改编)在某班的51名学生中,依次抽取学号为5、10、15、20、25、30、35、40、45、50的10名学生进行作业检查,这种抽样方法是( )A.随机抽样 B.分层抽样 C.系统抽样D.以上都不是2.为规范学校办学,省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是 ( )A.13 B.19 C.20 D.513.【变式】(2012·山东高考)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为 ( ) A.7 B.9 C.10 D.15(三)分层抽样1. (2012·福建高考)一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.【变式】(2013年高考湖南)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=___()A.9 B.10 C.12 D.13【总结】1、分层抽样就是“按比例抽样”,确定出每一层的个体占总体的比例,也就确定了样本中该层所占的比例.即:抽样比=样本容量总体容量=各层样本数量各层个体数量利用这两个比例相等,可以列出方程求解总体容量、样本容量或各层的个体数2. 某工厂生产A、B、C三种不同型号的产品,产品数量之比为3∶4∶7,现在用分层抽样的方法抽出容量为n的样本,样本中A型号产品有15件,那么样本容量n为( )A.50 B.60 C.70 D.80【作业】1. 要完成下列两项调查:①从某肉联厂的火腿肠生产线上抽取1 000根火腿肠进行“瘦肉精”检测;②从某中学的15名艺术特长生中选出3人调查学习负担情况.适合采用的抽样方法依次为( ) A.①用分层抽样,②用简单随机抽样 B.①用系统抽样,②用简单随机抽样C.①②都用系统抽样 D.①②都用简单随机抽样2. 某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人.3..(2012·西安模拟)某初级中学领导采用系统抽样方法,从该校某年级全体800名学生中抽50名学生做牙齿健康检查,现将800名学生从1到800进行编号,求得间隔数为16.在1~16中随机抽取一个数,如果抽到的是7,则从49~64这16个数中应取的是( )(A)54 (B)55 (C)56 (D)574.(2010年高考四川卷文科4)一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是( ) (A)12,24,15,9 (B)9,12,12,7 (C)8,15,12,5 (D)8,16,10,65. 某学校三个社团的人员分布如下表(每名同学只参加一个社团):学校要对这三个社团的活动效果进行抽样调查,按分层抽样的方法从社团成员中抽取30人,结果合唱社被抽出12人,则这三个社团人数共有_______________.二、用样本估计总体1、作频率分布直方图的步骤(1).求极差(即一组数据中最大值与最小值的差).(2).确定组距与组数.(3).将数据分组.(4).列频率分布表.(5).画频率分布直方图.2、频率分布折线图和总体密度曲线(1).频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.(2).总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.3、样本的数字特征(1)众数、中位数、平均数(2) 方差:s 2=n[(x1-x)2+(x2-x)2+…+(x n-x)2].标准差:s=1n1-x2+2-x2+…+n-x2].4、茎叶图茎叶图的优点是可以保留原始数据,而且可以随时记录,方便记录与表示.(一)用样本的频率分布估计总体分布1.(2013四川,文7)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( ).2.学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n 且支出在[20,60)元的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人,则n的值为________.4. (2012·广东高考改编)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3) 求样本数据的众数、中位数(二)茎叶图的应用与样本的数字特征1. (2012·淮北模考)如图所示的茎叶图记录了一组数据,关于这组数据,其中说法正确的序号是________.①众数是9;②平均数是10;③中位数是9或10;④标准差是3.4.2.(2013年高考山东卷(文10))将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场做的9个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为( )A .1169B .367C .36D 【变式】 (2013·江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:【注意】:由样本数据估计总体时,样本方差越小,数据越稳定,波动越小【作业】1 .(2013年高考陕西卷(文5))对一批产品的长度(单位: mm)进行抽样检测, 下图是检测结果的频率分布直方图. 根据标准, 产品长度在区间[20,25)上的为一等品, 在区间[15,20)和区间[25,30)上的为二等品, 在区间[10,15)和[30,35)上的为三等品. 用频率估计概率, 现从该批产品中随机抽取一件, 则其为二等品的概率为()A.0.09 B.0.20 C.0.25 D.0.45【变式】(2013·湖北)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x的值为 __________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.2.(2012·陕西高考)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,533.(2013年上海6)某学校高一年级男生人数占该年级学生人数的40%.在一次考试中,男、女生平均分数分别为75、80,则这次考试该年级学生平均分数为________.4.某样本数据的茎叶图如图所示,若该组数据的中位数为85,平均数为85.5,则x +y = ( )789⎪⎪⎪⎪3 94 4 4 x 7 83yA .12B .13C .14D .155. (2012·湖南高考)如图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.三、变量间的相互关系、统计案例1、变量间的相关关系(1).常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.(2).从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关. 2、两个变量的线性相关(1).从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.(2).回归方程为y ^=b ^x +a ^,其中b ^=∑i =1nx iy i-n x y∑i =1nx 2i -n x2,a ^=y -b ^x .(3).通过求Q =∑i =1ni-bx i -2的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.(4).相关系数=∑i =1ni-xi-y∑i =1ni-x2∑i =1ni-y2,当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.3、独立性检验(1).2×2列联表:假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2})为:K2=-2++++(其中n=a+b+c+d为样本容量).(2).用K2的大小可以决定是否拒绝原来的统计假设H0,若K2值较大,就拒绝H0,即拒绝事件A与B无关.(3).当K2>3.841时,则有95%的把握说事件A与B有关;当K2>6.635时,则有99%的把握说事件A与B有关;当K2>2.706时,则有90%的把握说事件A与B有关.(一)相关关系的判断1.(教材习题改编)观察下列各图形其中两个变量x、y具有相关关系的图是( )A.①② B.①④C.③④D.②③【小结】:(1).相关关系的判断方法一是利用散点图直观判断,二是利用相关系数作出判断. (2).对于由散点图作出相关性判断时,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性. (3).由相关系数r 判断时|r|越趋近于1相关性越强. 【变式1】 (2012·新课标全国卷)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n)都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12D .1【变式2】(2013年高考湖北卷(文))四名同学根据各自的样本数据研究变量,x y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:① y 与x 负相关且 2.347 6.423y x =-; ② y 与x 负相关且3.476 5.648y x =-+;③ y 与x 正相关且 5.4378.493y x =+; ④ y 与x 正相关且4.326 4.578y x =--.其中一定不正确...的结论的序号是 A .①② B .②③ C .③④ D . ①④(二)回归方程的求法及回归分析1. 已知x 与y已求得关于y 与x 的线性回归方程y =2.1x +0.85,则m 的值为( )A .1B .0.85C .0.7D .0.52.(2013·重庆)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720. (1)求家庭的月储蓄y 对月收入x 的线性回归方程y =bx +a ; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.3.(2013年高考福建卷(文11))已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为a x b y ˆˆˆ+=.若某同学根据上表中前两组数据)0,1(和)2,2(求得的直线方程为a x b y '+'=,则以下结论正确的是( )A .a a b b'>'>ˆ,ˆ B .a a b b '<'>ˆ,ˆ C .a a b b '>'<ˆ,ˆ D .a a b b '<'<ˆ,ˆ4.(2012·湖南高考)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不.正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg(三)独立性检验1.(2011年高考湖南卷文科5)通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表:由2222()110(40302030)7.8()()()()60506050n ad bc K K a b c d a c b d -⨯⨯-⨯==≈++++⨯⨯⨯算得, 附表:参照附表,得到的正确结论是( ) A . 有99%以上的把握认为“爱好该项运动与性别有关” B . 有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”2.某市第一次联考后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀.统计成绩后,得到如下的2×2列联表,且已知在甲、乙两个文科班全部110人中随机抽取1人为优秀的概率为311.(1)请完成上面的列联表;(2)根据列表中的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”.参考公式与临界值表:K 2=-2++++【作业】1. (教材习题改编)已知变量x ,y 之间具有线性相关关系,其回归方程为y ^=-3+bx ,若∑i =110x i =17,∑i =110y i =4,则b 的值为( )A .2B .1C .-2D .-12. 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.(1)请画出上表数据的散点图.(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=bx+a.(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)3. (2012·辽宁)电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?(2)迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率. 附:四、随机事件的概率 1、事件(1).在条件S 下,一定会发生的事件,叫做相对于条件S 的必然事件.(2).在条件S 下,一定不会发生的事件,叫做相对于条件S 的不可能事件.(3).在条件S 下,可能发生也可能不发生的事件,叫做相对于条件S 的随机事件. 2、概率和频率(1).用概率度量随机事件发生的可能性大小能为我们决策提供关键性依据.(2).在相同条件S 下重复n 次试验,观察某一事件A 是否出现,称n 次试验中事件A 出现的次数n A 为事件A 出现的频数,称事件A 出现的比例f n (A)=n An为事件A 出现的频率.(3).对于给定的随机事件A ,由于事件A 发生的频率f n (A)随着试验次数的增加稳定于概率P(A),因此可以用频率f n (A)来估计概率P(A).(1).概率的取值范围:0≤P(A)≤1. (2).必然事件的概率P(E)=1. (3).不可能事件的概率P(F)=0. (4).概率的加法公式:如果事件A 与事件B 互斥,则P(A ∪B)=P(A)+P(B).(5).对立事件的概率:若事件A 与事件B 互为对立事件,则A ∪B 为必然事件.P(A ∪B)=1,P(A)=1-P(B).(一)随机事件的频率与概率1(1)求次品出现的频率.(2)记“任取一件衬衣是次品”为事件A,求P(A).(3)为了保证买到次品的顾客能够及时更换,销售1 000件衬衣,至少需进货多少件?2.(2013四川)某算法的程序框图如图所示,其中输入的变量x在,3,2,1 这24个整数中等可能随机产生.24,(Ⅰ)分别..求出按程序框图正确编程运行时输出y的值为i的概率P i=;(1,2,3)i(Ⅱ)甲、乙两同学依据自己对程序框图的理解,各自编写程序重复运行n次后,统计记录了输出y的值为(1,2,3)i i=的频数.以下是甲、乙所作频数统计表的部分数据.当2100n=时,根据表中的数据,分别写出甲、乙所编程序各自输出y的值为(1,2,3)i i 的频率(用分数表示),并判断两位同学中哪一位所编写程序符合算法要求的可能性较大.(二)互斥事件与对立事件的概率1.(2012·兰州月考)从装有5个红球和3个白球的口袋内任取3个球,那么互斥而不对立的事件是( )A.至少有一个红球与都是红球B.至少有一个红球与都是白球C.至少有一个红球与至少有一个白球D.恰有一个红球与恰有二个红球【总结】:要判断两事件是互斥而不对立的事件:只需判断交事件为不可能事件,和事件为必然事件。

相关文档
最新文档