高中数学统计与统计案例概率知识点上课讲义


高中数学统计与统计案例概率知识点
统计与统计案例概率(文科)
知识点
1.抽样调查
(1)抽样调查
通常情况下,从调查对象中按照一定的方法抽取一部分,进行______,获取数据,并以此对调查对象的某项指标作出______,这就是抽样调查.
(2)总体和样本
调查对象的称为总______体,被抽取的称为样______本.
(3)抽样调查与普查相比有很多优点,最突出的有两点:
①______
②节约人力、物力和财力.
2.简单随机抽样
(1)简单随机抽样时,要保证每个个体被抽到的概率.
(2)通常采用的简单随机抽样的方法:_____
3.分层抽样
(1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.
(2)分层抽样的应用范围:
当总体是由差异明显的几个部分组成时,往往选用分层抽样.
4.系统抽样
系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按______(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机
械抽样.
5.统计图表
统计图表是______数据的重要工具,常用的统计图表有______
6.数据的数字特征
(1)众数、中位数、平均数
众数:在一组数据中,出现次数最多的数据叫作这组数据的众数.
中位数:将一组数据按大小依次排列,把处在______位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.
平均数:样本数据的算术平均数,即x =1n
(x 1+x 2+…+x n ). 在频率分布直方图中,中位数左边和右边的直方图的面积应该______
(2)样本方差
标准差s =
1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2], 其中x n 是样本数据的第n 项,n 是,______x 是______
标准差是刻画数据的离散程度的特征数,样本方差是标准差的______.通常用样本方差估计总体方差,当______时,样本方差很接近总体方差.
7.用样本估计总体
(1)通常我们对总体作出的估计一般分成两种,一种是______,另一种______.
(2)在频率分布直方图中,纵轴表示,______数据落在各小组内的频率用______表示,各小长方形的面积总和等于.______
(3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.
(4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且______,方便表示与比较.
8.相关性
(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的______
(2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为____________
(3)在两个变量x 和y 的散点图中,若所有点看上去都在一条直线附近波动,则称变量间是______,若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是______的.如果所有的点在散点图中没有关系,则称变量间是______的.
9.线性回归方程
(1)最小二乘法
如果有n 个点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),可以用[y 1-(a +bx 1)]2+[y 2-(a +bx 2)]2+…+
[y n -(a +bx n )]2来刻画这些点与直线y =a +bx 的接近程度,使得上式达到最小值的直线y =a +bx 就是所要求的直线,这种方法称为最小二乘法.
(2)线性回归方程
方程y =bx +a 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的线性回归方程,其中a ,b 是待定参数.
????? b =
∑n i =1 (x i -x )(y i -y )∑n i =1 (x i -x )2=∑n i =1x i y i -n x y ∑n i =1x 2i -n x 2,a =y -b x .
10.回归分析
(1)定义:对______的两个变量进行统计分析的一种常用方法.
(2)样本点的中心
对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )中,(x ,y )称为样本点的中心.
(3)相关系数
①r=
∑
n
i=1
(x i-x)(y i-y)
∑
n
i=1
(x i-x)2∑
n
i=1
(y i-y)2
=
∑
n
i=1
x i y i-n x y
(∑
n
i=1
x2i-n x2)(∑
n
i=1
y2i-n y2)
;
②当r>0时,表明两个变量正相关;
当r<0时,表明两个变量负相关;
当r=0时,表明两个变量线性不相关.
r的绝对值越接近于1,表明两个变量之间的线性相关程度越高.r的绝对值越接近于0,表明两个变量之间的线性相关程度越低.
11.独立性检验
设A,B为两个变量,每一个变量都可以取两个值,
变量A:A1,A2=A1;变量B:B1,B2=B1;
2×2列联表:
构造一个随机变量
χ2=n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
.
利用随机变量χ2来判断“两个分类变量有关系”的方法称为独立性检验.
当χ2______时,没有充分的证据判定变量A,B有关联,可以认为变量A,B______的;当______时,有______的把握判定变量A,B有关联;
当______,有______的把握判定变量A,B有关联;
当______时,有______的把握判定变量A,B有关联.
12.基本事件的特点
(1)任何两个基本事件是______的;
(2)任何事件(除不可能事件)都可以表示______的和.
13.古典概型
具有以下两个特点的概率模型称为古典的概率模型,简称古典概型.
(1)试验的所有可能结果______,每次试验只出现其中的一个结果;
(2)每一个试验结果出现的可能______.
14.如果一次试验中可能出现的结果有n个,而且所有结果出现的可能性都相等,那么每
一个基本事件的概率都是1
n;如果某个事件A包括的结果有m个,那么事件A的概率
P(A)=_____
15.古典概型的概率公式
P(A)=______
1.几何概型
向平面上有限区域(集合)G内随机地投掷点M,若点M落在子区域G1G的概率与G1的面积成正比,而与G的形状、位置无关,即P(点M落在G1)=______,则称这种模型为几何概型.
2.几何概型中的G也可以是空间中或直线上的有限区域,相应的概率是______之比或______之比.
3.借助______可以估计随机事件发生的概率.