高中数学选修1-2《统计案例》知识点讲义
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章统计案例一、回归分析的基本思想及其初步应用
1、数学变量相关关系
的定义:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不
确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系.
(1)按方向分类
①正相关:两个变量的变化趋势相同,从散点图可以看出各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大。
②负相关:两个变量的变化趋势相反,从散点图可以看出各点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小。
正相关负相关不相关
(2)相关性系数r(在《必修3》中有介绍)
用相关系数r来衡量两个变量之间的相关关系
()()
()()
1
22
11
n
i i
i
n n
i i
i i
x x y y
r
x x y y
=
==
--
=
--
∑
∑∑
2、两变量之间的关系存在两种不同的类型
(1)相关关系——非确定性关系 (2)函数关系——确定性关系
3、回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。 其基本步骤是:①画出两个变量的散点图; ②求回归直线方程;
③并用回归直线方程进行预报。
4、回归直线方程:∧
∧∧+=a x b y
⎪⎪
⎪⎩
⎪⎪⎪⎨⎧
-=--=---=∧∧====∧∑∑∑∑x b y a x n x y
x n y x x x y y x x b n i i
n
i i i n
i i n i i i ,)())((1
221121
()()()10.00,2,.
b b r x y ≠==说明:回归系数因为当时,相关系数这时不具有线性相关关系.
称为样本点的中心,回归直线必定经过样本点的中心
例如:
,.i y bx a e a b e e y y
=++=-4、线性回归模型用来表示其中和为模型的未知参数,称为随机误差 残差:
5、相关指数2R 是用来刻画回归效果的,
2R 越大,残差平方和越小,模型的拟合效果就越好。
二、独立性检验的基本思想及其初步应用
1、列联表
假设有两个分类变量X 和Y ,它们的值域分另为{x 1, x 2}和{y 1, y 2},其样本频数列联表为:
()
()()()()
2
22=n ad bc K n a b c d a b c d a c b d -=+++++++、随机变量,其中为样本容量.
()(
)
2
2
1
2
11n
i i i n
i i y y R y y
==-=-
-∑∑
3、独立性检验
(1)利用随机变量
2
K来判断“两个分类变量有关系”的方法称为独立性检验,并且能较精确地给出这种判断的
可靠程度。
(2)具体的做法是,由表中的数据算出随机变量K2的值。K2的值越大,说明“X与Y有关系”成立的可能性越大。下表k是观测值,概率P为犯错误的概率。
2
()
P K k
0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
例如:
4、利用列联表直接计算发现和相差很大,就判断两个分类变量之间有关系。
a a
b +c
c d
+