统计学第5章相关分析与回归分析
统计学中的相关分析与回归分析的关系

统计学中的相关分析与回归分析的关系统计学是一门研究如何收集、整理、描述和解释数据的学科。
在统计学中,相关分析和回归分析是两个重要的方法,用于了解和探究变量之间的关系。
尽管相关分析和回归分析在某些方面有相似之处,但它们在目的、数据类型和结果解释方面存在一些差异。
相关分析是一种用于衡量和描述两个或多个变量之间关联关系的方法。
相关分析可以帮助我们确定变量之间的线性相关程度,即一个变量的变化伴随着另一个变量的变化。
通过计算相关系数,我们可以了解这种关系的强度和方向。
常用的相关系数包括皮尔逊相关系数和斯皮尔曼等级相关系数。
与此不同,回归分析旨在建立一个数学模型,以描述和预测因变量与自变量之间的关系。
回归分析可以通过拟合曲线或平面来表示变量之间的关系,并用方程式来描述这种关系。
回归分析使用的模型可以是线性回归、多项式回归、对数回归等。
通过回归分析,我们可以根据自变量的值来估计因变量的值,并评估自变量对因变量的影响程度。
虽然相关分析和回归分析在某些情况下可互相转化,但它们具有不同的目标和应用范围。
相关分析主要用于探索变量之间的关系,确定它们之间的关联强度和方向,但不提供因果关系。
而回归分析则旨在建立一个模型,通过这个模型可以对未知的因变量进行预测,并且可以评估自变量对因变量的影响。
此外,相关分析和回归分析适用于不同类型的数据。
相关分析通常用于分析连续变量之间的关系,而回归分析可以应用于连续变量、二分类变量和多分类变量之间的关系。
在实际应用中,相关分析和回归分析常常结合使用。
首先,我们可以通过相关分析来初步检验变量之间是否存在关系。
如果相关分析结果显示两个变量之间存在显著相关性,我们可以进一步使用回归分析来建立一个模型,以更好地理解和预测这种关系。
在总结中,统计学中的相关分析和回归分析是两个相互关联的方法。
相关分析用于探究变量之间的关系和相关性,而回归分析则用于建立一个数学模型,描述和预测因变量与自变量之间的关系。
统计学教程 第五章

经济、管理类 基础课程
统计学
样本相关系数的计算公式
r
( x x )( y y ) (x x ) ( y y)
2
2
或化简为 r
10 - 13
n xy x y n x x n y y
2 2 2 2
10 - 4
经济、管理类 基础课程
变量间的关系
统计学 (相关关系correlation relationship)
1. 变量间关系不能用函数关 y 系精确表达 2. 一个变量的取值不能由另 一个变量唯一确定 3. 当变量 x 取某个值时,变 量 y 的取值可能有几个 4. 各观测点分布在直线周围 x
10 - 5
经济、管理类 基础课程
变量间的关系
统计学 (相关关系correlation relationship)
相关关系的例子
居民消费支出(y)与收入(x)之间的关系
商品销售额(y)与广告费支出(x)之间的关系
粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、 温度(x3)之间的关系 子女身高 (y)与父母身高(x)之间的关系 收入水平(y)与受教育程度(x)之间的关系
估计标准误差越小,回归模型拟合的越好。但 是作为判断和评价标准,估计标准完成不如判定 系数。
10 - 32
【例】根据上例中的数据,配合人均消费 金额对人均国民收入的回归方程 统计学
时间
1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 10 - 33
b0 和 b1 称为模型的参数
经济、管理类 基础课程
第五章相关分析与回归分析

第五章相关分析与回归分析相关分析(Correlation Analysis)和回归分析(Regression Analysis)都是统计学中常用的数据分析方法,用于研究两个或多个变量之间的关系。
相关分析主要用于衡量变量之间的线性关系强度和方向,回归分析则是基于相关分析的基础上建立数学模型来预测或解释因变量的方法。
相关分析是一种用于研究两个变量之间关系强度和方向的统计方法。
相关系数是用来衡量两个变量之间相关关系强度的指标,其取值范围为[-1,1]。
当相关系数为正时,表示两个变量呈正相关,即随着一个变量增加,另一个变量也增加;当相关系数为负时,表示两个变量呈负相关,即随着一个变量增加,另一个变量减少;当相关系数接近于0时,表示两个变量之间关系弱或不存在。
常用的相关系数有皮尔逊相关系数(Pearson correlation coefficient)、斯皮尔曼相关系数(Spearman’s rank correlati on coefficient)和肯德尔相关系数(Kendall’s rank correlation coefficient)等。
皮尔逊相关系数适用于两个变量均为连续型的情况,斯皮尔曼和肯德尔相关系数则适用于至少一个变量为顺序型或等距型的情况。
回归分析是一种建立数学模型来预测或解释因变量的方法。
在回归分析中,通常将一个或多个自变量与一个因变量建立数学关系,然后通过该关系来预测或解释因变量。
回归分析可以分为简单回归分析和多元回归分析两种。
简单回归分析是指只有一个自变量和一个因变量之间的分析。
该方法主要用于研究一个自变量对因变量的影响,通过拟合一条直线来描述自变量和因变量之间的线性关系。
简单回归分析的核心是最小二乘法,即通过最小化误差平方和来确定最佳拟合直线。
多元回归分析是指有多个自变量和一个因变量之间的分析。
该方法主要用于研究多个自变量对因变量的影响,并建立一个多元线性回归模型来描述它们之间的关系。
统计学中的相关性和回归分析

统计学中的相关性和回归分析统计学中,相关性和回归分析是两个重要的概念和方法。
它们旨在揭示变量之间的关系,并可以用来预测和解释观察结果。
本文将介绍相关性和回归分析的基本原理、应用及其在实践中的意义。
一、相关性分析相关性是指一组变量之间的关联程度。
相关性分析可以帮助我们理解变量之间的关系,以及这种关系的强度和方向。
常用的相关性指标有皮尔逊相关系数、斯皮尔曼相关系数和判定系数等。
皮尔逊相关系数是最常见的衡量变量之间线性关系的指标。
它的取值范围在-1到1之间,其中-1表示完全负相关,1表示完全正相关,0表示无相关。
例如,在研究身高和体重之间的关系时,如果相关系数为0.8,则说明身高和体重呈现较强的正相关。
斯皮尔曼相关系数则不要求变量呈现线性关系,而是通过对变量的序列进行排序,从而找到它们之间的关联程度。
它的取值也在-1到1之间,含义与皮尔逊相关系数类似。
判定系数是用于衡量回归模型的拟合程度的指标。
它表示被解释变量的方差中可由回归模型解释的部分所占的比例。
判定系数的取值范围在0到1之间,越接近1表示模型对数据的拟合越好。
二、回归分析回归分析是一种用于建立变量之间关系的统计方法。
它通过建立一个数学模型来解释和预测依赖变量和自变量之间的关系。
回归模型可以是线性的,也可以是非线性的。
线性回归是最常见的回归分析方法之一。
它假设自变量和因变量之间存在着线性关系,并通过最小二乘法来估计模型中的参数。
线性回归模型通常表示为y = β0 + β1x1 + β2x2 + ... + βnxn,其中y为因变量,x1、x2等为自变量,β0、β1等为模型的参数。
非线性回归则适用于自变量和因变量之间存在非线性关系的情况。
非线性回归模型可以是多项式回归、指数回归、对数回归等。
回归分析在实践中有广泛的应用。
例如,在市场营销中,回归分析可以用来预测销售量与广告投入之间的关系;在医学研究中,回归分析可以用来探究疾病发展与遗传因素之间的联系。
统计学原理 相关与回归分析

粮食产量y 随机的
降雨量
土质
种子 耕作技术
X3
X4 X5
可 控 的
(二)相关的种类
完全相关 函数关系是相关关系的一种特例。 不完全相关 相关分析的基本内容
度相 关 密 切 程
y 完全由x的数值唯一确定,函数关系。
不相关
相 关 的 性 质
x、y值变化各自独立,变量间没有相关
关系
正相关 x 负相关
y
x
x2 26896 28900 31329 24336 25600 27556
y2
62540 73695 420857
70225 83521 463382
55696 65025 382469
合计
2114
从表上可以看出,随着个人收入的增加,消 费支出有明显的增长趋势,二者存在一定的依存 关系。正相关关系。 2、相关图(散点图) 直角坐标系第一象限
1、相关表
单变量分组相关表
分组相关表
双变量分组相关表
先做定性分析——相关资料排序——列在一张表上
个人收入x 164 170 177 182 192 207 225 243 265 289
消费支出y 156 160 166 170 178 188 202 218 236 255 1929
xy 25584 27200 29382
yc = 25.32 + 0.7927 300 = 263.13万元
(三)估计标准误差Syx P197
Syx = Syx =
=
(y - yc) 2 n-2 y2 - a y -b xy n-2
382469 -25.32 1929 -0.7927 420857
10 - 2
SPSS5-相关与回归分析

在回归方程中包括常项 缺失值的处理方式
用均值代替缺失值
一、线性回归分析( Linear Regression)
2、一元线性回归:
示例1:教材P260数据:20章_数据1.sav
识字量对阅读能力的影响有多大?
步骤:
(1)依据散点图检验线性关系 (2)操作过程:Analyze-Regression-Linear (3)结果输出观察重点:
二、双变量相关分析(Bivariate)
示例1:大学生人格(神经质、内外向程度) 与心理健康(SCL-90总分)之间有无相关?
SPSS操作:
1、绘制散点图,判定两变aphs-Scatter
2、打开Bivarite Correlations主对话框
偏相关分析的思想:控制其它变量的变化,即在剔 除其它变量影响的情况下,计算两变量之间的相 关关系。
两个变量间的线性相关关系,用偏相关系数表示。 应用条件:均为连续性变量。
Partial Correlations 对话框
分析变量
显著性检验 显示实际的显著性水平
控制变量
Options 对话框
均值及标准差 零阶相关矩阵(即:Pearson相关矩阵)
Model 1
Regression Residual Total
Sum of Squares 1845.333 899.634 2744.967
a. Predictors: (Constant), 识 字 量
b. Dependent Var iable: 阅 读 能力
ANOV Ab
df 1
28 29
解释回归平方和在总平方各中所占的比率,即解释回 归效果, r2=0.672,则表示因变量(阅读能力)的 变异中有67.2%是由自变量(识字量)而引起的。
统计学中直线相关与回归的区别与联系
统计学中直线相关与回归的区别与联系在统计学中,直线相关和回归是两个相关的概念,但又有一些区别和联系。
区别:
1. 定义:直线相关是指两个变量之间的线性关系,即随着一个变量的增加,另一个变量也以一定的比例增加或减少。
回归分析是一种统计方法,用于建立一个或多个自变量与因变量之间的关系模型。
2. 目的:直线相关主要关注变量之间的关系和相关程度,通过相关系数来衡量。
而回归分析旨在通过建立数学模型来预测或解释因变量的变化,以及评估自变量对因变量的影响。
3. 变量角色:在直线相关中,两个变量没有明确的自变量和因变量的区分,它们之间的关系是对称的。
而在回归分析中,通常有一个或多个自变量作为预测因变量的因素。
联系:
1. 线性关系:直线相关和回归分析都假设变量之间存在线性关系,即可以用直线或线性模型来描述它们之间的关系。
2. 相关系数:直线相关中使用相关系数来度量变量之间的相关程度。
回归分析中也使用相关系数,但更多地关注回归模型的参数估计和显著性检验。
3. 数据分析:直线相关和回归分析都是常用的数据分析方法,在实际应用中经常同时使用。
直线相关可以帮助我们了解变量之间的关系和趋势,而回归分析可以进一步建立模型和进行预测。
总之,直线相关和回归分析是统计学中两个相关但又有区别的概念。
直线相关关注变量之间的线性关系和相关程度,而回归分析则更关注建立模型和预测变量之间的关系。
在实际应用中,它们常常相互补充使用,以帮助我们理解和解释数据。
如何使用Stata进行统计学分析
如何使用Stata进行统计学分析Stata是一种流行的统计学软件,广泛应用于各个领域的数据分析和统计学研究。
本文将介绍如何使用Stata进行统计学分析,并按照不同的主题进行划分章节。
第一章:Stata基础操作在开始使用Stata进行统计学分析之前,首先需要了解一些基础操作。
包括数据导入和导出、数据清洗、变量定义等。
Stata支持各种数据文件格式的导入,例如Excel、CSV等,通过使用`import`命令可以将数据导入到Stata中。
此外,Stata还提供了丰富的数据清洗功能,如缺失值处理、异常值处理等。
在数据准备工作完成后,可以使用`generate`命令定义变量,并使用`list`命令查看数据集的内容。
第二章:描述性统计分析描述性统计分析是了解数据的基本特征和分布情况的重要手段。
在Stata中,可以使用`summarize`命令计算变量的均值、方差、最大值、最小值等统计量。
此外,还可以使用`tabulate`命令生成频数表和列联表,用以统计分类变量的分布情况和不同变量之间的关联。
第三章:统计图形绘制统计图形是数据可视化的重要工具,有助于更直观地理解数据的特点和模式。
Stata提供了多种绘图命令,例如`histogram`命令用于绘制直方图、`scatter`命令用于绘制散点图、`boxplot`命令用于绘制箱线图等。
通过适当选择和组合这些绘图命令,可以呈现出丰富的数据图形,有助于揭示数据背后的规律。
第四章:参数估计与假设检验参数估计和假设检验是统计学分析的核心内容。
Stata提供了多种统计分析命令,如`ttest`命令用于独立样本t检验、`regress`命令用于回归分析、`anova`命令用于方差分析等。
这些命令可以根据用户提供的数据和分析需求,进行相应的估计和检验,并输出相应的统计结果和解释。
第五章:相关分析和回归分析相关分析和回归分析是统计学中常用的分析方法,用于探究变量之间的关系和预测模型的建立。
统计学中的相关分析与回归分析
统计学中的相关分析与回归分析统计学中的相关分析与回归分析是两种重要的数据分析方法。
它们帮助研究人员理解和解释变量之间的关系,并预测未来的趋势。
在本文中,我们将深入探讨相关分析和回归分析的定义、应用和原理。
第一部分:相关分析相关分析是用来衡量和评估两个或更多变量之间相互关系的统计方法。
通过相关系数来量化这种关系的强度和方向。
相关系数的取值范围在-1到+1之间,其中-1表示完全负相关,+1表示完全正相关,0表示没有相关性。
相关分析通常用于发现变量之间的线性关系。
例如,研究人员想要了解身高和体重之间的关系。
通过相关分析,他们可以确定是否存在正相关关系,即身高越高,体重越重。
相关分析还可以帮助确定不同变量对某一结果变量的影响程度。
第二部分:回归分析回归分析是一种通过建立数学模型来预测和解释变量之间关系的方法。
它可以用来预测因变量的值,并了解自变量对因变量的影响程度。
回归分析可分为简单回归和多元回归两种类型。
简单回归分析适用于只有一个自变量和一个因变量的情况。
例如,研究人员想要预测一个人的体重,他们可以使用身高作为自变量。
通过建立线性回归模型,他们可以得到身高对体重的影响,从而预测一个人的体重。
多元回归分析适用于有多个自变量和一个因变量的情况。
例如,研究人员想要了解影响一个城市房价的因素,他们可以考虑多个自变量,如房屋面积、地理位置、房龄等。
通过建立多元回归模型,他们可以确定每个因素对房价的影响程度,并进行预测。
第三部分:相关分析与回归分析的应用相关分析和回归分析在各个领域都有广泛的应用。
在医学研究中,相关分析可以帮助确定两个疾病之间的关联性,并为疾病的预防和治疗提供依据。
回归分析可以用来预测患者的生存率或疾病的发展趋势。
在经济学中,相关分析可以用来研究经济变量之间的关系,如GDP 与通货膨胀率之间的关系。
回归分析可以用来预测经济增长率,并评估政治和经济因素对经济发展的影响。
在市场营销中,相关分析可以帮助企业了解产品销售和广告投放之间的关系,并制定有效的市场推广策略。
统计学习题集第五章相关与回归分析
所属章节:第五章相关分析与回归分析1■在线性相关中,若两个变量的变动方向相反,一个变量的数值增加,另一个变量数值随之减少,或一个变量的数值减少,另一个变量的数值随之增加,则称为()。
答案:负相关。
干扰项:正相关。
干扰项:完全相关。
干扰项:非线性相关。
提示与解答:本题的正确答案为:负相关。
2■在线性相关中,若两个变量的变动方向相同,一个变量的数值增加,另一个变量数值随之增加,或一个变量的数值减少,另一个变量的数值随之减少,则称为()。
答案:正相关。
干扰项:负相关。
干扰项:完全相关。
干扰项:非线性相关。
提示与解答:本题的正确答案为:正相关。
3■下面的陈述中哪一个是错误的()。
答案:相关系数不会取负值。
干扰项:相关系数是度量两个变量之间线性关系强度的统计量。
干扰项:相关系数是一个随机变量。
干扰项:相关系数的绝对值不会大于1。
提示与解答:本题的正确答案为:相关系数不会取负值。
4■下面的陈述中哪一个是错误的()。
答案:回归分析中回归系数的显著性检验的原假设是:所检验的回归系数的真值不为0。
干扰项:相关系数显著性检验的原假设是:总体中两个变量不存在相关关系。
干扰项:回归分析中回归系数的显著性检验的原假设是:所检验的回归系数的真值为0。
干扰项:回归分析中多元线性回归方程的整体显著性检验的原假设是:自变量前的偏回归系数的真值同时为0。
提示与解答:本题的正确答案为:回归分析中回归系数的显著性检验的原假设是:所检验的回归系数的真值不为0。
5■根据你的判断,下面的相关系数值哪一个是错误的()。
答案:1.25。
干扰项:-0.86。
干扰项:0.78。
干扰项:0。
提示与解答:本题的正确答案为:1.25。
6■下面关于相关系数的陈述中哪一个是错误的()。
答案:数值越大说明两个变量之间的关系越强,数值越小说明两个变量之间的关系越弱。
干扰项:仅仅是两个变量之间线性关系的一个度量,不能直接用于描述非线性关系。
干扰项:只是两个变量之间线性关系的一个度量,不一定意味着两个变量之间存在因果关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
可编辑ppt
1
• 重点与难点:
• 重点: 相关关系的种类 相关系数的计算 回归分析的方法 估计标准误差的计算
• 难点: 相关系数的计算 估计标准误差的计算
可编辑ppt
2
• 学习内容:
一、变量间的相关关系 二、简单线性相关分析 三、一元线性回归分析
可编辑ppt
3
第一节 变量间的相关关系
三个或三个以上因素的相关关系称复相关,或
多元相关,即涉及二个或二个以上的自变量和因变
量。
在实际工作中,如存在多个自变量,可抓住
其中主要的自变量,研究其相关关系,而保持
另一些因素不变,这时复相关可转化为偏相关。
可编辑ppt
15
第二节 简单线性相关分析
一、相关表和相关图
简 单 相 关 表—根 据 总 体 单 位 的 原 始 资 料 汇 编 的 相 关 表 分 组 相 关 表—将 原 始 资 料 进 行 分 组 而 编 制 的 相 关 表
非线性相关是指两个相关现象之间,当自变量X的数
值发生变动时,因变量y也随之发生变动,但这种变
动在数值上不成固定比例,在相关图上的散点可表
现为抛物线、指数曲线、双曲线等形式,因此称其
为曲线相关关系。
可编辑ppt
14
3.按相关关系涉及的因素多少来分,可分 为:单相关、复相关和偏相关。
二因素之间的相关关系称单相关,即只涉及 一个自变量和一个因变量。
(2)设有两个变量 x 和 y ,变量 y
随变量 x 一起变化,并完全 y
依赖于 x ,当变量 x 取某个
数值时, y 依确定的关系取相 应的值,则称 y 是 x 的函数, 记为 y = f (x),其中 x 称为
自变量,y 称为因变量;
(3)各观测点落在一条线上。
x
可编辑ppt
5
函数关系的例子
单 变 量 分 组 表—按 自 变 量 分 组 双 变 量 分 组 表—按 自 变 量 和 因 变 量 均 分 组
可编辑ppt
16
例1
某市1998年 — 2005年的工资性现金支出与城镇储蓄存 款余额的资料,说明简单相关表和相关图的编制方法。
序号
年份
工资性
现金支出 (万元)x
城镇储蓄存 款余额(万
x
可编辑ppt
11
二、相关关系的种类
可编辑ppt
12
1.按相关关系的性质来分,可分为:
正相关和负相关
正相关是指两相关现象变化的方向是一致的。 负相关是指两相关现象变化的方向是相反的。
可编辑ppt
13
2. 按相关关系的形式来分,可分为:
线性相关和非线性相关
线性相关是指两个相关现象之间,当自变量X的数值 发生变动时,因变量y随之发生近似于固定比例的变 动,在相关图上的散点近似地表现为直线形式,因此 称其为直线相关关系。
如:汽车的行驶里程与耗油量,二者成正比,但受道 路、风速、驾驶特点等因素影响,使这一明显的因果 关系产生了波动,从而体现出非决定性的关系;
2.同一原因的诸多结果之间的关系
如:人的体重与裤长,它们都基本取决于身高,呈 正相关关系,但二者直接不存在因果关系;
3.因果关系不同而局部出现相同走势
如:我国近年来的“吸烟人数”与GDP成正相关关 系,这两个变量基本上互相独立,在一段时间出现相 同的走向,只能形成局可部编辑的pp解t 释,而无法找出因果关 8 系。
它反映着现象之间的数量上不严格的依存关系,
也就是说两者之间不具有确定性的对应关系,这种关 系有二个明显特点:
1.现象之间确实存在数量上的依存关系,即某一社会
经济现象变化要引起另一社会经济现象的变化;
2.现象之间的这种依存关系是不严格的,即无法用
数学公式表示。
可编辑ppt
7
相关关系产生的几种情况:
1.受干扰的因果关系
一、相关关系的概念(注意相关关系与函数关系的区别)
(一) 函数关系 它反映着现象之间存在着严格的依存关系,也就
是具有确定性的对应关系,这种关系可用一个数学 表达式反映出来。
例如某种商品的销售额和销售量之间,由于价
格因素,所以两者可表现为严格的依存关系。
可编辑ppt
4
(函数关系)
(1)是一一对应的确定关系;
元)y
1
1998
500
120
2
1999
540
140
3
2000
620
150
4
2001
730
200
5
2002
900
280
6
2003
970
350
7
2004
1050
450
8
2005
1170
510
可编辑ppt
17
城镇储蓄存款余额 (万元)
550 500 450 400 350 300 250 200 150 100 50
流通费用率(%)
10 9.5
9 8.5
8 7.5
7 6.5
6
0 4 8 12 16 20 24 28 32 36
销售额(万元)
▪ 某种商品的销售额(y)与销售量(x)之间的 关系可表示为 y = px (p 为单价)
▪ 圆的面积(S)与半径之间的关系可表示为
S量(x1) 、单
位产量消耗(x2) 、原材料价格(x3)之间的
关系可表示为y =可编辑xp1pxt 2x3
6
(二) 相关关系
400 500 600 700 800 900 1000 1100 1200
工资性现金支出(万元)
可编辑ppt
18
例2
企业按销售额分组 (万元) 4以下 4~ 8 8 ~ 12 12 ~ 16 16 ~ 20 20 ~ 24 24 ~ 28 28 ~ 32 32 ~ 36
流通费用率 (%) 9.65 7.68 7.25 7.00 6.86 6.73 6.64 6.60 6.58
在具有相互依存关系的两个变量中,作
为根据的变量称自变量,一般用X表示;发 生对应变化的变量称因变量,一般用y表示。
可编辑ppt
9
相关关系的例子
▪ 商品的消费量(y)与居民收入(x)之间的关系
▪ 商品的消费量(y)与物价(x)之间的关系
▪ 商品销售额(y)与广告费支出(x)之间的关系
▪ 粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温 度(x3)之间的关系
▪ 收入水平(y)与受教育程度(x)之间的关系
▪ 父亲身高(y)与子女身高(x)之间的关系
可编辑ppt
10
(相关关系)
(1)变量间关系不能用函数关
系精确表达;
(2)一个变量的取值不能由另 y
一个变量唯一确定;
(3)当变量 x 取某个值时,变
量 y 的取值可能有几个;
(4)各观测点分布在直线周围。