正态分布与线性回归

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

正态分布、线性回归

一、 知识梳理

1.正态分布的重要性

正态分布是概率统计中最重要的一种分布,其重要性我们可以从以下两方面来理解:一方面,正态分布是自然界最常见的一种分布。一般说来,若影响某一数量指标的随机因素很多,而每个因素所起的作用都不太大,则这个指标服从正态分布。 2.正态曲线及其性质

正态分布函数:

22

()2()x f x μσ--

=

,x ∈(-∞,+∞)

3.标准正态曲线

标准正态曲线N (0,1)是一种特殊的正态分布曲线,00()1()x x Φ-=-Φ,以及标准正态总体在任一区间(a ,b)内取值概率)()(a b P Φ-Φ=。 4.一般正态分布与标准正态分布的转化

由于一般的正态总体),(2

σμN 其图像不一定关于y 轴对称,对于任一正态总体),(2

σμN ,其取值小于x 的概率)(

)(σ

μ

-Φ=x x F 。只要会用它求正态总体),(2σμN 在某个特定区间的概率即可。

5.“小概率事件”和假设检验的基本思想

“小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。这种认识便是进行推断的出发点。关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。

课本是借助于服从正态分布的有关零件尺寸的例子来介绍假设检验的基本思想。进行假设检验一般分三步:

第一步,提出统计假设。课本例子里的统计假设是这个工人制造的零件尺寸服从正态分布),(2

σμN ; 第二步,确定一次试验中的取值a 是否落入范围(μ-3σ,μ+3σ); 第三步,作出推断。如果a ∈(μ-3σ,μ+3σ),接受统计假设;如果)3,3(σμσμ+-∉a ,由于这是小概率事件,就拒绝统计假设。 6.相关关系

研究两个变量间的相关关系是学习本节的目的。对于相关关系我们可以从下三个方面加以认识:⑴相关关系与函数关系不同。函数关系中的两个变量间是一种确定性关系。相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系。 ⑵函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系。 ⑶函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化。 7.回归分析

本节所研究的回归分析是回归分析中最简单,也是最基本的一种类型——一元线性回归分析。 对于线性回归分析,我们要注意以下几个方面:

⑴回归分析是对具有相关关系的两个变量进行统计分析的方法。两个变量具有相关关系是回归分析的前提。 ⑵散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。

⑶求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。 8.相关系数

有时散点图中的各点并不集中在一条直线的附近,仍可以按照求回归直线方程的步骤求得回归直线方程。显然这种情形下求得的回归直线方程没有实际意义。那么,在什么情况下求得的回归直线方程才能对相应的一组观测数据具有代表意义?课本中不加证明地给出了相关系数的公式。相关系数公式的作用在于,我们对一组数据之间的线性相关程度可作出定量的分析,而不是仅凭画出散点图,直觉地从散点图的形状粗浅地得出数据之间的线性相关程度。 9.线性相关性检验

相关性检验是一种假设检验,它给出了一个具体检验y 与x 之间线性相关与否的具体办法。限于要求,中学阶段只要求掌握这种检验方法的操作步骤,而不要求对这种方法包含的原理进行深入研究。其具体检验的步骤如下:

⑴在课本中的附表3中查出与显著性水平0.05与自由度n-2(n 为观测值组数)相应的相关系数临界值05.0r 。

⑵根据公式∑∑∑===---=

n

i n

i i i n

i i

i y n y x n x y

x n y

x r 1

2

1

22

21

)

)((计算r 的值。

⑶检验所得结果。如果05.0||r r ≤,那么可以认为y 与x 之间的线性相关关系不显著,从而接受统计假设。如果05.0||r r >,表明一个发生的概率不到5%的事件在一次试验中竟发生了。这个小概率事件的发生使我们有理由认为y 与x 之间不具有线性相关关系的假设是不成立的,拒绝这一统计假设也就是表明可以认为y 与x 之间具有线性相关关系。

二、基础训练

1.如果随机变量ξ~N (μ,σ2),且E ξ=3,D ξ=1,则P (-1<ξ≤1=等于B A.2Φ(1)-1 B.Φ(4)-Φ(2) C.Φ(2)-Φ(4) D.Φ(-4)-Φ(-2)

2. 随机变量ξ服从正态分布N (0,1),如果P (ξ<1)=0.8413,则P (-1<ξ<0)= .

三、例题剖析

【例1】 将温度调节器放置在贮存着某种液体的容器内,调节器设定在d ℃,液体的温度ξ(单位:℃)是一个随机变量,且ξ~N (d ,0.52). (1)若d =90°,求ξ<89的概率;

(2)若要保持液体的温度至少为80 ℃的概率不低于0.99,问d 至少是多少?(其中若η~N (0,1),则Φ(2)=P (η<2)=0.9772,Φ(-2.327)=P (η<-2.327)=0.01).

剖析:(1)要求P (ξ<89)=F (89),

∵ξ~N (d ,0.5)不是标准正态分布,而给出的是Φ(2),Φ(-2.327),故需转化为标准正态分布的数值.

(2)转化为标准正态分布下的数值求概率p ,再利用p ≥0.99,解d .

解:(1)P (ξ<89)=F (89)=Φ(

5

.090

89-)=Φ(-2)=1-Φ(2)=1-0.9772=0.0228. (2)由已知d 满足0.99≤P (ξ≥80),

即1-P (ξ<80)≥1-0.01,∴P (ξ<80)≤0.01. ∴Φ(5

.080d

-)≤0.01=Φ(-2.327). ∴

5

.080d

-≤-2.327. ∴d ≤81.1635.

故d 至少为81.1635.

评述:(1)若ξ~N (0,1),则η=

σ

μ

ξ-~N (0,1).(2)标准正态分布的密度函数f (x )是偶函数,x <0时,f (x )为增函数,x >0时,f (x )为减函数.

【例2】一投资者在两个投资方案中选择一个,这两个投资方案的利润x (万元)分别服从正态分布N (8,32)和N (6,22),投资者要求利润超过5万元的概率尽量地大,那么他应选择哪一个方案?

解:对第一个方案,有x ~N (8,32),于是P (x >5)=1-P (x ≤5)=1-F (5)=1-Φ(3

8

5-)=1-Φ(-1)=1-[1-Φ(1)]=Φ(1)=0.8413.

相关文档
最新文档