数理统计课程设计(一元线性回归)剖析

合集下载

一元线性回归分析报告

一元线性回归分析报告

实验报告金融系金融学专业级班实验人:实验地点:实验日期:实验题目:进行相应的分析,揭示某地区住宅建筑面积与建造单位成本间的关系实验目的:掌握最小二乘法的基本方法,熟练运用Eviews软件的一元线性回归的操作,并能够对结果进行相应的分析。

实验内容:实验采用了建筑地编号为1号至12号的数据,通过模型设计、估计参数、检验统计量、回归预测四个步骤对数据进行相关分析。

实验步骤:一、模型设定1.建立工作文件。

双击eviews,点击File/New/Workfile,在出现的对话框中选择数据频率,因为该例题中为截面数据,所以选择unstructured/undated,在observations中设定变量个数,这里输入12。

图12.输入数据。

在eviews 命令框中输入data X Y,回车出现group窗口数据编辑框,在对应的X,Y下输入数据,这里我们可以直接将excel中被蓝笔选中的部分用cirl+c复制,在窗口数据编辑框中1所对应的框中用cirl+v粘贴数据。

图23.作X与Y的相关图形。

为了初步分析建筑面积(X)与建造单位成本(Y)的关系,可以作以X为横坐标、以Y为纵坐标的散点图。

方法是同时选中工作文件中的对象X和Y,双击得X和Y的数据表,点View/Graph/scatter,在File lines中选择Regressions line/ok(其中Regressions line为趋势线)。

得到如图3所示的散点图。

图3 散点图从散点图可以看出建造单位成本随着建筑面积的增加而降低,近似于线性关系,为分析建造单位成本随建筑面积变动的数量规律性,可以考虑建立如下的简单线性回归模型:二、估计参数假定所建模型及其中的随机扰动项满足各项古典假定,可以用OLS法估计其参数。

Eviews软件估计参数的方法如下:在eviews命令框中键入LS Y C X,按回车,即出现回归结果。

Eviews的回归结果如图4所示。

图4 回归结果可用规范的形式将参数估计和检验结果写为:(19.2645)(4.8098)t=(95.7969)(-13.3443)0.9468 F=178.0715 n=12若要显示回归结果的图形,在equation框中,点击resids,即出现剩余项、实际值、拟合值的图形,如图5所示。

数理统计回归分析

数理统计回归分析
有了观测数据 (xi1, xi2 ,, xip , yi ) 后,同样可以用最小 二乘法获得参数 b0 , b1,, bp的最小二乘估计,记为 bˆ0 , bˆ1,, bˆp ,得多元线性回归方程:
yˆ bˆ0 bˆ1x1 bˆp x p (7)
同理,(7)式是否真正描述了 y 与 x1, x2 ,, x p 的客观存在的关系还需进一步检验
yˆ y bˆ(x x) (11)
(11)式给出了最小二乘估计的几何意义.当给定 样本观察值 (x1, y1 ), (x2 , y2 ),, (xn , yn ) 后,散点图中 直线很多.选取点 (xi , yi ) ,i 1,2,, n ,与诸直线的 偏差平方和最小的这条直线是一条通过散点图的几 何中心 (x, y) ,斜率为 bˆ 的直线,可以证明,在某 些假设下,aˆ 与 bˆ 是所有线性无偏估计中最好的.
n
n
n
a
i1
xi
b
i 1
x2i

i 1
xi yi
称为正规方程组,记
x

1 n
n i 1
xi
1 n
y n i1 yi
(9)
xi
由于 xi不完全相同,正规方程组的系数行列式
n
n
xi
i 1
n
xi
i 1
n x2i

n
n
i 1
x2i

9
11.5 11.3
10
13.3 12.0
解: 为求线性回归方程,计算得
x
1 10
10 i 1
xi
11.73

10

数理统计课程设计(一元线性回归)

数理统计课程设计(一元线性回归)

二氧化碳吸附量与活性炭孔隙结构的线性回归分析摘要:本文搜集了不同孔径下不同孔容的活性炭与CO2吸附量的实验数据。

分别以同一孔径下的不同孔容作为自变量,CO2吸附量作为因变量,作出散点图。

选取分布大致呈直线的一组数据为拟合的样本数据。

对样本数据利用最小二乘法进展回归分析,参数确定,并对分析结果进展显著性检验。

同时利用matlab 的regress 函数进展直线拟合。

结果明确:孔径在3. 0~ 3. 5 nm 之间的孔容和CO2吸附量之间存在较好的线性关系。

关键字:活性炭孔容CO2吸附量matlab一、问题分析本文主要研究同一孔径的孔容的活性炭和co2吸附量之间的线性关系,有关实验数据是借鉴双全,罗雪岭等人的研究成果[1]。

以太西无烟煤为原料、硝酸钾为添加剂,将煤粉、添加剂和煤焦油经过充分混合后挤压成条状,在600℃下炭化15 min,然后用水蒸气分别在920℃和860℃下活化一定时间得到2组活性炭,测定了CO2吸附等温线,探讨了2组不同工艺制备的活性炭的CO2吸附量和孔容的关系.数据如下表所示:表1:孔分布与CO2吸附值编号1~12是在不同添加剂量,温度,活化时间处理下的对照组。

因为处理方式不同得到不同结果是互不影响的,可以看出CO2的吸附量的值是互相独立的。

我们将不同孔径下的孔容分为1~7组。

编号孔容/(1110L g μ--⋅)CO2吸附量1/()mL g -⋅1 70 96 115 642 50 913 11 71 65 914 90 76 1225 78 1136 72 56 997 86 1228 13 69 107 9 78 107 10 13 91 137 11 114 110 142 75 12126 114 183作出不同孔径下与CO2吸附量的散点图如下:2468孔容C O 2吸附量10203040506070孔容C O 2吸附量152025303540孔容C O 2吸附量50100150孔容C O 2吸附量406080100120孔容C O 2吸附量5060708090100110孔容C O 2吸附量80100120140160180200孔容C O 2吸附量图1:不同孔容与CO2吸附量的散点图图1中从左往右依次是第1到第7组孔容,从图中可以看出第五、六、七组的点大致分散在一条直线附近,说明两个变量之间有一定的线性相关关系。

概率论与数理统计14-一元线性回归分析

概率论与数理统计14-一元线性回归分析
ˆi y ˆi y )2 ( yi y ˆi ) 2 ( y ˆi y ) 2 S yy ( yi y
i 1 i 1 i 1 n n n
通常记为 Syy Qe U ,
其中
ˆi y )2 U (y
n
(9.2.5)
称为回归平方和, 它反映了 i 1 ˆx的理论值 y ˆ1 , y ˆ2 ,, y ˆn 对 y平 回归方程 y ˆ a ˆ b
i 1 i 1
n
再由(9.2.5)式得到随机变量关系式
ˆ . Qe SYY bS xY
(9.2.7)
理论研究表明,检验统计量
U F F (1, n 2). Qe /(n 2)
当F>F(1,n-2)时,拒绝原假设H0.
例9.2.2 (续例9.2.1)数据见例9.2.1, 取显 ˆ 0.15 0.859x 著性水平 =0.05, 检验回归方程 y 的显著性. 解 检验 H0 : b 0, H1 : b 0.
^
2
~ t (n 2),
其中
^
2

Qe S bSxY YY n2 n2
是总体N 0, 的方差
2
2
D( )
的无偏估计. 对于给定的置信水平1 ,查自由度为n-2 的t分布表可得满足
P{ t t / 2} 1
的临界值t / 2 .利用不等式的恒等变形,可得
x
i 1 24 24 i


127.5, 829.61,
y
i 1 24
24
i
113.1, 650.93,
x
i 1
2 i
y

概率论与数理统计14-一元线性回归分析

概率论与数理统计14-一元线性回归分析

4.0
3.5 22 9.0 8.0
4.5
4.2 23 9.5 8.1
4.6
3.5 24 10 8.1
解 从本例的散点图看出(见图9-1),
强度Y与拉伸倍数x之间大致呈现线性
相关关系, 因此一元线性回归模型是适用Y
与 x的 .
图9-1 例9.2.1数据散点图
现用公式(9.2.4)求 a, b , 这里n=24,
线性回归方程, 其图像就是回归直线, b为回
归系数, a称为回归常数, 也称为回归系数.
现讨论如何根据观测值 ( xi , yi )
(i=1,2,…,n)估计模型(9.2.2) 中回归函数
f(X) =a+bx的回归系数.
采用最小二乘法, 记平方和
Q(a, b) ( yi a bxi )2 .
x
i 1 24 24 i


127.5, 829.61,
y
i 1 24
24
i
113.1, 650.93,
x
i 1
2 i
y
i 1
2 i
x y
i 1 i
24
i
731.6,
1 (127.5) 2 152.266, 24 1 S xy 731.6 127.5 113.1 130.756, 24 1 S yy 650.93 (113.1) 2 117.946, 24 1 x 127.5 5.313, 24 1 y 113.1 4.713. 24 S xx 829.61
1.9
1.4 13 5.0 5.5
2.0
1.3 14 5.2 5.0
2.1

第一节一元线性回归分析-

第一节一元线性回归分析-
Yx, ~ N(0,2). ,,2是 不 依 赖 于 x的 未 知 参 数 .
一元线性回归模型
x的线性函数 随机误差
二、未知参数的估计
Y x , ~ N (0 ,2 ).
对 于 样 本 ( x 1 , Y 1 ) , ( x 2 , Y 2 ) ,, ( x n , Y n ) , 它 满 足
n
x2
] 2
(xi x)2
i 1
则ˆ ~N(,[1
n
n
x2
]2)
(xi x)2
i1
3 .对 x x 0 , 回 归 方 程 Y ˆ 0 = ˆ ˆ x 0 的 分 布
n
Y ˆ0ˆˆx0i n1(n 1n (x(ixi x)xx)2)Yi in 1((xxiixx))x20Yi
(
n i 1
xi
n
( xi
i 1
)ˆ (
) ˆ
n i 1
xi2
n i 1

yi
n i 1
xi
yi
12ˆ 800ˆ 811 800ˆ 53418ˆ 54107
求解得
ˆ= 35.82 ˆ0.476
则 Y 关 于 x 的 线 性 回 归 方 程 为
i 1
i 1
2. (,)的最大似然估 根 计 Y 据 1,Y2, ,Yn的独立性可度 得函 到数 联
Li n 11 2πexp 2 12(yixi)2
(1 2π)nexp 2 12i n 1(yixi)2 .
观 察 散 点 图 ,( x ) 具 有 线 性 函 数 x 的 形 式 .
2.建立回归模型
(x)x一元线性回归问题

高等教育计量经济学一元线性回归分析PPT课件

高等教育计量经济学一元线性回归分析PPT课件

普通最小二乘法(Ordinary least squares, OLS)给出的判断标准是:二者之差(残差)的 平方和最小。
n
n
Q (Yi Yˆi )2 (Yi (ˆ0 ˆ1X i )) 2
1
1
24
最小二乘法的思路
为了精确地描述Y与X之间的关系,必须使用这两个变 量的每一对观察值(n组观察值),才不至于以点概面 (做到全面)。
ui N (0, )
32
(5) ui 非自相关。 Cov(ui, uj) = E[(ui - E(ui) ) ( uj - E(uj) )] = E(ui, uj) = 0,(i j )。
(6) xi是非随机的。 (7) ui 与xi 相互独立。
Cov(ui, xi) = E[(ui - E(ui) ) (xi - E(xi) )]
称为样本回归函数(sample regression function, SRF)。
18
• 样本回归函数的随机形式/样本回归模型:
样本回归函数也有如下的随机形式:
Yi Yˆi uˆˆii ˆ0 ˆ1 X i ei
式中,ei 称为(样本)残差(或剩余)项(residual),代表
963 1299510 1822500 926599
5769300 7425000 4590020
640000 352836 1210000 407044 1960000 1258884 2890000 1334025 4000000 1982464 5290000 2544025 6760000 3876961 8410000 4318084 10240000 6682225 12250000 6400900 53650000 29157448

一元线性回归分析PPT课件

一元线性回归分析PPT课件
第18页/共40页
拟合程度评价
拟合程度是指样本观测值聚集在样本回归线周围的紧
密程度. ( Y t Y ) ( Y ˆ t Y ) ( Y t Y ˆ t)
n
n
n
(Y t Y )2 (Y ˆt Y )2 (Y t Y ˆ)2
t 1
t 1
t 1
n
(Yt Y)2 :总离差平方和,记为SST;
t1
n
第8页/共40页

食品序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
求和
脂肪Xt 4 6 6 8 19 11 12 12 26 21 11 16 14 9 9 5
热量Yt 110 120 120 164 430 192 175 236 429 318 249 281 160 147 210 120
第1页/共40页
回归分析的分类
一个自变量
一元回归
回归分析
两个及以上自变量
多元回归
线性 回归
非线性 回归
线性 回归
非线性 回归
第2页/共40页
一元线性回归模型
(一)总体回归函数
Yt=0+1Xt+ut
ut是随机误差项,又称随机干扰项,它是一个特殊的 随机变量,反映未列入方程式的其他各种因素对Y的 影响。
(ˆ1t(n2)Sˆ1)
2
第15页/共40页
回归分析的Excel实现
“工具”->“数据分析”->“回归”
第16页/共40页
ˆ 0
S ˆ 0
ˆ 1
S ˆ 1
(ˆ0t(n2)Sˆ0)
2
(ˆ1t(n2)Sˆ1)
2
第17页/共40页
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

二氧化碳吸附量与活性炭孔隙结构的线性回归分析摘要:本文搜集了不同孔径下不同孔容的活性炭与CO2吸附量的实验数据。

分别以同一孔径下的不同孔容作为自变量,CO2吸附量作为因变量,作出散点图。

选取分布大致呈直线的一组数据为拟合的样本数据。

对样本数据利用最小二乘法进行回归分析,参数确定,并对分析结果进行显著性检验。

同时利用matlab 的regress 函数进行直线拟合。

结果表明:孔径在3. 0~ 3. 5 nm 之间的孔容和CO2吸附量之间存在较好的线性关系。

关键字:活性炭 孔容 CO2吸附量 matlab一、问题分析1.1.数据的收集和处理本文主要研究同一孔径的孔容的活性炭和co2吸附量之间的线性关系,有关实验数据是借鉴张双全,罗雪岭等人的研究成果[1]。

以太西无烟煤为原料、硝酸钾为添加剂,将煤粉、添加剂和煤焦油经过充分混合后挤压成条状,在600℃下炭化15 min,然后用水蒸气分别在920℃和860℃下活化一定时间得到2组活性炭,测定了CO2吸附等温线,探讨了2组不同工艺制备的活性炭的CO2吸附量和孔容的关系.数据如下表所示:表1:孔分布与CO2吸附值编号1~12是在不同添加剂量,温度,活化时间处理下的对照组。

因为处理方式不同得到不同结果是互不影响的,可以看出CO2的吸附量的值是互相独立的。

我们将不同孔径下的孔容分为1~7组。

编号孔容/(1110L g μ--⋅)CO2吸附量1/()mL g -⋅0.5~0.8nm 0.8~1.2nm 1.2~1.8nm 1.8~2.2nm 2.2~2.2nm 2.5~3.0nm 3.0~3.5nm 1 7.18 16.2 24.4 75.2 70 96 115 64 2 6.59 14.4 18.4 53.7 50 85.6 91 55.1 3 4.54 11 18.9 71 65 78.3 91 53.7 4 5.13 13.4 29.9 10.3 90 76 122 53.7 5 4.16 10.5 18.9 83.8 78 80.5 113 61.7 6 4.92 12.1 23.4 81.6 72 56 99 53.6 7 5.08 12.6 23.8 93.5 86 77.8 122 65.5 8 5.29 13 25.1 88.4 69 66.4 107 57.7 9 7.47 16.9 26.9 46.4 78 93.2 107 58.2 10 5.44 13 21.4 44.1 91 98.6 137 76.6 11 1.81 64.6 18.3 53.1 114 110 142 75 121.2427.739.5 126 114 98.6 183 98.7作出不同孔径下与CO2吸附量的散点图如下:2468孔容C O 2吸附量10203040506070孔容C O 2吸附量152025303540孔容C O 2吸附量50100150孔容C O 2吸附量406080100120孔容C O 2吸附量5060708090100110孔容C O 2吸附量80100120140160180200孔容C O 2吸附量图1:不同孔容与CO2吸附量的散点图图1中从左往右依次是第1到第7组孔容,从图中可以看出第五、六、七组的点大致分散在一条直线附近,说明两个变量之间有一定的线性相关关系。

且自变量的变化导致因变量CO2的浓度变化,因变量变化具有独立性。

我们就选取第七组的数据进行回归分析。

112101()()ˆ()ˆˆni i i ni i x x y y x x y xβββ==⎧--⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑二、问题假设1.假设误差分布服从正态分布。

2.为了简化模型,便于回归分析,我们不考虑实验中各种因素对活性炭吸附的影响,考虑孔容与co2吸附量的数据之间的线性关系。

三、模型建立3.1.回归参数的引进回归函数()(|)y f x E Y X x ===是线性函数的回归分析称为线性回归,当可控制变量只有一个时,即回归函数为01()y f x x ββ==+,那么称为一元线性回归模型,上式称为Y 对x 的一元线性回归方程或者一元线性回归直线,0β、1β称为回归系数,常数0β、1β、2σ均未知。

3.2回归方程的构建由于总体回归方程01()y f x x ββ==+中的参数0β、1β在实际中并不知道,需要通过样本值对它们进行估计,得到估计值0ˆβ,1ˆβ,从而得到样本回归方程01ˆˆY x ββ=+,此样本方程可用作总体回归方程()(|)y f x E Y X x ===的估计。

通常可用最小二乘法估计得到公式由于总体回归方程01()y f x x ββ==+中的参数0β、1β在实际中并不知道,需要通过样本值对它们进行估计,得到估计值0ˆβ,1ˆβ,从而得到样本回归方程01ˆˆY x ββ=+,此样本方程可用作总体回归方程()(|)y f x E Y X x ===的估计。

通常可用最小二乘法估计得到公式012(0,)Y x N ββεεσ=++⎧⎨⎩(1)(2)2σ=101ˆ/ˆˆxy xx l l y xβββ⎧=⎪⎨=-⎪⎩其11n i i x x n ==∑,11ni i y y n ==∑,记12112xy i i i l x y x y==-⋅∑= ,1222112xx i i l x x==-∑1222112yy i i l y y ==-∑1ˆ/xy xxl l β=01ˆy x ββ=- 2ˆe T R xx xx S S S l l β=-=- 可得2.3求一定孔容下的CO2的吸附量的回归直线方程利用matlab 对数据进行计算,结果如下表所示:实验编号孔容i xCO2吸附量iy2i x 2i yi i x y1 115 64 13225 4096 73602 91 55.1 8281 3036.01 5014.13 91 53.7 8281 2883.69 4886.74 122 53.7 14884 2883.69 6551.45 113 61.7 12769 3806.89 6972.16 99 53.6 9801 2872.96 5306.47 122 65.5 14884 4290.25 79918 107 57.7 11449 3329.29 6173.9 9 107 58.2 11449 3387.24 6227.4 10 137 76.6 18769 5867.56 10494.2 11 142 75 20164 5625 10650 12 183 98.7 33489 9741.69 18062.1 ∑1429773.517744551820.2795689.3表2:孔容与C02吸附度的回归计算讲结果代入上上述公式可得下列计算表:(3)表3:回归参数的计算表由此可得线性回归方程为:0.49 5.88y x =+四、回归方程的显著性检验对回归方程是否有意义做判断就是对如下的检验问题做出判断:01:0H β=vs 11:0H β≠拒绝域0H 表示回归方程是显著的。

利用F 检验对参数进行检验。

经计算有T yy S l ==63.7711T f =21R xx S l β==48.421R f =e T R S S S =-=15.3510e f =4.1F 值检验取显著水平α=0.05,其拒绝域为:i x ∑=1429.00n=12i y ∑=773.50x =119.08y =64.462ix∑=177445.00i i x y ∑=95689.302iy∑=51820.272nx =2129340.00n x y ⋅⋅=1148271.602ny =621843.24 xx l =7274.92 xy l =3578.34yy l =1961.75e S =201.662σ=63.771/xy xx l l β==0.4901ˆy x ββ=-=5.88(4) (5)(6) (7)(8)1(1,10)F F α-≥查表可得拒绝域的值为: 4.96F ≥ 计算得87.28/(2)Re S F S n ==-,远远大于F 的临界值,说明拒绝原假设,原假设不成立,自变量和因变量有着显著的线性关系。

4.2.p 值检验将(6)(7)(8)中的各平方和和自由度移入方差分析表,继续进行计算可得:这里p 值很小,因此,在显著性水平0.01下回归方程是显著的。

五、计算方法的涉及和计算机的实现4.1用matlab 拟合直线:先将数据以txt 格式保存,再用dlmread 读取ASCII 码文件。

调用matlab 中的regress 多元线性回归函数(代码见附录),对12个样本数据进行拟合,作出散点图和直线拟合图在一张图上如下:9010011012013014015016017018019050556065707580859095100图2:孔容和CO2吸附量的直线拟合孔容C O 2吸附量从图中可以看出样本点大致分布在直线附近,拟合效果比较好。

4.2直线参数的估计值的置信区间以及三种检验利用regess函数求出参数的估计值和置信区间以及参数的检验统计量(设置α=0.05)如下:图3:用matlab计算的参数值和检验值。

其中,R^2=0.8972指因变量(CO2吸附度)有89.7%可由模型确定,F的值远远超过F的临界值。

P远小于α,因而模型从整体上看是可用的。

六、主要的结论孔容和CO2吸附量之间存在线性关系,经过显著性检验,线性方程回归效果较好,即线性方程能基本描述孔径范围3. 0~ 3. 5 nm的活性炭孔容和CO2吸附量七、参考文献[1]张双全,罗雪岭,郭哲,董明建,岳晓明. CO2吸附量与活性炭孔隙结构线性关系的研究[J]. 中国矿业大学学报. 2008(04)附录Matlab制作散点图:M=dlmread('co2.txt');%读取ASCII码文件for i=1:1:7subplot(4,2,i)x1=M(:,i); y=M(:,8);plot(x1,y, 'bo');xlabel('孔容'),ylabel('CO2吸附量');endMatlab直线拟合:clc; format short g;M=dlmread('co2.txt');%读取ASCII码文件x1=M(:,7); y=M(:,8);plot(x1,y, 'bo');b=regress(y,[ones(size(x1)),x1]); % b=[β0 β1] ',列向量x1=sort(x1); %按升序排序,用于画图y=[ones(size(x1)),x1]*b;%使用矩阵乘法hold on;plot(x1,y, '-r');title('图2:孔容和CO2吸附量的直线拟合')xlabel('孔容');ylabel('CO2吸附量');hold off;Matlab参数估计:clc; format compact; format short g;M=dlmread('co2.txt');%读取ASCII码文件x1=M(:,7); y=M(:,8);[b,bint,r,rint,stats]=regress(y,[ones(size(x1)),x1],0.05);fprintf('%2s%5s%11s\n','参数','估计值','置信区间');%1个汉字算1个字符for i=1:length(b)fprintf ('β%1d%9.4f [%7.4f, %7.4f]\n',i-1,[b(i,:),bint(i,:)]); end% %d将i当整数输出,%7.4f按实数格式输出,区域宽7个字符,4位小数fprintf('\nR^2=%.4f F=%.4f p<%.4e s^2=%.4f\n',stats);。

相关文档
最新文档