统计学专业教授的讲座(续2)
统计学pt知名专家讲座

取值及其意义
完全负有关
无线性有关
完全正有关
-1.0 -0.5 0 +0.5 +1.0
r
负有关程度增长 正有关程度增长
15
使用有关系数时应注意:
● X和Y 都是相互对称旳随机变量; ● 线性有关系数只反应变量间旳线性有关程
度,不能阐明非线性有关关系; ● 样本有关系数是总体有关系数旳样本估计
值,因为抽样随机性,样本有关系数是个随 机变量,其统计明显性有待检验; ● 有关系数只能反应线性有关程度,不能拟 定因果关系,不能阐明有关关系详细接近哪 条直线。
1702 1886 2316 2423 2567
30
2.回归方程(regression equation) p365
1. 描述 y 旳平均值或期望值怎样依赖于 x 旳方
程称为回归方程
2. 一元线性回归方程旳形式如下
3.
E( y ) = b0+ b1 x
▪ 方程旳图示是一条直线,也称为直线回归方程 ▪ b0是回归直线在 y 轴上旳截距,是当 x=0 时 y 旳期
1. r 旳取值范围是 [-1,1] 2. |r|=1,为完全有关
r =1,为完全正有关
有关系 数旳性
r =-1,为完全负正有关
质在p359
3. r = 0,不存在线性有关关系
4. -1r<0,为负有关
5. 0<r1,为正有关
6. |r|越趋于1表达关系越亲密;|r|越趋于0表达关
系越不亲密
14
7
10.1.2.有关关系旳描述与测度P354
1)散点图(scatter diagram)
完全正线性有关
正线性有关
完全负线性有关
社会统计学讲义

社会统计学讲义(卢淑华)第一章社会学研究与统计分析一、社会调查资料的特点(随时掌握)随机性、统计规律性;二、统计学的作用:为社会研究提供数据分析和推论的方法三、统计分析的作用及其前提。
四、统计分析方法的选择1 、全面调查和抽样调查的分析方法2 、单变量和多变量的统计分析方法五、不同变量层次的比较;定类、定序、定距、定比定义、数学特征、运算特性、涵盖关系、等第二章单变量统计描述分析一、统计图表,熟悉不同层次变量对应的分析图表,不能混淆。
尤其是直方图的意义。
二、标明组限与真实组限的换算,重要。
三、集中趋势测量法1 、定义、优缺点、注意事项;2 、众值:定义、计算公式、解释、运用,注意事项;3 、中位值:定义、计算公式(频数和比例两种公式)、解释、运用,注意事项;4 、均值:定义、计算公式(分组与加权)、解释、运用,注意事项;5 、众值、中位值和均值的关系及其相互比较,会用众值和中位值估算均值;四、离散趋势测量法1 、定义、优缺点、注意事项,与集中趋势的关系;2 、异众比例:定义、计算公式、解释、运用,注意事项;3 、质异指数:定义、计算公式、解释、运用,注意事项;4 、四分位差:定义、计算公式(频数和比例两种公式)、解释、运用,注意事项;要会举一反三,如求十分位差、以及根据数据求其在总体中的位置。
5 、方差及标准差:定义、计算公式(分组与加权)、解释、运用,注意事项;第三章概率一、概率:就是指随机现象发生的可能性大小。
随机现象具有不确定性和随机性。
二、概率的性质:1 、不可能事件的概率为O ;2 、必然事件的概率为1 ;3 、随机事件的概率在O 一1 之间;三、概率的计算方法:1 、古典法:计算等概率事件,P 一有效样本点数/样本空间数;2 、频率法:求随机事件在多次试验后的极限频率。
3 、概率是理论值,只有一个,频率是试验值,不同的试验有不同的频率。
四、概率的运算:会画文氏图1 、加法公式:两个或多个随机事件的求和概率‘2 、乘法公式:两个或多个随机时间共同发生的概率。
007(讲座五-1)综合评价方法(一)

年度
1995 1996 1997
0.592 0.604 0.535
0.577 0.576 0.580
由式(8.7)和式(8.8)得最优方案和最劣方案:
Z (Z 1 , Z 2 , , Z m) { max Z ij j 1,2 , , m }
Z (Z 1 , Z 2 , , Z m) { min Z ij j 1,2 , , m }
S
i
( Z ij Z ) 2 j
j 1
m
i 1,2, , n
那么,某一可行解对于理想解的相对接近度定义为:
S i Ci S i S i
0≤Ci ≤1,i=1,…,n ,
8
S i Ci S i S i
0≤Ci ≤1,i=1,…,n ,
于是,若是理想解,则相应的 Ci =1;若是负理想解, 则相应的C i =0。愈靠近理想解,Ci 愈接近于1;反之, 愈接近负理想解, Ci 愈接近于0。那么,可以对 Ci 进行排队,以求出满意解。 1.3 TOPSIS法计算步骤 第一步: 设某一决策问题,其决策矩阵为A. 由A可以 构成规范化的决策矩阵Z′,其元素为Z'ij,且有
转化后数据见表8.2。
表8.2 转化指标值
年度 床位周 转次数 20.97 21.41 19.13 床位 周转率 (%) 113.81 116.12 102.85 平均 住院 日 5.34 5.44 5.73 出入院 诊断符 合率 (%) 99.42 99.32 99.49 手术前 后诊断 符合率 (%) 99.80 99.14 99.11 三日 确诊率 (%) 97.28 97.00 96.20 危重病 治愈 院内 病死 人抢救 率 好转率 感染率 成功率 (%) (%) (%) (%) 96.08 95.65 96.50 97.43 97.28 97.98 94.53 95.32 96.22 95.40 94.01 95.21
统计学与数据分析讲座

统计学与数据分析讲座统计学与数据分析讲座尊敬的各位听众,大家好。
我很荣幸能够在这里为大家做一场关于统计学与数据分析的讲座。
统计学与数据分析是现代社会不可或缺的工具,它们可以帮助我们更好地理解和解读数据,为决策提供科学的依据。
首先,让我们来了解一下统计学。
统计学是一门研究数据收集、整理、分析和解释的学科。
它可以帮助我们了解数据的特征和规律,并从中推断出总体的特征。
统计学不仅可以用于科学研究中,还可以应用于财务、市场、医疗等不同领域。
对于一个企业来说,统计学可以帮助他们分析市场需求和产品销售情况,从而优化生产和运营策略。
接下来,我们来谈谈数据分析。
数据分析是根据统计学原理和模型来处理数据的过程。
在现代社会中,我们面临着大量的数据,如何从中发现有价值的信息变得至关重要。
数据分析可以帮助我们提取有效信息,识别数据间的关联和趋势,从而为决策提供支持。
例如,一个电商网站可以通过分析用户购买行为来了解用户的兴趣和偏好,从而设计个性化的推荐系统。
那么,如何进行数据分析呢?数据分析的关键在于数据的整理和处理。
首先,我们需要对数据进行清洗,剔除无效或错误的数据。
然后,我们可以用图表、表格、数学模型等形式对数据进行可视化和描述性分析,以便更好地理解数据。
接下来,我们可以使用统计方法和机器学习算法对数据进行推断性分析,从而得出一些有意义的结论。
最后,我们可以将结果呈现给决策者,帮助他们做出科学的决策。
在数据分析中,还有一些常用的方法和工具。
例如,回归分析是一种常用的统计方法,可以用来研究自变量和因变量之间的关系。
时间序列分析可以帮助我们预测未来的趋势和变化。
机器学习算法如神经网络和决策树可以用来构建预测模型。
此外,R语言和Python是两种广泛使用的数据分析工具,它们具有丰富的函数库和易于学习的语法,方便我们进行数据分析和可视化。
正如前面所说,统计学与数据分析在现代社会中起着非常重要的作用。
它们可以帮助我们更好地理解和利用数据,从而推动科学研究、优化决策和提升效率。
《统计理论知识》讲座

《统计理论知识》 讲 座
(一) 古典统计学时期
1787年,英国博士齐默尔曼(E.A.W.Zimmerman)根据语音,把 Statistik译成英语Statistic,后经英国爵士莘克莱(J.Sinclair, 1754—1835)的大力推广,“统计学”一词终于为英国广大学者所接 受。后来,不仅在英国,而且在其他语种的欧洲国家都陆续接受了 阿亨瓦尔首创的“统计学”。这些国家翻译的“统计学”,从字音 或字形上十分接近Statistic。19世纪后半叶,“统计学”传到日本, 日本学者根据意思采用汉字“统计学”来表示。之后,作为一门科 学名称的“统计学”一词又传到中国。
2013-2-28 5
《统计理论知识》 讲 座
(一) 古典统计学时期
威廉· 配第对于统计学的形成有着巨大的功绩,因此马克思称他 为“政治经济学之父,在某种程度上也可以说是统计学的创始 人”。该学派的另一个代表人物是约翰· 格朗特 (J.Graunt,1620—1674)它通过对伦敦市人口的出生和死亡资料 进行分类计算,出版了第一本关于人口统计的著作《关于死亡表 的自然和政治的观察》,证实了出生、死亡、男女性别比例等人 口动态存在一定的规律;编制了世界上第一张“死亡表”。 政治算术学派在统计发展史上有着重要的地位。它在搜集 资料方面,较明确地提出了大量观察法、典型调查、定期调查 等思想;在处理资料方面,较为广泛地运用了分类、制表及各 种指标来浓缩与显现数量资料的内容信息。它第一次运用可度 量的方法,力求把自己的论证建立在具体的、有说服力的数字 上面。但该学派的学者都还没有使用“统计学”这个名称,可 谓“有统计学之实,无统计学之名”。
2013-2-28 8
《统计理论知识》 讲 座
(二) 近代统计学时期
统计基础知识 精品课程

统计基础知识精品课程摘要:一、统计学概述1.统计学的定义2.统计学的研究对象3.统计学的应用领域二、统计数据的收集与整理1.统计数据的来源2.统计数据的收集方法3.统计数据的整理三、统计数据的描述1.数据的图表展示2.数据的数字描述3.数据的分布特征四、统计推断1.参数估计2.假设检验3.回归分析五、统计学在实际应用中的案例1.金融领域2.医疗领域3.市场营销正文:一、统计学概述统计学是一门研究如何收集、整理、分析、解释以及展示数据的方法论学科。
统计学的研究对象包括各种数据,例如数值型数据、分类数据、顺序数据等。
统计学的应用领域广泛,包括自然科学、社会科学和商业等领域。
二、统计数据的收集与整理统计数据的来源多样,包括问卷调查、实验数据、政府发布的数据等。
收集数据的方法有抽样调查、全面调查等。
在收集到数据后,需要进行整理,包括数据清洗、数据转换、数据汇总等步骤,以便进一步分析。
三、统计数据的描述数据的描述包括数据的图表展示和数据的数字描述。
图表展示包括条形图、折线图、饼图等。
数据的数字描述包括平均数、中位数、众数、方差等。
此外,还需要了解数据的分布特征,如正态分布、偏度、峰度等。
四、统计推断统计推断是通过样本数据对总体参数进行估计和推断的过程。
参数估计是利用样本数据估计总体参数,例如均值、方差等。
假设检验是利用样本数据判断关于总体的某个假设是否成立。
回归分析是研究两个或多个变量之间关系的方法。
五、统计学在实际应用中的案例统计学在实际应用中具有广泛的应用价值。
例如,在金融领域,可以通过统计分析预测股票价格走势;在医疗领域,可以通过统计分析研究某种疾病的发病率、死亡率等;在市场营销中,可以通过统计分析了解消费者需求、市场占有率等。
统计知识讲座PPT课件

图表设计原则与规范
01
02
03
04
简洁明了
图表设计应简洁明了,避免过 多的装饰和复杂的背景,突出
数据本身的特点。
一致性
在同一份报告中,应保持图表 风格、字体、颜色等要素的一
致性,提高整体美观度。
数据准确性
图表中的数据应准确无误,来 源可靠,避免误导读者。
注解清晰
对于图表中的重要信息,应提 供清晰的注解和说明,帮助读
标准差
方差的算术平方根,反映 数据波动程度,标准差越 小,数据越稳定。
数据分布形态的描述
偏态分布
正态分布
数据分布不对称,偏向某一方向,可 分为左偏和右偏。
一种对称分布,其形态由均值和标准 差决定,具有广泛的应用。
峰态分布
数据分布的尖峭或扁平程度,峰度越 高,数据分布越尖峭;峰度越低,数 据分布越扁平。
假设检验与显著性水平
假设检验
先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程。假设 检验包括原假设和备择假设的设立、检验统计量的选择、显著性水平的确一类错误的概率。通常取0.05或0.01等小概率值作为显 著性水平,表示在原假设为真时,拒绝原假设的最大允许概率。
对收集到的数据进行预处理,包括数据筛 选、缺失值处理、异常值处理等。
数据分析
结果呈现
运用统计学方法对数据进行描述性分析和 推断性分析,如均值、方差、假设检验等 。
将分析结果以图表、报告等形式呈现,为 市场决策提供支持。
案例二:医学实验数据处理
实验设计
根据研究目的和实验条件,设计合理的实验 方案和数据收集计划。
数据可视化
Python的matplotlib、seaborn等库 提供丰富的数据可视化功能,可绘制 各种静态、动态、交互式的图表。
郑卫军 统计学 课件

郑卫军统计学课件统计学主要内容是关于认识客观现象总体数量特征和数量关系的科学,它是通过搜集、整理、分析统计资料,认识客观现象数量规律性的方法论科学。
由于统计学的定量研究具有客观、准确和可检验的特点,所以统计方法就成为实证研究的最重要的方法,广泛适用于自然、社会、经济、科学技术各个领域的分析研究。
统计学,其按使用目的又可分为描述统计学和推断统计学两大类。
描述统计是统计学最基本也是发展最早的内容,实际就是对所获得的海量数据进行准确、全面、简明、扼要地描述和展示,以使数据的使用者能够快速掌握数据的总体特点继而进一步使用。
推断统计则是因总体数据的难以获得而发展出的利用少数样本对总体数据的各项特征进行估计的近现代学科,推断统计学的分支极为众多,但基本都围绕着基于推断目的的参数估计和假设检验展开,20世纪以来相继繁荣兴盛的回归分析、时间序列分析等都属于这一范畴。
近年来成为应用统计学发展前沿的数据挖掘也同样属于推断统计学的分支。
和数学一样,统计学在其他各个学科中也都存在着大量的应用,从而形成了很多的交叉学科,有经济统计学、社会统计学、环境统计学、人口统计学、犯罪统计学等等。
1.统计学的涵义:统计学是一门研究数据的科学,任务是如何有效地收集、整理、和分析这些数据,探索数据内在的数量规律性,对所观察的现象做出推断或预测,直到为采取决策提供依据。
统计数据的收集是取得统计数据的过程,它是进行统计分析的基础。
离开了统计数据,统计方法就失去了用武之地。
如何取得所需的统计数据是统计学研究的内容之一。
统计数据的整理是对统计数据的加工处理过程,目的是使统计数据系统化、条理化,符合统计分析的需要。
数据整理是介于数据收集与数据分析之间的一个必要环节。
统计数据的分析是统计学的核心内容,它是通过统计描述和统计推断的方法探索数据内在规律的过程。
2.统计学研究对象的特点(1)总体性:统计学研究对象是社会经济现象总体或自然现象总体的数量特征。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
授課目錄第1章導論第2章統計資料的整理與描述第3章機率導論第4章常用的機率分配與統計分佈第5章描樣方法與描樣分佈第6章統計估計第7章統計檢定第8章變異數分析第9章相關分析與迴歸模式第10章無母數統計檢定第11章類別資料分析---列聯表與卡方檢定課前補充---系統、線性、與線性系統 系統的定義:『相互作用以達到某一目的之元件組合』。
以符號表示:X(t)Y(t)以運算子(Operator)或函數符號H 表示:Y(t) = H [X(t)]何謂線性、線性系統(Linear System)?X 1(t)Y 1 (t)and X 2 (t)Y 2 (t)ThenX 1(t) +X 2 (t)Y 1 (t) +Y 2(t)---SuperpositionWhere、 = Constant符合上述重疊原理(Principle of Superposition)即線性。
H[X 1(t) +X 2(t)] =H[X 1(t)] +H[X 2(t)]過程 H輸出Y(t)輸入X(t)= Y1(t) + Y2(t)符合上述重疊原理之系統即線性系統。
第九章相關分析與迴歸模式『小時候胖,是不是胖?』,『龍生龍、鳳生鳳、老鼠生的兒子會打洞?』,日常生活中,常發某些現象與其他現象有相關性(Correlation)。
本章係探討變數之間的相關程度,並用統計方法建立一合適的迴歸模式。
迴歸模式分為單變數(簡單)迴歸與多變數(複)迴歸。
9.1 資料散佈圖與相關程度研究資料相關與迴歸之步驟搜集資料繪出其散佈圖(x, y)求出相關係數以散佈圖建立y(x)之迴歸模式估計與檢定建構迴歸模式一般而言,任兩變數之間存在某種關係,包括正相關、負相關、或統計無關。
相關係數(Correlation Coefficient)以表示,即兩個變數X 與Y 的相關程度,其定義為: = X,Y/X Y= Cov(X, Y) /X Y(9.1)式中:2X2Y分別為X 與Y 為變異數;X,Y= Cov(X, Y)為X 與Y 為共變異數。
當 0時 X 與Y 之間為正相關; 當0時X 與Y 之間為負相關;當 = 0時X 與Y 之間為沒有關係存在,或統計無關。
在實務應用上,常以樣本相關係數ρˆ來估計,即 ∑-∑-∑--=ρ===n1i 2i n1i 2i n1i i i )y y ()x x ()y y )(x x (ˆ(9.2)其中,(x i , y i )為第i 對樣本值,i =1, 2,…,n ; y ,x 分別為其各對變數之樣本平均值。
◎僅能用來衡量”直線相關程度,至於非直線的情況而言,就無任何代表意義。
相關係數的解釋(1) 有相關並不表示有因果關係。
(2) 相關係數必須經過假設檢定。
(3) 絕對值相等的正負號相關係數代表兩變數的關連強度是一樣的,只是方向不同。
(4) 即使相關係數等於0,與其說是兩變數無關,寧可說是此兩變數沒有線性。
相關係數 的檢定當隨機變數X 與Y 之聯合分佈服從二元常態分配時,欲檢定H 0 := 0, vs. H 1 :0時,其檢定統計式: t n-2=2ˆ12n ˆρ--ρ(9.3)當欲檢定相關係數是否等於不為0的某特定值時,即檢定H 0 :=, vs. H 1 :(0)時可使用費雪轉換(Fisher Transformation),其檢定統計式:ρ-ρ+=ρˆ1ˆ1ln 21Z ˆ (9.4)在統計假設H 0為真時,ρˆZ N[Z 0 , 1/(n-3)]Z 0= 1/2 ln[(1+)/(1- 0)]範例、抽10人,發現8歲體重和20歲體重的相關係數ρˆ為0.8,但說不定母體的相關係數是0,但因抽樣誤差,而產生樣本關係數為0.8,因此要進行相關係數相關係數的假設檢定。
SOL :統計假設為:H 0:= 0, vs. H 1:= 0.05 下之雙邊檢定t n-2=2ˆ12n ˆρ--ρ= 0.8(10-2)1/2/(1-0.82)1/2= 3.77Critical Value = /=tinv(0.025*2,8)/= 2.3(Two-sides)Critical Value = /=tinv(0.05*2,8)/= 1.86(One-side)3.77值大於顯著水準0.05之臨界值Reject H 08歲體重和20歲體重的相關係數為0.8之假設。
範例、財金系研究指出台灣地區加權股票指數漲跌X 與成交量Y 有關,其相關係數為0.7。
工管系為驗證此結果,隨機抽取去年39筆資料,得到 ρˆ為0.6。
SOL :統計假設為:H 0:= 0.7, vs. H 1:0.7= 0.05 下之雙邊檢定ρ-ρ+=ρˆ1ˆ1ln 21Z ˆ=1/2 ln[(1+0.6)/(1-0.6)]= 0.69 /=fisher(0.6) = 0.69/ (ρˆ=0.6,transform, 0.69) Z 0 = 1/2 ln[(1+)/(1-)]=1/2 ln[(1+0.7)/(1-0.7)]= 0.87/=fisher(0.7) = 0.87/ (= 0.7,transform, 0.87))3n /(1Z Z 0ˆ--ρ= 6|0.69-0.87| = 1.081.08值小於顯著水準0.05之臨界值(=1.96) Accept H 0接受台灣地區加權股票指數漲跌X 與成交量Y 有關,其相關係數為0.7之假設。
9.2 單變數迴歸模式單變數迴歸模式與相關係數都是採討兩個變數間之關係。
在相關係數分析中,並無考慮到此兩個變數X 、Y 間之統計關聯。
若變數Y(依變量或稱應變數)和變數X(自變數)之間存在有線性迴歸關係,則可建構一合適之迴歸模式,此稱之為單變數迴歸模式(Simple Linear Regression)。
其迴歸統計模式如下:Y i =+1X i +i, i =1, 2,…., n(9.5)式中 : i : 樣本個數, n :共有n 組樣本; (X i , Y i ):第i 組樣本的自變數與應變數;,1:參數(常數值);i :樣本中第i 個隨機誤差項。
此迴歸模式有以下的基本假設:1、隨機誤差i是互相獨立、且均服從常態分配N(0,2)。
2、X i 為常數,Y i 為0+1X i 與i之和,故互相獨立、且Y i ~ N(0+1X i ,2)。
3、i與X i 為無關,即Cov(i, X i ) = 0。
即E[i] = 0E[Y i | X i = x i ] = 0+1x iVar[i ] =2Var[Y i | X i = x i ] =2由上圖知,X i 視為一常數, Y i 則為一隨機變數。
E[Y i ]= 0+1X i 受到自變數X i 的影響,且此影響呈直線走向。
此直條E[Y i ]=+1X i 稱之迴歸函數(RegressionRegression Line x 1 x 2β0+β1 x 1 β0+β1 x 2y 1 ~ N(β0+β1x 1,y 2 ~ N(β0+β1x 2,E[Y | x] = β0+β1 xFunction),參數,1分別為直線之截距與斜率,此二未知參數須進行估計與檢定。
一般估計0,1用最小平方法。
應用最小平方法估計0,1(樣本觀點)最小平方法概念是根據n 組資料(x i , y i ),找出一條樣本迴歸或稱配適線(Fitted Line)i yˆ= b 0 + b 1x i , ,其中b 0 , b 1分別代表,1之估計值。
使得各資料值y i 與迴歸線上所對應的配適值i yˆ之差異最小。
所謂最小,是以各個差異的平x b b yˆ10+= eεy 1x 1b 0 + b 1x 1方總和(SSE, Sum of the Squared Error)最小為標準: SSE = ∑+-=∑-=∑===n1i 2i 10i 2n1i i i n1i 2))x b b (y ()yˆy (e (9.6)欲計算出b 0 , b 1而使SSE 值最小,則須將SSE 分別對b 0 , b 1做偏微分並令其為0,則∑∑+===n1i n1i i 10i x b nb y(9.7) ∑∑+∑====n1i n1i 2i 1n1i i 0i i x b x b y x(9.8)解(9.7)(9.8)二式:∑-∑--===n1i 2i n1i i i 1)x x ()y y )(x x (b = SS xy / SS xx(9.9) x b y b 10-=(9.10)用yˆ= b0+b1x i 來估計迴歸函數E[Y i]= 0+1X i時,中ib0 , b1分別是0,1之不偏估計量,即E[b0]= 0且E[b1]=在計算估計值時,先算出b1再根據b1計算b0 , b1。
1。
五種主要的迴歸線迴歸分析係以X來預測Y,亦即算出Y = f (X)此函數,將X值帶入其中,預測Y值。
基本上,此Y = f (X) 函數即是迴歸線,其形狀有六種:1、一次函數(直線):yˆ= b0+b1x(單變數迴歸模式)2、對數函數:yˆ= b0+b1ln x3、高次函數:yˆ= b0+b1x +b2x2+…+ b n x n4、乘冪函數:yˆ= ax b5、指數函數:yˆ= ae bx如何檢定1在大多數的迴歸分析中,主要目的是為了要探討迴歸函數的斜率1;其代表自變數X增加一單位時,應變數Y改變的情況。
斜率愈大,代表自變數X雖只些微改變,卻會導致應變數Y產生劇烈的變動。
當迴歸模式之誤差項i服從常態分配(N(0,2))時,E[b1]= 1,Var[b1] = 2/S xx之常態分配(S xx =n i=1(x i-x)2);即b1~ N(1, 2/S xx)。
由於2通常是未知的,常以均方誤差MSE=n i=1 ( y i -yˆ)2/(n-2)作為2的估計值。
因此Var[b1]的估計值為MSE/S xx。
令S(b1) = (MSE /S xx)1/2,稱S(b1)為b1的估計標準誤(Standard Error ofEstimation)。
另(b1-1)/ S(b1)~ t n-2(9.11)檢定1的統計量與檢定程序:1、統計假設:H0: 1= 0 ; H1: 1 02、檢定統計量:t= (b1-1)/S(b1)= (b1-0)/S(b1)= b1/ S(b1)3、在顯著水準 = 0.05時,若| t | t/2,n-2,則拒絕H0;即自變數X和應變數Y之間有迴歸關係。
範例、欲研究某商品之廣告支出與銷售量?廣告支出 4 6 2 5 7 6 3 8 5 3 1 5銷售量197 272 1022832727914837723814266 2391、統計假設:H0: 1= 0 ; H1: 1 02、檢定統計量:t = (b1-1)/S(b1)= (b1-0)/S(b1)= b1/ S(b1)S xx = 46.9;MSE=( y i-yˆ)2/(n-2)= SSE /(n-2) = 336.9/10 =33.69t = b1/ S(b1) = 44.4/(33.69/46.9)1/2 = 52.43、在顯著水準 = 0.05時,若| t | t/2,n-2= t0.025,10=2.22,Then Reject H0自變數X和應變數Y之間有迴歸關係,即廣告支出此因子應引入模式中。