Ch6样本及其分布

合集下载

斯托克《计量经济学》Ch6

斯托克《计量经济学》Ch6
(辅助回归)
检验模型:(以残差代替误差) 检验假设: H 0 : 1 2 r 0,
ˆ i2 0 1 z1i r zri vi
H1 : 存在 i 使得 i 0, i 1,2,, r
检验步骤:S1:OLS回归原模型,得到残差序列; S2:将残差平方对影响变量回归,得出拟合优度R2;
Ch6:异方差、自相关和多重共线性
自变量包含因变量滞后项—— 德宾检验(DurbinTest): 检验假设:
计量经济学PPT
H 0 : 1 2 r 0; H1 : 1 , 2 ,, r 至少一个不为0
检验统计量及分布:辅助回归的拟合优度为R2,则n×R2渐进服从自 由度为r的χ2(r)分布。Eviews操作。 自相关的修正:广义差分法 回归模型:
ˆ ˆ Var ( 1 ) ˆ ( xi x ) 2 i2 i 1
n
计量经济学PPT
n ( xi x ) 2 i 1
2
以此计算的t-统计量
ˆ 1 1 ˆ t ( 1 ) * ˆ s ( 1 )
*
在大样本下渐进有效(参见本章附录)。 Eviews模型设定选项可进行选择
yt 0 1 x1t k xkt yt 1 t , t 1,2,, n
检验统计量及其分布:
n DW h 1 ~ a) N (0,1)ቤተ መጻሕፍቲ ባይዱ ( ˆ 2 1 nVar (ˆ )
自相关检验(二)——布劳殊-戈弗雷(Breusch-Godfrey)
Ch6:异方差、自相关和多重共线性
对古典线性回归模型基本假设不满足的处理:广义OLS. 包括(i)基本假设不满足时仍采用OLS带来的后果; (ii)对基本假设是否满足进行检验; (iii)对OLS方法的改进——GLS 一、异方差 定义:存在i,j,使得

六 样本及抽样分布

六 样本及抽样分布

第六章 样本及抽样分布前五章是概率论的基本内容,主要研究随机变量的性质、特点和规律性,而且研究的必要前提是假设随机变量的分布是已知的.但在实际中,大量存在另外一种随机变量,其分布是未知的或不完全清楚的.人们认识这种随机变量是通过对它们进行独立重复的观察,得到许多观察数据,然后对数据进行分析,并依分析结果对随机变量的分布做出推断.这就是数理统计所要研究的.概率论是数理统计研究的理论基础.一、随机样本总体和个体 在数理统计中,把所研究对象的全体称为总体.总体中的每个元素称为个体.总体中所包含个体的个数称为总体的容量.对象的全体一般是指对象的一个数量指标,它往往是一个随机变量,称之为总体变量,用X 表示,也说总体X .总体的分布就是指总体变量的分布.例如,研究学生们的身高.对象是学生,总体是学生们的身高.研究一批钢材的含炭量、含锰量等.对象是钢材,总体是这批钢材的含炭量、含锰量等.这里研究对象是通过随机试验进行的.随机试验产生总体,研究对象其实是指研究总体变量.在实际中,总体的分布一般是未知的,或知道它具有某种形式但其中含有未知参数.在数理统计中,人们是通过从所研究对象的总体中抽取一部分,称为总体的一个样本(或一组样本值),并根据这部分数据来对总体的分布做出推断.从总体中抽取一个个体是指对总体X 进行一次观察的结果.在相同的条件下,假设对总体X 进行n 次重复、独立的观察,n 次观察的结果按试验的次序依次记为12,,,n X X X .由于它们是对随机变量X 观察的结果,且各次观察是在相同的条件下重复、独立地进行的,所以12,,,n X X X 是相互独立的随机变量,且都与X 有相同的分布形式.我们称这样得到的12,,,n X X X 为来自总体X 的一个简单随机样本,简称样本,称n 为这个样本的容量.当n 次观察一完成,便得到一组实数12,,,n x x x ,依次是随机变量12,,,n X X X 的观察值,称为样本值.例如,研究学生们的身高,身高X 有分布,只是分布未知.假设随机地抽取20人,并以1220,,,X X X 记20人的身高.按样本构成可知,1220,,,X X X 都可以取学生每个人的身高,所以它是相互独立同分布于X 的随机变量.现在,我们具体做20次观察,得到的一组实数1220,,, 1.65,1.82,,1.65x x x 即为随机变量1220,,,X X X 的一组观察值.简单随机样本和样本值 设X 是总体变量.若相互独立的随机变量12,,,n X X X 与X 有相同的分布,则称随机变量12,,,n X X X 为来自总体X 的容量为n 的简单随机样本,简称样本.样本的一组取值(所谓的观察值)12,,,n x x x 称为样本值.二、抽样分布 1. 基本概念统计量 设12,,,n X X X 为总体X 的一个样本,()12,,,n g X X X 为样本的连续函数,如果g 中不含未知参数,则称()12,,,n g X X X 是一个统计量.若12,,,n x x x 是12,,,n X X X 的样本值,则称()12,,,n g x x x 是统计量()12,,,n g X X X 的一个观察值.抽样分布 统计量的分布称为抽样分布.分位点 设随机变量X 的概率密度为()f x ,对于给定的数()01αα<<,称满足条件{}()x P X x f x dx ααα+∞>==⎰的点x α为X 分布的上α分位点.称满足条件{}()11x P X x f x dx ααα---∞<==⎰的点1x α-为X 分布的下α分位点.下α分位点1x α-其实就是上1α-分位点1x α-.X 分布的上2α分位点2x α和下2α分位点12x α-称为X 分布的双侧α分位点.即{}{}()()12221x x P X x P X x f x dx f x dx ααααα-+∞--∞<+>=+=⎰⎰2. 常用统计量(1) 基本统计量 设12,,,n X X X 是来自总体X 的样本,则有样本均值 称11ni i X X n ==∑为样本均值,它反映总体均值的信息.样本方差 称()22111nii S X X n ==--∑为样本方差,它反映总体方差的信息. 样本标准差 称S =反映总体标准差的信息. 样本k 阶矩 称11n kk i i A X n ==∑为样本k 阶矩,它反映总体k 阶矩的信息.我们指出, 若总体X 的k 阶矩()kk E X μ∆=存在, 则当n →∞时, ,1,2,pk k A k μ−−→= . 这是因为12,,,n X X X 独立且与X 同分布, 所以12,,,k k k nX X X 独立且与kX 同分布. 故有12()()()k k kn k E X E X E X μ==== .由第五章中的辛钦定理知11,1,2,n P k k i k i A X k n μ==−−→=∑ .并由依概率收敛的序列的性质知道1212(,,,)(,,,),Pk k g A A A g μμμ−−→其中g 为连续函数. 这将成为下一章所要介绍的矩估计法的理论根据.样本k 阶中心矩 称()11nk k i i B X X n ==-∑为样本k 阶中心矩,它反映总体k 阶中心矩的信息.设总体X 的均值μ与方差2σ存在, 12,,,n X X X 是来自X 的样本, 样本均值11ni i X X n ==∑, 样本方差()22111nii S X X n ==--∑, 则总有 222()(),()E X D X E S nσμσ===,.(2) 来自正态总体的几个常用统计量及其分布(抽样分布) 0) 标准正态分布 标准正态分布的概率密度为()22,x x x ϕ-=-∞<<+∞标准正态分布的上α位点z α满足 ()1z ααΦ=-; 标准正态分布的双侧α分位点2z α满足 ()12z ααΦ=-; 标准正态分布有如下性质:1z z αα-=-.1) 2χ分布 设12,,,n X X X 是来自正态总体()0,1N 的样本,则称统计量222212nX X X χ=+++ 服从自由度为n 的2χ分布,记作()22n χχ.()2n χ分布的概率密度为()()12221, 0220, 0n y ny e y nf y y --Γ⎧>⎪=⎨⎪≤⎩; ()2n χ分布的上α分位点()2n αχ满足(){}()()222n P n f y dy ααχχχα+∞>==⎰;()2n χ分布有如下性质:①若()()22221122,n n χχχχ ,且2212,χχ相互独立,则()2221212n n χχχ++ ; ②若()22n χχ ,则()()22,2E n D n χχ==.2) t 分布 设()()20,1,X N Y n χ,且X 与Y 相互独立,则称随机变量T =服从自由度为n 的()t student 分布,记作()T t n .()t n 分布的概率密度为()()1221,n t f t t n -+⎫=+-∞<<+∞⎪⎭()t n 分布的上α分位点()a t n 满足(){}()()t n P t t n f t dt ααα+∞>==⎰;()t n 分布有如下性质:①密度曲线关于0t =对称; ②()()1t n t n αα-=-;③当45n >时,()t n z αα≈,z α是()0,1N 的上α分位点; ④()()()()()()0, 122n E D t t n n n n n ==>>-.3) F 分布 设()()2212,U n V n χχ,并且,U V 相互独立,则称随机变量12//U n F V n =服从自由度为12,n n 的F 分布,记作()12,F F n n .()12,F n n 分布的概率密度为()()()1122212111222211, 0220, 0n n nn n n n y y f y n n n y n y +-⎧Γ+⎛⎫⎛⎫⎪⎪+> ⎪ ⎪=⎨ΓΓ⎝⎭⎝⎭⎪≤⎪⎩;()12,F n n 分布的上α分位点满足()(){}()()121212,2,,F n n P F n n F n n f y dy ααα+∞>==⎰;()12,F n n 分布有如下性质:①()()112211,,F n n F n n αα-=;②()()()21222,1,1=>-n E F n n n n ()()()()()()2212122212222,424+-=>--n n n D F n n n n n n .例1 设X 与Y 均服从()0,1N ,则正确的是(A) X Y +服从正态分布; (B) 222X Y χ+ ;(C) 22,X Y 都服从2χ分布; (D) 22XY 服从F 分布.例2 设1215,,,X X X 是来自正态总体()20,2N 的样本,则统计量()22212102221112152X X X Y X X X +++=+++ 服从 分布,参数为 .例3 设129,,,X X X 和129,,,Y Y Y 都是来自正态总体()20,3N 的样本,且这两个样本相互独立,则统计量U =服从 分布,参数为 .4)设12,,,n X X X 是来自正态总体()2, X N μσ容量为n 的样本,其样本均值为11ni i X X n ==∑,样本方差为()22111nii S X X n ==--∑,则有 ①21,X N n μσ⎛⎫⎪⎝⎭.这说明n 越大,X 越接近总体均值;()0,1XN.②X与2S相互独立.③()()22211n Snχσ--.()1Xt n-.5) 设112,,,nX X X与212,,,nY Y Y是分别来自正态总体211(,)X Nμσ和222(,)Y Nμσ的样本, 且这两个样本相互独立.设12111,n ni ii iX X Y Yn====∑∑分别是这两个样本的均值, ()()122222121111,1n ni ii iS X X S Y Yn===-=--∑∑分别是这两个样本的样本方差, 则有①2211122222(1,1)--SF n nSσσ.②当22212σσσ==时,12(2),X Yt n n+-其中222112212(1)(1),2-+-==+-w wn S n SS Sn n统计量是进行统计推断的工具. 样本均值与样本方差是两个最重要的统计量.三、经验分布函数经验分布函数是根据样本所做出的与总体分布函数()F x相对应的统计量.经验分布函数的作法如下: 设12,,,nX X X是总体F的一个样本, 用(),S x x-∞<<∞表示12,,,nX X X中不大于x的随机变量的个数. 定义经验分布函数()nF x为1()(),.nF x S x xn=-∞<<∞给一组样本值, 很容易得到经验分布函数()nF x的观察值(()nF x的观察值仍以()nF x表示). 例如:(1) 设总体F 具有一组样本值1,2,3, 则经验分布函数3()F x 的观察值为30,,12,(),23,1, 3.<⎧⎪⎪≤<⎪=⎨⎪≤<⎪⎪≥⎩若1,1若32若3若x x F x x x (2) 设总体F 具有一组样本值1,1,2, 则经验分布函数3()F x 的观察值为30,(),12,1, 2.<⎧⎪⎪=≤<⎨⎪⎪≥⎩若1,2若3若x F x x x(3) 一般地, 设12,,,n x x x 是总体F 的容量为n 的一组样本值, 先将12,,,n x x x 按自小到大的次序排列并重新编号, 设为(1)(2)()n x x x ≤≤≤ , 则经验分布函数()n F x 的观察值为(1)()(1)()0,(),,1,.+<⎧⎪⎪=≤<⎨⎪⎪≥⎩若,若若n k k n x x kF x x x x nx x格里汶科(Glivenko )在1933年证明了经验分布函数()n F x 的一个结果: 对于任一实数x , 当n →∞时,()n F x 以概率1一致收敛于总体分布函数()F x , 即{}lim sup ()()0 1.n n x P F x F x →∞-∞<<∞-==定理表明, 对于任一实数x , 当n 充分大时, 经验分布函数的观察值()n F x 与总体分布函数()F x 只有微小的差别, 从而在实际中可将观察值()n F x 当作()F x 来使用. 习题 P174 2. 4.-8.。

CH6方差分析(1)_讲义版_2014

CH6方差分析(1)_讲义版_2014
P(reject in at least one test) = 1-0.857 = 0.143 0.143即是犯第一类假设检验错误的概率,远大于0.05
3
内容
• 方差分析基本概念 • 单因素方差分析 • 单因素方差分析—均数的多重比较 • 双因素方差分析(1): 无交互作用方差分析 • 附录:均数的多重比较—几种常用方法
P(reject in at least one test) = 1-0.857 = 0.143 0.143即是犯第一类假设检验错误的概率,远大于0.05
25
单因素方差分析--均数的多重比较
Bofferoni 校正法 (Bofferoni Correction)
在均值的多重检验中,设犯Ⅰ类错误的总概率为
生物统计学
第6讲 实验设计与方差分析(1)
2014.10
1
引言
对于 H0: μ1= μ2 vs. HA: μ1≠μ2 可采用两独立样本 t 检验
如果需要检验多个总体均值是否存在显著性差异, 需采用
什么方法?
若考虑仍采用两独立样本t 检验
在只有3个总体的情况下,将样本两两配对,需做3次独立 样本t 检验
方差分析应用条件 1. 各样本是相互独立的随机样本(变异的可加性) ; 2. 各样本来自正态总体; 3. 各处理组总体方差相等,即方差齐性或齐同 (homogeneity of variance)。 上述条件与两均数比较的 t 检验的应用条件相类似。 当组数为2时,方差分析与两均数比较的t检验是等价 的
MSB

SSB B
νW = N – a νB = a – 1
MS: 均方差 (Mean Square, MS)
19
单因素方差分析

PMP-知识点整理 CH6 项目时间管理

PMP-知识点整理 CH6 项目时间管理
什么是假设情景分析?
假设情景分析是对各种情景进行评估,预测它们对项目目标的影响(积极或消极 的)。假设情景分析就是对“如果情景 X 出现,情况会怎样?”这样的问题进行 分析,即基于已有的进度计划,考虑各种各样的情景。
6.7 什么是进度压缩?
进度压缩技术是指在不缩减项目范围的前提下,缩短或加快进度工期,以满足 进度制约因素、强制日期或其他进度目标。不能改变范围。
绩效审查是指根据进度基准,测量、对比和分析进度绩效,如实际开始和完成日期、已完成百分比,
以及当前工作的剩余持续时间。

横道图也称为“甘特图”,是展示进度信息的一种图表
横道图
方式。在横道图中,纵向列示活动,横向列示日期,用 横条表示活动自开始日期至完成日期的持续时间。
里程碑图
与横道图类似,但仅标示出主要可交付成果和关键外部 接口的计划开始或完成日期。
6.2 紧前关系绘图法包括哪 4 种关系?它是如何绘图的?
四种关系:完成到开始FS、完成到完成FF、开始到开始SS、开始到完成SF。
活动之间的依赖关系有哪 4 种?
四种依赖关系:强制性外部依赖关系、强制性内部依赖关系、选择性外部依赖关系或选择性内部依赖关系。
6.3 什么是提前量?
提前量是相对于紧前活动,紧后活动可以提前的时间量。例如,在新办公大楼建设项目中,绿化 施工可以在尾工清单编制完成前 2 周开始,这就是带 2 周提前量的完成到开始的关系。
什么是三点估算?
三点估算:一种估算技术。当单个活动的成本或持续时间估算不易确定时,取其乐观估算、悲观估算 和最可能估算的平均值或加权平均值。基于持续时间在三种估算值区间内的假定分布情况,可计算期 望持续时间 tE。
什么是类比估算?
类比估算是一种使用相似活动或项目的历史数据,来估算当前活动或项目的持续时间或成本的技术。

ch6流域水文模型解析

ch6流域水文模型解析

流域产流
河道汇流
地下水汇流
流域汇流
第三页,共八十三页。
§1 流域(liúyù)水文模型的概念
早期的水文分析计算大多采用一些经验相关 的方法(fāngfǎ),如:相应水位(或流量)法、降雨 径流相关图法、单位线法等。20世纪50年代后期 先后有流量综合与水库调节、斯坦福等模型出现。 这些模型从定量上分析了流域出口断面流量过程 形成的全部过程。60年代先后涌现出了大量的多 参数、复杂的概念性降雨径流模型,比较著名的 有萨克拉门托、水箱等模型。河海大学1973年研 制的新安江模型是一个分散参数的概念性降雨径 流模型,在我国湿润与半湿润地区广为应用,并 取得好的效果。
E=EU+EL+ED EP=KC × EM
第十三页,共八十三页。
§2 新安江模型(móxíng)-蒸散发计算
上层 (Upper layer) EU, WU,WUM
下层
EL, WL,WLM
(Lower layer)
深层 (Deep layer) ED, WD,WDM
上土层(tǔ cénɡ)蒸发量: EU=EP 下土层(tǔ cénɡ)蒸发量: EL=EP.WL/WLM
5mm
缺林地
UM=
20mm
多林地
LM=60~90mm,根据实验,在此范围内蒸散发大约与土 湿成正比。
DM=WM-UM-LM
WM可用实测资料来分析。选择前期特别干旱,本次降雨足
够(zúgòu)大,大得可使全流域蓄满的洪水进行分析。根据水量平 衡:
第三十页,共八十三页。
2.2 模型(móxíng)参数的物理意义及初值的
法,即:
合解上述两式得: Q2=C0I2+C1I1+C2O1

Ch6 耐热钢和铁基高温合金.ppt

Ch6 耐热钢和铁基高温合金.ppt

Ch6 耐热钢和铁基高温合金.ppt1、Chapter6耐热钢和铁基高温合金主要内容第一节珠光体型热强钢第二节马氏体型热强钢第三节铁素体型、奥氏体型及沉淀硬化型耐热钢第四节铁基高温合金Chapter6耐热钢和铁基高温合金基本要求:了解耐热金属材料的工作条件及性能特点;耐热钢及铁基高温合金的合金化及其热处理;常用耐热钢和铁基高温合金。

重点和难点:耐热钢及铁基高温合金的性能特点及合金化原理。

Chapter6耐热钢和铁基高温合金背景:耐热钢和高温合金是指在高温下工作并具有肯定强度和抗氧化、耐腐蚀能力的金属材料。

6.0引言6.0引言Chapter6耐热钢和铁基高温合金对蒸汽轮机和锅炉2、来讲:在本世纪30~40年月蒸汽温度不过400~450℃,蒸汽压力不过近100大气压;如今蒸汽温度已达650℃,蒸汽压力也高达340大气压以上,因此所使用的金属材料也从低碳钢进展到冗杂的各类合金钢。

6.0引言Chapter6耐热钢和铁基高温合金耐热钢的分类按合金元素多少可分为两类:一类是在低合金结构钢基础上进展起来的低合金珠光体型热强钢;另一类是在不锈钢基础上进展起来的高合金专用耐热钢。

专用耐热钢按对使用性能的要求可以分为:热强钢和热稳定钢。

Chapter6耐热钢和铁基高温合金6.0引言热强钢是指在高温下有肯定抗氧化能力并具有足够强度而3、不产生大量变形或断裂的钢种,如高温螺栓、涡轮叶片等。

它们工作时要求承受较大的载荷,失效的主要缘由是高温下强度不够。

热强钢广泛用于制造锅炉管道、紧固件、汽轮机转子、叶片、排气阀等。

Chapter6耐热钢和铁基高温合金6.0引言热稳定钢是指在高温下抗氧化或抗高温介质腐蚀而不破坏的钢种,如炉底、炉栅等。

它们工作时的主要失效形式是高温氧化,而单位面积上承受的载荷并不大,故又称抗氧化钢。

热稳定钢广泛用于工业炉中的构件、炉底板、马弗罐、料架、辐射管等。

Chapter6耐热钢和铁基高温合金6.0引言按组织的晶体结构特征可以分为:奥氏体型铁素体型马氏体4、型沉淀硬化型Chapter6耐热钢和铁基高温合金6.0引言奥氏体型、铁素体型钢大都用于要求抗氧化性较高的场合;马氏体型和沉淀硬化型钢则多用于要求高温强度较高的场合。

Ch6.2 抽样分布

Ch6.2 抽样分布

的值, 当n > 45时,对于常用的α的值,可用正态近似 tα(n) ≈ zα
3. F分布 定义 设 U ~ χ 2 ( n1 ), V ~ χ 2 ( n2 ), 且U , V 独立, 则称
U / V / n2 布, 记为 F ~ F ( n1 , n2 ).
Lxn是一个样本的观察值,则g( x1, x2 ,Lxn )也是统 计量g(X1, X2 ,LXn )的观察值.
几个常见统计量 样本平均值 样本方差
它反映了总体 方差的信息 它反映了 1 总体均值 X = ∑Xi 的信息 n i=1 n 1 2 2 S = ∑( Xi − X) n −1 i=1
n
定义 经验分布函数为 1 Fn( x) = s( x) − ∞ < x < ∞ n 11 , 例 设总体F具有一个样本值 ,2 则经验分布函数 ,
F3( x)的观察值为 0, 若x < 1 2 F3( x) = , 若 ≤ x < 2 1 3 若x ≥ 2 1,
一般, n 一般,设x1, x2 ,L, xn是总体的一个容量为 的样本 如下: 值.将它们按大小次序排列 如下:x(1) ≤ x(2) ≤ L≤ x(n) 则经验分布函数Fn( x)的观察值为 0, k Fn( x) = , n 1, 若x < x(1) 若x(k) ≤ x < x(k+1) , (k = 1,2,L, n − 1) 若x ≥ x(n)
F分布的概率密度曲线如 图
F分 的 质 布 性
1. 若F ~ F ( n1 , n2 ),
1 则 ~ F ( n2 , n1 ). F
2.F分布的数学期望为: 2.F分布的数学期望为: 分布的数学期望为

心理与教育统计学课件(张厚粲版)ch6概率分布

心理与教育统计学课件(张厚粲版)ch6概率分布

记做Ω)的概率等于1,即
P()。 1
⑶不可能事件(是指在一定条件下必然不发生的 事件,记做Φ)的概率等于0,即 P() 0
二、概率的基本性质与定理
㈡概率的加法定理:
定理:两个互不相容事件A、B之和的概率,等于两个事件
概率之和。即: P( A B) P( A) P(B)
所谓互不相容事件是指在一定试验中,若事件A发生,则
Y
N
e
ห้องสมุดไป่ตู้
X 2 2
2
X
2
其中μ和σ为待定参数(即理论平均数和理论标准差),且σ>0, 则称随机变量X服从正态分布。
一、正态分布和正态曲线的特征
㈠正态分布:正态分布的图形称做正态曲线,它的形状为钟
形线,由正态分布的函数表达式来刻Y划 。N
e
X 2 2
2
2
由于每个正态分布的μ,σ和N的不同,正态曲线也就不同。
A包括m个基本事件, 则事件A的概率为:P( A) m n
先验概率是在特定条件下计算出来的,是随机事件 的真实概率,不是由频率估计出来的。当试验重复次 数较多时,后验概率也就接近先验概率。
二、概率的基本性质与定理
㈠基本性质
⑴任一随机事件A的概率取值范围都在0与1之间, 即 0 P(A) 1
⑵必然事件(是指在一定条件下必然发生的事件,
准差为1的正态分布函数,这种平均数为0,标准差为1的
正态分布又叫标准正态分布。其分布函数为:
y
1
z2
e2
2
㈡正态分布的特征:
⑴正态曲线在X=μ点取得最大值,即
Y 1
2
标准正态分布曲线在Z=0点取得最大值,即
Y
1
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在概率论中,我们研究的随机变量,它的 分布,都是假设已知的,在这一前提下去研 究它的性质、特点和规律性,例如求出它的 数字特征,讨论随机变量函数的分布等。
1
某工厂生产了一大批产品,从中随机抽检了n 件产品, 发现有m件次品,如何估计整批产品的次品率 p?
要求某种元件的平均使用寿命不得低于1000小时,现 从这批元件中随机抽取25件,测得其寿命的平均值为 950小时. 试问该批元件是否达到了要求?
7总体个体来自特征一批产品 一批灯泡
一年的日平均气温
每件产品 每个灯泡
每天日平均气温
等级 寿命
度数
数轴上某一线段
线段中每一点
坐标
一批彩票
每张彩票
号码
人们感兴趣的是总体的某一个或几个数量指标的分布 情况。每个个体所取的值不同,但它按一定规律分布。
8
可见, 考X 察的概某率班分级布学反生映的了总英体语中课各程个学值习的分成布绩情X况,. 因很自为然每地,
从国产轿车中抽5辆 进行耗油量试验
样本容量为 5
抽到哪 5 辆是随机的!
样本是随机变量
容量为 n 的样本可以看作n 维随机变量(X1, X2, …, Xn). 但是,一旦取定一组样本,得到的是 n 个具体的数 x1, x2, …, xn, 称为样本(X1, X2, …, Xn)的一组观测值,简称样本值 .
总体与个体 样本与简单随机样本
统计量与统计值
6
研究对象的全体称为总体 总体中的一个具体对象称为个体 考察某班级学生的英语课程学习成绩,则全体学生构 成了一个总体,每个同学就是一个个体. 考察某工厂生产的某批灯泡的寿命,则该厂生产的该 批灯泡构成了一个总体,每个灯泡就是一个个体.
总不体是:研研这究究样它对定们象义的的数总量体指和标个体X而是~是F具研(x体)究的数对量象指,标 不符个合体数:学r研.v 究X的这的值些特数点量---指抽标象是服从某种分布的r.v
(分布检验问题) 5、若这批材料是由两种不同工艺生产的,那么不同
的工艺对合金强度有否影响?若有影响,那一种工艺 生产的强度较好? (方差分析问题)
4
6、若这批合金 由几种原料用不同的比例合成,那么
如何表达这批合金的强度与原料比例之间的关系?
(回归分析问题)
5
一 总体与随机样本
考察某工厂生产的灯泡寿命
考察某型号手机的质量 考察吸烟和患肺癌的关系
10
如何收集数据 从研究对象中任取 n个“个体”,观察它们的数量指标
X1 , X2 ,, Xn
这一过程称为抽样 , X1 , X2 ,, Xn称为容量为 n的样本.
在相同条件下对总体 X进行 n次重复、独立观察 要求各次取样的结果互不影响 每次取出的样品与总体有相同的分布
样本观察值为 29.1, 30.2, 29.3, 29.1, 30.3, 29.5
12
考察某工厂生产的零件是否合格,从该厂生产的一批 产品中随机抽检了100个,若合格则记为0,若不合格则记 为1,100个产品的检查结果为 x1, x2,, x100.
总体 X ~ b(1, p) (零件合格或不合格)
我们主要讨论有关推断统计学中几个最基本的问题。
3
例如 某厂生产一型号的合金材料,用随机的方法选取 100个样品进行强度测试,于是面临下列几个问题: 1、估计这批合金材料的强度均值是多少?
(参数的点估计问题) 2、强度均值在什么范围内? (参数的区间估计问题) 3、若规定强度均值不小于某个定值为合格,那么这 批材料是否合格? (参数的假设检验问题) 4、这批合金的强度是否服从正态分布?
灯也就泡是的说寿,命总都体可在以该用批一灯个泡随平机均变量寿X命或u的其分附布近来波描动述,. 所以总
体可视为 X ~ N( , 2 ).
考察某工厂生产的零件是否合格,记
0, 零件合格
X
1,
零件不合格
则总体可视为 X ~ b(1, p), p为零件的次品率.
9
在实际问题中,要考察整个总体往往是不可能的, 因为它需要耗费太多的资源和太多的时间. 有些破 坏性的试验更是不允许对整个总体进行考察.
观察前: X1 , X2 ,, Xn是相互独立,与总体同分布的r.v 观察后: 样本值 x1, x2,, xn为 n 个具体的观察数据
11
某厂生产了一大批灯泡,现从中随机抽取5只进行检测, 测得其寿命(小时)分别为
980, 960, 1030, 1300, 850
总体为灯泡的寿命
X ~ N(, 2)
我个们学就生用的随成机绩变量都X在来全表班示平所均考察成的绩总u体的. 附近波动,所以总体
可视X为的分X布~函N数(和, 数2 字). 特征就是总体的分布函数和数字特征.
今后不必区分总体和其相应的随机变量. 并常用随机变量的记
号或用其考分布察函某数工表厂示生总产体.的比某如批说灯总泡体的X 寿或命总X体,F(x因). 为每个
总体分布律为 P{X 1} p, P{X 0} 1 p
其中 p为零件的次品率。 样本 X1, X2,, X100 (独立同分布 (0 分1)布 )r.v 样本观察值 x1, x2 ,, x100.
13
2 样本
为推断总体分布及各种特征, 按一定规则从总体中抽取若干个体 进行观察试验以获得有关总体的信息. 这一抽取过程称为抽样, 所抽取的部分个体称为样本. 样本中所包含的个体数目称为样本容量.
现在转入课程的第二部分
这些问题都是统
数理统计 计推断问题
2
从总体上来说,数理统计可以分为两大类: 一类是如何科学地安排试验,以获取有效的随机数据。 此部分内容称为描述统计学如:试验设计、抽样方法。 另一类是研究如何分析所获得的随机数据,对所研究 的问题进行科学的、合理的估计和推断,尽可能地为 采取一定的决策提供依据,作出精确而可靠的结论. 这部分的内容称为推断统计学,如:参数估计、假设 检验等。
样本容量为5,样本为 X1, X 2 , X 3, X 4 , X5
样本观察值为 980, 960, 1030, 1300, 850
对长度为 的工件进行了6次测量,测量值为
29.1, 30.2, 29.3, 29.1, 30.3, 29.5
总体为工件长度
X ~ NN((30, 2 )
样本容量为6,样本为 X1, X2, X3, X4, X5, X6
相关文档
最新文档