概率论与数理统计 --- 第六章{样本及抽样分布} 第一节:总体与样本
概率论与数理统计 第六章 样本及抽样分布

x0 o.w.
n 1
n5
n 15
15
(2)t-分布(学生分布)
设 X ~ N ( 0 ,1), Y ~ 2 ( n ) 且X、Y为独立随 机变量,则称随机变量
t
X Y /n
X
1 n 2 ( X 12 ...... X n )
为自由度为n的t-分布。记为: t ~ t ( n ) 。
3
§1 随机样本
总体: 研究对象在某项数量指标的全体. 记为X。通常称总体X。 个体: 总体X中的每一个元素(实数)xi。 根据总体所含的个体数分为: 有限总体和无限总体。
4
总体与取样
X1
X
X2 X3 Xn
取样模型
X
X2 X1
X3
X4
X5
河流污染取样
5
总体、样本、统计量
总体 样本 统计量
X1 X2
2 ( n ) 分布:
具有可加性
2 X X 12 ...... X n , X i ~ N (0,1)
3. 4.
t ( n ) 分布:
X ~ N (0,1), Y ~ 2 ( n )
t(n) X Y /n
F ( n1 , n 2 ) 分布: U ~ 2 ( n1 ), V ~ 2 ( n 2 )
F (n1 , n2 )
19
分位点及性质:
定义: Pr[ X z ]
z
(1)标准正态分布分位点
(x)
( x)dx 1 ( x)dx
z
z1
( x)
Pr[ X z ]
统计学 第六章 样本及抽样分布

2.由分布的可加性易得 2分布的可加性:
若12
~
2
(n1
),
2 2
~
2 (n2
),并且12
,
22独立,
有
2 1
2 2
~
2
(n1
n2 ).
3. 若 2 ~ 2 (n), 则有E( 2 ) n, D( 2 ) 2n.
( Xi ~ N(0, 1), E(X i )2 D(Xi ) 1,
D(Xi2 )
2
,y
0,
0, 其它.
3. 性质 :
若F
~
F(n 1 , n2 ), 则
1 F
~
F(n
2 , n1 ).
4. F - 分布的上分位点:
对于给定的, 0 1, 称满足条件:
P{F F (n1 , n2 )}
(y)dy
F (n1 ,n2 )
的点F (n1 , n2 )为F 分布的上分位点.
(
n
)
的
点
2
(n)为
2
(n)分
布
的
上分
位
点.
其值由附表4给出.
2 ( n )
1 2 (Z
2n-1)2 .
2
(
nf()y)1
2
(Z
2n-1)2 .
0
2
(n)
y
(二) t-分布:
1. 定义: 设X~N(0, 1), Y~ 2 (n), 并且X, Y 相互独立,
则称 t X Y /n
服从自由度为n 的 t 分布, 记作t~t(n).
E(X
4 i
)-(E(X
2 i
))
概率论与数理统计-ch6-样本与抽样分布

概率论与数理统计-ch6-样本与抽样分布概率论中,所研究的随机变量是假定其分布是已知的,在此前提下研究它的性质、数字特征等。
在数理统计中,所研究的随机变量的分布是未知或不完全知道的,通过重复独⽴的试验得到许多观察值去推断随机变量的种种可能分布。
1、随机样本总体:试验的全部可能的观察值。
=样本空间个体:每⼀个可能观察值。
=样本点容量:总体中所包含的个体的个数。
有限总体⽆限总体⼀个总体对应⼀个随机变量X,对总体的研究就是对随机变量X的研究。
所以将不区分总体与相应的随机变量,统称为总体X。
样本:在数理统计中,⼈们都是通过从总体中抽取⼀部分个体,根据获得的数据来对总体分布得出推断的,被抽出的部分个体叫做总体的⼀个样本。
对总体进⾏⼀次观察,就会得到⼀个随机变量X1,对总体进⾏n次重复的、独⽴的观察,就会得到n个随机变量X1,X2,...,Xn,这n个随机变量X1,X2,...,Xn是对总体随机变量X观察的结果。
则X1,X2,...,Xn是相关独⽴且与X具有相同分布,称为来⾃总体X的⼀个简单随机样本。
n称为样本的容量。
进⾏n次观察得到的⼀组实数x1,x2,...,xn是随机变量X1,X2,...,Xn的观察值,称为样本值,也称为X的n个独⽴的观测值。
2、抽样分布样本是统计推断的依据,但往往不直接使⽤样本本⾝,⽽是由样本构造的函数。
统计量:设X1,X2,...,Xn是来⾃总体X的⼀个样本,g(X1,X2,...,Xn)是其函数,且g中不含任何未知参数,则称g(X1,X2,...,Xn)是⼀统计量。
统计量也是⼀个随机变量。
g(x1,x2,...,xn)是统计量的观测值。
常⽤的统计量:经验分布函数:经验分布函数(empirical distribution function)是根据样本得到的分布函数.如设,是总体的样本值,将它们按⼤⼩顺序排列为,则称分布函数为经验分布函数是与总体分布函数相对应的统计量。
总体的分布函数是F(x),统计量的经验分布函数是F n(x),⽤F n(x)去推断F(x),当n⾜够⼤时,F n(x)以概率1收敛于F(x)。
《概率与数理统计》第06章 - 样本及抽样分布

(3)g( x1, x2 ,L xn )是统计量g(X1, X2 ,L Xn )的观察值
几个常见统计量
样本平均值
X
1 n
n i 1
Xi
它反映了 总体均值 的信息
样本方差
S 2
1 n1
n i 1
(Xi
X )2
它反映了总体 方差的信息
n
1
1
n
X
2 i
i 1
nX
2
样本标准差
S
1 n
n
1
(
i 1
X
i
是来自总体的一个样本,则
(1) E( X ) E( X ) ,
(2) D( X ) D( X ) 2 n ,
n
(3) E(S 2 ) D( X ) 2
矩估计法的 理论根据
若总体X的k阶矩E( X k ) k存在,则
(4) Ak
1 n
n i 1
Xik
p k
k 1, 2,L .
(3)证明:E(S2 )
定义 设X1 , X2 ,L , Xn是来自总体X的一个样本, g( X1 , X 2 ,L , X n )是X1 , X 2 ,L , X n的函数,若g 中不含未知参数,则g( X1 , X 2 ,L , X n )称是一 个统计量.
请注意 :
(1)X1, X2 ,L
X
是样本,也是随机变量
n
(2)统计量是随机变量的函数,故也是随机变量
1
e
(
xi 2
2
)2
2
n
( xi )2
1
e i1 2 2
n
2
第二节
抽样分布
概率论 第六章 样本及抽样分布

一般,设 x1,x2, …,xn 是总体F的一个容 量为n的样本值,先将x1,x2, …,xn 按自小到 大的次序排列,并重新编号,设为
x(1) ≤x(2) ≤…≤x(n) 则经验分布函数Fn(x)的观察值为
0,
若x x(1) ,
性质:
(1) limf (t)
1
e ; t2 2
n
2
(2)当n 45时 取t (n) Z .
(三)设X~2(n1), Y~ 2(n2), 且X 与Y相互独立,则随机变量
F X/ n1 Y / n2
则称F服从第一自由度为n1,第二自由 度为n2的F分布,记作
F~F(n1 ,n2)
F分布的分布密度为
2 2
E( X 2 ) D( X ) (E( X ))2
2 2
n
E(S 2 )
E[ 1 n 1
n i 1
(Xi
X
)2 ]
E[
1
n
(
n 1 i1
X
2 i
2
n X )]
1
n
E(
n 1 i1
X
2 i
nX
2
)
1 [E( n 1
n i 1
X
2 i
)
E(n X
2
)]
1[ n 1
n i 1
考察某厂生产的电容器
的使用寿命。在这个试验 中什么是总体,什么是个 体。
解 个体是每一个电容器 的使用寿命;总体X是各个 电容器的使用寿命的集合。
2. 样本
为推断总体分布及各种特征,按一定规 则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样 本中所包含的个体数称为样本容量.
概率统计第六章 样本及抽样分布

第六章数理统计的基本概念数理统计与概率论是两个有密切联系的姊妹学科(基础 应用).概率论研究的是在知道随机变量分布的情况下求事件的概率.但对具体问题,如何判断某随机变量服从某种分布呢?诚然,我们可以根据经验判断出随机变量的分布,但参数又是什么呢?这些问题概率论回答不了,由数理统计来回答.数理统计是通过数据来回答这些问题的.这些数据带有随机性(不同于会计中的数据),根据数据得出的结论难免会出错,我们希望所犯错误越少越好,而这就需要使用概率论的语言来表述.数据不是从天上掉下来的,要获得数据,首先要进行观察或实验,收集整理数据,然后进行推断,这就是数理统计要研究的内容.即数理统计学是收集、分析数据,并根据数据进行推断的科学和艺术(强调它的艺术性是为着重说明统计方法需要灵活使用,很依赖于人的判断乃至灵感.强调这一点很有好处,它提醒人们不要以教条式的态度来看待数理统计方法,以为只要记住一些公式和方法,碰到什么问题套上去就行).数理统计课程着重于统计推断。
所谓统计推断,就是由样本来推断总体,或者由部分推断总体.统计估计和假设检验是统计推断的基础,以此为基础发展了许多实用的统计方法:回归分析、方差分析、时间序列分析及其他多元统计分析方法等.第一节样本与统计量一总体与个体1.总体(Population)和个体(Individual)1)【定义】把研究“对象”的全体称为总体.用X、Y、Z等表示总体.组成总体的每个元素称为个体.例如:全国英语四级考试刚刚结束,阅卷评分尚需一段时间,有关部门急于了解这次考试成绩的分布状况(应试的400万考生);另外,想了解全国大学生的身体状况;想了解用新工艺生产的一批灯泡寿命等等。
这里的“应试的考生”,“全国的大学生”“这批灯泡”等,就构成了各自的总体。
2)总体X的分布函数称为总体分布函数。
当X为离散型随机变量时,称X的概率函数为总体概率函数。
当X为连续型随机变量时,称X的密度函数为总体密度函数。
《概率论与数理统计》课程教学大纲

《概率论与数理统计》课程教学大纲英文名称:Probability and statistics课程代码:221101008课程类别:专业基础课课程性质:必修开课学期:第三学期总学时: 54学时总学分:3考核方式:闭卷先修课程:高等数学适用专业:经济学专业一、课程简介概率论与数理统计是经济学专业的一门专业基础课。
概率论与数理统计是研究不确定性现象的数量规律性的一门学科,是对随机现象进行定量分析的重要工具,它在现代科学技术中占有很重要的地位,是研究自然现象、处理现代工程技术、解决科研和生产实际问题的一种有力的数学工具,已被广泛应用于每一学科领域、工农业生产和经济管理部门中。
开设本课程的目的在于,通过本课程的学习,使学生初步掌握概率论与数理统计等方面的基础知识,了解它的基本理论与基本方法,培养学生的抽象思维能力、逻辑推理能力、数学建模与实践能力,注意培养学生的自学能力,注意理论联系实际,不断提高学生的综合素质以及运动所学知识解决实际问题的能力,同时使学生了解概率论与数理统计在经济方面的应用,具备概率思想分析实际随机问题的能力,为专业课程的学习打下基础。
学生在进入本课程学习之前,应学过高等数学课程,该课程的学习为本课程提供了必须的数学基础知识。
本课程学习结束后,学生可具备进一步学习相关课程的理论基础。
本课程总54学时,其中理论课47学时,习题课7学时,考核方式为闭卷考试,根据平时考勤成绩、习题作业成绩、阶段性单元检测成绩及闭卷期末考试成绩综合给予最终成绩评定。
二、课程目标及其对毕业要求的支撑目标1人文素养目标:教育学生认真学习马克思列宁主义、毛泽东思想、邓小平理论、“三个代表”、科学发展观和新时代中国特色社会主义的重要思想;忠诚党的教育事业和体育事业,培养学生互教互学、团结友爱、共同提高的集体主义精神;培养学生有严格组织纪律性,吃苦耐劳和勇敢顽强的意志品质。
目标2理论知识培养目标:使学生掌握概率论与数理统计的基本理论和基础知识,初步掌握处理随机事件的基本思想和方法。
概率论与数理统计-第六章

这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi
i 1, 2,
,n
,n
于是 (
) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数理统计
代表总体的随机变量随机地、独立地进行n次试验(观测),
每次试验的结果可以看作是一个随机变量, n次试验的结果就是n个随机变量 X1, X2,…, Xn. 这些随机变量相互独立, 并且与总体服从相同的分布. 设得到的样本观测值分别是 x1, x2, …, xn, 则可以认为抽样的结果是发生了n个相互独立的事件: {X1=x1, X2=x2, …, Xn=xn}.
n i 1
数理统计
f总 ( x1 , x2 ,, xn ) f ( xi ) p i 1 (1 p)
xi
n
n
xi
i 1
n
若抽样是无放回的,则前次抽取结果会影响后面抽取结果,例如:
P ( X 2 1 X 1 1) M 1 N 1
p 1
1 N 1 N
i 1
t
i 1
n
i
ti
e !
ti
i 1
n
t1 ! t 2 ! t n !
e
n
例5: 设某批产品共有N个,其中的次品数为M, 其次品率为: p=M/N, 若 p是未知的,则可用抽样方法来估计它. 从这批产品中任取一个产品,用随机变量 X 来描述它是否是次品:
1, X 0, 所取的产品是次品 所取的产品不是次品
设总体X的分布为F(x),则简单随机样本的联合分布为:
F ( x1 , x2 ,, xn ) P ( X 1 x1 , X 2 x2 ,, X n xn )
P ( X 1 x 1 ) P ( X 2 x2 ) P ( X n xn )
F ( x1 )F ( x2 ) F ( xn ) F ( xi )
简单随机样本是应用中最常见的情形, 今后,若不特别说明,就指简单随机样本.
2. 简单随机样本的联合分布函数
数理统计
简单随机样本 X1, X2,…, Xn可以看成是 n 个独立同分布(iid ) (independent, identically 的随机变量, 其共同分布即为总体分布. distributed)
P( X
i 1
n
xi )
(2) 当总体X是连续型时, n X ~ f (x), 则样本的联合概率密度为:
f ( x1 , x2 , , xn ) f ( xi )
i 1
数理统计
例3: 设 X ~ N ( , 2 ), (X1,X2,…,Xn)为X的一个样本, 求 (X1,X2,…,Xn)的密度。 解: (X1,X2,…,Xn) 为X的一个样本,故:
例2: 检验一批灯泡的寿命,从中选择100只,则: 总体: 这批灯泡(有限总体)
个体: 这批灯泡中的每一只 样本: 抽取的100只灯泡 样本容量: 100 样本值: x1, x2,…, x100
数理统计
二、简单随机抽样
数理统计
1. 若从总体 X 中抽取样本 X1, X2,…, Xn,满足: 1) 随机性:总体中每一个个体都有同等机会被选入, 即样本 Xi 与总体 X 有相同的分布; 2) 独立性:样本中每一样品的取值不影响其它样品的取值, 即 X1, X2,…, Xn 相互独立; 这种随机的、独立的抽样方法称为简单随机抽样。 由简单随机抽样得到的样本称为简单随机样本。
i 1 n
(1) 当总体X是离散型时, 其分布律为: 样本的联合分布律为:
P ( X 1 x1 , X 2 x2 , , X n xn )
P ( X xi ) pi ( i 1, 2,)
P ( X 1 x1 ) P ( X 2 x2 ) P ( X n xn )
总体中所包含的个体的个数称为总体的容量. 有限总体 总体 无限总体
例1: 研究某批灯泡的寿命时, 关心的数量指标就是寿命, 那么, 此总体就可以用随机变量 X 表示, 或用其分布函数 F(x)表示.
数理统计
寿命 X 可用概率(指数)分布来刻划
总体
某批 灯泡的寿命
寿命总体是指数分布总体
常用随机变量或用其分布函数表示总体, 比如说总体 X 或总体F(x) .
p( N )
P ( X 2 1 X 1 0)
M N 1
p 1
1 N
p( N )
所以, 当样本容量 n 与总体中个体数目 N 相比很小时, 可将无放回抽样近似地看作放回抽样.
3. 总体、样本、样本值的关系
总体(理论分布) ?
数理统计
样本
样本值
统计是从手中已有的资料---样本值, 去推断总体的情况---总体分布F (x)的性质.
类似地, 在研究某地区中学生的营养状况时, 若关心的数量指标是身高和体重, 我们用 X 和 Y 分别表示身高和体重, 那么此总体就可用二维随机变量 (X, Y) 或其联合分布函数 F (x, y)来表示. 统计中, 总体这个概念的要旨是: 总体就是一个概率分布.
数理统计
3. 样本——从总体中抽取的部分个体. 样本中所包含的个体数目称为样本容量.
2
数理统计
例4: 某商场每天客流量 X 服从参数为 λ 的泊松分布, 求其样本 (X1, X2, …, Xn) 的联合分布律。
解: P ( X x )
x
e
, x 0,1, 2,
n
x!
P ( X 1 t1 , X 2 t 2 , , X n tn ) P ( X ti )
样本是联系二者的桥梁
总体分布决定了样本取值的概率规律, 也就是样本取到样本值的规律, 因而可以由样本值去推断总体.
数理统计
作业
习题6-1 1; 4
数理统计
X 服从参数为 p 的 0-1分布,可用如下表示方法:
f ( x, p) p (1 p)
x
1 x
, x 0,1
设有放回地抽取一个容量为n的样本: (X1, X2, …, Xn) 其样本值为: ( x1, x2, …, xn)
样本空间为: {( x1 , x2 ,, xn ) xi 0,1, i 1, 2,, n} (X1, X2, …, Xn) 的联合分布为:
数理统计
第六章 样本及抽样分布
第一节 总体与样本 第二节 样本分布函数 直方图 第三节 样本函数与统计量 第四节 抽样分布
数理统计
数 理 统 计 的 分 类
描述统计学
对随机现象进行观测、试验,以取得有代表性 的观测值,并对已取得的数据进行归纳整理、画 出统计图表,来反映研究对象的数据分布特征.
推断统计学
对已取得的观测值进行整理、分析,作出推断、 决策,从而找出所研究的对象的规律性.
数理统计
数理统计学是一门应用性很强的学科. 它是研究怎样以有效的方式收集、 整理和分析带有 随机性的数据, 以便对所考察的问题作出推断和预测. 客观上, 只允许我们对随机现象进行次数不多的观察试验, 我们只能获得局部观察资料. 在数理统计中, 不是对所研究的对象全体 (称为总体)进 行观察, 而是抽取其中的部分(称为样本)进行观察获得数据 (抽样), 并通过这些数据对总体进行推断.
某批 灯泡的寿命
国产轿车每公里 的耗油量
该批灯泡寿命的全 体就是总体
国产轿车每公里耗油量 的全体就是总体
一、总体和样本
数理统计
1. 总体——研究对象全体元素组成的集合. 所研究的对象的某个(或某些)数量指标的全体, 它是一个随机变量(或多维随机变量), 记为 X. 总体有三层含义: 研究对象的全体;全部数据; 分布. 2. 个体——组成总体的每一个元素. 即某个数量指标的全体中的一个, 可看作随机变量 X 的某个取值, 用 Xi 表示.
数理统计方法具有“部分推断整体”的特征 .
ቤተ መጻሕፍቲ ባይዱ
数理统计
第一节 总体与样本
总体和样本
简单随机抽样
数理统计
人们往往研究有关对象的某一项(或几项)数量指标; 为此, 对这一指标进行随机试验, 观察试验结果全部观察值, 从而考察该数量指标的分布情况. 每个具有的数量指标的全体就是总体(population). 每个数量指标就是个体.
X i ~ N ( , ) i 1, 2, , n
2
f ( x1 , x2 , , xn ) f ( xi )
i 1
n
i 1
1
n
1 2
n
e
( xi ) 2
2
2
e 2 1
n
( xi ) 2 2
i 1