浙大概率论与数理统计样本及抽样分布
概率论与数理统计 第六章 样本及抽样分布

x0 o.w.
n 1
n5
n 15
15
(2)t-分布(学生分布)
设 X ~ N ( 0 ,1), Y ~ 2 ( n ) 且X、Y为独立随 机变量,则称随机变量
t
X Y /n
X
1 n 2 ( X 12 ...... X n )
为自由度为n的t-分布。记为: t ~ t ( n ) 。
3
§1 随机样本
总体: 研究对象在某项数量指标的全体. 记为X。通常称总体X。 个体: 总体X中的每一个元素(实数)xi。 根据总体所含的个体数分为: 有限总体和无限总体。
4
总体与取样
X1
X
X2 X3 Xn
取样模型
X
X2 X1
X3
X4
X5
河流污染取样
5
总体、样本、统计量
总体 样本 统计量
X1 X2
2 ( n ) 分布:
具有可加性
2 X X 12 ...... X n , X i ~ N (0,1)
3. 4.
t ( n ) 分布:
X ~ N (0,1), Y ~ 2 ( n )
t(n) X Y /n
F ( n1 , n 2 ) 分布: U ~ 2 ( n1 ), V ~ 2 ( n 2 )
F (n1 , n2 )
19
分位点及性质:
定义: Pr[ X z ]
z
(1)标准正态分布分位点
(x)
( x)dx 1 ( x)dx
z
z1
( x)
Pr[ X z ]
概率论与数理统计及其应用_习题答案_(浙大_盛骤谢式千版本)

《概率论与数理统计》习题解答教材:《概率论与数理统计及其应用》,浙江大学盛骤、谢式千编,高等教育出版社,2004年7月第一版目录第一章随机事件及其概率1第二章随机变量及其分布9第三章随机变量的数字特征25第四章正态分布33第五章样本及抽样分布39第六章参数估计42第七章假设检验53第一章 随机事件及其概率1、解:(1){}67,5,4,3,2=S (2){} ,4,3,2=S (3){} ,,,TTH TH H S =(4){}6,5,4,3,2,1,,T T T T T T HT HH S =2、设A , B 是两个事件,已知81)(,21)(,41)(===AB P B P A P ,求)(B A P ,)(B A P ,)(AB P ,)])([(AB B A P 解:81)(,21)(,41)(===AB P B P A P ∴)()()()(AB P B P A P B A P -+= 85812141=-+= )()()(AB P B P B A P -=838121=-=87811)(1)(=-=-=AB P AB P)])([(AB B A P )]()[(AB B A P -=)()(AB P B A P -= )(B A AB ⊂218185=-=3、解:用A 表示事件“取到的三位数不包含数字1”2518900998900)(191918=⨯⨯==C C C A P4、在仅由0,1,2,3,4,5组成且每个数字至多出现一次的全体三位数字中,任取一个三位数,(1)该数是奇数的概率;(2)求该数大于330的概率。
解:用A 表示事件“取到的三位数是奇数”,用B 表示事件“取到的三位数大于330”(1) 455443)(2515141413⨯⨯⨯⨯==A C C C C A P =0.48 2) 455421452)(251514122512⨯⨯⨯⨯+⨯⨯=+=A C C C A C B P =0.485、袋中有5只白球,4只红球,3只黑球,在其中任取4只,求下列事件的概率 (1)4只中恰有2只白球,1只红球,1只黑球; (2)4只中至少有2只红球; (3)4只中没有白球解:用A 表示事件“4只中恰有2只白球,1只红球,1只黑球”(1)412131425)(C C C C A P ==495120=338(2)用B 表示事件“4只中至少有2只红球”16567)(4124418342824=++=C C C C C C B P 或4124838141)(C C C C B P +-==16567495201= (3)用C 表示事件“4只中没有白球”99749535)(41247===C C C P 6、解:用A 表示事件“某一特定的销售点得到k 张提货单”nkn k n MM C A P --=)1()( 7、解:用A 表示事件“3只球至少有1只配对”,B 表示事件“没有配对”(1)3212313)(=⨯⨯+=A P 或321231121)(=⨯⨯⨯⨯-=A P (2)31123112)(=⨯⨯⨯⨯=B P 8、(1)设1.0)(,3.0)(,5.0)(===AB P B P A P ,求(),(),(),(),P A B P B A P A B P A A B(),()P AB A B P A AB ;(2)袋中有6只白球,5只红球每次在袋中任取一只球,若取到白球,放回,并放入1只白球,若取到红球不放回也不再放回另外的球,连续取球四次,求第一、二次取到白球且第三、四次取到红球的概率。
(浙大第四版)概率论与数理统计知识点总结

例如 P(Ω/B)=1 P( B /A)=1-P(B/A)
( 13 ) 乘 法公式
乘法公式: P(AB) P(A)P(B / A) 更一般地,对事件 A1,A2,…An,若 P(A1A2…An-1)>0,则有
P( A1A2 … An) P( A1)P( A2 | A1)P( A3 | A1A2) …… P( An | A1A2 … An 1) 。
第 1 章 随机事件及其概率
(1)排列
Pmn
m! (m n)!
从 m 个人中挑出 n 个人进行排列的可能数
组合公式
Cmn
m! n!(m n)!
从 m 个人中挑出 n 个人进行组合的可能数
加法原理(两种方法均能完成此事):m+n
(2)加法 和乘法原 理
某件事由两种方法来完成,第一种方法可由 m 种方法完成,第二种 方法可由 n 种方法来完成,则这件事可由 m+n 种方法来完成。 乘法原理(两个步骤分别不能完成这件事):m×n 某件事由两个步骤来完成,第一个步骤可由 m 种方法完成,第二个
法公式
P(A-B)=P(A)-P(AB) ( 11 ) 减 当 B A 时,P(A-B)=P(A)-P(B)
法公式
当 A=Ω时,P( B )=1- P(B)
( 12 ) 条 定义 设 A、B 是两个事件,且 P(A)>0,则称 P( AB) 为事件 A 发生条 P( A)
件概率
件下,事件 B 发生的条件概率,记为 P(B / A) P( AB) 。 P( A)
其中
则称随机变量 X 服从参数为 n , p 的二项分布。记为
X ~ B(n, p) 。
概率论与数理统计统计量样本及抽样分布

(Xi
X )k
它反映了总体k 阶矩的信息
它反映了总体k 阶 中心矩的信息
请注意 : 若总体X的k阶矩E( X k ) k存在,则当n 时,
Ak
1 n
n
i 1
X
i
Hale Waihona Puke kp kk 1,2, .
事实上 由X1, X2 , , Xn独立且与X同分布,
有X
k 1
,
X
k 2
,
,
X
n
k
独立且与X
k同分布,
E
(
X
k i
)
k
k 1,2, ,n 再由辛钦大数定律可得上述结论.
再由依概率收敛性质知,可将上述性质推广为
g( A1, A2 , , Ak ) p g(1,2 , ,k ) 其中g为连续函数.
我们关心的是总体中的个体的某项指标(如人的 身高、灯泡的寿命,汽车的耗油量…) .
由于每个个体的出现是随机的,所以相应的数量指 标的出现也带有随机性 . 从而可以把这种数量指标看 作一个随机变量X ,因此随机变量X的分布就是该数 量指标在总体中的分布.
总体就可以用一个随机变量及其分布来描述.
因此在理论上可以把总体与概率分布等同起来.
样本是联系二者的桥梁
总体分布决定了样本取值的概率规律,也就是 样本取到样本值的规律,因而可以由样本值去推断 总体.
小结
总体:研究对象的全体称为总体 个体:总体中每个成员称为个体
简单随机样本:
由简单随机抽样得到的样本称为简单随机样本, 它可以用与总体X独立同分布的n个相互独立的随机 变量 X1,X2,…,Xn表示, n为样本容量,
1. 代表性: X1,X2,…,Xn中每一个与所考察的总体有 相同的分布.
浙江大学概率论与数理统计第4版复习笔记详解

浙江大学概率论与数理统计第4版复习笔记详解|才聪学习网浙江大学《概率论与数理统计》(第4版)笔记和课后习题(含考研真题)详解文章来源:才聪学习网/概率论与数理统计内容简介本书是浙江大学盛骤等主编的《概率论与数理统计》(第4版)的学习辅导书,主要包括以下内容:(1)梳理知识脉络,浓缩学科精华。
本书每章的复习笔记均对该章的重难点进行了整理,并参考了国内名校名师讲授该教材的课堂笔记。
因此,本书的内容几乎浓缩了该教材的知识精华。
(2)详解课后习题,巩固重点难点。
本书参考大量相关辅导资料,对盛骤主编的《概率论与数理统计》(第4版)的课后思考题进行了详细的分析和解答,并对相关重要知识点进行了延伸和归纳。
(3)精选考研真题,培养解题思路。
本书从历年考研真题中挑选最具代表性的部分,并对之做了详尽的解析。
所选考研真题基本涵盖了每章的考点和难点,考生可以据此了解考研真题的命题风格和难易程度,并检验自己的复习效果。
目录第1章概率论的基本概念1.1 复习笔记1.2 课后习题详解1.3 考研真题详解第2章随机变量及其分布2.1 复习笔记2.2 课后习题详解2.3 考研真题详解第3章多维随机变量及其分布3.1 复习笔记3.2 课后习题详解3.3 考研真题详解第4章随机变量的数字特征4.1 复习笔记4.2 课后习题详解4.3 考研真题详解第5章大数定律及中心极限定理5.1 复习笔记5.2 课后习题详解5.3 考研真题详解第6章样本及抽样分布6.1 复习笔记6.2 课后习题详解6.3 考研真题详解第7章参数估计7.1 复习笔记7.2 课后习题详解7.3 考研真题详解第8章假设检验8.1 复习笔记8.2 课后习题详解8.3 考研真题详解第9章方差分析及回归分析9.1 复习笔记9.2 课后习题详解9.3 考研真题详解第10章bootstrap方法10.1 复习笔记10.2 课后习题详解10.3 考研真题详解第11章在数理统计中应用Excel软件11.1 复习笔记11.2 课后习题详解11.3 考研真题详解第12章随机过程及其统计描述12.1 复习笔记12.2 课后习题详解12.3 考研真题详解第13章马尔可夫链13.1 复习笔记13.2 课后习题详解13.3 考研真题详解第14章平稳随机过程14.1 复习笔记14.2 课后习题详解14.3 考研真题详解复习笔记详解第1章概率论的基本概念1.1 复习笔记在个别试验中其结果呈现出不确定性,在大量重复试验中其结果又具有统计规律性的现象,称为随机现象.一、随机试验1.定义试验包括各种各样的科学实验,甚至对某一事物的某一特征的观察也认为是一种试验.2.试验的特点(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现.在概率论中,将具有上述三个特点的试验称为随机试验.二、样本空间、随机事件1.样本空间随机试验E的所有可能结果组成的集合称为E的样本空间,记为S.样本空间的元素,即E的每个结果,称为样本点.2.随机事件一般地,称试验E的样本空间S的子集为E的随机事件,简称事件.在每次试验中,当且仅当这一子集中的一个样本点出现时,称这一事件发生.特别地,由一个样本点组成的单点集,称为基本事件.样本空间S包含所有的样本点,它是S自身的子集:(1)在每次试验中它总是发生的,S称为必然事件.(2)空集不包含任何样本点,也是样本空间的子集,它在每次试验中都不发生,称为不可能事件.3.事件间的关系与事件的运算事件间的关系与事件的运算按照集合论中集合之间的关系和集合运算来处理.设试验E的样本空间为S,而A,B,A k(k=1,2,…)是S的子集.(1)包含关系①若,则称事件B包含事件A,即事件A发生必导致事件B发生;②若且,即A=B,则称事件A与事件B相等.(2)和事件事件A∪B={x|x∈A或x∈B)称为事件A与事件B的和事件.当且仅当A,B 中至少有一个发生时,事件A B发生.称为n个事件A1,A2,…,A n的和事件;称为可列个事件A1,A2,…的和事件.(3)积事件事件A∩B={x|x∈A且x∈B)称为事件A与事件B的积事件.当且仅当A,B 同时发生时,事件A∩B发生.A∩B也记作AB.称为n个事件A1,A2,…,A n的积事件;称为可列个事件A1,A2,…的积事件.(4)差事件事件A-B={x|x∈A且x B)称为事件A与事件B的差事件.当且仅当A发生、B不发生时事件A-B发生.(5)互斥若,则称事件A与B是互不相容的,或互斥的.即事件A与事件B不能同时发生.基本事件是两两互不相容的.(6)逆事件若A∪B=S且,则称事件A与事件B互为逆事件,又称事件A与事件B互为对立事件.对每次试验而言,事件A、B中必有一个发生,且仅有一个发生.A的对立事件记为.(7)定律设A,B,C为事件,则有:①交换律:A∪B=B∪A;A∩B=B∩A;②结合律:A∪(B∪C)=(A∪B)∪C;A∩(B∩C)=(A∩B)∩C;③分配律:A∪(B∩C)=(A∪B)∩(A∪C);A∩(B∪C)=(A∩B)∪(A ∩C);④德摩根律:;.。
概率论与数理统计样本及抽样分布

概率论与数理统计样本及抽样分布第五章样本及抽样分布从本章开始, 我们将讲述数理统计的基本内容. 数理统计作为一门学科诞生于19世纪末20世纪初, 是具有广泛应用的一个数学分支, 它以概率论为基础, 根据试验或观察得到的数据, 来研究随机现象, 以便对研究对象的客观规律性作出合理的估计和判断.由于大量随机现象必然呈现出它的规律性, 故理论上只要对随机现象进行足够多次观察, 则研究对象的规律性就一定能清楚地呈现出来, 但实际上人们常常无法对所研究的对象的全体(或总体) 进行观察, 而只能抽取其中的部分(或样本) 进行观察或试验以获得有限的数据.数理统计的任务包括: 怎样有效地收集、整理有限的数据资料; 怎样对所得的数据资料进行分析、研究, 从而对研究对象的性质、特点, 作出合理的推断, 此即所谓的统计推断问题, 本课程主要讲述统计推断的基本内容.第一节数理统计的基本概念内容分布图示★ 引言★ 总体与总体分布★ 样本与样本分布★ 例1★ 例2 ★ 例3 ★ 例4★ 统计推断问题简述★ 分组数据统计表和频率直方图★ 例5 ★ 经验分布函数★ 例6 ★ 统计量★ 样本的数字特征★ 例7 ★ 例8 ★ 例9 ★ 内容小结★ 课堂练习★ 习题5-1 ★ 返回内容要点:一、总体与总体分布总体是具有一定共性的研究对象的全体, 其大小与范围随具体研究与考察的目的而确定. 例如, 考察某大学一年级新生的体重情况, 则该校一年级全体新生就构成了待研究的总体. 总体确定后, 我们称总体的每一个可观察值为个体. 如前述总体(一年级新生) 中的每一个个体即为每个新生的体重. 总体中所包含的个体的个数称为总体的容量. 容量为有限的称为有限总体, 容量为无限的称为无限总体.数理统计中所关心的并非每个个体的所有性质, 而仅仅是它的某一项或某几项数量指标. 如前述总体(一年级新生)中, 我们关心的是个体的体重, 进而也可考察该总体中每个个体的身高和数学高考成绩等数量指标.总体中的每一个个体是随机试验的一个观察值, 故它是某一随机变量X 的值,于是, 一个总体对应于一个随机变量X , 对总体的研究就相当于对一个随机变量X 的研究, X 的分布就称为总体的分布函数, 今后将不区分总体与相应的随机变量, 并引入如下定义:定义统计学中称随机变量(或向量)X 为总体, 并把随机变量(或向量)的分布称为总体分布.注(i) 有时个体的特性很难用数量指标直接描述, 但总可以将其数量化,如检验某学校全体学生的血型, 试验的结果有O 型、A 型、B 型、AB 型4种, 若分别以1,2,3,4依次记这4种血型,则试验的结果就可以用数量来表示了;(ii) 总体的分布一般来说是未知的, 有时即使知道其分布的类型(如正态分布、二项分布等),但不知这些分布中所含的参数等(如p ,,2σμ等).数理统计的任务就是根据总体中部分个体的数据资料对总体的未知分布进行统计推断.二、样本与样本分布由于作为统计研究对象的总体分布一般来说是未知的,为推断总体分布及其各种特征,一般方法是按一定规则从总体中抽取若干个体进行观察,通过观察可得到关于总体X 的一组数值),,,(21n x x x ,其中每一i x 是从总体中抽取的某一个体的数量指标i X 的观察值.上述抽取过程为抽样,所抽取的部分个体称为样本.样本中所含个体数目称为样本的容量.为对总体进行合理的统计推断,我们还需在相同的条件下进行多次重复的、独立的抽样观察,故样本是一个随机变量(或向量).容量为n 的样本可视为n 维随机向量),,,(21n X X X ,一旦具体取定一组样本,便得到样本的一次具体的观察值),,,(21n x x x ,称其为样本值.全体样本值组成的集合称为样本空间.为了使抽取的样本能很好地反映总体的信息, 必须考虑抽样方法,最常用的一种抽样方法称为简单随机抽样, 它要求抽取的样本满足下面两个条件:1. 代表性: n X X X ,,,21 与所考察的总体具有相同的分布;2. 独立性: n X X X ,,,21 是相互独立的随机变量.由简单随机抽样得到的样本称为简单随机样本, 它可用与总体独立同分布的n 个相互独立的随机变量n X X X ,,,21 表示. 显然, 简单随机样本是一种非常理想化的样本, 在实际应用中要获得严格意义下的简单随机样本并不容易.对有限总体, 若采用有放回抽样就能得到简单随机样本,但有放回抽样使用起来不方便, 故实际操作中通常采用的是无放回抽样, 当所考察的总体很大时, 无放回抽样与有放回抽样的区别很小, 此时可近似把无放回抽所得到的样本看成是一个简单随机样本. 对无限总体, 因抽取一个个体不影响它的分布, 故采用无放回抽样即可得到的一个简单随机样本.注: 今后假定所考虑的样本均为简单随机样本, 简称为样本.设总体X 的分布函数为)(x F ,则简单随机样本),,,(21n X X X 的联合分布函数为∏==ni i n x F x x x F 121)(),,,(并称其为样本分布.特别地, 若总体X 为连续型随机变量,其概率密度为)(x f ,则样本的概率密度为∏==ni i n x f x x x f 121)(),,,(分别称)(x f 与),,,(21n x x x f 为总体密度与样本密度.若总体X 为离散型随机变量,其概率分布为}{)(i i x X P x p ==, x 取遍X 所有可能取值, 则样本的概率分布为,)(},,,{),,,(12121∏======ni i n n x p x X x X x X p x x x p分别称)(i x p 与),,,(21n x x x p 为离散总体密度与离散样本密度.三、统计推断问题简述总体和样本是数理统计中的两个基本概念. 样本来自总体,自然带有总体的信息,从而可以从这些信息出发去研究总体的某些特征(分布或分布中的参数). 另一方面,由样本研究总体可以省时省力(特别是针对破坏性的抽样试验而言). 我们称通过总体X 的一个样本n X X X ,,,21 对总体X 的分布进行推断的问题为统计推断问题.总体、样本、样本值的关系:总体↙ ↖推断(个体)样本→ 样本值抽样在实际应用中, 总体的分布一般是未知的, 或虽然知道总体分布所属的类型, 但其中包含着未知参数. 统计推断就是利用样本值对总体的分布类型、未知参数进行估计和推断.为对总体进行统计推断, 还需借助样本构造一些合适的统计量, 即样本的函数, 下面将对相关统计量进行深入的讨论.四、分组数据统计表和频数直方图通过观察或试验得到的样本值,一般是杂乱无章的,需要进行整理才能从总体上呈现其统计规律性. 分组数据统计表或频率直方图是两种常用整理方法. 1. 分组数据表:若样本值较多时,可将其分成若干组,分组的区间长度一般取成相等, 称区间的长度为组距. 分组的组数应与样本容量相适应. 分组太少,则难以反映出分布的特征,若分组太多,则由于样本取值的随机性而使分布显得杂乱. 因此,分组时,确定分组数(或组距)应以突出分布的特征并冲淡样本的随机波动性为原则. 区间所含的样本值个数陈为该区间的组频数. 组频数与总的样本容量之比称为组频率.2. 频数直方图:频率直方图能直观地表示出频数的分布,其步骤如下:设n x x x ,,,21 是样本的n 个观察值.(i) 求出n x x x ,,,21 中的最小者)1(x 和最大者)(n x ;(ii) 选取常数a (略小于)1(x )和b (略大于)(n x ),并将区间],[b a 等分成m 个小区间(一般取m 使nm在101左右): mab t m i t t t i i -==?+,,,2,1),,[ , 一般情况下,小区间不包括右端点.(iii) 求出组频数i n ,组频率i i f nn ?=,以及),,2,1(,n i tfh i i =?=(iv) 在),[t t t i i ?+上以i h 为高,t ?为宽作小矩形,其面积恰为if ,所有小矩形合在一起就构成了频率直方图五、经验分布函数样本的直方图可以形象地描述总体的概率分布的大致形态,而经验分布函数则可以用来描述总体分布函数的大致形状。
概率论与数理统计-第六章

这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi
i 1, 2,
,n
,n
于是 (
) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2
《概率论与数理统计》第六章

既然总体是随机变量X,自然就有其概率分布。
我们把X的分布称为总体分布。
总体的特性是由总体分布来刻画的。因此,常 把总体和总体分布视为同义语。
第六章 样本及抽样分布 ‹#›
例2
在例1中,假定物体真实长度为(未知)。一般 说来,测量值X就是总体,取 附近值的概率要大一 些,而离 越远的值被取到的概率就越小。
k=1,2,…
第六章 样本及抽样分布 ‹#›
它反映了总体k 阶矩的信息
样本k阶中心矩
Bk
1 n
n i 1
(Xi
X )k
它反映了总体k 阶 中心矩的信息
第六章 样本及抽样分布 ‹#›
统计量的观察值
1 n
x n i1 xi;
s2
1 n 1
n i1
(xi
x )2
s
1 n 1
n i1
(xi
x
)2
第六章 样本及抽样分布 ‹#›
实际上,我们真正关心的并不一定是总体或个
体本身,而真正关心的是总体或个体的某项数量指 标。
如:某电子产品的使用寿命,某天的最高气温, 加工出来的某零件的长度等数量指标。因此,有时也
将总体理解为那些研究对象的某项数量指标的全
体。
第六章 样本及抽样分布 ‹#›
为评价某种产品质量的好坏,通常的做法是: 从全部产品中随机(任意)地抽取一些样品进行观测(检
样本X1,X2,…,Xn 既被看成数值,又被看成随机变量, 这就是所谓的样本的二重性。
随机样本
例 4 (例2续) 在前面测量物体长度的例子中,如果我们 在完全相同的条件下,独立地测量了n 次,把这 n 次测 量结果,即样本记为
X1,X2,…,Xn .
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
简单随机样本是应用中最常见的情形,今后, 当说到“X1,X2,…,Xn是取自某总体的样本”时,样本、样本值的关系
事实上我们抽样后得到的资料都是具体的、确 定的值. 如我们从某班大学生中抽取10人测量身高, 得到10个数,它们是样本取到的值而不是样本. 我 们只能观察到随机变量取的值而见不到随机变量.
统计中,总体这个概念的要旨是: 总体就是一个随机变量(向量)或一个概 率分布.
2、样本
总体中抽出若干个体而成的集体,称为样本。 样本中所含个体的个数,称为样本容量。
从国产轿车中抽5辆 进行耗油量试验 样本容量为5
抽到哪5辆是随机的
注1:所谓样本就是n个与总体同分布的随机变量。
对总体X在相同的条件下,进行n次重复、独立
,
Xn )是X1,
X 2 ,
,
X
的
n
函数
,若g
中不含未知参数,则g( X1, X 2 , , X n )称是一
个统计量.
例2、设总体X服从两点分布b(1, p),其中p是未知参
数,X1, , X5是来自X的简单随机样本.试指出X1 X2
,max 1 i 5
Xi
,
X5
2
p,(
X5
X1)2 之中哪些是统计量,哪些
由于每个个体的出现是随机的,所以相应的数量指 标的出现也带有随机性 . 从而可以把这种数量指标看 作一个随机变量X ,因此随机变量X的分布就是该数 量指标在总体中的分布.
总体就可以用一个随机变量及其分布来描述.
因此在理论上可以把总体与概率分布等同起来.
例如:研究某批灯泡的寿命时,关心的数量指标 就是寿命,那么,此总体就可以用随机变量X表示, 或用其分布函数F(x)表示.
第六章、样本及抽样分布
第一节:随机样本 第二节:抽样分布
引言
随机变量及其所伴随的概率分布全面描述了随机 现象的统计性规律。
概率论的许多问题中,随机变量的概率分布通常 是已知的,或者假设是已知的,而一切计算与推理都 是在这已知是基础上得出来的。
但实际中,情况往往并非如此,一个随机现象所 服从的分布可能是完全不知道的,或者知道其分布概 型,但是其中的某些参数是未知的。
定义:
设X是 具 有 分 布 函 数F的 随 机 变 量 , 若X1 , X 2 ,
,
X
是
n
具
有
同
一
分
布
函
数F的
、
相
互
独
立
的
随
机
变 量 , 则 称X1 ,
X 2 ,
,
X
为
n
从
分
布
函
数F(
或
总
体
F、 或 总 体X) 得 到 的 容 量 为n的 简 单 随 机 样 本 ,
简 称 样 本 , 它 们 的 观 察值x1 ,
观察,其结果依次记为X1,X2, ,Xn .
这样得
到
的随机变量X 1
,
X
2
,
Xn是来自总来自
的一个随机样一个随机体随机变随机变量具有分布.
一旦取定一组样本X1,… ,Xn ,得到n个具体的数 (x1,x2,…,xn),称为样本的一次观察值,简称样本值 .
注2 最常用的一种抽样叫作“简单随机抽样”,其特点: 1. 代表性: X1,X2,…,Xn中每一个与所考察的总体有 相同的分布. 2. 独立性: X1,X2,…,Xn是相互独立的随机变量.
如何对样本进行加工? ——统计量及其分布
第二节 抽样分布
统计量与经验分布函数 统计三大抽样分布 几个重要的抽样分布定理 小结
一、统计量与经验分布函数
1. 统计量
不含任何未知参数的样本的函数称为统计量. 它是完全由样本决定的量.
设X1, X 2 , , X n是来自总体X的一个样本,
g( X1,
X 2 ,
总体
寿命 X 可用一概率 (指数)分布来刻划
某批 灯泡的寿命
寿命总体是指数分布总体
鉴于此,常用随机变量的记号 或用其分布函数表示总体. 如 说总体X或总体F(x) .
类似地,在研究某地区中学生的营养状况时 , 若关心的数量指标是身高和体重,我们用X 和Y 分 别表示身高和体重,那么此总体就可用二维随机变 量(X,Y)或其联合分布函数 F(x,y)来表示.
例如:
某公路上行驶车辆的速度服从什么分布是未知的;
电视机的使用寿命服从什么分布是未知的; 产品是否合格服从两点分布,但参数——合格率p是 未知的;
数理统计的任务则是以概率论为基础,根据试验 所得到的数据,对研究对象的客观统计规律性做出合 理的推断。
学习的基本内容
从第本章开始,我们学习数理统计的基础知识。 主要有参数估计、假设检验、方差分析、回归分析等 内容.本章主要介绍数理统计的一些基本术语、基本 概念、重要的统计量及其分布,它们是后面各章的基 础。
第一节 随机样本
总体和样本 小结
一、总体与样本
1、总体与个体
一个统计问题总有它明确的研究对象.
研究对象的全体称为总体,总体中每个成员称为个体
总体中所包含的个体的个数称为总体的容量.
总体
…
研究某批灯泡的质量
有限总体 总体
无限总体
我们关心的是总体中的个体的某项指标(如人的 身高、灯泡的寿命,汽车的耗油量…) .
x2 ,
,
x
称
n
为
样
本
值
,
又 称 为X的n个 独 立 的 观 察 值.
由简单随机抽样得到的样本称为简单随机样本,
它可以用与总体独立同分布的n个相互独立的随机
变量X1,X2,…,Xn表示.
若总体的分布函数为F(x)、概率密度函数为 f(x),则其简单随机样本的联合分布函数为
F *( x, x2, , xn ) =F(x1) F(x2) … F(xn) 其简单随机样本的联合概率密度函数为
总体(理论分布) ?
样本
样本值
统计是从手中已有的资料--样本值,去推断总 体的情况---总体分布F(x)的性质.
样本是联系二者的桥梁
总体分布决定了样本取值的概率规律,也就是 样本取到样本值的规律,因而可以由样本值去推断 总体.
由样本值去推断总体情况,需要对样本值进 行“加工”,这就要构造一些样本的函数,它把 样本中所含的(某一方面)的信息集中起来.
不是统计量,为什么?
解:
X1
X
2
,
max
1 i 5
Xi
,(X5
X1 )2 都是统计量,但
X5 2 p不是统计量(因为p是未知数).
请注意 :
(1)统计量是一个随机变量。
(2) 设X1, X 2 ,
X
是
n
来
自
总
体X的
一
个
样
本,
x1
,
x2
,
xn是 一 个 样 本 的 观 察 值,则f ( x1, x2 , xn )也 是 统