4.1总体与样本 《概率论与数理统计》课件

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的未知参数,这就是数理统计所要解决的首要问题,办 法是什么呢?以上述例子来说,我们要掌握车辆速度的 分布,电视机寿命的分布,次品率的值,就必须对这一 公路上行驶的车辆的速度,电视机的寿命及三极管中的 次品作一段时间的观察或测试一部分,从而对所关心的 问题作出推断.即: 在数理统计学中,我们总是从所要研究的对象全体中抽 取一部分进行观测或试验,以取得信息,从而对我们所 关心的问题(整体)作出推断和估计.于是如何抽取样本如 何合理地获取数据,怎样合理地利用采集的数据资料对 问题作出推断等等就成为数理统计研究的问题.
(1,2 n)
n
f*(x1,x2xn) f(xi)
i1
例5.1.1 设总体 服从参数为 的泊松分布,(1,2, ,n)
为取自总体 的一组样本,求(1,2, ,n)的联合概率函
数. 解:
因为 ~P(),所以
f(x)P (x)xe,x0,1 ,2, 从
而(1,2 n)的联合概率函数为
x!
f*(x1,x2
第四章 数理统计的 基本概念
§4.1总体与样本
在概率论的讨论中,概率分布通常总是已知的,而一切 计算和推理就是在这已知的基础上得出的.但在实际问题中, 情况就并非如此,一个随机现象所遵循的分布是什么概型可 能完全不知道;或者我们根据随机现象所反映的某些事实能 断定其概型,但却不知道其分布函数中所含的参数.
2) 1,2, ,n是相互独立的随机变量.
称( 1,2, ,n )为一组简单随机样本,简称为样本.
若 为离散型随机变量,其分布列为P令x

若f(x)为P 连续x型随机变量,其密度函数为 ,令
称为 总体的概率函数.
p(x)
f(x)p(x)
设总体的概率函数为 ,
为取自总体的一组
样本,则
的联合f ( x概) 率(函1,数2 为n)
能做出的推断的可信度一般也极为有限.在很多情况下,往
往是知道总体所具有的分布形式,而不知道的仅仅是分布
中的参数.这在实际中是大量能见到的,因为,分布的总体
形式我们往往可以通过具体的应用背景或以往的经验加以
确定.
例5.1.3 考虑如何由样本的 1,2, ,n实际背景确定统计模型,
即总体 的分布:
(1) 样本记录随机抽取的n件产品的正品、废品情况.
例如 1) 在一段时间内某段公路上行驶的车辆的速度服从什么概 率分布是完全不知道的. 2) 某工厂生产的一批电视机的寿命遵循何种分布也可能是 不知道的. 3) 某仪器厂向某元件厂购买一批三极管,任抽一件是次品 或正品遵循的是两点分布(即分布概型已知),但是分布 中的参数(即次品率)往往是未知的.
找出一个随机现象所联系的随机变量的分布或分布中
对于样本需要强调:样本并非一堆杂乱无章无规律可循的 数据,它是受随机性影响的一组数据,因此,用概率论的话 说,就是每个样本既可以视为一组数据,又可视为一组随机 变量,这就是所谓样本的二重性.当通过一次具体的试验,得 到一组观测值,这时样本表现为一组数据;但这组数据的出 现并非是必然的,它只能以一定的概率(或概率密度)出现, 这就是说,当考察一个统计方法是否具有某种普遍意义下的 效果时,又需要将其样本视为随机变量,而一次具体试验得 到的数据,则可视为随机变量的一个实现值.今后为行文方便, 我们常交替使用上述两种观点来看待样本,而不去每次声明 此处样本是指随机变量还是其观测值.
为了能使抽到的样本能够对总体作出较可靠的推断,就希 望它能很好地代表总体.这就对抽样方法提出一些要求.最简单 的抽取的样本必须具有(1)样本能代表总体;(2)每个个 体都是随机地抽出的.这就是简单随机样本的概念.
若( 1,2, ,n)为来自总体的一组样本,且满足
1) 1,2, ,n与总体具有相同的分布;
n
xi
xn)i n1f(xi)i n1xix !ex1!x2i! 1
en. xn!
例5.1.2 设总体 服从 N(,2),(1,2, ,n)为取自总体的一组样
本,求(1,2, ,n)的联合概率函数.
解: 因为 服从 N(,2) ,
所以
f (x)
1
e , (x22)2
2
从而 (1,2, ,n)的联合概率函数为
二、简单随机样本Fra Baidu bibliotek
实际上,从总体中抽取样本可以有各种不同的方法. 例如设一组抽奖券共10000张,其中有5张有奖.问连续抽 取3张均有奖的概率为多少?
对于这个问题,我们可以采取“有放回的”或“无放回的” 连续抽取.
显然无放回的抽样方式不是独立的,每次抽样的结果都将 影响下一次抽样的分布,这种抽样不是我们所希望的抽样.而 有放回的抽样,则是多次独立的抽样,它们是同分布的,是我 们通常所采用的抽样.称为的随机抽样.
(2) 样本表示同一批n个电子元件的寿命(小时).
(3) 样本表示同一批n件产品某一尺寸(mm).
通过分析或经验,我们容易知道:
(1) 服从两点分布,其概率分布为 px(1p)1x,x=0,1,所需确
定的是参数 p [0,1.] (2) 通常服从指数分布,其密度函数
f
(x;)
ex,x0
,
0, x0
f* (x 1 ,x 2 , ,x n )i n 1f(x i)i n 1x ix !e (x 2 i 2 )2 (2 1)ne 2 1 2 i n 1(x i )2
. 三、 参数与参数空间 如前所述,数理统计问题的分布一般来说是未知的,需要
通过样本来推断.但如果对总体绝对地一无所知,那么,所
所需确定的是参数 >0.
(3) 通常服从正态分布 N (, 2 ) ,其密度函数
f(x; , 2) 1 e(x22)2,xR 2
所需确定的是参数( , 2 ),其中 R , 2 0 ,对于每个总体, 我们称其分布中参数的一切可能取值的集合为参数空间,记 为.
今后对于统计推断,如果总体的分布为形式已知, 仅对参数进行推断,我们就称之为参数推断(估计,检 验);否则,称为非参数推断.
相关文档
最新文档