概率统计第六章
概率论与数理统计 第六章 样本及抽样分布

x0 o.w.
n 1
n5
n 15
15
(2)t-分布(学生分布)
设 X ~ N ( 0 ,1), Y ~ 2 ( n ) 且X、Y为独立随 机变量,则称随机变量
t
X Y /n
X
1 n 2 ( X 12 ...... X n )
为自由度为n的t-分布。记为: t ~ t ( n ) 。
3
§1 随机样本
总体: 研究对象在某项数量指标的全体. 记为X。通常称总体X。 个体: 总体X中的每一个元素(实数)xi。 根据总体所含的个体数分为: 有限总体和无限总体。
4
总体与取样
X1
X
X2 X3 Xn
取样模型
X
X2 X1
X3
X4
X5
河流污染取样
5
总体、样本、统计量
总体 样本 统计量
X1 X2
2 ( n ) 分布:
具有可加性
2 X X 12 ...... X n , X i ~ N (0,1)
3. 4.
t ( n ) 分布:
X ~ N (0,1), Y ~ 2 ( n )
t(n) X Y /n
F ( n1 , n 2 ) 分布: U ~ 2 ( n1 ), V ~ 2 ( n 2 )
F (n1 , n2 )
19
分位点及性质:
定义: Pr[ X z ]
z
(1)标准正态分布分位点
(x)
( x)dx 1 ( x)dx
z
z1
( x)
Pr[ X z ]
概率与统计学课件-第六章-数理统计的基本概念2-1

�总体与样本
基本概念: 总体:研究的问题所涉及的对象的全体 个体:总体中的每个成员 样本:从总体中抽取部分个体 样本容量:样本所包含的个体数量 样本观测值:
数的属性 样本的二重性 随机变量的属性
设X1,X2, …,Xn为总体X的一个容量为 n的 样本。若它满足 独立性,即X1,X2, …,Xn 相互独立; 同分布性,即每个 Xi都与总体X服从相 同的分布. 则称这样的样本为简单随机样本,简称为 样本。
�统计量
设是总体X的样本,g(X1,X2, …,Xn)是样本 的实值函数,且不包含任何未知参数,则 称g(X1,X2, …,Xn)为统计量。
例2.若X1,X2, X3是来自总体X~N(μ, σ 2)的 其中参数μ未知, σ2已知,则
X 1 X 3 − 3µ , X12 + 4 X 22 + 5µ 都不是统计量
�定理
若X1,X2, …,Xn是来自总体X的样本,设X 的分布函数为 F(x),则样本X1,X2, …,Xn的 联合分布函数为
n
∏ F (x )
i i =1
例1.若X1,X2, …,Xn是来自总体X的样本,设 X的分布函数为 F(x),则样本 X1,X2, …,Xn的联合分布函数为
⎧ n − λ xi (1 − e ), xi > 0(i = 1, 2,⋯ , n) ⎪∏ F ( x1 , x2 ,⋯ , xn ) = ⎨ i =1 ⎪ 0 , 其他 ⎩
1/8, 25 ≤ x<27 2/8, 27 ≤ x<30 3/8, 30 ≤ x<33 Fn(x)= 5/8, 33 ≤ x<35 6/8, 35 ≤ x<45 7/8, 45 ≤ x<65 1, 65 ≤ x
概率论与数理统计(06)第6章 统计量及其抽样分布

σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 11
µx = µ
xቤተ መጻሕፍቲ ባይዱ
x 的分布趋 于正态分布 的过程
6 - 12
6.4 正态总体 6.3.1 χ2分布 6.3.2 t 分布 6.3.3 F 分布
6 - 13
χ2 分布
第六章 样本与统计量
6.1引言 6.1引言
数理统计学: 运用概率论的基础知识,对要研究的随机现象进行 多次观察或试验,研究如何合理地获得数据资料, 建立有效的数学方法,根据所获得的数据资料,对 所关心的问题作出估计与检验。
6-1
§6.2总体与样本 6.2总体与样本
对某一问题的研究对象全体称为总体。 组成总体的某个基本单元,称为个体。 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体。 有限总体在个体相当多的情况下,可以作为无限 总体进行研究。 总体中的个体,应当有共同的可观察的特征。该 特征与研究目的有关。
6 - 16
χ2分布
(图示) 图示)
n=1 n=4 n=10
n=20
6 - 17 不同容量样本的抽样分布
χ2
t 分布
6 - 18
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 (W. “Student”(学生)为笔名的论文中首次提出 Student”(学生)
X ~ N(µ,σ ) ,则
2
χ2分布
2. 3.
z=
X −µ
Y=z
概率与数理统计第六章

t
x
y
W {T t (n 1)}
2021/3/11
t
x 16
6.2.1 单个正态总体均值的假设检验
例6.2 正常人的脉搏平均每分钟72次,某医生测得10例四乙基铅 中毒患者的脉搏数(次/分)如下:54,67,68,78,70,66, 67,70,65,69.已知人的脉搏次数服从正态分布.试问四乙基铅
在取6份水样,测定该有害物质含量,得如下数据: 0.530‰,0.542‰,0.510‰,0.495‰,0.515‰,0.530‰
能否据此抽样结果说明有害物质含量超过了规定? 0.05
练习2 一公司声称某种类型的电池的平均使用寿命至少为21.5小 时,有一实验室检验了该公司制造的6套电池,得到如下的寿命数 据(单位:小时):19 18 22 20 16 25 设电池寿命服202从1/3/正11 态分布,试问这种类型的电池寿命是否低于该18 公
即提出假设: H0 : p 0.02 若 H0 正确,则取到次品为小概率事件.
2021/3/11
在一次试验中, 小概率事件是 几乎不可能发 生的.
小概率原理
2
6.1 假设检验的基本概念
2. 两类错误
犯了“弃真”错误 第一类错误
犯了“纳伪”错误 第二类错误
P(拒绝H0 | H0为真)
P(接受H0 | H0为假)
注意:我们总把含 有“等号”的情形 放在原假设.
在原假设 H0 为真的前提下,确定统计量
U
X 0
~
N (0,1)
n
2021/3/11
因为X
~
N
,
2
n
,
所以
X
~
N (0,1)
概率论与数理统计教材第六章习题

X σ0 n
~ N(0,1)
对于置信水平1- ,总体均值的置信区间为 对于置信水平 -α,总体均值 的置信区间为
X
σ0
n
uα < < X +
2
σ0
n
uα
2
(2)设总体 ~ N(,σ 2 ), 未知 ,求的置信区间。 设总体X~ 未知σ, 的置信区间。 设总体 的置信区间
σ 0 ,则样本函数 t = X ~ t(n 1) 用 S 代替 S n
i =1
n1
n1
F
1
α ∑ Yj 2
2 j =1
n2
(
)
2
n2
10
2 2 及 (1)设两个总体 ~ N(1,σ1 ) 及Y~ N(2 ,σ 2 ), 未知 1 2, )设两个总体X~ ~
2 σ1 的置信区间。 求 2 的置信区间。 σ2
选取样本函数 选取样本函数
2 2 S1 σ1 F = 2 2 ~ F(n1 1, n2 1) S2 σ2
∑x
i =1
n
i =1
i
n = 0.
1 p
得 p 的极大似然估计值为 p =
n
∑x
i =1
n
1 = x
i
12
1 θ 2. 设总体 服从拉普拉斯分布:f ( x;θ ) = e ,∞< x < +∞, 设总体X 服从拉普拉斯分布: 2θ 求参数 θ 其中 > 0. 如果取得样本观测值为 x1 , x2 ,L, xn , 求参数θ
第六章 参数估计
(一)基本内容
一、参数估计的概念 1 定义:取样本的一个函数θ ( X 1 , X 2 ,L , X n ), 如果以它的观测 定义:
《概率与数理统计》第06章 - 样本及抽样分布

(3)g( x1, x2 ,L xn )是统计量g(X1, X2 ,L Xn )的观察值
几个常见统计量
样本平均值
X
1 n
n i 1
Xi
它反映了 总体均值 的信息
样本方差
S 2
1 n1
n i 1
(Xi
X )2
它反映了总体 方差的信息
n
1
1
n
X
2 i
i 1
nX
2
样本标准差
S
1 n
n
1
(
i 1
X
i
是来自总体的一个样本,则
(1) E( X ) E( X ) ,
(2) D( X ) D( X ) 2 n ,
n
(3) E(S 2 ) D( X ) 2
矩估计法的 理论根据
若总体X的k阶矩E( X k ) k存在,则
(4) Ak
1 n
n i 1
Xik
p k
k 1, 2,L .
(3)证明:E(S2 )
定义 设X1 , X2 ,L , Xn是来自总体X的一个样本, g( X1 , X 2 ,L , X n )是X1 , X 2 ,L , X n的函数,若g 中不含未知参数,则g( X1 , X 2 ,L , X n )称是一 个统计量.
请注意 :
(1)X1, X2 ,L
X
是样本,也是随机变量
n
(2)统计量是随机变量的函数,故也是随机变量
1
e
(
xi 2
2
)2
2
n
( xi )2
1
e i1 2 2
n
2
第二节
抽样分布
西北工业大学《概率论与数理统计》课件-第六章 参数估计

(2) 似然函数
定义6.1 设总体X的分布密度(或分布律)为 p(x; ), 其中 (1, 2, ,m )为未知参数. 又设
( x1, x2,, xn ) 为自总体X的样本(X1,X2,…,Xn) 的一 个观察值,则称样本的联合分布
n
L( ) p(x1, x2, … , xn; ) p( xi; )
2º似然估计方程组与最大似然估计之间没有必 然
从中解得 pˆ k n
参数 p的估计值
这时, 对一切 0< p <1, 均有
P{Y k; pˆ } P{Y k; p}
综上所述: 设某试验的可能结果为: A1, A2 , ···, Ai , ···
若在一次试验中,某结果 Ai 出现,则应选择参 数使Ai 出现的概率最大.
以上这种选择一个参数使得实验结果具有
(k 1,2,, m)
(4) 求最大似然估计(MLE)的步骤:
1 写出似然函数
(1, 2 , ,m )
n
L( ) L( x1, x2,, xn; ) p( xi; )
n
i 1
2 取对数 ln L( ) ln p( xi; )
i 1
3 解似然方程(组)
ln L
ln L
2
为来自总体X的简单随机样本. 矩估计法的具体步骤:
1 求出k E( X k ) (1,2,,m ), k 1,2,,m;
2 要求k Ak , k 1,2,, m
这是一个包含 m个未知参数1,2 ,,m的方程组.
3 解出其中1,2,,m , 用ˆ1,ˆ2,,ˆm表示.
4 用方程组的解ˆ1, ˆ2 , ,ˆm 分别作为 1,2 ,,m的估计量,这个估计量称为
概率论与数理统计第6章

第六章6.4 在例6.2.3 中, 设每箱装n 瓶洗净剂. 若想要n 瓶灌装量的平均阻值与标定值相差不超 过0.3毫升的概率近似为95%, 请问n 至少应该等于多少? 解:因为1)3.0(2)/3.0|/(|)3.0|(|-Φ≈<-=<-n nnX P X P σσμμ依题意有,95.01)3.0(2=-Φn ,即)96.1(975.0)3.0(Φ==Φn于是 96.13.0=n ,解之得 7.42=n 所以n 应至少等于43.6.5 假设某种类型的电阻器的阻值服从均值 μ=200 欧姆, 标准差σ=10 欧姆的分布, 在一个电子线路中使用了25个这样的电阻.(1) 求这25个电阻平均阻值落在199 到202 欧姆之间的概率; (2) 求这25个电阻总阻值不超过5100 欧姆的概率. 解:由抽样分布定理,知nX /σμ-近似服从标准正态分布N (0,1),因此(1) )25/10200199()25/10200202()202199(-Φ--Φ≈≤≤X P)5.0(1)1()5.0()1(Φ+-Φ=-Φ-Φ=5328.06915.018413.0=+-= (2) )204()255100()5100(≤=≤=≤X P X P X n P 9772.0)2()25/10200204(=Φ=-Φ≈6。
8 设总体X ~N (150,252), 现在从中抽取样本大小为25的样本, {140147.5}P X ≤≤。
解: 已知150=μ,25=σ,25=n ,)25/25150140()25/251505.147()5.147140(-Φ--Φ≈≤≤X P)5.0()2()2()5.0(Φ-Φ=-Φ--Φ= 2857.09615.09772.0=-=第六章《样本与统计量》定理、公式、公理小结及补充:。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
习题六解答1. 设X求出:以下随机变量的分布律。
(1)2+X ;(2)1+-X ;(3)2X 。
解 由X由此表可定出(1)2+X(2)1+-X(3)2X 的分布律为其中()()()24682242=+=-=+===X P X P X P 。
2. 设随机变量X 服从参数1=λ的泊松分布,记随机变量=Y ,1,1;1,0>≤X X 若若试求随机变量Y 的分布律。
解 由于X 服从参数1=λ的泊松分布,因此(),,2,1,0,!!111 ====--k k e e k k X P k而 ()()()()1112!1!01010---=+==+==≤==e e e X P X P X P Y P ;()()()1211111--=≤-=>==e X P X P Y P 。
即Y 的分布律为3. 设X 的密度函数为()=x f ,0,2x,;10其他<<x 求以下随机变量的密度函数:(1)X 2;(2)1+-X ;(3)2X 。
解 求连续型随机变量的函数的密度函数可通过先求其分布函数,然后再求密度函数。
如果()x g y =为单调可导函数,则也可利用性质求得。
(1)解法一:设X Y 2=,则Y 的分布函数()()()⎪⎭⎫ ⎝⎛≤=≤=≤=22y X P y X P y Y P y F Y= ⎰⎰102202xdx xdx y1212002≥<≤<y y y=1402y 2200≥<≤<y y y ()()='=y F y f Y Y 02y其他20<<y 解法二:x y 2=,()y h y x ==2,而()21='y h ,则 ()()()()y h y h f y f X Y '== ,0,2122⋅⋅y 其他120<<y = 0,2y 其他20<<y(2)设1+-=X Y ,则()()1,1-='=-=y h y h y x ,Y 的密度函数()()()()='=y h y h f y f X Y()()211y -⨯- 其他110<-<y=()012-y 其他110<-<y (3)设2X Y =,由于X 只取()1,0中的值,所以2x y =也为单调函数,其反函数()()yy h y y h 121,='=,因此Y 的密度函数为 ()()()()='=y h y h f y f X Y,0,1212y y ⋅ 其他10<<y=,0,1其他10<<y4. 对圆片直径进行测量,测量值X 服从()6,5上的均匀分布,求圆面积Y 的概率密度。
解 圆面积241X Y π=,由于X 均匀取()6,5中的值,所以X 的密度函数()=x f X,0,1.;65其他<<x且241x y π=为单调增加函数()()6,5∈x ,其反函数()()y y y h yy y h ππππ11212,24=⋅='==, Y 的密度函数为()()()()='=y h y h f y f X Y,0,1y π ,;625其他<<πy= ,0,1y π .;9425其他ππ<<y5. 设随机变量X 服从正态分布()1,0N ,试求随机变量的函数2X Y =的密度函数()y f Y 。
解 ()1,0~N X ,所以()+∞<<-∞=-x ex f x X ,212π,此时2x y =不为单调函数不能直接利用性质求出()y f Y 。
须先求Y 的分布函数()y F Y 。
()()()=≤=≤=y XP y Y P y F Y 2()yX y P ≤≤-0,0;0≥<y y()()⎰⎰---==≤≤-yyyy X dx edx x f y X y P x 221π.()()='=y F y f Y Y,0,2121212122y eyeyy--+ππ,;0其他>y=,0,21ye y -π.;0其他>y6. 设随机变量X 服从参数为1的指数分布,求随机变量的函数X e Y =的密度函数()y f Y 。
解 ()=x f X ,,x e - .;0其他>xx e y =的反函数()()yy h y y h 1,ln ='=,因此所求的Y 的密度函数为 ()()()()='=y h y h f y f X Yln 1,0,y e y - ,;0ln 其他>y= ,0,12y .;1其他>y7. 设X 服从()1,0N ,证明a X +σ服从()2,σa N ,其中σ,a 为两个常数且0>σ。
证明 由于()1,0~N X ,所以()+∞<<-∞=-x ex f x X ,2122π,记a X Y +=σ,则当0>σ时,a x y +=σ为单增函数,其反函数()()σσ1,='-=y h ay y h ,因此Y 的密度函数为()()()()()+∞<<-∞=⋅='=--⎪⎭⎫⎝⎛--y eey h y h f y f a y a y X Y ,21121222221σσσπσπ,即证明了()2,~σσa a X N +。
8. 设随机变量X 在区间[]2,1-上服从均匀分布,随机变量=Y1,00,01,0.X X X >=-<若;若;若试求随机变量函数Y 的分布律。
解 []2,1~-R X ,则()=x f ,0,31.;21其他<<-x而 ()()⎰-==<=-=01313101dx X P Y P ; ()()000====X P Y P ;()()⎰==>==20323101dx X P Y P 。
因此所求分布律为9. 设二维随机变量()Y X ,的分布律;(3)X 2;(4)XY 。
(1)(2)由此得X 2的分布律为(4)10. 设随机变量X、Y相互独立,⎪⎭⎫⎝⎛⎪⎭⎫ ⎝⎛41,1~,41,1~B Y B X ,(1)记随机变量Y X Z +=,求Z 的分布律;(2)记随机变量X U 2=,求U 的分布律。
从而证实:即使X、Y服从同样的分布,Y X +与X 2的分布并不一定相同,直观地解释这一结论。
解(1)由于⎪⎭⎫⎝⎛⎪⎭⎫ ⎝⎛41,1~,41,1~B Y B X ,且X与Y独立,由分布可加性知⎪⎭⎫⎝⎛+41,2~B Y X ,即()()2,1,0,434122=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛==+==-k k k Y X P k Z P kk ,经计算有(2)由于因此易见Y X +与X 2的分布并不相同。
直观的解释是的Y X +与X 2的取值并不相同,这是因为X 与Y 并不一定同时取同一值,因而导致它们的分布也不同。
11. 设二维随机变量()Y X ,的联合分布律为(1)求()Y X U ,max =的分布律; (2)求()Y X V ,min =的分布律。
解 (1)随机变量U 可能取到的值为1,2,3中的一个,且()()()()()()()()()()()()()()()()()();95919292003,32,31,33,23,13,max 3;31919202,21,22,12,max 2;911,11,max 1=++++===+==+==+==+=======++===+==+=============Y X P Y X P Y X P Y X P Y X P Y X P U PY X P Y X P Y X P Y X P U P Y X P Y X P U P 综合有(2)随机变量V()()()()()()()();95929200911,31,23,12,11,11,min 1=++++===+==+==+==+======Y X P Y X P Y X P Y X P Y X P Y X P V P 同理可求得()(),13,12====V P V P 综合有12. 设二维随机变量()Y X ,服从在D上的均匀分布,其中D为直线0,0==y x ,2,2==y x 所围成的区域,求X Y -的分布函数及密度函数。
解 ()Y X ,的联合密度函数为1,02,02;(,)40,x y f x y ⎧<<<<⎪=⎨⎪⎩其他.设Y X Z -=,则Z 的分布函数()()()()⎰⎰=≤-=≤=zzD Z dxdyy x f z Y X P z Z P z F ,其中区域(){}z y x y x D z ≤-=:,,当2-<z 时,积分区域见图6.2,此时()⎰⎰==zD Z dxdy z F 00当02<≤-z 时,积分区域见z D 图6.3,此时()()()()22281221414141,z z D dxdydxdy y x f z F z D D Z z z +=-⨯=⨯==='⎰⎰⎰⎰'的面积区域 其中z D '是区域z D 限在20,20<<<<y x 中的那部分。
当20<≤z 时,积分区域z D 见图6.4,此时()()()()2228112214414141,z z D dxdydxdy y x f z F z D D Z z z--=⎪⎭⎫ ⎝⎛-⨯-⨯=⨯==='⎰⎰⎰⎰'的面积区域其中z D '是区域z D 限在20,20<<<<y x 中的那部分。
当2≥z 时,积分区域z D 见图6.5,此时()()1,==⎰⎰zD Z dxdy y x f z F 。
综合有()=z F Z()(),1,2811,281,022z z --+ ,2;20;02;2≥<≤<≤--<z z z zZ 的密度函数()()='=z F z f Z Z ()(),0,241,241z z -+ .;20;02其他<≤≤<-z z13. 设()Y X ,的密度函数为()y x f ,,用函数f 表达随机变量Y X +的密度函数。
解 设Y X Z +=,则Z 的分布函数()()()()()⎰⎰⎰⎰+∞∞--∞-≤+==≤+=≤=xz zy x Z dxdy y x f dx dxdy y x f z Y X P z Z P z F ,,。
对积分变量y 作变换y x u +=,得到()()⎰⎰∞--∞--=zxz du x u x f dy y x f ,,于是 ()(){}⎰⎰+∞∞-∞--=dx du x u x f z F zZ ,,交换积分变量u x ,的次序得()(){}⎰⎰∞-+∞∞--=zZ du dx x u x f z F ,从而,Z 的密度函数为()()⎰+∞∞--=dx x z x f z f Z ,,把X 与Y 的地位对换,同样可得到Z 的密度函数的另一种形式()()⎰+∞∞--=dy y y z f z f Z ,。