生物统计学 第三章 概率分布09
生物统计学欧阳乐军

随机事件(random event):若某特定事件只 是可能发生的几种事件中的一种,这种事 件称为随机事件。
2019/8/8
湛江师范学院生科院欧阳乐军制作
3
要认识随机事件的规律性,个别的试验或观察 是不适用的,必须在大量的实验中才能观察到。
下面用棉田发生盲椿象为害的情况来说明这一 问题。
调查株
数(n)
5
25
50 100 200 500 1000 1500 2000
受害株
数(a)
2
12
15
33
72 177 351 525 704
受害频 率(a/n) .40 .48 .30 .33 .36 .354 .351 .350 .352
2019/8/8
2019/8/8
湛江师范学院生科院欧阳乐军制作
7
二、事件的交(积事件)
事件A和B同时发生而构成的新事件, 称为事件A和B的积事件,记为AB,读作“A 和B同时发生”。
例如某小麦品种,以发生锈病赤霉病 为事件A,发生白粉病赤霉病为事件B,则 赤霉病发生这一新事件为AB,记为A∩B 。
2019/8/8
2019/8/8
湛江师范学院生科院欧阳乐军制作
23
例如,观察施用某种农药后蚜虫的死亡数,记 “死”为0,“活”为1。如果每次观察5只,则 观察的结果将有0(5只全死)、1(4死1活)、2(3 死2活)、3(2死3活)、4(1死4活)、5(5只全活), 共6种变量。由这6种变量的相应概率组成的分
布,就是n=5时活虫数的二项分布。
0.05 0 012345
(p=0.5,n=5)的概率分布图
生物统计学第三章 概率和概率分布(2)

的第x 1项,所以有“二项分布”这个名称。
0 0 1 1 x x n n [ (1 )]n Cn (1 )n Cn (1 )n1 Cn (1 )nx Cn (1 )0
x x (2) P(x) Cn (1 )nx [ (1 )]n 1n 1 x 0 x 0
2. 二项分布的常用符号
n :贝努利试验的次数(或 样本含量)
x : 在n次试验中事件A出现的次数,即二项分布变量X 的取值
: 事件A发生的概率 (每次试验都是恒定的 )
1 - : 事件A发生的概率
p(x) : X的概率函数即P(X x)
F( x) P(X x) p(xi )
2014-4-21
二项分布的程序计算方法
二项分布函数Binomdist(k,n,p,false/true) 某数阶乘的计算函数Fact 从给定元素数目m的集合中抽取若干n元素的排 列组合数C n m 计算函数Combin(m,n)
2014-4-21
二、 泊松分布 (Poisson Distribution)
2014-4-21
二项分布
(实例)
【例】已知 100 件产品中有 5 件次品,现从中任取一件,有 放回地抽取3次。求在所抽取的3件产品中恰好有2件次品的 概率 解:设 X 为所抽取的3件产品中的次品数,则根据二项分 布公式有
P X 2 C32 (0.05)2 (0.95)32 0.007125
二项分布变量的一些例子:
(1)连续抛硬币100次,统计总共出现正面的次数。次数X服从二项分布。 (2)调查250名新生婴儿的性别,记男婴的总数为X,则X服从二项分布。 (3)调查n枚种蛋的出雏数,出雏数X服从二项分布。 (4)n头病畜治疗后的治愈数X,X服从二项分布。
生物统计学 几种常见的概率分布律

非此即彼
随机试验有两种互不相容不同结果。 重要条件: 1. 每次试验两个结果(互为对立事件),每一种结果在每次 试验中都有恒定的概率; 2. 试验之间应是独立的。
P(AB)=P(A)P(B)
2.14
二项分布的概率函数
服从二项分布的随机变量的特征数
方差 当以比率表示时
偏斜度
了解
峭度
做题时请先 写公式,代 数字,出结 果,描述结 果的意义。
正态分布表的单侧临界值
上侧临界值
下侧临界值
双侧临界值
§3.5 另外几种连续型概率分布
指数分布(exponential distribution)
了解
Γ分布(gamma distribution)
了解
了解
随着p的增加, Γ分布愈来愈 接近于正态分 布。
§3.6 中心极限定理 (Central Limit Theorem) 假设被研究的随机变量X可以表 示为许多相互独立的随机变量Xi 的和。如果Xi的数量很大,而且 每一个别的Xi对于X所起的作用 又很小,则X可以被认为服从或 近似地服从正态分布。
作业
P51
3.1, 3.2(算出各表现型概率即可); 3.12, 3.18
正态分布的密度函数和分布函数 正态分布(normal distribution) 高斯分布(Gauss distribution) 正态曲线(normal curve) 连续型概率分布律 两头少,中间多,两侧对称
了解
标准正态分布
/fai/
标准正态分布的特性
ቤተ መጻሕፍቲ ባይዱ
正态分布表的使用方法
正态分布标准化
生物统计学
第三章 几种常见的概率 分布律
2010.9
生物统计学:第三章随机变量与概率分布

例:用复合饲料饲养动物,每天增重的kg数及 其相应的概率如下:
每天增重xi /kg 0.5
概率 0.10
1.0
0.20
1.5
0.50
2.0
0.20
问每天增重的数学期望和方差是多少?
解: μ=E(X)=1.40
E(X2 ) =2.15
var=σ2 = E(X2 ) –μ2=2.15-1.42=0.19
15.167
(4)随机变量的方差(variance) - 总体方差
度量随机变量取值的变异程度的指标,其定义式:
Var( X ) 2 ( xi )2 E[( X )2 ]
N
E[( X )2 ] E( X 2 2 X 2 )]
E(X 2) 2E(X ) 2
对于例1:
件的集合)的概率有以下关系:P(A )=1-P(A)
2 )条件概率
➢ 已知事件B发生的条件下,事件A发生的概率 称为条件概率,记为P(A︱B) P(A∣B)=P(AB)/P(B) P(B∣A)=P(AB)/P(A)
例:一周的天气情况如下:
周日
日
一
二
三
四
五
六
预报
晴
阴
雨
雨
雨
晴
雨
实际
晴
雨
阴
雨
雨
晴
晴
设A表示预报有雨的事件,B表示实际下雨的事件
些值的概率p(x1),p(x2),…,p(xn),…,排列起来,构 成了离散型随机变量的概率分布。常用概率分布表或概 率分布图表示(如,p28表与p29图3-1)。
例3.1 掷一次骰子所得点数的概率函数
f (x) 1 , x 1, 2, 3, 4, 5, 6 6
生物统计学03概率和概率分布

e
−λ
(λ = np)
x = 0, 1, 2…, n
第二节 常用的概率分布 二、泊松分布
☆ 参数 参数:
µ= λ
2 = λ σ
☆ 形状
λ=0.5 λ=1.5 λ=2.5
λ→20
泊松分布→正态分布 泊松分布 正态分布
第二节 常用的概率分布 三、正态分布
☆ 是一种连续随机变量的概率分布 ☆ 许多生物现象的计量资料均服从正态分布 ☆ 一般假定试验误差的分布服从正态分布 ☆ 非正态总体统计数的抽样分布近似服从正态分布
☆当 p 值较小且 n 值不
0.25 0.2 0.15 0.1 0.05 0 1 3 5 7
p=0.3
p=0.5
p=0.75
大时, 大时,图形是偏倚的
☆当 p 值趋于 时,分 值趋于0.5时
布趋于对称
9
11
13
15
17
19
21
第二节 常用的概率分布 二、泊松分布
☆ 概率函数
P( x ) =
λ
x
x!
第二节 常用的概率分布
随机抽取20株小麦 测得平均株高为82.3cm,标准差为 株小麦, cm, 例3.4 随机抽取 株小麦,测得平均株高为 cm 1.7502cm,试计算: cm,试计算: cm 1)株高≥85cm的概率; 的概率; 的概率 的正常值范围。 2)小麦株高的95%的正常值范围。 小麦株高的 的正常值范围
第二节 常用的概率分布 三、正态分布
1. 概率函数
f (x) = 1
− ( x−µ)2 2σ 2
σ 2 π
e
记为x~ 记为 ~N(µ,σ2)
第二节 常用的概率分布
2. 正态曲线的特点
生物统计学 第三章 概率分布09

2
2 2
x
= 期望 2 = 方差
X ~ N(, 2)
正态分布
正态分布概率密度函数的几何表示
f (x)
正态曲线
x
曲线下某区间的面积即为随机变量在该区间取值的概率
正态分布
正态分布的特点
➢只有一个峰,峰值在x = 处 ➢曲线关于x = 对称,因而平均数=众数=中
位数 ➢x轴为曲线向左、右延伸的渐进线
P(x≥4)=1-P(x<4)=1-P(0)-P(1)-P(2)-P(3)
1
30!0 e331 1!e3 Nhomakorabea32 2!
e3
33 3!
e3
=0.3528
连续型随机变量的概率分布
正态分布(normal distribution)
➢具有如下概率密度函数的随机变量称为正态 分布随机变量:
f (x) 1 e[ (x )2 ]
第三章 常用概率分布
二项分布 普哇松分布 正态分布 抽样分布
离散型随机变量的概率分布
二项分布(binomial distribution)
假设:1. 在相同条件下进行了n次试验 2. 每次试验只有两种可能结果(1或0) 3. 结果为1的概率为p,为0的概率为1-p 4. 各次试验彼此间是独立的
在n次试验中,结果为1的次数(X = 0,1,2, ,n)服从二项分布,表示为
较大,顶部略低,尾部略高。自由度小的t 分布,更为明显。 n>30时, t 分布接近于标准正态分布; n>100时,t 分布基本与标准正态分布相同; n→∞时,t 分布与标准正态分布完全一致。 3. t 分布概率求法 可查P302 t 分布的双侧分位表。
例:df=4 双侧 t0.05=2.776 t0.01=4.604 单侧 t0.05=2.132 t0.01=3.747
最新生物统计学课后习题解答-李春喜
第一章概论解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。
第二章试验资料的整理与特征数的计算习题2.1 某地100 例30 ~40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.124.56 4.375.396.30 5.217.22 5.54 3.93 5.21 6.515.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.694.38 4.89 6.255.32 4.50 4.63 3.61 4.44 4.43 4.254.035.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.975.16 5.10 5.85 4.79 5.34 4.24 4.32 4.776.36 6.384.885.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.094.52 4.38 4.31 4.585.726.55 4.76 4.61 4.17 4.034.47 3.40 3.91 2.70 4.60 4.095.96 5.48 4.40 4.555.38 3.89 4.60 4.47 3.64 4.34 5.186.14 3.24 4.90计算平均数、标准差和变异系数。
【答案】=4.7398, s=0.866, CV =18.27 %2.2 试计算下列两个玉米品种10 个果穗长度(cm) 的标准差和变异系数,并解释所得结果。
24 号:19 ,21 ,20 ,20 ,18 ,19 ,22 ,21 ,21 ,19 ;金皇后:16 ,21 ,24 ,15 ,26 ,18 ,20 ,19 ,22 ,19 。
【答案】 1 =20, s 1 =1.247, CV 1 =6.235% ; 2 =20, s 2 =3.400, CV 2 =17.0% 。
第三章 概率和概率分布
三、概率分布
(一)离散型变量的概率分布
要了解离散型随机变量x 的统计规律,必须知道它 的一切可能值xi及取每种可能值的概率pi。
1. 列出离散型随机变量X的所有可能取值. 2. 列出随机变量取这些值的概率. 3. 通常用下面的表格来表示:
表3.3 离散型变量的概率分布
变量(x) 概率(P) x1 p1 x2 p2 x3 p3 x4 p4 …….. ……. xn pn
Jocob Bernoulli(16541705年):瑞士数学家
当实验次数足够多时,某一事件出现的频率与概率有较 大偏差的可能性很小
2、辛钦大数定律(Khinchine theorem)
设x1,x2,x3,…,xn是来自同一总体的变量, 对于任意小的正数ε 。
lim P{ x } 1
A3、…、An为完全事件系。
(二)概率的计算法则 1 互斥事件加法定理 若事件A与B互斥,则 P(A+B)=P(A)+P(B) 推理1 P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An) 推理2 P(A)=1-P(A) 推理3 完全事件系的和事件的概率为1。
2 独立事件乘法定理 事件A和事件B为独立事件,则事件A与事件B同 时发生的概率为各自概率的积。
n
Khinchine(1894~1959) 苏联数学家
只要从总体中抽取 的随机变量相当
多,就可以用样本的统计数来估计总体的
参数。
统计数
参数
样本容量越大,样本统计数与总体参数之差越小。
第二节 几种常见的理论分布
随机变量的分布可用分布函数来表述概率
二项分布
离散型变量
生物统计学(第3版)杜荣骞 课后习题答案 第三章 几种常见的概率分布律
第三章 几种常见的概率分布律3.1 有4对相互独立的等位基因自由组合,问有3个显性基因和5个隐性基因的组合有多少种?每种的概率是多少?这一类型总的概率是多少?答:代入二项分布概率函数,这里φ=1/2。
()75218.02565621562121!5!3!83835==⎪⎭⎫⎝⎛=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛=p结论:共有56种,每种的概率为0.003 906 25(1/256 ),这一类型总的概率为0.218 75。
3.2 5对相互独立的等位基因间自由组合,表型共有多少种?它们的比如何? 答:(1)543223455414143541431041431041435434143⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛=⎪⎭⎫⎝⎛+ 表型共有1+5+10+10+5+1 = 32种。
(2)()()()()()()6976000.0024114165014.00241354143589087.002419104143107263.0024127104143105395.00241815414353237.0024124343554322345541322314==⎪⎭⎫⎝⎛==⨯=⎪⎭⎫⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛===⎪⎭⎫⎝⎛=隐隐显隐显隐显隐显显P P P P P P它们的比为:243∶81(×5)∶27(×10)∶9(×10)∶3(×5)∶1 。
3.3 在辐射育种实验中,已知经过处理的单株至少发生一个有利突变的概率是φ,群体中至少出现一株有利突变单株的概率为P a ,问为了至少得到一株有利突变的单株,群体n 应多大?答: 已知φ为单株至少发生一个有利突变的概率,则1―φ为单株不发生一个有利突变的概率为:()()()()()φφφ--=-=--=-1lg 1lg 1lg 1lg 11a a an P n P n P3.4 根据以往的经验,用一般的方法治疗某疾病,其死亡率为40%,治愈率为60%。
生物统计学课件ch3常用的概率分布
(3) 各次试验独立。即一次试验出现什么样的 结果与前面已出现的结果无关。
成功次数的概率分布——二项分布
• 例 设某毒理试验采用白鼠共3只,它们有 相同的死亡概率π,相应存活概率为1-π。记 试验后白鼠死亡的例数为X,分别求X=0、 1、2和3的概率
35
30
25
人数
20
15
10
5
0
2.7~ 3.1~ 3.5~ 3.9~ 4.3~ 4.7~ 5.1~ 5.9~56..53~
血清总胆固醇(mmol/L)
如果样本量很大,组段很多,矩形顶端组 成的阶梯型曲线可变成光滑的分布曲线。
大多数情况下,可采用一个函数拟合这 一光滑曲线。这种函数称为概率密度函数
把钱分成7份,赢了4局的就拿4份,赢了3局 的就拿3份呢?或者一人分一半呢?
频率与概率 frequency and probability
样本的实际发生率称为频率。设在相同条 件下,独立重复进行n次试验,事件A出现f 次,则事件A出现的频率为f/n。
概率:随机事件发生的可能性大小,用大 写的P 表示;取值[0,1]。
p(X=xi) p(x1) p(x2) …… p(xk) ……
离散型随机变量分布的特点:
(1) 0 p(xi ) 1(i 1, 2,...)
(2) p(xi ) 1 所有xi
离散型随机变量的概率分布举例
f(x)
抗体滴度 人数, x 比例, f(x)
1:10
4
.058
1:20
3
.043
二项分布的概率计算
例 如 果 =0.4,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0.0439
0.2051
产公猪头数的期望值: E(X ) np 100.5 5 产公猪头数的方差:
Var(X ) np(1 p) 10 0.5 0.5 0.25
离散型随机变量的概率分布
普哇松分布(Poisson distribution)
描述稀有事件的试验,对于二项分布 X ~ B(n, p) 如果概率P很小,试验次数n很大 ,则二项分布 趋近普哇松分布,表示为:
第三章 常用概率分布
二项分布 普哇松分布 正态分布 抽样分布
离散型随机变量的概率分布
二项分布(binomial distribution)
假设:1. 在相同条件下进行了n次试验 2. 每次试验只有两种可能结果(1或0) 3. 结果为1的概率为p,为0的概率为1-p 4. 各次试验彼此间是独立的
在n次试验中,结果为1的次数(X = 0,1,2, ,n)服从二项分布,表示为
X
)
Var( )]
1
2
(
2
0)
1
Z服从正态分布 Z ~ N(0,1) 标准正态分布
正态分布
标准正态分布的概率密度函数
f (z) 1 e[ z2 ]
2 2
z
0
正态分布
标准正态分布的概率计算
➢ 附表1 (p. 297)
u
u
P(Z u) f (z)dz
1 e( z 2 )dz
2
2
正态分布
(1) P( Z u) 或 P(Z -u) (u > 0)
P(Z u) P(Z u) 直接查表
标准正态分布的概率计算
标准正态分布函数表----附表1 (p. 297)
(1) 直接查附表1,P(Z 0.64)= 0.7389; (2) P( Z 1.53)= 1 - P( Z 1.53)= 1 – 0.9370 = 0.0630; (3) P (2.12 Z 0.53)= P (Z -0.53)- P (Z 2.12)
T表
自由度
F分布(F-distribution) 2分布(Chi-Square)
➢由两个参数决定: 平均数 和 标准差 • 决定曲线在x 轴上的位置 • 决定曲线的形状
正态分布
平均数的影响
标准差的影响
正态分布
标准正态分布(standard normal distribution)
对于 X ~ N(, 2)
令
Z
X
标准化
E(Z)
1
[E(X
)
]
1
(
)
0
Var(Z
)
1
2
[Var(
= 0.2981 – 0.0136 = 0.2811。
标准正态分布的双侧分位数
标准正态分布的双侧分位数表 ----附表2 (p. 299)
对于给定的两尾概率求标准正态分布在x 轴上的分位点
/2
/2
(1)设标准正态分布的两尾概率之和 0.05 ,求分位数u值。
由附表2可直接查得分位数为u = 1.959964
2
2 2
x
= 期望 2 = 方差
X ~ N(, 2)
正态分布
正态分布概率密度函数的几何表示
f (x)
正态曲线
x
曲线下某区间的面积即为随机变量在该区间取值的概率
正态分布
正态分布的特点
➢只有一个峰,峰值在x = 处 ➢曲线关于x = 对称,因而平均数=众数=中
位数 ➢x轴为曲线向左、右延伸的渐进线
1908年以“Student(学生)”为笔名在该年的 Biometrika上发表了论文《平均数的概率误差》, 创立了小样本检验代替大样本检验的理论,即t分布 和t检验法,也称为学生氏分布。
1. t 分布图像类似于标准正态分布,两侧对称,均数为 0。 2. t 分布曲线随样本自由度不同而异, 与正态曲线相比,离散度
x ~ p()
离散型随机变量的概率分布
普哇松分布的概率函数
p(X x) x e
x!
普哇松分布的期望与方差
2
离散型随机变量的概率分布
例2:某遗传病的发病率为0.0003,某鸡场有10000头 肉鸡,问今年发生该遗传病4头及4头以上的概率有 多少?
λ=μ=np=10000×0.0003=3 x=4
样本均数的分布亦接2近正态分布。
的期望为
2、设原总体的期望为,方差为 ,则样本平均数
x
样,本方均差数为的均2 x/数n(期n 望) x — N(,
2
)
样本均数的标准差
n
故样本均数的分布是服从
的正态
t 分布
当以样本s 估计 时(n < 30 ),得到统计量:
t x
sx
W.S.Gosset(歌赛特,英国,1777~1855)
X ~ B(n, p)
离散型随机变量的概率分布
二项分布的概率函数
f (x) Cnx px (1 p)nx
E(X ) xi f (xi ) np
n! px (1 p)nx (x 0,1,2, , n) x!(n x)!
二项分布的期望
E(X ) xi f (xi ) np
二项分布的方差
(2) 0.01 , 分位数为u = 2.575829
标准正态分布的双侧分位数表 ----附表2 (p. 299)
对于给定的一尾概率求标准正态分布在x 轴上的分位点
0.05
/2
0.01
/2
(1)设标准正态分布的右尾(左尾)概率为 0.05 ,求分位数u值
用2 查附表2,可得一尾概率为 时的分位数u值 = 20.05 = 0.1查表得u = 1.644854 。
2 Var(X ) np(1 p)
离散型随机变量的概率分布
例1:一头母猪一窝产了10头仔猪,分别求其
中有2头公猪和6头公猪的概率。
f (2) C120 0.52 (1 0.5)102 10! 0.520.58 2!(10 2)!
f (6) C160 0.56 (1 0.5)106 10! 0.560.54 6!(10 6)!
较大,顶部略低,尾部略高。自由度小的t 分布,更为明显。 n>30时, t 分布接近于标准正态分布; n>100时,t 分布基本与标准正态分布相同; n→∞时,t 分布与标准正态分布完全一致。 3. t 分布概率求法 可查P302 t 分布的双侧分位表。
例:df=4 双侧 t0.05=2.776 t0.01=4.604 单侧 t0.05=2.132 t0.01=3.747
(2) 0.01 , = 20.01 = 0.02查表得u = 2.326348
标准正态分布几个常用的分位数值:
双侧(尾)概率:
下面是标0准.05正态时分,布u的=几个1.特96殊的且常用的分位数值:
0.01 时,当u双=尾概2.率58为0.05时,u = 1.96
当双尾概率为0.01时,u = 2.58 当右尾概率(左尾概率)为0.05 时,u = 1.64(-1.64) 当右尾概率(左尾概率)为0.01 时,u = 2.33(-2.33)
P(x≥4)=1-P(x<4)=1-P(0)-P(1)-P(2)-P(3)
1
30!0 e3
31 1!
e3
32 2!
e3
33 3!
e3
=0.3528
连续型随机变量的概率分布
正态分布(normal distribution)
➢具有如下概率密度函数的随机变量称为正态 分布 ]
单侧(尾)概率:
0.05 时,u = 1.64(-1.64)
0.01 时,u = 2.33(-2.33)
抽样分布 P43 原总体
样本统计量的概率分布 称为抽样分布
样本1 样本2
x1
x2
新总体
样本n n
xn
统计量
正态总体样本平均数的抽样分布
数的分 (n>30)
1、中心极限定理:从正态总体N(µ,σ2)抽样,样本均 布服从正态分布;若从非正态总体抽样,当n→∞