水质工程学2 水文统计基本原理与方法
合集下载
水文统计基本原理与方法

Y=
∶
∶
∶
∶
6 “出现6点”
建立了这种数量化关系后,实际上相当于引入了 变量Y。这样的变量是随试验的不同结果而取不同的 值。
由于试验出现的结果是随机的,因此,变量X和Y 的取值也是随机的,故称X、Y为随机变量。
定义:在随机试验中,用一个变量X的取值(实数) 表示随机试验的结果。由于随机试验的结果是随机的, 所以称这种变量X为随机变量。
x0
x
x0
x
记:
f ( x) F '( x) dF( x) dx
称为概率密度函数,简称密 度函数(density function), 其图形称为密度曲线 (density curve)。
密度函数积分即为分 布函数:
F ( x) P( X x) f ( x)dx
x
(3 5)
分布函数(distribution function)的图形称为分 布曲线(density curve), 水文学中称为频率曲线 (frequency curve)。
其几何图形如下图所示, 图中纵坐标表示变量x, 横坐标表示概率分布函数值F(x),在概率论中称此 曲线为概率分布曲线,水文统计中称为随机变量的累积 频率曲线,简称频率曲线(frequency curve)。
图中,当 x= xP 时, 可以查得:
F(xP) = P(X≥xP) = P 表示随机变量X大于或 等于xP 的概率(可能性) 为P(%)。
【例3-0】河流每年会发生洪水,但洪水的大小无法 预先知道。这是一种偶然现象,也称为随机现象。
水文现象是一种自然现象,所 以它具有必然性的一面,也具有偶 然性的一面。
随机现象看似杂乱无章,但对大量随机现象的分 析发现,随机现象也具有一定的规律性,称这种规律 为统计规律性(statistical regularity)。
水文学 水文统计基本原理与方法

PE
全球多年平均降 水量等于多年平 均蒸发量,为 1130mm
2.2.2 水文观测与水文资料的收集
一、降水
形式: 雨、雪、霰、雹、露、霜等 特征要素: 降水量(mm) 降水历时(min,h,d) 降水强度(mm/h,mm/d) 降水面积(km2) 暴雨中心
与降水有关的气象因素 降水发生在大气中的对流层,对流层是地球大 气中最底的一层。
Pc R Ec Sc
若以海洋为研究对象,其水量平衡方程为:
Po R Eo So
△Sc——大陆在研究时段内蓄水量的变化量 △So——海洋在研究时段内蓄水量的变化量 对多年平均情况, △Sc 、△So 趋于零。所以:
Pc R E c
合并得:
Po R E o
Pc Po E c E o 或
1.2 水文现象基本规律及其研究方法
1、水文现象基本规律 (1)确定性规律 (2)随机性规律 (3)地区性规律 2、基本研究方法 (1)成因分析法 (2)数理统计法 (3)地区综合法
1.3 水文科学的发展
第二章
2.1 河流与流域
河流与径流
一、河流 (一)河流的形成与分段 定义:接纳地面径流和地下径流的天然泄水通道。 河谷、河槽或河床。 上游、下游、左岸、右岸。 分段:沿水流方向,自高向低可分为河源、上游、 中游、下游和河口五段。
(二)河流的基本特征 1. 河流的长度 自河源沿主河道至河口的距离称为河 长(km)。 2. 河流的断面: 横断面 中泓线 纵断面
3. 河道纵比降: 任意河段两端(水面 或水底)的高差△h称为落 差,单位河长的落差称为河 道纵比降。 水面比降、河底比降
二、流域 (一)流域 定义:供给河流地面和地下径流的集水区域, 即分水线所包围的区域 分水线(分水岭) 闭合流域。、非闭合流域
第三章 水文统计基本原理与方法

的两端或一端与横轴线渐近相切。
y f ( x) ( x a0 ) a 1 e ( x a ( )
( )
——
0
)
0
t 1e t dt ,称为 的伽马函数
0
—— 曲线上点的横坐标值,待定参数 —— 特定参数
,
第三章 水文统计基础知识 → 3)水文经验频率曲线、理论曲线及参数估计
第三章 水文统计基本原理与方法 → (1) 概率统计理论基础
概率
随机事件A客观上出现的可能性,称为概率,用 P(A)表示,又称为机率、或然率等。它是描述随 机事件发生可能性大小的数值标准。 设事件A在重复的随机中共有N种结果,且每种 结果发生的可能性均等,其中事件A出现的可 能结果有f0种,按概率定义,有
曲线参数与统计参数之间的关系:
2 x CV 4 C s 2C S
a0 x(1 ) CS
第三章 水文统计基础知识 → 3)水文经验频率曲线、理论曲线及参数估计
p( ) f , C d
p p s
该式包含 Cs、P与Φp的关系,查附表2,由已 知的Cs值,查表可得不同P的 Φp值,然后利用 已知的 x 和Cv值,通过下式即可求出与各种P 相应的xp值,从而可绘出理论频率曲线。
上述累积频率是指多年平均出现的机会; 重现期则是平均若干年出现一次,而不是固定 的周期。
例4 某大城市从互不相关的三条河流中取水,各设一个 泵房.每一泵房正常运转受洪水破坏的机率为1﹪。试确 定此城市供水受破坏的机率为多大?
解:水文现象总体容量无限,所述破坏机率只能是一 种估计值。供水受破坏的情况有如下几种: (1)三个泵房运转同时破坏的机率:
•重现期
水文统计基本原理与方法

51
41 40 42
72
58 56 60
102
82 80 85
162
130 126 134
由表中可见,当n=100时,CS的误差在40~126%之间。 水文资料一般都很短(n<100),按矩法公式算得的CS值, 抽样误差太大。
3.3 经验频率曲线与理论频率曲线
一、经验频率及其计算公式 1.经验频率 用根据水文实测系列 ( 样本 ) 计算出来的 频率分布近似代替总体概率分布,这种意义 上的累积频率称为经验(累积)频率。
81 32
皮尔逊Ⅲ型分布参数矩法估计的均方误公式:
X
n
2n 1 3 2 cs 4 3 2 CS 2C V C S 4
绝 对 误 差
Cv
Cv 2n
6
2 1 2cv
Cs
n
(1
3 5 2 4 CS CS 2 16
81 33
样本参数的均方误(相对误差,%)
81 24
3.2 统计参数与抽样误差
一、统计参数 概率分布曲线完整地刻画了随机变量的变化规
律。但随机变量特别是水文随机变量,其概率分
布的确定是十分困难的。实际上,我们有时仅需
要知道它的一些数字特征即统计参数就足够了。
水文水利计算中常用离散特征参数 ( 均值、均方 差、变差系数、偏态系数等)。
81 25
古典概率表达式
k P ( A) n
古典概率满足“随机等可能,独立同分布”。 古典概率通常又叫事前概率,是指当随机事件中各种可能发 生的结果及其出现的次数都可以由演绎或外推法得知,而无 需经过任何统计试验即可计算各种可能发生结果的概率。
81 11
第二章 水文统计基本原理与方法

则,降雨量落在900和500mm的可能性为: 60%-15% = 45%
三、累积频率和重现期 1、累积频率 等量或超量值的累积频数m与总观测次数 S之比,以P(x≥xi)表示。 例:某桥位处测得40年最高水位资料,如表, 求水位H≥25m的累积频率。
解:当水位H=25m时,W=25% P=25+5=30% 表明:若水位为25m时对桥梁会有威胁, 则高于25m的水位对桥梁都会有威胁,其发生 的可能性应为P=30%。 工程上习惯把累积频率简称为频率。
经验频率曲线的特点 ① 当n→∞时,经验频率曲线将越来越光滑, 且接近于理论频率曲线,对于水文变量分布线型 的选择具有借鉴作用; ② 经验频率曲线计算工作量小,绘制简单, 查用方便; ③ 经验频率曲线外延比较盲目,误差较大, 往往难以满足设计上的需要。因为在水文计算中, 常需推求P=1%、0.1%、0.01%相应的水文变量 值。 ④ 不能求出统计参数,难以进行参数的地 区综合,无法解决无实测水文资料的小流域的水 文计算问题。
• 频率是经验值,概率是理论值; • 可以通过实测样本的频率分析来推论事件 总体概率特性; • 样本容量越大,结果越准确; • 对于水文现象,只能采用有限的多年实测 水文资料组成样本系列,推求频率作为概 率的近似值。
二、随机变量的概率分布
1、对于离散型随机变量 随机变量的取某一可能值的机会有的 大有的小,即随机变量取值都有一定的概 率与之相对应,可表示为:
P ( X x1 ) P1 P ( X x 2 ) P2 P ( X x n ) Pn
上式中P1、P2、 … Pn 表示随机变量X 取值x1、 x2、 … xn 所对应的概率。
一般将这种对应关系称作随机变量的概 率分布规律,简称为分布律。可以用以下的 分布图形表示:
第四章 水文统计基本原理与方法 工程水文学

lim W(A) P(A)
n
五、概率的加法定理与乘法定理
1、概率的加法定理
互不相容(互斥):P(A1+A2+…An)= P(A1)+P(A2)+……P(Ai)
非互斥事件 : P(A1+A2)= P(A1)+P(A2)- P(A1A2)
式中:P(A1+A2+……An)为它们中任一个出现的概率
目估外延。 2、理论累积频率曲线
四.理论累积频率曲线
1.频率密度
正态分布:
1 ( x x )2 f ( x) exp 2 2 2
P
x
x
1 ( x x )2 exp dx 0.683 2 2 2
1 ( x x )2 P exp dx 0.997 2 x 3 2 2 1 ( x x )2 P exp dx 1 2 2 2
若求百年一遇的洪水
,m=1 ,得,n=99年。即
是说,在推求百年一遇的洪水时,至少需要99年的实测资料。
2.经验累积频率曲线绘制步骤
1)将实测水文特征值如水位、流量或降雨量不论年序,按大小 排序,对于洪水资或大于某特征值 x≥xi,的
例4-1:江河中出现的最高水位或最大流量,每年的实测值 各不相同,为互斥事件。某水文站观测到一河段50年的洪 水水位资料如下表4-2,求小于258m水位出现的频率。
水位高程Hi(m) 出现的频数 fi(年) 频率w(Hi)%
250 3 6
255 7 14
258 9 18
265 16 32
268 15 30
均系数表。后经雷布京等人的修正,成为专用水文计算表。
1961年中国科学院水文研究所又对此离均系数ФP计算表进行 修正扩展,加密点据,将ФP值补充到Cs=6.4。 x K p 1 pCv;xP KP x 理论累计频率曲线的坐标值:令 K
水文统计基本原理与方法课件

险评估和效益预测。
02 水文统计基本原理
概率论与数理统计基础
概率论基本概念
概率是描述随机事件发生可能性的数 学工具,包括概率空间、随机变量、 概率分布等。
数理统计基础
数理统计是研究如何从数据中获取有 用信息的方法论,包括参数估计、假 设检验、回归分析等。
水文数据的收集与整理
数据来源
水文数据主要来源于水文站观测、遥感监测、气象观测等多 种途径。
水文统计学的应用领域
01
02
03
04
水资源评估
通过对水文数据的统计分析, 评估和预测水资源量、水质和
供水能力。
水文预报
利用水文统计方法对未来水文 情势进行预测,为防洪抗旱提
供决策依据。
水环境管理
通过对水环境相关数据的统计 分析,评估水环境质量,制定
水环境保护和治理措施。
水利工程设计
在水利工程设计中,利用水文 统计数据和方法对工程进行风
河流流量变化规律研究
总结词
河流流量变化规律研究是水文统计中的重要 内容,通过对河流流量数据的收集、整理和 分析,可以了解河流流量的变化规律,为水 资源管理和水利工程提供科学依据。
详细描述
河流流量变化规律研究包括对河流流量数据 的收集、整理和统计分析。通过对河流流量 数据的分析,可以了解河流流量的变化规律 ,包括河流流量的季节性变化、年际变化和 长期变化趋势等。这些规律对于水资源管理 和水利工程具有重要的意义,可以帮助决策 者制定科学合理的水资源管理和水利工程规
划。
水质参数的统计分析
总结词
水质参数的统计分析是水文统计中的重要内容,通过对水质参数数据的收集、整理和分 析,可以了解水质的时空分布规律,为水资源保护和水环境治理提供科学依据。
02 水文统计基本原理
概率论与数理统计基础
概率论基本概念
概率是描述随机事件发生可能性的数 学工具,包括概率空间、随机变量、 概率分布等。
数理统计基础
数理统计是研究如何从数据中获取有 用信息的方法论,包括参数估计、假 设检验、回归分析等。
水文数据的收集与整理
数据来源
水文数据主要来源于水文站观测、遥感监测、气象观测等多 种途径。
水文统计学的应用领域
01
02
03
04
水资源评估
通过对水文数据的统计分析, 评估和预测水资源量、水质和
供水能力。
水文预报
利用水文统计方法对未来水文 情势进行预测,为防洪抗旱提
供决策依据。
水环境管理
通过对水环境相关数据的统计 分析,评估水环境质量,制定
水环境保护和治理措施。
水利工程设计
在水利工程设计中,利用水文 统计数据和方法对工程进行风
河流流量变化规律研究
总结词
河流流量变化规律研究是水文统计中的重要 内容,通过对河流流量数据的收集、整理和 分析,可以了解河流流量的变化规律,为水 资源管理和水利工程提供科学依据。
详细描述
河流流量变化规律研究包括对河流流量数据 的收集、整理和统计分析。通过对河流流量 数据的分析,可以了解河流流量的变化规律 ,包括河流流量的季节性变化、年际变化和 长期变化趋势等。这些规律对于水资源管理 和水利工程具有重要的意义,可以帮助决策 者制定科学合理的水资源管理和水利工程规
划。
水质参数的统计分析
总结词
水质参数的统计分析是水文统计中的重要内容,通过对水质参数数据的收集、整理和分 析,可以了解水质的时空分布规律,为水资源保护和水环境治理提供科学依据。
水文统计基本原理与方法

1 T p
当考虑水库兴利调节,研究枯水问题时,设计频率P>50%,则
1 T 1 p
·对于暴雨洪水(防洪,设计频率 P≤50%)
T
1 1 (年) P P ( x p )
三峡:P=0.01%,Q0.01%=91100m3 /s,指平均每 10000 年遇到
91100 m3 /s 的洪水 1 次洪峰流量
4-5 理论频率曲线
2、皮尔逊Ⅲ型分布
(2)皮尔逊Ⅲ型累积频率P的查算
水文计算中,一般需要求出指定频率P所相应的随机变量取 值xp,也就是通过对密度曲线进行积分:
1 x a P Px x p x a e dx 0 x
(2)连续型随机变量 若某随机变量可以取得一个有限或无限区间内的任何数值,则 成为连续型随机变量。
4-3 随机变量及其概率分布
1、随机变量
(3)总体与样本 在数理统计中,把研究对象的个体集合成为总体。 从总体中随机抽取n个个体成为总体的一个随机样本,简称样 本。
4-3 随机变量及其概率分布
4-2 概率的基本概念和定理
1、事件
在概率论中,对随机现象的测验叫做随机试验,随机试验的结 果称为事件。事件可以分为必然事件、不可能事件和随机事件 三种。
2、概率
随机事件的概率计算公式:
P ( A) k n
式中:P(A)―在一定的条件组合下,出现随机事件A的概率 ; k― 有利于随机事件A的结果数 ; n― 在试验中所有可能出现的结果。
4-3 随机变量及其概率分布
2、随机变量的概率分布
F(x)=P(X≥x) 代表随机变量X大于等于某一取值x的概率。
在数学上称此曲线为分 布曲线,水文统计中常 称分布曲线为随机变量 的累积频率曲线,简称 频率曲线。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.1.3 总体与样本
3.1.3
总体与样本 (collectivity and sample) :
有 限 总 体 无限 样本
容量无限 容量一定
容 量
● ●
水文特征值系列的总体是无限的。 样本是总体的一部分,样本的特征在一定程度上反映 出总体的特征。
概率与频率
3.1.4 概率与频率(Probability and frequency)
频率 P=50% 时的 x 值,有 x50%.
示意图
均方差
2.离散程度特征参数
(1)均方差
▵ 描述概率分布离散趋势的特征参数。随机变量分布越分散, 均方差越大;分布越集中,均方差越小。 ▵ 限于比较均值相同的系列。 ☆ 总体的
☆ 样本的
总
x x 样
n 2 i 1 i
K
3 n
n
i
i 1
i
1
3 V
3
(3-16)
n C
i
Cs
(x
x)
3
3
(n 3)
(K
1)
3
3
(3-17)
(n 3)C v
Cs影响形状图
当Cs>0,密度曲线峰顶在均值的左边,叫做左偏或正偏。 当Cs<0,密度曲线峰顶在均值的右边,叫做右偏或负偏。 当Cs=0,密度曲线峰顶在均值处,叫做对称分布或正态分布。 ◇ 水文现象大多属于正偏,Cs>0。
n 1
引入模比系数 对于总体
k i 1
i 1 n 2 n
xi Ki x
对于样本
Cv
Cv
n
ki2 n
i 1
k 1
i 1 i
n
2
n
n 1
k
i 1
n
2 i
n
n 1
变差系数图
湖北省部分地区年径流量变差系数Cv等值线图
Cv的曲线形状影响
必然事件 不可能事件 随机事件
随机事件:在一定组合条件下,可能发生也可能不
发生的事情
◆ 随机变量(Random variables) :
▴
随机变量(Random variables) :
随机事件的数量化表征
随机变量
相邻两个随机变量之间,不存在中间值
离散型 连续型
随机变量的一个有限区间内可以取得任何数值
xi
水文学中的概率分布
水文统计中常用的概率分布 — 正态分布 概率密度函数为:
f ( x)
1
( x x )2 2 2
2
e
( x )
正态分布密度曲线特征: 特点:
1)单峰;
2)以均值为对称轴;
3)曲线两端趋于±∞, 且以x轴为渐近线。
3.1.6 累积频率与重现期
3.1.6 累积频率与重现期
2 7 11 5 3 2
6.67 23.33 36.67 16.67 10.00 6.67
1.67 5.83 9.17 4.17 2.5 1.67
2 9 20 25 28
30
6.67 29.99 66.66 83.33 93.33 100.00
§3-2 统计参数与抽样误差
§3-2
统计参数与抽样误差
(1) 概率(机率):随机事件在客观上可能出现的机会
k n k:事件A在客观上可能出现结果的总数; P( A) n:一切可能出现的结果的总数。
基本性质:
0≤P(A)≤1
(2) 频率:在具体重复试验中,随机事件A出现的次数 与试验总次数之比值
k W ( A) n k : 事件A在n次试验中实际出现的次数
3.1.1 3.1.2 3.1.3 3.1.4 3.1.5 3.1.6
水文统计基本概念
水文统计 事件与随机变量 总体、个体与样本 概率与频率 随机变量概率分布 累积频率与重现期
3.1.1 水文统计
水文统计意义:
水文现象具有必然性、偶然性(随机性); 利用概率论和数理统计的理论和方法,研究和分析水文的
题的图
62
1.6 4.8 9.6 20.9 41.9 71.0 95.2 98.4 100.0 — 100.0
2300
f(x) 频率密度曲线
2300
P(X≥xi) 累积频率曲线
x(mm)
1300
x(mm)
频率密度直方图
1300
300 0 5
300
10
-4 △P ×10 ) △X(
累积频率直方图
15
(Statistical parameters & Sampling error )
3.2.1. 统计参数
能说明随机变量统计规律的某些特征数值,称为
统计参数,或特征参数,有时称为分布参数。
特征参数
1.
位置特征参数
2.
离散程度特征参数
均值(平均数)
均方差
众值(众数)
变差系数Cv
3. 对称程度特征参数
概率和频率的关系
(3) 概率与频率关系:
lim W ( A) P( A) 0
n
频率是经验值,概率是经验值; 可以通过实测样本的频率分析来推论事件总体概 率特性; 样本容量越大,结果越准确; 对于水文现象,只能采用有限的多年实测水文资 料组成样本系列,推求频率作为概率的近似值。
总体思路
I、II级铁路桥梁 铁路桥涵设计 洪水频率P(%) I、II级铁路涵洞 水电站设计保证率(电力系统中 水电容量比重<25%)P(%) 雨水管渠设计 重现期T(a) 一般地区,干道
80~90 0.5~3
2~5
重要地பைடு நூலகம்,干道
Hydrological Statistics
◆ 本节水文频率计算的基本思路: 实测水文系列资料为样本 分析不同测值出现频率(且考虑抽样误差) 总体规律性 预测水文情势,确定合理设计值
Cv越大,频率密度曲线矮而宽,系列数值相对 Cv越小,频率密度曲线瘦而高,系列数值相对
x 分布越分散。
分布越集中。
偏态系数
x
3. 对称程度特征参数
偏态系数 CS
反映密度曲线的对称特征,即衡量系列在均值的两侧分布对
称或不对称(偏态)程度的系数。
总体:
CS
样本:
x
n i 1
i
x
3
0
20
40
60
80
100
P(%)
p dp lim f ( x) x 0 x dx
将左式进行积分
x
P(X≥xp)=F(xp) ∞ x ∫p f(x)dx
f(x)
x
xp
xp
F(x) F(xp)
0
概率密度函数
f(x)
0
p
F(x)(%) 100
概率分布函数 (3-4)
P( X xi ) F ( xi ) f ( x)dx
中值(中位数) 偏态系数Cs
无偏估计
无偏估计量:
ˆ E( ) ˆ E( )
有偏估计量:
▲ 对于有偏估计量,大量样本平均的结果都不等于总 体的相应参数,需要进行修正,以得到对总体的无偏估 计值公式。
均值
1.位置特征参数
(1) 均值(数学期望) x
3-11
均值表示系列的分布中心,代表随机变量系列的平均水平。
(1) 累积频率(Accumulated frequency): 等量或超量值的累积频数(m)与总观测次数(n)之比。
有:
m P ( X xi ) n
(%)
(3-6)
※
频率
累积频率
频率特性
√ 累积频率特性:
i n
1 P( X xi ) P( X xi ) ?( f k f k ) n k 1 k i 1 P ( X xi ) 1 P ( X xi )
随机现象(已经观测到的水文现象),找出水文现象的统
计规律性; 以此为基础,对水文现象未来可能的长期变化做出概率意
义下的定量预估,以满足工程规划、设计、施工以及运营
期间的需要。
3.1.2 事件与随机变量
3.1.2 事件与随机变量
▴ 事件 (Events) :是指在一定组合条件下,在 实验结果中所有可能出现或可能不出现的事情。
频数 / 年
累积 ∑mi 1 3 6 13 26 44 59 61 62 —
频率 / %
组内 △p 1.6 3.2 4.8 11.3 21.0 29.1 24.2 3.2 1.6 累积 P
组内平均频率密度 △p/△x (10-4) 0.80 1.60 2.40 5.65 10.50 14.55 12.10 1.60 0.80 —
▵ 算数平均值
◇ 加权平均值
均值图示
我国多年平均年降水量分布图(单位:mm)
Y图
湖北省部分地区多年平均年径流深等值线图(mm)
众值
(2) 众值(众数)
ˆ x
概率密度曲线峰值在x坐标上相应的位置值。
(3)中值(中位数) x
对于连续随机变量,把概率密度曲线下的面积分为 两个相等部分所对应的 x 值为中值。即中值是该系列
图总结
位置特征参数
均值(平均数) 众值(众数)
离散程度特征参数 均方差 变差系数Cv
对称程度特征参数 中值(中位数)
偏态系数Cs
※ 统计参数物理意义; 统计参数对频率密度曲线形状的影响。
复习:矩的概念
矩
▲ 随机变量 x 对原点离差的 k 次幂的数学期望 E(xk),称为随机 变量 x 的 k 阶原点矩。 ▲ 随机变量 x 对中心分布 E (x) 离差的 k 次幂的数学期望 E {[x – E (x)]k},则称为随机变量 x 的 k 阶中心矩。