matlab与分布拟合

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 -8
-6
-4
-2
0
2
4
6
8
连续分布:均匀分布
均匀分布(连续分布)
如果随机变量 X 的密度函数为:
1 , a xb f ( x) b a 0, 其他
为检验骰子是否均匀, 要把骰子实地投掷 若干次,统计各点出现的频率与1/6的差距.
问题是:得到的数据能否说明“骰子均匀” 的假设是可信的?
现实生活中的许多数据都是随机产生的, 如考试分数、月降雨量、灯泡寿命等。从 数理统计角度来看,这些数据其实都是符 合某种分布的,这种规律就是统计规律。
本专题的主要目的是:熟悉Matlab相关命令;熟悉 各种常见分布的概率密度函数及其曲线,会利用数据 分布的形态猜测其分布类型;能够对密度函数进行参 数估计;进行简单的假设检验(以正态检验为主)。
pdf 概率密度函数
y=pdf(name,x,A) 返回由 name 指定的单参数分布的概率密度,x为样本数据 y=pdf(name,x,A,B) 或 y=pdf(name,x,A,B,C) 返回由 name 指定的双参数或三参数分布的概率密度 name 用来指定分布类型,其取值可以是: 'beta'、'bino'、'chi2'、'exp'、'ev'、'f' 、 'gam'、'gev'、'gp'、'geo'、'hyge'、'logn'、 'nbin'、'ncf'、'nct'、'ncx2'、'norm'、 'poiss'、'rayl'、't'、'unif'、'unid'、'wbl'。
正态分布也称高斯分布,是概率论中最重要的一个分布。 如果一个变量是大量微小、独立的随机因素的叠加,那么 它一定满足正态分布。如测量误差、产品质量、月降雨量等
正态分布举例
例:标准正态分布和非标准正态分布密度函数图形
x=-8:0.1:8; y=normpdf(x,0,1); y1=normpdf(x,1,2); plot(x,y,x,y1,':')
Matlab相关命令
数据统计处理基本命令
类似的用法,请自己借助matlabຫໍສະໝຸດ Baidu线帮 助功能自己了解:
– 中位数:median(x) – 标准差:std(x) – 方差:var(x) – 偏度:skewness(x) – 峰度:kurtosis(x)
偏度和峰度的说明
表示分布形状的统计量—偏度和峰度
Matlab相关命令
数据统计处理基本命令
– 相关系数
MATLAB提供了corrcoef函数,可以求出数据的相关系数矩阵。 corrcoef函数的调用格式为: • corrcoef(X):返回从矩阵X形成的一个相关系数矩阵。此相关系数矩 阵的大小与矩阵X一样。它把矩阵X的每列作为一个变量,然后求它 们的相关系数。 • corrcoef(X,Y):在这里,X,Y是向量,它们与corrcoef([X,Y])的作用一 样。
……
……
概率密度函数
表 概率密度函数(pdf) 函数名称 normpdf chi2pdf tpdf fpdf 函数说明 正态分布 调用格式 Y=normpdf (X, MU, SIGMA) Y=chi2pdf (X, N) Y=tpdf (X, N) Y=fpdf (X, N1, N2)
2
2 分布
2 分布
t 分布
F 分布
【例】略
连续分布:正态分布
正态分布(连续分布)
如果随机变量 X 的密度函数为:
( X )2 2 2 e
1 f ( x) 2
x , 0
~ N ( , 2 )
则称 X 服从正态分布。记做:X 标准正态分布:N (0, 1)
Matlab相关命令
数据统计处理基本命令
– 排序
MATLAB中对向量X是排序函数是sort(X),函数返回一个对X中的元素 按升序排列的新向量。
sort函数也可以对矩阵A的各列或各行重新排序,其调用 格式为: [Y,I]=sort(A,dim)
其中dim指明对A的列还是行进行排序。若dim=1,则按列排;若dim=2, 则按行排。Y是排序后的矩阵,而I记录Y中的元素在A中位置。
Matlab相关命令
数据统计处理基本命令
– 累加和与累乘积 在MATLAB中,使用cumsum和cumprod函数能方便地求得向量和矩 阵元素的累加和与累乘积向量,函数的调用格式为: • cumsum(X):返回向量X累加和向量。 • cumprod(X):返回向量X累乘积向量。 • cumsum(A):返回一个矩阵,其第i列是A的第i列的累加和向量。 • cumprod(A):返回一个矩阵,其第i列是A的第i列的累乘积向量。 • cumsum(A,dim):当dim为1时,该函数等同于cumsum(A);当 dim为2时,返回一个矩阵,其第i行是A的第i行的累加和向量。 • cumprod(A,dim):当dim为1时,该函数等同于cumprod(A);当 dim为2时,返回一个向量,其第i行是A的第i行的累乘积向量。
t 分布
F 分布
注意: Y=normpdf (X, MU, SIGMA)的 SIGMA 是指标准差 , 而非 .
【例】 绘制标准正态分布的概率 密度图. x=-4:0.1:4; y=normpdf(x,0,1); plot(x,y) title('N(0,1)的概率密度曲线图')
【例】绘制卡方分布密度函数在自 由度分别为1、5、15的图形 x=0:0.1:30; y1=chi2pdf(x,1); plot(x,y1,':') hold on
累积分布函数(cdf)
表 累积分布函数(cdf) 函数名称 normcdf chi2cdf tcdf fcdf 函数说明 正态分布 调用格式 P=normcdf (X, MU, SIGMA) P=chi2cdf (X, N) P=tcdf (X, N) P=fcdf (X, N1, N2)
2 分布
u_alpha = t_alpha = F_alpha = X2_alpha =
1.2816 -0.7407 0.4772 32.3574
累积分布函数(cdf)
表 随机数发生函数(random) 函数名称 normrnd chi2rnd trnd frnd 函数说明 正态分布 调用格式 R=normrnd(MU, SIGMA, m, n) R=chi2rnd(N, m, n) R=trnd(N, m, n) R=frnd(N1, N2, m, n)
内容提纲
1.Matlab相关命令介绍 2.常见概率分布 3.频数直方图与频数表 4.参数估计 5.假设检验
Matlab相关命令
数据统计处理基本命令
– 最值:max(x), min(x)
• (1) max(X):返回向量X的最大值,如果X中包含复数元素, 则按模取最大值。
• (2) max(A):返回一个行向量,向量的第i个元素是矩阵A 的第i列上的最大值。 • (3) [Y,U]=max(A):返回行向量Y和U,Y向量记录A的每列 的最大值,U向量记录每列最大值的行号。 • (4) max(A,[],dim):dim取1或2。dim取1时,该函数和 max(A)完全相同;dim取2时,该函数返回一个列向量,其 第i个元素是A矩阵的第i行上的最大值。
上面的数据能否证实X 具有 泊松分布的假设是正确的?
又如,某钟表厂对生产的钟进行精确性检 查,抽取100个钟作试验,拨准后隔24小时 以后进行检查,将每个钟的误差(快或慢) 按秒记录下来.
问该厂生产的钟的误差是否服从正态 分布?
再如,某工厂制造一批骰子, 声称它是均匀的.
也就是说,在投掷中,出 现1点,2点,…,6点的概 率都应是1/6.
2 分布
t 分布
F 分布
【例】求下列分位数:
(i)
>> >> >> >>
u0.9 ;
(ii)
t0.25 (4) ;
(iii)
F0.1 (14,10) ;
(iv)
2 0.025 (50)
u_alpha=norminv(0.9,0,1) t_alpha=tinv(0.25,4) F_alpha=finv(0.1,14,10) X2_alpha=chi2inv(0.025,50)
常见的概率分布
二项式分布 卡方分布 指数分布 F分布 几何分布 正态分布 泊松分布 T分布 均匀分布 离散均匀分布 Binomial Chisquare Exponential F Geometric Normal Poisson T Uniform
Discrete Uniform
bino chi2 exp f geo norm poiss t unif unid
Matlab相关命令介绍
例: x=-8:0.1:8;
y=pdf('norm',x,0,1); y1=pdf('norm',x,1,2); plot(x,y,x,y1,':') 注: y=pdf('norm',x,0,1) 相类似地, y=pdf('beta',x,A,B) y=pdf('bino,x,N,p) y=betapdf(x,A,B) y=binopdf(x,N,p) y=normpdf(x,0,1)
从2009国赛B题
眼科病床的合理安排
说起。。。
从1500到1931年的432年间,每年爆发战争的 次数可以看作一个随机变量,椐统计,这432 年间共爆发了299次战争,具体数据如下:
战争次数X 发生 X次战争的年数 223 0 142 1 48 2 15 3 4 4
在概率论中,大家对泊松分布产生的一 般条件已有所了解,容易想到,每年爆发战 争的次数,可以用一个泊松随机变量来近似 描述 . 也就是说,我们可以假设每年爆发战 争次数分布X近似泊松分布. 现在的问题是:
t 分布
F 分布
【例】 求服从标准正态分布的随机变量落在区间[-2, 2]上的概率. >> P=normcdf ([-2, 2]) ans = 0.0228 0.9772
>> P(2)-P(1) ans = 0.9545
累积分布函数(cdf)
表 逆累积分布函数(icdf) 函数名称 norminv chi2inv tinv finv 函数说明 正态分布 调用格式 X=norminv (P, MU, SIGMA) X=chi2inv (P, N) X=tinv (P, N) X=finv (P, N1, N2)
Matlab相关命令
数据统计处理基本命令
–例
生成满足正态分布的10000×5随机矩阵,然后求各列元 素的均值和标准方差,再求这5列随机数据的相关系数矩阵。 命令如下: X=sqrt(3)*randn(10000,5)+4; M=mean(X) D=std(X) R=corrcoef(X)
Matlab相关命令介绍
Matlab相关命令
数据统计处理基本命令
– 求和: • (1) sum(X),返回向量X各元素的和。 • (2) sum(A) ,返回一个行向量,其第i个元素是 A的第i列的元素和。 • (3)sum(A,dim) ,当dim为1时,该函数等同于sum(A);当dim为2 时,返回一个列向量,其第i个元素是A的第i行的各元素之和。 – 乘积: • (1) prod(X) ,返回向量X各元素的乘积。 • (2) prod (A) , 返回一个行向量,其第i个元素是A的第i列元素的乘 积。 • (3) prod(A,dim) ,当dim为1时,该函数等同于prod(A);当dim为2 时,返回一个列向量,其第i个元素是A的第i行的各元素之乘积。
1 偏度: g1 3 s
(Xi X )
i 1
n
3
1 峰度: g 2 4 s
(X i X )4
i 1
n
偏度反映分布的对称性,g1 >0 称为右偏态,此时数据位于均值 右边的比位于左边的多;g1 <0 称为左偏态,情况相反;而 g1 接近 0 则可认为分布是对称的. 峰度是分布形状的另一种度量,正态分布的峰度为 3,若 g2 比 3 大很多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数 据,因而峰度可用作衡量偏离正态分布的尺度之一.
相关文档
最新文档