MATLAB数理统计程序
高校统计学专业数理统计建模算法Matlab实现代码详解

高校统计学专业数理统计建模算法Matlab实现代码详解统计学专业是现代社会中非常重要的学科之一,因为它帮助我们理解和解释各种数据,从而为决策提供依据。
在统计学领域中,数理统计建模是一种重要的方法,它利用数学模型来描述和预测数据的行为。
而Matlab作为一种强大的科学计算软件,可以有效地实现数理统计建模算法。
本文将详细介绍高校统计学专业数理统计建模算法在Matlab中的实现代码。
首先,我们将介绍几种常见的数理统计建模算法,并展示它们在Matlab中的具体代码实现。
随后,我们将详细解释这些代码的原理和使用方法,以便读者能够更好地理解和运用这些算法。
1. 线性回归线性回归是数理统计建模中最基本的算法之一。
它通过拟合一个线性模型来预测连续变量的值。
在Matlab中,可以使用“fitlm”函数实现线性回归。
以下是代码示例:```matlabdata = readtable('data.csv'); % 读取数据集model = fitlm(data, 'Y ~ X1 + X2'); % 构建线性回归模型summary(model); % 打印模型摘要信息```2. 逻辑回归逻辑回归是一种常用的分类算法,它用于预测二元变量的概率。
在Matlab中,可以使用“fitglm”函数实现逻辑回归。
以下是代码示例:```matlabdata = readtable('data.csv'); % 读取数据集model = fitglm(data, 'Y ~ X1 + X2', 'Distribution', 'binomial'); % 构建逻辑回归模型summary(model); % 打印模型摘要信息```3. 决策树决策树是一种常用的分类和回归算法,它通过构建一个树状模型来预测变量的取值。
在Matlab中,可以使用“fitctree”函数实现决策树。
概率论和数理统计的Matlab 实现

expcdf 函数 功能:计算累加指数分布函数。 语法:P = expcdf(X,MU) 描述:expcdf(X,MU) 计算参数为 MU 的数据 X 的累加指数分布函数。指数 MU 必须为
正。 累加指数分布函数的计算公式为:
概率论和数理统计的 Matlab 实现
1概 述
自然界和社会上会发生各种各样的现象,其中有的现象在一定条件下是一定要发生的, 有的则表现出一定的随机性,但总体上又有一定的规律可循。一般称前者为确定性事件, 后者为不确定性事件(或称随机事件)。概率论和数理统计就是研究和揭示不确定事件统计 规律性的一门数学学科。
f (x |l) =
lx x!
e-l
I (0,1,K )
(x)
y=
f (x | b) =
x b2
çæ - x 2 ÷ö
eçè 2b2 ÷ø
y
=
f
(x
| v)
=
Gçæ è
v
+ 2
1
÷ö ø
Gçæ è
v 2
÷ö ø
1
1
vp
ççèæ1 +
v +1
x2 v
÷÷øö
2
y=
f (x | N) =
1 N
I (1,..., N ) ( x)
y
=f(x|r,p)
=
ççèæ
r
+
x x
+
1÷÷øö
p
x
q
x
I
(
0,1,...)
(
x)
其中, q = 1 - p
(完整版)Matlab概率论与数理统计

Matlab 概率论与数理统计、matlab 基本操作 1. 画图【例01.01】简单画图hold off; x=0:0.1:2*pi; y=sin (x);plot(x,y, '-r'); x1=0:0.1:pi/2; y1=s in( x1); hold on;fill([x1, pi/2],[y1,1/2],'b');【例01.02】填充,二维均匀随机数hold off ;x=[0,60];y0=[0,0];y60=[60,60]; x1=[0,30];y1=x1+30; x2=[30,60];y2=x2-30;plot(x,y0, 'r' ,y0,x, plot(x1,y1, 'r' ,x2,y2, yr=u nifrnd (0,60,2,100);plot(yr(1,:),yr(2,:), axis( 'on'); axis( 'square' ); axis([-20 80 -20 80 ]);xv=[0 0 30 60 60 30 0];yv=[0 30 60 60 30 0 0]; fill(xv,yv, 'b');hold on ;'r' ,x,y60, 'r' ,y60,x,'r')'r');'m.')2. 排列组合kC=nchoosek(n,k) : CC n ,例 nchoosek(5,2)=10, nchoosek(6,3)=20.prod(n1:n2):从 n1 至U n2 的连乘【例01.03】至少有两个人生日相同的概率365 364|||(365 rs 1)rs365365 364 365 rs 1 365 365365rs=[20,25,30,35,40,45,50]; %每班的人数p1= on es(1,le ngth(rs)); p2=on es(1,le ngth(rs));%用连乘公式计算for i=1:le ngth(rs) p1(i)=prod(365-rs(i)+1:365)/365A rs(i); end%用公式计算(改进) for i=1:le ngth(rs)for k=365-rs(i)+1:365p2(i)=p2(i)*(k/365); end ; end%用公式计算(取对数) for i=1:le ngth(rs)p1(i)=exp(sum(log(365-rs(i)+1:365))-rs(i)*log(365)); end公式计算P 1n!C NN nN!1 (N n)!1N nN (N 1) (N n 1)、随机数的生成3. 均匀分布随机数rand(m,n);产生m行n列的(0,1)均匀分布的随机数rand(n);产生n行n列的(0,1)均匀分布的随机数【练习】生成(a,b)上的均匀分布4. 正态分布随机数randn(m,n); 产生m行n列的标准正态分布的随机数【练习】生成N(nu,sigma42)上的正态分布5. 其它分布随机数三、一维随机变量的概率分布1. 离散型随机变量的分布率(1) 0-1分布(2) 均匀分布_ k k n k(3) 二项分布:binopdf(x,n,p),若X ~ B(n, p),则P{X k} C n p (1 p),x=0:9 ;n=9;p=0.3;y= bin opdf(x ,n, p);plot(x,y,'b-',x,y,'r*')y=[ 0.0404, 0.1556, 0.2668, 0.2668, 0.1715, 0.0735, 0.0210, 0.0039, 0.0004, 0.0000 ]当n较大时二项分布近似为正态分布x=0:100; n=100;p=0.3;y= bin opdf(x ,n, p);plot(x,y,'b-',x,y,'r*')ke⑷泊松分布:piosspdf(x, lambda),若X ~ (),贝U P{ X k}k!x=0:9; lambda = 3;y= poisspdf (x,lambda);plot(x,y,'b-',x,y,'r*')y=[ 0.0498, 0.1494, 0.2240, 0.2240, 0.1680, 0.1008, 0.0504, 0.0216, 0.0081,0.0027]k 1⑸几何分布:geopdf (x, p),贝U P{X k} p(1 p)x=0:9;p=0.3y= geopdf(x,p);plot(x,y,'b-',x,y,'r*')y=[ 0.3000, 0.2100, 0.1470, 0.1029, 0.0720, 0.0504, 0.0353, 0.0247, 0.0173, 0.0121 ] x=0:10;N=20;M=8; n=4;y= hygepdf(x,N,M, n); plot(x,y,'b-',x,y,'r*')y=[ 0.1022, 0.3633, 0.3814, 0.1387, 0.0144, 0, 0, 0, 0, 0, 0 ]2. 概率密度函数(1)均匀分布:unifpdf(x,a,b) , f (x)其它a=0;b=1;x=a:0.1:b; y= uni fpdf (x,a,b);1 2 厂(x )2 ■厂ex=-10:0.1:12;mu=1;sigma=4;y= no rmpdf(x,mu,sigma);rn=10000;z= normrnd (mu,sigma,1,rn); % 产生 10000 个正态分布的随机数 d=0.5;a=-10:d:12;b=(hist(z,a)/rn)/d;%以a 为横轴,求出10000个正态分布的随机数的频率(6)超几何分布:hygepdf(x,N,M,n),则 P{Xk}C k nM CNC N(2)正态分布:normpdf(x,mu,sigma) , f (x)plot(x,y,'b-',a,b,'r.')1 _x⑶指数分布:exppdf(x,mu), f (x)其它x=0:0.1:10;mu=1/2;■ t京■I_ey= exppdf(x,mu); plot(x,y,'b-',x,y,'r*')1n i F⑷2分布:chi2pdf(x,n) , f (x; n) 2n ^( n 2) % e x 0hold onx=0:0.1:30;n=4;y= chi2pdf(x, n);plot(x,y,'b');%blue n=6;y= chi2pdf(x, n);plot(x,y,'r');%red n=8;y=chi2pdf(x ,n );plot(x,y,'c');%cya n n=10;y= chi2pdf(x, n);plot(x,y,'k');%black lege nd(' n=4', 'n=6', 'n=8', 'n=10');n 1((n 1) 2) x2 2⑸t 分布:tpdf(x,n) , f (x; n) ------------------ 1 -J n (n. 2) nhold onx=-10:0.1:10;n=2;y= tpdf(x, n);plot(x,y,'b');%bluen=6;y= tpdf(x, n);plot(x,y,'r');%redn=10;y= tpdf(x ,n );plot(x,y,'c');%cya nn=20;y= tpdf(x, n);plot(x,y,'k');%black lege nd(' n=2', 'n=6', 'n=10', 'n=20');((m山m 门2n2) 2)小2% 2 1 5 % 2(n2 2) n2n2x 0(6) F 分布:fpdf(x,n1,n2) , f (x; n「n2) (E 2)0 x 0hold onx=0:0.1:10;n1=2; n2=6;y= fpdf(x, n1, n2);plot(x,y,'b');%bluen1=6; n2=10;y= fpdf(x, n1, n2);plot(x,y,'r');%red n1=10; n2=6;y= fpdf(x, n1, n2);plot(x,y,'c');%cyann1=10; n2=10;y= fpdf(x, n1,n 2);plot(x,y,'k');%black legend(' n仁2; n2=6', ' n1= 6; n2=10', ' n仁10;n2=6', ' n仁10; n2=10');3.分布函数F(x) P{X x}【例03.01】求正态分布的累积概率值设X ~ N(3,22),求 P{2 X 5}, P{ 4 X 10}, P{ X 2}, P{X 3},14.逆分布函数,临界值y F(x) P{X x} , x F (y) , x称之为临界值【例03.02】求标准正态分布的累积概率值y=0:0.01:1;x=normin v(y,0,1);【例03.03】求2(9)分布的累积概率值hold offy=[0.025,0.975];x=ch i2in v(y,9);n=9;x0=0:0.1:30;y0=chi2pdf(x0, n); plot(x0,y0, 'r'); x1=0:0.1:x(1);y1=chi2pdf(x1, n);x2=x(2):0.1:30;y2=chi2pdf(x2 ,n);hold onfill([x1, x(1)],[y1,0], 'b');fill([x(2),x2],[0,y2], 'b');【练习1.1】二项分布、泊松分布、正态分布(1)对n 10, p 0.2二项分布,画出b(n,p)的分布律点和折线;(2)对np,画出泊松分布()的分布律点和折线;(3)对np, 2叩(1 p),画出正态分布N( , 2)的密度函数曲线;(4)调整n, p,观察折线与曲线的变化趋势。
MATLAB数理统计分析

1. 3 MATLAB的开发环境
1.3.1 MATLAB桌面平台
桌面平台是各桌面组件的展示平台,默认设置情况下 的桌面平台包括4个窗口,即命令窗口(Command Window)、命令历史窗口(Command History)、当前目录 窗口(Current Directory)和工作空间窗口(Workspace)。此 外,MATLAB还有编译窗口、图形窗口和帮助窗口等其他 种类的窗口。
subplot(3,1,1) capaplot(data,[-inf,xalpha1]);axis([-3,3,0,0.45]) subplot(3,1,2) capaplot(data,[xalpha2,inf]);axis([-3,3,0,0.45]) subplot(3,1,3) capaplot(data,[-inf,xalpha3]);axis([-3,3,0,0.45]) hold on capaplot(data,[xalpha4,inf]);axis([-3,3,0,0.45]) hold off
hold off text(-0.5,yy(6)+0.005,'\fontsize{14}95.44%') text(-0.5,yy(5)+0.005,'\fontsize{14}68.26%') text(-0.5,yy(7)+0.005,'\fontsize{14}99.74%') text(-3.2,-0.03,'\fontsize{10}μ-3σ') text(-2.2,-0.03,'\fontsize{10}μ-2σ') text(-1.2,-0.03,'\fontsize{10}μ-σ') text(-0.05,-0.03,'\fontsize{10}μ') text(0.8,-0.03,'\fontsize{10}μ+σ') text(1.8,-0.03,'\fontsize{10}μ+2σ') text(2.8,-0.03,'\fontsize{10}μ+3σ')
数理统计的MATLAB求解

2019/3/2
8
3.1 随机变量及其分布
p2=binopdf(x,100,0.5);plot(x,p2,'*r');title('概率分布图')
2019/3/2
9
3.1 随机变量及其分布
例3.2设X~N(2,0.25) (1) 求概率P{1<X<2.5}; (2)绘制分布函数图象和分布密度图象; (3)画出区间[1.5,1.9]上的分布密度曲线下方区域。 程序:(1)p=normcdf(2.5,2,0.5)- normcdf(1,2,0.5) p = 0.8186 (2) x=0:0.1:4;px=normpdf(x,2,0.5); fx= normcdf(x,2,0.5); plot(x,px,'+b');hold on; plot(x,fx,'*r');legend('正态分布函数','正态分布密度'); (3) specs=[1.5,1.9]; pp=normspec(specs,2,0.5)
2019/3/2
10
3.1 随机变量及其分布
0.8 0.7
Probability Between Limits is 0.26209
0.6
0.5
Density
0.4
0.3
0.2
0.1
0
0
0.5
1
1.5
2 Critical Value
2.5
3
3.5
4
2019/3/2
11
3.2 随机变量函数的分布
2019/3/2
2
常见分布的随机数产生
2019/3/2
使用Matlab进行统计分析和假设检验的步骤

使用Matlab进行统计分析和假设检验的步骤统计分析在科学研究和实际应用中起着重要的作用,可以帮助我们理解和解释数据背后的信息。
而Matlab作为一种强大的数据处理和分析软件,不仅可以进行常见的统计分析,还能进行假设检验。
本文将介绍使用Matlab进行统计分析和假设检验的步骤,具体内容如下:1. 数据准备和导入首先,我们需要准备待分析的数据,并将其导入到Matlab中。
可以使用Matlab提供的函数来读取数据文件,例如`csvread`或`xlsread`函数。
确保数据被正确导入,并查看数据的整体情况和结构。
2. 描述性统计在进行进一步的统计分析之前,我们需要对数据进行描述性统计,以了解数据的基本特征。
Matlab提供了一些常用的描述性统计函数,例如`mean`、`std`和`var`等,可以帮助计算均值、标准差和方差等统计量。
此外,还可以绘制直方图、箱线图和散点图等图形,以便更好地理解数据的分布和关系。
3. 参数估计和假设检验接下来,我们可以使用Matlab进行参数估计和假设检验,以验证对数据的猜测和假设。
参数估计可以通过最大似然估计或贝叶斯估计来实现,并使用Matlab 提供的相应函数进行计算。
在假设检验方面,Matlab还提供了一些常用的函数,例如`ttest`、`anova`和`chi2test`等,可以用于检验两个或多个总体间的均值差异、方差差异或相关性等。
在使用这些函数进行假设检验时,需要指定显著性水平(通常是0.05),以决定是否拒绝原假设。
4. 非参数统计分析除了参数估计和假设检验外,Matlab还支持非参数统计分析方法。
非参数方法不依赖于总体分布的具体形式,因此更加灵活和广泛适用。
在Matlab中,可以使用`ranksum`、`kstest`和`signrank`等函数来进行非参数假设检验,例如Wilcoxon秩和检验和Kolmogorov-Smirnov检验等。
5. 数据可视化最后,在完成统计分析和假设检验后,我们可以使用Matlab提供的数据可视化工具来展示分析结果。
利用Matlab进行数据分析与统计方法详解

利用Matlab进行数据分析与统计方法详解数据分析和统计方法在现代科学、工程和商业领域中是非常重要的工具。
而Matlab作为一种强大的计算软件和编程语言,提供了丰富的功能和工具,可以帮助我们进行数据分析和统计。
一、Matlab数据分析工具介绍Matlab提供了许多数据分析工具,包括数据可视化、数据处理、统计分析等。
其中,数据可视化是数据分析中重要的一环,可以用于展示数据的分布、趋势和关系。
Matlab中的绘图函数可以绘制各种类型的图形,如折线图、散点图、柱状图等。
我们可以利用这些图形来直观地理解数据并发现潜在的模式。
二、常用的数据处理方法在进行数据分析之前,我们通常需要对数据进行预处理,以去除噪声、填补缺失值和标准化数据等。
Matlab提供了丰富的函数和工具来处理这些问题。
例如,可以使用滤波函数对信号进行平滑处理,使用插值函数填补缺失值,并使用标准化函数将数据转化为标准分布。
三、基本的统计分析方法在进行统计分析时,我们常常需要计算各种统计量,如均值、方差、标准差等。
Matlab提供了一系列统计函数,如mean、var和std等,可以轻松计算这些统计量。
此外,Matlab还提供了假设检验、方差分析、回归分析等高级统计方法的函数,方便我们进行进一步的研究。
四、数据挖掘和机器学习方法数据挖掘和机器学习是数据分析的前沿领域,能够从大量的数据中发现隐藏的模式和规律。
Matlab作为一种强大的计算工具,提供了丰富的数据挖掘和机器学习函数。
例如,可以利用聚类分析函数对数据进行聚类,使用分类函数进行分类,还可以使用神经网络函数构建和训练神经网络模型。
五、案例分析:利用Matlab进行股票市场分析为了更好地理解Matlab在数据分析和统计方法中的应用,我们以股票市场分析为例进行讲解。
股票市场是一个涉及大量数据和复杂关系的系统,利用Matlab可以对其进行深入分析。
首先,我们可以利用Matlab的数据导入和处理函数,将股票市场的历史数据导入到Matlab中,并对数据进行预处理,如去除异常值和填补缺失值。
数理统计方法的Matlab实现(6.5版)

数理统计的Matlab实现
[H,SIG,CI]=ttest2 (x, y, ,tail) 对两个正态总 体的均值作检验 若tail=0, 表示 H 1 : 1 2 若tail=1, 表示 H 1 : 1 2 若tail=-1,表示 H 1 : 1 2 结论:H=0,表示接受原假设 H 0 : 1 2 H=1,表示拒绝原假设 H 0 : 1 2 SIG为犯错误的概率,CI为均值差的置信区间。
因素A 因素B B1 B2 B3
A1 95 93 85 86 72 76 A2 A3 A4
97 96 87 89 90 91 89 90 84 87 92 90 75 73 85 86 88 89
AB2=[95 93 97 96 87 89 90 91;85 86 89 90 84 87 92 90;72 76 75 73 85 86 88 89 ] anova2(AB2',2)
数理统计的Matlab实现
例2自动包装机包装出的产品服从正态分 布 N (0.5 , 0.0152 ) ,从中抽取出9个样品,它们的 重量是 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512 问包装机的工作是否正常? ( =0.05) x=[0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512]; [H,SIG]=ztest(x, 0.5, 0.015, 0.05,0)
数理统计的Matlab实现
其中 y:y的 n 1 数据向量 x:x的数据 n m 矩阵 b: b0 , b1 ,, bm 的估计值 bint:b的置信区间 r:残差 rint :r的置信区间 stats:第一个值是回归方程的置信度,第二值是F统 计量的值,第三值小说明所建的回归方程有意义。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
正态总体均值、方差的参数估计与置信区间估计P316 例6.5.1 置信区间估计clear;Y=[14.85 13.01 13.50 14.93 16.97 13.80 17.95 13.37 16.29 12.38]; X=normrnd(15,2,10,1) % 随机产生数[muhat,sigmahat,muci,sigmaci]=normfit(X,0.1) % 正态拟合[muhat,sigmahat,muci,sigmaci]=normfit(Y,0.1) % 正态拟合X =15.257316.312912.664414.078814.475112.573712.361116.862415.022513.7097muhat =14.3318sigmahat =1.5595muci =13.427815.2358sigmaci =1.13742.5657muhat =14.7050sigmahat =1.8432muci =13.636515.7735sigmaci =1.34433.0324P320例6.5.5 置信区间估计clear;Y=[4.68 4.85 4.32 4.85 4.61 5.02 5.20 4.60 4.58 4.72 4.38 4.70]; [muhat,sigmahat,muci,sigmaci]=normfit(Y,0.05)muhat =4.7092sigmahat =0.2480muci =4.55164.8667sigmaci =0.17570.4211P321 例6.5.6 置信区间估计clear;Y=[45.3 45.4 45.1 45.3 45.5 45.7 45.4 45.3 45.6]; [muhat,sigmahat,muci,sigmaci]=normfit(Y,0.05) muhat =45.4000sigmahat =0.1803muci =45.261445.5386sigmaci =0.12180.3454单正态总体均值的假设检验方差sigma已知时P338 例7.2.1%[h,p,ci,zval]=ztest(X,mu,sigma,alpha,tail,dim)clear all;X=[ 8.05 8.15 8.2 8.1 8.25];[h,p,ci,zval]=ztest(X,8,0.2,0.05)h =p =0.0935ci =7.9747 8.3253zval =1.6771注:p为观察值的概率ci为置信区间;zval统计量值若h=0: 表示在显著性水平alpha下,不能否定原假设;若h=1: 表示在显著性水平alpha下,否定原假设;若tail=0:表示双边假设检验;若tail=1:表示单边假设检验(mu>mu0);若tail=0:表示单边假设检验(mu<mu0);dim表示根据指定的维数进行检验%[h,p,ci,zval]=ztest(X,mu,sigma,alpha)% X=normrnd(mu,sigma,N,M); 随机产生均值为mu,标准差为sigma的M行N例随机数;clear all;X=normrnd(100,5,100,1);mu=mean(X)sigmal=5;[h,p,ci,zval]=ztest(X,100,5,0.05)mu =99.8810h =p =0.8119ci =98.9011100.8610zval =-0.2379单正态总体均值的假设检验方差sigma未知时P338 例7.2.2%[h,p,ci,tstat]=ttest(X,mu0,alpha,tail,dim)clear all;X=[ 239.7 239.6 239 240 239.2];[h,p,ci,tstat]=ttest(X,240,0.05)h =1p =0.0491ci =239.0033 239.9967tstat =tstat: -2.7951df: 4sd: 0.4000注:p为观察值的概率ci为置信区间;tstat统计量值若h=0: 表示在显著性水平alpha下,不能否定原假设;若h=1: 表示在显著性水平alpha下,否定原假设;df为自由度;sd为样本标准背离若tail=0:表示双边假设检验;若tail=1:表示单边假设检验(mu>mu0);若tail=0:表示单边假设检验(mu<mu0);dim表示根据指定的维数进行检验单正态总体方差的假设检验总体均值未知时%[h,p,varci,stats]=vartest(x,var0,alpha,tail)clear all;X=[49.4 50.5 50.7 51.7 49.8 47.9 49.2 51.4 48.9];[h,p,varci,stats]=vartest(X,1.5,0.05,0)h =p =0.8383varci =0.6970 5.6072stats =chisqstat: 8.1481df: 8注:p为观察值的概率varci为方差的置信区间;stats 为卡方统计量的观测值若h=0: 表示在显著性水平alpha下,不能否定原假设;若h=1: 表示在显著性水平alpha下,否定原假设;df为自由度;若tail=0:表示双边假设检验;若tail=1:表示单边假设检验(mu>mu0);若tail=0:表示单边假设检验(mu<mu0);两正态总体均值差的假设检验方差未知但相等情形% h=ttest2(x,y,alpha,tail,vartype,dim)%样本X与Y在给定检验水平alpha下,进行双边(tail为0)或单边>(tail为+1)或单边<(tail为-1)且vartype('equal' or 'unequal')指定方差是否相等的假设检验P342例7.2.3clear all;X=[76.43 76.21 73.58 69.69 65.29 70.83 82.75 72.34];Y=[73.66 64.27 69.34 71.37 69.77 68.12 67.27 68.7];[h,sig,ci]=ttest2(X,Y,0.05,1,'equal')h =1sig =0.0290ci =0.6357 Inf注:h=1: 表明在alpha=0.05条件下,应拒绝原假设,即认为镍合金硬度有显著提高。
sig =0.0290:表明两个总体均值相等的概率;ci:表示均值差的置信区间两正态总体方差比的假设检验总体均值未知但时%[h,p,varci.stats]=vartest2(X,Y,alpha,tail)P345 例7.2.5clear all;X=[16.2 16.4 15.8 15.5 16.7 15.6 15.8];Y=[15.9 16.0 16.4 16.1 16.5 15.8 15.7 15.0];[h,p,varci,stats]=vartest2(X,Y,0.05,0)h =p =0.9232varci =0.1775 5.1754stats =fstat: 0.9087df1: 6df2: 7注:p为观察值的概率varci为方差的置信区间;stats 为卡方统计量的观测值fstat为F统计量的观测值;df1 df2分别为F分布的第一、第二自由度;若h=0: 表示在显著性水平alpha下,不能否定原假设,认为二台机床加工的精度一致。
若tail=0:表示双边假设检验;若tail=1:表示单边假设检验(mu>mu0);若tail=0:表示单边假设检验(mu<mu0);clear all;X=[20.1 20.0 19.3 20.6 20.2 19.9 20.0 19.9 19.1 19.9];Y=[18.6 19.1 20.0 20.0 20.0 19.7 19.9 19.6 20.2];[h,p,varci,stats]=vartest2(X,Y,0.05,0)h =p =0.5798varci =0.1567 2.8001stats =fstat: 0.6826df1: 9df2: 8Chi_Square(卡方)拟合优度检验检验样本是否服从指定的分布。
调用格式:1. h=chi2gof(X)检验样本X是否样本是否服从正态分布(原假设为样本服从正态分布)。
输出参数h为0(在显著性水平0.05下接受原假设,认为X服从正态分布)或1(在显著性水平0.05下拒绝原假设,认为X不服从正态分布)2.[h,p]=chi2gof(X)返回检验P值: 当P值小于或等于显著性水平alpha时,拒绝原假设,否则接受原假设。
3.[h,p,stats]=chi2gof(X)返回一个结构体变量stats,它包含字段:chi2stat: 卡方统计量;df: 自由度;edges: 合并后各区间的边界向量;O:落入每个小区间内观测的个数,即实际频数;E:每个小区间对应的理论频数4.[h,p,stats]=chi2gof(X,name1,vall,name2,val2,….)通过可选的成对出现的参数名与参数值来控制初始分组、原假设中的分布、显著性水平等。
等等其它调用格式,参见有关Matlab统计资料P357 例7.4.2clear all;bins=0:11;%总体分成的区间总类obsCounts=[57 203 383 525 532 408 273 139 45 27 10 6];%对应区间上样本观测值个数n=sum(obsCounts);%总的观测样本数据lambdaHat=sum(bins.*obsCounts) / n; %参数的MLE估计值expCounts = n * poisspdf(bins,lambdaHat);% 理论频数[h,p,st] = chi2gof(bins,'ctrs',bins,'frequency',obsCounts, ...'expected',expCounts,'nparams',1) %'frequency'指定观测值中出现的频数, 'expected'指定各区间的理论频数,'nparams'指定分布中待估参数的个数h =p =0.1692st =chi2stat: 12.8577df: 9edges: [-0.5000 0.5000 1.5000 2.5000 3.5000 4.5000 5.5000 6.5000 7.5000 8.5000 9.5000 11.5000]O: [57 203 383 525 532 408 273 139 45 27 16]E: [54.4187 210.5802 407.4339 525.5397 508.4113 393.4729 253.7659 140.2829 67.8554 29.1751 15.2612]注:h=0(p值>0.05)接受原假设: Poisson分布;P356 例7.4.1clear all;close;bins=1:6;%总体分成的区间总类obsCounts=[2 6 6 3 3 0];%对应区间上样本观测值个数n=sum(obsCounts);%总的观测样本数据expCounts=[n*0.1 n*0.2 n*0.3 n*0.2 n*0.1 n*0.1];%对应区间上的理论频数[h,p,st] = chi2gof(bins,'ctrs',bins,'frequency',obsCounts,'expected',expCounts,'nparams',0) %'nparams'指定分布中待估参数的个数h =p =0.5580st =chi2stat: 1.1667df: 2edges: [0.5000 2.5000 3.5000 6.5000]O: [8 6 6]E: [6 6 8]注:h=0(p值>0.05)接受原假设分布;clear all;bins=1:6;%总体分成的区间总类obsCounts=[2 6 6 3 3 0];%对应区间上样本观测值个数n=sum(obsCounts);%总的观测样本数据expCounts=[n*0.1 n*0.2 n*0.3 n*0.2 n*0.1 n*0.1];%对应区间上的理论频数[h,p,st]=chi2gof(bins,'ctrs',bins,'frequency',obsCounts,'expected',expCo unts,'frequency',obsCounts,'expected',expCounts,'frequency',obsCounts,'e xpected',expCounts,'frequency',obsCounts,'expected',expCounts,'frequency ',obsCounts,'expected',expCounts,'frequency',obsCounts,'expected',expCou nts) %'nparams'指定分布中待估参数的个数注:h=0(p 值>0.05) 接受原假设分布;例2 丢掷骰子100次,分别出现的点数为13次 14次 20次 17次 15次 21次 1点 2点 3点 4点 5点 6 点检验这粒骰子是否均匀?解:0H :均匀,即P {1点朝上}=……=P {6点朝上}=61 根据观测值:5667.166100>==i np 1.11)106(200.3)(216122=--<=-=-=∑αχχi i i i np np n⇒ 接受0H ,认为总体服从均匀分布,这粒骰子是均匀的.bins=1:6;%总体分成的区间总类obsCounts=[13 14 20 17 15 21];%对应区间上样本观测值个数n=sum(obsCounts);%总的观测样本数据 lambdaHat=1/6; %参数的MLE 估计值expCounts=[n*lambdaHat n*lambdaHat n*lambdaHat n*lambdaHat n*lambdaHat n*lambdaHat];% 理论频数,即均为100/6[h,p,st]=chi2gof(bins,'ctrs',bins,'frequency',obsCounts,'expected',expCo unts,'nparams',0) %'nparams'指定分布中待估参数的个数h = 0 p =0.6692 st =chi2stat: 3.2000 df: 5edges: [0.5000 1.5000 2.5000 3.5000 4.5000 5.5000 6.5000] O: [13 14 20 17 15 21]E: [16.6667 16.6667 16.6667 16.6667 16.6667 16.6667]说明:h=0(p 值>0.05)故接受原假设,认为总体服从均匀分布,这粒骰子是均匀的.例3 某工厂近5年发升63次事故,按星期几分类如下星期 一 二 三 四 五 六 次数 9 10 11 8 13 12问事故发生与否与星期几有关?解 0H :61)6()1(=====X P XP 5.106163=⨯==i x p n np X 1 2 3 4 5 6i n 9 10 11 8 13 12 i np 10.5 10.5 10.5 10.5 10.5 10.507.1167.1ˆ)ˆ(295.021122==≤=-=--=∑χχχ k ki i i i p n p n n接受0H 认为事故发生与星期几无关.bins=1:6;%总体分成的区间总类obsCounts=[ 9 10 11 8 13 12];%对应区间上样本观测值个数 n=sum(obsCounts);%总的观测样本数据 lambdaHat=1/6; %参数的MLE 估计值expCounts=[n*lambdaHat n*lambdaHat n*lambdaHat n*lambdaHat n*lambdaHat n*lambdaHat];% 理论频数,即均为63/6[h,p,st]=chi2gof(bins,'ctrs',bins,'frequency',obsCounts,'expected',expCo unts,'nparams',0) %'nparams'指定分布中待估参数的个数h = 0 p =0.8931 st =chi2stat: 1.6667 df: 5edges: [0.5000 1.5000 2.5000 3.5000 4.5000 5.5000 6.5000] O: [9 10 11 8 13 12]E: [10.5000 10.5000 10.5000 10.5000 10.5000 10.5000]说明:h=0(p 值>0.05)故接受原假设,认为事故发生与星期几无关.Klomogorov-Smirnov 检验Klomogorov-Smirnov 检验是检验任意已知分布函数的一种有效的假设检验算法。