实验5:概率统计实验

实验5:概率统计实验
实验5:概率统计实验

撰写人姓名:撰写时间:审查人姓名:

实验全过程记录实验

名称概率统计实验

时间2学时

地点数学实验室

姓名学号

同实验者学号

一、实验目的

1、掌握利用MATLAB处理简单的概率问题;

2、掌握利用MATLAB处理简单的数理统计问题。

二、实验内容:

1、熟练掌握几种常用的离散型、连续型随机变量的函数命令;

2、熟练掌握常用的描述样本数据特征的函数命令(如最值、均值、中位数(中值)、方差、标准差、几何平均值、调和平均值、协方差、相关系数等);

3、掌握常用的MATLAB统计作图方法(如直方图、饼图等);

4、能用MATLAB以上相关命令解决简单的数据处理问题;

5、熟练掌握常用的参数估计和假设检验的相关的函数命令;

6、能用参数估计和假设检验等相关命令解决简单的实际问题。

三、实验用仪器设备及材料

软件需求:

操作系统:Windows XP或更新的版本;

实用数学软件:MATLAB 7.0或更新的版本。

硬件需求:

Pentium IV 450以上的CPU处理器、512MB以上的内存、5000MB的自由硬盘空间、CD-ROM驱动器、打印机、打印纸等。

四、实验原理:

概率论与数理统计等相关理论

五、实验步骤:

1、对下列问题,请分别用专用函数和通用函数实现。

⑴X服从[3, 10]上均匀分布,计算P{X≤4},P{X>8};已知P{X>a}=0.4,求a。

p1=unifcdf(4,3,10)

p2=1-unifcdf(8,3,10)

p11=cdf('unif',4,3,10)

p22=1-cdf('unif',8,3,10)

unifinv(0.6,3,10)

icdf('unif',0.6,3,10)

p1 =

0.1429

p2 =

0.2857

p11 =

0.1429

p22 =

0.2857

ans =

7.2000

ans =

7.2000

⑵X服从正态分布N(2, 9),计算P{|X|≤1},P{|X|>5};已知P{X

p2=1-(normcdf(5,2,3)-normcdf(-5,2,3))

b=norminv(0.9,2,3)

p11=cdf('norm',1,2,3)-cdf('norm',-1,2,3)

p22=1-cdf('norm',5,2,3)+cdf('norm',-5,2,3)

icdf('norm',0.9,2,3)

p1 =

0.2108

p2 =

0.1685

b =

5.8447

p11 =

0.2108

p22 =

0.1685

ans =

5.8447

⑶X服从自由度为9的t分布,计算P{-2c},求c。

p1=tcdf(1,9)-tcdf(-2,9)

p11=cdf('t',1,9)-cdf('t',-2,9)

tinv(0.5,9)

icdf('t',0.5,9)

p1 =

0.7900

p11 =

0.7900

ans =

ans =

2、绘制下列图形,并比较参数变化对图形的影响。

μσ,为(-1,1),(0,0.4),(0,6),(1,1)时正态分布的概率密度函数图形;

⑴()2

x=1:0.1:10

y1=normpdf(x,-1,1)

subplot(2,2,1),plot(x,y1)

y2=normpdf(x,0,0.4^0.5)

subplot(2,2,2),plot(x,y2)

y3=normpdf(x,0,6^0.5)

subplot(2,2,3),plot(x,y3)

y4=normpdf(x,1,1)

subplot(2,2,4),plot(x,y4)

0510

0.02

0.04

0.06

0510

0.050.1

0.150.20510

0.050.10.150.20510

0.10.20.30.4

⑵ 参数n 为1,2,3,4,5时2

分布的概率密度函数图形。 x=1:0.1:10

y1=chi2pdf(x,1)

subplot(5,1,1),plot(x,y1) y2=chi2pdf(x,2)

subplot(5,1,2),plot(x,y2) y3=chi2pdf(x,3)

subplot(5,1,3),plot(x,y3) y4=chi2pdf(x,4)

subplot(5,1,4),plot(x,y4) y5=chi2pdf(x,5)

subplot(5,1,5),plot(x,y5)

1

2

3

4

5

6

7

8

9

10

00.20.41

2

3

4

5

6

7

8

9

10

00.20.41

2

3

4

5

6

7

8

9

10

00.20.41

2

3

4

5

6

7

8

9

10

00.10.21

2

3

4

5

6

7

8

9

10

00.10.2

求该样本的均值、方差、标准差、中位数、几何均值、最大值、最小值、极差并绘出数据的直方图及圆饼图。

>> x=[110.1 25.2 39.8 65.4 50.0 98.1 48.3 32.2 60.4 40.3];

>> av=mean(x)

av =

56.9800

>> D=var(x)

D =

768.5151

>> d=std(x)

d =

27.7221

>> z=median(x)

z =

49.1500

>> M=geomean(x)

M =

51.6111

>> max(x)

ans =

110.1000

>> min(x)

ans =

25.2000

Y =

84.9000

>> bar(x) >> pie(x)

4、下表一列出某高校自动化专业研究生招生规模及生源情况

表一 2005—2008年生源分布情况统计表

年级 来自学校

2005

2006 2007 2008 人数 比率 人数 比率 人数 比率 人数 比率 某高校 25 33% 13 19% 31 45% 23 35% 55所重点院校 6 8% 6 8% 5 7% 4 6%

合 计 76 70 69 66

请用常用的MATLAB 统计作图函数,分析表一中的数据,能否得出近四年招生规模缩小, 总体生源质量下降的结论?

2005

2005.5

20062006.5

2007

2007.5

2008

0102030405060

7080

合计

其他院校

某高校

重点院校

四年内总人数有减少,重点院校招生减少,其他变化不能确定。

5、某高校自动化学院现有教师80人。其中,教授24人,副教授32人;博士生导师18人,硕士生导师40人;教师队伍中具有博士学位的39人。请用三维圆饼图描述教师的组成,并在图中显示相应的人数及所占比例。

6、有两组(每组100个元素)正态随机数据,其均值为10,均方差为2,求95%的置信区间和参数估计值。

>> R=normrnd(10,2,1,100); >> [a,b,c,d]=normfit(R,0.05) a =

10.1824 b =

1.8533 c =

9.8147 10.5501 d =

1.6272

2.1529

7、分别使用金球和铂球测定引力常数。

⑴用金球测定观察值为:6.683 6.681 6.676 6.678 6.679 6.672;

⑵用铂球测定观察值为:6.661 6.661 6.667 6.667 6.664。

设测定值总体为()2

Nμσ,,μ和σ为未知。对⑴、⑵两种情况分别求μ和σ的置信度为0.9的置信区间。

>> a=[6.683 6.681 6.676 6.678 6.679 6.672];

>> b=[6.661 6.661 6.667 6.667 6.664];

>> [q w e r]=normfit(a,0.1)

q =

6.67816666666667

w =

0.00386867763799

e =

6.67498413748713

6.68134919584620

r =

0.00259994387179

0.00808266362696

>> [q w e r]=normfit(b,0.1)

q =

6.66400000000000

w =

0.00300000000000

6.66113982740089

6.66686017259910

r =

0.00194791550216

0.00711706707423

成绩评定:指导教师:

年月日

数据挖掘试验指导书

《商务数据分析》实验指导书(适用于国际经济与贸易专业) 江西财经大学国际经贸学院 编写人:戴爱明

目录 前言 (1) 实验一、SPSS Clementine 软件功能演练 (5) 实验二、SPSS Clementine 数据可视化 (9) 实验三、决策树C5.0 建模 (17) 实验四、关联规则挖掘 (30) 实验五、聚类分析(异常值检测) (38)

前言 一、课程简介 商务数据分析充分利用数据挖掘技术从大量商务数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。数据挖掘的广义观点:数据挖掘就是从存放在数据库,数据仓库或其他信息库中的大量的数据中“挖掘”有趣知识的过程。数据挖掘,又称为数据库中知识发现(Knowledge Discovery in Database, KDD),因此,数据挖掘和数据仓库的协同工作,一方面,可以迎合和简化数据挖掘过程中的重要步骤,提高数据挖掘的效率和能力,确保数据挖掘中数据来源的广泛性和完整性。另一方面,数据挖掘技术已经成为数据仓库应用中极为重要和相对独立的方面和工具。 数据挖掘有机结合了来自多学科技术,其中包括:数据库、数理统计、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索、图像与信号处理、空间数据分析等,这里我们强调商务数据分析所处理的是大规模数据,且其算法应是高效的和可扩展的。通过数据分析,可从数据库中挖掘出有意义的知识、规律,或更高层次的信息,并可以从多个角度对其进行浏览察看。所挖掘出的知识可以帮助进行商务决策支持。当前商务数据分析应用主要集中在电信、零售、农业、网络日志、银行等方面。

概率统计实验复习过程

§13.6 概率统计实验 [学习目标] 1. 会用Mathematica 求概率、均值与方差; 2. 能进行常用分布的计算; 3. 会用Mathematica 进行期望和方差的区间估计; 4. 会用Mathematica 进行回归分析。 概率统计是最需要使用计算机的领域,过去依靠计算器进行统计计算,由于计算机的普及得以升级换代。本节介绍Mathematica 自带的统计程序包,其中有实现常用统计计算的各种外部函数。 一、 样本的数字特征 1. 一元的情况 Mathematica 的内部没有数理统计方面的功能,但是带有功能强大的数理统计外部程序,由多个程序文件组成。它们在标准扩展程序包集的Statistic 程序包子集中,位于目录 D :\Mathematica\4.0\AddOns\StandardPackages\Statistics 下。通过查看Help ,可以找到包含所需外部函数的程序文件名。 在程序文件DescriptiveStatistics.m 中,含有实现一元数理统计基本计算的函数,常用的有: SampleRange[data] 求表data 中数据的极差(最大数减最小数)。 Median[data] 求中值。 Mean[data] 求平均值∑=n i i x n 1 1。 Variance[data] 求方差(无偏估计)∑=--n i i x x n 12)(11。 StandardDeviation[data] 求标准差(无偏估计)∑=--n i i x x n 1 2)(11。 VarianceMLE[data] 求方差∑=-n i i x x n 1 2)(1。 StandardDeviationMLE[data] 求标准差∑=-n i i x x n 1 2)(1。 实际上程序文件中的函数很多,这里只列出了最常用的函数,其它计算函数可以通过Help 浏览。 例1 给出一组样本值:6.5,3.8,6.6,5.7,6.0,6.4,5.3,计算样本个数、最大值、最小值、均值、方差、标准差等。

1_概率统计上机练习(给学生1)2017级

Matlab 概率论与数理统计一、matlab基本操作 1.画图 【例01.01】简单画图 【例01.02】填充,二维均匀随机数 hold off; x=[0,60];y0=[0,0];y60=[60,60]; x1=[0,30];y1=x1+30;

2. 排列组合 C=nchoosek(n,k):k n C C =,例nchoosek(5,2)=10, nchoosek(6,3)=20. prod(n1:n2):从n1到n2的连乘 【例01.03】至少有两个人生日相同的概率 公式计算n n n n N N n N N N N n N N N C n p )1()1(1)! (! 1!1+--?-=--=- = 365364 (3651)365364 3651 11365365365 365 rs rs rs ?-+-+=- =-?

二、随机数的生成 3.均匀分布随机数 rand(m,n); 产生m行n列的(0,1)均匀分布的随机数rand(n); 产生n行n列的(0,1)均匀分布的随机数 【练习】生成(a,b)上的均匀分布 4.正态分布随机数 randn(m,n); 产生m行n列的标准正态分布的随机数【练习】生成N(nu,sigma.^2)上的正态分布 5.其它分布随机数

三、一维随机变量的概率分布 1. 离散型随机变量的分布率 (1) 0-1分布 (2) 均匀分布 (3) 二项分布:binopdf(x,n,p),若~(,)X B n p ,则{}(1)k k n k n P X k C p p -==-, y=[ 0.0404, 0.1556, 0.2668, 0.2668, 0.1715, 0.0735, 0.0210, 0.0039, 0.0004, 0.0000 ] ‘当n 较大时二项分布近似为正态分布 x=0:100;n=100;p=0.3; y= binopdf(x,n,p); plot(x,y,'b-',x,y,'r*')

概率统计-习地的题目及答案详解(1)

习题一 1.1 写出下列随机试验的样本空间,并把指定的事件表示为样本点的集合: (1)随机试验:考察某个班级的某次数学考试的平均成绩(以百分制记分,只取整数); 设事件A 表示:平均得分在80分以上。 (2)随机试验:同时掷三颗骰子,记录三颗骰子点数之和; 设事件A 表示:第一颗掷得5点; 设事件B 表示:三颗骰子点数之和不超过8点。 (3)随机试验:一个口袋中有5只球,编号分别为1,2,3,4,5,从中取三个球; 设事件A 表示:取出的三个球中最小的号码为1。 (4)随机试验:某篮球运动员投篮练习,直至投中十次,考虑累计投篮的次数; 设事件A 表示:至多只要投50次。 (5)随机试验:将长度为1的线段任意分为三段,依次观察各段的长度。 1.2 在分别标有号码1~8的八张卡片中任抽一张。 (1)写出该随机试验的样本点和样本空间; (2)设事件A 为“抽得一张标号不大于4的卡片”,事件B 为“抽得一张标号为偶数的 卡片”,事件C 为“抽得一张标号能被3整除的卡片”。 试将下列事件表示为样本点的集合,并说明分别表示什么事件? (a )AB ; (b) B A +; (c) B ; (d) B A -; (e) BC ; (f) C B + 。 1.3 设A 、B 、C 是样本空间的事件,把下列事件用A 、B 、C 表示出来: (1)A 发生; (2)A 不发生,但B 、C 至少有一个发生; (3)三个事件恰有一个发生; (4)三个事件中至少有两个发生; (5)三个事件都不发生; (6)三个事件最多有一个发生; (7)三个事件不都发生。 1.4 设}10,,3,2,1{ =Ω,}5,3,2{=A ,}7,5,3{=B ,}7,4,3,1{=C ,求下列事件: (1)B A ; (2))(BC A 。 1.5 设A 、B 是随机事件,试证:B A AB A B B A +=-+-)()(。 1.6 在11张卡片上分别写上Probability 这11个字母,从中任意抽取7张,求其排列结果为ability 的概率。 1.7 电话号码由6位数字组成,每个数字可以是0,1,2,…,9中的任一个数字(但第一位不能为0),求电话号码是由完全不相同的数字组成的概率。 1.8 把10本不同的书任意在书架上放成一排,求其中指定的3本书恰好放在一起的概率。

西安交通大学概率论上机实验报告总结计划.docx

西安交通大学一、试验目的

概率论部分 1.了解 matlab 软件的基本命令与操作; 2.熟悉 matlab 用于描述性统计的基本菜单操作及命令; 3.会用 matlab 求密度函数值、分布函数值、随机变量分布的上 下侧分位数。 数理统计部分 1.熟悉 matlab 进行参数估计、假设检验的基本命令与操作. 2.掌握用 matlab 生成点估计量值的模拟方法 3.会用 matlab 进行总体数学期望和方差的区间估计。 4.会用 matlab 进行单个、两个正态总体均值的假设检验。 5.会用 matlab 进行单个、两个正态总体方差的假设检验。 二、试验问题 实验五、随机变量综合试验 实验内容 1.产生 ?(6),?(10), F(6,10) 和 t (6)四种随机数,并画出相应的频 率直方图; 2.在同一张图中画出了 N(0,1)和 t (6)随机数频率直方图,比较它 们的异同; 3.写出计算上述四种分布的分布函数值和相应上侧分位点命 令.

实验七、对统计中参数估计进行计算机模拟验 证实验内容: 1.产生服从给定分布的随机数,模拟密度函数或概率分布; 2.对分布包含的参数进行点估计,比较估计值与真值的误差; 3.对分布包含的参数进行区间估计,行区间估计,可信度。 三、实验源程序及结果 实验 5 源程序: %清空内存,清空输出屏幕 clc;clear; %首先是指数分布 n = normpdf(-2::14,6); %绘制频率直方图 plot(-2::14,n,'color','r','linewidth',2); ylabel(' 概率密度 '); title('正态分布概率密度'); %t 分布 h1 = figure; t = tpdf(-3::3,6); plot(-3::3,t,'color','g','linewidth',2); ylabel(' 对应频率 '); title('t分布频率密度'); %F 分布 h2 = figure; f = fpdf(0::10,6,10); plot(0::10,f,'color','k','linewidth',2); ylabel(' 对应频率 '); title('F分布频率直方图'); %卡方分布 h3 = figure; ka = chi2pdf(0::15,6); plot(0::15,ka,'color','y','linewidth',2); ylabel(' 对应频率 '); title('卡方分布频率直方图'); %再来绘图 h4 = subplot(2,1,1); y1=normpdf(-10::10,0,1);

实验5:概率统计实验

撰写人姓名:撰写时间:审查人姓名: 实验全过程记录实验 名称概率统计实验 时间2学时 地点数学实验室 姓名学号 同实验者学号 一、实验目的 1、掌握利用MATLAB处理简单的概率问题; 2、掌握利用MATLAB处理简单的数理统计问题。 二、实验内容: 1、熟练掌握几种常用的离散型、连续型随机变量的函数命令; 2、熟练掌握常用的描述样本数据特征的函数命令(如最值、均值、中位数(中值)、方差、标准差、几何平均值、调和平均值、协方差、相关系数等); 3、掌握常用的MATLAB统计作图方法(如直方图、饼图等); 4、能用MATLAB以上相关命令解决简单的数据处理问题; 5、熟练掌握常用的参数估计和假设检验的相关的函数命令; 6、能用参数估计和假设检验等相关命令解决简单的实际问题。 三、实验用仪器设备及材料 软件需求: 操作系统:Windows XP或更新的版本; 实用数学软件:MATLAB 7.0或更新的版本。 硬件需求: Pentium IV 450以上的CPU处理器、512MB以上的内存、5000MB的自由硬盘空间、CD-ROM驱动器、打印机、打印纸等。 四、实验原理: 概率论与数理统计等相关理论 五、实验步骤: 1、对下列问题,请分别用专用函数和通用函数实现。 ⑴X服从[3, 10]上均匀分布,计算P{X≤4},P{X>8};已知P{X>a}=0.4,求a。 p1=unifcdf(4,3,10) p2=1-unifcdf(8,3,10) p11=cdf('unif',4,3,10) p22=1-cdf('unif',8,3,10) unifinv(0.6,3,10) icdf('unif',0.6,3,10) p1 =

西安交大概率论上机实验报告材料

概率论上机实验报告 实验目的 1. 学习使用MATLAB 中常见分布相关的命令; 2. 学习绘制概率分布律与分布函数图形; 3. 利用随机数对随机事件进行模拟; 4. 体会随机事件发生频率与概率的关系,加深对概率论的理解。 实验内容 1. 列出常见分布的概率密度及分布函数的命令,并操作。 2. 掷硬币150次,其中正面出现的概率为0.5,这150次中正面出现的次数记为X , (1) 试计算45=X 的概率和45≤X 的概率; (2)绘制分布函数图形和概率分布律图形。 3. 用Matlab 软件生成服从二项分布的随机数,并验证泊松定理。 4. 设22221),(y x e y x f +-=π是一个二维随机变量的联合概率密度函数,画出这一函数的联合概率密度图像。 5. 来自某个总体的样本观察值如下,计算样本的样本均值、样本方差、画出频率直方图。 A=[16 25 19 20 25 33 24 23 20 24 25 17 15 21 22 26 15 23 22 20 14 16 11 14 28 18 13 27 31 25 24 16 19 23 26 17 14 30 21 18 16 18 19 20 22 19 22 18 26 26 13 21 13 11 19 23 18 24 28 13 11 25 15 17 18 22 16 13 12 13 11 09 15 18 21 15 12 17 13 14 12 16 10 08 23 18 11 16 28 13 21 22 12 08 15 21 18 16 16 19 28 19 12 14 19 28 28 28 13 21 28 19 11 15 18 24 18 16 28 19 15 13 22 14 16 24 20 28 18 18 28 14 13 28 29 24 28 14 18 18 18 08 21 16 24 32 16 28 19 15 18 18 10 12 16 26 18 19 33

概率论与数理统计课程教学大纲

《概率论与数理统计》课程教学大纲 (2002年制定 2004年修订) 课程编号: 英文名:Probability Theory and Mathematical Statistics 课程类别:学科基础课 前置课:高等数学 后置课:计量经济学、抽样调查、试验设计、贝叶斯统计、非参数估计、统计分析软件、时间序列分析、统计预测与决策、多元统计分析、风险理论 学分:5学分 课时:85课时 修读对象:统计学专业学生 主讲教师:杨益民等 选定教材:盛骤等,概率论与数理统计,北京:高等教育出版社,2001年(第三版) 课程概述: 本课程是统计学专业的学科基础课,是研究随机现象统计规律性的一门数学课程,其理论及方法与数学其它分支、相互交叉、渗透,已经成为许多自然科学学科、社会与经济科学学科、管理学科重要的理论工具。由于其具有很强的应用性,特别是随着统计应用软件的普及和完善,使其应用面几乎涵盖了自然科学和社会科学的所有领域。本课程是统计专业学生打开统计之门的一把金钥匙,也是经济类各专业研究生招生考试的重要专业基础课。本课程由概率论与数理统计两部分组成。概率论部分侧重于理论探讨,介绍概率论的基本概念,建立一系列定理和公式,寻求解决统计和随机过程问题的方法。其中包括随机事件和概率、随机变量及其分布、随机变量的数字特征、大数定律和中心极限定理等内容;数理统计部分则是以概率论作为理论基础,研究如何对试验结果进行统计推断。包括数理统计的基本概念、参数统计、假设检验、非参数检验、方差分析和回归分析等。 教学目的: 通过本课程的学习,要求能够理解随机事件、样本空间与随机变量的基本概念,掌握概率的运算公式,常见的各种随机变量(如0-1分布、二项分布、泊松(Poisson)分布、均匀分布、正态分布、指数分布等)的表述、性质、数字特征及其应用,一维随机变量函数的分布、二维随机变量的和分布、顺序统计量的分布。理解数学期望、方差、协方差与相关系数的本质涵义,掌握数学期望、方差、协方差与相关系数的性质,熟练运用各种计算公式。了解大数定律和中心极限定量的内容及应用,熟悉数据处理、数据分析、数据推断的各种基本方法,能用所掌握的方法具体解决所遇到的各种社会经济问题,为学生进一步学习统计专业课打下坚实的基础。 教学方法: 本课程具有很强的应用性,在教学过程中要注意理论联系实际,从实际问题出发,通过抽象、概括,引出新的概念。由于本课程是研究随机现象的科学,学生之前从未接触过,学习起来会感到难度较大,授课时应突出重点,讲清难点。要使学生明白,本课程主要研究哪些方面的问题,从何角度、用何原理和方法进行研究的,是怎样研究的,得到哪些结论,如何用这些方法和结论处理今后遇到的社会经济问题。在教育中要坚持以人为本,全面体现学生的主体地位,教师应充分发挥引导作用,注意随时根据学生的理解状况调整教学进度。授课要体现两方面的作用:一是为学生自学准备必要的理论知识和方法,二是激发学生学习兴趣,引导学生自学。在教学中要体现计算机辅助

概率统计实验报告(三)剖析

线性回归实验报告(三) 实验目的:通过本次实验,了解matlab和spss在非参数检验中的应用,学会用matlab和spss做非参数假设检验,主要包括单样本和多样本非参数假设检验。 实验内容: 1.单样本假设检验; 2.多样本假设检验. 实验结果与分析: 1.单样本K-S儿童身高 操作步骤: ⑴分析-非参数检验-旧对话框-1-样本KS; ⑵将“周岁儿童身高”变换到检验变量列表,由于样本量太少,点击精确按钮,选择精确检验方法; ⑶回到K-S检验对话框,点击选项按钮,设置输出参数,勾选描述性和四分位数; ⑷输出检验结果。 从图形特征上看,儿童身高的分布非常接近正态分布,但是仍需要用K-S来检验

诊断。 结论:K-S检验统计量Z值为0.936,显著性为0.344,大于显著性水平0.05,所以不能拒绝原假设,认为周岁儿童的身高服从正态分布。 2.单样本游程——电缆 操作步骤: ⑴分析-非参数检验-旧对话框-游程; ⑵将“耐电压值”变换到检验变量列表; ⑶回到游程检验对话框,点击选项按钮,设置输出参数,勾选描述性和四分位数; ⑷输出检验结果。

结论:中位数渐进显著性为0.491,平均数和众数为1,大于显著性水平0.05,所以不能拒绝原假设,所以该组电缆耐电压值是随机的。 3.多独立样本——儿童身高 操作步骤: ⑴分析-非参数检验-旧对话框-K个独立样本检验; ⑵将“周岁儿童身高”变换到检验变量列表;将“城市标志”变换到分组变量,设置分组变量范围; ⑶回到多独立样本检验对话框,点击选项按钮,设置输出参数,勾选描述性和四分位数; ⑷输出检验结果。

结论:多个样本的K-W检验,即秩和检验目的是看各总体的位置参数是否一样,渐近显著性值为0.003,小于显著性水平0.05,所以拒绝原假设,因而四个城市儿童身高的分布存在显著性差异。 4.多样本配对——促销方式 操作步骤: ⑴分析-非参数检验-旧对话框-K个相关样本检验; ⑵将“促销形式1”、“促销形式2”、“促销形式3”变换到检验变量列表; ⑶回到多个关联样本检验对话框,点击选项按钮,设置输出参数,勾选描述性和四分位数; ⑷输出检验结果。

统计学上机实习心得体会

统计学上机实习心得体会 在本学期的统计学实验课上你一定做了许多类型的实验让你受益菲浅吧!小编收集了统计学上机实习心得体会欢迎阅读为期半个学期的统计学实验就要结束了这段以来我们主要通过excl软件对一些数据进行处理比如抽样分析方差分析等经过这段时间的学习我学到了很多掌握了很多应用软件方面的知识真正地学与实践相结合加深知识掌握的同时也锻炼了操作能力回顾整个学习过程我也有很多体会 统计学是比较难的一个学科作为工商专业的一名学生统计学对于我们又是相当的重要因此每次实验课我都坚持按时到实验室试验期间认真听老师讲解看老师操作然后自己独立操作数遍不懂的问题会请教老师和同学有时也跟同学商量找到更好的解决方法几次实验课下来我感觉我的能力确实提高了不少统计学是应用数学的一个分支主要通过利用概率论建立数学模型收集所观察系统的数据进行量化的分析、总结并进而进行推断和预测为相关决策提供依据和参考它被广泛的应用在各门学科之上从物理和社会科学到人文科学甚至被用来工商业及政府的情报决策之上可见统计学的重要性认真学习显得相当必要为以后进入社会有更好的竞争力也为多掌握一门学科对自己对社会都有好处 几次的实验课我每次都有不一样的体会个人是理科出来的对这种数理类的课程本来就很感兴趣经过书本知识的学习和实验的实践操作更加加深了我的兴趣每次做实验后回来我还会不定时再独立操

作几次为了不忘记操作方法这样做可以加深我的记忆根据记忆曲线的理论学而时习之才能保证对知识和技能的真正以及掌握更久的掌握就拿最近一次实验来说吧我们做的是“平均发展速度”的问题这是个比较容易的问题但是放到软件上进行操作就会变得麻烦书本上只是直接给我们列出了公式但是对于其中的原理和意义我了解的还不够多在做实验的时候难免会有很多问题不奇怪的是这次试验好多人也都是不明白操作不好不像以前几次试验老师讲完我们就差不多掌握了但是这次似乎遇到了大的麻烦因为内容比较多又是一些没接触过的东西我个人感觉最有挑战性也最有意思的就是编辑公式这个东西必须认真听认真看稍微走神就会什么都不知道很显然刚开始我是遇到了麻烦还好在老师的再次讲解下我终于大致明白了回到寝室立马独自专研了好久到现在才算没什么问题了 实验的时间是有限的对于一个文科专业来说能有操作的机会不是很多而真正利用好这些难得的机会对我们的大学生涯有很大意义不仅是学习上能掌握具体的应用方法我感觉更大的意义是对以后人生路的作用我们每天都在学习理论久而久之就会变成书呆子问什么都知道但是要求做一次就傻了眼这肯定是教育制度的问题和学校的设施问题但是如果我们能利用好很少的机会去锻炼自己得到的好处会大于他自身的价值很多倍例如在实验过程中如果我们要做出好的结果就必须要有专业的统计人才和认真严肃的工作态度这就在我们的实践工作中不知觉中知道一丝不苟的真正内涵以后的工作学习我们再把这些应用于工作学习肯定会很少被挫折和浮躁打败因为统计

概率统计实验报告

概率统计实验报告 班级16030 学号16030 姓名 2018 年1 月3 日

1、 问题概述和分析 (1) 实验内容说明: 题目12、(综合性实验)分析验证中心极限定理的基本结论: “大量独立同分布随机变量的和的分布近似服从正态分布”。 (2) 本门课程与实验的相关内容 大数定理及中心极限定理; 二项分布。 (3) 实验目的 分析验证中心极限定理的基本结论。 2、实验设计总体思路 2.1、引论 在很多实际问题中,我们会常遇到这样的随机变量,它是由大量的相互独立的随机 因素的综合影响而形成的,而其中每一个个别因素在总的影响中所起的作用是微小的,这种随机变量往往近似的服从正态分布。 2.2、 实验主题部分 2.2.1、实验设计思路 1、 理论分析 设随机变量X1,X2,......Xn ,......独立同分布,并且具有有限的数学期望和方差:E(Xi)=μ,D(Xi)=σ2(k=1,2....),则对任意x ,分布函数 满足 该定理说明,当n 很大时,随机变量 近似地服从标准正 态分布N(0,1)。因此,当n 很大时, 近似地服从正 态分布N(n μ,n σ2). 2、实现方法(写清具体实施步骤及其依据) (1) 产生服从二项分布),10(p b 的n 个随机数, 取2.0=p , 50=n , 计算n 个随 机数之和y 以及 ) 1(1010p np np y --; 依据:n 足够大,且该二项分布具有有限的数学期望和方差。 (2) 将(1)重复1000=m 组, 并用这m 组 ) 1(1010p np np y --的数据作频率直方图进 行观察. 依据:通过大量数据验证随机变量的分布,且符合极限中心定理。

西安交大概率论上机实验报告 西安交通大学概率论实验报告

概率论与数理统计上机实验报告

一、实验内容 使用MATLAB 软件进行验证性实验,掌握用MATLAB 实现概率统计中的常见计算。本次实验包括了对二维随机变量,各种分布函数及其图像以及频率直方图的考察。 1、列出常见分布的概率密度及分布函数的命令,并操作。 2、掷硬币150次,其中正面出现的概率为0.5,这150次中正面出现的次数记为X , (1) 试计算45=X 的概率和45≤X 的概率; (2) 绘制分布函数图形和概率分布律图形。 3、用Matlab 软件生成服从二项分布的随机数,并验证泊松定理。 4、设2 2221),(y x e y x f +-=π是一个二维随机变量的联合概率密度函数,画出这 一函数的联合概率密度图像。 5、来自某个总体的样本观察值如下,计算样本的样本均值、样本方差、画出频率直方图。 A=[16 25 19 20 25 33 24 23 20 24 25 17 15 21 22 26 15 23 22 20 14 16 11 14 28 18 13 27 31 25 24 16 19 23 26 17 14 30 21 18 16 18 19 20 22 19 22 18 26 26 13 21 13 11 19 23 18 24 28 13 11 25 15 17 18 22 16 13 12 13 11 09 15 18 21 15 12 17 13 14 12 16 10 08 23 18 11 16 28 13 21 22 12 08 15 21 18 16 16 19 28 19 12 14 19 28 28 28 13 21 28 19 11 15 18 24 18 16 28 19 15 13 22 14 16 24 20 28 18 18 28 14 13 28 29 24 28 14 18 18 18 08 21 16 24 32 16 28 19 15 18 18 10 12 16 26 18 19 33 08 11 18 27 23 11 22 22 13 28 14 22 18 26 18 16 32 27 25 24 17 17 28 33 16 20 28 32 19 23 18 28 15 24 28 29 16 17 19 18] 6. 利用Matlab 软件模拟高尔顿板钉试验。 7. 自己选择一个与以上问题不同类型的概率有关的建模题目,并解决。 二、实验目的 1.要求能够利用MATLAB 进行统计量的运算。 2.要求能够使用常见分布函数及其概率密度的命令语句。 3.要求能够利用MATLAB 计算某随机变量的概率。 4.要求能够利用MATLAB 绘制频率直方分布图。

大学概率论与数理统计上机报告

概率论与数理统计 第一次上机 专业:信息与计算科学 班级:信计1502(35组) 学生姓名:吕瑞杰陈炎睿何芝芝指导教师:张志刚 完成时间:2020年3月23日

Matlab 概率论与数理统计(LX1) 【练习1.1】二项分布、泊松分布、正态分布 (1) 对10,0.2n p ==二项分布,画出(,)b n p 的分布律点和折线; (2) 对np λ=,画出泊松分布()πλ的分布律点和折线; (3) 对2,(1)np np p μσ==-,画出正态分布2(,)N μσ的密度函数曲线; (4) 调整,n p ,观察折线与曲线的变化趋势。 理论分析: (1)因为x 为二项分布,所以有:; )2.01(2.0)(); 2.010(~k k k n C k Pn B X -=, (2)根据泊松分布公式得:); 2(~; 22.0*10np P X ===λ (3)由题意得正态分布有:); 6.1,2(~; 6.1)1(,22N X p np np =-===σμ (4)改变n 和p 的取值。 Matlab 程序: x=0:10;n=10;p=0.2; y=binopdf(x,n,p); y1=poisspdf(x,n*p); x1=-4:0.1:10; y2=normpdf(x1,n*p,sqrt(n*p*(1-p))); plot(x,y,'b-',x,y,'b.',x,y1,'r-',x,y1,'r.',x1,y2,'k-');

(4) 设n=20,p=0.3; 则λ=6;μ=6,; (新代码) x=0:10;n=20;p=0.3; y=binopdf(x,n,p); y1=poisspdf(x,n*p); x1=-2:0.1:12; y2=normpdf(x1,n*p,sqrt(n*p*(1-p))); plot(x,y,'b-',x,y,'b.',x,y1,'r-',x,y1,'r.',x1,y2,'k-'); (图形)

概率论与数理统计数学实验

概率论与数理统计数学实验 目录 实验一几个重要的概率分布的MATLAB实现 p2-3实验二数据的统计描述和分析 p4-8实验三参数估计 p9-11实验四假设检验 p12-14实验五方差分析 p15-17实验六回归分析 p18-27

实验一 几个重要的概率分布的MATLAB 实现 实验目的 (1) 学习MATLAB 软件与概率有关的各种计算方法 (2) 会用MATLAB 软件生成几种常见分布的随机数 (3) 通过实验加深对概率密度,分布函数和分位数的理解 Matlab 统计工具箱中提供了约20种概率分布,对每一种分布提供了5种运算功能,下表给出了常见8种分布对应的Matlab 命令字符,表2给出了每一种运算功能所对应的Matlab 命令字符。当需要某一分布的某类运算功能时,将分布字符与功能字符连接起来,就得到所要的命令。 例1 求正态分布()2,1-N ,在x=处的概率密度。 解:在MATLAB 命令窗口中输入: normpdf,-1,2) 结果为: 例2 求泊松分布()3P ,在k=5,6,7处的概率。 解:在MATLAB 命令窗口中输入: poisspdf([5 6 7],3) 结果为: 例3 设X 服从均匀分布()3,1U ,计算{}225P X .-<<。 解:在MATLAB 命令窗口中输入: unifcdf,1,3)-unifcdf(-2,1,3) 结果为:

例4 求概率995.0=α的正态分布()2,1N 的分位数αX 。 解:在MATLAB 命令窗口中输入: norminv,1,2) 结果为: 例5 求t 分布()10t 的期望和方差。 解:在MATLAB 命令窗口中输入: [m,v]=tstat(10) m = 0 v = 例6 生成一个2*3阶正态分布的随机矩阵。其中,第一行3个数分别服从均值为1,2,3;第二行3个数分别服从均值为4,5,6,且标准差均为的正态分布。 解:在MATLAB 命令窗口中输入: A=normrnd([1 2 3;4 5 6],,2,3) A = 例7 生成一个2*3阶服从均匀分布()3,1U 的随机矩阵。 解:在MATLAB 命令窗口中输入: B=unifrnd(1,3,2,3) B = 注:对于标准正态分布,可用命令randn(m,n);对于均匀分布()1,0U ,可用命令rand(m,n)。

概率论上机实验报告资料

西安交通大学 概率论实验报告 计算机36班 南夷非 2130505135 2014年12月13日

一、实验目的 1.熟练掌握MATLAB 软件关于概率分布作图的基本操作,会进行常用的概率密度函数和分布函数的作图,绘出分布律图形。 2.利用MATLAB 软件解决一些概率论问题在实际生活中的应用。 二、实验内容 1.二项分布的泊松分布与正态分布的逼近 设 X ~ B(n ,p) ,其中np=2 1) 对n=101,…,105,讨论用泊松分布逼近二项分布的误差。 画处逼近的图形 2) 对n=101,…,105, 计算 )505(≤

纸的需求量X的分布律为 试确定报纸的最佳购进量n。(要求使用计算机模拟) 4.蒲丰投针实验 取一张白纸,在上面画出多条间距为d的平行直线,取一长度为r(r

概率论与数理统计实验报告

概率论与数理统计 实验报告 概率论部分实验二 《正态分布综合实验》

实验名称:正态分布综合实验 实验目的:通过本次实验,了解Matlab在概率与数理统计领域的应用,学会用matlab做概率密度曲线,概率分布曲线,直方图,累计百分比曲线等简单应用;同时加深对正态分布的认识,以更好得应用之。 实验内容: 实验分析: 本次实验主要需要运用一些matlab函数,如正态分布随机数发生器normrnd函数、绘制直方图函数hist函数、正态分布密度函数图形绘制函数normpdf函数、正态分布分步函数图形绘制函数normcdf等;同时,考虑到本次实验重复性明显,如,分别生成100,1000,10000个服从正态分布的随机数,进行相同的实验操作,故通过数组和循环可以简化整个实验的操作流程,因此,本次实验程序中要设置数组和循环变量。 实验过程: 1.直方图与累计百分比曲线 1)实验程序 m=[100,1000,10000]; 产生随机数的个数 n=[2,1,0.5]; 组距 for j=1:3 for k=1:3 x=normrnd(6,1,m(j),1); 生成期望为6,方差为1的m(j)个 正态分布随机数

a=min(x); a为生成随机数的最小值 b=max(x); b为生成随机数的最大值 c=(b-a)/n(k); c为按n(k)组距应该分成的组数 subplot(1,2,1); 图形窗口分两份 hist(x,c);xlabel('频数分布图'); 在第一份里绘制频数直方图 yy=hist(x,c)/1000; yy为各个分组的频率 s=[]; s(1)=yy(1); for i=2:length(yy) s(i)=s(i-1)+yy(i); end s[]数组存储累计百分比 x=linspace(a,b,c); subplot(1,2,2); 在第二个图形位置绘制累计百分 比曲线 plot(x,s,x,s);xlabel('累积百分比曲线'); grid on; 加网格 figure; 另行开辟图形窗口,为下一个循 环做准备 end end 2)实验结论及过程截图 实验结果以图像形式展示,以下分别为产生100,1000,10000个正态分布随机数,组距分别为2,1,0.5的频数分布直方图和累积百分比曲线,从实验结果看来,随着产生随机数的数目增多,组距减小,累计直方图逐渐逼近正态分布密度函数图像,累计百分比逐渐逼近正态分布分布函数图像。

数学实验四(概率论)_6

数学实验四(概率论) 一.用MATLAB 计算随机变量的分布 1.用MA TLAB 计算二项分布 当随变量(),X B n p 时,在MATLAB 中用命令函数 (,,)Px binopdf X n p = 计算某事件发生的概率为p 的n 重贝努利试验中,该事件发生的次数为X 的概率。 例1 在一级品率为0.2的大批产品中,随机地抽取20个产品,求其中有2个一级品的概率。 解 在MATLAB 中,输入 >>clear >> Px=binopdf(2,20,0.2) Px = 0.1369 即所求概率为0.1369。 2.用MA TLAB 计算泊松分布 当随变量()X P λ 时,在MATLAB 中用命令函数 (,)P poisspdf x lambda = 计算服从参数为lambda 的泊松分布的随机变量取值x 的概率。用命令函数 (,)P poisscdf x lambda = 计算服从参数为lambda 的泊松分布的随机变量在[]0,x 取值的概率。 例2 用MATLAB 计算:保险公司售出某种寿险保单2500份.已知此项寿险每单需交保费120元,当被保人一年内死亡时,其家属可以从保险公司获得2万元的赔偿(即保额为2万元).若此类被保人一年内死亡的概率0.002,试求: (1)保险公司的此项寿险亏损的概率; (2)保险公司从此项寿险获利不少于10万元的概率; (3)获利不少于20万元的概率. 利用泊松分布计算. 25000.0025np λ==?= (1) P(保险公司亏本)= ()()15 250025000(3020)1(15)10.0020.998k k k k P X P X C -=-<=-≤=- ?∑ =15 5 051! k k e k -=-∑ 在MATLAB 中,输入 >> clear >> P1=poisscdf(15,5) P1 = 0. 9999 即 15 5 05! k k e k -=∑= P1 =0.9999 故 P(保险公司亏本)=1-0.9999=0.0001

概率论与数理统计实验报告

概率论与数理统计实验报告 一、实验目的 1.学会用matlab求密度函数与分布函数 2.熟悉matlab中用于描述性统计的基本操作与命令 3.学会matlab进行参数估计与假设检验的基本命令与操作 二、实验步骤与结果 概率论部分: 实验名称:各种分布的密度函数与分布函数 实验内容: 1.选择三种常见随机变量的分布,计算它们的方差与期望<参数自己设 定)。 2.向空中抛硬币100次,落下为正面的概率为0.5,。记正面向上的次数 为x, (1)计算x=45和x<45的概率, (2)给出随机数x的概率累积分布图像和概率密度图像。 3.比较t(10>分布和标准正态分布的图像<要求写出程序并作图)。 程序: 1.计算三种随机变量分布的方差与期望 [m0,v0]=binostat(10,0.3> %二项分布,取n=10,p=0.3 [m1,v1]=poisstat(5> %泊松分布,取lambda=5 [m2,v2]=normstat(1,0.12> %正态分布,取u=1,sigma=0.12 计算结果: m0 =3 v0 =2.1000 m1 =5 v1 =5 m2 =1 v2 =0.0144 2.计算x=45和x<45的概率,并绘图 Px=binopdf(45,100,0.5> %x=45的概率 Fx=binocdf(45,100,0.5> %x<45的概率 x=1:100。 p1=binopdf(x,100,0.5>。 p2=binocdf(x,100,0.5>。 subplot(2,1,1>

plot(x,p1> title('概率密度图像'> subplot(2,1,2> plot(x,p2> title('概率累积分布图像'> 结果: Px =0.0485 Fx =0.1841 3.t(10>分布与标准正态分布的图像 subplot(2,1,1> ezplot('1/sqrt(2*pi>*exp(-1/2*x^2>',[-6,6]> title('标准正态分布概率密度曲线图'> subplot(2,1,2> ezplot('gamma((10+1>/2>/(sqrt(10*pi>*gamma(10/2>>*(1+x^2/10>^(-(10+1>/2>',[-6,6]>。b5E2RGbCAP title('t(10>分布概率密度曲线图'> 结果:

《非参数统计》实验教学大纲

《非参数统计》课程实验教学大纲 大纲制定(修订)时间: 2017 年 6 月 课程名称:《非参数统计》课程编码:090531007 课程类别:专业基础课课程性质:必修 适用专业:应用统计学 课程总学时:40 实验(上机)计划学时:8 开课单位:理学院 一、大纲编写依据 1.应用统计学专业2017版教学计划; 2.应用统计学专业《非参数统计》理论教学大纲对实验环节的要求; 3.近年来《非参数统计》实验教学经验。 二、实验课程地位及相关课程的联系 1. 非参数统计是应用统计学专业学生的一门专业基础必修课。 2.本实验以《概率论与数理统计》为先修课; 3.与《数理统计》课程相辅相成。 三、实验目的、任务和要求 1.开设本课程的目的是为了满足日后学生参加统计调查实践工作的需要。 2.掌握单样本模型、两样本位置模型、多样本分类数据模型中的各种非参数统计检验方法,以及检验尺度参数是否相等的各种非参数方法,掌握各种回归的方法,掌握分布检验的各种方法,通过利用各种统计软件(包括SPSS、R软件)实现对样本调查数据的处理与分析,能在真实案例中应用相应的方法。 四、教学方法、教学形式、教学手段的特色 1.每个实验由教师指定实验内容及要求,由学生独立完成上机操作,得出正确的结果。 2.学生要书写实验报告,记录式样结果。 五、实验内容和学时分配

实验一位置参数的检验在统计软件中的实现 1、实验目的:掌握单样本、两样本和多样本位置参数的检验在统计软件中的实现过程。 2、实验要求:将操作过程及结果书写出来,并且将结果截图后贴在实验报告上。 3、实验内容:根据实际问题,个人设计检验总体,获取数据,进行检验。 4、主要仪器设备及试剂:(据实选填)计算机·50台·SPSS/EXCEL软件 实验二尺度参数的检验在统计软件中的实现 1、实验目的:掌握两样本和多样本尺度参数的检验在统计软件中的实现过程。 2、实验要求:把操作过程及结果书写出来,并且上交实验报告。 3、实验内容:根据实际问题,个人设计检验总体,获取数据,进行检验。 4、主要仪器设备及试剂:(据实选填)计算机·50台·SPSS/EXCEL软件 实验三相关与回归分析在统计软件中的实现 1、实验目的:掌握Spearman秩相关检验、Kendall协同检验与Theil回归在统计软件中的实现过程,并与Pearson相关系数与一元线性回归分析比较。 2、实验要求:将各种结果相对照,最后把操作过程及结果书写出来,并且上交实验报告。 3、实验内容:根据实际问题,个人设计检验总体,获取数据,进行检验。 4、主要仪器设备及试剂:(据实选填)计算机·50台·SPSS/EXCEL软件 实验四Kolmogorov-Smirnov检验在统计软件中的实现 1、实验目的:掌握Kolmogorov-Smirnov检验在统计软件中的实现过程,并与卡方检验结果对照。 2、实验要求:将结果相对照,最后把操作过程及结果书写出来,上交实验报告。 3、实验内容:根据实际问题,个人设计检验总体,获取数据,进行检验。 4、主要仪器设备及试剂:(据实选填)计算机·50台·SPSS/EXCEL软件 六、教材(讲义、指导书) 《非参数统计》,吴喜之,赵博娟,中国统计出版社,2013. 七、考核方法和评分标准 1.按照大纲要求,根据每个学生实验前的预习准备,实验过程的考查,实验操作情况及实验报告的质量,综合给出实验成绩。 2.评分等级 评分成绩分优、良、中、及格和不及格五个等级。 优:90分以上 良:80-89分 中:70-79分 及格:60-69分 不及格:59分及以下 具体评定标准如下: 优:实验纪律、预习、操作技能很好,实验报告书写工整无原则错误; 良:实验纪律、预习、操作技能较好,实验报告中原则错误不超过一个; 中:实验纪律、预习、操作技能一般,实验报告中原则错误不超过两个; 及格:实验纪律、预习、操作技能较差,实验报告中原则错误不超过三个; 不及格:实验中严重违章违纪,预习、实验技能均较差,实验报告中数据严重错误。 八、使用说明 1.本实验教学大纲一般随课程进度进行安排,也可集中安排;

相关文档
最新文档