概率统计实验

合集下载

概率论与数理统计实验2抛硬币实验的随机模拟实验报告

概率论与数理统计实验2抛硬币实验的随机模拟实验报告
部分实验截图实验编频率四实验中的问题建议及体会实验总结概率论与数理统计的研究对象都是随机事件所以产生的数必须是随机数数而且需要通过大量的实验数据才能统计出实验结果所以随机数应尽量大一些实实验数组也该多一些才能得到相对正确的答案

实验名称
实验2:抛硬币实验的随机模拟
编号
姓名
班级
学号
同组人姓名
同组人学号
4.部分实验截图
四、实验中的问题、建议及体会(实验总结)
概率论与数理统计的研究对象都是随机事件,所以产生的数必须是随机数数,而且需要通过大量的实验数据才能统计出实验结果,所以随机数应尽量大一些,实实验数组也该多一些才能得到相对正确的答案。
实验成绩:
指导教师签字
批改日期
long double c,g,ave ;
for(i=0;i<a;i++)
{
m=rand();
n=m%2;
b+=n ;
}
f=a-b;
c=(double)a;
g=(double)b;
ave=g/c;
printf("\n 试验的总次数为 %ld \n 其中正面向上的次数为 %ld \n 反面向上的次数为 %ld \n 正面出现的频率为 %20.15f \n ",a,b,f,ave);
任课教师
指导教师
实验地点
课外
实验时间
一、实验目的
(1)了解均匀分布随机数的产生
(2)理解掌握随机模拟的方法.
(3)体会频率的稳定性.
二、实验内容及要求
1.实验背景
对于一枚均匀的硬币,每次投掷出现正面与反面的机会是均等的。于是我们可以用数字1代表出现的是正面,数字0代表出现的是反面。而可以利用计算机等可能的产生0和1这两个随机数。于是,计算机每次产生一个随机数0或1,代表一次投硬币实验。这样,就可以用计算机快速模拟大量投硬币实验的结果。

概率统计实验

概率统计实验

概率统计实验一、课程目标知识目标:1. 理解概率统计的基本概念,掌握概率的计算方法和应用;2. 掌握统计学中的平均数、中位数、众数等描述性统计量的计算和应用;3. 了解随机变量及其分布,理解正态分布的特点和在实际问题中的应用;4. 学会运用概率统计知识解决实际问题,进行数据分析和决策。

技能目标:1. 能够运用概率的计算方法,解决简单的概率问题;2. 能够运用统计学方法,对数据进行整理、描述和分析;3. 能够运用统计软件或工具进行数据收集和处理,绘制统计图表;4. 能够运用所学的概率统计知识,解决生活中的实际问题。

情感态度价值观目标:1. 培养学生对概率统计学科的兴趣,激发学习热情;2. 培养学生的数据分析能力,使其认识到数据在决策中的重要性;3. 培养学生的团队合作意识,学会与他人共同探讨问题;4. 培养学生的批判性思维,使其在分析问题时能够客观、全面地考虑各种因素。

本课程针对高年级学生,结合概率统计学科特点,注重理论知识与实践应用的结合。

课程目标旨在使学生掌握概率统计的基本知识,培养数据分析能力,提升学生在实际生活中运用概率统计知识解决问题的能力。

通过本课程的学习,使学生形成正确的数据分析观念,具备批判性思维和团队合作精神。

在教学过程中,教师需关注学生的个体差异,设计分层教学活动,确保课程目标的达成。

二、教学内容1. 概率的基本概念:概率的定义、性质,条件概率,独立事件的判定与应用;2. 随机变量及其分布:随机变量的定义,离散型随机变量及其分布,连续型随机变量及其分布,正态分布的特点与运用;3. 描述性统计分析:平均数、中位数、众数、方差的意义与计算,四分位数及其应用;4. 概率统计在实际问题中的应用:利用概率知识解决实际问题,运用统计学方法进行数据分析,结合实际案例进行讲解;5. 统计软件的使用:介绍统计软件的基本操作,进行数据收集、处理和分析,绘制统计图表。

教学内容依据课程目标,以教材为蓝本,系统性地安排如下:第一周:概率的基本概念,重点讲解条件概率和独立事件的判定;第二周:随机变量及其分布,侧重于离散型和连续型随机变量的学习;第三周:描述性统计分析,学会计算各类统计量并应用于实际问题;第四周:概率统计在实际问题中的应用,通过案例教学,提高学生的实际操作能力;第五周:统计软件的使用,教授学生如何运用统计软件辅助学习。

概率统计学实验报告

概率统计学实验报告

《概率统计》实验报告实验人员:系(班):矿业工程系机械设计制造及其自动化1404班 学号:20141804408 姓名:李君阳 实验地点:电教楼四层三号机房实验名称:《概率统计》实验时间:2016.5.10,2016.5.17 16:30——18:30.实验目的:1.加强学生的动手能力,让学生掌握对MATLAB 软件的应用。

2.为以后的数学计算节省时间,提高精确度,准确度,合理的利用科学技术。

实验内容:(给出实验程序与运行结果)一、古典概型2、在50个产品中有18个一级品,32个二级品,从中任意抽取30个,求其中恰有20个二级品的概率.解:p=C 3220C 1810c 5030=0.2096>> p=nchoosek(32,20)*nchoosek(18,10)/nchoosek(50,30)p =0.2096二、计算概率1、某人进行射击,设每次射击的命中率为0.02,独立射击200次,试求至少击中两次的概率.2、一铸件的砂眼(缺陷)数服从参数为0.5的泊松分布,求此铸件上至多有1个砂眼的概率和至少有2个砂眼的概率. 解:1.p=1-c 2000∗0.98400-c 2001*0.98199*0.02=0.1458>> p=binopdf(2,200,0.02)p =0.1458 2.P(ζ=0)= 5.00*!05.0-e P(ζ=1)= 5.01*!15.0-e P(ζ1)=0.9098P(ζ)=0.09024、设随机变量()23,2X N ,求()25P X <<;()2P X >解:P(2<X<5)=F(5)-F(2)= )5(1,0σa F -=)235(1,0-F -)232(1,0-F = -=0.08413-(1-0.6915)=0.5328P(|X |>2)=P(X<-2)+P(X>2)=P(X<-2)+1-P(X<2)=0.6977normcdf(5,3,2)-normcdf(2,3,2) ≤2≥吕梁学院《概率统计》实验报告ans =0.5328>> normcdf(-2,3,2)-normcdf(2,3,2)+1ans =0.6977三、作图1、画出N(2,9),N(4,9),N(6,9)的图像进行比较;(图1)画出N(0,1),N(0,4),N(0,9)的图像进行比较.解:y1=normpdf(x,2,3);y2=normpdf(x,4,3);y3=normpdf(x,6,3);plot(x,y1,x,y2,x,y3)>> x=-40:0.01:40;y1=normpdf(x,0,1);y2=normpdf(x,0,2);y3=normpdf(x,0,3);plot(x,y1,x,y2,x,y3)(图2)四、常见统计量的计算1、根据调查,某集团公司的中层管理人员的年薪(单位:万元)数据如下:42 41 39.2 37.6 40.2 40 41 41.4 36.1 43.140.3 39.3 38.4 36.5 38.1 38.5 39.1 40.6 38.3 39.7求其公司中层管理人员年薪的样本均值、样本方差、样本标准差,绘制直方图。

概率统计实验12多准则决策问题

概率统计实验12多准则决策问题

实验十二 多准则决策问题一 实验目的通过用层次分析法解决一个多准则决策问题, 学习层次分析法的基本原理与方法; 掌握用层次分析法建立数学模型的基本步骤;学会用Mathematica 解决层次分析法中的数学问题.二 学习Mathematica 命令有时在计算中只需求出实数解, 而省略复数解, 则可以输入调用只求实数解的软件包. 输入<<Miscellaneous\RealOnly.m即可.三 实验的基本原理与方法层次分析法是一种简便、灵活而实用的多准则决策方法. 它特别适用于难以完全定量进行分析的,又相互关联、相互制约的众多因素构成的复杂问题. 它把人的思维过程层次化、数量化, 是系统分析的一个新型的数学方法.运用层次分析法建模,大体上可分四个基本步骤进行:1. 建立层次结构首先对所面临的问题要掌握足够的信息. 搞清楚问题的范围、因素、各因素之间的相互关系,及所要解决问题的目标. 把问题条理化、层次化,构造出一个有层次的结构模型. 在这个模型下,复杂问题被分解为元素的组成部分. 这些元素又按其属性及关系形成若干层次. 层次结构一般分三类:第一类为最高层,它是分析问题的预定目标和结果,也称目标层;第二类为中间层,它是为了实现目标所涉及的中间环节,如:准则、子准则,也称准则层;第三类为最低层,它包括了为实现目标可供选择的各种措施、决策方案等,也称方案层. OO 的影响之比,全部比较的结果可用矩阵表示,n n ij==⨯矩阵称为判断矩阵. 定义1 若判断矩阵满足下列条件:则称判断矩阵A 为正互反矩阵.怎样确定判断矩阵A 的元素ij a 取值?当某层的元素n C C C ,,,21 对于上一层某元素O 的影响可直接定量表示时(如利润多少),i C 与j C 对O 的影响之比可以直接确定,ij a 的值也易得到.但对于大多数社会经济问题,特别是比较复杂的问题,元素i C 和j C 对O的重要性不容易直接获得,需要通过适当的方法解决.通常取数字1-9及其倒数作为ij a 的取值范围.这是因为在进行定性的成对比较时,人们头脑中通常有5个明显的等级:因素太多,将超出人们的判断比较能力,降低精确. 实践证明,成对比较的尺度以72±为宜. 故ij a 的取值范围是1,2,9, 及其倒数1,.91,,21 3. 计算层次单排序并做一致性检验层次单排序是指同一层次各个元素对于上一层次中的某个元素的相对重要性进行排序. 具体做法是:根据同一层n 个元素n C C C ,,,21 ,对上一层某元素O 的判断矩阵A 求出它们对于元素O 的相对排序权重,记为:n w w w ,,,21 .写成向量形式:()T n w w w w ,,,21 = ,称为A 的排序权重向量. 其中i w 表示第i 个元素对上一层中某元素O 所占的比重. 从而得到层次单排序.层次单排序权重向量可有几种方法求解,常用的方法是利用判断矩阵A 的特征值与特征向量来计算排序权重向量w .为此引出矩阵的特征值与特征向量的有关理论.定义2 如果一个正互反矩阵().,,2,1,,n j i a A nn ij ==⨯满足 ),,2,1,,(n k j i a a a ik jk ij ==⨯,则称矩阵A 具有一致性,称元素k j i c c c ,,的成对比较是一致的; 并且称A 为一致矩阵.根据矩阵理论,可以得到如下几个定理.定理1 n 阶正互反矩阵A 的最大特征根m ax λn ≥,当n =λ时,A 是一致的.定理2 n 阶正互反矩阵是一致矩阵的充分必要条件是最大特征值m ax λn =.计算排序权重向量方法和步骤:设()T n w w w w ,,,21 =是n 阶判断矩阵的排序权重向量,当A 为一致矩阵时,根据n 阶判断矩阵构成的意义,显然有⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=n n n n n n w w w w w w w w w w w w w w w w w w A 212221212111 (1) 因而满足 nw Aw =. 这里n 是矩阵A 的最大特征根,w 是相应的特征向量;当A 为一般的判断矩阵时w Aw max λ=. 其中m ax λ是A 的最大特征值(也称主特征根),w 是相应的特征向量(也称主特征向量). 经归一化后(即:∑==n i i w11),可近似作为排序权重向量,这种方法称为特征根法.一致性检验:在判断矩阵的构造中,并没有要求判断矩阵具有一致性的特点. 这是由于客观事物的复杂性与人的认识的多样性所决定.特别是在规模大、因素多的情况下,对于判断矩阵的每个元素来说,不可能求出精确的ji w w .但要求判断矩阵大体上应该是一致的. 一个经不起推敲的判断矩阵有可能导致决策的失误. 利用上述方法计算排序权向量,当判断矩阵过于偏离一致性时,其可靠程度也出现问题. 因此需要对判断矩阵的一致性进行检验. 其步骤如下:(1)计算一致性指标..I C1..max --=n nI C λ (2)当0..=I C 时,即n =max λ时,判断矩阵A 是一致的.当..I C 值越大,判断矩阵A 的不一致的程度越严重.(2)查找相应的平均随机一致性指标..I R下表给出了n (从1—11)阶正互反矩阵,用了100—150个随机样本矩阵A 算出的随机一致性指标..I R......I R I C R C = (3) 当10.0..<R C 时,认为判断矩阵的一致性是可以接受的,否则应对判断矩阵作适当修正.4. 计算层次总排序权重并做一致性检验在得到了某层元素对其上一层中某元素的排序权重向量后,还需要得到各层元素,特别是最低层中各方案对于目标层的排序权重,即层次总排序权重向量,从而进行方案选择. 层次总排序权重要自上而下地将层次单排序的权重进行合成得到.考虑3个层次的决策问题. 若第一层只有1个元素,第二层有n 个元素,第三层有m 个元素,设第二层对第一层的层次单排序的权重向量为:第三层对第二层的层次单排序的权重为:以)3(k w 为列向量构成矩阵 ()nm nm m m n n n w w w w w w w w w w w w W ⨯⎪⎪⎪⎪⎪⎭⎫ ⎝⎛==)3()3(2)3(1)3(2)3(22)3(12)3(1)3(21)3(11)3()3(2)3(1)3(,,,(4) 则第三层对第一层的层次总排序权重向量为)2()3()3(w W w = (5)一般地,若有s 层,则第k 层对第一层的总排序权重向量为s k w W w k k k ,,4,3,)1()()( ==- (6)其中)(k W 是以第k 层对第k-1层的排序权向量为列向量组成的矩阵,)1(-k w 是第k-1层对第一层的总排序权重向量. 按照上述递推公式,可得到最下层(第s 层)对第一层的总排序权重向量为 )2()3()1()()(w W W W w s s s -= (7)层次总排序权重向量也要进行一致性检验. 具体方法是从最高层到最低层逐层进行. 定义3:若考虑的决策问题共有s 层. 设第l (s l ≤≤3)层的一致性指标为)1(.,,.,.)()(2)(1层元素的数目是第-l n I C I C I C l n l l ; 第l 层的随机一致性指标为 )()(2)(1.,,.,.l n l l I R I R I R ,令)1()(1)(1)(].,,.[.-=l l l l w I C I C I C (8))1()(1)(1)(].,,.[.-=l l l l w I R I R I R (9)则第l 层对第一层的总排序权向量的一致性比率为s l I R I C R C RC l l l l ,,4,3,....)()()1()( =+=-. (10) 其中)2(.R C 为由(3)式计算的第二层对第一层的排序权向量的一致性比率. 当最下层对第一层的总排序权向量的一致性比率1.0.)(<s RC 时,认为整个层次结构的比较判断可通过一致性检验.。

概率实验:进行概率实验

概率实验:进行概率实验

概率实验:进行概率实验概率实验是统计学中的重要内容之一,通过实际操作来观察和记录事件发生的频率,从而探究事件发生的概率。

本文将介绍如何进行概率实验以及如何根据实验结果得出概率的估计。

一、准备工作在进行概率实验之前,我们需要明确实验的目的和方案,并准备好相应的材料和设备。

例如,我们要进行抛硬币实验,准备好一枚硬币;要进行掷骰子实验,准备好一个六面骰子等。

二、实验步骤1. 确定实验目的:明确所要研究的事件或现象。

比如,我们想知道抛一枚硬币正面朝上的概率。

2. 设定实验方案:确定实验的方法和步骤。

例如,我们可以通过抛硬币的方式进行实验,记录每次抛掷的结果。

3. 进行实验:按照实验方案进行实验操作。

例如,我们进行了10次抛硬币的实验,并记录了每次的结果。

4. 统计实验结果:根据实验数据记录事件发生的频率。

在我们的抛硬币实验中,我们可以统计正面朝上的次数。

三、数据处理与分析1. 统计频数:统计事件发生的次数。

在我们的抛硬币实验中,我们统计了正面朝上的次数为6次。

2. 计算频率:根据事件发生的次数计算频率。

频率是指某事件发生的次数与实验总次数的比值。

在我们的实验中,抛硬币正面朝上的频率为6/10=0.6。

四、概率估计与结论根据我们的实验结果,我们可以得出抛硬币正面朝上的估计概率为0.6。

然而,我们需要注意到这只是通过有限次实验得出的估计值,真实的概率可能存在偏差。

我们可以通过增加实验次数来提高概率估计的准确性。

当实验次数越多时,观察到的频率会更加接近真实的概率值。

因此,概率实验的重复性和可验证性是确保结果准确性的重要条件。

总结起来,概率实验是一种通过实际操作来观察和记录事件发生频率的方法,用于研究事件发生的概率。

通过实验步骤和数据处理与分析,我们可以得出对事件概率的估计值。

然而,在进行概率实验时,我们应当注意增加实验次数,以提高概率估计的准确性。

正如英国统计学家约翰·图基所说:“概率追踪未来不能,但可以改善管理”。

概率论与数理统计实验

概率论与数理统计实验
机械加工得到的零件尺寸的偏差、射击命中点 与目标的偏差、各种测量误差、人的身高、体重等, 都可近似看成服从正态分布。
整理课件
3、指数分布随机数
1) R = exprnd(λ):产生一个指数分布随机数 2)R = exprnd(λ,m,n)产生m行n列的指数分布随机数
例3、产生E(0.1)上的一个随机数,20个随机数, 2行6列的随机数。
整理课件
在Matlab命令行中输入以下命令: binomoni(0.5,1000)
整理课件
在Matlab命令行中输入以下命令: binomoni(0.5,10000)
整理课件
在Matlab命令行中输入以下命令: binomoni(0.3,1000)
整理课件
二、常用统计量
1、表示位置的统计量—平均值和中位数
概率论与数理统计实验
实验2 随机数的产生
数据的统计描述
整理课件
实验目的
学习随机数的产生方法 直观了解统计描述的基本内容。
实验内容
1、随机数的产生 2、统计的基本概念。 3、计算统计描述的命令。 4、计算实例。
整理课件
一、随机数的产生 定义:设随机变量X~F(x),则称随机变量X的 抽样序列{Xi}为分布F(x)的随机数 10常用分布随机数的产生
整理课件
例6 生成单位圆上均匀分布的1行10000列随机数,并 画经验分布函数曲线。
Randnum=unifrnd(0,2*pi,1,10000); %(0,2pi)上均匀分布随机数 xRandnum=cos(Randnum);%横坐标 yRandnum=sin(Randnum);%丛坐标 plot(xRandnum,yRandnum);
例9:产生5组指数分布随机数,每组100个, 计算样本偏度和峰度。

概率实验报告_蒙特卡洛积分

概率实验报告_蒙特卡洛积分

本科实验报告实验名称:《概率与统计》随机模拟实验随机模拟实验实验一设随机变量X 的分布律为-i P{X=i}=2,i=1,2,3......试产生该分部的随机数1000个,并作出频率直方图。

一、实验原理采用直接抽样法:定理:设U 是服从[0,1]上的均匀分布的随机变量,则随机变量-1()Y F U =与X 有相同的分布函数-1()Y F U =(为F(x)的逆函数),即-1()Y F U =的分部函数为()F x .二、题目分析易得题中X 的分布函数为1()1- ,1,0,1,2,3, (2i)F x i x i i =≤≤+=若用ceil 表示对小数向正无穷方向取整,则F(x)的反函数为产生服从[0,1]上的均匀分布的随机变量a ,则m=F -1(a)则为题中需要产生的随 机数。

三、MATLAB 实现f=[]; i=1;while i<=1000a=unifrnd(0,1); %产生随机数a ,服从【0,1】上的均匀分布 m=log(1-a)/log(1/2);b=ceil(m); %对m 向正无穷取整 f=[f,b]; i=i+1; enddisplay(f);[n,xout]=hist(f); bar(xout,n/1000,1)产生的随机数(取1000个中的20个)如下:-1ln(1-)()1ln()2a F a ceil ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦频率分布直方图实验二设随机变量X 的密度函数为24,0,()0,0x xe x f x x -⎧>=⎨≤⎩试产生该分布的随机数1000个,并作出频率直方图 一、实验原理取舍抽样方法,当分布函数的逆函数难以求出时,可采用此方法。

取舍抽样算法的流程为:(1) 选取一个参考分布,其选取原则,一是该分布的随机样本容易产生;二是存在常数C ,使得()()f x Cg x ≤。

(2) 产生参考分布()g x 的随机样本0x ; (3) 独立产生[0,1]上的均匀分布随机数0u ;(4) 若000()()u Cg x f x ≤,则保留x 0,作为所需的随机样本;否则舍弃。

概率的实验报告之硬币实验

概率的实验报告之硬币实验

概率的实验报告之硬币实验硬币实验是概率统计学中最为经典且简单的实验之一,通过投掷硬币的方式来观察出现正面和反面的概率。

本篇实验报告将详细介绍硬币实验的设计、实验步骤、数据分析以及实验结论等内容。

一、实验设计在硬币实验中,我们希望探究的是硬币被投掷后出现正面和反面的概率是否相等。

因此,本实验需要设计一个合适的实验方案来达到这个目的。

1.硬币选择:我们选择一枚标准铜币作为硬币实验中的投掷对象。

这样可以保证硬币的重量、形状以及材质等因素对实验结果的影响较小。

2.硬币数量:为了保证实验结果的准确性,我们需要进行大量的投掷操作。

因此,我们决定投掷硬币120次,即获得120个数据点。

3.投掷方式:我们采用随机抛掷硬币的方式进行实验,确保每次投掷都是独立的事件,并且没有任何偏差。

二、实验步骤1.准备工作:将硬币清洗干净,并确保实验环境整洁,以避免外部因素对实验结果的影响。

2.开始实验:将硬币从一定高度(如10厘米)处抛向平坦的硬地上,确保硬币自由落体,并保证它在投掷过程中的旋转速度较快,从而增加实验结果的随机性。

3.记录数据:每次投掷后,记录硬币出现的面向(正面或反面)。

重复步骤2和3,直到完成全部120次投掷。

三、数据分析完成硬币实验后,我们可以开始对实验数据进行分析,以求得硬币出现正面和反面的概率。

1.数据整理:将实验记录的数据整理为一个数据表格,包括投掷次数、正面的次数、反面的次数以及正面的频率和反面的频率等指标。

2.概率计算:根据实验数据,我们可以计算出硬币出现正面和反面的频率,从而得到相应的概率。

正面的频率即正面的次数除以投掷次数,反面的频率即反面的次数除以投掷次数。

四、实验结果与结论根据实验数据和概率计算的结果,我们得到了硬币出现正面和反面的概率。

在本次实验中,我们投掷了120次硬币,其中正面出现了70次,反面出现了50次。

根据计算,正面的频率为70/120=0.5833,反面的频率为50/120=0.4166因此,通过本次实验可以得出结论:在这枚标准铜币中,硬币出现正面和反面的概率约为0.5833和0.4166,两者相差较小,可以认为是基本相等的。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

§13.6概率统计实验[学习目标]1. 会用Mathematica 求概率、均值与方差;2. 能进行常用分布的计算;3. 会用Mathematica 进行期望和方差的区间估计;4. 会用Mathematica 进行回归分析。

概率统计是最需要使用计算机的领域,过去依靠计算器进行统计计算,由于计算机的普及得以升级换代。

本节介绍Mathematica 自带的统计程序包,其中有实现常用统计计算的各种外部函数。

一、 样本的数字特征1. 一元的情况Mathematica 的内部没有数理统计方面的功能,但是带有功能强大的数理统计外部程序,由多个程序文件组成。

它们在标准扩展程序包集的Statistic 程序包子集中,位于目录D :\Mathematica\4.0\AddOns\StandardPackages\Statistics下。

通过查看Help ,可以找到包含所需外部函数的程序文件名。

在程序文件DescriptiveStatistics.m 中,含有实现一元数理统计基本计算的函数,常用的有:SampleRange[data] 求表data 中数据的极差(最大数减最小数)。

Median[data] 求中值。

Mean[data] 求平均值∑=ni i x n 11。

Variance[data] 求方差(无偏估计)∑=--ni i x x n 12)(11。

StandardDeviation[data] 求标准差(无偏估计)∑=--ni i x x n 12)(11。

VarianceMLE[data] 求方差∑=-ni i x x n 12)(1。

StandardDeviationMLE[data] 求标准差∑=-ni i x x n 12)(1。

实际上程序文件中的函数很多,这里只列出了最常用的函数,其它计算函数可以通过Help 浏览。

例1 给出一组样本值:6.5,3.8,6.6,5.7,6.0,6.4,5.3,计算样本个数、最大值、最小值、均值、方差、标准差等。

解:In[1]:= << Statistics `DescriptiveStatistics`In[2]:= data = {6.5,3.8,6.6,5.7,6.0,6.4,5.3};In[3]:=Length[data]Out[3]=7In[4]:=Min[data]Out[4]= 3.8In[5]:=Max[data]Out[5]= 6.6In[6]:=SampleRange[data]Out[6]= 2.8In[7]:=Median[data]Out[7]= 6.In[8]:=Mean[data]Out[8]= 5.75714In[9]:=Variance[data]Out[9]= 0.962857In[10]:=StandardDeviation[data]Out[10]= 0.981253In[11]:=VarianceMLE[data]Out[11]= 0.825306In[12]:= StandardDeviationMLE[data]Out[12]= 0.908464说明:在上例中,In[1]首先调入程序文件,求数据个数、最大值和最小值使用内部函数。

2. 多元的情况在程序文件MultiDescriptiveStatistics.m 中,含有实现多元数理统计基本计算的函数,常用的有:SampleRange[data] 求表data 中数据的极差。

Median[data] 求中值。

Mean[data] 求平均值。

Variance[data] 求方差(无偏估计)。

StandardDeviation[data] 求标准差(无偏估计)。

VarianceMLE[data] 求方差。

StandardDeviationMLE[data] 求标准差。

Covariance[xlist ,ylist] 求x ,y 的协方差(无偏估计)∑=---n i i i y y x x n 1))((11。

CovarianceMLE[xlist ,ylist] 求x ,y 的协方差∑=--n i i i y y x x n 1))((1。

Correlation[xlist ,ylist] 求x ,y 的相关系数∑∑∑===----n i n i n i i i i i y y x x y y x x11122)()(/))((。

实际上程序文件中的函数很多,这里只列出了最常用的函数,其它计算函数可以通过Help 浏览。

例2 给出4个样本值:{1.1,2.0,3.2},{1.3,2.2,3.1},{1.15,2.05,3.35},{1.22,2.31,3.33},计算样本个数、均值、方差、标准差等。

解:In[1]:= << Statistics `MultiDescriptiveStatistics `In[2]:= data = {{1.1,2.0,3.2},{1.3,2.2,3.1},{1.15,2.05,3.35},{1.22,2.31,3.33}};Length[data]Out[3]=4In[4]:=SampleRange[data]Out[4]= {0.2,0.31,0.25}In[5]:=Median[data]Out[5]= {1.185,2.125,3.265}In[6]:=Mean[data]Out[6]= {1.1925,2.14,3.245}In[7]:=Variance[data]Out[7]= {0.00755833,0.0200667,0.}In[8]:=VarianceMLE[data]Out[8]= {0.00566875,0.01505,0.010325}In[9]:=CentralMoment[data ,2]Out[9]= {0.00566875,0.01505,0.010325}In[10]:=x=data[[All ,1]];y=data[[All ,2]];z=data[[All ,3]];In[11]:=Covariance[x ,y]Out[11]=0.0093In[12]:=Covariance[z ,z]Out[12]=0.In[13]:=CovarianceMLE[y ,y]Out[13]=0.01505In[14]:=Correlation[y,z]Out[14]=0.In[15]:=Correlation[x,x]Out[15]=1.二、常用分布的计算在计算机出现以前,统计计算总是依赖一堆函数表。

使用本节介绍的函数可以取代查表,为实现各种统计计算的自动化做好了底层准备工作。

1.离散分布程序文件DiscreteDistributions.m中,含有用于离散分布计算的函数。

其中常用的离散分布有:BernoulliDistribution[p] 贝努利分布。

BinomialDistribution[n,p] 二项分布。

GeometricDistribution[p] 几何分布。

HypergeometricDistribution[n,M,N] 超几何分布。

PoissonDistribution[λ] 泊松分布。

DiscreteUniformDistribution[n] 离散的均匀分布。

NegativeBinomialDistribution[n,p] 负二项分布。

以上函数中的参数,既可以是数值的,也可以是符号的。

使用这些函数只能按用户给出的参数建立一个表达式,并不能返回任何其它结果。

真正进行计算的是下面的求值函数,它们使用以上的分布表达式作为一个参数。

常用的求值函数有:Domain[dist] 求dist的定义域。

PDF[dist,x] 求点x处的分布dist的密度值。

CDF[dist,x] 求点x处的分布函数值。

Quantile[dist,q] 求x,使CDF[dist,x]达到q。

Mean[dist] 求分布dist的期望。

Variance[dist] 求方差。

StandardDeviation[dist] 求标准差。

ExpectedValue[f,dist,x] 求E f(x)。

CharacteristicFunction[dist,t] 求特征函数φ(t)。

Random[dist] 求具有分布dist的伪随机数。

RandomArray[dist,dims] 求维数为dims的伪随机数的数组。

例3观察下面二项分布的各种基本计算。

In[1]:= << Statistics `DiscreteDistributions`In[2]:= b=BinomialDistribution[n,p]In[3]:=Mean[b]Out[3]=npIn[4]:=Variance[b]Out[4]= n (1-p )pIn[5]:=CharacteristicFunction[b ,t]Out[5]= (1-p+e it p )nIn[6]:=b=BinomialDistribution[10,0.3]Out[6]= BinomialDistribution[10,0.3]In[7]:=Domain[b]Out[7]= {0,1,2,3,4,5,6,7,8,9,10}In[8]:=PDF[b ,4]Out[8]= 0.200121In[9]:=CDF[b ,3.9]Out[9]= 0.649611In[10]:=CDF[b ,4]Out[10]= 0.849732In[11]:=Variance[b]Out[11]= 2.1说明:在上例中,首先调入程序文件。

In[2]用b 表示具有符号参数的二项分布,这一步只是为了后面输入时方便,并非必需的,也可以使用嵌套省略这一步。

In[3]~In[5]进行的是符号运算,可以得到期望、方差等的一般公式。

这是本程序与一般统计软件的不同之处,充分体现了Mathematica 的特色。

接下来给出具体的参数值,进行数值计算,这些计算取代了查表。

以下是一些更广泛、深入的例子。

例4 观察下面离散分布的各种计算。

In[1]:= << Statistics `DiscreteDistributions`In[2]:= h=HypergeometricDistribution[n ,M ,N];Mean[h]Out[3]=NMn In[4]:=Variance[h]Out[4]=N N N n N M Mn )1())(1(+-+--PDF[p ,2]Out[6]=5225eIn[7]:=N[%]Out[7]=0.0842243In[8]:=PDF[p ,20] //NOut[8]=2.64121×10-7In[9]:=N[CDF[p ,20],20]Out[9]=0.999999912In[10]:=ExpectedValue[x^2,p ,x]Out[10]=30In[11]:=RandomArray[p ,{2,10}]Out[11]={{3,4,6,10,2,5,7,2,5,5},{4,3,2,11,5,4,2,2,4,6}}说明:在上例中表明,超几何分布的参数按我国教科书的习惯来表示,这里求出的期望和方差公式就与教科书上的相同了。

相关文档
最新文档