中北大学概率论实验报告四
概率论与数理统计应用实验报告

概率论与数理统计应用实验报告
概率论与数理统计是中国大学MOOC《数据科学导论》课程中的一门关键科目,为了加深熟悉概率论与数理统计的过程,我完成了在R语言环境下的相关实验并撰写了这份报告。
实验过程以R Studio为平台。
R studio是一款跨平台,开源的编程环境,可以天然
地支持R语言,为我们提供卓越的实验环境。
所有的实验操作都是在R Studio上进行的。
实验分两步,第一步是正态分布的实验,第二步是对多项式分布的实验。
正态分布的实验
首先,我们构造了1000000以内随机整数,范围为-500000到500000。
将这些整数绘
制灰度图,来查看各项数据的分布情况,数据在中心出现了最多,并且随着两端逐渐减少,绘出的图像符合正态分布的分布曲线,即右尾巴更长。
此外,我们还对构造出的数据进行
正态性分析,使用R语言中的hist函数来绘制正态分布的柱状图,根据结果可以清楚地
看出,数据的分布也是符合正态分布的,由此也证明了构造数据的正确性。
多项式分布的实验
我们首先运用随机数生成器在R语言环境下,构造出多项式分布的数据,将生成的数
据进行灰度图展示,发现随着两端的和逐渐增加,形成非对称的多项式分布的曲线。
同时,我们运用R语言中的hist函数来检验再次检验多项式分布,结果也确实符合多项式分布,从而证明以上步骤是正确的。
经过上述实验,我加深了对概率论与数理统计的熟悉。
构建统计数据,运用R Studio 画出统计图来检验和证明数据是否符合正态分布和多项式分布使我对概率论和数理知识有
了更为深刻的认识,也为今后解决数据科学相关的科学问题奠定基础。
中北大学随即实验报告

6
采样序列 R = 1/T0*abs(ifft(S)); R = ifftshift(R); subplot(212), plot(R); title('功率谱密度序列 IFFT 得到自相关序列') %功 率谱密度序列 IFFT 得到自相关序列
七、实验结果及分析
自相关函数 1
0.5
0
-250 -200 -150 -100 -50
100
50
0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
功率谱密度函数采样序列 150
100
50
0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 功 率 谱 密 度 序 列 IFFT得 到 自 相 关 序 列
m_x = 0;
%输入期望,方差,平均功率
sigma_x = R_x(41);
P_x = R_x(41);
figure(1), subplot(221),stem(R_x),title('RX');gtext('1105064239 亓岳岩'); subplot(222),stem(S_x),title('SX'); subplot(223),stem(h),title('h'); subplot(224),stem(H),title('H'); %时域法求解 R_xy = conv(R_x,h);R_xy = R_xy(41:121); R_yx = conv(R_x,fliplr(h));R_yx = R_yx(41:121); R_y = conv(R_yx,h);R_y = R_y(41:121); m_y = sqrt(R_y(81)); D_y = R_y(1) - R_y(81);
大学概率统计实验报告

大学概率统计实验报告引言在概率统计学中,实验是一种重要的数据收集方法。
通过实验,我们可以收集到一系列随机变量的观测值,然后利用统计方法对这些观测值进行分析和推断。
本实验旨在通过一个简单的骰子实验来介绍概率统计的基本理论和方法。
实验目标本实验的目标是通过投掷骰子的实验,验证骰子的随机性,并研究骰子的概率分布。
实验步骤1.准备一个六面骰子和一张记录表格。
2.将骰子投掷20次,并记录每次投掷的结果。
将结果按照出现的次数填入表格中。
3.统计记录表格中每个数字出现的频数,并计算频率。
4.绘制柱状图展示各个数字的频率分布情况。
实验结果与分析根据实验记录表格,我们统计得到了每个数字出现的频数如下:数字 1 2 3 4 5 6频数 4 3 6 2 4 1根据频数,我们可以计算出每个数字的频率。
频率是指某个数字出现的次数与总次数的比值。
通过计算,我们得到了每个数字的频率如下:数字 1 2 3 4 5 6频率0.2 0.15 0.3 0.1 0.2 0.05通过绘制柱状图,我们可以更直观地观察到各个数字的频率分布情况。
柱状图如下所示:0.3 | █| █| █| █0.25 | █| █| █| █0.2 | █ █ █| █ █ █ █| █ █ █ █| █ █ █ █0.15 | █ █ █ █| █ █ █ █| █ █ █ █| █ █ █ █0.1 | █ █ █ █| █ █ █ █| █ █ █ █| █ █ █ █0.05 | █ █ █ █| █ █ █ █| █ █ █ █| █ █ █ █----------------1 2 3 4 5 6根据实验结果,我们可以观察到以下现象和结论: - 各个数字的频率接近于理论概率,表明骰子的结果具有一定的随机性。
- 数字3的频率最高,约为0.3,而数字6的频率最低,约为0.05。
这说明骰子的结果并不完全均匀,存在一定的偏差。
结论与讨论通过本次实验,我们了解了概率统计的基本理论和方法,并通过投掷骰子的实验验证了骰子的随机性。
概率论实验报告

概率论试验报告试验一:随机掷硬币1、模拟掷一枚硬币的随机试验(可用0——1随机数来模拟试验结果),取n=100,模拟掷n次硬币的随机试验。
记录试验结果,观察样本空间的确定性及每次试验结果的偶然性,统计正面出现的次数,并计算正面的出现的频率;试验结果如下:测试中出现零代表正面,出现一代表反面,其中共计50次正面50次反面。
2、取试验次数n=1000,将过程(1)重复三次,比较三次试验结果试验结果如下3、三次结果分别是0.501,0.503,0.521 。
这充分说明模拟情况接近真实情况,频率接近概率0.5。
试验二:高尔顿钉板试验1、自高尔顿钉板上端放一个小球, 任其自由下落. 在其下落过程中,当小球碰到钉子时从左边落下的概率为p , 从右边落下的概率为,1p -碰到下一排钉子又是如此, 最后落到底板中的某一格子. 因此任意放入一球, 则此球落入哪个格子事先难以确定. 设横排共有20=m 排钉子, 下面进行模拟实验:(1) 取,5.0=p 自板上端放入一个小球, 观察小球落下的位置; 将该实验重复作5次, 观察5次实验结果的共性及每次实验结果的偶然性;(2) 分别取,85.0,5.0,15.0=p 自板上端放入n 个小球, 取,5000=n 观察n 个小球落下后呈现的曲线我们分析可知,这是一个经典的古典概型试验问题2、具体程序:3、我们分析实验结果可知,若小球碰钉子后从两边落下的概率发生变化, 则高尔顿钉板实验中小球落入各个格子的频数发生变化, 从而频率也相应地发生变化. 而且, 当,5.0p曲线峰值的格子位置向右偏; 当><p曲线峰值的格子位置向左偏。
,5.0试验三:抽签试验1、我们做模拟实验,用1-10的随机整数来模拟实验结果。
在1-10十个随机数中,假设10代表抽到大王,将这十个数进行全排,10出现在哪个位置,就代表该位置上的人摸到大王。
每次随机排列1-10共10个数,10所在的位置随机变化,分别输出模拟实验10次, 100次,1000次的结果, 将实验结果进行统计分析, 给出分析结果。
概率论教学实践报告总结(3篇)

第1篇一、前言概率论是数学的一个重要分支,它研究随机现象及其规律。
随着我国教育事业的不断发展,概率论在教学中的地位日益重要。
为了提高教学质量,探索有效的教学策略,我们开展了一系列概率论教学实践活动。
现将本次实践活动的总结如下:二、实践目的1. 提高学生对概率论知识的掌握程度,培养学生的逻辑思维能力。
2. 探索适合我国学生特点的概率论教学方法,提高课堂教学效果。
3. 加强师生互动,培养学生的自主学习能力。
4. 丰富教师的教学经验,提高教师的专业素养。
三、实践内容1. 教学方法改革(1)启发式教学:教师在课堂上注重引导学生思考,通过提问、讨论等方式,激发学生的学习兴趣,提高学生的思维能力。
(2)案例教学:结合实际生活中的例子,让学生理解概率论知识在实际中的应用,提高学生的实践能力。
(3)小组合作学习:将学生分成若干小组,共同完成教学任务,培养学生的团队协作能力。
2. 教学手段创新(1)多媒体教学:利用PPT、视频等多媒体手段,使教学内容更加生动形象,提高学生的学习兴趣。
(2)网络教学:通过在线课程、论坛等网络平台,拓宽学生的学习渠道,提高学生的学习效果。
(3)实验教学:开展概率实验,让学生亲身体验概率现象,加深对概率论知识的理解。
3. 教学评价改革(1)过程性评价:关注学生在学习过程中的表现,如课堂发言、作业完成情况等。
(2)结果性评价:关注学生对知识掌握程度,如期中、期末考试等。
(3)多元评价:结合学生自评、互评、教师评价等多种方式,全面评价学生的学习成果。
四、实践效果1. 学生对概率论知识的掌握程度有了明显提高,课堂参与度显著提升。
2. 学生在解决实际问题时,能够运用概率论知识进行分析,提高了解决问题的能力。
3. 学生在团队协作、自主学习等方面取得了较好成绩,综合素质得到提高。
4. 教师的教学经验得到了丰富,教学水平得到提高。
五、存在问题及改进措施1. 存在问题(1)部分学生对概率论知识缺乏兴趣,学习积极性不高。
概率论试验报告

概率论试验报告实验一概率计算实验目的:掌握用MATLAB实现概率中的常见计算1、选择三种常见随机变量的分布,计算它们的期望与方差(参数自己设定)2、已知机床加工得到的某零件尺寸服从期望为20cm,标准差为1.5cm的正态分布。
(1)任意抽取一个零件,求它的尺寸在(19,22)区间的概率;(2)若规定尺寸不小于某一标准值的零件为合格品,要使合格品的概率为0.9,如何确定这个标准值?(3)独立的取25个组成一个样本,求样本均值在(19,22)区间的概率。
3、比较t(10)分布和标准正态分布的图像。
1.均匀分布:设定为服从在(0,1)上的均匀分布。
则代码为:2.参数为1的指数分布:3.标准正态分布:2.(1)。
概率为(2)。
求得的值为:(3)。
由题目可知样本均值服从(20,0.3)的正态分布,所以代码为:3.我们取区间[-3,3],间隔为0.1,画得的图为:上方的曲线为t分布,下面的为正态分布曲线。
实验二样本的统计与计算实验目的:学习利用MATLAB求来自总体的一个样本的样本均值、中位数、样本方差、样本分位数和其它数字特征,并能作出频率直方图和经验分布函数来自某总体的样本观察值如下,计算样本的样本均值、中位数、样本方差、画出频率直方图经验分布函数图。
A=[16 25 19 20 25 33 24 23 20 24 25 17 15 21 22 26 15 23 22 20 14 16 11 14 28 18 13 27 31 25 24 16 19 23 26 17 14 30 21 18 16 18 19 20 22 19 22 18 26 26 13 21 13 11 19 23 18 24 28 13 11 25 15 17 18 22 16 13 12 13 11 09 15 18 21 15 12 17 13 14 12 16 10 08 23 18 11 16 28 13 21 22 12 08 15 21 18 16 16 19 28 19 12 14 19 28 28 28 13 21 28 19 11 15 18 24 18 16 28 19 15 13 22 14 16 24 20 28 18 18 28 14 13 28 29 24 28 14 18 18 18 08 21 16 24 32 16 28 19 15 18 18 10 12 16 26 18 19 33 08 11 18 27 23 11 22 22 13 28 14 22 18 26 18 16 32 27 25 24 17 17 28 33 16 20 28 32 19 23 18 28 15 24 28 29 16 17 19 18]代码为:代码为:[a,b]=hist(A); bar(b,a/sum(a))画得的图为:实验三数理统计中的常用方法实验目的:能熟练用matlab做参数点估计、区间估计和假设检验。
中北大学 概率论实验报告三.

实验三正态分布的参数估计及假设检验1、从某超市的货架上随机抽取9包0.5千克装的食糖,实测其重量分别为(单位:千克):0.497,0.506,0.518,0.524,0.488,0.510,0.510,0.515,0.512,从长期的实践中知道,该品牌的食糖重量服从正态分布。
根据数据对总体的均值及标准差进行矩估计、极大似然估计和置信度为0.9与0.95的区间估计。
>> x=[0.497 0.506 0.518 0.524 0.488 0.51 0.51 0.515 0.512];mu_ju=mean(x)sigma2_ju=moment(x,2);bianzhuncha=sqrt(sigma2_ju)[muhat1,sigmahat1,muci1,sigmaci1]=normfit(x,0.1)[muhat2,sigmahat2,muci2,sigmaci2]=normfit(x,0.05)mu_ju =0.5089bianzhuncha =0.0103muhat1 =0.5089sigmahat1 =0.0109muci1 =0.50210.5156sigmaci1 =0.00780.0186muhat2 =0.5089sigmahat2 =0.0109muci2 =0.50050.5173sigmaci2 =0.00730.0208所以总体的均值和标准差的矩估计分别为:0.5089,0.0103;总体的均值和标准差的极大似然估计分别为:0.5089 , 0.0109;总体的均值和标准差的置信度为0.9的区间估计分别为:[0.5021,0.5156],[ 0.0078,0.0186];总体的均值和标准差的置信度为0.95的区间估计分别为:[0.5005,0.5173],[ 0.0073,0.0208]。
2、设某种清漆的9个样品, 其干燥时间(单位:小时)分别为6.0, 5.7, 5.8, 6.5,7.0, 6.3, 5.6, 6.1, 5.0.又设干燥时间总体服从. 求下列两种情形时的μ的置信水平为0.95的置信区间:(1) 若由以往经验知=0.6小时.>> x=[6.0 5.7 5.8 6.5 7.0 6.3 5.6 6.1 5.0];alpha=0.05; %给定的显著性水平sigma=0.6;%已知的标准差x=[6.0 5.7 5.8 6.5 7.0 6.3 5.6 6.1 5.0]n=length(x);%计算样本容量mu=mean(x);%计算并显示样本均值u=norminv(1-alpha/2,0,1);%计算置信度为1-alpha/2的正态分布临界值muci=[mu-u*sqrt(sigma^2/n),mu+u*sqrt(sigma^2/n)] %输出置信区间muci =5.60806.3920故=0.6时,μ的置信水平为0.95的置信区间为[5.6080,6.3920]。
概率论实验报告

概率论与数理统计实验报告实验名称: 区间估计姓名 学号 班级 实验日期一、实验名称:区间估计二、实验目的:1. 会用MATLAB 对一个正态总体的参数进行区间估计;2. 会对两个正态总体的均值差和方差比进行区间估计。
三、实验要求:1. 用MATLAB 查正态分布表、χ2分布表、t 分布表和F 分布表。
2. 利用MATLAB 进行区间估计。
四、实验内容:1. 计算α=0.1, 0.05, 0.025时,标准正态分布的上侧α分位数。
2. 计算α=0.1, 0.05, 0.025,n =5, 10, 15时,χ2(n )的上侧α分位数(注:α与n相应配对,即只需计算2220.10.050.025(5),(10),(15)χχχ的值,下同)。
3. 计算α=0.1, 0.05, 0.025,n =5, 10, 15时, t (n )的上侧α分位数。
4. 计算α=0.1, 0.05, 0.025时, F (8,15)的上侧α分位数; 验证:0.050.95(8,15)1(15,8)F F =;计算概率{}312P X ≤≤。
5. 验证例题6.28、例题6.29、例题6.30、习题6.27、习题6.30。
五、实验任务及结果:任务一:计算α=0.1, 0.05, 0.025时,标准正态分布的上侧α分位数。
源程序:%1-1x = norminv([0.05 0.95],0,1)%1-2y = norminv([0.025 0.975],0,1)%1-3z = norminv([0.0125 0.9875],0,1)结果:x =-1.6449 1.6449y =-1.9600 1.9600z =-2.2414 2.2414结论:α=0.1时的置信区间为[-1.6449,1.6449],上侧α分位数为1.6449.α=0.05时的置信区间为[-1.9600,1.9600],上侧α分位数为1.9600.α=0.025时的置信区间为[-2.2414,2.2414],上侧α分位数为2.2414.任务二:计算α=0.1, 0.05, 0.025,n=5, 10, 15时,χ2(n)的上侧α分位数(注:α与n 相应配对,即只需计算2220.10.050.025(5),(10),(15)χχχ的值,下同)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验四方差分析和回归分析
四、实验结果
1、用5种不同的施肥方案分别得到某种农作物的收获量(kg)如右:
在显著性水平=
对农作物的收获量是否有显著影响.
>> X=[67 67 55 42 98 96 91 66 60 69 50 35 79 64 81 70 90 70 79 88];
group=[ones(1,4),2*ones(1,4),3*ones(1,4),4*ones(1,4),5*ones(1,4)];
[p,table,stats] = anova1(X,group,'on')
p =
table =
'Source' 'SS' 'df' 'MS' 'F' 'Prob>F'
'Groups' [+03] [ 4] [] [] []
'Error' [+03] [15] [] [] []
'Total' [+03] [19] [] [] []
stats =
gnames: {5x1 cell}
n: [4 4 4 4 4]
source: 'anova1'
means: [ ]
df: 15
s:
因为p=<,所以施肥方案对农作物的收获量有显著影响。
且由箱型图可知:第2种施肥方案对对农作物的收获量的影响最好,即产量最高。
2、某粮食加工产试验三种储藏方法对粮食含水率有无显著影响,现取一批粮食分成若干份,分别用三种不同的方法储藏,过段时间后测得的含水率如右表:
在显著性水平=α下,i x 检验储藏方法对含水率有无显著的影响. >> X=[ 10 ];
group=[ones(1,5),2*ones(1,5),3*ones(1,5)]; [p,table,stats] = anova1(X,group,'on') p = table =
'Source' 'SS' 'df' 'MS' 'F' 'Prob>F' 'Groups' [] [ 2] [] [] []
'Error' [ ] [12] [] [] [] 'Total' [] [14] [] [] [] stats =
gnames: {3x1 cell} n: [5 5 5] source: 'anova1'
means: [ ]
df: 12
s:
因为p=<,所以储藏方法对含水率有显著的影响。
且由箱型图可知:第3种储藏方法使食物的含水率量最高。
3、一位经济学家对电子计算机设备的企业收集了在一年内生产力提高指数(用0到100内的数表示)并按过去三年间在科研和开发上的平均花费分为三类:A1:花费少, A2:花费中等, A3:花费多。
生产力提高的指数如下表所示:
水平生产力提高指数
A1
>> X=[ ];
group=[ones(1,9),2*ones(1,12),3*ones(1,6)];
[p,table,stats] = anova1(X,group,'on')
p =
table =
'Source' 'SS' 'df' 'MS' 'F' 'Prob>F'
'Groups' [] [ 2] [] [] []
'Error' [] [24] [ ] [] []
'Total' [] [26] [] [] []
stats =
gnames: {3x1 cell}
n: [9 12 6]
source: 'anova1'
means: [ ]
df: 24
s:
因为p=<,所以过去三年间在科研和开发上的平均花费对一年内生产力提高指数有显著差异。
且由箱型图可知:A3:花费多对生产力的提高的最快。
4、随机调查10个城市居民的家庭平均收入x 与电器用电支出Y 情况的数据(单位:千元)如右:
(1) 求电器用电支出y 与家庭平均收入x 之间的线性回归方程; >> x=[18 20 22 24 26 28 30 30 34 38];
收入i x 18 20 22 24 26 支出i y 收入 28 30 30 34 38 支出i y
y=[ ];
a=polyfit(x,y,1)
a =
所以线性回归方程为:0.1232 1.4254
=-。
y x
(2) 计算样本相关系数;
>> x=[18 20 22 24 26 28 30 30 34 38];
y=[ ];
corrcoef(x,y)
ans =
α下,作线性回归关系显著性检验;
(3) 在显著性水平=
>> x=[18 20 22 24 26 28 30 30 34 38];
x=x';
y=[ ]';
X=[ones(10,1),x];
[b,bint,r,rint,stats]=regress(y,X,
b =
bint = r =
rint =
stats =
(4) 若线性回归关系显著,求x=25时,电器用电支出的点估计值.
>> x=[18 20 22 24 26 28 30 30 34 38];
y=[ ];
a=polyfit(x,y,1);
x0=25;
polyval(a,x0)
ans =
故x=25时,电器用电支出的点估计值为。