数理统计课程论文

数理统计课程论文
数理统计课程论文

大学生考试成绩的量化分析

摘要:本文以某某大学化学化工学院2009级高等代数成绩为样本,结合概率论理论基础及统计学原理,探讨学生成绩的整理、成绩分布曲线的描绘以及怎样研究分布曲线所包含的“教”与“学”两方面的信息的方法。

关键词:正态分布频数直方图数字特征值优度检验偏度

一、引言

目前,考试仍然是高校教学过程中不可或缺的组成部分,对教与学双方而言,考试均起着检查工作成果进而评价绩效、查漏补缺的重要作用。考试是反馈教学信息,检测和评价教学质量,调控教学过程的重要手段。大学生在校期间的考试成绩可从多个层面折射出学生学习努力的程度、教师教学的效果、试卷的质量和学校教学管理水平等。

正态分布是连续随机变量概率分布的一种,对于一门课程的考核从掌握参照的角度来说,如果命题设计的合理,学生分数一般服从或近似服从正态分布。当然并不是所有考试都要求其分布为正态分布,这要根据考试的目的和性质等因素来决定。

对于大学成绩,已经不再是诸如各种竞赛性测验和择优录取的升学测验等选拔性的测验,而是一种成就测验,即合格水平测验。从而,目的在于考核学生是否达到了预定的教学目标和要求,反映了学生的学习功效。此时,不要求学生成绩呈现正态分布,反而希望学生成绩的分布能呈现负偏态分布。从学校的教育目的的角度来看,合格水平测验具有普遍意义、更重要的测验。因此,学生成绩测验呈现负偏态分布时,说明教学恰恰是成功的教学。

本文对某某大学化学化工学院2009级高等代数成绩加以统计,运用英国统计学家K.Pearson提出的2 检验方法进行了实证分析,得到合理的结论。

二、学生成绩分布直方图、成绩分布曲线

在刚得到数据时,各种数据信息是杂乱无章的,本文通过对数据进行由低到高分组分类得到各组的频数,求出各组的比例,然后编制出频数直方图,并求出数字特征。

某某大学化学化工学院2009级高等代数成绩表(百分制)

95 69 92 66 83 45

47 65 87 50 29 60

62 76 79 30 67 60

78 67 27 46 90 90

91 65 98 75 93 87

100 66 66 78 81 74

61 62 80 48 96 67

63 68 77 88 84 43

83 43 87 94 43 20

32 60 48 75 94 66

68 49 76 65 85 60

40 49 42 49 60 83

71 39 67 61 61 67

60 66 72 61 71 80

60 63 78 49 97 79

69 65 45 92 70 68

90 33 38 77 83 42

62 65 60 74 85 49

2.1数据整理

本文将所得数据采用百分制方法,按将从小到大分成了5组。利用excel软件编制累积次数表如下:

按成绩分组(分)频数(个)频率(%)

0-20 0 0.00%

20-40 8 7.41%

40-60 18 16.67%

60-80 54 50.00%

80-100 28 25.93%

合计108 100.00%

2.2 绘制频数直方图

建立以分数为横坐标,频数为纵坐标的直角坐标系,分别以组距为宽,频数为高作矩形构成分数频数直方图如下:

2.3

成绩散点图及频数趋势

用横坐标表示第几个分组,纵坐标表示该组内的频数,绘制成绩散点图级频数趋势,如下图:

2.4 数字特征

随机变量完全有它的概率分布(函数)描述,而确定其分布函数一般来说是相当麻烦的。在实际问题中,有时只需知道随机变量的某些数字特征就够了。以下是本文根据搜集的数据,利用数理统计的知识,结合计算机,分析算出的数字特征:

成绩直方图

1020304050600-20

20-40

40-60

60-80

80-100

成绩/分

人数/个

系列1

成绩散点图

102030405060

1

2

3

4

56

分组/第i个

频数/个

系列1线性 (系列1)

三、 分布拟合优度检验

3.1 正态性检验

本文将成绩总体分成5类,由上述数据整理可以得出每类情况出现的频率。记i A 为对该总体进行的分类,()j P A 为各种情况出现的频率,i P 为各种情况出现的概率。

原假设0H :()j P A =i P ,i =1,2,3,4,5 其中i P ≥0,且i P 之和等于1. 被择假设1H :()j P A =i P 等式不完全成立

2χ=

()

2

1

k

i i i i

n np np =-∑

若在0H 成立时对充分大的n ,检验统计量2χ近似服从自由度为1k -的2χ分布。由于统计量2χ度量的是观测频数i n 与理论频数i np 的偏离程度,2χ值大,表示偏离的程度大,偏离的程度越大越倾向于拒绝原假设0H 。对给定的显著水平α(0<α<1),该检验的拒绝域为:

W ={2χ≥21αχ-(1)k -}

本文用搜集的108个数据作为容量为108的样本的一个样本值,设:

0H :2009级高等代数成绩服从N ( 65.97335.36), 1H :2009级高等代数成绩不服从N ( 65.97335.36),

由2χ-拟合优度检验法的要求,将实数轴分成5个不相交的区间: [)0,20,

平均值 65.97 标准误差 1.831291

中位数 66 标准差 18.31291 方差 335.3627 偏度 -0.26385

最小值 20 最大值 100 求和 6597 最大(1) 100 最小(1) 20 置信度(95.0%)

3.633679

[)20,40,[)40,60 ,[)60,80 ,[]80,100

如前面数据整理所述。用()F x 表示N ( 65.97,335.36)的分布函数,P 表示在

0H 为真的条件下数据落入个区间的理论概率,即公式中的i p : 1P =F ()20=Φ()2.5103-≈

0.006 2P =F ()40-F ()20=Φ()1.4181--Φ()2.5103-≈0.0718 3P =F ()60-F ()40=Φ()0.3260--Φ()1.4181-≈0.2929 4P =F ()80-F ()60=Φ()0.7661-Φ()0.3260-≈0.4087 5P =F ()100-F ()80=Φ()1.8583-Φ()0.7661≈0.1892

本文取置信水平α=0.05,用Pearson 检验方法验证本文所收集的某某大学化学化工学院2009级高等代数成绩是否服从正态分布。将上述数据代入公式得:

()

2

5

21

i i i i

n np np χ=-=≈∑

11.54

由于区间数m 5=,未知参数2l =,故自由度为12m l --=。 经过查表,

可以得出20.95χ2()=5.9915。由于2χ>20.95χ2(),在拒绝域内,故应该拒绝原假

设,即某某大学化学化工学院2009级高等代数成绩不服从正态分布。

3.2 检验的p 值

假设检验的结论通常是简单的,在给定的显著水平下,不拒绝原假设就是保留原假设。然而有时也会出现这样的情况:在一个较大的显著水平(比如

α=0.05)下得到拒绝原假设的结论,而在一个较小的显著水平(比如α=0.01)

下却回到相反的结论。

因此引进检验的p 值得概念有明显的好处。第一、它比较客观,避免了事先确定的显著水平;其次,有检验的p 值与人们心目中的显著性水平α进行比较可以很容易做出检验的结论:

如果α≥p ,则在显著水平α下拒绝原假设0H ; 如果α

这个p 值反映了数据与假设的分布拟合程度的高度,p 值越大,拟合越好。 本文中,以T 记服从()22χ的随机变量,则使用统计软件可以算出:

{}11.540.178717309p P T =>=

由上述结果可以看出,p 值相对于α较大,故拟合得较好。

四、 结论

1、运用正态分布科学地分析学生的成绩是一项重要意义的工作,是高校教学过程控制的一个重要环节,是衡量教学效果、保证教学质量的重要手段。成绩

的统计分析是挖掘成绩数据资料的有效途径,为教学管理和改革服务。通过对正态分布和正态分布率的分析,我们可以较方便地发现哪些班和哪些专业学生的学习存在问题,从而加强管理和强化学风教育.

2、偏态是统计学家K.Pearson 于1895年首次提出的,它是对数据分布的对称测度。而偏态系数是对数据分布不对称性的度量值。偏态系数可以描述分布的形状特征,其取值的正负反映的是: 当0β>时,分布为正偏或右偏, 当0β=时,分布关于其均值()E x 对称, 当0β<时,分布为负偏或左偏.

本文中偏度是负的,则成绩的分布呈低度负偏或左偏。说明总体分数较高,高分段学生很多,命题较易。

3、我们通过Excel 软件对上述成绩进行了正态分析得出了上述考试成绩的一些数字特征。对于大学成绩,已经不再是诸如各种竞赛性测验和择优录取的升学测验等选拔性的测验,而是一种成就测验,即合格水平测验。从而,目的在于考核学生是否达到了预定的教学目标和要求,反映了学生的学习功效。此时,不要求学生成绩呈现正态分布,反而希望学生成绩的分布能呈现负偏态分布。从学校的教育目的的角度来看,合格水平测验具有普遍意义、更重要的测验。因此,学生成绩测验呈现负偏态分布时,说明教学恰恰是成功的教学。比如本文所作的成绩检测,呈现出低度负偏态分布,从实际出发,达到了学校教育目的,是学校教育成功的表现。

4、实际中,成绩评价的主要依据仅是平均分和不及格率。而平均成绩是可以被教师通过考题的难度及考前复习所控制的。事实上,在很多学校的成人教学中,学生大面积缺课、从不完成作业等现象非常严重,但是考试成绩却高分很多,不及格率极低,可见由平均成绩和不及格率很难发现学生学习中的异常情况。诚然,不及格率高会给教师造成很多压力,但我们不应该因此而降低考试的难度,如果试题太容易,则用功和不用功的学生考试成绩相差无几的情况就会发生,勤奋学生的学习积极性会受到打击。更严重的是,如果各届学生之间口口相传,学生的学风可能一届比一届差,这将严重影响大学的教学质量。当然,不及格率过高也是不合适的。因此,保持试卷有一定的难度,而通过平时成绩适当地加以调整,控制较低的不及格率,这才是一种较为现实的做法。对学生而言,这样做既有一定的学习压力,又能保证大部分学生获得合格的成绩。如上所述,本文所采用的成绩数据不及格率达到了68.51%,均分65.97,良好地反映了学生的学习功效和教学成果。成绩众数为60分,如果将其归为不及格,则成绩分布呈正态分布,有理由怀疑是否应将60划为及格线。

总之,正态分布分析具有科学计算的精确性、规律性和客观真实性的特点,但是应正确地运用这一工具,不应该简单化地评价正态分布分析结果。例如,认为学生成绩不呈正态分布就是教师的教学有问题。正态分布分析和其他指标如平均分、标准差、及格率等若能有机结合来,就可以较好地获得学生学习状况的信息,从而有利于学校、学院和任课老师采取切实措施,提高教学质量。

参考文献

[1] 茆诗松,程依鸣,濮晓龙.概率论与数理统计教程. 高等教育出版社,2004,7.

[2] 贾俊平. 统计学(第二版). 清华大学出版社,2006,7.

[3] 杨静. 学生成绩分析方法及其理论基础. 徐州师范大学,江苏. 彭城职业大学学报,第14卷第4

期,1999,12.

[4] 张生智. 总体分布假设检验的U-检验法. 合作民族师专,数学系,甘肃. 西北民族学院学报(自然科学版),

第20卷第3期,1999,9.

[5] 许树声,叶斐斐,李文婧. 华东理工大学,理学院数学系,上海. 华东高等教育,2009年第4期(总第108期).

数理统计论文

谈数理统计的社会应用 姓名:胡强达专业班级:理科0916班学号:3090103757 数理统计是研究随机现象的统计规律性的一门数学学科。它以概率论为基础,研究如何合理有效地收集受到随机性影响的数据,如何对所获得的数据进行整理和分析,从而为随机现象选择合适的数学模型并提供检验的方法,在此基础上对随机现象的性质、特点和统计规律做出推断和预测,直至为决策提供依据和建议。 19世纪时,比利时的凯特勒(L.A.Quetelet)将概率论等数学原理引入社会经济现象的统计研究,将概率论原理应用到了人口、人体测量和犯罪等问题的研究,并对观测的数据进行误差分析,创立了数理统计学。而数理统计作为一个进一步完善的数学学科的奠基者是英国人费舍尔(R.A.Fisher)。费舍尔最终的理论研究成果颇丰,它包括:数据信息的测量、压缩数据而不减少信息、对一个模型参数估计等。而后20世纪的瑞典数学家拉默(H. Cramer)运用测度论方法总结数理统计的成果,美籍罗马尼亚数学家瓦尔德(A. Wald)提出“序贯抽样”方法,还用博弈的观点看待数理统计的问题,他们极大地推动了数理统计向应用于社会生活的方向发展。 由于随机现象是客观世界中普遍存在的一种现象,因而数理统计的应用十分广泛,在自然科学、社会科学、工程技术、军事科学、医药卫生以及工农业生产中都能用到数理统计的理论与方法。随着计算机的普及和软件技术的发展,多种使用便捷的统计软件的面世,使得各行各业中只要粗通统计知识的人,都可以方便地运用统计分析的各

种工具来为自己的研究课题服务。数理统计正在发挥着越来越大的作用,它的应用更加广泛深入。数理统计在我们的生活中的各个方面影响几乎无处不在。可以说,数理统计学的理论和方法,与人类活动的各个领域在不同程度上都有关联。因为各个领域内的活动,都得在不同的程度上与数据打交道。都有如何收集和分析数据的问题,因此也就有数理统计学用武之地。 首先,专门的统计部门会做社会统计工作,定期公布社会生活各方面数量规律的情报,例如研究CPI,GDP,基尼系数这些社会经济指数时,都必须用到数理统计进行各种分析,得出结论,供决策部门和研究部门使用,社会学工作者利用这些公布的资料,可以进行广泛的社会研究。 然后,数理统计在工业中也要非常重要的应用,例如假设我们已经生产了一种产品,在生产过程中,由于原材料,设备调整及工艺参数等条件可能的变化,而造成生产条件不正常并导致出现废品,这可以通过在生产过程中随时收集数据并用统计方法进行处理,可以监测出不正常情况的出现以便随时加以纠正,避免出大的问题;然后,大批量的产品生产出来后,还有一个通过抽样检验以检验其质量是否达到要求,是否可以出厂或为买方所接受的问题,处理这个问题也要使用数理统计方法,在我国现行的国家标准中有一些就与这个问题有关。 还有,在农业上,数理统计被极大程度地被应用于预测预报上,正确预测预报作物(动物)的生长发育进度(苗情)、产量和病虫害的发

数理统计结课论文

数理统计中回归分析的探究与应用

回归分析问题探究 摘要 本文主要针对数理统计中的回归分析问题,通过对一元线性回归、多元线性回归以及非线性回归原理的探究,分别运用了SPSS和MATLAB软件进行实例分析以及进一步的学习。 首先,通过变量之间关系的概念诠释引出回归函数;其次,针 对回归函数,分别对一元线性回归原理上的学习,了解并会运用这三种线性回归模型、参数估计和回归系数的显著性检验来处理和解决实际的一元线性回归问题;接着,对多元线性回归和非线性回归进行学习,掌握它们与一元线性回归在理论和实践的联系与区别;然后,通过实际问题运用SPSS进行简单的分析,熟悉SPSS软件的使用步骤和分析方法,能够运用SPSS进行简单的数理分析;最后,用MATLAB编程来处理线性回归问题,通过多种方法进行比较,进行线性回归拟合计算并输出Logistic模型拟合曲线。 关键词:回归分析;一元线性回归;多元线性回归;非线性回归;SPSS;MATLAB

一、回归概念 一般来说,变量之间的关系大致可以分为两类:一类是确定性的,即变量之间的关系可以用函数的关系来表达;另一类是非确定性的,这种不确定的关系成为相关关系。相关关系是多种多样的,回归分析就是研究相关关系的数理统计方法。它从统计数据出发,提供建立变量之间相关关系的近似数学表达式——经验公式的方法,给出相关行的检验规则,并运用经验公式达到预测与控制的目的。 如随机变量Y与变量x(可能是多维变量)之间的关系,当自变量x确定后,因变量Y 的值并不跟着确定,而是按照一定的停机规律(随机变量Y的分布)取值。这是我们将它们之间的关系表示为 其中是一个确定的函数,称之为回归函数,为随机项,且。回归分析 的任务之一就是确定回归函数。当是一元线性函数形时,称之为一元线性回归;当 是多元线性函数形时,称之为多元线性回归;当是非线性函数形时,称之为非线性回归。 二、回归分析 2.1 一元线性回归分析 2.1.1 一元线性回归模型 设随机变量Y与x之间存在着某种相关关系,这里x是可以控制或可以精确测量的普通变量。对于取定的一组不完全相同的值做独立实验得到n对观察值 一般地,假定x与Y之间存在的相关关系可以表示为 , 其中为随机误差且,未知,a和b都是未知参数。这个数学模型成为医院 线性回归模型,称为回归方程,它所代表的直线称为回归直线,称b为回归系数。 对于一元线性回归模型,显然有。

概率论与数理统计-课程设计

概率论与数理统计课程设计

概率论的起源、发展和应用 作者: 摘要:论文简要介绍了概率论与数理统计学科的起源和发展,以及概率论与理统计在生活中的应用。 关键词:概率论与数理统计,起源,发展,应用 1、引言 《概率论与数理统计》是研究随机现象统计规律的一门数学学科,也是一门应用性很强又颇具特色的数学学科。它在包括控制、通信、生物、物理、力学、金融、社会科学等工程技术领域以及科学研究、经济管理、企业管理、经济预测等众多领域都有广泛的应用;它与其他数学分支有着紧密的联系(如微积分、高等代数、测度论等),是近代数学的重要组成部分;它的方法和理论向各个基础学科、工程学科的渗透,是近代科学技术发展的特征之一;它与基础学科相结合产生出了许多边缘学科,如生物统计、统计物理、数学地质等;它又是许多新兴的重要学科的基础,如信息论、控制论、可靠性理论、人工智能、信息编码理论和数据挖掘等。 《概率论与数理统计》是工科大学的一门应用性很强的必修基础课。学习和掌握概率论与数理统计的基本理论和基本方法并将其灵活应用于科学研究和工程实际中,是社会发展对高素质人才培养提出的必然要求。 2、概率论与数理统计的起源 概率论的萌芽源于十七世纪保险业的发展,但是真正引发数学家们思考的源泉,却是赌博者的请求。 十七世纪中叶,法国贵族德·美黑在骰子赌博中,有事急于抽身,须中途停止赌博,需要根据对胜负的预测把赌资进行合理的分配,但不知用什么样的比例分配才算合理,于是就写信向当时法国的最高数学家帕斯卡请教。正是这封信使概率论在历史的舞台迈出了第一步。

帕斯卡和当时第一流的数学家费尔玛一起,研究了德·美黑提出的关于骰子赌博的问题。于是,一个新的数学分支--概率论登上了历史舞台。三年后,也就是1657年,荷兰著名的天文、物理兼数学家惠更斯企图自己解决这一问题,结果写成了《论机会游戏的计算》一书,这就是最早的概率论著作。 为概率论确定严密的理论基础的是数学家柯尔莫哥洛夫。1933年,他发表了著名的《概率论的基本概念》,用公理化结构,这个结构明确定义了概率论发展史上的一个里程碑,为以后的概率论的迅速发展奠定了基础。 3、概率论与数理统计的发展 数理统计的发展大致可分为古典时期、近代时期和现代时期三个阶段。 古典时期(19世纪以前)——这是描述性的统计学形成和发展阶段,是数理统计的萌芽时期。在这一时期里,瑞土数学家贝努里(1654-1795年)较早地系统论证了大数定律。1763年,英国数学家贝叶斯提出了一种归纳推理的理论,后被发展为一种统计推断方法――贝叶斯方法,开创了数理统计的先河。法国数学家棣莫佛(1667-1754)于1733年首次发现了正态分布的密度函数,并计算出该曲线在各种不同区间内的概率,为整个大样本理论奠定了基础。1809年,德国数学家高斯(1777-1855)和法国数学家勒让德(1752-1833)各自独立地发现了最小二乘法,并应用于观测数据的误差分析。在数理统计的理论与应用方面都作出了重要贡献,他不仅将数理统计应用到生物学,而且还应用到教育学和心理学的研究。并且详细地论证了数理统计应用的广泛性,他曾预言:“统计方法,可应用于各种学科的各个部门。” 近代时期(19世纪末至1845年)——数理统计的主要分支建立,是数理统计的形成时期。上一世纪初,由于概率论的发展从理论上接近完备,加之工农业生产迫切需要,推动着这门学科的蓬勃发展。1889年,英国数学家皮尔逊(1857-1936)提出了矩估计法,次年又提出了频率曲线的理论,并于1900年在德国数学家赫尔梅特在发现c2分布的基础上提出了c2检验,这是数理统计发展史上出现的第一个小样本分布。1908年,英国的统计学家戈塞特(1876-1937)创立了小样本检验代替了大样本检验的理论和方法(即t分布和t检验法),这为数理统计的另一分支――多元分析奠定理论基础。1912年,英国统计学家费

数理统计结课论文

数理统计在环境监测方面的应用 班级:14研3班姓名:漆麟学号:201420001101 直线回归在分光光度法分析中起着非常重要的作用,它反应出被测物质浓度与吸光度之间的变量关系。例如在测定亚硝酸盐氮标准曲线时,由于亚硝酸盐氮不稳定在空气中可被氧化成硝酸盐氮也易被还原成氨,因此,要求测定过程快速准确。而正确绘制标准曲线是获得准确结果的必要手段。如何做到正确绘制标准,可采用数理统计中最小二乘法对每组实验数据进行线性回归,根据回归方程式 y=a+bx,求解a、b后代入回归方程即可绘出最接近真实的标准曲线。因为在理论上每组实验数据经过最小二乘法处理后都能得到一条最佳直线,这样就可避免主观选择估计的因素,使测定结果接近真值。 采用《环境监测分析方法》中N-1萘-乙二胺比色法。在pH2.0~2.5时,水中亚硝酸盐与对氨基苯磺酰胺生成重氮盐,再与N-1萘-乙二胺偶联生成红色染料,在543nm波长处有最大吸收。其色度深浅与亚硝酸盐含量成正比,可比色测定。 向标准比色管分别加入每毫升含0.5μg的亚硝酸钠标准使用液1mL、3mL、 5mL、7mL、10mL,用水稀释至50mL。然后再分别加入1.0mL对氨基苯磺酰胺盐酸盐溶液摇匀,放置2-8min,加入1.0mLN-1A萘-乙二胺盐酸盐溶液,10min后比色测定。测定结果见表1。 表1 亚硝酸盐氮标准曲线测定结果 亚硝酸(μg)x钠使用液0.5 1.5 2.5 3.5 5.0 吸光度y 0.036 0.111 0.185 0.259 0.367 线性回归设标准物浓度为x1,x2,……,x n,相应的吸光度为y1,y2,……,y n,根据回归方程y=a+bx求解方程的b和a。经计算的测定结果列于表2。 表2 用最小二乘法绘制亚硝酸盐氮标准曲线 n x x2 y y2 xy 1 0.5 0.25 0.036 0.001296 0.018 2 1.5 2.25 0.111 0.01231 0.1665 3 2.5 6.25 0.185 0.034225 0.4625

概率论与数理统计课程设计

概率论与数理统计课堂设计——概率论与数理统计在博彩中的应用 院系:班级: 姓名: 学号:

概率论与数理统计在博彩中的应用 作者: 摘要:赌博自古以来就一直是我们生活中的一个重要部分,各种形式的赌博存在于我们的生活中,但是我们也听过十赌九骗、十赌九输,那么赌博究竟有没有什么机制与规律呢?本文通过概率论的一些知识来揭示赌博中的规律,通过揭示其运行机制,让我们感受数学的美。关键字:赌博;概率论 1.发展历程 概率论是一门研究随机现象的规律的数学分支。其起源于16世纪,意大利学者吉诺拉莫·卡尔达诺(1501-1576)开始研究骰子等赌博中的一些问题,但真正刺激概率论发展的是来自17世纪的赌博者问题。数学家费马向法国数学家帕斯卡提出下列问题:现有两个赌徒相约赌若干局,谁先赢s局就算赢了,当赌徒A先赢a局(a

概率论课程小论文

《概率论与数理统计》小论文概率与理性的发展 哈尔滨工业大学 2014年12月

《概率论与数理统计》课程小论文 概率与理性的发展 摘要概率论是一门研究事件发生的数学规律的学科。他起源于生活中的实际问题的思考,较传统的几何学等起步较晚,在伯努利、泊松等数学家的努力下,形成了现如今较为完备的理论体系。他与数理统计一起,在工程设计、自然科学、社会科学、军事等领域起着重要作用。而概率论提出后有很多人感感兴趣对其进行研究的原因之一是很多事件的主观上对概率的判 断与实际的理论概率有着很大的差异,于是有关概率的悖论有很多,也有很多与直觉相悖的概率问题,这也是概率的魅力之一。本文将从概率的发展、概率与感性的差异等方面出发对概率与感性和理性进行探讨。 关键词概率悖论直觉理性 一、概率的发展 概率论的初步发展起源于十七世纪中叶的法国。在那里出现了对赌博问题的研究,也正是对赌博问题的研究,推动了概率论的发展。最初的问题是从分赌金开始的。[1] 最初的问题大致是这样的:甲乙双方是竞技力量相当的对手,每人各拿出32枚金币,以争胜负。在竞争中,取胜一次,得一分。最先获得3分的人取得全部赎金64枚金币。可是,因某种缘故,竞争3次,赌博被迫终止。而此时,甲得2分,乙得1分,问赌金如何分配?很多问题的开端都是利益的纠纷,这也是一个例子,双方都会为自己的利益考虑而提出对这笔赌金的分法,而从直觉上看,很多理由似乎也是很有道理的。但是真相只有一个,到底理论上最公平的分法是怎样的?这个问题的当事人爱好赌博的德梅雷 向其好友著名的数学家帕斯卡请教,这个问题也受到了帕斯卡的关注。帕斯卡与其好友费尔马进行了三个月的书信往来讨论这个问题,最终得到了满意的答案:假设两赌徒中甲赢了两局,乙一局未赢,那么接下来可能出现的情况是:若甲再赢一局,得3分,将获全部赌金;若乙赢一局,出现2:1的局

数理统计论文——统计源于生活

统计源于生活,生活演绎统计 ——《女士品茶》读书随笔在老师推荐的几本统计学著作中,我毫不犹豫地选择了这本《女士品茶——20世纪统计怎样改变了科学》,我不知道女士品茶与统计学有何关联,其中的微妙之处让我产生了好奇。同时它的名字会让我们立刻脱离冷冰冰、一大串复杂的统计学公式,而转到一个更加贴近生活和应用的角度去欣赏统计学的魅力。书中作者试图用20世纪统计学革命中的权威大师们的生平故事来向大众阐述什么是统计模型?它们是怎么来的?在现实生活中它们意味着什么?初略本书的目录,着实给人一种和某些平乏生硬的教科书不一样的感觉,一个个故事生动地演绎着统计学一个又一个突破与飞跃! 本书一开头便解开读者心头的疑惑——女士品茶与统计学有何关联? 故事是在20世纪20年代后期发生的,在英国剑桥一个夏日的午后,一群大学的绅士和他们的夫人们,还有来访者,正围坐在户外的桌旁,享用着下午茶。在品茶过程中,一位女士坚称:把茶加进奶里,或把奶加进茶里,不同的做法,会使茶的味道品起来不同。在场的一帮科学精英们,对这位女士的“胡言乱语”嗤之以鼻。这怎么可能呢?他们不能想象,仅仅因为加茶加奶的先后顺序不同,茶就会发生不同的化学反应。 这时唯独一个身材矮小、戴着厚眼镜、下巴上蓄着的短尖髯开始变灰的先生,却不这么看,他对这个问题很感兴趣,认为这种现象可以作为一个假设并做实验验证,于是设计一个实验来测试这位女士是否能喝出两种冲泡法的区别,让她在不知情的情况下尝奶茶,猜这杯是先加奶还是先加茶。为了避免蒙中,茶的杯数要足够多,但也不能无限制的喝下去,那么为了确定那个女士能猜到多准,最少该喝多少杯呢? 这个实验很著名,是个似然估计问题。故事中那位蓄短胡须的先生便是在统计发展史上地位显赫、大名鼎鼎的罗纳德·艾尔默·费歇尔(Ronald Aylmer Fisher)。他是英国统计学家,近代数理统计的开创者。后来费歇尔在自己的著作中讨论了这个实验的各种可能结果,其中有关实验设计的著述是科学革命的要素之一。费歇尔在自己孜孜不倦地求索过程中得出一个结论:科学家需要从潜在实验结果的数据模型开始工作,这是一系列数据公式,其中一些符号代表实验中

数理统计论文

研究生课程考核试卷 科目:数理统计教师:黄光辉 姓名:张振学号:20142002036 专业:环境科学与工程类别:学术 上课时间:2014 年9 月至2014 年11 月 考生成绩: 卷面成绩平时成绩课程综合成绩 阅卷评语: 阅卷教师(签名)

某商业银行不良贷款形成原因分析 摘要 根据某商业银行多家分行业务数据,建立线性回归模型,运用SPSS数理统计软件对此商业银行不良贷款情况进行运算与分析,以不良贷款为因变量(y),运用逐步回归法对变量数据进行筛选,最后以各项贷款余额(χ1)与本年固定资产投资额(χ4)为自变量,分别建立y与χ1的一元线性回归方程和y与χ1、χ4的二元线性回归方程,并对回归线性模型进行F检验、t检验和回归系数检验。最后结合实践经验,对模型进行检验,并运用Pearson相关系数测量因变量(y)与自变量(χ1、χ4)的线性相关关系,以及两个变量之间的相关性。 一、问题提出与分析 重庆一家某商业银行其业务主要是进行基础设施建设、重点项目建设、固定资产投资等项目的贷款。最近一段时间,在贷款额平稳增长的基础上,该银行的不良贷款记录也有大比例提高。为了弄清楚不良贷款形成的原因,该银行希望利用一些数据做些定量分析。 二、数据描述 表1是项目参考的变量名称;表2给出了该银行所属20家分行在2012年的相关业务数据。 表1 项目参考变量名 y:不良贷款(亿元)χ3:贷款项目个数(个) χ1:各项贷款余额(亿元)χ4:本年固定资产投资额(亿元) χ2:本年累计应收贷款(亿元) 表2 相关业务数据 分行编号不良贷款 各项贷款余 额 本年累计应 收贷款 贷款项目个数 本年固定资产投 资额 1 0.9 2 67.5 6.78 5 51.9 2 1.1 112.5 19.8 16 91.1 3 4.81 174.2 7.9 17 74.2 4 3.18 82.1 7.3 10 14.5 5 7.8 199.7 16.4 19 63.21 6 2. 7 16.3 2.2 1 2.2 7 1.6 106.2 10.7 17 20.2

数理统计论文

研究生课程考核试卷 (适用于课程论文、提交报告) 科目:概率论与数理统计上课时间:2017.2-2017.5 姓名:刘振学号: 20160702031专业:机械工程教师:刘朝林 工作单位或所在行业:重庆大学 考生成绩: 卷面成绩平时成绩课程综合成绩阅卷评语: 阅卷教师 (签名)

回归分析在数理统计中的应用 摘要:回归分析是数理统计中重要的一种数据统计分析的思想, 是处理变量间的相关关系的一种有效工具。其目的在于根据已知自变量的变化来估计或预测因变量的变化情况,或者根据因变量来对自变量做一定的控制. 它可以提供变量间相关关系的数学表达式, 且利用概率统计知识,对经验公式及有关问题进行分析、判断以确定经验公式的有效性,从众多的解释变量中,判断哪些变量对因变量的影响是显著的,哪些是不显著的. 还可以利用所得经验公式,由一个或几个变量的值去预测或控制个变量的值时的值,去预测或控制另一个变量的取值,同时还可知道这种预测和控制可以达到什么样的精度。 本文就是针对实际问题运用回归分析中一元线性回归分析的统计方法,来确定自变量与 另一个变量的相关关系,并确立出较为合理的回归方程,再对其的可信度进行统计检验. 关键词:回归分析;回归方程;F检验法

1.问题的提出 调查一下重庆大学学生的生活费与家庭收入的关系,看看是否家庭收入越高,学生的每月支出也越多,从而根据学生每月消费支出,进而估计学生的家庭收入情况,对学生的生活补助等问题有重要的参考意义 2.数据描述 根据调研的重庆大学学生家庭月收入与每月生活费的数据,确定两者关系。数据来源100多份问卷调查的抽样,取其中10份,绘制表1如下图所示序号家庭月收入每月生活费14800 500 25200 600 35420 650 45600 700 56000 750 66400 800 76800 900 87000 1000 97200 1200 108000 1500 表1-1 重庆大学学生家庭月收入与每月生活费的数据利用matlab软件画出家庭月收入与每月生活费的散点图,如图一所示

应用数理统计课程小论文数据,结果,分析过程

1 聚类分析 我们利用Matlab6.5中的cluster 命令实现,具体程序如下 x={ {n,m}=size(x); Stdr=std(x); xx=x./stdr(ones(n,1),;); % 标准化变换 y=pdist(xx); %计算各样本间距离(这里为欧氏距离) z=linkage(y); %进行聚类(这里为最短距离法) h=dendrogram(z); %画聚类谱系图 t=cluster(z,3) % 将全部样本分为3类 find(t==2); %找出属于第2类的样品编号 执行后得到所要结果 聚类谱系图见图1 t={3,1,3,1,1,2,2} 即全部样本分为3类。结果见表1 从图 1可以看出:七条河流中, 二干河、横套河、四干河属于一类, 污染 较重, 主要是CODmn 、BOD5超标多; 华妙河、盐铁塘属于一类, 污染一般, 主要是氨氮、石油类超标; 张家港河、东横河属于一类,污染较轻, 总的来说,各河流都存在不同程度的污染,因此全市应对各河流严格监督管理, 着力实施水污染防治工作, 太湖流域水污染源应限期治理达标排放, 巩固水污染防治工作成果,加大投入,新建或改、 扩建废水治理工程, 确保达标排放。 3.14 5.47 3.1 5.67 6.81 6.21 4.87 8.41 9.57 4.31 9.54 9.05 7.08 8.97 23.78 26.48 21.2 10.23 16.18 21.05 26.54 25.79 23.79 22.48 20.87 24.56 31.56 34.56 4.17 6.42 5.34 4.2 5.2 6.15 5.58 6.47 5.58 6.54 6.8 5.45 8.21 8.07 }

数理统计小论文

研究生“数理统计”课程课外作业 姓名:罗冲学号:20131002006 学院:动力工程学院专业:动力工程 类别:学术型上课时间:2013.9—2013.12 成绩:

城市供水管道长度与用水人口回归分析 摘要 为了分析城市居民供水问题,通过在国家统计局搜集数据,找到城市供水管道的长度和城市用水人口的相关数据,进行回归分析,运用参数估计、假设检验、回归分析的方法对其进行分析。讨论供水管道Y和用水人口X之间的线性关系,并讨论其在显著水平为α=0.05下,检验x和y是否具有显著线性关系。所以通过上述分析可以得到,供水管道的长度和用水人口成线性相关性。运用统计学知识,可以解决生活的问题。说明了随着人口的增长会,增加城市的供水管道的长度。 正文 一、问题提出,问题分析。 统计了有关供水的数据,通过对数据的分析,讨论供水管道Y和用水人口X 之间的线性关系,并讨论其在显著水平为α=0.05下,检验x和y是否具有显著线性关系;应用参数估计、假设检验、回归分析来解决问题。 二、数据描述(用表格表达数据信息,指出数据来源或提供原始数据) 问题中所给出的数据来源于国家统计局网站上面的相关信息,城市供水的信息。其中包括了生活、生产用水和用水人口、供水重量、管道长度等信息,选取的数据是2011年到2006年(如下表),进行相关分析。

三、模型建立: (1)提出假设条件,明确概念,引进参数; 讨论供水管道Y 和用水人口X 之间的线性关系,采用一元线性回归模型。 Y=β0+β1x+ ε ε~ N(0,2σ) 回归函数:y=β0+β1x 采用最小二乘法,求出相应的估计值: X =6 116=∑i i x =36036.4 Y =6 1 16=∑i i Y =496943.59 通过计算可以得到: l xx =6 21 ()i i x x - =-∑=34337890.49 l yy =21 ()n i i y y - =-∑=1.510297x1010 l xy =6 1 ()i i i x x y - =-∑=701606286 ^ y = ^β0+ ^ β1x (2)模型构建; 一元线性回归模型,进行求解,并会对其进行相关的验证。根据教材的相关公式进行求解。

概率论与数理统计结课论文

概率论与数理统计课程总结报告——概率论与数理统计在日常生活中的应用 姓名: 学号: 专业:电子信息工程

摘要:数学作为一门工具性学科在我们的日常生活以及科学研究中扮演着极其重要的角色。概率论与 数理统计作为数学的一个重要组成部分,在生活中的应用也越来越广泛,近些年来,概率论与数理统计知识也越来越多的渗透到经济学,心理学,遗传学等学科中,另外在我们的日常生活之中,赌博,彩票,天气,体育赛事等都跟概率学有着十分密切的关系。本文着眼于概率论与数理统计在我们生活中的应用,通过前半部分对概率论与数理统计的一些基本知识的介绍,包括概率的基本性质,随机变量的数字特征及其分布,贝叶斯公式,中心极限定理等,结合后半部分的事例分析讨论了概率论与数理统计在我们生活中的指导作用,可以说,概率论与数理统计是如今数学中最活跃,应用最广泛的学科之一。 关键词:概率论 数理统计 经济生活 随机变量 贝叶斯公式 基本知识 §1.1 概率的重要性质 1.1.1定义 设E 是随机试验,S 是它的样本空间,对于E 的每一事件A 赋予一个实数,记为P (A ),称为事件的概率。 概率)(A P 满足下列条件: (1)非负性:对于每一个事件A 1)(0≤≤A P (2)规范性:对于必然事件S 1)S (=P (3)可列可加性:设n A A A ,,,21 是两两互不相容的事件,有∑===n k k n k k A P A P 1 1 )()( (n 可以取∞) 1.1.2 概率的一些重要性质 (i ) 0)(=φP (ii )若n A A A ,,,21 是两两互不相容的事件,则有∑===n k k n k k A P A P 1 1 )()( (n 可以取∞) (iii )设A ,B 是两个事件若B A ?,则)()()(A P B P A B P -=-,)A ()B (P P ≥ (iv )对于任意事件A ,1)(≤A P (v ))(1)(A P A P -= (逆事件的概率) (vi )对于任意事件A ,B 有)()()()(AB P B P A P B A P -+=?

数理统计参考论文

重庆市固定资产投资与房地产投资 线性关系分析 学号 20111602084 姓名陈磊 学院土木工程学院专业土木工程 成绩

重庆市固定资产投资与房地产投资 线性关系分析 摘要:我国房地产投资近年来迅猛发展,无论在规模还是在增速上都达到了前所未有的水平,房地产业作为新兴的产业,对我国的经济发展起着举足轻重的作用。房地产投资与固定资产的投资息息相关,研究两者之间的关系并作出预测显得非常有必要。借助于数理统计的知识,在实际的数据的基础上,对两者之间进行一个简单的一元线性回归分析。在建立起模型之后,通过显著性检验方法进行检验,以检查结果的正确性。并通过模型对重庆市的房地产投资作出一个大致的预测,同时对相关结论进行分析,以指导实际工作。 关键词:固定资产投资;房地产投资;线性回归 一、问题提出及分析 重庆市作为国家中心城市之一,西部惟一的直辖市,凭借特殊的政策优势、基础条件优势, 经过政府一系列积极政举,经济发展环境持续向好,直辖以来积蓄的发展势能不断释放。在大力推动“五个重庆”、统筹城乡、内陆开放、深化改革、振兴区县、改善民生等重点工作的情况下,重庆市继续加强落实了中央扩大内需的投资项目和政府主导的投资计划,不断鼓励并激活社会资本,使得固定资产投资需求不断扩大、投资力度不断增强、投资结构不断优化,基础产业、基础设施、房地产及其他第三产业的投资齐头并进,全市固定资产投资保持平稳较快增长。 固定资产是指企业使用期限超过1年的房屋、建筑物、机器、机械、运输工具以及其他与生产、经营有关的设备、器具、工具等。固定资产投资是建造和购置固定资产的经济活动。按照管理渠道分,全社会固定资产投资总额分为基本建设、更新改造、房地产开发投资和其他固定资产投资四个部分。 房地产业作为一个国计民生的大行业,其投资额牵动着整个社会的安居问题。重庆目前又在推出宜居重庆的政策,由此引发思考:房地产投资在固定资产中是否存在一定的关系,与固定资产投资的关系如何,是否可以用一定的方式进行预测? 借助统计学与软件的分析,采用散点图的描绘,可以看到固定资产投资额与房地产投资额可能存在一定的线性关系,由此借助数理统计知识,通过一元线性回归的相关知识对该问题进行分析。

概率论与数理统计结课论文

概率论的发展与应用 摘要:概率论与数理统计是一门研究随机现象及其规律性的数学学科。通过实验来观察随机现象,揭示其规律性,或根据实际问题的具体情况找出随机现象的规律。它起源于17世纪中叶,法国数学家帕斯卡、费马及荷兰数学家惠更斯基于排列组合方法,研究利用古典概型解决赌博中提出的一些问题。由于社会的发展和工程技术问题的需要,促使概率论不断发展,许多科学家进行了研究。发展到今天,概率论与数理统计在自然科学,社会科学,工业生产,金融及日常生活实际等诸多领域中起着不可替代的作用。 关键词:概率论与数理统计;起源与发展;应用 1.概率论的起源与发展 1.1 概率论的起源 概率论的起源与赌博有关,在17世纪中叶,一位名叫德·梅尔的赌徒向帕斯卡提出了“分赌注问题”即两个人决定赌若干局,事先约定谁先赢得s局便算赢家。如果在一个人赢a(a

数理统计论文

应用MATLAB进行非线性回归分析 摘要 早在十九世纪,英国生物学家兼统计学家高尔顿在研究父与子身高的遗传问题时,发现子代的平均高度又向中心回归大的意思,使得一段时间内人的身高相对稳定。之后回归分析的思想渗透到了数理统计的其他分支中。随着计算机的发展,各种统计软件包的出现,回归分析的应用就越来越广泛。回归分析处理的是变量与变量间的关系。有时,回归函数不是自变量的线性函数,但通过变换可以将之化为线性函数,从而利用一元线性回归对其进行分析,这样的问题是非线性回归问题。下面的第一题:炼钢厂出钢水时用的钢包,在使用过程中由于钢水及炉渣对耐火材料的侵蚀,使其容积不断增大。要找出钢包的容积用盛满钢水时的质量与相应的实验次数的定量关系表达式,就要用到一元非线性回归分析方法。首先我们要对数据进行分析,描出数据的散点图,判断两个变量之间可能的函数关系,对题中的非线性函数,参数估计是最常用的“线性化方法”,即通过某种变换,将方程化为一元线性方程的形式,接着我们就要对得到的一些曲线回归方程进行选择,找出到底哪一个才是更好一点的。此时我们通常可采用两个指标进行选择,第一个是决定系数2R,第二个是剩余标准差s。进而就得到了我们想要的定量关系表达式。第二题:给出了某地区1971—2000年的人口数据,对该地区的人口变化进行曲线拟合。也用到了一元非线性回归的方法。首先我们也要对数据进行分析,描出数据的散点图,然后用MATLAB编程进行回归分析拟合计算输出利用 Logistic模型拟合曲线。 关键词:参数估计, Logistic模型,MATLAB 正文 一、一元非线性回归分析的求解思路:

1、求解函数类型并检验。 2、求解未知参数。可化曲线回归为直线回归,用最小二乘法求解;可化曲线回 归为多项式回归。 二、回归曲线函数类型的选取和检验 1、直接判断法 2、作图观察法,与典型曲线比较,确定其属于何种类型,然后检验。 3、直接检验法(适应于待求参数不多的情况) 4、表差法(适应于多想式回归,含有常数项多于两个的情况) 三、化曲线回归为直线回归问题 用直线检验法或表差法检验的曲线回归方程都可以通过变量代换转化为直 线回归方程,利用线性回归分析方法可求得相应的参数估计值。 题目: 例8.5.1 炼钢厂出钢水时用的钢包,在使用过程中由于钢水及炉渣对耐火材料的浸蚀,其容积不断增大。现在钢包的容积用盛满钢水时的重量y (kg)表示,相应的试验次数用x表示。数据见表8.5.1,要找出y与x的定量关系表达式。 表8.5.1 钢包的重量y与试验次数x数据 1) 1/y=a+b/x 2)y=a+b ln x = y+ b x a

数理统计课程论文

硕士课程考试试卷 考试科目:数理统计 考生姓名:周宇考生学号:20131702044 学院:城市建设与环境工程学院专业:市政工程 考生成绩: 任课老师(签名) 考试日期:2013年12月日午时至时

游戏公司的代言方案是否有效 摘要:由于近来游戏研发市场低迷,某游戏公司提出邀请明星做代言。该公司通过制定一系列品牌定位、广告拍摄以及市场投放方案,起到提高点击率的目的。该方案实施后为考察其有效性,应用数理统计的知识对随机抽取的数据进行假设检验,并分析检验后结果,得到的结论是该方案有效。 关键字:假设检验分析 一、问题的提出与分析 游戏公司认为现在的方案有点片面的强调顾客的游戏体验而对顾客点击数缺乏一些激励措施。为此,邀请了一系列与游戏形象相符的明星代言,然后在不太影响游戏公司效益的前提下设计了一些有吸引力的有奖措施已尽量增加顾客的点击数。 二、数据描述 为了比较此方案的有效性,随机地选择了该游戏公司的15位玩家,得到他们在新方案实施前后的指数,结果见下表2.1。 表2.1方案实施前后的指数

三、模型建立 对α=0.01检验该营销方案是否有效。 (1)提出假设 对本检验题,采用成对数据的比较方法较好.这是因为初看起来,这是两总体均值的比较问题,即将新方案实施前后的指数分别看作两个总体,将15位玩家在新方案实施前后的指数看作来自这两个总体的样本,若进一步假设这两个总体服从正态分布,便可利用t检验法检验二者的均值是否有显著差异。但仔细想想,发现这样有点欠要,因为每位玩家的消费水平、游戏偏好等等会有很大的差异,从而玩家的点击数存在较大差异,这使得各户之间的存款指数缺乏一致性,因而看成来自同一总体的样本是不妥当的。 如果我们将同一玩家在新方案实施前后的存款指数相减,由于各玩家在新方案实施前后的消费水平、游戏偏好等方面不会有太大的变化,则该差值不是由于各玩家的家庭状况的差异而来,而是反映了新方案的实施对点击数的影响,因而将这些差值看成来自某一总体的样本就比较合理了。若进一步假定这些差值服从N(μ, σ2),则μ的大小反映了新方案实施前后对存款指数的平均影响程度.检验方案是否有效,等价于检验假设 H0: μ≤0; H1: μ>0 (2)模型构建 该假设便可有正态总体均值的t检验法来检验以x1i,x2i(i = 1, 2,...15)分别表示新方案实施前后各玩家的存款指数,令 y i=x2i-x1i(i=1,2…15) 则y l,y2…y15 可看成来自正态总体N(μ, σ2)的一个容量为15的样本观察值. (3)模型求解 由此可求得:

数理统计小论文

钢-混组合梁抗弯承载力 影响因素分析 摘要:钢-混组合梁是在钢筋混凝土结构和钢结构基础上发展起来的,以钢筋混凝土为翼缘板,钢梁为腹板,两者以建立连接件连接而成的新型结构形式。其具有承载能力高、整体刚度大、抗火能力强、经济等特点。抗弯承载力是钢-混组合梁一个主要的力学性能。本文采用正交试验设计,分析了钢材强度等级、混凝土强度等级、钢梁的腹板厚度和混凝土横向配筋率等四个因素对组合梁抗弯承载力的影响程度。 关键词:钢-混组合梁;抗弯承载力;正交试验;SPSS 一问题提出与分析 1.1钢-混组合梁概念 混凝土具有很好的抗压性能,但抗拉能力很弱,宜用于受压结构;钢材既抗拉又抗压。对于一片普通的简支梁,在荷载作用下,梁的上部分受压,下部分受拉。对于钢筋混凝土梁,为了保证梁的上下部分同时达到屈服,一般采用的是在梁下部布设钢筋,起到抗拉的作用。但钢筋混凝土梁具有自重大、受拉区混凝土容易产生裂缝等缺点。由于钢材良好的抗拉与抗压力学性能,因此纯钢梁的力学性能也很好,但是钢梁具有不经济、耐火性能差等缺点。 钢-混组合梁就是在钢结构和钢筋混凝土结构的基础上发展起来的一种新型结构形式。翼缘板采用钢筋混凝土,作为受压结构,腹板采用钢梁,作为受拉结构,两者之间通过剪力连接件连接成一个整体,这就构成了钢-混组合梁。钢-混组合梁结合了钢筋混凝土和钢材各自的优势,具有承载能力高、整体刚度大、抗火能力强、经济的特点[1]。 1.2问题的提出 在钢-混组合梁的力学性能中,抗弯承载力是一项重要的指标。钢-混组合梁由钢材和钢筋混凝土通过连接件连接而成,有许多因素会对组合梁的抗弯承载力产生影响。本文对钢材强度等级、混凝土强度等级、钢梁的腹板厚度和混凝土横

数理统计课程论文

福建农林大学计算机与信息学院 (数学类课程) 课程论文报告 2011 年 6 月25 日

福建农林大学计算机与信息学院数学类课程论文报告结果评定

目录 摘要 (2) 1、问题的提出 (3) 2、问题的分析 (4) 3、问题的解决 (4) 3.1 问题重述 (4) 3.2 建立模型 (4) 3.3 模型求解 (5) 3.4 模型检验 (7) 4、小结 (9) 参考文献 (9) 附录 (1)

摘要:回归分析是数理统计中重要的一种数据统计分析的思想。它是研究一个随机变量与一个或多个普通变量之间的相互关系的统计方法。主要是解决从一组数据出发,确立变量间是否存在相关的关系,如果存在相关关系,确定他们之间合适的数学表达式即经验公式或回归方程,并对它的可信度作统计检验;还可以针对从共同影响一个变量的许多变量中,判断哪些变量的影响是显著的,哪些变量是不显著的,并利用所确定的回归方程进行预测和控制。 本文就是针对实际问题运用回归分析中一元线性回归分析的统计方法,来确定自变量与另一个变量的相关关系,并确立出较为合理的回归方程,再对其的可信度进行统计检验。关键词:回归分析;回归方程;F检验法

1、问题的提出 根据以下9组关于营业税税收总额y和社会商品零售总额x的数据[1],确定出两者的关系。 表1 社会商品零售总额和营业税税收总额 序号社会商品零售总额营业税税收总额 1 142.08 3.93 2 177.30 5.96 3 204.68 7.85 4 242.68 9.82 5 316.24 12.50 6 341.99 15.55 7 332.69 15.79 8 389.29 16.39 9 453.40 18.45 2、问题的分析 营业税税收总额是受很多的因素所决定,但是题目中已经将主要的因素确定为社会商品零售总额,这就大大的减少了在对于自变量的多因素进行分析的过程,从而减少了在计算以及统计上的困难,但是这也在很大的程度上减少了结果的实际意义。 在针对本题所给的两个变量之间的关系,作出回归分析以及运用重要的数学软件的实现,从而来确定这两个变量之间的关系,并计算出两者之间的回归方程,再对方程的可信度进行检验。 3、问题的解决 3.1 问题重述 在本题目中已经明确地给出只有两个变量之间的关系,所有可以忽略影响营业税税收总额除社会商品零售总额之外的其他因素,这对于解决问题减少了难度。只要在运用回归分析的统计方法来比较二者之间的关系以及它们之间的相关性,并运用经验的回归公式,计算出二者之间的数学关系式。 3.2 建立模型 根据表中所给的数据初步作出营业税税收总额y和社会商品零售总额x之间的数据散点图,并在散点图中找出关于二者之间的初步关系 。运用数学软件来作出二者的散点图如下:(MA TLAB程序代码如附录一)

相关文档
最新文档