数理统计大作业知识分享

合集下载

应用数理统计大作业1——逐步回归法分析终教学提纲

应用数理统计大作业1——逐步回归法分析终教学提纲

应用数理统计大作业1——逐步回归法分析终应用数理统计多元线性回归分析(第一次作业)学院:机械工程及自动化学院姓名:学号:2014年12月逐步回归法在AMHS物流仿真结果中的应用摘要:本文针对自动化物料搬运系统 (Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS 数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。

关键词:逐步回归;残差;SPSS;AMHS;物流仿真目录1、引言 (1)2、逐步回归法原理 (4)3、模型建立 (6)3.1确定自变量和因变量 (6)3.2分析数据准备 (6)3.3逐步回归分析 (7)4、结果输出及分析 (9)4.1输入/移去的变量 (9)4.2模型汇总 (10)4.3方差分析 (10)4.4回归系数 (11)4.5已排除的变量 (12)4.6残差统计量 (13)4.7残差分布直方图和观测量累计概率P-P图 (14)5、异常情况说明 (15)5.1异方差检验 (15)5.2残差的独立性检验 (17)5.3多重共线性检验 (17)6、结论 (18)参考文献 (20)1、引言回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。

这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。

逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。

SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。

数理统计期末重点知识

数理统计期末重点知识

数理统计期末重点知识期末考试重点目录5.3 统计量及其分布 (1)5.4 三大抽样分布 (2)内容概要 (2)§6.1 点估计的几种方式 (6)§ 6.2 点估计的评价标准 (11)内容概要 (11)§7.1 假设检验的基本思想 (19)内容概要 (19)§正态总体参数假设检验 (26)5.3 统计量及其分布样本方差与样本标准差 样本方差有两个,样本方差2*s 与样本无偏方差2*s2*s =n121)(-=-∑x x ni i , 112-=n s 21)(-=-∑x x ni i 。

实际中常用的是无偏样本方差2s ,这是因为:当2σ为总体方差时,总有E(2s *)=21σnn -, E(22)σ=s . 2s 的计算有如下三个公式可供选用:2s =22222()111()[][].111i i ii x x x x x nx n n n n -=-=----∑∑∑∑ 在分组样本场合,样本方差的近似计算公式为221111()[],11k ki i i i i i s f x x f x nx n n ===-=---∑∑ 1.从指数总体exp(1/θ)中抽取了40个样品,试求x 的渐进分布240(,)N θθ 2.设125,x x 是从均匀分布U(0,5)抽取的样本,试求样本均值x 的渐进分布 51,.212N ⎛⎫⎪⎝⎭3. 设x 1,, x20是从二点分布b(1,p)抽取得样本,试求样本均值x 的渐近线分布(1),20p p N p -⎛⎫ ⎪⎝⎭4.设116,,x x 是来自N ()4,8的样本,试求下列概率(1)(16)(10)P x >; (2)(1)(5)P x >.解:(1) 10(16)(16)1(10)1(10)1((10))P x P x P x >=-≤=-≤1616108110.84130.9370,0⎛-⎫⎛⎫=-Φ=-= ⎪ ⎪⎝⎭⎝⎭(2 )()()161616(1)158(5)(5)1 1.50.3308.2P x P x ⎛-⎫⎛⎫>=>=-Φ=Φ=⎡⎤ ⎪ ⎪⎣⎦⎝⎭⎝⎭5.4 三大抽样分布内容概要1. 三大抽样分布:χ2分步,F 分布,t 分布设x 1,x 2,…,x n 和y 1,y 2,…,y n 是来自标准正态分布的两个相互独立的样本,则此三个统计量的构造及其抽样分布人员下表所示2221)/)/n m n x y m x n y ++++++2)/n x n+今后正态总体参数的置信区间与假设检验大多数将基于这三大抽样分布 2. 一个重要的定理设x 1,x 2,…,x n 是来正态总体N(μ,σ2)的的样本,其样本均值与样本方差分别为∑==n i i x n x 11 和 ,)(1122∑--=x x n s i 则有(1)x 与2s 相互独立;(2)x ~)/,(2n N δμ;(3)22)1(δs n ⋅-~)1(2-n χ.3. 一些重要推论(1)设n x x ,,1 是来自正态总体),(2δμN 的样本,则有sx n t )(μ-=~)1(-n t , 其中x 为样本均值,为样本标准差.(2)设m x x ,,1 是来自),(211δμN 的样本,n y y ,,1 是来自),(222δμN 的样本,且此两样本相互独立,则有222212δδyx s s F =~)1,1(--n m F ,其中22,y x s s 分别是两个样本方差.若2221δδ=,则22y xs s F =~)1,1(--n m F .1. 在总体)4,6.7(N 中抽取容量为n 的样本,如果要求样本均值落在)6.9,6.5(内的概率不小于0.95,则至少为多少?解:样本均值x ~)4,6.7(nN ,从而按题意可建立如下不等式95.0)46.76.946.746.76.5()6.96.5(≥-<-<-=<<nnx nP x P ,即95.01)(2≥-Φn ,所以975.0)(≥Φn ,查表,975.0)96.1(=Φ,故96.1≥n 或84.3≥n ,即样本量n 至少为4.2.设n x x ,,1 是来自)25,(μN 的样本,问n 多大时才能使得95.0)1|(|≥<-μx P 成立?解:样本均值x ~)25,(nN μ,因而(||1)|210.95x P x P μ⎛⎫-<=<=Φ-≥ ⎝, 所以975.0)5(≥Φn ,96.15≥n ,这给出04.96≥n ,即n 至少为97时,上述概率不等式才成立..设161,,x x 是来自),(2δμN 的样本,经计算32.5,92==s x ,试求)6.0|(|<-μx P .解:因为)1()1(||)(22---=-n sn n x sx n δδμμ~)1(-n t ,用)(15x t 表示服从)15(t 的随机变量的分布函数,注意到t 分布是对称的,故1)0405.1(2)6.04||4()6.0|(|15-=⨯<-=<-t ss x P x P μμ. 统计软件可计算上式.譬如,使用MATLAB 软件在命令行输入tcdf(1.0405,15)则给出0.8427,直接输入2* tcdf(1.0405,15)-1则给出0.6854.这里的tcdf(x,k)就是表示自由度为可 k 的t 分布在x 处的分布函数,于是有(||0.6)20.842710.6854.P x μ-<=⨯-=3.设n x x ,,1 是来自)1,(μN 的样本,试确定最小的常数c,使得对任意的0≥μ,有α≤<P )|(|c x .解:由于)1,(~nx μN ,所以)|(|c x <P 的值依赖于μ,它是μ的函数,记为g(μ),于是))(())(()()|(|)(μμμμ--Φ---Φ=<<-P =<P =c n c n c x c c x g ,其导函数为))](())(([)('μϕμϕμ-----=c n c n n g , 其中)(x ϕ表示)1,0(N 的密度函数,由于0,0≥≥μc ,故μμ-≥--c c ,从而)),(())((μϕμϕ-≤--c n c n 这说明)(,0)('μμg g ≤为减函数,并在0=μ处取得最大值,即.1)(2)()())}(())(({m ax 0-Φ=-Φ-Φ=--Φ--Φ≥c n c n c n c n c n μμμ于是,只要,1)(2α≤-Φc n 即n u c /)0(2/)1(α+≤≤就可保证对任意的,0≥μ有.)|(|α≤<P c x 最大的常数为 ./2/)1(n u c α+=4.设21,x x 是来自),0(2σN 的样本,试求22121⎪⎪⎭⎫ ⎝⎛-+=x x x x Y 的分布.解: 由条件,),2,0(~),2,0(~221221σσN x x N x x -+故),1(~2),1(~222212221χσχσ⎪⎭⎫⎝⎛-⎪⎭⎫ ⎝⎛+x x x x 又0)()(),(212121=-=-+x Var x Var x x x x Cov ,且2121x x x x -+与服从二元正态分布,故 2121x x x x -+与独立,于是 ).1,1(~)2/)(()2/)((22122122121F x x x x x x x x Y σσ-+=⎪⎪⎭⎫ ⎝⎛-+=5.设总体为N(0,1),21,x x 为样本,试求常数k,使得.05.0)()()(221221221=⎪⎪⎭⎫ ⎝⎛>++-+P k x x x x x x 解:由上题,,1)()()(),1,1(~22122122122121Y Y x x x x x x z F x x x x Y +=++-+=⎪⎪⎭⎫ ⎝⎛-+= 由于Z 的取值与(0,1),故由题目所给要求有0<k<1,从而.05.0)1()1()(=->=>+=>kkY P k Y Y P k Z P于是,45.161)1,1(195.0==-F k k 这给出.9938.045.161145.161=+=k6.设从两个方差相等的正态总体中分别抽取容量为15,20的样本,其样本方差分别为,,2221s s 试求).2(2221>S S p 解 不妨设正太总体的方差为2σ,则有),19(~19),14(~1422222221χσχσs s 于是).19,14(~2221F s s F =利用统计软件计算可算出.0798.0)2()2(2221=>=>F P s s P 譬如,可使用MATLAB 软件计算上式:在命令行输入1-fcdf (2,14,19)则给出0.0798,这里的fcdf ),,(21k k x 就表示),(21k k 自由度为 的F 分布在x 处的分布函数。

根据数理统计知识点归纳总结(精华版)

根据数理统计知识点归纳总结(精华版)

根据数理统计知识点归纳总结(精华版)
1. 引言
本文旨在对数理统计的基本知识点进行归纳总结,帮助读者快速了解数理统计的核心概念和方法。

2. 概率论基础
- 概率的基本定义和性质
- 随机事件的运算规则
- 条件概率和独立性
- 贝叶斯定理
3. 随机变量和分布
- 随机变量的定义和分类
- 离散型随机变量和连续型随机变量
- 常见离散型分布(如伯努利分布、二项分布、泊松分布)
- 常见连续型分布(如均匀分布、正态分布、指数分布)
4. 数理统计的基本概念
- 总体和样本的概念
- 估计与抽样分布
- 统计量和抽样分布
5. 参数估计
- 点估计的定义和性质
- 常见的点估计方法(如最大似然估计、矩估计)
- 区间估计的基本原理和方法
6. 假设检验
- 假设检验的基本思想和步骤
- 单侧检验和双侧检验
- 假设检验中的错误类型和显著性水平
- 常见的假设检验方法(如正态总体均值的检验、两样本均值的检验)
7. 相关分析
- 相关系数的定义和计算方法
- 相关分析的假设检验
- 线性回归分析的基本原理和方法
8. 统计软件的应用
- 常见的统计软件介绍(如SPSS、R、Python)
- 统计软件的基本操作(如数据导入、数据处理、统计分析)
9. 结语
本文对数理统计的核心知识点进行了简要的概括,供读者参考和研究。

通过研究数理统计,读者可以更好地理解和应用统计学在实际问题中的作用,提高数据分析和决策能力。

以上是根据数理统计知识点的归纳总结,希望有助于您对数理统计的理解和学习。

如需深入了解各个知识点的具体内容,请参考相关教材或课程。

数理统计知识梳理

数理统计知识梳理

2、步骤
( 1) 提 出 原 假 设 H 0 ( 2) 选 择 检 验 的 统 计 量 并 找 出 在 假 设 H 0 成 立 的 条 件 下 , 该 统 计 量 所服从的概率分布 ( 3) 根 据 所 给 的 显 著 水 平 , 查 概 率 分 布 临 界 值 表 , 找 出 检 验 统 计 量 的 临 界 值 , 并 确 定 否 定 域 ( 4) 用 样 本 值 计 算 统 计 量 的 值 , 将 其 与 临 界 值 比 较 , 根 据 比 较 结 果 , 确 定 样 本 值 是 否 落 入 否 定 域 , 最 后 对 H 0作 出 结 论
( X 1 , X 2 ,… , X n )
是n次试验的结果,因此它们是
n个随机变量。但做了试验后,记录下来的是它们在试 验中所取得的数值,得到一串数据
( x1 , x 2 , … , x n )
这串数据称为样本的观察值。
样本的观察值就是指样本的一次实现, 是一个常数向量

有时样本观察值也称为样本,因此样本一词 具有二重性
服 从 自 由 度 为 ( k 1, k 2) 的 F 分 布 , 记 F ( k 1, k 2) 。

F分布一个重要特点
F1( k 1, k 2) =
1 F( k 2, k 1)
3、统计量
设 X 1 , X 2 , … , X n 是 来 自 总 体 X 的 一 个 样 本 , g( x1 , x 2 , … , x n ) 是 一 个 连 续 函 数 。 如 果 g中 不 包 涵 任 何 未 知 数 参 数 , 则 称 g(X 1 , X 2 , … , X n )为 统 计 量 。
2分 布 的 重 要 性 质
X 1 ~ ( m ) , X 2 ~ ( n ) ; n )

数理统计知识点总结

数理统计知识点总结

数理统计知识点总结一、概述数理统计是一门研究收集、整理、分析和解释数据的学科。

它在各个领域中发挥着重要作用,包括科学研究、经济学、社会学等。

二、基本概念1. 数据:指收集到的观察结果或实验结果,是进行统计分析的基础。

2. 总体和样本:总体指研究对象的全体,样本是从总体中选取的一部分。

3. 变量:指研究对象的性质或特征,分为定性变量和定量变量。

4. 频数和频率:频数是某一数值在样本中出现的次数,频率是某一数值在样本中出现的相对次数。

三、数据的整理与描述1. 数据的收集:可以通过实验、调查或观察等方式获取数据。

2. 数据的整理:包括数据的分类、排序和归纳等处理。

3. 数据的描述:使用统计指标如均值、方差、标准差等来描述数据分布的中心趋势和变异程度。

四、概率与概率分布1. 概率:指事件发生的可能性,可通过频率或理论推导计算得到。

2. 概率分布:描述随机变量取值与其概率之间的关系,包括离散概率分布和连续概率分布。

五、统计推断1. 参数估计:根据样本数据估计总体的参数,如均值、比例等。

2. 假设检验:根据样本数据判断总体参数是否符合某个假设。

3. 置信区间:给出总体参数的估计范围。

六、相关性与回归分析1. 相关性:描述两个变量之间的关联程度,可以通过相关系数来度量。

2. 简单线性回归:通过一条直线描述两个变量之间的函数关系。

3. 多元线性回归:通过多个变量来描述一个变量的线性关系。

七、抽样与实验设计1. 抽样方法:包括随机抽样、分层抽样等,确保样本具有代表性。

2. 实验设计:设计合理的实验方案,控制其他因素对结果的影响。

以上是数理统计的一些基本知识点总结,希望对您有所帮助。

数理统计第一次大作业——回归分析

数理统计第一次大作业——回归分析

北京市农业经济总产值的逐步回归分析姓名:学号:摘要:农业生产和农村经济是国民经济的基础,影响农村经济总产值的因素有多种,主要包括农林牧渔业。

本文以北京市农业生产和农村经济总产值为对象,首先分析了各种因素的线性相关性,建立回归模型,再利用逐步回归法进行回归分析,得到最符合实际情况的回归模型。

以SPSS 17.0为分析工具,给出了实验结果,并用预测值验证了结论的正确性。

关键词:农业生产和农村经济,线性回归模型,逐步回归分析,SPSS1.引言农林牧渔业统计范围包括辖区内全部农林牧渔业生产单位、非农行业单位附属的农林牧渔业生产活动单位以及农户的农业生产活动。

军委系统的农林牧渔业生产(除军马外)也应包括在内,但不包括农业科学试验机构进行的农业生产。

在近几年中国经济快速增长的带动下,各地区农林牧渔业也得到了突飞猛进的发展。

以北京地区为例,2005年的农业总产值为1993年的6倍。

因此用统计方法研究分析农业总产值对指导国民经济生产,合理有效的进行产业布局,提高生产力等有着重要意义。

表1 北京市农业经济产值及各产品产量统计数据本文以北京市农生产为对象,分析了农业经济总产值与粮食产量、棉花产量、油料产量、蔬菜产量、干鲜果品产量、猪牛羊肉产量、禽蛋产量、水产品产量的关系,并建立农业经济总产值的回归模型。

表1中列出了1999年至2008年间的统计数据(数据来源于北京统计信息网)。

2.线性回归模型的建立2.1 线性回归模型的假设为了研究农业经济总产值与各种农生产量的关系,必须要建立二者之间的数学模型。

数学模型可以有多种形式,比如线性模型,二次模型,指数模型,对数模型等等。

而实际生活中,影响农业经济总产值的因素很多,并且这些因素的影响不能简单的用某一种模型来描述,所以要建立农业经济总产值的数学模型往往是很难的。

但是为了便于研究,我们可以先假定一些前提条件,然后在这些条件下得到简化后的近似模型。

以下我们假定两个前提条件:1) 农产品的价格是不变的。

数理统计大作业题目和答案0348

数理统计大作业题目和答案0348

1、设总体X 服从正态分布),(2σμN ,其中μ已知,2σ未知,n X X X ,,,21 为其样本,2≥n ,则下列说法中正确的是( )。

(A )∑=-ni iXn122)(μσ是统计量 (B )∑=ni iXn122σ是统计量(C )∑=--ni i X n 122)(1μσ是统计量 (D )∑=ni i X n12μ是统计量2、设两独立随机变量)1,0(~N X ,)9(~2χY ,则YX 3服从( )。

)(A )1,0(N )(B )3(t )(C )9(t )(D )9,1(F3、设两独立随机变量)1,0(~N X ,2~(16)Y χ)。

)(A )1,0(N )(B (4)t )(C (16)t )(D (1,4)F4、设n X X ,,1 是来自总体X 的样本,且μ=EX ,则下列是μ的无偏估计的是( ).)(A ∑-=-1111n i i X n )(B ∑=-n i i X n 111 )(C ∑=n i i X n 21 )(D ∑-=111n i i X n 5、设4321,,,X X X X 是总体2(0,)N σ的样本,2σ未知,则下列随机变量是统计量的是( ).(A )3/X σ; (B )414ii X=∑; (C )σ-1X ; (D )4221/ii Xσ=∑6、设总体),(~2σμN X ,1,,n X X L 为样本,S X ,分别为样本均值和标准差,则下列正确的是( ).2() ~(,)A X N μσ 2()~(,)B n X N μσ 22211()()~()ni i C X n μχσ=-∑(~()D t n7、设总体X 服从两点分布B (1,p ),其中p 是未知参数,15,,X X ⋅⋅⋅是来自总体的简单随机样本,则下列随机变量不是统计量为( )( A ) . 12X X +( B ){}max ,15i X i ≤≤( C ) 52X p +( D )()251X X -8、设1,,n X X ⋅⋅⋅为来自正态总体2(,)N μσ的一个样本,μ,2σ未知。

数理统计知识点总结(总22页)

数理统计知识点总结(总22页)

数理统计知识点总结(总22页)一、基本概念1、统计学:统计学是一门研究人群或事物特性及变化规律的学科,是应用数理统计方法研究某种规律的学科,是整理、综合和分析统计资料的学科。

2、统计资料:统计资料是从实际中收集的有关统计对象的数据,也可以称为实验资料。

3、变量:历史的发展过程中,统计中的变量可分为定量变量和定性变量。

前者是指可以用数字表示的变量,又被称为被观察变量或解释变量;后者多由文字描述,不能量化,又被称为因变量或行为变量。

4、分类变量:又称为分类统计数据,是指按照一定的范围将变量等分,主要用于描述变量的构成状况。

5、样本:样本是用于做统计分析的一部分数据,它按照一定的要求从某种群体中抽取出来,它是统计资料的简写总结。

样本本身并非具有代表性,但在发现规律方面与总体相比,它有许多独特的优势。

二、数理统计方法1、数据描述:数据描述是指用定量和定性的方式把统计对象描述出来,也就是用汇总统计和分类统计的方法研究统计资料的特征。

2、分布类型:经过研究的统计资料各变量的分布可分为三种基本形式:正态分布、对数分布和正玄分布。

3、抽样技术:抽样是指在随机或不完全随机的情况下,从一个总体中抽出一定数量的抽样单位,用它们反映整体的一般特性的科学方法。

4、统计推断:统计推断是指借助于统计技术去评价样本资料与总体资料之间的联系,并借以判断在一定概率水平上总体参数的取值情况,并对总体参数做出推断。

5、回归分析:回归分析是利用统计方法,探索两个或多个变量之间存在的关系,及掌握这种关系的参数。

三、统计推断1、假设检验:假设检验是统计推断的基本方法,是统计方法求出的取值所处位置在参数特定范围内的概率,通常用统计量在假设下把允许的概率建模出来。

2、置信区间:置信区间是统计学中定量评价事物变化范围的一种分析方法,其作用是加以比较研究结果,以及让相应的概率参数可以被确定的概率范围的压缩,使数据更有说服力。

3、方差分析:方差分析是检验研究变量之间是否存在显著的差异性的统计分析方法,其研究的是变量的变异程度。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数理统计大作业数理统计学大作业学院航空航天工程学部专业飞行器设计班级航宇二班学号142103130228 姓名张立指导教师姜永负责教师沈阳航空航天大学2014年12月目录目录 (2)前言 (3)一、采集样本数据整理及SPSS统计软件的实现 (5)1.1、数据的收集方法及说明 (5)1.2、数据整理:给出频数、频率分布表及偏度和峰度 (5)1.3、画出直方图和折线图 (7)1.4、经验分布函数和图形 (8)1.5、各种概率分布 (8)二、给出总体分布的参数估计 (13)2.1、矩估计法 (13)2.2、最大似然估计 (14)2.3、参数区间估计 (15)三、参数的假设检验 (18)3.1. 样本统计数据的t检验 (18)3.2样本统计数据的2χ检验 (19)四、非参数假设检验(2χ拟合优度检验) (20)4.1、2χ拟合优度检验 (20)五、结论 (22)参考文献 (23)前言数理统计学是研究有效地运用数据收集与数据处理、多种模型与技术分析、社会调查与统计分析等,对科技前沿和国民经济重大问题和复杂问题,以及社会和政府中的大量问题,如何对数据进行推理,以便对问题进行推断或预测,从而对决策和行动提供依据和建议的应用广泛的基础性学科。

随着科学技术的发展,数理统计的作用在国民生活中越来越重要,特别是现在随着大数据的时代来临,迫切的需要我们对大量数据的处理能力,当然这些大量的数据不可能用人工计算,有很多可以实际应用的数理统计软件,这次大作业我使用的是SPSS软件。

由于数理统计是一门实用性极强的学科,在学习中要紧扣它的实际背景,理解统计方法的直观含义。

了解数理统计能解决那些实际问题。

对如何处理抽样数据,并根据处理的结果作出合理的统计推断,该结论的可靠性有多少要有一个总体的思维框架,这样,学起来就不会枯燥而且容易记忆。

例如估计未知分布的数学期望,就要考虑到:1.如何寻求合适的估计量的途径,2.如何比较多个估计量的优劣。

这样,针对1按不同的统计思想可推出矩估计和极大似然估计,而针对2又可分为无偏估计、有效估计、相合估计,因为不同的估计名称有着不同的含义,一个具体估计量可以满足上面的每一个,也可能不满足。

掌握了寻求估计的统计思想,具体寻求估计的步骤往往是“套路子”的,并不困难,然而如果没有从根本上理解,仅死背套路子往往会出现各种错误.一、采集样本数据整理及SPSS 统计软件的实现1.1、数据的收集方法及说明我的这次作业采取的数据是机械加工零件中,车床C6140其中一个传动轴的长度,由于这零件是大批量生产,数据很多,我选取了其中的100个数据进行计算,数据具体如下:84 69 73 77 88 83 65 74 79 6767 89 74 85 92 80 87 71 80 6777 76 77 73 53 68 79 81 67 7659 88 70 80 92 79 75 88 48 7274 73 83 68 65 78 88 84 58 7470 78 70 69 80 79 76 75 73 7065 81 81 80 76 52 66 69 77 7673 65 75 75 79 89 74 88 81 7377 82 74 88 84 82 81 88 90 6584 90 78 89 93 81 85 83 61 701.2、数据整理:给出频数、频率分布表及偏度和峰度其中,样本传动轴长度数据最小值为48,最大值为93,取a =40,b=100, 全距L =100-40=60,把数据分布的区间(40,100]等分为6个子区间,等组距为 Δt i =(100-40)/6=10,i =1,2,3,4,5,6。

通过计数要求落在子区间的个数,则得样本传动轴长度的频数i n 和频率i f分布,序号 区间 频数n i 频率f i1 (40,50] 1 0.012 (50,60]3 0.033 (60,70] 24 0.244 (70,80] 43 0.435 (80,90] 23 0.236 (90,100] 6 0.06偏度是对样本观察值分布的偏斜方向和程度的度量,通过样本数据计算的偏度为:3471.2)1()(3131=--=∑=S n X X V ni iV 1 0,分布呈右偏态。

峰度是描述样本观察值分布集中趋势高峰的程度,通过样本数据计算的峰度为:6328.4)1()(4142=--=∑=S n X X V ni iV 2 3,分布为尖峰分布。

1.3、画出直方图和折线图图一、数据段的直方图图二、数据分段的折线图1.4、经验分布函数和图形设X 1,X 2,...,X n 是来自总体X 的样本,样本的顺序统计量为X (1)≤X (2)≤...≤X (n ),当固定的一组顺序统计量的观察值x (1)≤x (2)≤...≤x (n )时,对于任何实数x 称下式:⎪⎪⎩⎪⎪⎨⎧≥-+<≤<+)(1)1(,11,......,2,1,,,0)(n k k n x x n k x x x nk x x x F为总体X 的经验分布函数。

图3经验分布函数图像1.5、各种概率分布概率分布类型主要分为离散型概率分布和连续型概率分布,我查阅了图书馆还有专业参考资料搜集到以下的概率分布,个别分布还画出了密度函数图像,还对各种概率密度的背景做了简单的介绍。

1.指数分布:⎩⎨⎧<>=-0,00,)(x x e x f x λλ 指数函数的一个重要特征是无记忆性(又称遗失记忆性)。

这表示如果一个随机变量呈指数分布,当s,t ≥0时有P(T>s+t|T>t)=P(T>s)。

即,如果T 是某一元件的寿命,已知元件使用了t 小时,它总共使用至少s+t 小时的条件概率,与从开始使用时算起它使用至少s 小时的概率相等。

21)(1)(λλ==X D X E ,2.威布尔分布:⎪⎩⎪⎨⎧<≥=-0,00,)(),,()(x x e x k k x f k x λλλλ 威布尔分布又称韦伯,是可靠性分析和寿命检验的理论基础。

在可靠性工程中被广泛应用,尤其适用于机电类产品的磨损累计失效的分布形式。

由于它可以利用概率值很容易地推断出它的分布参数,被广泛应用与各种寿命试验的数据处理。

22)21()(),11()(μλλ-+Γ=+Γ=kX D k X E3.正态分布222)(21)(σμπ--=x e x f正态分布是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。

若随机变量X 服从一个数学期望为μ、方差为2σ的正态分布,记为N(μ,2σ)。

正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。

因其曲线呈钟形,因此人们又经常称之为钟形曲线。

我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布。

2)()(σμ==X D X E ,4.t 分布t 分布曲线形态与n (确切地说与自由度v )大小有关。

与标准正态分布曲线相比,自由度v 越小,t 分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度v 愈大,t 分布曲线愈接近正态分布曲线,当自由度v=∞时,t 分布曲线为标准正态分布曲线。

5.柯西分布R x x x f ∈-+=,)(1)(22μλλπ柯西分布是一个数学期望不存在的连续型分布函数,它同样具有自己的分布密度6.均匀分布⎪⎩⎪⎨⎧∉∈-=),(,0),(,1)(b a x b a x ab x f 这表明X 落在[a,b]的子区间内的概率只与子区间长度有关,而与子区间位置无关,因此X 落在[a,b]的长度相等的子区间内的可能性是相等的,所谓的均匀指的就是这种等可能性。

12)()(,2)(2a b X D b a X E -=+=7.伽马分布伽玛分布是统计学的一种连续概率函数。

伽玛分布中的参数α,称为形状参数,β称为尺度参数。

二、给出总体分布的参数估计2.1、矩估计法矩估计法是一种相对简单的估计方法,其理论依据是辛钦大数定律:设随机变量序列X1,X2,…,n X ,…独立同分布,且数学期望E(Xi)=µ存在.则对任意的є>0,有1)1(lim =<-∑∞→εμXi nP n 即当n →∞时,Xi n∑1依概率收敛到μ。

因此当样本很大时(因为采集的样本大于等于100,因此可以看作是大样本)又因为从数据分布图可以看出样本服从正态分布, X 的概率密度函数为:R x ex f u x ∈=--,21),,(222)(2σπσμμ=)(X E ,22)(μσ+=X E ,所以令⎩⎨⎧==2)()(A X E XX E 经过计算可得到X =μ,222X A -=σ 样本均值3.21001,5.8411221====∑∑==n i i n i i X nA X n X 。

所以 a 与 b 的矩估计量 分别为3.2100,5.842==∧∧σμ,。

2.2、最大似然估计因为最大似然估计法有较强的直观性,又能获得参数θ的合理的估计量,特别是在大样本时,最大似然估计有极好的性质。

所以他广泛应用于估计理论中。

最大似然估计的解题原理如下: X 的概率密度函数为:Rx ex f u x ∈=--,21),,(222)(2σπσμ所以μ,2σ的似然函数为:∏=--=ni x e L 12)(22221),(σμπσσμ取对数得:∑=---=ni i x L 12222]2)(ln 2121[ln),(ln σμσπσμ 令 ⎪⎪⎩⎪⎪⎨⎧=∂∂∂=∂∂0),(ln 0),(ln 222σμμσμL L解得:⎪⎩⎪⎨⎧-==∑=212)(1ni i X X n x σμ所以,2σμ,的极大似然估计量为:5.3185.61==∧∧σμ,2.3、参数区间估计假设样本总体服从正态分布进行计算。

(1)方差2σ未知,求数学期望μ的置信区间: 1)由于2σ未知,用样本的标准差21)(11∑=--=ni i X X n S 代替此时nS X μ-不再服从标准正态分布。

而是服从自由度为n-1的t 函数, 其分布记为:)1(~--=n t n S X t μ2)查分位数给定置信水平1-α=0.90,使:90.01)1(2=-=⎪⎪⎭⎫⎝⎛-<-αμαn t n S X P 根据自由度n-1和1-α,从t-分布表查出分位数为)1(2-n t α式等价于90.01))1()1((22=-=-+<<--αμααn t n SX n t n S X P 3)μ的随机置信区间μ的置信水平为0.90 的置信区间为:())1(),1(22-+--n t nS X n t nS Xαα4)μ的确定置信区间由X =74.4,方差S=9.49,47.420=,则3277.1)19(05.0=t 带入值可得:置信水平为0.9的区间为(71.6,77.2)。

相关文档
最新文档