重大数理统计大作业

合集下载

数理统计大作业

数理统计大作业

数理统计学大作业学院航空航天工程学部专业飞行器设计班级航宇二班学号142103130228 姓名张立指导教师姜永负责教师沈阳航空航天大学2014年12月目录 (2)前言 (3)一、采集样本数据整理及SPSS统计软件的实现 (4)1.1、数据的收集方法及说明 (4)1.2、数据整理:给出频数、频率分布表及偏度和峰度 (4)1.3、画出直方图和折线图 (6)1.4、经验分布函数和图形 (6)1.5、各种概率分布 (7)二、给出总体分布的参数估计 (12)2.1、矩估计法 (12)2.2、最大似然估计 (12)2.3、参数区间估计 (13)三、参数的假设检验 (16)3.1. 样本统计数据的t检验 (16)3.2样本统计数据的2χ检验 (17)四、非参数假设检验(2χ拟合优度检验) (18)4.1、2χ拟合优度检验 (18)五、结论 (20)参考文献 (21)数理统计学是研究有效地运用数据收集与数据处理、多种模型与技术分析、社会调查与统计分析等,对科技前沿和国民经济重大问题和复杂问题,以及社会和政府中的大量问题,如何对数据进行推理,以便对问题进行推断或预测,从而对决策和行动提供依据和建议的应用广泛的基础性学科。

随着科学技术的发展,数理统计的作用在国民生活中越来越重要,特别是现在随着大数据的时代来临,迫切的需要我们对大量数据的处理能力,当然这些大量的数据不可能用人工计算,有很多可以实际应用的数理统计软件,这次大作业我使用的是SPSS软件。

由于数理统计是一门实用性极强的学科,在学习中要紧扣它的实际背景,理解统计方法的直观含义。

了解数理统计能解决那些实际问题。

对如何处理抽样数据,并根据处理的结果作出合理的统计推断,该结论的可靠性有多少要有一个总体的思维框架,这样,学起来就不会枯燥而且容易记忆。

例如估计未知分布的数学期望,就要考虑到:1.如何寻求合适的估计量的途径,2.如何比较多个估计量的优劣。

这样,针对1按不同的统计思想可推出矩估计和极大似然估计,而针对2又可分为无偏估计、有效估计、相合估计,因为不同的估计名称有着不同的含义,一个具体估计量可以满足上面的每一个,也可能不满足。

重庆大学学年(秋)数理统计试题及答案

重庆大学学年(秋)数理统计试题及答案

重庆大学全日制学术型硕士研究生 《数理统计》(A )课程试卷2013-2014学年第一学期(秋)请保留四位小数,部分下侧分位数为:0.95 1.65u =,0.99 2.33u =,20.95(1) 3.841χ=,0.95(3,6)9.78f =一、(18分)设1X ,2X ,…,64X 是来自总体N (0,2σ)的样本,X ,2S 分别是样本均值和样本方差:(1)求参数c 满足{}0.1P X S c >⋅=;(2)求概率22122234{1}X X P X X +>+;(3)求322321(2)i i i D X X X +=⎡⎤+-⎢⎥⎣⎦∑。

(请写出计算过程)解:(1)~(1)t n-{}}0.1P X S c P c ∴>⋅=>=得0.95(63)c t = 故 1.650.20638c ==(2)2~(0,)X N σ22212(/)(/)~(2)X X σσχ∴+ 同理22234(/)(/)~(2)X X σσχ+2222223412122234(/)(/)(/)(/)/~(2,2)22X X X X X X F X X σσσσ+++∴=+ 22122234{1}{(2,2)1}X X P P F X X +>=>+ 且0.50.50.51(2,2)(2,2)1(2,2)F F F =⇒= 得2222121222223434{1}1{1}0.5X X X X P P X X X X ++>=-≤=++ (3)令2~(2,2)i i n i Y X X N μσ+=+,112n i i Y Y X n ===∑ 221()(1)ni Y i T Y Y n S =∴=-=-∑3232223211(2)[()]i i i i i D X X X DT D Y Y +==⎡⎤+-==-⎢⎥⎣⎦∑∑2~(0,2(11/))i Y YN n σ-+~(0,1)YN=3222422421[2(11/)4(11/)((32))256(11/32)i Y D n n D σσχσ=+=+=+∑二、(26分)设1X ,2X ,…,n X 是来自总体2~(2,)(0)X N σσ>的样本,{}0.95P X A <=。

重庆大学数理统计试题3

重庆大学数理统计试题3
一、设 X1 , X 2 ,…,X m , X m1 ,…,X mn 为来自总体 X ~N 0, 2 的一个样本, 试确定下列统计量的分布
n Xi
i 1 m n m
( 1 ) Y1
m
2
i m 1
X
; ( 2 ) Y2
2 i
n X i 2 m Xi
i m 1 i 1 mn 2
n n 2 i 1 2 1 e 2 ) ( 2 2 ) 2 e 2 2 n xi2
xi2
n
L( 2 , X 1 , X 2 ,
Xn) (
i 1
ln( L( 2 , X 1 , X 2 , ln( L( 2 , X 1 , X 2 , d 2
xi2 n X n )) ln( 2 ) ln 2 i 1 2 2 2 X n )) n 1 n 1 n 2 i 1 ( xi 2 ) 2 2 2 4 2 2( ) 2 n i 1
s
2
c1
1 1 2 (n 1), c2 2 (n 1) n 1 2 n 1 1 2 s2
k0 :{
2
c2或
s2
2
c1}
(2) H0 : 2 1, H1 : 2 2
2 拒绝域 k0 : (n 1)s 2 12 (n 1);22s 2 0.95 (22) 33.92; :
m
2 i m1
X

n X i 2 m Xi
i m 1 i 1 mn 2
Y2 ~ F (m, n)
2 i
n
Xi
(3)
i 1
m
m n
m
~ N (0,1),

重庆大学研究生数理统计大作业

重庆大学研究生数理统计大作业

NBA球员科比单场总得分与上场时间的线性回归分析摘要篮球运动中,球员的上场时间与球员的场上得分的数学关系将影响到教练对每位球员上场时间的把握,若能得到某位球员的上场时间与场上得分的数据关系,将能更好的把握该名球员的场上时间分配。

本次作业将针对现役NBA球员中影响力最大的球员科比布莱恩特进行研究,对其2012-2013年赛季常规赛的每场得分与出场时间进行线性回归,得到得分与出场时间的一元线性回归直线,并对显著性进行评估和进行区间预测。

正文一、问题描述随着2002年姚明加入NBA,越来越多的中国人开始关注篮球这一项体育运动,并使得篮球运动大范围的普及开来,尤其是青年学生。

本着学以致用的原则,希望将所学理论知识与现实生活与个人兴趣相结合,若能通过建立相应的数理统计模型来做相应的分析,并且从另外一个角度解析篮球,并用以指导篮球这一项运动的更好发展,这也将是一项不同寻常的探索。

篮球运动中,得分是取胜的决定因素,若要赢得比赛,必须将得分超出对手,而影响一位球员的得分的因素是多样的,例如:情绪,状态,体力,伤病,上场时间,防守队员等诸多因素,而上场时间作为最直接最关键的因素,其对球员总得分的影响方式有着重要的研究意义。

倘若知道了其分布规律,则可从数量上掌握得分与上场时间复杂关系的大趋势,就可以利用这种趋势研究球员效率最优化与上场时间的控制问题。

因此,本文针对湖人当家球星科比布莱恩特在2012-2013年赛季常规赛的每场得分与上场时间进行线性回归分析,并对显著性进行评估,以巩固所学知识,并发现自己的不足。

二、数据描述抽出科比布莱恩特2012-2013年常规赛所有82场的数据记录(原始数据见附录),剔除掉其中没有上场的部分数据,得到有参考实用价值的数据如表2.1所示:以上数据由腾讯篮球中心提供,特此说明。

三、模型建立(1)假设条件假定球员每场的发挥均为独立同分布事件, (2)模型构建以上场时间为自变量Xi ,单场得分为应变量Yi ,建立正态线性模型式:()012,1,2,,;0,,,,,i i i ii i i Y x i n N ββεεσεεε=++=⎧⎪⎨⎪⎩且相互独立 其中β0、β1为模型参数。

最新数理统计大作业题目和答案--0348资料

最新数理统计大作业题目和答案--0348资料

1、设总体X 服从正态分布),(2σμN ,其中μ已知,2σ未知,n X X X ,,,21 为其样本,2≥n ,则下列说法中正确的是( )。

(A )∑=-ni iXn122)(μσ是统计量 (B )∑=ni iXn122σ是统计量(C )∑=--ni i X n 122)(1μσ是统计量 (D )∑=ni i X n12μ是统计量2、设两独立随机变量)1,0(~N X ,)9(~2χY ,则YX 3服从( )。

)(A )1,0(N )(B )3(t )(C )9(t )(D )9,1(F3、设两独立随机变量)1,0(~N X ,2~(16)Y χ)。

)(A )1,0(N )(B (4)t )(C (16)t )(D (1,4)F4、设n X X ,,1 是来自总体X 的样本,且μ=EX ,则下列是μ的无偏估计的是( ).)(A ∑-=-1111n i i X n )(B ∑=-ni i X n 111 )(C ∑=n i i X n 21 )(D ∑-=111n i i X n 5、设4321,,,X X X X 是总体2(0,)N σ的样本,2σ未知,则下列随机变量是统计量的是( ).(A )3/X σ; (B )414ii X=∑; (C )σ-1X ; (D )4221/ii Xσ=∑6、设总体),(~2σμN X ,1,,n X X L 为样本,S X ,分别为样本均值和标准差,则下列正确的是( ).2() ~(,)A X N μσ 2() ~(,)B n X N μσ 22211()()~()ni i C X n μχσ=-∑()~()D t n7、设总体X 服从两点分布B (1,p ),其中p 是未知参数,15,,X X ⋅⋅⋅是来自总体的简单随机样本,则下列随机变量不是统计量为( )( A ) . 12X X +( B ){}max ,15i X i ≤≤( C ) 52X p +( D )()251X X -8、设1,,n X X ⋅⋅⋅为来自正态总体2(,)N μσ的一个样本,μ,2σ未知。

数理统计大作业要求

数理统计大作业要求

大作业要求前言 ............................................................ 页码一、采集样本、数据整理及SPSS 统计软件的实现 ..................... 页码 0、掌握采集样本及数据整理的方法;1、学会SPSS 统计软件安装与启动;2、利用SPSS 建立数据文件、并利用数据库导入数据;3、利用SPSS 对数据进行合并与拆分;4、利用SPSS 对数据进行描述性统计分析:给出频数、频率分布表及偏度和峰度,并画出直方图和折线图;5、写出经验分布函数并利用SPSS 画出图形;6、查找藏于文著里的已知的各种概率分布(力求全),并描述其背景,给出 其期望和方差,利用SPSS 或其他软件画出密度函数的图形;注:SPSS 软件版本为SPSS19.0 (中文版或英文版均可),从百度可以下载.二、给出总体分布的参数估计(用SPSS 软件完成) .............................................. 页码1、矩估计;2、最大似然估计;3、若总体是未知分布,应探求其参数的点估计,并写出方案;4、参数区间估计(假设总体是正态分布); .......................... 页码1)、方差2σ未知,求数学期望μ的置信区间; ........................ 页码2)、数学期望μ,2σ均未知,求方差2σ的置信区间; ......................................... 页码 (要求有步骤,有计算结果)三、 参数的假设检验(用SPSS 完成) .............................. 页码1、 样本统计数据的t 检验........................................ 页码2、 样本统计数据的-2χ检验...................................................................................... 页码 注:可先假设总体是正态情况讨论,总体若不是正态的要给出探求方案四、非参数假设检验(2χ拟合优度检验)(用SPSS 完成) .............. 页码1、2χ拟合优度检验2、当上述检验被接受或被拒绝时,请结合实际问题给出说明五、结论 ........................................................ 页码总结、评述和体会参考文献 ..........................................................................................................................................要求:1、大作业内容按上述过程要求完成,不得缺漏;2、由本人认真独立完成,不得抄袭他人;3、样本数据限在本专业范围内寻找,样本容量原则上100个以上;4、大作业格式应参考本科毕业设计格式(如,页面设置,字号小四,插图等)5、字数要求为A4纸20页左右;6、结束课程后一周内提交,上交纸质版和电子版两种;7、大作业成绩占期末总成绩30% 。

重庆大学硕士研究生《数理统计》课程大作业(论文)

重庆大学硕士研究生《数理统计》课程大作业(论文)

一、问题提出和问题分析今天的重庆,肩负着中央赋予的历史重任——着力打造西部地区的重要增长极、长江上游地区的经济中心、成为统筹城乡发展的试验者、在西部地区率先实现全面建设小康社会的目标。

2010年初,又一重要规划将重庆发展提升到国家战略——重庆被确定为国家五大中心城市之一,是中西部地区唯一入选的城市。

这说明,重庆未来的发展不可限量。

自1997年直辖以来,重庆市的经济社会发展极为迅猛。

全市的GDP由1997年的1360.24亿元增长至2010年的7894.2亿元,而整个社会的发展进步也有目共睹。

在重庆过去、现在和未来的发展进程中,在重庆的各种发展规划的要求下,建设必将成为山城的另一个符号。

过去十多年中的大规模、大范围的建设成就了现在的重庆,而重庆未来的发展将需要更多的建设。

作为重庆建设中最重要的一环,建筑业在重庆显然有着重要的地位。

建筑业这种专门从事土木工程、房屋建设和设备安装以及工程勘察设计工作的生产部门,为重庆的发展建设提供着众多的基础设施,满足着居住、工业、商业、办公等各种城市需求。

数据显示,在过去的数年中,重庆市建筑业的总产值占全市GDP的7%-8%,是名副其实的支柱产业。

因此建筑业的发展情况,可以从侧面反映出整个重庆社会经济的发展情况,对重庆建筑业的研究就有了很大的现实意义。

建筑企业是建筑业的主体。

众多的建筑企业的良好发展构成了建筑业的良好发展。

对于建筑企业来说,要实现企业的良好经营和发展,必须要有良好的收入来支撑。

在建筑企业收入的众多影响因素中,企业的劳动生产率无疑是值得关注的一个。

企业都在致力于提高自身的劳动生产效率,而不断提高的劳动生产率,可使得企业的生产经营行为更具效率,因而获得更多的收入,实现更好的发展。

所以,研究重庆市建筑企业劳动生产率与企业收入的关系,可从一个角度来了解重庆市建筑企业的发展情况,从而了解到了重庆建筑业的发展以至于重庆市的经济发展情况。

为了找出二者之间的关系或者规律性,本文采用2001-2010这十年中重庆建筑企业劳动生产率和企业平均收入的数据,通过数学分析,找出二者关系。

最新重庆大学数理统计试题2

最新重庆大学数理统计试题2

一、假设129,,X X X …,是来自总体2~,X N的简单随机样本,X 是样本均值,2S 是样本方差,求下列常数a 的值。

(1)0.78P Xa ;(2)922113.49()15.51ii P X X a ;(3)0.05X P aS。

解:(1)22~(,),~(0,1)xx N N Nn220.78{}xp ann即2{ 2.34},(2.34),0.99xp a a a n。

(2)222(1)~(1)n sn 992222119221221:()(1)()11{3.49()15.51}(1){3.4915.51}(15.51)(3.49)10.950.10.85ii i i ii s x x n s x x n p x x an sp aaaa(3)2222(1)~(0,1),~(1)Xn sN n n222()/~(1),(1)/(1)X n t n n sn即()~(1)3(){}0.053()1{}0.053(){}0.951.86n X t n s Xp a s Xp a s Xp a s a 二、设总体X 的密度函数2,0()00,0xxex f x x 其一个样本为12,,nX X X …,(1)求1g的最大似然估计量T ;(2)验证T是否为1g的有效估计量,若是,写出信息量I;(3)验证T 是否为1g的相合估计量。

解:(1)122111()(,)()()niii nnnx x ni i i I I i L f x x ex e1111ln ()2lnln 2ln ()01112212nniii i nii nii L n x x dn L x d x xn T X(2)由(1)121220211ln (,,,)2()21,()221111()()222nn ii xdnL X X X X n Xd TX c nE T E X EX x edxT 是1得无偏估计量因而T 是1的有偏估计量。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

研究生“数理统计”课程课外作业
姓名:学号:
学院:光电工程学院专业:测控技术与仪器
类别:上课时间:
成绩:
城镇居民家庭食品总支出与肉类食品支出关系研究分析
摘要:
近些年,我国经济高速增长,居民的家庭收入大幅提高,同时居民的生活水平和质量也有了很大的提高,以前只有在过节或者有贵客时才能在餐桌上见到的各种食品现在已经平常化日常化。

肉类做为日常家庭食品的一个重要组成部分,也快速的增长着.上世纪80年代以来,城市居民家庭人均肉类消费增长了1倍。

从表面看来家庭食品支出越高肉类消费越多。

但是我们将城镇居民按家庭收入分成5等份,发现收入最低的吃肉最少,随着收入的增加,肉类消费数量同步增加,收入越高吃肉越多。

但是也有部分高收入家庭的肉类消费量开始下降。

因为这部分群体对于健康饮食的关注远远高于其他人群。

所以从总体上看来,家庭食品总支出与肉类食品支出之间存在着一定的相互关联。

在此文中我们以回归分析方法分析检验了家庭肉类食品消费支出与家庭食品总支出是否存在线性相关关系。

关键词:家庭肉类食品支出与食品总支出,回归分析方法
正文
随着我国经济的快速发展,居民的生活水平也有了显著的提高。

同时城市居民家庭在食品方面的开支始终占据着很大的份额,其中肉类的开支也有着显著的提高。

故提出在我国居民生活水平日益提高的情况下肉类食品的消费水平是否与家庭总的食品消费水平存在线性相关性?
数据描述:
表一:家庭食品支出与各种肉类支出分布
家庭食品支出与肉类支出关系(元/月)
品名
按人平月可支配收入比例分组
最低收入
户低收入户
中等收入
户高收入户
最高收入

猪肉187.44 233.16 248.88 269.4 236.04 牛肉9.36 18.84 26.76 24.48 28.44
羊肉 3.84 5.88 6.48 9.36 13.32 家禽
76.2
104.52 120 110.52 179.28 鱼 52.56 56.88 65.52 62.64 70.32 肉类支出合计 329.4 419.28 467.64 476.4 527.4 食品支出总合计 1131.84
1351.44
1624.56
1744.72
2017.44
表二:家庭食品支出与肉类支出关系
家庭食品支出与肉类支出关系(元/月)
品名 按人平月可支配收入比例分组
最低收入 低收入户 中等收入 高收入户 最高收入
食品支出总合计 1131.84 1351.44 1624.56 1744.72 2017.44 肉类支出合计 329.4
419.28
467.64
476.4
527.4
模型建立:
提出假设条件,引进参数:由上面两个表格的数据我们可以假设家庭肉类支出与家庭食品总支出之间满足线性关系。

设家庭食品总支出为X (元/月),家庭肉类食品支出为Y(元/月)。

1) 做出表二中家庭食品总支出与肉类食品支出数据的散点图,如图一所示:
图一:家庭食品总支出与肉类食品支出数据的散点图
从图一中可以看出家庭食品总支出与肉类食品支出之间存在线形相关关系。

2) 求家庭食品总支出与肉类食品支出的样本回归直线,由表二的样本资料数据有计算机求解有(表三)
由表三可以计算得:x 7870/51574==;y 2220.12/54440.2==
5
xy i i i 1l x y 5xy 3594351.56515744440.299882.68==-=-⨯⨯=∑
5
2
22xx i i 1
l x 5x 12860759.851574473379.08==-=-⨯=∑
5
2
22yy i i 1
l y 5y 1008094.9754440.222308.41
==-=-⨯=∑
表三:家庭食品总支出与肉类食品支出回归计算
家庭食品支出与肉类支出关系(元/月) 家庭类型 食品总支出x i 肉类支
出y i x i 2 y i 2 x i y i 最低收入户 1131.84 329.4 1281061.79 108504.36 372828.10 低收入户 1351.44 419.28 1826390.07 175795.72 566631.76 中等收入户 1624.56 467.64 2639195.19 218687.17 759709.24 高收入户 1744.72 476.4 3044047.88 226956.96 831184.61 最高收入户 2017.44 527.4
4070064.15 278150.76 1063997.86
∑ 7870 2220.12
12860759.08 1008094.97 3594351.56
1xy xx
l /l 99882.68/473379.080.21β=== 01y x 4440.20.211574111.91ββ=-=-⨯=
2
2
2221yy xx S S S l l 22308.410.21473379.081233.22E
T
R
β=-=-=-⨯= 2
1233.22
20.27n 23
E S σ
===- 所以家庭食品肉类支出Y 对家庭食品总支出X 的样本回归直线方程是:
01y x=111.91+0.21x ββ=+
我们可以在图一上可以做出上面表达式的图形(如图二)

该方程说明,在家庭总体生活水平达到一定阶段后,家庭肉类食品的支出与总的食品支出呈线性关系。

但是在生活水平较低的情况下,次方程显然不符合实际生活情况。

3) 检验:取显著水平0.05α= 用t 检验法:算出临界值
12
20.27
(2) 3.1820.09368
473379.08
xx
c t
n l ασ-
=
-=⨯=
拒绝域为:
{}
1
0.09368β

已知 10.21β=,显然大于0.09368。

故在拒绝域内,所以应该拒绝H 0,即是认为家庭食品总支出X 与肉类食品支出Y 由显著的线性相关关系。

4) 预测
当家庭食品支出x=2500元时,肉类食品支出预测为
01y x=111.91+0.21x=111.91+0.212500=636.91ββ=+⨯
置信度为95%的预测区间为:
010010((),())y x y x -δ+δ
由公式及查表有:
1010
12
22
0100.97512
()()(2)
()11(25001574)() 1.425473379.08(2)(3) 3.182
xx x s x t n x x s x n l t
n t α
-
α
-δ=σ⋅---=+=+=-==

100
1
1
()20.27 1.42 3.18291.59((),())x y x y x δ=⨯⨯=-δ+δ=(545.32,728.50)
即有95%的把握顾忌当家庭食品总支出为2500元的时候,平均肉类食品支出在545.32到728.50元之间。

参考资料
[1]杨虎,刘琼荪,钟波.数理统计[M].高等教育出版社,2004年10月:58-117 [2]中国肉类消费全景图和大趋:/html/news/12/510472 [3]百度数据统计:。

相关文档
最新文档