数理统计大作业2

合集下载

数理统计作业答案

数理统计作业答案

1、设总体X 服从正态分布),(2σμN ,其中μ已知,2σ未知,n X X X ,,,21 为其样本,2≥n ,则下列说法中正确的是(D )。

(A )∑=-ni i X n122)(μσ是统计量 (B )∑=ni i X n122σ是统计量(C )∑=--ni iX n 122)(1μσ是统计量 (D )∑=ni iX n12μ是统计量2、设两独立随机变量)1,0(~N X,)9(~2χY ,则YX 3服从( C )。

3、设两独立随机变量)1,0(~N X,2~(16)Y χ,则C )。

4、设n X X ,,1 是来自总体X 的样本,且μ=EX,则下列是μ的无偏估计的是( A ).5、设4321,,,X X X X 是总体2(0,)N σ的样本,2σ未知,则下列随机变量是统计量的是( B ).(A )3/X σ; (B )414ii X=∑; (C )σ-1X ; (D )4221/ii Xσ=∑6、设总体),(~2σμN X ,1,,n X X L 为样本,S X ,分别为样本均值和标准差,则下列正确的是( C ). 7、设总体X 服从两点分布B (1,p ),其中p 是未知参数,15,,X X ⋅⋅⋅是来自总体的简单随机样本,则下列随机变量不是统计量为( C ) ( A ) . 12X X +( B ){}max ,15i X i ≤≤( C ) 52X p + ( D )()251X X -8、设1,,n X X ⋅⋅⋅为来自正态总体2(,)N μσ的一个样本,μ,2σ未知。

则2σ的最大似然估计量为( B )。

(A )∑=-n i i X n 12)(1μ (B )()211∑=-n i i X X n (C )∑=--n i i X n 12)(11μ(D )()∑=--n i iX X n 1211 9、设总体),(~2σμN X ,1,,n X X ⋅⋅⋅为样本,S X ,分别为样本均值和标准差,则)X Sμ-服从( D )分布.10、设1,,n X X ⋅⋅⋅为来自正态总体2(,)N μσ的一个样本,μ,2σ未知。

数理统计 作业

数理统计 作业

第4章补充作业1. 某部门对当前市场的价格情况进行调查.以鸡蛋为例,所抽查的全省20个集市上,售价分别为(单位:元/500克)3.05 3.31 3.34 3.82 3.30 3.16 3.84 3.10 3.90 3.183.88 3.22 3.28 3.34 3.62 3.28 3.30 3.22 3.54 3.30已知往年的平均售价一直稳定在3.25元/500克左右,假设鸡蛋的销售价格服从正态分布,能否认为全省当前的鸡蛋售价明显高于往年(显著水平α = 0.05)?2. 有若干人参加一个减肥锻炼,在一年后测量了他们的身体脂肪含量,结果如下表所示:男生组:13.3 19 20 8 18 22 20 31 21 12 16 12 24女生组:22 26 16 12 21.7 23.2 21 28 30 23假设身体脂肪含量服从正态分布,试比较男生和女生的身体脂肪含量有无显著差异(显著水平α= 0.05).3. 装配一个部件时可以采用不同的方法,所关心的问题是哪一个方法的效率更高.劳动效率可以用平均装配时间反映.现从不同的装配方法中各抽取12件产品,记录下各自的装配时间(单位:分钟)如下表所示:甲法:31 34 29 32 35 38 34 30 29 32 31 26乙法:26 24 28 29 30 29 32 26 31 29 32 28假设装配时间服从正态分布,问两种方法的装配时间有无显著不同(显著水平α = 0.05)?4. 为了考察两种测量萘含量的液体层析方法:标准方法和高压方法的测量结果有无显著差异,取了10份试样,每份分为两半,一半用标准方法测量,一半用高压方法测量,每个试样的两个结果(单位:mg)如下表,假设萘含量服从正态分布,试检验这两种化验方法有无显著差异(显著水平α = 0.05).标准14.7 14.0 12.9 16.2 10.2 12.4 12.0 14.8 11.8 9.7高压12.1 10.9 13.1 14.5 9.6 11.2 9.8 13.7 12.0 9.15. 由10名学生组成一个随机样本,让他们分别采用A和B两套数学试卷进行测试,成绩如下表:试卷A78 63 72 89 91 49 68 76 85 55试卷B71 44 61 84 74 51 55 60 77 39假设学生成绩服从正态分布,试检验两套数学试卷是否有显著差异(显著性水平α = 0.05).参考答案:1. 在0.05的显著水平下拒绝H0,可以认为全省当前的鸡蛋售价明显高于往年2. 第一步:方差齐性检验,在显著性水平α= 0.05下,结果是可以认为男生和女生身体脂肪含量的方差相等第二步:均值检验,在显著性水平α = 0.05下,可以认为男生和女生的身体脂肪含量无显著差异3. 第一步:方差齐性检验,在显著性水平α= 0.05下,结果是可以认为这两种方法的装配时间的方差相等第二步:均值检验,在0.05的显著水平下,可以认为这两种方法的装配时间有显著不同4. 在显著性水平α = 0.05下,可以认为两种测试方法有显著差异5.略。

最新数理统计大作业题目和答案--0348资料

最新数理统计大作业题目和答案--0348资料

1、设总体X 服从正态分布),(2σμN ,其中μ已知,2σ未知,n X X X ,,,21 为其样本,2≥n ,则下列说法中正确的是( )。

(A )∑=-ni iXn122)(μσ是统计量 (B )∑=ni iXn122σ是统计量(C )∑=--ni i X n 122)(1μσ是统计量 (D )∑=ni i X n12μ是统计量2、设两独立随机变量)1,0(~N X ,)9(~2χY ,则YX 3服从( )。

)(A )1,0(N )(B )3(t )(C )9(t )(D )9,1(F3、设两独立随机变量)1,0(~N X ,2~(16)Y χ)。

)(A )1,0(N )(B (4)t )(C (16)t )(D (1,4)F4、设n X X ,,1 是来自总体X 的样本,且μ=EX ,则下列是μ的无偏估计的是( ).)(A ∑-=-1111n i i X n )(B ∑=-ni i X n 111 )(C ∑=n i i X n 21 )(D ∑-=111n i i X n 5、设4321,,,X X X X 是总体2(0,)N σ的样本,2σ未知,则下列随机变量是统计量的是( ).(A )3/X σ; (B )414ii X=∑; (C )σ-1X ; (D )4221/ii Xσ=∑6、设总体),(~2σμN X ,1,,n X X L 为样本,S X ,分别为样本均值和标准差,则下列正确的是( ).2() ~(,)A X N μσ 2() ~(,)B n X N μσ 22211()()~()ni i C X n μχσ=-∑()~()D t n7、设总体X 服从两点分布B (1,p ),其中p 是未知参数,15,,X X ⋅⋅⋅是来自总体的简单随机样本,则下列随机变量不是统计量为( )( A ) . 12X X +( B ){}max ,15i X i ≤≤( C ) 52X p +( D )()251X X -8、设1,,n X X ⋅⋅⋅为来自正态总体2(,)N μσ的一个样本,μ,2σ未知。

应用数理统计大作业

应用数理统计大作业

应用数理统计大作业In statistics, the central limit theorem plays a crucial role in understanding the distribution of sample means. By stating that, regardless of the shape of the underlying population distribution, the distribution of sample means approaches a normal distribution as the sample size increases, the central limit theorem provides a powerful tool for making inferences about population parameters based on sample data. 统计学中,中心极限定理在理解样本均值的分布方面扮演着关键角色。

通过表明,无论底层人群分布的形状如何,随着样本量的增加,样本均值的分布会逼近正态分布,中心极限定理为根据样本数据对人群参数进行推断提供了一个强大的工具。

Another important concept in statistical inference is confidence intervals, which provide a range within which the true population parameter is estimated to lie with a certain level of confidence. Confidence intervals are essential in interpreting the results of hypothesis tests, as they indicate the precision of the estimate and allow for an assessment of the uncertainty associated with the sample data. 统计推断中的另一个重要概念是置信区间,它提供了一个范围,真实人群参数被估计在其中的概率。

数理统计习题作业

数理统计习题作业

数理统计习题作业班级:学号:姓名:习题一1. 设是来自服从参数为的泊松分布的样本,试写出样本的联合分布律。

2.设2(,)N ξμσ:,其中μ已知,2σ未知,12(,,,)n ξξξL 是总体ξ的样本,问下列那些是统计量?那些不是?并简述其理由.(1) 12ξξσ++;(2) 1()ni i ξμ=-∑;(3) 12min{,,,}n ξξξL ;(4) 2123ξξξσ++; (5) 221()ni i ξμσ=-∑;(6) 221()ni i S ξμ=-∑.3.从总体2(52,6.3)N ξ:中抽取一容量为36的样本,求样本均值ξ落在50.8到53.8之间的概率.4. 假设某种类型的电阻器的阻值服从均值μ=200欧姆,标准差σ=10欧姆的正态分布,在一个电子线路中使用了25个这样的电阻。

(1) 求这25个电阻平均值落在199欧姆到202欧姆之间的概率。

(2) 求这25个电阻总阻值不超过5100欧姆的概率。

5. 设总体分布2(150,25)N ξ:,现在从中抽取25个样本,求(140147.5)P ξ<<.6. 设某城市人均年收入服从均值μ=1.5万元,标准差σ=0.5万元的正态分布。

现随机调查了100个人,求他们的年均收入在下列情况下的概率:(2) 小于1.3万元; (3) 落在区间[1.2, 1.6].7. 假设总体分布为(12,2)N ,今从中抽取样本125(,,,)ξξξL ,试问 (1) 样本均值ξ大于13的概率是多少? (2) 样本的最小值小于10的概率是多少? (3) 样本的最大值大于15的概率是多少?8.设总体2(0,0.3)N ξ:,1210(,,,)ξξξL 是从总体ξ抽取的一个样本,求1021( 1.44)i i P ξ=>∑.9.设12,,,n ξξξL 是相互独立且同分布的随机变量,且都服从2(0,)N σ,求证 (1) 22211()nii n ξχσ=∑:; (2)22211()(1)ni i n ξχσ=∑:.10.设125,,,ξξξL 是相互独立且同分布的随机变量,且都服从标准正态分布,求常数C ,服从t 分布.11.设总体2(0,)N ξσ:,12(,)ξξ为总体ξ的样本,求证212212()(1,1)()F ξξξξ+-:.12. 通过查表求(1)20.05(4)χ,20.01(6)χ,20.025(10)χ;(2) 0.01(8)t ,0.95(9)t ,0.01(50)t ;(3) 0.05(4,1)F ,0.01(5,4)F ,0.90(3,2)F .13. 通过查表求以下各题的λ值(1) 设22(6)χχ:,2()0.05P χλ>=;(2) 设(5)t t :,()0.05P t λ>=; (3) 设(5,3)F F :,()0.05P F λ>=;(4) 设(5,3)F F :,()0.05P F λ<=.习题二1. 设),,,(21n ξξξΛ为抽自二项分布),(p m b 样本,试求p 的矩估计量和极大似然估计量。

数理统计大作业要求

数理统计大作业要求

大作业要求前言 ............................................................ 页码一、采集样本、数据整理及SPSS 统计软件的实现 ..................... 页码 0、掌握采集样本及数据整理的方法;1、学会SPSS 统计软件安装与启动;2、利用SPSS 建立数据文件、并利用数据库导入数据;3、利用SPSS 对数据进行合并与拆分;4、利用SPSS 对数据进行描述性统计分析:给出频数、频率分布表及偏度和峰度,并画出直方图和折线图;5、写出经验分布函数并利用SPSS 画出图形;6、查找藏于文著里的已知的各种概率分布(力求全),并描述其背景,给出 其期望和方差,利用SPSS 或其他软件画出密度函数的图形;注:SPSS 软件版本为SPSS19.0 (中文版或英文版均可),从百度可以下载.二、给出总体分布的参数估计(用SPSS 软件完成) .............................................. 页码1、矩估计;2、最大似然估计;3、若总体是未知分布,应探求其参数的点估计,并写出方案;4、参数区间估计(假设总体是正态分布); .......................... 页码1)、方差2σ未知,求数学期望μ的置信区间; ........................ 页码2)、数学期望μ,2σ均未知,求方差2σ的置信区间; ......................................... 页码 (要求有步骤,有计算结果)三、 参数的假设检验(用SPSS 完成) .............................. 页码1、 样本统计数据的t 检验........................................ 页码2、 样本统计数据的-2χ检验...................................................................................... 页码 注:可先假设总体是正态情况讨论,总体若不是正态的要给出探求方案四、非参数假设检验(2χ拟合优度检验)(用SPSS 完成) .............. 页码1、2χ拟合优度检验2、当上述检验被接受或被拒绝时,请结合实际问题给出说明五、结论 ........................................................ 页码总结、评述和体会参考文献 ..........................................................................................................................................要求:1、大作业内容按上述过程要求完成,不得缺漏;2、由本人认真独立完成,不得抄袭他人;3、样本数据限在本专业范围内寻找,样本容量原则上100个以上;4、大作业格式应参考本科毕业设计格式(如,页面设置,字号小四,插图等)5、字数要求为A4纸20页左右;6、结束课程后一周内提交,上交纸质版和电子版两种;7、大作业成绩占期末总成绩30% 。

重庆大学硕士研究生《数理统计》课程大作业(论文)

一、问题提出和问题分析今天的重庆,肩负着中央赋予的历史重任——着力打造西部地区的重要增长极、长江上游地区的经济中心、成为统筹城乡发展的试验者、在西部地区率先实现全面建设小康社会的目标。

2010年初,又一重要规划将重庆发展提升到国家战略——重庆被确定为国家五大中心城市之一,是中西部地区唯一入选的城市。

这说明,重庆未来的发展不可限量。

自1997年直辖以来,重庆市的经济社会发展极为迅猛。

全市的GDP由1997年的1360.24亿元增长至2010年的7894.2亿元,而整个社会的发展进步也有目共睹。

在重庆过去、现在和未来的发展进程中,在重庆的各种发展规划的要求下,建设必将成为山城的另一个符号。

过去十多年中的大规模、大范围的建设成就了现在的重庆,而重庆未来的发展将需要更多的建设。

作为重庆建设中最重要的一环,建筑业在重庆显然有着重要的地位。

建筑业这种专门从事土木工程、房屋建设和设备安装以及工程勘察设计工作的生产部门,为重庆的发展建设提供着众多的基础设施,满足着居住、工业、商业、办公等各种城市需求。

数据显示,在过去的数年中,重庆市建筑业的总产值占全市GDP的7%-8%,是名副其实的支柱产业。

因此建筑业的发展情况,可以从侧面反映出整个重庆社会经济的发展情况,对重庆建筑业的研究就有了很大的现实意义。

建筑企业是建筑业的主体。

众多的建筑企业的良好发展构成了建筑业的良好发展。

对于建筑企业来说,要实现企业的良好经营和发展,必须要有良好的收入来支撑。

在建筑企业收入的众多影响因素中,企业的劳动生产率无疑是值得关注的一个。

企业都在致力于提高自身的劳动生产效率,而不断提高的劳动生产率,可使得企业的生产经营行为更具效率,因而获得更多的收入,实现更好的发展。

所以,研究重庆市建筑企业劳动生产率与企业收入的关系,可从一个角度来了解重庆市建筑企业的发展情况,从而了解到了重庆建筑业的发展以至于重庆市的经济发展情况。

为了找出二者之间的关系或者规律性,本文采用2001-2010这十年中重庆建筑企业劳动生产率和企业平均收入的数据,通过数学分析,找出二者关系。

概率论与数理统计作业题及参考答案

东北农业大学网络教育学院 概率论与数理统计作业题(一)一、填空题1.将A ,A ,C ,C ,E ,F ,G 这7个字母随机地排成一行,恰好排成GAECF AC 的概率为 。

2.用随机变量X 来描述掷一枚硬币的试验结果. 则X 的分布函数为 。

3.已知随机变量X 和Y 成一阶线性关系,则X 和Y 的相关系数=XY ρ 。

4.简单随机样本的两个特点为:5.设21,X X 为来自总体),(~2σμN X 的样本,若2120041X CX +为μ的一个无偏估计,则C = 。

二、选择题1.关系( )成立,则事件A 与B 为互逆事件。

(A )Φ=AB ; (B )Ω=B A ; (C )Φ=AB Ω=B A ; (D )A 与B 为互逆事件。

2.若函数)(x f y =是一随机变量X 的概率密度,则( )一定成立。

)(A )(x f y =的定义域为[0,1] )(B )(x f y =非负)(C )(x f y =的值域为[0,1] )(D )(x f y =在),(+∞-∞内连续3.设Y X ,分别表示甲乙两个人完成某项工作所需的时间,若EY EX <,DY DX >则 ( ) (A ) 甲的工作效率较高,但稳定性较差 (B ) 甲的工作效率较低,但稳定性较好 (C ) 甲的工作效率及稳定性都比乙好 (D ) 甲的工作效率及稳定性都不如乙4.样本4321,,,X X X X 取自正态分布总体X ,μ=EX 为已知,而2σ=DX 未知,则下列随机变量中不能作为统计量的是( )(.A ).∑==4141i i X X (B ).μ241++X X (C ).∑=-=4122)(1i i X X k σ (D ).∑=-=4122)(31i i X X S 5.设θ是总体X 的一个参数,θˆ是θ的一个估计量,且θθ=)ˆ(E ,则θˆ是θ的( )。

(A )一致估计 (B )有效估计 (C )无偏估计 (D )一致和无偏估计三、计算题1.两封信随机地投向标号1,2,3,4的四个空邮筒,问:(1)第二个邮筒中恰好投入一封信的概率是多少;(2)两封信都投入第二个邮筒的概率是多少?2.一批产品20个, 其中有5个次品, 从这批产品中随意抽取4个, 求(1)这4个中的次品数X 的分布列;(2))1(<X p3.已知随机变量X 的分布密度函数为 ⎪⎩⎪⎨⎧≤<-≤<=其他,021,210,)(x x x x x f ,求DX EX ,.4.设随机变量X 与Y(1)求X 与Y 的边缘分布列 (2)X 与Y 是否独立?5.总体X 服从参数为λ的泊松分布)(λp ,λ未知,设n X X X ,,, 21为来自总体X 的一个样本: (1)写出)(21n X X X ,,, 的联合概率分布; (2)}{max 1i ni X ≤≤,21X X +,212XX n-,5,∑=ni iX 12)(λ-中哪些是统计量?6.某车间生产滚珠,从长期实践可以认为滚珠的直径服从正态分布,且直径的方差为04.02=σ,从某天生产的产品中随机抽取9个,测得直径平均值为15毫米,试对05.0=α,求出滚珠平均直径的区间估计)96.1,645.1(025.005.0==Z Z概率论与数理统计作业题(二)一、填空题1.将A ,A ,C ,C ,E ,F ,G 这7个字母随机地排成一行,恰好排成GAECF AC 的概率为 。

数理统计作业答案(杨虎,刘琼荪,钟波编著)

第一章2.解:因为0110,(),1,n k k k x x k F x x x x n x x ++<⎧⎪⎪≤<⎨⎪≥⎪⎩,所以40,00.3,010.65,12()0.8,230.9,341,4x x x F x x x x <⎧⎪≤<⎪⎪≤<⎨≤<⎪⎪≤<⎪≥⎩7.解:101010222111~(0,4),~(0,1),2111 10.05,0.95444444ii i i i i i i X X N N c c c P X P X P X ===⎛⎫⎛⎫⎛⎫>=-≤=≤= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭∑∑∑则查卡方分位数表 c/4=18.31,c=73.24 14.解:1)12345~(0,2),~(0,3)X X N X X X N +++~~(0,1)N N1111,, 2.23c d n ∴===2)()2345222212~(2),~(1)3X X X X X χχ+++()()22122234523~(2,1),,2,123XX F c m n X X X +===++17.证明: 1)2211122211()0,(),(0,)1(1)(1)n n n n n E X X D X X X X N n nn S n t n σσχσ+++++-=-=∴---=- 又2)2211111()0,(),(0,)n n n n n E XX D X X X X N nnσσ+++++-=-=∴- 3)2211111()0,(),(0,)n n E X X D X X X X N n nσσ---=-=∴- 18. 解:()()()62,47.61,96.125.0,975.025.0,95.0125.0225.0/25.025.0975.0≥≥=≥≥Φ≥-Φ=⎪⎪⎭⎫ ⎝⎛≤-≤-=≤-n n u n n n n n X n P X P σμσμ20.解:()()()()()()()55(1)(1)11515555555(5)111011011011101211121(1(1))1(11(1))1(1)0.5785121515 1.5(1.5)0.93320.70772i i i i i i i i i i P X P X P X P X X P X P X P X P =====<=-≥=-≥=--≤⎛-⎫⎛⎫=--≤- ⎪⎪⎝⎭⎝⎭=--Φ-=--+Φ=-Φ=-⎛⎫<==<=<=Φ== ⎪⎝⎭∏∏∏∏∏21. 解:1)因为21~(0,)mi i X N m σ=∑,从而~(0,1)miXN ∑2221~()m ni i m Xn χσ+=+∑,所以~()miX t n ξ=2)因为22211~()mii Xm χσ=∑,22211~()m nii m Xn χσ+=+∑所以2121~(,)mi i m ni i m n X F m n m X =+=+∑∑3)因为21~(0,)m i i X N m σ=∑,21~(0,)m ni i m X N n σ+=+∑所以2212()~(1)mi i X m χσ=∑,2212()~(1)m ni i m X n χσ+=+∑故 222221111~(2)mm ni i i i m X X m n χσσ+==+⎛⎫⎛⎫+ ⎪ ⎪⎝⎭⎝⎭∑∑第二章3. 1)解:矩法估计:111ˆ,EX X Xλλ===最大似然估计:111,ln ln niii nnx x ni i i L eeL n L x λλλλλ=--==∑===-∑∏2111ˆln 0,ni ni ii d n nL x d Xxλλλ===-===∑∑2)解:~()X P λ矩估计:最大似然估计:1,ln ln ixnxnn i i iiL eeL n nx x x xλλλλλλ--====-+-∑∏∏2ˆln 0,d nx L n X d λλλ=-+==3)解:矩估计:()2,212b a a bEX DX -+==联立方程:()2*221ˆ2ˆa X b X a bX b a M ⎧=-⎪→+⎧=⎪⎪⎨-⎪=⎪⎩⎨=+⎪⎩极大似然估计:依照定义,11ˆˆmin ,max i ii ni na Xb X ≤≤≤≤== 11.解:222221111115ˆˆ()(),()()6336918E D ααααααασσσσσ=+++==+++= 2ˆ(234)/52E ααααααα=+++=≠ 22331141ˆˆˆ(),4164E D D ααααααασσα=+++===< 12ˆˆ,αα无偏,3ˆα方差最小 X X EX ===1ˆ,λλ所以:231ˆˆˆD D D ααα<< 12、1)解:()2122222221111ˆ[12(1)2][2(1)()2(1)]n i i i i i E E k n x x x x n n k kσσμμσσ-++==--+=-+--==∑2(1)k n ∴=-2)1,2110,nkk k i i i i x n n y x x x N n nn σ=≠--⎛⎫=-=- ⎪⎝⎭∑令222(1)x n ni E y dx k σσ--∴===∴=⎰15.1)解:()22222211111()(())()111n ni i i i i ES E X X E X nX EX nEX n n n ===-=-=----∑∑ 222221[()]1n n n n σσμμσ⎛⎫=+-+= ⎪-⎝⎭2S ∴是的2σ无偏估计2)解:()2224222421222(1),,11n D S n DS E S DS n n σσσσ-⎛⎫=-=-== ⎪--⎝⎭()()()()()()222222224111222222222422221()2()1n E S D S E S nE S D S E S n σσσσσσσσ--=-+-=-=-+-=+可以看出()2222E S σ-最小。

概率论与数理统计吉林大学,网络教育,大作业答案

1.将n 只球随机地放入N ()n N ≤个盒子中,设每个盒子都可以容纳n 只球,求:(1)每个盒子最多有一只球的概率1p ;(2)恰有()m m n ≤只球放入某一个指定的盒子中的概率2p ;(3)n 只球全部都放入某一个盒子中的概率3p .(10分)答:2.已知随机变量X 的概率密度为(10分),0<1,()0,ax b x f x +<⎧=⎨⎩其 他, 且15,28P X ⎧⎫>=⎨⎬⎩⎭求(1)常数,a b 的值;(2)1142P X ⎧⎫<≤⎨⎬⎩⎭;(3)()E X . 3. 设随机事件A 、B 满足11(),()(),42P A P B A P A B ===令1,0A X A ⎧=⎨⎩发生,,不发生, 1,0B Y B ⎧=⎨⎩发生,,不发生,求(1)(,)X Y 的概率分布;(2)Z X Y =+的概率分布. (20分)4.假设由自动流水线加工的某种零件的内径X (毫米)服从正态分布(,1)N μ,内径小于10或大于12为不合格品,其余为合格品;销售合格品获利,销售不合格品亏损,已知销售一个零件的利润T (元)与零件内径X 的关系为1,10,20,1012,5,12,X T X X -<⎧⎪=≤≤⎨⎪->⎩.问平均内径μ取何值时,销售一个零件的平均利润最大.(20分)答:利润 L=-1* φ (10- μ )+20*[ φ (12- μ )- φ (10- μ )]-5*[1- φ (12- μ )]=25 φ (12- μ )-21 φ (10- μ )-5=25 ∫ 1/(2 π )^0.5e^(-0.5x^2) 从 - ∞到 12- μ的积分-21 ∫ 1/(2 π )^0.5e^(-0.5x^2) 从∞到 10- μ的积分 -5对上式求导得L ’ =1/(2 π )^0.5(21e^[0.5(10- μ )^2]-25 e^[0.5(12- μ )^2]令 L ’ =0 即可以求得μ =10.9此时销售一个零件的平均利润最大 .5.设总体X 的概率密度为(1)(1),12,()0,x x f x θθ⎧+-<<=⎨⎩其它, 其中0θ>是未知参数,又12,,,n X X X L 为取自总体X 的简单随机样本,求θ的矩估计量和最大似然估计量. (20分)6.设123,,X X X 是总体X 的样本,()E X μ=,2()D X σ=存在,证明估计量 µ1123211366X X X μ=++, ¶2123111424X X X μ=++, ¶3123311555X X X μ=++ 都是总体X 的均值()E X 的无偏估计量;并判断哪一个估计量更有效.(20分)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2011-2012年第一学期研究生“应用数理统计”课程课外作业 学号 20110313142 姓名 许 娜 学院 建筑管理与房地产学院 专业 建筑与土木工程 成绩

房地产开发投资对固定资产总投资的线性回归分析 摘要:房地产业的支柱产业地位及其在经济社会发展过程中的作用一直以来都是建筑经济投资领域研究的热点更是社会的焦点问题。本文通过搜集中国近10年的房地产开发投资额等相关数据,借用数理统计的分析工具对固定资产投资额增长对于房地产业的影响进行线性回归分析。发现理论上中国的房地产开发规模总体上控制较好。这为今后更好地进行固定资产投资以及房地产开发规划奠定了理论基础。 关键词:固定资产总投资额;房地产开发投资;回归分析

一、问题提出 在国民经济中,房地产业的支柱地位和作用越来越突出。一方面房地产为人们提供必要的物质生活条件,是人们从事各种活动的物质基础来源,房地产既是一种重要的物质劳动产品和物质财富,又是人们赖以生存和发展的重要社会资源;另一方面房地产业涉及国民经济的各个领域,将土地、资金、劳动力和各种社会资源及物质材料通过市场机制积聚起来,对整个市场体系的完善具有不可替代的重要作用,包括建筑业在内的广义房地产业的发展,为农业、工业、商业、运输业等国民经济基本行业的繁荣发展提供了必备的物质条件。但是房地产业的高投资高利润,吸引了大批投资者。近年房地产业出现过热的形势,这对于房地产业的健康持续发展不利。全社会固定资产投资总额中各部分投资所占比重应该合理分配,城市才能健康协调发展,才能有效地实现经济增长。尤其在房地产泡沫引发的全球金融危机后,政府更应该大力调控房地产开发投资规模,合理控制房地产开投资额占全社会总投资额的比例,一般是20%到30%是比较正常的。 本文通过分析我国2001年—2010年的各年全社会固定资产投资额和房地产开发投资额的数据,建立一元线性回归模型,试图分析全社会固定资产投资对房2011-2012年第一学期研究生“应用数理统计”课程课外作业 地产开发规模是否有影响,以期检测我国总体的建设投资发展规划控制是否合理。

二、数据描述 本文主要是结合全社会固定资产投资额和房地产开发规模实际,以全国过去十年中全社会固定资产投资额增长和房地产开发的情况为研究对象,利用一元线性回归模型来进行分析和相关检验说明。下面表1是全国2001年—2010年的各年全社会固定资产投资额和房地产开发投资额数据汇总。表中数据均来自于中国统计年鉴。

年份 固定资产投资额(亿元) 房地产开发投资额(亿元) 2001 37213.5000 6344.1107 2002 43499.9100 7790.9223 2003 55566.6100 10153.8009 2004 70477.4000 13158.2516 2005 88773.6200 15909.2471 2006 109998.2000 19422.9174 2007 137323.9400 25288.8373 2008 172828.4000 31203.1942 2009 224598.8000 36241.8000 2010 278139.8000 48267.1000 表1. 全国2001—2010年全社会固定资产投资额和房地产开发投资额统计对照表

三、线性回归模型的建立 (1)模型中的相关参数和概念解释 我们把在不确定性关系中作为影响因素的变量称为自变量或解释变量,用X表示,受X取值影响 的响应变量称为因变量,用Y表示。这里,假设X是可控制变量,即它的取值是可以事先给定的,Y是可观测的随机变量,当X取定一个数值x时,就有一个随机变量Y与之对应。令 2011-2012年第一学期研究生“应用数理统计”课程课外作业 E(Y∕X=x)= f(x), ① 从而其它随机因素引起的偏差是 ε=Y-f(x) ② (2)两个假设条件 a.假设自变量X是可控变量,即它的取值是可以事先给定的,而Y是可观测的随机变量,它与X的取值相对应。 b.假定随机误差ε是不含系统偏差的零均值随机误差,且2~0,。

(3)回归模型的建立 结合式①与式②以及假设条件,我们根据X与Y的不确定性关系建立如下回归模型: Y= E(Y∕X=x)+ε= f(x) +ε ③ 满足 2=0D=DY=E

 ④

这里假定 2~0,

(4)对回归模型的解释 式③表示因变量Y的变化由两个原因所致,即自变量X和其它未考虑到的随机因素ε,记 y= f(x) = E(Y∕X=x) ⑤ 式⑤刻画了Y受X影响的主体部分,或者称系统性成分,剩下的是不含系统偏差的零均值随机误差,倘若我们知道了y = f(x) ,则可以从数量上掌握X与Y之间复杂关系的大趋势,就可以利用这种趋势研究对Y的预测问题和对X的控制问题。 回归分析就是通过自变量X与因变量Y的均值之间的确定性关系y = f(x)研究X与Y之间的不确定性关系,虽然随机因素ε的干扰使得X与Y之间的关系不确定,但从平均性质看,不确定性关系有向确定性关系y = f(x)回归的趋势。 (5)一元线性回归模型的建立 易知,回归函数⑤式是一个线性函,且本文中所要研究对象的可控制变量只2011-2012年第一学期研究生“应用数理统计”课程课外作业 有一个,所以回归函数为: 01()yfxx ⑥ 由回归模型的特点,则一元线性回归模型可如下建立: 012~(0,)

Yx

⑦ 其中,⑥式称为Y对x的一元线性回归方程或一元线性回归直线; 0、1称为回归系数,常数0、1、σ2均未知。

(6)模型求解 我们采用最小二乘法来估计一元线性回归模型中的两个参数0、1

设i ixy, (i=1,2, …,n)为取得的一组试验数据,假定满足如下一元线性回归模型: i=1,2, …,n i=1,2, …,n ⑧ i≠j,i,j=1,2, …,n 需要在此基础上确定回归系数0、1的估计值0ˆ、1ˆ,并使残差 ˆiiieyy

(i=1,2, …,n)

要使上式中的n个残差都小有时是做不到的,解决这个问题的一种途径是让

22

011neiiiSyx



达到最小,这就是最小二乘法的思想,这等价于求解下面的优化问题 以0、1为未知数的min2011niiiyx



因此,0、1为下列方程组

i01ii2i

ij

yx~(0,)Cov0

 , 2011-2012年第一学期研究生“应用数理统计”课程课外作业 20101201112020nEiiinEiiiiSyxSxyx









的解。 解上面的方程组,便可以得到0

ˆ

、1ˆ:

112101()()ˆ()ˆˆniiiniixxyyxxyx









 也即 101ˆˆˆxyxxllyx

以上就是最小二乘法的基本算法,当X=x时,Y的预测值为: 01ˆˆˆyx

四、根据以上模型进行建筑业总产值对GDP贡献的线性回归分析 拟用前文中给出的全国2001年—2010年的各年全社会固定资产投资额和房地产开发投资额数据为例进行分析研究。 变量设置:将数据中的全社会固定资产投资额设为自变量,用X表示(单位:亿元);数据中的房地产开发投资额作为因变量,用Y表示(单位:亿元)。 (1)做出表1中房地产开发投资额和全社会固定资产投资额数据的散点图,如图1所示。 2011-2012年第一学期研究生“应用数理统计”课程课外作业 图1:全国2001—2010年房地产开发投资额和固定资产投资额数据的散点图 以上的散点图显示了房地产开发投资额和全社会固定资产投资额之间存在线性相关关系。 (2)求房地产开发投资额(Y)对全社会年固定资产投资额(X)的样本回归直线。由表1中数据用EXCEL计算出求样本回归直线所需数据如下表2所示。 年份 固定资产投资额()(万亿元) 房地产开发

投资额()(万亿元)

2ix 2iy

ii

xy

2001 3.72135000 0.63441107 13.84844582 0.4024774 2.360866 2002 4.34999100 0.77909223 18.9224217 0.6069847 3.389044 2003 5.55666100 1.01538009 30.87648147 1.0309967 5.642123 2004 7.04774000 1.31582516 49.67063911 1.7313959 9.273594 2005 8.87736200 1.59092471 78.80755608 2.5310414 14.12321 2006 10.99982000 1.94229174 120.99604 3.7724972 21.36486 2007 13.73239400 2.52888373 188.578645 6.3952529 34.72763 2008 17.28284000 3.12031942 298.6965585 9.7363933 53.92798 2009 22.45988000 3.62418000 504.4462096 13.134681 81.39865 2010 27.81398000 4.82671000 773.6174834 23.297129 134.25

 121.842018 21.37801815 2078.460481 62.63885 360.458

相关文档
最新文档