统计学作业CH5(指数)
ch5数理统计的基本概念

第五章数理统计的基本概念一、教学目的与要求1、掌握母体、子样、统计量等数理统计的基本概念;2、熟练掌握正态总体的有关统计量的分布;3、了解数理统计的基本思想方法以及应用领域。
二、教学重点和难点本章的教学重点和难点都是正态总体的有关统计量的分布。
§5.1母体与子样、经验分布函数一、母体与个体在数理统计学中我们把研究对象的全体所构成的一个集合称为母体或总体,而组成母体的每一单元成员称为个体。
在实际中我们所研究的往往是母体中个体的各种数值指标。
例如要研究某灯炮厂生产的一批灯炮的平均寿命。
这批灯炮就构成了一个母体,其中每一只灯炮就是一个个体。
我们关心的是灯炮的寿命指标,它是一个随机变量。
假设的分布函数是F(x)。
如果我们主要关心的只是这个数值指标。
为了方便起见我们可以把这个数值指标的可能取值的全体看作母体,并且称这一母体为具体分布函数F(x)的母体。
这样就把母体和随机变量联系起来了,并且这种联系也可以推广到R维,。
例如电视机显像管的寿命和亮度等,我们可以把这两个指标所构成的二维随机向量()可能取值的全体看成一个母体。
简称二维母体。
这二维随机变量()在母体上有一个联合分布函数F(x,y).称这一母体为具有分布函数F(x,y)的母体。
数理统计学中我们总是通过观测和试验以取得信息,我们可以从客观存在的母体中按机会均等的原则随机抽取一些个体,然后对这些个体进行观测或测试某一指标的数值,这种按机会均等的原则选取一些个体进行观测或测试的过程称为随机抽样。
假如我们抽取了n个个体,且这n个个体的某一指标为()称这几个个体的指标()为一个子样或样本,n称作为这子样的容量,在一次抽样以后,观测到()的一组确定的值()称为容量为n的子样的观测值(或数据)。
在随机抽样中,每个是一个随机变量,从而我们可以把容量为n的子样()看成一个n维随机向量,容量为n的子样的观测值()可以看成一个随机实验的结果,它的一切可能结果的全体构成一个样本空间,称为一个子样空间,它可以是n维空间,也可以是其中的一个子样,而子样的一组观测值()是子样空间的一个点。
统计学第五版统计指数

第十四章统计指数(1) 计算产量与单位成本个体指数。
(2) 计算两种产品产量总指数以及由于产量增加而增加的生产费用。
(3) 计算两种产品单位成本总指数以及由于成本降低而节约的生产费用。
(2)产量指数:室=理=115.64% ' z 0q 0 55000Z Z)q -,40) = 63600-55000 = 8600元) ' Z i Q i 63500(3)单位成本指数:一 =63500 = 99.84%' 神 63600Z zq -W Aq i =63500-63600= -100(元)要求:(1) 计算三种商品的销售额总指数。
(2) 分析销售量和价格变动对销售额影响的绝对值和相对值。
解:(1) 销售额总指数:P"二冬竺=121.06%' PA 26000Z pq —£ p 0q 0 =31475 —26000 = 5475元)(2) 价格的变动:职1 二3!475—109.29%' Pol 28800Z pq -£ p °q 1 = 31475-28800= 2675元)销售量的变动: 哂=28800 = 110.77% 、P 0。
26000Z p ()q 1-,P b q 0 =28800-26000 = 2800元)价格指数:' P °q 1 444480=92.5% '、P °q 0 38076%500' P 0O 1 480 P 1Q 1 444销售量指数一竺 =480 = 96% 刘=444 = 116.8% '、P o Q ) 500 ' Bq 。
3804.某公司三种产品的有关资料如下表,试问三种产品产量平均增长了多少,产量增长对产值有什么影响?产品名称 个体产量指数基期广■值(万兀)报告期产值(万兀)甲 i.25 i00 i20 乙 i.i0 i00 ii5 丙i.506085解:产品总产值(万兀)q 。
CH5 参数估计

t 分布面积规律
-t/2,v
t/2,v
总体均数的可信区间 (σ已知、或σ未知但n很大)
X 1 P u u 2 2 / n
100(1 )%可信区间为 (X u / 2 / n X u / 2 / n)
均数
150
200
250
300
350
400
450
50
5. 5. 5. 5.
0
n 5; S X 0.2212
n 30; S X 0.0920
3个抽样实验结果图示
均数
100 150
3. 71 3. 92 4. 12 4. 33 4. 54 4. 74 4. 95 5. 15 5. 36 5. 57 5. 77 5. 98 6. 19
总体标准差
总体率
如:样本均数
样本均数的抽样误差 —— 标准误
抽样误差 总体
参 数
如:总体均数 抽取部分观察单位 样本
统计推断
统计量
如:样本均数 X
(sampling error) :由 于个体差异导 致的样本统计 量与总体参数 间的差别。
一、抽样试验
从正态分布总体 N(5.00,0.502)中, 每次随机抽取样本含量n=5,并计算其均数 与标准差;重复抽取1000次,获得1000份样 本;计算1000份样本的均数与标准差,并对 1000份样本的均数作直方图。 按上述方法再做样本含量n=10、样本
100%
区别点
总体均数可信区间
参考值范围
按预先给定的概率,确定的未知参数 的可能范围。实际上 “正常人”的解剖,生理, 含 义 一次抽样算得的可信区间要么包含了总体均数, 要么不包含。 生化某项指标的波动范围。 但可以说:当=0.05 时,95%CI 估计正确的概率为 0.95,估 计错误的概率小于或等于 0.05,即有 95%的可能性包含了总 体均数。 总体均数的波动范围 计算 公式 用途 个体值的波动范围 正态分布: X u S 偏态分布:PX~P100X 绝大多数(如 95%)观察对象 某项指标的分布范围
Ch5投入产出分析模型rev17

实物表基本表式(q-Y-Q)
X = AX + Y
18
例:3部门经济体投入产出表(单位:元) x(i,j)+Y=X
xij
X
总投入
19
记住:X = (I-A)^-1*Y
I-A 称为列昂惕夫矩阵
A = xij /( X .* I ) X = A*X + Y I*X = A*X + Y (I*X –A*X) = Y (I-A) *X = Y X = (I-A)^-1*Y
X=
1.0516e+006 5.1584e+005 5.4871e+005
23
总产出
X = (I - A)-1 * 外部订单Y
24
如果外部订单改变为Y1 总产出(投资结构)X 须调整为何?
% 如果外部订单改变为Y1 %总产出(=总投入)结构须调 整为
Y1=[ 750000 300000 250000] X1 = inv(eye(3,3) - A) * Y1
12
例:3部门经济体投入产出表
13
例:3部门经济体投入产出表
由价值型投入产出数学模型 x + Y = X
求直接消耗系数矩阵A
%内部流量矩阵 x=[ 0 36506 15582 25522 2808 2833 25522 2808 0
x= 0 36506 15582
统计学作业CH5(指数)参考答案

1.某企业生产两种产品的有关资料如下表所示。
要求:从相对数和绝对数两方面来分析由于销售量和价格的变动对企业销售总额的影响。
销售额总指数及绝对增减额:I pq=p1q100=300∗12+2000∗21=45600=142.5% p1q1−p0q0=45600−32000=13600销售量总指数及由于销售量变动引起的销售额绝对增减额:I q=p0q100=300∗10+2000∗20=43000=134.375% p0q1−p0q0=43000−32000=11000价格总指数及由于价格变动引起的销售额绝对增减额:I p=p1q1p0q1=300∗12+2000∗21300∗10+2000∗20=4560043000=106.047% p1q1−p0q0=45600−43000=26002.某企业生产某产品的总成本和产量资料如下表所示。
要求:计算产量总指数以及由于产量增长而增加的总成本绝对额。
产量总指数:I q=q2014q2013p2013q201320132013=15001000∗50+28002000∗80=187=143.85%由于产量增长而增加的总成本绝对额:q2014q2013p2013q2013−p2013q2013=187−130=57(万元)3.某集团公司销售的三种商品的销售额及价格变动资料如表所示。
要求:从相对数和绝对数两方面分析公司销售总额变动的原因。
销售额总指数及绝对增减额:I pq=p1q1p0q0=150+45+510100+50+500=705650=108.46% p1q1−p0q0=705−650=55销售量总指数及由于销售量变动引起的销售额绝对增减额:I q=1p1p0p1q100=150/(1+1%)+45/(1+5%)+510/(1−2%)=711.7802 =109.505%p0q1−p0q0=711.7802−650=61.7802价格总指数及由于价格变动引起的销售额绝对增减额:I p=p1q11pp0p1q1=150+45+510150/(1+1%)+45/(1+5%)+510/(1−2%)=705711.7802 =99.05%p1q1−p0q0=705−711.7802=−6.78024.某市2013年社会商品零售额为12亿元,2014年增加为15亿元。
CH.5 主成分分析

设X的协方差阵为
12 12 1 p 2 2 2p 21 Σx 2 p1 p 2 p
由于Σ x为非负定的对称阵,则有利用线性代数的 知识可得,必存在正交阵U,使得
0 1 UΣ X U p 0
济信息将会有较大的损失。
如果我们将xl 轴和x2轴先平移,再同时按 逆时针方向旋转角度,得到新坐标轴Fl和F2。 Fl和F2是两个新变量。
根据旋转变换的公式:
y1 x1 cos x2 sin y1 x1 sin x2 cos y1 cos y2 sin sin x1 Ux cos x2
类推
写为矩阵形式:
F UX
u11 u12 u1 p u u u 21 22 2p U (u1 ,, u p ) u u u p2 pp p1
X ( X 1 , X 2 ,, X p )
§4
一、均值
主成分的性质
既然研究某一问题涉及的众多变量之间有一定的 相关性,就必然存在着起支配作用的共同因素,根据 这一点,通过对原始变量相关矩阵或协方差矩阵内部 结构关系的研究,利用原始变量的线性组合形成几个 综合指标(主成分),在保留原始变量主要信息的前 提下起到降维与简化问题的作用,使得在研究复杂问 题时更容易抓住主要矛盾。一般地说,利用主成分分 析得到的主成分与原始变量之间有如下基本关系: 1.每一个主成分都是各原始变量的线性组合; 2.主成分的数目大大少于原始变量的数目
3.主成分保留了原始变量绝大多数信息 4.各主成分之间互不相关 通过主成分分析,可以从事物之间错 综复杂的关系中找出一些主要成分,从 而能有效利用大量统计数据进行定量分 析,揭示变量之间的内在关系,得到对 事物特征及其发展规律的一些深层次的 启发,把研究工作引向深入。
ch5 分布的检验

i 1 ~ n
5.1.1
夏皮洛· 威尔克检验
c' c
i 1
n
5.1.1
夏皮洛· 威尔克检验
(4)W检验的拒绝域。由于W是n个数对
(x(1),a1),…,(x(n),an)之间的相关系数的平方,所以W仅在 [0,1]上取值。
5.1.1
夏皮洛· 威尔克检验
若把上式中u(i)用期望E(u(i))=mi代替,会产生 误差,记此误差为εi,这样上式可改写为 x(i)=μ+σmi+εi, i=1,2,…,n(5.1.2) 这是一元线性回归模型。由于次序统计量的 关系,其中诸εi是相关的。若记ε=(ε1,ε2,…,εn)', 则ε是均值为零向量,协方差矩阵为V=(vij)的n 维随机向量。
5.2.1
χ2检验
定理5.2.1 在H0为真和上述符号下,令 y1=n(x(1)-x0), x0=0 y2=(n-1)(x(2)-x(1))(5.2.2) ︙ yr=(n-r+1)(x(r)-x(r-1)) 则y1,y2,…,yr是相互独立同分布随机变量,共同分布为 exp(λ)。
5.2.1
χ2检验
为σ的最小方差线性无偏估计 2(BLUE),由例2.5.2知,正 态标准差σ的BLUE为:
c 2 ci x (i ) c x (5.1.5) ~
,
,
n
i 1
其中系数为 c'=(c1,c2,…,cn)= m v1 '
' 1
mv
m
(5.1.6)
5.1.1
夏皮洛· 威尔克检验
CH5 总体参数估计

区间估计
• 不知道总体参数Æ需要通过样本来估计 • 点估计量和区间估计的端点都是统计量(随机的) • “ 某个总体参数 ξ 的置信度为 100(1-α)% 的置信区 间”意味着:
• 如果抽取(相同样本量)的大量样本,那么, 从这些样本中得到的以同样方法(或公式)计 算的大量区间中会有大约1-α比例的区间包 含未知的总体参数,而有约α比例的区间不 包含总体参数。
估计例子
• • • •
在无信号灯的人行横道减速的机动车的比例=? 500辆通过斑马线的机动车,仅有2辆车减了速。 “在斑马线减速的机动车比例为0.4%” :点估计 “减速车辆的比例在0.00048和0.01437之间, 而且可信程度为95%: 区间估计 • 点估计给出一个数目,区间估计给出一个区间
区间估计
• 我们希望区间窄,又希望置信度大。 • 对固定的样本量,要增加置信度,通常要加宽区 间,而要使区间变窄,就要牺牲置信度。 • 固定了区间宽度,置信度会随着样本量的增加而 增加, • 固定置信度时,区间宽度会随着样本量的增加而 变窄。
思考一下
• 如果说“区间(0.2, 0.4)包含参数p=0.3的概率为95%”, 你应该会觉得有些怪异,但如果说“区间(0.2, 0.4)包含 未知参数p的概率为95%”呢?要知道p也是一个固定 的数,只不过不知道罢了。 • 如果U和L为两个随机变量,那么说“随机区间(L, U)包 含未知参数p的概率为95%”就没有什么讲不通的了。 比较这个论述和上面问题中的论述。 • 对于总体比例,无疑,置信区间[0, 1]是肯定包含总体 比例的,置信度应该是100%。你觉得这样的区间好 吗?类似地,我们是否可以用100%置信区间(-∞, +∞) 来作为总体均值的置信区间呢? • 同样置信度的置信区间并不是惟一的,也不一定是关 于点估计对称的,也可能有一边或两边是无穷的;当 然,两边都无穷的区间没有什么意义。试着讨论一下。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
产品名称
销售量
价格(元)
基期
报告期
基期
报告期
甲(吨)
200
300
10
12
乙(件)
1 500
2 000
20
21
要求:从相对数和绝对数两方面来分析由于销售量和价格的变动对企业销售总额的影响。
2.某企业生产某产品的总成本和产量资料如下表所示。
产品种类
产量(件)
2013年总成本
510
-2
要求:从相对数和绝对数两方面分析公司销售总额变动的原因。
4.某市2013年社会商品零售额为12亿元,2014年增加为15亿元。物价上涨了1%,试计算零售量指数,并分析零售量变动和物价变动对零售额总额变动的影响。
5.某中农产品在两地块进行种植,其平均产量和地块面积资料如下:
地块编号
面积(亩)
平均产量(千克/亩)
基期
报告期
基期
报告期
甲
30
40
600
700
乙
50
45
800
1000
试对该农产品总平均亩产量的变动及其原因进行分析。
(万元)
2013年
2014年
A
1 000
1 500
50
B
2 000
2 800
80
要求:计算产量总指数以及由于产量增长而增加的总成本绝对额。
3.某集团公司销售的三种商品的销售额及价格变动资料如表所示。
种类
商品销售额(万元)
价格上升(%)
第一季度
第二季度
甲(套)
100
150
1
乙(件)
50
45
5
丙(块)
500