数据模型与决策习题解答

数据模型与决策习题解答
数据模型与决策习题解答

第二章习题(P46)

14.某天40只普通股票的收盘价(单位:元/股)如下:

(1)构建频数分布*。

(2)分组,并绘制直方图,说明股价的规律。

(3)绘制茎叶图*、箱线图,说明其分布特征。

(4)计算描述统计量,利用你的计算结果,对普通股价进行解释。

解:(1)将数据按照从小到大的顺序排列

, , 8, , , 9, , , , 10, , , 14, , , 18, 18, , , , , , , , , , , , , 34, , 37, , 38, , , , 52, , ,结合(2)建立频数分布。

(2)将数据分为6组,组距为10。分组结果以及频数分布表。为了方便分组数据样本均值与样本方差的计算,将基础计算结果也列入下表。

区间组频数累计频数组中值组频数×组中值组频数×组中值×组中值

,0[99 545225

10

)

[1019 151502250

10

20

,

)

[524 251253125

20

)

,

30

[1135 3538513475

30

,

)

40

40

[237 45904050 50

,

)

50

[ 340 6018010800 ,

)

合计4097533925

根据频数分布与累积频数分布,画出频率分布直方图与累积频率分布的直方图。

频率分布直方图

从频率直方图和累计频率直方图可以看出股价的规律。股价分布10元以下、10—20元、30—40元占到60%,股价在40元以下占%,分布不服从正态分布等等。

累积频率分布直方图

(3)将原始数据四舍五入取到整数。

1,8 ,8 ,9 ,9 ,9 ,9 ,9 ,9 ,10 ,11 ,12 ,14 ,17 ,17 ,18 ,18 ,19 ,19 ,22 ,24 ,29 ,30 ,30 ,30 ,31 ,32 ,34 ,34 ,34 ,35 ,37 ,38 ,38 ,39 ,43 ,48 ,52 ,53 ,79

以10位数为茎个位数为叶,绘制茎叶图如下

茎(十位数)

叶(个位数及其小数) 0 9 1 9 2 249 3 89 4 38 5 23 6 7 9

由数据整理,按照从小到大的准许排列为:)40()39()2()1(x x x x ≤≤?≤≤

频率

0.05

0.10.150.20.250.30—10

10—20

20—30

30—40

40—50

50及以上

累计频率

0.20.40.60.811.20—10

10—20

20—30

30—40

40—50

50及以上

最小值25.1)1(=x ,下四分位数()

03125.11375.114

3

1041341)11()10(=?+?=?+=x x Q l ,中位数()9375.22225.24625.2121)21()20(=+=+=

x x M e ,上四分位数()

)30()29(34

1

x x Q u +?= 3125.3425.3541

3443=?+?=

,最大值375

.79)40(=x ,四分位数间距

28125.2313=-=Q Q IQR ,375.792344.695.1)40(3=<=+x IQR Q ,

因此可以做出箱线图为:

茎叶图的外部轮廓反映了样本数据的分布状况。从茎叶图和箱线图可以看出其分布特征:中间(上下四分位数部分)比较集中,但是最大值是奇异点。数据分布明显不对称,右拖尾比较长。

(4)现用原始数据计算常用的描述性统计量 样本均值:421875.2540/875.101640

1

40

1

===

∑=i i

x

x

样本方差:196.26340391240122

=???

? ???-=∑

=x x s i i

样本标准差:2233.16196.2634039124012==???

? ???-=

=x x s i i 用分组数据计算常用的描述性统计量:9756

1

='∑=k k

k x f

339256

1

2='∑=k k

k x f

样本均值:375.2440/97540

1

6

1

=='=

∑=k k

k x f

x

样本方差:4968.260403912612=???

? ??

?-'=∑

=x x f s k k

k 样本标准差:1399.164968.260403912612==???

? ???-'=

=x x f s k k k 与用原始数据计算的结果差别不大。

此外,可以用Excel 中的数据分析直接进行描述性统计分析,结果如下:

平均 区域 标准误差 最小值

中位数 最大值 众数 求和 标准差 观测数 40 方差 最大(1) 峰度 最小(1)

偏度

置信度%)

补充习题:

1. 测量血压14次,记录收缩压,得样本如下:

121,123,119,130,125,115,128,126,109,112,120,126,125,125 求样本均值,样本方差,样本中位数,众数和极差。 2. 根据列表数据

分组 人数 [20,25) 2 [25,30) 6 [30,35) 9 [35,40) 4 [40, 45]

1

3. 调查30个中学生英语成绩,得样本如下:

54, 66, 69, 69, 72,75, 77, 75, 76, 79, 76,77, 78, 79,81, 81, 85, 87, 83, 84,89, 86,89, 89, 92, 95,96,96, 98, 99

把样本分为5组,组距为10,且最小组的下限为50,作出列表数据和直方图 补充习题答案

1. 测量血压14次,记录收缩压,得样本如下:

121,123,119,130,125,115,128,126,109,112,120,126,125,125 求样本均值,样本方差,样本中位数,众数和极差。 解:排序:

109 112 115 119 120 121 123 125 125 125 126 126

128

130

均值:

1

n

i

i x

x n

==

∑=

方差:2

2

2

2

1

1

()

1

1

n

n

i

i

i i x x x

nx

s n n ==--=

=

--∑∑=

中位数:1

2

202

n n

x x m -+=

= 124

众数:m e = 125 极差:R=x n -x 1= 21

2.根据列表数据

分组 人数 组中值 [20,25) 2 [25,30) 6 [30,35) 9 [35,40) 4 [40, 45]

1

解:

分组 人数 组中值 [20,25) 2 [25,30) 6 [30,35) 9 [35,40) 4 [40, 45]

1

样本均值:

1

1k

i i

i x x f n ==∑=

样本方差:2

2

22

1

1

()1

1

k

n

i i

i i i i x x f x f nx

s n n ==--=

=

--∑∑=

样本标准差:2

1

()

1

k

i

i

i x x f s n =-=

-∑3调查30个中学生英语成绩,得样本如下:

54, 66, 69, 69, 72,75, 77, 75, 76, 79, 76,77, 78, 79,81, 81, 85, 87, 83, 84,89, 86,89, 89, 92, 95,96,96, 98, 99

把样本分为5组,组距为10,且最小组的下限为50,作出列表数据和直方图 解:列表

区间 频数 [ 50,60) 1 [60,70) 3 [70,80) 10 [80,90) 10 [90,100] 6

24681012[ 50,60)

[60,70)

[70,80)

[80,90)

[90,100]

第四章习题(p118)

21.下面的10个数据是来自一个正态总体的样本数据: 10,8,16,12,15,6,5,14,13,9 (1)总体均值的点估计是多少? (2)总体标准差的点估计是多少? (3)总体均值99%的置信区间是多少? 解:

(1)总体均值的点估计8.1010810

1

?=?==x μ (2)总体标准差的点估计

()

7947.34.148.10101296911091?221012==?-=???

? ???-==∑

=x x s i i σ (3)这是正态总体方差未知的条件下,总体均值μ的区间估计问题

99.01=-α,01.0=α,2498.3)9()1(005.02/==-t n t α

总体均值99%的置信区间为:????

??-+--n s n t x n s n t x )1(,)1(2/2/αα

)(6997.14,9.6107947.32498.38.10,107947.32498.38.10=

???

? ???+?-= 第五章习题(p154)

7.某一问题的零假设和备择假设分别如下:

25:0≥μH 25:1<μH

当某个样本容量为100,总体标准差为12时,对下面每一个样本的结果,都采用显著性水平05.0=α计算检验统计量的值,并得出相应的结论。

(1)0.221=x 。 (2)5.232=x 。 (3)8.223=x 。 (4)0.244=x 。

解:这是总体分布未知,大样本前提下,总体均值的单边检验问题。故,可以用大样本情况下单个总体均值的检验。

提出原假设与备择假设:25:0≥μH 25:1<μH 选择检验统计量n

x z /25

σ-=

,当0H 成立时,)1,0(~//25

N n

x n

x z σμ

σ-≤

-=

给定显著性水平05.0=α,645.105.0==z z α,拒绝域645.105.0-=-≤z z (1)0.221=x ,645.15.2100/122522/25

-<-=-=

-=n

x z σ,拒绝0H 。接受1H ,即不能认

为25≥μ。

(2)5.231=x ,645.125.1100/12255.23/25->-=-=-=n

x z σ,接受0H 。即认为25≥μ。 (3)8.221=x ,645.183333.1100/12258.22/25

-<-=-=

-=n

x z σ,拒绝0H 。接受1H ,即不

能认为25≥μ。

(4)0.241=x ,645.18333.0100

/122524/25->-=-=

-=

n

x z σ,接受0H 。即认为25≥μ。

12.有一项研究要作的假设检验是: 20:0=μH 20:1≠μH

某个样本有6个数据,他们分别是:20,18,19,16,17,18。根据这6个数据,分别回答以下问题:

(1)它们的均值和标准差各是多少?

(2)当显著性水平05.0=α时,拒绝规则是什么? (3)计算检验统计量t 的值。

(4)根据以上信息,你所得出的结论是什么?

解:说明:本题是小样本,应该有总体服从正态分布),(2σμN 的假定。 (1)由样本数据得6=n ,1086

1

=∑=i i

x

19546

1

2=∑=i i

x

样本均值:186/1086

1

6

1

===

∑=i i

x

x ;

样本方差:2)1861954(51651226122

=?-=???

? ???-=∑

=x x s i i

样本标准差:4142.126512612==???

? ???-=

=x x s i i (2)在总体服从正态分布的假定之下,这是正态总体方差未知的条件下,总体均值的双边检验问题,用t 检验。

提出原假设与备择假设:20:0=μH 20:1≠μH 选择检验统计量:n

s x t /20-=

,当原假设0H 成立时,)1(~//20--=-=

n t n

s x n

s x t μ

当显著性水平05.0=α时,5706.2)5()1(025.02/==-t n t α,因此:拒绝域为: 5706.2)5(025.0=≥t t

(3)计算检验统计量t 的值236.255

/22018/20-=-=-=

-=n

s x t

(4)5706.2236.2/20<=-=

n

s x t ,接受0H 。即,总体均值μ与20没有显著性差异。

13.一家钢铁企业主要生产一种厚度为25mm 的钢板。历史统计资料显示,其中一台设备生产的钢板的厚度服从正态分布。最近,该厂维修部门对这台设备进行了大修。这台设备重新投入生产后,车间生产监管员担心这台设备经过维修后生产的钢板厚度会发生变化。为验证这一担心是否属实,他随机选出20块钢板,对其厚度进行测量。测量结果如表5—11所示。请判断这台设备经过维修后生产的钢板的厚度是否发生了明显的变化(05.0=α)。

表5—11 20块样本钢板的厚度 (单位:mm )

解:这是一个正态总体方差未知的条件下,总体均值的双边检验问题。用t 检验。 (!)提出原假设和备择假设:25:0=μH 25:1≠μH (2)选择检验统计量:n

s x t /25-=

, 当显著性水平05.0=α时,

093.2)19()1(025.02/==-t n t α,拒绝域为:093.2)19(025.0=≥t t

(3)计算检验统计量t 的值0483.120

/197.225515.25/25=-=

-=n

s x t

(4)093.20483.1/25<=-=

n

s x t ,接受0H 。即,这台设备经过维修后生产的钢板的

厚度没有发生明显的变化。

25.一家保健品厂最近研制出一种新的减肥药品。为了检验这种减肥药的效果,它分别对10名志愿者服用减肥药之前的体重和服用减肥药一个疗程后的体重进行测量。测量数据如下:(单位:kg )

服药前 71 75 82 69

76 71 86 78

服药后 66

80 67 79

69 80 75 77

在05.0=α的显著性水平下判断这种减肥药是否有效。 解:这是匹配样本情况下两个总体均值差的检验

服药前 71 75 82 69 76 71 86 78 服药后 66 80 67 79

69 80 75 77

服药前-服药后(d )

5

2

2

2

6

3

由样本数据算得:10=n ,7.2=d ,9465.1=d s

建立零假设与备择假设为:0)(:210=-=μμμd H ,0)(:211≠-=μμμd H 选择检验统计量:n

s d t d /=

,当0H 成立时,)1(~/-=

n t n

s d t d

显著性水平05.0=α,2622.2)9()1(025.02/==-t n t α,拒绝域:2622.2/≥=n

s d t d 。

将样本数据代入计算检验统计量的值:3864.410

/9465.17.2/==

=

n

s d t d

由于检验统计量的值:2622.2)9(3864.4025.0=>=t t ,拒绝0H ,接受1H ,即:服用减肥药一个疗程后平均体重有明显降低,说明这种减肥药具有明显的疗效。

第七章习题(p210)

23

公司名称 销售数量/百万股 预期价格/元

A 3 10

B 14

C 13

D 12

E 19

F 3 11

G 18

H 16

I 9 19 J

5

16

要求:

(1)画出以销售数量为自变量、预期价格为因变量的散点图,并说明两者的关系。 (2)建立预期价格对股票销售数量的一元线性回归方程。 (3)求销售数量x 与预期价格y 的相关系数

(4)如果一个公司首次公开发行700万股,预测该公司股票的预期价格。

解:(1)以销售数量(百万股)为横坐标,以预期价格(元)为纵坐标,画出散点图如下:

从散点图可以看出,预期价格(元)与销售数量(百万股)的散点图大致分布在一条直线附近,因此,两者间具有较强的线性相关关系。

(2)设预期价格(y )与销售数量(x )之间的线性回归方程为: x y 10ββ+=

由样本数据算得:

y = 0.8625x + 8.9266

R 2 = 0.7009

05

10

15

20

25

2

4

6

8

10

12

14

16

销售数量/百万股

预期价格

8625.0))

)?101

2

10

1

1

=---=∑

==i i

i i i

x x y y x x (((β,9266.8??1

0=-=x y ββ 因此,预期价格对股票销售量的一元线性回归方程为:x y

8625.09266.8?+= (3)销售数量x 与预期价格y 的相关系数r=

(4)如果一个公司首次公开发行700万股,该公司股票的预期价格的预测值为: 159641.1478625.09266.8?≈=?+=y

元 即:估计该公司股票的预期价格大约是15元。

第九章习题(P296)

7.加权综合指数的拉氏指数、帕氏指数的主要区别是什么?

拉氏指数=(各类商品报告期的价格×各类商品基期的数量)/(各类商品基期的价格×各类商品基期的数量);

帕氏指数=(各类商品报告期的价格×各类商品报告期的数量)/(各类商品基期的价格×各类商品报告期的数量)

其实从数学公式来看都是计算当期价格和基期价格按照一定的权数加权后的变化,拉氏指数选择基期的数量作为权数,帕氏指数选择报告期的数量作为权数。

12.什么是居民消费价格指数?根据你的了解,说出它有哪些作用?

居民消费价格指数(CPI),是反映一定时期城乡所购买的生活消费品价格和服务项目价格变动趋势和程度的。它是一组代表性消费商品及服务项目的价格水平随时间而变动的相对数,是用来反映居民家庭购买消费商品及服务的价格水平的变动情况。

居民消费价格指数(CPI)的作用主要有:

(1)作为度量通货膨胀(通货紧缩)的一个经济指标,为国家宏观调控提供决策依据;

(2)反映购买力水平;

(3)为剔除价格因素的影响,用CPI指数对现价指标进行缩减;

(4)用于国民经济估计核算中,如通过GDP平减指数全面反映价格水平,测算GDP 实际增长;

(5)通过CPI进一步研究和观测其他经济变量。

14.某企业生产甲、乙、丙三种产品,其产量和单位成本分别如表9—11所示。

表9—11 产量和单位成本

产品名称计量单位

产量/件单位成本/元基期报告期基期报告期

甲件13000 15000 20 30

乙台11000 10000 1500 2000

丙个4000 4800 80 100

要求:(1

(2)计算三种产品的产量总指数,说明由于产量的变动而增加或减少的生产费用。

(3)计算三种产品的单位成本总指数,说明由于单位成本的变动而增加或减少的生产费用。

(4)计算三种产品的生产费用总指数,说明生产费用的变动程度与变动数额。

解:(1)列表计算:

产品名称计量单位

产量/件单位成本/元计算计算计算计算q0q1p0p1p0×q0p1×q1p0×q1p1×q0

甲件13000 15000 20 30 260000 450000 300000 390000 乙台11000 10000 1500 2000

丙个4000 4800 80 100 320000 480000 384000 400000 求和

甲的产量指数%38.115130001500001===q q ,甲的成本指数%150203001===p p ; 乙的产量指数%91.90110001000001===q q ,乙的成本指数%33.1331500200001===p p , 丙的产量指数%1204000480001===

q q ,丙的成本指数%12580

10001===p p 。 (2)三种产品的总产量指数%83.9117080000

15684000

1==

=

∑∑p

q p

q I q

139600017080000156840000

00

1-=-=-∑∑p

q p q

由于产量变动而减少的总成本1396000元 (3)三种产品的单位成本总指数%45.133********

20930000

1

011==

=

∑∑q

p q p I q

524600015684000209300001

01

1=-=-∑∑q

p q p

由于成本变动而变动的总成本5246000元 (4)三种产品的生产费用总指数%54.12217080000

20930000

01

1==

=

∑∑q

p q p I qp

%54.122%45.133%83.911

01

10

010

01

1=?=?==

∑∑∑∑∑∑q

p q p p q p q q p q p I qp 385000017080000209300000

011=-=-∑∑q p q p

()()∑∑∑∑∑∑-+-=-1

01100010011q p q p p q p q q p q p

385000052460001396000=+-=

生产费用的变动数额为3850000元。 15.某店销售四种商品,数据如表9—12所示。

表9—12 四种商品的销售量和单价

产品名称 计量单位 销售量 单价/元

基期 报告期 基期 报告期

甲 双 200 315 12 乙 件 820 880 55 70 丙 个 400 680 120 150 丁

300

360

38 40

要求:

(1)计算四种商品的销售额总指数。

(2)根据指数体系关系,分析销售量和销售价格变动对销售额的影响程度和影响的绝对量。

解:(1)先列表计算 产品名称 计量单位 销售量 单价/元 计算 计算 计算 计算 q 0

q 1 p 0 p 1 p 0q 0 q 1p 0

q 0p 1 p 1q 1 甲 双 200 315 12 1700

2400 3780 乙 件 820 880 55 70 45100 48400 57400 61600 丙 个 400 680 120 150 48000 81600 60000 102000

300 360 38

40

11400 13680 12000

14400

求和

106200

131800 181780

四种商品的销售额总指数:%17.1711062001817800

01

1===∑

∑q p q p I qp

四种商品的销售额总变动755801062001817800

011=-=-∑∑q p q p 元

(2)销售量对销售额的影响程度%81.137106200

5.1463570

01===

∑∑p q p q I q

影响的绝对量5.401571062005.1463570

001=-=-∑∑p q p q 元

销售价格变动对销售额的影响程度%20.1245

.1463571817801

01

1===

∑∑q p q p I p

影响的绝对量5.354225.1463571817801

011=-=-∑∑q p q p 元

%17.171%2.124%81.1371

01

100

010011=?=?==∑

∑∑∑∑∑q p q p p q p q q p q p I qp

()()∑∑∑∑∑∑-+-=-1

01100010011q p q p p q p q q p q p

755805.354225.40157=+=元

16.某水果批发公司的成交额及成交价格如表9—13所示。

表9—13 三种水果的成交额和成交价格 品种

成交额/元 成交价格/(元/kg )

基期

报告期 基期 报告期 香蕉 12000 18000 西瓜 8000

11000

苹果 16000 14000

解:先列表计算

品种

成交额/元 成交价格/(元/kg ) 计算 计算 计算 计算 p 0q 0 p 1q 1 p 0 p 1 q 0 q 1 q 0p 1 p 0q 1 香蕉 12000 18000 西瓜

8000

11000

8000 11000 苹果 16000 14000 22000 求和 36000 43000

三种水果的成交价格总指数%22.11575

.3731943000

1

011==

=

∑∑q

p q p I p

25.568075.37319430001

01

1=-=-∑∑q

p q p

由于价格变动使三种水果的成交额增加元。 同时还可以计算:三种水果的成交量总指数%67.10336000

75

.373190

1==

=

∑∑p

q p q I q

75.131********.373190

00

1=-=-∑∑p

q p q

由于销量变动使三种水果的成交额增加元。 三种水果成交额总指数%44.11936000

43000

01

1==

=

∑∑q

p q p I qp %67.103%22.1150

11

011?=?=

∑∑∑∑p

q p q q p q p

三种水果成交额增加:

700036000430000

01

1=-=-∑∑q p q p 元

()()700075.131925.56801

01

10

00

1=+=-+-=

∑∑∑∑q p q p p q p

q 元

17.假设某证券市场有4只股票,其基期和报告期的价格与发行量数据如表9—14所示。

表9—14 4种股票的价格和发行量数据

股票名称 基期价格/元 基期发行量/万股 报告期价格/元 报告期发行量/万股

A

11 150 200 B 48 75 C 42 50 D

25

30

解:首先列表计算:

股票 名称 基期价格 /元p 0 基期发行 量/万股q 0 报告期价格 /元p 1 报告期发行

量/万股q 1 p 0q 1 p 1q 1

A 11 150 200 2200 2910

B 48 75 3624

C 42 50 D

25

30

合计

该市场的股票价格总指数%67.1969667.19

.44913

.88341

011===

=

∑∑q

p q p I p

第十一章习题(P345)

16.某洗衣粉生产企业开发一种新产品,有三个方案可供选择,经过整理,得到如表11—8所示的收益矩阵。

表11—8 收益矩阵

决策方案 自然状态

需求大 需求一般 需求小 方案1 1000 800 -200 方案2 1400 500 -400 方案3

1100

600

100

要求:根据无概率下的决策分析五种准则(“好中求好”决策准则、“坏中求好”决策准则、α系数)7.0(=α决策准则、后悔值决策准则、等可能性准则)选择决策方案。

解:先列表计算

决策方案 自然状态

好中 求好 坏中

求好

α系数 等可能

需求大 需求一般 需求小 最大 最小 =

期望值 方案1 1000 800 -200 1000 -200 640 方案2 1400 500 -400 1400 -400 860 500 方案3

1100

600

100

1100 100 800 600 最大

1400

100 860

600

“好中求好”决策准则:{}

{}14001100,1400,1000max max max 313131==??????≤≤≤≤≤≤i ij j i a ,应选择方案2; “坏中求好”决策准则{}

{}100100,400,200max min max 3

13131=--=??????≤≤≤≤≤≤i ij j i a ,应选择方案3;

α系数)7.0(=α决策准则{}{}

{}860800,860,640max min 3.0max 7.0max 3131

3131==??????+?≤≤≤≤≤≤≤≤i ij j ij j i a a ,应选择方案2;

等可能性准则{}600600,500,33.533max 31max 3

13131==??

?

???????≤≤=≤≤∑

i j ij i a ,应选择方案3。

后悔值列表计算

决策方案 自然状态

需求大 需求一般 需求小 方案1 1000 800 -200 方案2 1400 500 -400 方案3

1100

600

100

相关主题
相关文档
最新文档