统计学上机作业(1)

统计学上机作业(1)
统计学上机作业(1)

统计学上机作业(1)

一、利用软件计算

1、

宾馆未露面者人数进行统计频数分析,分析结果对确定超员预定客房数有何帮助?(数据参见课件)

因而得出结论该宾馆可以增加订房数,以使得宾馆的到充分运用。

2、

文件名:DA TA11-02

文件说明:1973年某市测量120名12岁男孩身高资料。

变量说明:height: 12岁男孩身高

绘制身高分布的直方图,求出该市12岁男孩身高平均值95%和99%的置信区间,说明置信系数与区间宽度之间的关系。

(1)当平均值是95%时:

(2)当平均值是99%时

有置信区间的:

当置信度为95%时,为(141.996,144.100),当置信度为99%时,为(141.657,144.439)说明置信度越大估计精度越差。

3、

文件名:DA TA09-03

文件说明:1969-1971年美国一家银行的474名雇员情况的调查数据,其中包括工资、受教育水平、工作经验、种族等数据。

变量说明:ID:Employee Code(雇员代码) GENDER:性别 BDATE:Date of Birth(出生日期)EDUC:Educational Level (years)(受教育年份) JOBCAT:Employment Category(工作地位)SALARY:Current Salary(当前工资) SALBEGIN:Beginning Salary(起始工资)JOBTIME:Months since Hire(雇佣月份) PREVEXP:Previous Experience (months)(以前工作经历) MINORITY:Minority Classification(特殊群体) AGE:年龄

A、请分别求出该银行中男雇员、女雇员工资平均值的95%的置信区间。

Case Processing Summary

Cases

Valid Missing Total

Gender N Percent N Percent N P ercent

Current

Salary

Female 216 100.0% 0 .0% 216 100.0%

Male 258 100.0% 0 .0% 258 100.0%

Descriptives

Gender Statistic S td. Error

Current

Salary

Female Mean $26,031.9

2

$514.26

95% Confidenc e Interval

Lower

Bound

$25,018.2

9

for Mean

Upper Bound $27,045.5

5

5% Trimmed

Mean $25,248.3

Median $24,300.0

Variance 57123688.

268

Std.

Deviation

$7,558.02

Minimum $15,750

M aximum $58,125

Range $42,375

Interquartil

e Range

$7,012.50

Skewness 1.863 .166

Kurtosis 4.641 .330

Male Mean $41,441.7

8

$1,213.97

95% Confidenc e Interval for Mean

Lower

Bound

$39,051.1

9

Upper Bound

$43,832.37

5% Trimmed Mean

$39,445.87

Median

$32,850.00

Variance

380219336.303

Std.

Deviation

$19,499.21

Minimum

$19,650

M aximum

$135,000

Range

$115,350

Interquartil e Range

$22,675.00

Skewness

1.639 .152

Kurtosis

2.780 .302

所以得女职工工资均值的置信度为95%的置信区间为:(25,018.29,27,045.55) 男职工工资均值的置信度为95%的置信区间为:(39,051.19,43,832.37) B 、请计算出男女平均工资差异的95%的置信区间,并对差异程度做出解释。

Group Statistics

Gender

N

Mean

Std. Deviation Std. Error Mean

Current Salary

Male

258 $41,441.78 $19,499.21 $1,213.97

Female

216 $26,031.92

$7,558.02 $514.26

Independent Samples Test

Levene's

Test for Equality of Variances

t-test for Equality of

Means

F

Sig.

t

df

Sig.

(2-tailed) Mean Difference Std. Error

Difference 95% Confidenc e Interval

of the Difference

Lower U pper

Current Salary

Equal variances assumed 119.669

.000

10.945

472

.000 $15,409.86

$1,407.91 $12,643.32 $18,176.4

Equal variances

not assumed

11.688

344.262

.000 $15,409.86

$1,318.40 $12,816.73 $18,003.0

由图的置信区间为: (12,643.32,12,816.73)

C 、请求出雇员当前工资与起始工资平均值的95%的置信区间。、

Paired Samples Statistics

Mean

N

Std. Deviation Std. Error Mean

Pair 1

Current Salary $34,419.57 474 $17,075.66 $784.31

Beginning Salary

$17,016.0

9 474 $7,870.64 $361.51

Paired Samples Correlations

N Correlation S ig.

Pair 1

Current

474

.880 .000

Salary & Beginning

Salary

Paired Samples Test

Paired Difference

s t df S ig.

(2-tailed)

Mean Std.

Deviation Std. Error

Mean

95%

Confidenc

e Interval

of the

Difference

Lower Upper

Pair 1

Current Salary - Beginning

Salary $17,403.4

8

$10,814.6

2

$496.73 $16,427.4

1

$18,379.5

6

35.036 473 .000

由结果的置信区间为:(16,427.41,18,379.56)

4、

文件名:DA TA10-04

文件说明:29名13岁男生的身高、体重、肺活量数据。

变量说明:no:编号;height: 身高; weight: 体重; vcp : 肺活量.

请求出身高大于等于155cm(≥155cm)与身高小于155cm(<155cm)的两组男生体重与肺活量平均值的95%的置信区间。

由图的置信区间为:对于体重来说为(3.3231,10.1288)

对于肺活量来说(0.07110,0.70534)

5、

文件名:DA TA11-03

文件说明:10位高血压患者在施以体育疗法前后测定舒张压的数据。

变量说明:number:编号pretreat:治疗前舒张压(mmHg) posttreat:治疗后舒张压(mmHg) 请求出治疗前与治疗后患者血压平均值差异的95%的置信区间。说明体育疗法对高血压有无治疗效果。

由t值为5.639不在区间(10.180,23.820)内,所以认为体育疗法对高血压有治疗效果。

6、

文件名:DA TA11-04

文件说明:经过严格挑选12名排球运动员用新训练方法进行训练,训练前后分别测试6项技术指标的数据。

变量说明:NUMBER:编号;BHAND:前手形控制;AHAND:后手形控制;BCFC1:前睁眼力控制;ACFC1:后睁眼力控制;BCFC2:前闭眼力控制;

ACFC2:后闭眼力控制;BACUR:前准确性;AACUR:后准确性;BFOCL:前左用力感;AFOCL:后左用力感;BFOCR:前右用力感;ADOCR:后右用力感

请计算出训练前后手形控制、睁眼力控制、闭眼力控制、准确性平均值差异95%的置信区间。对新训练方法的效果做出说明。

(1)

训练前后手形控制平均值差异95%的置信区间是(-1.5111,-0.7389)t=-6.413不在区间内所以认为新训练方法的有效果。

(2)

训练前后睁眼力控制平均值差异95%的置信区间是(-4.412,-1.421)t=-4.293在区间内所以认为新训练方法的无效果。

(3)

训练前后闭眼力控制平均值差异95%的置信区间是(-5.600,-3.400),t=-9.000不在区间内所以认为新训练方法的有效果。

(4)

训练前后准确性平均值差异95%的置信区间是(-6.099,-3.567),t=-8.403不在区间内所以认为新训练方法的有效果。

7、

文件名:DA TA18-27

文件说明:150名三岁女童身高数据。

请计算出身高在85cm-100cm之间的三岁女童所占的比例,第10%,30%,70%分位数。

Statistics

第10%,30%,70%分位数分别为:86.540,90.130,94.970。

Hight (cm)

Hight (cm)

Frequency Percent Valid Percent Cumulative Percent

Valid 80.1 1 .7 .7 .7

82.3

1 .7 .7 1.3

82.5

1 .7 .7 2.0

83.5

1 .7 .7 2.7

84.2

1 .7 .7 3.3

84.4

2 1.

3 1.3 4.7

84.5

2 1.

3 1.3 6.0

85.0

1 .7 .7 6.7

1 .7 .7 7.3 85.2

1 .7 .7 8.0 85.7

1 .7 .7 8.7 86.2

1 .7 .7 9.3 86.4

1 .7 .7 10.0 86.5

1 .7 .7 10.7 86.9

1 .7 .7 11.3 87.1

1 .7 .7 12.0 87.2

1 .7 .7 12.7 87.3

1 .7 .7 13.3 87.4

1 .7 .7 14.0 87.6

1 .7 .7 14.7 87.9

1 .7 .7 15.3 88.0

1 .7 .7 16.0 88.1

1 .7 .7 16.7 88.2

2 1.

3 1.3 18.0 88.4

1 .7 .7 18.7 88.5

1 .7 .7 19.3 88.7

1 .7 .7 20.0 88.9

2 1.

3 1.3 21.3 89.0

2 1.

3 1.3 22.7 89.1

1 .7 .7 23.3 89.2

3 2.0 2.0 25.3 89.3

1 .7 .7 26.0 89.4

1 .7 .7 26.7 89.7

1 .7 .7 27.3 89.8

3 2.0 2.0 29.3 90.0

1 .7 .7 30.0 90.1

1 .7 .7 30.7 90.2

2 1.

3 1.3 32.0 90.3

1 .7 .7 32.7 90.4

1 .7 .7 33.3 90.5

1 .7 .7 34.0 90.6

1 .7 .7 34.7 90.7

2 1.

3 1.3 36.0 90.8

3 2.0 2.0 38.0 91.1

1 .7 .7 38.7 91.3

1 .7 .7 39.3 91.4

3 2.0 2.0 41.3 91.7

1 .7 .7 42.0 91.8

1 .7 .7 42.7 91.9

1 .7 .7 43.3 92.1

1 .7 .7 44.0 92.3

1 .7 .7 44.7 92.4

2 1.

3 1.3 46.0 92.5

1 .7 .7 46.7 92.6

2 1.

3 1.3 48.0 92.7

3 2.0 2.0 50.0 92.8

2 1.

3 1.3 51.3 92.9

1 .7 .7 52.0 93.0

1 .7 .7 52.7 93.1

2 1.

3 1.3 54.0 93.2

1 .7 .7 54.7 93.3

1 .7 .7 55.3 93.4

1 .7 .7 56.0 93.5

3 2.0 2.0 58.0 93.6

1 .7 .7 58.7 93.7

1 .7 .7 59.3 93.8

1 .7 .7 60.0 93.9

1 .7 .7 60.7 94.0

1 .7 .7 61.3 94.2

3 2.0 2.0 63.3 94.3

3 2.0 2.0 65.3 94.4

1 .7 .7 66.0 94.5

1 .7 .7 66.7 94.6

2 1.

3 1.3 68.0 94.7

2 1.

3 1.3 69.3 94.8

1 .7 .7 70.0 94.9

1 .7 .7 70.7 95.0

4 2.7 2.7 73.3 95.1

1 .7 .7 74.0 95.5

2 1.

3 1.3 75.3 95.6

1 .7 .7 76.0 95.8

1 .7 .7 76.7 96.0

2 1.

3 1.3 78.0 96.2

1 .7 .7 78.7 96.3

1 .7 .7 79.3 96.4

1 .7 .7 80.0 96.5

1 .7 .7 80.7 96.6

1 .7 .7 81.3 96.7

1 .7 .7 82.0 96.8

2 1.

3 1.3 83.3 97.0

1 .7 .7 84.0 97.1

1 .7 .7 84.7 97.2

由表格的85cm的累积百分比为6.7%,100cm的累积百分比94.7%,所以身高在85cm-100cm之间的三岁女童所占的比例为94.7%-6.7%=88%。

第10%,30%,70%分位数分别为:86.540,90.130,94.970。

8、

文件名:University of Florida graduate salaries

文件说明:University of Florida毕业生的起始工资、专业的数据。

变量说明:graduate: 毕业生编号; gender: 性别; college: 所在学院;

salary: 起始工资; degree: 学位; graddate: 毕业时间.

A、请问各学院(④企业管理、⑦工程)(①农业学、⑤林业学)间毕业生工资平均值差异的95%的置信区间。

(1)

Group Statistics

Independent Samples Test

Sig=0.744〉0.025所以两者方差无差异。由于sig=0.000<0.025所以对于均值来说两者有差异。

企业管理、工程间毕业生工资平均值差异的95%的置信区间是(-6926.450,-6922.484)。

(2)

Group Statistics

Independent Samples Test

由于sig=0702〉0.025所以两者方差无差异,sig=0.380〉0.025,所以接受原假设,认为两者均值无差异。农业学、林业学间毕业生工资平均值差异的95%的置信区间(-5914.738,-50749.169)。

B、构造企业管理毕业生中男、女平均工资差异的95%的置信区间,并做出解释。

Group Statistics

Independent Samples Test

由于sig=0.854在区间(2.5%,97.5%)之间,所以两者方差无差异。Sig=0.000<0.025所以拒绝原假设,认为两者有明显差异。

男、女平均工资差异的95%的置信区间是(1433.850,3080.142)。

C、说明平均工资高的专业与低的专业之间的差距。

解:

由第(1)知均值最大的是工程类专业,均值最小的是林业学专业。所以比较两者既可。

Group Statistics

Independent Samples Test

由于sig=0.744〉0.25所以两者方差无差异,对于均值sig=0.000<0.025所以拒绝原假设,认为两者有差异。工程类专业的工资比林业学的最少高5199.181,最多高6926.450。

9

日本的管理人员和工人比美国的同行目的性更明确?为了对这个问题的一个方面进行研究,研究人员对日本和美国的中年企业经理进行了调查。从东京和大阪两地选出100名经理组成日本样本,而美国样本则由不得221名来自贝尔系统的管理人员组成。对每一名管理人员均进行萨尔诺夫(Sarnoff Survey of Attitudes Toward Life,SSATL)籍以测量向上流动的动力。SSA TL分数汇总于下表(较高分数代表较强的向上流动动力)。

美国管理人员日本管理人员

样本容量

平均SSA TL分数标准差211

65.75

11.07

100

79.83

6.41

(1)对美国和日本管理人员求平均SSA TL分数之差的95%置信区间。

统计学课程作业及答案

统计学作业2 单项选择题 第1题某地区有10万人口,共有80个医院。平均每个医院要服务1250人,这个指标是()。 A、平均指标 B、强度相对指标 C、总量指标 D、发展水平指标 答案:B 第2题某企业2002年工业总产值比1992年增长了3倍,则该公司1992-2002年间工业总产值平均增长速度为() A、11.61% B、14.87% C、13.43% D、16.65% 答案:A 第3题某工业企业的某种产品成本,第一季度是连续下降的。1月份产量750件,单位成本20元;2月份产量1000件,单位成本18元;3月份产量1500件,单位成本15元。则第一季度的平均成本为()。 A、17.67 B、17.54 C、17.08 D、16.83 答案:C 第4题已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应该采用()。 A、简单算术平均数 B、加权算术平均数 C、加权调和平均数 D、几何平均数

答案:C 第5题如果分配数列把频数换成频率,那么方差()。 A、不变 B、增大 C、减小 D、无法预期变化 答案:A 第6题某厂5年的销售收入如下:200万、220万、250万、300万、320万,则平均增长量为()。 A、120/5 B、120/4 C、320/200的开5次方 D、320/200的开4次方 答案:B 第7题直接反映总体规模大小的指标是()。 A、平均指标 B、相对指标 C、总量指标 D、变异指标 答案:C 第8题计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和()。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 答案:C 多项选择题

统计学作业完整版本

统计学论文错误

一、科研设计 1.论文题目:HO-1在阿尔兹海默病额叶及海马组织中的表达及对神经的保护作用 摘要:方法选择2012年7月至2013年12月该院收集的30例神经活检脑标本作为研究对象。结合病理诊断选择其中肯定的散发型AD病例记为AD组,共16 例,其余14例有中枢神经系统等病症且无明显脑病理变化者作为对照组。以免疫组化法以及免疫荧光染色法分别检测HO-1在额叶及海马组织中的表达,对比两组HO-1IHC阳性情况以及两组额叶及海马神经元中HO-1表达IA值水平。结论HO-1在AD疾病患者额叶及海马组织中均有表达,且可能是通过启动机体内源性的神经保护机制从而对大脑发挥一定的保护作用。 错误之处: 在科研设计中,病例与对照选择的基本原则是所调查的病例足以代表总体中该病的病例,对照足以代表产生病例的总体。 此调查选取了来源于某一所医院住院部的病例在一定时期内得神经活检标本作为病例。较易进行,省经费;但是带有选择性,容易产生选择偏倚,仅反映该机构的病人特点,而不是全人群该病的特点。 对照的选择关系到病例对照研究的成败。该实验从本医院的其他病人中选对照,即在选择病例的医院内选择有中枢神经系统等病症且无明显脑病理变化者作为对照组,但并未提及是何病种,也并知道该病种是否对研究阿尔兹海默病是否产生影响,病种以愈复杂愈好。这样比较方便,且这种对照的应答率和信息的质量均较高。 建议:

1.得出结论是可以给出范围,如某地区某医院HO-1在AD疾病患者额叶及海马组织中均有表达,且可能是通过启动机体内源性的神经保护机制从而对大脑发挥一定的保护作用。 2.可在方法中给出对照组疾病对研究并未产生统计学作用。 3.可以同时选取两种对照,即从一般人口中选择对照,又可以从住院病人中选择对照。研究结果一致,则能增强评价的依据。如结果不一致,则需分析其原因,可能有偏倚。 4.所选病例必须是患同一种疾病的病人,诊断标准、病例的年龄、性别、种族、职业等,选择时要有一个明确的规定。如本例可选取某排除标准将具有其他痴呆相关的神经系统疾病、抑郁症等排除入组等。 2.论文题目:补肾益智颗粒联合盐酸多奈哌齐片治疗阿尔兹海默病的临床疗效研究 摘要:目的:观察补肾益智颗粒联合盐酸多奈哌齐片治疗阿尔兹海默病的临床疗效。方法:选取2012年11月至2013年11月期间,在广西中医药大学第一附属医院脑病科及干部科门诊或住院治疗符合诊断标准的136例阿尔兹海默病患者,按就诊先后随机分为治疗组和对照组,每组各68例。对照组单用盐酸多奈哌齐片治疗,治疗组在对照组的基础上加用补肾益智颗粒治疗,4周为一疗程,共治疗24周。治疗前及治疗后采用临床总体印象量表(CGI)评价患者的整体情况,采用简易智能精神状态量表(MMSE)评价患者的认知功能及痴呆的严重程度,采用AD评定量表的认知次级量表(ADAS-Cog)评价患者认知功能及精神行为,采用日常生活能力量表(ADL)评价患者的日常生活自理能力,采用神经精神量表(NPI)评价患者的精神状态,采用中医证候评分评价患者症状、体征的变化。所有数据均采用SPSS17.0

统计学原理作业2答案(新)

《统计学原理》作业(二) (第四章) 一、判断题 1、总体单位总量和总体标志总量是固定不变的,不能互相变换。(×) 2、相对指标都是用无名数形式表现出来的。(×) 3、能计算总量指标的总体必须是有限总体。(×) 4、按人口平均的粮食产量是一个平均数。(×) 5、在特定条件下,加权算术平均数等于简单算术平均数。(√) 6、用总体部分数值与总体全部数值对比求得的相对指标。说明总体内部的组成状况,这个相对指标是比例相对指标。(×) 7、国民收入中积累额与消费额之比为1:3,这是一个比较相对指标。(×) 8、总量指标和平均指标反映了现象总体的规模和一般水平。但掩盖了总体各单位的差异情况,因此通过这两个指标不能全面认识总体的特征。(√) 9、用相对指标分子资料作权数计算平均数应采用加权算术平均法。(×) 10、标志变异指标数值越大,说明总体中各单位标志值的变异程度就越大,则平均指标的代表性就越小。(√) 二、单项选择 1、总量指标数值大小(A) A、随总体范围扩大而增大 B、随总体范围扩大而减小 C、随总体范围缩小而增大 D、与总体范围大小无关 2、直接反映总体规模大小的指标是(C) A、平均指标 B、相对指标 C、总量指标 D、变异指标 3、总量指标按其反映的时间状况不同可以分为(D) A、数量指标和质量指标 B、实物指标和价值指标 C、总体单位总量和总体标志总量 D、时期指标和时点指标 4、不同时点的指标数值(B) A、具有可加性 B、不具有可加性 C、可加或可减 D、都不对 5、由反映总体各单位数量特征的标志值汇总得出的指标是(B) A、总体单位总量 B、总体标志总量 C、质量指标 D、相对指标

统计学作业

统计学作业 Document number:WTWYT-WYWY-BTGTT-YTTYU-2018GT

《统计学》作业 适用层次:专科培养类型:经管类 专业班级:姓名:学号: 作业要求:作业可打印,答案要求手写;考试时交作业。 第三章综合指标 1、某厂按计划规定,第一季度的单位产品成本比去年同期降低10%,实际执行结果, 单位产品成本较去年同期降低8%。问该厂第一季度产品单位成本计划的完成程度如 何 2、某乡甲、乙两个村的粮食生产情况如下: 试分别计算甲、乙两个村的平均亩产。根据表列资料及计算结果,比较分析哪一个村 的生产经营管理工作做得好,并简述作出这一结论的理由。 3、甲、乙两单位工人的生产资料如下: 试分析:(1)哪个单位工人的生产水平高

(2)哪个单位工人的生产水平整齐 第四章时间数列 1、某企业2010年第一季度职工人数及产值资料如下: 要求:(1)计算第一季度的月平均劳动生产率。 (2)计算第一季度的劳动生产率。 2、某炼钢厂连续5年钢产量资料如下: 要求:(1)平均发展水平(2)平均增减量(3)平均发展速度(4)平均增减速度3、某企业2002~2008年的产品销售额资料如表所示。 要求:用最小平方法配合直线趋势方程,并预测2009年的趋势值。 第五章统计指数 1、试根据某企业三种产品总产值和产量动态的资料,计算三种产品产量总指数,以及由于产量增加使企业所增加的总产值。 2、某企业三种产品总产值、出厂价格增长速度资料如下表:

要求:计算出厂价格总指数和由于价格变化而增加的总产值; 3、某商场销售三种商品,销售量及销售价格如下: 要求用总量指标变动中的因素分析法,对销售额的变动作出分析。

统计学作业2

1、对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果如下: 成年组166 169 172 177 180 170 172 174 168 173 幼儿组68 69 68 70 71 73 72 73 74 75 (1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么? (2)比较分析哪一组的身高差异大? (1) 采用离散系数。因为它消除了不同组数据水平高地的影响( (2)标准差分别是: 成年组4.2019cm 幼儿组2.4967cm 过程,以成年组为例: 平均数:(166+169+172+177+180+170+172+174+168+173)/10=172.1 方差:[(166-172.1)平方+(169-172.1)平方+......+(173-172.1)平方]/10=17.7278161 方差再开方就是标准差 标准差系数(标准差/均值)分别是: 成年组0.024415 幼儿组0.035017 显然,幼儿组身高差异更大 2、一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量(单位:个): 方法A 方法B 方法C 164 129 125 167 130 126 168 129 126 165 130 127 170 131 126 165 130 128 164 129 127 168 127 126 164 128 127 162 128 127 163 127 125 166 128 126 167 128 116 166 125 126 165 132 125 (1)你准备采用什么方法来评价组装方法的优劣? (2)如果让你选择一种方法,你会作出怎样的选择?试说明理由。 (1)方法A组装优先理由是平均数较大,离散数较小,分布较为紧密,分析较方便,具有代表性。 (2)我肯定选第一种,单位时间的产量是后面2种的130%了,最小值也比后面的最大值高出很多,,很明显生产效率很高,作为老板必须选这个的,前提是产品质量必须一样

统计学上机作业

统计学第一次上机实验 一、上机项目名称:EXCEL、SPSS绘制统计图表 二、上机时间:2011年10月 13日,下午14:00—15:50 上机地点:基础楼综合实验室 三、上机目的、内容、步骤及结果 目的:掌握EXCEL、SPSS统计图表的基本操作 内容:教材29页4题EXCEL;30页6题SPSS 步骤及结果: ○1 29页4题EXCEL: 1、打开Nielsen的excel表格,并在相应位置输入TV Show、Millionaire、Frasier、Charmed、Chicago Hope、total、 frequency、relative frequency、percent frequency。 2、在Millionaire后的frequency中输入——函数——COUNTIF——range(所有的数组)——CRITERIE(C2)——确定,单元格中显示Millionaire的频数,并以此用此法求出Frasier、Charmed、Chicago Hope的频数。 3、在Millionaire后的relative frequency中输入=Millionaire 的frequency数值/50,得到Millionaire的相对频数。并依次据此求出Frasier,Charmed,Chicago Hope,total的相对频数。 4、在Millionaire后的umulative frequency中输入=Millionaire 的relative frequency数值*100,得到Millionaire的百分频数,并据此求出Frasier,Chicago Hope,Charmed的百分频率。

统计学上机作业(1)

统计学上机作业(1) 一、利用软件计算 1、 宾馆未露面者人数进行统计频数分析,分析结果对确定超员预定客房数有何帮助?(数据参见课件) 因而得出结论该宾馆可以增加订房数,以使得宾馆的到充分运用。 2、 文件名:DA TA11-02 文件说明:1973年某市测量120名12岁男孩身高资料。 变量说明:height: 12岁男孩身高 绘制身高分布的直方图,求出该市12岁男孩身高平均值95%和99%的置信区间,说明置信系数与区间宽度之间的关系。

(1)当平均值是95%时:

(2)当平均值是99%时

有置信区间的: 当置信度为95%时,为(141.996,144.100),当置信度为99%时,为(141.657,144.439)说明置信度越大估计精度越差。 3、 文件名:DA TA09-03 文件说明:1969-1971年美国一家银行的474名雇员情况的调查数据,其中包括工资、受教育水平、工作经验、种族等数据。 变量说明:ID:Employee Code(雇员代码) GENDER:性别 BDATE:Date of Birth(出生日期)EDUC:Educational Level (years)(受教育年份) JOBCAT:Employment Category(工作地位)SALARY:Current Salary(当前工资) SALBEGIN:Beginning Salary(起始工资)JOBTIME:Months since Hire(雇佣月份) PREVEXP:Previous Experience (months)(以前工作经历) MINORITY:Minority Classification(特殊群体) AGE:年龄 A、请分别求出该银行中男雇员、女雇员工资平均值的95%的置信区间。 Case Processing Summary Cases Valid Missing Total Gender N Percent N Percent N P ercent Current Salary Female 216 100.0% 0 .0% 216 100.0% Male 258 100.0% 0 .0% 258 100.0% Descriptives Gender Statistic S td. Error Current Salary Female Mean $26,031.9 2 $514.26 95% Confidenc e Interval Lower Bound $25,018.2 9

统计学作业及答案

作业 选择题 1.统计总体的特征是() A.大量性总体性数量性 B.总体性数量性变异性 C.同质性大量性变异性 D.数量性同质性变异性 2.变量是说明()特征的名称 A.总体 B.总体单位 C.总体单位量的 D.总体单位质的 3.下列中,属于定性变量的是() A.工人的年龄 B.工人的工资 C.工人的工种 D.工人的产品数量 4.某个个体的自然人在社会经济统计研究中,一般() A.只能作为总体 B.既能作为总体,也能作为总体单位 C.只能作为总体单位 D.以上都不能 5.下列中,属于定量变量的是() A.职工的性别 B.职工的籍贯 C.职工的受教育程度 D.职工的身高 简答题 1.如何区分描述统计和推断统计。 (1)描述统计:利用统计指标、统计表格、统计图形等,对现象总体的总量规模、结构比 例、发展速度等状况进行刻画,、陈述、表达,是事前统计; (2)推断统计就是充分利用有用信息,采用科学的概率理论,对未知的现象总体或事物的 未来进行有一定把握的估计和预测,属于事前统计。 2.试论大数定律在统计研究中的方法论意义。 (1)现象的某种总体规律只有当具有这些现象的足够多数的单位汇总综合在一起的时候, 才能显示出来。因此只有从大量现象的总体中,才能研究这些现象的规律性。 (2)现象的总体规律,通常是以平均数的形式表现出来。

(3)所研究的现象总体包含的单位愈多,平均数也就愈能够正确地反映出这些现象的规律 性。 (4)各单位的共同倾向(表现为主要的、基本的因素)决定着平均数的水平,而各单位对 平均数的离差(由次要的、偶然的因素所产生的影响),则由于足够多数单位的汇总综合结果,而相互抵消,趋于消失。通过平均化的结果以抵消偶然因素的个别影响,描述现象的典 型水平,并进一步推断总体的数量特征,这些都是在大数定律的作用下进行的。应该指出, 大数定律的作用是帮助我们通过偶然性达到发现的必然性,认识现象规律的表现形式的目 的,但它并不能说明现象的本质,这又须借助相关实质性学科的知识来解释现象的本质及其 内在联系。 3.一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。 (1)这一研究的总体是什么? 所有IT从业者 (2)月收入是分类变量、顺序变量还是定量变量?定量变量 (3)消费支付方式是分类变量、顺序变量还是定量变量?分类变量 (4)这一研究涉及截面数据还是时间序列数据?截面数据 4.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。 (1)这一研究的总体是什么?所有消费者 (2)“消费者在网上购物的原因”是分类变量、顺序变量还是定量变量?分类变量 (3)研究者所关心的参数是什么?消费者每月在网上购物的平均花费 (4)“消费者每月在网上购物的平均花费是200元”是参数还是统计量?参数 (5)研究者所使用的主要是描述统计方法还是推断统计方法?推断统计方法 选择题 1.抽样调查应遵循的原则是() A.准确性原则 B.可靠性原则 C.随机性原则 D.灵活性原则 2.统计分组时,在全距一定的情况下()

统计学作业完整版

广西工学院实验报告用纸 1、解:利用SPSS 进行描述分析分析,得表如下 信管091-092班的大一英语成绩 Statistics 信管091 信管092 N Valid 30 30 Missing 0 0 Mean 64.93333 74.96667 Median 66.5 76 Std. Deviation 14.51737 11.883 Variance 210.754 141.2057 由该表我们得到信管091的平均成绩为64.9,标准差为14.5; 信管092的平均成绩为74.96,标准差为11.9。 由此可看出信管092的英语成绩比信管091的英语成绩好。 2、解:1)、利用SPSS 进行描述分析分析,得表1如下: 表1 由表1可知,工作表现的平均值为8.0417,标准差方差为1.03056 — — 装 订 线 — —

专业水平的平均值为6.3750,标准差方差为1.36249 外语水平的平均值为5.0833,标准差方差为1.77252 由此可见,用人单位对该校毕业生工作表现方面最为满意。外语水平方面最不满意。应在外语水平方面作出教学改革。 措施:1、在入学前就针对性的对英语成绩进行筛选 2、入学后分班进行上课 3、加强对英语课程的教育 4、开展一些有关英语互动的活动 5、要求每个班每天早上用一定时间读英语 2)、由表1可知,工作表现的标准误差为0.14875,全距为4 专业水平的标准误差为0.19666,全距为5 外语水平的标准误差为0.25584,全距为7 由此可见,用人单位对该校毕业生外语水平方面的满意程度差别最大。 产生的原因是:从抽取的样本看来,学生的外语水平参差不齐,有的学生外语水平很高,而有的学生水平非常低,同时大多数学生的外语水平都较低。所以使得用人单位对该校毕业生外语水平方面的满意程度差别较大。 3)、利用SPSS进行,得表1、表2和表3如下: 商学院表1 Statistics 工作表现专业水平外语水平 N Valid 17 17 17 Missing 0 0 0

《统计学》作业(60题)

《统计学》课程习题(修订) 1.举例说明统计分组可以完成的任务。 2.举一个单向复合分组表的例子,再举一个双向复合分组表的例子。 3.某市拟对该市专业技术人员进行调查,想要通过调查来研究下列问题: (1)通过描述专业技术人员队伍的学历结构来反映队伍的整体质量;(2)研究专业技术人员总体的职称结构比例是否合理;(3)描述专业技术人员总体的年龄分布状况;(4)研究专业技术人员完成的科研成果数是否与其最后学历有关。 请回答: (1)该项调查研究的调查对象是; (2)该项调查研究的调查单位是; (3)该项调查研究的报告单位是; (4)为完成该项调查研究任务,对每一个调查单位应询问下列调查项目。 4 根据上表指出:(1)变量、变量值、上限、下限、次数(频数);(2)各组组距、组中值、频率。 5 注:年龄以岁为单位,小数部分按舍尾法处理。 6.对下列指标进行分类。(只写出字母标号即可) A手机拥有量B商品库存额C市场占有率D人口数 E 出生人口数 F 单位产品成本G人口出生率H利税额 (1)时期性总量指标有:;(2)时点性总量指标有:; (3)质量指标有:;(4)数量指标有:; (5)离散型变量有:;(6)连续型变量有:。 7.现有某地区50户居民的月人均可支配收入数据资料如下(单位:元):

886 928 999 946 950 864 1050 927 949 852 1027 928 978 816 1000 918 1040 854 1100 900 866 905 954 890 1006 926 900 999 886 1120 893 900 800 938 864 919 863 981 916 818 946 926 895 967 921 978 821 924 651 850 要求: (1)试根据上述资料作等距式分组,编制次(频)数分布和频率分布数列; (2)编制向上和向下累计频数、频率数列; (3)用频率分布列绘制直方图、折线图和向上、向下累计图; (4)根据图形说明居民月人均可支配收入分布的特征。 8.某商贸公司从产地收购一批水果,分等级的收购价格和收购金额如下表,试求这批 9.某厂长想研究星期一的产量是否低于其他几天,连续观察六个星期,所得星期一日产量为100、150、170、210、150、120,单位:吨。同期非星期一的产量整理后的资料为: 要求: (1)计算星期一的平均日产量、中位数、众数; (2)计算非星期一的平均日产量、中位数、众数; (3)比较星期一和非星期一产量的相对离散程度哪一个大一些。 10 要求:(1)比较两个单位工资水平高低;(2)说明哪一个单位的从业人员工资的变异程度较高。 11.根据下表绘制某地区劳动者年龄分布折线图(年龄以岁为单位,小数部分按舍尾法处理)。

统计学作业2答案

华南理工大学网络教育学院 《统计学原理》作业2选择题 1.统计分组时,若某标志值刚好等于相邻两组上下限数值时(B ) A.将此数值归入上限所在组 B.将此数值归入下限所在组 C.归入这两组中任意一组均可 D.另立一组 2.有200家公司每位职工的工资资料,如果要调查这200家区水泥总产量的80%的五个大型水泥厂的生产情况进行调查,这种调查方式是( D)。 A.普查B典型调查C抽样调查D重点调查 3.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为(C ) A.260B215C230D 185 4.当一组数据属于左偏分布时.则(D ) A.平均数、中位数与众数是合而为一的 B.众数在左边、平均数在右边 C.众数的数值较小,平均数的数值较大 D.众数在右边、平均数在左边 5.要通过移动平均法消除季节变动得到趋势值,则移动平均项数( B)A.应选择奇数 B.应和季节周期长度一致 C.应选择偶数

D.可取4或12 6.不重复抽样平均误差(B)。 A.总是大于重复抽样平均误差 B.总是小于重复抽样平均误差 C.总是等于重复抽样平均误差 D.以上情况都可能发生 《统计学原理》第1页(共页) 7.如果你的业务是销售运动衫,哪一种运动衫号码的度量对你更为有用CA.均值 B.中位数 C.众数 D.四分位数 8.某年末某地区城市人均居住面积为20平方米,标准差为8.4平方米,乡村人均居住面积为30平方米,标准差为11.6平方米,则该地区城市和乡村居民居住面积的离散程度B A.乡村较大 B.城市较大 C.城市和乡村一样 D.不能比较 9.重点调查的实施条件是B A.被调查的单位总数相当多 B.存在少数举足轻重的单位

统计学应用--上机作业

作业一:计算题 抽样调查某地区50户居民的人均可支配收入数据资料如下(单位:元): 886 928 999 946 950 864 1050 927 949 852 1027 928 978 816 1000 918 1040 854 1100 900 866 905 954 890 1006 926 900 999 886 1120 893 900 800 938 864 919 863 981 916 818 946 926 895 967 921 978 821 924 651 850 要求利用Excel: 1、试根据上述资料编制次(频)数分布和频率分布数列, 向上和向下累计频数、频率数列; 2、绘制频率直方图、折线图、曲线图和向上、向下累计 频率图; 3、根据图形说明居民月人均可支配收入分布的特征。 作业二: 根据上面的数据资料,要求 1、计算原始收入数据分布特征的各种描述性统计指标; 2、根据编制的频数分布数列,由组中值来计算反映数据 分布特征的各个指标,并观察与第1题所得到的计算结果

是否相同,为什么? 作业三: 根据EXCEL数据 1 2 3 4 5 6 2000 282 256 750 535 470 845 2001 310 486 740 544 449 786 2002 375 254 910 666 567 847 2003 408 403 1014 736 700 1304 2004 501 669 1211 995 881 1368 7 8 9 10 11 12 2000 302 395 1376 1473 673 727 2001 407 419 1232 892 607 611 2002 498 464 1333 807 614 536 2003 528 626 1457 895 886 1000 2004 718 810 1690 1124 957 782 要求分别用按月平均法和长期趋势剔除法求季节指数。 作业四: 1根据E xcel数据计算:1990-2003我国能源消费总量

统计学原理作业与答案(完整)

《统计学原理》作业(一) (第一~第三章) 一、判断题 1、社会经济统计工作的研究对象是社会经济现象总体的数量方面。(√) 2、统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查。( × ) 3、全面调查包括普查和统计报表。(× ) 4、统计分组的关键是确定组限和组距(×) 5、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。(×) 6、我国的人口普查每十年进行一次,因此它是一种连续性调查方法。(×) 7、对全国各大型钢铁生产基地的生产情况进行调查,以掌握全国钢铁生产的基本情况。这种调查属于非全面调查。(√) 8、对某市工程技术人员进行普查,该市工程技术人员的工资收入水平是数量标志。(√) 9、对我国主要粮食作物产区进行调查,以掌握全国主要粮食作物生长的基本情况,这种调查是重点调查。(√) 10、我国人口普查的总体单位和调查单位都是每一个人,而填报单位是户。(√) 二、单项选择题 1、设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是(C ) A、每个工业企业;B、670家工业企业;C、每一件产品;D、全部工业产品 2、某市工业企业2003年生产经营成果年报呈报时间规定在2004年1月31日,则调查期限为(B)。 A、一日 B、一个月 C、一年 D、一年零一个月 3、在全国人口普查中(B)。 A、男性是品质标志 B、人的年龄是变量 C、人口的平均寿命是数量标志 D、全国人口是统计指标 4、某机床厂要统计该企业的自动机床的产量和产值,上述两个变量是(D)。 A、二者均为离散变量 B、二者均为连续变量 C、前者为连续变量,后者为离散变量 D、前者为离散变量,后者为连续变量 5、下列调查中,调查单位与填报单位一致的是( D ) A、企业设备调查 B、人口普查 C、农村耕地调查 D、工业企业现状调查 6、抽样调查与重点调查的主要区别是(D)。 A、作用不同 B、组织方式不同 C、灵活程度不同 D、选取调查单位的方法不同 7、下列调查属于不连续调查的是(A)。 A、每月统计商品库存额 B、每旬统计产品产量 C、每月统计商品销售额 D、每季统计进出口贸易额 8、全面调查与非全面调查的划分是以( C ) A、时间是否连续来划分的 B、最后取得的资料是否完全来划分的 C、调查对象所包括的单位是否完全来划分的 D、调查组织规模的大小划分的 9、下列分组中哪个是按品质标志分组(B) A、企业按年生产能力分组B、产品按品种分组C、家庭按年收入水平分组D、人口按年龄分组三、多项选择题 1、总体单位是总体的基本组成单位,是标志的直接承担者。因此(A、D) A、在国营企业这个总体下,每个国营企业就是总体单位; B、在工业总产值这个总体下,单位总产值就是总体单位; C、在全国总人口这个总体下,一个省的总人口就是总体单位;

统计学作业

注:教师应使用计算机处理试题的文字、公式、图表等;学生应使用水笔或圆珠笔答题。

二.(30分) 以下是部分地区房地产开发投资和商品房销售的资料(单位:亿元)。试根据表2 的数据将各地区按房地产发展情况进行分类。并将分类结果应用到对表3的地区的判别分析中。 (注:请使用等级聚类的Ward离差平方和法进行分类,并使用距离判别法进行判别) 表2 部分地区房地产开发投资和商品房销售额 地区房地产开发投资完成额商品房销售额商品房销售中的住宅销售额 北京191.2 184.4 158.3 天津49.3 49.5 45.6 河北54.5 15.9 13.5 山西9.3 6.8 4.3 内蒙古 1 2.1 1.8 辽宁36.2 44.1 36.2 吉林0.2 2.2 1.8 黑龙江 2 7.2 5.9 上海236.7 316 278.6 江苏313.8 133.5 106.5 浙江259.7 78.8 59 安徽80.5 49 39.7 (2).福建90.2 61.9 50.2 江西43.2 16.8 13.5 山东136.8 74.1 62.8 河南49.5 24.2 21.6 表3 部分地区房地产开发投资和商品房销售资料 地区房地产开发投资完成额商品房销售额商品房销售中的住宅销售额 湖北65.8 32.5 28.6 湖南74.3 28 21.9 广东262.8 221.8 184.4 广西36.7 21.5 19 海南13 8.1 6.8

四. (20分) 表5 是研究消费者对购买牙膏偏好的调查数据。通过市场的拦截访问,用7级量表询问受访者对以下陈述的认同程度(1表示非常不同意,7表示非常同意)。试用主成分分析方法选择适当的因子,做最大方差旋转,并对旋转后的因子做出合理的解释。(要求所提因子的累计方差贡献率不低于75%) 1V :购买预防蛀牙的牙膏是重要的; 2V :我喜欢使牙齿亮泽的牙膏; 3V :牙膏应当保护牙龈; 4V :我喜欢使口气清新的牙膏; 5V :预防坏牙不是牙膏提供的一项重要利益;6V :购买牙膏时最重要的考虑是富有魅力的牙齿。 表5 牙膏属性评分 编号 1V 2V 3V 4V 5V 6V 编号 1V 2V 3V 4V 5V 6V 1 7 3 6 4 2 4 16 6 4 6 3 3 4 2 1 3 2 4 5 4 17 5 3 6 3 3 4 3 6 2 7 4 1 3 1 8 7 3 7 4 1 4 4 4 5 4 6 2 5 1 9 2 4 3 3 6 3 5 1 2 2 3 6 2 20 3 5 3 6 4 6 6 6 3 6 4 2 4 21 1 3 2 3 5 3 7 5 3 6 3 4 3 22 5 4 5 4 2 4 8 6 4 7 4 1 4 23 2 2 1 5 4 4 9 3 4 2 3 6 3 24 4 6 4 6 4 7 10 2 6 2 6 7 6 25 6 5 4 2 1 4 11 6 4 7 3 2 3 26 3 5 4 6 4 7 12 2 3 1 4 5 4 27 4 4 7 2 2 5 13 7 2 6 4 1 3 28 3 7 2 6 4 3 14 4 6 4 5 3 6 29 4 6 3 7 2 7 15 1 3 2 2 6 4 30 2 3 2 4 7 2 最终提取一个主成分,其方差贡献率已经达到了90.220% 根据成分矩阵中的值,可以计算得到特征向量矩阵的值,进而可以得到主成分的表达式为: Y 1=0.264X 1+0.277X 2+0.274X 3+0.236X 4 由于本题只有一个主成分,所以得到的Y 1和综合得分的数值是相等的。其中,Y 1代表提取出的一个主成分,X 1、X 2、X 3、X 4分别代表4个变量(资产总计、固定资产净值平均余额、产品销售收入、利润总额)。 代入X 1、X 2、X 3、X 4标准化后的数据,得到综合得分及排名如下: 行业名称 综合得分 排名 煤炭开采和选业 0.376268822 2 石油和天然气开采业 0.539515706 1 黑色金属矿采选业 0.044678775 4 有色金属矿采选业 0.050396198 3 非金属矿采选业 0.040045411 5 其它采矿业 9.50883E-05 6 根据综合得分大小可得:六个工业行业中,石油和天然气开采业的经济效益最好,其次是煤炭开采和选业,接着依次是有色金属、黑色金属、非金属和其他采矿业。 四.根据因子分析操作,得到以下关键结果: 由图可知:当满足题中条件累计方差贡献率不低于75%时,只需提取两个公共因子即可

大学《统计学》课后作业及答案

1.1什么是统计学? 统计学是一门研究随机现象,以推断为特征的方法论科学,“由部分推及全体”的思想贯穿于统计学的始终。具体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。用统计来认识事物的步骤是:研究设计—>抽样调查—>统计推断—>结论。这里,研究设计就是制定调查研究和实验研究的计划,抽样调查是搜集资料的过程,统计推断是分析资料的过程。显然统计的主要功能是推断,而推断的方法是一种不完全归纳法,因为是用部分资料来推断总体。 增加定义:是关于收集、整理、分析和解释统计数据的科学,是一门认识方法论性质的科学,其目的是探索数据内在的数量规律性,以达到对客观事物的科学认识。统计学是收集、分析、表述和解释数据的科学 1.2解释描述统计和推断统计 描述统计学(Descriptive Statistics)研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合概括与分析得出反映客观现象的规律性数量特征。内容包括统计数据的收集方法、数据的加工处理方法、数据的显示方法、数据分布特征的概括与分析方法等。 推断统计学(1nferential Statistics)则是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。 描述统计学和推断统计学的划分,一方面反映了统计方法发展的前后两个阶段,同时也反映了应用统计方法探索客观事物数量规律性的不同过程。 统计研究过程的起点是统计数据,终点是探索出客观现象内在的数量规律性。在这一过程中,如果搜集到的是总体数据(如普查数据),则经过描述统计之后就可以达到认识总体数量规律性的目的了;如果所获得的只是研究总体的一部分数据(样本数据),要找到总体的数量规律性,则必须应用概率论的理论并根据样本信息对总体进行科学的推断。 1.3 统计数据可分为哪几种类型?不同类型的统计数据各有什么特点? 1.分类数据:由定类尺度计量形成,表现为类别,通常用文字表述,但不区分顺序。 2.顺序数据:由定序尺度计量形成,表现为类别,通常用文字表述,但有顺序。 3.数值型数据:由定距尺度和定比尺度计量形成,说明的是现象的数量特征,通常用数值来表现。也称为定量数据或数量数据。数据类型的不同,可采用不同的统计方法来处理和分析。 1.4解释分类数据、顺序数据和数值型数据的含义。 分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果表现为类别,因而也称为定性数据或品质数据。 数值型数据说明的是现象的数量特征,通常是用数值来表现的,因而也可称为定量数据或数量数据. 1.5 举例说明总体、样本、参数、统计量、变量这几个概念。

统计学上机习题

统计学上机习题 1.打开“tab1.xls”工作簿,进行如下操作: (1)在“原始成绩”工作表的第1行前面插入一行,加上一个“2007~2008学年第 一学期商专10601班学生成绩一览表” 的标题。 (2)将序号“1”-“9”前面加“0”,变为“01”-“09”。 (3)将A9行底色添加为淡黄色。 (4)应用条件格式,将90分以上的成绩显示为兰色,将80~90分的成绩显示为 绿色,将60分以下的成绩显示为红色。 (5)在“原始成绩”工作表的最后加上5行,分别计算各门课程的最高分、最低 分、考试总分、平均分数和标准差,其中平均成绩和标准差要求保留两位小数。(注:可分别利用MAX()、MIN()、SUM()、A VERAGE()及STDEVP()函数) 求。) (6)另建一个工作表,取名为“汇总成绩”,在“汇总成绩”表中计算“原始成绩” 工作表中每个学生的成绩总分及平均成绩,其中平均成绩保留两位小数。 (注:跨工作表引用格式为:“=表名!单元格名称” ) (7)在“汇总成绩”工作表中按照平均成绩由高到低排名次,将名次结果记录在 增加的一列“名次”中。 (8)在“汇总成绩”工作表中,先将C列“姓名”复制到G列,然后在H列将平 均成绩60分以上的显示成“及格”,60分以下的显示成“不及格”;在I列将平均成绩60分以下、60-70分、70-80分、80-90分、90分以上的分别显示成“不及格”、“及格”、“中等”、“良好”及“优秀”。 (9)对“汇总成绩”工作表中的总分与平均分两列数据进行保护设置。然后对 “tab1.xls”进行打开权限和工作表修改权限的保护设置。 (10)按照统计表的一般规范化要求对“原始成绩”工作表进行格式设置,编制统 计报表,将该班同学的成绩打印出来。(要求熟悉字体、边框、行高、列宽、打印标题行及标题列等的设置。) 2.打开工作簿“tab2.xls”,按要求在工作表sheet1中完成下述工作: (1) 计算每位职工的实发工资(其中医疗保险、养老金、储蓄和其它扣款为扣除 款项),填入实发工资相应单元格中。 (2) 计算各项目的合计值,填入合计单元格中,并计算实发工资总额,填入相应 单元格中。

统计学作业

统计学作业 Final revision on November 26, 2020

第二章习题(离散程度指标) 1.[习题集P23第9题]某车间有两个小组,每组都是7人,每人日产量数如下:第一组:20、40、60、70、80、100、120;第二组:67、68、69、70、71、72、73。已知两组工人每人平均日产量件数为70件,试计算:(1)R;(2)A.D;(3)S.D,并比较哪个组的平均数代表性大? 要求:如计算过程有小数,请保留至小数点后两位,余均同。 试据此分别计算其平均日产量,并说明哪个班的平均日产量代表性大? 假定生产条件相同,试计算这两个品种的收获率(产量/播种面积),确定哪一品种具有较大的稳定性和推广价值。 注意:播种面积是“f”,而产量等于收获率乘以播种面积,因而是“xf”。 4.[习题集P25第15题]各标志值对任意数的方差为500,而这个任意数与标志值平均数之差为12,试确定标志值的方差(提示:方差是离差平方的平均数。本题中的500是标志值与任意数的方差,即所测度的离差发生在标志值与某一任意数之间,而所求的方差是标志值与均值之间的方差)。 第二章习题(平均指标)

试计算该局企业平均职工人数以及第20百分位数。 2.[习题集P21第3题]某乡播种2800亩早稻,其中35%的稻田使用良种,平均亩产750斤,其余的稻田平均亩产仅480斤。试问:(1)全部耕地早稻平均亩产是多少(2)早稻的全部产量是多少 试计算产品计划与实际的平均等级和平均出厂价格,指出两者间的经济联系(提示:可对产品等级进行赋值,尔后计算)。 根据该资料计算亩产的中位数和众数,并判断其分布态势。

应用统计学上机

工商管理学院 《应用统计学》 实验作业 班级 学号 姓名 上课教师 2017年11月

实验二建立数据文件 1.建立一个数据文件记录试录入以下数据,并按要求进行变量定义。 数据: 要求:将录入结果截图粘贴在作业题目答案处(变量视图和数据视图)。 (1)变量名同表格名,以“()”内的内容作为变量标签。对性别(Sex)设值标签“男=0;女=1”。 (2)正确设定变量类型。其中学号设为数值型;日期型统一用“mm/dd/yyyy“型号;生活费用货币型。 (3)变量值宽统一为10,身高与体重、生活费的小数位2,其余为0。 答案:1准备工作。打开SPAA 2选择变量视图,依次录入学号,姓名,性别等。

2.对大学生创业问题设计一份调查问卷。要求格式正确,题目类型包括开放题、封闭题(单选、多选都有)、半封闭题三种类型,题目个数10-15个。 答案: 3.用第2题得到的调查问卷进行模拟调查(10份),并将得到的结果录入到SPSS中,(1)将录入结果保存为xxx.sav文件,并将录入结果截图粘贴在作业题目答案处(变量视图和数据视图)。 答案:

实验三数据的整理 1. 某地区农科所为了研究该地区种植的两个小麦品种“中麦9号”、“豫展1号”产量的差异,从该地区的两个村庄各选5块田地,分别种植两个品种小麦,使用相同的田间管理,收获后,测得各个地块生产的小麦的千粒重(g)数据资料如表3-1所示。 表3-1 某地区小麦种植 要求: 量,并建立数据文件,完成分类汇总工作。 步骤:1.准备工作。打开3-1文件,通过文件--打开,将文件放入打开窗口。 2.选择数据---分类汇总。 3.打开分类汇总窗口,将小麦品种放入分组变量对话框中,将千粒重放入变量摘要对话

统计学上机作业

统计软件应用作业(3) ——方差分析作业 公管11 2111401025 潘烨烽 1、 抽查某地区三所小学五年级男学生的身高,数据见文件:“男生身高”。设各小学五年级男学生的身高服从同方差的正态分布。问该地区三所小学五年级男学生的平均身高是否有显著差异(α=0.05)?

P=.032<.05,有显著差异 2、 某钢厂检查一月上旬内的五天中生产钢锭重量,数据见文件:“钢锭重量”,设各日所生产的钢锭重量服从同方差的正态分布,试检验不同日期生产的钢锭的平均重量有无显著差异(α=0.05)?

Sig=0.034<0.05,所以样本方差不齐 P=.022<0.05,所以有显著性差异 3、 在某种橡胶的配方中,考虑了3种不同的促进剂,4种不同分量的氧化剂。各种配方各实验一次,测得300%定强数据见文件:“橡胶配方定强”。假定各种配方的定强服从同方差的正态分布。试问不同促进剂、不同分量氧化锌分别对定强有无显著影响(α=0.05)?

表中促进剂,氧化锌的sig=.000〈0.05,有显著性差异 4、 某灯泡厂用四种不同配料方案制成的灯丝,生产了四批灯泡。在每批灯泡中随机的抽取若干个灯泡测其使用寿命(单位:小时),数据见文件:“灯泡使用寿命”。试问对于这四种灯丝生产的灯泡,其使用寿命有无显著差异(α=0.05)。绘制均值散布图,说明那种配料方案最佳。

表1,sig=0.061〉0.05,所以样本方差齐 表2,p=0.209〈0.05,所以对四种灯丝生产的灯泡,使用寿命无显著差异 由图可知,配料方案1最佳 5、 用四种饲料喂猪,共19头猪分成四组,每组用一种饲料,一段时间后称重。猪体重增加数据见文件DATA12-01,试比较这四种饲料对猪体重增加的作用有无显著差异(α=0.05)。通过均值多重比较,说明那种饲料最合适。

相关主题
相关文档
最新文档