统计学原理期末复习练习题附答案

统计学原理期末复习练习题附答案
统计学原理期末复习练习题附答案

1.统计总论练习

单项选择题

1.对某市工业生产设备情况进行统计研究,这时,总体单位是该市( 4 )①每一个工业企业②每一台设备③每一台生产设备④每一台工业生产设备

2.几位工人的工资分别是100元、120元、150元、200元这几个数字是(3 )

①指标②变量③变量值④标志

3.标志是( 3 )

①总体的特征②总体的数量特征③总体单位的属性或特征的名称④总体单位的数量特征

多项选择题

在全国人口普查中(235 )

①全国所有人口数是总体②每一个人是总体单位③人的年龄是变量④某人的性别为“女性”是一个品质标志

⑤全部男性人口的平均寿命是统计指标

2.统计调查练习

一、单项选择题

1、统计调查方案中调查期限是指_1____。

①调查工作的起迄时间②搜集资料的时间③时期现象资料所属的时间④时点现象资料所属的时间

2、重点调查中的重点单位是指___4__。

①这些单位是工作的重点②这些单位举足轻重

③这些单位数量占总体全部单位的比重很大

④这些单位的标志总量在总体标志总量中占较大比重

3、研究某型号炮弹的平均杀伤力,可以采用__4___。

①重点调查②普查③典型调查④抽样调查

4、对某地食品物价进行一次全面调查,调查单位是__4__。

①该地区所有经营食品的商店②每一个经营食品的商店③全部零售食品④每一种零售食品

二、多项选择题

1、抽样调查和重点调查的主要区别有_24____。

①抽选调查单位的多少不同②抽选调查单位的方式方法不同③调查的组织形式不同

④在对调查资料使用时,所发挥的作用不同⑤原始资料的来源不同

2、第四次全国人口普查的标准时点是1990年7月1日零点,下列人员不应计入人口总数之中_135____。

①1990年7月1日23时出生的人口

②1990年7月10日死亡的人口

③1990年6月25日出生,30日23时死亡的人口④1990年6月29日出生,7月2日死亡的人口

⑤1990年6月30日零点死亡的人口

3、以系统为单位调查某市全部商业状况,调查对象是__34___。

①该市全部商品销售额②该市商业企业的总和③该市各商业系统商业状况总和④该市所有商业系统商业状况总和

3.统计整理练习单项选择题

1.一个分配数列的构成要素有_4___。

①分组标志和指标②数量分组标志值和频数③品质分组标志和频数④分组标志及次数

2.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为__1___。

①230 ②560 ③185 ④515

3.有20名工人看管机器台数资料如下:3,5,4,6,5,2,3,4,4,3,4,2,3,5,4,4,5,3,3,4,按上述资料编制变量数列应采用___1___。

①单项分组②组距分组③等距分组④异距分组

4.组距数列中影响各组次数分布的要素是_2_____。

①组中值②组距和组数③全距④总体单位数

多项选择题

1.对离散型变量分组_12345____。

①可按每个变量值分别列组②也可采用组距分组③相邻组的组限可以不重④各组组距可相等也可不等

⑤要按“上组限不在本组内”的原则处理与上组限相同的变量值

2.统计分组的作用是_134____。

①反映总体的内部结构②比较现象间的一般水平③区分事物的性质④研究现象之间的依存关系

⑤分析现象的变化关系

判断:将某市500家工厂按产值多少分组而形

成的变量数列,其次数是各厂的产值数。

4.综合指标练习

一、单项选择题

1.平均指标将总体内各单位数量差异(a )

a.抽象化

b.具体化

c.一般化

d.形象化

2. 加权算术平均方法中的权数为( d )

a.标志值

b.标志总量

c.次数之和

d.单位数比重

3. 某公司有十个下属企业,现已知每个企业的产值计划完成百分比和实际产值资料,计算该公司平均产值计划完成程度时,所采用的权数应该是(c )

a.企业数

b.工人数

c.实际产值

d.计划产值

4. 计算平均比率最适宜的平均数是(c )

a.算术平均数

b.调和平均数

c.几何平均数

d.位置平均数

5. 受极端数值影响最小的平均数是( d )

a.算术平均数

b.调和平均数

c.几何平均数

d.位置平均数

6. 由组距数列确定众数时,如果众数组相邻两组的次数

相等,则

( b ) a.众数为零 b.众数组的组中值就是众数

c.众数不能确定

d.众数组的组限就是众数

7.已知甲数列的平均数为100,标准差为;乙数列的平均数为,标准差为。由此可断言( a )

a.甲数列平均数的代表性好于乙数列

b.乙数列平均数的代表性好于甲数列

c.两数列平均数的代表性相同

d.两数列平均数的代表性无法比较 二、多项选择题

1. 加权算术平均数的大小受下列因素的影响(abe ) a.各组标志值大小的影响 b.各组次数多少的影响 c.与各组标志值大小无关 d.与各组次数多少无关

e.各组标志值和次数共同影响

2.标准差与标准差系数的主要区别在于( ade )

a.指标表现形式不同

b.作用不同

c.与平均数的关系不同

d.适用条件不同

e.计算方法不同

计算题:

1、某企业2006年产量计划完成110%,2006年产量计划比2005年增长8%,则产量2006年同2005年比较增长的百分数。

a 1 /a 0 =a n /a 0 × a 1 /a n =108%×110%=% 增长了% 2、某企业生产一种出口产品,计划出口量比上期增长15%,因经济危机,实际比计划少完成8%,实际比上期:(1) (1)增长% (2)增长7%

(3)减少8% (4)减少7% 3、苹果 单价 购买量 总金额 品种 (元)(公斤) (元) 红富士 2 3 6 青香蕉 5 9

【例】某年级一、二两班某门课的平均成绩分别为82分和76分,其成绩的标准差分别为分和分,比较两班平均成绩代表性的大小。

一班成绩的标准差系数为: 二班成绩的标准差系数为:

所以一班平均成绩的代表性比二班大。

【例】某次歌唱比赛,共有9位评委,其中歌手A 和歌手

手B 进行排名。 2.通常情况下,评委对歌手的最终评分是去掉得分中的一个最高分和一个最低分。然后再取平均数作为其最终得分。你认为这种做法是否合理。

两个歌手的众数:歌手A 的众数有两个,一个是,一个,

而歌手B 的众数是,仅从众数无法判断得分高低。但从得分分布偏态看,歌手A 的得分略集中于大于分的部分,而歌手B 的得分略集中于低于分的部分

两个歌手的算术平均数:歌手A 、歌手B 均是, 两个歌手得分的标准差:歌手A 是,歌手B 是, B >A

两个歌手的中位数:歌手A 是,歌手B 是, A > B

如果去掉得分中的一个最高分和一个最低分,然后再取平均数,歌手A 是,歌手B 是,这与采用众数和中位数所得的结论是一致的。

第五章一、单项选择题

1、将某一项指标在不同时间上的数值,按其时间先后顺序排列成的数列,称为( )

A.分配数列

B.次数分布

C.变量数列

D.动态数列

2、用来进行比较的基础时期的发展水平称为( )

A.报告期水平

B.中间水平

C.基期水平

D.最末水平

3、定基增长速度等于各个相应的( )

A.环比增长速度的连乘积减 1

B.环比发展速度的总和减1

C.环比增长速度的总和

D.环比发展速度的连乘积减1 4、某高等学校在校生人数近三年逐年增加,1999年比1998年增长25%,1998年比1997年增长10%,1997年比1996年增长7%,则1997-1999年学生人数增长速度应用( )式计算

A 、7%×10%×25%

B 、7%+10%+25%

C 、107%×110%×125%-100%

D 、107%×110%×125% 5、一时间数列有20年的数据,现用移动平均法对原时间数列进行修匀。若用5年移动平均,修匀后的时间数列有( )年的数据。( )

.16 C

6、用最小平方法配合趋势方程的基本前提是( ) 。

A. 趋势值与观测值离差之和为零

B. 趋势值与观测值离差平方和为零 ( )

B.某工厂各月的利润额

C.某地区2000-2005年的各年平均人口数

D.某商店各月月末的商品库存额

E.某企业2000-2005年年末固定资产净值

875.15358.132=+?+?=x 875.18.19

2696=++=x ﹪

﹪﹪02.19100826

.151001

11=?=?=X V σσ﹪

﹪﹪47.19100768.141002

22=?=?=X V σσ

2.已知一个数列各期的环比发展速度、逐期增长量和观察值个数,可以直接求出数列( )

A.平均发展速度

B.序时平均数

C.定基增长

速度 D.平均增长量 E.累计增长量

3.定基增长速度等于( )

A.定基发展速度减1

B.相应的各个环比发展速度的连乘积

C.相应的各个环比增长速度的连乘积

D.相应的各个环比增长速度加1后的连乘再减1

E.累积增长量除以固定时期水平

4.序时平均数与一般平均数不同,它( )

A.根据动态数列计算

B.根据变量数列计算

C.只能根据绝对数动态数列计算

D.说明现象在不同时期的一般水平

E.说明总体某个数量标志的一般水平

1、某企业职工人数资料如下: (单位:人)

计算该企业上半年和第二季度平均职工人数

2、某企业2000年产值300万元,计划今后产值每年平均

递增10%,到2005年产值应为多少若计划到2005年产值

达到483万元,问平均每年递增多少若已知2000年产值为

300万元,计划每年平均递增10%,问几年后才能达到483

万元

1、检查产量发展趋势是否接近于直线型

2、如果是直线型,用最小平方法配合直线趋势方程。

3、预测第12年的产量

第六章

1.数量指标综合指数公式是__4___。

2、按照个体价格指数和报告期销售额计算的价格指数是

_____。

①综合指数②平均指标指数③加权算术平均数指

数④加权调和平均数指数

3、同度量因素的作用是_____。

①同度量作用②比较作用③平衡作用④

权数作用⑤稳定作用

4、总指数中可以包括_____。

①质量指标指数②数量指标指数③算术平均数指数

④调和平均数指数⑤综合指数

5、下列属于质量指标指数的有_____。

①产量指数②价格指数③职工人数指数④销售

额指数⑤单位成本指数

公式的经济意义为

①综合反映价格变动的绝对额

②综合反映价格变化而引起的销售额变动的绝对额

③反映价格变化而使消费者多付(或少付)的货币额

④反映销售量变化而引起的销售额变化的绝对额

1.某商场三种商品的价格和销售量资料如下表所示:

要求计算:①三种商品的个体价格指数;

②三种商品的个体销售量指数;

③三种商品的价格总指数;

④三种商品的销售量总指数;

⑤三种商品的销售额总指数。

⑥利用指数体系从绝对数相对数两方面对销售额变动

进行因素分析

2、有三种产品的生产资料如下:

要求:计算三种产品产量总指数,并分析由于三种产品产

量的变动对生产费用的影响。

3、有三种产品的生产资料如下:

要求:计算三种产品单位成本总指数,并分析由于

三种产品单位成本的变动对生产费用的影响。

4,某地2006年社会商品零售额为400万元,零售额总指数为105%,如果剔除物价变动的因素影响,实际增长2%。计算:由于价格变动和销售量变动对零售额的绝对影响量。

第七章选择题

1 抽样平均误差是指抽样平均数(抽样成数)的——

A 平均数

B 平均差

C 标准差 D标准差系数

2 在总体方差一定的前提下,下列抽样平均误差最小的是

——

A 抽样单位数为20

B 为40

C 为90

D 为100

3 在其他条件不变的情况下,抽样极限误差的大小与概率

保证程度的关系是——

A 允许误差范围越小,概率保证程度越大

B……越小,……越小 C ……越大,……越大

D 成正比关系

E 成反比关系

4 在抽样推断中,样本的容量——

A 越少越好

B 越多越好

C 取决于统一的抽样比例

D 取决于对抽样推断可靠性的要求

5 抽样平均误差的大小取决于——

A 有限总体,无限总体

B 重复抽样,不重复抽样

C 样本单位数大小n

D 全及总体标志变异程度

【例A】某企业生产某种产品的工人有1000人,某日采

用不重复抽样从中随机抽取100人调查他们的当日产量,

要求在95﹪的概率保证程度下,估计该厂全部工人的日平

均产量和日总产量。

100名工人的日产量分组资料

△x = tμx =×=(件)

则该企业工人人均产量及日总产量的置信区间为:

【例B】若例A中工人日产量在118件以上者为完成生产

定额任务,要求在95﹪的概率保证程度下,估计该厂全部

工人中完成定额的工人比重及完成定额的工人总数。

则该企业全部工人中完成定额的工人比重及完成定额的工

人总数的置信区间为:

()

()

()件

47

.6

99

4144

1

126

100

12600

2

=

=

-

-

=

=

=

=

f

f

x

x

s

f

xf

x

1

2

2

?

?

?

?

?

-

=

N

n

n

s

x

μ

()()

203

.1

126

1000

203

.1

126

1000

,

203

.1

126

203

.1

126

+

-

+

-

X

N

X

()

0568

.0

029

.0

96

.1

029

.0

1000

100

1

1

100

1.0

9.0

1

1

1

,9.0

100

90

,

96

.1

,

10

,

90

,

100

,

1000

1

1

=

?

=

?

=

?

=

?

?

?

?

?

-

-

?

=

?

?

?

?

?

-

-

-

=

=

=

=

=

=

=

=

=

p

p

p

t

N

n

n

p

p

n

n

p

t

n

n

n

N

μ

μ

己知

()()

0568

.0

9.0

1000

0568

.0

9.0

1000

,

0568

.0

9.0

0568

.0

9.0

+

-

+

-

NP

P

医学统计学名词解释及问答题

1、总体(population):是根据研究目的确定的同质研究对象的全体。 2、样本(sample):从总体中抽取的一部分有代表性的个体。 3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。 4、变异(variation):指同质个体的某项指标之间的差异。 5、参数(parameter):反映总体特征的指标称为参数。 6、统计量(statistic):通过样本资料计算出来的相应指标称为统计量。 7、抽样误差(sampling error):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。 8、概率(probability):某事件发生的可能性大小。 9、正态分布(normal distribution):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。 10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标。 11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。 12、医学参考值范围(medical reference range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。 13、方差(variance):是各个数据与平均数之差的平方的平均数。 14、标准差(standard deviation):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。 15、标准误(standard error):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。 16、均数的抽样误差(sampling error of mean):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。 17、假设检验(hypothesis testing):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。 18、统计推断(statistical inference):是根据已知的样本信息来推断未知的总体,是统计分析的目的,包括参数估计和假设检验。 19、Ⅰ型错误(type Ⅰ error):拒绝了实际上成立的H0,这类弃真错误,发生的概率为α,为已知。 20、Ⅱ型错误(type Ⅱ error):不拒绝实际上不成立的H0,这类存伪错误,发生的概率为β,未知。 21、检验效能(power of test):又称把握度,为1-β,其意义是两总体确有差别,按α水准能发现它们有差别的能力。 22、可信区间(confidence interval):指总体参数可能所在的范围。 23、率(rate):说明某现象发生的频率或强度。 24、构成比(constituent ratio):表示某事物内部各组成部分所占的比重或分布,常以百分数表示。 25、相对比(relative ratio):表示两个有关事物指标之比,常以百分数和倍数表示,用以说明一个指标是另一个指标的几倍或百分之几。 26、标准化率(standardized rate):亦称调整率,是采用统一的标准对内部构成不同的各组频率进行调整和对比的方法。 27、参数检验(parametric test):一类依赖于总体分布的具体形式的统计推断方法。 28、非参数检验(non parametric test):一类不依赖总体分布类型的检验,在应用中可以不考虑被研究对象为何种分布以及分布是否已知,检验假设中没有包括总体参数的统计方法。

医学统计学 名词解释+问答题-1

医学统计学 1、应用相对数时应注意的事项 ①计算相对数时分母不能太小; ②分析时不能以构成比代替率; ③当各分组的观察单位数不等时,总率(平均率)的计算不能直接将各分组的率相加求其平均; ④对比时应注意资料的可比性:两个率要在相同的条件下进行,即要求研究方法相同、研究对象同质、观察时间相等以及地区、民族、年龄、性别等客观条件一致,其他影响因素在各组的内部构成应相近; ⑤进行假设检验时,要遵循随机抽样原则,以进行差别的显著性检验。 2、正态分布的特点及其应用 性质:①两头低中间高,略呈钟形; ②只有一个高峰,在X=μ,总体中位数亦为μ; ③以均数为中心,左右对称; ④μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动; σ为变异度参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高; ⑤对于任何服从正态分布N(μ,σ2)的随机变量X作的线性变换,都会变换成u 服从于均数为0,方差为1的正态分布,即标准正态分布。 应用:①概括估计变量值的频数分布; ②制定参考值范围; ③质量控制; ④是许多统计方法的理论基础。 3、确定参考值范围的一般原则和步骤、方法 一般原则和步骤:①抽取足够例数的正常人样本作为观察对象; ②对选定的正常人进行准确而统一的测定,以控制系统误差; ③判断是否需要分组测定; ④决定取单侧范围值还是双侧范围值; ⑤选定适当的百分范围; ⑥选用适当的计算方法来确定或估计界值。 方法:①正态分布法:②百分位数法(偏态分布) 4、总体均数的可信区间与参考值范围的区别 概念:可信区间是按预先给定的概率来确定的未知参数μ的可能范围。 参考值范围是绝大多数正常人的某指标范围。所谓正常人,是指排除了影响所研究指标的疾病和有关因素的人;所谓绝大多数,是指范围,习惯上指正常人的95%。 计算公式:可信区间① ② ③ 参考值范围①正态分布 ②偏态分布 用途:可信区间用于总体均数的区间估计 参考值范围用于表示绝大多数观察对象某项指标的分布范围

2014统计学课后复习题答案

《应用统计学》习题解答 第一章绪论 【1.1】指出下列变量的类型: (1)汽车销售量; (2)产品等级; (3)到某地出差乘坐的交通工具(汽车、轮船、飞机); (4)年龄; (5)性别; (6)对某种社会现象的看法(赞成、中立、反对)。 【解】(1)数值型变量 (2)顺序变量 (3)分类变量 (4)数值型变量 (5)分类变量 (6)顺序变量 【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。 要求: (1)描述总体和样本。 (2)指出参数和统计量。 (3)这里涉及到的统计指标是什么? 【解】(1)总体:某大学所有的大学生 样本:从某大学抽取的200名大学生 (2)参数:某大学大学生的月平均消费水平 统计量:从某大学抽取的200名大学生的月平均消费水平 (3)200名大学生的总消费,平均消费水平 【1.3】下面是社会经济生活中常用的统计指标: ①轿车生产总量,②旅游收入,③经济发展速度,④人口出生率,⑤安置再就业人数,⑥全国第三产业发展速度,⑦城镇居民人均可支配收入,⑧恩格尔系数。 在这些指标中,哪些是数量指标,哪些是质量指标?如何区分质量指标与数量指标?【解】数量指标有:①、②、⑤ 质量指标有:③、④、⑥、⑦、⑧ 数量指标是说明事物的总规模、总水平或工作总量的指标,表现为绝对数的形式,并附有计量单位。而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标,通常是两个有联系的统计指标对比的结果。 【1.4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查,其中60%的居民对自己的居住环境表示满意,70%的居民回答他们的月收入在6000元以下,生活压力大。 回答以下问题: (1)这一研究的总体是什么? (2)月收入是分类变量、顺序变量还是数值型变量? (3)对居住环境的满意程度是什么变量? 【解】(1)这一研究的总体是某小区的所有居民。

统计学原理计算题及答案

2 ?采用简单重复抽样的方法从一批零件中抽取 200件进行检查,其中合格品 188件。要求: (1) 计算该批零件合格率的抽样平均误差; (2) 按95.45%的可靠程度(t=2,就是我们现在的Z )对该批零件的合格率作出区间估计。 解:n =200,n =188 (1)合格率 = 1?^ = 94% n 200 合格率的抽样平均误差 p(1 — p) 「0.94 x 0.06 J0.0564 . ---------- 0.000282 = 0.01679 = 1.679%(2)按95.45%的可靠程度对该批零件的 p i n , 200 \ 200 合格率作出区间估计 二Z 」p =2 1.68% =3.36% p - :p =94% -3.36% =90.64% p :P =94% 3.36% =97.36% 该批零件合格率区间为: 990.64%乞P 乞97.36% 要求: (1) 试计算各年的环比发展速度及年平均增长量。 (2) 如果从2006年起该地区的粮食生产以 10%的增长速度发展,预计到 2010年该地区的粮食产量将达到什么水平? 2006年起该地区的粮食生产以 10%的增长速度发展 x =1 10% =110% 71 预计到2010年该地区的粮食产量将达到 解: (1) 各年的环比发展速度 472 二 108.76% a 0 434 a 2 516 109.32 % 472 a g 584 a 2 516 = 113.18% 618 =105.82% a 4 年平均增长量 累计增长量 累计增长个数 …=618一434」84=46 4 4 4 (2)如果从

统计学课后习题答案(Chap1.2)

第1章绪论 1.什么是统计学怎样理解统计学与统计数据的关系 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表;

统计学原理计算题试题及答案

电大专科统计学原理计算题试题及答案 计算题 1.某单位40名职工业务考核成绩分别为: 68 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60─70分为及格,70─80分为中,80─90 分为良,90─100分为优。 要求: (1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并 编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)分析本单位职工业务考核情况。 解:(1) (2)分组标志为"成绩",其类型为"数量标志";分组方法为:变量分组中 的开放组距式分组,组限表示方法是重叠组限; (3)本单位的职工考核成绩的分布呈两头小, 中间大的" 正态分布"的形态, 说明大多数职工对业务知识的掌握达到了该单位的要求。 2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下

试问哪一个市场农产品的平均价格较高?并说明原因。 解: 解:先分别计算两个市场的平均价格如下: 甲市场平均价格()375.145 .5/==∑∑=x m m X (元/斤) 乙市场平均价格325.14 3 .5==∑∑= f xf X (元/斤) 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场 平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同。 3.某车间有甲、乙两个生产组,甲组平均每个工人的日产量为36件, 标准差为9.6件;乙组工人日产量资料如下: 要求:⑴计算乙组平均每个工人的日产量和标准差; ⑵比较甲、乙两生产小组哪个组的日产量更有代表性? 解:(1)

医学统计学简答题

医学统计学简答题 1.简述标准差、标准误的区别与联系? 区别:(1)含义不同:标准差S表示观察值的变异程度,描述个体变量值(x)之间的变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。标准误..估计均数的抽样误差的大小,是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。 (2)与n的关系不同: n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。 (3)用途不同:标准差表示x的变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间和假设检验。 联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。 2.简述假设检验的基本步骤。 1.建立假设,确定检验水准。 2.选择适当的假设检验方法,计算相应的检验统计量。 3.确定P值,下结论 3.正态分布的特点和应用:? 特点:?1、集中性:正态曲线的高峰位于正中央,即均数所在的位置;? 2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交; 3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降;?

4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平; ?5、u变换:为了便于描述和应用,常将正态变量作数据转换;?? 应用:?1.估计医学参考值范围?2.质量控制?3.正态分布是许多统计方法的理论基础 4.简述参考值范围与均数的可信区间的区别和联系 可信区间与参考值范围的意义、计算公式和用途均不同。 ?1.从意义来看?95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指?95%可信度估计的总体均数的所在范围? 2.从计算公式看?若指标服从正态分布,95%参考值范围的公式是:±1.96s。?总体均数95%可信区间的公式是:??前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。 5.频数表的用途和基本步骤。 用途:(1)揭示资料的分布特征和分布类型;(2)便于进一步计算指标和分析处理;(3)便于发现某些特大或特小可疑值。 基本步骤:(1)求出极差;(2)确定组段,一般设8~15个组段;(3)确定组距;组距=R/组段数,但一般取一方便计算的数字;(4)列出各个组段并确定每一组段频数。 6.非参数统计检验的适用条件。 (1)资料不符合参数统计法的应用条件(总体为正态分布、且方差相等)或总体分布类型未知;(2)等级资料;(3)分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件;(4)在资料满足参数检验的要求时,应首选参数法,以免降低检验效能 7.线性回归的主要用途。

【缩印整理版】医学统计学名词解释及问答题

统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。 总体(population):大同小异的研究对象全体。更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。 样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。样本应该具有代表性,能反映总体的特征。利用样本信息可以对总体特征进行推断。 抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。可用标准误描述其大小。 标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。样本均数的标准差称为均数的标准误。均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数 区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。 参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常 置信区间揭示的是按一定置信度估计总体参数所在的范围。t分布法、正态分布法(标准误)、二项分布法。置信区间估计总体参数所在范围 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidence interval,CI)。它的确切含义是:可信区间包含总体参数的可 能性是1- α ,而不是总体参数落在该范围的可能性为1-α 。 参数统计(parametric statistics) 非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。 变异(variation):对于同质的各观察单位,其某变量值之间的差异 同质(homogeneity):研究对象具有的相同的状况或属性等共性。 回归系数有单位,而相关系数无单位 β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。 线性相关系数(linear correlation coefficient):又称Pearson积差相关系数(Pearson product moment coefficient),是定量描述两个变量间线性关系的密切程度与相关方向的统计指标。 参数(parameter):描述总体特征的统计指标。 统计量(statistic):描述样本特征的统计指标。实验设计的基本原则 对照 (control) 对受试对象不施加处理因素的状态。在确定接受处理因素的实验组时,要同时设立对照组 重复 (replication)相同实验条件下进行多次实验或多次观察。整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。作用是估计变异大小和降低变异 随机化(randomization) 采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组和对照组。 I类错误(假阳性错误)真实情况为H0是成立的,但检验结果为H0不成立,这样的错误称为I类错误。其发生的概率用α表示。在假设检验中作为检验水准。一般取0.05或0.01。 II类错误(假阴性错误)真实情况为H1是成立的,但检验结果为H1不成立,这样的错误称为II类错误。其发生的概率用β表示。由于其取值取决于H1 ,因此在假设检验中无法确定。 变异指标是用于描述一组观察值围绕中心位置散布的范围,即描述离散趋势的统计指标。数值越大,说明数据越离散,反之越集中。极差 (range);四分位数间距(quartile range);方差(variance);标准差(standard deviation);变异系数(coefficient of variation 平均数指标用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。算术均数(arithmetic mean);几何均数(geometric mean);中位数(median);众数(mode) 单纯抽样将调查总体的全部观察单位编号,从而形成抽样框架,在抽样框架中随机抽取部分观察单位组成样本。每个观察对象都有相同的机会被抽中系统抽样又称机械抽样。按照某种顺序给总体中的个体编号,然后随机地抽取一个号码作为第一个调查个体,其他的调查个体则按照某种确定的规则“系统”地抽取。最常用的方法是等距抽样 分层抽样先将总体中全部个体按某种特征分成若干“层”,再从每一层内随机抽取一定数量的个体组成样本。分层特征与研究目的有关。按各层比例抽样。为减少抽样误差,要求层内误差最小,层间误 差最大。 整群抽样先将总体分成若干“群”,从中随机抽取 几个群,抽取群内的所有观察单位组成调查样本。 “群”的确定与研究目的无关。为减少抽样误差, 需多抽几个“群”。 方差分析:又称变异数分析或 F检验,适用于对多 个平均值进行总体的假设检验,以检验实验所得的 多个平均值是否来自相同总体。 析因设计(factorial design)实验:凡同时配置两个 或两个以上处理因素,这些因素的各水平又具有完 全组合的实验,统称为析因设计(factorial design) 实验。 随机区组设计(randomized block design)是事先 将全部受试对象按某种可能与实验因素有关的特征 分为若干个区组(block),使每一区组内的受试对 象例数与处理因素的分组数相等,使每个实验组从 每一区组得到一例受试对象。 单向方差分析(one way analysis of variance)是指 处理因素只有一个。这个处理因素包含有多个离散 的水平,分析在不同处理水平上应变量的平均值是 否来自相同总体。 (2)计数资料:将观察单位按某种属性或类别分组, 所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。 其观察值是定性的,表现为互不相容的类别或属性。 如调查某地某时的男、女性人口数;治疗一批患者, 其治疗效果为有效、无效的人数;调查一批少数民 族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性 的不同程度分组,所得各组的观察单位数,称为等 级资料(ordinal data)。等级资料又称有序变量。如 患者的治疗结果可分为治愈、好转、有效、无效或 死亡,各种结果既是分类结果,又有顺序和等级差 别,但这种差别却不能准确测量;一批肾病患者尿 蛋白含量的测定结果分为+、++、+++等。 随机变量(random variable)是指取指不能事先确 定的观察结果。随机变量的具体内容虽然是各式各 样的,但共同的特点是不能用一个常数来表示,而 且,理论上讲,每个变量的取值服从特定的概率分 布。 变异系数(coefficient of variation)用于观察指标单 位不同或均数相差较大时两组资料变异程度的比 较。用CV 表示。计算:标准差/均数*100% 直线回归(linear regression)建立一个描述应变量 依自变量变化而变化的直线方程, 并要求各点与该直线纵向距离的平方和为最小。直 线回归是回归分析中最基本、最简单的一种,故又 称简单回归(simple regression)。 回归系数(regression coefficient )即直线的斜率 (slope),在直线回归方程中用b 表示,b 的统计意 义为X每增(减)一个单位时,Y平均改变b 个单 位。 相关系数r:用以描述两个随机变量之间线性相关 关系的密切程度与相关方向的统计指标。 秩次:变量值按照从小到大顺序所编的秩序号称为 秩次(rank)。 秩和:各组秩次的合计称为秩和(rank sum),是非 参数检验的基本统计量。 方差(variance):方差表示一组数据的平均离散情 况,由离均差的平方和除以样本个数得到。 检验效能:1- β称为检验效能(power of test),它是 指当两总体确有差别,按规定的检验水准a 所能发 现该差异的能力。 百分位数(percentile)是将n 个观察值从小到大依 次排列,再把它们的位次 依次转化为百分位。百分位数的另一个重要用途是 确定医学参考值范围 随机误差(random error)又称偶然误差,是指排 除了系统误差后尚存的误差。它受多种因素的影响, 使观察值不按方向性和系统性而随机的变化。误差 变量一般服从正态分布。随机误差可以通过统计处 理来估计。 一、统计表有哪些要素构成的?制表的注意事项有 哪些? 一般来说,统计表由标题、标目、线条和数字、备 注五部分组成。但备注并不是必需的内容,可以根 据需要出现。 1简明扼要,重点突出:最好一张表突出一个中心, 不易太多中心,如果需要说明多个中心,可分成多 张统计表。 2合理安排主语和谓语的位置:对于表中任意一行, 从左至右,通过简短的连接词,可连成成一句通顺 的句子。 3表中数据要认真核对,保证准确可靠 二、为什么不宜用t 检验对多组均数进行比较? 如果用t检验进行多个样本均数的两两比较,则会 增加犯I 类错误的概率。 经检验得到拒绝H0 ,认为两组之间有差别的结论 可能犯I类错误的概率为α,不犯I类错误的概率为 1- α.每次判断均不犯I类错误的概率为(1- α)k, k为比较的次数,上例α=0.05, k=3,则均不犯错误 的概率为( 1- 0.05)3 =0.86. 至少有一次判断犯I 类错误的概率为1-(1- α)k 三、方差分析的基本思想是什么? 按实验设计的类型,将全部观察值间的变异分解成 两个或多个组成部分,然后将各部分的变异与随机 误差进行比较(每个部分的变异可由某因素的作用 来解释),以判断各部分的变异是否具有统计学意 义,从而推断不同样本所代表的总体均数是否相同。 五、简述直线相关与回归的区别与联系 区别:1.回归说明依存关系,直线回归用于说明两 变量间数量依存变化的关系,描述y如何依赖于x 而变化;相关说明相关关系,直线相关用于说明两 变量间的直线相关关系,此时两变量的关系是平等 的 2.r与b有区别:r说明具有直线关系的两个 变量间相关的密切程度与相关方向; b表示x每改 变一个单位,y平均增(减)多少个单位; 3.资料要求不同:直线回归要求应变量 y是来自正态总体的随机变量,而x可以是来自正 态总体的随机变量,也可以是严密控制、精确测量 的变量,相关分析则要求x,y是来自双变量正态分 布总体的随机变量。 4.取值范围:-∞

统计学第四版(贾俊平)课后思考题答案

统计课后思考题答案 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类

统计学原理计算题及参考答案

"

}

| 1、某生产车间30名工人日加工零件数(件)如下: 30 26 42 41 36 44 40 37 37 25 45 29 43 31 36 36 49 34 47 33 43 38 42 32 34 38 46 43 39 35 要求:(1)根据以上资料分成如下几组:25—30,30—35,35—40,40—45,45—50,计算各组的频数和频率,编制次数分布表; (2) 根据整理表计算工人平均日产零件数。(20分) 解:(1)根据以上资料编制次数分布表如下:

则工人平均劳动生产率为: 17.3830 1145 == = ∑∑f xf x # 要求:(1)建立以产量为自变量的直线回归方程,指出产量每增加1000件时单位成本的平均变动是多少 、 (2)当产量为10000件时,预测单位成本为多少元(15分) x bx a y n x b n y a x x n y x xy n b c 5.28080 10703 125.232105.2615 1441502520250512503210128353)(2 2 2-=+==+=?+=-=-=-=--=-??-?= --= ∑∑∑∑∑∑∑因为,5.2-=b ,所以产量每增加1000件时, 即x 增加1单位时,单位成本的平均变动是:平均减少元 (2)当产量为10000件时,即10=x 时,单位成本为 — 55105.280=?-=c y 元

>课程的测试,甲班平均成绩为81分,标准差为分;乙班的成绩分组资料如下: 计算乙班学生的平均成绩,并比较甲.乙两班哪个班的平均成绩更有代表性 解:乙班学生的平均成绩∑∑=f xf x ,所需的计算数据见下表:

医学统计学题库

第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A . 调查、录入数据、分析资料、撰写论文 B . 实验、录入数据、分析资料、撰写论文 C . 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体内部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计必然考虑其统计分析方法,因而统计分析又寓于统计设计之中;统计分析是在统计设计的基础上,根据设计的不同特点,选择相应的统计分析方法对资料进行分析

统计学课后题答案

第二章 3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。 (2)制作茎叶图,并与直方图进行比较。 解:(1)频数分布表

或: (2)茎叶图

第三章 1. 已知下表资料: 试根据频数和频率资料,分别计算工人平均日产量。解:计算表

根据频数计算工人平均日产量:6870 34.35200 xf x f = = =∑∑(件) 根据频率计算工人平均日产量:34.35f x x f = = ∑∑ g (件) 结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。 2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表: 试计算这9个企业的平均单位成本。 解:

这9个企业的平均单位成本=f x x f = ∑∑ =13.74(元) 3.某专业统计学考试成绩资料如下: 试计算众数、中位数。 解:众数的计算: 根据资料知众数在80~90这一组,故L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9, ()() 1 11m m o m m m m f f M L d f f f f --+-=+ ?-+-

00974统计学原理练习题

00974统计学原理 一、单选 1、下列调查中,调查单位与填报单位一致的是( D )。 A. 企业设备调查 B. 人口普查 C. 农村耕地调查 D. 工业企业现状调查 2、每一吨铸铁成本(元)倚铸件废品率(%)变动的回归方程为: y c = 56 + 8x,这意味着( C ) 3、 A. 废品率每增加1%,成本每吨增加64元 B. 废品率每增加1%,成本每吨增加8% 4、 C. 废品率每增加1%,成本每吨增加8元 D. 废品率每增加1%,则每吨成本为56元 3、2005年某地区下岗职工已安置了万人,安置率达%,安置率是( D )。 A.总量指标 B.变异指标 C.平均指标 D.相对指标 4、下面现象间的关系属于相关关系的是( C )。 A. 圆的周长和它的半径之间的关系 B. 价格不变条件下,商品销售额与销售量之间的关系 C. 家庭收入愈多,其消费支出也有增长的趋势 D. 正方形面积和它的边长之间的关系 5、分配数列各组标志值和每组次数均增加15%,加权算术平均数的数值( B )。 A.减少15% B.增加15% C.不变化 D.判断不出 6、次数分配数列是( D)。 A.按数量标志分组形成的数列 B.按品质标志分组形成的数列 C.按统计指标分组所形成的数列 D.按数量标志和品质标志分组所形成的数列 7、对于不同水平的总体不能直接用标准差比较其标志变异度,这时需分别计算各自的 ( A )来比较。 A.标准差系数 B.平均差 C.全距 D.均方差 8、企业按资产总额分组( B ) A.只能使用单项式分组 B.只能使用组距式分组 C.可以单项式分组,也可以用组距式分组 D.无法分组 9、某企业的职工工资水平比上年提高5%,职工人数增加2%,则企业工资总额增长( B )。 A. 10% B. % C. 7% D. 11% 10、在进行分组时,凡是遇到某单位的标志值刚好等于相邻两组上下限数值时,一般是 ( B )。

最新医学统计学问答题(含答案)

简答题 0. 算术均数、几何均数和中位数各有什么适用条件? 答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。 (2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。 (3)中位数:适用各种类型的资料,尤其以下情况: A 资料分布呈明显偏态; B 资料一端或两端存在不确定数值(开口资料或无界资料); C 资料分布不明。 1.对于一组近似正态分布的资料,除样本含量n 外,还可计算 S X ,和S X 96.1±,问各说明什么? (1)X 为算数均数,说明正态分布或近似正态分布资料的集中趋势 (2)S 为标准差,说明正态分布或近似正态分布的离散趋势 (3)S X 96.1±可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含95%的个体值。 2.试述正态分布、标准正态分布的联系和区别。 正态分布 标准正态分布 原始值X 无需转换 作u=(X-μ)/σ转换 分布类型 对称 对称 集中趋势 μ μ=0 均数与中位数的关系 μ=M μ=M 参考:标准正态分布的均数为0,标准差为1;正态分布的均数则为μ,标准差为σ(μ为任意数,而σ为大于0的任意数)。标准正态分布的曲线只有一条,而正态分布曲线是一簇。任何正态分布都可以通过标准正态变换转换成标准正态分布。标准正态分布是正态分布的特例。 3.说明频数分布表的用途。 1)描述频数分布的类型 2)描述频数分布的特征 3)便于发现一些特大或特小的可疑值 4)便于进一步做统计分析和处理 4.变异系数的用途是什么? 多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。 5.试述正态分布的面积分布规律。 (1)X 轴与正态曲线所夹的面积恒等于1或100%; (2)区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。 6.试举例说明均数的标准差与标准误的区别与联系。 7.标准正态分布(u 分布)与t 分布有何不同?

统计学原理计算题

一、时间序列: 1.某公司某年9月末有职工250人,10月上旬的人数变动情况就是:10月4日新招聘12名大学生上岗,6日有4名老职工退休离岗,8日有3名青年工人应征入伍,同日又有3名职工辞职离 岗,9日招聘7名营销人员上岗。试计算该公司10月上旬的平均在岗人数。 解: 1.2562 12232 2591252225822623250=++++?+?+?+?+?= = ∑∑f af a 要求:(1)具体说明这个时间序列属于哪一种时间序列。 (2)分别计算该银行2001年第一季度、第二季度与上半年的平均现金库存额。 解: 2.(1)这就是个等间隔的时点序列 (2)n a a a a a a a n n 22 13210++++++=-K 第一季度的平均现金库存额: )(4803 2520 4504802 500万元=+ ++=a 第二季度的平均现金库存额: )(67.5663 2580 6005502 500万元=+ ++=a 上半年的平均现金库存额: 33.5232 67 .566480,33.52362580 6005504802 500=+==+ ++++=或K a 答:该银行2001年第一季度平均现金库存额为480万元,第二季度平均现金库存额为566、67 万元,上半年的平均现金库存额为523、33万元、 要求计算:①第一季度平均人数;②上半年平均人数。 解: 第一季度平均人数: )(10322 1221020 10501210501002人=+?++?+=a 上半年平均人数:

10233 21321008 102022102010501210501002=++?++?++?+=a 解: 解:产品总产量 ∑=+++++=)(210005000040003000400030002000件a 产品总成本 ∑=+++++=)(1.1480.346.279.214.286.216.14万元b 平均单位成本)/(52.70210001.148件元件 万元 总产量总成本= = ∑∑∑a b c 或:平均单位成本)(52.706 2100010000 61 .148万元=?= =a b c 答:该企业2001年上半年的产品平均单位成本为70.52元/件。 要求:(1)计算并填列表中所缺数字。 (2)计算该地区1997—2001年间的平均国民生产总值。 (3)计算1998—2001年间国民生产总值的平均发展速度与平均增长速度。 解: (1)计算表如下: 某地区1996--2000年国民生产总值数据 (2) )(88.545 9.61585.6811.459.40万元=++++== ∑n a a

相关文档
最新文档