统计学 第七章 综合评价

统计学 第七章  综合评价
统计学 第七章  综合评价

二、企业经营综合统计评价的程序与方法

企业经营综合统计评价的基本步骤为:①选择评价指标,建立评价指标体系;②选择综合评价方法,即根据被评价现象的实际情况和特点,选定所用的无量纲化方法和合成方法;

③根据综合评价方法和研究目的的要求确定评价标准值,即确定指标的有关阈值和参数;④确定合成时所使用的反映评价指标重要程度不同的权数;⑤将指标实际值转化为指标评价值,即无量纲化;⑥将各指标评价值合成为综合评价值,并依据综合评价值的大小,进行排序和其它分析研究。

综合统计评价的具体方法不同,步骤和内容也略有不同。上述六个步骤中,前四步是准备工作,后两步是实际操作。下面介绍其主要步骤及其内容。

(一)评价指标体系的确定

在企业经营综合统计评价中,科学地确定评价指标体系是综合评价能否准确反映全面情况的前提。评价指标的选择要在对评价现象定性研究的基础上,结合定量测定方法进行分析。确定评价指标体系的基本原则有:

1.目的性。选择指标,构造评价指标体系,首先要注意从评价目的出发。例如,要评价企业经济效益,就应对企业经济效益的含义及层次进行科学界定,在此基础上选取经济效益指标;要研究企业活力状况,就应在正确理解企业活力含义的基础上,确定反映企业竞争力的指标。总之,评价指标体系的设置要能够反映不同评价对象的含义及特征,符合特定的研究目的。

2.全面性。企业经营综合统计评价是一种全面性的评价,因而选取的指标应具有代表性,指标体系的扫描范围要力求全面,从不同的侧面,不同的角度全面反映其被评价对象的整体情况。全而性并不是包括所有的指标,而应根据精简、效能的原则,选择既能反映全面状况,又能体现被研究对象本质特征的概括性强的指标,使指标体系形成一个极大无关组,尽量减少指标间的相关影响。

3.可行性。设计评价指标体系时,要考虑到指标数据是否容易取得,数据质量是否真实可靠。例如,对企业及产品的竞争能力进行综合评价,一般可以用竞争对手的相应资料作为对比标准,由于存在着竞争,这些资料的取得是比较困难的。因此,选择评价指标,要考虑到信息来源是否畅通,能否通过变通处理获取资料。

(二)评价时数据处理方法的选择

在确定了综合评价的指标体系后,需要对数据进行统一处理,才可以进行综合评价。评价时数据处理方法的选择与评价的问题有关,也与人们掌握的资料有关。这里处理数据的目标主要有两个,一是对数据进行可比化处理,即使不同量纲条件下原本不可比的数据成为可比的数据;二是对数据进行合成化处理,即将经过可比化处理的若干个指标按一定的运算规则合成为一体,用来对企业经营系统或其中的某个子系统进行整体评价。一定的数据处理方法与一定的合成方法相结合,就形成了各种不同的具体评价方法。

关于评价的具体方法见后面的内容。

1、数据的可比化处理基础——直线型无量纲化方法

在评价指标体系中,各指标间的量纲可能是不同的。一方面表现在计量单位的不同;另一方面表现在使用相同计量单位时,指标值数量级的差异。数据的可比化处理的意义在于

将量纲不同的各评价指标实际值转化为可比的、并易于进行统计处理的数量,从而使其成为可以直接用于进行综合评价的指标评价值。这一处理过程通常称为数据的无量纲化。

无量纲化是指通过数量变换来消除评价指标量纲影响,使指标实际值转化为指标评价值的方法。也可以称为单指标或单因素评价。无量纲化方法大体上可归纳为三类:直线型无量纲化方法、折线型无量纲化方法和曲线型无量纲化方法。这里主要介绍直线型无量纲化方法。

直线型无量纲化方法设指标实际值xi 与指标评议值yi 之间呈线性关系,可用直线型无量纲化方法将指标实际值转化为指标评价值。直线型无量纲化公式主要有:

'

i

i

i x x y = (1)式中:x’i 为第i 项指标的评价标准值。

'

i n

i i

i x max x y ≤≤=

1 (2)

'

i n

i i

'i n

i i x max x x max y ≤≤≤≤-=

11

(3)

i

'

i n

i i i x x min x y ≤≤-=1

(4)

'i

n

i 'i

n

i 'i n i i i x

min x max x min x y ≤≤≤≤≤≤--=

111

(5)

b

a x

min x max x min x y 'i

n

i 'i n

i '

i n

i i i +?--=

≤≤≤≤≤≤111

6)

s

x x y i i -=

(7)

∑==

n

i i

i

i x

x y 1

(8

以上八种形式都是在进行无量纲化处理时常用的直线型公式,在实际应用时,要根据实际评价标准和占有的资料,选择适当的公式进行。

2、数据的整体化处理基础——数据合成方法

企业经济综合统计评价中,合成是指运用一定的算式将消除量纲的各指标评价值综合在一起,得到一个对企业经营系统或某子系统的整体性评价。合成的方法较多,常用的有以下几种。

(1)加法合成。当各评价指标间相互独立,其重要程度是差异较大,而且各指标评价值之间的差异较小时,宜采用加法合成。基本公式为:

()

n ,,,i w y y n

i i

i 211

==∑=

式中:y 为综合评价值;y i 为第i 项指标评价值;w i 为第i 项评价指标的权数;n 为评价指标的个数。

(2)乘法合成。当各评价指标间相互关联,其重要程度的差异不大,而且各指标评价值之间的差异较大时,宜采用乘法合成。基本公式为:

()

01

≥=∏=i n

i i

y y y

()

01

1

>>=∏∏=-='i i

n

i 'i m

n i i

y ,

y y y y

式中:y i 与y’i 为变化方向相反的两类指标;y i 为正指标,则y’i 为逆指标;y i 为逆指标,则y’i 为正指标;m 为y’i 类指标的个数。

乘法合成的变形形式为几何平均法,即:

简单式:

()

01

1>?

???

??=∏=i

n

n

i i y y y

加权式

()

01

1>∑???

?

??=∏=i w n

i w i y y y i

i

(3)加乘混合法。将加法和乘法混合在一起,可以得到兼顾两种适用场合的合成方法。

其计算公式有:

∏∑=-=+=m

j '

j

m n i i y

y y 1

1

∏∑=-==m

j 'j m

n i i

y y y 1

1

∑∏=-==m

j 'j

m

n i i

y

y y 1

1

式中:yi 与y’j 不表现为变化方向相反的两类指标。

加乘混合法还可以将评价指标分成几类,根据指标间相关关系的紧密程度进行分类,使类内指标间相关关系较为紧密,而类间指标间相关关系较为松散,则可在类内作乘法处理,类间作加法处理。

∏∑===nk

i i

k j j y w y 1

1

式中:k 为类的个数。 (三)评价标准的确定

在综合评价中,根据不同的研究目的,确定合适的评价标准是企业经营综合统计评价的重要内容,同时评价标准值也是进行评价操作时的重要参数。

1.评价标准的意义和种类

在综合评价中,无量纲化时使用的阈值(临界值)和参数称为评价标准。事实上,评价标准往往直接参与数据的无量纲化过程,即常常是有了评价标准,数据的无量纲化才能得以实现。同时,评价标准的确定对综合评价结果的影响也是至关重要的。

实际工作中,常用的评价标准有以下几种:

(1)计划标准。它是以企业经营中执行的计划指标、定额指标、经营目标、达标数等数据作为评判尺度。以计划作为评价标准,有利于在制定计划时综合考虑各个方面的因素,全面考核计划执行进度及综合结果。

(2)时间标准。它是以企业经营系统的历史水平作为评判尺度,又称历史标准。根据综合评价的目的不同,时间标准可有以下几种选择:①前期标准,即以评价对象前一期的指标值为评价标准。②历史平均水平标准,即以历史上几个时期指标的序时平均值作为评价标准。③历史最好时期标准,即以历史上最佳时期的指标值作为评价标准,往往采用极大值或极小值,简称极值。正指标 使用极大值,逆指标使用极小值。④关键时期标准,即以历史上有特殊意义的关键时期指标数值作为评价的标准。

(3)空间标准。它是将评价对象置于相似或更广泛的空间范围内考察而建立的评判尺度。根据不同的评价目的,空间标准又可分为:①相似空间标准,即以生产规模、产品类型、生产条件等因素与本企业相似的企业的指标值作为评价标准。例如以主要竞争对手的资料作为评价本企业竞争能力的标准等。②最优空间标准,即以处于先进水平的企业的指标值作为评价标准,也可称为极值标准。根据对比的层次不同,又分为同行业先进水平、地区先进水平、全国先进水平和国际先进水平等。③扩大空间标准,即以比企业更大的空间范围的平均水平或平均先进水平作为评价标准。根据对比的层次不同,也可分为同行业平均水平或平均先进水平地区的、全国的、或国际的平均水平、平均先进水平等。

(4)主观标准。它是以对大量历史资料的归纳总结而得出的经验数据,或凭借经验得出的主观指标作为综合评价的尺度,如模糊综合评判中的评语等级论域的确定,等等。

2.确定评价标准的原则

无量纲化的处理结果一般是以各种形式的相对数表示。从评价方法上看,评价标准的作用在于作为对比基数的指标的实际值转化为评价值。因此,确定评价标准,应注意以下几个问题。

(1)同一性。即评价标准要与评价指标保持同一性,使之可比。同一性包括评价标准与评价指标之间要保持内涵和口径的同一、计算方法的同一、时空限制的同一、计量单位的同一等。

(2)目的性。对同一评价对象,根据不同的研究目的,其评价标准可以有多种选择。例如,结企业经济效益进行综合评价,若以分析经济效益的发展变化为目的,可以选择时间标准;若以寻找与先进水平的差距为目的,可以选择空间标准;若以检查经济效益目标的完成情况为目的,则应选择计划标准,等等。

(3)稳定性。在选择时间标准时,要注意不应选择那些经营活动不稳定的时期的指标值作为基数。确定其它各种标准,也要注意指标值分布的状况,对异常值进行检验和调整。

(4)协调性。评价标准的选择要与无量纲化和合成方法的要求相适应,与其协调一致。 (四)权数的确定

在进行数据处理时,不论是进行可比化处理还是进行合成化处理都会遇到一个共同的问题,即数据的加权问题,因此,不论在数据处理阶段还是在最终的分析评价阶段权数的确定都是综合评价中的一个重要问题。

由于各评价指标在指标体系中的重要程度不同,因而在对指标评价值进行合成时,首先应确定各指标相对重要性的权数。权数值的确定直接影响到综合评价的结果,因而科学地确定权数是企业经营综合统计评价中的重要问题。

由于各评价指标的量纲不同,不存在统一的同度量因素,也就无法确定象指数中的同度量因素、平均数中的频率那样的有明确经济意义的权数。因而,需要用专门的方法确定权数。

权数的确定方法主要有:排队法、德尔菲法、层次分析法等。德尔菲法和层次分析法的详细介绍见第二章。

排队法也称经验等距权数法。该方法在确定各类指标权数差距时利用下面公式:

指标个数各类指标权数差距 2O

1O =

式中的系数2为经验确定。这种方法运用时要求评价指标在6—15个之间,并且先将各项指标按重要程度分类,一般分为2—3类。各类指标之间权数差距按上式计算,一般在3—10之间,以避免某类指标权数过大,而另一类指标权数偏小。

权数的确定还可以用二项系数法、优序图法或模糊综合评判的逆问题等方法。企业可以根据实际问题的需要和各种方法的特点,选取合适的方法确定权数。

(五)企业经营综合统计评价常用方法

无量纲化方法与合成方法相结合,可形成多种综合评价方法。有些综合评价方法对无量纲化方法没有特殊限制,可专门作无量纲化处理。有些综合评价方法将无量纲化方法与合成方法有机结合在一起。

在实际工作中,常用的综合评价方法有以下几种。 1、综合指数法

综合指数法就是利用统计指数方法对事物进行综合评价的方法,运用这个方法既可以对单项指标计算指数,又可以运用计算总指数的方法对企业经营系统或其中的某个子系统进行综合评价。具体的计算公式如下:

∑∑====n

i i

'i

i

n i i i w x x w y y 11

式中:y 为进行综合评价所计算的综合指数;y i 为第i 项评价指标的个体指数,实际上也是第i 项指标评价值与评价标准进行对比得到的一种无量纲化评价值;x i 为第i 项评价指标的评价值;x ’i 为第i 项评价指标的评价标准值;w i 为第项评价指标在综合评价中的权数。

综合指数法实际上是先对评价指标作直线型无量纲化处理,再使用加法合成,对指标评价值进行加权平均得出综合评价值。现行的工业经济效益综合指数采用的就是这种方法。综合指数法的具体运用请见本章第四节例。

2、功效系数法

功效系数法是对直线型无量纲化公式进行变形处理,然后进行综合评价。具体的做法是。

设评价指标可接受的最小值

s

i 'i n

i x x min 为≤≤1,h

i 'i n

i x x max 为≤≤1,

b 为及格分数线60分,

a 为

40分(100-b=100-60=40分),则无量纲化公式为:

6040+?--=s

i

h i s

i i i x x x x d 式:中di 为第项指标的功效系数,即指标评价值;s

i x 和h

i x 分别为第项指标的不允许值和满意值。根据不同的研究目的,s

i x 和h

i x 有不同的确定方法。例如,可以用不应出现的最低值为不允许值,最高值为满意值;采用时间标准时,历史上最低值为不允许值,最高值为满意值;采用空间标准时,某范围内先进水平为满意值,落后水平为不允许值;等等。和的确定还要根据指标性质和研究目的作调整修订。

对指标进行无量纲化处理后,一般使用按几何平均法进行乘法合成。

∑?

??? ??=∏=i

i w n i w i d D 1

1

式中:D 为总功效系数,即综合评价值。

第四节企业经营经济效益的综合评价

企业经营的经济效益的含义及指标体系在前面已经进行了介绍,我们了解一个指标只能反映企业经济效益的一个方面,要对企业经营的经济效益做出总体判断就需要对企业经营经济效益做出综合评价。这一节就简单介绍一下企业经济效益综合评价的方法。对企业经营的经济效益进行综合评价有许多方法,如关键指标法、打分法、指数法和功效系数法等。这里介绍两种常用的简易方法。

一、综合指数法

综合指数法以各项经济效益指标的实际值分别除以各项指标的标准值得出各项指标的评价值,再对指标评价值进行加权算术平均,得出综合评价值的一种方法。各项指标的标准值可以采用时间标准,也可以采用空间标准。

现在工业企业为例,对企业经济效益综合评价的指数法予以说明。

某企业经济效益指标及有关资料如表5-5所示。

利用指数法对该企业经济效益进行综合评价,见表5-6资料。

表5-6

表5-6的结果表明,该企业报告期经济效益的综合状况或水平,为基期水平的104.13%,为地区间行业最高水平的88.33%,为地区同行业水平的96.74%。说明该企业综合经济效益,用时间标准评价有提高;用空间标准衡量,较为接近平均水平,与先进水平还有较大差距。在此基础之上可对指数进行分解,分析各项指标及变化对综合经济效益的影响,从而了解、研究制约经济效益提高的因素。

二、功效系数法

根据本章第一节中介绍的功效系数法的原理,用表5-3资料,取地区同行业最高水平为满意值,地区同行业最低水平为不允许值,对企业经济效益进行综合评价,结果如表5-7所示:

表5-5结果表明,该企业经济效益总功效系数为80.72分,居地区同行业中游水平。

(完整版)统计学习题答案第5章参数估计

第5章 参数估计 ●1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。 (1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,允许误差是多少? 解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差 x σσ5=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×0.7906=1.5496。 ●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差; (5) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 x σσ15=2.1429 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×2.1429=4.2000。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为 α/2 x Z 0±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。 ●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5

描述统计学思考题

1、调查问卷的结构? 2、多项选择题的编码?(多重响应) 3、多项选择排序题的编码? 4、缺失值有哪些处理方法? 5、离群值如何判断和筛选出来? 6、什么是问卷的信度和效度?怎样检验问卷的信度和效度? 7、问卷调查中的信度分析,有几种信度系数?写出三种信度的测 量方法。 8、问卷调查中的效度分析,有几种关于效度的测定方法? 9、信度与效度之间有什么关系? 10、条形图、直方图、茎叶图的区别。 11、箱线图中的离群点是哪些点?离群程度? 12、数据特征从哪几个方面进行描述?描述统计量分别是? 13、众数、中位数、均值的异同? 14、根据下表数据, (1)用描述统计的方法概括表中数据,并讨论你的结论。 (2)对变量数据的最大值、最小值、平均数以及适当的分位数进行评价和解释;通过这些描述统计量,你对亚太地区的商学院有何看法或发现? (3)对本国学生学费和外国学生学费进行比较。 (4)对要求或不要求工作经验的学校学生的起薪进行比较。 (5)对要求或不要求英语测试的学校学生的起薪进行比较。

(6)分析报告中如果有必要的图表,将更便于反映你希望反映的问题。(见下页)

表亚太地区25所知名商学院 商学院名称录取 名额 每系 人数 本国 学生 学费 ($) 外国 学生 学费 ($) 年龄 国外 学生 比例 (%) 是否 要求 GMAT 是否 要求 英语 测试 是否 要求 工作 经验 起薪 ($) 麦夸里商学院 (悉尼) 12 5 24420 29600 28 47 是否是71400 阿德莱德大学20 4 19993 32582 29 28 是否是65200 梅西大学(新 西兰,北帕默 斯顿) 30 5 4300 4300 22 0 否否否7100 墨尔本皇家工 商学院 30 5 11140 11140 29 10 是否否31000 马来西亚 Sains大学(槟 城) 30 4 33060 33060 28 60 是是否87000 澳大利亚国立 大学(堪培拉) 42 5 7562 9000 25 50 是否是22800 De La Salle大 学(马尼拉) 44 5 3935 16000 23 1 是否否7500 南洋理工大学 (新加坡) 50 6 6146 7170 29 51 是是是43300 香港理工大学60 8 2880 16000 23 0 否否否7400 拉合尔管理科 学院 70 2 20300 20300 30 80 是是是46600 香港大学90 5 8500 8500 32 20 是否是49300 柯廷理工学院 (珀思) 98 17 16000 22800 32 26 否否是49600 日本国际大学126 2 11513 11513 26 37 是否是34000 昆士兰大学 (布里斯本) 138 8 17172 19778 34 27 否否是60100 新加坡国立大 学 147 7 17355 17355 25 6 是否是17600 墨尔本商学院200 13 16200 22500 30 30 是是是52500 Chulalongkorn 大学(曼谷) 200 10 18200 18200 29 90 否是是25000 新南威尔士大 学(悉尼) 228 19 16426 23100 30 10 否否是66000 Jamnalal Bajaj 管理学院(孟 买) 240 15 13106 21625 37 35 否是是41400 亚洲管理学院300 7 13880 17765 32 30 否是是48900

统计学第七章、第八章课后题答案

统计学复习笔记 第七章参数估计 一、思考题 1.解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2.简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3.怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4.解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。 5.简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 (z 2 )2 2其中: E z n n E22 其中: E z 2 n 2. 样本量n 与置信水平1- α、总体方差、估计误差E之间的关系为与置信水平 成正比,在其他条件不变的情况下,置信水平越大,所

梁前德《统计学》(第二版)学习指导与习题训练答案:07第七章 假设检验与方差分析 习题答案

旗开得胜 1 第七章 假设检验与方差分析 习题答案 一、名词解释 用规范性的语言解释统计学中的名词。 1. 假设检验:对总体分布或参数做出某种假设,然后再依据抽取的样本信息,对假设是否正确做出统计判断,即是否拒绝这种假设。 2. 原假设:又叫零假设或无效假设,是待检验的假设,表示为 H 0,总是含有等号。 3. 备择假设:是零假设的对立,表示为 H 1,总是含有不等号。 4. 单侧检验:备择假设符号为大于或小于时的假设检验。 5. 显著性水平:原假设为真时,拒绝原假设的概率。 6. 方差分析:是检验多个总体均值是否相等的一种统计分析方法。 二、填空题 根据下面提示的内容,将适宜的名词、词组或短语填入相应的空格之中。 1. u , n x σμ0 -,标准正态; ),( ),(2/2/+∞- -∞n z n z σσααY 2. 参数检验,非参数检验 3. 弃真,存伪 4. 方差

旗开得胜 2 5. 卡方, F 6. 方差分析 7. t ,u 8. n s x 0μ-,不拒绝 9. 单侧,双侧 10.新产品的废品率为5% ,0.01 11.相关,总变异,组间变异,组内变异 12.总变差平方和=组间变差平方和+组内变差平方和 13.连续,离散 14.总体均值 15.因子,水平 16.组间,组内 17.r-1,n-r 18. 正态,独立,方差齐

三、单项选择 从各题给出的四个备选答案中,选择一个最佳答案,填入相应的括号中。 1.B 2.B 3. B 4.A 5.C 6.B 7.C 8.A 9.D 10.A 11.D 12.C 四、多项选择 从各题给出的四个备选答案中,选择一个或多个正确的答案,填入相应的括号中。1.AC 2.A 3.B 4.BD 5. AD 五、判断改错 对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。 1. 在任何情况下,假设检验中的两类错误都不可能同时降低。( ×) 样本量一定时 2. 对于两样本的均值检验问题,若方差均未知,则方差分析和t检验均可使用,且两者检验结果一致。( √) 3

第五章+统计学教案(假设检验)

第五章+统计学教案(假设检验)参数估计和假设检验是统计推断的两个组成部分,它们分别从不同的角度利用样本信息对总体参数 进行推断。前者讨论的是在一定的总体分布形式下,借助样本构造的统计量,对总体未知参数作出估计 的问题;后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证, 从而作出真假判断。通俗地、简单地说,前者是利用样本信息估计总体参数将落在什么范围里;而后者 则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。 通过本章学习,要求学生在充分理解有关抽样分布理论的基础上,理解掌握假设检验的有关基本概 念;明确在假设检验中可能犯的两种错误,以及这两种错误之间的联系;熟练掌握总体均值和总体成数 的检验方法,主要是 Z 检验和 t 检验;对于非参数的检验,也应有所了解,包括符号检验、秩和检验与游程检验等。 2 一、假设检验概述与基本概念 1、假设检验概述 2、假设检验的有关基本概念 二、总体参数检验 1、总体平均数的检验 2、总体成数的检验

3、总体方差的检验 三、总体非参数检验 1、符号检验 2、秩和检验 3、游程检验 一、假设检验的有关基本概念; 二、总体平均数与总体成数的检验; 三、非参数检验; 一、假设检验的基本思路与有关概念; 二、两类错误的理解及其关系; 一、假设检验概述 假设检验:利用统计方法检验一个事先所作出的假设的真伪,这一假设称为统计假设,对这一假设 所作出的检验就是假设检验。 基本思路:首先,对总体参数作出某种假设,并假定它是成立的。然后,根据样本得到的信息(统 计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个 假设。 所谓合理性,就是看是否在一次的观察中出现了小概率事件。 小概率原理:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。这种事件可以称其 为“实际不可能事件”。 二、假设检验的基本概念

《统计学》-第7章-习题答案

第七章思考与练习参考答案 1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。 2.答:相关和回归都是研究现象及变量之间相互关系的方法。相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。 3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数 ,样本相关系数 。复相关系数是多元线性回归分 析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。 4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。根据样本数据拟合的方程,就是样本回归函数,以一元线 性回归模型的样本回归函数为例可表示为:t t X Y 10???ββ+=。总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。第二,总体回归函数中 的0β和1β是未知的参数,表现为常数;而样本回归直线中的0 ?β和1?β是随机变量,其具体数值随所抽取的样本观测值不同而变动。 5.最小二乘法是在根据样本数据估计样本回归方程时,采用残差平方和作为衡量总偏 差的尺度,找到使得残差平方和最小的回归系数0 ?β和1?β的取值的估计方法。根据微积分中

应用统计学:参数估计习题及答案

简答题 1、矩估计的推断思路如何?有何优劣? 2、极大似然估计的推断思路如何?有何优劣? 3、什么是抽样误差?抽样误差的大小受哪些因素影响? 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素? 计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少? 3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少? 4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公

顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973) 5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下: 试推断: (1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围 (2)以同样条件推断其合格率的可能范围 (3)比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求: (1)计算样本合格品率及其抽样平均误差

统计学答案第七章

1 估计量的含义是指()。 A.用来估计总体参数的统计量的名称 B.用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体数值 2 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为()。 A.无偏性 B.有效性 C.一致性 D.充分性 3 根据一个具体的样本求出的总体均值的95%的置信区间()。 A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D.要么包含总体均值,要么不包含总体均值 4 无偏估计是指()。 A.样本统计量的值恰好等于待估的总体参数 B.所有可能样本估计值的数学期望等于待估总体参数 C.样本估计值围绕待估总体参数使其误差最小 D.样本量扩大到和总体单元相等时与总体参数一致 5 总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以()。 A.样本均值的抽样标准差 B.样本标准差 C.样本方差 D.总体标准差 6 当样本量一定时,置信区间的宽度()。 A.随着置信系数的增大而减小 B.随着置信系数的增大而增大 C.与置信系数的大小无关 D.与置信系数的平方成反比 7 当置信水平一定时,置信区间的宽度()。 A.随着样本量的增大而减小 B.随着样本量的增大而增大 C.与样本量的大小无关 D.与样本量的平方根成正比 8 一个95%的置信区间是指()。 A.总体参数有95%的概率落在这一区间内 B.总体参数有5%的概率未落在这一区间内 C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数 D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数

统计学 第四版 第七章答案

第四章 抽样分布与参数估计 7.2 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客 组成了一个简单随机样本。 (1)假定总体标准差为15元,求样本均值的抽样标准误差。 x σ= = =2.143 (2)在95%的置信水平下,求边际误差。 x x t σ?=?,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ?=?2x z ασ=?0.025x z σ=?=1.96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。 置信区间为: (),x x x x -?+?=()120 4.2,120 4.2-+=(115.8,124.2) 7.4 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。 要求: 大样本,样本均值服从正态分布:2,x N n σμ?? ??? 或2 ,s x N n μ?? ??? 置信区间为: x z x z αα ?-? +? ? (1)构建μ的90%的置信区间。 2z α=0.05z =1.645,置信区间为:()81 1.645 1.2,81 1.645 1.2-?+?=(79.03,82.97) (2)构建μ的95%的置信区间。 2z α=0.025z =1.96,置信区间为:()81 1.96 1.2,81 1.96 1.2-?+?=(78.65,83.35) (3)构建μ的99%的置信区间。 2z α=0.005z =2.576,置信区间为:()81 2.576 1.2,81 2.576 1.2-?+?=(77.91,84.09) 7.7 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取 36 解:

统计学原理课后习题答案 第五章 抽样及参数估计

统计学原理课后习题答案 第五章 抽样及参数估计 1.①由题意可知本题属于:纯随机重复抽样下的总体比例区间估计。 已知:n=1000,828 82.8%1000 p = =,(Z)195.45%F α=-= ,查表得/2=2Z α 由于不知总体标准差,用样本的标准差代替: p 82.8%282.8% 2.4%Z α±=±? =± 即:80.4%P 85.2%≤≤ 所以该城市拥有彩电家庭比例的置信区间为80.4%—85.2%。 ②由题意可知本题属于:重复抽样时比例的必要抽样数目。 已知: 82.8%p =,5%p ?= ,(Z)199.73%F α=-= ,查表得/2=3Z α 由于不知总体标准差,用样本的标准差代替: 222 2 (1P) 382.8%(1-82.8%)5130.05 p z P n -??= =≈? 2.由题意可知本题属于:纯随机重复抽样下的总体平均数的抽样极限误差 已知:n=100,=3x ,=0.8σ ,(Z)195%F α=-= ,查表得/2=1.96Z α /2 = 1.960.16Z α?=?= 分钟 3.(1) 已知:n=150,123 82%150 p = =,(Z)199.73%F α=-= ,查表得/2=3Z α 由于不知总体标准差,用样本的标准差代替: p 82%382%9.41%Z α±=±? =± 即:72.59%P 91.41%≤≤ (2)已知:n=150,=2x ,=0.75σ ,(Z)199.73%F α=-= ,查表得/2=3Z α

/2 0.75 2320.2x Z αμ=±=±?=± 分钟 即:1.8 2.2μ≤≤ 4. 已知: 200σ=,30z ?= ,(Z)195%F α=-= ,查表得/2=1.96Z α 则:22 222 2 1.9620017130 z z n σ?==≈? 户 (1)如上图 (2)40名职工的平均考核成绩为3070 40 76.75xf x f = = =∑ 样本的方差为2 2 ()4777.5 s 122.54x x f f -= = =∑∑ (Z)195%F α=-= ,查表得到/2 1.96Z α= /2 76.75 1.911.07 676.75 3.43s x Z α±=±?=± 即在95%的概率保证度下,该企业工人的平均考核成绩在73.32到80.18直接。 (3)已知:n=40,36 90%40 p = =,(Z)195%F α=-= ,查表得/2=1.96Z α 由于不知总体标准差,用样本的标准差代替:

统计学第七章、第八章课后题答案.doc

统计学复习笔记 第七章 一、 思考题 1. 解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2. 简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3. 怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4. 解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。 5. 简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=

统计学答案解析最新版本

统计学课本课后作业题(全) 题目: 第1章:P11 6,7 第2章:P52 练习题3、9、10、11 第3章:P116思考题12、14 练习题16、25 第4章:P114 思考题6,练习题2、4、6、13 第5章:P179 思考题4、练习题3、4、6、11 第6章:P209 思考题4、练习题1、3、6 第7章:P246思考题1、练习题1、7 第8章:P287 思考题4、10 练习题2、3 第一章 6..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体;最近的一个集装箱内的全部油漆; (2)描述研究变量;装满的油漆罐的质量; (3)描述样本;最近的一个集装箱内的50罐油漆; (4)描述推断。50罐油漆的质量应为4.536×50=226.8 kg。 7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求:答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第二章 3.某百货公司连续40天的商品销售额如下(单位:万元):

统计学第四版第七章课后题最全答案

第七章 练习题参考答案 (1)已知σ=5,n=40,x =25,α=, z 2 05.0= 样本均值的抽样标准差 σ x =n σ= 79.0405 = (2)估计误差(也称为边际误差)E=z 2 α n σ =*= (1)已知σ=15,n=49,x =120,α=, z 2 05.0= (2)样本均值的抽样标准差 σ x =n σ= =4915 估计误差E= z 2 α n σ=* =4915 (3)由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±*=±,即(,) (1)已知σ=85414,n=100,x =104560,α=, z 05.0= 由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±* =100 85414±.144即(,) (1)已知n=100,x =81,s=12, α=, z 1.0= 由于n=100为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=±* =100 12±,即(,) (2)已知α=, z 2 05.0= 由于n=100为大样本,所以总体均值μ的95%的置信区间为: n s x z 2 α±=±* =100 12±,即(,) (3)已知α=, z 2 01.0= 由于n=100为大样本,所以总体均值μ的99%的置信区间为:

n s x z 2 α±=±* =100 12±,即(,) (1)已知σ=,n=60,x =25,α=, z 05.0= 由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±* =60 .53±,即(,) (2)已知n=75,x =,s=, α=, z 02.0= 由于n=75为大样本,所以总体均值μ的98%的置信区间为: n s x z 2 α±=± =75 9.823±,即(,) (3)已知x =,s=,n=32,α=, z 2 1.0= 由于n=32为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=± =32 74.90±,即(,) (1)已知:总体服从正态分布,σ=500,n=15,x =8900,α=,z 2 05.0= 由于总体服从正态分布,所以总体均值μ的95%的置信区间为: n x z σ α2 ±=±* =15 500±,即(,) (2)已知:总体不服从正态分布,σ=500,n=35,x =8900,α=, z 2 05.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的95%的置信区间为: n x z σ α2 ±=±* =35 500±,即(,) (3)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=, z 1.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=±* =35 500±,即(,) (4)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=, z 2 01.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的99%的置信区间

描述性统计分析报告--Descriptive Statistics菜单详解

第六章:描述性统计分析-- Descriptive Statistics菜单详解 描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中,最常用的是列在最前面的四个过程:Frequencies过程的特色是产生频数表;Descriptives过程则进行一般性的统计描述;Explore过程用于对数据概况不清时的探索性分析;Crosstabs 过程则完成计数资料和等级资料的统计描述和一般的统计检验,我们常用的X2检验也在其中完成。 本章讲述的四个过程在9.0及以前版本中被放置在Summarize菜单中。 §6.1 Frequencies过程 频数分布表是描述性统计中最常用的方法之一,Frequencies过程就是专门为产生频数表而设计的。它不仅可以产生详细的频数表,还可以按要求给出某百分位点的数值,以及常用的条图,圆图等统计图。 和国内常用的频数表不同,几乎所有统计软件给出的均是详细频数表,即并 不按某种要求确定组段数和组距,而是按照数值精确列表。如果想用Frequencies过程得到我们所熟悉的频数表,请先用第二章学过的Recode过程产生一个新变量来代表所需的各组段。 6.1.1 界面说明 Frequencies对话框的界面如下所示:

该界面在SPSS中实在太普通了,无须多言,重点介绍一下各部分的功能如下:【Display frequency tables复选框】 确定是否在结果中输出频数表。 【Statistics钮】 单击后弹出Statistics对话框如下,用于定义需要计算的其他描述统计量。 现将各部分解释如下:

统计学的发展历程

统计学的发展历程

统计学概述 [编辑本段] 统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。 统计学主要又分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。另外也有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。 统计学的发展历程 [编辑本段] 统计学的英文statistics最早是源于现代拉丁文statisticum collegium (国会)以及意大利文statista (国民或政治家)。德文Statistik,最早是由Gottfried Achenwall(1749)所使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。 统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”,“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而属于数学的范畴。 统计学的发展过程的三个阶段 第一阶段称之为“城邦政情”(Matters of state)阶段 “城邦政情”阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十馀种纪要,其内容包括各城邦的历史,行政,科学,艺术,人口,资源和财富等社会和经济情况的比较,分析,具有社会科学特点。“城邦政情”式的统计研究延续了一两千年,直至十七世纪中叶才逐渐被“政治算数”这个名词所替代,并且很快被演化为“统计 学”(Statistics)。统计学依然保留了城邦(state)这个词根。 第二阶段称之为“政治算数”(Politcal arthmetic)阶段 与“城邦政情”阶段没有很明显的分界点,本质的差别也不大。

统计学第四版第七章课后题最全答案

第七章 练习题参考答案 7.1 (1)已知σ=5,n=40,x =25,α=0.05, z 05.0=1.96 样本均值的抽样标准差 σ x =n σ= 79.040 5 = (2)估计误差(也称为边际误差)E= z 2 α n σ =1.96*0.79=1.55 7.2(1)已知σ=15,n=49,x =120,α=0.05, z 05.0=1.96 (2)样本均值的抽样标准差 σ x =n σ= =4915 2.14 估计误差E= z 2 α n σ=1.96* =4915 4.2 (3)由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α ± =120±1.96*2.14=120±4.2,即(115.8,124.2) 7.3(1)已知σ=85414,n=100,x =104560,α=0.05, z 05.0=1.96 由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α ± =104560±1.96* =100 85414104560±16741.144即(87818.856,121301.144) 7.4(1)已知n=100,x =81,s=12, α=0.1, z 2 1.0=1.645 由于n=100为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=81±1.645* =100 1281±1.974,即(79.026,82.974) (2)已知α=0.05, z 2 05.0=1.96 由于n=100为大样本,所以总体均值μ的95%的置信区间为: n s x z 2 α±=81±1.96* =100 1281±2.352,即(78.648,83.352) (3)已知α=0.01, z 2 01.0=2.58 由于n=100为大样本,所以总体均值μ的99%的置信区间为:

描述统计学

2. 数据汇总Summarizing Data 频数分布与图形展示 本章和下一章讨论有关统计描述的问题。关于收集、组织、展示数值数据的方法。其中包括描述各种数据分布,各种统计图形的使用,描述数据的各种指标,如平均值、期望值、方差等等。 2.1 频数分布Frequency distribution 为了进行决策或推断,我们需要信息。例如,为了进行制定有关销售方面的决策需要了解员工的实际销售情况,或者说要获得有关销售的信息。获得了数据以后,就需要对数据进行组织,也就是将数据组织成容易观察的形式。然后就是展示数据,通常都是以图形的方式。最后就可以得出关于这一组数据的结论,并将这些结论用于决策。 一种常用的方式是首先获得一组原始数据。将这组数据组织成数组,即将数据从大到小或从小到大进行排序。然后将其总结成一组频数分布。也就是将这一数组按一定的间隔进行计数,清点出位于每一间隔中的数据出现的次数。这样就获得了频数表或频数分布。 频数分布就是一张显示一组数据位于每一独立区间间隔内的次数的数据表格。频数分布也称为频数表。 频数分布又可以划分为定性数据的频数分布和定量数据的频数分布。一般我们主要对定量数据进行频数分布研究。 为了建立一频数分布,我们需要确定: ? 间隔的数量, ? 间隔的长度(或宽度), ? 间隔的边界,或者说是划分间隔的位置 然后我们就可以清点落在每一间隔中的数值。 例: PP28表2-2显示了一个频数分布。 确定间隔长度(或宽度)的公式为: 间隔数量 最小值 最大值估计的间隔长度-= 在此,如果间隔数量选为8,则间隔的长度应该为: 813.88 26000 96500=-= 估计的间隔长度 当然,这个数值看起来不太好,所以可以取整为9000或10000。 如果我们不能确定应该用多少个间隔数量,则可以通过下列估计间隔长度的公式进行计算:

统计学第七章、第八章课后题答案

统计学复习笔记 第七章 参数估计 一、 思考题 1. 解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2. 简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3. 怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4. 解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。 5. 简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 2. 样本量n 与置信水平1-α、总体方差 、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=

《统计学概论》第七章课后练习题答案

《统计学概论》第七章课后练习题答案 一、思考题 1.抽样推断的意义和作用是什么? 2.抽样推断的特点是什么? 3.为什么抽样调查要遵循随机原则? 4.总体参数与样本统计各有什么特点? 5.为什么区间估计比点估计优越? 6.抽样平均误差的定义是什么?它有什么重要意义? 7.影响抽样平均误差的因素有哪些? 8.优良估计量的衡量标准有哪些? 9置信区间、置信度、概率度之间的关系怎样? 10.区间估计的原理是什么? 11.为什么说在n固定的情况下参数区间估计的精确度和可靠性是此消彼长的?12.怎样同时改善区间估计的精确度和可靠性? 13.影响抽样极限误差的因素有哪些? 14.怎样正确理解抽样极限误差的概念? 15.确定样本容量的因素有哪些? 16.抽样方案设计的基本原则是什么? 17.怎样理解类型抽样的原理和意义? 18.等距抽样的原理和意义是什么? 19.整群抽样的原理以及与类型抽样的区别是什么? 二、单项选择题 1.以()为基础理论的统计调查方法是抽样调查法。 A.高等代数B.微分几何 C.概率论D.博弈论 2.典型调查与抽样调查的相同之处为()。 A.均遵守随机原则B.以部分推断总体 C.误差均可估计D.误差均可控制 3.抽样推断必须遵守的首要原则是()。 A.大量性原则B.随机原则

C.可比性原则D.总体性原则4.既可进行点估计又可进行区间估计的是()。 A.重点调查B.典型调查C.普查D.抽样调查5.误差可以计算并加以控制的是()。 A.抽样调查B.普查 C.典型调查D.重点调查6.()可以对于某种总体的假设进行检验。 A.回归分析法B.抽样推断法C.综合指数法D.加权平均法7.以下正确的是()。 A.总体指标与样本指标均为随机变量 B.总体指标与样本指标均为常数 C.总体指标是常数而样本指标是随机变量 D.总体指标是随机变量而样本指标是常数 8.总体属性变量平均数恰等于()。 A.1-P B.P C.P(1-P)D.) P? 1 (P 9.总体属性变量的方差等于()。 A.1-P B.P C.P(1-P)D.) 1 P? (P 10.点估计的理论依据是()。 A.中心极限定理B.抽样分布定理C.小数定律D.大数定律11.频率稳定性的必要条件是()。 A.同质性B.大量性C.随机性D.社会性12.样本指标的标准差就是()。 A.抽样极限误差B.抽样平均误差

统计学第四版第七章答案

第四章 抽样分布与参数估计 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客组成 了一个简单随机样本。 (1)假定总体标准差为15元,求样本均值的抽样标准误差。 x σ= = = (2)在95%的置信水平下,求边际误差。 x x t σ?=?,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ?=?x z ασ=?0.025x z σ=?=×= (3)如果样本均值为120元,求总体均值 的95%的置信区间。 置信区间为: (),x x x x -?+?=()120 4.2,120 4.2-+=(,) 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。 要求: 大样本,样本均值服从正态分布:2,x N n σμ?? ???:或2,s x N n μ?? ??? : 置信区间为: 22x z x z αα?-+ ? (1)构建μ的90%的置信区间。 2z α=0.05z =,置信区间为:()81 1.645 1.2,81 1.645 1.2-?+?=(,) (2)构建μ的95%的置信区间。 2z α=0.025z =,置信区间为:()81 1.96 1.2,81 1.96 1.2-?+?=(,) (3)构建μ的99%的置信区间。 2z α=0.005z =,置信区间为:()81 2.576 1.2,81 2.576 1.2-?+?=(,) 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取 36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 解:

大学统计学第七章练习题及答案概要

第7章 参数估计 练习题 7.1 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。 (1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,边际误差是多少? 解:⑴已知25,40,5===x n σ 样本均值的抽样标准差79.04 10 40 5≈= = = n x σ σ ⑵已知5=σ,40=n ,25=x ,4 10 = x σ,%951=-α 96.1025.02==∴Z Z α 边际误差55.14 10 * 96.12 ≈==n Z E σ α 7.2 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客 组成了一个简单随机样本。 (1) 假定总体标准差为15元,求样本均值的抽样标准误差; (2) 在95%的置信水平下,求边际误差; (3) 如果样本均值为120元,求总体均值μ的95%的置信区间。 解.已知.根据查表得2/αz =1.96 (1)标准误差:14.249 15== =n X σ σ (2).已知2/αz =1.96 所以边际误差=2/αz * =n s 1.96* 49 15=4.2 (3)置信区间:)(2.124,8.11596.149 151202 =*± =±n s Z x α

7.3 从一个总体中随机抽取100=n 的随机样本,得到104560=x ,假定总体标准差 85414=σ,构建总体均值μ的95%的置信区间。 96.12 =?Z 144.16741100 85414* 96.12 ==? ?n Z σ 856.87818144.16741104560. 2 =-=-?n Z x σ 144.121301144.16741104560. 2 =+=+?n Z x σ 置信区间:(87818.856,121301.144) 7.4 从总体中抽取一个100=n 的简单随机样本,得到81=x ,12=s 。 (1) 构建μ的90%的置信区间。 (2) 构建μ的95%的置信区间。 (3) 构建μ的99%的置信区间。 解;由题意知100=n , 81=x ,12=s . (1)置信水平为%901=-α,则645.12 =αZ . 由公式n s z x ? ±2 α974.181100 12645.181±=? ±= 即(),974.82,026.79974.181=± 则的的%90μ置信区间为79.026~82.974 (2)置信水平为%951=-α, 96.12 =αz 由公式得n s z x ? ±2 α=81352.281100 12 96.1±=? ± 即81352.2±=(78.648,83.352), 则μ的95%的置信区间为78.648~83.352 (3)置信水平为%991=-α,则576.22 =αZ .

相关文档
最新文档