统计学向书坚内容整理

统计学向书坚内容整理
统计学向书坚内容整理

第一章导论

1、统计学性质

①统计学研究对象是客观现象的数量方面;

②统计学研究的是群体现象的数量特征与规律性;

③统计学是一门方法论的科学

2、统计学的发展

①古典统计学时期(17中-18中)统计学萌芽

国势学派——德国康令和G.阿亨瓦尔;

政治算术学派——威廉·配第和约翰·格朗特;

②近代统计学时期(18末-19末)

数理统计学派——比利时A.凯特勒“统计学之父”:将国势学、政治算术学和古典概率论融合;

社会统计学派——K.G.A.克尼斯首创,代表人物C.L.E.恩格尔和G.V.梅尔

③现代统计学派(20-迄今)

数理统计主流从描述统计转向推断统计——英国哥赛特、费雪;完善区间估计、假设检验——内曼、皮尔逊;统计决策、质量检验的序贯分析——瓦尔德;多变量统计——威夏特、赫特林

3、统计数据

是指对客观现象的属性或数量表现进行测量的结果。

4、面板数据

指时间序列数据和截面数据相结合的数据。如在调查中收集的对各个固定调查用户在不同时期的调查数据。

5、大数据

指在信息技术中,一些使用目前现有数据库管理工具或传统数据处理应用很难处理的大型而复杂的数据集。

6、统计指标

统计指标是指总体数量特征的概括性度量。由指标名称和指标取值两基本要素组成,还包括时间状态、空间范围、计量单位、计量方法等限定。分为数量指标和质量指标。

指标数值反映的是所研究现象在具体时间、地点、条件下的规模、水平、结构等特征,是具体的而不是抽象的数字。

第二章统计数据收集、整理与展示

1、间接数据和直接数据的来源?

间接数据:公开出版的报纸、书籍及相关网站中的数据,也可以从调查公司或数据库等处购买,有些未公开的数据在获得数据所有者允许的情况下也可以使用。直接数据:专门组织的调查或观察,科学试验。

2、统计调查方式包括:普查、抽样调查、统计报表调查、重点调查

3、普查

定义:指一个国家或一个地区为详细地了解某项重要的国情国力而专门组织的一次性、大规模的全面调查。主要用来收集某些不能够或不适宜用定期的全面调查报表收集的信息资料,以搞清重要的国情、国力,为国家制定有关政策或措施提

供依据。

特点:①通常是周期性进行;②需要规定统一的标准时间,避免调查数据重复与遗漏;③相对于其他调查方式,所得资料更全面、更系统,可以为抽样调查或其他调查提供基本依据;④涉及面广、工作量大、时间较长,而且需要大量人力物力、组织工作较为繁重,因此普查的适用范围较窄,主要用于调查一些关系国计民生的基本现象。

4、统计报表调查

定义:指按照国家有关法规规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的统计调查方法。

分类:按内容和实施范围不同,分为国家统计报表、部门统计报表和地方统计报表;按报送周期长短不同,报表分为日报、旬报、季报、半年报和年报;按填报单位不同,报表分为基层统计报表和综合统计报表。

5、重点调查

定义:指在调查对象中选择一部分重点单位进行调查,用以反映总体基本情况的一种非全面调查方法。

适用:当调查任务值要求掌握基本情况,而部分单位又能集中地反映所要研究的问题,采用重点调查较为适宜。

6、我国统计调查方法体系,就整个统计工作来说,应该以周期性普查为基础,以经常性的抽样调查为主体,辅之以其他调查方法。

7、调查方案结构

①调查目的;

②调查对象、调查单位和报告单位;

③调查项目与调查表;

④调查时间、调查期限、调查方式与调查方法;

⑤调查的组织实施计划

8、问卷设计

问卷结构:问卷标题、问卷说明、填写要求、甄别部分、主体内容、编码、背景。提问要求:①提问内容尽可能短;②用词通俗、准确;③避免诱导性、否定式提问;④避免敏感性问题;⑤一项问题一般只包含一个问题

问题排序:注意问题排序的逻辑性、兴趣性,应先易后难,开放性问题放最后。回答项目设计:开放性问题:填空、自由回答;

封闭性问题:两项选择法、多项选择法、顺序选择法、评定尺度法、双向列联法。

9、数据审核

间接数据:适用性、时效性

直接数据:及时性、完整性、准确性

第三章数据分布特征描述

1、简单算术平均数与加权算术平均数

算术平均数:指将一组数据相加后除以数据个数所得到的一个数值,也称均值。简单算术平均数:数值大小只与变量值大小有关,

加权算术平均数:数值大小不仅受各组变量值(或组中值)大小影响,而且受频率的影响。某组频率越大,改组数据大小对平均数的影响就越大。

权数起作用的两个条件:①各变量值之间有差异;②各变量值的权数有差异。注意:用各组组中值代表其实际数据计算算术平均值时,通常假定各组数据在组内是均匀分布的,相应的组中值近似等于各组的平均数。如果实际数据与这一假定吻合,则计算结果比较准确,否则出现较大误差。

2、调和平均数:指对变量值的倒数求平均,然后再取倒数而得到的平均数,也称倒数平均数,以H m表示。数学定义看与算术平均不同,但在社会经济应用领域,调和平均数实际上只是算术平均数的另一种表现形式,二者本质上是一致的,唯一区别是计算时使用了不同的数据资料。

3、几何平均数:指n个变量值乘积的n次方根,也称几何均值,以G m表示。是计算平均比率或平均发展速度最适用的一种方法。分布数列中各变量值呈几何级数变化或频率分布极不对称,也常采用几何平均法。

4、标准分数:一组数据中单个变量值与其平均值的离差除以标准差的值,也称标准化值,记为Z。可用来判断一组数据有否离群点(对称分布——经验法则;非对称分布——切比雪夫不等式)

第四章时间数列分析与预测

1、时间数列分类

按生成时间数列影响因素,可分为平稳时间数列和非平稳时间数列。

按统计指标数值的表现形式不同,可分为绝对数时间数列、相对数时间数列和平均数时间数列。绝对数时间数列又派生出时期数列和时点数列。

2、区分平稳数列与非平稳数列的意义

在于数列的预测,平稳时间数列表明现象的未来与其历史过程具有高度相似性,因而可用其历史值预测其未来;但对非平稳时间数列,则需先认识其变化规律,在此基础上,再利用事物发展的惯性预测其未来。

3、时间数列分析常用统计方法:图形描述法(线图)、指标分析法、构成因素分析法和预测法

4、时间数列分解的统计分析中,将T、S、C、I之间关系作出三种假设:

①各构成因素相互独立,用加法模型表示:y i=T i+S i+C i+I i;

②各构成因素非独立,用乘法模型表示:y i=T i*S i*C i*I i;

③各构成因素有独立也有非独立,表现为混合模型。

5、分离长期趋势方法

①修匀法:在原时间数列的基础上生成一个新数列,借新数列来反映原数列长期趋势的方法,常见的如移动平均法、指数平滑法;

②模型拟合法:观察原时间数列线图中现象变化轨迹的形态,拟合一条与该轨迹形态相适应的曲线,借此曲线来反映原数列长期趋势的方法,最常用的是最小二乘法。

6、采用移动平均法分离长期趋势应注意的问题

①合理选择步长k;

②注意新数列中各项观察值位置的排列(奇数一次平均,偶数两次平均);

③注意移动平均法的局限性。奇数项移动首尾少(k-1)/2,偶数项少k/2,步长越大修匀作用越大,原有数列的信息损失越多,当数据量不足时(n<50)不宜采用该方法。

7、相比移动平均,指数平滑法的优点

①平滑值的计算所用数据量和计算量都很少;

②α(1-α)i随i的增大而变小,说明滞后期越长的数据对未来的影响越小,即体现出“近大远小”的思想。

8、模型拟合法的操作步骤

首先根据时间数列变动的形态特征,选择一条曲线(模型),然后估计参数,最后依此模型计算出的趋势值来构造新时间数列以反应原数列的长期趋势。该方法的关键问题在于如何选择合适的模型以及用什么方法估计模型中的参数。

9、拟合模型的确定

可根据时间数列线图确定,此外可计算相关指标来确定。

(1)若时间数列观察值y的逐期增长量(一阶差分y i-y i-1=Δi)大体相等,则其趋势线近似于一条直线,即拟合模型为y=a+bt;

(2)若y的二阶差分(Δi-Δi-1)大体相等,则其趋势线近似于一条抛物线,拟合模型为y=a+bt=ct2;

(3)若y的对数的一阶差分( Iny i-Iny i-1) 大体相等,则其趋势线近似于一条指数曲线,等等。

10、季节变动基本特征:周期性、重复性、相似性。

11、季节指数:若干年同期观察值的均值与所有观察值的总均值之比值,称为该期的季节指数。

12、季节指数计算方法

①同期平均法:直接将若干年同期观察值的均值与所有观察值的总均值对比,计算出一个年度内各月或各季节的季节指数。该方法在时间数列长期趋势不明显或者长期趋势不存在时使用。

②趋势剔除法:是时间数列长期趋势较明显情况下分解季节变动的一种方法。基本思想是先从时间数列中将长期趋势剔除掉,然后再应用“同期平均法”剔除循环变动和不规则变动,最后通过计算季节指数来表现季节变动。趋势剔除法是长期趋势测定方法和上述同期平均法的结合运用。

13、时间数列预测

平稳时间数列:简单平均法、移动平均法、指数平滑法

趋势非平稳时间数列:趋势外推预测法

季节非平稳时间数列:回归模型

趋势-季节非平稳时间数列:建立趋势季节模型

第五章统计指数

1、统计指数

广义上说,指数是指一切用来测定社会经济现象数量变动或差异程度的相对数。狭义上说,统计指数是指综合反映复杂总体数量变动方向和程度的特殊相对数。

2、分类

①按研究范围不同,分为个体指数和总体指数;

②按计算方法不同,分简单指数和加权指数;

③按所表明现象的属性特征不同,分数量指标指数和质量指标指数;

④按采用基期不同,分环比指数和定基指数

3、编制总指数的基本原理

首先,确定同度量因素,通过同度量因素将复杂现象同度量化,使各因素能直接

相加。

其次,确定同度量因素的时期,即根据实际情况固定在某个时期,以单纯考察复杂现象中研究的那个因素的综合变动情况。

最后,将属于不同时期的两个总量指标对比,得出反映复杂总体综合变动的总指数。

编制总指数时,依据所选用的权数及加权形式的不同,计算方法主要有加权综合法和加权平均法。

4、加权综合法:指对复杂总体通过引入同度量因素并将其固定在某一时期来编制总指数,以反映总体综合变动程度的指数编制方法。分为基期加权综合法和报告期加权综合法。

5、为什么派氏价格指数应以报告期的实际销售量作为同度量因素?

编制物价指数的目的不仅要反映市场物价水平变动的方向和程度,还要反映这种变动对社会经济生活带来的实际影响,即物价变化对国家、企业、人民群众货币收支和生活水平的实际影响。由于物价变化发生在报告期,国家、企业、居民因物价变动而得到的实惠或受到的损失也与报告期购买量有关,而不可能与物价变动以前的任何一个时期的购买量有关。所以,从应用的角度来讲,用派氏指数编制物价总指数应当以报告期的实际销售量作为同度量因素,才具有现实的经济意义。

6、拉氏销售量总指数与派氏销售量总指数

拉氏销售量总指数是以基期物价作为权数,目的是说明在基期物价水平不变的前提下,销售量综合变动的程度。不足之处在于使用基期水平作权数,与实际的经济运行结果脱节。

派氏销售量总指数以报告期物价作为权数,目的是说明在报告期物价水平不变的前提下,销售量综合变动的程度。虽然考虑了现实的经济意义,但不足之处在于使用报告期的权数,资料不能迅速取得,工作量较大;同时由于指数数列中各期权数不同,指数数值之间不能直接进行比较。总之,这两个公式各有利弊。在实际工作中,编制数量指标总指数时倾向于将作为同度量因素的质量指标(权数)固定在基期;编制质量指标总指数时,则倾向于将作为同度量因素的数量指标(权数)固定在报告期。

7、加权平均法:指以个体指数k为基础,采用相应的总量数据pq为权数加权计总指数的方法。分为加权算术平均法(以p0q0为权数)、加权调和平均法(以p1q1为权数)和固定加权平均法(权数一定时间内不变)。

8、加权综合法与加权平均法的联系和区别

加权综合法与加权平均法是编制总指数的方法,两者之间既有联系,也存在区别。

(1)两者之间的联系。

其一,两种方法都是单指数的编制方法,其最后结果都是总指数。

其二,在一定条件下,两类指数间具有变形关系,即只有使用(p0q0)或(p1q1)这个权数时,加权平均指数才是加权综合指数的变形;如果使用(p0q0)或(p1q1)以外的权数时,这种变形关系不会存在。

其三,当掌握的资料不能直接用加权综合法计算总指数时,则可用它的变形(加权平均指数)形式计算,这种条件下的加权平均指数与其相应的加权综合指数具有完全相同的经济意义与计算结果。

(2)两者之间的区别。

其一,两种方法计算总指数的出发点不同。在解决复杂总体不能直接同度量的问

题上,加权综合指数是通过引人同度量因素,先计算出总体的总量,然后进行对比,即先综合后对比;而加权平均指数则是在个体指数基础上进行加权平均计算总指数,即先对比,后综合,两种方法各有其独立的意义。

其二,两种方法所用权数不同。加权指数使用的权数(同度量因素)是不同时期的数量(产量或销售量)或是物价,平均指数所使用的权数是不同时期的价值量(产值或销售额)。

其三,两种方法编制指数所依据的资料不同。加权指数需要有总体的全面资料,所选用的同度量因素要求比较严格,一般应采用与指数指标有明确经济联系的指标。而平均指数既适用于全面资料,也适用于非全面的资料。

9、指数体系:指经济上具有一定联系,而且在数量上具有一定对等关系的三个或三个以上的指数所构成的一个整体。构建指数体系目的,就是分析多种因素的变动对经济总体变动的影响情况。

10、因素分析:指利用指数体系从相对数和绝对数两方面分析现象的总变动受各个因素变动影响的情况。

11、价值总量的两因素分析原则:一个因素指数的同度量因素固定在报告期,另一个因素指数的同度量因素固定在基期。

12、多因素分析过程注意点

(1)多因素分析必须遵循连环代替法的原则,即在分析受多因素影响的事物的发展变化时,要逐项分析,逐项确定同度量因素。分析第一个因素变动影响后,接着分析第二个因素的影响,然后再分析第三个因素的影响,以此类推。

(2)在多因素分析中,为了分析某一因素的影响,要求把其余因素固定不变。具体方法是:当分析第一个因素的影响时,就把其它所有因素固定不变,并都作为同度量因素固定在基期;当分析第二个因素的变动影响时,则把已经分析过的因素固定在报告期,没有分析过的因素仍固定在基期;当分析第三个因素的变动影响时,就把已经分析过的两个因素固定在报告期,没有分析过的因素固定在基期,依次类推。

(3)对多因素的排列顺序,要具体分析现象总体的经济内容,使之符合客观事物的联系或逻辑,保证相邻两个指标相乘具有实际含义。各因素顺序的排列一般应遵循数量指标因素在前,质量指标因素在后的原则。

13、工业生产指数:指以代表产品的生产量为基础,用报告期产量除以基期产量取得产品产量的个体指数,并以工业增加值为权数来加权计算的总指数。该指数实质上是工业生产量总指数,它反映的是某一时期工业经济的景气和发展趋势,可以表明一个国家经济发展的其本情况。

14、工业生产者价格指数:指反映工业生产产品出厂价格和购进价格在某个时期内变动趋势和变动幅度的相对数。该指数包括工业生产者出厂价格指数(Producer Price Index for Industrial Products, 简称PPI)和工业生产者购进价格指数。前者反映工业企业产品第一次出售时的出厂价格的变化趋势和变动幅度。后者反映工业企业作为中间投入产品的购进价格的变化趋势和变动幅度。

15、货币购买力指数:是指反映单位货币所能买到的商品和服务的数量,即货币购买力变动情况的相对数。

该指数的大小,直接受商品和服务价格的影响。商品和服务价格上涨,单位货币购买力就下降,居民以货币购买的商品和服务的数量就减少,生活水平就会下降。在实际测算中,往往是采用货币购买力指数来反映不同时期货币购买力的变动,以说明单位货币在不同时期所能获得的商品和服务数量的变动情况。

货币购买力指数实际是居民消费价格指数(含消费品价格指数和服务性支出价格指数)的倒数。货币购买力指数反映了币值的稳定程度,综合反映了各时期币值的变动情况,可以从一个侧面分析一个国家的财政经济状况,寻找影响币值稳定程度的因素和解决存在问题的办法。

16、股票价格指数:指根据选择的那些具有代表性和敏感性强的样本股票某时点平均市场价格计算的,用以反映某一股市股票价格总变动趋势的相对数。该指数通常简称股价指数。

17、国内生产总值缩减指数:指现价国内生产总值与不变价国内生产总值相比得到的反映价格变动趋势的相对数,又称国内生产总值缩平减指数,简称GDP缩减指数。

第六章综合评价方法

1、综合评级方法

定义:指以被评价事物在不同侧面的数量特征为基础,通过运用一系列数学、统计学及其他定量方法将这些数量特征指标转化为一个能够反映综合情况的指标,并以此对被评价事物进行整体评价的方法体系。

特征:

①与单项评价相比,综合评价包含了若干个指标,这多个指标分别说明被评价对象的不同方面;

②虽然包含了多个指标,但最终只用一个综合指数来说明被评价对象的一般水平;

③由于被评价对象包含了多个指标,需要先对被评价对象进行层次拆分寻找这些指标,再将这些指标合并成为一个总指标进行数值反映;

④综合评价需要处理多个指标数据,评价方法相对单项评价而言要复杂得多。

分类:

①按目的划分,综合评价可分为分类问题、排序问题和整体水平评价问题;②按时间状况分,综合评价可分为纵向评价问题、横向评价问题;

③按使用方法分,综合评价可分为使用传统方法的综合评价问题、使用现代方法的综合评价问题;

④按定量化程度分,综合评价可分为定性评价、定量评价和半定性评价问题;

⑤按赋权方法分,综合评价方法分为主观赋权法、客观赋权法、主客观结合赋权法。

基本要素:①评价目的;②评价者;③被评价对象;④评价指标;⑤指标权重;

⑥评价方法;⑦评价结果;

基本步骤:①确定评价的目的;②确定评价对象和属性集;③对属性集中的指标数据进行搜集和处理;④确定权重系数和价值函数;⑤给出评价结果;⑥对评价结果进行检验;⑦分析和运用评价结果。

2、评价指标体系

构建原则:①目的性原则;②层次性原则;③综合性原则;④可操作性原则;⑤代表性原则;⑥简要性原则(不重复)

建立的基本内容:①评价指标体系层次构造;②单个指标的选择

3、指标筛选方法:①最小均方差法;②极小极大离差法;③极大不相关法

4、数据处理

无量纲化:①阈值法;②标准化法

同向化:①极小型指标;②居中型指标;③区间型指标

5、综合评价指标体系的检验

单项指标检验:可行性、正确性、真实性

指标体系的检验:协调性、完整性、一致性

6、指标权重确定:包括主观赋权法、客观赋权法和组合赋权法

主观赋权法主要是从定性角度,根据各个指标的经济意义以及其对所研究的问题作用大小由专家确定相应指标的权重。因此,该类方法比较充分地考虑了客观的实际情况,使指标的权数相对具有现实意义。但这种方法不可避免地带有主观随意性。

而客观赋权法则是从定量角度,依据各个指标的数值所提供的信息量大小来确定相应的指标权重。该类方法借助指标数值本身的特征,避免了主观判断造成的随意性,但对指标具体经济意义重视不够。

组合赋权法虽然力图把主观赋权法与客观赋权法的优缺点整合到一起,但整合过程中存在平均分配权重的现象,因而,也不可避免地存在缺陷。

常见赋权法:等权法、离差权法、层次分析法(AHP)等等…

7、综合权数计算:①线性综合法;②几何综合法;③混合综合法

第七章概率与抽样分布

1、正态分布的重要意义

①它是最常见的一种分布,现实中许多随机变量都服从正态分布;

②它是许多常用分布的极限分布,如二项分布、X2分布、t分布和F分布等,可用于近似计算;

③它是构造许多常用分布的基础,例如小样本的精确分布就是正态分布推导出的。

第八章参数估计

1、分类

参数估计法按是否考虑估计误差及发生概率的大小,分点估计和区间估计;

点估计法又分矩估计法、最大似然估计法和最小二乘法等。

2、矩估计法

定义:指以样本矩的某一函数代替总体矩的同一函数来构造估计量的方法。最简单的矩估计法是用一阶样本原点矩来估计总体的期望,而用二阶样本中心矩来估计总体的方差。

优点:原理简单、使用方便,使用时可以不知总体的分布,而且具有一定的优良性质如矩估计为总体参数的一致最小方差无偏估计。

不足:

①对于总体原点矩不存在的分布(如柯西分布等)不能应用;

②要求大样本。由于它只涉及总体的一些数字特征,并未用到总体的分布,因此矩法估计量实际上只集中了总体的部分信息,这样它在体现总体分布特征上往往性质较差,只有在样本容量n较大时,才能保障它的优良性,因而理论上讲,矩法估计是以大样本为应用对象的;

③矩估计量不具有唯一性,即在一般场合下,使用不同阶的总体矩可得到不同的矩估计形式。

3、极大似然估计法

定义:在总体类型已知条件下,先利用总体分布信息构造出似然函数,再对似然函数求解估计出参数的一种方法。

基本思想:当经一次抽样取得一些观测数据(样本值)后,应给未知参数选取一些数值,使得所观测得到的样本值出现的概率最大。

4、枢轴量:从参数θ的一个点估计出发,构造与θ有关的一个函数G,使得G 的分布是已知的,而且与θ无关,通常称这种函数为枢轴量。枢轴量是随机变量,但由于包含待估总体参数,所以并不是统计量。

5、区间估计法基本步骤

①确定待估参数;

②构造与待估参数相对应的枢轴量;

③确定枢轴量的抽样分布;

④依照枢轴量的抽样分布,由给定的置信度计算待估参数置信区间的上、下限

6、确定样本容量的必要性

对于一个实际问题来说,样本容量为多大,在进行抽样调查之前就必须确定,否则将无法进行抽样。作为一项调查研究活动,统计推断总是在一定成本的约束下进行的。另外,样本容量越大,样本对总体的代表性就越高,从而抽样误差就越小;反之,样本容量过小,就难以保证样本对总体的代表性,从而导致抽样误差增大,满足不了推断精确度的要求。所以,从推断的角度来看,要达到估计所要求的精确程度,自然要求样本容量越大越好;但从抽样的角度来看,增大样本容量,势必增加人力和物力,从而导致调查成本增大。于是,在抽样推断中,要在统计推断的精确度与调查成本这一对矛盾间进行权衡。

第九章假设检验

1、假设检验

定义:是统计推断的另一种方式,它在对总体的未知参数或总体服从的分布等问题作出判断时,首先提出某种假设,例如假设未知参数为某一常数或总体服从某已知分布等,然后由样本提供的信息,对所做假设的“真实性”作出否定还是不否定,即拒绝还是接受的假定。

特点:①假设检验采用逻辑上的反证法,即为了检验一个假设是否成立,首先假设它是真的,然后对样本进行观察,如果发现出现了不合理现象,则可以认为假设是不合理的,拒绝假设;否则可以认为假设是合理的,接受假设;

②假设检验采用的反证法带有概率性质。所谓假设的不合理不是绝对的,而是基于小概率原理。

2、确定原假设和备择假设的原则

(1)当目的是希望从样本观察值取得对某一论断有力的支持时,把这一论断的否定作为原假设H

,人们常常把那些保守的、历史的、(2)把由过去资料所提供的论断作为原假设H

经验的结果取为原假设,而把那些猜测的、可能的、预期的结果取为备择假设;

(3)把等号放在原假设中。例如,“=”或“≤”或“≥”。

3、假设检验与区间估计的联系和区别

联系:

(1)都是根据样本信息对总体参数进行推断;

(2)都是以抽样分布为理论依据;

(3)都是建立在概率基础上的推断,推断结果都有风险;

(4)可对同一参数进行判断。

区别:

(1)方法不同。区间估计是依据样本资料估计总体的未知参数的可能范围,假设检验是根据样本资料来检验对总体参数的先验假设是否成立;

(2)应用范围不同。区间估计通常进行的是参数的估计,假设检验不仅有参数检验,也有非参数检验;

(3)特点不同。区间估计立足于大概率通常以较大的把握程度(1-a)去估计总体参数的置信区间。假设检验立足于小概率,通常是给定很小的概率去检验对总体参数的先验假设是否成立;

(4)所使用的变量的性质不同。区问估计使用的随机变量是枢轴量,其分布有定理保证,即是无条件成立。假设检验使用的随机变量是检验统计量,其分布是有条件已知,即在原假设成立条件下已知,在原假设不成立时则分布未知。

临界值的大小,进而对4、临界值检验法:通过比较检验统计量的值与原假设H

作出拒绝还是不拒绝的决策的假设检验方法。

原假设H

5、P值检验法:指用P值大小对原假设做决策的检验法,又称概率值检验法。

依据很强;

一般地,P≤0.01,检验高度显著,拒绝H

依据是强的;

0.01<P≤0.05,检验是显著的,拒绝H

依据是弱的;

0.05<P≤0.1,检验是不显著的,拒绝H

若0.1<P,则称没有理由拒绝H

6、对两类错误的控制

当样本容量n固定时,若减少犯一类错误的概率,则犯另一类错误的概率往往增大。若要使犯两类错误的概率都减小,则只有增加样本容量。但是,扩大样本容量必然增加调查费用,从经济性要求和成本约束两方面讲,样本容量的增加是有上限的。这样一来,就需要对这两类错误的性质进行评估,根据哪一类错误造成的后果更加严重,从而确定要控制的首要目标。

统计学家J.内曼(J. Neyman)和E.皮尔逊(E. Pearson)提出的原则是:在控制犯第一类错误的概率α的条件下,使犯第二类错误的概率β尽量减小。其含义是:原假设要受到保护,使它不至于轻易被否定,因为假设检验是从不利于原假设的角度来对原假设作决策的;若检验结果否定了原假设,则说明否定的理由是充分的。同时,犯第一类错误的概率α受到控制,亦使作出否定判断的可靠程度(1-α)得到了保证。

由于假设检验是针对原假设是否接受进行的,检验原假设的内容常常是明确的,而备择假设的内容常常是模糊的。故在假设检验中,通常的做法是把控制犯第一类错误的风险放在优先考虑的位置上,这也是为什么α是研究者事先给定的理由。

第十章方差分析与列联表分析

1、方差分析模型四个假定:可加性、正态性、方差齐性、独立性

2、方差分析中可加性假设的意义

①说明观察值x ij与随机误差εij为线性关系,两者同分布;

②说明总体均值μj与随机误差εij相互独立。

3、计算均方误差的必要性:为了消除各水平下试验次数对离差平方和大小的影响,需要计算离差平方和的均方。

4、LSD法

定义:最小显著差异法,是同时比较多个正态总体均值间两两差异的一种统计方法,由英国统计学家费雪于1935年提出。

特征:事先不设定比较标准,规定每一次检验的第一类错误的误判概率均为α。

5、因素和处理

处理:按照因素的给定水平对试验对象所做的操作,称为处理。

单元:接受处理的试验对象,称为试验单元,简称单元。

处理与因素关系:在单因素试验中,实施在试验单元上的具体项目就是因素的某一个水平,即因素的一个水平就是-个处理。但在双因素试验中,实施在试验单元上的具体项目是各因素的某水平组合,即两因素交叉分组形成的一个水平组合是一个处理。一个处理既是一个试验条件,也是一个总体。

当因素A分r个水平,因素B分5个水平时,试验单元共分成rs个组,每组随机地接受一种处理。若各组按各处理只做一次实验,称为两因素无重复试验;若各组按各处理均做多次试验则称为两因素重复试验。

需注意,两因素无重复试验数据不能考察两因素间的交互作用。

6、列联表分析

定义:指根据观测数据编制列联表,检验定性变量之间是否独立的统计分析方法。原理:根据样本数据编制列联表,提出要检验的假设“H

:定性变量相互独立”,构造服从χ2分布的检验量,计算检验量χ2的值并作出是否拒绝原假设的决策。χ2检验的期望值准则:

①独立性检验时增大样本容量使得每个单元格的期望频数均不小于5;

②拟合优度检验时合并相邻组使得每组的期望频数均不小于5.

第十一章线性回归分析

1、相关关系分类

①按涉及变量的多少不同,分为单相关(一个变量对于另一个变量)、复相关(一个变量对于两个或两个以上变量)和偏相关(假定其他变量不变,两个变量的相关关系);

②按变量之间密切程度不同,分完全相关、不完全相关和不相关;

③按表现形态不同,分线性相关和非线性相关。

2、一元线性回归模型的基本假定与意义

假定1:误差项的期望值为0,即对所有的i有E(ε

i

)=0;

假定2:误差项的方差为常数,即对所有的i有Var(ε

i )= E(ε

i

2)=σ2

假定3:误差项之间不存在自相关关系,其协方差为0,即i≠j时,有Cov

(ε

i ,ε

j

)=0;

假定4:自变量是非随机变量,与随机误差项线性无关;

假定5:随机误差项服从正态分布,ε

i

~ N(O,σ2)。

以上这些基本假定是德国数学家高斯最早提出的,故也称为高斯假定或标准假定。

假定1的实际意义在于:凡是模型中不显含而归属于ε

i

的因素,对y的均值

都没有系统的影响,正的ε

i 值抵消了负的ε

i

值,它们对y的平均影响为零;

假定2表示对应于不同x

i 值,ε

i

的方差σ2是常数。这也意味着对应于不同

的x

i

值,y的方差也是常数σ2;

假定3中,对于任意指定的i和j,随机误差项之间无序列相关或无自相关;

假定4表示随机误差项ε

i 和解释变量x

i

是不相关的。也就是说在总体回归

模型中, x

i 和ε

i

对y有各自的影响。但是,如果ε

i

和x

i

是相关的,就不可能评

估他们各自对y的影响。

假定5中,随机误差项ε服从正态分布,也就是ε

i

~ N(0,σ2)。

3、三种检验的关系

回归方程显著性的F检验、回归系数显著性的t检验以及相关系数显著性的t检验这三种检验之间存在一定的关系。对一元线性回归这三种检验的结果是完全一致的,可以证明回归系数显著性的t检验与相关系数显著性的t检验是完全等价的,而F统计量则是t统计量的平方。因而对-元线性回归实际只需要作其中的一种检验即可。然而,对多元线性回归来说,这三种检验所要检验的对象不同,所以并不等价,其检验的意义是不同的。

4、偏相关系数:指在多元线性回归分析中,假定在其他自变量保持不变的条件下,分别计算所得的每一个自变量与因变量相关关系密切程度的统计指标。剔除某个变量时可参考偏相关系数。

5、复相关系数:指在多元线性回归分析中,同时考虑因变量与多个自变量之间相关关系密切程度的统计指标。两个变量的相关系数有正负之分,而负相关系数都取正号。

第十三章非参数统计

1、非参数统计的宗旨:在不假定总体分布的情况下,最大可能地从数据本身获得所需要的信息。

2、数据的秩:从非参数角度来看,一组数据最基本的信息就是次序,如果可以把数据点按大小次序排列,则每一个样本都有它在全体样本中的位置或次序,样本的位置或次序称为数据的秩。

3、单样本χ2拟合优度检验步骤(检验总体分布)

①提出假设H0:F(X)=F0(x),计算各区间实际频数和理论频数;

②选择适当统计量χ2;

③确定临界值(右侧检验);

④计算检验统计量的值;

⑤结论

4、符号检验(Sing Test):是最简单、最古老的非参数统计方法,它是利用正号(大于中位数记正号)和负号(小于中位数记负号)的数目对原假设进行统计推断的方法。

5、Wilcoxon符号秩检验

Wilcoxon符号秩检验是对符号检验的一种改进,前面的符号检验只利用了样本与中位数差异方向上的信息,并未考虑到差异的大小。不同的符号代表了在中心位置的哪一边,而差别的绝对值的秩的大小代表了距离中心的远近。如果把两者结合起来,自然比仅用符号更有效。所以Wilcoxon符号秩检验弥补了符号

检验的不足。注意:为了检验的可行性,Wilcoxon符号秩检验需假定样本X

1,…,X

n

来自连续对称总体(符号检验不需要此假设)。

统计思想:

Wilcoxon符号秩检验是检验关于中位数对称的总体中位数是否等于某个特定值,检验假设为

H 0:M=M

;H

1

:M≠M

H 0:M≤M

;H

1

:M>M

H 0:M≥M

;H

1

:M<M

从总体中随机抽取n个样本点X

1,…,X

n

,它们与M

的差值记为D

i

,D

i

=X

i

- M

(i=1,

2,…,n)。如果H

0为真,那么样本点围绕M

上下浮动,即D

i

关于0对称。

这时,对于D

i

来说,正的差值和负的差值应近似地相等。为了借助秩统计量进

行假设检验,先忽略符号,而取绝对值|D

i |,对n个|D

i

|按大小顺序进行排序并找

出他们分别对应的n个秩。再按D

i

本身符号的正、负分别加总它们的秩,得到正

秩的总和T

+与负秩的总和T

-

H

为真时,正秩的总和与负秩的总和应该近似相等。如果正秩的总和远远大于负

秩的总和,表明大部分大的秩是正的差值,即D

i

为正的秩大。这时,数据支持备

择假设H

1:M>M

,即实际的中位数比M

大。类似地,如果负秩的总和远远大于

正秩的总和,表明大部分大的秩是负的差值,即D

i

为负的秩大。这时,数据支

持备择假设H

1:M<M

,即实际的中位数比M

小。因为正秩和负秩的总和是个恒定

的值,即1+2+…+n= n(n+1)/2,因此对于双侧备择假设H

1:M≠M

来说,两个总和

中无论哪一个太大,都可以被支持。

Wilcoxon 符号秩检验所定义的检验统计量为:正秩的总和T

+和负秩的总和T

-

6、配对符号检验和配对Wilcoxon符号秩检验法假定

①每一对数据或者来自同一个对象或者来自可比较的类似对象;

②对与对之间是相互独立的。

7、Pearson相关系数

定义:设随机变量X与Y具有有限非零方差,则X与Y之间的线性相关系数为Pearson相关系数流行原因:①容易计算;②线性变换下容易处理;③严格递增线性变换情况下相关系数不变

不足:

(1)随机变量X与Y要求具有有限非零方差,否则线性相关系数无法定义;

(2)两变量独立意味着他们不相关,但不相关通常并不独立。只有在随机变量X 与Y具有正态分布情况下,独立与不相关才是等价的;

(3)在非线性严格递增变换的情况下相关系数不是不变的;

(4)对于ρ检验需假设总体服从正态分布。

《统计学》_第三章_统计整理

… 第三章统计整理 (一)填空题 1、统计整理是统计工作的第三阶段。在这一阶段,通过对原始资料进行科学的加工,可以得出反映事物总体特征的资料。 2、统计整理在统计分析中起着承前启后的作用,它既是统计调查的必然继续,又是统计分析的基础和前提条件。 3、统计分组实质上是在统计总体内部进行的一种定性分类。 4、对原始资料审核的重点是真实性。 5、区分现象质的差别是统计分组的根本作用。 6、标志是统计分组的依据,是划分组别的标准。 ' 7、根据分组标志的特征不同,统计总体可以按品质分组,也可以按数量分组。 8、对所研究的总体按两个或两个以上的标志结合进行的分组,称为复合分组。 9、次数分布数列根据分组标志特征的不同,可以分为品质分布数列和数量分布数列两种。 10、变量数列是单项变量分组、组距式分组所形成的次数分布数列。 11、按品质标志分组的结果,形成品质分布数列。 12、组限是组距变量数列中表示各组数量界限的变量值,其中下限是指最小值的变量值,上限是指最大值的变量值。 13、组距变量数列的组距大小与组数的多少成反比。与全距的大小成正比。 14、组距变量数列的分布可以用次数分布曲线图表示。 — 15、划分连续变量的组限时,相邻组的组限必须重叠;划分离散型变量的组限时,相邻组的组限可以重叠,也可以不重叠。 16、统计资料的整理方法主要有统计分组和统计汇总两种。 17、钟形分布、U形分布和J形分布是次数分布的三种主要类型。 18、统计分组体系有品质标志分组和数量标志分组两种。 19、统计表按主词是否分组和分组的程度可分为简单表、简单分组表和复合分组表三种。 20、统计表从内容结构上看,是由主词和宾词两部分构成。 (二)单项选择题(在每小题备选答案中,选出一个正确答案) · 1、统计分组的结果表现为( A ) A. 组内同质性,组间差异性 B. 组内差异性,组间同质性 C. 组内同质性,组间同质性 D. 组内差异性,组间差异性 2、统计分组的依据是( A ) A、标志 B、指标 C、标志值 D、变量值 3、下面属于按品质标志分组的有( C ) A. 企业按职工人数分组 B. 企业按工业总产值分组 C. 企业按经济类型分组 D. 企业按资金占用额分组 ; 4、统计分组的关键在于( A ) A、正确选择分组标志 B、正确划分各组界限

统计学原理计算题试题及答案(最新整理)

电大专科统计学原理计算题试题及答案 计算题 1某单位40名职工业务考核成绩分别为 68 89 8884 86 87 75 73 72 68 75 82 9758 81 54 79 76 95 76 71 60 9065 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60 — 70分为及格,70 — 80分为中,80 — 90 分为良,90 — 100分为优。 要求: (1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)分析本单位职工业务考核情况。 解:(1) (2)分组标志为”成绩",其类型为" 的开放组距式分组,组限表示方法是重叠组限; (3)本单位的职工考核成绩的分布呈两头小,中间大的”正态分布”的形态, 说明大多数职工对业务知识的掌握达到了该单位的要求。 2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下 价格(元/斤) 甲市场成交额(万元) 乙市场成交量(万斤) 品种

试问哪一个市场农产品的平均价格较高?并说明原因 解:先分别计算两个市场的平均价格如下: 甲市场平均价格 X m 5.5 1.375 (元 /斤) m/x 4 乙市场平均价格 X xf 5.3 1.325 (元 / 斤) f 4 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场 平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同 3. 某车间有甲、乙两个生产组,甲组平均每个工人的日产量为 36件, 标准差为9.6件;乙组工人日产量资料如下:

统计学学习指导书

篇一:统计学学习指导书(最新) 统计学 学习指导书 安徽财经大学 2012.02 第一章绪论 学习目的和要求: 通过本章的学习,要求了解统计学产生与发展的历史;明确统计与统计学的涵义、统 计学的研究对象、特征、统计学的学科性质及研究方法等一些基本问题;重点理解统计学中的几个基本概念。 难点释疑: 掌握以下基本概念:统计总体与总体单位,标志与指标、统计指标体系。要掌握这些 重要概念的联系与区别、特点、表现形式及其基本分类等。 练习题: (一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内) 1.“统计”一词的基本含义是( )。 ①统计调查、统计整理、统计分析 ②统计设计、统计分组、统计计算 ③统计方法、统计分析、统计预测 ④统计科学、统计工作、统计资料 2.要了解某市国有工业企业生产设备情况,则统计总体是( )。 ①该市国有全部工业企业 ②该市国有每一个工业企业 ③该市国有某一台设备 ④该市国有工业企业全部生产设备 3.有200个公司全部职工每个人的工资资料,如要调查这200个公司职工的工资水平情况,则统计总体为()。 ①200个公司的全部职工 ②200个公司 ③200个公司职工的全部工资④200个公司每个职工的工资 4.构成统计总体的个别事物称为()。 ①调查单位②总体单位 ③调查对象④填报单位 5.构成统计总体的那些个体(总体单位)必须至少在某一方面具有()。 ①差异性②同质性 ③相关性④可加性 6.调查某大学2000名学生学习情况,则总体单位是( )。 ①2000名学生②2000名学生的学习成绩 ③每一名学生④每一名学生的学习成绩7.要了解某市职工收入状况,其总体单位是( )。 ①该市所有职工②该市每名职工 ③该市所有职工的收入④该市每名职工的收入 8.某城市进行工业企业未安装设备普查,总体单位是()。 ①该市工业企业全部未安装设备 ②该市工业企业每一台未安装设备 ③该市每个工业企业的未安装设备

《统计学》_第三章_统计整理(补充例题)

第三章统计整理 计算题 例1、某厂工人日产量资料如下:(单位:公斤) 162 158 158 163 156 157 160 162 168 160 164 152 159 159 168 159 154 157 160 159 163 160 158 154 156 156 156 169 163 167 试根据上述资料,编制组距式变量数列,并计算出频率。 解:将原始资料按其数值大小重新排列。 152154 154 156 156 156 156 157 157 158158 158 159 159 159 159 160 160 159160 162 162 163 163 163 164 167 168 168 169 最大数=169,最小数=152,全距=169-152=17 例2、某企业50个职工的月工资资料如下: 113 125 78 115 84 135 97 105 110 130 105 85 88 102 101 103 107 118 103 87 116 67 106 63 115 85 121 97 117 107 94 115 105 145 103 97 120 130 125 127 122 88 98 131 112 94 96 115 145 143 试根据上述资料,将50个职工的工资编制成等距数列,列出累计频数和累计频率。 解:将原始资料按其数值大小重新排列。 6367 78 84 85 85 87 88 88 94 94 96 97 9797 98 101 102 103 103 103 105 105 105 106107 110 112 113 115 115 115 115 116 117118 120 121 122 125 125 127 130 130

统计学(计算题部分)

统计学原理期末复习(计算题) 1 ?某单位40名职工业务考核成绩分别为: 68 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60—70分为及格,70—80分为中,80—90 分为良,90—100分为优。 要求: (1)将参加考试的职工按考核成绩分组并编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)根据整理表计算职工业务考核平均成绩; (4)分析本单位职工业务考核情况。 解:(1 ) (2)分组标志为"成绩",其类型为"数量标志”;分组方法为:变量分组中的开放组距式分组,组限表示方法是重叠组限; (3)平均成绩: - xf 3080 x 77 f 40(分) (4)本单位的职工考核成绩的分布呈两头小,中间大的”正态分布”的形态,平均成绩为 77分,说明大多数职工对业务知识的掌握达到了该单位的要求。 2 ?某车间有甲、乙两个生产组,甲组平均每个工人的日产量为36件, 标准差为件;乙组工人日产量资料如下: 要求:⑴计算乙组平均每个工人的日产量和标准差; ⑵比较甲、乙两生产小组哪个组的日产量更有代表性 解: (1 )

丄15 15 25 3835 34 45 1329.5。(件) X

上限=x 77 3.34 80.3(分) (2)利用标准差系数进行判断: V 甲 9.6 X 36 0.267 V 乙 8.986 0.305 X 29.5 因为 > 故甲组工人的平均日产量更有代表性。 3?采用简单随机重复抽样的方法,在 2000件产品中抽查200件,其中合格品190件. 要求:(1)计算合格品率及其抽样平均误差 (2) 以%的概率保证程度(t=2)对合格品率和合格品数量进行区间估计。 (3) 如果极限误差为%,则其概率保证程度是多少 解:(1)样本合格率 p = n1/ n = 190/200 = 95% 抽样平均误差: (2)抽样极限误差△ p= tp = 2X % = % 下限:X △ p=95%% = % 上限:x △ p=95%+% = % 贝总体合格品率区间:(% %) 总体合格品数量区间( %x 2000=1838件 %X 2000=1962件) (3)当极限误差为%时,则概率保证程度为 % (t=A/^ ) 4 ?某单位按简单随机重复抽样方式抽取 40名职工,对其业务情况进行考核, 考核成绩 平均分数77分,标准差为10。54分,以%的概率保证程度推断全体职工业务考试成绩的区 间范围。 解: 计算抽样平均误差: 计算抽样极限误差: 2 1.67 3.34 全体职工考试成绩区间范围是: 下限=X x 77 3.34 73.66(分) 8.986 (件) P ) ■- n 10.54 40 1.67 X )2 f p

教育统计学试题库

教育统计学 一、选择题 1、当一组数据用中位数来反映集中趋势时,这组数据最好用哪种统计量来表示离散程度?( B ) A. 全距( 差异量) B. 四分位距(差异量) C. 方差(差异量) D. 标准差(差异量) 2、总体不呈正态分布,从该总体中随机抽取容量为1000 的一切可能样本的平均数的分布接近于:( D ) A. 二项分布 B.F 分布 C. t 分布 D. 正态分布 3、检验某个频数分布是否服从正态分布时需采用:( C ) A. Z检验 B. t 检验 C. X 2检验 D. F 检验 4、对两组平均数进行差异的显著性检验时,在下面哪种情况下不需要进行方差齐性检验?( B ) A. 两个独立样本的容量相等且小于30; B. 两个独立样本的容量相等且大于30; C. 两个独立样本的容量不等,n1小于30, n2大于30; D. 两个独立样本的容量不等,n1大于30, n2小于30。 5、下列说法中哪一个是正确的?( C ) A. 若r1=0.40 , r2=0.20,那么r1 就是r2 的2 倍;

B. 如果r=0.80 ,那么就表明两个变量之间的关联程度达到80%; C. 相关系数不可能是2; D. 相关系数不可能是-1 。 6、当两列变量均为二分变量时,应计算哪一种相关?( B ) A. 积差相关(两个连续型变量) B. ?相关 C. 点二列相关(一个是连续型变量,另一个是真正的二分名义变量) D. 二列相关(两个连续型变量,其中之一被人为地划分成二分变量。) 7、对多组平均数的差异进行显著性检验时需计算:( A ) A.F值 B. t 值 C. x 2 值 D.Z 值 8、比较不同单位资料的差异程度,可以采用何种差异量?( A ) A. 差异系数 B. 方差 C. 全距 D. 标准差 二、名词解释 1. 分层抽样:按与研究内容有关的因素或指标先将总体划分成几个部分,然后从各部分(即各层)中进行单纯随机抽样或机械抽样,这种抽样方法称为分层抽样。 2. 描述统计:对已获得的数据进行整理、概括,显现其分布特征的统计方法称为描述统计。 3. 集中量:集中量是代表一组数据典型水平或集中趋势的量。它能反映频数分

统计学原理课程期末考试及复习

统计学原理课程期末考试及复习 一、统计学原理考核要求 统计学原理是中央电大统开课,根据中央电大的规定,该课程的考核由形成性考核和期末考试两部分组成。 形成性考核成绩占课程总成绩的20%,内容包括4次作业、在线测试以及小组学习、自学笔记等。期末考试成绩占课程总成绩的80%,由中央电大统一命题。 二、统计学原理期末考试试题类型及结构 1、判断题:10分。考核对基本理论、基本概念的记忆和理解。 2、单项选择题:14分。考核对基本概念的理解和计算方法的应用。 3、多项选择题:8分。考核对基本概念的理解和计算方法的应用。 4、简答题:18分。考核对基本概念、基本理论、基本方法的理解和掌握情况。 5、计算题:50分。考核对基本计算方法的理解、掌握程度及综合应用能力。 三、期末考试形式及答题时限 期末考试形式为闭卷笔试;答题时限为120分钟;可以携带计算器。 四、各章复习内容 期末复习资料:教材、学习指导书习题、作业 第一章统计总论 1、统计一词的三种含义 2、统计学的研究对象及特点 3、统计学的研究方法 4、统计学的几个基本概念:总体与总体单位、标志与标志表现、变异与变量、统计指标的概念、特点及分类。理解以上几个概念,能够结合实际资料做出正确的选择和判断。 5、国家统计兼有的职能。 第二章统计调查 1、统计调查的概念和基本要求 2、统计调查的种类

3、统计调查方案的构成内容(包括调查对象、调查项目、调查时间和调查时限的含义) 4、统计调查方法:普查、抽样调查、重点调查和典型调查。理解各种调查方法的概念、 特点及应用条件。(给出实际资料能区分) 5、调查误差的种类 第三章统计整理 1、统计整理的概念和方法 2、统计分组的概念、种类(按分组的任务和作用分、按分组标志的多少分、按分组标志的性质分、单项式分组及组距式分组、组限(下限和上限)、组中值等的含义。) 3、统计分组的关键(统计整理的关键) 4、统计分组的方法:品质分组方法和变量分组的方法。能够根据实际资料选择正确的 标志进行分组。 5、分配数列的概念、构成及编制方法。能够根据实际资料编制变量分配数列(计算题)。 在正确掌握有关分组的知识的前提下,根据所掌握的资料准确的进行资料分组和数列的编制。一定要掌握单项式分组和组距式分组的方法。在编制变量分配数列的时候,对组距式数列要同时会组距、组中值的计算,直接关系到平均指标的计算。 例:某班40名学生统计学考试成绩分别为: 57 89 49 84 86 87 75 73 72 68 75 82 9781 67 81 54 79 87 95 76 71 60 90 65 7672 70 86 85 89 89 64 57 83 81 78 87 72 61 学校规定:60分以下为不及格,60─70分为及格,70─80分为中, 80─90分为良,90─100分为优。要求: (1)将该班学生分为不及格、及格、中、良、优五组,编制一张次数分配表。 (2)指出分组标志及类型;分组方法的类型;分析该班学生考试情况。

统计学第三章课后题及答案解析

第三章 一、单项选择题 1.统计整理的中心工作是() A.对原始资料进行审核B.编制统计表 C.统计汇总问题D.汇总资料的再审核 2.统计汇总要求资料具有() A.及时性B.正确性 C.全面性D.系统性 3.某连续变量分为五组:第一组为40—50,第二组为50—60,第三组为60—70,第四组为70—80,第五组为80以上,依习惯上规定() A.50在第一组,70在第四组B.60在第二组,80在第五组 C.70在第四组,80在第五组D.80在第四组,50在第二组 4.若数量标志的取值有限,且是为数不多的等差数值,宜编制() A.等距式分布数列B.单项式分布数列 C.开口式数列D.异距式数列 5.组距式分布数列多适用于() A.随机变量B.确定型变量 C.连续型变量D.离散型变量 6.向上累计次数表示截止到某一组为止() A.上限以下的累计次数B.下限以上的累计次数 C.各组分布的次数D.各组分布的频率 7.次数分布有朝数量大的一边偏尾,曲线高峰偏向数量小的方向,该分布曲线属于()A.正态分布曲线B.J型分布曲线 C.右偏分布曲线D.左偏分布曲线 8.划分连续变量的组限时,相临组的组限一般要() A.交叉B.不等 C.重叠D.间断 二、多项选择题 1.统计整理的基本内容主要包括() A.统计分组B.逻辑检查 C.数据录入D.统计汇总 E.制表打印 2.影响组距数列分布的要素有() A.组类B.组限 C.组距D.组中值 E.组数据 3.常见的频率分布类型主要有() A.钟型分布B.χ型分布 C.U型分布D.J型分布 E.F型分布 4.根据分组标志不同,分组数列可以分为() A.组距数列B.品质数列 C.单项数列D.变量数列 E.开口数列 5.下列变量一般是钟型分布的有()

统计学试题及答案

统计学试题及答案文件排版存档编号:[UYTR-OUPT28-KBNTL98-UYNN208]

统计学试题及答案 一.单选题(每题2分,共20分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2.一组数据的均值为20, 离散系数为, 则该组数据的标准差为 A 50 B 8 C D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4.已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A.5%×7%×9% B. 105%×107%×109% C.(105%×107%×109%)-1 D. 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –% C. –% D. % 6.对不同年份的产品成本配合的直线方程为 , 回归系数b= -表示 A. 时间每增加一个单位,产品成本平均增加个单位 B. 时间每增加一个单位,产品成本平均下降个单位 C. 产品成本每变动一个单位,平均需要年时间

7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间: =70件, =件乙车间: =90件, =件 哪个车间日加工零件的离散程度较大: A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间 A. 相关程度很低 B.不存在任何相关关系 C. 不存在线性相关关系 D.存在非线性相关关系 二. 多选题 (每题2分,共14分) 1. 下列数据中属于时点数的有 A. 流动资金平均余额20万元 B. 储蓄存款余额500万元 C. 商品销售额80万元 D. 固定资产300万元 E. 企业职工人数2000人 2. 在数据的集中趋势的测量值中,不受极端数值影响的测度值是

《统计学》(第四版)学习指导书以及课后习题答案

附录:教材各章习题答案 第1章统计与统计数据 1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5) 分类数据。 1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”; (2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。 1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者 的月平均花费;(4)统计量;(5)推断统计方法。 1.5(略)。 1.6(略)。 第2章数据的图表展示 2.1(1)属于顺序数据。 (2)频数分布表如下 (4)帕累托图(略)。 2.2(1)频数分布表如下

2.3 2.5(1)排序略。 (2)频数分布表如下 (4)茎叶图如下

2.6 (3)食品重量的分布基本上是对称的。 2.7 2.8(1)属于数值型数据。

2.9 (1)直方图(略)。 (2)自学考试人员年龄的分布为右偏。 布比A 班分散, 且平均成绩较A 班低。 2.11 (略)。 2.12 (略)。 2.13 (略)。 2.14 (略)。 2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量 3.1 (1)100=M ;10=e M ;6.9=x 。

(2)5.5=L Q ;12=U Q 。 (3)2.4=s 。 (4)左偏分布。 3.2 (1)190=M ;23=e M 。 (2)5.5=L Q ;12=U Q 。 (3)24=x ;65.6=s 。 (4)08.1=SK ;77.0=K 。 (5)略。 3.3 (1)略。 (2)7=x ;71.0=s 。 (3)102.01=v ;274.02=v 。 (4)选方法一,因为离散程度小。 3.4 (1)x =274.1(万元);M e=272.5 。 (2)Q L =260.25;Q U =291.25。 (3)17.21=s (万元)。 3.5 甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原 因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。 3.6 (1)x =426.67(万元);48.116=s (万元)。 (2)203.0=SK ;688.0-=K 。 3.7 (1)(2)两位调查人员所得到的平均身高和标准差应该差不多相 同,因为均值和标准差的大小基本上不受样本大小的影响。 (3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。 3.8 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生 体重的离散系数0.08。 (2) 男生:x =27.27(磅),27.2=s (磅); 女生:x =22.73(磅),27.2=s (磅); (3)68%; (4)95%。 3.9 通过计算标准化值来判断,1=A z ,5.0=B z ,说明在A项测试中 该应试者比平均分数高 出1个标准差,而在B 项测试中只高出平均分数0.5个标准差,由于A 项测试的标准化值高于B 项测试,所以A 项测试比较理想。 3.10 通过标准化值来判断,各天的标准化值如下表 日期 周一 周二 周三 周四 周五 周六 周日 标准化值Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0 周一和周六两天失去了控制。

统计学_第三章_统计整理

第三章统计整理 (一)填空题 1、统计整理是统计工作的第三阶段。在这一阶段,通过对原始资料进行科学的加工,可以得出反映事物总体特征的资料。 2、统计整理在统计分析中起着承前启后的作用,它既是统计调查的必然继续,又是统计分析的基础和前提条件。 3、统计分组实质上是在统计总体内部进行的一种定性分类。 4、对原始资料审核的重点是真实性。 5、区分现象质的差别是统计分组的根本作用。 6、标志是统计分组的依据,是划分组别的标准。 7、根据分组标志的特征不同,统计总体可以按品质分组,也可以按数量分组。 8、对所研究的总体按两个或两个以上的标志结合进行的分组,称为复合分组。 9、次数分布数列根据分组标志特征的不同,可以分为品质分布数列和数量分布数列两种。 10、变量数列是单项变量分组、组距式分组所形成的次数分布数列。 11、按品质标志分组的结果,形成品质分布数列。 12、组限是组距变量数列中表示各组数量界限的变量值,其中下限是指最小值的变量值,上限是指最大值的变量值。 13、组距变量数列的组距大小与组数的多少成反比。与全距的大小成正比。 14、组距变量数列的分布可以用次数分布曲线图表示。 15、划分连续变量的组限时,相邻组的组限必须重叠;划分离散型变量的组限时,相邻组的组限可以重叠,也可以不重叠。 16、统计资料的整理方法主要有统计分组和统计汇总两种。 17、钟形分布、U形分布和J形分布是次数分布的三种主要类型。 18、统计分组体系有品质标志分组和数量标志分组两种。 19、统计表按主词是否分组和分组的程度可分为简单表、简单分组表和复合分组表三种。 20、统计表从内容结构上看,是由主词和宾词两部分构成。 (二)单项选择题(在每小题备选答案中,选出一个正确答案) 1、统计分组的结果表现为( A ) A. 组内同质性,组间差异性 B. 组内差异性,组间同质性 C. 组内同质性,组间同质性 D. 组内差异性,组间差异性 2、统计分组的依据是( A ) A、标志 B、指标 C、标志值 D、变量值 3、下面属于按品质标志分组的有( C ) A. 企业按职工人数分组 B. 企业按工业总产值分组 C. 企业按经济类型分组 D. 企业按资金占用额分组 4、统计分组的关键在于( A ) A、正确选择分组标志 B、正确划分各组界限 C、正确确定组数和组限 D、正确选择分布数列种类 5、下面属于按数量标志分组的有( B ) A. 工人按政治面貌分组 B. 工人按年龄分组 C. 工人按工种分组 D. 工人按民族分组

统计学计算题整理

: 典型计算题一 1、某地区销售某种商品的价格和销售量资料如下: 根据资料计算三种规格商品的平均销售价格。 解: 36== ∑∑ f f x x (元) 点评: 第一,此题给出销售单价和销售量资料,即给出了计算平均指标的分母资料,所以需采用算术平均数计算平均价格。第二,所给资料是组距数列,因此需计算出组中值。采用加权算术平均数计算平均价格。第三,此题所给的是比重权数,因此需采用以比重形式

表示的加权算术平均数公式计算。 2、某企业1992年产值计划是1991年的105%,1992年实际产值是1991的的116%,问1992年产值计划完成程度是多少? 解: %110% 105% 116=== 计划相对数实际相对数计划完成程度。即1992年计划完成程度为 110%,超额完成计划10%。 点评:此题中的计划任务和实际完成都是“含基数”百分数,所以可以直接代入基本公式计算。 3、某企业1992年单位成本计划是1991年的95%,实际单位成本是1991年的90%,问1992年单位成本计划完成程度是多少? 解: 计划完成程度 %74.94% 95% 90==计划相对数实际相对数。即92年单位成本计划完成程度是 94.74%,超额完成计划5.26%。 点评:本题是“含基数”的相对数,直接套用公式计算计划完成程度。 4、某企业1992年产值计划比91年增长5%,实际增长16%,问1992年产值计划完成程度是多少? 解: 计划完成程度%110% 51% 161=++= 点评:这是“不含基数”的相对数计算计划完成程度,应先将“不含基数”的相对数还原成“含基数”的相对数,才能进行计算。 5、某企业1992年单位成本计划比1991年降低5%,实际降低10%,问1992年单位成

统计学计算题

第二章 六、计算题. 1.下面是某公司工人月收入水平分组情况和各组工人数情况: 月收入(元)工人数(人) 400-500 20 500-600 30 600-700 50 700-800 10 800-900 10 指出这是什么组距数列,并计算各组的组中值和频率分布状况。 2.抽样调查某省20户城镇居民平均每人全年可支配收入(单位:百元)如下: 88 77 66 85 74 92 67 84 77 94 58 60 74 64 75 66 78 55 70 66 ⑴根据上述资料进行分组整理并编制频数分布数列 ⑵编制向上和向下累计频数、频率数列 答:⑴⑵

第三章 六、计算题. 要求:⑴填满表内空格. ⑵对比全厂两年总产值计划完成程度的好坏。 ⑵该企业2005年的计划完成程度相对数为110.90%,而2006年只有102.22%,所以2005年完成任务程度比2006好。 ⒉某工厂2006年计划工业总产值为1080万吨,实际完成计划的110%,2006年计划总产值比2005年增长8%,试计算2006年实际总产值为2005年的百分比? 解:118.8% 3.某种工业产品单位成本,本期计划比上期下降5%,实际下降了9%,问该种产品成本

计划执行结果? 解:95.79% 4.我国“十五”计划中规定,到“十五”计划的最后一年,钢产量规定为7200万吨, 根据上表资料计算: ⑴钢产量“十五”计划完成程度; ⑵钢产量“十五”计划提前完成的时间是多少? 解:⑴102.08%;⑵提前三个月 5.某城市2005年末和2006年末人口数和商业网点的有关资料如下: 计算:⑴平均每个商业网点服务人数; ⑵平均每个商业职工服务人数; ⑶指出是什么相对指标。 ⑶上述两个指标是强度相对指标。 6.某市电子工业公司所属三个企业的有关资料如下:

概率论与数理统计

《概率论与数理统计》 姓名:黄淑芹 学号:1543201000276 班级:数学与应用数学E 时间:2017年6月

概率论与数理统计 摘要:随机现象无处不在,渗透于日常生活的方方面面和科学技术的各个领域,概率论就是通过研究随机现象及其规律从而指导人们从事物表象看到其本质的一门科学。生活中买彩票显示了小概率事件发生的几率之小,抽签与体育比赛赛制的选择用概率体现了公平与不公平,用概率来指导决策,减少错误与失败等等,显示了概率在人们日常生活中越来越重要。数理统计在人们的生活中也不断的发挥重要的作用,如果没有统计学,人们在收集资料和进行各项的大型的数据收集工作是非常困难的,通过对统计方法的研究,使得我们处理各种数据更加简便,所以统计也是一门很实用的科学,应该受到大家的重视。 关键词:概率、统计、数学期望、方差、实际问题、应用 概率论与数理统计是研究随机现象统计规律的一门数学学科,是对随机现象的统计规律进行演绎和归纳的科学。随着社会的不断发展,概率论与数理统计的知识越来越重要,运用抽样数据进行推断已经成为现代社会一种普遍适用并且强有力的思考方式。目前,概率论与数理统计的很多原理方法已被越来越多地应用到交通、经济、医学、气象等各种与人们生活息息相关的领域。本文将就概率论与数理统计的方法与思想,在日常生活中的应用展开一些讨论,,推导出某些表面上并非直观的结论,从中可以看出概率方法与数理统计的思想在解决问题中的高效性、简捷性和实用性。 (一)、概率 要学习与概率有关的知识,首先要知道事件的定义与分类及与它们有关的运算性质: 随机事件 在抛掷一枚均匀硬币的试验中,“正面向上”是一个随机事件,可用A={正面向上}表示。 【1】随机试验中的每一个可能出现的试验结果称为这个试验的一个样本点,记作ωi。全体样本点组成的集合称为这个试验的样本空间,记作Ω.即Ω={ω1,ω2,…,ωn,…}。仅含一个样本点的随机事件称为基本事件,含有多个样本点的随机事件称为复合事件。 在随机试验中,随机事件一般是由若干个基本事件组成的。样本空间Ω的任一子集A称为随机事件。属于事件A的样本点出现,则称事件A发生。例如,在试验E中,令A表示“出现奇数点”,A就是一个随机事件,A还可以用样本点的集合形式表示,即A={1,3,5},它是样本空间Ω的一个子集,在试验中W中,令B表示“灯泡的寿命大于1000小时”,B也是一个随机事件,B也可用样本点的集合形式表示,即B={t|t>1000},B也是样本空间的一个子集。

统计学原理计算题及参考答案

"

}

| 1、某生产车间30名工人日加工零件数(件)如下: 30 26 42 41 36 44 40 37 37 25 45 29 43 31 36 36 49 34 47 33 43 38 42 32 34 38 46 43 39 35 要求:(1)根据以上资料分成如下几组:25—30,30—35,35—40,40—45,45—50,计算各组的频数和频率,编制次数分布表; (2) 根据整理表计算工人平均日产零件数。(20分) 解:(1)根据以上资料编制次数分布表如下:

则工人平均劳动生产率为: 17.3830 1145 == = ∑∑f xf x # 要求:(1)建立以产量为自变量的直线回归方程,指出产量每增加1000件时单位成本的平均变动是多少 、 (2)当产量为10000件时,预测单位成本为多少元(15分) x bx a y n x b n y a x x n y x xy n b c 5.28080 10703 125.232105.2615 1441502520250512503210128353)(2 2 2-=+==+=?+=-=-=-=--=-??-?= --= ∑∑∑∑∑∑∑因为,5.2-=b ,所以产量每增加1000件时, 即x 增加1单位时,单位成本的平均变动是:平均减少元 (2)当产量为10000件时,即10=x 时,单位成本为 — 55105.280=?-=c y 元

>课程的测试,甲班平均成绩为81分,标准差为分;乙班的成绩分组资料如下: 计算乙班学生的平均成绩,并比较甲.乙两班哪个班的平均成绩更有代表性 解:乙班学生的平均成绩∑∑=f xf x ,所需的计算数据见下表:

统计学试题库及试题库答案解析

统计学题库及题库答案 题库1 一、单项选择题(每题2分,共20分) 1、调查时间就是指( ) A 、调查资料所属的时间 B 、进行调查的时间 C 、调查工作的期限 D 、调查资料报送的时间 2、对某城市工业企业未安装设备进行普查,总体单位就是( )。 A 、工业企业全部未安装设备 B 、企业每一台未安装设备 C 、每个工业企业的未安装设备 D 、每一个工业企业 3、对比分析不同性质的变量数列之间的变异程度时,应使用( )。 A 、全距 B 、平均差 C 、标准差 D 、变异系数 4、在简单随机重复抽样条件下,若要求允许误差为原来的2/3,则样本容量( ) A 、扩大为原来的3倍 B 、扩大为原来的2/3倍 C 、扩大为原来的4/9倍 D 、扩大为原来的2、25倍 5、某地区组织职工家庭生活抽样调查,已知职工家庭平均每月每人生活费收入的标准差为12元,要求抽样调查的可靠程度为0、9545,极限误差为1元,在简单重复抽样条件下,应抽选 ( )。 A 、576户 B 、144户 C 、100户 D 、288户 6、当一组数据属于左偏分布时,则( ) A 、平均数、中位数与众数就是合而为一的 B 、众数在左边、平均数在右边 C 、众数的数值较小,平均数的数值较大 D 、众数在右边、平均数在左边 7、某连续变量数列,其末组组限为500以上,又知其邻组组中值为480,则末组的组中值为 ( )。 A 、520 B 、 510 C 、 500 D 、490 8、用组中值代表组内变量值的一般水平有一定的假定性,即( ) A 、各组的次数必须相等 B 、变量值在本组内的分布就是均匀的 C 、组中值能取整数 D 、各组必须就是封闭组 9、n X X X ,,,21 就是来自总体 ),(2 N 的样本,样本均值X 服从( )分布 A 、),(2 N B 、、)1,0(N C 、、),(2 n n N D 、) ,(2n N 10、测定变量之间相关密切程度的指标就是( ) A 、估计标准误 B 、两个变量的协方差 C 、相关系数 D 、两个变量的标准差 二、多项选择题(每题2分,共10分)

《统计学》_第三章_统计整理

第三章统计整理 (一)填空题 1、统计整理就是统计工作得第三阶段。在这一阶段,通过对原始资料进行科学得加工,可以得出反映事物总体特征得资料。 2、统计整理在统计分析中起着承前启后得作用,它既就是统计调查得必然继续,又就是统计分析得基础与前提条件。 3、统计分组实质上就是在统计总体内部进行得一种定性分类。 4、对原始资料审核得重点就是真实性。 5、区分现象质得差别就是统计分组得根本作用。 6、标志就是统计分组得依据,就是划分组别得标准。 7、根据分组标志得特征不同,统计总体可以按品质分组,也可以按数量分组。 8、对所研究得总体按两个或两个以上得标志结合进行得分组,称为复合分组。 9、次数分布数列根据分组标志特征得不同,可以分为品质分布数列与数量分布数列两种。 10、变量数列就是单项变量分组、组距式分组所形成得次数分布数列。 11、按品质标志分组得结果,形成品质分布数列。 12、组限就是组距变量数列中表示各组数量界限得变量值,其中下限就是指最小值得变量值,上限就是指最大值得变量值。 13、组距变量数列得组距大小与组数得多少成反比。与全距得大小成正比。 14、组距变量数列得分布可以用次数分布曲线图表示。 15、划分连续变量得组限时,相邻组得组限必须重叠;划分离散型变量得组限时,相邻组得组限可以重叠,也可以不重叠。 16、统计资料得整理方法主要有统计分组与统计汇总两种。 17、钟形分布、U形分布与J形分布就是次数分布得三种主要类型。 18、统计分组体系有品质标志分组与数量标志分组两种。 19、统计表按主词就是否分组与分组得程度可分为简单表、简单分组表与复合分组表三种。 20、统计表从内容结构上瞧,就是由主词与宾词两部分构成。 (二)单项选择题(在每小题备选答案中,选出一个正确答案) 1、统计分组得结果表现为( A ) A、组内同质性,组间差异性 B、组内差异性,组间同质性 C、组内同质性,组间同质性 D、组内差异性,组间差异性 2、统计分组得依据就是( A ) A、标志 B、指标 C、标志值 D、变量值 3、下面属于按品质标志分组得有( C ) A、企业按职工人数分组 B、企业按工业总产值分组 C、企业按经济类型分组 D、企业按资金占用额分组 4、统计分组得关键在于( A ) A、正确选择分组标志 B、正确划分各组界限 C、正确确定组数与组限 D、正确选择分布数列种类 5、下面属于按数量标志分组得有( B ) A、工人按政治面貌分组 B、工人按年龄分组 C、工人按工种分组 D、工人按民族分组 6、在全距一定得情况下,组距得大小与组数得多少成( B ) A、正比 B、反比 C、无比例关系 D、有时成正比有时成反比

统计学试题库及答案

统计学试题库及答案文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)

《统计学》试题库答案在最后面,答案仅供参考 知识点一:统计基本理论和基本概念 一、填空题 1、统计是、和的统一体,是统计工作的成 果,是统计工作的经验总结和理论概括。 2、统计研究的具体方法主要有、、和。 3、统计工作可划分为、、和四个阶段。 4、随着的改变,总体和是可以相互转化的。 5、标志是说明,指标是说明。 6、可变的数量标志和所有的统计指标称为,变量的具体数值称 为。 7、变量按分,可分为连续变量和离散变量,职工人数、企业数属于 变量;变量按分,可分为确定性变量和随机变量。 8、社会经济统计具有、、、等特点。 9、一个完整的统计指标应包括和两个基本部分。 10、统计标志按是否可用数值表示分为和;按在各个单位 上的具体表现是否相同分为和。 11、说明特征的名称叫标志,说明特征的名称叫指标。 12、数量指标用表示,质量指标用或平均数表示。 13、在统计中,把可变的和统称为变量。 14、由于统计研究目的和任务的变更,原来的变成,那么原 来的指标就相应地变成标志,两者变动方向相同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。 3、统计学是对统计实践活动的经验总结和理论概括。 4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。 5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。 6、某同学计算机考试成绩80分,这是统计指标值。 7、统计资料就是统计调查中获得的各种数据。 8、指标都是用数值表示的,而标志则不能用数值表示。 9、质量指标是反映工作质量等内容的,所以一般不能用数值来表示。

统计学计算题

计 算 题 第二章 统计数据的整理 (一)基本概念及计算公式 1)组距 连续变量分组(~)a b 的组距:b a - 2)组中值啊 (1)分组(~)2 a b a b +的组中值为: 1 2 (2)上开口组(如"80以上")的组中值=本组下限+ 邻组(较小组)组距1 102 (3)下开口组(如"以下")的组中值=本组上限-邻组(较大组)组距 第三章 统计数据的描述与显示 (一)基本概念及计算公式 1)有关指标概念 ??? ??? ??????????????????? ?????? ??? ??? ??? ?????? ???? 时期指标数量指标=绝对指标=总量指标时点指标部分1)结构相对指标=全部2)比较相对指标=两个的指标之比指标部分1相对指标3)比例相对指标= 质量指标部分24)强度相对指标=但的指标之比5)动同类现象性质不同不同时间态相对指标=同两个有联一事物的指标之比平均指系标 2)反映集中趋势的指标 (1)众数 01 M L+ 12 d ?=??+? (2)中位数 -12 M L+ m e m f S d f -=?∑ (3)算术平均数 ()x x n n ∑=适用于个离散数据 ()xf f x x f f ∑= =∑∑∑适用于分组数据 (4)几何平均数 3)反映离散程度的指标 (1)极差(全距):数列中的最大值—最小值 (2)平均差 || ..()x x M D n n ∑-= 适用于个离散数据 ||..()x x f M D f ∑-= ∑适用于分组数据

(3)方差 () 2 2()x x n n σ∑-= 适用于个离散数据 () 2 2()x x f f σ∑-= ∑适用于分组数据 (4)标准差 ()n σ适用于个离散数据 ()σ= 适用于分组数据 (5)离散系数(变异系数,标准差系数) v x σ = (6)成数的方差和标准差 设成数为p , 则 方差 2(1) p q p p σ==- 标准差 σ (二)应用举例 1. 现有甲、乙两国钢产量和人口资料如下: 试通过计算动态相对指标、强度相对指标和比较相对指标。 1解.

相关文档
最新文档