《统计学原理》期末重点

合集下载

统计学原理复习重点概述

统计学原理复习重点概述

统计学原理复习重点概述本课程主要包括三部分知识。

第一部分统计基础知识第一章和第二章数据收集部分。

第二部分描述统计第二章统计数据整理部分(表格和图形法)、第三章数据分布特征的描述(静态数据描述法)和动态数据描述法,即第六章时间数列分析和第八章统计指数。

第三部分推断统计第四章抽样估计和第五章假设检验和方差分析。

第一章绪论。

本章介绍统计学及相关概念,勾勒了本课程的框架结构——描述统计学和推断统计学。

是统计的三层含义,总体、样本及指标等概念。

统计的三层含义及相互关系统计学是一门关于数据的科学,是一门关于数据的收集、整理、分析、解释和推断的科学。

(一)统计工作(统计的基本含义)即统计实践活动,是人们对客观事物的数据资料进行搜集、整理、分析的工作活动的总称。

(二)统计资料是统计工作的成果,包括各种统计报表、统计图形及文字资料等。

(三)统计学是一门收集、整理、描述、显示和分析统计数据的方法论的科学,其目的是探索事物的内在数量规律性,以达到对客观事物的科学认识。

(四)三者关系统计学和统计实践活动的关系是理论和实践的关系,理论源于实践,理论又高于实践,反过来又指导实践。

统计工作和统计数据是工作和工作成果关系。

统计实践活动的产生和发展三个主要的统计学派1、政治算术学派代表人物:英国的威廉·配第(1623-1687)、约翰·格朗特(1620-1674)等。

威廉·配第的代表著《政治算术》对当时的英、荷、法等国的“ 国富和力量”进行了数量的计算和比较;格朗特写出了第一本关于人口统计的著作。

他们开创了从数量方面研究社会经济现象的先例。

可以说,威廉·配第是统计学的创始人。

2、记述学派(国势学派〕代表人物:德国的康令(1606-1681)阿亨瓦尔(1719-1772;1764年首创统计学一词)他们在大学中开设“ 国势学”课程,采用记述性材料,讲述国家“ 显著事项”,籍以说明管理国家的方法。

《统计学》重点归纳

《统计学》重点归纳

《统计学》期末重点1.统计学的类型和不同类型的特点统计数据:按所釆用的计量尺度不同分;(1)(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对爭物进行分类的结果,数据表现为类别,用文字来表述:(2)(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。

它也是有类别的,但这些类别是有序的。

(3)(走量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

统计数据:按统计数据都收集方法分:(4)观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。

(5)实骏数据:在实验中控制实验对象而收集到的数据。

统计数据:按被描述的现象与实践的关系分;(6)截面数据:在相同或相似的时问点收集到的数据,也叫挣态数据。

(7)时问序列数据:按时问顺序收集到的,用于描述现象随时问变化的情况,也叫动态数据。

2.变量的题型第10页,习题1. 1(1)年龄:数值型变量(2)性别:分类变量(3)汽车产量:离散型变量(4)员工对企业某项改革措施的态度(赞成.中立、反对):顺序变量(5)购买商品时的支付方式(现金.信用卡、支票〉:分类变量3.随机抽样(槪率抽样)的抽样方式。

(1)简单随机抽样(2)分层抽样:就是抽样单位按某种特征或者某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。

将各层的样本结合起来,对总体目标量进行估计。

(3)整群抽样:(4)系统抽样(5)多阶段抽样分层抽样与整群抽样的区别:分层抽样的层数就是样本容量:整群抽样的群中单位的个数就是样本容量4.非槪率抽样的几种类型(1)方便抽样(2)判断抽样(3)自愿样本(4)滚雪球抽样滚雪球抽样往往用于对稀少群体的调查。

在滚雪球抽样中,首先选择一组调查单位,对其实施调查后,再请他们提供另外一些属于研究总待的调查对象,调查人员根据调查线索,进行此后的调查。

这个过程持续下去,就会形成滚雪球效应。

优点:容易找到那些属于待定群体的被调查者,调查成本也比较低。

(完整版)统计学期末复习重点

(完整版)统计学期末复习重点

统计总体:统计总体是根据一定目的确定的所要研究事物的全体,它是客观存在,并在某一相同性质基础上结合起来的由许多个别事物组成的整体,简称总体。

样本:是指在全及总体中按随机原则抽取的那部分单位所构成的集合体。

算术平均数:算术平均数是统计中最基本、最常用的一种平均数,它的基本计算形式是用总体的单位总数去除总体的标志总量。

调和平均数:是根据变量值的倒数计算的,是变量值倒数的算术平均数的倒数,也叫倒数平均数。

简单分组:是指对所研究的总体按一个标志进行分组。

复合分组:复合分组是指对所研究的总体按两个或两个以上的标志进行的多层次分组。

结构相对指标:结构相对指标是表明总体内部的各个组成部分在总体中所占比重的相对指标,也叫比重指标。

强度相对指标:是指两个性质不同,但有一定联系的总量指标数值之比。

类型抽样:又称分类抽样或分层抽样,它是先将总体按某个主要标志进行分组(或分类),再按随机原则从各组(类)中抽取样本单位的一种抽样方式。

机械抽样:它是将总体各单位按某一标志顺序排列,然后按固定顺序和相等距离或间隔抽取样本单位的抽样组织方式。

综合指数:凡是一个总量指标可以分解为两个或两个以上的因素指标时,为观察某个因素指标的变动情况,将其他因素指标固定下来计算出的指数称为综合指数。

平均指数:平均指数法是以个体指数为基础来计算总指数,根据选用的权数不同,平均指数法可以进一步分为加权算术平均法,加权调和平均法,固定权数加权平均法。

相关关系:是指现象之间客观存在的,在数量变化上受随机因素的影响,非确定性的相互依存关系。

回归分析:现象之间的相关关系,虽然不是严格的函数关系,但现象之间的一般关系值,可以通过函数关系的近似表达式来反映,这种表达式根据相关现象的实际对应资料,运用数学的方法来建立,这类数学方法称为回归分析。

统计调查:就是根据统计研究的目的、要求和任务,运用各种科学的调查方法,有计划、有组织的搜集有关现象的各个单位的资料,对客观事实进行登记,取得真实可靠的调查资料的活动过程。

《统计学原理》期末考前总复习题

《统计学原理》期末考前总复习题

《统计学原理》期末考前总复习题《统计学原理》期末考前总复习题⼀、填空题1、统计的职能是、、。

2、钢产量和⼈⼝数对⽐,属于相对指标。

3、相对指标的表现形式有两种,即有名数和。

4、已知某产品产量1996年与1995年相⽐增加了5%,1997年与1995年相⽐增长10%,则1997年与1996年相⽐增长了。

5、统计总体具有三个基本特征,即、、。

6、在⼈⼝总体中,总体单位是,“⽂化程度”是标志。

7、时期指标的数值⼤⼩与时期长短。

8、总量指标的数值随着的⼤⼩⽽增减。

9、时点指标的数值⼤⼩与时点间的间隔长短10、现象之间的相关关系,从相关因素的个数看,可分为和;从相关的形式看,可分为和。

11、某公司⽣产三种型号的轿车,产量分别为1200辆,6000辆和2000辆,为检验该公司的产品质量,现⽤分层抽样的⽅法抽取46辆进⾏检验,这三种型号的轿车依次应抽取、、辆。

12、某⼈在计算⼀个样本⽅差时,有算式:)(54631696122-+++=x σ,(样本各数据均是10以内的⾃然数)由此算式可知:平均数是;式中x = ;样本⽅差2σ= 。

13、统计调查按组织⽅式不同,可分为和。

14、中位数是位于数列位置的那个标志值;众数是在总体中出现次数的那个标志值。

中位数和众数也可称为平均数。

15、已知某数列各值的平均数为7,各值平⽅的平均数为65,则该数列的标准差系数为。

16、统计分组的关键在于和。

17、统计调查的基本要求是、、、和。

18、某同学在⽤电脑计算平均数时,将1、2、3、--------n 个数输⼊后,电脑上出现了输⼊了)1(-n 个数,其平均值为7535,则该⽣少输了的数为。

19 标志变异指标的数值越⼤,平均指标的代表性。

20、已知某数列的平均数为2600,标准差系数为30%,则该数列的标准差为。

21、若以相同的⼈民币在物价下跌后多购商品15%,则物价指数为。

22、分⼦分母有可能互换的相对指标有、、。

23、通过调查宝钢、鞍钢、武钢等⼏个⼤型钢铁企业,以了解我国钢铁⽣产的基本情况,这种调查⽅式是。

2020年更新)XXX《统计学原理》期末题库和答案

2020年更新)XXX《统计学原理》期末题库和答案

2020年更新)XXX《统计学原理》期末题库和答案电大资料精品XXX《统计学原理》期末题库及答案统计学原理》题库及答案一一、单项选择题(以下每小题各有四项备选答案,其中只有一项是正确的。

每小题2分,共12分)1.下列分组中哪个是按品质标志分组?(。

)A.企业按年生产能力分组B.企业工人按日产量分组C.人口按性别分组D.家庭按年收入水平分组2.某市工业企业2006年生产经营成果年报呈报时间规定在2007年1月31日,则调查期限为(。

)。

A.一日B.一个月C.一年D.一年零一个月3.简单分组和复合分组的区别在于(。

)。

A.选择的分组标志性子不同B.选择的分组标志多少不同C.组数的多少不同D.组距的大小不同4.直接反映总体规模大小的指标是(。

)。

A.总量指标B.相对指标C.平均指标D.变异指标5.反映样本指标与总体指标之间的平均误差程度的指标是(。

)。

A.平均数离差B.概率度C.抽样平均误差D.抽样极限误差6.如果变量X和变量y之间的相关系数为1,说明两变量之间存在(。

)。

A.微弱相关关系B.显著相关关系C.完全相关关系D.没有相关关系二、多项选择题(以下每小题最少有两项精确答案,所有选对得分。

多选、少选或错选均不得分。

每小题2分,共8分)7.下列调查中,调查单位与填报单位一致的有(。

)。

A.工业企业出产设备查询拜访B.人口普查电大资料精品电大资料精品C.工业企业现状查询拜访‘D.农产量查询拜访E.城市零售商店贩卖情况查询拜访8.在次数分配数列中,(。

)。

A.各组的频数之和等于100B.各组的频次大于C.频数越小,则该组的标志值所起的作用越小D.总次数一定,频数和频次成反比E.频次表明各组标志值对总体的相对作用程度9.下列指标中属于时点指标的有(。

}。

A.某地区人口数B.某校卒业生人数C.某农场拖拉机台数D.某企业某月产品产量E.某企业月末在册职工人数10.直线回来分析中(。

)。

A.两个变量不是对等的关系B.使用一个回来方程两个变量能够互相推算C.根据回归系数可判定相关的方向D.自变量是可控制量,因变量是随机的E.对于没有明显关系的两变量可求得两个回来方程三、判断题(判断正误,每小题2分,共10分)11.我国人口普查的调查单位是“人”,填报单位是“户”。

统计学原理期末复习资料

统计学原理期末复习资料

统计学原理期末复习资料集团标准化办公室:[VV986T-J682P28-JP266L8-68PNN]2015秋季学期《统计学原理》复习资料一、单选题1. 某厂4月份产量与1月份产量相比增长了10%,若已知4月份产量为1000,那么1月份的产量为(A )。

A.B.C.D.2.以下各项属于品质标志的有(B )。

A.工龄B.健康状况C.工资水平D.劳动时间利用率3.连续变量( C)。

A.表现形式为整数B.取值可一一列举C.取值连续不断,不能一一列举D.一般都四舍五入取整数4.了解某公司职工文化程度情况,总体单位是( B)。

A.该公司全体职工B.该公司每一位职工C.该公司全体职工文化程度D.该公司每一位职工文化程度5.在某市工业设备普查中,调查单位是(D )。

A. 该市每一家工业企业B. 该市全部工业设备C. 该市全部工业企业D. 某公司新推出了一种饮料产品,欲了解该产品在市场上的受欢迎程度,公司派人到各商场、超市随机调查了200 名顾客。

该公司采用的调查方法是(C )。

A. 直接观察法B. 报告法C. 访问调查法D.很难判断7.企业要对流水生产线上的产品质量实行严格把关,那么,在质量检验时最合适采用的调查组织方式是( D)。

A. 普查B. 重点调查C.典型调查D. 抽样调查8. 统计资料按数量标志分组后,处于每组两端的数值叫(C )。

A. 组距B. 组数C. 组限D. 组中值9.统计分组的核心问题是(A )。

A.选择分组的标志B.划分各组界限C.区分事物的性质D.对分组资料再分组10. 在分组的情况下,总体平均指标数值的大小(C )。

A. 只受各组变量值水平的影响,与各组单位数无关B. 只受各组单位数的影响,与各组变量值水平无关C. 既受各组变量值水平的影响,又与各组次数有关D. 既不受各组变量值水平的影响,也部受各组次数的影响11. 在组距数列中,用组中值作为计算算术平均数直接依据的假定条件是(D )。

统计学期末知识点总结

1.多重共线性:当回归模型中存在两个或两个以上的自变量彼此相关时,则称回归模型中存在多重共线性。

2.相关关系:变量之间存在的不确定的数量关系,称为相关关系。

3.五个相关关系:正线性相关,负线性相关,完全正线性相关,完全负线性相关,非线性相关,不相关。

若 0<r≤1,表明 x 与 y 之间存在正线性相关关系;若-1≤r <0,表明 x 与 y 之间存在负线性相关关系;若 r=+1,表明 x 与 y 之间为完全正线性相关关系;若 r=-1,表明 x 与 y 之间为完全负线性相关关系。

|r|→1 说明两个变量之间的线性关系越强;|r|→0 说明两个变量之间的线性关系越弱。

4.回归直线的拟合优度:回归直线与各观测点的接近程度称为回归直线对数据的拟合优度。

判定系数 R2测度了回归直线对观测数据的拟合程度。

5.最小二乘估计法:通过使因变量的观测值 yi 与估计值yi ∧之间的离差平方和,即残差平方和,达到最小来估计β0和β1的方法。

6. F 检验和 t 检验各有什么作用:F 检验是检验自变量 x 和因变量 y 之间的线性关系是否显著;t 检验是检验自变量对因变量的影响是否显著,也就是回归系数的检验。

7.8.正态分布—Z分布:大样本或小样本总体标准差σ已知。

9.N-1的T分布:小样本σ未知。

10.参数估计:点估计与区间估计11.置信区间:由样本统计量所构造的总体参数的估计区间。

12.置信水平:置信区间中包含总体参数真值的次数所占的比例。

置信水平越大,所需的样本量也就越大,置信区间越宽。

13.评价估计量的标准:无偏性:是指估计量抽样分布的数学期望等于被估计的总体参数有效性:是指对同一参数的两个无偏估计量,有更小方差的估计量越有效。

一致性:是指随着样本量n的增大,估计量的值越来越接近总体参数的真值。

14.样本量越大,样本均值的抽样标准差就越小。

15.总体数据的方差越大,估计时所需的样本量越大。

16.数据概括性度量:(数据分布特征的测量)集中趋势,离散程度,分布形态(偏态与峰态)17.三个分布:对称分布—众数=中位数=平均数左偏分布—平均数<中位数<众数右偏分布—众数<中位数<平均数18.标准分数的用途:①变量值与其平均数的离差除以标准差后的值称为标准分数,用Z表示。

统计学期末复习重点

统计学期末复习重点一、选择、填空、判断题型:1、统计一词通常有三种含义:即统计工作、统计资料、统计学。

2、统计学的特点:数量性、总体性、具体性。

3、就一次统计活动来讲,一个完整的认识过程一般可分为统计调查、统计整理和统计分析三个阶段。

4、标志可分为品质标志和数量标志。

5、统计调查是统计工作中的基础环节。

6、统计调查工作要力求达到准确性和及时性这两个基本要求。

7、统计调查按调查对象所包括范围不同,可分为全面调查和非全面调查。

8、统计调查的组织形式分为统计报表制度和专门调查。

9、统计调查按登记事物的连续性不同,分为经常调查和一时调查。

10、统计整理的关键是统计分组,统计分组的工作是正确的选择分组标志。

11、统计分组的三方面作用是分别从类型分组、结构分组和分析分组角度来说明的。

12、根据分组标志的不同,分配数列可分为两种:品质分配数列(简称品质数列);变量分配数列(简称变量数列)。

品质数列由各组名称和次数组成。

变量数列也是由各组名称(由变量值表示)和次数(或频率)组成。

13、组距数列根据组距是否相等,分为等距数列和异距数列两种。

14、次数分布有三种主要类型:钟型分布、U型分布,J型分布。

15、总量指标按其反映的内容不同,分为总体单位总量和总体标志总量。

16、总量指标按其反映时间状况不同,分为时期指标和时点指标。

17、根据客观现象的性质不同,5年计划指标数值的规定有水平法和累计法。

18、注意两个对比指标的可比性19、平均指标能反映总体变量值的集中趋势。

20、动态数列由两个基本要素构成:一个是资料所属的时间;另一个是各时间上的统计指标数值,习惯上称之为动态数列中的发展水平。

21、如果掌握的权数资料是基本公式的母项数值,则采用算术平均数形式;如果掌握的权数资料是基本公式的子项数值,则采用调和平均数形式。

22、动态数列按统计指标的性质不同,可以分为绝对数动态数列、相对数动态数列、平均数动态数列三种。

23、保证数列中各个指标之间的可比性,就成为编制动态数列应遵守的基本原则。

统计学各章节期末复习知识点

统计学各章节期末复习知识点统计学是一门研究数据收集、分析和解释的学科。

作为一门广泛应用于各个领域的学科,统计学的知识点非常丰富。

以下是统计学各章节的期末复习知识点汇总:1.数据收集与描述-数据类型:定量数据和定性数据-数据收集方式:问卷调查、观察、实验-描述统计:中心趋势(均值、中位数、众数)、离散程度(范围、方差、标准差)、数据分布(直方图、条形图、饼图)2.概率论基础-随机试验与样本空间-事件与事件概率-古典概型、几何概型和统计概型-条件概率与独立性-伯努利试验与二项分布3.随机变量及其分布-随机变量与分布函数-离散型随机变量与其分布律-连续型随机变量与其概率密度函数-均匀分布、正态分布、指数分布等常见分布4.多个随机变量的分布-边缘分布与条件分布-两个离散型随机变量的联合分布律-两个连续型随机变量的联合概率密度函数-相互独立的随机变量的分布5.随机变量的数字特征-数学期望与其性质-方差与标准差-协方差与相关系数-矩、协方差矩阵与相关系数矩阵6.大数定律与中心极限定理-辛钦大数定律-中心极限定理-切比雪夫不等式与伯努利不等式7.统计推断基础-参数估计:点估计、区间估计-置信区间与置信水平-假设检验:原假设与备择假设、显著性水平、拒绝域-类型Ⅰ错误和类型Ⅱ错误-样本容量与统计检验的效应大小8.单样本与双样本推断-单个总体均值的推断:正态总体与非正态总体-单个总体比例的推断-两个总体均值的推断:独立样本与配对样本-两个总体比例的推断9.方差分析与回归分析-单因素方差分析-两因素方差分析-简单线性回归分析:最小二乘法-多元线性回归分析:拟合优度、剩余平方和、变量选择10.非参数统计方法-指标:秩和检验、秩和相关检验、符号检验- 分布:符号检验、秩和检验、秩和相关检验、Kolmogorov-Smirnov检验这些是统计学各个章节的期末复习知识点的一个概述。

每个章节都拥有更加详细和复杂的内容,需要学生在复习中深入理解并进行练习。

《统计学原理》知识点概括总结

《统计学原理》知识点概括总结第一部分:概率论基础《统计学原理》的第一部分主要介绍了概率论的基本概念和原理。

概率论是统计学的基础,它研究的是事件发生的可能性。

本部分包括事件与概率、条件概率与独立性、贝叶斯定理等内容。

概率的性质、计算方法和基本公式也是本部分的重点。

第二部分:随机变量和概率分布第二部分以随机变量和概率分布为核心,介绍了离散型和连续型随机变量的定义和性质。

离散型随机变量的概率质量函数和分布函数、连续型随机变量的概率密度函数和分布函数都在本部分进行了详细讨论。

同时,本部分还介绍了常见的离散型分布(如伯努利分布、二项分布、泊松分布)和连续型分布(如均匀分布、正态分布)。

第三部分:多维随机变量及其分布第三部分讨论了多维随机变量和其分布。

多维随机变量是指由多个随机变量组成的向量,它的概率分布可以通过联合分布、边缘分布和条件分布来描述。

本部分介绍了多维随机变量的分布函数和密度函数,并给出了常见的两个随机变量的联合分布和边缘分布。

此外,还介绍了常见的多维分布,如多项分布和多元正态分布。

第四部分:参数估计参数估计是统计学中重要的一环,它研究如何从样本中推断总体的未知参数。

本部分介绍了点估计和区间估计两种常见的参数估计方法。

点估计方法根据样本数据直接估计出总体参数的值,例如最大似然估计和矩估计。

区间估计是通过样本数据得到参数的一个范围估计,例如置信区间的构造和解释。

第五部分:假设检验假设检验是统计学中用于验证关于总体的其中一种假设的方法。

本部分详细介绍了假设检验的基本思想和步骤,包括建立原假设和备择假设、选择合适的检验统计量和确定显著性水平等。

此外,还介绍了单总体、两总体和多总体的假设检验方法,并给出了具体的应用实例。

通过对《统计学原理》的知识点进行总结,我们可以发现统计学是一门基于概率论的科学,它研究数据的收集、整理、分析和解释的方法。

本书详细介绍了统计学的基本原理和方法,涵盖了概率论、概率分布、参数估计和假设检验等内容。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.什么是统计学?为什么统计学可以通过对数据分析达到对事物性质的认识?答:(1)统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。

(2)这是由客观事物本身的特点和统计方法的特性共同决定的。

①从客观事物方面来说,根据辩证法的基本原理,任何客观事物都是必然性与偶然性的对立统一。

同样,任何一个数据,也都是必然性与偶然性共同作用的结果,是二者作用的对立统一。

②从统计方法来看,统计学提供了一系列的方法,专门用来收集数据、整理数据、显示数据的特征,进而分析和探索(或推断)出事物总体的数量规律性。

2.解释总体与样本、参数和统计量的含义。

答:①总体:所研究的全部个体(元素)的集合。

②样本:从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量。

③参数:研究者想要了解的总体的某种特征值,参数通常是一个未知的常数。

④统计量:根据样本数据计算出来的一个量。

由于样本是我们所已经抽出来的,所以统计量总是知道的。

3.解释总体分布、样本分布和抽样分布的含义。

答:(1)总体分布:整体取值的概率分布规律,通常称为总体分布。

(2)样本分布:从总体中抽取容量为n的样本,得到n个样本观测值的概率分布,则为样本分布。

(3)抽样分布:就是由样本n个观察值计算的统计量的概率分布。

4.简述描述统计学和推断统计学的概念及其联系。

答:(1)描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法;推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。

(2)两者间联系:一方面反映了统计发展的前后两个阶段,另一方面也反映了统计方法研究和探索客观事物内在数量规律性的先后两个过程。

5.简述中心极限定理。

答:中心极限定理就是对于一个抽自任意总体(均值为µ,方差为σ2),样本容量为n 的随机样本。

当n充分大时(通常要求n≥30),样本均值的抽样分布将近似于一个具有μ、方差为σ2/n的正态分布。

6.解释置信水平、置信区间、显著性水平的含义,它们有什么联系。

答:(1)置信水平:置信区间中包含总体参数真值的次数所占的比率,也称置信系数。

(2)置信区间:在区间估计中,由样本统计量所构造的总体参数的估计区间。

(3)显著性水平:是指当原假设实际上正确时,检验统计量落在拒绝域的概率。

联系:置信区间越宽,置信水平越高,显著性水平越低。

7.样本统计量的分布和总体分布的关系是什么?答:样本统计量包括样本均值、样本比率、样本方差。

(1)样本均值总体分布的关系:①无论是重复还是不重复抽样,样本均值的数学期望始终等于总体均值;②在重复抽样条件下,样本均值的方差为总体方差的1/n;在不重复抽样条件下,样本均值的方差为1/n(2)样本比率与总体分布的关系:①样本比率p的数学期望等于总体比率π;②在重复条件下;在不重复条件下,用修正系数加以修正(3)样本方差与总体分布的关系:对于来自正态总体的简单随机样本,则比值的抽样分布服从自由度为(n-1)的x²分布。

8.抽样推断时为什么必须遵循随机原则抽取样本?只有遵循随机原则从总体中抽取样本,才能排除主观因素等非随机因素对抽样调查的影响,从而使样本单位的分布接近总体单位的分布,样本对总体才具有较大的代表性。

这样,根据样本的调查资料来估计和推断总体的数量特征才能较为科学和准确。

9.简述假设检验的一般步骤答:①陈述原假设H0和备择假设H1;②从所研究的总体中抽了一个随机样本;③确定一个适当的检验统计量,并利用样本数据算出来具体数值;④确定一个适当的显著性水平a,并计算出其临界值,指定拒绝域;⑤将统计量的值与临界值进行比较,并做出决策:若统计量的值落在拒绝域内,拒绝原假设H0,否则不拒绝原假设H0。

10.简述第Ⅰ类错误和第Ⅱ类错误的概念,它们发生的概率之间存在怎样关系?答:(1)当原假设为真时拒绝原假设,所犯的错误称为第Ⅰ类错误,又称为弃真错误,犯第Ⅰ类错误的概率通常记为α。

当原假设为假时没有拒绝原假设,所犯的错误称为第Ⅱ类错误,又称为取伪错误,犯第Ⅱ类错误的概率通常记为β。

(2)两者的关系:当α增大时,β减小;当α增大时,β减小。

【确定了显著水平a就等于控制了第一类错误的概率,但犯第二类错误的概率β趋却是不确定的.在拒绝原假设H0时,人们犯错误的概率不超过给定的显著水平α。

但当样本观测显示没有充分的理由拒绝原假设时,便难以确切知道第二类错误发生的概率。

因此,在假设检验中采用“不拒绝H0”,而不采用“接受H0”的表述方法,这种说法实质上并未作出明确结论,在多数场合下便避免了第二类错误发生的风险,因为“接受H0”所以得结论可靠性将由第二类错误的概率β来测量,而β的控制又相对复杂。

】11.简述众数、中位数和均值的特点和应用场合。

答:(1)众数是将数据按大小顺序排队形成次数分配后,在统计分布中具有明显集中趋势点的数值,是数据一般水平代表性的一种。

特点:可能没有众或有多个众数,最容易计算,但不是永远存在,同时作为集中趋势代表值应用的场合很少,一般在农贸市场上。

(2)中位数是数据排序后,位置在最中间的数值。

特点:很容易理解、很直观,它不受极端值的影响。

这既是它有价值的方面,也是它数据信息利用不够充分的地方(3)均值是算术平均数,是数据集中趋势的最主要测度值。

特点:数据信息提取得最充分,在整个统计方法中应用最广,对经济管理和工程等实际工作也是最重要的方法之一。

12. 为什么要计算离散系数?答:离散系数是用来对两组数据的差异程度进行相对比较的,比较两组数据的差异程度时,方差和标准差是以均值为中心计算出来的,受变量值水平和计量单位的影响,因而有时直接比较方差是不准确的,需要剔除均值大小不等的影响,计算并比较离散系数。

13.简述移动平均法的基本原理和特点。

答:移动平均法的基本原理是通过移动平均消除时间序列中的不规则变动和其他变动,从而揭示出时间序列的长期趋势。

移动平均具有如下特点:当时间数列的变动趋势为线性状态时,可采用移动平均法进行描述和分析。

该方法是通过扩大原时间数列的时间间隔,并按一定的间隔长度逐期移动,分别计算一系列移动平均数,由这些平均数形成的新的时间数列对原时间数列的波动起到一定的修匀作用,削弱了原数列中短期偶然因素的影响,从而呈现出现象发展的变动趋势。

14.方差分析的基本假设有那些?答:每个总体都应服从正态分布;各个总体的方差σ2必须相同;观测值是独立的15. 一组数据的分布特征可以从那几个方面进行测定?答:一组数据的分布特征可以从以下3个方面进行测度:(1)集中趋势的测度(众数、中位数、分位数、均值、几何平均数、切尾均值)。

(2)离散程度的测度(极差、内距、方差和标准差、离散系数)。

(3)偏态与峰度的测度(偏态及其测度、峰度及其测度)。

16.简述样本容量与置信水平、总体方差、允许误差的关系。

答:①样本容量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本容量也就越大;②样本容量与总体方差成正比,总体的差异越大,所要求的样本容量也越大;③样本容量与允许误差成反比,可以接受的允许误差越大,所需的样本容量就越小。

17.比较单侧检验和双侧检验的区别。

(1)问题的提法不同,双侧检验研究的是新方法与旧方法是否有差异;单侧检验研究的是新方法明显好于旧方法还是新方法明显不如旧方法。

(2) 建立假设的形式不同,双侧检验的假设是H0: u=u0, H1: u ≠u0;单侧检验的假设是H0: u ≤u0, H1: u>u0或H0: u>u0, H1: u ≤u0 。

(3)否定的区域不同,双侧检验的否定区域是IZ I> Z a/2;单侧检验的否定区域是Z<-Za 或Z>Za18.解释置信水平为95%的置信区间的含义。

答:总体参数是固定的,未知的,置信区间是一个随机区间。

置信水平为95%的置信区间的含义是指,在相同条件下多次抽样下,在所有构造的置信区间里大约有95%包含总体参数的真值。

19.什么是显著性水平?它对于假设检验决策的意义是什么?答:假设检验中犯第一类错误的概率被称为显著性水平。

显著性水平通常是人们事先给出的一个值,用于检验结果的可靠性度量,但确定了显著性水平等于控制了犯第一错误的概率,但犯第二类错误的概率却是不确定的,因此作出“拒绝原假设”的结论,其可靠性是确定的,但作出“不拒绝原假设”的结论,其可靠性是难以控制的20.甲企业近四年产品销售量分别增长了9%、7%、8%、6%;乙企业这四年产品的次品率也正好是9%、7%、8%、6%。

这两个企业这四年的平均增长率和平均次品率的计算是否一样?为什么?答:不一样。

因为计算的对象不同,所使用的方法不同。

平均增长率要将增长率变成发展速度后,通过几何平均法求出平均发展速度后减去1得平均增长率,即:四年的平均增长率=平均次品率是以每年的产品量(包括次品)为权数对每年的次品率进行加权算术平均得到的,设四年的产品量分别为A 、B 、C 、D ,则四年的平均次品率=(9%A+7%B+8%C+6%D )/(A+B+C+D)21. 在总量指标的两因素分析中,指数体系如下:)()(001010110011001010110011∑∑∑∑∑∑∑∑∑∑∑∑-+-=-⨯=q p q p q p q p q p q p q p q p q p q p q p q p 以下计算出来的是一组与上述指数体系相对应的销售额、销售价格和销售量的数据。

请根据以下数据解释该指数体系的含义。

答: 这表明,报告期与基期相比,销售额增长了30%,即2 160万元,这是由于销售价格提高了8.33%,使销售额增加了600万元和销售量增长了20%,使销售额增加了1 560万元这两个因素共同作用的结果。

相关文档
最新文档