统计学复习资料解答
统计学复习题及答案

统计学复习题及答案1. 什么是统计学?答:统计学是一门应用数学,它涉及数据的收集、分析、解释、展示和预测。
2. 描述统计学和推断统计学有什么区别?答:描述统计学关注于数据的总结和描述,而推断统计学则使用样本数据来推断总体特征。
3. 列举三种常见的概率分布。
答:正态分布、二项分布和泊松分布。
4. 什么是中心极限定理?答:中心极限定理表明,当样本量足够大时,独立同分布的随机变量之和的分布将趋近于正态分布。
5. 什么是置信区间?答:置信区间是一个区间估计,它给出了总体参数的一个可能范围,并且该范围有一定的置信水平。
6. 解释什么是假设检验。
答:假设检验是一种统计方法,用于根据样本数据来判断一个关于总体的假设是否成立。
7. 什么是相关系数?答:相关系数是度量两个变量之间线性关系强度和方向的统计量。
8. 什么是回归分析?答:回归分析是一种统计方法,用于研究变量之间的关系,特别是一个或多个自变量对因变量的影响。
9. 什么是方差分析?答:方差分析是一种统计方法,用于比较三个或更多组数据的均值是否存在显著差异。
10. 什么是标准差?答:标准差是衡量数据分散程度的一个指标,它是方差的平方根。
11. 什么是均值?答:均值是一组数据的算术平均值,它是所有数据值的总和除以数据的数量。
12. 什么是中位数?答:中位数是一组数据的中间值,当数据按照大小顺序排列时,位于中间位置的数值。
13. 什么是众数?答:众数是一组数据中出现次数最多的数值。
14. 什么是样本?答:样本是从总体中抽取的一部分个体,用于代表总体进行研究。
15. 什么是总体?答:总体是指研究中所有可能的个体的集合。
16. 什么是抽样误差?答:抽样误差是指由于样本的随机性导致样本统计量与总体参数之间的差异。
17. 什么是系统误差?答:系统误差是由于测量或实验设计中的偏差导致的误差,它会导致测量结果持续地偏离真实值。
18. 什么是数据的正态性?答:数据的正态性指的是数据分布接近正态分布,即呈现出对称的钟形曲线。
《统计学》试题及答案

《统计学》试题及答案(解答仅供参考)第一套一、名词解释1. 样本:在统计学中,样本是从总体中抽取的一部分个体,用于推断总体的特性。
2. 概率:概率是描述随机事件发生可能性的数值,范围在0到1之间。
3. 中位数:在一个数据集中,将所有数据按照大小排序后位于中间位置的数值称为中位数。
4. 方差:方差是描述一组数据分散程度的统计量,是各个数据与其平均数离差平方的平均数。
5. 相关系数:相关系数是衡量两个变量之间线性关系强度和方向的统计指标,其值介于-1和1之间。
二、填空题1. 在统计学中,______是描述数据集中趋势的常用指标,包括平均数、中位数和众数。
答案:集中趋势2. 如果一个随机变量的所有可能取值出现的概率相等,则该随机变量服从______分布。
答案:均匀分布3. 在进行假设检验时,我们通常会设定______水平,以决定拒绝原假设的标准。
答案:显著性水平(或称alpha水平)4. ______是通过观察样本来估计总体参数的一种方法。
答案:抽样5. 在回归分析中,______表示因变量的变化中能被自变量解释的比例。
答案:判定系数(R^2)三、单项选择题1. 下列哪种图表最适合展示各分类变量的频数分布?()A. 条形图B. 折线图C. 散点图D. 直方图答案:A2. 当两个随机变量完全正相关时,相关系数为()。
A. 0B. 1C. -1D. 无法确定答案:B3. 下列哪个统计量可用于度量数据的离散程度?()A. 平均数B. 中位数C. 众数D. 标准差答案:D4. 在t检验中,如果p值小于0.05,我们可以()。
A. 接受原假设B. 拒绝原假设C. 不能确定D. 都可以答案:B5. 在线性回归模型中,如果某个自变量的系数为负,那么这个自变量与因变量的关系是()。
A. 正相关B. 负相关C. 无关D. 不确定答案:B四、多项选择题1. 下列哪些是描述性统计分析的主要内容?()A. 平均数B. 中位数C. 众数D. 方差E. 相关系数答案:A、B、C、D、E2. 下列哪些是常用的概率分布?()A. 正态分布B. 均匀分布C. 泊松分布D. 二项分布E. 卡方分布答案:A、B、C、D、E3. 统计学中,总体与样本的关系是:A. 总体是全部数据,样本是部分数据B. 总体是随机抽取的部分数据,样本是全部数据C. 总体是固定不变的,样本是可以变动的D. 总体是随机的,样本也是随机的答案:A、C、D4. 下列哪种情况适合使用卡方检验?()A. 检验两个分类变量之间是否存在关联性B. 比较两组样本的平均值是否有显著差异C. 研究一个连续变量是否符合正态分布D. 预测一个响应变量的未来值E. 分析一个因素对实验结果的影响答案:A5. 在进行线性回归分析时,以下哪些假设通常需要满足?()A. 因变量和自变量之间存在线性关系B. 自变量之间不存在多重共线性C. 残差服从正态分布D. 同一样本中的观测值是独立的E. 样本数据必须是完整的,不能有缺失值答案:A、B、C、D五、判断题1. 标准差越大,数据的离散程度越大。
统计学复习题与答案

统计学复习题与答案1. 什么是总体和样本?总体是指研究对象的全体,而样本是从总体中抽取的一部分个体。
样本的选取应具有代表性,以便能够通过样本来推断总体的特征。
答案:总体是指研究对象的全部个体,样本则是从总体中随机抽取的一部分个体。
总体和样本的关系是,样本是总体的子集,通过样本可以对总体进行推断。
2. 描述统计和推断统计有何区别?描述统计主要关注对数据的收集、整理和描述,目的是对数据集进行总结和描述。
推断统计则侧重于利用样本数据来推断总体的特征,包括估计总体参数和进行假设检验。
答案:描述统计学关注于数据的收集、整理、描述和展示,目的是对数据集进行总结。
而推断统计学则利用样本数据来推断总体的特征,包括参数估计和假设检验。
3. 什么是中心极限定理?中心极限定理指出,如果样本量足够大,那么样本均值的分布将近似正态分布,无论总体分布的形状如何。
答案:中心极限定理表明,对于足够大的样本量,样本均值的分布将趋向于正态分布,即使总体分布本身不是正态分布。
4. 什么是相关系数?它如何衡量变量之间的关系?相关系数是一个统计量,用于衡量两个变量之间线性关系的强度和方向。
其值介于-1和1之间,其中1表示完全正相关,-1表示完全负相关,0表示没有线性关系。
答案:相关系数是衡量两个变量之间线性关系强度和方向的统计量。
它的取值范围是-1到1,其中1代表完全正相关,-1代表完全负相关,0则表示没有线性关系。
5. 什么是回归分析?它在统计学中有何应用?回归分析是一种统计方法,用于研究一个或多个自变量对因变量的影响。
它广泛应用于预测、趋势分析和因果关系研究等领域。
答案:回归分析是研究一个或多个自变量与因变量之间关系的统计方法。
它在预测、趋势分析、因果关系研究等多个领域都有重要应用。
6. 如何理解假设检验中的零假设和备择假设?零假设(H0)通常表示没有效应或没有差异的假设,而备择假设(H1)则是研究者试图证明的假设。
进行假设检验的目的是确定是否有足够的证据拒绝零假设,以支持备择假设。
统计学复习题解答

《应用统计学》期末复习解答一、单选题1.统计总体的同质性是指( A )A.总体各单位具有某一共同的品质标志或数量标志B.总体各单位具有某一共同的品质标志属性或数量标志值C.总体各单位具有若干互不相同的品质标志或数量标志D.总体各单位具有若干互不相同的品质标志属性或数量标志值2.按某一标志分组的结果,表现出( A )A.组内同质性和组间差异性B.组内差异性和组间差异性C.组内同质性和组间同质性D.组内差异性和组间同质性3.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D )A.全部工业企业B.800家工业企业C.每一件产品D.800家工业企业的全部工业产品4.统计调查的基本任务是取得原始统计资料,所谓原始统计资料是(C)A.统计部门掌握的资料B.对历史统计资料进行整理后取得的资料C.直接向调查单位进行登记取得的资料D.统计年鉴或统计公报上发布的资料5.已知两个同类企业的职工平均工资的标准差分别为10元和6元,而平均工资分别为3000元、3500元,则两个企业的工资离散程度为( A )A.甲大于乙B.乙大于甲C.两者相等D.无法判断6.一个连续性生产的工厂,为检验产品的质量,在一天中每隔1小时取5分钟的产品做检验,这种抽样方法属于( C )A.简单随机抽样B.整群抽样C.系统抽样D.分层抽样7.进行统计分组的关键是(B)A.划分各组组限B.正确选择分组标志C.确定各组组距D.计算各组组中值8.对一批进口商品的质量进行假设检验,在显著性水平为0.01时,原假设被拒绝;如果使用0.05的显著性水平,则原假设( A)A.一定会被拒绝B.可能会被拒绝C.一定会被接受D.必须重新假设检验 9.下列分组中按品质标志分组的是(B )A.人口按年龄分组B.产品按质量优劣分组C.企业按固定资产原值分组D.乡镇按工业产值分组 10.当一组数据属于右偏分布时,则(B ) A.平均数、中位数与众数是合而为一的 B.众数在左边,平均数在右边C.众数的数值较小,平均数的数值较大D.众数在右边,平均数在左边11.下列关于相关系数的陈述中哪一个是错误的( A ) A.数值越大说明两个变量之间的关系就越强B.仅仅是两个变量之间线性关系的一个度量,不能用于描述非线性关系C.只是两个变量之间线性关系的一个度量,不一定意味两个变量之间存在因果关系D.绝对值不会大于112.如果报告期商品价格计划降低5%,销售额计划增加10%,则销售量应增加( D ) A.15% B.5% C.5.25% D.15.79% 13.某橡胶厂生产汽车轮胎,根据历史资料统计结果,平均里程为25000公里,标准差为1900公里。
统计复习题及答案

统计复习题及答案1. 什么是统计学?统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
2. 描述统计学和推断统计学的主要区别是什么?描述统计学关注于数据的组织、汇总和描述,而推断统计学则利用样本数据来推断总体特征。
3. 什么是总体和样本?总体是指研究对象的全部个体,样本则是从总体中抽取的一部分个体。
4. 什么是随机抽样?随机抽样是指每个样本单位被选中的概率相等的抽样方法。
5. 什么是变量?变量是可取不同值的量,通常用于描述数据集中的属性或特征。
6. 什么是参数和统计量?参数是总体的特征值,统计量则是样本的特征值。
7. 什么是频率分布?频率分布是将数据分组并计算每组中数据出现的次数。
8. 什么是正态分布?正态分布是一种连续概率分布,其形状呈钟形,也称为高斯分布。
9. 什么是中位数?中位数是将数据集从小到大排序后位于中间位置的数值。
10. 什么是众数?众数是数据集中出现次数最多的数值。
11. 什么是方差和标准差?方差是衡量数据分布离散程度的量,标准差则是方差的平方根。
12. 什么是相关系数?相关系数是衡量两个变量之间线性关系强度和方向的统计量。
13. 什么是回归分析?回归分析是一种统计方法,用于估计变量之间的关系,特别是一个因变量和一个或多个自变量之间的关系。
14. 什么是假设检验?假设检验是一种统计方法,用于根据样本数据对总体参数进行推断。
15. 什么是置信区间?置信区间是一个值的范围,在这个范围内,我们有特定置信水平认为总体参数会落在其中。
答案:1. 统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
2. 描述统计学关注于数据的组织、汇总和描述,而推断统计学则利用样本数据来推断总体特征。
3. 总体是指研究对象的全部个体,样本则是从总体中抽取的一部分个体。
4. 随机抽样是指每个样本单位被选中的概率相等的抽样方法。
5. 变量是可取不同值的量,通常用于描述数据集中的属性或特征。
6. 参数是总体的特征值,统计量则是样本的特征值。
统计学复习资料解答

统计学复习资料解答统计学复习资料一、单项选择题1、一个统计总体( D )A、只能有一个标志;B、只能有一个指标;C、可以有多个标志;D、可以有多个指标。
2、调查某大学2000名学生学习情况,则总体单位是( C )A 、2000名学生;B、 2000名学生的学习成绩;C、每一名学生;D、每一名学生的学习成绩。
3、某地进行国有商业企业经营情况调查,则调查对象是( B )。
A、该地所有商业企业;B、该地所有国有商业企业;C、该地每一国有商业企业;D、该地每一商业企业。
4、以下哪种调查的报告单位与调查单位是一致的( C )。
A、工业普查;B、工业设备调查;C、职工调查;D、未安装设备调查。
5、某市进行工业企业生产设备普查,要求在7月1日至7月10日全部调查完毕,则这一时间规定是( B )。
A、调查时间;B、调查期限;C、标准时间;D、登记期限。
6、某连续变量分为5组:第一组为40——50,第二组为50——60,第三组为60——70,第四组为70——80,第五组为80以上,则( B )A、50在第一组,70在第四组;B、60在第三组,80在第五组;C、70在第四组,80在第五组;D、80在第四组,50在第二组。
7、已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用( A )A 、简单算术平均法;B 、加权算术平均法;C 、加权调和平均法;D 、几何平均法。
8、用水平法检查长期计划完成程度,应规定( B )A 、计划期初应达到的水平;B 、计划期末应达到的水平;C 、计划期中应达到的水平;D 、整个计划期应达到的水平。
9、某地区有10万人,共有80个医院。
平均每个医院要服务1250人,这个指标是( B )。
A 、平均指标;B 、强度相对指标;C 、总量指标;D 、发展水平指标。
10、时间序列中,每个指标数值可以相加的是( B )。
A 、相对数时间序列;B 、时期数列;C 、间断时点数列;D 、平均数时间序列。
统计学必考试题库及答案

统计学必考试题库及答案一、单项选择题1. 统计学是一门研究数据的科学,其主要研究内容包括数据的收集、处理、分析和解释。
()A. 正确B. 错误答案:A2. 描述统计学主要关注数据的收集和整理,而不涉及数据的推断。
()A. 正确B. 错误答案:B3. 在统计学中,总体是指研究对象的全部个体。
()A. 正确B. 错误答案:A4. 样本容量是指样本中包含的个体数量,它不能小于总体中的个体数量。
()A. 正确B. 错误答案:B5. 统计学中的参数是指用来描述总体特征的数值,而统计量则是用来描述样本特征的数值。
()A. 正确B. 错误答案:A二、多项选择题6. 以下哪些是统计学中常用的数据类型?()A. 定性数据B. 定量数据C. 时间序列数据D. 空间数据答案:ABCD7. 在统计分析中,以下哪些因素会影响样本的代表性?()A. 抽样方法B. 样本容量C. 总体的异质性D. 抽样误差答案:ABC8. 以下哪些统计图可以用来展示数据的分布情况?()A. 条形图B. 直方图C. 散点图D. 箱线图答案:BCD9. 以下哪些是统计学中常用的参数估计方法?()A. 点估计B. 区间估计C. 假设检验D. 方差分析答案:AB10. 以下哪些是统计学中常用的回归分析方法?()A. 简单线性回归B. 多元线性回归C. 逻辑回归D. 泊松回归答案:ABCD三、判断题11. 统计学中的抽样调查可以完全代替全面调查。
()答案:错误12. 统计学中的相关性意味着因果关系。
()答案:错误13. 在统计学中,中位数是不受极端值影响的中心趋势度量。
()答案:正确14. 统计学中的置信区间越宽,表示估计的精确度越高。
()答案:错误15. 统计学中的假设检验可以用来确定两个总体参数之间是否存在显著差异。
()答案:正确四、简答题16. 简述统计学中样本与总体的关系。
答案:样本是从总体中抽取的一部分个体,用于代表总体进行研究和分析。
样本的代表性和容量直接影响统计分析的结果和推断的准确性。
统计学简答题参考答案

统计学简答题参考答案第一章绪论1.什么是统计学怎样理解统计学与统计数据的关系答:统计学是一门收集、整理、显示和分析统计数据的科学;统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义;2.简要说明统计数据的来源;答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查;间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得;3.简要说明抽样误差和非抽样误差;答:统计调查误差可分为非抽样误差和抽样误差;非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的;抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的;4.解释描述统计和推断统计的概念P5答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法; 推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法;第二章统计数据的描述1描述次数分配表的编制过程;答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组;按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细;按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围区间作为一个组; 统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表;2. 一组数据的分布特征可以从哪几个方面进行测度答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度;常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数;3.怎样理解均值在统计中的地位答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位;受极端数值的影响是其使用时存在的问题;4. 简述众数、中位数和均值的特点和应用场合;答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的;众数容易计算,但不是总是存在,应用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响;5.为什么要计算离散系数答:在比较二组数据的差异程度时,由于方差和标准差受变量值水平和计量单位的影响不能直接比较,由此需计算离散系数作为比较的指标;6.描述茎叶图和直方图,箱线图的画法,并说明它们的用途P41、42答:茎叶图将数据分为“茎”和“叶”两部分,绘制茎叶图的关键是设计好树茎,通常是以该组数据的高位数值作 为树茎,而且树叶上 只保留该数值的最后一个数字;通过茎叶图可以看出数据的分布形状及数据的离散状况; 直方图的绘制方法:在平面直角坐标系上,将分组标志作为横轴,并将各组次数作为纵轴,绘出的长方形图即直方图;通过直方图 可以看出数据的分配特征; 箱线图是由一个箱子和两条线段组成的;其绘制方法是:首先找出一组数据的五个特征值,即数据的最大值、最小值、中位数和两 个四分位数;然后连接两个四分位数画出箱子;再将两个极值点与箱子相连接;通过箱线图可以看出数据分布的特征;7.设计一张规范的统计表应该注意哪些问题答:1、统计表一般为横长方形,上下两端封闭且为粗线,左右两端开口; 2、统计表栏目多时要编号,一般主词部分按甲、乙、丙;宾词部分按12等次序编号; 3、统计表总标题应简明扼要,符合表的内容; 4、主词与宾词位置可互换;各栏排列次序应以时间先后、数量大小、空间位置等自然顺序编排; 5、计量单位一般写在表的右上方或总栏标题下方; 6、表内资料需要说明解释部分,如:注解、资料来源等,写在表的下方;7、填写数字资料不留空格,即在空格处划上斜线;统计表经审核后,制表人和填报单位应签名并盖章,以示负责;第三章 概率、概率分布与抽样分布1.解释总体分布、样本分布和抽样分布的含义答:总体分布指某个变量在总体中各个个体上的取值所形成的分布,它是未知的,是统计推断的对象;从总体中随机抽取容量为n 的样本()12,,,n x x x ,它的分布称为样本分布;由样本的某个函数所形成的统计量()12,,,n f x x x ,它的分布称为抽样分布如样本均值、样本方差的分布2.重复抽样与不重复抽样相比,抽样均值抽样分布的标准差有什么不同答:重复抽样和不重复抽样下,样本均值的标准差分别为:因此不重复抽样下的标准差小于重复抽样下的标准差,两者相差一个调整系数3.解释中心极限定理的含义答:在抽样推断中,中心极限定理指出,不论总体服从何种分布,只要其数学期望和方差存在,对总体进行重复抽样时,当样本容量充分大,样本均值趋近于正态分布;中心极限定理为均值的抽样推断奠定了理论基础;4.简述系统抽样组织方式组织实施的基本步骤P98答:在抽样中先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个单位,直至抽取n 个 单位形成一个样本;5.整群抽样的优缺点是什么P98答:整群抽样的优点:可以简化抽样框的编制;样本单元比较集中,实施调查便利,且能节约费用; 整群抽样的缺点:当群内具有一定的相似性,而不同群之间的差别比较大时,相同样本量下整群抽样的抽样效率比简单随机抽样差 ,抽样误差较大;6.什么是必要的样本容量,其影响因素有哪些答:是指一个样本的必要抽样单位数目;在组织抽样调查时,抽样误差的大小直接影响样本指标代表性的大小,而必要的样本单位数目是保证抽样误差不超过某一给定范围的重要因素之一影响因素:1 研究对象的变化程度;2 所要求或允许的误差大小即精度要求;3 要求推断的置信程度;也就是说,当所研究的现象越复杂,差异越大时,样本量要求越大;当要求的精度越高,可推断性要求越高时,样本量越大;第四章 参数估计1.简述评价估计量好坏的标准答:评价估计量好坏的标准主要有:无偏性、有效性和相合性;设总体参数θ的估计量有1ˆθ和2ˆθ,如果()1ˆE θθ=,称1ˆθ是无偏估计量;如果1ˆθ和2ˆθ是无偏估计量,且()1ˆD θ小于()2ˆD θ,则1ˆθ比2ˆθ更有效;如果当样本容量n →∞,1ˆθθ→,则1ˆθ是相合估计量; 2.简述样本容量与置信水平、总体方差、允许误差的关系答:以估计总体均值时样本容量的确定公式为例:()22/22z n E ασ= 样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比;第五章 假设检验1.理解原假设与备择假设的含义,并归纳常见的几种建立原假设与备择假设的原则. 答:原假设通常是研究者想收集证据予以反对的假设;而备择假设通常是研究者想收集证据予以支持的假设;建立两个假设的原则有:1原假设和备择假设是一个完备事件组;2一般先确定备择假设;再确定原假设;3等号“=”总是放在原假设上;4假设的确定带有一定的主观色彩;5假设检验的目的主要是收集证据来拒绝原假设;2.第一类错误和第二类错误分别是指什么它们发生的概率大小之间存在怎样的关系 答:第I 类错误指,当原假设为真时,作出拒绝原假设所犯的错误,其概率为α;第II 类错误指当原假设为假时,作出接受原假设所犯的错误,其概率为β;在其他条件不变时,α增大,β减小;β增大,α减小;3.什么是显着性水平它对于假设检验决策的意义是什么答:假设检验中犯第一类错误的概率被称为显着性水平;显着性水平通常是人们事先给出的一个值,用于检验结果的可靠性度量,但确定了显着性水平等于控制了犯第一错误的概率,但犯第二类错误的概率却是不确定的,因此作出“拒绝原假设”的结论,其可靠性是确定的,但作出“不拒绝原假设”的结论,其可靠性是难以控制的;4.什么是p 值p 值检验和统计量检验有什么不同答:p 值是当原假设为真时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率;P 值常常作为观察到的数据与原假设不一致程度的度量;统计量检验采用事先确定显着性水平α,来控制犯第一类错误的上限,p 值可以有效地补充α提供地关于检验可靠性的有限信息;p 值检验的优点在于,它提供了更多的信息,让人们可以选择一定的水平来评估结果是否具有统计上的显着性;5.什么是统计上的显着性答:一项检验在统计上是显着的拒绝原假设,是指这样的样本结果不是偶然得到的,或者说,不是靠机遇能够得到的;显着性的意义在于“非偶然的;第七章 相关与回归分析1.相关分析与回归分析的区别与联系是什么答:相关与回归分析是研究变量之间不确定性统计关系的重要方法,相关分析主要是判断两个或两个以上变量之间是否存在相关关系,并分析变量间相关关系的形态和程度;回归分析主要是对存在相关关系的现象间数量变化的规律性作出测度;但它们在研究目的和对变量的处理上有明显区别;它们均是统计方法,不能揭示现象之间的本质关系;2.什么是总体回归函数和样本回归函数它们之间的区别是什么答:以简单线性回归模型为例,总体回归函数是总体因变量的条件期望表现为自变量的函数:()()i i i E Y X f X X αβ==+,或i i i Y X u αβ=++;总体回归函数是确定的和未知的,是回归分析所估计的对象;样本回归函数是根据样本数据所估计出的因变量与自变量之间的函数关系:ˆˆˆi i y x αβ=+或ˆˆi i iy x e αβ=++;回归分析的目的是用样本回归函数来估计总体回归函数;它们的区别在于,总体回归函数是未知但是确定的,而样本回归函数是随样本波动而变化;总体回归函数的参数,αβ是确定的,而样本回归函数的系数ˆˆ,αβ是随机变量;总体回归函数中的误差项i u 不可观察的,而样本回归函数中的残差项i e 是可以观察的;3. 什么是随机误差项和残差它们之间的区别是什么答:随机误差项i u 表示自变量之外其他变量的对因变量产生的影响,是不可观察的,通常要对其给出一定的假设;残差项i e 指因变量实际观察值与样本回归函数计算的估计值之间的偏差,是可以观测的;它们的区别在于,反映的含义是不同且可观察性也不同,它们的联系可有下式:4.为什么在对参数进行最小二乘估计时,要对模型提出一些基本的假定答:最小二乘法只是寻找估计量的一种方法,其寻找到的估计量是否具有良好的性质则依赖模型的一些基本的假定;只有在一系列的经典假定下,最小二乘估计量才是BLUE;5. 为什么在多元回归中要对可决系数进行修正答:在样本容量一定下,随着模型中自变量个数的增加,可决系数2R 会随之增加,模型的拟合程度上升,但自由度会损失,从而降低推断的精度,因此需要用自由度来修正可决系数,用修正的可决系数来判断增加自变量的合适性;6.在多元线性回归中,对参数作了t 检验后为什么还要作方差分析和F 检验答:t 检验仅是对单个系数的显着性进行检验,由于自变量之间存在着较为复杂的关系,因此有必要对回归系数进行整体检验,方差分析和F 检验就是对回归方程的整体统计显着性进行的检验方法;7.函数关系与相关关系有何不同答:1函数关系指变量之间的关系是确定的,而相关关系的两变量的关系则是不确定的;可以在一定范围内变动;2函数关系变 量之间的依存可以用一定的方程y=fx 表现出来,可以给定自变量来推算因变量,而相关关系则不能用一定的方程表示;函数关 系是相关关系的特例,即函数关系是完全的相关关系,相关关系是不完全的相关关系;8.什么是标准差和标准误差,两者有和差别答:标准差作为随机误差 的代表,是随机误差绝对值的统计均值;在抽样试验或重复的等精度测量 中, 常用到样本平均数的标准差,亦称样本平均数的标准误或简称标准误; 区别:标准差是表示个体间变异大小的指标,反映了整个样本对样本平均数的离散程度,是数据精密度的衡量指标;而标准误反映样本平均数对总体平均数的变异程度,从而反映抽样误差的大小 ,是量度结果精密度的指标;第八章时间序列分析与预测1.从要素分解的角度,时间序列可分解成哪四个要素答:一个时间序列通常由4种要素组成:趋势、季节变动、循环波动和不规则波动;趋势:是时间序列在长时期内呈现出来的持续向上或持续向下的变动;季节变动:是时间序列在一年内重复出现的周期性波动;它是诸如气候条件、生产条件、节假日或人们的风俗习惯等各种因素影响的结果;循环波动:是时间序列呈现出得非固定长度的周期性变动;循环波动的周期可能会持续一段时间,但与趋势不同,它不是朝着单一方向的持续变动,而是涨落相同的交替波动;不规则波动:是时间序列中除去趋势、季节变动和周期波动之后的随机波动;不规则波动通常总是夹杂在时间序列中,致使时间序列产生一种波浪形或震荡式的变动;只含有随机波动的序列也称为平稳序列;2.什么是季节变动测定季节变动的“趋势—循环”剔除法的基本步骤和原理是什么答:季节变动是指客观现象因受自然因素或社会因素的影响,而形成的在一年内有规则的周期性变动;P275 步骤和原理:①求出原数列中的趋势值或趋势-循环值;②以原数列各项数值分别除以其对应的趋势值或趋势-循环值,目的是为了剔除数列中的趋势或趋势-循环因素③将剔除趋势或趋势-循环因素的数据,求其各年同期月或季的平均数,并使其平均为1得到季节比率④调整季节比率P277.3.测定季节变动的“原始资料平均法”的基本步骤和原理是什么答:A基本步骤1计算各年同期的平均数,为了消除各年同季数据的不规则变动2,计算全部数据的总平均数,找出整个数列的水平趋势3 计算季节指数B原理是不考虑长期趋势影响,根据原始数据直接计算季节指数测定季节变动4.为什么平均发展速度要用几何平均法计算,计算平均发展速度的几何平均法的特点是什么答:现象发展的平均速度,一般用几何平均法计算;平均速度是总速度的平均,但现象发展的总速度不等于各年发展速度之和,而等于各年环比发展速度的连乘积,所以求平均发展速度要用几何平均法; 几何平均法的实质是要求从最初水平出发,按所求的平均发展速度发展,计算出的末期水平应等于实际末期水平,这种方法可以只根据最初水平与最末水平计算而不考虑中间水平的变化,其侧重点在于考虑最末一期发展水平;5.时间序列有哪些速度分析指标他们之间的关系是什么答:发展速度:报告期发展水平与基期发展水平之比,用于描述现象在观察期内的发展变化程度增长速度:也称增长率,是增长量与基期水平之比,用于描述现象的相对增长程度;按照采用基期的不同,增长速度可分为定基增长速度与环比增长速度,两者之间没有直接的换算关系,在由环比增长速度推算定基增长速度时,可先将各环比增长速度加1后连乘,再将结果减1,即得定基增长速度平均发展速度:各个时期环比发展速度的平均数,用于描述现象在整个观察期内平均发展变化的程度平均增长速度平均增长率:用于描述现象在整个观察期内平均增长变化的程度,它通常用平均发展速度减1来求得第九章统计指数1.同度量因素固定的固定的一般原则答:在编制数量指标指数时,用质量指标指数作为同度量因素,并把这个同度量因素固定在基期;在编制质量指标指数时,用数量指标做同度量因素,并且把这个同度量因素,并且把这个同度量因素固定在报告期;2.同度量因素的作用答:不仅起着同度量的作用;同时还起着对指标“加权”的作用3.拉氏指数与帕氏指数同度量因素固定的原则答:拉氏指数:以基期的质量指标作为同度量因素帕氏指数:以报告期的数量指标作为同度量因素4.指数体系的概念,用公式写出指数体系的两个涵义相对数与绝对数涵义,指数体系有何作用P305答:广义的指数体系类似于指标体系的概念,泛指由若干个内容上相互关联的统计指数所结成的体系;狭义的指数体系仅指几个指数在一定的经济基础上所结成的较为严密的数量关系式;相对指标:相对指标又称相对数,是用两个有联系的指标进行对比的比值来反映社会经济现象数量特征和数量关系的综合指标;公式:相对数=总体中某一部分数值/总体全部数值X100%绝对指标:统计中常用的总量指标就是绝对数;它是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合指标;公式:相对数=比较数值比数/ 基础数值基数作用:①因素分析,即分析现象的总变动中各有关因素的影响程度;②指数推算,即根据已知的指数推算未知的指数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学复习资料
一、单项选择题
1、一个统计总体( D )
A、只能有一个标志;
B、只能有一个指标;
C、可以有多个标志;
D、可以有多个指标。
2、调查某大学2000名学生学习情况,则总体单位是( C )
A 、2000名学生;B、 2000名学生的学习成绩;
C、每一名学生;
D、每一名学生的学习成绩。
3、某地进行国有商业企业经营情况调查,则调查对象是( B )。
A、该地所有商业企业;
B、该地所有国有商业企业;
C、该地每一国有商业企业;
D、该地每一商业企业。
4、以下哪种调查的报告单位与调查单位是一致的( C )。
A、工业普查;
B、工业设备调查;
C、职工调查;
D、未安装设备调查。
5、某市进行工业企业生产设备普查,要求在7月1日至7月10日全部调查完毕,则这一时间规定是( B )。
A、调查时间;
B、调查期限;
C、标准时间;
D、登记期限。
6、某连续变量分为5组:第一组为40——50,第二组为50——60,第三组为60——70,第四组为70——80,第五组为80以上,则( B )
A、50在第一组,70在第四组;
B、60在第三组,80在第五组;
C、70在第四组,80在第五组;
D、80在第四组,50在第二组。
7、已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用( A )
A、简单算术平均法;
B、加权算术平均法;
C、加权调和平均法;
D、几何平均法。
8、用水平法检查长期计划完成程度,应规定( B )
A、计划期初应达到的水平;
B、计划期末应达到的水平;
C、计划期中应达到的水平;
D、整个计划期应达到的水平。
9、某地区有10万人,共有80个医院。
平均每个医院要服务1250人,这个指标是( B )。
A、平均指标;
B、强度相对指标;
C、总量指标;
D、发展水平指标。
10、时间序列中,每个指标数值可以相加的是( B )。
A、相对数时间序列;
B、时期数列;
C、间断时点数列;
D、平均数时间序列。
11、根据时间序列用最小平方法配合二次曲线,所依据的样本资料的特点是( B )。
A 、时间序列中各期的逐期增长量大体相等;
B 、各期的二级增长量大体相等;
C 、各期的环比发展速度大体相等;
D 、各期同比增长量的大体相。
12、红星机械厂计划规定,今年甲产品的单位产品成本比去年降低4%,实际执行的结果降低了5%,则该产品单位成本降低计划完成程度的算式为( C )。
A 、%4%5 ; B 、%104%105; C 、%96%
95;D 、%4%5 。
13、在回归分析中,要求两变量 ( B )
A 、都是随机变量;
B 、自变量是确定性变量,因变量是随机变量;
C 、都是确定性变量;
D 、因变量是确定性变量,自变量是随机变量。
14、无偏性是指( A )
A 、抽样指标的平均数等于被估计的总体指标;
B 、当样本容量n 充分大时,样本指标充分靠近总体指标;
C 、随着n 的无限增大,样本指标与未知的总体指标之间的离差任意小的可能性趋于实际必然性。
D 、作为估计量的方差比其他估计量的方差小
15、在一定的抽样平均误差条件下 ( A )
A 、扩大极限误差范围,可以提高推断的可靠程度;
B 、扩大极限误差范围,会降低推断的可靠程度;
C 、缩小极限误差范围,可以提高推断的可靠程度;
D 、缩小极限误差范围,不改变推断的可靠程度。
二、多项选择题
1、下列各项中属于品质标志的有( ACD )。
A 、性别;
B 、年龄;
C 、职务;
D 、民族;
E 、工资。
2、从表式上看,统计表由哪些部分构成( ACDE )。
A 、总标题;
B 、主词;
C 、纵栏标题;
D 、横行标题;
E 、指标数值
3、在相对数中,子项和母项可以互换位置的有( BC )。
A .结构相对数;
B .比例相对数;
C .比较相对数;
D .动态相对数。
E .计划完成相对数
4、下列统计指标属于总量指标的是( ABCDE )
A 、工资总额;
B 、商业网点密度;
C 、商品库存量;
D 、人均国内生产总值;
E 、进出口总额。
5、定基增长速度等于( ADE )。
A.定基发展速度-1;
B.环比发展速度的连乘积;
C.环比增长速度的连乘积;
D.环比增长速度加1后的连乘积再减1;
E.定基增长量除以最初水平。
6、某企业为了分析本厂生产的两种产品产量的变动情况,已计算出产量指数为118.6%,这一指数是( ABD )。
A .综合指数;
B .总指数;
C .个体指数;
D .数量指标指数;
E .质量指标指数。
7、影响抽样误差的因素有( CD )。
A 、是有限总体还是无限总体;
B 、是平均数还是成数;
C 、是重复抽样还是不重复抽样;
D 、总体标志变异程度大小;
E 、以上答案都对。
8、统计指标和统计标志是不同的,下面属于统计指标的是( AVDE )。
A 、某地区人口的性别比例;
B 、某人的性别;
C 、一台完好的设备;
D 、设备完好率;
E 、平均身高
9、下列指标中属于时点指标的有( ABD )。
A 、企业数;
B 、在册职工人数;
C 、某种商品的销售量;
D 、某地区2004年人口数;
E 、某种产品的产量。
10、影响抽样平均误差的因素有( ACDE )。
A 、总体标志变异程度;
B 、样本容量;
C 、抽样组织形式;
D 、抽样方法;
E 、样本指标值的大小。
三、判断题
( √ )1、分层抽样和整群抽样都需要事先按某一标志对总体进行划分的随机抽样。
( √ )2、参数估计就是用样本统计量去估计总体的参数。
( )3、不存在趋势的时间序列称为平稳时间序列。
( )4、相关系数为0表明两个变量之间不存在任何关系。
( )5、广义地讲,任何两个数值对比形成的相对数都可以称为指数。
( )6、11、在假设检验中,如果检验统计量的P 值小于给定的显著性水平则在做决策时,需要在显著性水平的情况下,接受原假设。
( )7、抽样分布是指样本统计量的概率分布。
( )8.欲对一批成品合格率进行抽样调查,前不久曾经进行的两次全面调查,合格率分别为p 1=90%,p 2=80%,根据p 1计算样本容量。
( )9.当相关系数r 为正时,回归系数b 一定为正。
( )10.甲产品产量与单位成本的相关系数是-0.89。
乙产品单位成本与利润率的相关系数是-0.93。
因此,甲比乙的相关程度高。
四、问答题
1、统计指标的概念
2、普查的组织原则
3、统计分组的核心
4、相对指标的作用
5、变异指标的作用
6、动态数列的作用
7、统计指数的作用
8、相关关系的种类
五、计算题
1、一个电视节目主持人想了解观众对某个电视专题的喜欢程度,他选取了500个观众作样本(重复抽样),结果发现喜欢该节目的有175人。
(1)试以95%的概率估计观众喜欢这一专题节目的区间范围。
(2)若该节目主持人希望估计
,问有多大把握程度?
2、2014年某月甲、乙两市场某商品价格、销售量和销售额资料如下:
试分别计算该商品在两个市场上的平均价格。
4、已知:279,30268,1481y xy ===∑∑∑∑∑2n=6 ,x=21 , y=426 , x 要求:(1)计算变量x 与变量y 间的相关系数;(2)建立变量y 倚变量x 变化的直线回归方程。
(要求写出公式和计算过程,结果保留四位小数。
)
5、已知:279,30268,1481y xy ===∑∑∑∑∑2n=6 ,x=21 , y=426 , x 要求:(1)计算变量x 与变量y 间的相关系数;(2)建立变量y 倚变量x 变化的直线回归方程。
(要求写出公式和计算过程,结果保留四位小数。
)
六、结合实际谈谈学习本门课程的感悟。