应用统计学概念整理
[应用]统计学名词解释、简答
![[应用]统计学名词解释、简答](https://img.taocdn.com/s3/m/44c681ed760bf78a6529647d27284b73f24236a8.png)
名词解释统计总体:指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。
统计总体的特征:同质性、差异性、大量性。
总体单位:个体,指构成总体的各个单位。
统计指标:简称指标,用来反映社会经济现象总体的数量特征的概念及其数值。
任一概念都包含指标名称和指标数值。
特征有总体性、数量性、综合性、具体性。
统计标志:在统计中,总体单位所具有的属性或特征的名称。
标志是统计研究的起点,总体单位是标志的载体,是标志的承担者,统计研究是从登记标志开始的,并通过对标志的综合来反映总体的数量特征。
可分为品质标志和数量标志,或不变标志和变异标志。
统计调查:就是根据统计研究的预定目的、要求和任务,运用各种科学的调查方法,有计划、有组织地搜集有关现象的各个单位的资料,对客观事实进行登记,取得真实可靠的原始资料的工作过程。
统计调查是整个统计工作的基础环节。
统计调查的好坏,将影响统计资料的正确与否,从而影响统计质量。
统计调查的要求:准确性、及时性、全面性、系统性。
普查:是根据统计任务的特定目的而专门组织的一次性全面调查。
调查范围:1.属于一定时点的社会经济现象的总量(如人口普查)。
2.反映一定时期现象的总量(如出生人口总数)。
优点:所获资料更详细,有较高的准确性和时效性。
缺点:工作量大,花费时间长,耗费大量的人力、物力和财力。
主要作用:在于掌握某些关系国计民生、国情国力的数据,获得比较准确的信息。
抽样调查:指从所要研究的总体中,按照随机原则,抽取部分单位进行调查,并将调查整理得出的数量特征,用以推断总体综合数量特征的一种非全面调查组织形式。
特点:随机性、推断性。
优点:经济性、时效性、准确性、灵活性。
应用范围:①对总体不可能或不必要进行全面调查,但要掌握总体某些现象的全面数值②用抽样调查资料修正全面调查资料。
作用:①承担全面调查无法或很难承担的调查任务。
如气象调查。
②与全面调查结合,可以发挥相互补充、校对的作用。
③进行生产过程的质量控制。
应用统计学必备知识点总结

应用统计学必备知识点总结1. 总体与样本在统计学中,总体是指研究者希望得到信息的全部对象的集合,而样本是从总体中抽取出来的一部分对象的集合。
在应用统计学中,我们需要了解如何进行总体和样本的描述以及如何通过样本推断总体的特征。
了解这些知识点可以帮助我们更好地设计调查问卷、确定样本量以及进行统计推断。
2. 数据的收集与整理数据的收集是应用统计学中非常重要的一步。
在数据收集过程中,我们需要关注如何设计合理的调查问卷、如何进行实地观察以及如何获取可靠的次生数据。
同时,对于已经收集到的数据,我们还需要了解如何进行数据清洗、数据转换、变量选择等工作,以确保数据的质量。
3. 描述统计描述统计是应用统计学中最为基础的方法之一。
它涉及到对数据的基本特征进行汇总和展示,包括中心趋势、离散程度等。
在描述统计中,我们需要了解如何计算各种统计指标(均值、中位数、众数、标准差等)、如何绘制各种统计图表(直方图、饼图、箱线图等)以及如何进行数据的描述性解释和比较。
4. 概率与概率分布概率是统计学中的核心概念,而概率分布则是对随机变量在各个取值上的概率进行描述的方法。
在应用统计学中,我们需要了解如何计算概率、如何根据样本估计总体的概率、以及如何利用概率分布进行统计推断和模型拟合。
5. 统计推断统计推断是应用统计学中的另一个重要内容。
它涉及到如何通过样本对总体特征进行推断。
在统计推断中,我们需要了解参数估计的方法(最大似然估计、贝叶斯估计等)、假设检验的原理和方法以及置信区间的构建和解释。
6. 相关分析与回归分析相关分析和回归分析是应用统计学中常用的数据分析方法。
相关分析主要用于研究变量之间的关系,而回归分析则用于探究自变量与因变量之间的关系。
在相关分析和回归分析中,我们需要了解如何计算相关系数、如何进行相关性检验、以及如何建立回归模型和进行回归诊断。
7. 多元统计分析在实际问题中,往往会有多个变量同时影响一个结果变量。
多元统计分析则是用于解决这种情况的一种分析方法。
应用统计学

(3)准确性,即按古典概率方法计算的概率是没有误差的。
概率统计:
研究自然界中随机现象统计规律的数学方法,叫做概率统计,又称数理统计方法
(1)可以对随机现象进行科学分析
(2)可以对出现的可能性做出数量上的描述
主观概率:
以概率估计人的个人信念为基础。主观概率可以定义为根据确凿有效的证据对个别事件设计的概率。这里所说的证据,可以是事件过去的相对频率的形式,也可以是根据丰富的经验进行的推测
质量指标:反映的是现象相对水平或平均水平的变动
(3)按指数采用的基期不同,统计指数可分为环比指数和定基指数
4、同度量因素起什么作用,如何使用
同度量因素:能使不同度量不能加总的现象转化为可以同度量可加总的另一现象的媒介因素。
同度量因素在分子分母同时出现,需选择同期水平,基期水平,报告水平。
5、统计”一词有哪几种含义?它们之间是什么关系?
2、从指标变量的性质和数列形态来分,时间数列有哪几种,如何区分
有总量指标组成的时间数列称为绝对数列,又分为相对时间数列和对数数列,相对时间数列是有不同时间的同类相对指标,在时间数列中的各项指标,若是以平均数指标出现,则称为平均数时间数列。
3、什么是指数,它有哪几种分类,各自的定义和作用是什么
1 两事件对立,必定互斥,但互斥未必对立
2 互斥的概念适用于多个事件,但对立概念只适用于两个事件
3 两个事件互斥只说明这两个事件不能同时发生,即之多只能发生其中一个,但可以都不发生;两事件对立则表示有且仅有一个发生。
时间数列是一种统计数列,它是将某一现象或统计指标在各个不同时间上的数值按时间先后顺序排列所形成的数列。由于时间数列表现了现象在时间上的动态变化,故又称动态数列。
考研应用统计学知识点精讲

考研应用统计学知识点精讲统计学是一门研究数据收集、分析和解释的科学,广泛应用于各个领域,如经济学、生物学、医学和社会科学等。
在考研中,应用统计学是一个重要的科目,掌握其知识点对于考生来说至关重要。
本文将重点讲解考研应用统计学的知识点,帮助考生更好地准备考试。
一、概率论与数理统计概率论与数理统计是应用统计学的基础,它们主要研究随机事件的规律性及其数学描述。
在考研中,概率论与数理统计占据了很大的比重,考生需要掌握以下知识点:1.概率论的基本概念概率论研究随机事件发生的可能性,并给出相应的数学描述。
考生需要了解概率的定义、基本性质、加法定理、乘法定理等。
2.随机变量及其分布随机变量是概率试验结果的数值描述,它可以是离散的或连续的。
在考研中,考生需要熟悉常见的离散分布(如二项分布、泊松分布)和连续分布(如正态分布、指数分布)的定义、性质和应用。
3.数理统计的基本概念数理统计是利用样本信息对总体特征进行推断的一门学科。
考生需要了解总体、样本、统计量、抽样分布等基本概念,并掌握重要统计量的抽样分布(如样本均值的正态分布、样本比例的二项分布)。
二、统计推断统计推断是指根据样本数据对总体特征进行估计和推断的方法。
在考研中,统计推断是应用统计学的重要内容,考生需要掌握以下知识点:1.点估计点估计是利用样本数据对总体参数进行估计的方法。
考生需要了解点估计的基本原理,以及常用的点估计方法(如最大似然估计、矩估计)和估计量的性质(如无偏性、有效性)。
2.区间估计区间估计是指对总体参数给出一个区间范围,以一定的置信水平保证这一区间包含真值的概率。
考生需要了解区间估计的原理,以及如何构造置信区间(如正态总体均值的置信区间、两样本均值差的置信区间)。
3.假设检验假设检验是对总体参数提出某种假设并根据样本数据进行检验的方法。
考生需要了解假设检验的基本步骤、拒绝域的确定和错误类型的概念,以及常用的假设检验方法(如正态总体均值的检验、两样本均值差的检验)。
统计学概念整理 以及试题(附答案)

一基本概念、1、统计总体简称总体是我们要调查或统计某一现象全部数据的集合。
总体单位是构成总体的各个个别单位,它是组成总体的基本单位,也是调查项目的直接承担者。
如:对工业企业进行调查,全国工业企业是总体,每一个工业企业就是单位。
2标志与指标指标是反映统计总体的数量特征,标志反映的是总体单位的特征。
指标分为数量指标和质量指标。
(都可以用数量表示)数量指标,反映总体总规模或总水平,如人口数,产量,耕地面积。
质量指标,反映总体内在质量,如产品合格率,劳动生产率等。
标志分为品质标志和数量标志。
品质标志,如人的性别,籍贯等。
(只能用文字表示)数量标志,人的年龄,身高,职工工资等。
(用数量表示)关系:1)、指标反映的是总体,标志反映的是单位;2)、表示方法不同(文字还是数字);3)、标志是构成指标的基础,指标是标志的汇总,在一定情况下可以互相转化。
如A同学,性别女,女是A的标志,B同学,性别男,男是B的标志……假设一共有5位男同学,3位女同学,男女性别比为5:3,这个5:3就是指标了。
没有前面每个同学的性别标志,就不能通过加总得到后面的5:3.3从统计学而言,理论上,一切认识的对象均可被量化。
而其量化的方法则无外乎四种--定量、定比、定序、定类。
(定距尺度没有绝对零点,比如IQ)1、定类尺度:也称类别尺度或名义尺度,是将调查对象分类,标以各种名称,并确定其类别的方法。
它实质上是一种分类体系。
2、定序尺度:也称等级尺度或顺序尺度,是按照某种逻辑顺序将调查对象排列出高低或大小,确定其等级及次序的一种尺度。
3、定距尺度:也称等距尺度或区间尺度,是一种不仅能将变量(社会现象)区分类别和等级,而且可以确定变量之间的数量差别和间隔距离的方法。
4、定比尺度:也称比例尺度或等比尺度,是一种除有上述三种尺度的全部性质之外,还有测量不同变量(社会现象)之间的比例或比率关系的方法。
4.变异与变量在一个总体中,当某标志在每个总体单位上的具体表现都相同时,称此标志为不变标志。
统计量的基本概念及其应用

统计量的基本概念及其应用统计学是指以收集、整理、分析、解释和抽样等方法,研究群体总体特征和个体间关系的一门学科。
而统计量就是指统计学研究中所使用的各种数字指标和计算结果,是对数据的描述和度量。
本文将从统计量的基本概念和应用方面进行讨论。
一、统计量的基本概念1.1 样本与总体在统计学研究中,数据的来源通常是从总体中随机选择一些样本来进行研究。
总体是指具有一定特征的全部个体,如全国所有人口;而样本是指从总体中随机抽取的一部分,如全国人口中的一部分。
1.2 中心趋势指标中心趋势指标用于描述数据分布的中心,通常包括平均数、中位数、众数等指标。
平均数是指数据的算术平均值,是最常见的中心趋势指标;中位数是指数据排序后中间的数值;众数是指数据中出现最频繁的数值。
1.3 离散程度指标离散程度指标用于描述数据的分布程度,通常包括方差、标准差、极差等指标。
方差是指数据离平均数的距离的平方和与数据个数的比值;标准差是方差的正平方根,用于描述数据的离散程度,越大说明数据分布越分散;极差是指数据的最大值与最小值之差。
1.4 偏态和峰态偏态用于描述数据分布的不对称程度,通常包括正偏态和负偏态。
正偏态是指数据分布呈现右偏的形态,即数据的平均数大于中位数;负偏态则是呈现左偏的形态,即数据的平均数小于中位数。
峰态用于描述数据分布的峰度,通常包括正峰态和负峰态。
正峰态是指数据分布的波峰较高,呈现比较尖锐的形态;负峰态则是波峰较平缓的形态。
二、统计量的应用2.1 假设检验假设检验是统计学中常用的应用之一,用于验证某个假设是否成立,如判断一个新的药品是否有效。
在进行假设检验时,需要确定一个零假设和一个替代假设,通过计算统计量的值来决定是否拒绝零假设。
2.2 方差分析方差分析也是统计学中的一种应用,主要用于分析多个样本间的差异,如比较不同地区、不同年龄段和不同性别的人口数据。
在进行方差分析时,通常需要计算F值和P值,以判断不同样本间的方差是否有显著性差异。
应用统计学 知识点考点汇总

(1)约有68%的观测值落于 ( x , x ) 的区间内; (2)约有95%的观测值落于 ( x 2 , x 2 ) 的区间内; (3)约有99.7%的观测值落于 ( x 3 , x 3 )的区间内;
3.数据的分布形状 偏斜度(Pearson偏态系数、矩法求偏态系数的计算及
第八章 相关与回归分析
1.函数关系与相关关系
2.简单线性相关分析
n
n
n
总体相关系数、样本相关系数n(简xi y便i 公 式xi )y、i 相关
3. 系一数元的线假性设回检归验分、析相关分析r 中n应in1注xi2 意i(1i的n1 x问i )2题in1 (in1 i虚y1i2 假( i相n1 y关i )2 )
登记性误差和代表性误差 重点:各种统计调查方式的特点和区别。
第三章 数据整理
1.数据分组(分组的目的、原则) 2.统计分组的方法
品质分组的方法 变量分组的方法:单项式分组、组距式分组(等距 和不等距 )
根据统计数据编制次数分配表(也称频数分配 表)、绘制直方图、计算累计次数(向上累计、向 下累计)
ቤተ መጻሕፍቲ ባይዱ
因素B SB
s1
SB
SB s1
FB
SB SE
误 差 SE
(r 1) (s 1)
SE
SE (r 1)(s 1)
总 和 ST rs 1
第七章 卡方检验
1.卡方检验的基本原理 比较理论频数与实际频数吻合的程度. 2.卡方检验的具体应用(拟合度检验、独立性
检验、同质性检验) 3.列联表的简单计算公式
分位数、几何平均数、调和平均数等的计算;(注 意应用条件及分组数据的计算)
应用统计学基本概念

统计总体:统计研究的对象的全体,简称总体。
特征:大量性、同质性、变异性总体单位:构成总体的各个基本单位。
标志:说明总体单位所具有特征的名称。
品质标志和数量标志(统计)指标:反映总体数量特征的概念和具体数值。
构成要素:指标名称、计量单位、指标数值、时间、地点。
特点:数量性、综合性、客观性关系:联系:指标值是由总体单位的数量标志汇总而来,在特定条件下可以互相转换。
区别:反映的对象不同;指标能用具体数值表示,标志未必;指标数值通过汇总得到,标志可直接取得;指标是总体在特定条件下的数量特征,而标志没有时间属性、空间概念。
时期指标:反映连续发生变化的现象或总体在一段时期内发展过程的总量。
时点指标:反映不连续发生变化的现象或总体在某一时间点上的状况或水平的总量。
统计调查的种类:按调查的组织形式:统计报表调查和专门调查(普查、抽样调查、典型调查、重点调查)范围:全面和非全面(抽样、重点、典型)时间:经常性和一次性统计分组:根据研究目的,用某个或某几个标志将总体划分为若干性质不同的部分的一种统计方法。
作用:划分总体或现象的类型,研究总体或事物的内部结构,研究现象之间的相互依存关系。
分组标志:将总体划分为若干性质不同组的标准或依据。
种类:品质标志和数量标志。
统计分组体系:对某一总体运用多个不同标志进行分组形成的相互联系、相互补充的体系。
简单分组及平行分组体系和复合分组及复合分组体系。
统计表: 总标题、横行标题、纵栏标题、数据资料;主词和宾词总量指标:反映在社会经济现象在一定时间、地点、条件下的总规模或总水平的统计指标。
反映的内容不同:总体单位总量和总体标志总量;时间状况不同:时期指标和时点指标相对指标(相对数):计划完成相对数(实际/计划)、强度、比较、比例、结构、动态。
时间序列:将同一现象在不同时间上的一系列指标数值,按时间先后顺序排列而成的序列。
绝对数时间序列、相对数、平均数趋势剔除法下,季节比率的计算步骤:计算移动平均数Mij;剔除长期趋势;将剔除长期趋势后的资料Xij按各年同期排列计算各年同期平均数;计算调整系数;季节比率。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
并根据样本调查结果来推断总体特征自下而上地逐级提供基本数据的调查方应用统计学概念整理第一章:导论1. 只能归类于某一类别的非数字型数据称为分类数据2. 只能归于某一有序类别的非数字型数据称为顺序数据3. 按数字尺度测量的观测值称为数值型数据4. 包含所研究的全部个体的集合称为总体5. 从总体中抽取的一部分的元素的集合称为样本6. 用来描述总体特征的的概括性数字度量称为参数7. 用来描述样本特征的概括性数字度量称为统计量8. 说明事物类别的一个名称称为分类变量9.说明事物有序类别的一个名称称为顺序变量10. 说明事物数字特征的一个名称称为数值型变量 11. 只能取可数值的变量称为离散型变量12. 可以在一个或多个区间中取任何值的变量称为连续型变量第二章:数据收集1. 从总体中随机抽取一部分单位作为样本进行调查, 的数据收集方法,称为抽样调查。
2. 为特定目的而专门组织的全面调查称为普查3.按照国家有关法律规定, 自上而下地统一布置, 式称为统计报表第三章:数据的图表展示1. 落在某一特定类别或组中的数据个数,称为频数2. 把各个类别及其落在其中的相应频数全部列出, 并用表格形式表示出来, 称为频数分布3. 一个样本或总体中各个部分的数据与全部数据之比,称为比例4. 将比例乘以 100 得到的数值,称为百分比或百分数,用 %表示5. 样本或总体中各不同类别数值之间的比值,称为比率6. 分类数据的图示:条形图, pareto 图,对比条形图,饼图7. 将各有序类别或组的频数逐级累加起来得到的频数称为累计频数8. 将各有序类别或组的百分比逐级累加起来称为累计频率9.顺序数据的图示:累计频数分布图,环形图10. 根据统计研究的需要,将原始数据按照某种标准划分成不同的组别称为数据分组 11. 分组后的数据称为分组数据 12. 把变量值作为一组称为单变量值分组13. 将全部变量值一次划分为若干个区间, 并将这一区间的变量值作为一组, 称为组距分组 14. 在组距分组中,一个组的最小值称为下限,最大值称为上限 15. 一个组的上限与下限的差称为组距 16. 各组组距相等的组距分组称为等距分组 17. 各组组距不相等的组距分组称为不等距分组 18. 每一组的下限和上限之间的重点值称为组中值19. 用矩形的宽度和高度即面积来表示频数分布的图形称为直方图20. 由茎和叶两部分组成的,反应原始数据分布的图形称为茎叶图21. 由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的,反应原始数据分布的图形,称为箱线图第四章:数据的概括性度量1. 一组数据向其中心值靠拢的倾向和程度称为集中趋势2. 测度集中趋势就是寻找数据水平的代表值或中心值3. 不同类型的数据用不同的集中趋势测度值4. 低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据5. 层次由低到高:分类-顺序-数值型6. 一组数据中出现频数最多的变量值,称为众数7. 一组数据排序后处于中间位置上的变量值称为中位数8. 一组数据排序后处于中间位置上的变量值,称为中位数9. 一组数据排序后处于 25%和75%位置上的值称为四分位数10. 一组数据相加后除以数据的个数而得到的结果,称为平均数11. N个变量值乘积的n次平方根,称为几何平均数12. 数据分布的另一个重要特征13. 离中趋势反映各变量值远离其中心值的程度(离散程度)14. 从另一个侧面说明了集中趋势测度值的代表程度15. 不同类型的数据有不同的离散程度测度值16. 非众数组的频数占总频数的比率,称为异众比率17. 上四分位数与下四分位数之差,称为四分位差,也称为内距或四分间距18. 一组数据的最大值与最小值只差称为极差,用R表示19. 各变量值与其平均数离差绝对值的平均数,称为平均差,叶也称为平均绝对离差20. 各变量值与其平均数离差平方的平均数称为方差21. 方差的平方根称为标准差22. 变量值与其平均数的离差除以标准差后的值,称为标准分数,也成为标准化值或 z分数23. 对于任意分布形态的数据,根据切比雪夫不等式,至少有1-1/k2的数据落在平均数加减k个标准差之内。
其中k是大于1的任意值,但不一定是整数24. 一组数据的标准差与其相应的平均数之比,称为离散系数25. 数据分布的不对称性称为偏态26. 对数据分布不对称性的度量值,称为偏态系数27. 数据分布的平峰或尖峰程度,称为峰态28. 对数据分布峰态的度量值称为峰态系数,记做K第五章:概率与概率分布1. 对一个或多个试验对象进行一次观察或测量的过程,称为一次试验2. 试验的结果称为事件3. 不能被分解为其他事件组合的基本事件,称为简单事件4. 随机事件(random event):每次试验可能出现也可能不出现的事件5. 必然事件(certain event):每次试验一定出现的事件,用表示6. 不可能事件(impossible event):每次试验一定不出现的事件,用表示7. 一项试验所有可能结果的集合称为样本空间8. 事件A的概率是对事件 A在试验中出现的可能性大小的一种度量,介于0和1之间的一个值9. 在试验中,两个事件有一个发生时另一个就不能发生,称这两个事件为互斥事件10. 非负性:对任意事件 A,有0 P(A) 111. 规范性:必然事件的概率为1;不可能事件的概率为0。
即P ( ) = 1; P ( ) = 012. 可加性:若 A与B互斥,则P ( A U B ) = P ( A ) + P ( B,推广到多个两两互斥事件A1 ,A2,…,An,有 P ( A1U A2 U …U An) = P ( A1 ) + P (A2 ) + …+ P (An )13. A发生或者B发生的事件,称为 A与B的并14. 在事件B已经发生的条件下,求事件 A发生的概率,称这种概率为事件B发生条件下事件A发生的条件概率,记为15. 一个事件的发生与否并不影响另一个事件发生的概率,则称两个事件独立16. 某次试验结果的数值型描述,称为随机变量17. 只能取有限个或可数个值的随机变量,称为离散型随机变量18. 可以去一个或多个区间中任何值的随机变量称为连续型随机变量19. 离散型随机变量的概率分布:列出离散型随机变量 X的所有可能取值,列出随机变量取这些值的概率,通常表格来表示20. 离散型随机变量的数学期望:在离散型随机变量 X的一切可能取值的完备组中,各可能取值xi与其取相对应的概率 pi乘积之和,描述离散型随机变量取值的集中程度,计算公式为:E(X) V X i p r(X取有限个值)FTE(X) V X i p. (X取无穷个值);•r=i21. 离散型随机变量的方差:随机变量X的每一个取值与期望值的离差平方和的数学期望, 记为D(X),描述离散型随机变量取值的分散程度,计算公式为若盘是离散型随机变星'则2=1二项分布:进行 n次重复试验,出现"成功”的次数的概率分布称为二项分布,设X为n 次重复试验中事件 A出现的次数,X取x的概率为式中:护{/二扩厂(龙=卽2A・⑹刈(n一才)!22. 泊松分布:用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布P{X- x卜辱(X-吐2,…闹—给定的时间间隔、长度、面积、体积内“成功”的平均数e = 2.71828x —给定的时间间隔、长度、面积、体积内“成功”的次数23. 用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布(1).f(x)\0⑵匚 f (x)dx = 124.用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布F(x)二P(X") x f(t)dtJ—co第六章:抽样与抽样分布概率抽样非概率抽样1. 简单随机抽样:从总体 N个单位中随机地抽取 n个单位作为样本,使得每一个容量为 n样本都有相同的机会(概率)被抽中2. 系统抽样:将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位3. 分层抽样:将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本4. 整群抽样:将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查5. 多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查6. 总体分布:总体中各元素的观测值所形成的相对频数分布,称为总体分布7. 从总体中抽取一个容量为n的样本由这n个观测值形成的相对频数分布,称为样本分布8. 某个样本统计量的抽样分布,从理论上来说就是在重复选取容量为n的样本使,由该统计量的所有可能取值形成的相对频数分布样本均值正态分布样本均值 正态分布样本均值 非正态分布样本均值的抽样分布: 在重复选取容量为n 的样本时,由样本均值的所有可能取值形成 的相对频数分布当总体服从正态分布 "(go 2)时,来自该总体的所有容量为 n 的样本的均值 x 也服从正态分布,x 的数学期望为g 方差为0/n 。
即x 〜N(gO /n)中心极限定理:从均值为,方差为2的一个任意总体中抽取容量为n 的样本,当n 充分大时,样本均值的抽样分布近似服从均值为g 方差为0/n 的正态分布I -------------- --- 1 _正态分布|非正态分布|I大样聿 小样本样本统计量的抽样分布的标准差,称为统计量的标准误,也称为标准误差 当计算标准误时涉及的总体参数未知时,用样本统计量代替计算的标准误, 称为估计的标准误 在重复选取容量为n 的样本时,由样本比例的所有可能取值形成的相对频数分布,称为样本比例的抽样分布在重复选取容量为n 的样本时,由样本方差的所有可能取值形成的相对频数分布, 称为样本方差的抽样分布在两个总体中,分别独立地抽取容量为 n1和n2的样本,在重复选取容量为 n1和n2的 样本时,由两个样本均值之差的所有可能取值形成的相对频数分布, 称为两个样本均值的抽样分布在两个服从二项分布总体中,分别独立地抽取容量为 n1和n2的样本,在重复选取容量为n1和n2的样本时,由两个样本比例之差的所有可能取值形成的相对频数分布, 称为两个样本比例的抽样分布在两个正态总体中,分别独立地抽取容量为 n1和n2的样本,在重复选取容量为n1和n2的样本时,由两个样本方差比的所有可能取值形成的相对频数分布,称为两个样本 方差比的抽样分布9. 10. 11.12. 13. 14. 15. 16.17.18.19.第七章:参数估计的一般问题華败估计假设检验1.2. 估计量:用于估计总体参数的随机变量3.3. 点估计:用样本的估计量的某个取值直接作为总体参数的估计值4. 区间估计:在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到5. 置信水平:将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平6. 将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平7. 无偏性:估计量抽样分布的数学期望等于被估计的总体参数8. 有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效9. 一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数10. 当用原始数据构建置信区间时,置信区间的计算结果应保留的小数点位数要比原始数据中使用的小数点多一位11. 单个总体参数的区间估计第八章:假设检验1. 对总体参数的具体数值所作的陈述称为假设或称为统计假设2. 先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程,称为假设检验3. 通常将研究者想收集证据给予支持的假设称为备择假设,或称为研究假设4. 通常将研究者想收集证据给予反对的假设称为原假设,或称为研究零假设5. 备择假设没有特定的方向性,并含有符号“不等于”的假设检验,称为双侧检验或双尾检验6. 备择假设具有特定的方向性,并含有符号“>”或的假设检验,称为单侧检验或单CIM sis M IrJ Iau—尾检验7.备择假设的方向为"<”称为左侧检验 备择假设的方向为" >”称为右侧检验8.8. 第I 类错误(弃真错误)原假设为正确时拒绝原假设,第I 类错误的概率记为被称为显著性水平 9. 2.第n 类错误(取伪错误),原假设为错误时未拒绝原假设,第n 类错误的概率记为(Beta )10. 检验统计量:根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量 宣信水乎i 临界值临界值"13. t 给定显箸性水平⑦杳表得出相应的临界 值*G 閒M2将检验统计量的值与m 水平的临界值进行 比较a 作出决策□双侧检验;I 统计饋I A 临界值,拒绝□左侧检验;统计量 <・临界值.拒绝%■右侧检验*统计量A 临界值*拒绝址14.12. 能够拒绝原假设的检验统计量的所有可能取值的集合称为拒绝域13. 根据给定的显著性水平确定的拒绝域的边界值,称为临界值14. P 值:如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率「|临界值计算出的样弃銃计壺拒绝汕 4/2尸值决策规则:若p值<a,拒绝H o19. 一个总体参数的检验总体均值的检验两个总体参数的检验总体参数均值差比例差涯比独立样木配对样本检验两个总体均值检验方法总结Z检验(大样本}I {小样本)11 (小样本)F检验章末总结。