统计学重要考点总结
统计学复习要点

1.统计学是收集、分析、表述和解释数据的科学(不列颠百科全书)2.按照计量层次分: 分类数据、顺序数据、数值型数据3.按收集方法分:观测数据和实验数据4.按时间状况分:截面数据和时间序列数据5.总体:所研究的全部个体(数据) 的集合,其中的每一个个体也称为元素6.样本:从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量或样本量7.参数:描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值,所关心的参数主要有总体均值(?)、标准差(?)、总体比例(?)等8.统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数,所关心的样本统计量有样本均值(?x)、样本标准差(s)、样本比例(p)等9.数据的间接来源:系统外部的数据和系统内部的数据10.二手数据的特点:搜集容易,采集成本低、作用广泛、在研究中应优先考虑11.二手数据的可靠性评估:数据是谁搜集的?为什么目的而搜集的?数据是怎样搜集的?什么时候搜集的?12.数据的直接来源:调查数据、实验数据13.概率抽样的特点:按一定的概率以随机原则抽取样本,每个单位被抽中的概率是已知的,或是可以计算出来的,当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率14.简单随机抽样:从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的,最基本的抽样方法,是其它抽样方法的基础。
15.分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本16.整群抽样:将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查17.系统抽样:将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位。
先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位18.多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查19.非概率抽样:相对于概率抽样而言。
统计学知识点梳理

统计学知识点梳理统计学是一门研究数据收集、整理、分析和解释的学科,它在各个领域都有着广泛的应用。
从科学研究到商业决策,从社会调查到医学研究,统计学都发挥着重要的作用。
接下来,让我们一起梳理一下统计学中的一些关键知识点。
一、数据的类型数据可以分为定性数据和定量数据。
定性数据是描述事物属性或特征的数据,例如性别(男、女)、职业(教师、医生、工程师等)。
定量数据则是可以用数值来衡量的数据,又进一步分为离散数据和连续数据。
离散数据是只能取有限个或可数个值的数据,比如班级里的学生人数;连续数据可以在某个区间内取任意值,例如身高、体重。
二、数据的收集数据收集是统计学的第一步。
常见的数据收集方法包括普查和抽样调查。
普查是对研究对象的全体进行调查,能够获取全面、准确的信息,但成本高、耗时长。
抽样调查则是从总体中抽取一部分样本进行调查,通过对样本的分析来推断总体的特征。
抽样方法有简单随机抽样、分层抽样、系统抽样等。
简单随机抽样是从总体中随机地抽取样本,每个个体被抽到的概率相等。
分层抽样是将总体按照某些特征分成不同的层次,然后从每个层次中分别抽样。
系统抽样是按照一定的规律从总体中抽取样本。
三、数据的整理与展示收集到的数据需要进行整理和展示,以便更好地理解和分析。
整理数据的方法包括分类、排序等。
数据的展示方式有表格、图形等。
常见的图形展示方法有柱状图、折线图、饼图、直方图等。
柱状图用于比较不同类别之间的数据差异;折线图适合展示数据随时间或其他顺序变量的变化趋势;饼图用于显示各部分在总体中所占的比例;直方图则用于展示数据的分布情况。
四、数据的集中趋势度量集中趋势是指数据分布的中心位置,常用的度量指标有平均数、中位数和众数。
平均数是所有数据的总和除以数据的个数,它对数据中的极端值比较敏感。
中位数是将数据按照大小顺序排列后,位于中间位置的数值。
如果数据个数为奇数,中位数就是中间的那个数;如果数据个数为偶数,中位数是中间两个数的平均值。
统计学知识点(完整)

基本统计方法第一章概论1•总体(Population ):根据研究目的确定的同质对象的全体(集合) ;样本(Sample ):从总体中随机抽取的部分具有代表性的研究对象。
2.参数(Parameter ):反映总体特征的统计指标,如总体均数、标准差等,用希腊字母表示,是固定的常数;统计量(Statistic ):反映样本特征的统计指标,如样本均数、标准差等,采用拉丁字字母表示,是在参数附近波动的随机变量。
3.统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。
第二章计量资料统计描述1.集中趋势:均数(算术、几何)、中位数、众数2.离散趋势:极差、四分位间距( QR=P75-P25)、标准差(或方差)、变异系数(CV)3.正态分布特征:①X轴上方关于X= 对称的钟形曲线;②X= 时,f(X)取得最大值;③ 有两个参数,位置参数和形态参数;④曲线下面积为1,区间土的面积为68.27% ,区间±1.96 的面积为95.00%,区间±2.58 的面积为99.00%。
4.医学参考值范围的制定方法:正态近似法:X U /2 S ;百分位数法:P2.5-P 97.5。
第三章总体均数估计和假设检验1.抽样误差(Sampling Error ):由个体变异产生、随机抽样造成的样本统计量与总体参数的差异。
抽样误差不可避免,产生的根本原因是生物个体的变异性。
2.均数的标准误(Standard error of Mean, SEM):样本均数的标准差,计算公式:八n。
反映样本均数间的离散程度,说明抽样误差的大小。
3.降低抽样误差的途径有:①通过增加样本含量n;②通过设计减少S。
4.t分布特征:①单峰分布,以0为中心,左右对称;②形态取决于自由度,越小,t值越分散,t分布的峰部越矮而尾部翘得越高;③当逼近a ,S X逼近X, t分布逼近u分布,故标准正态分布是t分布的特例。
5.置信区间(Con fide nee In terval , CI ):按预先给定的概率(1-)确定的包含总体参数的一个范围,计算公式:X t /2, S X或X U /2, S X。
统计学重点部分归纳

统计学重点部分归纳 Document serial number【KKGB-LBS98YT-BS8CB-BSUT-BST108】第三章全距也称极差,是一组数据的最大值与最小值之差。
R=最大值-最小值组距分组数据可根据最高组上限 -最低组下限计算。
四分位数:数据按大小顺序排序后把分割成四等分的三个分割点上的数值。
SPSS中四分位数的位置为(n+1)/4, 2(n+1)/4, 3 (n+1)/4。
Excel中四分位数的位置分别为(n+3)/4, 2(n+1)/4,(3 n+1)/4。
如果四分位数的位置不是整数,则四分位数等于前后两个数的加权平均。
四分位距等于上四分位数与下四分位数之差IQR=Q3-Q1反映了中间50%数据的离散程度,数值越小说明中间的数据越集中。
不受极端值的影响。
可以用于衡量中位数的代表性。
方差是一组数据中各数值与其算术平均数离差平方的平均数,标准差是方差正的平方根。
是反映定量数据离散程度的最常用的指标。
离散系数:标准差与其相应的均值之比,表示为百分数。
特点:(1)反映了相对于均值的相对离散程度;(2)可用于比较计量单位不同的数据的离散程度;(3)计量单位相同时,如果两组数据的均值相差悬殊,离散系数可能比标准差等绝对指标更有意义数据分布的不对称性称作偏态。
偏态系数就是对数据分布的不对称性(即偏斜程度)的测度。
峰度:数据分布的扁平或尖峰程度。
峰度系数:数据分布峰度的度量值,对数据分布尖峰或扁平程度的测度,一般用K表示。
箱线图用于描述数据分布特征的一种图形。
最简单的箱线图可以根据数据的最大值、最小值和三个四分位数绘制的:先根据三个四分位数Q1、Q2、Q3画出中间的盒子,然后由盒子两端分别向最大、最小值连线。
在SPSS中标准的箱线图一般是这样绘制的:先根据三个四分位数Q1、Q2、Q3画出中间的盒子;由Q3至Q3+*IQR区间内的最大值向盒子的顶端连线,由Q1至*IQR区间内的最小值向盒子的底部连线;处于Q3+*IQR至Q3+3*IQR或者 *IQR至Q1-3*IQR范围内的数据用圆圈标出;大于Q3+3*IQR或者小于Q1-3*IQR的用星号标出。
统计学基础知识点总结

统计学基础知识点总结统计学是研究数据收集、分析和解释的科学。
它提供了一种用来了解和解释各种数据的方法和工具。
统计学的基础知识点是学习统计学的基础,下面是一些重要的基础知识点总结:1. 数据类型:统计学中的数据可以分为两类:定量数据和定性数据。
定量数据是可以量化的,例如身高、温度等,而定性数据是描述性质和特征的,例如性别、颜色等。
2. 数据收集:数据收集是统计学的基础,它包括设计问卷、调查、实验等方法来收集数据。
收集数据时需要注意样本的代表性,并尽量避免抽样偏差。
3. 描述性统计:描述性统计是用来总结和描述数据的方法。
常用的描述性统计包括计算平均数、中位数、范围和标准差等指标来衡量数据的集中趋势和离散程度。
4. 概率:概率是研究随机事件发生可能性的数学工具。
它可以用来计算事件发生的概率,从而预测未来事件的可能性。
概率可以分为古典概率和条件概率等不同类型。
5. 概率分布:概率分布是描述随机变量的分布规律的数学模型。
常见的概率分布包括均匀分布、正态分布和泊松分布等。
概率分布可以用来计算随机变量的期望、方差等统计指标。
6. 假设检验:假设检验是统计学中用来验证关于总体参数的假设的方法。
通过对样本数据进行统计分析,可以得出关于总体参数是否符合假设的结论。
假设检验包括设定假设、选择检验统计量、计算显著性水平和做出决策等步骤。
7. 相关分析:相关分析是用来研究两个变量之间关系的方法。
它可以通过计算相关系数来衡量两个变量之间的相关性,并判断相关性是否显著。
常用的相关系数有皮尔逊相关系数和斯皮尔曼相关系数。
8. 回归分析:回归分析是研究因果关系的统计方法。
它通过建立数学模型来描述自变量和因变量之间的关系,并可以用来预测因变量的取值。
常见的回归分析包括线性回归和多元回归等。
9. 抽样分布:抽样分布是指统计量在不同样本中的分布情况。
它可以用来计算统计量的置信区间和显著性水平等,从而对总体参数进行推断。
10. 统计软件:统计软件是进行统计分析的工具。
高考统计知识点总结

高考统计知识点总结高考统计学是数学中的一个重要分支,它主要研究数据的搜集、整理、描述与分析。
高考统计学常考的知识点主要包括概率、抽样与中心极限定理、参数估计与假设检验等。
下面是关于这些知识点的详细总结。
一、概率1.基本概念:样本空间、事件、随机试验、等可能事件等。
2.事件关系:互斥事件、对立事件、相等事件等。
3.概率基本定理:概率的性质、概率的计算、概率的加法定理和乘法定理等。
4.排列与组合:排列的计算、组合的计算、二项式定理等。
5.条件概率与独立性:条件概率的计算、乘法定理的条件概率形式、事件的独立性等。
6.贝叶斯定理:完全事件组、贝叶斯定理的推导与应用等。
二、抽样与中心极限定理1.总体与样本:总体、样本的概念、总体参数与样本统计量的关系等。
2.抽样分布:简单随机抽样、大小为n的简单随机样本、比例估计等。
3.中心极限定理:中心极限定理的条件、正态分布的基本性质、用中心极限定理进行估计等。
三、参数估计与假设检验1.点估计:估计量的性质、最大似然估计、样本均值、样本方差等。
2.区间估计:区间估计的基本思想、正态总体参数的区间估计、大样本的区间估计等。
3.假设检验:假设检验的基本思想、单侧假设检验、双侧假设检验、P值的应用等。
4.卡方检验:观察频数与期望频数的差异、卡方统计量、卡方分布等。
以上是高考统计学的部分重点知识点总结,希望能够对你的学习有所帮助。
需要注意的是,统计学是一门理论实践相结合的学科,掌握理论知识的同时,更要注重实际应用,多做习题和真题,加强对知识点的理解和应用能力。
祝你高考取得好成绩!。
统计学重点整理
1.统计学有三种含义,即统计活动、统计数据和统计学。
2.统计学分类标志:从方法的功能上来看,统计学可以分为统计学和推断统计学;从方法研究的重点来看,可以分为理论统计学和应用统计学。
3.统计总体有三个特征:同质性,大量性和变异性。
4.标志按其反映的单位特征不同分为品质标志和数量标志;按其表现的变异情况,分为不变标志和可变标志。
5.数据的计量尺度:1.定类尺度。
2.定序尺度。
3.定距尺度。
4.定比尺度。
6.定类尺度:是按照事物的某种属性对其进行平行的分类或分组的一种测度7.定序尺度:是对事物之间等级顺序差别的一种测度。
8.定距尺度:是对事物类别或者次序之间间距进行的一种测度。
9.定比尺度:是对事物之间比值的一种测度。
10.统计数据的直接来源:1.调查(主要)2.观察3.实验。
11.统计调查的组织方式:1.普查为某一特定目的而专门组织的一次性全面调查方式。
2.抽查按照随机原则从调查对象的总体中抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查方式。
3.统计报表按照国家规定,自上而下统一布置,自下而上逐级填报的一种调查组织方式4.重点调查从全部总体单位中选择少数重点单位进行调查。
5.典型调查从全部总体单位中选择一个或几个有代表性的单位进行深入细致调查的一种调查组织方式。
6.统计调查方案的结构:1.确定调查目的2.确定调查对象和调查单位3.设计调查项目和调查表。
4.其他内容1.明确调查的方式2.明确调查的方法.3.调查时间4.调查的组织与实施工作。
7.统计数据的质量要求:1.精度(最低的抽样误差或随机误差)2.准确性(最小的非抽样误差或偏差)3.关联性(满足用户决策、管理和研究的需要)4.及时性(在最短的时间里取得并公布数据)5.一致性(保证时间序列的可比性).6.最低成本(满足以上标准前提下,以最经济的方式取得数据)8.统计分组就是根据统计的目的和客观信息的特点,按某个标志把被研究的总体划分为若干个既有区别,又有联系的组成部分。
统计的知识点总结
统计的知识点总结1. 描述统计描述统计是通过数据的收集、整理和呈现,来对数据的特征进行描述和解释的方法。
描述统计包括了测度中心趋势的方法(如均值、中位数、众数)、测度离散程度的方法(如标准差、方差、极差)以及数据的呈现方法(如表格、图表、频率分布)。
2. 推论统计推论统计是通过对样本数据的分析和推断,来对总体特征进行推测和预测的方法。
推论统计包括了参数估计和假设检验两个主要方法。
在参数估计中,我们通过样本数据来估计总体的参数值;在假设检验中,我们通过样本数据来对总体的某个假设进行检验。
推论统计方法在科学研究和决策制定中具有重要的应用价值。
3. 概率统计概率统计是研究随机现象规律性的科学,它包括了概率的概念、概率分布、随机变量的概念和性质、大数定律和中心极限定理等。
概率统计的基本概念对于理解统计学的理论和方法具有重要的意义。
4. 回归分析回归分析是一种对两个或多个变量之间关系进行建模和分析的方法。
它包括了简单线性回归、多元线性回归、非线性回归等。
回归分析的方法对于预测和决策具有重要的应用价值。
5. 方差分析方差分析是一种用于比较两个或两个以上样本均值之间差异的方法。
它包括了单因素方差分析、双因素方差分析、多因素方差分析等。
方差分析的方法在生物、医学、社会科学等领域都具有重要的应用价值。
6. 生存分析生存分析是一种对时间至事件发生之间关系进行建模和分析的方法。
它包括了生存函数、风险集与危险比、生存曲线、生存比较等。
生存分析的方法在医学、流行病学、生物统计学等领域都具有重要的应用价值。
以上是统计学的一些基本知识点总结。
统计学作为一门科学,它的研究对象是数据,通过数据的收集、整理、分析和解释,来探索数据之间的关系和规律,从而推断和验证问题的解答。
统计学的方法和技术在各个领域都有着广泛的应用价值,它不仅可以帮助我们理解世界,还可以指导我们进行决策和预测。
统计学的知识点非常丰富,每一个知识点都有着自己的理论和方法,对于我们学习和应用统计学都具有着重要的意义。
统计学期末知识点总结
1.多重共线性:当回归模型中存在两个或两个以上的自变量彼此相关时,则称回归模型中存在多重共线性。
2.相关关系:变量之间存在的不确定的数量关系,称为相关关系。
3.五个相关关系:正线性相关,负线性相关,完全正线性相关,完全负线性相关,非线性相关,不相关。
若 0<r≤1,表明 x 与 y 之间存在正线性相关关系;若-1≤r <0,表明 x 与 y 之间存在负线性相关关系;若 r=+1,表明 x 与 y 之间为完全正线性相关关系;若 r=-1,表明 x 与 y 之间为完全负线性相关关系。
|r|→1 说明两个变量之间的线性关系越强;|r|→0 说明两个变量之间的线性关系越弱。
4.回归直线的拟合优度:回归直线与各观测点的接近程度称为回归直线对数据的拟合优度。
判定系数 R2测度了回归直线对观测数据的拟合程度。
5.最小二乘估计法:通过使因变量的观测值 yi 与估计值yi ∧之间的离差平方和,即残差平方和,达到最小来估计β0和β1的方法。
6. F 检验和 t 检验各有什么作用:F 检验是检验自变量 x 和因变量 y 之间的线性关系是否显著;t 检验是检验自变量对因变量的影响是否显著,也就是回归系数的检验。
7.8.正态分布—Z分布:大样本或小样本总体标准差σ已知。
9.N-1的T分布:小样本σ未知。
10.参数估计:点估计与区间估计11.置信区间:由样本统计量所构造的总体参数的估计区间。
12.置信水平:置信区间中包含总体参数真值的次数所占的比例。
置信水平越大,所需的样本量也就越大,置信区间越宽。
13.评价估计量的标准:无偏性:是指估计量抽样分布的数学期望等于被估计的总体参数有效性:是指对同一参数的两个无偏估计量,有更小方差的估计量越有效。
一致性:是指随着样本量n的增大,估计量的值越来越接近总体参数的真值。
14.样本量越大,样本均值的抽样标准差就越小。
15.总体数据的方差越大,估计时所需的样本量越大。
16.数据概括性度量:(数据分布特征的测量)集中趋势,离散程度,分布形态(偏态与峰态)17.三个分布:对称分布—众数=中位数=平均数左偏分布—平均数<中位数<众数右偏分布—众数<中位数<平均数18.标准分数的用途:①变量值与其平均数的离差除以标准差后的值称为标准分数,用Z表示。
统计学各章节期末复习知识点
统计学各章节期末复习知识点统计学是一门研究数据收集、分析和解释的学科。
作为一门广泛应用于各个领域的学科,统计学的知识点非常丰富。
以下是统计学各章节的期末复习知识点汇总:1.数据收集与描述-数据类型:定量数据和定性数据-数据收集方式:问卷调查、观察、实验-描述统计:中心趋势(均值、中位数、众数)、离散程度(范围、方差、标准差)、数据分布(直方图、条形图、饼图)2.概率论基础-随机试验与样本空间-事件与事件概率-古典概型、几何概型和统计概型-条件概率与独立性-伯努利试验与二项分布3.随机变量及其分布-随机变量与分布函数-离散型随机变量与其分布律-连续型随机变量与其概率密度函数-均匀分布、正态分布、指数分布等常见分布4.多个随机变量的分布-边缘分布与条件分布-两个离散型随机变量的联合分布律-两个连续型随机变量的联合概率密度函数-相互独立的随机变量的分布5.随机变量的数字特征-数学期望与其性质-方差与标准差-协方差与相关系数-矩、协方差矩阵与相关系数矩阵6.大数定律与中心极限定理-辛钦大数定律-中心极限定理-切比雪夫不等式与伯努利不等式7.统计推断基础-参数估计:点估计、区间估计-置信区间与置信水平-假设检验:原假设与备择假设、显著性水平、拒绝域-类型Ⅰ错误和类型Ⅱ错误-样本容量与统计检验的效应大小8.单样本与双样本推断-单个总体均值的推断:正态总体与非正态总体-单个总体比例的推断-两个总体均值的推断:独立样本与配对样本-两个总体比例的推断9.方差分析与回归分析-单因素方差分析-两因素方差分析-简单线性回归分析:最小二乘法-多元线性回归分析:拟合优度、剩余平方和、变量选择10.非参数统计方法-指标:秩和检验、秩和相关检验、符号检验- 分布:符号检验、秩和检验、秩和相关检验、Kolmogorov-Smirnov检验这些是统计学各个章节的期末复习知识点的一个概述。
每个章节都拥有更加详细和复杂的内容,需要学生在复习中深入理解并进行练习。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章导论
1.2、
描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计
方法。
推断统计:研究的是如何利用样本数据来推断总体特征。
1.3、统计学据可以分成哪几种类型,各有什么特点?
按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。
分类数据:只能归于某一类别的,非数字型数据。
顺序数据:只能归于某一有序类别的,非数字型数据。
数值型数据:按数字尺度测量的观察值,结果表现为数值。
按收集方法不同,分为:观测数据、和实验数据。
观测数据:通过调查或观测而收集到的数据;不控制条件;社会经济领域。
实验数据:在试验中收集到的数据;控制条件;自然科学领域。
按时间不同,分为:截面数据、时间序列数据
截面数据:在相同或近似相同的时间点上收集的数据。
时间序列数据:在不同时间收集的数据。
1.4
分类数据:只能归于某一类别的非数字型数据,是对事物进行分类的结果,该数据表现为类别,使用文字来表述的,分类数据主要由分类尺度计量形成的。
顺序数据:只能归于某一有序类别的非数字型数据,这些类别是有顺序的,它是由顺序尺度计量形成的。
数值型数据:按数字尺度测量的观察值,是使用自然或度量衡单位对事物进
行测量的结果,其结果表现为具体的数值。
第二章数据的搜集
2.2比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽
样,什么情况下适合采用非概率抽样。
概率抽样是指抽样时按一定概率以随机原则抽取样本。
每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本
被抽中的概率,概率抽样的技术含量和成本都比较高。
如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。
非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。
它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。
非概率抽样也适合市场调查中的概念测试。
第三章数据的图表搜集
3.4直方图和条形图有何区别?
条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积
表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距,高度
与宽度都有意义;
直方图各矩形连续排列,条形图分开排列;3条形图主要展示分类数据,直方图主要展示数值型数据。
3.6饼图和环形图的不同?
饼图只能显示一个样本或总体各部分所占比例。
环形图可以同时绘制多个样本或总体的数据系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一个环。
第四章习题答案
4.5简述众数、中位数和平均数的特点和应用场合。
众数:主要用于分类数据集中趋势的度量;是一组数据的峰值;
优点:不受极值的影响。
缺点:具有不唯一性;只有数据量较大时才有效果
中位数:主要用于顺序数据集中趋势的度量;是一组数据中间位置的代表制;优点:不受极值的影响;数据分布偏斜程度较大时是一个不错的选择。
平均数:主要用于数值型数据集中趋势的度量;是一组数据的重心所在。
优点:利用了所有数据信息;数据误差相互抵消,具有无偏性;
缺点:易受极值影响;当数据分布偏斜程度较大时代表性差。
4.9测度数据分布形状的统计量有哪些?峰态系数、偏态系数。
第六章统计量及其抽样分布
6.6什么是抽样分布?
样本统计量(随机变量)的概率分布是一种理论概率分布。
第七章参数估计
7.2、简述评价估计量好坏的标准。
无偏性:估计量抽样分布的数学期望=总体参数
有效性:对同一参数的两个无偏点估计量,拥有更小标准差的估计量更有效。
一致性:随着样本容量的增大,估计量的值越来越接近总体参数。
7.7简述样本量与置信水平、总体方差、估计误差的关系。
样本量越大,置信水平越高,总体方差和估计误差越小。
第八章假设检验
8.1假设检验和参数估计有什么相同点和不同点?
相同点:是统计推断的两部分;都运用样本对总体进行推断。
不同点:推断角度不同。
参数估计:用样本统计量估计总体参数,总体参数估计前未知。
假设检验:对总体参数提出假设,用样本信息验证假设成立否。
8.3什么是假设检验中的两类错误?
α错误(弃真错误):原假设为真,却被我们拒绝了。
β错误(取伪错误):原假设为假,却被我们接受了。
第十章方差分析
10.4方差分析中有哪些基本假定?
(1)每个总体都应服从正态分布
(2)各个总体的方差必须相同
(3)观测值是独立的
10.10方差分析中多重比较的作用是什么?
通过对总体均值之间的配对比较来进一步检验哪些均值之间存在差异。
第11章一元线性回归
11.8一元线性回归模型通常有以下几条基本的假定:
(1)
变量之间存在线性关系;(2)
在重复抽样中,自变量x 的取值是固定的;(3)
误差项ε是一个期望为零的随机变量;(4)
对于所有的x 值,误差项的方差2都相同;(5)误差项是一个服从正态分布的随机变量,且相互独立。
即2(0,)N 。
11.9参数最小二乘法的基本原理
因变量的观测值与估计值之间的离差平方和最小。
第十二章多元线性回归
12.2多元线性回归模型中有哪些基本假定?
(1)误差项是一个期望值为0的随机变量,即0)
(E 。
(2)对于自变量1x ,2x ,…,k x 的所有值,
的方差2都相同。
(3)误差项
是一个服从正态分布的随机变量,且相互独立,即),0(~2N 。
12.3解释多重判定系数和调整的多重判定系数的含义和作用。
多重判定系数2R 是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量的变差中被估计的回归方程所解释的比例。
为避免增加自变量而高估
2R ,统计学家提出用样本量n 和自变量的个数k 去调整2R ,计算出调整的多重判定系数)11)(1(12
2
k n n R R a ,其意义与2R 类似,表示在用样本量和模型中自变量的个数进行调整后,
在因变量的变差中被估计的回归方程所解释的比例。