《统计学》重点归纳
统计学重点

第一章1、数据类型:按照所采用的计量尺度不同,我们将数据分为:分类数据(归于某一类别的非数字型数据,ex:血型),顺序数据(有序类别的非数据型数据,ex:喜好,产品等级),数值型数据(按照数字尺度测量的观测值)2、统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数,样本统计量通常用小写英文字母表示,若存在未知变量就不是统计量。
第二章1、概率抽样(随机抽样):(1)特点:按一定的概率以随机原则抽取样本(抽取样本时使每个单位都有一定的机会被抽中)。
每个单位被抽中的概率是已知的,或是可以计算出来的。
当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率(2)简单随机抽样:体现在每一个样本点的选取上(简单直观方便,但是效率低)(3)分层抽样:适用于总体差距大,体现在每一层样本点选取上(精度最高)(4)系统抽样:第一个样本点的选取是随机的(简单,提高精度,但是方差估计难)(5)整群抽样:要求:群集间互斥且周延,群集与群集间差异小,群集内类似总体每一群的选取是随机的(简单,相对集中,方便,但是精度较差)(6)多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查。
2、非概率抽样(1)抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查(2)有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式3、比较:4、抽样误差:所有样本可能的结果与总体真值之间的平均性差异影响因素:样本量的大小、总体的变异性第三章1、数据审核:(1)原始数据:完整性,准确性;(2)二手数据:适用性,时效性,确认是否有必要做进一步的加工整理2、分类数据的图示:(1)条形图:主要反映分类数据的频数分布(2)帕累托图:各类别数据出现的频数多少排序的柱形图,用于展示分类数据分布。
(3)饼图:主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题。
统计学复习要点

1.统计学是收集、分析、表述和解释数据的科学(不列颠百科全书)2.按照计量层次分: 分类数据、顺序数据、数值型数据3.按收集方法分:观测数据和实验数据4.按时间状况分:截面数据和时间序列数据5.总体:所研究的全部个体(数据) 的集合,其中的每一个个体也称为元素6.样本:从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量或样本量7.参数:描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值,所关心的参数主要有总体均值(?)、标准差(?)、总体比例(?)等8.统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数,所关心的样本统计量有样本均值(?x)、样本标准差(s)、样本比例(p)等9.数据的间接来源:系统外部的数据和系统内部的数据10.二手数据的特点:搜集容易,采集成本低、作用广泛、在研究中应优先考虑11.二手数据的可靠性评估:数据是谁搜集的?为什么目的而搜集的?数据是怎样搜集的?什么时候搜集的?12.数据的直接来源:调查数据、实验数据13.概率抽样的特点:按一定的概率以随机原则抽取样本,每个单位被抽中的概率是已知的,或是可以计算出来的,当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率14.简单随机抽样:从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的,最基本的抽样方法,是其它抽样方法的基础。
15.分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本16.整群抽样:将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查17.系统抽样:将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位。
先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位18.多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查19.非概率抽样:相对于概率抽样而言。
统计学基础知识考试重点

统计学基础知识考试重点第一章统计和数据第二章●统计是用来处理数据的,是关于数据的一门学问。
1、统计学:是用以收集数据、分析数据和由数据得出结论的一组概念、原则和方法。
2、统计分析数据的方法分为:(1)描述统计(2)推断统计3、描述统计:是研究数据搜集、处理和描述的统计学方法。
4、推断统计:是研究如何利用样本数据来推断总体特征的统计学方法。
5、推断统计包括:(1)参数估计(2)假设检验6、定性变量的特点:只反映现象的属性特点,不能说明具体量的大小和差异。
●定性变量包括分类变量和顺序变量。
●只反映现象分类特征的变量称分类变量。
分类变量没有数值特征,所以不能对其数据进行数学运算。
●如果类别具有一定的顺序,这样的变量称为顺序变量。
顺序变量不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。
7、定量变量的特点:可以用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异。
●数值型数据(定量数据)作为统计研究的主要资料,其特征在于它们都是以数值的形式出现的,有些数值型数据只可以计算数据之间的绝对差,而有些数值型数据不仅可以计算数据之间的绝对差,还可以计算数据之间的相对差。
其计量精度远远高于定性数据。
在统计学研究中,数值型数据有着最广泛的用途。
8、数据按获取的方法不同分为:(1)观测数据(2)实验数据9、观测数据:是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。
10、实验数据:一般是在科学实验环境下取得的数据。
11、统计数据资料的来源:(1)通过直接的调查或实验获得的原始数据,这是统计数据的直接来源;(2)别人调查的间接数据,并将这些数据进行加工和汇总后公布的数据,这是数据的间接来源。
12、数据的直接来源:(1)统计调查(2)实验法●通过统计调查得到的数据,一般称为观测数据。
●运用实验法时,实验组和对照组的产生应当是随机的。
统计学重点部分归纳

统计学重点部分归纳 Document serial number【KKGB-LBS98YT-BS8CB-BSUT-BST108】第三章全距也称极差,是一组数据的最大值与最小值之差。
R=最大值-最小值组距分组数据可根据最高组上限 -最低组下限计算。
四分位数:数据按大小顺序排序后把分割成四等分的三个分割点上的数值。
SPSS中四分位数的位置为(n+1)/4, 2(n+1)/4, 3 (n+1)/4。
Excel中四分位数的位置分别为(n+3)/4, 2(n+1)/4,(3 n+1)/4。
如果四分位数的位置不是整数,则四分位数等于前后两个数的加权平均。
四分位距等于上四分位数与下四分位数之差IQR=Q3-Q1反映了中间50%数据的离散程度,数值越小说明中间的数据越集中。
不受极端值的影响。
可以用于衡量中位数的代表性。
方差是一组数据中各数值与其算术平均数离差平方的平均数,标准差是方差正的平方根。
是反映定量数据离散程度的最常用的指标。
离散系数:标准差与其相应的均值之比,表示为百分数。
特点:(1)反映了相对于均值的相对离散程度;(2)可用于比较计量单位不同的数据的离散程度;(3)计量单位相同时,如果两组数据的均值相差悬殊,离散系数可能比标准差等绝对指标更有意义数据分布的不对称性称作偏态。
偏态系数就是对数据分布的不对称性(即偏斜程度)的测度。
峰度:数据分布的扁平或尖峰程度。
峰度系数:数据分布峰度的度量值,对数据分布尖峰或扁平程度的测度,一般用K表示。
箱线图用于描述数据分布特征的一种图形。
最简单的箱线图可以根据数据的最大值、最小值和三个四分位数绘制的:先根据三个四分位数Q1、Q2、Q3画出中间的盒子,然后由盒子两端分别向最大、最小值连线。
在SPSS中标准的箱线图一般是这样绘制的:先根据三个四分位数Q1、Q2、Q3画出中间的盒子;由Q3至Q3+*IQR区间内的最大值向盒子的顶端连线,由Q1至*IQR区间内的最小值向盒子的底部连线;处于Q3+*IQR至Q3+3*IQR或者 *IQR至Q1-3*IQR范围内的数据用圆圈标出;大于Q3+3*IQR或者小于Q1-3*IQR的用星号标出。
统计学重点

1、非全面调查方式有哪几种?说明他们各自的特点及应用场合。
(1)抽样调查是一种专门组织的非全面调查,是按照随机原则从总体中抽取部分单位组成样本,以样本数据推断总体特征的一种调查方法,是实际中应用最广的一种调查方式。
具体来说:①不可能进行全面调查的社会现象,为了测算全面数据,必须采取抽样调查方法;②没必要或很难进行全面调查的社会现象,也可采用抽样调查;③其他应用,如进行生产过程的质量控制、对全面调查结果进行检验修正等。
(2)重点调查时在调查对象中选择一部分重点所进行的非全面调查。
但只有在当调查任务是掌握调查对象的基本情况,而在总体中的确存在的重点单位时,才能进行重点调查。
(3)典型调查是根据调查的目的和任务,在对调查对象全面分析的基础上,有意识地选择若干有典型意义或有代表性的单位进行深入、细致调查的一种非全面调查方式。
可以用来研究某些复杂的专门问题或新生事物。
2、数据分组的关键是什么?如何选择分组标志?(1)数据分组的关键是选择分组标志和划分各组界限。
(2)应根据研究的目的选择分组标志;选择能够反映事物本质的标志;考虑现象所在的历史条件或经济条件选择分组标志。
3、简述均值、中位数和众数的特点及应用场合。
(1)均值的计算利用了全部数据信息,具有优良的数学性质,主要适用于数值型变量集中趋势测度值。
主要缺点是易受极端值的影响。
算术平均数是实际中应用最广泛的集中趋势测度值;调和平均数主要用于不能直接计算均值的数据;几何平均数主要用于计算比率或速度数据的平均数。
(2)中位数是一组数据中间位置上的代表值,其特点是不受数据极端值得影响,主要适用于作为顺序数据的集中趋势测度值。
(3)众数是一组数据分布的峰值,它也是一种位置的代表值,不受极端的影响。
其缺点是不具有唯一性。
众数主要适用于作为分类数据的集中趋势测度值。
(4)当数据呈对称分布或接近对称分布时,应选择均值作为集中趋势的代表值。
当数据呈偏态分布时,可以选择众数或中位数作为集中趋势测度值。
自考00974统计学原理复习重点

00974统计学原理章节基础知识第一章:总论1、统计的三基本方法:大量观察法,综合分析法,归纳推断法((可扩展未简答)2、凯特乐将统计学的三个主要源泉:英国的政治学派,德国的国势学,法国的概率统计3、“统计”一词的含义:统计包括三个含义:统计工作、统计资料和统计科学。
统计工作、统计资料、统计科学三者之间的关系是:统计工作的成果是统计资料,统计资料和统计科学的基础是统计工作,统计科学既是统计工作经验的理论概括,又是指导统计工作的原理、原则和方法。
(简答)4、统计信息的两大特征:数量性和总体性(多选、简答)5、统计的三大职能:信息,咨询,监督(多选)6、四大计量尺度:定类尺度,定序尺度,定距尺度,定比尺度(重点前两个)7、按度量层次低到高:定类尺度>定序尺度>定距尺度>定比尺度8、区别总体和总体单位(选择,判断)9、统计指标的的三大特性:总体性,数量性,综合性(多选)10、区分变异和变量,变量又可以分为:连续变量和离散变量(多选)第二章:统计资料的收集和整理1.统计资料的三大特性:数量性,总体性,客观性(选择,填空)2.总体性的定义是指统计是从整体上反映和分析事物数量特征,而不是着眼于个别事物,因为事物的本质和发展规律只有从整体上观察,才能作出正确的判断。
(判断)3.原始资料的搜集方法访问方法观察方法实验方法(多选)4.统计调查的方式:1)普查:专门组织进行一次性的全面调查(填空、多选)2)抽样调查:最常用的方法3)统计报表4)重点调查:了解定义(选择)(多年都有考到)5)典型调查6.结论:统计方式是以普查为基础,抽样调查为主体(选择、判断)7.统计调查方案的内容:(1) 调查目的:调查目的要符合客观实际,是任何一套方案首先要明确的问题,是行动的指南。
(2) 调查对象和调查单位:调查对象即总体,调查单位即总体中的个体。
(3) 调查项目:即指对调查单位所要登记的内容。
(4) 调查表:就是将调查项目按一定的顺序所排列的一种表格形式。
统计学考试重点

精品文档统计学考试重点(是我去年考试时的,命中率百分之百)1.统计的涵义:从数量方面认识总体现象的本质和规律的一种认识活动或调查研究活动。
概括为:统计工作,统计资料,统计学。
2.统计工作,统计资料与统计学的联系:统计工作是获取统计资料的实践活动,统计资料是统计工作的成果。
同时又服务于统计工作,统计学来源于统计实践,有用于指导统计实践,它可以使统计工作进行的更科学,得到的统计资料更全面、更及时、更准确3.统计的研究对象是大量社会经济现象的数量特征与规律。
4.统计的研究对象具有以下特点:①数量性②总体性③具体性。
5.统计工作可分为四个阶段,统计设计,统计调查,统计整理,统计分析。
6.统计工作的基本方法:大量观察法,统计分组法,综合指标法,统计推理法7.统计总体:简称总体,是根据统计研究目的确定的所研究对象的全体。
8.总体单位:简称单位或个体,是只构成总体的个别单位。
9.指标是指用来说明总体单位数量特征或属性特征的概念或名称。
10.标志根据表现形式分为:品质标志和数量标志11.指标是说明总体数量特征的科学概念和具体数值。
12.指标所包含的要素有:指标名称,指标数值,时间,空间,计量单位。
13.指标按其表现形式不同,又可分为总量指标,相对指标,平均指标。
14.按所反映总体内容不同可分为:数量指标和质量指标。
15.变量,所谓变量,是指可变的数量标志。
16.统计数据的计量尺度分为:定类尺度,定序尺度,定距尺度,定比尺度。
17.数据的类型有:定性数据(由定类尺度和定序尺度计量形成) 。
定量数据(由定居尺度和定比尺度计量形成) 。
18.统计调查方案的设计(内容):①确定调查的目的和任务②确定调查对象、调查单位与报告单位,③确定调查项目、设计调查表式,④确定调查时间、空间和调查期限,⑤制定调查工作的组织实施计划。
⑥选择调查方法精品文档19.统计数据搜集的原则:准确性原则,及时性原则,系统性原则,完整性原则。
20.统计数据搜集的方法:观察法,报告法,询问法。
统计学知识点(完整)

基本统计方法第一章概论1. 总体(Population):根据研究目的确定的同质对象的全体(集合);样本(Sample):从总体中随机抽取的部分具有代表性的研究对象。
2. 参数(Parameter):反映总体特征的统计指标,如总体均数、标准差等,用希腊字母表示,是固定的常数;统计量(Statistic):反映样本特征的统计指标,如样本均数、标准差等,采用拉丁字字母表示,是在参数附近波动的随机变量。
3. 统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。
第二章计量资料统计描述1. 集中趋势:均数(算术、几何)、中位数、众数2. 离散趋势:极差、四分位间距(QR=P75-P25)、标准差(或方差)、变异系数(CV)3. 正态分布特征:①X轴上方关于X=μ对称的钟形曲线;②X=μ时,f(X)取得最大值;③有两个参数,位置参数μ和形态参数σ;④曲线下面积为1,区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。
4. 医学参考值范围的制定方法:正态近似法:;百分位数法:P2.5-P97.5。
第三章总体均数估计和假设检验1. 抽样误差(Sampling Error):由个体变异产生、随机抽样造成的样本统计量与总体参数的差异。
抽样误差不可避免,产生的根本原因是生物个体的变异性。
2. 均数的标准误(Standard error of Mean, SEM):样本均数的标准差,计算公式:。
反映样本均数间的离散程度,说明抽样误差的大小。
3. 降低抽样误差的途径有:①通过增加样本含量n;②通过设计减少S。
4. t分布特征:①单峰分布,以0为中心,左右对称;②形态取决于自由度ν,ν越小,t值越分散,t分布的峰部越矮而尾部翘得越高;③当ν逼近∞,逼近, t分布逼近u分布,故标准正态分布是t分布的特例。
5. 置信区间(Confidence Interval, CI):按预先给定的概率(1-α)确定的包含总体参数的一个范围,计算公式:或。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《统计学》期末重点1.统计学的类型和不同类型的特点统计数据:按所釆用的计量尺度不同分;(1)(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对爭物进行分类的结果,数据表现为类别,用文字来表述:(2)(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(3)(走量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据:按统计数据都收集方法分:(4)观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
(5)实骏数据:在实验中控制实验对象而收集到的数据。
统计数据:按被描述的现象与实践的关系分;(6)截面数据:在相同或相似的时问点收集到的数据,也叫挣态数据。
(7)时问序列数据:按时问顺序收集到的,用于描述现象随时问变化的情况,也叫动态数据。
2.变量的题型第10页,习题1. 1(1)年龄:数值型变量(2)性别:分类变量(3)汽车产量:离散型变量(4)员工对企业某项改革措施的态度(赞成.中立、反对):顺序变量(5)购买商品时的支付方式(现金.信用卡、支票〉:分类变量3.随机抽样(槪率抽样)的抽样方式。
(1)简单随机抽样(2)分层抽样:就是抽样单位按某种特征或者某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。
将各层的样本结合起来,对总体目标量进行估计。
(3)整群抽样:(4)系统抽样(5)多阶段抽样分层抽样与整群抽样的区别:分层抽样的层数就是样本容量:整群抽样的群中单位的个数就是样本容量4.非槪率抽样的几种类型(1)方便抽样(2)判断抽样(3)自愿样本(4)滚雪球抽样滚雪球抽样往往用于对稀少群体的调查。
在滚雪球抽样中,首先选择一组调查单位,对其实施调查后,再请他们提供另外一些属于研究总待的调查对象,调查人员根据调查线索,进行此后的调查。
这个过程持续下去,就会形成滚雪球效应。
优点:容易找到那些属于待定群体的被调查者,调查成本也比较低。
(5)配额抽样比较抵率抽样和非低率抽样的待点,指出各自适用情况•低率抽样:抽样时按一定的概率以髓机原则抽取样本。
每个单位别抽中的概率已知或可以计算,当用样本对总体目标呈进行估计时,要考虑到每个单位样本被抽到的概率。
技术含量和成本都比较高。
如果调查目的在于掌握和研究对象总体的数量待征,得到总体参数的置信区问,就使用概率抽样。
非概率抽样:操作简单,时效快,成本低.而且对于抽样中的统计学专业技术要求不是很高。
它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。
它同样使用市场调查中的概念测试(不需要调查结果投彩到总体的情况)。
5.数据预处理容数据审核(完整性和准确性:适用性和实效性),数据筛选和数据排序。
6.数据型数据的分组方法和步菠分组方法:单变量值分组和组距分组,组距分组又分为等距分组和异距分组。
分组步骤:(1)确定组数(2)确定各组组距(3)根据分组整理成频数分布表7.散点图与併图的主要用途饼图定用圆形及圆扇形的削度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。
散点图是描述变量之问关系的一种直观方法,从中可以大体上看出变量之问的关系形态及关系强度。
&举例说明开口组组中值的计算方法缺下限开口组组中值=上限一1/2邻组组距缺上限开口组组中值=下限+1/2邻组组距9.怎样理解平均数在统计学中的地位?平均数在统计学中具有重要的地位,是集中趋势的最主要的测度,主要适用于数值型数据,而不适用于分类数据和顺序数据。
10.中位数与众数的区别众数:是一组数据中出现次数最多的变量值,用Mo表示。
众数主要用于测度分类数据的集中趋势,当然也适用于作为顺序数据以及数值型数据集中趋势的测度值。
中位数:長一组数列排序后处于中问位置上的变量值,用Me。
中位数主要用于测度顺序数据的集中趋势,当然也适用测度数值型数据的集中超势,但不适用于分类数据。
简述众数、中位数和平均数的待点和应用场合。
众数是一组数据分布的峰值,不受极端值的彩响,缺点是具有不唯一性。
众数只有在数据量较多时才有意义,数据量较少时不宜使用。
主要适合作为分类数据的集中趋势测度值。
中位数是一组数据中问位置上的代表值,不受极端值的彩响。
当数据的分布偏斜较大时,使用中位数也许不错。
主要适合作为顺序数据的茉中趋势测度值。
平均数对数值型数据计算的,而且利用了全部数据信息,在实际应用中最广眨。
当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。
但平均数易受极端值的彩咱,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。
x为什么要计算离散系数?方差利标准差是反映数据分散程度的绝对值,一方面其数值大小受原变量值本身水平高低的影响,也就是与变量的平均数大小有关;另一方面,它们与原变量的计量单位相同,采用不同计量单位的变量值,其离散程度的测度值也就不同。
因此,为消除变量值水平高低和计量单位不同对离散程度测度值的彩响,笛要计算离散系数。
12.什么是次序统计童设X"……,X”是从总体x中抽取的一个样本,x⑼称为第:个次序统计量,它是样本(XrX乂满足如下条件的函数:毎当样本得到一组观测值尢,矩,……,兀时,其由小到大的排序X,兀胪……"卢……“如“中,第"值m就作为次序统计量X⑺的观测值,而X……「X加称为次序统计量。
其中,Xm和1X刖分别为最小的的最大次序统计量。
13.什么是自由度?自由度:髓机变量所包含的独立变量的个数。
14.偏态系数(SK)取值的不同意义如果一组数据的分布是对称的,则偏态系数等于0:如果偏态系数明显不等于0,表明分布是非对称的。
若偏态系数大于1或小于-1,成为高度偏态分布;若偏态系数在0.5-1或-1-0.5之问,被认为是中等偏态分布;偏态系数越接近0,偏斜程度就越低。
11・标准差系数(离散系数匚 故)的计算及其应用(第89页,第96页习题4.8 (1))• •15. 中心极限定理的容 1 一■设从均值"方差为CT 的任意一个总体中抽取样本量为n 的样本•当n 充分大时,样本均值兀的抽样分布近似服从均值为",方差为。
的正态分布。
16.评价估计量的标准(1)无偏性无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。
设总体参数为0 •所选择的估计量为。
,如果E ( 0 ) = 0 ,则称D为o的无偏估计量。
(2)有效性有效性是指对同一整体参数的两个无偏估计量,有更小的标准的估计量更有效。
在无偏估计的条件下,估计量的方差越小,估计也就越有效。
(3)一致性一致性是指随着样本量的増大,估计量的指越来越接近被估计总体的参数。
换而言之,一个大样本给出的估计量要比一个小样本给出的估计量更接近总体的参数。
17.简述样本呈与置信水平、总体方差.估计误差的关系样本量越大置信水平越高,总体方差和边际误差越小18.大样本条件下总体均值的区问估计2(1)大样本条件下■方差b 巳知,正态总体或非正态总体- b总体均值"在置信水平下的置信区问为:* 土乙毎2寓一 b _ b(X _乙炉丁为置信下限:X+Za/2石为置信上限.°为事先确定的一个概率值,也称凤险值,是总体均值不包括在置信区问的概率;为置信水平:Za/2是标准正态分布右侧面积为时的z值: (73寓是总体均值的估计误差)•>■(2)大样本条件下,方差°7未知,正态总体或非正态总体总体均值"在置信水平下的置信区问为:”土Za/2真('为样本方差,S为样本标准差)19.置信区问可靠性与精确性的关系置信度又称盟信水平是对总体参数进行区问估计时构适的随机区问包含参数真值的概率。
精确度長对总体参数进行区问估计时构遗的随机区问的平均长度。
置信度和豬确度是评价区问估计优劣的两个标准,置信度度和精确度都高则说明区问佶计较好,但是二者是此消彼长的关系,提高置信度必将以降低精确度为代价。
20.假设检卷和参数估计有什么相同点和不同点?参数估计和假设检验是统计推浙的两个组成部分,它们都是利用样本对总体进行某种推断,然而推断的角度不同。
参数估计讨论的是用样本统计量估计总体参数的方法,总体参数口在估计前是未知的。
而在参数假设检菠中,则是先对U的值提出一个假设,然后利用样本信息去检骏这个假设是否成立。
21.假设检菽的种类及假设的正确写法建设检卷的一般流程:首先提出原假设和备择假设,分别为:HJHr 然后,确定适当的桧卷统计量,需要考虑样本量的多与少,总体标准差旷巳知与否,等等。
规定显著性水平检騷统计量的确定:①若是大样本条件下,釆用Z统计量,计算公式为:②若是小样本条件下,釆用t统计量,计算公式为CT/Vn S! y/n(t统计量的自由度为n-l)注:即使是小样本,若o•巳知,仍可继续使用z统计量。
最后,进行统计决策。
比例问題的检验,z统计量的计算公式为:(P为样本比例:疗°为总体比例n的假设值)(1)双侧检验在双侧检骏中,只要“>“()或“<“()两者之中有一个成立,就可以拒绝原假设。
以大样本条件下为例,双侧检验的决策准则为:若同<“』不拒绝汕:若kl>|z』,拒绝汕。
(Z的下标a/2表示双侧检验)不管双侧檢鑿威長单侧检验,若使用P值检菽,P<a.拒绝Ho:P>cc.不育芒扌巨绝Ro (2)单侧检验①左单侧检轻(下限检验)希塑所考查的数值越大越好②右单侧检验(上限检验)希望所考查的数值越小•越好22.大样本条件下总体均值的假设检验(192页例題)5 •总体方差假设检验的方法2 (n-l)c2z =—Aa若进行双侧检验,在确定的a水平下,拒绝域分布在力2统计量分布曲线的两边;若是单侧桧鞭,拒绝域分布在龙2统计量分布曲线的一边。
具体在左还是在右,需根据原假设和备择假设2 2 2 2的情况而定。
若样本统计量,则拒绝原假设:若7 <,则不能拒绝原假e A a (n-l) * A a 5T> 设。
23. 假设检菠中犯两类错误及其槪率之问的关系假设检豔的结果可能是错误的,所犯的错误有两种类型,一类错误是原假设H0为真却被我们拒绝了, 犯这种错误的槪率用a 表示,所以也称Q 错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯 这种错误的概论用B 表示,所以也称B 错误或取伪错误。
两类错误之问存在什么样的数量关系:在假设检验中,a 与B 是此消彼长的关系。
如果减小Q 错误, 就会増大犯B 错误的机会,若减小B 错误,也会增大犯a 错误的机会。
故,二者是此消彼长的关系。
24. 列脫表的低念及自由度的确定列脫表是由两个以上的变量进行交叉分类的頻数分布表。