统计学重点

合集下载

医学统计学复习重点

医学统计学复习重点

整理分析和2.计描述4.(集合)。

1.抽样随机2.分组随机3.实验顺序随机。

称全距,用离散系数,为标准差与均数只比,常:CV=s/x究,1.抽样研究2.个体变异。

系统误差:指数据搜集和测量过程中由于仪器不准确、造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差由于一些非人真实性(validity):观察值与真值的接近程度,受系统误差的影响( (reliabiliy)——也称精密度(precision)或重复性(repeatability)是直接用样本统计量作为对应的总体参数最常用的是95%10095有5在描述两变量间的关系时,若散点图呈直线趋势或有直线相关关系,可进行直线回归分析。

参数:根根据样本的分布特征而计算得到的1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。

5、★频数表的用途:揭示计量资料的分布类型;揭示计量资料的分布特征;便于发现特大值和特小值;便于进一步进行统计分析★常见的统计资料的类型有:计量资料;计数资料;等级资料7、★t检验的应用条件是:①正态分布:当样本含量较小时,要求样本来自正态总体。

②方差齐性:两样本均数比较时,要求两总体方差相等。

U检验的应用条件是:①大样本(如n>50);②小样本,σ已知且样本来自正态总体。

8、★.描述分类变量常用的指标有率、构成比、相对数。

9、率是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,常用来描述某种现象发生的频率大小或强度构成比是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,常用来描述某一事物内部各组成部分所占的比重或分布。

10、★四格表卡方专用公式应用条件n≥40,且Tmin≥5 研究事物或现象间的线性关系用相关分析,研究事物或现象间的线性数量依存关系用回归分析。

统计学重点

统计学重点

复习重点:统计学基本概念、问题简答复习重点统计1.简述统计的含义及其相互之间的关系。

统计资料、统计工作、统计学统计资料是统计工作的成果统计工作满足对统计资料的准确性统计学与统计工作是理论和实践的关系2.简述变量分配数列编制的步骤。

步骤:①将原始资料按其数值大小重新排列②确定全距③确定组距和组数④ 确定组限⑤ 编制变量数列3.什么是统计指标、什么是统计标志?说明二者的联系与区别。

统计指标是反映社会经济现象总体数量特征的概念标志指标简称标志,是反映总体单位某种特征的名称。

区别:指标是说明总体特征的,而标志是说明总体单位特征的;标志有不能用数值表示的品质标志和能够用数值表示的数量标志两种,而指标都能用数值表示联系:许多统计指标的数值是从总体单位的数量标志汇总而来的;指标和数量标志之间存在着转化关系。

4.什么是发展速度?包括哪些类型?各类之间的数量关系?发展速度是两个时期发展水平之比,它表明现象发展的程度和方向。

(一)定基发展速度=报告期水平÷某一固定时期水平(二)环比发展速度=报告期水平÷前一期水平数量关系:1.环比发展速度的连连乘积等于相应的定基发展速度2.相邻的两个定基发展速度之比等于相应时期的环比发展速度5.什么是结构相对指标、强度相对指标和比例相对指标?各类之间的关系如何?结构相对指标是利用分组的方法,将总体去区分为性质不同的若干部分,以部分数值与总体数值对比,计算各部分所占比重或比率的相对数,是反映同一时期总体内部组成状况的综合指标。

部分与总体的关系比例相对指标是反映同一总体内部各部分之间数量对比关系的综合指标,用来反映总体各组成部分之间的数量联系程度和比例关系。

部分与部分的关系强度相对指标是将两个性质不同但有一定联系的总体的指标对比而得到的相对数,用以反映现象强度、密度或普遍程度的综合指标。

关联指标间的关系6.什么是统计调查?有哪些类型?统计调查方案包括哪些内容?统计调查是根据研究的任务和目的,按照预先设计的方案,采用统计学的理论和方法,对所研究对象进行有计划,有组织的搜集资料的工作过程。

统计学重点

统计学重点

填空1.统计一词有三种不同涵义分别是统计工作、统计资料和统计学。

2.社会经济统计的研究对象是社会经济现象总体的数量特征和数量关系。

3.社会经济统计学的理论基础是经济学,方法论基础是唯物辩证法。

4.国家统计兼有信息、咨询和监督三种职能。

5.统计总体的基本特征是同质性、大量性和差异性。

6.统计总体按其所包含的单位数是否可数分为有限总体和无限总体。

7.变量是指可变的数量标志;变量是指变量的具体数值表现。

8.按变量的连续性,变量分为连续变量和离散变量两种。

9.统计指标体系是各互不相联系的统计指标构成的整体,它按其作用不同可以分为基本统计指标体系和专题统计指标体系两大类。

10.统计的基本方法有大量观察法、统计分组法、综合分析法和归纳推荐法。

11.统计指标所反映的是总体的数量特征,数量标志所反映的是总体单位的数量特征。

12.统计调查按其组织形式,可分为统计报表和专门调查。

13.对调查对象的所有单位都进行调查,这是全面调查,而重点调查,抽样调查,典型调查都属于非全面调查。

14.统计调查的基本要求是准确性、及时性、完整性。

15.调查人员亲自到现场对调查对象进行清点和计量,这种调查为直接观察法。

16.人口调查中的调查单位是人,填报单位是户。

17.抽样调查属于非全面调查,但其调查目的是要达到对总体数量特征的认识。

18.统计调查误差一般分为登记误差和代表性误差两种。

19.统计分组的关键在于正确选择分组标志。

20.根据分组标志的特征不同,统计总体可以按品质标志分组,也可以按数量标志分组。

21.统计分组体系有平行分组体系和复合分组体系两种。

22.次数分配数列由总体按某标志分组和各组单位数比重两个要素组成。

23.对于连续变量划分组限时,相邻组的组限必须重叠。

24.在组距数列中,表示各组界限的变量值叫组限,各组上限与下限之间的中点叫组中值。

25.已知一个变量数列采用重叠组限分组,其最后一组的下限为500,其相邻组的组中值为480,则最后一组的上限可以确定为540,组中值为520。

统计学考试重点

统计学考试重点

统计学考试重点(是我去年考试时的,命中率百分之百)1.统计的涵义:从数量方面认识总体现象的本质和规律的一种认识活动或调查研究活动。

概括为:统计工作,统计资料,统计学.2.统计工作,统计资料与统计学的联系:统计工作是获取统计资料的实践活动,统计资料是统计工作的成果。

同时又服务于统计工作,统计学来源于统计实践,有用于指导统计实践,它可以使统计工作进行的更科学,得到的统计资料更全面、更及时、更准确3.统计的研究对象是大量社会经济现象的数量特征与规律。

4。

统计的研究对象具有以下特点:①数量性②总体性③具体性.5.统计工作可分为四个阶段,统计设计,统计调查,统计整理,统计分析。

6。

统计工作的基本方法:大量观察法,统计分组法,综合指标法,统计推理法7.统计总体:简称总体,是根据统计研究目的确定的所研究对象的全体。

8.总体单位:简称单位或个体,是只构成总体的个别单位。

9。

指标是指用来说明总体单位数量特征或属性特征的概念或名称。

10。

标志根据表现形式分为:品质标志和数量标志11.指标是说明总体数量特征的科学概念和具体数值。

12。

指标所包含的要素有:指标名称,指标数值,时间,空间,计量单位。

13。

指标按其表现形式不同,又可分为总量指标,相对指标,平均指标。

14。

按所反映总体内容不同可分为:数量指标和质量指标。

15.变量,所谓变量,是指可变的数量标志。

16。

统计数据的计量尺度分为:定类尺度,定序尺度,定距尺度,定比尺度。

17.数据的类型有:定性数据(由定类尺度和定序尺度计量形成)。

定量数据(由定居尺度和定比尺度计量形成)。

18.统计调查方案的设计(内容):①确定调查的目的和任务②确定调查对象、调查单位与报告单位,③确定调查项目、设计调查表式,④确定调查时间、空间和调查期限,⑤制定调查工作的组织实施计划。

⑥选择调查方法19。

统计数据搜集的原则:准确性原则,及时性原则,系统性原则,完整性原则.20。

统计数据搜集的方法:观察法,报告法,询问法。

统计学重点名词解释

统计学重点名词解释

什么叫因素或因子:所要检验的对象。

因素的不同表现成为水平或处理,每个因子水平下得到的数据称为观察值。

无偏性:估计量抽样分布的数学期望等于被估计的总体参数。

有效性:对同一总体参数的两个无偏估计量,有更小估计差得估计量更有效。

一致性:随着样本量的增大,点估计量的值越来越接近被估总体的参数。

原假设:提出一个或两个参数是否等于或大于、小于某个特殊值的命题。

备择假设:与原假设逻辑相反的假设。

点估计:就是用样本统计量的某个取值直接作为总体参数的估计值。

区间估计:在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减误差得到。

置信水平:将构造置信区间的步骤重复很多次,置信区间包括总体参数真值的次数所占的比例。

方差分析就是通过检验个总体的均值是否相等来判断分类自变量对数值型因变量是否有相助影响假设检验:利用样本信息,对提出的命题进行检验的一套程序和方法。

显著性水平:是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险单因素方差分析:研究一个分类型自变量同数值型自变量之间关系的一种统计方法。

离散系数:也称为变异系数,一组数据的标准差与其相应的平均数之比,是测度数据离散程度的相对值。

离散程度:它反映的是各变量值远离其中心值的程度。

统计学:收集、处理、分析、解释数据并从数据中得到结论的科学。

统计量:描述样本特征的概括性数字度量。

误差的控制主要方法有:改变样本容量、构造不同的抽样框、注意问卷中得措辞方式以及对调查过程的质量控制。

估计量:用来估计总体参数的统计量的名称。

根据一个具体样本计算出来的估计量数值称为估计值。

抽样调查的作用:应用范围广、调查结果准确可靠、调查速度快、节省调查费中位数:将所研究的总体中的各单位标志值按大小顺序排列,位于中点位置的那个标志值就是中位数小概率原理:是指在发生概率很小的随机事件再一次试验中几乎是不可能发生的。

根据这一原理可以做出是否拒绝原假设的决定。

管理统计学期末知识点重点归纳

管理统计学期末知识点重点归纳

管理统计学期末知识点重点归纳●发展历程●政治算术学派,英国威廉·配地、代表著作是《政治算术》。

“无统计学之名,有统计学之实”。

●国势学派,德国康令和阿亨瓦尔。

“有统计学之名,无统计学之实”。

●数理统计学派,大数定律,比利时凯特勒,被称为“近代统计学之父”●统计学基础概念●统计含义●1统计工作(实践)过程:设计—调查—整理—分析——统计资料的提供和开发 2统计资料(成果) 3统计学●统计学是研究如何测定、收集、描述和分析大量客观现象总体数量的数据和给出正确认识的方法论科学(性质)。

●研究对象:是客观现象总体的数量方面,即现象总体的数量特征和数量关系。

作为自己的研究对象。

●研究目的:是通过现象总体的数量表现、数量特征和数量关系,综合考察总体现象的特征及其发展变化的规律。

●研究对象的特点:数量性,总体性,具体性,社会性●统计学的基本方法:1大量观察法;2统计分组法;3综合指标法;(常用的综合指标有总量指标、相对指标、平均指标、变异指标、动态指标和统计指数等。

)4归纳推断法●统计的基本职能:1统计信息(统计信息以数量性和总体性为特征)2统计咨询;3统计监督(特点:数量性;总体性)●三者的关系:三者是相互联系、相辅相成的。

搜集和提供统计信息是统计最基本的职能。

统计的信息职能是保证统计咨询和统计监督职能有效发挥的基础。

统计咨询职能是统计信息职能的延续和深化。

统计监督职能是在统计信息、咨询职能基础上进一步拓展,并促进统计信息和咨询职能的优化。

●集中统一是我国统计工作所具有的特点,也是统计工作组织的基本原则●总体与总体单位●总体/统计总体:是客观存在的,在某一方面具有相同性质的,许多个别事物组成的整体。

●特征:同质性、大量性、差异性分类1有限总体:单位数有限,可数,可以进行全面调查和非全调查;2无限总体:不可数,只能采取非全面调查。

●总体单位:构成总体的个别单位●两者关系:1构成总体的单位同质,2总体与总体单位有相对性●流量(时期)与存量(时点)●统计标志1性质:品质指标(说明总体单位的属性特征,在原始状态下无法量化)数量标志(数量特征,可量化)2变异情况:可变标志(标志表现有差别,决定总体的差异性)不变标志(标志表现无差别,总体的同质性)●统计指标:反映社会经济现象总体数量特征的概念及其具体数值。

统计学复习资料概率论与数理统计重点知识点整理

统计学复习资料概率论与数理统计重点知识点整理

统计学复习资料概率论与数理统计重点知识点整理概率论与数理统计是统计学的基础课程之一,也是应用最为广泛的数学工具之一。

下面将对概率论与数理统计的重点知识点进行整理,以供复习使用。

一、概率论的基本概念1. 样本空间和事件:样本空间是指随机试验的所有可能结果构成的集合,事件是样本空间的子集。

2. 古典概型和几何概型:古典概型是指样本空间中的每个结果具有相同的概率,几何概型是指采用几何方法进行分析的概率模型。

3. 概率公理和条件概率:概率公理是概率论的基本公理,条件概率是指在已知某一事件发生的条件下,另一事件发生的概率。

4. 独立事件和全概率公式:独立事件是指两个事件的发生与否互不影响,全概率公式是用于计算复杂事件的概率的公式。

5. 随机变量和概率分布函数:随机变量是对样本空间中的每个结果赋予一个数值,概率分布函数是随机变量的分布情况。

二、概率分布的基本类型1. 离散型概率分布:包括二项分布、泊松分布和几何分布等。

2. 连续型概率分布:包括正态分布、指数分布和均匀分布等。

三、多维随机变量及其分布1. 边缘分布和条件分布:边缘分布是指多维随机变量中的某一个或几个变量的分布,条件分布是指在已知某些变量取值的条件下,其他变量的分布。

2. 二维随机变量的相关系数:相关系数用于刻画两个随机变量之间的线性关系的强度和方向。

3. 多维随机变量的独立性:多维随机变量中的各个分量独立时,称为多维随机变量相互独立。

四、参数估计与假设检验1. 参数估计方法:包括点估计和区间估计,点估计是通过样本数据得到参数的估计值,区间估计是对参数进行一个范围的估计。

2. 假设检验的基本概念:假设检验是用于对统计推断的一种方法,通过与某个假设进行比较来得出结论。

3. 假设检验的步骤:包括建立原假设和备择假设、选择显著性水平、计算检验统计量和做出统计决策等步骤。

五、回归分析与方差分析1. 简单线性回归分析:简单线性回归分析是研究两个变量之间的线性关系的方法,通过建立回归方程来拟合数据。

统计学公式及重点整理

统计学公式及重点整理

統計學公式及重點整理第三章 機率論一、樣本空間與事件1. 機率:衡量事件發生之可能大小2. 實驗:蒐集資料的過程3. 隨機實驗:不能預知會發生何種結果的實驗方式4. 樣本點:每一個實驗的可能的結果,亦稱為出象5. 樣本空間:所有實驗可能產生之結果所成的集合,以大寫S 來表示6. 有限樣本空間:具有”有限”或”無限但可數”的樣本點之樣本空間7. 無限樣本空間:具有”無限且不可數”的樣本點之樣本空間8. 事件:樣本空間之子集合9. 不可能事件:事件為空集合,一般以∅表示10. 簡單事件:只包含一個樣本點的事件11. 複合事件:包含一個以上樣本點的事件12. 事件之集合運算事件的交集:B A事件的聯集:B A13. 互斥事件:對任何二事件A 、B,若∅=B A ,則稱A 、B 二事件為「互斥事件」14. 餘事件:事件A 之互補事件,稱為A 之「餘事件」,記為c A 或A15. 狄摩根定理:對於事件A 、B,下列等式成立c c c B A B A )( =c c c B A B A )( =16. 交換律:(1)A B B A =(2)A B B A =17. 結合律)()(C B A C B A =)()(C B A C B A =18. 分配律)()()(C B C A C B A =)()()(C B C A C B A =二、排列與組合19. 階乘:當n 為大於或等於1之整數,則n 階乘定義為123)...2)(1(!⋅⋅--=n n n n ;而定義0!=120. 排列數:)!(!)1(2)-1)(n -n(n P n r r n n r n -=+-⋯=,其中n r ≤且r,n 均為大於或等於1的整數 21. 組合數:)!(!!!)1(2)-1)(n -n(n !C n rr n r n r r n r P n r -=+-⋯==,其中n r ≤且r,n 均為大於或等於1的整數三、機率概念與性質22. 事件之機率古典機率方法:在一隨機實驗,中若每一個結果產生的可能性一致的條件下,事件的機率為事件的元素個數除以樣本空間之樣本點的個數,即事件E 的機率:(S)#(E)#P(E)=,其中#(E)、#(S)分別代表事件E 及樣本空間S 的元素個數。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计学重点第一章1、数据类型:按照所采用的计量尺度不同,我们将数据分为:分类数据(归于某一类别的非数字型数据,ex:血型),顺序数据(有序类别的非数据型数据,ex:喜好,产品等级),数值型数据(按照数字尺度测量的观测值)2、统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数,样本统计量通常用小写英文字母表示,若存在未知变量就不是统计量。

第二章1、概率抽样(随机抽样):(1)特点:按一定的概率以随机原则抽取样本(抽取样本时使每个单位都有一定的机会被抽中)。

每个单位被抽中的概率是已知的,或是可以计算出来的。

当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率(2)简单随机抽样:体现在每一个样本点的选取上(简单直观方便,但是效率低)(3)分层抽样:适用于总体差距大,体现在每一层样本点选取上(精度最高)(4)系统抽样:第一个样本点的选取是随机的(简单,提高精度,但是方差估计难)(5)整群抽样:要求:群集间互斥且周延,群集与群集间差异小,群集内类似总体每一群的选取是随机的(简单,相对集中,方便,但是精度较差)(6)多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查。

2、非概率抽样(1)抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查(2)有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式3、比较:4、抽样误差:所有样本可能的结果与总体真值之间的平均性差异影响因素:样本量的大小、总体的变异性第三章1、数据审核:(1)原始数据:完整性,准确性;(2)二手数据:适用性,时效性,确认是否有必要做进一步的加工整理2、分类数据的图示:(1)条形图:主要反映分类数据的频数分布(2)帕累托图:各类别数据出现的频数多少排序的柱形图,用于展示分类数据分布。

(3)饼图:主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题。

(4)环形图:同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环。

用于结构比较研究、用于展示分类和顺序数据3、数值型数据的整理:(1)分组方法:1、单变量值分组,2、组距分组(1、等距分组,2、异距分组)4、组距分组:(1)等距分组:连续性组距数列的统计原则:“上组限不在内”等距分组一般在变量值变动比较均匀的条件下所有。

做法:先用定性方法确定组数,再用全距除以组数得组距。

即:组距(i)=全距(R)/组数(k)(2)异距分组:异距分组一般在变量值变动不均匀,急剧上升或下降的条件下所有。

或当变量值按一定比例发展变化时使用。

需要用频数密度(频数密度=频数/组距)反映频数分布的实际状况。

Ex:5、图示(1)分组数据-直方图:(与条形图的区别)1、条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)是固定的2、直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3、直方图的各矩形通常是连续排列,条形图则是分开排列4、条形图主要用于展示分类数据,直方图则主要用于展示数值型数据(2)分组数据-折线图:是在直方图的基础上,把直方图顶部的中点(组中值)连接起来。

(3)未分组数据-茎叶图:以高位数值作树茎,低位数字作树叶,适用于小批量数据(4)未分组数据-箱线图:由最大值、最小值、中位数和两个四分位数绘制而成。

(5)时间序列数据-线图:长宽比例大致为10 : 7,时间一般绘在横轴,数据绘在纵轴(6)多变量数据-二维散点图:展示两个变量之间的关系(7)多变量数据-气泡图:展示三个变量之间的关系,数据点的大小依赖于第三个变量。

(8)多变量数据—雷达图:蜘蛛图,在显示或对比各变量的数值总和时十分有用6、统计表的设计1.合理安排统计表的结构2.总标题内容应满足3W要求3. 数据计量单位相同时,可放在表的右上角标明,不同时应放在每个变量后或单列出一列标明4. 表中的上下两条横线一般用粗线,其他线用细线5. 通常情况下,统计表的左右两边不封口6. 表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一7. 对于没有数字的表格单元,一般用“—”表示8. 必要时可在表的下方加上注释第四章1、众数:异距数列,用频数密度2、中位数:3、四分位数:4、分类数据-异众比率:非众数组的频数占总频数的比例,对分类数据离散程度的测度∑∑∑-=-=im imi r f f f f f v 15、顺序数据-四分位差:对顺序数据离散程度的测度,用于衡量中位数的代表性,上四分位数与下四分位数之差,即Q3-Q1。

6、方差和标准差:分组数据方差(重复抽样):Nf M Kiii ∑=-=122)(μσ(fi 为组中值,u 为均值,若是样本,除以N-1)不重复抽样:xσ-=i f f f f f f L M ?-+--+=+--)()(111&方差加法定理:总方差=组内方差的平均数+组间方差组间方差是:分组均值与总均值的差的平方乘以组内个数的和除以总数。

7、标准分数:s x x z i i -=服从N (0,1)分布。

8、相对离散程度-离散系数:标准差与其相应的均值之比,xsv s =9、偏态:偏态系数=0为对称分布,偏态系数> 0为右偏分布,偏态系数< 0为左偏分布10、峰态:峰态系数=0峰度适中,峰态系数<0为扁平分布,峰态系数>0为尖峰分布第六章1、中心极限定理:设从均值为μ,方差为σ 2的一个任意总体中抽取容量为n 的样本,当n 充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n 的正态分布2、样本均值的抽样分布:3、均值的抽样标准误:所有可能的样本均值的标准差,测度所有样本均值的离散程度,小于总体标准差,计算公式为:n X σσ=4、比例:5、样本比例的抽样分布:6、比率的抽样标准误:7、两个样本均值之差的抽样分布:(1)两个总体都为正态分布,即),(~2111σμN X ,),(~2222σμN X ,(2)两个样本均值之差21X X -的抽样分布服从正态分布, (3)数学期望为两个总体均值之差:2121)(μμ-=-X X E ,(4)方差为各自的方差之和222121221n n X X σσσ+=-。

8、两个样本比例之差的抽样分布:(1)两个总体都服从二项分布(2)分别从两个总体中抽取容量为n1和n2的独立样本,当两个样本都为大样本时,两个样本比例之差的抽样分布可用正态分布来近似(3)分布的数学期望为2121)(ππ-=-P P E (4)方差为各自的方差之和2221112)1()1(21n n P P ππππσ-+-=-第七章1、评价估计量的标准无偏性:估计量抽样分布的数学期望等于被估计的总体参数有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数 2、总体均值的区间估计3、总体比率的区间估计假定条件:总体服从二项分布、可以由正态分布来近似。

总体比率π在1-α置信水平下的置信区间为。

正态分布统计量 z:4、两个总体均值之差的区间估计其中:2)1()1(212221 12 - + - + - = n n s n s n s p ,1 ) / ( 1 ) / ( ) ( 2 22 2 1 2 1 2 1 2 2 2 2 1 2 1 - + - + = n n s n n s n s n s5、两个总体比率之差的区间估计假定条件:两个总体服从二项分布、可以用正态分布来近似、两个样本是独立的两个总体比率之差π1-π2在1-α置信水平下的置信区间为6、估计总体均值时样本容量的确定估计总体均值时样本容量n为,样本容量n与总体方差σ2、允许误差E、可靠性系数Z或t之间的关系为:与总体方差成正比、与允许误差成反比、与可靠性系数成正比7、估计总体比率时样本容量的确定根据比率区间估计公式可得样本容量n为。

第八章1、两类错误:显著性水平为a影响 b 错误的因素:1、随着假设的总体参数与真实参数值差异的减小而增大2、当显著性水平a减少时增大3、当总体标准差增大时增大4、当样本容量n减少时增大。

2、假设检验:3、单边检验单边检验解题步骤: 1、计算样本均值,2、用样本均值和要比较的K 比较,若样本均值大于K,则右边检验。

若样本均值小于k则左边检验3、画图4、计算统计量值5、查找临界值并和统计量值比较其中:右边检验:,拒绝域在右边左边检验:,拒绝域在左边4、假设检验步骤与注意点步骤:1、陈述原假设和备择假设2、从所研究的总体中抽出一个随机样本3、确定一个适当的检验统计量,并利用样本数据算出其具体数值4、确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5、将统计量的值与临界值进行比较,作出决策a)统计量的值落在拒绝域,拒绝H0,否则不拒绝H0b)也可以直接利用P值作出决策注意点:(1)当检验统计量落在拒绝域内,不代表我们证明原假设为错误的。

只能说我们对于原假设所陈述的内容真实性有很大的怀疑—零假设不是不正确,就是极不可能发生,(2)当检验统计量落在无法拒绝域中,并不是证明原假设为真,仅是表示证据不足以推翻我们的假设。

5、P值(1)在原假设为真的条件下,P值是抽样分布中大于或小于样本统计量的概率即:双侧检验为分布中两侧面积的总和、左侧检验为小于等于检验统计量部分的面积、右侧检验为大于等于检验统计量部分的面积(2)反映实际观测到的数据与原假设H0之间不一致的程度(3)被称为观察到的(或实测的)显著性水平(4)决策规则:若p值< ,拒绝H0(5)P<0.10代表有“一些证据”不利于原假设、P<0.05代表有“适度证据”不利于原假设、P<0.01代表有“很强证据”不利于原假设6、一个参数总体均值的检验7、一个参数总体比率的检验8、两个总体均值之差的检验其中:2)1()1(212222112-+-+-=n n s n s n s p ,()()1122222121212222121-+-???? ??+=n n s n n s n s n s v 9、两个总体比率之差的检验(1)(2)其中:2221121211n n n p n p n n x x p ++=++=第九章一、单因素方差分析 1、误差平方和-ss组内平方和SSE :()∑∑==-=k i n j i ij ix x SSE 112,每个组各样本数据与其组平均值的离差平方和组间平方和SSA :()()∑∑∑===-=-=ki i i ki n j i x x n x x SSA i12112,组平均值),,2,1(k i x i Λ=与总平均值x 离差平方和总平方和SST :()∑∑==-=k i n j ij ix x SST 112全部观察值ijx 与总平均值x 的离差平方和总离差平方和(SST )、误差项离差平方和(SSE )、水平项离差平方和 (SSA ) 之间的关系()()()∑∑∑∑∑=====-+-=-k i n j ij k i i i k i n j ijiix x x x n x x11212112,即SST = SSA + SSE三个平方和的作用:1、SST 反映全部数据总的误差程度;SSE 反映随机误差的大小;SSA 反映随机误差和系统误差的大小2、如果原假设成立,则表明没有系统误差,组间平方和SSA 除以自由度后的均方与组内平方和SSE 除以自由度后的均方差异就不会太大;如果组间均方显著地大于组内均方,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差3、判断因素的水平是否对其观察值有影响,实际上就是比较组间方差与组内方差之间差异的大小2、平方和除以相应的自由度----均方(方差)—MS(1)各误差平方和的大小与观察值的多少有关,为消除观察值多少对误差平方和大小的影响,需要将其平均,这就是均方,也称为方差,计算方法是用误差平方和除以相应的自由度。

相关文档
最新文档