统计学各种检验

u检验、t检验、F检验、X2检验（转）来源：李冠炜?????的日志常用显著性检验

1.t检验

适用于计量资料、正态分布、方差具有齐性的两组间小样本比较。包括配对资料间、样本与均数间、两样本均数间比较三种，三者的计算公式不能混淆。

2.t'检验

应用条件与t检验大致相同，但t′检验用于两组间方差不齐时，t′检验的计算公式实际上是方差不齐时t检验的校正公式。

3.U检验

应用条件与t检验基本一致，只是当大样本时用U检验，而小样本时则用t 检验，t检验可以代替U检验。

4.方差分析

用于正态分布、方差齐性的多组间计量比较。常见的有单因素分组的多样本均数比较及双因素分组的多个样本均数的比较，方差分析首先是比较各组间总的差异，如总差异有显著性，再进行组间的两两比较，组间比较用q检验或LST 检验等。

5.X2检验

是计数资料主要的显著性检验方法。用于两个或多个百分比(率)的比较。常见以下几种情况：四格表资料、配对资料、多于2行*2列资料及组内分组X2检验。

6.零反应检验

用于计数资料。是当实验组或对照组中出现概率为0或100％时，X2检验的一种特殊形式。属于直接概率计算法。

7.符号检验、秩和检验和Ridit检验

三者均属非参数统计方法，共同特点是简便、快捷、实用。可用于各种非正态分布的资料、未知分布资料及半定量资料的分析。其主要缺点是容易丢失数据中包含的信息。所以凡是正态分布或可通过数据转换成正态分布者尽量不用这些方法。

8.Hotelling检验

用于计量资料、正态分布、两组间多项指标的综合差异显著性检验。

计量经济学检验方法讨论

计量经济学中的检验方法多种多样，而且在不同的假设前提之下，使用的检验统计量不同，在这里我论述几种比较常见的方法。

在讨论不同的检验之前，我们必须知道为什么要检验，到底检验什么？如果这个问题都不知道，那么我觉得我们很荒谬或者说是很模式化。检验的含义是要确实因果关系，计量经济学的核心是要说因果关系是怎么样的。那么如果两个东西之间没有什么因果联系，那么我们寻找的原因就不对。那么这样的结果是没有什么意义的，或者说是意义不大的。那么检验对于我们确认结果非常的重要，也是评价我们的结果是否拥有价值的关键因素。所以要做统计检验。

t 检验，t检验主要是检验单个ols估计值或者说是参数估计值的显著性，什么是显著性？也就是给定一个容忍程度，一个我们可以犯错误的限度，错误分为两类：1、本来是错的但是我们认为是对的。2、本来是对的我们认为是错的。统计的检验主要是针对第一种错误而言的。一般的计量经济学中的这个容忍程度是 5%，也就是说可以容忍我们范第一类错误的概率是5%。这样说不准确，但是比较好理解。t-stastic是类似标准正态化的正态分布两一样，也就是估计值减去假设值除以估计值得标准差，一般假设值是0，这一点不难理解，如果是0 ，那么也就意味着没有因果关系。这个t-static在经典假设之下服从t分布。t

分布一般是和正态分布差不多，尤其是当样本的量足够大的时候，一般的经验认为在样本数量大于120的时候，就可以看成是正态分布的。

F-statistc：F检验是属于联合检验比较重要的一种，主要的目的是用于对于一系列的原因的是否会产生结果这样一个命题做出的检验。F统计量主要的产生来源是SSR\SST\SSE三个量。但是这个检验有一个缺点是必须在经典假设之下才能有效。

LM 检验：这个检验的性质和F检验的性质是一样的，都是检验联合显著性的，不同的是F统计量符合F分布，但是LM统计量服从卡方分布。卡方分布是正态分布的变量的平方和，而F分布是卡方分布的商，并且分子和分布必须独立，这就是为什么F检验适用范围受限的原因。LM=n*SSR、或者是LM=n-SSR。

至于其他的White检验、Brusch-pagan检验（异方差的检验方法）、还有序列相关的t检验、DW检验基本原来是相同的。

关于异方差检验、序列相关的检验其中存在不同的地方，但是思想基本是相同的。

关于异方差检验的讨论：

1、Brusch-pagan检验：这个检验的思路比较简单，主要是要研究残查和X之间的关系，给定这样的一个方程：u=b0+b1*x1+……+bn*xn+u'的回归，其中进行F检验和LM检验。如果检验通过那么不存在异方差，如果不通过那么存在异方差。

2、 White检验：这个检验也是对异方差的检验，但是这个检验不同的是不仅对于X的一次方进行回归，而且考虑到残查和x的平方还有Xi*Xj 之间的关系。给定如下方程：u=b0+b1*y+b2*y^2+u'。也是用F和LM 联合检验来检验显著性。如果通过那么不存在异方差，否则存在。

序列相关的检验方法的讨论：

对于时间序列的问需要知道一个东西，也就是一介自回归过程，也就是一般在教科书中说到的：AR(1)过程，其中的道理主要是说在当期的变量主要是取决于过去一个时期的变量和一个随机误差项。表示如下：Ut=p*U(t-1)+et。在这里我要说到几个概念问题，I(1)（一阶积整）、I(0)（零阶积整）。其中的一介自回归过程AR(1)就属于零阶积整过程，而一阶积整过程实际上是随机游动和飘移的随机游动过程。随机游动过

程：Ut=U(t-1)+et。也就是在AR(1)的过程之下，其中的P是等于1的。飘移的随机游动过程：Ut=a+U(t-1)+et。其中随机游动过程和AR(1)过程中的不同点在于一个弱相依性的强弱问题，实际上我们在时间序列问题中，我们可以认为任何一个过程是弱相依的，但是问题的关键是我们不知道到底有多弱？或者更加直观地说，我们想知道P到底是多大，如果P是0.9或者是一个比较接近于1得数，那么可能我们可以认为这个时间序列有高度持久性，这个概念表示当期的变量却绝于一个很早的时期的变量，比如一阶积整过程，实际上et是一个独立统分布的变量，而且条件数学期望等于0，没有异方差性。那么实际上这个序列的数学期望是和期数没有什么关系的。那么也就意味着从第0期开始，U的数学期望值就是和很久以后的U的数学期望值一样的。但是方差就不同了，方差随着时间的增加不断扩大。我们知道了，这种不同的概念就可以讨论在一阶自回归的条件之下的检验问题，但是我们说一介自回归的过程是参差序列的特征而已，其他的变量的特征问题我们不谈。

在讨论检验的问题以前，我有必要交待一下时间序列在ols估计的时候我们应该注意什么。实际上解决序列自相关问题最主要的问题就是一个差分的方法。因为如果是长期持久的序列或者是不是长期持久的序列，那么一定的差分就可以解除这种问题。

1、 t检验。如果我们知道这个变量是一个一介自回归的过程，如果我们知道自回归过程是AR(1)的。那么我们就可以这样作，首先我们做OLS 估计，得到的参差序列我们认为是一阶自相关的。那么为了验证这种情况，那么我们可以做Ut和U(t-1)的回归，当然这里可以包含一个截距项。那么我们验证其中的参数的估计是不是显著的，就用t检验。

t检验与F检验有什么区别

1.检验有单样本t检验，配对t检验和两样本t检验。

单样本t检验：是用样本均数代表的未知总体均数和已知总体均数进行比较，来观察此组样本与总体的差异性。

配对t检验：是采用配对设计方法观察以下几种情形，

1，两个同质受试对象分别接受两种不同的处理；

2,同一受试对象接受两种不同的处理；

3，同一受试对象处理前后。

F 检验又叫方差齐性检验。在两样本t检验中要用到F检验。从两研究总体中随机抽取样本，要对这两个样本进行比较的时候，首先要判断两总体方差是否相同，即方差齐性。若两总体方差相等，则直接用t检验，若不等，可采用t'检验或变量变换或秩和检验等方法。其中要判断两总体方差是否相等，就可以用F检验。

2.t检验和方差分析的前提条件及应用误区用于比较均值的t检验可以分成三类，

第一类是针对单组设计定量资料的；

第二类是针对配对设计定量资料的；

第三类则是针对成组设计定量资料的。

后两种设计类型的区别在于事先是否将两组研究对象按照某一个或几个方面的特征相似配成对子。无论哪种类型的t检验，都必须在满足特定的前提条件下应用才是合理的。

若是单组设计，必须给出一个标准值或总体均值，同时，提供一组定量的观测结果，应用t检验的前提条件就是该组资料必须服从正态分布；若是配对设计，每对数据的差值必须服从正态分布；

若是成组设计，个体之间相互独立，两组资料均取自正态分布的总体，并满足方差齐性。

之所以需要这些前提条件，是因为必须在这样的前提下所计算出的t统计量才服从t分布，而t检验正是以t分布作为其理论依据的检验方法。值得注意的是，方差分析与成组设计t检验的前提条件是相同的，即正态性和方差齐性。

t 检验是目前医学研究中使用频率最高，医学论文中最常见到的处理定量资料的假设检验方法。t检验得到如此广泛的应用，究其原因，不外乎以下几点：现有的医学期刊多在统计学方面作出了要求，研究结论需要统计学支持；传统的医学统计教学都把t检验作为假设检验的入门方法进行介绍，使之成为广大医学研究人员最熟悉的方法；t检验方法简单，其结果便于解释。简单、熟悉加上外界的要求，促成了t检验的流行。但是，由于某些人对该方法理解得不全面，导致在应用过程中出现不少问题，有些甚至是非常严重的错误，直接影响到结论的可靠性。将这些问题归类，可大致概括为以下两种情况：

不考虑t检验的应用前提，对两组的比较一律用t检验；

将各种实验设计类型一律视为多个单因素两水平设计，多次用t检验进行均值之间的两两比较。

以上两种情况，均不同程度地增加了得出错误结论的风险。而且，在实验因素的个数大于等于2时，无法研究实验因素之间的交互作用的大小。

u检验和t检验区别与联系

u 检验和t检验可用于样本均数与总体均数的比较以及两样本均数的比较。理论上要求样本来自正态分布总体。但在实用时，只要样本例数n较大，或n小但总体标准差σ已知时，就可应用u检验；n小且总体标准差σ未知时，可应用t 检验，但要求样本来自正态分布总体。两样本均数比较时还要求两总体方差相等。

一、样本均数与总体均数比较

比较的目的是推断样本所代表的未知总体均数μ与已知总体均数μ0有无差别。通常把理论值、标准值或经大量调查所得的稳定值作为μ0.根据样本例数n大小和总体标准差σ是否已知选用u检验或t 检验。

（一）u检验用于σ已知或σ未知但n足够大[用样本标准差s作为σ的估计值，代入式（19.6）]时。

以算得的统计量u，按表19-3所示关系作判断。

表19-3 u值、P值与统计结论

α｜t｜值P值统计结论

0.05双侧

单侧

＜1.96

＜1.645

＞0.05 不拒绝H0，差别无统计学意义

0.05双侧

单侧

≥1.96

≥1.645

≤0.05拒绝H0，接受H1，差别有统计学意义

0.01双侧

单侧≥2.58

≥2.33

≤0.01拒绝H0，接受H1，差别有高度统计学意义

例19.3根据大量调查，已知健康成年男子脉搏均数为72次/分，标准差为6.0次/分。某医生在山区随机抽查25名健康成年男子，求得其脉搏均数为74.2次/分，能否据此认为山区成年男子的脉搏高于一般？

据题意，可把大量调查所得的均数72次/分与标准差6.0次/分看作为总体均数μ0和总体标准差σ，样本均数x为74.2次/分，样本例数n为25.

H0：μ=μ0

H1：μ＞μ0

α=0.05（单侧检验）

算得的统计量u=1.833＞1.645，P＜0.05，按α=0.05检验水准拒绝H0，可认为该山区健康成年男子的脉搏高于一般。

（二）t检验用于σ未知且n较小时。

以算得的统计量t，按表19-4所示关系作判断。

表19-4 ｜t｜值、P值与统计结论

α｜t｜值P值统计结论

0.05 ＜t0.05（v）＜0.05 不拒绝H0，差别无统计学意义

0.05 ≥t0.05（v）≤0.05拒绝H0，接受H1，差别有统计学意义

0.01 ≥t0.01（v）≤0.01拒绝H0，接受H1，差别有高度统计学意义

例19.4 若例19.3中总体标准差σ未知，但样本标准差已求出，s=6.5次/分，余数据同例19.3.

据题意，与例19.3不同之处在于σ未知，可用t检验。

H0：μ=μ0

H1：μ＞μ0

α=0.05（单侧检验）

本例自由度v=25-1=24，查t界值表（单侧）（附表19-1）得t0.05（24）=1.711.算得的统计量t=1.692＜1.711，P＞0.05，按α=0.05检验水准不拒绝H0，尚不能认为该山区成年男子的脉搏高于一般。

二、配对资料的比较

在医学研究中，常用配对设计。配对设计主要有四种情况：①同一受试对象处理前后的数据；②同一受试对象两个部位的数据；③同一样品用两种方法（仪器等）检验的结果；④配对的两个受试对象分别接受两种处理后的数据。情况①的目的是推断其处理有无作用；情况②、③、④的目的是推断两种处理（方法等）的结果有无差别。

公式（19.8）

式中，0为差数年总体均数，因为假设处理前后或两法无差别，则其差数的均数应为0，d为一组成对数据之差d（简称差数）的均数，其计算公式同式（18.1）；Sd为差数均数的标准误，sd为差数年的标准差，计算公式同式（18.3）；n为对子数。

因计算的统计量是t，按表19-4所示关系作判断。

例19.5 应用某药治疗9例高血压病人，治疗前后舒张压如表19-5，试问用药前后舒张压有无变化？

表19-5 高血压病人用某药治疗前后的舒张压（kPa）

病人编号治疗前治疗后差数d D2

1 12.8 11.7 1.0 1.21

2 13.1 13.1 0.0 0.00

3 14.9 14.

4 0.

5 0.25

4 14.4 13.6 0.8 0.64

5 13.

6 13.1 0.5 0.25

6 13.1 13.3 -0.2 0.04

7 13.3 12.8 0.5 0.25

8 14.1 13.6 0.5 0.25

9 13.3 12.3 1.0 1.00

合计 4.7 3.89

H0：该药治疗前后的舒张压无变化，即μd=0

H1：该药治疗前后的舒张压有变化，即μd≠0

α=0.05

自由度v=n-1=8，查t界值表得t0.05（8）=2.306，t0.01（8）=3.355，本例t=3.714＞t0.01（8），P＜0.01，按α=0.05检验水准拒绝H0，接受H1，可认为治疗前后舒张压有变化，即该药有降压作用。

三、完全随机设计的两样本均数的比较

亦称成组比较。目的是推断两样本各自代表的总体均数μ1与μ2是否相等。根据样本含量n的大小，分u检验与t检验。

（一）u检验可用于两样本含量n1、n2、均足够大时，如均大于50或100.

公式（19.9）

算得的统计量为u 值，按表19-3所示关系作出判断。

例19.6某地抽样调查了部分健康成人红细胞数，其中男性360人，均数为

4.660×1012/L，标准差为0.575×1012/L；女性255人，均数为4.178×1012/L，标准差为0.291×1012/L，试问该地男、女红细胞数的均数有无差别？

H0：μ=μ0

H1：μ≠μ0

α=0.05

今x1=4.660×1012/L，s1=0.575×1012/L，n1=360；

x2=4.1781012/L，s2=0.2911012/L，n2=255.

算得的u=13.63＞2.58，P＜0.01，按α=0.05检验水准拒绝H0，接受H1，可认为该地男女红细胞数的均数不同，男性高于女性。

（二）t检验可用于两样本含量n1、n2较小时，且要求两总体方差相等，即方差齐（homoscedasticity）。若被检验的两样本方差相差较大且差别有统计学意义则需用t检验。

公式（19.10）

公式（19.11）

公式（19.12）

式中sx1－x2，为两样本均数之差的标准误，s2c为合并估计方差（combined estimate variance）。算得的统计量为t，按表19-4所示关系作出判断。

例19.7某医生统广西瑶族和侗族正常妇女骨盆X线测量资料各50例。骨盆入口前后径：瑶族的均数为12.002（cm），标准差0.948（cm），侗族相应的为11.456（cm）和1.215（cm）。问两族妇女的骨盆入口前后径是否有差别？

H0：μ1=μ2

H1：μ1≠μ2

α=0.05

已知n1=n2=50， x1=12.002（cm），s1=0.948（cm）；

x2=11.456（cm），s2=1.215（cm）。

本例自由度v =n1+n2-2=98，查t界值表[表内自由度一栏无98，可用内插法（从略）或用v =100估计].T0.05（100）=1948，t0.01（100）=2.626，今t=2.505＞t0.05（1000，P＜0.05，按α=0.05检验水准拒绝H0，接受H1，可认为广西瑶族和侗族妇女骨盆入口前后径不同，前者大于后者。

四、完全随机设计的两样本几何均数比较

医学上有些资料为等比资料或正态分布资料，宜用几何均数表示其平均水平。比较两样本几何均数的目的是推断它们分别代表的总体几何均数是否相等。此种情况下，应先把原始数据X进行对数变换，用变换后的数据代入式（19.10）、（19.11）、（19.12）计算t值。

例19.8 将20名钩端螺旋体病人的血清随机分为两组，分别用标准株或水生株作凝溶试验，测得稀释倍数如下，问两组的平均效价有无差别？

X1：标准株（11人）100，200，400，400，400，400，800，1600，1600，1600，3200

X2：水生珠（9人）100，100，100，200，200，200，200，400，400

H0：μ1=μ2

H1：μ1≠μ2

α=0.05

将两组数据分别取对数，以对数作为新变量X1和X2.

X1：2.000，2.301，2.602，2.602，2.602，2.602，2.903，3.204，3.204，3.204，3.505

X2： 2.000，2.000，2.000，2.301，2.301，2.301，2.301，2.602，2.602

用变换后的数据计算 x1，s12；x2，s22再代入式（19.10）、（19.11）、（19.12）计算t值。

x1=2.794，s12=0.2043；x2=2.268，s22=0.0554

自由度v=11+9-2=18，查t界值表得t0.01（18）=2.878，今t=3.150＞2.878，P＜0.01，按α=0.05检验水准拒绝H0，接受H1，可认为两组平均效价不同，标准株高于水生株。

https://www.360docs.net/doc/e917646396.html,/?????/blog/item/54edcd02c2f4ea23b1351dda.html 方差分析与两样本T检验区别

定义假设检验就是用来判断样本与样本,样本与总体的差异就是由抽样误差引起还就是本质差别造成的统计推断方法。其基本原理就是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还就是接受作出推断。基本原理 (1)先假设总体某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。 (2)它又不同于一般的反证法。所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而就是基于小概率原理:概率很小的事件在一次试验中几乎就是不可能发生的,若发生了,就就是不合理的。至于怎样才算就是“小概率”呢？通常可将概率不超过0、05的事件称为“小概率事件”,也可视具体情形而取0、1或0、01等。在假设检验中常记这个概率为α,称为显著性水平。而把原先设定的假设成为原假设,记作H0。把与H0相反的假设称为备择假设,它就是原假设被拒绝时而应接受的假设,记作H1。假设的形式 H0——原假设, H1——备择假设双侧检验:H0:μ = μ0 , 单侧检验: ,H1:μ < μ0 或, H1:μ > μ0假设检验就就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。假设检验的种类下面介绍几种常见的假设检验 1、T检验亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。目的:比较样本均数所代表的未知总体均数μ与已知总体均数μ0。计算公式:统计量: 自由度:v=n - 1 适用条件: (1) 已知一个总体均数; (2) 可得到一个样本均数及该样本标准误; (3) 样本来自正态或近似正态总体。 T检验的步骤 1、建立虚无假设H0:μ1= μ2,即先假定两个总体平均数之间没有显著差异; 2、计算统计量T值,对于不同类型的问题选用不同的统计量计算方法; 1)如果要评断一个总体中的小样本平均数与总体平均值之间的差异程度,其统计量T值

医学统计学检验方法(转) 医学论文中统计方法的正确应用医用统计方法是医学科研和论文撰写的一个基本工具，但是不少医学科研及临床工作者对统计方法的正确应用缺乏足够的知识，在实际应用过程中常常出现一些不妥用法甚至误用现象。正确使用统计方法，能使研究结果具有科学性和说服力;反之，如果使用不当，不仅不能准确地反映科研结果，而且可能带来错误的结论。 1、所选统计方法脱离了资料的性质不同的资料类型和不同的研究目的采用不同的统计方法。按照资料的性质测定指标的多少，确定资料是计数资料还是计量资料，应用单因素分析还是多因素分析。 1.1 多因素资料是对每个研究对象测量的多个指标同时进行的综合分析，其分析计算过程相对复杂。常用的有回归分析;相关分析以及判别分析、聚类分析、主成分分析和因子分析等。多因素分析多用于计量资料。 1.2 单因素分析应用较多，按获取资料的方法，分计数资料和计量资料。首先，计数资料主要是针对要求某现象的频率和比例，利用率或比的相应计算方法。如做不同样本间的比较则采用计数资料的显著性检验，样本率与总体率的比较用u 检验;两个样本率的比较可用u 检验或四格表的x 检验，多个样本率的比较可用行乘列的卡方检验或2XC 表的卡方检验。其次，计量资料要结合研究目的确定相应的统计方法。对于显著性检验通常有T 检验和F 检验，T 检验是用于两个均数问的比较，按研究设计与比较内容的不同又分为样本均数和总体均数的比较，两个样本均数差别的检验，配对资料的显著性检验。F 检验用于多个样本均数的比较，按设计类型分完全随机设计的方差分析、随机区组设计的方差分析和组内分组资料的方差分析。 2、根据研究目的选用统计分析方法不同的统计方法说明不同的问题，同样不同的问题要应用不同的统计方法来分析和表达。研究者在做统计分析前，首先要明确资料分析的目的、意图是什么，通过分析最终达到什么样的期望，临床工作者科研通常的目的主要有: 2.1 某现象发生的频率或比例如人群中重复癌的发生率，采用频率指标，构成指标或相对比，可计算发病、患病、感染、阳性频率或构成等。

医学统计学检验方法（转）医学论文中统计方法的正确应用医用统计方法是医学科研和论文撰写的一个基本工具，但是不少医学科研及临床工作者对统计方法的正确应用缺乏足够的知识，在实际应用过程中常常出现一些不妥用法甚至误用现象。正确使用统计方法，能使研究结果具有科学性和说服力;反之，如果使用不当，不仅不能准确地反映科研结果，而且可能带来错误的结论。 1、所选统计方法脱离了资料的性质不同的资料类型和不同的研究目的采用不同的统计方法。按照资料的性质测定指标的多少，确定资料是计数资料还是计量资料，应用单因素分析还是多因素分析。 1.1多因素资料是对每个研究对象测量的多个指标同时进行的综合分析，其分析计算过程相对复杂。常用的有回归分析；相关分析以及判别分析、聚类分析、主成分分析和因子分析等。多因素分析多用于计量资料。 1.2单因素分析应用较多，按获取资料的方法，分计数资料和计量资料。首先，计数资料主要是针对要求某现象的频率和比例，利用率或比的相应计算方法。如做不同样本间的比较则采用计数资料的显著性检验，样本率与总体率的比较用 u检验;两个样本率的比较可用u检验或四格表的x检验，多个样本率的比较可用行乘列的卡方检验或2XC表的卡方检验。其次，计量资料要结合研究目的确定相应的统计方法。对于显著性检验通常有T检验和F检验，T检验是用于两个均数问的比较，按研究设计与比较内容的不同又分为样本均数和总体均数的比较，两个样本均数差别的检验，配对资料的显著性检验。F检验用于多个样本均数的比较，按设计类型分完全随机设计的方差分析、随机区组设计的方差分析和组内分组资料的方差分析。 2、根据研究目的选用统计分析方法不同的统计方法说明不同的问题，同样不同的问题要应用不同的统计方法来分析和表达。研究者在做统计分析前，首先要明确资料分析的目的、意图是什么，通过分析最终达到什么样的期望，临床工作者科研通常的目的主要有： 2.1某现象发生的频率或比例如人群中重复癌的发生率，采用频率指标，构成指标或相对比，可计算发病、患病、感染、阳性频率或构成等。

统计中经常会用到各种检验，如何知道何时用什么检验呢，根据结合自己的工作来说一说： t检验有单样本t检验，配对t检验和两样本t检验。单样本t检验：是用样本均数代表的未知总体均数和已知总体均数进行比较，来观察此组样本与总体的差异性。配对t检验：是采用配对设计方法观察以下几种情形，1，两个同质受试对象分别接受两种不同的处理；2,同一受试对象接受两种不同的处理；3，同一受试对象处理前后。 u检验：t检验和就是统计量为t,u的假设检验，两者均是常见的假设检验方法。当样本含量n较大时，样本均数符合正态分布，故可用u检验进行分析。当样本含量n小时，若观察值x符合正态分布，则用t检验（因此时样本均数符合t 分布），当x为未知分布时应采用秩和检验。F检验又叫方差齐性检验。在两样本t检验中要用到F检验。从两研究总体中随机抽取样本，要对这两个样本进行比较的时候，首先要判断两总体方差是否相同，即方差齐性。若两总体方差相等，则直接用t检验，若不等，可采用t'检验或变量变换或秩和检验等方法。其中要判断两总体方差是否相等，就可以用F检验。简单的说就是检验两个样本的方差是否有显著性差异这是选择何种T检验（等方差双样本检验，异方差双样本检验）的前提条件。在t检验中，如果是比较大于小于之类的就用单侧检验，等于之类的问题就用双侧检验。卡方检验是对两个或两个以上率（构成比）进行比较的统计方法，在临床和医学实验中应用十分广泛，特别是临床科研中许多资料是记数资料，就需要用到卡方检验。方差分析用方差分析比较多个样本均数,可有效地控制第一类错误。方差分析(analysis of variance,ANOVA)由英国统计学家，以F命名其统计量，故方差分析又称F检验。其目的是推断两组或多组资料的总体均数是否相同，检验两个或多个样本均数的差异是否有统计学意义。我们要学习的主要内容包括单因素方差分析即完全随机设计或成组设计的方差分析（one-way ANOVA）：用途：用于完全随机设计的多个样本均数间的比较，其统计推断是推断各样本所代表的各总体均数是否相等。完全随机设计（completely random design）不考虑个体差异的影响，仅涉及一个处理因素，但可以有两个或多个水平，所以亦称单因素实验设计。在实验研究中按随机化原则将受试对象随机分配到一个处理因素的多个水平中去，然后观察各组的试验效应；在观察研究（调查）中按某个研究因素的不同水平分组，比较该因素的效应。两因素方差分析即配伍组设计的方差分析（two-way ANOVA）：用途：用于随机区组设计的多个样本均数比较，其统计推断是推断各样本所代表的各总体均数是否相等。随机区组设计考虑了个体差异的影响，可分析处理因素和个体差异对实验效应的影响，所以又称两因素实验设计，比完全随机设计的检验效率高。该设计是将受试对象先按配比条件配成配伍组（如动物实验时，可按同窝别、同性别、体重相近进行配伍），每个配伍组有三个或三个以上受试对象，再按随机化原则分别将各配伍组中的受试对象分配到各个处理组。值得注意的是，同一受试对象不同时间（或部位）重复多次测量所得到的资料称为重复测量数据

统计分析方法总结分享胡斌 00:06分享，并说：统计 1.连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布，（1）可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验；（2）采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐，（1）采用Satterthwate 的t’检验；（2）采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布，采用配对t检验。 1.2.2 两组差值不服从正态分布，采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布，且各组方差齐性，直接采用完全随机的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有LSD检验，Bonferroni法，tukey法，Scheffe法，SNK法等。 1.3.2资料不符合正态分布，或各组方差不齐，则采用非参数检验的Kruscal－Wallis法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用Bonferroni法校正P值，然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布，且各组方差齐性，直接采用随机区组的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有LSD检验，Bonferroni法，tukey法，Scheffe法，SNK法等。 1.4.2资料不符合正态分布，或各组方差不齐，则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用Bonferroni 法校正P值，然后用符号配对的Wilcoxon检验。 ****需要注意的问题：（1）一般来说，如果是大样本，比如各组例数大于50，可以不作正态性检验，直接采用t检验或方差分析。因为统计学上有中心极限定理，假定大样本是服从正态分布的。（2）当进行多组比较时，最容易犯的错误是仅比较其中的两组，而不顾其他组，这样作容易增大犯假阳性错误的概率。正确的做法应该是，先作总的各组间的比较，如果总的来说差别有统计学意义，然后才能作其中任意两组的比较，这些两两比较有特定的统计方法，如上面提到的LSD检验，Bonferroni法，tukey 法，Scheffe法，SNK法等。**绝不能对其中的两组直接采用t检验，这样即使得出结果也未必正确** （3）关于常用的设计方法：多组资料尽管最终分析都是采用方差分析，但不同设计会有差别。常用的设计如完全随即设计，随机区组设计，析因设计，裂区设计，嵌套设计等。 2．分类资料

统计分析的八种方法统计分析的八种方法一、指标对比分析法指标对比分析法，又称比较分析法，是统计分析中最常用的方法。是通过有关的指标对比来反映事物数量上差异和变化的方法。有比较才能鉴别。单独看一些指标，只能说明总体的某些数量特征，得不出什么结论性的认识；一经过比较，如与国外、外单位比，与历史数据比，与计划相比，就可以对规模大小、水平高低、速度快慢作出判断和评价。指标分析对比分析方法可分为静态比较和动态比较分析。静态比较是同一时间条件下不同总体指标比较，如不同部门、不同地区、不同国家的比较，也叫横向比较；动态比较是同一总体条件不同时期指标数值的比较，也叫纵向比较。这两种方法既可单独使用，也可结合使用。进行对比分析时，可以单独使用总量指标或相对指标或平均指标，也可将它们结合起来进行对比。比较的结果可用相对数，如百分数、倍数、系数等，也可用相差的绝对数和相关的百分点（每1％为一个百分点）来表示，即将对比的指标相减。二、分组分析法指标对比分析法是总体上的对比，但组成统计总体的各单位具有多种特征，这就使得在同一总体范围内的各单位之间产生了许多差别，统计分析不仅要对总体数量特征和数量关系进行分析，还要深入总体的内部进行分组分析。分组分析法就是根据统计分析的目的要求，把所研究的总体按照一个或者几个标志划分为若干个部分，加以整理，进行观察、分析，以揭示其内在的联系和规律性。统计分组法的关键问题在于正确选择分组标值和划分各组界限。三、时间数列及动态分析法时间数列。是将同一指标在时间上变化和发展的一系列数值，按时间先后顺序排列，就形成时间数列，又称动态数列。它能反映社会经济现象的发展变动情况，通过时间数列的编制和分析，可以找出动态变化规律，为预测未来的发展趋势提供依据。时间数列可分为绝对数时间数列、相对数时间数列、平均数时间数列。时间数列速度指标。根据绝对数时间数列可以计算的速度指标：有发展速度、增长速度、平均发展速度、平均增长速度。动态分析法。在统计分析中，如果只有孤立的一个时期指标值，是很难作出判断的。如果编制了时间数列，就可以进行动态分析，反映其发展水平和速度的变化规律。进行动态分析，要注意数列中各个指标具有的可比性。总体范围、指标计算方法、计算价格和计量单位，都应该前后一致。时间间隔一般也要一致，但也可以根据研究目的，采取不同的间隔期，如按历史时期分。为了消除时间间隔期不同而产生的指标数值不可比，可采用年平均数和年平均发展速度来编制动态数列。此外在统计上，许多综合指标是采用价值形态来反映实物总量，如国内生产总值、工业总产值、社会商品零售总额等计算不同年份的发展速度时，必须消除价格变动因素的影响，才能正确的反映实物量的变化。

试卷2 一、单选题 1．统计学的基本方法包括有( ) ①调查方法、整理方法、分析方法、预测方法 ②调查方法、汇总方法、预测方法、实验设计 ③相对数法、平均数法、指数法、汇总法 ④实验设计、大量观察、统计描述、统计推断 2．要了解某市国有工业企业生产设备情况，则统计总体是( ) ①该市国有的全部工业企业 ②该市国有的每一个工业企业 ③该市国有的某一台设备 ④该市国有制工业企业的全部生产设备 3．有意识地选择三个农村点调查农民收入情况，这种调查方式属于（） ①典型调查②重点调查③抽样调查④普查 4．2000年11月1日零点的第五次全国人口普查是（） ①典型调查②重点调查③一次性调查④经常性调查 5．将不同地区、部门、单位之间同类指标进行对比所得的综合指标称为（） ①动态相对指标②结构相对指标 ③比例相对指标④比较相对指标 6．一个企业产品销售收入计划增长8％，实际增长20％，则计划超额完成程度为（） ①12％②150％③111.11％④11.11％ 7．众数是总体中下列哪项的标志值（） ①位置居中②数值最大 ③出现次数较多④出现次数最多 8．某工厂新工人月工资400元，工资总额为200000元，老工人月工资800元，工资总额80000元，则平均工资为（） ①600元②533.33元③466.67元④500元 9．抽样调查和重点调查的主要区别是（） ①选取调查单位的方式不同②调查的目的不同 ③调查的单位不同④两种调查没有本质区别 10．若销售量增加，销售额持平，则物价指数( ) ①降低②增长③不变④趋势无法确定二、多选题 1．某企业是总体单位，数量标志有( ) ①所有制②职工人数③月平均工资 ④年工资总额⑤产品合格率 2．相对指标数值的表现形式有（） ①比例数②无名数③结构数④抽样数⑤复名数 3．在直线相关和回归分析中（） ①据同一资料，相关系数只能计算一个 ②据同一资料，相关系数可以计算两个 ③据同一资料，回归方程只能配合一个 ④据同一资料，回归方程随自变量与因变量的确定不同，可能配合两个

问卷调查的常用统计分析方法问卷调查的方法用得很广泛，对于没有接触过spss的人第一步面临的就是问卷编码问题，有很多外专业的同学都在问这个问题，现在通过举例的方法详细讲解如下，以方便第一次接触SPSS 的同学也能做简单的分析。后面还有分析时的操作步骤，以及比较适用的深入统计分析方法的简单介绍。调查分析问卷回收，在经过核实和清理后就要用SPSS做数据分析，首先的第一步就是把问题编码录入。 SPSS的问卷分析中一份问卷是一个案，首先要根据问卷问题的不同定义变量。定义变量值得注意的两点：一区分变量的度量，Measure的值，其中Scale是定量、Ordinal是定序、Nominal 是指定类；二注意定义不同的数据类型Type 各色各样的问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型，他们的变量的定义和处理的方法各有不同，我们详细举例介绍如下：问卷调查的方法用得很广泛，对于没有接触过spss的人第一步面临的就是问卷编码问题，有很多外专业的同学都在问这个问题，现在通过举例的方法详细讲解如下，以方便第一次接触SPSS的同学也能做简单的分析。后面还有分析时的操作步骤，

以及比较适用的深入统计分析方法的简单介绍。自己写的，错误之处请指正，调查分析问卷回收，在经过核实和清理后就要用SPSS做数据分析，首先的第一步就是把问题编码录入。 SPSS的问卷分析中一份问卷是一个案，首先要根据问卷问题的不同定义变量。定义变量值得注意的两点：一区分变量的度量，Measure的值，其中Scale是定量、Ordinal是定序、Nominal 是指定类；二注意定义不同的数据类型Type 各色各样的问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型，他们的变量的定义和处理的方法各有不同，我们详细举例介绍如下： 1 、单选题：答案只能有一个选项例一当前贵组织机构是否设有面向组织的职业生涯规划系统？ A有 B 正在开创C没有D曾经有过但已中断编码：只定义一个变量，Value值1、2、3、4分别代表A、B、C、D 四个选项。

1、两组数据中的每个变量值减去同一常数后做两个样本均数差异的t检验（） *c ? A.t值变小 ? B.t值变大 ? C.t值不变 ? D.t值变小或变大 2、作单组样本均数与一个已知的总体均数比较的t检验时，正确的理解是（） *c ? A.A.统计量t越大，说明两总体均数差别越大 ? B.B.统计量t越大，说明两总体均数差别越小 ? C.C.统计量t越大，越有理由认为两总体均数不相等 ? D.D.P值就是αa 3、随机区组设计的方差分析用于（） * ? A.多个样本均数间的两两比较 ? B.比较各个区组间的样本均数有无差别 ? C.比较各个区组间的总体均数有无差别 ? D.比较各个处理组间的样本均数有无差别 4、各组数据方差不齐时，可以做（） *D ? A.近似检验 ? B.秩和检验 ? C.数据转换 ? D.ABC均可 5、第I类错误的概念是（） *D ? A.H0是不对的，统计检验结果未拒绝H0 ? B.H0是对的，统计检验的结果未拒绝H0 ? C.H0是不对的，统计检验结果拒绝H0 ?

6、下列哪种说法是错误的（） *B ? A.计算相对数尤其是率时应有足够数量的观察单位数或观察次数 ? B.分析大样本数据时可以构成代替率 ? C.应分别将分子和分母合计求合计率或平均率 ? D.相对数的比较应注意其可比性 7、配对计量资料进行假设检验时（） *Dd ? A.仅能用配对t检验 ? B.仅能用成组t检验 ? C.仅能用随机区组设计的方差分析 ? D.用配比t检验和随机区组设计的方差分析均可 8、方差分析的前提条件是（） *A ? A.计量资料非参数统计的 ? B.正态性 ? C.随机性 ? D.方差齐性 9、设配对设计资料的变量为X1与X2，则配对设计的符号的秩检验（） *B ? A.把X1与X2的差数军队之从小到大编秩，排好后秩次保持原差数的正负号 ? B.把X1与X2的差数绝对值从小到大编秩，秩次不保存正负号 ? C.把X1与X2综合按绝对值从小到大编秩 ? D.把X1与X2的差数从小到大编秩 10、对于配对t检验和成组t检验，下列哪一种说法是错误的（） *B ? A.对于配对设计资料应作配对t检验，如果作成组t检验，不但不合理，而且平均起来统计效率降低 ? B.成组设计的资料用配对t检验，不但合理，而且平均起来可以提高统计效率 ? C.成组设计的资料，无法用配对t配对t检验 ?

正确答案错误答案 1.从同一总体抽样,则样本标准差（） A随着样本含量增大而增大 B样本含量增大而标准差不变 C随着样本含量减少而减少 D随着样本含量增大而减小 2.用图表示某地区近30年三种疾病的发病率，在各年度的动态发展速度情况,宜绘制（） A普通线性图 B.直方图 C.百分条图 D.半对数线图。 3.均数与标准误的关系（） A.均数越大,标准误越大 B.均数越大,标准误越小 C标准误越小，用均数推测总体均数的可靠性越大。 E标准误越大，用均数推测总体均数的可靠性越大。 4.多重线性回归分析中，度量一组自变量与应变量线性相关程度的统计量是() A.负相关系数 B.决定系数 C.偏相关系数 D.偏回归系数 5.变异系数cv的数值() A.一定大于1 B.一定小于1 C.可以大于1，也可以小于1 D.一定小于标准差。 6.在样本量为n，自变量个数为3的线性回归方程的假设检验中，回归变异和剩余变异的

自由度分别为（） A. 3和n-3 B. 3和n-4 C. 2和n-2 D. 2和n-3 7.比较某地区解放以来三种病的发病率在各个年度的发展速度,应该绘制（） A.半对数线图 B.圆图 C.直方图 D.普通线图 8.在同一总体中随机抽取多个样本，用样本均数估计总体均数95%的可信区间，则估计精密度高的是（） A.均数小的样本 B.标准差小的样本 C.标准误大的样本 D.标准误小的样本 9.均数的标准误反映了（） A.个体的变异程度 B.集中趋势的位置 C.指标的分布规律 D.样本均数与总体均数的差异 10.由样本均数估计总体均数可靠性大小的指标是（） A.标准差 B.标准误 C.方差 D.变异系数 11.表示血清抗体滴度资料平均水平最常用的指标是（）

统计分析方法适用条件统计学方法一直以来都是我们专业的必修课，也是我们的基本功，可是现在滥用方法的人很多，现在总结一些前人的资料供大家参考学习！ 1.连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布，（1）可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验；（2）采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐，（1）采用Satterthwate 的t’检验；（2）采用非参数检验, 如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布，采用配对t检验。 1.2.2 两组差值不服从正态分布，采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布，且各组方差齐性，直接采用完全随机的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有LSD检验，Bonferroni 法，tukey法，Scheffe法，SNK法等。 1.3.2资料不符合正态分布，或各组方差不齐，则采用非参数检验的Kruscal－ Wallis法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用Bonferroni 法校正P值，然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布，且各组方差齐性，直接采用随机区组的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有LSD检验，Bonferroni 法，tukey法，Scheffe法，SNK法等。 1.4.2资料不符合正态分布，或各组方差不齐，则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用Bonferroni法校正P值，然后用符号配对的Wilcoxon检验。 ****需要注意的问题：

1.1多元回归 1、方法概述: 在研究变量之间的相互影响关系模型时候, 用到这类方法, 具体地说:其可以定量地描述某一现象和某些因素之间的函数关系,将各变量的已知值带入回归方程可以求出因变量的估计值,从而可以进行预测等相关研究。 2、分类分为两类:多元线性回归和非线性线性回归; 其中非线性回归可以通过一定的变化转化为线性回归, 比如:y=lnx 可以转化为 y=u u=lnx来解决;所以这里主要说明多元线性回归应该注意的问题。 3、注意事项在做回归的时候,一定要注意两件事: (1 回归方程的显著性检验(可以通过 sas 和 spss 来解决 (2 回归系数的显著性检验(可以通过 sas 和 spss 来解决检验是很多学生在建模中不注意的地方, 好的检验结果可以体现出你模型的优劣, 是完整论文的体现, 所以这点大家一定要注意。 4、使用步骤: (1根据已知条件的数据,通过预处理得出图像的大致趋势或者数据之间的大致关系; (2选取适当的回归方程; (3拟合回归参数; (4回归方程显著性检验及回归系数显著性检验 (5进行后继研究(如:预测等

这种模型的的特点是直观,容易理解。这体现在:动态聚类图可以很直观地体现出来! 当然,这只是直观的一个方面! 2、分类聚类有两种类型: (1 Q 型聚类:即对样本聚类; (2 R 型聚类:即对变量聚类; 聚类方法: (1 最短距离法 (2 最长距离法 (3 中间距离法 (4 重心法 (5 类平均法 (6 可变类平均法 (7 可变法 (8 利差平均和法在具体做题中,适当选取方法; 3、注意事项

在样本量比较大时,要得到聚类结果就显得不是很容易,这时需要根据背景知识和相关的其他方法辅助处理。还需要注意的是:如果总体样本的显著性差异不是特别大的时候,使用的时候也要注意! 4、方法步骤 (1首先把每个样本自成一类; 2选取适当的衡量标准,得到衡量矩阵,比如说:距离矩阵或相似性矩阵,找到矩阵中最小的元素,将该元素对应的两个类归为一类, (4重复第 2步,直到只剩下一个类; (4重复第 2步,直到只剩下一个类; 补充:聚类分析是一种无监督的分类,下面将介绍有监督的“分类” 。我简单说明下,无监督学习和有监督学习是什么无监督学习:发现的知识是未知的而有监督学习:发现的知识是已知的有监督学习是对一个已知模型做优化,而无监督学习是从数据中挖掘模型他们在分类中应用比较广泛 (非数值分类如果是数值分类就是预测了,这点要注意 1.3数据分类 1、方法概述

假设检验是用来判断样本与样本，样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设，然后通过抽样研究的统计推理，对此假设应该被拒绝还是接受作出推断。基本原理（1）先假设总体某项假设成立，计算其会导致什么结果产生。若导致不合理现象产生，则拒绝原先的假设。若并不导致不合理的现象产生，则不能拒绝原先假设，从而接受原先假设。（2）它又不同于一般的反证法。所谓不合理现象产生，并非指形式逻辑上的绝对矛盾，而是基于小概率原理：概率很小的事件在一次试验中几乎是不可能发生的，若发生了，就是不合理的。至于怎样才算是“小概率”呢通常可将概率不超过的事件称为“小概率事件”，也可视具体情形而取或等。在假设检验中常记这个概率为α，称为显著性水平。而把原先设定的假设成为原假设，记作H0。把与H0相反的假设称为备择假设，它是原假设被拒绝时而应接受的假设，记作H1。假设的形式 H0——原假设，H1——备择假设双侧检验：H0:μ = μ0，单侧检验：，H1:μ < μ0 或，H1:μ > μ0假设检验就是根据样本观察结果对原假设（H0）进行检验，接受H0，就否定H1；拒绝H0，就接受H1。假设检验的种类下面介绍几种常见的假设检验 1.T检验亦称student t检验（Student's t test），主要用于样本含量较小（例如n<30），总体标准差σ未知的正态分布资料。目的：比较样本均数所代表的未知总体均数μ和已知总体均数μ0。计算公式：统计量：自由度：v=n - 1 适用条件： (1) 已知一个总体均数； (2) 可得到一个样本均数及该样本标准误； (3) 样本来自正态或近似正态总体。 T检验的步骤 1、建立虚无假设H0:μ1= μ2，即先假定两个总体平均数之间没有显著差异； 2、计算统计量T值，对于不同类型的问题选用不同的统计量计算方法； 1）如果要评断一个总体中的小样本平均数与总体平均值之间的差异程度，其统计量T 值的计算公式为： 2）如果要评断两组样本平均数之间的差异程度，其统计量T值的计算公式为： 3、根据自由度df=n-1，查T值表，找出规定的T理论值并进行比较。理论值差异的显

大理大学实验报告课程名称生物医学统计分析实验名称非参数检验（卡方检验）专业班级姓名学号实验日期实验地点 2015—2016学年度第 2 学期

a. 不假定零假设。 b. 使用渐进标准误差假定零假设。分析：表11为LPA和FA两种检测结果的的一致性检验。Kappa值是内部一致性系数，除数据P值判断一致性有无统计学意义外，根据经验，Kappa≥0.75，表明两者一致性较好0.7>Kappa ≥0.4，表明一致性一般，Kappa<0.4，则表明一致性较差。本例Kappa值为0.680，P=0.000<0.01，拒绝无效假设，即认为两种检测方法结果存在一致性，Kappa值=0.680，0.7>Kappa≥0.4，表明一致性一般。例1 表12 周内日频数表观察数期望数残差 1 11 16.0 -5.0 2 19 16.0 3.0 3 17 16.0 1.0 4 1 5 16.0 -1.0 5 15 16.0 -1.0 6 16 16.0 .0 7 19 16.0 3.0 总数112 分析：表12结果显示一周内各日死亡的理论数（Expected）为16.0，即一周内各日死亡均数；还算出实际死亡数与理论死亡数的差值（Residual）。表13 检验统计量周日卡方 2.875a df 6 渐近显著性.824 a. 0 个单元 (.0%) 具有小于 5 的期望频率。单元最小期望频率为 16.0。分析：Chi-Square过程，调用此过程可对样本数据的分布进行卡方检验。卡方检验适用于配合度检验，主要用于分析实际频数与某理论频数是否相符。卡方值X2=2.875，自由度数（df）=6，P=0.824>0.05，差异不显著，即可认为一周内各日的死亡危险性是相同的。例2 表14 二项式检验类别N 观察比例检验比例精确显著性（双侧）性别组 1 0 12 .30 .50 .017 组 2 1 28 .70

统计分析的四种方法一、指标对比分析法，又称比较分析法，是统计分析中最常用的方法。是通过有关的指标对比来反映事物数量上差异和变化的方法。有比较才能鉴别。单独看一些指标，只能说明总体的某些数量特征，得不出什么结论性的认识；指标分析对比分析方法可分为静态比较和动态比较分析。静态比较是同一时间条件下不同总体指标比较，也叫横向比较；动态比较是同一总体条件不同时期指标数值的比较，也叫纵向比较。这两种方法既可单独使用，也可结合使用。进行对比分析时，可以单独使用总量指标或相对指标或平均指标，也可将它们结合起来进行对比。比较的结果可用相对数，如百分数、倍数、系数等，也可用相差的绝对数和相关的百分点（每1％为一个百分点）来表示，即将对比的指标相减。二、分组分析法指标对比分析法是总体上的对比，但组成统计总体的各单位具有多种特征，这就使得在同一总体范围内的各单位之间产生了许多差别，统计分析不仅要对总体数量特征和数量关系进行分析，还要深入总体的内部进行分组分析。分组分析法就是根据统计分析的目的要求，把所研究的总体按照一个或者几个标志划分为若干个部分，加以整理，进行观察、分析，以揭示其内在的联系和规律性。统计分组法的关键问题在于正确选择分组标值和划分各组界限。三、时间数列及动态分析法, 时间数列是将同一指标在时间上变化和发展的一系列数值，按时间先后顺序排列，就形成时间数列，又称动态数列。时间数列可分为绝对数时间数列、相对数时间数列、平均数时间数列。时间数列速度指标。根据绝对数时间数列可以计算的速度指标：有发展速度、增长速度、平均发展速度、平均增长速度。动态分析法。在统计分析中，如果只有孤立的一个时期指标值，是很难作出判断的。如果编制了时间数列，就可以进行动态分析，反映其发展水平和速度的变化规律。进行动态分析，要注意数列中各个指标具有的可比性。总体范围、指标计算方法、计算价格和计量单位，都应该前后一致。时间间隔一般也要一致，但也可以根据研究目的，采取不同的间隔期，如按历史时期分。四、指数分析法指数是指反映社会经济现象变动情况的相对数。有广义和狭义之分。根据指数所研究的范围不同可以有个体指数、类指数与总指数之分。用指数进行因素分析。因素分析就是将研究对象分解为各个因素，把研究对象的总体看成是各因素变动共同的结果，通过对各个因素的分析，对研究对象总变动中各项因素的影响程度进行测定。因素分析按其所研究的对象的统计指标不同可分为对总量指标的变动的因素分析，对平均指标变动的因素分析。

定义假设检验是用来判断样本与样本，样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设，然后通过抽样研究的统计推理，对此假设应该被拒绝还是接受作出推断。基本原理（1）先假设总体某项假设成立，计算其会导致什么结果产生。若导致不合理现象产生，则拒绝原先的假设。若并不导致不合理的现象产生，则不能拒绝原先假设，从而接受原先假设。（2）它又不同于一般的反证法。所谓不合理现象产生，并非指形式逻辑上的绝对矛盾，而是基于小概率原理：概率很小的事件在一次试验中几乎是不可能发生的，若发生了，就是不合理的。至于怎样才算是“小概率”呢？通常可将概率不超过0.05的事件称为“小概率事件”，也可视具体情形而取0.1或0.01等。在假设检验中常记这个概率为α，称为显著性水平。而把原先设定的假设成为原假设，记作H0。把与H0相反的假设称为备择假设，它是原假设被拒绝时而应接受的假设，记作H1。假设的形式 H0——原假设，H1——备择假设双侧检验：H0:μ = μ0，单侧检验：，H1:μ < μ0 或，H1:μ > μ0假设检验就是根据样本观察结果对原假设（H0）进行检验，接受H0，就否定H1；拒绝H0，就接受H1。假设检验的种类下面介绍几种常见的假设检验 1.T检验亦称student t检验（Student's t test），主要用于样本含量较小（例如n<30），总体标准差σ未知的正态分布资料。目的：比较样本均数所代表的未知总体均数μ和已知总体均数μ0。计算公式：统计量：自由度：v=n - 1 适用条件： (1) 已知一个总体均数； (2) 可得到一个样本均数及该样本标准误； (3) 样本来自正态或近似正态总体。 T检验的步骤 1、建立虚无假设H0:μ1= μ2，即先假定两个总体平均数之间没有显著差异； 2、计算统计量T值，对于不同类型的问题选用不同的统计量计算方法；

常用统计分析方法排列图因果图散布图直方图控制图控制图的重要性控制图原理控制图种类及选用统计质量控制是质量控制的基本方法，执行全面质量管理的基本手段，也是CAQ系统的基础，这里简要介绍制造企业应用最广的统计质量控制方法。常用统计分析方法与控制图获得有效的质量数据之后,就可以利用各种统计分析方法和控制图对质量数据进行加工处理,从中提取出有价值的信息成分。常用统计分析方法此处介绍的方法是生产现场经常使用,易于掌握的统计方法,包括排列图、因果图、散布图、直方图等。排列图排列图是找出影响产品质量主要因素的图表工具.它是由意大利经济学家巴洛特（Pareto)提出的.巴洛特发现人类经济领域中"少数人占有社会上的大部分财富,而绝大多数人处于贫困状况"的现象是一种相当普遍的社会现象,即所谓"关键的少数与次要的多数"原理.朱兰(美国质量管理学家)把这个原理应用到质量管理中来,成为在质量管理中发现主要质量问题和确定质量改进方向的有力工具. 1.排列图的画法

排列图制作可分为5步: (1)确定分析的对象排列图一般用来分析产品或零件的废品件数、吨数、损失金额、消耗工时及不合格项数等. (2)确定问题分类的项目可按废品项目、缺陷项目、零件项目、不同操作者等进行分类。 (3)收集与整理数据列表汇总每个项目发生的数量，即频数fi、项目按发生的数量大小，由大到小排列。最后一项是无法进一步细分或明确划分的项目统一称为“其它”。 (4)计算频数fi、频率Pi和累计频率Fi 首先统计频数fi，然后按(1)、(2)式分别计算频率Pi和累计频率Fi (1) 式中，f为各项目发生频数之和。 (2) (5)画排列图排列图由两个纵坐标，一个横坐标，几个顺序排列的矩形和一条累计频率折线组成。如图1所示为一排列图实例。 2.排列图用途

01如何选择合适的统计学方法？ 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布，（1）可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验；（2）采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐，（1）采用Satterthwate 的t’检验；（2）采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布，采用配对t检验。 1.2.2 两组差值不服从正态分布，采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布，且各组方差齐性，直接采用完全随机的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有LSD检验，Bonferroni法，tukey 法，Scheffe法，SNK法等。 1.3.2资料不符合正态分布，或各组方差不齐，则采用非参数检验的Kruscal－Wallis法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用Bonferroni法校正P值，然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布，且各组方差齐性，直接采用随机区组的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有LSD检验，Bonferroni法，tukey 法，Scheffe法，SNK法等。 1.4.2资料不符合正态分布，或各组方差不齐，则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用Bonferroni法校正P值，然后用符号配对的Wilcoxon检验。 ****需要注意的问题：（1）一般来说，如果是大样本，比如各组例数大于50，可以不作正态性检验，直接采用t 检验或方差分析。因为统计学上有中心极限定理，假定大样本是服从正态分布的。（2）当进行多组比较时，最容易犯的错误是仅比较其中的两组，而不顾其他组，这样作容易增大犯假阳性错误的概率。正确的做法应该是，先作总的各组间的比较，如果总的来说差别有统计学意义，然后才能作其中任意两组的比较，这些两两比较有特定的统计方法，如上面提到的LSD检验，Bonferroni法，tukey法，Scheffe法，SNK法等。**绝不能对其中的两组直接采用t检验，这样即使得出结果也未必正确** （3）关于常用的设计方法：多组资料尽管最终分析都是采用方差分析，但不同设计会有差

1.1多元回归 1、方法概述：在研究变量之间的相互影响关系模型时候，用到这类方法，具体地说：其可以定量地描述某一现象和某些因素之间的函数关系，将各变量的已知值带入回归方程可以求出因变量的估计值，从而可以进行预测等相关研究。2、分类分为两类：多元线性回归和非线性线性回归；其中非线性回归可以通过一定的变化转化为线性回归，比如：y=lnx 可以转化为y=u u=lnx来解决；所以这里主要说明多元线性回归应该注意的问题。 3、注意事项在做回归的时候，一定要注意两件事：（1）回归方程的显著性检验（可以通过sas和spss来解决）（2）回归系数的显著性检验（可以通过sas和spss来解决）检验是很多学生在建模中不注意的地方，好的检验结果可以体现出你模型的优劣，是完整论文的体现，所以这点大家一定要注意。 4、使用步骤：（1）根据已知条件的数据，通过预处理得出图像的大致趋势或者数据之间的大致关系；（2）选取适当的回归方程；（3）拟合回归参数；（4）回归方程显著性检验及回归系数显著性检验（5）进行后继研究（如：预测等）这种模型的的特点是直观，容易理解。这体现在：动态聚类图可以很直观地体现出来！当然，这只是直观的一个方面！ 2、分类聚类有两种类型：（1）Q型聚类：即对样本聚类；（2）R型聚类：即对变量聚类；聚类方法：（1）最短距离法（2）最长距离法（3）中间距离法（4）重心法（5）类平均法（6）可变类平均法（7）可变法（8）利差平均和法在具体做题中，适当选取方法； 3、注意事项在样本量比较大时，要得到聚类结果就显得不是很容易，这时需要根据背景知识和相关的其他方法辅助处理。还需要注意的是：如果总体样本的显著性差异不是特别大的时候，使用的时候也要注意！ 4、方法步骤（1）首先把每个样本自成一类； 2）选取适当的衡量标准，得到衡量矩阵，比如说：距离矩阵或相似性矩阵，找到矩阵中最小的元素，将该元素对应的两个类归为一类，（4）重复第2步，直到只剩下一个类；（4）重复第2步，直到只剩下一个类；补充：聚类分析是一种无监督的分类，下面将介绍有监督的“分类”。

u检验、t检验、F检验、X2检验（转）来源：李冠炜?????的日志常用显著性检验 1.t检验适用于计量资料、正态分布、方差具有齐性的两组间小样本比较。包括配对资料间、样本与均数间、两样本均数间比较三种，三者的计算公式不能混淆。 2.t'检验应用条件与t检验大致相同，但t′检验用于两组间方差不齐时，t′检验的计算公式实际上是方差不齐时t检验的校正公式。 3.U检验应用条件与t检验基本一致，只是当大样本时用U检验，而小样本时则用t 检验，t检验可以代替U检验。 4.方差分析用于正态分布、方差齐性的多组间计量比较。常见的有单因素分组的多样本均数比较及双因素分组的多个样本均数的比较，方差分析首先是比较各组间总的差异，如总差异有显著性，再进行组间的两两比较，组间比较用q检验或LST 检验等。

5.X2检验是计数资料主要的显著性检验方法。用于两个或多个百分比(率)的比较。常见以下几种情况：四格表资料、配对资料、多于2行*2列资料及组内分组X2检验。 6.零反应检验用于计数资料。是当实验组或对照组中出现概率为0或100％时，X2检验的一种特殊形式。属于直接概率计算法。 7.符号检验、秩和检验和Ridit检验三者均属非参数统计方法，共同特点是简便、快捷、实用。可用于各种非正态分布的资料、未知分布资料及半定量资料的分析。其主要缺点是容易丢失数据中包含的信息。所以凡是正态分布或可通过数据转换成正态分布者尽量不用这些方法。 8.Hotelling检验用于计量资料、正态分布、两组间多项指标的综合差异显著性检验。计量经济学检验方法讨论

计量经济学中的检验方法多种多样，而且在不同的假设前提之下，使用的检验统计量不同，在这里我论述几种比较常见的方法。在讨论不同的检验之前，我们必须知道为什么要检验，到底检验什么？如果这个问题都不知道，那么我觉得我们很荒谬或者说是很模式化。检验的含义是要确实因果关系，计量经济学的核心是要说因果关系是怎么样的。那么如果两个东西之间没有什么因果联系，那么我们寻找的原因就不对。那么这样的结果是没有什么意义的，或者说是意义不大的。那么检验对于我们确认结果非常的重要，也是评价我们的结果是否拥有价值的关键因素。所以要做统计检验。 t 检验，t检验主要是检验单个ols估计值或者说是参数估计值的显著性，什么是显著性？也就是给定一个容忍程度，一个我们可以犯错误的限度，错误分为两类：1、本来是错的但是我们认为是对的。2、本来是对的我们认为是错的。统计的检验主要是针对第一种错误而言的。一般的计量经济学中的这个容忍程度是 5%，也就是说可以容忍我们范第一类错误的概率是5%。这样说不准确，但是比较好理解。t-stastic是类似标准正态化的正态分布两一样，也就是估计值减去假设值除以估计值得标准差，一般假设值是0，这一点不难理解，如果是0 ，那么也就意味着没有因果关系。这个t-static在经典假设之下服从t分布。t