学习资料描述统计与推断统计.docx

学习资料描述统计与推断统计.docx
学习资料描述统计与推断统计.docx

描述统计与推断统计-心理学统计与测量经典习题1

第一章描述统计

名词解释

1.描述统计(吉林大学2002研)

答:描述统计主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。具体内容有:数据如何分组,如何使用各种统计表与统计图的方法去描述一组数据的分组及分布情况,如何通过一组数据计算一些特征数,减缩数据,进一步显示与描述一组数据的全貌。

2.相关系数(吉林大学2002研)

答:相关系数是两列变量间相关程度的数字表现形式,或者说是表示相关程度的指标。作为样本的统计量用r表示,作为总体参数一般用ρ表示。相关系数不是等距的度量值,因此在比较相关程度时,只能说绝对值大者比绝对值小者相关更密切一些,而不能进行加减乘除。

3.差异系数(浙大2003研)

答:差异系数,又称变异系数、相对标准差等,它是一种相对差异量,为标准差对平均数的百分比。其公式如下:

常用于:①同一团体不同观测值离散程度的比较;②对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。

4.二列相关(中科院2004研)

答:如果两列变量均属于正态分布,其中一列变量为等距或等比的测量数据,另一列变量虽然也是正态分布,但被人为地划分为两类。求这样两列变量的相关用二列相关。

5.集中量数与差异量数(浙大2000研,苏州大学2002研)

答:集中趋势和离中趋势是次数分布的两个基本特征。数据的集中趋势就是指数据分布中大量数据向某方向集中的程度,离中趋势是指数据分布中数据彼此分散的程度。用来描述一组数据这两种特点的统计量分别称为集中量数和差异量数。

6.中位数(南开大学2004研)

答:中位数,又称中点数,中数,是指位于一组数据中较大一半和较小一半中间位置的那个数,用Md或Mdn来表示。

7.品质相关(华东师大2002研)

答:品质相关是指R×C表的两个因素之间的关联程度。两个因素只被划为了不同的品质类别,其数据一般都是计数的数据,而非测量的数据。品质相关可依二因素的性质及分类项目的不同,而有不同的名称和计算方法,较常见的有四分相关和Ф相关。

8.标准分数(华南师大2004研)

答:标准分数,又称基分数或Z分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。

其计算公式为:

简答题

1.简述使用积差相关系数的条件。(首师大2004研)

答:一般来说,用于计算积差相关系数的数据资料,需要满足下面几个条件:

①要求成对的数据,即若干个体中每个个体都有两种不同的观测值。

②两列变量各自总体的分布都是正态,即正态双变量,至少两个变量服从的分布应是接近正态的单峰分布。

③两个相关的变量是连续变量,也即两列数据都是测量数据。

④两列变量之间的关系应是直线性的,如果是非直线性的双列变量,不能计算线性相关。

2.简述算术平均数的使用特点。(浙大2003研,苏州大学2002研)

答:算术平均数的优点有反应灵敏;计算严密;计算简单;简明易解;适合于进一步用代数方法演算;较少受抽样变动的影响。缺点有易受极端数据的影响;如果出现模糊不清的数据时,无法计算平均数,因为平均数的计算需要每个数据的加入。勤*思老师期待您的好消息。从算术平均数的这些特点可以看出,如果一组数据是比较准确,可靠又同质,而且需要每一个数据都加入计算,同时还要作进一步代数运算时,用算术平均数表示其集中趋势最佳。

3.如果你不知道两个变量概念之间的关系,只知道两个变量的相关系数很高,请问你可能做出什么样的解释?(武汉大学2004研)

答:相关系数是两列变量间相关程度的数字表现形式,或者说是表示相关程度的指标。两个变量的相关系数很高,只能说明两变量间具有较高的共变关系,即一个变量的变化会引起另一个变量朝相同或相反方向发生变化。至于二者有无因果关系,或谁是因谁是果则无法确定。所以在解释时只能说两变量间存在较高的相关关系。

4.一组大学生的智力水平和性别之间求相关,设男为1,女为2。如果两变量的相关为负,请问说明了什么情况?请举例说明。(武汉大学2004研)

答:根据题意,如果两变量的相关为负,则说明大学生的智力水平与性别存在负相关,即男生智力水平低,女生智力水平高。

举例提示:本题所求的相关是点二列相关,一列变量为等距变量(智力水平),另一列变量为名义变量(性别)。根据点列相关的数据特点,列出两组数据,运用相应公式计算即可。要注意的是,男生的智力水平平均分数应小于女生的。

5.某省进行了一次小学五年级的数学统考。已知不同小学教学水平相差较大,但同一个小学的五年级的不同班级教学水平很相近。以学生的考试成绩为原始数据,问:

①如何处理这些原始数据,使得数据处理的结果能够比较不同小学学生的数学学习潜能?

答:提示:使用标准分数。由于要考察的是不同学生的数学学习潜能,而非已有的数学水平,所以应该以每个学校的五年级学生为总体,求每个学生的标准分数,然后比较不同学校学生间的标准分数。

②如何处理这些原始数据,使得数据处理的结果能够反映一个学校的教学水平?(南开大学2004研)

答:提示:一个学校的教学水平主要体现在学生的学习成绩上,而学生成绩的好坏有两个标准:一是平均水平的高低,二是整体水平的差异。一般来说,平均水平越高,同时整体水平差异越小,表明该学校的教学水平高,反之则低。而同时反映了这两个指标的只有差异系数(CV)。其公式为:

6.举例说明相关程度很高的两个变量之间并不存在因果关系。(北师大2001研)

答:变量之间的因果关系必须符合以下几个条件:①二者之间必须有可解释的相关关系;②二者必须有一定的时间先后顺序,也就是说“因”的变化在前,“果”的变化在后,二者顺序不能变;③二者不能是虚假关系(即一种关系被另一种关系被另一种关系取代后,原来的关系被证明不成立);④因果决定的方向不能改变。

而变量之间的相关关系是一种共变关系,即一种变量发生变化,另一种变量也相应地朝相同或相反方向发生变化。但有高相关的两个变量之间并不一定存在因果关系,如一般情况下,数学成绩好的学生,物理成绩也会比较好,即两者存在很高的正相关。但是,数学成绩和物理成绩之间没有一定的时间先后顺序,而且无法确定二者谁决定了谁,即不能满足因果关系的②④两个条件,所以不是因果关系。

7.度量离中趋势的差异量数有哪些?为什么要度量差异量数?(西北师大2002研)

答:对于数据变异性即离中趋势进行度量的一组统计量,称作差异量数。这些差异量数有标准差或方差,全距,平均差,四分差及各种百分差等。

一组数据集中量数的代表性如何,可由表示差异情况的量数来说明。差异量数越小,则集中量数的代表性越大;若差异量数越大,则集中量数的代表性越小。如差异量数为零,则说明该组数据彼此相等,其值都与集中量数相同。集中量数是指量尺上的一点,是点值,而差异量数是量尺上的一段距离,只有将二者很好地结合,才能对一组数据的全貌进行清晰的描述。所以需要度量差异量数。

8.用算术平均数度量集中趋势存在哪些缺点?试举例说明。(重大2004研)

答:其缺点有:易受极端数据的影响;如果出现模糊不清的数据时,无法计算平均数,因为平均数的计算需要每个数据的加入。

如:有两组物理成绩:

第一组:25,37,32,60,100,99,96

第二组:63,72,60,68,63,62,61

尽管两组成绩的平均分相等都约为64,但由于极端数据的存在,64不能很好地代表第一组数据的平均水平,却较好地代表了第二组数据。

计算题

1.五位教师对甲乙丙三篇作文分别排定名次如下表;

名次

教师序号甲乙丙

1 3 1 2

2 3 2 1

3 3 1 2

4 1 3 2

5 1 3 2

请对上述数据进行相应的统计分析。(华东师大2003研)

答题提示:题目目的是让考生对5位教师的一致性做出评价。该题是让5个被试(教师)对3篇作文进行等级评定,每个被试都根据自己的标准对三篇作文排出了一个等级顺序。所以应该计算肯德尔W系数。将题中原始数据代入公式即可。

2.计算未分组数据:18,18,20,21,19,25,24,27,22,25,26的平均数、中数和标准差。(首师大2003研)

答题提示:平均数与标准差的计算直接将原始数据代入相应公式即可。中位数的计算稍复杂一些。将数据从小到大进行排序,可知数组中虽有重复数据,但位于中间的数非重复数据,加之数据数为偶数,所以取第N/2和第N/2+1两个数的平均数作为中数即可。

3.4名教师各自评阅相同的5篇作文,表2为每位教师给每篇作文的等级,试计算肯德尔W系数。(首师大2003研)

表2 教师对学生作文的评分

答题提示:将数据代入肯德尔W系数即可。

4.把下列分数转换成标准分数。

11.0,11.3,10.0,9.0,11.5,12.2,13.1,9.7,10.5(华南师大2003研)

答题提示:先根据相应公式计算平均数和标准差,然后根据标准分数公式依次计算每个分数的标准分数。

5.假定学生的成绩呈正态分布,某班五名学生的数学和物理成绩如下,求相关系数。(重大2004研)

答题提示:两列数据均为测量数据,而且呈正态分布,因此应该求积差相关。将数据代入积差相关公式即可。

第二章推断统计

单选题

1.什么情况下样本均值分布是正态分布?

A 总体分布是正态分布

B 样本容量在30以上

C A和B同时满足

D A或B之中任意一个条件满足

(北京大学2000)

参考答案D

2.以下关于假设检验的命题,哪一个是正确的?

A如果H0在=.05的单侧检验中被接受,那么H0在=.05的双侧检验中一定会被接受

B如果t的观测值大于t的临界值,一定可以拒绝H0

C如果H0在=.05的水平上被拒绝,那么H0在=.01的水平上一定会被拒绝

D在某一次实验中,如果实验者甲用=.05的标准,实验者乙用=.01的标准。实验者甲犯II类错误的概率一定会大于实验者乙。

(北京大学2000)

参考答案D

3.让64位大学生品尝A B两种品牌的可乐并选择一种自己比较喜欢的。如果这两种品牌的可乐味道实际没有任何区别,有39人或39人以上选择品牌B的概率是(不查表):

A 2.28%

B 4.01%

C 5.21%

D 39.06% (北京大学2000)

参考答案C

4.在多元回归的方法中,除哪种方法外,各预测源进入回归方程的次序是单纯由统计数据决定的:

A逐步回归B层次回归C向前法D后退法

(北京大学2000)

参考答案B

5.以下关于假设检验的命题哪一个是正确的

A、实验者甲用=0.05的标准,实验者乙用=0.01的标准,甲犯II类错误的概率一定会大于乙:

B、统计效力总不会比水平小

C、扩大样本容量犯II类错误的概率增加

D、两个总体间差异小,正确拒绝虚无假设的机会增加。

(北京大学2002)

参考答案 D

6.已知X和Y的相关系数r1是0.38,在0.05的水平上显著,A与B的相关系数r2是0.18,在0.05的水平上不显著

A、r1与r2在0.05水平上差异显著

B、r1与r2在统计上肯定有显著差异

C、无法推知r1与r2在统计上差异是否显著

D、r1与r2在统计上不存在显著差异

(北京大学2002)

参考答案C

7.在回归方程中,假设其他因素保持不变,当X与Y相关趋近于0时,估计的标准误是怎样变化?

A、不变

B、提高

C、降低

D、也趋近于0

(北京大学2002)

参考答案 C

简答题

1.非参数检验方法的特点有哪些?(浙江大学2005)

参考答案:

①一般不需要有严格的前提假设

②非参数检验特别适用于顺序资料(等级变量)

③很适用于小样本,且方法简单

④最大的不足是未能充分利用资料的全部信息;⑤非参数方法目前还不能处理“交互作用”。

2.在被试取样时,应该根据哪些因素确定样本的大小?(华南师大2005)

参考答案

① 当进行平均数的估计时,当确定后,总体标准差和最大允许误差d是决定样本容量的两个因子

② 当进行平均数假设检验时,需要同时考虑显著性水平、统计检验力、总体标准差以及所假设的总体差异四个因子

3.能否用两总体平均数差异z检验或t检验逐对检验多个总体平均数的差异显著性问题?为什么?(华南师大2005)

参考答案:

不能,因为同时比较的平均数越多,其中差异较大的一对所得的t值超过原定临界值t 的概率就越大,这时错误的概率将明显增大,或者说原本达不到显著性水平的差异很容易被视为是显著的。

4.试述分层抽样的原则和方法?(华南师大2005)

参考答案:

分层抽样是按照总体上已有的某些特征,将总体分成几个不同部分,在分别在每一部分中随机抽样。分层的总的原则是:各层内的变异要小,而层与层之间的变异越大越好。在具体操作中,没有一成不变的标准,研究人员可根据研究需要依照多个分层标准,视具体情况而定。

5.有人说:“t检验适用于样本容量小于30的情况。Z检验适用于大样本检验”,谈谈你对此的看法

(北京师范大学2004)

参考答案:

选择t检验还是Z检验的主要标准不是样本容量大小,而是欲检验的总体是否为正态分布以及总体方差是否已知。如果总体为正态而方差又已知,使用Z检验就可以了;而如果总体为正态而总体方差未知,就需要用无偏估计量来代替总体方差,这时应进行t检验;如果总体并非正态而总体方差也是未知的,在样本容量大于30时,可以用Z检验但不能用t检验。如果总体非正态而样本容量又小于30,既不能用Z 检验也不能用t检验,需要使用非参数检验。

6.学业考试成绩为x,智力测验分数为y,已知这两者的rxy=0.5,IQ=100+15z,某学校根据学业考试成绩录取学生,录取率为15%,若一个智商为115的学生问你他被录取的可能性为多少,你如何回答他?(北京师范大学2004)

答案提示:很难给出一个确定的比率来回答该生可被录取的可能性。就智商而言,该生在总体中的z 值为1,百分比为84.26%,但并不能以此来推断该生一定可被录取,因为智商与考试成绩之间的相关仅为0.5。

7.如果两总体中的所有个体都进行了智力测验,这两个总体智商的平均数差异是否还需要统计检验?为什么?(北京师范大学2004)

参考答案:需要。还需要排除测验中误差的干扰,才能够判断出两总体智商是否存在差异。

8.选择统计检验程序的方法时要考虑哪些条件,才能正确应用统计检验方法分析问题?(北京师范大学2004)

参考答案:

① 总体分布特征

② 样本容量

③ 总体方差是否已知

④ 对什么统计量进行检验?

⑤ 在进行方差分析时还要考察方差是否齐性、组间变异是否独立

9.标准正态分布的曲线有哪些特点?(华东师范大学1997)

参考答案:

正态分布具有以下特征:①正态分布的形式是对称的(但对称的不一定是正态的),它的对称轴是经过平均数点的垂线,正态分布中,平均数、中数、众数三者相等,此点y值最大(0.3989),左右不同间距的丁值不同,各相当间距的面积相等,值也相等;②正态分布的中央点(即平均数点)最高,然后逐渐向两侧下降,曲线的形式是先向内弯,然后向外弯,拐点位于正负1个标准差处,曲线两端向靠近基线处无限延伸,但终不能与基线相交;③正态曲线下的面积为1,由于它在平均数处左右相对称,故过平均数点的垂线将正态曲线下的面积划分为相等的两部分,各为0.5

10.方差分析的逻辑是什么?(华东师范大学1997、2000)

参考答案:依据方差的可加性原理,将组内变异与组间变异区分开来,在运用F检验原理,判断实验处理效应与误差效应是否存在显著差异,依次确定实验处理效应的大小。

11.完全随机设计和方差分析和随机区组设计的方差分析有什么区别?(华东师范大学2001)

参考答案:一个重要的区别就是将区组方差从组内方差中分离出来,使方差分析结果更为精确可靠。

12.什么是非参数检验?它有什么特点?(华东师范大学2001)

参考答案:

参数检验对欲检验的数据有较高的要求,如正态分布等,而非参数检验对数据的要求较低,适用于不适合参数检验数据的检验。

特点:

①一般不需要有严格的前提假设;②非参数检验特别适用于顺序资料(等级变量);③很适用于小样本,且方法简单;④最大的不足是未能充分利用资料的全部信息;⑤非参数方法目前还不能处理“交互作用”。

13.为了建立最好的多元线性回归方程,一般采用什么方式选择自变量?(华东师范大学2001)

参考答案:自变量对因变量变异的解释能力

14.什么是二元线性标准回归方程(2003 华东师范大学)

参考答案:两个自变量、数据标准化后的方程

15.为什么抽样调查得到的样本统计可以推论总体参数。(2006北京师范大学)

参考答案:因为总体分布存在一定的理论模型,比如正态分布、二项分布等,样本参数与总体分布之间的差异可以用推论的方式估计出来。

16.平均数的显著性检验和平均数差异的显著性检验的区别联系(2005北师)

参考答案:前者检验的是样本平均数与总体平均数之间的差异,后者检验的是两样本代表的不同总体之间的差异是否显著。

17.正态分布的标准差有何统计意义,在统计检验中为什么会用到标准差?(北师大2003)

参考答案:正态分布的标准差仍然是数据离散程度的一个度量指标,在统计检验中,标准差成为度量样本平均数与总体平均数之间差异的重要度量指标。

18. 正态分布的特征是什么,统计检验中为什么经常要将正态分布转化成标准正态分布?(北师大2003)

参考答案:正态分布具有以下特征:①正态分布的形式是对称的(但对称的不一定是正态的),它的对称轴是经过平均数点的垂线,正态分布中,平均数、中数、众数三者相等,此点y值最大(0.3989),左右不同间距的Z值不同,各相当间距的面积相等,值也相等;②正态分布的中央点(即平均数点)最高,然后逐渐向两侧下降,曲线的形式是先向内弯,然后向外弯,拐点位于正负1个标准差处,曲线两端向靠近基线处无限延伸,但终不能与基线相交;③正态曲线下的面积为1,由于它在平均数处左右相对称,故过平均数点的垂线将正态曲线下的面积划分为相等的两部分,各为0.5

标准正态分布具有固定的标准误与平均数值,能够排除不同样本数据度量单位不同造成的混乱,更易于推断分析。

19.在进行差异的显著性检验时,若将相关样本误作独立样本处理,对差异的显著性有何影响,为什么?(北师大2003)

参考答案:可能会使本来存在显著差异的两组数据变得没有差异,因为如果将相关样本误作为独立样本处理,会减小计算临界Z值时选用的标准误值,从而使本来得到的正确Z值变小,从而增加了不显著的概率值。

20.为什么要做区间估计?怎样对平均数作区间估计?(北师大2003)

参考答案:原因是想通过样本统计量来预测总体参数的可能区间。

根据样本平均数的分布仍然为正态分布这一原理,利用推论统计原理计算出平均数分布的标准误,就可以推论出在一定置信度之上的总体参数置信区间。

21.抽样调查要想得到比较准确的结果,需要控制哪些技术环节?(北师大2003)

参考答案:

① 界定好总体

② 选择适当的抽样方式,最好遵循随机化原则

③ 标准化施测,尽量排除无关变量的干扰

④ 统计控制,选择适当的统计处理方法

22.为什么假设检验中待检验假设为无差异假设?(2001年北师大)

参考答案:

假设检验的基本思想是概率性质的反证法,为了检验虚无假设,首先假定虚无假设为真,在这样的前提下,如果导致违反逻辑或违背人们常识和经验的不合理现象出现,则表明“虚无假设为真”的假定是不正确的,也就不能接受虚无假设。若没有导致不合理现象出现,那就认为“虚无假设为真”的假定是正确的,也就是说要接受虚无假设。

这也就是假设检验中的“反证法”思想,但是它不同于纯数学中的反证法。后者是在假设某一条件下导致逻辑上的矛盾,从而否定原来的假设条件。而假设检验中的不合理现象“是指小概率事件在一次试验中发生了,它是给予人们在实践中广泛采用的小概率事件原理,该原理认为”小概率事件在一次试验中几乎是不可能发生的“。

23.为什么方差分析能够分析出几个平均数的差异?(2001年北师大)

参考答案:方差分析的基础是方差的可分解性,它可以将来自于多个途径的变异从总变异中分解出来,而后通过检验来判断某种处理产生的变异量的大小。

24.指出t=5.53,p小于0.05的含义(2001年北师大)

参考答案:拒绝虚无假设所犯的概率小于0.05

25.非参数检验的方法有哪一些?其各自使用的条件是什么?(北京师范大学1999)

参考答案:

秩和检验法:适用于独立样本均值差异的非参数检验

中位数检验:适用于两独立样本均平均数差异的非参数检验

符号检验法:适用于检验两个配对样本分布的差异

符号等级检验法:同符号检验法,但精度更高

26.t检验要满足那些条件才能保证统计分析的有效性?(北师大1998)

①总体正态分布

②总体方差未知

③两组比较,多组比较时最好用方差分析

27.方差分析之后,平均数进一步检验的步骤(北师大1998)

参考答案:N—K检验法的步骤

(1)把要比较的各个平均数从小到大作等级排列;

(2)根据比较等级和自由度在附表中查相应的q值。被比较的两个平均数各自在上面的等级排列中所处等级之差再加上1,就是这两个平均数的比较等级,自由度就是方差分析中的误差项自由度;

(3)利用公式计算样本平均数的标准误:

N相等时,标准误计算公式为:SE =

公式中MSE,是组内均方,n是每组容量。

N不等时,标准误计算公式为:SE =

其中,n ,n 分别为两个样本的容量。

(4)计算q的临界值(q SE );

(5)统计决断。

28.写出二项分布平均数及标准差的计算公式,并指出在心理实验研究中的用处。(北京师范大学1997 )

参考答案:

二项分布在心理与教育研究中,主要用于解决含有机遇性质的问题。所谓机遇问题,即指在试验或调查中,试验结果可能是由于猜测而造成的。比如,选择题目的回答,选对选错,可能完全由猜测造成的。凡此类问题,欲区分由猜测而造成的结果与真实的结果之间的界限,就要应用二项分布来解决。

29.有人给你两组数据,让你帮助进行差异显著性检验,写出你对解决上述问题的思考程序。(北京师范大学1997 )

参考答案:

检查总体是否正态

检查总体方差是否已知

在总体非正态条件下看样本容量大小

决定选用什么公式进行差异显著性检验

进行检验并得出检验结论

30. 试说明参数区间估计的原理?(北师大1996)

参考答案:

区间估计的原理与标准误:样本分布理论是区间估计的原理。在计算区间估计值,解释估计的正确概率时,依据的是该样本统计量的分布规律及样本分布的标准误(SE)。只有知道了样本统计量的分布规律和样本统计量分布的标准误,才能计算总体参数可能落入的区间长度,并对区间估计的概率进行解释。样本分布可提供概率解释,而标准误的大小决定区间估计的长度。标准误越小,置信区间的长度越短,而估计成功的概率仍能保持较高。一般地,加大样本容量可使标准误变小。在对总体参数实际进行估计中,人们当然希望估计值的范围尽可能小些,而估计准确的概率大些。但在样本容量一定的情况下,二者不可兼得。

31. 什么是方差分析?须满足哪些条件?(北师大1996)

参考答案

方差分析又称变异分析,功能在于分析实验数据中不同来源的变异对总变异的贡献大小,从而确定实验中的自变量是否对因变量有重要影响,即用于置信度不变情况下的多组平均数之间的差异检验

进行方差分析时,数据必须满足以下条件,否则结论会产生错误:

(1)总体正态分布

(2)变异的相互独立性

(3)各实验处理内的方差要一致

计算题

答案提示:

1.一位研究者用心理量表测量大学生的内外控倾向。随机抽取了一个有8位男生,8位女生的样本。男生组样本均值X=11.4,SS=26;女生组样本均值X=13.9,SS=30。试问两组被试在此人格维度上是否存在显著差异。

(北京大学2000)

答案提示:作两总体都是正态分布且两总体方差均未知的两独立样本平均数差异显著性检验。

先计算标准误,公式为:

SE =

再计算临界值,公式为:

Z=

比较现有Z值与临界值的大小,如果现有值大于临界值,则差异显著。

2.社会学家发现儿童早期被虐待可能导致青年期的犯罪行为。选取了25个罪犯和25个大学生,询问其早期被虐待经历,结果的次数分布如下。罪犯是否比大学生有更多的早期被虐待经历?(用a=。05的标准作假设检验)

无早期被虐待经历有早期被虐待经历

罪犯9 16

大学生19 6

(北京大学2000)

答案提示:作独立样本四格表检验。代入公式=N(AD-BC)/[(A+B)(C+D)(A+C)(D+B)]求出值,查自由度为1时的值,与求出的值作比较,如果实际值大于临界值,则差异显著,说明罪犯比大学生有更多早期被虐经历。

3、学生辅导中心办了一系列学习方法的讲座,为评估整个系列讲座的效果,随机抽取了25个参加讲座的学生,调查了他们在系列讲座开始前那个学期的GPA和系列讲座结束后那个学期的GPA,从差异均值分布看,这25个参加讲座的学生提高了D1=0.72,和方SS=24,用数据来对系列讲座提高GPA的效应进行点估计和90%的区间估计。(北京大学2002)

答案提示:

区间估计:-Z <<+Z 将值设为0.10即可

4、一位研究者发现大白鼠在T型迷津实验中有右转弯的偏好,在20次系列实验中,一只大白鼠右转17次,左转3次,用适当的假设检验验证大白鼠在T型迷津中右转弯好偏好是否在统计上显著?(北京大学2002)

答案提示:作配合度检验,理论次数均为10,代入公式= 求出,查分布表算出临界值与当前值比较,如果当前值大于临界值,则差异显著。

5、通过随机抽样,抽取了A、B两组被试,施以不同的教学方法,期末考试成绩如下:

A组:119,110,132,106,121,120;

B组:133,128,130,134,129,136,133

为检验教学方法的效果有无显著差异,请计算必要的检验统计量。(华东师范大学2001)

答案提示:作两独立样本t检验。先代入公式SE = 求出标准误SE ,然后求出Z= ,查正态分布表得出临界Z值,比较临界值与当前Z值的大小,即可判断是否存在显著差异

6、134位学生参加寒假长跑训练,开学后发现长跑成绩显著进步(由不及格变成及格)的有38人,显著退步(由及格变成不及格)的有19人,问长跑训练有无显著效果?(华东师范大学2001)

答案提示:作相关样本四格表检验,代入公式= 求出值,查df=1时的值,比较两者大小,如果实际值大于临界值,则差异显著。

7、有5名女生,物理测验成绩分别是68,69,70,71,72;另有7名男生,成绩分别是40,50,60,70,80,90,100。现需要知道男女生成绩是否方差齐性,请计算相应的检验统计量(华东师范大学2002 )

答案提示:先分别求出两组数据的方差,代入公式F= ,求出F值,查F分布表,比较当前F 值与临界值的差异即可。

8、某小学根据各方面条件基本相同的原则将32名学生配成16对,然后把每对学生随机分入实验组和对照组,实验组的16名学生参加课外科研活动,对照组的16名学生不参加此活动,一学期后,统一进行理解能力测验。结果发现,有9对学生的理解能力测验成绩明显拉开了距离,其中8对是实验组学生得到”及格“,对照组学生得到”不及格“;1对是对照组学生得到”及格“,实验组学生得到”不及格“。问:参加课外科研活动对理解能力测验有无显著影响?(华东师范大学2002)

答案提示:先作成四格表,而后做独立性检验。代入公式=N(AD-BC)/[(A+B)(C+D)(A+C)(D+B)]求出值,比较当前值与临界值的差异,如果当前值大于临界值,则差异显著,否则不显著。

9、有一团体的人数为300人,施测某一心理测验的结果平均数为100,标准差为8,有被测者A的得分是113,问该团体中测验得分高于A的被测者有多少人?回答这一问题尚须作哪些假设?(北师大1998)

答案提示:

求出被试A在团体中的Z分数值,Z=(113-100)/8=1.625,查正态分布表确定其百分位95%。其前提假设是总体分布正态。

10、请选用参数与非参数的方法各一种,对下述结果进行差异检验,分析A、B、C三种实验处理是否存在显著差异?

A 85 90 92 91 88

B 90 93 95 100 110

C 110 115 117 116 114

(北师大1998)

答案提示:

1)参数检验:选用完全随机实验设计方差分析法

分别计算:

总平方和SS =

组间平方和SS = -

组内平方和SS = -

然后计算自由度:

组间自由度dfb=K-1

组内自由度dfm=N-K

而后计算均方:

MS =SS /(K-1);MS =SS /(N-K)

再计算F值:F= MS / MS

查表求理论F值:进行统计推断——查表寻找相应的临界值比较F与F ,从而确定该样本的户是否为小概率,即是否P<0.05。

2)非参数检验:克—瓦氏单向方差分析法

11、请选恰当的参数与非参数方法分析下述两组平均数是否存在显著差异?n1:3.6 4.2 4.0 5.0 3.7 3.8 4.1

n2:4.1 4.2 4.0 4.8 5.0 5.3 5.2 5.5

(北师大1998)

答案提示:

1)参数方法:独立样本t检验

求出每组数据方差后计算标准误SE =

计算临界值,公式为:

Z=

查正态分布表比较临界值与当前Z值的大小,大于临界值则说明差异显著。

2)非参数检验:秩和检验法

原理:将两个容量均小于10且第一个样本小于第二个样本的独立样本的数据合并在一起,按大小顺序排列并赋予等级秩次。若无显著差异,则两个样本各自秩次之和应该相等或接近相等。

检验步骤:

①虚无假设

②编排秩次

③求秩和:计算样本容量较小一组的秩次和

④查表求临界值并进行统计决断:根据两个组的容量查表

12、有研究者欲考察某一高考试题的得分情况是否存在性别差异,统计结果如下:

及格不及格

男290 160

女100 350

该统计结果说明什么问题?

(北京师范大学1997 )

答案提示:作四格表独立性检验,看男女生在及格率上的比率是否存在显著差异。

依公式=N(AD-BC)/[(A+B)(C+D)(A+C)(D+B)]求出值(式中A,B,C,D分别为四格表内各格的实际数,(A+B),(C+D),(A+C),(D+B)为各边缘次数,自由度df=1)。之后查表比较临界值与当前的值大小即可,如果当前值落入了小概率事件内,则说明差异显著。

13、有一区组设计的实验数据,请用参数及非参数两种方法检验其差异显著性。

A1 A2 A3 A4

甲2 3 4 5

乙3 5 5 6

丙3 4 6 7

丁4 6 7 8

(北京师范大学1997 )

答案提示:

参数检验过程:采用随机区组设计的方差分析过程

总方差的构成:SS =SS +SS = SS +SS +SS

组内方差的构成:SS = SS +SS (SS 为残差;SS 为区组平方和)

组内自由度:df =n-1; df =df -df - df =(N-1)-(K-1)-(n-1)=N-K-n+1 总平方和SS =

组间平方和SS = -

SSr= -

SSE= + - -

然后计算自由度:

组间自由度dfb=K-1

组内自由度dfr=n-1

dfE=(k-1)(n-1)

而后计算均方:

MS =SS /(K-1);MSr=SSr/(N-K)

再计算F值:F= MS / MSe

查表求理论F值:进行统计推断——查表寻找相应的临界值比较F与F ,从

而确定该样本的户是否为小概率,即是否P<0.05。

非参数检验过程:选用弗里德曼双向等级方差分析过程

步骤:

1 将每一区组的K个数据(K为实验处理数)从小到大排列出等级

2 每种实验处理n歌数据(n为区组数)等级和,依Ri表示

3 代入公式

所得出的弗里德曼双向等级方差分析表中的临界值做比较,若当前的值大于临界值,则差异显著。

14、有一区组设计的实验结果,请用参数与非参数方法检验其三种不同条件下之结果有无显著差异。被试a1 a2 a3

1 6.1 4.7 2.2

2 5.8 3.9 2.3

3 7.1 5.8 3.1

4 8.0 6.2 3.8

5 6.5 4.4 2.9

(北师大1996)

答案提示:

参数检验过程:采用随机区组设计的方差分析过程

总方差的构成:SS =SS +SS = SS +SS +SS

组内方差的构成:SS = SS +SS (SS 为残差;SS 为区组平方和)

组内自由度:df =n-1; df =df -df - df =(N-1)-(K-1)-(n-1)=N-K-n+1

总平方和SS =

组间平方和SS = -

SSr= -

SSE= + - -

然后计算自由度:

组间自由度dfb=K-1

组内自由度dfr=n-1

dfE=(k-1)(n-1)

而后计算均方:

MS =SS /(K-1);MSr=SSr/(N-K)

再计算F值:F= MS / MSe

查表求理论F值:进行统计推断——查表寻找相应的临界值比较F与F ,从

而确定该样本的户是否为小概率,即是否P<0.05。

非参数检验过程:选用弗里德曼双向等级方差分析过程

步骤:

1 将每一区组的K个数据(K为实验处理数)从小到大排列出等级

2 每种实验处理n歌数据(n为区组数)等级和,依Ri表示

3 代入公式

所得出的弗里德曼双向等级方差分析表中的临界值做比较,若当前的值大于临界值,则差异显著

描述统计与推断统计

描述统计与推断统计-心理学统计与测量经典习题1 第一章描述统计 名词解释 1.描述统计(吉林大学2002研) 答:描述统计主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。具体内容有:数据如何分组,如何使用各种统计表与统计图的方法去描述一组数据的分组及分布情况,如何通过一组数据计算一些特征数,减缩数据,进一步显示与描述一组数据的全貌。 2.相关系数(吉林大学2002研) 答:相关系数是两列变量间相关程度的数字表现形式,或者说是表示相关程度的指标。作为样本的统计量用r表示,作为总体参数一般用ρ表示。相关系数不是等距的度量值,因此在比较相关程度时,只能说绝对值大者比绝对值小者相关更密切一些,而不能进行加减乘除。 3.差异系数(浙大2003研) 答:差异系数,又称变异系数、相对标准差等,它是一种相对差异量,为标准差对平均数的百分比。其公式如下: 常用于:①同一团体不同观测值离散程度的比较;②对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。 4.二列相关(中科院2004研) 答:如果两列变量均属于正态分布,其中一列变量为等距或等比的测量数据,另一列变量虽然也是正态分布,但被人为地划分为两类。求这样两列变量的相关用二列相关。 5.集中量数与差异量数(浙大2000研,苏州大学2002研) 答:集中趋势和离中趋势是次数分布的两个基本特征。数据的集中趋势就是指数据分布中大量数据向某方向集中的程度,离中趋势是指数据分布中数据彼此分散的程度。用来描述一组数据这两种特点的统计量分别称为集中量数和差异量数。 6.中位数(南开大学2004研) 答:中位数,又称中点数,中数,是指位于一组数据中较大一半和较小一半中间位置的那个数,用Md或Mdn来表示。 7.品质相关(华东师大2002研)

实验三 分类资料的统计描述与统计推断

实验三分类资料的统计描述与统计推断 一、下表为一抽样研究资料,试:(1)填补空白处数据;(2)根据最后三栏结果作简要分析。(3)试估计 该地死亡率、0~恶性肿瘤死亡率的置信区间。 某地各年龄组恶性肿瘤死亡情况 出高血压病人775人,试估计该市中年男性高血压患病率的95%置信区间。 三、一般而言,对某疾病采用常规治疗,其治愈率约为45%。现改用新的治疗方法,并随机抽取180名该 疾病患者进行了新疗法的治疗,治愈117人。问新治疗方法是否比常规疗法的效果好? 四、一般人群先天性心脏病的发病率为千分之八,某研究者为探讨母亲吸烟是否会增大其小孩的先天性心 脏病的发病危险,对一群20~25岁有吸烟嗜好的孕妇进行了生育观察,在她们生育的120名小孩中,经筛查有4人患了先天性心脏病。请作统计分析。 五、某院康复科用共鸣火花治疗癔症患者56例,有效者42例;心理辅导法治疗癔症患者40例,有效者 21例。问两种疗法治疗癔症的有效率有无差别? 六、用兰芩口服液治疗慢性咽炎患者34例,有效者31例;用银黄口服液治疗慢性咽炎患者26例,有效 者18例。问两药治疗慢性咽炎的有效率有无差别? 七、用甲乙两种方法检查已确诊的乳腺癌患者120名。甲法的检出率为60%,乙法的检出率为50%,甲乙 两法一致的检出率为35%,问甲、乙两法的检出率有无差别? 八、某研究者将腰椎间盘突出症患者1184例,随机分为三组,分别用快速牵引法、物理疗法和骶裂孔药 物注射法治疗,结果如下表。问三种疗法的有效率有无不同? 三种疗法治疗腰椎间盘突出有效率的比较 疗法有效无效合计 快速牵引法444 30 474 物理疗法323 91 414 骶裂孔药物注射法222 74 296 合计989 195 1184 九、思考题: 1、常用的相对数有哪些?应用相对数时应注意的事项? 2、率的标准误与率的抽样误差 3、简述二项分布、Poisson分布和正态分布的区别与联系。 4、总体率的区间估计方法 5、2x卡方检验的用途与基本思想 6、行?列表资料2x检验的注意事项 7、普通四格表资料2x检验的应用条件及其表格、检验公式、步骤等 8、配对四格表资料2x检验的应用条件及其表格、检验公式、步骤等 χ检验有何异同? 9、两样本率比较的z检验与2 10、对于四格表资料,如何正确选用检验方法? 11、资料的对比应注意其可比性,可比性指的是什么?试举两例说明

spss教程常用的数据描述统计:频数分布表等统计学

第二节常用的数据描述统计 本节拟讲述如何通过SPSS菜单或命令获得常用的统计量、频数分布表等。 1.数据 这部分所用数据为第一章例1中学生成绩的数据,这里我们加入描述学生性别的变量“sex”和班级的变量“class”,前几个数据显示如下(图2-2),将数据保存到名为“2-6-1.sav”的文件中。 图2-2:数据输入格式示例 1.Frequencies语句 (1)操作 打开数据文件“2-6-1.sav”,单击主菜单Analyze /Descriptive Statistics / F requencies…,出现频数分布表对话框如图2-3所示。 图2-3:Frequencies定义窗口 把score变量从左边变量表列中选到右边,并请注意选中下方的Display frequency table复选框(要求

显示频数分布表)。如果您只要求得到一个频数分布表,那么就可以点OK按钮了。如果您想同时获得一些统计量,及统计图表,还需要进一步设置。 ①Statistics选项 单击Statistics按钮,打开对话框,请按图2-4自行设置。有关说明如下: (ⅰ)在定义百分位值(percentile value)的矩形框中,选择想要输出的各种分位数,SPSS提供的选项有: ●Quartiles四分位数,即显示25%、50%、75%的百分位数。 ●Cut points equal 把数据平均分为几份。如本例中要求平均分为3份。 Percentile显示用户指定的百分位数,可重复多次操作。本例中要求15%、50%、85%的百分位数。(ⅱ) 在定义输出集中趋势(Central Tendency)的矩形框中,选择想要输出的集中统计量,常用的选项有: ●Mean 算术平均数 ●Median 中数 ●Mode 众数 ●Sum 算术和 (ⅲ)在定义输出离散统计量(Dispersion)的矩形框中,选择想要输出的离散统计量,常用的选项有: ●Std. Deviation 标准差 ●Variance 方差 ●Range 全距 ●Minimum 最小值 ●Maximum 最大值 ●S.E. mean 平均数的标准误 (ⅳ)描述数据分布(Distribution)的统计量 ●Skewness 偏度,非对称分布指数。 ●Kurtosis 峰度,CASE围绕中心点的扩展程度。 另外,频数过程(Frequence)除了能够提供上面常用的统计量外,还可以对分组数据计算百分位数和中数(Values are group midpoints),即对于已经分组的数据,并且数据中的原始数据表示的是组中数的数据计算百分位数的值和中位数。

实验二 定量资料的统计推断

实验二定量资料的统计推断 (总体均数的估计及t检验、z检验、F检验) 一、随机抽样调查上海市区男孩出生体重(kg),得下表数据,问 1、99%的男孩出生体重在什么范围? 2、全市男孩出生体重均数在什么范围? 3、某男孩出生体重为4.5kg ,怎样评价? 4、在这些男孩中随机抽样,根据正态分布理论抽到体重≤2.15(kg)的男孩的可能性 是多少? 5、在这些男孩中随机抽查10人,抽到出生体重均数为≤3.2(kg)的样本的可能性约有多少? 体重人数 2.0~ 1 2.2~ 2 2.4~ 5 2.6~ 10 2.8~ 12 3.0~ 24 3.2~ 23 3.4~ 22 3.6~ 17 3.8~ 7 4.0~ 3 4.2~ 2 4.4~4.6 1 二、将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前后(治后一月)的血沉(㎜/小时)如下表。 病人号甲治疗前药治疗后1 2 3 4 5 6 7 8 9 10 20 23 16 21 20 17 18 18 15 19 16 19 13 20 20 14 12 15 13 13 病人号乙治疗前药治疗后1 2 3 4 5 6 7 8 9 10 19 20 19 23 18 16 20 21 20 20 16 13 15 13 13 15 18 12 17 14 1、甲、乙两药是否均有效? 2、甲、乙两药的疗效有无差别? 三、某地抽样调查了部分健康成人的红细胞数和血红蛋白量,结果如下表: 2、分别计算男、女两项指标的抽样误差。 3、试估计该地健康成年男、女红细胞数的均数。

4、该地正常成年男、女血红蛋白含量有无差别? 5、该地成年男、女两项血液指标是否均低于上表地标准值? 四、为研究某药物的抑癌作用,使一批小白鼠致癌后,按完全随机设计的方法随机分为四组,A 、B 、C 三个试验组和一个对照组,分别接受不同的处理,A 、B 、C 三个试验组,分别注射0.5m1、1.0m1和1.5m1 30%的注射液,对照组不用药。经一定时间以后,测定四组小白鼠的肿瘤重量(g),测量结果见下表。问不同剂量药物注射液的抑癌作用有无差别?如有差别,请用SNK-q 检验方法作多重比较。 某药物对小白鼠抑癌作用(肿瘤重量,g)的试验结果 五、为研究注射不同剂量雌激素对大白鼠子宫重量的影响,取4窝不同种系的大白鼠,每窝3只,随机地分配到3个组内接受不同剂量雌激素的注射,然后测定其子宫重量,结果见下表。问注射不同剂量的雌激素对大白鼠子宫重量是否有影响? 如有影响,请用Dunnett-t 检验方法作多重比较。 大白鼠注射不同剂量雌激素后的子宫重量(g) 大白鼠 种系 雌激素剂量(μg/100g) 0.25 0.5 0.75 A 108 112 142 B 46 64 116 C 70 96 134 D 43 65 98 六、思考题及名词解释 1、试述正态分布、z 分布及t 分布的联系和区别。 2、均数的可信区间与参考值范围有何不同?试比较95%参考值范围与95%总体均数可信区间。 3、抽样分布(数理统计)的中心极限定理的内容是什么? 4、试举例说明标准差与标准误(即均数的标准差)的区别与联系。 对照组 试 验 组 A B C 3.6 3.0 0.4 3.3 4.5 2.3 1.8 1.2 4.2 2.4 2.1 1.3 4.4 1.1 4.5 2.5 3.7 4.0 3.6 3.1 5.6 3.7 1.3 3.2 7.0 2.8 3.2 0.6 4.1 1.9 2.1 1.4 5.0 2.6 2.6 1.3 4.5 1.3 2.3 2.1

描述统计与推断统计

描述统计与推断统计-心理学统计与测量经典习题1 第一章描述统计 名词解释 1、描述统计(吉林大学2002研) 答:描述统计主要研究如何整理心理与教育科学实验或调查得来得大量数据,描述一组数据得全貌,表达一件事物得性质。具体内容有:数据如何分组,如何使用各种统计表与统计图得方法去描述一组数据得分组及分布情况,如何通过一组数据计算一些特征数,减缩数据,进一步显示与描述一组数据得全貌。 2、相关系数(吉林大学2002研) 答:相关系数就是两列变量间相关程度得数字表现形式,或者说就是表示相关程度得指标。作为样本得统计量用r表示,作为总体参数一般用ρ表示。相关系数不就是等距得度量值,因此在比较相关程度时,只能说绝对值大者比绝对值小者相关更密切一些,而不能进行加减乘除。 3、差异系数(浙大2003研) 答:差异系数,又称变异系数、相对标准差等,它就是一种相对差异量,为标准差对平均数得百分比。其公式如下: 常用于:①同一团体不同观测值离散程度得比较;②对于水平相差较大,但进行得就是同一种观测得各种团体,进行观测值离散程度得比较。 4、二列相关(中科院2004研) 答:如果两列变量均属于正态分布,其中一列变量为等距或等比得测量数据,另一列变量虽然也就是正态分布,但被人为地划分为两类。求这样两列变量得相关用二列相关。 5、集中量数与差异量数(浙大2000研,苏州大学2002研) 答:集中趋势与离中趋势就是次数分布得两个基本特征。数据得集中趋势就就是指数据分布中大量数据向某方向集中得程度,离中趋势就是指数据分布中数据彼此分散得程度。用来描述一组数据这两种特点得统计量分别称为集中量数与差异量数。 6、中位数(南开大学2004研) 答:中位数,又称中点数,中数,就是指位于一组数据中较大一半与较小一半中间位置得那个数,用Md或Mdn来表示。 7、品质相关(师大2002研)

《统计学》名词解释及公式

第1章统计与统计数据 一、学习指导 统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。 概念:统计学,描述统计,推断统计。 统计在工商管理中的应用。 统计的其他应用领域。 概念:分类数据,顺序数据,数值型数据。 不同数据的特点。 概念:观测数据,实验数据。 概念:截面数据,时间序列数据。 统计数据的间接来源。 二手数据的特点。 概念:抽样调查,普查。 数据的间接来源。 数据的收集方法。 调查方案的内容。 概念。抽样误差,非抽样误差。 统计数据的质量。 概念:总体,样本。 概念:参数,统计量。

概念:变量,分类变量,顺序变量,数值 型变量,连续型变量,离散型变量。 二、主要术语 1.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。 2.描述统计:研究数据收集、处理和描述的统计学分支。 3.推断统计:研究如何利用样本数据来推断总体特征的统计学分支。 4.分类数据:只能归于某一类别的非数字型数据。 5.顺序数据:只能归于某一有序类别的非数字型数据。 6.数值型数据:按数字尺度测量的观察值。 7.观测数据:通过调查或观测而收集到的数据。 8.实验数据:在实验中控制实验对象而收集到的数据。 9.截面数据:在相同或近似相同的时间点上收集的数据。 10.时间序列数据:在不同时间上收集到的数据。 11.抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推 断总体特征的数据收集方法。 12.普查:为特定目的而专门组织的全面调查。 13.总体:包含所研究的全部个体(数据)的集合。 14.样本:从总体中抽取的一部分元素的集合。 15.样本容量:也称样本量,是构成样本的元素数目。 16.参数:用来描述总体特征的概括性数字度量。 17.统计量:用来描述样本特征的概括性数字度量。 18.变量:说明现象某种特征的概念。 19.分类变量:说明事物类别的一个名称。 20.顺序变量:说明事物有序类别的一个名称。 21.数值型变量:说明事物数字特征的一个名称。

统计学复习必备

1、 描述统计与推断统计有何区别和联系? 描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计是研究如何利用样本数据来推断总体特征的方法。 联系:描述统计学和推断统计学是现代统计学的两个组成部分呢,相辅相成、缺一不可,描述统计学是现代统计学的基础和前提,推断统计学是现代统计学的核心和关键。 2、 统计数据的类型有哪些?(P5-6) 按照计量尺度不同,可分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法可以分为观测数据和实验数据;按照被描述的现象与时间的关系可分为截面数据和时间序列数据。 3、 简述数据误差来源?(P33-38) 统计数据的误差来源分为抽样误差和非抽样误差。抽样误差是由于抽样的随机性引起的样本结果与总体真值之间的误差。非抽样误差是相对抽样误差而言的,是指除抽样误差之外的由于其他原因引起的样本观察结果与总体真值之间的差异。 4、 衡量数据离散程度的指标有哪些(P96-104) 衡量数据离散程度的指标有:1.异众比率,用于测度分类数据的离散程度,衡量众数对一组数据的代表程度;2.四分位差,用于测量顺序数据的离散程度,衡量中位数对一组数据的代表程度;3.方差和标准差,用于测度数据离散程度的最常用测度值,衡量均值对一组数据的代表程度。 5、 为什么说正态分布是客观现象中最主要的分布?(P142) 正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布。从理论上看,正态分布具有很多良好的性质 ,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对

统计学(第三版)李金昌课后简答题----个人整理版汇总

《统计学》简答题 第一章 1.统计的含义与本质是什么? 含义:1、统计工作:调查研究。资料收集、整理和分析。 2、统计资料:工作成果。包括统计数据和分析报告。 3、统计学:研究如何搜集、整理、分析数据资料的一门方法论科学。 本质:就是关于为何统计,统计什么和如何统计的思想。 2.什么是统计学?有哪些性质? 统计学是关于如何收集、整理和分析统计数据的科学。统计学就其研究对象而言,具有数量性、总体性和差异性的特点;就其学科范畴而言,具有方法型、层次性和通用性的特点;就其研究方式而言,具有描述性和推断性的特点。 3.统计学数据可分为哪几种类型,不同类型数据各有什么特点? 1)按照所采用的计量尺度,可分为定性数据和定量数据 定性数据是只能用文字或数字代码来表现事物的品质特征或属性特征的数据,具体分为定序数据和定类数据。定量数据是只能用数值来表现事物数量特征的数据,具体分为定距数据和定比数据。 2)按照表现形式不同,可以分为绝对数、相对数和平均数 绝对数是用以反映现象或事物绝对数量特征的数据。以最直观、最基本的形式体现现象或事物的外在数量特征,有明确的计量单位,是表示直接数量标志或总量标志的形式。 相对数是用以反映现象或事物相对数量特征的数据。通过另外两个相关统计数据的对比来体现现象或事物之间的联系关系,其结果主要表现为没有明确计量单位的无名数。 平均数是用以反映现象或事物平均数量特征的数据。体现现象或事物某一方面的一般数量水平。 3)按收集方法,可分为观测的数据和实验的数据 观测数据:数据是在没有对事物进行人为控制的条件下得到的。 实验数据:数据是在实验中控制实验对象而收集到的。 4)按照被描述的对象和时间的关系,可分为截面数据和时间序列数据 截面数据:描述的是现象在某一时刻的变化情况。 时间序列数据:描述的是现象随时间而变化的情况。 5)按照加工程度不同,可以分为原始数据和次级数据 原始数据是指直接向调查对象收集的、尚待加工整理、只反映个体特征的数据,或通过实验采集的原始记录数据。 次级数据是指已经经过加工整理、能反映总体数量特征的各种非原始数据。 4.如何正确理解描述统计与推断统计的关系? 描述统计和推断统计是统计方法的两个组成部分。描述统计是整个统计学的基础,推断统计则是现代统计学的主要内容。描述统计对资料的数量特征及其分布规律进行测定和描述;而统计推断是指通过抽样等方式进行样本估计总体特征的过程,包括参数估计和假设检验两项内容。推断统计是和假设检验联系在一起的,这只是简单的描述现象,并没有进行假设,再利用数据检验,得出推断的结果。 5.统计研究的基本过程如何?常用的统计方法有哪些? 统计设计,数据搜集,数据整理,数据分析与解释(核心、最终目的) 常用的统计方法:大量观察发、统计分组法、综合指标法、统计推断法、统计模型法

统计学(第五版)贾俊平-课后思考题和练习题答案(完整版)

统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版) 第一部分思考题 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7举例说明离散型变量和连续性变量 离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度”。 1.8统计应用实例 人口普查,商场的名意调查等。 1.9统计应用的领域 经济分析和政府分析还有物理,生物等等各个领域。

统计学(复习)

第1章统计和统计数据 1统计学的定义:是收集、处理、分析、解释数据并从数据中得出结论的科学 描述统计与推断统计的含义、内容、目的。 描述统计: 是研究数据收集,处理和描述的统计学方法.其内容包括如何取得研究所需要的数据,如何用图表形式对数据进行处理和展示,如何通过对数据的综合,概括与分析,得出所关心的数据特征. 推断统计: 是研究如何利用样本数据来推断总体特征的统计学方法,内容包括两大类: 参数估计: 是利用样本信息推断所关心的总体特征. 假设体验:是利用样本信息判断对总体的某个假设是否成立. 2、变量与数据:不同数据类型的含义,会判断已有数据的类型. 变量:它们的特点是从一次观察到下一次观察会出现不同结果. Ex: 企业销售额, 上涨股票的家数, 生活费支出,投掷一枚骰子观察其出现的点数 数据: 把观察到的结果记录下来. 总体:包含所研究的全部个体(数据)的集合 样本: 从总体中抽取的一部分元素的集合 样本量: 构成样本的元素的数目 定量变量或数值变量:定量变量的观察结果称为定量数据或数值型数据.可以用阿拉伯数据来记录其观察结 果 .如“企业销售额”、“上涨股票的家数”、“生活费支出”、“投掷一枚骰子出现的点数” 定性变量:分类变量和顺序变量统称为定性变量 分类变量:表现为不同的类别.如“性别”、“企业所属的行业”、“学生所在的学院”等. 分类变量的观察结果就是分类数据 顺序变量或有序分类变量:具有一定顺序的类别变量. 如考试成绩按等级,一个人对事物的态度.顺序变量的观察结果就是顺序数据或有序分类数据 离散型变量: 只能取有限个值得随机变量 连续型变量:可以取一个或多个区间中任何值得随机变量 3、获得数据的概率抽样方法有哪些? 根据一个已知的概率来抽取样本单位,也称随机抽样 -简单随机抽样:从总体N个单位(元素)中随机地抽取n个单位作为样本,使得总体中每一个元素都有相同的机会(概率)被抽中. 抽取元素的具体方法有重复抽样是抽取一个个体记录下数据后,再把这个个体放回到原来的总体中参加下一次抽选。不重复抽样抽中的个体不再放回,再从所剩下的个体中抽取第二个元素,直到抽取n 个个为止。 - 分层抽样或分类抽样:它是在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。 -系统抽样或等距抽样:它是想将总体个元素按某个顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个元素,直至抽取n 个元素组成一个样本。

统计学基础课后全部详细答案与讲解

统计学第一至四章答案 第一章 一、思考题 1.统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。 统计方法可分为描述统计和推断统计。 2.统计数据的分类:按计量尺度:分类数据、顺序数据和数值型数据 按获取数据的方式:观测数据和实验数据 按数据与时间的关系:截面数据和时间序列数据特点:分类数据各类别之间是平等的并列关系,各类别之间的顺序可以任意改变;顺序数据的分类是有序的;数值型数据说明的是现象的数量特征,是定量数据;观测数据是通过调查或观测而收集到的数据,是在没有对事物进行人为控制的条件下得到的;实验数据是在实验中控制实验对象而收集到的数据;截面数据也称静态数据,描述的是现象在某一时刻的变化情况;时间序列数据也称动态数据,描述的是现象随时间的变化情况。 3.对武昌分校的全体教师进行工资调查,那么全体教师就是总体,从中抽取五十名教师进行调查,这五十名教师的集合就是样本,全体教师工资的总体平均值和总体标准差等描述特征的数值就是参数,五十名教师工资的样本平均值和样本标准差等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说教师的工资。 4.有限总体:指总体的围能够明确确定,而且元素的数目是有限可数

的。例如:武昌分校10级金融专业学生 无限总体:指总体所包含的元素是无限的、不可数的。例如:整个宇宙的星球 5.变量可分为分类变量、顺序变量、数值型变量。同时数值型变量可分为离散型变量和连续型变量。 6.离散型变量只能取有限个值,而且其取值都以整位数断开,可以一一列举,例如“产品数量”、“企业数”。连续型变量的取值指连续不断的,不能一一列举。例如“温度”、“年龄”。 二、练习题 1.(1)数值型变量(2)分类变量(3)数值型变量 (4)顺序变量(5)分类变量 2.(1)这一研究的总体是IT从业者,样本是从IT从业者中抽取的1000人,样本量是1000 (2)“月收入”是数值型变量 (3)“消费支付方式”是分类变量 3.(1)这一研究的总体是所有的网上购物者 (2)“消费者在网上购物的原因”是分类变量 第二章 一、思考题 1:答:1:普查的特点:①:普查通常是一次性的或周期性的; ②:普查一般需要规定统一的调查时间;③:普查的数据一般比较准确;4:普查的使用围比较狭窄,只能调查一些最基本的、

第六章分类资料的统计推断

1不满足正态近似条件,所以采用直接计算概率法。 H0:加维生素C的治愈率与不加相同,即π=π0=0.6 H1:加维生素C的治愈率高于不加维生素C,即π>π0 α=0.05 P(X≤8)=1-P(X≥9)=1-P(X=9)-P(X=10)=1-C109*0.69*0.41-C1010*0.610*0.40= 0.9536>0.05 不拒绝H0,差别无统计学意义,可以认为加维生素C的治愈率与不加相同。 2满足正态近似条件,采用正态近似法。 H0:经健康教育后的高血压患病率与以前相同,即π=π0=0.6 H1:经健康教育后的高血压患病率比以前降低,即π<π0 单侧α=0.05 u==4.9453536 u>u0.05,单侧=1.64 p<0.05,拒绝H0,接受H1,差别有统计学意义,可以认为经健康教育后的高血压患病率与以前有差别。 3①建立检验假设和确定检验水准 H0:男女大学生HBV感染对其心理影响相同,即π1 =π2 H1:男女大学生HBV感染对其心理影响不同,即π1≠π2 检验水准α=0.05 ②计算检验统计量 χ2=(ad-bd)2*n/(a+b)(c+d)(a+c)(b+d) =(250*213-246*320)/(250+320)(246+213)(250+246)(320+213)=9.651 ν=1 ③确定p值 查χ2届值表,得p<0.05 ④统计推断 按α=0.05水准,拒绝H O,接受H1,差别有统计学意义,可以认为HBV感染对不同性别的大学生在心理行为方面的影响不同。 4①建立检验假设和确定检验水准 H0:两组的治愈率相等,即π1 =π2 H1:两组的治愈率不等,即π1≠π2 检验水准α=0.05

统计学作业题

统计学作业题 专业:—————— 年级:—————— 班级:—————— 姓名:——————

第1章导论 1.某森林公园的一项研究试图确定哪些因素有利于成年松树长到60英以上的高度。经估计,森林公园生长着25 000棵成年松树,该研究需要从中机抽取250棵成年松树井丈量它们的高度后进行分析。该研究的总体是( )。 A. 250棵成年松树 B.公同中25 000棵成年松树 c.所有高于60英尺的成年松树 D.森林公园中所有年龄的松树 2.某森林公园的-项研究试图确定成年松树的高度。该研究需要从中随机抽取250棵成年松树并丈量它们的高度后进行分析。该研究所感兴趣的变量是( )。 A.森林公园巾松树的年龄 B.森林公园中松树的高度 c.森林公园中松树的数量 D.森林公园中树木的种类 3.推断统计的主要功能是( )。 A.应用总体的信息描述样本 B.描述样本中包含的信息 c.描述总体中包含的信息 D.应用样本信息描述总体 4.对高中生的一项抽样调查表明,85%的高中生愿意接受大学教育。这一叙述是( )的结果。 A.定性变量 B.试验 c.描述统计 D.推断统计 5.一名统计学专业的学生为了完成其统计作业,在图书馆找到的一本参考书中包含美国50个州的家庭收入中位数。在该生的作业中,他应该将此数据报告为来源于( )。 A.试验 B.实际观察 c.随机抽样 D.已发表的资料 6.某大公司的人力资源部主任需要研究公司雇员的饮食习惯。他注意到,雇员的午饭要么从家里带来,要么在公司餐厅就餐,要么在外面的餐馆就餐。该研究的目的是为了改善公司餐厅的现状。这种数据收集方式可以认为是( )。 A.观察研究 B.设计的试验 c.随机抽样 D.全面调查 7.下列不属于描述统计问题的是( )。 A.根据样本信息对总体进行的推断 B.感兴趣的总体或样本 c.图、表或其他数据汇总工具 D.对数据模式的识别 8.下列不属于推断统计问题的是( )。 A.感兴趣的总体 B.对数据模式的识别 c.需要调查的变量 D.对总体推断结果的可靠性度量 9.某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书 上的花费是250元。该研究人员感兴趣的总体是( )。 A.该大学的所有学生 B.所有的大学生 c.该大学所有的一年级新生 D.样本中的200名新生 10.某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。在研究中,该研究人员感兴趣的变量是( )。 A.该大学-年级新生的教科书费用 B.该大学的学生数 c.该大学新生的年龄 D.大学生的生活成本 11. 1990年发表的一份调查报告显示,为了估计佛罗里达州有多少居民愿意支付更多的税金以保护海滩的环境不受破坏,共有2 500户居民接受了调查。 在该项调查中,最有可能采用的数据收集方法是( )。 A.设计的试验 B.公开发表的资料 c.随机抽样 D.实际观察 12.在下列叙述中,关于推断统计的描述是( )。 A.一个饼图描述了某医院治疗过的癌症类型,其中2%是肾癌,19%是乳腺癌 B.从一个果园中抽取36个椅子的样本,用该样本的平均重量估计果园中椅子的平均重量

分类资料的统计分析A型选择题-30页精选文档

第十章分类资料的统计分析 A型选择题 1、下列指标不属于相对数的是() A、率 B、构成比 C、相对比 D、百分位数 E、比 2、表示某现象发生的频率或强度用 A 构成比 B 观察单位 C 相对比 D 率 E 百分比 3、下列哪种说法是错误的() A、计算相对数尤其是率时应有足够数量的观察单位数或观察次数 B、分析大样本数据时可以构在比代替率 C、应分别将分子和分母合计求合计率或平均率 D、相对数的比较应注意其可比性 E、样本率或构成比的比较应作假设检验 4、以下哪项指标不属于相对数指标( ) A.出生率

B .某病发病率 C .某病潜伏期的百分位数 D .死因构成比 E .女婴与男婴的性别比 5、计算麻疹疫苗接种后血清检查的阳转率,分母为( ). A.麻疹易感人群 B.麻疹患者数 C.麻疹疫苗接种人数 D.麻疹疫苗接种后的阳转人数 E.年均人口数 6、某病患者120人,其中男性114人,女性6人,分别占95%与5%,则结论为( ). A.该病男性易得 B.该病女性易得 C.该病男性、女性易患率相等 D.尚不能得出结论 E.以上均不对 7、某地区某重疾病在某年的发病人数为0α,以后历年为1α,2α,…,n α,则该疾病发病人数的年平均增长速度为( )。 A. 1 ...10+++n n ααα B. 110+??n n ααα C.n n 0 α α

D.n n 0 α α -1 E. 10 -a a n 8、按目前实际应用的计算公式,婴儿死亡率属于( )。 A. 相对比(比,ratio ) B. 构成比(比例,proportion ) C. 标准化率(standardized rate ) D. 率(rate ) E 、以上都不对 9、某年某地乙肝发病人数占同年传染病人数的9.8%,这种指标是 A .集中趋势 B .时点患病率 C .发病率 D .构成比 E .相对比 10、构成比: A.反映事物发生的强度 B 、反映了某一事物内部各部分与全部构成的比重 C 、既反映A 也反映B D 、表示两个同类指标的比 E 、表示某一事物在时间顺序上的排列 11、构成比之重要特点是各组成部分的百分比总和: A.必大于1

统计学课后思考

什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 解释分类数据,顺序数据和数值型数据 答案同 举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 变量的分类 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。

第六章分类资料的统计推断(pdf 6)

第六章 分类资料的统计推断 分类资料中最常用的统计方法是2χ检验,确切概率法,另外还有秩和检验。秩和检验在后一章介绍,本章重点介绍2χ检验,其它方法简略讲述。 6.1 四格表资料2χ检验 例 6.1 某医院治疗慢性肾炎病人,其中用西药治疗79例,有效者63人,有效率79.75%,用中药治疗54例,有效者47人,有效率87.04%,问两种药物治疗慢性肾炎有效率是否相同? 处理 有效 无效 西药组 63 16 中药组 47 7 具体步骤: 1. 数据录入 设变量group 代表处理组(西药组为1,中药组为2),变量effect 代表是否有效(有效为1,无效为0),变量f 代表频数,即例数。如西药组有效例数为63,则group 为1,effect 为1,freq 为63。数据格式如图6.1。 2.统计分析 首先依次选取Data -weight Cases ,展开对话框如图6.2,选择Weight cases by ,将freq 选入Frequency Variable :框,即赋予权重;然后依次选取Analyze -Descriptive Statistics -Crosstabs ,展开对话框如图6.3,将group 选入Rows 框,effect 选入Columns 框,或相反; 该对话框下方有三个按钮:Statistics 、Cells 和Format ,现将其子对话框选项介绍如下: Statistics 选择要输出的统计量,常用的有2χ(Chi -square )、Pearson 相关系数

χ(McNemar)(Correlations)、Kappa系数(Kappa)、相对危险度(Risk)、配对2 等。 Cells指定多维分布表中显示实际频数、理论频数、行列及全部百分比和残差等。 Format指定行顺序(升序或降序)。 在对话框下方还有两个选项:Display Clustered Bar Charts(输出直方图)和Suppress Tables(不输出多维分布表)。 本例仅计算2 χ,单击Statistics,弹出对话框如图6.4,选取Chi-square。返回主对话框,单击OK提交执行。 χ检验数据格式 图6.1 2

如何区分描述统计学与推断统计学

咨询热线:400—703—0600 我要调查网——市场调查公司专用的在线调查平台 专业!方便!快速!经济! 如何区分描述统计学与推断统计学 统计学被广泛的应用于各个领域之上,从物理和社会科学,再到人文科学,甚至被用在工商业及政府的情报决策当中。统计学又可分为描述统计学和推断统计学,那么要怎样来区分她们呢? 我们先来了解描述统计学和推断统计学的概念: 描述统计学(descriptive statistics)是研究如何取得反映客观现象的数据,并通过图表形式对所搜集的数据进行加工处理和显示,进而通过综合概括与分析得出反映客观现象的规律性数量特征的一门学科。 (摘于百度百科) 推断统计学(inferential statistic )是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。(摘于百度百科) 因此我们可以得出两者的共同点:两者都以概率论为理论基础,都是数理统计学,都是应用数学的一个分支,都可分为数理统计([数理]统计理论与方法)与应用统计(专业统计)两部分,都属于。研究自然与社会现象的通用科学。 描述统计学和推断统计学之间的不同点: 第一、产生年代不同:一般认为描述统计学产生于二十世纪二十年代以前,以K .毕尔生为代表;推断统计学产生于二十世纪二十年代以后,以费雪为代表。我们可以以费雪为分界点,费雪以前为描述统计学,费雪以后为推断统计学;这两个阶段并无明确的分界时间,其发展是渐进的,不是突变的。 第二、研究特点不同:描述统计学研究如何简缩数据并描述这些数据的方法,一般包括:统计分析方法,分类原理,汇总,统计表,统计图,频数分配,时间数列,指数,相关,估计推算等。推断统计学研究如何在随机抽样的基础上推论有关总体数量特征的方法,一般包括:统计推断原上推论有关总体数量特征的方法,一般包括:统计推断原理,实验设计,估计理论,抽样调查,复变数分析,序列分析,误差理论,假设检验,决策理论等。 第三、研究样本不同:描述统计学研究大样本理论,所谓大样本即包括多数个体或多数数值的样本;推断统计学肝究小样本理论,所谓小样本即包括少数个体或少数数恼的样本。应当指出,大小或多少之分也是相对的,缺乏严格的划分标消。据多数统汁学者的意见:如果研究的是一个粮纯项目,则包含三十项以上的数值或个体的样本即可视为大样本;但也有人主张采用五十或一百为划分标准的。 第四、应用统计的性质不完全相同。描述统计学派和推断统计学派都把其统计学看作是通用科学,可以用来研究自然与社会现象;但在其应用统计方面则略有不同。描述统计学派在应用统计——生物统计、经济统计等方面,仍残留者凯特勒的实质科学的影响;推断统计学在应用统计——物理统计、田间设计、质量管理、经济预测等方面,基本上已转变为通用的方法论科学。 综合上面的论据我们就不难区分描述统计学与推断统计学,充分利用两者进行在线调查统计,增加调查结果的精准性。在线调查https://www.360docs.net/doc/ce8555336.html,

常见统计量

?一、T检验 ?用途:?比较两组数据之间的差异 前提:正态性,?方差?齐次性,独?立性 假设:H0: μ0=μ1 H1: μ0≠μ1 SPSS中对应?方法: 1、单样本T检验(One-sample Test) (1)??目的:检验单个变量的均值与给定的某个常数是否?一致。 (2)判断标准:p<0.05;t>1.98即认为是有显著差异的。 2、独?立样本T检验(Independent-Samples T Test) (1)??目的:检验两个独?立样本均值是否相等。 (2)判断标准:p<0.05;t>1.98即认为是有显著差异的。 3、配对样本T检验(Paired-Samples T Test) (1)??目的:检验两个配对样本均值是否相等。 (2)判断标准:p<0.05;t>1.98即认为是有显著差异的。 ! ?二、?方差分析 ?用途:?比较多组数据之间的差异 前提:正态性,?方差?齐次性,独?立性 假设:H0: μ0=μ1=…… H1: μ0,μ1,……不全相等 SPSS中对应?方法: 1、单因素?方差分析(One-way ANOVA) (1)??目的:检验由单?一因素影响的多组样本均值差异。 (2)判断标准:p>0.05;t<1.98即认为是有显著差异的。 (3)特别说明:可以进?一步使?用LSD,Tukey?方法检验两两之间的差异。 2、多因素?方差分析(Univariate) (1)??目的:检验由多个因素影响的多组样本均值差异。 (2)判断标准:p>0.05;t<1.98即认为是有显著差异的。 (3)特别说明:可以进?一步使?用LSD,Tukey?方法检验两两之间的差异。! 三、?非参数检验 ?用途:?比较多组数据之间的差异,独?立性等

实习2 定量资料的统计推断1

实习二 定量资料的统计推断 一、目的要求 1、掌握抽样误差、标准误、可信区间的概念及计算; 2、熟悉t 分布; 3、掌握假设检验的基本原理、有关概念(如I 、II 类错误)及注意事项; 4、掌握t 检验和u 检验的适用条件、基本步骤等。 二、主要内容 (一)基本概念 1.抽样误差 2.可信区间 (二)t 分布 1.以0为中心,左右对称的单峰分布; 2.t 分布曲线是一簇曲线,其形态与自由度v 的大小有关。自由度v 越小,则t 值越分散,曲线越低平;自由度v 逐渐增大时,t 分布逐渐逼近u 分布(标准正态分布);当v 趋于∞时,t 分布即为u 分布。 (三)总体均数的估计 1、点估计 2、区间估计 ①σ未知且n 较小:(/2X X t S αν-,,/2v X X t S α+,) ②σ未知但n 足够大:(/2X X u S α-,/2X X u S α+) ③σ已知:(X u X σα2/-,X u X σα2/+) (四)假设检验的步骤及有关概念 1、基本思想:小概率事件和反证法 2、基本步骤 (1)建立检验假设,确立检验水准 (2)选择检验方法,计算检验统计量 (3)确定P 值,下结论 P <α,拒绝H 0,接受H 1,差异有统计学意义,可以认为……不同。

P>α,不拒绝H0,差异无统计学意义,尚不能认为……不同。 3、两类错误: Ⅰ型错误是拒绝了实际上成立的H0,也称为“弃真”错误,用α表示。统计推断时,根据研究者的要求来确定。 Ⅱ型错误是不拒绝实际上不成立的H0,也称为“存伪”错误,用β表示。但β值的大小一般很难确切估计,只有已知样本含量n、两总体参数的差值δ以及检验水准α的条件下,才能估算出β的大小。 4、注意事项 (五)t检验和u检验 1、t检验的应用条件:独立性;σ未知且n较小时,要求样本来自正态分布总体;两样本均数比较时,还要求两样本所属总体的方差齐性。 2、u检验的应用条件:独立性;σ未知但n足够大(如n>100)或σ已知。 3、t检验与u检验,检验统计量的计算: 三、SPSS操作演示 1、单样本t检验 2、两独立样本t检验 3、两配对样本t检验 四、课堂讨论 1.根据以下案例资料回答问题:在对两组药物治疗某心血管病的临床试验研究中,选择了140例受试对象,得到如下结果:

相关文档
最新文档