心理统计学重点分析大全

心理统计学重点分析大全
心理统计学重点分析大全

心理统计学重点分析

一.描述统计

(一)统计图表

1)统计图

次数分布图:

①直方图:用以矩阵的面积表示连续性随即变量次数分布的图形。

②次数多边形图:一种表示连续性随机变量次数分布的线形图,属于次数分布图。

③累加次数分布图:分为:累加直方图和累加曲线图;

其中累加曲线的形状大约有三种:一种是曲线的上枝长于下枝(正偏态),另一种是下枝长于上枝(负偏态),第三种是上枝,下枝长度相当(正态分布)。

其他统计图:条形图:用于离散型数据资料;

圆形图:用于间断性资料;

线形图:更多用于连续性资料,凡预表示两个变量之间的函数关系,或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的情况,用这种方法比较好。

散点图:

2)统计表

①简单次数分布表

②分组次数分布表

③相对次数分布表:将次数分布表中各组的实际次数转化为相对次数,即用频数比率表示。

④累加次数分布表

⑤双列次数分布表:对有联系的两列变量用同一个表来表示其次数分布。

(二)集中量数

1)算术平均数M

优点:反应灵敏;计算严密;计算简单;简明易解;适合于进一步用代数方法演算;较少受抽样变动的影响;

缺点:受极端数据的影响;若出现模糊不清的数据时,无法计算平均数;

计算和运用平均数的原则:同质性原则;平均数与个体数值相结合的原则;平均数与标准差。方差相结合原则;

性质:

①在一组数据中每个变量与平均数之差的总和等于零

②在一组数据中,每一个数都加上一个常数C,所得的平均数为原来的平均数加常数C

③在一组数据中,每一个数都乘以一个常数C,所得的平均数为原来的平均数乘以常数C

2)中数:Md按顺序排列在一起的一组数据中居于中间位置的数,即这组数据中,一般数据比它大,一般数据比它小。注意计算方法;

3)众数:Mo是指在次数分布中出现次数最多的那个数值;

三者的关系:正偏态分布中,M>Md>Mo

负偏态分布中,M

Mo=3Md-2M(自己推导一下)

(三)差异量数

差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数。

1)离差与平均差

离差:分布中的某点到均值得距离,其符号表示了某分数与均值之间的位置关系,而数值表示了它们之间的绝对距离。所有的离差之和始终为零。

=-

x

平均差:次数分布中所有原始数据与平均数绝对离差的平均值。2)方差与标准差

(1)总体的方差和标准差

方差:每个数据与该组数据平均数之差乘方后的均值,即离均差

平方后的均数。

作为样本统计量用符号s2表示,作为总体参数用符号σ2表示,也叫均方。

标准差:方差的平方根

作为样本统计量用符号s表示,作为总体参数用符号σ表示。

(2)样本的方差和标准差

样本的变异性往往比它来自的总体的变异性要小。为了校正样本数据带来的偏差,在计算样本方差时,我们用自由度来矫正样本误差,从而有利于对总体参数更好的无偏差估计:

2

1

SS

S

n

=

-

(3)性质

①每一个观测值都加一个相同的常数C之后,计算得到的标

准差等于原来的标准差;

②每一个观测值都乘以一个相同的常数C,所得到的标准差等于

原标准差乘以这个常数。

3)变异系数

当遇到下列情况时,不能用绝对差异量来比较不同样本的离散程度,而应当使用相对差异量数,最常用的就是差异系数。

①两个或两个以上样本所使用的观测工具不同,所测的特质相同

②两个或两个以上样本使用的是同种观测工具,所测的特质相

同,但样本间水平差异较大

差异系数:一种最常用的相对差异量,为标准差对平均数的百分比

注题目:变异系数与标准差的区别于联系?

标准差反映了一个次数分布的离散程度,当对同一个特质,使用

同一种测量工具进行测量,所测样本水平比较接近时,直接比较

标准差的大小即可以知道样本间离散程度的大小;但是当遇到下列情况,则不能直接比较标准差: (1)两个或两个以上的样本所使用的观测工具不同,所测的特质不同; (2)两个或两个以上的样本使用的是同一种观测工具,测量的也是同一种特质,但样本间的水平相差较大;

在第一种情况下,标准差的单位不同,显然不能直接进行比较;第二种情况下,虽然标准差单位相同,但样本的水平不同,通常情况下,平均数的值较大,其标准差的值一般也较大;平均数的值越小,其标准差的值也越小;

(四)相对量数

1)百分位数:第P百分位数就是指在其值为P的数值以下,包括分布中全部数据的百分之p,其符号是Pp;

2)百分等级:常模团体中低于该分数的人所占总体的百分比;

百分位数的逆运算;

3)标准分数

(1)定义

标准分数:以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数,也叫Z分数

离平均数有多远,即表示原始分数在平均数以上或以下几个标准差的位置。

(2)性质

①Z分数无实际单位,是以平均数为参照点,以标准差为单位的

一个相对量

②一组原始分数转换得到的Z分数可正可负,所有原始分数的Z

分数之和为零

③原始数据的Z分数的标准差为1

④若原始分数呈正态分布,则转换得到的所有Z分数均值为0,

标准差为1的标准正态分布

(3)优点

①可比性——不同性质的成绩,一经转换为标准分数,就可在同

一背景下比较;

②可加性——不同性质的原始数据具有相同的参照点,因此可相

加;

③明确性——知道了标准分数,利用标准正态分布表就能知道其

百分等级;

④稳定性——转换成标准分数之后,规定了标准差为1,保证了不同性质分数在总分数中权重一样。 (4)缺点

①标准分数过于抽象不易理解;

②在非正态分布下,分布形态不同的分数,仍然不能进行比较,也不能相加求和;

(五)相关量数

相关系数:两列变量间相关程度的数字表现形式

作为样本的统计量用r 表示,作为总体参数一般用ρ表示。 正相关:两列变量变动方向相同

负相关:两列变量中有一列变量变动时,另一列变量呈现出与前一列变量方向相反的变动

零相关:两列变量之间没有关系,各自按照自己的规律或无规律变化

1)积差相关 (1)前提

①数据要成对出现,即若干个体中每个个体都有两种不同的观测值,并且每队数据与其它对子相互独立,N 应不小于30对; ②两列变量各自总体的分布都是正态的,至少接近正态; ③两个相关的变量是连续变量,也即两列数据都是测量数据; ④两列变量之间的关系应是直线性的; (2)公式(注意协方差:∑xy/N )

2)等级相关(就是Spearman 等级相关) 适用范围

适用于只有两列变量,而且是等级变量性质的具有线性关系的资料,若原始数据为等比或等距,则先转化为顺序型数据 3)肯德尔等级相关

(1)肯德尔W 系数(等级评定法)

也叫肯德尔和谐系数,原始数据资料的获得一般采用等级评定法,即让K 个被试对N 件实物进行等级评定。其原理是评价者评价的一致性除以最大变异可能性。

R i :评价对象获得的K 个等级之和, N :等级评定的对象的数目, K :等级评定者的数目。 (2)肯德尔U 系数#

其与肯德尔W 系数所处理的问题相同,但评价者采用对偶比较法,即将N 件事物两两配对分别进行比较。

r ij 为对偶比较记录表中i>j 格中的择优分数。 当完全一致时U=1.

当完全不一致时,U=-1/K(K 为奇数)

U=-1/(K-1) (K 为偶数) 4)点二列相关与二列相关 (1)点二列相关

适用于一列数据为等距或等比数据,而且其总体分布为正态,另一列为离散型二分称名变量。多用于评价是非类测验题组成的测验的内部一致性等问题;

p X 是与二分称名变量的一个值对应的连续变量的平均数,q

X 是与二分称名变量的另一个值对应的连续变量的平均数,p 与q 是二分称名变量两个值各自所占的比率,s t 是连续变量的标准差 (2)二列相关

适用于两列变量都是正态等距变量,但其中一列变量被人为地分成两类。

注: 两者之间的区别: 二分变量是否为正态分布,总的原则是,如果不是十分明确,观测数据的分布形态是否为正态分布,这是不管观测数据代表的是一个真正的二分变量还是基于正态分布的人为的二分变量,都用点二列相关;当确认数据分布形态为正态分布,都应选用二列相关; 5)Ф相关

适用于两个变量都是只有两个点值或只表示某些质的属性。 其中a 、b 、c 、d 分别为四格表中左上、右上、左下、右下的数据

具体见卡方检验

二.推断统计

(一)推断统计的数学基础 (略)

(二)参数估计

1)点估计,区间估计,与标准误 (1)一个良好估计量的标准:(1)无偏性:即用多个样本的统计量作为总体参数的估计值,其偏差的平均值为0;例如,用样本平均数作为总体平均数μ的估计值,就是无偏性;因为无限多

个样本平均数X 与μ的偏差之和为零;但方差S 2不是σ2

的无偏

估计,σ2 的无偏估计是:S 2n-1=∑x 2

/(N-1)

(2)有效性:当总体参数的无偏估计不止一个统计量时,无偏估计变异量小者有效性高,变异大者有效性底,即方差越小越好;例如μ的估计量有Mo,Md,X 但是,只有X 是变异量最小。

(3)一致性:即当样本无限增大,估计值应能够越来越接近它所估计的总体参数,估计值越来越精确,

逐渐接近于真值;即当N →∞,X →μ,S 2n-1→σ2

;

(4)充分性:指一个容量为n 的样本统计量,是否充分地反映了全部n 个数据所反映的总体信息。例如X 能反映所有数据所代表的总体的信息,故X 的充分性高;二Mo ,Md 只反映了部分数据所反映的总体信息,充分性低; (2)区间估计:

区间估计的原理是根据样本分布理论,应样本分布的标准误计算区间长度,解释总体参数落入某置信区间可能的概率; 2)总体平均数的估计

3)标准差与方差的估计(可以先算出方差的区间,再求标准差的区间)

(三)假设检验

1)假设检验的原理: (1)两类假设

备则假设:因变量的变化、差异却是是由于自变量的作用 往往是我们对研究结果的预期,用H 1表示。

虚无假设:实际上什么也没有发生,我们所预计的改变、差异、处理效果都不存在观察到的差异只是随机误差在起作用,用H 0表示。

(2)小概率原理

小概率原理:小概率事件在一次试验中几乎是不可能发生的。 两类错误

Ⅰ型错误:当虚无假设正确时,我们拒绝了它所犯的错误,也叫α错误。 Ⅱ型错误:当虚无假设是错误的时候,我们没有拒绝所犯的错误,也叫β错误。 两类检验的关系

①α+β不一定等于1

②在其他条件不变的情况下,α与β不可能同时减小或增大 (4)检验的方向性

单侧检验:强调某一方向的检验,显著性的百分等级为α

双侧检验:只强调差异不强调方向性的检验,显著性百分等级为α/2

2)样本与总体平均数差异的检验 3)两样本平均数差异的检验 4)方差齐性的检验: (1)样本方差与总体方差

当从正态分布的总体中随机抽取容量为n 的样本时,其样本方差

与总体方差比值服从χ2分布:由自由度查χ2

表,依据显著性水平判断

(2)两个样本方差之间

①独立样本(双侧检验)

②相关样本

5)相关系数的显著性检验

①积差相关

a.当ρ=0时:

b.当ρ≠0时:先通过查表将r和ρ转化为费舍Z r和Zρ然后进行Z检验。

(四)方差分析

1)方差分析的原理与基本过程

方差分析的基本假定(1) 总体正态分布,也就是要求样本必须来自正态分布的总体;

(2)变异的相互独立性,总变异可以分解成为几个来源不同的部分,这几个部分的来源必须明确,而且彼此要相互独立;

(3)各实验处理内的方差要一致,各实验处理内的方差彼此应无显著差异,这是方差分析中最为重要的基本假定。

方差分析中的方差齐性检验:Fmax=S2max/S2min (07年考过大题)

2)完全随机设计的方差分析

查F表时查单侧表

注意利用样本统计两进行方差分析的例子

3)随机区组设计的方差分析

自由度的计算:dfT=N-1;

dfB=k-1

dfw=dfR+dfE drR=n-1 ;dfE=(k-1)(n-1);

注意SSR的公式

4)事后检验

为什么不能用t检验?会使α错误的概率明显增加。

使用的方法N-K检验法;HSD检验法;详见《甘怡群》P135和《张厚粲》P290;

5)二因素分析

(1)基本概念:

一个2*3的两因素实验设计,A因素有两个水平,B因素有三个水平;

当忽略b因素个水平的差异,只取A因素的A1水平和A2水平计算方差时,得到A因素的主效应;同理B因素的主效应;

当一个因素的不同水平在另一个因素不同水平上的变化趋势不一致时,就产生了交互作用;

(2)事后比较

对二因素方差分析进行事后比较,其中主效应的检验与单因素方差分析原理相同,但是交互作用的事后比较,则包含事后整体检验和事后多重比较两种情况;

第一,二因素方差分析主效应显著后,不一定要进行事后多重比较,进行事后多重比较的前提是有三个以上的水平;

第二,多因素交互效应显著后,对主效应必须进行事后比较;这里的多因素是指3个或三个以上的水平,由于不能确定是哪几个水平建有显著差异,因此必须进行事后比较;另外,对主效应的进一步解释,需要通过多重比较分析;

主效应的检验是在忽略其他因素的情况下检验一个因素的处理效应; 第三,交互效应的事后比较,包括限定提条件的主效应的整体比

较(单纯主效应比较,上面说到了),和达到显著性水平后,该限定条件的主效应的事后多重比较(了解)

注: 交互作用不显著,检验每个因素的主效应就很重要,但若交

互作用显著,则对每个因素的主效应的检验,意义就不大了;

另外,主效应的事后比较与主效应的检验是两回事;

主效应的事后比较是指一个因素不同水平间(一般至少3个)确定到底哪几个间存在显著差异;

主效应的检验,就和单因素的检验原理相同;

(五)回归分析

1)一元线性回归分析

(1)最小二乘法:

(2)回归系数与相关系数的关系:

(3)线性回归的基本假设:

①线性关系假设:X,Y在总体上具有线性关系;

②正态性假设:Y服从正态分布;

③独立性假设:有两个意思:一个是某一个X对应的一组Y值和与另一个X对应的一组Y值之间没有关系,彼此独立;另一个就是,误差项独立,不同的X所产生的误差之间应相互独立,且与自变量也应独立;

④误差等分散性假设:特定X水平的误差,除了呈随机化的常态分布,其变异量也应相等,称为误差等分散性;

2)一元线性回归方程的检验

方差分析法

3)测定系数

()

()T R RR

SS

Y

Y

Y

Y

r=

-

-

=

∑2

2

2

?

就是说相关系数的平房等于回归平方和在总平方和中所占的比例,如果说2

r=0.64,表明变异量Y的变异中有64%是由变量X 引起的,或者说有64%可以由X的变异解释。所以2

r叫做测定系数;

4)一元线性回归方程的应用

回归分析的目的,就是在测定自变量X与因变量Y的关系为显著相关后,借助于你和的较优回归模型来预测在自变量X为一定值时因变量Y的发展变化。当我们根据给出的X值而预测得到点估计Y时,Y只代表了预测值的中点,而计算在特定置信区间内的区间估计则依靠以下公式:根号部分当n很大时近似为1其中t

的自由度取 n-2,

p

Y为对应该

P

X的方程解出的点估计Y值;(六)卡方检验

卡方检验的假设:(1)分类相互排斥,互不包容;

(2)观测值相对独立;

(3)期望次数的大小:每个单元格中期望次数至少在5以上,分类中不超过20%的类别的理论次数可以小于5。

单元格人数过少时处理方法:(1)单元格合并法

(2)增加样本数

(3)去除样本法

(4)使用校正公式

其中为观察次数;为理论期望次数

公式的适用范围要求观察彼此之间独立,并且单位格的理论期望次数不能小于5(小于5时可与相邻的组合并)

1)拟合度检验

χ2匹配度检验是用样本数据来检验总体分布的形状或比率,以确定与假设的总体性质的匹配度。

2)独立性检验

χ2独立性检验帮助我们考察多种因素的不同分类之间是否独立。它是检验行和列两个变量彼此有无关联的一种统计方法,适用于命名型变量和顺序型变量。

(七)非参数检验

1)独立样本均值差异的非参数检验

总差异

组内差异组间差异

个体差异随机误差

1)秩和检验法

①两样本容量均小于10

将容量较小的样本的各数据等级求和,T值检验表中的临界值比较。

②两样本容量均大于10

(2)中数检验法

①将两个样本数据混合从小到大排列

②求混合排列的中数

③分别找出每个样本中大于和小于中数的数据的个数,列成四格

表(中数本身不在内)

④对四格表卡方检验公式进行计算

2)相关样本均值差异的非参数检验

(1)符号检验法

①对子数小于25(实得r值大于表中r的临界值时,说明差异无

统计学意义;)

对于样本每对数据之差来记录符号,求出正负号分别的个数,用

其中较小的个数作为观测值r对照临界值表检验

(2)维尔克松检验法(符号等级检验法)实得T值大于表中T

的临界值时,说明差异无统计学意义

①对子数小于25时

a.把相关样本对应数据之差值按照绝对值从小到大排列

b.在各等级前加上原来差值的正负号

c.分别求出正号等级和负号等级的秩和,取其中较小的值作为T

d.由n值查表检验T

现代心理与教育统计学第07章习题解答

1. 何谓点估计与区间估计,它们各有哪些优缺点? 点估计就是总体参数不清楚时,用一个特定的值,即样本统计量对总体参数进行估计,但估计的参数为数轴上某一点。 区间估计是用数轴上的一段距离来表示未知参数可能落入的范围,它不具体指出总体参数是多少,能指出总体未知参数落入某一区间的概率有多大。 点估计的优点是能够提供总体参数的估计值,缺点是点估计总以误差的存在为前提,且不能提供正确估计的概率。 区间估计的优点是用概率说明估计结果的把握程度,缺点是不能确定一个具体的估计值。 2以方差的区间估计为例说明区间估计的原理 根据χ2分布: 总体方差的.95或.99置信区间为: 即总体参数(方差)落入上述区间的概率为1-α,其值为95%或99% 3.总体平均数估计的具体方法有哪些? 总体方法为点估计好区间估计,区间估计又分为: (1) 当总体分布正态方差已知时,样本平均的分布为正态分布,故依据正态分布理论估计其区间;(2)当总体分布正态方差未知时,样本平均数的分布为T 分布,依据T 分布理论估计其区间;(3)当总体非分布正态方差未知时,只有在n 大于30时渐近T 分布,样本平均数的分布渐近T 分布,依据T 分布理论估计其区间。 4总体相关系数的置信区间,应根据何种分布计算? 应根据Fisher 的Z 分布进行计算 5.解 依据样本分布理论该样本平均数的分布呈正态 其标准误为: 其置信区间为: 该科成绩的真实分数有95%的可能性在78.55----83.45之间。 6.解:此题属于总体分布正态总体方差未知的情形,故样本平均数的分布呈T 分布 其标准误为: 用df=99差T 值表,然后用直线内插法求得t α/2=1.987 其置信区间为: 该学区教学成绩的平均值有95%的可能在78.61---81.39之间。 7解:此题属于总体分布正态总体方差已知 计算标准误 ()()222212221σσσχnS S n X X n =-=-=-∑()()22/121222/2111)(ααχσχ----<<-n n S n S n 25.116 5===n x σσ45 .8355.7825.1*96.18125.1*96.1812/2/<<+<<-?+<

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

(完整word版)医学统计学试题和答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

统计学考试要点整理

2010级3班整理生物统计学基础知识整理 生物统计学整理 第一部分名词解释本文档仅供参考,仍有不足,有许多名词没有交待,需自己补充。本资料与课本,课后习题册搭配使用效果更好,有疑问联系大正 1生物统计学:是一门探讨如何从事生物学实验研究的设计,取样,分析,资料整理与推 论的科学.是数理统计在生物学研究中的应用,它是应用数理统计的 原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科, 属于应用统计学的一个分支。 2总体:统计学研究的全部对象叫做总体,分为无限总体和有限总体。 3个体:构成总体的每个成员称为个体。 4样本:总体的一部分称为样本 5样本含量:样本内包含的个体数目称为样本含量 6抽样:从总体中获得样本的过程。 7连续性数据:与某种标准做比较所得到的数据称为连续型数据,又称为度量数据 8离散型数据:由记录不同类别个体的数目所得到的数据,称为离散型数据 9变量的方法:对连续性数据进行分析的方法,通常称为变量的方法 10属性的方法:对离散型数据进行分析的方法 11对于数据的变异程度,经常使用的度量方法有三中,1 范围或称为极差 2 平均离差 3 标准离差或称为标准差 12概率论:研究偶然现象本身规律性的科学 13统计学:基于实际观测结果,利用概率论得出的规律,揭示偶然性中所寄寓的必然性 的科学 14随机实验:在我们做第一次观测时,并不能准确得知下一次的结果,这样的实验叫做随机实验 随机误差:试验过程中,由于各种无法控制的随机因素所引起统计量与参数之间的偏差,称之为随机误差。 15基本事件:试验的每一最基本结果用小写拉丁字母表示

2.什么叫总体?什么叫样本?为什么要抽样?怎样抽样? 1)总体:统计学研究的全部对象叫做总体,分为无限总体和有限总体。 2)样本:总体的一部分称为样本 3)从总体中获得样本的过程称为抽样,抽样的目的是希望通过对样本的 研究,推断其总体。生物统计学中往往总体数目是无限个,为方便研究总 体特征需要抽样。 4)从总体中抽取样本时,总体中的每一个个体被抽中的机会必须都一样,不能带有偏见,我们得到的样本应该是该市总体的一部分,需要进行随机 抽样。随机抽样的方法很多,例如抽签,拈阄等。最好方法是使用随机数 字表进行抽样。 5)随即数字表抽样步骤:第一步,闭上眼睛用铅笔在随机数字表上任意 点上一点,假若点到奇数,就用第一页表;假若点到偶数,就用第二页表。 第二步,在选定的那一页上,在点一次,决定从那个字开始。决定开始以 后进行读书(例如,总体有 4728 个个体,那就四位数字为一节读下去,

现代心理与教育统计学复习资料

现代心理与教育统计学 复习资料 Revised as of 23 November 2020

1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。

统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、 次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 %100 N f

医学统计学考试重点

考试题型: 名词解释10个 选择20个 填空题20个 简答4-5个 讨论分析1-2题 计算1-2题 绪论 2选1 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 2选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是

统计学重点

简答 1、抽样框是包含全部抽样单位的名单框架。主要有三种形式:名单抽样框;区域抽样框;时间表抽样框。 2、样本估计量的标准差定义为抽样平均误差;抽样平均误差的平方为抽样方差;一定概率下抽样误差的可能范围,称为极限误差 3、必要抽样数目因素影响(1)总体方差(或总体标准差)(2)允许误差范围(3)置信度(4)抽样方法(5)抽样组织形式 4、估计量:样本指标又称样本统计量与或估计量。 标准为:无偏性;有效性;一致性 5、点估计常用的方法有哪两种?其基本思想是什么?一是矩估计法。其基本思想是:由于样本来源于总体,样本矩在一定程度上反映了总体矩,而且由大数定律可知,样本矩依概率收敛与总体矩。因此,只要总体x的k阶原点矩存在,就可用样本矩作为相应总体矩的估计量,用样本矩的函数作为总体矩的函数的估计量。 二是极大似然估计法。其基本思想是:设总体分不函数形式已知,但又未知参数,未知参数可以取很多值,在未知参数的一切可能取值中选一个使样本观测值出现的概率为最大的参数作为估计量。 6什,么是抽样推断?抽样推断都有哪几方面的特点? 答:抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推断总体相应数量特征的统计分析方法。特点:(1)是由部分推算整体的一种认识方法论。(2)建立在随机取样的基础上。(3)运用概率估计的方法。(4)抽样推断的误差可以事先计算并加以控制。 7,什么是参数和统计量?各有何特点? 答:参数指的就是某一个全及指标,它反映了全及总体某种数量特征,统计量即样本指标,它反映了样本总体的数量特征。其特点是:全及指标是总体变量的函数,但作为参数其指标值是确定的、唯一的,是由总体各单位的标志值或标志属性决定的;而统计量是样本变量的函数,是总体参数的估计值,其数量由样本各单位标志值或标志属性决定,统计量本身也是随机变量, 8数据计量尺度:定类尺度、定序尺度、定距尺度、定比尺度。其中定类是分类数据,定序是顺序数据,定距和定比是数值型数据。 常用的调查方式:统计报表、普查、抽样调查、重点调查、典型调查。 9.方差分析:是检验多个总体均值是否相等的统计方法。它是通过检验个总体的均值是否相等来判断分类型自变量对数值型因变量是否有影响。表面上看,方差分析是检验多个总体均值是否相同,但本质上他所研究的是分类型自变量对数值型因变量的影响。例如,他们之间有没有关系,关系的密切程度如何等。10,一组数据的分布从三个方面进行测度:集中趋势,离散程度,偏态和峰太。数据的集中趋势是指一组数据项某一中心靠拢的倾向,它反映了一组数据中心点的位置所在,数据的离散程度反映了各变量值远离其中新的程度,数据的偏态和峰太是测度数据分布形状的两个重要指标。, 11离散系数是用来对两组数据的差异程度进行相对比较的。因为在比较相关的.两组数据的差异时,方差和标准差是以均值为中心计算的,因而有时直接比较方差是不准确的,需要剔除均值大小不等的影响,计算并比较离散系数。他是从相对的角度观察差异和离散系数的,在比较相关事务的差异程度时,较之直接比较标准差要好。 1.一个完整的统计调查方案应包括那些内容? 答:1、确定目的和任务;2、确定对象和单位;3、确定内容,拟定调查表;4、确定时间和期限;5、确定方法;6、确定组织和计划。 2.统计调查误差哪有几种?如何防止或尽量减少调查误差?答:统计调查误差有两种,一种是登记误差,一种是代表性误差。防止和减少登记误差,应制定周密的调查方案,并抓好调查方案的实施工作,利用先进的设备和手段。防止代表性误差,关键在于调查单位的选取。在重点调查和典型调查中应加强选取单位前的研究,在抽样调查中则要严格遵守随机抽样原则,以便选出的调查单位对总体具有较高的代表性。 3.对于连续型变量编制组距式变量数列组限应如何设置?为 什么? 答:对于连续型变量编制组距式变量数列组限应重叠设置。因为连续型变量的数值是连续不断的,相邻两值之间可以取无限个数值,在编制组距式变量数列时,如果组限不重叠设置,就会使一部分变量值无阻可归。 4.简述总量指标的作用? 答:总量指标是对社会经济现象的认识的起点,是实行经济管理的依据之一,是计算其它形式的统计指标的基础。 5.总体单位总量和总体标志总量有何区别? 答:总体单位总量是指总体中单位数的总和,总体标志总量是总体各单位某项指标值之和,二者是从同一总体的俩个方面来看的,它们的含义和作用都不相同。但二者的地位随着研究目的的不同和总体的变化而发生变化。区分它们的关键在于指标本身所反映的内容,属于总体单位的个数为总体单位总量,属于总体中各单位某一标志值的总和为总体标志总量。 6.简述时期指标和时点指标的特点? 答:1、时期指标数值可以连续计数,即通过连续登记获得数据,每个数据都说明了现象在一段时期内发生的总量;而时点指标只能间断计数,即每隔一定时间登记一次,每个数据都表示现象在某一时点上达到的水平。2、性质相同的时期指标数值可以相加,相加后说明较长时期内现象发展的总量;时点指标数值一般相加后没意义。3、同类时期指标数值大小与时期长短成正比;时点指标数值大小与时点间隔长短没有直接关系。 7.平均指标有何作用? 答:平均指标的作用有:1、可以对比同类现象在不同单位、地区的一般水平;2、可以对比某一现象在不同时间的变化;3、可

现代心理与教育统计学复习资料

第一章 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。

4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 %100 N f

(三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 四、其他统计图表 条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。 圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。

统计学原理考试知识点整理

第1章 绪论 1、统计的含义统计一词最基本的含义是对客观事物的数量方面进行核算和分析,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。 2、统计的特点P3 数量性 具体性 综合性 3、统计学的若干基本概念 总体与总体单位P10: 总体是指在某种共性的基础上由许多个别事物结合起来的整体,构成总体的个别事物叫总体单位; 总体的特征:同质性,大量性,差异性;总体的分类:有限总体与无限总体;标志、变异与变量P10: 标志,是指说明总体单位特征的名称。变异:总体单位之间品质和数量上的差异,即可变标志在总体各单位之间所表现出的差异。变量:可变的数量标志。 连续型变量与离散型变量联系和区别:连续型:变量值可作无限分割的变量离散型:变量值只能以整数出现的变量指标与标志P11 (指标,说明总体数量特征的概念)区别:第一,指标说明总体的特征,而标志则说明总体单位的特征。第二,指标只反映总体的数量特征,所有指标都要用数字来回答问题,没有用文字回答问题的指标。而标志既有反映数量也有反映品质。 第2 章统计调查 1、统计调查的含义及其在统计工作中的地位P13 含义:根据统计研究的目的,有组织、有计划地搜集统计资料的过程地位:是统计工作的第一阶段,是整个统计工作的基础一环 2、统计调查的基本原则P13-14 一、要实事求是,如实反映情况 二、要及时反映,及时预报 三、要数字与情况相结合 3、统计调查的组织形式:普查P14:含义:为搜集某种社会经济现象在某时某地的情况而专门组织的一次性全面调查、优缺点:,适用场合:主要用于一些重要项目呢的调查,如人口普查、耕地普查、基本单位普查、工业普查和库存普查等; 随机抽样调查P14:含义(按随机原则(机会均等原则)从总体中抽取部分单位进行调查,并借以推断和认识总体的一种统计方法)以及具体的抽样方法【第七章】系统抽样、多阶 简单随机、分层抽样、整群抽样、 段抽样)及适用场合;非随机抽样:含义(调查者有意识地或随意而 非随机地从总体中抽取部分单位进行调查的统计方法)以及具体的抽样方法P15 (重点抽样:只对总体中为数不多但影响颇大的重点单位进行研究的一种非

张厚粲现代心理与教育统计学第4版知识点总结课后答案

第1 章绪论 1.1 复习笔记 本章重点 ?心理与教育统计的研究内容 ?选择使用统计方法的基本步骤 ?统计数据的基本类型 ?心理与教育统计的基本概念 一、统计方法在心理和教育科学研究中的作用 (一)心理与教育统计的定义与性质 1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。 (二)心理与教育科学研究数据的特点 1.心理与教育科学研究数据与结果多用数字形式呈现。 2.心理与教育科学研究数据具有随机性和变异性。 3.心理与教育科学研究数据具有规律性。 4.心理与教育科学研究的目标是通过部分数据来推测总体特征。 (三)学习心理与教育统计应注意的事项 1.学习心理与教育统计学要注意的几个问题: (1)学习心理与教育统计学时,必须要克服畏难情绪。心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。 (2)在学习时要注意重点掌握各种统计方法使用的条件。 (3)要做一定的练习。 2.应用心理与教育统计方法时要做到: (1)克服“统计无用”与“统计万能”的思想,注意科研道德。 (2)正确选用统计方法,防止误用和乱用统计。 二、心理与教育统计学的内容 心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别: (一)分类一 依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。如图1-1 所示:

预防医学考试重点完整最新版

预 防 医 学 医学统计学 第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异:由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本特性代表性随机性可靠性可比性 3选1 小概率事件:我们把概率很接近于0(即在大量中出现的频率非常低)的事件称为小概率事件。 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 3选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。 随机测量误差:在收集原始资料时,仪器由于各种偶然因素造成同一对象多次测定的结果不一致。 统计的步骤(考填空题,四个空) 医学统计工作的内容 1.实验设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研 究中最关键的一环,是今后工作应遵循的依据。 2.收集资料:应采取措施使能取得准确可靠的原始数据。 3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分 析资料包括统计描述和统计推断。 实验设计的基本原则(考填空题,三个空) 随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。 对照的类型空白对照实验对照标准对照 自身对照相互对照历史对照安慰剂对照 2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样 本,用算得的样本统计量估计未知的总体参数。 统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机 变量。 完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解2选1) 完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 第二章集中趋势的统计描述 频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤: 例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1

现代心理与教育统计学(张厚粲)课后习题答案

现代心理与教育统计学(张厚粲)课后习题答案 第一章绪论(略) 第二章统计图表(略) 第三章集中量数 4、平均数约为36.14;中位数约为36.63 5、总平均数为91.72 6、平均联想速度为5.2 7、平均增加率约为11%;10年后的毕业人数约有3180人 8、次数分布表的平均数约为177.6;中位数约为177.5;原始数据的平均数约为176.7 第四章差异量数 5、标准差约为1.37;平均数约为1.19 6、标准差为26.3;四分位差为16.03 7、5cm组的差异比10cm组的离散程度大 8、各班成绩的总标准差是6.03 9、次数分布表的标准差约为11.82;第一四分位为42.89;第三四分位为58.41;四分位差为7.76 第五章相关关系 5、应该用肯德尔W系数。 6、r=0.8;r R=0.79;这份资料只有10对数据,积差相关的适用条件是有30对以上数据,因此这份资料适用等级相关更合适。 7、这两列变量的等级相关系数为0.97。 8、上表中成绩与性别有很强的相关,相关系数为0.83。 9、r b=0.069小于0.2.成绩A与成绩B的相关很小,成绩A与成绩B的变化几乎没有关系。 10、测验成绩与教师评定之间有一致性,相关系数为0.87。 11、9名被试的等级评定具有中等强度的相关,相关系数为0.48。 12、肯德尔一致性叙述为0.31。 第六章概率分布 4、抽得男生的概率是0.35 5、出现相同点数的概率是0.167 6、抽一黑球与一白球的概率是0.24;两次皆是白球与黑球的概率分别是0.36和0.16 7、抽一张K的概率是4/54=0.074;抽一张梅花的概率是13/54=0.241;抽一张红桃的概率是13/54=0.241;抽一 张黑桃的概率是13/54=0.241;抽不是J、Q、K的黑桃的概率是10/54=0.185

医学统计学考试重点

医学统计学考试重点 The latest revision on November 22, 2020

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 真实情况拒绝H 不拒绝H

H 正确Ⅰ型错误(ɑ) 推断正确(1ɑ) 不正确推断正确(1β) H Ⅱ型错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H 为假时却被接受,取伪错误 Ⅱ型错误(β错误): H 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数)

统计学复习重点

1、统计学:是收集、汇总和分析统计数据的科学和艺术。 2、统计数据的分析是统计学的核心内容,它是通过统计描述和统 计推断的方法探索数据内在规律的过程。 3、普查:是为某一特定目的而专门组织的一次性全面调查,如人口普查、工业普查、农业普查等。 4、抽样调查的特点:经济性;时效性高;适应面广;准确性高。 5、调查方案:是指导整个过程的纲领性文件,其内容包括调查目的、调查对象和调查单位、调查项目和调查表等内容。 6、组距分组的几个步骤:一、确定组数二、确定组距三、确定组限和进行次数分配四、绘制统计图五、分析。) 7、为消除组距不同对频数分布的影响,需要计算频数密度,即频数密度=频数/组距,用频数密度才能准确反映频数分布的实际情况。8、以组中值作为代表值有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组距中值两侧呈对称分布。 9、描述统计的内容也包括频数分布、但主要是关于集中趋势和离中趋势的描述问题。 10、众数:是一组数据中出现次数最多的变量值。从分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数,记为M。 11、众数是一组数据中心位置的一个代表值。当然,如果数据的分布没有明显的集中趋势或最高峰点,众数也可以不存在;如果有多个高峰点,实际上也可以认为有多个众数。

12、协方差的大小会受到计量单位和数据均值水平的影响,从而使不同相关总体之间的相关程度缺乏可比性。 13、时间系列:是反映现象随时间的变化而变化的数据系列,也称为时间数列或动态数列。 14、用报告期水平减去基期水平,就等于增长量。其中,当基期水平为上期水平时,就称为逐期增长量,当基期水平为某个时期的固定发展水平时,就称为累计增长量。 15、报告水平与基期水平之比,称为发展速度。其中,当基期水平为上期水平时,就称为环比发展速度;当基期水平为某个时期的固定发展水平时,就称为定基发展速度。 16、序时平均数也称为动态平均数,它反映现象在一定时期内发展水平达到的一般水平。由于指标形式分绝对数、相对数和平均数等,所以对其平均的方法存在差异性。 17、绝对数有时期数和时点数之分,两者的区别主要在于是否具有可加性。 18、几何平均法的应用条件是要求现象呈现均匀变动。如果现象发生大起大落的变化,用几何平均法所计算的平均发展速度将失去代表性。 19、累计法考虑各时期的发展状况,不只是受最初和最末两个极端值的影响。 20、移动平均法是趋势变动分析的一种较简单的常用方法。该方法的基本思想和原理是,通过扩大原时间序列的时间间隔,并按一定的间

现代心理与教育统计学

心理统计学 第一章概述 描述统计 定义:研究如何把心理与教育科学实验或调查得来得大量数据科学得科学得加以整理概括与表述 作用:使杂乱无章得数字更好得显示出事物得某些特征,有助于说明问题得实质。 具体内容:1数据分组:采用图与表得形式。 2计算数据得特征值:集中量数(平均数中数)离散量数(方差) 3计算量事物间得相关关系:积差相关(2列 3列多列) 推断统计 定义:主要研究如何利用局部数据(样本数据)所提供得信息,依据数理统计提供得理论与方法,推论总体情形。 作用:用样本推论总体。 具体内容:1如何对假设进行检验。 2如何对总体参数特征值进行估计。 3各种非参数得统计方法。 心理与教育统计基础概念 数据类型 一从数据来源来划分 1计数数据:计算个数或次数而获得得数据。(都就是离散数据) 2测量数据:借助一定测量工具或测量标准而获得得数据。(连续数据) 二根据数据所反映得测量水平 1称名数据(分类) 定义:指用数字代表事物或数字对事物进行分类得数据。

特点:数字只就是事物得符号,而没有任何数量意义。 统计方法:百分数次数众数列联相关卡方检验等。(非参检验) 2顺序数据(分类排序) 定义:指代事物类别,能够表明不同食物得大小等级或事物具有得某种特征得程度得数据。(年级) 特点:没有相等单位没有绝对零点。不表示事物特征得真正数量。 统计方法:中位数百分位数等级相关肯德尔与谐系数以及常规得非参数检验方法。3等距数据(分类排序加减(相等单位))(真正应用最广泛得数据) 定义:不仅能够指代物体得类别等级,而且具有相等得单位得数据。(成绩温度) 特点:真正得数量,能进行加减运算,没有绝对零点,不能进行乘除计算。 统计方法:平均数标准差积差相关 Z检验 t检验 F检验等。 4比率数据(分类排序加减法乘除法(绝对零点)) 定义:表明量得大小,也具有相等单位,同时具有绝对零点。(身高反应时) 特点:真正得数字,有绝对零点,可以进行加减乘除运算。 在统计中处理得数据大多就是顺序数据与等距数据。 三按照数据就是否具有连续性 离散数据连续数据 变量观测值随机变量 变量:指心理与教育实验观察调查种想要获得得数据。数据获得前用“x”表示,即为一个可以取不同熟知得物体得属性或事件,其数值具有不确定性,因而称为变量。观测值:就是研究中确定得某一变量得取值。 随机变量:表示随机现象各种结果得变量称为随机变量 三总体样本个体 总体:具有某种共同特质得一类事物。(欲研究得研究范围) 样本:构成总体得每个基本单元。

医学统计学考试重点

医学统计学考试重点Prepared on 21 November 2021

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 不 真实情况拒绝H 拒绝H 正确Ⅰ型错误(ɑ) 推 H 断正确(1ɑ) 不正确推断正确(1β) Ⅱ型 H 错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H Ⅱ型错误(β错误): H 为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S =S/√n x ㈡样本率 率的抽样误差:样本率p和总体率π的差异

统计学基础知识考试重点

统计学基础知识考试重点 第一章统计和数据 第二章 ●统计是用来处理数据的,是关于数据的一门学问。 1、统计学:是用以收集数据、分析数据和由数据得出结论的一组概念、原则和方法。 2、统计分析数据的方法分为:(1)描述统计(2)推断统计 3、描述统计:是研究数据搜集、处理和描述的统计学方法。 4、推断统计:是研究如何利用样本数据来推断总体特征的统计学方法。 5、推断统计包括:(1)参数估计(2)假设检验 6、定性变量的特点: 只反映现象的属性特点,不能说明具体量的大小和差异。 ●定性变量包括分类变量和顺序变量。 ●只反映现象分类特征的变量称分类变量。分类变量没有数值特征,所以不能对其数据进行数学运算。 ●如果类别具有一定的顺序,这样的变量称为顺序变量。顺序变量不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。 7、定量变量的特点: 可以用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异。 ●数值型数据(定量数据)作为统计研究的主要资料,其特征在于它们都是以数值的形式出现的,有些数值型数据只可以计算数据之间的绝对差,而有些数值型数据不仅可以计算数据之间的绝对差,还可以计算数据之间的相对差。其计量精度远远高于定性数据。在统计学研究中,数值型数据有着最广泛的用途。 8、数据按获取的方法不同分为:(1)观测数据(2)实验数据 9、观测数据:是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。 10、实验数据:一般是在科学实验环境下取得的数据。 11、统计数据资料的来源: (1)通过直接的调查或实验获得的原始数据,这是统计数据的直接来源; (2)别人调查的间接数据,并将这些数据进行加工和汇总后公布的数据,这是数据的间接来源。 12、数据的直接来源:(1)统计调查(2)实验法 ●通过统计调查得到的数据,一般称为观测数据。 ●运用实验法时,实验组和对照组的产生应当是随机的。 13、数据的间接来源:

相关文档
最新文档