教育统计学公式汇总

合集下载

统计学常用公式

统计学常用公式统计学是一门研究数据收集、分析、解释和表达的科学。

在统计学中，有许多常用的公式被广泛应用于数据处理和推断分析。

本文将介绍一些统计学常用公式，并对其进行说明和用途解释。

一、描述统计学公式1. 平均值（Mean）平均值是一组数据的总和除以数据的个数，即：$\bar{X} = \frac{X_1 + X_2 + \cdots + X_n}{n}$其中，$\bar{X}$表示平均值，$X_i$表示第i个数据，n表示数据的个数。

2. 中位数（Median）中位数是将一组数据按照大小排列后，处于中间位置的数值。

当数据个数为奇数时，中位数即为排列后正中间的数；当数据个数为偶数时，中位数为排列后中间两个数的平均值。

3. 众数（Mode）众数是一组数据中出现频率最高的数值。

4. 标准差（Standard Deviation）标准差衡量数据的离散程度，其计算公式为：$SD = \sqrt{\frac{(X_1 -\bar{X})^2 + (X_2 -\bar{X})^2 + \cdots + (X_n -\bar{X})^2}{n-1}}$5. 方差（Variance）方差是标准差的平方，即：$Var = SD^2$6. 百分位数（Percentile）百分位数是指一组数据中某个特定百分比处的数值。

比如，第25百分位数是将一组数据从小到大排列后，处于前25%位置的数值。

二、概率与统计公式1. 随机变量期望（Expectation）随机变量期望是描述随机变量平均值的指标，也称为均值。

对于离散型随机变量X，其期望计算公式为：$E(X) = \sum_{i=1}^{n} X_i \cdot P(X_i)$对于连续型随机变量X，其期望计算公式为：$E(X) = \int_{-\infty}^{\infty} x \cdot f(x)dx$其中，$X_i$表示随机变量X的取值，$P(X_i)$表示对应取值的概率，$f(x)$表示X的概率密度函数。

教育统计学计算公式列表

教育統計學計算公式列表 01.算數平均數NX x i∑=02.加權平均數 N1∑∑∑===Ki ii iii Xf x X x 或ωω03.幾何平均數)][log(exp{)][log()log(121X GM X GM XX X X GM NNi iNn 平均數平均數===⋅=∏=04.調和平均數)]}([{)]([)HM (1)111(11121X HM X X N X X X N HM Ni iN倒數平均數倒數倒數平均數倒數===+++=∑=05.探索性資料分析4/)2(2/)(2/)(3131min Q Md Q Q Q X X MAX ++=+=-=三重平均數中間四分距中間全距06.全距 min X X MAX -=ω 07.平均差NNx X AD ∑∑=-=χ08.標準差定義式NNX X S NNX X Sx X SS x x∑∑∑∑∑∑=-==-==-=2222222)()()(χχχ均方根差變異數離均差平方和09.樣本變異數代替母群體變異數1)(1)(2222--==--=∑∑∑N x X S vN X X S x x χ10.標準差計算式NNX XNX X S NNX XNX X SN X X x X SS x x∑∑∑∑∑∑∑∑∑-=-=-=-=-=-=2222222222)()()()()()(11.變異係數 100⨯=xS CV x15.四分差 213Q Q Q -=16.四分位數變異係數 3113Q Q Q Q CQV +-=17.中位數絕對差NMdX MAD i∑-=18.分散係數 ))((Md N MdX CD i∑-=19.變異比 Nf VR Mo -=1 20.分歧性指標∑=-=----=ki i kP P P P ID 12222211121.質的變異指標 kk P P P IQV k /)1(122221-----=22.百分等級 NR PR )50100(100--= 23.百分位數 h f F N PRl P pp )100(-+= 24.z 分數 xx S S x X z χ=-=25.各種標準分數 5001002051002010015100165010+=+=+=+=+=+=z SAT z ACT z AGCT z WISC z BSS z T26.積差相關 yx xy yxxyS S S Nz z r ==∑27.共變數 Nxy N y Y x X S xy∑∑=--))((28.以和、平方和、交叉乘積和計算積差相關NY YNX XNY X XY r xy ∑∑∑∑∑∑∑---=2222)()(29.原始分數回歸方程式x b y aS S NX X N Y X XY b a bX Y xxy ˆˆ)(ˆmin)(2222-==--==--∑∑∑∑∑∑30.標準分數回歸方程式 xy Z Z β=ˆ xy yx xy x r S S bS S S b ===2β31.離均差平方和nX XnY X XY NY Y SS NX XN YX XY SS NY Y SS y Y y Y y Y SS SS SS res reg t resreg t 2222222222222)(][])([)(][)()ˆ()ˆ()(∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑----=--=-=-+-=-+=32.決定係數])(][)([][222222NY Y NX X NY X XY SS SS r treg ∑∑∑∑∑∑∑---==33.期望值 ∑==i i X P X E μ)( 34.期望值變異數222222)()(μμμσ-=-=-=∑i i X P X E X E35.期望值共變數y x xy XY E Y E x E XY E S μμ-=-=)()()()(36.母群體變異數2σ的不偏估計值算法2222221)()()(σμσ=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡--+=∑∑∑N N X X E N X E 37.ｚ分配 N x x z x/σμσμ-=-=38.Ｘ2分配 ∑∑=-==212)(i ni i z X σμχ39.Ｆ分配 122221df df F χχ=40.ｔ分配 dfzt 2χ=41.積差相關係數t 考驗公式 2212-=---=N df N r r t ρ。

统计学常用公式汇总

《统计学原理》常用公式汇总组距＝上限－下限组中值＝（上限+下限）÷2 缺下限开口组组中值＝上限－1/2邻组组距缺上限开口组组中值＝下限+1/2邻组组距111平均指标 1.简单算术平均数：2.加权算术平均数或iii.变异指标1.全距＝最大标志值－最小标志值2.标准差: 简单σ=；加权σ= 3.标准差系数:第五章抽样估计1.平均误差：重复抽样：不重复抽样：2.抽样极限误差3.重复抽样条件下：平均数抽样时必要的样本数目成数抽样时必要的样本数目4.不重复抽样条件下：平均数抽样时必要的样本数目第七章相关分析 1.相关系数2.配合回归方程ｙ＝ａ＋ｂｘ3.估计标准误：第八章指数分数一、综合指数的计算与分析(1)数量指标指数此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度。

(-)此差额说明由于数量指标的变动对价值量指标影响的绝对额。

(2)质量指标指数此公式的计算结果说明复杂现象总体质量指标综合变动的方向和程度。

（-）此差额说明由于质量指标的变动对价值量指标影响的绝对额。

加权算术平均数指数=加权调和平均数指数=(3)复杂现象总体总量指标变动的因素分析相对数变动分析：=×绝对值变动分析：-= (-)×（-）第九章动态数列分析一、平均发展水平的计算方法：(1)由总量指标动态数列计算序时平均数①由时期数列计算②由时点数列计算在间断时点数列的条件下计算：a.若间断的间隔相等，则采用“首末折半法”计算。

公式为：b.若间断的间隔不等，则应以间隔数为权数进行加权平均计算。

公式为：(2)由相对指标或平均指标动态数列计算序时平均数基本公式为：式中：代表相对指标或平均指标动态数列的序时平均数；代表分子数列的序时平均数；代表分母数列的序时平均数；逐期增长量之和累积增长量二. 平均增长量＝─────────＝─────────逐期增长量的个数逐期增长量的个数(1)计算平均发展速度的公式为：(2)平均增长速度的计算平均增长速度＝平均发展速度-１（100%）。

统计学常用公式

统计学常用公式统计学是一门研究数据收集、整理、分析和解释的学科。

在统计学中，公式是非常重要的工具，用于计算和推导各种统计指标和结果。

下面是一些统计学中常用的公式，它们可以帮助我们理解和应用统计学的基本概念和方法。

1. 数据的中心趋势度量在统计分析中，我们经常需要了解数据的中心趋势，即数据的集中程度或平均水平。

以下是几个常用的中心趋势度量公式：- 平均值（Mean）：一组数据中所有观测值的总和除以观测值的个数。

- 中位数（Median）：将一组数据按照大小排序，位于中间位置的观测值。

- 众数（Mode）：出现次数最多的观测值。

- 加权平均值（Weighted Mean）：将每个观测值乘以相应的权重，然后求和并除以总的权重和。

2. 数据的离散程度度量除了了解数据集中在哪里，我们还需要了解数据的离散程度，即数据分散的程度。

以下是几个常用的离散程度度量公式：- 方差（Variance）：一组数据与其平均值之差的平方的平均值。

- 标准差（Standard Deviation）：方差的算术平方根。

- 平均绝对偏差（Mean Absolute Deviation）：一组数据与其平均值之差的绝对值的平均值。

3. 数据的相关性度量在统计分析中，我们常常需要了解两个或多个变量之间的相关性。

以下是几个常用的相关性度量公式：- 协方差（Covariance）：一组数据中两个变量之间的协方差。

协方差的正负表示两个变量是正相关还是负相关。

- 相关系数（Correlation Coefficient）：协方差除以两个变量各自的标准差的乘积。

相关系数的取值范围为-1到1，越接近-1或1表示相关性越强。

4. 抽样误差估计在统计学中，我们通常只能对样本数据进行分析，从而推断总体的特征。

以下是几个常用的抽样误差估计公式：- 样本标准差（Sample Standard Deviation）：类似于总体标准差，但在计算时使用样本数据。

- 样本均值（Sample Mean）：类似于总体均值，但在计算时使用样本数据。

统计学基本公式

平均数基本公式: 一、总体单位总量总体标志总量算术平均数=（调和平均数）简单算术平均： nx x ∑=加权算术平均： ∑∑=fxf x 或 ∑∑=ffxx二、调和平均数：简单调和平均： ∑=xn H 1 加权调和平均： ∑∑=xm m H三、几何平均数：简单：nx G ∏= 加权： ∑∏=ff x G四、众数：下限： d L M O 211∆+∆∆+= 上限：d U M O 212∆+∆∆-=五、中位数:下限： d f S fL M mm e 12--+=∑ 上限：d f S fU M mm e 12+--=∑中位数的位次: M e 2∑=f标志变异指标：标准差：简单: nx x ∑-=2)(σ 加权：∑∑-=ffx x 2)(σ方差：简单： nx x ∑-=22)(σ加权： ∑∑-=ffx x 22)(σ成数： N N p 1=NN q 0= 1=+p q交替标志：平均数：p x = 标准差： )1(p p p -=σ方差)1(2P P P -=σ标准差系数: %100⨯=xV σσ分析计算题:1、星河公司2009年四个季度的销售利润率分别是12％、11％、13%和10％，同期的销售额分别是1000万元、1200万元、1250万元和1000万元.友谊公司同期的销售利润率分别是13％、11％、10%和12％，利润额分别是130万元、132万元、120万元和144万元，试通过计算比较两家公司2009年全年销售利润率的高低。

2、课本 P 93 17题动态分析指标：一、平均发展水平：总量指标时间数列：1、时期数列：na a ∑=2、时点数列: 连续型：等间隔:na a ∑=不等间隔：∑∑=ffa a不连续型：等间隔: na a a a a n n 22110++⋅⋅⋅++=-不等间隔： 12111232121222---+⋅⋅⋅++++⋅⋅⋅++++=n n n n f f f f a a f a a f a a a相对指标时间数列： ba c =平均指标时间数列：同上二、增长量：逐期增长量： 01a a -12a a - 23a a -… 1--n n a a 累计增长量： 01a a -02a a -03a a -…0a a n -平均增长量1)1()()()(011201-+-=-+⋅⋅⋅+-+-=-n a a n a a a a a a n n n三、发展速度：环比发展速度：1a a12a a23a a …1-n n a a 定基发展速度:1a a2a a3a a …a a n两者之间关系： 1、112010-⨯⨯⨯=n n n a a a a a a a a 2、110--=n n n na a a a a a平均发展速度： n x x ∏=nn a a x 0= n R x =长期趋势测定方法：(时间数列变动分析）方程法：根据时间数列的数据特征，建立一个合适的趋势方程来描述时间数列的趋势变动,推算或预测个时期的趋势值。

(完整word版)统计学常用公式

公式一1. 众数【MODE 】（1）未分组数据或单变量值分组数据众数的计算未分组数据或单变量值分组数据的众数就是出现次数最多的变量值。

（2）组距分组数据众数的计算对于组距分组数据，先找出出现次数最多的变量值所在组，即为众数所在组，再根据下面的公式计算计算众数的近似值。

下限公式： 1012M =L++i ∆⨯∆∆ 式中：0M 表示众数；L 表示众数的下线；1∆表示众数组次数与上一组次数之差；2∆表示众数组次数与下一组次数之差；i 表示众数组的组距。

上限公式：2012M =U-+i ∆⨯∆∆ 式中：U 表示众数组的上限。

2．中位数【MEDIAN 】（1）未分组数据中中位数的计算根据未分组数据计算中位数时，要先对数据进行排序，然后确定中位数的位置。

设一组数据按从小到大排序后为12N X X X ，，…，，中位数e M ，为则有：e N+M =X1（）2当N 为奇数e N N +1221M =X +X 2⎛⎫⎛⎫⎪ ⎪⎝⎭⎝⎭⎧⎫⎪⎪⎨⎬⎪⎪⎩⎭ 当N 为偶数（2）分组数据中位数的计算分组数据中位数的计算时，要先根据公式N / 2 确定中位数的位置，并确定中位数所在的组，然后采用下面的公式计算中位数的近似值：N=1m-1e m-S 2M =L+ii fd f ⨯∑式中：e M 表示中位数；L 表示中位数所在组的下限；m-1S 表示中位数所在组以下各组的累计次数；m f 表示中位数所在组的次数；d 表示中位数所在组的组距。

3．均值的计算【A VERAGE 】（1）未经分组均值的计算未经分组数据均值的计算公式为： 112n ++==nii x x x x x n n=∑…（2）分组数据均值计算分组数据均值的计算公式为： 11221121+++==+ki ik k i k kii x f x f x f x f x f f f f==+∑∑+4．几何平均数【GEOMEAN 】几何平均数是N 个变量值乘积的N 次方根，计算公式为：式中：G 表示几何平均数；∏表示连乘符号。

统计学公式大全

表示为 A-AB 或者 AB ，它表示 A 发生而 B 不发生的事件。
A、B 同时发生：A B，或者 AB。A B=Ø，则表示 A 与 B 不可能同时发生，
称事件 A 与事件 B 互不相容或者互斥。基本事件是互不相容的。
1
-A 称为事件 A 的逆事件，或称 A 的对立事件，记为 A 。它表示 A 不发生
的事件。互斥未必对立。 ②运算：
结合率：A(BC)=(AB)C A∪(B∪C)=(A∪B)∪C 分配率：(AB)∪C=(A∪C)∩(B∪C) (A∪B)∩C=(AC)∪(BC)

Ai Ai
德摩根率： i1
i 1
AB AB，AB AB
（7）概率的公理化定义
设为样本空间， A 为事件，对每一个事件 A 都有一个实数 P(A)，若满
1
每次试验是独立的，即每次试验 A 发生与否与其他次试验 A 发生与
否是互不影响的。
这种试验称为伯努利概型，或称为 n 重伯努利试验。
用 p 表示每次试验 A 发生的概率，则 A 发生的概率为1 p q ，用 Pn(k) 表
示 n 重伯努利试验中 A 出现 k(0 k n) 次的概率，
积分元 f (x)dx 在连续型随机变量理论中所起的作用与 P( X xk) pk 在离
散型随机变量理论中所起的作用相类似。
1
（4）分布函数
设 X 为随机变量， x 是任意实数，则函数 F(x) P(X x)
称为随机变量 X 的分布函数，本质上是一个累积函数。
P(a X b) F(b) F(a) 可以得到 X 落入区间 (a,b] 的概率。分布
P( X k) q k1 p, k 1,2,3, ，其中 p≥0，q=1-p。

《教育统计学》超详细知识点及重点笔记

华东师大心理统计学大纲教材：《教育统计学》第一章绪论第一节什么是统计学和心理统计学一、什么是统计学统计学是研究统计原理和方法的科学。

具体地说，它是研究如何搜集、整理、分析反映事物总体信息的数字资料，并以此为依据，对总体特征进行推断的原理和方法。

统计学分为两大类。

一类是数理统计学。

它主要是以概率论为基础，对统计数据数量关系的模式加以解释，对统计原理和方法给予数学的证明。

它是数学的一个分支。

另一类是应用统计学。

它是数理统计原理和方法在各个领域中的应用，如数理统计的原理和方法应用到工业领域，称为工业统计学；应用到医学领域，称为医学统计学；应用到心理学领域，称为心理统计学，等等。

应用统计学是与研究对象密切结合的各科专门统计学。

二、统计学和心理统计学的内容统计学和心理统计学的研究内容，从不同角度来分，可以分为不同的类型。

从具体应用的角度来分，可以分成描述统计，推断统计和实验设计三部分。

1．描述统计对已获得的数据进行整理、概括，显示其分布特征的统计方法，称为描述统计。

2．推断统计根据样本所提供的信息，运用概率的理论进行分析、论证，在一定可靠程度上，对总体分布特征进行估计、推测，这种统计方法称为推断统计。

推断统计的内容包括总体参数估计和假设检验两部分。

3．实验设计实验者为了揭示试验中自变量和因变量的关系，在实验之前所制定的实验计划，称为实验设计。

其中包括选择怎样的抽样方式；如何计算样本容量；确定怎样的实验对照形式；如何实现实验组和对照组的等组化；如何安排实验因素和如何控制无关因素；用什么统计方法处理及分析实验结果，等等。

以上三部分内容，不是截然分开，而是相互联系的。

第二节统计学中的几个基本概念一、随机变量具有以下三个特性的现象，成为随机变量。

第一，一次试验有多中可能结果，其所有可能结果是已知的；第二，试验之前不能预料哪一种结果会出现；第三，在相同的条件下可以重复试验。

随机现象的每一种结果叫做一个随机事件。

我们把能表示随机现象各种结果的变量称为随机变量。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

教育统计学公式汇总
1、众数：
2、中数：
3、加权平均数：
4、众数、中数和算术平均数之间的关系：
5、几何平均数：
6、调和平均数：
7、平均差：
8、样本标准差：
9、标准差的合成： 10、差异系数：
11、百分位数： 0a
b a b
f M L i
f f =+•+2b
d b n F M L i f
-=+
•2a d a n F M L i f -=-•1
112212k j j j k k
w k t n X n X n X n X X n n n n =++⋯+==++⋯+∑
0M 3Mdn 2X =
－g X =1
1
lg lg n
i
i g x
X n
-=⎛
⎫
⎪ ⎪=
⎪
⎪⎝
⎭
∑1211111111
1
()H n
i
i
n
M n x x x n x x
=
=
=
++⋯+∑∑1
1
'n
n
i i
i i x X x AD n
n
==-==
∑
∑
S ==
w σ=
100%S
CV X =⨯100b m m
N F P L i f
•-=+•(1)100a
m
m
N F P U i f
-
-=-
•
12、百分等级分数：
13、协方差：
14、积差相关系数：
15、斯皮尔曼等级相关：
16、肯德尔和谐系数：
17、点双列相关：
18、双列相关：
19、多系列相关：
20、φ（fai ）相关：
21、列联相关：
22、的分布（标准分）：
()100b x L f F i PR N
-⎡⎤+⎢⎥⎣⎦=
⨯1
()()
(,)n
i
i
i x X y
Y COV X Y n
=--=
∑1
()()
i i
i
i
XY x y x y r -=∑∑∑2261(1)
R D r n n =-
-∑43(1)1(1)X Y
R R R r n n n n ⎡⎤=•-+⎢⎥
-+⎣⎦
∑231
()12
i
R SS W k n n =
-p q
pb X
X X r S -=
p q
b X X X pq r S Y
-=•()2()L H i s L H t i
Y Y X r Y Y S p ⎡⎤-•⎣⎦=-∑
∑
r ϕ=
C =
X X X
X X Z μμ
σσ--=
=
23、总体平均数的置信区间：
24、样本容量的估计：
25、平均数之差的标准误：
两组相关样本的情况：
26、检验统计量：
27、已知两组样本相关系数r 时的检验统计量：
两组独立样本的情况： 28、两个总体方差都已知时的检验统计量：
29、两个总体方差都未知时的检验统计量：
（1）两总体方差相等：（2）两总体方差不等：
1）阿斯平—威尔士检验：
2) 柯克兰—柯克斯检验： 2
2
212
1)
1(222
2)1(212
12
21··n S
n S t n S
t n S t n n ++='--α
αα
22/X Z X Z αασσ⎡-•+•⎢⎣()
2
2
(
)df t S
n d
α
•
=1
2
X X σ-=
d t
=X X t =
X X Z =
X X t =2
2
S F S =
大
小
211
22
12
1
2S n k S S n n =+22
12
1
(1)df k k n n =
-+
30、样本比率抽样分布的标准误：
31、总体比率的置信区间：
32、样本比率显著性检验的检验统计量：
33、相关样本比率差异的显著性检验： Z
34、独立样本比率差异的显著性检验：
（1
）独立样本之差（p 1-p 2
）的抽样分布：
（2）独立样本之差（p 1-p 2）在抽样分布中的标准误：
（3）独立样本比率差异显著性检验的检验统计量：
其中，
35、t 分布的检验统计量：
其中，
相关系数区间估计的置信区间为：
p σ=
/2/2p Z P p Z
αα-•≤≤+•
Z =
12
p p σ-=
=
12p p σ-==12
1212()()
p p p p P P Z
S ----==
1122
12
'n p n p p n n +=
+r
r t ρ
σ-=
=
r σ=
(2)
(2)
2
2
r
r
n n r t
r t αα
σρσ---⋅≤≤+⋅
36、两总体相关系数的差异性检验：
37、检验统计量的一般表达式：
38、独立性检验：
（1）在“R变量与C变量相互独立，彼此无关”的假设成立的条件下，第r行第c列的那个类别的理论期待次数：
自由度：
（2）对2×2表的资料进行独立性检验，计算检验统计量：
39、非参数检验
连续性校正校正公式：
40、符号秩次检验：
（1）大样本的情况：
T的总体平均数为μT=n(n+1)
4
T的总体标准差为σT=√n(n+1)(2n+1)
24
Z=
2χ
2
20
()
k
e
e
f f
f
χ-
=∑
2
2
1
()
2
e
c
e
f f
f
χ
--
=∑
()
c r c
r
e
n n n
n
f N P N
N N N
•=•=••=
(1)(1)
df r c
=-•-
2
2
()
()()()()
N ad bc
a b a c b d c d
χ
•-
=
+++
+
0.5
Z
±
=
n
（r）-
其检验统计量为 24
)
12)(1(4/)1(+++-=
-=
Z n n n n n T T T
T
σμ
其中，n= n ++n − T=min(T +，T −）
41、秩和检验（1）T 的总体平均数为：
2
)
1(211++=
n n n T μ
（2）T 的总体标准差为：12
)
1(2121++=
n n n n T σ
（3）其检验统计量为： 12
)
1(2/)1(2121211++++-=
-=
Z n n n n n n n T T T
T
σμ
42、中数检验
两个样本中数差异的显著性检验：m
d f i f N L )2(∑-+=M。