(精品)社会统计学公式总结及要点

合集下载

(完整版)统计学公式大全

(完整版)统计学公式大全

(完整版)统计学公式大全统计学公式大全本文档旨在提供统计学领域常用的公式大全,便于大家在研究和实践中进行参考和应用。

描述统计学公式中心趋势度量1. 平均数(Mean):$\bar{x} =\frac{{\sum_{i=1}^{n}x_i}}{n}$2. 中位数(Median):若数据个数为奇数,中位数为排序后的中间值;若数据个数为偶数,中位数为排序后的中间两个值的平均值。

3. 众数(Mode):出现频率最高的数值。

离散趋势度量1. 方差(Variance):$Var(x) = \frac{{\sum_{i=1}^{n}(x_i - \bar{x})^2}}{n}$2. 标准差(Standard Deviation):$SD(x) = \sqrt{Var(x)}$3. 极差(Range):$Range(x) = \max(x) - \min(x)$分布形状度量1. 偏度(Skewness):$\text{Skewness} =\frac{{\sum_{i=1}^{n}(x_i - \bar{x})^3}}{n \cdot SD(x)^3}$2. 峰度(Kurtosis):$\text{Kurtosis} =\frac{{\sum_{i=1}^{n}(x_i - \bar{x})^4}}{n \cdot SD(x)^4}$ 推断统计学公式参数估计1. 样本均值的抽样分布标准差(Standard Error of the Mean):$SE(\bar{x}) = \frac{{SD(x)}}{\sqrt{n}}$2. 双侧置信区间公式(Confidence Interval):$\bar{x} \pm Z\cdot SE(\bar{x})$3. 样本比例的抽样分布标准差(Standard Error of Proportion):$SE(p) = \sqrt{\frac{{p(1-p)}}{n}}$4. 双侧置信区间公式(Confidence Interval):$p \pm Z \cdotSE(p)$假设检验1. 样本均值和总体均值的差异(t检验):$t = \frac{{\bar{x} -\mu}}{{SE(\bar{x})}}$2. 双侧拒绝域临界值(t分布):$t_{\text{critical}} = \pmt_{\alpha/2, df}$3. 样本比例和总体比例的差异(z检验):$z = \frac{{\hat{p} - p}}{{SE(p)}}$4. 双侧拒绝域临界值(z分布):$z_{\text{critical}} = \pmz_{\alpha/2}$回归分析公式简单线性回归模型1. 回归方程(Simple Linear Regression):$y = \beta_0 +\beta_1x + \epsilon$2. 线性预测公式(Simple Linear Regression):$\hat{y} =\hat{\beta}_0 + \hat{\beta}_1x$3. 斯皮尔曼秩相关系数(Spearman's Rank Correlation Coefficient):$r_s = 1 - \frac{6\sum d_i^2}{n(n^2 - 1)}$4. 相关系数的显著性检验(t检验):$t = \frac{r}{\sqrt{\frac{1 - r^2}{n-2}}}$结论本文档列举了统计学领域常用的公式,包括描述统计学中的中心趋势度量、离散趋势度量和分布形状度量,推断统计学中的参数估计和假设检验,以及回归分析中的简单线性回归模型等相关公式。

统计学公式总结

统计学公式总结

标准分数 (变量值与其平均数的离 差除以标准差后的值。)
离散系数(变异系数)是一组数据的 标准差与其相应的平均数之比..离 散系数大,数据的离散程度大.反 之..它们是成正比的. (二)抽样分布主要公式
zi
xi
s
x
vs
s x
( s 标准差,x 平均数)
总体均值的置信区间(正态总体, 已知)P183 注意 P184 例题
总体比例的检验 (检验方法的总结)
假设
双侧检验
假设形式
H0:= H1:
左侧检验 H0: H1 :<
右侧检验 H0 : H1 :>
统计量
z
p 0 0 (1 0 )
n
拒绝域 P 值决策
z z / 2
z z
P 拒绝 H0
z z
M d i1 n
简单样本方差 (未分组数据)P99
n
(xi x)2
s 2 i1 n 1
加权样本方差 (分组数据)
k
(Mi x)2 fi
s 2 i1 n 1
简单样本标准方差 (未分组数据)
n
(xi x)2
s i1 n 1
加权样本标准差 (分组数据)
k
(Mi x)2 fi
s i1 n 1
异众比率(是指非众数组的频数占 总频数的比例..Vr 越大,说明非众 数组的频数占总频数的比重越大, 众数的代表性就越差.) 四分位差(内距,四分间距)反映了 中间 50%数据的离散程度,其数值越 小,说明中间的数据越集中;越大, 说明中间数据越分散. 极 差 :( 全 距 ) 描 述 数 据 离 散 程 度 的 最简单测度值,受极端值影响.
n
Gm n x1 x2 xn n xi i 1

社会统计学公式总结及要点

社会统计学公式总结及要点
2.相关系数→第四章;定类、定序、定距→第四章;假设、推论→检定→第七、八章
3.一个变项,1个样本 :
①(n≥100):
②(n≤30): , df=b-1
4.1个变项,2个样本 1 2
n=n1+n2>100 →
五、归类总结之五:有关消减误差比例
1.
有消减误差比例意义,且对称
、G、Q拉系数、rs2、r2、rxy.12、、Ry.122= Ry.x1x22
2.有无自由度的表达
G、r、F、x2结果解释加上“其显著度水平达到或没有达到……水平”
3.有关r净相关系数
(两个定距变项)
r=rxy.1——引入第三个变项时对X、Y变项产生共同影响。
rx(y-1)——引入第三个变项时,只对Y产生影响,无消减误差意义。
ry(x-1)——引入第三个变项时,只对X产生影响,无消减误差意义。
Q= Q3- Q1
有单个数(n为偶数时会出现偏离)、区间之分。
(有几种Q,就有几种S计算法)
当为区间表格时(n/4)
①计算向上累加数cf;②Q1位置= ,Q3位置= ;
③Q1=L1+ W1,Q3= L3+ W3;④Q= Q3- Q1P57
5.标准差
①单个数:S= ,②区间:S= P60
对S的解释:如以均值来估计各个个案的数值,所犯的错误 平均是S。用均值作估计变项数值时所犯错误的大小。
社会统计学公式汇总及要点2011.09.09-09.10
(仅供参考,如不能显示公式,请安装Microsoft公式3.0)
一、归类总结之一
测量层次
特质
数学特质
单变项:X
定类变项
只分类
Mo、V
比例、比率、对比值、

社会统计学常用公式及说明

社会统计学常用公式及说明

b
b
i 1
n
i

n
yn y0
平均发展速度-1
回归方程
公式名称

数学公式
yt a bt (方程式)
说明
说明
当 t 0 时:
b
N tY t Y N t 2 ( t ) 2
Y b t N
直线回归
b
N tY t Y N t 2 ( t ) 2
H
调和平均数
H
x
1
简单
H :平均数
m 1 x *m
x x
f
加权
x :单位变量值 n :总体单位数 m :权数
Gn
简单 加权
G :平均数
几何平均数
f G

n :项数
:连乘
f
Me L 2
sm 1 fm
*d
下限公式
中位数
Me U
f
2
sm 1 fm
*d
上限公式
环比
Ai
增长速度
Bi
yi y0 (i 1,2,....n) y0
yi yi 1 (i 1,2,....n) yi 1
n
定基
环比
环比发展速度-1 1、等 于 各 环 比 发 展 速度连乘开 n 次方 根 2、等于 n 次方根下报 告期水平 / 基期水 平
平均发展 速度 平均增长 速度
a
a
Y
N
回归方程
a
yt a bt ct 2 (方程式)

t Y t t Y N t ( t )
4 2 2 4 2 2
b

统计学常用公式汇总

统计学常用公式汇总

《统计学原理》常用公式汇总(一)第三章统计整理a) 组距=上限-下限b) 组中值=(上限+下限)÷2c) 缺下限开口组组中值=上限-1/2邻组组距d) 缺上限开口组组中值=下限+1/2邻组组距第四章综合指标i. 相对指标1.结构相对指标=各组(或部分)总量/总体总量2.比例相对指标=总体中某一部分数值/总体中另一部分数值3.比较相对指标=甲单位某指标值/乙单位同类指标值4.强度相对指标=某种现象总量指标/另一个有联系而性质不同的现象总量指标5.计划完成程度相对指标=实际数/计划数=实际完成程度(%)/计划规定的完成程度(%)ii.平均指标1.简单算术平均数:2.加权算术平均数或iii.变异指标1.全距=最大标志值-最小标志值2.差: 简单σ= ;加权σ=3.差系数:第五章抽样估计1.平均误差:重复抽样:不重复抽样:2.抽样极限误差3.重复抽样条件下:平均数抽样时必要的样本数目成数抽样时必要的样本数目4.不重复抽样条件下:平均数抽样时必要的样本数目第七章相关分析1.相关系数2.配合回归方程y=a+bx3.估计误:第八章指数分数一、综合指数的计算与分析(1)数量指标指数此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度。

( - )此差额说明由于数量指标的变动对价值量指标影响的绝对额。

(2)质量指标指数此公式的计算结果说明复杂现象总体质量指标综合变动的方向和程度。

( -)此差额说明由于质量指标的变动对价值量指标影响的绝对额。

加权算术平均数指数=加权调和平均数指数=(3)复杂现象总体总量指标变动的因素分析相对数变动分析:= ×绝对值变动分析:- = ( - )×( -)第九章动态数列分析一、平均发展水平的计算方法:(1)由总量指标动态数列计算序时平均数①由时期数列计算②由时点数列计算在间断时点数列的条件下计算:a.若间断的间隔相等,则采用“首末折半法”计算。

公式为:b.若间断的间隔不等,则应以间隔数为权数进行加权平均计算。

社会统计学公式总结LIJUN

社会统计学公式总结LIJUN

社会统计学考试必备公式
学院:人文学院
姓名:李军
学号:2011014737
专业:社会学
班级:社会111
时间:2013年6月20日
社会统计学考试必备公式
第二章单变量统计描述分析
直方图:频次密度=频次/组距(条宽)
相对频次密度(频率密度)=相对频次(频率)/组距(条宽)
频次=频率密度*组距
A、集中趋势测量法
众值:m0
B、离散趋势测量法
极值R:观察的最大值-观察的最小值
四分互差Q=Q75-Q25
第三章概率
一、概率的运算
1.当事件A与事件B互不相容时,
P(A+B)=P(A)+P(B)
2. 当事件A与事件B不满足互不相容时,
P(A+B)=P(A)+P(B)-P(AB)
3.A、B相互独立
P(AB)=P(A)P(B)
4. A、B不相互独立
P(AB)=P(A)P(B/A)或P(B)(A/B)
第五章正态分布
第六章参数估计
第七章假设检验的基本概念
1.统计假设
2.原假设与备择假设
3.假设检验的基本原理
4.双边检验与单边检验
第十四章非参数检验。

统计学常用公式汇总

统计学常用公式汇总

《统计学原理》常用公式汇总第三章统计整理a) 组距=上限-下限 b) 组中值=(上限+下限)÷2c) 缺下限开口组组中值=上限-1/2邻组组距d) 缺上限开口组组中值=下限+1/2邻组组距第四章综合指标i. 相对指标1.结构相对指标=各组(或部分)总量/总体总量2.比例相对指标=总体中某一部分数值/总体中另一部分数值3.比较相对指标=甲单位某指标值/乙单位同类指标值4.强度相对指标=某种现象总量指标/另一个有联系而性质不同的现象总量指标5.计划完成程度相对指标=实际数/计划数=实际完成程度(%)/计划规定的完成程度(%)ii.平均指标1.简单算术平均数:2.加权算术平均数或iii.变异指标1.全距=最大标志值-最小标志值2.标准差: 简单σ= ;加权σ=3.标准差系数:第五章抽样估计1.平均误差:重复抽样:不重复抽样:2.抽样极限误差3.重复抽样条件下:平均数抽样时必要的样本数目成数抽样时必要的样本数目4.不重复抽样条件下:平均数抽样时必要的样本数目第七章相关分析1.相关系数2.配合回归方程y=a+bx3.估计标准误:第八章指数分数一、综合指数的计算与分析(1)数量指标指数此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度。

( - )此差额说明由于数量指标的变动对价值量指标影响的绝对额。

(2)质量指标指数此公式的计算结果说明复杂现象总体质量指标综合变动的方向和程度。

( -)此差额说明由于质量指标的变动对价值量指标影响的绝对额。

加权算术平均数指数=加权调和平均数指数=(3)复杂现象总体总量指标变动的因素分析相对数变动分析:= ×绝对值变动分析:- = ( - )×( -)第九章动态数列分析一、平均发展水平的计算方法:(1)由总量指标动态数列计算序时平均数①由时期数列计算②由时点数列计算在间断时点数列的条件下计算:a.若间断的间隔相等,则采用“首末折半法”计算。

社会统计学笔记

社会统计学笔记

第一章科学方法与社会研究历程1·社会学研究:就是运用科学的方法来搜集和分析社会事实,以理解社会现象之间的关系。

2·科学研究:就是运用客观的、逻辑的和系统的方法来搜集事实及分析事实。

3·社会学研究的整个历程,大致上可以分为三个阶段:(1)筹划,(2)执行,(3)总结。

4·初步探索步骤:(1)收集有关的文献,(2)咨询那些对研究的题目有经验、有知识的人,进行了解,(3)观察个案.5·假设:就是根据我们对问题的了解,假定现象与现象之间的关系。

就是假定某一现象的变化与另一种现象的变化具有某种关系.假设的方式:函数式(要求变项之数值有高低之分)、差异式(不存在高低之分)6·较为常用的研究方式:实验法、社会调查法.(皆可验证假设)①实验法的逻辑:有意的改变A变项,然后看看B变项是否随着变化;如果B变项显然是随着A变项的变化而变化,就说明A变项对B变项有影响。

②社会调查法特点:在研究过程中不改变社会现状,只求就地取材,然后以统计方法推算变项与变项之间的关系。

7·能够有效地验证假设的实验法称为典型或理想实验法8·社会调查法可以分为两大类:一是叙述性调查(重点是报道社会事实,较少分析社会事实(即变项)之间的因果关系),一是解释性调查(目的是要证明不同的变项之间是否有因果关系)。

9·全体调查:就是从所有研究对象中搜集资料。

抽样调查:就是从全体的研究对象中科学的抽出一个数目较少的样本,然后据此样本的资料推论全体的情况。

10·个案研究:就是选择一个或几个个案(即研究对象),作深入的接触和观察,目的是对所研究的问题作深入的了解.11·横剖研究:指的是在同一时期搜集资料,目的是理解各种社会现象(即变项)在某时期的相关情况的研究.纵贯研究:是指在不同时期搜集的,目的在了解社会现象(即变项)在不同时期中的变动情况的研究.12·纵贯研究分为两种:趋势研究、同组研究(指的是在不同时期调查相同的样本).同组分析的问题:遗失个案的问题。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
检定法

两个定类
定类
定类
、 、tau-y
x2

定类+定序
定类
定序
同上

两个定序
定序
定序
G、dy
Z(n≥100)、t(n≤30)

两个定距
定距
定距
r、b,即r=rxy,b=bxy
F、r (n≤30)

定类+定距
定类
定距
E
只能用F检定

定序+定距
定序
定距
E
只能用F检定
四、归类总结之四:有关计算题
1.第二章、第四或第六章、第七八章
计算公式表(一)⑥①②③④⑤⑥(红色字体为特别关注的公式)
1.众值
Mo=次数最多之值。
2.中位项
Md位置= ,Md=L+ W,Md=L+ W
有三种情况:单个数奇、偶、区间。fm:原始次数;cfm-1:累加次数P48
3.均值
= P49
4.离异比率
V= = P52
5.四分位差
由低到高排列,分四个等分计算Q1、Q3位置,Q1位置= ,Q3位置= ,
2.两个
定序变项
G=
Ns是同序对数,Nd是异序对数对G检定,只有两种检定法:Z、t。
dy=
Ns是同序对数,Nd是异序对数,
Ty是只在依变项Y上同分的对数。因为dy系数是以X预测Y,如果两个个案在X上有高低之分,就要预测或估计他们在Y上的相对等级。因上分母要加上Ty。
rs=
斯皮尔曼rho系数。常出现在填空选择,一般不考计算题。
2.相关系数→第四章;定类、定序、定距→第四章;假设、推论→检定→第七、八章
3.一个变项,1个样本 :
①(n≥100):
②(n≤30): , df=b-1
4.1个变项,2个样本 1 2
n=n1+n2>100→
五、归类总结之五:有关消减误差比例
1.
有消减误差比例意义,且对称
、G、Q拉系数、rs2、r2、rxy.12、、Ry.122= Ry.x1x22
④已知:可信度,p,
P or e,求n。
计算公式表(三)假设的检定:两个变项之相关Z(5个)、t(4)、F(2个)
Z检定法(大样本)、t检定法(小样本):定矩变项、随机抽样、总体正态分布。
1、Z检定法
2、t检定法
①(大样本)
n≥100(单均值)
①(小样本)n≤30
以t值来表示样本的均值在标准化抽样中分布中的位置。
2.有无自由度的表达
G、r、F、x2结果解释加上“其显著度水平达到或没有达到……水平”
3.有关r净相关系数
(两个定距变项)
r=rxy.1——引入第三个变项时对X、Y变项产生共同影响。
rx(y-1)——引入第三个变项时,只对Y产生影响,无消减误差意义。
ry(x-1)——引入第三个变项时,只对X产生影响,无消减误差意义。
2.
有消减误差比例意义,且不对称
dy、 、tau-y、E2、CR2(特征值)
3.
无消减误差比例意义,且对称
、V系数、C系数、tau-a、tau-b、tau-c、Vs、r
4.
无消减误差比例意义,且不对称
b、E
六、其他细节
1.显著度的表达
①两端检定: ;②一端检定: ;③ ;④F(df1,df2);⑤x2(df)
6.定序+定距
因此社会学家常改用相关比率——即将定序变项看做是定类变项。E
参数值的估计:的均值M
①已知:n, (样本的均值),可信度为95%,求M。
(S是样本的标准差)
③已知:n,可信度95%,样本比率p,求总体比率P。
(百分率(或比例)的间距估计)
②已知: ,可信度,M或e,求n。(决定样本的大小)
S2方差:就是标准的平方值,其意义与标准差相同。
计算公式表(二)二个变项
1.两个
定类变项


My=Y变项的众值次数,Mx=X变项的众值次数,n=全部个案数目。
my=X变项的每个值(类别)之下Y变项的众值次数,mx=Y变项的每个值之下X变项的众值次数,
③tau-y= (E1= ,E2= )
n=全部个案数目,f=某条件次数,Fy=Y变项的某个边缘次数,Fx=X变项的某个边缘次数。
3.两个
定距变项
Y’=bX+a, a= —b = 简单线性回归分析
X是自变项数值,自变项数值,b是回归系数,表示回归张的斜率,a是截距,即回归线与Y轴的交点,Y’是根据回归方程式所预测的Y变项的值。
r=rxy=
积矩相关测量法
r系数与简单线性回归分析都是假定X与Y的关系具有直线的性质。
4.
定类+定项
,ni是每个自变项Xi的个案数目。 =每类的平均值, 每个竖列平方的和。E值无负值,因为是定类变项。
4.参数检定:Z、t、F
非参数检定:x2、U、H、K-S、走动检定P201
②2个定序
G、dy
③2个定距
R、b,即r=rxy,b=bxy
④定类+定距
E
⑤定类+定序
同①: 、 、tau-y大多数社会学者将定序看作定类,即2个定类。
三、归类总结之三:理解如下:(红色字体为特别关注的公式)
变项X
变项Y
可计算
累加次数、累加百分率
定距变项
不仅分类,有大小、高低、程度,还可加减
Mo、V、Md、Q、 、S(S2)
同上
定比变项
最高测量层次
加减乘除
二、归类总结之二
①2个定类
、 、tau-y
1.集中趋势测量法:Mo、Md、
2.离散趋势测量法:V、Q、S
2.有下标,表示不对称
3.具有消减误差比例意义的有:r2、E2、G、dy、 、 、tau-y、rs2(rs斯皮尔曼系数)
社会统计学公式汇总及要点2011.09.09-09.10
(仅供参考,如不能显示公式,请安装Microsoft公式3.0)
一、归类总结之一
测量层次
特质
数学特质
单变项:X
定类变项
只分类
Mo、V
比例、比率、对比值、
次数分布、长作图、圆瓣
双变项:
X、Y
定序变项
不仅分类,有大小、高低、程度等
Mo、V、Md、Q
相关比率与非线性相关
又称为eta平方系数(E2),是以一个定类变项X为自变项,以一个定距变项Y为依变项。是根据自变项的每一个值来预测或估计依变项的均值。
E是假定X是非线性关系。E值从0-1,其E2具有消减误差的意义。
5.定类+定序
=两个定类,大部分的社会学研究都采用Lambda或tau-y系数来测量
Q= Q3- Q1
有单个数(n为偶数时会出现偏离)、区间之分。
(有几种Q,就有几种S计算法)
当为区间表格时(n/4)
①计算向上累加数cf;②Q1位置= ,Q3位置= ;
③Q1=L1+ W1,Q3= L3+ W3;④Q= Q3- Q1P57
5.标准差
①单个数:S= ,②区间:S= P60
对S的解释:如以均值来估计各个个案的数值,所犯的错误 平均是S。用均值作估计变项数值时所犯错误的大小。
相关文档
最新文档