统计学原理重要公式

统计学原理重要公式
统计学原理重要公式

?加权算术平均数和加权调和平均数的计算

加权算术平均数:

-工灯十牙= —或

加权调和平均数:

y— X/

厶X

频数也称次数。在?组依人小顺序扌II冽的测量值中,当按?定的组距将其分组时出现在各组的测量值的数目.即落在各类别(分组)中的数据个数。

再如在3?⑷59265358979324中,9出现的频数是3,出现的频率是3/18=16.7%

?般我们称落在不同小组中的数据个数为该组的频数,频数与总数的比为频率。

频数也称''次数",对总数据按某种标准进行分组,统计出各个组含个体的个数。而频率则每个小组的频数与数据总数的比值。

在变量分配数列中,频数(频率)农明对应组标志值的作用程度。频数(频率)数值越人农明该组标志值对于总体水平所起的作用也越人,反之,频数(频率)数值越小,农明该组标志值对于总体水平所起的作用越小。

掷硬币实验:在10次掷硕币中,有4次正而切上,我们说这10次试验中,正血呦上,的频数是4例题:我们经常掷硬币,在掷了?百次后,硬币有40次正而朝上.那么?硬币反面朝上的频数为—?解答,掷了硬币100次,40次朝上,则有10040=60 (次)反血呦上,所以硬币反而初上的频数为60.

一. 加权算术平均数和加权调和平均数的计算

加权算术平均数:

x=^~L或x=Yx~!—

】代衣算术平均数;工是总和符合:f为标志值出现的次数。

ij口权算术平均数是具有不同比重的数据(或平均数)的算术平均数。比重也称为权重,数据的权重反映了该变量在总体中的和对重耍性,每种变量的权重的确定与?定的理论经验或变量在总体中的比重有关。依据各个数据的重要性系数(即权重)进行和乘后再相加求和,就是加权和。加权和与所有权重之和的比等于加权算术平均数。

加权平均数=各组(变量值x次数)之和/各组次数之和二》Xf /

加权调和平均数:

加权算术平均数以各组单位数f为权数,加权调和蛋均数以各组标志总量m 为权药亘计號容和结果都是相同的。

二. 标准差和标准差系数的计算方法标准差:

£EIZ

0=

/=!

公式

标准差也被称为标准偏差,或者实验标准差,公式如图。

简单来说,标准差是?组数据平均值分散程度的?种度量。?个较人的标准差,代农人部分数值和其平均值之间差异较大:?个较小的标准差,代衣这些数值较接近平均值。

例如,两组数的集合{0.5,9?14}和{5.6. & 9}其平均值都是7,但第二个集合具有较小的标准差。

标准差可以当作不确定性的?种测量。例如在物理科学中,做重复性测量时,测量数值集合的标准差代衣这些测量的精确度。当要决定测量值是否符合预测值,测量值的标准差占有决定性重要角色:如果测量平均值与预测值相差太远(同时与标准差数值做比较),则认为测量值与预测值互相矛质。这很容易理解,因为如果测量值都落在?定数值围之外,可以合理推论预测值是否正确。

标准差应用于投资上,可作为量度回报稳定性的指标。标准差数值越大,代农回报远离过去平均数值,回报较不稳定故风险越高。相反,标准差数值越细,代农回报较为稳定,风险亦较小。

例如,A、B两组各有6位学生参加同?次语文测验,A组的分数为95. 85、75、65、55、45, B组的分数为73、72、71. 69、68、67□这两组的平均数都是70,但A组的标准差为17.07 分,B组的标准差为2.37分(此数据时在R统计软件中运行获得),说明A组学生之间的差距要比B组学生之间的差距人得多。

如是总体,标准差公式根号除以n

如是样本,标准差公式根号除以(ml)

因为我们人量接触的是样本,所以普遍使用根号除以(ml)

公式意义

所有数减去其平均值的平方和,所得结果除以该组数之个数(或个数减?),再把所得值开根号,所得之数就是这组数据的标准差。

标准差的总义

标准差越高,农示实验数据越离散?也就是说越不精确

反之,标准差越低,代衣实验的数据越精确

离散度___________________________________________________ 标准差是反应?组数据离散程度最常用的?种量化形式,是农示蒂密确的最要指标。说起标准差首先得搞清楚它出现的目的。我们使用方法去检测它,但检测方法总是有谋差的,所以检测值并不是其真实值。检测值与真实值之间的差距就是评价检测方法最有决定性的指标。但是真实值是多少,不得而知。因此怎样量化检测方法的准确性就成了难題。这也是临床工作质控的目的:保证每批实验结果的准确可靠。

虽然样本的真实值是不可能知道的,但是每个样本总是会有?个真实值的,不管它究竟是多少。可以想象,?个好的检测方法,基检测值应该很紧密的分散在真实值周围。如何不紧密,那距真实值的就会人,准确性当然也就不好了,不可能想象离散度人的方法,会测出准确的结果。因此,离散度是评价方法的好坏的最重要也是最基本的指标。

标准差系数:

(7

标准差系数又均方差系数。反映标志笛动程度的相对指标。

式中:V。为标准差系数:G为标准差:;为平均数。当以样本标准差系数(称变异系数/离散系数)估计总体标准差系数时.VS二式中:VS为变异系数;S为样本标准差。对于不同水平的总体不宜宜接用标准差指标进行对比,标准差系数能更好的反映不同水平总体的标志变动度。

标准差变动系数为标志变异系数的?种。标志变异系数指用标志变异指标与其相应的平均指标对比,来反应总体各单位标志值之间离散程度的相对指标,?般用V农示。标志变异指标有全距、平均差和标准差,相对应的,便有全距系数、平均差系数和标准差系数3种。计算方法为:

标志变异系数二标志变异值/相对应的平均值

三. 总体平均数和总体成数的区间估计。

抽样平均误差的计算公式:

1.总体平均数:

重复抽样:从=2

yin

重复抽样又称放回式抽样。

每次从总体中抽取的样本单位,经检验之后又重新放回总体,参加下次抽样,这种抽样的特点是总体中每个样本单位彼抽中的概率是相等的。

不重复抽样:

不重复抽样亦称不放回式抽样。

每次从总体中抽取的样本单位,经检验之后不再放回总体,在下次抽样时不会再次抽到前闻已抽中过的样品单位。

总体每经?次抽样,其样品单位数就减少?个,因此每个样品单位在各次抽样中被抽中的概率是不同的。

2?总体成数:

重复抽样:"厂J巴二出不重复抽样::止/2(1巧

\ n V n N 抽样极限误差:

抽样极限误差又称''置信区间和抽样允许谋差围二是指在?定的把握程度(P)下保证样本指标与总体指标之间的抽样误差不超过某?给定的最人可能围,记作

简单线性回归方程的建立:

Y = a + bx

其中:

疙一OX

a = y- bx

五?统计指数的编制和两因素分析

1.综合指数的计算

(1)数量指标指数:

Po

(2)质量指标指数:

工0刃

2.平均指数的计算

算术平均数指数:

D()0O ? K Q /

调和平均数指数:

工血/(D"|/Kp)工如门一

3.复杂现象总体总量指标变动的因素分析相对数变动分析:

Y/hPi = 工%Po X 工尙小

Dm 工q(〉Po工0心绝对值变动分析:

工射厂工弘几二(工如几一D()〃o)X(

六.平均发展水平的计算

1.由总量指标动态数列计算序时平均数

(l)ill时期数列计算序时平均数:

2

n

⑵山间隔相等的时点数列讣算序时平均数:

⑶山间隔不相等的时点数列计算序时平均数:

'Z^oA)

工如门

/

Dm-工Mo)

2 ?山相对指标或平均指标动态数列讣算序时平均数:

b

七.现象发展的速度指标的计算

1 ?环比发展速度的连乘积等于定基发展速度。公式表示为:

4) 5 弘 5

2.逐期增长量之和等于累积增长量

(?i -a0) + (a2 _q) + @3 -a2) + ■ ? ■ 4-{a n_x -a n) = a n-a0 逐期增

长量之和累积增长量平均增长量= --- = ----------------------

逐期增长量的个数逐期增长量的个数

3.增长速度二发展速度-1

4.平均冬展速度的计算

x = Vn7

5.平均增长速度的计算

平均增长速度=平均发展速度一1 (10 0%)

相关主题
相关文档
最新文档