统计学各章计算题公式及解题方法
概率论及统计学的重要公式和解题思路

一、基本概率公式及分布 1、概率常用公式:P(A+B)=P(A)+P(B)-P(AB) ;P(A-B)=P(A)-P(AB) ; 如A 、B 独立,则P(AB)=P(A)P(B) ; P(A )=1-P(A) ; B 发生的前提下A 发生的概率==条件概率 :P(A|B)=P(AB)P(B);或记 : P(AB)=P(A|B)*P(B) ;2、随机变量分布律、分布函数、概率密度 分布律:离散型X 的取值是x k (k=1,2,3...), 事件X=x k 的概率为: P{X=x k }=P k , k=1,2,3...; --- 既 X 的分布律;X 的分布律也可以是上面的表格形式,二者都可以。
分布函数:F(x)=P(X ≤x ), -∞<x <+∞ ; 是概率的累积! P(x1<X<x2)=F(x2)-F(x1) ;离散型rv X; F(x)= P{X ≤x}=∑p k x k <x ;(把X<x 的概率累加) 连续型rvX ;F(x)=∫f (x )dx x−∞, f(x)称密度函数;既分布函数F(X)是密度函数f(x)和X 轴上的(-∞,x)围成的面积! 性质:F(∞)=1; F(−∞)=0;二、常用概率分布:①离散:二项分布:事件发生的概率为p,重复实验n 次,发生k 次的概率(如打靶、投篮等),记为B(n,p)P{X=k}=(n k)p k (1−p)n−k,k=0,1,2,...n; E(X)=np, D(X)=np(1-p); ②离散:泊松分布:X ~Π(λ) P{X=k}=λk e −λk!,k=0,1,2,...; E(X)=λ, D(X)=λ ;③连续型:均匀分布:X 在(a,b)上均匀分布,X ~U(a,b),则:密度函数:f(x)={1b−a,a <x <b 0,其它分布函数F(x)=∫f (x )dx x−∞={0, x <a x−ab−a1,x ≥b,a <x <b④连续型:指数分布,参数为θ,f(x)= {1θe −xθ,0<x 0,其它F(x)={1−e−x θ,x >0 ;⑤连续型:正态分布:X ~N(μ,σ2),most importment!密度函数f(x),表达式不用记!一定要记住对称轴x=µ, E(X)=µ,方差D(X)= σ2; 当µ=0,σ2=1时,N(0,1)称标准正态,图形为:分布函数F(x)为密度函数f(x)从(-∞,x)围成的面积。
统计学公式总结期末

统计学公式总结期末一、概率论1. 加法法则:P(A ∪ B) = P(A) + P(B) - P(A ∩ B)加法法则用于计算两个事件同时发生或其中一个事件发生的概率。
2. 乘法法则:P(A ∩ B) = P(A) × P(B|A)乘法法则用于计算两个事件同时发生的概率。
3. 条件概率:P(A|B) = P(A ∩ B) / P(B)条件概率用于计算在已知某个事件发生的情况下,另一个事件发生的概率。
4. 贝叶斯定理:P(A|B) = P(B|A) × P(A) / P(B)贝叶斯定理用于计算在已知某个事件发生的条件下,另一个事件发生的概率。
5. 期望值:E(X) = ∑(x × P(X = x))期望值用于计算随机变量X的平均值。
6. 方差:Var(X) = E((X - μ)^2) = E(X^2) - (E(X))^2方差用于度量随机变量X的离散程度。
7. 协方差:Cov(X, Y) = E((X - μ_x)(Y - μ_y))协方差用于度量两个随机变量X和Y之间的线性关系。
二、描述统计学1. 样本均值:x̄= ∑(x) / n样本均值用于估计总体均值。
2. 样本方差:s^2 = ∑((x - x̄)^2) / (n - 1)样本方差用于估计总体方差。
3. 样本标准差:s = √s^2样本标准差用于度量样本数据的离散程度。
4. 权重平均:x̄_w = ∑(x × w) / ∑(w)权重平均用于估计带有不同权重的样本数据的平均值。
5. 百分位数:P_p = ((p/100) × (n + 1))th value百分位数是将数据按升序排列后,某个百分比处的数值。
三、推断统计学1. 样本标准误:SE = s / √n样本标准误用于估计样本均值与总体均值之间的误差。
2. 置信区间:CI = x̄± (Z × SE)置信区间用于估计总体均值的范围。
自考统计学计算题知识点总结

统计分组 1、组中值:组中值=(上限+下限)/2缺下限组的组中值=该组上限-邻组组距/2 缺上限组的组中值=该组下限+邻组组距/2 2、众数出现最多的数d ΔΔΔL M 211o ⨯++=3、中位数从小排到大,中间的那个数4、平均数5、几何平均数6、标准差例题:计算下题中的中位数、众数、平均值、标准差n πx nx n ...x 2x 1G =••=Σf f 2)x Σ(x σn 2)x Σ(x σ:标准差;(已分组资料)Σff2)x Σ(x 2σ:方差的加权式;(未分组资料)n 2)x Σ(x 2σ:方差的简单式-=-=-=-=1)△1=50-30=20 △2=50-40=10 △1+△2=30 众数=10+(20/30)*2=11.33 2)中位数∑f/2=144/2=72 S m-1=45 fm=50 ∑f/2 - Sm-1=72-45=27 Me= 10+27/50*2=11.083)平均数=∑xi*fi/∑fi=1580/144≈11 4)标准差=2.15第4章1、区间估计最后推断的公式:2、两个理论:大数定律、中心极限定理3、四种抽样组织形式:随机抽样、等距抽样、分类抽样、整群抽样第五章1、相关关系:完全正相关(值为1)、完全负相关(值为-1)、部分正相关(0,1),部分负相关(-1,0),不相关(值为0)2、相关系数:取值范围是在[-1,1]区间3、回归分析:x x p p x t X x t p t P p t μμμμ-≤≤+-≤≤+()()2222∑∑∑∑∑∑∑---=y y n x x n yx xy n γΣf f 2)x Σ(x σ-=144644=基本形式:y=a+bx4、估计标准误差的计算估计标准误差指标是用来说明回归方程代表性大小的统计分析指标,也简称为估计标准差或估计标准误差,其计算原理与标准差基本相同。
估计标准误差说明理论值(回归直线)的代表性。
若估计标准误差小,说明回归方程准确性高,代表性大;反之,估计不够准确,代表性小。
统计学各章计算题公式及解题方法

统计学各章计算题公式及解题方法第四章数据的概括性度量1.组距式数值型数据众数的计算:确定众数组后代入公式计算:下限公式:;上限公式:,其中,L为众数所在组下限,U为众数所在组上限,为众数所在组次数与前一组次数之差,为众数所在组次数与后一组次数之差,d为众数所在组组距2.中位数位置的确定:未分组数据为;组距分组数据为3.未分组数据中位数计算公式:4.单变量数列的中位数:先计算各组的累积次数(或累积频率)—根据位置公式确定中位数所在的组—对照累积次数(或累积频率)确定中位数(该公式假定中位数组的频数在该组内均匀分布)5.组距式数列的中位数计算公式:下限公式:;上限公式:,其中,为中位数所在组的频数,为中位数所在组前一组的累积频数,为中位数所在组后一组的累积频数6.四分位数位置的确定:未分组数据:;组距分组数据:7.简单均值:8.加权均值:,其中,为各组组中值统计学各章计算题公式及解题方法9.几何均值(用于计算平均发展速度):10.四分位差(用于衡量中位数的代表性):11.异众比率(用于衡量众数的代表性):12.极差:未分组数据:;组距分组数据:13.平均差(离散程度):未分组数据:;组距分组数据:14.总体方差:未分组数据:;分组数据:15.总体标准差:未分组数据:;分组数据:16.样本方差:未分组数据:;分组数据:17.样本标准差:未分组数据:;分组数据:18.标准分数:19.离散系数:第七章参数估计1.的估计值:置信水平α90%0。
1 0。
05 1。
654 95%0。
05 0.025 1。
9699%0.01 0。
005 2。
58统计学各章计算题公式及解题方法2.不同情况下总体均值的区间估计:总体分布样本量σ已知σ未知大样本(n≥30)正态分布小样本(n〈30)非正态分布大样本(n≥30)其中,查p448 ,查找时需查n—1的数值3.大样本总体比例的区间估计:4.总体方差在置信水平下的置信区间为:5.估计总体均值的样本量:,其中,E为估计误差6.重复抽样或无限总体抽样条件下的样本量:,其中π为总体比例第八章假设检验1.总体均值的检验(已知或未知的大样本)[总体服从正态分布,不服从正态分布的用正态分布近似]假设双侧检验左侧检验右侧检验假设形式已知统计量未知拒绝域值决策,拒绝2.总体均值检验(未知,小样本,总体正态分布)假设双侧检验左侧检验右侧检验假设形式统计学各章计算题公式及解题方法已知统计量未知拒绝域值决策,拒绝注:已知的拒绝域同大样本3.一个总体比例的检验(两类结果,总体服从二项分布,可用正态分布近似)(其中为假设的总体比例)假设双侧检验左侧检验右侧检验假设形式统计量拒绝域值决策,拒绝4.总体方差的检验(检验)假设双侧检验左侧检验右侧检验假设形式统计量拒绝域值决策,拒绝5.统计量的参考数值0。
统计学各章计算题公式及解题方法

百度文库-让每个人平等地提升自我统计学各章计算题公式及解题方法第四章数据的概括性度量组距式数值型数据众数的计算:确定众数组后代入公式计算:,其中,L 为众数所在组次数与后一组次数之差,d 为众数所在组组距单变量数列的中位数:先计算各组的累积次数(或累积频率)一根据位置公式确定中位 数所在的组一对照累积次数(或累积频率)确定中位数(该公式假定中位数组的频数在 该组内均匀分布)组距式数列的中位数计算公式:1. 2.3.4. 5.6. 7. 8.9. 10. 11.12. 13. 14.下限公式:Mo 土丄+ 爲;x 氐上限公式: 叫土 “下限,U 为众数所在组上限,A 1为众数所在组次数与前一组次数之差,为众数所在组未分组数据中位数计算公式:下限公式: 叭十毛2上限公式:M e = U-■W + L ■-x ci ,其中,在组的频数, 为中位数所在组前一组的累积频数,抵咛:||为中位数所在组后一组的累积频数四分位数位置的确定:未分组数据:下四分位数:<?! = —c 帥 * I ) I 上四分位数:Qv =XX| +JTj + ... + jf nIn加权均值:- * ,-I,几何均值 (用于计算平均发展速度).工二屮1 X 引其…X 為1 - 四分位差 (用于衡量中位数的代表性)异众比率 (用于衡量众数的代表性)极差:未分组数据:R = rnax (Xl ) - ;组距分组数据:R 土 :ft 高组上阴-最-低姐下眦 平均差(离散程度):未分组数据: ,-丄一组距分组数据: 叭-总体方差:未分组数据: ;分组数据:中位数位置的确定:未分组数据为;组距分组数据为T (甞卜仇为奇数.+巴+ J 八为喝数为中位数所;组距分组数据:简单均值: 值为各组组中:Q 。
= Qu - Q L其中叫%•松1. 的估计值: 置信水平aa 2Za290%95%99%2.不同情况下总体均值的区间估计:总体分布样本量b 已知b 未知正态分布大样本(n > 30)tJX +S工土 Za-^小样本(n<30)(TX + Za —S 工 土 f41—^1捕非正态分布 大样本(n > 30)(TX + Za —S工土 ?«--其中,•查p448,查找时需查n-1的数值3. 大样本总体比例的区间估计:4. 总体方差 在.,置信水平下的置信区间为:5. 估计总体均值的样本量:门二 駕竺,其中,第八章假设检验1.总体均值的检验(已知或卜T 未知的大样本)[总体服从正态分布,不服从正态分布的用正态分布近似]假设 双侧检验左侧检验右侧检验假设形式H Q : P =他1、阿:P 工颅\/ “1 : H旳:统计量。
统计原理计算公式(自考统计学)

集中趋势测定:一、众位数L为众数组的下限,U为上限;d为众数组的组距;△1=fm-fm-1,即众数组的次数与下一组(或前一组)次数之差;△2=fm -fm+1,即众数组的次数与上一组次数之差二、中位数式中:L为中位数所在组的下限,U为上限;d为中位数所在组的组距;Sm-1 为中位数所在组以下各组(或小于中位数的各组)次数之和;Sm+1为中位数所在组以上各组(或大于中位数的各组)次数之和;fm为中位数所在组的次数。
三、算术平均数1、简单算术平均数2、加权算术平均数A、绝对权数(次数)⇒ fB、相对权数(频率或比重)⇒ f/∑f⎪⎪⎩⎪⎪⎨⎧⇒⨯+-=⇒⨯++=上限公式dΔΔΔUM下限公式dΔΔΔLM212o211o⎪⎪⎪⎩⎪⎪⎪⎨⎧→⨯+--=→⨯--+=⇒=上限公式dm f1mS2ΣfUeM下限公式dm f1mS2ΣfLeM2Σf中位四、几何平均数离散程度的测定 极差全距是数列中的最大值与最小值之差。
全距(R)=最大值—最小值平均差平均差是各数据值与其算术平均数之差绝对值的算术平均数。
常用“M ·D ”表示(一)根据未分组资料计算(简单算术平均差)(二)根据分组资料计算(加权算术平均差)方差和标准差⎩⎨⎧⇔⇔⇔⇔=的代表性越大x 数据越集中R越小的代表性越小x 数据越分散R越大x x 当21nxx ΣD M -=⋅⎩⎨⎧→→→→→→=的代表性越大x 数据越整齐平均离差越小A.D越小的代表性越小x 数据越分散平均离差越大A.D越大x x 21Σff2)x Σ(x σn2)x Σ(x σ:标准差;(已分组资料)Σff2)x Σ(x 2σ:方差的加权式;(未分组资料)n2)x Σ(x 2σ:方差的简单式-=-=-=-=抽样平均误差计算总体平均数的抽样平均误差 (1)不重置抽样条件下(2)重置抽样条件下总体成数的抽样平均误差 (1) 不重置抽样条件下(2)重置抽样条件下抽样极限误差计算:1. 总体平均数的抽样极限误差2.总体成数的抽样极限误差100%xσV :标准差系数100%xM.DV :平均差系数σA.D ⨯=⨯=)1N n N (n σ2μx --=nσμx=)1N nN (n p)p(1μp ---=np)p(1μp -=μxxt=∆μppt=∆1、 总体平均数的区间估计:2、总体成数的区间估计:样本容量的确定总体平均数估计的样本容量的确定 重置抽样:不重置抽样 :总体成数估计的样本容量的确定 重置抽样:不重置抽样 :∆∆+-xx x x ,∆∆+-pp p p ,相关系数 判定标准:• 0.3以下,微弱线性相关 • 0.3~0.5,低度线性相关 • 0.5~0.8,显著线性相关 • 0.8以上,高度线性相关 计算公式:⎪⎩⎪⎨⎧→→→=y的标准差x,y σx σy的协方差x,xy σ为x与y的相关系数y σx σxyσ2r 2)y Σ(y 2)x Σ(x )y )(y x Σ(x n2)y Σ(y n2)x Σ(x n )y )(y x Σ(x r ----=----=yyxx xy L L L =2)y Σ(y 2)x Σ(x )y )(y x Σ(x yσx σxy σr ----==n2(Σy)2Σy n2(Σx)2Σx n ΣxΣy Σxy ---=2(Σy)2nΣy 2(Σx)2nΣx ΣxΣynΣxy ---=n2(Σy)2Σy n2(Σx)2Σxn )n ΣxΣy n(Σxy ---=2y 2y 2x 2x y x xy --⋅-=yσx σy x xy ⋅-=回归分析的方法 一元线性回归分析 方程式: 线性回归模型参数估计值计算公式:估计标准误差 计算: 平均发展水平间隔不等的时点数列Σf )f a (a 21Σa 公式i1i i ++=→平均发展水平计算bxa y +=n 2(Σx)2ΣxnΣxΣy Σxy b--=2(Σx)2nΣx ΣxΣy nΣxy --=xb y nΣx b nΣy a -=⋅-=n-2xyy-b a y2s ∑∑∑-=nΣa a :计算公式=⇒nΣa a 时期数列=→⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎨⎧⎪⎪⎪⎩⎪⎪⎪⎨⎧⎩⎨⎧++=→-+++=→=Σfi)f 1i a i Σ(a 21a 间隔不等1n n a 212a 1a 21a 间隔相等时点数列nΣa a 连续时点数列时点数列(1)∏环比发展速度=定基发展速度。
统计学重点公式复习资料 例题及答案.

150.30 0.26 X 150.30 0.26
150.04 X 150.56
统计 学
( 2)
n1 30 p 30% n 100
p(1 p) 0.3 0.7 p 0.046 n 100
p p P p p,
p z p 2 0.046 9.2%
f
V
X
100﹪
统计 学
2、某班学生40人,某次考试及格38人。求及格 率的平均数和标准差。
P
N1
N
P(1 P)
统计 学
第四章
区间估计——总体均值的置信区间(方差已知)
x
x
x x x x x z x z
2
n
n
x
或 x
(2)
a a1 a2 an1 an y bn1 b1 b b2 2 2 y 3
统计 学
1、某商店有关资料如下:
1月 商品销售额 (万元) 月初商品库 额(万元) 2月 3月 4月
100
48
159
52
130
54
140
50
试计算: (1)第一季度平均每月的商品周转次数 (2)第一季度商品周转次数 (1)
pz
p(1 p) P pz n 2
Z P 1 P n 2 P
p(1 p) n
统计 学
某公司对某种名茶随机抽样结果如下: 每包重量(克) 148-149 149-150 包 数 10 20
150-151 151-152
50 20
要求:(1)以99.73%的概率保证程度,估计这批茶叶 平均每包重量的区间;(2)按质量规定,这种茶叶每 包重量不得低于150克,试以95.45%的概率保证程度, 估计这批茶叶每包重量不合格率的范围。( 3)若其他 条件和(1)相同,现把误差范围缩小一半,问需抽取 多少包茶叶?
统计的计算题的计算步骤

《统计学原理》计算题要点:一)分组后求x 的加权算术平均值,有两个公式:∑∑=fxf x 或 )(∑∑⋅=ffx xf为各组出现的次数;∑ff为各组的频率;x 为组中值;∑为连加号二)加权调和平均数 ∑∑=xm m x 三)标准差σ标准差的计算也有简单和加权两种形式,计算公式如下:(1)简单:σ=(适用于未分组资料)可简化为:(2)加权: σ= (适用于分组资料)可简化为:四)标准差系数x v σσ=如果题目里问到谁的平均水平更有代表性或谁更具有推广价值一类的问题,需计算标准差系数。
选标准差系数小的。
计划完成程度:公式一:实际完成数 / 计划数公式二: 实际完成的上期百分数 / 计划的上期百分数五)总体参数的两种区间估计方法 (以平均数X的估计为例。
若是估计成数P ,则只有σ的计算公式改为)1(p p -,其他公式和方法是相同的。
)(一)给定抽样误差范围(即极限误差)x ∆,求置信区间和置信度。
(1)计算样本均值x ;(2)计算样本标准差σ(3)求抽样平均误差:重复抽样: nx σμ=不重复抽样:)1(2--=N nN n x σμ当N很大时可近似为:)1(2N nn x -=σμ(4)置信区间为:),(x x x x ∆+∆-(5)概率度为:xxz μ∆=,查表得)(Z F 的值,置信度为)(Z F(二)给定置信度,求置信区间和抽样极限误差的可能范围。
(1)计算样本均值x ;(2)计算样本标准差σ(3)求抽样平均误差:重复抽样: nx σμ=不重复抽样:)1(2--=N nN n x σμ当N很大时可近似为:)1(2N n n x -=σμ(4)由已知的置信度)(Z F ,得对应的概率度Z抽样极限误差为x x Z μ⋅=∆ (5)置信区间为:),(x x x x ∆+∆-六)样本单位数的计算方法:抽样平均数 抽样成数重复抽样:七)相关系数r0.8 ~ 1, 高度相关; 0.5 ~ 0.8 显著相关八) 线性回归方程式为:yc =a+bx注: (1)(2)回归系数b 的涵义是:当自变量x每增加一个单位时,因变量y的平均增加值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学各章计算题公式及解题方法第四章数据的概括性度量1.组距式数值型数据众数的计算:确定众数组后代入公式计算:下限公式:;上限公式:,其中,L为众数所在组下限,U为众数所在组上限,为众数所在组次数与前一组次数之差,为众数所在组次数与后一组次数之差,d为众数所在组组距2.中位数位置的确定:未分组数据为;组距分组数据为3.未分组数据中位数计算公式:4.单变量数列的中位数:先计算各组的累积次数(或累积频率)—根据位置公式确定中位数所在的组—对照累积次数(或累积频率)确定中位数(该公式假定中位数组的频数在该组内均匀分布)5.组距式数列的中位数计算公式:下限公式:;上限公式:,其中,为中位数所在组的频数,为中位数所在组前一组的累积频数,为中位数所在组后一组的累积频数6.四分位数位置的确定:未分组数据:;组距分组数据:7.简单均值:8.加权均值:,其中,为各组组中值9.几何均值(用于计算平均发展速度):10.四分位差(用于衡量中位数的代表性):11.异众比率(用于衡量众数的代表性):统计学各章计算题公式及解题方法12.极差:未分组数据:;组距分组数据:13.平均差(离散程度):未分组数据:;组距分组数据:14.总体方差:未分组数据:;分组数据:15.总体标准差:未分组数据:;分组数据:16.样本方差:未分组数据:;分组数据:17.样本标准差:未分组数据:;分组数据:18.标准分数:19.离散系数:第七章参数估计1.的估计值:置信水平α90% 0.1 0.05 1.65495% 0.05 0.025 1.9699% 0.01 0.005 2.582.不同情况下总体均值的区间估计:总体分布样本量σ已知σ未知大样本(n≥30)正态分布小样本(n<30)统计学各章计算题公式及解题方法非正态分布大样本(n≥30)其中,查p448 ,查找时需查n-1的数值3.大样本总体比例的区间估计:4.总体方差在置信水平下的置信区间为:5.估计总体均值的样本量:,其中,E为估计误差6.重复抽样或无限总体抽样条件下的样本量:,其中π为总体比例第八章假设检验1.总体均值的检验(已知或未知的大样本)[总体服从正态分布,不服从正态分布的用正态分布近似]假设双侧检验左侧检验右侧检验假设形式已知统计量未知拒绝域值决策,拒绝2.总体均值检验(未知,小样本,总体正态分布)假设双侧检验左侧检验右侧检验假设形式统计学各章计算题公式及解题方法已知统计量未知拒绝域值决策,拒绝注:已知的拒绝域同大样本3.一个总体比例的检验(两类结果,总体服从二项分布,可用正态分布近似)(其中为假设的总体比例)假设双侧检验左侧检验右侧检验假设形式统计量拒绝域值决策,拒绝4.总体方差的检验(检验)假设双侧检验左侧检验右侧检验假设形式统计量拒绝域值决策,拒绝统计学各章计算题公式及解题方法5.统计量的参考数值0.1 0.05 0.01双侧检验 1.65 1.96 2.58单侧检验 1.28 2.65 2.33第九章列联分析1.期望频数的分布(假定行变量和列变量是独立的)一个实际频数的期望频数,是总频数的个数乘以该实际频数落入第行和第j列的概率,即:2.统计量(用于检验列联表中变量间拟合优度和独立性;用于测定两个分类变量之间的相关程度,为列联表中第i行第j 列的实际频数,为列联表中第i行第j列的期望频数1)检验多个比例是否相等检验的步骤提出假设H0:π1 = π2= … = πj;H1:π1,π2,…,πj不全相等;计算检验的统计量;进行决策:根据显著性水平α和自由度(r-1)(c-1)查出临界值,若χ2>,拒绝H0;若χ2<,不拒绝H02)利用样本数据检验总体比例是否等于某个数值检验的步骤提出假设H0:π1 = ,π2 = ,… ;H1:原假设的等式中至少有一个不成立;计算检验的统计量;进行决:根据显著性水平α和自由度(r-1)(c-1)查出临界值χα2;若χ2>,拒绝H0;若χ2<,不拒绝H03)检验列联表中的行变量与列变量之间是否独立检验的步骤提出假设H0:行变量与列变量独立;H1:行变量与列变量不独立;计算检验的统计量;进行决策:根据显著性水平α和自由度(r-1)(c-1)查出临界值,若χ2≥,拒绝H0;若χ2<,不拒绝H03.ϕ相关系数:测度2⨯2列联表中数据相关程度;对于2⨯2 列联表,ϕ系数的值在0~1之间统计学各章计算题公式及解题方法,其中,n为实际频数总个数,即样本容量4.列联相关系数(C系数)用于测度大于2 2列联表中数据的相关程度,其中,C的取值范围是 0C<1;C= 0表明列联表中的两个变量独立;C的数值大小取决于列联表的行数和列数,并随行数和列数的增大而增大;根据不同行和列的列联表计算的列联系数不便于比较5.V相关系数,其中,V 的取值范围是 0≤V≤1; V = 0表明列联表中的两个变量独立;V=1表明列联表中的两个变量完全相关;不同行和列的列联表计算的列联系数不便于比较;当列联表中有一维为2,min[(r-1),(c-1)]=1,此时V=第十章方差分析1.单因素方差分析的要点:1)建立假设的表述方法:,自变量对因变量没有显著影响不全相等,自变量对因变量有显著影响2)决策:i.根据给定的显著性水平,在F分布表中查找与第一自由度、第二自由相应的临界值ii.若F>,则拒绝原假设,表明均值之间的差异是显著的,所检验的因素对观察值有显著影响iii.若F<,则不拒绝原假设,不能认为所检验的因素对观察值有显著影响3)单因素方差分析表的结构:2.方差分析中的多重比较(步骤):采用Fisher提出的最小显著差异方法,简写为LSD统计学各章计算题公式及解题方法1)提出假设:(第个总体的均值等于第个总体的均值)(第个总体的均值不等于第个总体的均值)2)计算检验统计量:3)计算LSD:4)决策:若,则拒绝;若,则不拒绝3.双因素方差分析:1)无交互作用的双因素方差分析表结构:2)有交互作用的双因素方差分析表结构:4.关系强度测量:变量间关系的强度用自变量平方和(SSA)及残差平方和(SSE)占总平方和(SST)的比例大小来反映,根据平方根R进行判断第十一章一元线性回归1.样本的相关系数:统计学各章计算题公式及解题方法2.相关系数的显著性检验步骤:1)提出假设:2)计算检验统计量:3)确定并决策:,拒绝;,不拒绝3.一元回归模型:4.一元线性回归方程形式:,其中是直线方程在y轴上的截距,是当=0时,y的期望值;是直线的斜率,称为回归系数,表示当每变动一个单位时y的平均变动值5.一元线性回归中,估计的回归方程:,其中是估计的回归直线在y轴上的截距,是直线的斜率,它表示对于一个给定的的值,是y的估计值,表示当每变动一个单位时y的平均变动值6.根据最小二乘法求以及的公式:7.误差平方和之间的关系:,即:8.判定系数(回归平方和占离差平方和的比例):9.估计标准误差(实际观察值与回归估计值离差平方和的均方根):10.线性关系的显著性检验:1)提出假设:,线性关系不显著;,有线性关系2)计算检验统计量:3)确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值统计学各章计算题公式及解题方法4)决策:若,拒绝;,不拒绝11.回归系数的显著性检验:1)提出假设:,线性关系不显著;,有线性关系2)计算检验统计量:3)确定显著性水平并决策:若;12.置信区间估计:在置信水平下的置信区间:其中,为估计标准误差,为的自由度13.预测区间估计:在置信水平下的预测区间:14.回归分析表的结构:15.几点说明:1)判定系数测度了回归直线对观测数据的拟合程度,若所有观测点都落在直线上,残差平方和SSE=0,=1,拟合是完全的2)在一元线性回归中,相关系数r实际上是判定系数的平方根统计学各章计算题公式及解题方法3)相关系数r与回归系数是同号的第十三章时间序列预测和分析1.环比增长率:报告期增长率与前一期水平之比减1:2.定基增长率:报告期水平与某一固定时期水平之比减1,其中,表示用于对比的固定基期的观察值3.平均增长率:序列中各逐期环比值(也称环比发展速度) 的几何平均数减1后的结果(描述现象在整个观察期内平均增长变化的程度)1)当时间序列中的观察值出现0或负数时,不宜计算增长率2)在有些情况下,不宜单纯就增长率论增长率,要注意增长率与绝对水平的结合分析4.时间序列预测的步骤:1)确定时间序列所包含的成分,也就是确定时间序列的类型2)找出适合此类时间序列的预测方法3)对可能的预测方法进行评估,以确定最佳预测方案4)利用最佳预测方案进行预测5.均方误差:通过平方消去正负号后计算的平均误差,用MSE表示6.简单平均法:根据过去已有的t期观察值来预测下一期数值。
设时间序列已有的其观察值为则期的预测值为:有了的实际值,则预测误差为:期的预测值为:7.简单移动平均法:将最近k期的数据加以平均,作为下一期的预测值设移动间隔为k(1<k<t),则t期的移动平均值为:统计学各章计算题公式及解题方法期的预测值为:预测误差用均方误差表示:8.指数平滑法(一次):以一段时期的预测值与观察值的线性组合作为t+1的预测值,其预测模型为:,其中为平滑系数,在开始计算时,没有第1个时期的预测值,通常可以设等于1期的实际观察值,即9.线性趋势预测:1)一般形式:,为时间序列趋势值,为时间标号,为趋势线在Y 轴上的截距,为趋势线的斜率,表示时间变动一个单位时观察值的平均变动数量2)由最小二乘法求得:如令,则3)预测误差可用估计标准误差来衡量:m为趋势方程中未知常数的个数10.指数曲线:用于描述以几何级数递增或递减的现象1)一般形式:,a、b为未知常数,若b>1,增长率随着时间t的增加而增加,若b<1,增长率随着时间t的增加而降低,若a>0,b<1,趋势值逐渐降低到以0为极限2)将一般形式转换为对数直线形式,由最小二乘法求得:3)求出及,取反对数11.修正指数曲线:描述初期增长迅速,随后增长率逐渐降低,最终则K为增长极限现象1)一般形式:,K、a、b 为未知常数,K>0,a≠0,0<b≠12)趋势值K无法事先确定时采用;将时间序列观察值等分为三个部分,每部分有m个时期;令趋势值的三个局部总和分别等于原序列观察值的三个局部总和i.设观察值的三个局部总和分别为:,;;11统计学各章计算题公式及解题方法ii.根据三和法求得:12.Gompertz曲线:描述初期增长缓慢,以后逐渐加快,当达到一定程度后,增长率又逐渐下降,最后接近一条水平线现象1)一般形式:,K、a、b为未知常数;K>0,0<a≠1,0<b≠12)求解系数方法:i.将其改写为对数形式:ii.仿照修正指数曲线的常数确定方法,求出、、b ;取和的反对数求得和令:,,则有:第十四章指数1.简单综合指数:(误差太大)(质量指标);(数量指标)2.加权综合指数:1)拉氏数量指标指数(同度量因素固定在基期):2)帕氏质量指标指数(同度量因素固定在报告期):3.指数体系:式中为报告期总量指标,为基期总量指标,q为数量指标,p为质量指标12统计学各章计算题公式及解题方法因素影响差额之间的关系:4.居民消费价格指数:,式中代表规格品个体指数或各层的类指数,为相应的消费支出比重5.股票价格指数:13。