统计学知识简介

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i
中心极限定理说明,当样本容量n充分大时,相互独立 随机变量和的分布将是正态的,即:
2 2 x ~ N ( n , n ) 或 x ~ N ( , / n) i i 1 n
统计学知识简介
七、估计量的评价标准 1、无偏性
利用统计量的信息 可以对未知参数进 ˆ 作为θ的 行估计, 估计量,其优劣有 一些评价的标准。
如:x是的有效估计量
如:x为的一致估计量 3、一致性 ˆ |) ) 1 ˆ 依概率收敛于θ,即对任意ε>0,lim P(| 若 n ˆ 为θ的一致估计量。 通常把样本容量n>30的样本看做大 则称
样本,一致性在大样本时才起作用。
统计学知识简介
八、参数估计 1、参数的点估计
1 n 2 2 2 若S ( X X ) ,则 E ( S ) i n 1 i 1
2
1 n 2 若S (Xi X) 2,则E(S0 ) 2 n i 1
2 0
3、样本协方差
1 n (Xi X)(Yi Y) 无偏 n 1 i 1 1 n (Xi X)(Yi Y) 有偏 n i 1
若ξ为随机变量,η=f(ξ)称为随机变量函数,通常也是一 个随机变量。
统计学知识简介
三、总体分布的数字特征——参数
总体分布是由它的某些 数字特征决定的,称之 为参数。常用的参数有 期望、方差、协方差
1、数学期望(Mathematical Expectation) 也称均值,表示总体的平均水平,记为μ或E(•) 离散型随机变量ξ的期望值定义为:E() 连续型随机变量ξ的期望值定义为:E() 期望值满足: (1)若a为常数,ξ随机变量,则E(a)=a,E(aξ)=aE(ξ) (2)若ξ、η为随机变量,a、b为常数,则E(aξ+bη)=aE(ξ)+bE(η) (3)若ξ、η为相互独立的随机变量,则E(ξ•η)=E(ξ)•E(η)
i 1 i 1 i 1 2 i 2 i n n n
正态分布在统计中具有重要的理论和实践意 义,现实中的许多随机现象都服从或近似服 从正态分布;随着样本容量的增大,很多统 计量近似于正态分布(如 t分布);许多离散型 随机变量可用正态分布来近似(如二项分布)。
统计学知识简介
五、几个重要的连续型随机变量的分布 2、χ2分布
F分布的上侧分位数
易知,若F~ F(n1,n2), 则1/F ~ F(n2,n1)。
α
0
Fα(n1,n2) x
统计学知识简介
六、正态总体的样本平均数和样本方差 (1)若总体服从N(μ,σ2),x1 , „ , xn为一个样本,则
x x ~ N( , / n ) , ~ N(0 , 1) / n
i 1 i 1
统计学知识简介
五、几个重要的连续型随机变量的分布 3、t分布
若随机变量ξ ~ N(0,1),η ~ χ2(n),ξ与η相互独立,则称
t 为服从自由度为n的t分布,记为t ~ t(n)。 / n
可以 (1)E(t) = 0 证明: (2)Var(t)随着n的增加而减少,且Var(+∞)=1 (3)当n>30时,t(n)近似于N(0,1) 。



f (x)dx 1,P(a x b) f (x)dx
a
b
若ξ为随机变量,x为任意实数,则称F( x )=P( ξ ≤ x )为 随机变量ξ的分布函数,即ξ ≤ x的概率。 分布函数F (x )满足:0 ≤ F( x ) ≤ 1,F( -∞)=0,F(+∞)=1, P(x1 ≤ ξ ≤ x2)=F( x2 )- F( x1 )
统计学知识简介
一、总体、样本与随机变量 二、随机变量的分布 三、总体分布的数字特征——参数 四、样本分布的数字特征——统计量
统计学是研究随机现象的统 计规律的一门科学,已被广 泛地应用于自然科学和社会 科学的各个领域中,成为定 量分析的一种有力工具。
五、几个重要的连续型随机变量的分布
六、正态总体的样本平均数和样本方差 七、估计量的评价标准 八、参数估计 九、假设检验
对无限总体,不重复抽样等价于重复抽样,当N很大时,不重复 抽样则近似于重复抽样
统计学知识简介
一、总体、样本与随机变量 随机变量——按一定的概率取不同数值的变量,用ξ、η等表示。 一个随机变量的完全信息是包括它的取值范围及取每个数值的 概率,称为随机变量的分布。 随机变量按其取值情况分为两大类: 离散型随机变量——所有可能值为有限个或至多为无穷可列个。 连续型随机变量——所有可能取值不能够一一列举出来,其值 域为一个或若干个有限或无限区间。
统计学知识简介
五、几个重要的连续型随机变量的分布
1 e 若随机变量ξ的密度函数 f ( x ) 2
f(x)
1、正态分布
( x ) 2 22
μ
x
其中μ、σ为常数,σ >0,则称ξ服从正态分布,记为ξ ~ N(μ,σ2)
当μ=0,σ=1时,称ξ服从标准正态分布,记为ξ ~ N(0,1)
正态分布 t分布
f(x)
0
x
统计学知识简介
五、几个重要的连续型随机变量的分布 4、F分布 若随机变量ξ ~ χ2(n1) ,η ~ χ2(n2),且ξ与η相互独立,则称
/ n1 为服从第一个自由度为n 、第二个自由 F 1 / n 2 度为n2的F分布,记为F~ F(n1,n2)。
f(x)


2
由期望值的性质,可得:Var () E(2 ) 方差满足:
E()
2
Var()
(1)若a为常数,ξ随机变量,则Var(a)=0, Var(aξ)= a2 Var(ξ), Var(a+ξ)= Var(ξ)
为总体标准差, 与总体的数量指 标有相同的量纲。
(2)若ξ、η为相互独立的随机变量,a、b为常数,则 Var(aξ+bη)=a2 Var(ξ)+b2 Var(η)
(2)若随机变量1, , n 相互独立,i ~ N(0 , 1), 1 n 则 (i ) ~ (n 1),其中 i n i 1 i 1
2 2 n
f(x)
n=4
n=10
0
2 n 2 n
x
(3)若随机变量1, , n 相互独立,i ~ (n i ),则 i ~ ( n i )
2、样本方差
S S2
为样本标准差,它与样本观测值的数量指标有相同的量纲。
显然,由不同的样本可以得到不同的样本平均数和样本方差,因此统 计量是随机变量。可以证明: 2 2
E(X) , E(S )
统计学知识简介
四、样本分布的数字特征——统计量 2、样本方差
样本分布的数字特征 称为统计量。
2
x ~ t (n 1) S/ n
(n 1)S2 2 2 ~ ( n 1 ) ,且 x 与 S 相互独立 2
(2)若x1 , „ , xn和y1 , „ , yn是分别取自正态总体N(μ1,σ12)、 N(μ2,σ22)的样本,则
2 2 S1 / 1 F 2 2 ~ F(n1 1 , n 2 1) S2 / 2
对离散 变量:
F(x) Pi
xi x
对连续 变量:
F( x ) f ( t )dt

x
统计学知识简介
二、随机变量的分布
随机变量是用它的 分布来表示的。
分量为随机变量的向量称为多元随机变量,其联合分布 函数定义为:F(x1 , „, xn)=P(ξ1 ≤ x1 , „,ξn ≤ xn)。 若随机变量ξ、η满足F(x,y)=Fξ (x) • Fη (y),即联合分布 函数等于各自分布函数的乘积,则称随机变量ξ与η相互 独立。
其中,S12、S22分别为两个样本的样本方差。
统计学知识简介
六、正态总体的样本平均数和样本方差 (3)中心极限定理:若随机变量x1 , „ , xn相互独立, 且服从同一分布,则
随机变量y n
Leabharlann Baidu
x
i 1
n
n 的极限分布(n→∞)为标准正态分布, 其中μ、σ2分别为xi的均值和方差。 n
P x
i
i

i

xf (x)dx
统计学知识简介
三、总体分布的数字特征——参数
总体分布是由它的某些 数字特征决定的,称之 为参数。常用的参数有 期望值、方差、协方差
2、方差(Variance) 表示总体相对均值的离散程度,记为σ2或Var(ξ) 定义为: Var () E E()
ˆ ) ,则称 ˆ 为θ的无偏估计量。 若 E(
通常称
ˆ ) 为系统误差,无偏估计意味着无系统误差。 E(
如:E(x) , E(S2 ) 2
在样本容量相同的情 况下,有效估计量的 值在θ的附近最为集中
2、有效性 ˆ 为θ的所有无偏估计量中方差 若 ˆ 为θ的有效估计量。 最小的,则称
统计学知识简介
一、总体、样本与随机变量 总体——所研究对象的全体。
总体中的每个元素称为个体,总体中个体的数目称为总体容量,用N表示。
分:有限总体——N为有限数,无限总体——N为无限数。
样本——由总体中的若干个体组成的集合
样本中个体的数目称为样本容量,用n表示。样本是总体的子集。 根据样本的信息来推测总体的情况,并给出这个推断的可靠程度, 称为统计推断。统计推断要求从总体中抽取样本须满足随机原则, 即抽样时总体中的每个个体都有同等的机会成为样本中的元素。 不重复抽样——每次抽取一个 个体不放回去,再抽取第二个 个体,连续抽取n次。 重复抽样——每次抽取一个 个体又放回去,再抽取第二 个个体,连续抽取n次。
显然,参数不是随机变量。
统计学知识简介
三、总体分布的数字特征——参数
总体分布是由它的某些 数字特征决定的,称之 为参数。常用的参数有 期望值、方差、协方差
3、协方差(Covariance) 是两个随机变量与各自数学期望离差之积的期望, 记为:
Cov(, ) E E() E()
统计学知识简介
二、随机变量的分布
随机变量是用它的 分布来表示的。
对离散型随机变量 ξ,可以用概率函数Pi =P( ξ =xi )表示, 即ξ = xi的概率,其中i=1,2, „。P满足:Pi ≥0,∑Pi =1 对连续型随机变量 ξ,可以用密度函数f(x)表示,近似于ξ 在x附近单位长区间上取值的概率。f(x)满足:f(x)≥0,
统计学知识简介
四、样本分布的数字特征——统计量 1、样本平均数
样本分布的数字特征 称为统计量。
n 1 样本平均数表示样本的平均水平。 X Xi 若 x1 , , x n 为一个样本,定义为: n i 1
n 1 2 2 S ( X X ) 样本方差表示样本相对其样本 i n 1 i 1 平均数的离散程度,定义为:
可简化为:Cov(, ) E() E()E() 协方差满足:
协方差可用于度 量两个随机变量 之间相关关系的 密切程度。
(1)若ξ和η独立,则Cov(ξ , η)=0 (2) Cov(ξ , ξ)= Var(ξ)
(3) Cov(a+bξ , c+dη)= bdCov(ξ , η)
显然,参数不是随机变量。
服从χ2分布的随机变量, 可以表示为独立的标 准正态随机变量的平 方和。正态总体的样 本方差服从χ2分布。
若ξ1 , „ , ξn 为服从N(0,1)的正态总体的样本, 则称ξ= ξ12 +„+ ξn2 为服从n个自由度的χ2分布,记为ξ ~ χ2(n)
χ2分布满足: (1)E(ξ) = n,Var(ξ) = 2n
正态分布满足: (1)E(ξ) = μ,Var(ξ) = σ2
(2)若ξ ~ N(μ,σ2),则 ( ) ~ N(0, 1)
(3)若随机变量1, , n 相互独立,i ~ N( i , 2 ,a 1 , , a n 不全为0, i ) 则 a i i ~ N( a i i , a )
统计推断中包括参 数估计和假设检验。 参数估计又分为点 估计和区间估计。
ˆ ,把其观测值作为未知参数θ 选择一个适当的统计量 的估计值,称为点估计。统计量的选取有不同的方法。
(1)矩估计法 随机变量x 的r阶原点矩定义为E(xr),r阶中心矩定义为 E[(x-E(x))r]。 特例:一阶原点矩为数学期望E(x),二阶中心距为方差 Var(x),即E[(x-E(x))2]。
相关文档
最新文档