数理统计 样本及抽样分布.

合集下载

概率论与数理统计 第六章 样本及抽样分布

概率论与数理统计 第六章 样本及抽样分布

x0 o.w.
n 1
n5
n 15
15
(2)t-分布(学生分布)
设 X ~ N ( 0 ,1), Y ~ 2 ( n ) 且X、Y为独立随 机变量,则称随机变量
t
X Y /n

X
1 n 2 ( X 12 ...... X n )
为自由度为n的t-分布。记为: t ~ t ( n ) 。
3
§1 随机样本
总体: 研究对象在某项数量指标的全体. 记为X。通常称总体X。 个体: 总体X中的每一个元素(实数)xi。 根据总体所含的个体数分为: 有限总体和无限总体。
4
总体与取样
X1
X
X2 X3 Xn
取样模型
X
X2 X1
X3
X4
X5
河流污染取样
5
总体、样本、统计量
总体 样本 统计量
X1 X2
2 ( n ) 分布:
具有可加性
2 X X 12 ...... X n , X i ~ N (0,1)
3. 4.
t ( n ) 分布:
X ~ N (0,1), Y ~ 2 ( n )
t(n) X Y /n
F ( n1 , n 2 ) 分布: U ~ 2 ( n1 ), V ~ 2 ( n 2 )



F (n1 , n2 )
19
分位点及性质:
定义: Pr[ X z ]

z
(1)标准正态分布分位点

(x)
( x)dx 1 ( x)dx


z
z1
( x)
Pr[ X z ]

数理统计基础公式详解样本统计量与抽样分布

数理统计基础公式详解样本统计量与抽样分布

数理统计基础公式详解样本统计量与抽样分布数理统计作为一门重要的学科,为我们分析和理解数据提供了基础和方法。

在数理统计中,样本统计量和抽样分布是两个关键概念。

本文将详细解释这些概念,并介绍相关的公式和定理。

一、样本统计量样本统计量是从数据样本中计算得到的数值,用于描述总体的特征。

常用的样本统计量有平均值、方差、标准差、相关系数等。

下面我们将详细介绍这些统计量以及它们的计算公式。

1. 平均值平均值是一组数据的总和除以观测数量,用于衡量数据的集中趋势。

样本平均值的计算公式如下:\[ \overline{x} = \frac{\sum_{i=1}^{n} x_i}{n} \]其中,\( \overline{x} \) 表示样本平均值,\( x_i \) 表示第 i 个观测值,n 表示观测数量。

2. 方差方差衡量了一组数据的离散程度,它表示各观测值与平均值之差的平方和的平均值。

样本方差的计算公式如下:\[ S^2 = \frac{\sum_{i=1}^{n} (x_i - \overline{x})^2}{n-1} \]其中,\( S^2 \) 表示样本方差,\( x_i \) 表示第 i 个观测值,\( \overline{x} \) 表示样本平均值,n 表示观测数量。

3. 标准差标准差是方差的平方根,用于衡量数据的离散程度。

样本标准差的计算公式如下:\[ S = \sqrt{S^2} \]其中,S 表示样本标准差,\( S^2 \) 表示样本方差。

4. 相关系数相关系数衡量了两个变量之间的线性关系的强弱和方向。

样本相关系数的计算公式如下:\[ r = \frac{\sum_{i=1}^{n} (x_i - \overline{x})(y_i -\overline{y})}{\sqrt{\sum_{i=1}^{n} (x_i - \overline{x})^2 \sum_{i=1}^{n} (y_i - \overline{y})^2}} \]其中,r 表示样本相关系数,\( x_i \) 和 \( y_i \) 分别表示第 i 个观测值的两个变量,\( \overline{x} \) 和 \( \overline{y} \) 分别表示两个变量的样本平均值,n 表示观测数量。

概率论与数理统计(06)第6章 统计量及其抽样分布

概率论与数理统计(06)第6章  统计量及其抽样分布
一个任意分 布的总体
σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 11
µx = µ
xቤተ መጻሕፍቲ ባይዱ
x 的分布趋 于正态分布 的过程
6 - 12
6.4 正态总体 6.3.1 χ2分布 6.3.2 t 分布 6.3.3 F 分布
6 - 13
χ2 分布
第六章 样本与统计量
6.1引言 6.1引言
数理统计学: 运用概率论的基础知识,对要研究的随机现象进行 多次观察或试验,研究如何合理地获得数据资料, 建立有效的数学方法,根据所获得的数据资料,对 所关心的问题作出估计与检验。
6-1
§6.2总体与样本 6.2总体与样本
对某一问题的研究对象全体称为总体。 组成总体的某个基本单元,称为个体。 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体。 有限总体在个体相当多的情况下,可以作为无限 总体进行研究。 总体中的个体,应当有共同的可观察的特征。该 特征与研究目的有关。
6 - 16
χ2分布
(图示) 图示)
n=1 n=4 n=10
n=20
6 - 17 不同容量样本的抽样分布
χ2
t 分布
6 - 18
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 (W. “Student”(学生)为笔名的论文中首次提出 Student”(学生)
X ~ N(µ,σ ) ,则
2
χ2分布
2. 3.
z=
X −µ
Y=z

概率论与数理统计-ch6-样本与抽样分布

概率论与数理统计-ch6-样本与抽样分布

概率论与数理统计-ch6-样本与抽样分布概率论中,所研究的随机变量是假定其分布是已知的,在此前提下研究它的性质、数字特征等。

在数理统计中,所研究的随机变量的分布是未知或不完全知道的,通过重复独⽴的试验得到许多观察值去推断随机变量的种种可能分布。

1、随机样本总体:试验的全部可能的观察值。

=样本空间个体:每⼀个可能观察值。

=样本点容量:总体中所包含的个体的个数。

有限总体⽆限总体⼀个总体对应⼀个随机变量X,对总体的研究就是对随机变量X的研究。

所以将不区分总体与相应的随机变量,统称为总体X。

样本:在数理统计中,⼈们都是通过从总体中抽取⼀部分个体,根据获得的数据来对总体分布得出推断的,被抽出的部分个体叫做总体的⼀个样本。

对总体进⾏⼀次观察,就会得到⼀个随机变量X1,对总体进⾏n次重复的、独⽴的观察,就会得到n个随机变量X1,X2,...,Xn,这n个随机变量X1,X2,...,Xn是对总体随机变量X观察的结果。

则X1,X2,...,Xn是相关独⽴且与X具有相同分布,称为来⾃总体X的⼀个简单随机样本。

n称为样本的容量。

进⾏n次观察得到的⼀组实数x1,x2,...,xn是随机变量X1,X2,...,Xn的观察值,称为样本值,也称为X的n个独⽴的观测值。

2、抽样分布样本是统计推断的依据,但往往不直接使⽤样本本⾝,⽽是由样本构造的函数。

统计量:设X1,X2,...,Xn是来⾃总体X的⼀个样本,g(X1,X2,...,Xn)是其函数,且g中不含任何未知参数,则称g(X1,X2,...,Xn)是⼀统计量。

统计量也是⼀个随机变量。

g(x1,x2,...,xn)是统计量的观测值。

常⽤的统计量:经验分布函数:经验分布函数(empirical distribution function)是根据样本得到的分布函数.如设,是总体的样本值,将它们按⼤⼩顺序排列为,则称分布函数为经验分布函数是与总体分布函数相对应的统计量。

总体的分布函数是F(x),统计量的经验分布函数是F n(x),⽤F n(x)去推断F(x),当n⾜够⼤时,F n(x)以概率1收敛于F(x)。

生物数学-数理统计习题(一)

生物数学-数理统计习题(一)

生物数学—-数理统计习题(前半部分)一、抽样与抽样分布1.设X 1,X 2,···,X n 为样本,¯X n =1n n i =1X i ,S 2n =1n n i =1(X i −¯X )2,X n +1为第n +1次的观测样本,试证:¯X n +1=¯X n +1n +1(X n +1−¯X n )2.设x 1,x 2,···,x n 及u 1,u 2,···,u n 为两个样本观测值,它们有如下关系:u i =x i −a b,b =0,a 都为常数,求样本平均值¯u 与¯x ,样本方差S 2u 与S 2x 之间的关系。

3.证明如下等式:(1)n i =1(X i −¯X )=0;(2)n i =1(X i −C )2=n i =1(X i −¯X )2+n (¯X −C )2;(3)n i =1(X i −¯X )2=n i =1X 2i −n ¯X,进而有S 2n =¯X 2−¯X 2,其中¯X 2=1n n i =1X 2i 。

4.若从总体中抽取容量为13的一个样本:−2.1,3.2,0,−0.1,1.2,−4,2.22,2.01,1.2,−0.1,3.21,−2.1,0试写出这个样本的次序统计量,中位数和极差。

5.设X ∼N (µ,σ2),求样本均值¯X与总体期望µ的偏差不超过1.96σ2n的概率。

6.在总体N (52,633)中随机抽一容量为36的样本,求样本均值¯X 落在50.8和53.8之间的概率。

7.求总体N (20,3)的容量分别为10,15的两个独立样本均值差的绝对值大于0.3的概率。

8.设X 1,X 2,···,X 10为N (0,0.09)的一个样本,求P (10i =1X 2i >1.44)。

数理统计基本知识

数理统计基本知识

2 (5), Y
E( 2 ) n, D( 2 ) 2n.
P{ (n)}
2 2
2 2 ( n ) 的点 为分布 (n) 的上分位点.


( n)
2
f ( y)dy
19
•当n充分大(>45)时,有
2
1 ( z 2n 1 ) 2 2

i 1
n
X i 2 等均
1 ( X 1 X 2 ) 等都不是统计 2 Xi i 1 2 量,因为它们含有未知参数 ,
为统计量,而
1
n
2
从统计量的定义可知,统计量是不含任何未知参数的
随机变量.
10
几个常用的统计量 设X1, X2 ,…, Xn是来自总体X
的一个样本, (x1,x2,…,xn)是其观察值.
§6.2
抽样分布
一、统计量 样本是进行统计推断的依据.但在应
用时,往往不是直接使用是样本本身,而是针对不同 的问题构造样本的适当函数,利用这些样本的函数进 行统计推断. 定义1 设X1, X2 ,…, Xn是来自总体 X 的一个样本, g(X1, X2 ,…, Xn)是X1, X2 ,…, Xn函数,若g 中不含任 何未知参数,则称g(X1, X2 ,…, Xn)是一个统计量. [注] (1) 统计量是一个随机变量;
n 11
0
18
y


2 分布的可加性 设 12 ~ 2 (n1 ), 2 ~ 2 (n2 ) 2 2 2 2 2 且 1 与 2相互独立,则有 1 2 ~ ( n1 n2 )
分布的数学期望和方差
例: X

U ( 0, 4), 则 E ( X Y ) _____ D( X Y ) _____ . 分布的分位点 对于给定正数 (0<<1), 称满足

第十六讲(数理统计中常用的分布、抽样分布定理)

第十六讲(数理统计中常用的分布、抽样分布定理)
2 1 2 2
3 n足够大 时, (n)近似服从• (n,2n) N
2

1设
2 (n) X i2
i 1
n
X i ~ N (0,1) i 1,2, , n
X 1 , X 2 , , X n
相互独立,
2 i
则 E ( X i ) 0, D( X i ) 1, E ( X ) 1
•2
P{ X z } 1
-z= z1-
例1 求
z0.05 , z0.025 , z0.005 , z0.95 .
解: P{ X 1.645} 0.05, P{ X 1.96} 0.05, P{ X 2.575} 0.005.
z0.05 1.645 , z0.025 1.96 , z0.005 2.575
0.4 0.3 0.2 0.1
n= 1 n=20
-3

-1
1
2
3
t 分布的图形(红色的是标准正态分布)
t分布的性质: 1. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形, 1 t 2 2 再 由函数的性质有 lim f (t ) 2 e . n
~ ( n2 ), U
2
与V 相互
U n1 F V n2
服从自由度为n1及 n2 的F分布,n1称为 第 一自由度,n2称为第二自由度,记作
F~F(n1,n2) . 由定义可见,
1 V n2 ~F(n2,n1) F U n1
若F~F(n1,n2), F的概率密度为
( n1 n2 ) n n1 n21 1 n n 2 n ( n1 ) 2 ( y ) 1 n1 y 2 ( y ) ( 1 ) ( 2 ) 2 2 2 0

概率论6-1,2,3

概率论6-1,2,3

例如,考察某工厂10月份生产的灯泡的寿命所组 例如,考察某工厂 月份生产的灯泡的寿命所组 成的总体。 成的总体。灯泡寿命落在各个时间区间内有一定的 百分比,如灯泡寿命落在1000小时 小时~1300小时的占灯 百分比,如灯泡寿命落在 小时 小时的占灯 泡总数的85%,落在1300小时 %,落在 小时~1800小时的占灯泡总 泡总数的 %,落在 小时 小时的占灯泡总 数的5%, %,…。 即灯泡寿命的取值有一定的分布。 数的 %, 。 即灯泡寿命的取值有一定的分布。
就取位于 [ 是整数, x([ np ]+1) , 不是整数, 当np不是整数, x 综上, 综上, p = 1 [ x( np ) + x( np+1) ], 当np是整数 . 2
0 当 特别, 特别, p = 0.5时,.5分位数 x0 .5也记为Q2或
数据集的箱线图是由箱子和直线组成的图形, 数据集的箱线图是由箱子和直线组成的图形, 它是基于以下五个数的图形概括: 它是基于以下五个数的图形概括: 最小值 Min, 第一四分位数 Q1,中位数M,第三四分位数 Q3和 中位数 最大值 Max. 作法如下: 作法如下: (1) 画一水平数轴, 在轴上标上 Min,Q1, M, 画一水平数轴, Q3,Max. 在数轴上方画一个上、 下侧平行于数 在数轴上方画一个上、 Q 箱子的左右两侧分别位 于 Q1, 3 的上方. 轴的矩形箱子, 轴的矩形箱子, 在 M点的上方画一条垂直线 段 .线段位于箱子内部. ( 2)自箱子左侧引一条水平 线至 Min; 在同一水平 高度自箱子右侧引一条水平线直至最大值. 高度自箱子右侧引一条水平线直至最大值. 如图所示. 如图所示.
1.总体与个体 总体与个体
§1 随机样本
总体 试验的全部可能的观察值称为总体. 试验的全部可能的观察值称为总体. 个体 总体中的每个可能观察值称为个体. 总体中的每个可能观察值称为个体.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章 样本与抽样分布
2. 格列汶科定理
设总体分布函数为F (x) ,经验分布函数为Fn(x) , 则
P lim sup Fn ( x) F ( x) 0 1
n


即 当n 很大时, F n ( x ) F ( x )
第一章
样本与抽样分布
三. 样本的数字特征
1. 样本均值
1 n X Xi n i 1
第一章 样本及抽样分布
1.1 总体和样本 1.2 抽样分布
武汉理工大学应用数学系模式分析研究室王展青
1.1 总体和样本
一. 二. 三. 四. 总体与样本 经验分布函数 样本的数字特征 统计量
武汉理工大学应用数学系模式分析研究室王展青
一. 总体与样本
1. 总体和个体
总体:研究对象的全体,用随机变量X表示。 个体:总体的每个单元。
称 2 服从自由度是 n 的卡方分布。 概率密度为
n x 1 1 2 2 x e , x 0, n 2 n f ( x ) 2 ( ) 2 , x0 0
第一章 样本与抽样分布
2 分布的性质
① E ( 2 ( n ) ) = n, D ( 2 ( n ) ) = 2 n ② 2分布的可加性 若12 ~ 2(n1), 22 ~ 2(n2)且相互独立, 12 + 22 ~ 2(n 1 + n 2) 则
2. 样本方差 n 1 2 S2 ( X X ) i n 1 i 1 3. 样本标准差
1 n x xi nቤተ መጻሕፍቲ ባይዱi 1
n 1 2 s2 ( x x ) i n 1 i 1
S
1 2 ( X X ) i n 1 i 1
第一章
n
s
1 n 2 ( x x ) i n 1 i 1
P
n→∞
总体均值 E ( X ) 总体方差 D ( X )
P
n→∞
P
n→∞
第一章
总体矩
样本与抽样分布
四. 统计量
设X1, X2, , Xn是总体X的样本,若函数 g ( X1, X2, , Xn )不含任何未知参数, 则称函数g ( X1, X2, , Xn )为一个统计量。
如 样本均值, 样本方差, 样本矩 经验分布函数F n ( x )
P ( U ≤ u ) =1 - = ( u )

1 -

u o
u
u 0.05 = 1.645
第一章 样本与抽样分布
2. 2 (卡方)分布
定义:设总体X ~ N(0,1),X1, X2, , Xn是X的样本统 计量2定义为
2 2 2 X12 X 2 Xn , X i ~ N (0,1)
1 (1.645 99 ) 2 2 67.221
第一章

x o
2 ( n)
样本与抽样分布
3. t 分布
X T 则称 T 服从自由度是n的t 分布 Y /n n 1 n 1 概率密度为 ( ) 2 2 t 2 f (t ) 1 n n n ( ) 2 t 分布的性质
第一章
样本与抽样分布
1.2 抽样分布
一. 分布函数的分位点 二. 四大统计分布 三. 正态总体的抽样分布定理
武汉理工大学应用数学系模式分析研究室王展青
一. 分布函数的分位点
抽样分布 统计量的分布。 分位点 设统计量U服从某分布,如果对于 (0<<1) 有 P ( U > U ) = 则称U为该分布的上分位点。
③ 当 n = 1时,2 ( n ) 为分布, 当 n = 2时,2 ( n ) 为指数分布。
第一章
样本与抽样分布
2 分布的分位数计算
① 当n ≤ 45时, 可直接查表求出 如 20.1 ( 25 ) = 34.328 ② 当n > 45时, 利用以下近似公式计算 1 2 (n) (u 2n 1) 2 2 2 如 2 0.05 (50)
二. 经验分布函数
1.经验分布函数 将n个样本值按大小排成顺序
x(1) x (2)

x (n)
记Fn (x)为不大于x的样本值出现的频率,则
称Fn (x) 为经验分布函数。
0 , x x(1) , k Fn ( x ) , x( k ) x x( k 1) , n 1 , x x( n ) .
样本与抽样分布
4. 样本的 k 阶原点矩
1 n Ak X ik n i 1
5. 样本的 k 阶中心矩
1 n k ak xi n i 1
1 n k Bk ( X i X ) n i 1
1 n bk ( xi x) k n i 1
第一章
样本与抽样分布
由大数定律可知 定理 样本的数字特征依概率收敛到总体的数字特征 样本均值 样本方差 样本矩
F(u)
面积 =
u o
第一章
U
样本与抽样分布
二. 四大统计分布
1. 正态分布
设 X ~ N(μ, σ2), 则U = ( X-μ) /σ ~ N ( 0, 1 ) 记标准正态分布的分布函数为(u), 分位点为u P ( U > u ) = 例如 由于 查表 所以 求 u 0.05 1 - = 0.95 (1.645) = 0.95
样本的联合分布函数为F*(x1,x2,,xn), 样本的联合概率密度函数为f*(x1,x2,,xn),
且 F* (x1, x2 ,, x n) = F (x1 ) F (x2 )F (xn )
f* (x1, x2 ,, xn) = f (x1 ) f (x2 )f (xn )
第一章 样本与抽样分布
2. 样本与样本值
样本 在总体X中抽取n个个体X1, X2 , , Xn , n为样本容量, (X1, X2 , , Xn)构成n维随机变量。
样本值 样本的取值,即样本的观察值x1, x2 , , xn
第一章 样本与抽样分布
简单随机样本 ( 1 ) 每个个体Xi与总体X同分布; ( 2 ) 个体之间相互独立。 设总体X的分布函数为F ( x ),概率密度为f ( x ),则
相关文档
最新文档