概率论及数理统计第六章{样本及抽样分布}第二节:样本分布函数直方图

合集下载

概率论与数理统计 第六章 样本及抽样分布

概率论与数理统计 第六章 样本及抽样分布

x0 o.w.
n 1
n5
n 15
15
(2)t-分布(学生分布)
设 X ~ N ( 0 ,1), Y ~ 2 ( n ) 且X、Y为独立随 机变量,则称随机变量
t
X Y /n

X
1 n 2 ( X 12 ...... X n )
为自由度为n的t-分布。记为: t ~ t ( n ) 。
3
§1 随机样本
总体: 研究对象在某项数量指标的全体. 记为X。通常称总体X。 个体: 总体X中的每一个元素(实数)xi。 根据总体所含的个体数分为: 有限总体和无限总体。
4
总体与取样
X1
X
X2 X3 Xn
取样模型
X
X2 X1
X3
X4
X5
河流污染取样
5
总体、样本、统计量
总体 样本 统计量
X1 X2
2 ( n ) 分布:
具有可加性
2 X X 12 ...... X n , X i ~ N (0,1)
3. 4.
t ( n ) 分布:
X ~ N (0,1), Y ~ 2 ( n )
t(n) X Y /n
F ( n1 , n 2 ) 分布: U ~ 2 ( n1 ), V ~ 2 ( n 2 )



F (n1 , n2 )
19
分位点及性质:
定义: Pr[ X z ]

z
(1)标准正态分布分位点

(x)
( x)dx 1 ( x)dx


z
z1
( x)
Pr[ X z ]

概率论与数理统计第6章(公共数学版)

概率论与数理统计第6章(公共数学版)

Xi
1 n (X1
X2
Xn)
S 2
1 n
n i 1
(Xi
X )2
显然
S 2
1 n
n
[
X
2 i
i 1
2Xi
X
(X )2]
1n [
n i1
X
2 i
2X
n i 1
Xi
n( X )2 ]
1 n
n i 1
X
2 i
2X
X
(X )2
S 2
1 n
n i 1
X
2 i
(X )2
16
样本均方差
样本标准差
4
Yi 2
i 1
4
Yi
2
i1 4
4
Yi
2
4
i1 2
32
T 4( X 2) 4 Yi 2 i 1
X 2
4
Yi
2
i1 4
X 2
~ t(4),
4
Yi
2
4
i1 2
即 T 服从自由度为 4 的 t 分布: T ~ t(4). 由 P{| T | t0 } 0.01.
t0 t0.995 (4) 4.6041.
设( X1, X2,, Xn )为来自总体X的一个样本
则( X1, X2,, Xn )为一个随机向量 X为一个随机变量 X1, X2,, Xn相互独立,且具有和总体X同样的分布
样本的同分布性和相互独立性
11
三、统计量 对所研究的对象收集了有关样本的数据
后,还要对数据进行加工和提炼,将样本的有关 信息,利用数学的工具进行加工.
S
S2

概率论6-1,2,3

概率论6-1,2,3

例如,考察某工厂10月份生产的灯泡的寿命所组 例如,考察某工厂 月份生产的灯泡的寿命所组 成的总体。 成的总体。灯泡寿命落在各个时间区间内有一定的 百分比,如灯泡寿命落在1000小时 小时~1300小时的占灯 百分比,如灯泡寿命落在 小时 小时的占灯 泡总数的85%,落在1300小时 %,落在 小时~1800小时的占灯泡总 泡总数的 %,落在 小时 小时的占灯泡总 数的5%, %,…。 即灯泡寿命的取值有一定的分布。 数的 %, 。 即灯泡寿命的取值有一定的分布。
就取位于 [ 是整数, x([ np ]+1) , 不是整数, 当np不是整数, x 综上, 综上, p = 1 [ x( np ) + x( np+1) ], 当np是整数 . 2
0 当 特别, 特别, p = 0.5时,.5分位数 x0 .5也记为Q2或
数据集的箱线图是由箱子和直线组成的图形, 数据集的箱线图是由箱子和直线组成的图形, 它是基于以下五个数的图形概括: 它是基于以下五个数的图形概括: 最小值 Min, 第一四分位数 Q1,中位数M,第三四分位数 Q3和 中位数 最大值 Max. 作法如下: 作法如下: (1) 画一水平数轴, 在轴上标上 Min,Q1, M, 画一水平数轴, Q3,Max. 在数轴上方画一个上、 下侧平行于数 在数轴上方画一个上、 Q 箱子的左右两侧分别位 于 Q1, 3 的上方. 轴的矩形箱子, 轴的矩形箱子, 在 M点的上方画一条垂直线 段 .线段位于箱子内部. ( 2)自箱子左侧引一条水平 线至 Min; 在同一水平 高度自箱子右侧引一条水平线直至最大值. 高度自箱子右侧引一条水平线直至最大值. 如图所示. 如图所示.
1.总体与个体 总体与个体
§1 随机样本
总体 试验的全部可能的观察值称为总体. 试验的全部可能的观察值称为总体. 个体 总体中的每个可能观察值称为个体. 总体中的每个可能观察值称为个体.

概率论第六章

概率论第六章

P( X1 = x1 , X2 = x2 ,, Xn = xn )记作 f ( x1 , x2 ,, xn ) = P( X1 = x1 ) P( X2 = x2 )P( Xn = xn ) = f ( x1 ) f ( x2 ) f ( xn ) = ∏ f ( xi )
i =1 n
(1)
(2)当总体 X是连续型随机变量 且具有概率 当总体 是连续型随机变量,且具有概率 密度函数 f ( x) 时 ,则样本 ( X1 , X2 ,, Xn ) 的联 则样本 合概率密度为
的分布函数为F(x),则称总体的分布函数为 若X的分布函数为 的分布函数为 ,则称总体的分布函数为F(x) 。
对总体进行研究时, 对总体进行研究时,对总体中每个个体逐一 进行考察,这在实际中往往是行不通的, 进行考察,这在实际中往往是行不通的,一是试 验具有破坏性,二是需花费大量的人力物力; 验具有破坏性,二是需花费大量的人力物力; 常用的方法是: 常用的方法是:从总体中随机地抽取若干个 个体, 个体,根据对这部分个体的研究结果推判总体某 方面的特征。 方面的特征。 二、样本 从总体X中随机地抽取 个个体, 中随机地抽取n个个体 定义 从总体 中随机地抽取 个个体,称之为 的样本。 总体X的一个样本容量为 的样本 的一个样本容量 总体 的一个样本容量为n的样本。
解 总体 X 的分布律为 P{ X = k } = p k (1 p )1 k
所以 ( X 1 , X 2 , , X n ) 的分布律为
f ( x1 , x 2 , , x n ) = ∏ f ( x i ) =
n i =1
( k = 0, 1)
= p i =1 (1 p )
∑ xi
n
n
i =1

《概率论与数理统计》课程教学大纲

《概率论与数理统计》课程教学大纲

《概率论与数理统计》课程教学大纲英文名称:Probability and statistics课程代码:221101008课程类别:专业基础课课程性质:必修开课学期:第三学期总学时: 54学时总学分:3考核方式:闭卷先修课程:高等数学适用专业:经济学专业一、课程简介概率论与数理统计是经济学专业的一门专业基础课。

概率论与数理统计是研究不确定性现象的数量规律性的一门学科,是对随机现象进行定量分析的重要工具,它在现代科学技术中占有很重要的地位,是研究自然现象、处理现代工程技术、解决科研和生产实际问题的一种有力的数学工具,已被广泛应用于每一学科领域、工农业生产和经济管理部门中。

开设本课程的目的在于,通过本课程的学习,使学生初步掌握概率论与数理统计等方面的基础知识,了解它的基本理论与基本方法,培养学生的抽象思维能力、逻辑推理能力、数学建模与实践能力,注意培养学生的自学能力,注意理论联系实际,不断提高学生的综合素质以及运动所学知识解决实际问题的能力,同时使学生了解概率论与数理统计在经济方面的应用,具备概率思想分析实际随机问题的能力,为专业课程的学习打下基础。

学生在进入本课程学习之前,应学过高等数学课程,该课程的学习为本课程提供了必须的数学基础知识。

本课程学习结束后,学生可具备进一步学习相关课程的理论基础。

本课程总54学时,其中理论课47学时,习题课7学时,考核方式为闭卷考试,根据平时考勤成绩、习题作业成绩、阶段性单元检测成绩及闭卷期末考试成绩综合给予最终成绩评定。

二、课程目标及其对毕业要求的支撑目标1人文素养目标:教育学生认真学习马克思列宁主义、毛泽东思想、邓小平理论、“三个代表”、科学发展观和新时代中国特色社会主义的重要思想;忠诚党的教育事业和体育事业,培养学生互教互学、团结友爱、共同提高的集体主义精神;培养学生有严格组织纪律性,吃苦耐劳和勇敢顽强的意志品质。

目标2理论知识培养目标:使学生掌握概率论与数理统计的基本理论和基础知识,初步掌握处理随机事件的基本思想和方法。

概率论与数理统计教学课件-ch6 样本及抽样分布

概率论与数理统计教学课件-ch6 样本及抽样分布
(4) X~t(n1). Sn
Stop
定理
iid
若 X 1 ,X 2 , i,iX dn 1~N ( 1 , 1 2 ),
X Y n 1 1 1 , iY n 1 1 2,X i,,Y n 2 S 1 ~ 2 N n ( 1 1 2 ,1 i2 n 2 1 1 )(X ,i且 两X 样)2本;独立
t1 (n ) t (n )
t(n)
Stop
存在t/2(n)>0, 满足 P{|T| t/2(n)}=,则称 t/2(n)为t(n)的双侧分位点.
t/2(n)
t/2(n)
Stop
• F—分布 构造 若1 ~2(n1), 2~2(n2),1, 2独立,则
F 2 1//n n1 2~F(n1,n2).
(1 11 n1 n2
2)
~
t(n1
n2

2).其中
Sw2
(n11)S12 (n2 1)S22 n1 n22
称为混合样本方. 差
Stop
例 设总 X~体 N(,2)如 , 果9要 .9 7% 的 以 概率保X 证 偏 0.1,差 试问 2 在 0.5时 , 样本n应 容取 量?多大
例 设(X1, X2,,X6)是来自正态 N(0总 ,1)的 体 样本 ;又设 Y(X1X2X3)2(X4X5X6)2 试确定c常 使c数 Y服从 2分布 ,并指出其自 . 由
样本观测值 对样本 X1, … ,Xn进行观测, 即可得一组观测值 x1, … ,xn • 统计量
样本 X1, … ,Xn的函数 g(X1, … ,Xn )称 为是总体 X 的一个统计量,若g(X1, … ,Xn ) 与任何未知参数无关。
统计量的观测值 若样本 X1, … ,Xn的观测值为x1, … ,xn,

概率论与数理统计-第六章

概率论与数理统计-第六章
大街上随机抽取200人,进行调查。记录了
这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi

i 1, 2,
,n
,n
于是 (

) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2

概率论与数理统计第六章样本及抽样分布第一节:总体与样本.ppt

概率论与数理统计第六章样本及抽样分布第一节:总体与样本.ppt

例2: 检验一批灯泡的寿命,从中选择100只,则: 总体: 这批灯泡(有限总体)
个体: 这批灯泡中的每一只 样本: 抽取的100只灯泡 样本容量: 100 样本值: x1, x2,…, x100
数理统计
二、简单随机抽样
数理统计
1. 若从总体 X 中抽取样本 X1, X2,…, Xn,满足: 1) 随机性:总体中每一个个体都有同等机会被选入, 即样本 Xi 与总体 X 有相同的分布; 2) 独立性:样本中每一样品的取值不影响其它样品的取值, 即 X1, X2,…, Xn 相互独立; 这种随机的、独立的抽样方法称为简单随机抽样。 由简单随机抽样得到的样本称为简单随机样本。
某批 灯泡的寿命
国产轿车每公里 的耗油量
该批灯泡寿命的全 体就是总体
国产轿车每公里耗油量 的全体就是总体
一、总体和样本
数理统计
1. 总体——研究对象全体元素组成的集合. 所研究的对象的某个(或某些)数量指标的全体, 它是一个随机变量(或多维随机变量), 记为 X. 总体有三层含义: 研究对象的全体;全部数据; 分布. 2. 个体——组成总体的每一个元素. 即某个数量指标的全体中的一个, 可看作随机变量 X 的某个取值, 用 Xi 表示.
数理统计
第六章 样本及抽样分布
第一节 总体与样本 第二节 样本分布函数 直方图 第三节 样本函数与统计量 第四节 抽样分布
数理统计
数 理 统 计 的 分 类
描述统计学
对随机现象进行观测、试验,以取得有代表性 的观测值,并对已取得的数据进行归纳整理、画 出统计图表,来反映研究对象的数据分布特征.
推断统计学
数理统计方法具有“部分推断整体”的特征 .
数理统计
第一节 总体与样本
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

其中和式
xi
是对小于或等于
x
x
的一切
x(i)
的频率
fi
求和,
则称 Fn(x)为样本分布函数,经验分布函数。
2. 样本分布函数Fn(x)具有下列性质:
(1) 0 ≤ Fn(x) ≤1 (2) Fn(x)是非减函数
(3 )F n 0 , F n 1
(4) Fn(x)在每个观测值 x(i)处是右连续的, 点 x(i)是 Fn(x)的跳跃间断点, Fn(x)在该点的跃度就等于频率fi
因为样本容量 n充分大时, 随机变量 X的取值落在 各个子区间 (ti-1 - ti)内的频率近似等于其概率, 即:
f i P t i 1 X t i,i 1 ,2 , ,l
所以直方图大致地描述了总体X的概率分布。
例2: 测量100个某种机械零件的质量, 得到样本观测值如下(单位:g):
246 251 259 254 246 253 237 252 250 251 249 244 249 244 243 246 256 247 252 252 250 247 255 249 247 252 252 242 245 240 260 263 254 240 255 250 256 246 249 253 246 255 244 245 257 252 250 249 255 248 258 242 252 259 249 244 251 250 241 253 250 265 247 249 253 247 248 251 251 249 246 250 252 256 245 254 258 248 255 251 249 252 254 246 250 251 247 253 252 255 254 247 252 257 258 247 252 264 248 244
数理统计
总计
100
1.00
直方图如图所示:
作业
习题6-2 1
数理统计
写出零件质量的频率分布表并作直方图。
解: 因为样本观测中最小值为 237, 最大值为 265, 所以我们把数据的分布区间确定为: (236.5, 266.5)
并把这个区间等分为 10个子区间:
(236.5, 239.5), (239.5, 242.5), …, (263.5, 266.5)
数理统计
由此得到零件质量的频率分布表:
数理统计
第二节 样本分布函数 直方图
样本分布函数 直方图
一、样本分布函数(sample distribution function) 数理统计
我们把总体的分布函数 F(x)=P(X ≤ x) 称为总体分布函数. 从总体中抽取容量为 n 的样本得到 n 个样本观测值, 若样本容量 n 较大,则相同的观测值可能重复出现若干次, 为此,应当把这些观测值整理,并写出下面的样本频率分布表:
并以各子区间为底, 以 fi /(ti - ti-1)为高作小矩形,
各个小矩形的面积 ∆Si 就等于样本观测值落在该子区间内的频率,
即:
S ititi 1 ti fiti 1fi,l
i1 ,2, ,l.
l
所有小矩形的面积的和: Si fi 1.
i1
i1
这样作出的所有小矩形就构成了直方图。
理 论基础.
例 1:设 总 体 F 具 有 一 个 样 本 值 1, 1, 2,数理统计
则 经 验 分 布 函 数 F 3(x)的 观 察 值 为 :
0, 若x 1
F3 ( x)

2 3
,
若1
x
2
1, 若 x 2
二、直方图(histogram)
作样本的频率直方图(简称直方图), 步骤如下:
把区间 (a, b)分成 l个子区间:
(a, t1), (t1, t2), …, (ti-1, ti), …, (tl-1, b) 第 i个子区间的长度为: ti ti ti 1 ,(i 1 ,2 , ,l)
各子区间的长度可以相等, 也可以不等;
若使各子区间的长度相等,
则有:
ti
b
l
a
子区间的个数一般取为 8至 15个,
数理统计
样本分布函数Fn(x)的图形
数理统计
对于任意的实数 x总体分布函数 F(x)是事件X ≤ x 的概率; 样本分布函数 Fn(x)是事件 X ≤ x发生的频率. 根据伯努利大数定理可知, 当 n→∞时, 对于任意的正数 ε, 有:
ln i m PF nxF x1
格利文科(Glivenko) 进一步证明了, 当n→∞时, 样本分布函数 Fn(x)与总体分布函数 F(x)之间存在着更密切的 近似关系的结论. 这些结论就是我们在数理统计中可以依据样本来推断总体的
观测值 x 1
频数
n1
频率
f1
x 2

n2

f2

数理统计
x l
总计
nl
n
fl
1
其中 x1x2 xl
fi
ni n
i1,2,
,l
l n
l
ni n
i1
l
fi 1
i1
1. 定义: 设函数:
0,
x x1
Fn
x
fi , xi x xi1
xi x
1,
x xl
数理统计
i1,2, ,l1
数理统计
1. 找出样本观测值 x1, x2, …, xn中的最小值与最大值, 分别记作 x1* 与 xn*, 即: x1* =min(x1, x2, …, xn), xn* =max(x1, x2, …, xn)
2. 适当选取略小于 x1*的数 a与略大于 xn*的数 b, 并用分点: a=t0 < t1 < t2 < … < tl-1 < tl=b
太多则由于频率的随机摆动而使分布显得杂乱,
太少则难于显示分布的特征。
此外, 为了方便起见, 分点 ti 应比样本观测值 xi多取一位小数.
3. 把所有样本观测值逐个分到各子区间内,
并计算样本观测值落在各子区间内的频数 ni及频率:
fi
ni ,i
n
1,2,
,l.
数理统计
4. 在 Ox轴上截取各子区间,
相关文档
最新文档