第一章 数理统计
概率论与数理统计 第一章1.1随机事件

事件的关系与运算
注:(1) 事件的关系与运算可用维恩图形象表之
(2) 事件的和与积的运算可推广到有限个事 件或可数无限个事件的情形.
A B A B, (3) 事件的和与积的另一记法:
A B AB.
事件的关系与运算
8. 完备事件组 设 A1 , A2 ,, An , 是有限或可数个事件,若其 满足:
完
随机事件
在随机试验中,人们除了关心试验的结果本身外,
往往还关心试验的结果 是否具备某一指定的可观
察的特征,概率论中将这一可观察的特征称为一 个事件 , 它分三类:
随机事件
1. 随机事件:在试验中可能发生也可能不发生的 事件; 2. 必然事件:在每次试验中都必然发生的事件; 3. 不可能事件:在任何一次试验中都不可能发 生的事件. 例如,在抛掷一枚骰子的试验中,我们也许会关
A : “点数为奇数”,B : “点数小于5”.
则 A B {1,2,3,4,5}; A B {1,3};
A - B {5}.
6. 若 A B , 则称事件 A 与 B 是互不相 容的(或互斥的).
7. 若 A B S 且 A B ,
事件的关系与运算
由于随机现象的结果事先不能预知, 初看似乎 毫无规律. 然而人们发现 同一随机现象大量重 其每种可能的结果 出现的频率具有 复出现时,
稳定性, 从而表明随机现象也有其固有的规律
性. 人们把随机现象在大量重复出现时 所表现 出的量的规律性 称为随机现象的统计规律性.
随机现象的统计规律性
概率论与数理统计是研究 随机现象统计规律性 的一门学科. 为了对随机现象的统计规律性进行研究,就需 对随机现象进行重复观察,我们把对随机现象
应用数理统计吴翊李永乐第一章数理统计的基本概念课后习题答案

第一章 数理统计的基本概念课后习题参考答案1.1 设对总体X 得到一个容量为10的子样值:4.5,2.0,1.0,1.5,3.4,4.5,6.5,5.0,3.5,4.0,试分别计算子样均值X -和子样方差2S 的值。
解:12,n X X X 为总体X 的样本,根据 121()n XX X X n=+++ 求得X=3.59;根据2211()ni i S X X n ==-∑ 求得2S =2.5929。
1.2 设总体X 的分布函数为()x F ,密度函数为()x f ,n X X X ,,,21 为X 的子样,求最大顺序统计量()n X 及最小顺序统计量()1X 的分布函数及密度函数。
解:将总体X 中的样本按照从小到大的顺序排列成()()()n X X X ≤≤≤ 21 1.3 设总体X 服从正态分布N(12,4),今抽取容量为5的子样521,,,X X X ,试问:(1)子样的平均值X 大于13的概率为多少?(2)子样的极小值(最小顺序统计量)小于10的概率为多少? (3) 子样的极大值(最大顺序统计量)大于15的概率为多少? 解:(1)()()1314.08686.0112.1n /-X 15/41213n /-X P -113X P -113X P =-=⎪⎪⎭⎫ ⎝⎛≤-=⎪⎪⎭⎫⎝⎛-≤=≤=>σμσμP(2) ()()()5785.08412.011-X P -121210-X P -110P -110P 551i 51i 51min =-=⎪⎭⎫ ⎝⎛≤=⎪⎭⎫ ⎝⎛->=>=<∏∏∏===i i i i X X σμσμ(3) ()()()2923.093315.015.1-X P -121215-X P -115P -115P 551i 51i 51max =-=⎪⎭⎫ ⎝⎛≤=⎪⎭⎫⎝⎛->=≤=>∏∏∏===i i i i X X σμσμ1.4 试证:(1)22211()()()n niii i x a x x n x a ==-=-+-∑∑ 对任一实数a 成立。
数理统计(第一章)

数理统计学•主讲人: 沈玉波•办公室地址: 校本部,大黑楼B1005•办公室电话: 84708351-8205•E-mail: shenyubo@•大连理工大学概率统计教研室常见的离散型随机变量1.二项分布:()p B ,”分布“11-0=()为参数为自然数,其中10<<p n ().的二项分布,服从参数为则称随机变量p n X 显然,当n=1 时()()n k p p C k X P kn kk n,,, 101)(=-==-()p n B X ,记作~如果随机变量X 的分布律为()∑=--nk kn kknp p C1()[]11=-+=np p4.帕斯卡分布(负二项分布)如果随机变量X 的分布律为(),,21,)1()(11++=-==---r r r k pp C k X P rrk r k ()为常数其中10<<p 则称随机变量X 服从参数为r , p 的帕斯卡分布.)B(r,~p N X 记为:1)独立重复试验,第r 次成功时实验次数的分布律。
则独立同分布,且已知),(~,,,)221p G X X X X i r ),(~21p r NB X X X r +++1. 概念设X 是一个随机变量,x 是任意实数,函数)()(x X P x F ≤=称为X 的分布函数.2. 分布函数的性质1)(0,)1≤≤∈x F R x 1)(lim )(,0)(lim )()2==∞==-∞∞→-∞→x F F x F F x x 分布函数.)(),()0()5是右连续的即x F x F x F =+3) F (x ) 是一个不减的函数.)()(}{)41221x F x F x X x P -=≤<。
01第一章 数理统计的基础知识

为推断总体分布及其各种特征,一般方法是按一定规则从总体中抽取若干 个体进行观察,称为抽样。
2
第一章 数理统计的基础知识
第一节 总体与样本
一 . 总体与样本
定义1:研究的对象称为总体,总体往往以某一项数量指标为其特征。实 际上总体就是一个随机变量 X 。
为推断总体分布及其各种特征,一般方法是按一定规则从总体中抽取若干 个体进行观察,称为抽样。 定义2:从总体中抽取的 n 个个体 (X1,X2,…,Xn) 称为样本,实际上样本就 是一个 n 维随机变量(或向量)。
简单随机样本: (X1,X2,…,Xn) 是相互独立的随机变量(独立性);且 Xi ~ X (同分布) 。 样本容量 n:样本中所含个体数目,为已知的一个自然数。 样本观察值: (X1,X2,…,Xn) = (x1,x2,…,xn)
上例中,若某次抽样得: (X1,X2,X3,X4,X5) = (0,0,1,0,1)
P(Y 15) f ( y)dy
15
10 0 15 20 y y 1 3 7 dy dy 10 100 100 2 8 8
例3:设总体 X ~ b(1,p)。现从中抽取容量为 2 的样本,得到样本 (X1, X2),求样本的函数 Y = X12 + X22 的概率分布,并求出事件 P(Y < 15) 的概率。
i 1 n
如上例:总体 X ~ b(1,p),概率分布为:P(X = x) = (1 – p)1 – x p x (x = 0,1) 则样本 (X1,X2,…,Xn) 的联合分布为:
P( X 1 x1 , X n xn ) p x1 (1 p)1 x1 p xn (1 p)1 xn p i1 (1 p)
数理统计课后答案-第一章

3
2
5
5
可以看作是有 15 个空位子, 每个班级各有 5 个 解法二 将 15 名新生平均分配到三个班级, 空位子。从这 15 个空位子中任意选 3 个位子放运动员(其余位子自然是放非运动员,可不 考虑) ,共有 C15 种不同做法。 (1) 每个班级各有一名运动员, 相当于从每个班级的 5 个空位子中任意选 1 个位子放运 动员,有 C 5 C 5 C 5 种不同做法,所以,
k =0
a
3 k −3 e ≥ 0.99 。 k =0 k !
a
直接计算或查书后附录中普阿松分布的概率表,可以求得:
8 3 k −3 3 k −3 e ≈ 0 . 988 < 0 . 99 , e ≈ 0.996 > 0.99 。 ∑ ∑ k = 0 k! k = 0 k! 7
由此可见,月初至少要进货 8 件,才能以 99% 以上的概率满足顾客的需要。 已知随机变量 ξ 的概率密度为 ϕ ( x ) = Ae
1.5 无线通信中,由于随机干扰,当发出信号为“ • ”时,收到信号为“ • ” 、 “不清” 、 “—” 的概率分别为 0.7、0.2 和 0.1;当发出信号为“—”时,收到信号为“—” 、 “不清” 、 “• ” 的概率分别为 0.9、 0.1 和 0.如果整个发报过程中 “• ” 、 “—” 出现的概率分别为 0.6 和 0.4, 当收到信号“不清”时,原发信号是什么?试加以推测. 解 设 A = { 收到“不清”}, B = { 发出“·”}, B = { 发出“-”},由题意可知,
1 2 C1 C k −1 C k2−1 于 k 的 k − 1 个球中取 2 个球,所以 P{ξ = k} = = ( k = 3, 4, 5 ) 。 3 10 C5
数理统计第一章

n
例1.4 总体X~B(1,p),0<p<1,写出其样本的联合概率函数
总体
样品
X ~ P ( X x ) p ( 1 p ) ( x 0 ,1 )
x 1 x
X ~ P ( X x ) p ( 1 p ) , ( x 0 ,1. i 1,2 , , n )
xi 1 x i i i i
全部信息。 一个好的统计方法,是使由局部推断出的有关整体的信 息尽可能地准确。
第一章
数理统计的基本概念
第一节 随机样本
一.总体与个体
1.总体 在一个统计问题中,把所研究对象的全体称为总体。
构成总体的每个成员称为个体。
如:例一中的一大批灯泡叫总体。而每个灯泡叫做个体。 把含有有限个个体的总体称为有限总体 把含有无限个个体的总体称为无限总体
在数理统计学中,我们总是对随机现象进行有限 次的观察或试验,以获取数据。通过对数据的分析与 推断去寻找隐藏在数据中的统计规律性。 由于是对随机现象进行观察或试验,因此,观察或 试验数据是带有随机性的。为此需要我们从中尽可能地 排除随机性的干扰,以作出合理的推断。 数理统计是研究怎样以有效的方式收集、 整理和分 析带有随机性的数据,在此基础上,对所研究的问题作 出统计推断,直至对可能作出的决策提供依据和建议。
则其简单随机样本的联合分布函数为
F ( x )F ( x )F ( x ) F ( x )
1 2 n
n
(2)若总体X为连续随机变量,概率密度函数为f(x), 样品X i 的概率密度函数为 f ( xi ), (i 1,2,, n)
i 1
i
则样本 ( X1, X 2 , X n ) 的联合概率密度函数为
概率论与数理统计1完整(完整版)ppt课件

.
19
定义 当随机试验的样本空间是某个区域,并且任 意一点落在度量 (长度, 面积, 体积) 相同的子区域 是等可能的,则事件 A 的概率可定义为
P(A) m(A)
m()
(其中 m()是样本空间,m 的 (A)度 是量 构成事 A 件 的子区域的 )这度样量借助于几量 何来 上合 的理 度 规定的概率 几称 何为 概 . 率
对偶律: A B A B;
A B AB.
证明 对偶律.
.
13
例.事件 A、B、C两两互不相 则容 有,
ABC 反之 不成 立
例. 甲、乙、丙三人各射击一次,事件A1,A2,A3分别表示 甲、乙、丙射中,试说明下列事件所表示的结果:
A 2,A 2 A 3, A 1A 2, A 1 A 2, A 1A 2A 3, A 1A 2 A 2A 3 A 1A 3.
.
16
例1. 袋中装有4只白球和2只红球. 从袋中摸球两次,每次任取一球.有两种式: (a)放回抽样; (b)不放回抽样.
求: (1)两球颜色相同的概率; (2)两球中至少有一只白球的概率.
例2. 设一袋中有编号为1,2,…,9的球共9只, 现从中任取3 只, 试求: (1)取到1号球的概率,(事件A) (2)最小号码为5的概率.(事件B)
A-BAAB
显然: A-A=, A- =A, A-S=
s
A B
(4)AB
.
10
5.事件的互不相容(互斥):
若 AB,则A 称 与 B 是 互 不 ,或 相 互 容 ,即 斥
A 与 B 不能同 . 时发生
B
A B
A
.
11
6. 对立事件(逆事件): 若ABS且A B,则A称 与B互为逆事件
概率论与数理统计 第一章

故n lg 0.01 1150 lg 0.996
1.8伯努利概型
例1
某药物对某病的治愈率为0.8,求10位服药的 病人中至少有6人治愈的概率。
10
解:设A表示至少有6人治愈
P(A) P10 (k)
k 6
=P10(6)+P10(7)+P10(8)+P10(9)+P10(10)
故 P(A) 1
C
7 35
1 0.000000148 6724520
若B表示中一等奖(对6个号码) B的样本点数为
1 1
CC
7
6
1 28
故 P(B) C7C28 0.0000292 7
C
35
例3
生日问题:随机地选取n个人,他们的生日各不 相同的概率有多大?
解:相当于从365个数字中有放回地随机抽取n个 样本点总数为 365n
P(A)P(B | A)P(C | AB) P( A)P( B | A)P(C | AB) 4 3 2 4 6 3 6 4 3 6 4 3 6 5 4 10 9 8 10 9 8 10 9 8 10 9 8 10 9 8
288 0 .4 720
解法一: 每局双方获胜的可能性均为
1 2
应按照比赛双方最终获胜的可能性分赌注, 即在余下的四局中甲赢得2局以上即可。 甲最终获胜的概率为 P4(2)+P4(3)+P4(4)
11 1 1 1 1 1 C2 C3 4 4 2 2 2 2 2 16
A1 U A2 U A3
解: 三次全部取到合格品:1 A2 A3 A
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Remark 可以把复杂的变量简化为简单变量,反之不行 数值变量 → 顺序变量 → 分类变量
变量组合与相应的统计分析方法 自变量 x 分类变量 顺序变量 数值变量 因 分类变量 卡方分析 变 顺序变量 ↑ 量 y 数值变量 方差分析 ← 秩方法 ↑ 回归与相关 ← 回归与相关
三. 常用统计软件简介
简单的说,从概率论的角度出发, 可以把上述数理统计学的过程理解成: 有一个含有未知信息的概率分布 F
针对 F 做了 n 次独立重复的试验与观察, 得到 n 个独立同分布于 F 的随机变量的取值
根据样本的具体观察值,去推断出总体 F 所包含的未知信息,或作出进一步的决策等
问题二:如何分析与处理变量之间的关系? 简 单 复 杂 分类变量:如性别、信仰、职业等等, 顺序变量:如名次(第一、第二,…), 数值变量:如收入、比例、产量等等
1. 抽样理论:介绍如何收集数据。主要
抽样方法,样本容量的确定,抽样误差, 敏感问题等
2. 参数估计:如何根据数据得到总体参数
信息。点估计、区间估计,Bayes 估计等
3. 假设检验: 如何对关于总体的一些假设
做出决策。正态总体参数的检验,分布拟合 检验,秩检验,列联表,统计决策等理论
4. 方差分析与回归分析:变量间效应关系。
1. 随机变量 X :离散型、连续型
样本空间到实数轴的函数 分布律与概率密度函数
2. 随机变量与随机事件的关系
( a ≤ X < b ) 是一个随机事件; A 是否发生可以通过两点分布表示
3. 分布函数 F(x)
也就是概率:P(X<x ) 离散随机变量的分布函数是阶梯型跳跃函数, 对满足(xk< x )的所有 pk 求和得到。 连续随机变量的分布函数是(0,1) 之间的非 降单调函数, 对满足( t < x )的密度函数 f(t) 积分得到。
两个离散随机变量的独立性
4. 二维正态与多元正态分布
5. 条件分布:条件概率的推广
从 f (x|θ ) 到 h(θ | x )
θ 是一个具有分布h(θ) 的随机变量,如果 X 关于θ 具有条件分布 f (x|θ ) ,则X 与θ 的 联合分布是 h(θ)× f (x|θ ) 。
2. SAS
Statistical Analysis System (统计分析系统软件包) 广泛应用于经济管理、社会科学、生物医学、 质量控制、以及政府和教育科研等领域, 在数据处理和统计分析领域,SAS 被誉为 国际上的标准软件系统。
3. EXCEL 统计函数
计算统计量: AVERAGE,MEDIAN,VAR,CORREL ,… 计算区间点:TINV,CHIINV,… 计算概率( p-值): NORMSDIST,CHIDIST, TDIST,FDIST,… 回归分析:LINEST,……
1. 概率 P(A)
随机事件在一次试验中发生的可能性 频率定义、主观概率 概率的数学定义: 样本空间中的一些子集到实数轴的一个集合 函数,满足:非负性、规范性、可列可加性
2. 条件概率 P(B|A) 3. 概率计算的一些公式
加法公式 减法公式 乘法公式 全概率公式 Bayes 公式
三. 随机变量及分布
3. 如何从样本得出总体的信息 ?
样本是一组与总体独立、同分布的随机变量, 我们得到的数据是样本观察值,而不是样本。 调查一个家庭得到了一个数据,相当于 对总体分布做了一次随机试验而观察到了这 个随机变量的具体取值。 一共有 n 个数据,相当于对总体分布做了 n 次独立重复试验,而得到了这个总体随机变 量在这些试验中的具体取值。
0, x ≤ x(1) k — , x(k) < x ≤ x(k+1) n 1, x > x(n)
这个函数实际上是观察值 x1,…,xn中 小于 x 的频率,即 Fn (x) = { x1,…,xn中小于 x 的个数} / n
y
…
2/n 1/n O ○ x(1) x(2) x(3) x ○
可以证明,经验分布函数 Fn (x) 将依概率、 甚至是几乎处处收敛到 F (x) 。
参数估计
数理统计学最重要的内容之一
利用样本观察值去估计出总体的未知参数 直观上可以利用调查到的 n 个家庭的月支出 x1 ,x2 ,…,xn 的算术平均 :
1 n x = ∑ xk n k =1
去估计这个城市家庭的平均月支出费用 µ 。 它的合理性在哪? 还有没有其它的办法? 这些不同的方法各有什么样的优缺点?
把 (a,b) 等分成 若干小区间,计算 每个小区间中包含 的数据的频率。
x(1) x(n)
根据这些频率做出相应的小区间上的矩形, 则当 n 充分大时,这些小区间上矩形的面积将近 似于总体的概率密度函数下曲边梯形的面积。
(2). 经验分布函数的方法 构造一个分布函数,得到的是总体 分布函数 F (x) 的近似。 Fn (x) =
1. SPSS
Statistical Package for the Social Science (社会科学统计软件包) Statistical Product and Service Solutions (统计产品与服务解决方案) 用户遍布于通讯、医疗、银行、证券、 保险、制造、商业、市场研究、科研教育 等多个领域和行业,是世界上应用最广泛 的专业统计软件。
(数理) 统计学中的数据都是随机数据。 统计学的任务就是在随机性中去寻找规律。
一. 统计学的基本概念
1. 总体与个体 (population)
统计学中把所研究的对象全体称为总体, 总体中的每一个元素称为一个个体。 总体与个体都用数量指标来表示 即使面临的是一个定性的实际问题, 也必须把有关的资料定量化。 例如总体分成:抽烟与不抽烟两类。 0 表示 抽烟者; 1 表示 不抽烟者。
假设检验
数理统计学最重要的内容之一
事先提出一个假设,利用样本观察值去 检验这个假设是否可以被接受 政府和企业共同关心的一个问题:
µ > µ0 ?
这里 µ0 是一个已知的常数。
应该如何去做这个检验? 一种想法是:既然已经通过参数估计得到了这 个城市家庭月平均支出 ( 即总体的参数 µ ) 的估计 值,自然就可以用它代替假设里的 µ 去做检验: 当估计值比 µ0 大就本总是随机得到的, 因此估计值与真实值之间不可避免地存在着随 机误差。 传统的方法是:给出一个区域 (拒绝域), 如果估计值落在这个区域内,就拒绝原来的 假设,否则就接受。
总体 样本
……..
具有代表性的 部分个体 被研究的对象全体
定义1.1.1 X 是具有分布函数 F 的一个随机变量, 如果 X1,X2 ,…,Xn 是有同一分布函数 F 的 相互独立的随机变量,则称: X1,X2 ,…,Xn 是从总体 F ( 总体 X ) 中得到 的容量为 n 的简单随机样本,简称为 样本。 这些样本随机变量各自具体的取值: x1,x2 ,…,xn 称为是总体随机变量 X 的样本观察值。 样本的函数称为是统计量。
2. 样本 (sample)
从总体中取出一个个体,称为从 总体中得到一个样本。 由于各种原因与实际条件的限制,不 可能得到一个总体中所有个体的数据。即 样本总是总体的一小部分。 但同时在直观上又认为、或者希望做到: 抽取出的每个个体 (样本) 都充分蕴涵总体信息。 统计学的目的就是从样本去得出总体的信息。
《应用数理统计》
孙 平 东北大学数学系
plsun@
1. 预 备 知 识
2.参数 估计
4.方差 分析
3.假设 检验
5.回归 分析
第1章 预备知识
第1.1节 基本概念与主要内容 第1.2节 概率论基础 第1.3节 统计量与抽样分布
统计学 ( Statistics ) 是一门收集与分析数据, 并且根据数据进行推断的艺术与科学。 ———— 《大英百科全书》 统计学理论主要包含三个部分: 1.数据收集,2.数据分析,3.由数据做出决策。
Remark 当不知道或者难以确定总体的分布类型时,在 统计学中常常采用下面两种办法来近似得到总体 分布的有关信息。 (1). 直方图的方法 只适用连续总体,得到的是总体密度函数近似。 把收集到的 n 个数据 x1,x2 ,…,xn 从小 到大排列: x(1) ≤ x(2) ≤ … ≤ x(n) ;其次取 区间 (a,b),包含全部数据 a < x(1) ,x(n) < b ;
回归与相关分析
数理统计学重要应用之一
讨论数值变量之间的效应关系问题 一元线性回归 比如说,想了解儿子身高与父亲身高之间的关系。 在每个被调查的家庭中同时获得这两个变量的 观察值,分析它们是否有某种(函数)关系,… 多元线性回归 例如,钢的去碳量与不同矿石、融化时间、 炼钢炉体积等等是否有关?关系如何?…
1. 如何得到样本 ?
抽样调查
不同阶层背景的家庭比例应该各占多少? 样本容量应该取多少才合适?被调查者拒绝调 查怎么办?
2. 如何确定总体的分布 ?
根据经验或者是所讨论的问题的实际背 景,总体的分布类型一般可以事先确定下来。 这里的总体是这个城市的家庭月支出费 用,我们有充分理由认为家庭月支出费用是 一个服从正态分布的随机变量。 即,总体随机变量 X ~ N (µ,σ2 ) ,而这 个城市相应的两个参数 µ 与 σ 2 是未知的。 ( 不同城市对应的这两个参数也就不相同 )
利用统计方法去处理数据时,有两个必须 要解决的问题: (1) 数据量太大,因此计算复杂、繁琐; (2) 能够应用的方法很多,因此需要反复比较 不同的统计方法,找出综合的解决方案。 统计软件包(Statistical Package) 涵盖了应用 广泛、使用频率很高的各种统计方法,是针对 统计数据的特点而专门设计的软件包。
除了对总体参数的检验外,还有一些 重要的假设检验问题,例如: 关于总体分布的检验 分布拟合检验
检验得到的样本数据是不是来自于 某个事先给出的总体 独立性的检验 检验一些分类变量之间是否是独立的, 例如: 抽烟与肺癌,睡觉打鼾与心脏病…