Lect2.2(北大统计与数据分析-概率理论基础之二)
概率统计知识点总结考研

概率统计知识点总结考研概率统计是数学的一个分支,它研究的是随机现象的规律性和数量关系,因此在现代世界中具有非常重要的地位。
在考研数学中,概率统计是一个重要的知识点,涉及到的内容非常丰富,包括概率基本概念与分类、条件概率、独立性、期望与方差、离散型随机变量、连续型随机变量、常用分布、大数定律和中心极限定理、参数估计与假设检验等等。
本文将就以上内容进行总结,以便广大考研学子能够更好地掌握概率统计知识。
一、概率基本概念与分类1.1 概率的基本概念概率是描述事物出现的可能性的一种数值。
在现实生活中,随机现象是普遍存在的,其结果的确定是不可预测的,因此需要用概率来描述随机现象的规律性。
概率的计算公式为P(A)=N(A)/N(S),其中P(A)为事件A发生的概率,N(A)为事件A发生的次数,N(S)为随机试验的次数。
概率的性质包括非负性、规范性、可列可加性和互斥事件概率的加法规则等。
1.2 概率的分类根据随机试验的结果空间和概率分布的不同,概率可分为等可能概率、经典概率、几何概率、条件概率和伯努利概率等。
每种概率都具有其特定的应用场景和计算方法。
二、条件概率、独立性2.1 条件概率条件概率是指在已知事件B发生的条件下,事件A发生的概率,记作P(A|B)。
其计算公式为P(A|B)=P(AB)/P(B)。
条件概率的计算方法在实际问题中具有重要的应用价值,如生病的概率、考试的概率等。
2.2 独立性两个事件A与B独立,是指事件A的发生与B的发生互相独立,不影响彼此。
可用P(AB)=P(A)P(B)来计算两个事件的独立性。
在实际问题中,独立事件具有较强的应用性,如掷硬币、抛骰子等。
三、期望与方差3.1 期望期望是随机变量取值的平均数,它是描述一个随机变量平均水平的数值,也被称为均值。
离散型随机变量的期望计算公式为E(X)=∑X*P(X),连续型随机变量的期望计算公式为E(X)=∫xf(x)dx。
3.2 方差方差是随机变量取值与其期望之差的平方的数学期望,用以描述随机变量取值的离散程度。
北大概率论与数理统计考研

北大概率论与数理统计考研北大概率论与数理统计考研内容总结如下:1. 概率论基础知识:包括事件、样本空间、随机变量、概率分布、期望、方差等基本概念,以及常见离散分布(如二项分布、泊松分布)和连续分布(如均匀分布、正态分布)的性质和应用。
2. 数理统计基本概念:研究数据的收集、整理和分析方法,包括参数估计、假设检验和置信区间。
需要熟悉常见分布的参数估计方法(如最大似然估计)以及假设检验的原理和步骤。
3. 抽样理论:深入了解简单随机抽样、分层抽样、整群抽样等抽样方法的原理与应用,了解样本中心极限定理以及样本容量与抽样误差之间的关系。
4. 统计推断:对数据进行分析得出总体特征的过程,包括点估计和区间估计。
需要了解估计量的性质,如无偏性、一致性以及有效性,能够构造估计量和置信区间。
5. 假设检验:通过对样本数据进行检验,判断总体参数是否满足某种设定。
需要了解假设检验的基本步骤、拒绝域的确定以及错误类型的问题。
还需要掌握常见分布(如t分布、F分布)的应用。
6. 方差分析:研究不同因素对总体差异的贡献程度,进行统计推断。
需要了解单因素方差分析和多因素方差分析的原理和应用,能够进行方差分析表的解读和统计判断。
7. 回归分析:研究自变量与因变量之间的关系,进行参数估计和模型检验。
需要了解简单线性回归和多元线性回归的原理和步骤,能够进行回归模型的构建和参数估计。
8. 相关分析:研究两个变量之间的相关性和线性关系。
需要了解皮尔逊相关系数和秩相关系数的计算和性质,能够进行相关分析的假设检验和解读。
9. 非参数检验:针对总体分布未知或不满足常见分布假设的情况,进行假设检验和区间估计。
需要了解秩和检验、K-S检验、符号检验等非参数方法的基本原理和应用。
总体而言,北大概率论与数理统计考研涵盖了概率论和数理统计的基本理论和方法,考生需要通过对概念、方法和应用的学习掌握,熟练运用各种统计工具进行数据分析和推断。
同时,还需进行大量的练习和实践,加强对各种方法的理解和应用能力。
数理统计与多元统计 lect2—统计模型、统计量

与概率模型不同,这里 N θ是未知的,可以取 0 ∼ N 之间的任何值。因此,对于 X 仅能提出一个概率分布 族 {h(n, N, N θ)|0 θ 1},分布族中的任何一个成 员都可能产生相应的观测数据。 测量模型:设 X1 , . . . , Xn 是 µ的 n个测量值,则 X i = µ + εi , 1 这里 (ε1 , . . . , εn )是误差向量。 i n
§ 2.1
样本均值及其抽样分布
样本均值的性质: ∑ 1. 样本的所有偏差和为 0,即 (xi − x) = 0; ∑ 2. 函数 (xi − c)2 在 x处达到最小,即数据观察值与均 值的偏差平方和最小。
2. 在一次测量中的测量值不影响在另一次的测量中误 差值,即 ε1 , . . . , εn 相互独立; 3. 在一次测量中的误差分布与另一次测量中误差分布 相同,即 ε1 , . . . , εn 有相同的分布; 4. 误差的共同分布是连续型的,且关于 0对称。 可以进一步假设: 5. 误差的共同分布是 N (0, σ 2 ),这里 σ 2 是未知的。
与概率模型不同,这里 N θ是未知的,可以取 0 ∼ N 之间的任何值。因此,对于 X 仅能提出一个概率分布 族 {h(n, N, N θ)|0 θ 1},分布族中的任何一个成 员都可能产生相应的观测数据。 测量模型:设 X1 , . . . , Xn 是 µ的 n个测量值,则 X i = µ + εi , 1 这里 (ε1 , . . . , εn )是误差向量。 关于 ε的分布的设定需要以下基本假定: i n
θ N −N θ (N k )( n−k ) P (X = k) = , (N n) max(n − N (1 − θ), 0) k min(N θ, n).
数学中的概率与统计事件概率与数据分析

数学中的概率与统计事件概率与数据分析概率和统计是数学中重要的概念,它们与数据分析密切相关。
在本文中,我们将探讨概率和统计与数据分析的关系,以及它们在实际中的应用。
一、概率与统计的基本概念概率是用来描述事件发生可能性的数学工具。
它涉及随机试验和事件的发生概率。
随机试验是指在相同的条件下可以重复进行的试验,每次实验的结果可能有多个可能的结果。
事件是指试验的结果的一个子集。
统计是通过对观察样本的数据进行分析,来推断总体的性质和参数的科学。
它包括数据收集、数据描述、数据分析和推断等过程。
统计旨在通过对样本进行推断来了解总体的性质和参数。
二、概率与统计的关系概率与统计有着密切的关系。
概率理论为统计学提供了基础,统计学则通过数据的收集和分析来验证和应用概率理论。
统计学中的很多概念和方法都建立在概率的基础之上,例如概率分布、期望、方差等。
同时,概率理论也可以通过统计学中的数据验证和应用。
三、概率与统计在数据分析中的应用1. 随机变量与概率分布:在数据分析中,我们经常需要对随机变量进行建模和分析。
概率分布可以描述随机变量的可能取值以及其相应的概率。
常用的概率分布包括正态分布、泊松分布等。
2. 抽样与统计推断:在数据分析中,我们往往只能收集到样本数据,而无法获得全部的总体数据。
通过对样本数据进行分析和推断,可以对总体进行推断。
常用的统计推断方法包括参数估计和假设检验。
3. 相关与回归分析:在数据分析中,我们经常需要确定变量之间的关系。
相关分析可以衡量变量之间的线性相关程度,回归分析可以建立变量之间的函数关系。
4. 概率与统计在机器学习中的应用:机器学习是一种通过利用统计方法来让计算机具有学习能力的方法。
概率与统计方法在机器学习中起着重要的作用,例如朴素贝叶斯分类器、隐马尔可夫模型等。
四、结语概率与统计作为数学中重要的概念,在数据分析中有着广泛的应用。
它们通过对数据的收集、描述、分析和推断等过程,帮助我们了解数据背后的规律和趋势,为决策提供科学依据。
概率统计二级结论

概率统计二级结论全文共四篇示例,供读者参考第一篇示例:概率统计是数学的一个重要分支,它研究随机现象的规律性和规律性现象的随机性,是一种介于确定性和随机性之间的数学方法。
在概率统计的学习中,概率统计二级结论是一个非常重要的部分,它是概率与数理统计理论的基础,并且在实际生活中有着广泛的应用。
概率统计二级结论包括了许多重要的内容,比如二项分布、正态分布、卡方分布、t分布等等。
这些分布在概率统计中有着重要的作用,可以用来描述随机变量的分布规律,并且可以用来做出统计推断和决策。
二项分布可以用来描述二分类变量的分布规律,正态分布可以用来描述连续变量的分布规律,卡方分布可以用来做卡方检验,t分布可以用来进行t检验等等。
这些分布的性质和应用都非常重要,在实际应用中起着至关重要的作用。
在概率统计二级结论的学习过程中,需要掌握一些基本的概率统计原理和方法,比如概率的性质、随机变量的性质、大数定律、中心极限定理等等。
这些原理和方法是概率统计二级结论的基础,只有掌握了这些基础知识,才能够更好地理解和应用概率统计二级结论。
在概率统计二级结论的学习过程中,还需要学习一些重要的统计推断方法,比如参数估计、假设检验、方差分析、回归分析等等。
这些方法是概率统计二级结论的核心内容,通过这些方法可以对样本数据进行统计推断,从而得出对总体的统计结论。
参数估计可以用来估计总体参数的值,假设检验可以用来检验总体的假设,方差分析可以用来比较多个总体的均值是否有显著差异,回归分析可以用来分析变量之间的关系等等。
这些方法都非常重要,在实际应用中有着广泛的应用。
概率统计二级结论是概率统计学习中的一个重要部分,它包括了许多重要的内容,比如概率统计原理、概率统计方法、统计推断方法等等。
通过学习概率统计二级结论,可以更好地理解和应用概率统计理论,在实际应用中可以做出准确的统计推断和决策,对于提高数据分析能力和解决实际问题有着重要的意义。
希望大家能够认真学习概率统计二级结论,提高自己的统计分析能力,为实现科学发展和社会进步做出贡献。
概率与统计基础知识

概率与统计基础知识概率与统计是数学的一个分支,是研究不确定性的科学。
概率论主要研究随机现象,统计学则通过采样和分析数据来推断总体特征。
今天,我们将介绍一些概率与统计的基础知识,包括概率的定义、常见的概率分布以及统计学中的一些基本概念。
一、概率的定义概率是描述一个随机事件发生可能性的数值。
常用的概率定义有频率定义、古典概型以及主观概率等。
频率定义是指根据统计实验的结果来计算概率,即事件发生的次数与试验总次数的比值。
古典概型是指事件的每种可能结果发生的概率相等。
主观概率则是基于主观判断和经验估计得出的概率。
二、常见的概率分布1. 均匀分布:均匀分布是概率分布中最简单的一种形式。
在一个区间内,每个数值的概率都是相等的。
例如,掷骰子的结果就是均匀分布。
2. 正态分布:正态分布也被称为高斯分布,它是自然界中非常常见的一种分布形式。
正态分布的特点是对称,其密度曲线呈钟形。
许多自然现象和统计数据都符合正态分布,如身高和成绩分布等。
3. 二项分布:二项分布适用于只有两个可能结果的独立重复实验。
例如,抛硬币的结果只有正面和反面两种可能,这时可以用二项分布来描述硬币正反面的概率。
4. 泊松分布:泊松分布用来描述单位时间或单位空间内事件发生的次数,如一天内接到的电话数量、某个时间段内停车场停车次数等。
三、统计学的基本概念1. 总体与样本:总体是指我们研究的对象的全体,样本是从总体中选取的一部分。
通过对样本的研究,我们可以推断总体的特征。
2. 参数与统计量:总体的特征可以用参数来表示,样本的特征则可以用统计量来估计。
例如,总体均值用μ表示,样本均值用x表示。
3. 抽样:抽样是指从总体中选择一定数量的个体作为样本的过程。
抽样是统计学中非常重要的一环,对样本的选择要具有代表性和随机性。
4. 假设检验:假设检验是统计学中用来推断总体特征的一种方法。
通过建立假设和进行显著性检验,我们可以判断某个结论是否具有统计学意义。
总结起来,概率与统计是研究随机现象的一门学科,它可以帮助我们了解事件发生的概率和推断总体特征。
2015北京大学概率论与数理统计考研参考书、历年真题、报录比、研究生招生专业目录、复试分数线
310
195
300
330 提前面试 提前面试
(3)、“强军计划”、“少数民族骨干计划”、“单考班”: 复试基本分数线根据教育部相关政策另行确定。考生可向相关院系或研招办查询。
二、录取和调剂: 1、考生能否录取,以考生的总成绩名次为准。复试成绩不及格的考生不能录取。各学 院(系、所、中心)拟录取名单经批准后公布。 2、我校未录取考生,达到国家分数线并符合调剂规定的,按教育部要求进行调剂。
是因为大学四年学了一个并不喜欢的专业,到了就业的时候,才陡然感觉压力巨大,便决定考研, 虽说是一种逃避心理,但我也在追求梦想的路上。
第二,从第一次去厦门,我就喜欢上了这个城市。一直以文艺小清新自居的我,总觉得这个城 市的气息是多么的适合我。特别是美丽的北大、环岛路和鼓浪屿,有一股让人流连忘返的气息。
政治 外语
50 50 50 50 50 50 50 50
数学
90 90 90 90
专业或 综合课
90 90 90 90
50 50
90
50 50
90
50 50
90
50 50
180
60 60
90
50 50
90
50 50
90
50 50
180
50 50 80
80
50 50 80
80
总分
340 340 340 340
配套习题集 数学分析 (上,下册) 陈纪修;於崇华,金路, 高教出版社 高等代数(第二版)上册、下册 丘维声, ,高等教育出版社,2002 年, 2003 年
丘维声 , 高等代数学习指导书(上册), 清华大学出版社,2005 年 7 月 高等代数(第二版), 北京大学数学系几何代数教研室代数小组, 1988 年 解析几何(第二版),丘维声,北京大学出版社,(其中第七章不考) 解析几何简明教程,吴光磊,田畴,高等教育出版社,2003 实变函数论,周民强,北京大学出版社,2001 年 复变函数教程,方企勤,北京大学出版社 泛函分析讲义(上册),张恭庆,林源渠,北京大学出版社 常微分方程教程,丁同仁,李承治,高等教育出版社 常微分方程(第二版),王高雄,周之铭,朱思铭,王寿松,高等教育出版社 常微分方程讲义(第二版)叶彦谦,人民教育出版社 数学物理方程讲义(第二版),姜礼尚,陈亚浙,高等教育出版 三、2015 北京大学概率论与数理统计考研经验
概率与统计基础知识
06
参数估计与假设检验的应用
参数估计的应用
点估计
点估计是一种对总体参数的估计 方法,通过样本统计量作为总体 参数的近似值。例如,使用样本 平均值作为总体平均值的估计。
区间估计
区间估计是一种提供估计区间的 方法,该区间通常包含未知的总 体参数。例如,使用样本置信区
间来估计总体的真实值。
01
03
02 04
假设检验
假设检验的基本思想
假设检验是一种通过样本数据来检验关于总体参数的假设是否成立的方法。如 果样本数据与假设不一致,则拒绝该假设,否则接受该假设。
假设检验的步骤
假设检验通常包括以下步骤:提出假设、构造统计量、确定显著性水平、计算 临界值、做出决策。
03
随机变量及其分布
随机变量的概念与分布函数
概率
度量事件发生的可能性大小
事件的运算与概率的性质
事件的加法
两个事件至少有一个发生
概率的性质
非负性,规范性,可加性,可减性,乘法 公式,加法公式,全概率公式,贝叶斯公 式
事件的除法
两个事件不可能同时发生
事件的减法
两个事件至少有一个不发生
事件的乘法
两个事件同时发生
古典概型与伯努利概型
古典概型
有限个样本点,每个样本点出现 的可能性相等
随机变量
定义为样本空间中的函数,其值域为实数。随机变量用于描 述随机现象的结果。
分布函数
定义为一个实数函数,描述了随机变量取值小于或等于某个 特定值的概率。
离散型随机变量及其分布
离散型随机变量
其取值只能是一些离散的数值,例如掷硬币的结果(正面或反面)。
离散型分布
描述离散型随机变量的取值概率,例如二项分布、泊松分布等。
lect-02-随机系统理论基础
m(t ) x (t ) E{x(t )} xdF(t , x)
ቤተ መጻሕፍቲ ባይዱ
p1(t , x 一维概率密度函数p(t,) 存在时
m(t )
xp1(t , x)dx F (t1, x1) p1(t1, x )dx
x1
均值函数的基本概念
x x1 m(t) xi(t) xj(t)
9 24.01212 28.44764 34.02756 26.20549 32.90215 27.39643 24.7694 27.1446 25.9043 29.49725 28.0599 34.31279 30.64229 31.40126 33.18533 35.08034 44.50067 47.09547 31.3658
x x1 D(t) xi(t) xj(t)
t1
t2
t
ù ¾ \Ê ¼ Ñ ± ±ä 1 2 1 23.6 24.5093 2 24.8 25.78119 3 34.2 34.80395 4 25.7 25.45605 5 34.7 33.7056 6 26.4 27.15254 7 24 24.90088 8 27.5 27.27021 9 25 25.84369 10 28.8 29.45255 11 29 28.07607 12 34.1 34.29696 13 30.4 30.65762 14 32.1 31.4123 15 33.2 33.19638 16 34.1 35.0781 17 45 44.50261 18 46.6 47.09715 ù Ö ¾ µ 31.0667 31.2885 ·² ½ î 737.38 697.889
7 24.25699 26.68381 35.19981 25.10097 32.81004 27.38443 24.77701 27.15172 25.90123 29.49505 28.06065 34.31206 30.643 31.40177 33.18584 35.08024 44.50076 47.09555 31.2801
北京大学统计学经典课件第二章——统计回顾和分析方法
第一手数据
• 获得第一手数据并不象得到二手数据那么轻松。 • 某些在华的外资企业每年至少要花三四千万元来
收集和分析数据。
• 他们调查其产品目前在市场中的状况和地位并确 定其竞争对手的态势;
• 他们调查不同地区,不同阶层的民众对其产品的 认知程度和购买意愿以改进产品或推出新品种争 取新顾客;
• 当然,也有可能调查所有的人(比如 人口普查),那叫做普查(census)。
• 总体是包含所有要研究的个体(element) 的集合。而样本是总体中选中的一部 分。
随机样本
• 在抽取样本时,如果总体中的每 一个体都有同等机会被选到样本 中,这种抽样称为简单随机抽样 (simple random samห้องสมุดไป่ตู้ling),
• 因此,可以说,活得长短是有一定随机性的 (randomness)。这种随机性可能和人的经历、基 因、习惯等无数说不清的因素都有关系。
现实中的随机性和规律性
• 但是从总体来说,我国公民的平均 年龄却是非常稳定的。而且女性的 平均年龄也稳定地比男性高几年。 这就是规律性。
• 一个人可能活过这个平均年龄,也 可能活不到这个年龄,这是随机的。
• Excel:它严格说来并不是统计软件,但作为数据表格 软件,必然有一定统计计算功能。而且凡是有Microsoft Office的计算机,基本上都装有Excel。但要注意,有时 在装Office时没有装数据分析的功能,那就必须装了才 行。当然,画图功能是都具备的。对于简单分析, Excel 还 算 方 便 , 但 随 着 问 题 的 深 入 , Excel 就 不 那 么 “傻瓜”,需要使用函数,甚至根本没有相应的方法了。
• Eviews:这是一个主要处理回归和时间序列的软件。 • GAUSS:这是一个很好用的统计软件,许多搞经济的
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§2.2.2 2 2 2 离散型随机变量及其分布律
定义4
若一个随机变量X的全部可能取值只有有限多个或可数无穷多 个,则称X是离散型随机变量。
定义5
设离散型随机变量X的全部可能取值为x1, x2, ... , xi,..., 个可能值相应的概率为 X取各
P ( X xi ) pi
i 1, 1 2,... 2
密度函数的性质 密度函数 的性质
性质1: 性质2 : f(x)≥0, x∈(-∞, +∞)
f ( x)dx 1
b
性质3: a, a b∈(( ∞, +∞), ) a<b, a<b 有
P(a x b) F (b) F (a) f ( x)dx
a
性质4: 对于实数轴上任意一个集合S(S可以是若干个区间的 合并),有:
若 机变量X只可能取值 若随机变量 能 值0和1,其分布律为: 其分布律为
{X , p } }={(0 {(0, 1 - p), ) (1, (1 p)},0<p<1,
则称X服从参数为p的两点分布,或(0, 1)分布。 亦可表示为分布律如下的分布:
p x (1 p ) 1 x p(x) 0
《统计与数据分析》
Statistics & Data Analysis
§2 概率理论基础
(Part II)
Zhu h Huaiqiu i i @Peking University
§2.2 2 2 随机变量
§2.2.1 2 2 1 随机变量及其分布函数
定义1
设E是样本空间为Ω={ω}的随机试验。若对每一ω∈Ω,都存在 唯一的函数X(ω)∈R与之对应,R为实数,则称X(ω)是一个随 机变量(random variable),简记为X。 Ω 引入随机变量后,随机试 验就能用随机变量X的关 系式来表达。
背景:Bernoulli试验
x 0或 x 1 o th e r w is e
Bernoulli trial: an experiment whose outcome is random and can be either of two possible outcomes, success and failure.
k k P ( X k ) Cn p (1 p ) n k ,
k=0, 1, 2, …, n
满足该分布律的随机变量X称为服从参数n, p的二项分布,记为 X B(n p)。 X~B(n, n=1:X~B(1, ( , p)就是两点分布 就是两点分布。
二项分布B(n, B(n p)的分布律
满足该分布律的随机变量X称为服从参数p的几何分布,记为 X~G(p)。
P( X
k 1
k)
(1 p )
k 1
k 1
p p (1 p ) k 1 1
k 1
几何分布G(p) G( )的分布律
几何分布G(p) G( )的分布函数
四、超几何分布 超 何分布(Hypergeometric distribution)
xi x xi x
p(x) pi p1 p2
x1
x2
xi
x
【Example 2.23】设随机变量X的分布律为 X p -1 1/6 2 1/2 3 1/3
试求: (1)X的分布函数; (2)P(X≤0),P(-1<X≤5/2),P(X>3/2)。
一、两点分布 两点分布B(1, p) (Bernoulli distribution)
【Example 2.26】1991年美国加州宣布六合彩从49选6改为53选 6。由于累积奖金额高达1.2 1 2亿美元,在全州掀起了买六合彩的 狂热,平均每小时有1~2百万人购买六合彩,极大地增加了该 州的税收。假定彩票中心是随机从53个数字中选择6个数字(不 考虑排列顺序),试求彩票购买者能够买中的概率。
P ( X S ) f ( x)dx d
S
性质5: 在f(x)的连续点处,若△x充分小,有:
P ( x X x x) f ( x)x
即X取值于x邻近的概率与f(x)的大小成正比。同时,f(x)本身 并不表示概率。
P(a x b) F (b) F (a) f ( x)dx
k nk CM CN M P(X k) n CN
, k=0, 1, 2, …, n, M<N, n<N
满足这种分布律的随机变量X称为服从参数 称为 从参数N, M, n的超几何分 布。 N≥10n:令p=M/N,有
k nk CM CN k k n k M P( X k ) C p p (1 ) n n CN
——Poisson Poisson
Poisson i 分布P( (λ)的分布律
Poisson分布P(λ)的分布函数
【Example p 2.27】1898年,有人对普鲁士骑兵部队发生士兵 在训练中被军马不幸踢死的数据进行分析。他们获得了连续 20年期间10个骑兵团记录的共200例数据(即每个团某一年记 录的被踢死士兵的人数),结果发现这一数据较好地服从参 数λ=0.61的Poisson分布。
a
b
F(x)
F(b)
F(a) a b
连续型随机变量的补充讨论
(1)分布函数F(x)在(-∞, +∞)上处处连续,但必处处可导; (2)若f(x) f( )在x处连续,则
F ( x ) f ( x )
(3)对于任意常数C∈R,有P(X=C)=0 ( )
【Example p 2.28】设连续型随机变量X的分布函数为
三、几何分布( 几何分布(Geometric distribution)
若Bernoulli试验中事件A在每次试验发生的概率P(A) = p, 0<p<1, 连续重复进行直至事件A首次发生,则试验次数X的概率分布律 为:
P( X k ) ( (1 p ) k 1 p
,k=1, , 2, , …。
§2.2.3 连续型随机变量 及其密度函数和分布函数
定义6 对于随机变量X,若存在一个定义域为(( ∞, +∞)的非负
实值函数f(x),使得X的分布函数F(x)可表示为
F ( x) P( X x)
x
f (t )dt ,x∈(-∞, +∞)
则称X为连续性随机变量,f(x)为X的 概率密度函数(probability density f function ti ),简称密度函数(density d it function)。
则称上式为离散型随机变量X的概率分布律(frequency function, 或probability mass function),简称为X的分布律。
分布律的性质: ( 1) ( 2)
pi 0,
i 1 1, 2 , ...
i
P ( X xi )
i
pi 1
分布函数:
F ( x) P( X xi ) pi
二项分布B(n, ( p) )的分布律
二项分布B(n, ( p) )的分布函数
【Example 2.24】Tay-Sachs病是一种与神经鞘脂代谢相关的 隐性常染色体遗传病,多发于犹太人种群。若一对夫妇都为 T-S病携带者,则他们所生孩子患病的概率为1/4。假定该夫 妇共育有4个孩子,求他们当中至多1个患病的概率。 【Example 2.25 2 25】无线电通讯中信号发射器发出信号0或1, 由于随机干扰导致接收器收到错误信号的概率为p。为提高 可靠性,规定发射器每送出一个信号都连续独立不相关地发 射n次(n为奇数),接收器接收这n次信号后以多数原则来 判断信号的内容。试分析这一方案的可靠性有多高。 (设p=0.1,n=5)
X(ω)
定义2
设(Ω,FΩ ,P)为概率空间,X=X(ω) (ω∈Ω)是定义在Ω上的单 值实函数,若对于任一实数x∈R,ω的集合{ω:X(ω)≤x}是一 随机事件,亦即{ω|X( (ω)≤x} }∈ FΩ ,则称X( (ω)为随机变量, 简记为X。
更严格的数学定义 Ω 不仅定义随机变量的取值, 也定义这些取值具有一定 的规律——即概率分布特 征。
X(ω)
讨论: 讨论
(1)随机变量的取值具有随机性,并有 )随机变量的取值具有随机性 并有一定的概率规律; 定的概率规律; (2)随机变量实质上是定义在样本空间 随机变量实质 是定义在样本 间Ω的 的一个实值函数,亦 个实值函数 亦 即对样本空间Ω上的某一样本点ω赋值X(ω)来表示该点; (3)与概率函数P(A)的区别。 的区别
x a0
lim F ( x ) F ( a )
(5)X落入区间( (a, , b] ]内的概率P(a<X ( ≤b)=F(b) ) ( )-F(a) ( ) (6)X落在任一点a处的概率P(X=a)=F(a)-F(a-0)
单位阶跃函数,定义如下:
或
是不连续函数,其“ 微分”是狄拉克δ函数 ,是一个几乎肯定是 零的随机变量的累积 分布函数。 分布函数
F(x)=数F(x) F( )的性质:
(1)0≤F(x)≤1,x∈(-∞, +∞) (2)F(x) ( )单调非减,即若x1<x2,则有F(x ( 1)≤F(x ( 2) (3)
x
lim F ( x) 0 , lim F ( x ) 1
x
(4)F(x)为右连续函数,即对于每个实数a,有
Siméon-Denis Poisson (1781–1840) 法国数学家、物理学家
人生只有两样美好的事 情:发现数学和教数学。
(La vie n‘est bonne qu’à deux choses: découvrir les mathématiques et enseigner les mathématiques ) mathématiques.