第四章 生物信息学常用概率统计方法分析
生物信息学中的统计学方法与应用

生物信息学中的统计学方法与应用生物信息学是一门综合性学科,通过整合生物学、计算机科学和统计学等多个领域的知识,研究生物信息的获取、存储、分析和应用。
在生物信息学中,统计学方法的应用至关重要。
统计学方法可以帮助研究人员从大量的生物数据中提取有用的信息,揭示生物系统的特征和规律。
本文将介绍生物信息学中常用的统计学方法及其应用。
一、序列分析序列分析是生物信息学中最基础的研究领域之一,通过对生物序列(如DNA、RNA和蛋白质序列)进行比对、模式识别和结构预测等分析,揭示序列间的相似性、功能和结构信息。
在序列分析中,统计学方法被广泛应用于序列比对和模式识别等方面。
1. 序列比对序列比对是将两个或多个序列进行比较,找出其间的相似性和差异性。
常用的序列比对算法有全局比对算法、局部比对算法和多序列比对算法等。
统计学方法在序列比对中起到了至关重要的作用,它可以评估序列比对的可靠性,并帮助研究人员找到最佳的比对结果。
2. 模式识别模式识别是从序列中寻找特定模式或序列片段的过程。
在生物信息学中,模式识别常用于寻找基因启动子、转录因子结合位点等重要功能元件。
统计学方法可以帮助研究人员确定模式识别的阈值和准确性,并提供可靠的结果。
二、基因表达分析基因表达分析是研究基因在不同生物条件下的表达水平和变化的过程。
通过对基因表达数据进行统计学分析,可以揭示基因调控网络和生物过程的动态变化。
常用的基因表达分析方法包括差异表达分析、聚类分析和通路分析等。
1. 差异表达分析差异表达分析是比较不同样本间基因表达水平的差异,并找出显著差异的基因。
统计学方法可以帮助研究人员对差异表达结果进行校正和统计显著性检验,从而获得可靠的差异表达基因。
2. 聚类分析聚类分析是将基因或样本按照相似性进行分组的方法。
通过统计学方法,研究人员可以对聚类结果进行评估和验证,揭示基因表达模式和样本间的关系。
3. 通路分析通路分析是研究基因在特定生物过程中相互作用的过程。
生物大数据技术中常用的统计学方法

生物大数据技术中常用的统计学方法生物大数据技术的发展使我们能够获取到大规模、高维度的生物学数据,这为生物研究提供了更多的机会和挑战。
为了更好地理解和利用这些数据,统计学方法成为生物大数据分析中必不可少的工具之一。
在本文中,我们将介绍生物大数据技术中常用的统计学方法,包括假设检验、方差分析、线性回归、聚类分析和主成分分析。
假设检验是统计学中常用的方法之一,用于判断样本数据是否代表总体的特征。
在生物学研究中,我们经常需要检验两个或多个群体之间的差异。
例如,我们可能想知道一个新的药物是否能够显著地降低癌症患者的生存率。
为了回答这个问题,我们可以收集两组患者的数据,使用假设检验方法比较两组的生存率是否有显著差异。
方差分析是一种用于比较多个群体之间差异的统计方法。
在生物研究中,我们常常需要比较不同基因型之间的表达差异。
方差分析可以帮助我们确定某个基因是否与特定生物性状相关联。
通过将样本数据分为不同的基因型组,并使用方差分析方法检验这些组之间是否存在显著差异,我们可以确定该基因是否与生物性状有关。
线性回归是一种建立变量之间关系的统计方法。
在生物研究中,我们经常需要探索变量之间的相互依赖关系,例如基因表达与蛋白质水平之间的关系。
通过使用线性回归方法,我们可以建立一个模型来预测一个变量如何随着另一个变量的变化而变化。
这可以帮助研究人员理解变量之间的关系,并为生物学研究提供更多的见解。
聚类分析是一种将样本划分为不同群体的统计方法。
在生物大数据技术中,我们通常会收集大量的生物学数据,例如基因表达数据。
聚类分析可以帮助我们将这些数据按照相似性分为不同的群体。
通过将样本分组,我们可以更好地理解不同基因或样本之间的差异,为进一步的分析提供基础。
主成分分析 (PCA) 是一种降维方法,用于减少多变量数据集的维度。
在生物大数据技术中,我们通常会从高通量测序或芯片数据中获取大量的基因表达信息。
然而,这些数据往往包含大量的冗余信息,主成分分析可以帮助我们从中提取最有信息量的关键变量。
生物信息学常用概率统计方法精讲61页文档

谢谢!
51、 天 下 之 事 常成 于困约 ,而败 于奢靡 。——陆 游 52、 生 命 不 等 于是呼 吸,生 命是活 动。——卢 梭
53、 伟 大 的 事 业,需 要决心 ,能力 ,组织 和责任 感。 ——易 卜 生 54、 唯 书 籍 不 朽。——乔 特
55、 为 中 华 之 崛起而 读书。 ——周 恩来
生物信息学常用概率统计方法精讲
21、没有人陪你走一辈子,所以你要 适应孤 独,没 有人会 帮你一 辈子, 所以你 要奋斗 一生。 22、当眼泪流尽的时候,留下的应该 是坚强 。 23、要改变命运,首先改变自己。
24、勇气很有理由被作人类德性之 首,因 为这种 德性保 证了所 有其余 的德性 。--温 斯顿. 丘吉尔 。 25、梯子的梯阶从来不是用来搁脚的 ,它只 是让人 们的脚 放上一 段时间 ,以便 让别一 只脚能 够再往 上登。
概率论方法在生物信息学中的应用

概率论方法在生物信息学中的应用随着DNA测序技术的不断发展,生物信息学作为一门新兴的交叉学科已经走进了人们的视野。
生物信息学是一门集计算机科学、数学和生物学为一体的学科,旨在通过计算机和信息技术的手段,对生物信息进行处理、分析和应用。
而在生物信息学中,概率论方法得到了广泛的应用。
一、序列比对序列比对是生物信息学中最常用的方法之一,它能够帮助我们研究生物序列之间的相似性与差异性,并推断它们之间的进化关系。
在序列比对中,概率论方法被广泛用于评估序列的相似性得分。
通常采用贝叶斯理论,通过计算后验概率来评估比对得分的合理程度。
另外,概率论方法还可以用于多序列比对。
在多序列比对中,需要同时比对多个序列,更加复杂。
如果单纯使用动态规划算法会出现时间和空间复杂度大的问题。
而概率论方法能够较好地解决这些机遇,提高多序列比对的精确度和效率。
二、序列分类序列分类是生物信息学中另一个常见的问题。
它可以帮助我们对DNA、RNA和蛋白质序列进行分类,推断物种进化关系以及预测基因功能。
在序列分类中,概率论无疑也是一种重要的分析方法。
传统的概率模型如马尔可夫模型、朴素贝叶斯模型、隐马尔可夫模型等都可以用于序列分类。
最近,深度学习方法也被广泛用于序列分类。
基于神经网络的模型,如卷积神经网络(CNN)、递归神经网络(RNN)、长-短时记忆网络(LSTM)等,以其强大的特征提取和分类能力,成为序列分类的热门方法。
这些方法基本上涉及到概率论,不同的网络架构、不同的损失函数都涉及到概率论的应用。
三、基因表达分析基因表达分析是研究基因表达水平的一种方法,它是了解生物体功能和生命活动的重要途径之一。
在分子水平上,基因表达是生物体内蛋白质合成的过程,是复杂的动态过程。
在基因表达分析中,概率论方法被广泛用于预测基因表达量的大小,解决表达数据中的噪音问题以及评估两个基因之间的相关性,可以较好地帮助我们理解生物体的生命活动。
四、蛋白质结构预测蛋白质是生物体内非常重要的生物大分子之一,它的结构对其功能发挥起着关键的作用。
生物信息学研究中的统计方法

生物信息学研究中的统计方法随着科技的不断发展,生物信息学领域也日益受到重视。
作为一门交叉学科,生物信息学融合了生物学、计算机科学、数学和统计学等多个学科领域,旨在帮助人们理解生物学中的各种问题和现象。
而生物信息学研究中的统计方法,则是其重要的组成部分之一。
本文将从以下几个方面,对生物信息学研究中的统计方法进行探讨。
一、什么是生物信息学研究中的统计方法在生物信息学中,统计方法的作用是帮助科学家从数据中提取更多信息,如寻找与哪些基因相关、寻找特定蛋白质、预测蛋白的三维结构等。
统计方法在大规模数据分析中扮演了重要的角色。
所以,生物信息学通过对各种数据进行分析和解释,为我们展现了生物学的奥秘。
统计方法在其中起着至关重要的作用。
而在这个过程中主要的方法是收集、记录、管理、分析和解释大量的生物数据,并使用一些复杂的算法来处理数据,以便生物学家们能够更好地理解各种生物问题。
二、生物信息学研究中的统计方法的作用统计方法在生物信息学研究中扮演的角色十分重要。
它们主要被用来研究和分析大量的数据。
在生物信息学研究中,统计方法通常包含以下几个方面:1、分析基因表达数据:基因组测序和芯片技术的兴起,使得生物信息学在分析基因表达数据方面发挥了重要作用。
统计方法的使用允许生物学家们识别基因表达的变化,并对大量表达差异的基因进行分类分析。
比如,可以比较在正常生长和病理生长条件下的基因表达。
这也为评估基因表达的组织特异性和开发特定药物提供了关键信息。
2、发现个体基因特异性:人类基因组计划和其他大规模测序计划,使得人们可以了解人类的整个基因组序列。
因此,人们可以研究和比较不同个体之间的特异性基因。
统计学方法可以利用大规模测序计划的数据,勾勒出人类基因组的一些特异性。
3、分析蛋白质序列:种种生命机制的研究手段都需要正确描述蛋白质序列。
蛋白质序列可以通过蛋白质编码基因的DNA序列来描述。
因此,统计方法可以被用来分析蛋白质与DNA的相互作用。
生物信息学常用概率统计方法精讲共61页文档

▪
30、意志是一个强壮的盲人,倚靠在明眼的跛子肩上。——叔本华
谢谢!
61
生物信息学常用概率统计方法精讲
11、用道德的示范来造就一个人,显然比用法律来约束他更有价值。—— 希腊
12、法律是无私的,对谁都一视同仁。在每件事上,她都不徇私情。—— 托马斯
13、公正的法律限制不了好的自由,因为好人不会去做法律不允许的事 情。——弗劳德
14、法律是为了保护无辜而制定的。——爱略特 15、像房子一样,法律和法律都是相互依存的。——伯克
▪
26、要使整个人生都过得舒适、愉快,这是不可能的,因为人类必须具备一种能应付逆境的态度。——卢梭
▪
27、只有把抱怨环境的心情,化为上进的力量,才是成功的保证。——罗曼·罗兰
▪
28、知之者不如好之者,好之者不如乐之者。——孔子
概率论与统计学在生物信息学中的应用
概率论与统计学在生物信息学中的应用概率论与统计学作为数学的分支,在生物信息学领域中发挥着重要的作用。
生物信息学是一门涉及到生物学、计算机科学和统计学的交叉学科,旨在利用计算机和数学方法处理生物学数据,并从中挖掘出有价值的生物学信息。
本文将重点介绍概率论与统计学在生物信息学中的应用。
一、序列比对中的概率论与统计学序列比对是生物信息学中最基础也是最重要的任务之一。
它通过将两个或多个序列进行比较,找出它们之间的相似性和差异性,从而推断出它们的结构、功能和进化关系。
而概率论与统计学在序列比对中的应用主要体现在两个方面:比对模型和比对评分。
在序列比对模型中,概率论提供了一种数学框架,可以对序列间的相似性进行建模。
例如,隐马尔可夫模型(HMM)被广泛应用于序列比对中,它通过定义状态转移概率和发射概率,能够根据已知的序列信息推断出未知的序列。
而统计学则通过收集大量的序列比对数据,进行参数估计和模型训练,从而提高比对的准确性和可靠性。
在序列比对评分中,概率论和统计学起到了至关重要的作用。
比对评分是衡量序列比对结果好坏的一个指标,也是判断序列相似与否的依据。
在这方面,概率论提供了一种数学模型,通过模型计算出序列间的相似性得分。
而统计学则通过建立模型和计算统计量,对比对得分进行假设检验和显著性分析,以判断比对结果的可靠性和置信度。
二、基因组学中的概率论与统计学基因组学是研究基因组结构、功能和演化的科学,也是生物信息学的核心领域之一。
在基因组学中,概率论与统计学的应用主要涉及到基因预测、基因表达调控和遗传变异等方面。
基因预测是基因组学的基础任务之一,其核心目标是从大量的DNA序列数据中识别和预测出基因位置和结构。
概率论和统计学在基因预测中发挥着重要作用,通过建立基因预测模型,对DNA序列进行建模和分析,从而识别出潜在的基因区域。
例如,随机序列模型和Markov模型常被应用于基因预测中,通过计算基因区域的概率分值,进行基因预测和注释。
生物学中的统计分析方法
生物学中的统计分析方法统计分析是生物学研究中不可或缺的一部分,它帮助我们从大量的数据中提取有意义的信息,并作出科学的推断。
在生物学研究中,统计分析方法的应用广泛而深入,涉及到实验设计、数据收集、数据处理和结果解释等多个方面。
本文将介绍一些常用的生物学统计分析方法,以及它们在不同研究领域的应用。
一、描述性统计分析描述性统计分析是对数据进行总结和描述的方法。
它通过计算数据的中心趋势和离散程度,来了解数据的分布特征。
常用的描述性统计方法包括均值、中位数、众数、标准差和方差等。
这些统计量可以帮助我们了解数据的集中程度、离散程度和分布形态。
例如,在生物学研究中,我们经常需要测量某种生物体的体重。
我们可以通过测量一组个体的体重,并计算出平均值和标准差来描述这组数据的特征。
平均值可以反映这组数据的中心趋势,而标准差则可以反映数据的离散程度。
通过描述性统计分析,我们可以更好地理解生物体体重的分布情况。
二、假设检验假设检验是一种用于判断实验结果是否具有统计学意义的方法。
它基于概率统计的原理,通过对比实际观测值和理论预期值之间的差异,来判断差异是否由随机因素引起。
假设检验可以帮助我们确定实验结果是否显著,并作出科学的结论。
在生物学研究中,假设检验常用于比较两组数据之间的差异。
例如,我们想研究某种新药对癌症患者的治疗效果。
我们可以将患者分为两组,一组接受新药治疗,另一组接受传统治疗,然后比较两组患者的生存率。
通过假设检验,我们可以判断新药治疗组与传统治疗组之间的差异是否具有统计学意义,从而评估新药的疗效。
三、方差分析方差分析是一种用于比较多个样本之间差异的方法。
它可以帮助我们确定不同因素对实验结果的影响程度,并进行多组数据的比较。
方差分析常用于实验设计和数据解释中,特别是在涉及多个处理组的情况下。
在生物学研究中,方差分析常用于比较不同处理组之间的差异。
例如,我们想研究不同温度对植物生长的影响。
我们可以将植物分为几组,分别在不同温度下进行培养,并测量它们的生长高度。
生物信息学分析方法
生物信息学分析方法生物信息学是一门综合利用计算机科学、数学、统计学等方法分析生物学数据的学科,它在克隆基因组学、蛋白质预测、基因表达谱分析、蛋白质相互作用预测、药物设计等方面都发挥了重要作用。
生物信息学分析方法主要包括序列比对、结构预测、基因表达谱分析、蛋白质相互作用分析和药物设计等几个方面。
序列比对是生物信息学中的基础方法之一,它用于比较两个或多个生物序列之间的相似性和差异性。
序列比对可以通过全局比对和局部比对来进行。
全局比对方法适用于两个序列整体相似的情况,而局部比对方法则适用于在一个序列中寻找与另一个序列相似的片段。
序列比对方法有Smith-Waterman算法、Needleman-Wunsch算法、BLAST算法等。
结构预测是生物信息学中一个重要的研究方向,它旨在通过计算预测蛋白质分子的三维结构。
蛋白质的结构与其功能密切相关,因此蛋白质结构的准确预测对于理解蛋白质的功能和相互作用具有重要意义。
结构预测方法主要分为基于比对和基于模型两种。
基于比对的方法包括同源建模、远程同源建模和折叠库等,而基于模型的方法包括分子力学模拟和蒙特卡洛方法等。
基因表达谱分析是研究在不同生理条件下基因表达差异的一种方法。
基因表达谱分析可以帮助研究者了解基因在不同组织、器官或生理状态下的表达模式,从而进一步理解基因编码的蛋白质的功能和调控机制。
基因表达谱分析包括芯片组学和测序组学两种方法。
芯片组学通过芯片上的探针检测基因的表达水平,而测序组学则通过高通量测序技术直接测定基因的表达水平。
蛋白质相互作用分析是研究蛋白质与其他分子之间相互作用的一种方法。
蛋白质相互作用是维持细胞内各种生物学过程的关键。
通过分析蛋白质相互作用网络可以揭示细胞内分子之间的调控关系和信号传导途径。
蛋白质相互作用分析方法主要包括基于实验和基于计算的方法。
基于实验的方法包括酵母双杂交、免疫沉淀和质谱分析等,而基于计算的方法则包括结构基因组学和机器学习等。
生物大数据分析中常见的统计学方法及其应用
生物大数据分析中常见的统计学方法及其应用生物大数据分析已经成为现代生物学领域的重要研究手段之一。
在生物学领域,大量的数据被积累和获取,这些数据的处理和分析对于深入理解生物系统中的复杂性至关重要。
统计学方法在生物大数据分析中发挥了关键作用,能够帮助我们从海量的数据中抽取有用的信息,识别关键的生物学特征,并进一步进行生物学解释和发现。
在生物大数据分析中,常见的统计学方法包括假设检验、线性回归、聚类分析、主成分分析、基因表达量差异分析等等。
这些方法在不同的研究问题和数据类型下,具有不同的应用效果。
假设检验是生物大数据分析中最常用的统计学方法之一。
它用于验证研究中的假设是否成立,从而确定数据之间的差异是否具有统计学意义。
例如,在基因表达数据分析中,我们可以通过假设检验来比较不同条件下的基因表达差异是否显著。
而线性回归则常用于寻找变量之间的关联性和趋势性。
例如,在基因组学研究中,可以使用线性回归方法来探究基因表达水平和转录因子结合位点的关系。
聚类分析是一种将相似样本归为一类的方法,它在生物数据聚类和分类中得到广泛应用。
聚类分析可以帮助我们理解生物系统中的样本组成和相似性,发现潜在的生物学分类和模式。
聚类分析在基因表达谱数据分析中尤为重要,通过对基因表达模式的聚类,可以识别出不同生物状态或组织样本之间的差异。
主成分分析(PCA)是生物大数据分析中常用的降维方法,它能够帮助我们从复杂多变量数据中抽取出关键的特征信息。
主成分分析通过线性变换将高维数据转化为低维空间,从而减少数据的维度,并且能够保持原始数据的一部分信息。
在基因组学研究中,主成分分析可以用于分析基因表达谱、SNP数据以及其他基因组学数据,以帮助我们更好地理解数据的变异和结构。
基因表达量差异分析是生物大数据分析中非常重要和常用的方法,它用于比较不同条件下的基因表达量差异。
在基因组学研究中,比较分析能够帮助我们鉴定与各种生物学过程相关的差异性基因表达。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
泊松分布(Poisson distribution)
若随机变量 X 的分布律为:
P( X k )
k
k!
e , k 0,1,2...
其中 >0, 则称X服从参数为的泊松分布,记为X~ P()
则称X为连续型随机变量,f(x)称为X的概率密度函数, 简称概率密度
F ( x) f (t )dt
x
概率密度f(x)的性质
f ( x ) 0 f ( x )dx 1
连续型随机变量X的值落入区间 [ a , b ]内的概率 为 P(a X b) F (b) F (a) b f ( x)dx
连续型随机变量的概率分布
连续型随机变量的取值为一个范围,当变量在 该范围内取值时,概率是固定的,而当变量取 某一个具体固定值则是无意义的,因为在连续 尺度上,某一点的概率=0 对这种类型的随机变量不能象离散型的那样用 分布律描述,而是用概率密度描述
连续型随机变量概率密度的定义及性质
定义:设X是一个随机变量,其分布函数为F(x).若存 在非负函数 f(
样本的实际发生率称为频率。设在相同条件下,
独立重复进行n次试验,事件A出现f 次,则事
件A出现的频率为f / n
频率与概率间的关系:
样本频率总是围绕概率上下波动 样本含量n越大,波动幅度越小,频率越接近概率
概率计算的基本法则
加法法则
乘法法则
互补原则 完全事件系的概率
随机变量概率分布(probability distribution)
事件概率表示了一次试验中某个结果发生可能 性的大小 要想全面了解试验中某种变量的变化趋势,必 须知道该变量在试验中全部可能的结果以及各 种可能结果发生的概率—随机变量的概率分布 概率分布通常用表格、图形、函数来表示 根据随机变量的不同,可分为离散变量的概率 分布与连续变量的概率分布
几种常见的离散型分布
二项分布(Binomial distribution) △定义:在n重贝努利试验中,若以X表示事件A发生的
次数, 则X可能的取值为0,1,2,3,…,n 若随机变量X的分布律满足:
k P{ X k} Cn p k (1 p)nk
k 0,1, 2..., n;
随机变量特征
是一个变量 取值随试验结果而改变
本例中,性别、体重、 疗效分别为三个随机变 编号 性别 体重 疗效 量,分别用X, Y, Z表示 (ID) (X) (kg) (Y) (Z) 其中,性别变量有若 1 66 0 张1 干取值:x1=1, x2=1; 1 78 1 李2 体重变量也有若干取值: 0 57 2 王3 y1=66, y2=78;
…
…
…
…
随机变量的分类
离散型变量(discrete variable),相当于计数资 料,变量的所有取值是有限个,如性别、年龄、 血型等 连续性变量( continuous variable),相当于计 量资料,变量的取值有无穷多个,如身高、体 重、血压、体温等 有序变量( ordinal variable),相当于等级资料, 如尿糖等级( +、++、+++、++++)、脉搏等 级(速脉、正常、缓脉)等
PX xk pk
X
x1, x2, …
xk, …
p1 , p2 ,…
pK …
随机变量X的概率分布全面表达了X的所有可能取值 以及取各个值的概率情况 1) pk 0 k 1, 2, 性质
2)
p
k 1
k
1
分布律确定概率
例
设X的分布律为
X
P
-1
1/3
1
1/2
2
1/6
求 P(0<X≤2) 解 P(0<X≤2)=P(X=1)+P(X=2) =1/2+1/6=2/3
概率统计学基础
确定性现象:在一定条件下,一定会发生或一定 不会发生的现象。其表现结果为两种事件:肯定 发生某种结果的叫必然事件;肯定不发生某种结 果的叫不可能事件。 随机现象:在同样条件下可能会出现两种或多种 结果,究竟会发生哪种结果,事先不能确定。其 表现结果称为随机事件。 随机事件的特征:①随 机性;②规律性:每次发生的可能性的大小是确 定的。 概率(probability):随机事件发生的可能性大小, 用大写的P 表示;取值[0,1]。
a
频数分布:用来统计每个变量值所处的区域,从而将资料 进行收集整理
频数分布直方图
30
20
从频数表及频数分布图上 可得知:该数值变量资料 频数分布呈现中间频数多, 左右两侧基本对称的分布。 所以我们通俗地认为该资 料服从正态分布。
频数
10 0 130.5 133.5 136.5 139.5 142.5 145.5 148.5 151.5 154.5 157.5
第四章
生物信息学常用概率统 计方法简介
统计生物信息学解决问题步骤
在掌握基本资料分布的基础上,提出检验假设
将数据资料进行合理的分类和整理,建立数据文
件
借助于相关统计软件,根据研究者的实验设计和 研究目的,对数据文件中的数据进行统计分析 (可能需要建立统计模型) 对统计结果做出合理的解释
最最关键!
小概率事件
必然事件 不可能事件 随机事件
P= 1 P=0
0<P<1
将P ≤ 0.05(5%)或P ≤ 0.01(1%)称为小 概率事件(习惯),统计学上认为不大可能发生
随机变量及其分布
随机变量(random variable)
简称变量(variable),统计上习惯用大写拉 丁字母表示 ,如X、Y 、Z、… 变量值习惯用小写拉丁字母表示 ,如性别x1= 1(男)、x2 =1(男)、x3 =0(女) 、…
离散随机变量的概率分布
设离散型随机变量 X 的所有可能取值是 x1, x2 , , xn , , 而取值 xk 的概率为 pk
即
PX xk pk
称此式为X的分布律(列)或概率分布
(Probability distribution)
离散随机变量分布律的表示方法
公式法 表格法