第五节数理统计的基础知识
数理统计的基础知识

例1 研究某地区N个农户的年收人.
在这里,总体既指这N个农户,又指我们关心的数 量指标──他们的年收入的N个数字.
如果从这N个农户中随机地抽出n个农户作为调 查对象,那么,这n个农户以及我们所关心的数量指标 ──他们的年收入这n个数字就是样本.
注意 在上面的例子中,总体是很直观的,是
看得见摸得着的. 但是客观情况并不总是这样.
一、总体与总体分布
总体(母体):研究的问题所涉及的对象的 全体所组成的集合. 个体:构成总体的每一个成员(或元素).
有限总体:容量有限. 无限总体:容量无限.
总体
…
研究某批灯泡的质量
然而在统计研究中,人们关心总体仅仅是关心 其每个个体的一项(或几项)数量指标和该数量指标 在总体中的分布情况. 这时,每个个体具有的数量 指标的全体就是总体.
n
g(x1, x2 ,, xn ) f (xi ) . i 1
简单随机样本是应用中最常见的情形,
例2 用一把尺子去量一个物体的长度.
假定n次测量值为X1,X2 , ,Xn 显然,在这个 问题中,我们把测量值X1,X2 , ,Xn看成了样本,但 是,总体是什么呢?
分析: 事实上,这里没有一个现实存在的个体的集
合可以作为我们的总体.可是,我们可以这样考虑, 既然n个测量值 X1,X2 , ,Xn是样本,那么总体就 应该理解为一切所有可能的测量值的全体.
某批 灯泡的寿命
国产轿车每公里 的耗油量
该批灯泡寿命的全 体就是总体
国产所以相应的 数量指标的出现也带有随机性. 从而可以把这种 数量指标看作一个随机变量,因此随机变量的分 布就是该数量指标在总体中的分布.
这样,总体就可以用一个随机变量(或向量)及 其分布来描述. 通常情况,称随机变量(或向量)为 总体,并把对应的分布称为总体分布。
数理统计的基本知识.ppt

设 x1, x2,…, xn 是相应于样本 X1, X2, …,Xn 的样本值,则称 g(x1,x2,…, xn) 是统计量T = g(X1,X2,…,Xn)的观察值.
二、样本矩
下面给出几个常用的统计量.设(X1,X2,…,Xn)是来自总体 X 的一个样
本,(x1,x2,…,xn)是样本观察值,定义:
频数
2 0 0 2 2 8 13 23 24 21 14 6 2 2 0 1
组中值
0.645 0.665 0.685 0.705 0.725 0.745 0.765 0.785 0.805 0.825 0.845 0.865 0.885 0.905 0.925 0.945
直方图中第 i 个小矩形面积 yiΔt=fi (i=1,2,…,k),k 个小矩形的面积之 和为1.
由于样本观察值的 n 个数值 x1,x2,…,xn是从总体X 中独立抽取的,它 们落入区间 (ti-1,ti] 的频率 fi 近似等于随机变量 X 在该区间内取值的概率,即
fi≈P{ti-1<X≤ti}=pi,i=1,2,…,k,
一、样本分布函数
样本能够反映总体X的信息,总体X的分布函 数F(x)是否能由样本来“表示”?回答是肯定的, 我们用下面介绍的样本函数来近似表示总体X的 分布函数.
定义 设x(1),x(2),…,x(n)是总体X的顺序统计量的一组观察值,对于任 意的实数x,定义函数
0, x x(1) ;
Fn
(
x)
i n
,
x(i) x x(i1) ,
1, x x(n) .
i 1, 2,, n 1;
称 Fn(x) 为 总 体 X 的 样 本 分 布 函 数 (或 经 验 分 布 函 数).
数理统计基础知识

多元线性回归分析
01
02
03
多元线性回归分析是研究多个自 变量与一个因变量之间线性关系 的回归分析方法。
多元线性回归模型可以表示为: y=β0+β1x1+β2x2+...+βkxk+ε ,其中β0,β1,...,βk为模型参数, ε为随机误差项。
多元线性回归分析的步骤与一元 线性回归分析类似,但需要考虑 多个自变量的影响以及自变量之 间的相关性问题。
02 概率论基础知识
概率的定义与性质
概率的直观定义
01
描述某一事件发生的可能性大小的数值。
概率的性质
02
非负性、规范性(所有可能事件的概率之和为1)、可加性(互
斥事件的概率之和等于它们并事件的概率)。
古典概型与几何概型
03
古典概型中每个样本点等可能出现,几何概型中样本点连续且
等可能分布。
条件概率与独立性
通过对样本进行重复抽样,生成大量自助样本,然后基于自助样本 得到参数的置信区间。
估计量的评价标准
无偏性
估计量的数学期望等于被估计的总体参数,即估计量在多次抽样下的平均 值等于总体参数真值。
有效性
对于同一总体参数的两个无偏估计量,方差更小的估计量更有效。
一致性
随着样本量的增加,估计量的值逐渐接近总体参数真值。
F检验
用于检验两个正态总体方差是否存在显著差异。
非参数假设检验
符号检验
用于检验两个相关样本的中位数是否存在显 著差异。
秩和检验
用于检验两个独立样本的中位数是否存在显 著差异。
游程检验
用于检验两个相关样本的分布是否存在显著 差异。
06 方差分析与回归分析
数理统计主要知识点

数理统计主要知识点数理统计是统计学的重要分支,旨在通过对概率论和数学方法的研究和应用,解决实际问题上的不确定性和随机性。
本文将介绍数理统计中的主要知识点,包括概率分布、参数估计、假设检验和回归分析。
一、概率分布概率分布是数理统计的基础。
它描述了一个随机变量所有可能的取值及其对应的概率。
常见的概率分布包括:1. 均匀分布:假设一个随机变量在某一区间内取值的概率是相等的,则该随机变量服从均匀分布。
2. 正态分布:正态分布是最常见的连续型概率分布,其概率密度函数呈钟形曲线,具有均值和标准差两个参数。
3. 泊松分布:泊松分布描述了在一定时间内发生某个事件的次数的概率分布,例如在一天内发生交通事故的次数。
4. 二项分布:二项分布描述了进行一系列独立实验,每次实验成功的概率为p时,实验成功的次数在n次内取特定值的概率。
二、参数估计参数估计是根据样本数据来推断随机变量的参数值。
常见的参数估计方法包括:1. 最大似然估计:假设数据服从某种分布,最大似然估计方法寻找最能“解释”数据的那个分布,计算出分布的参数值。
2. 矩估计:矩估计方法利用样本矩来估计分布的参数值,例如用样本均值估计正态分布的均值,样本方差估计正态分布的方差。
三、假设检验假设检验是为了判断一个统计假设是否成立而进行的一种统计方法。
它包括假设、检验统计量和显著性水平三个重要概念。
1. 假设:假设指的是要进行验证的观察结果,分为零假设和备择假设两种。
2. 检验统计量:检验统计量是为了检验零假设而构造的统计量,其值代表目标样本符合零假设的程度。
3. 显著性水平:显著性水平是用来决定是否拒绝零假设的标准,通常为0.01或0.05。
四、回归分析回归分析是用来研究和描述两个或多个变量之间关系的统计方法。
它可以帮助人们了解因果关系,做出预测和控制因素的效果。
1. 简单线性回归:简单线性回归是一种简单的回归分析方法,它描述一个因变量和一个自变量之间的线性关系。
2. 多元线性回归:多元线性回归描述多个自变量和一个因变量之间的关系,通过多元回归模型可以找到最佳的回归系数,从而用来预测未来的结果。
数理统计基础

数理统计基础数理统计是统计学中的一个重要分支,它不仅是现代科学研究的必备工具,更是经济、金融、医学、社会科学等领域的重要基础。
本文将从基础概念、数据的搜集与整理、概率分布及其统计推断、参数估计与假设检验等方面,简要介绍数理统计的基本概念和理论。
一、基础概念1.总体和样本总体指我们需要研究的全体对象,样本则是从总体中选出的一部分对象。
为了使样本更具有代表性,我们需要采用随机抽样的方法。
总体和样本的关系是,样本是从总体中抽出的一部分,通过对样本的研究可以得到对总体的推断。
2.统计量和参数统计量是样本数据的函数,参数是总体分布的特征数值。
例如样本均值是样本数据的函数,而总体均值是总体分布的特征数值。
统计量可以用来描述样本的分布情况,帮助我们对总体进行推断。
3.分位数和分位点分位数是在数值序列中把一个样本分割为几个等份的数值,分位点则是将整个样本分成若干等份的点。
例如,中位数是50%分位数,将样本分为两个等份。
分位数和分位点是描述样本分布特征的指标。
二、数据的搜集与整理数据的搜集与整理是数理统计的重要前提。
在数据搜集时,需要注意样本的代表性、随机性和可比性。
在数据整理时,需要进行数据清洗,包括误差校正、缺失数据的填补等。
整理出清晰、准确、有意义的数据,是进行统计分析的基础。
三、概率分布及其统计推断在统计分析中,分布是一个关键概念。
常见的分布有正态分布、泊松分布等。
概率密度函数是描述分布特征的函数,可以用于对总体和样本进行分析和描述。
概率分布的统计推断包括参数估计和假设检验两个重要方面。
1.参数估计参数估计是指根据已知的样本数据,推断总体分布的参数。
这里介绍两种参数估计方法:最大似然估计法:在总体分布已知的情况下,利用样本数据进行最大似然估计。
最大似然估计是一种广泛应用于统计学中的方法,可以得到比较准确的参数估计。
贝叶斯方法:在总体分布未知的情况下,利用概率论的贝叶斯公式计算后验分布并进行参数估计。
贝叶斯方法面对的是更加复杂的情形,但能够在一定程度上处理不确定性。
§5.1数理统计的基础知识

P(X>xα)=1-F(xα)=α (0<α<1)
的 xα称为X的上α分位数(点) t分布的 上 分位数 t (n)
t0.05 (9) 1.8331 t0.95 (9) 1.8331
例如:
设随机变量X的分布函数为F(x),满足等式
P(X>xα)=1-F(xα)=α (0<α<1)
的 xα称为X的上α分位数(点)
1 X Xi n i 1 1 2 Sn ( X i X ) n i 1
2 n
(2) 样本方差
n 1 2 样本方差修正值 S 2 (Xi X ) n 1 i 1
(3) 样本标准差(均方差) : Sn 样本标准差(均方差)修正值: S
1 k (4) 样本 k 阶原点矩 Ak X i n i 1
它反映了总体 k 阶矩的信息
n
1 n (5) 样本 k 阶中心矩 Bk ( X i X ) k n i 1
它反映了总体 k 阶中心矩的信息
设 (X1,Y1), (X2, Yn)…,(Xn, Yn) 是二维总体 的一组样本, 则常见统计量有:
(1) 样本协方差
S
2 XY
(2) 样本相关系数
一. 总体与个体
一个统计问题总有它明确的研究对象.
研究对象的全体称为 总体(母体), 总体中每个成员称为 个体. 在统计研究中,人们关心总体仅仅是关心 其一项(或几项)数量指标. 这时数量指标的 全体就是总体. 可以用随机变量 X 来表示,
如: 灯泡寿命等.
因此, 总体可以用一个随机变量 X 来表示, 个体即为 X 某个取值. 总体的分布也就是随机变量 X 的分布. 总体: 1 维总体、 k 维总体(数量指标) 总体: 有限总体、无限总体(个体数目).
概率论与数理统计 --- 第二章{一维随机变量及其分布} 第五节:随机变量的函数的分布

概率论
用
y X
y 代替 X y
2
这样做是为了利用已知的 X的分布,从而求出相应的概率.
这是求r.v.的函数的分布的一种常用方法.
概率论 定理: 设 X是一个取值于区间 [a, b], 具有概率密度 f(x)的连续型随机变量, 又设 y=g(x)处处可导, 且对于任意 x, 恒有 g'(x)>0 或恒有 g'(x)<0, 则 Y=g(X)是一个连续型随机变量,它的概率密度为:
y
f X ( x)
1
( x ) 2
2
2
概率论
2
1
e
,
x
yb fY ( y ) fX , a a
y
2
即:fY ( y )
1 a
1 2
yb a 2
2
e
dh( y ) , f X [h( y )] fY ( y ) dy 0,
a x b
y
其它
其中, min g ( x ), max g ( x ),
a x b
x=h(y) 是 y=g(x) 的反函数 .
概率论 2x 2 0 x 例4: 设随机变量X的概率密度为: f X ( x ) 求 Y = sinX 的概率密度. 1 Y 1 0 其它 解: 当 0 x 时, 0 y 1 FY y P Y y
当 y 0时,FY ( y ) 0,
当 y 1时,FY ( y ) 1,
第五章 数理统计基础知识

(3)对360个零售商店调查零售额(单位:元)的结果 如下:
商店数 零售额
61 135
110
42
12
1000 (1000 ,5000 ] (5000 ,10000 ] (10000 ,20000 ] (20000 ,30000 ]
这是一个容量为360的样本的观察值,对应的总体是所 有零售店的周零售额.不过这里没有给出每一个样品的观 察值,而是给出了样本观察值所在的区间,称为分组样本 的观察值.
这便是一个容量为30的样本观察值,其样本均值为:
x
1 (156 30
134
161
151)
153.5
它反映了该厂工人周工资的一般水平.
例3(分组样本均值的近似计算)如果在例2中收集
得到的样本观察值用分组样本形式给出(见下表),
此时样本均值可用下面方法近 似计算:以 xi ,表示
第 i 个组的组中值(即区间的中点),ni 为第 i 组的频
(2)对某型号的20辆汽车记录每加仑汽油各自行驶的 里和数(单位:公里)如下:
29.8 27.6 28.3 28.7 27.9 30.1 29.9 28.0 28.7 27.9 28.5 29.5 27.2 26.9 28.4 27.8 28.0 30.0 29.6 29.1
这是一个容量为20的样本的观察值,对应的总体是该 型号汽车每加仑汽油行驶的里程.
即下表所示.
X
0
1
P
1 p p
其中 X 是一个随机变量,表示抽查一台彩电的质量后 所得到的不合格数,X 0 表示该彩电合格,X 1 表示该 彩电不合格.不同厂家的总体间的差异就体现在不同的 p 上.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章数理统计的基础知识在前四章的概率论部分中,我们讨论了概率论的基本概念、思想和方法。
知道随机变量的统计规律性是通过随机变量的概率分布来全面描述的。
在概率论的许多问题中,概率分布通常是已知的或假设为已知的,在这一前提下我们去研究它的性质、特点和规律性,即讨论我们关心的某些概率、数字特征的计算以及对某些问题的判断、推理等。
但在许多实际问题中,所涉及到的某个随机变量服从什么分布我们可能完全不知道,或有时我们能够根据某些事实推断出分布的类型,但却不知道其分布函数中的某些参数。
例如:1、某种电子元件的寿命服从什么分布是完全不知道的。
2、检测一批灯泡是否合格,则每个灯泡可能合格,也可能不合格,则服从(0-1)分布,但其中的参数p未知。
对这类问题要深入研究,就必须知道与之相应的分布或分布中的参数。
数理统计要解决的首要问题就是:确定一个随机变量的分布或分布中的参数。
数理统计学是研究随机现象规律性的一门学科,它以概率论为理论基础,研究如何以有效的方式收集、整理和分析受到随机因素影响的数据,并对所考察的问题作出推理和预测,直至为采取某种决策提供依据和建议。
数理统计研究的内容非常广泛,可分为两大类:一是:怎样有效地收集、整理有限的数据资料。
二是:怎样对所得的数据资料进行分析和研究,从而对所考察对象的某些性质作出尽可能精确可靠的判断—本书中参数估计和假设检验。
第一节数理统计的基本概念一、总体与总体的分布在数理统计中,我们将研究对象的全体称为总体或母体,而把组成总体的每个元素称为个体。
总体中所包含的个体的个数称为总体的容量.容量为有限的总体称为有限总体;容量为无限的总体称为无限总体. 总体和个体之间的关系就是集合与元素之间的关系.在实际问题中,研究对象往往是很具体的事物或现象,而我们所关心的不是每一个个体的种种具体的特征,而是其中某项或某几项数量指标,记为X。
例如:研究一批灯泡的平均寿命时,该批灯泡的全体构成了研究的总体,其中每个灯泡就是个体。
但在实际问题中,我们仅仅关心灯泡的使用寿命(记X表示该批灯泡的寿命)。
则X就是我们研究的总体(所有灯泡寿命的集合),每一个灯泡的寿命就是一个个体。
再如:考查某一群体的身高和体重,则全体人员的(身高、体重)是总体,每个人的身高和体重是个体。
由此给出定义:总体:对所研究对象的某些指标进行试验,将试验的全部可能的观测值称为总体记为X。
个体:每一个可能的观测值称为个体。
对不同的个体,X的取值一般是不同的。
例如在试验中观察若干个个体就会得到X的一种数值,但在试验或观察之前,无法确定会得到一组什么样的数值,所以X是一个随机变量或随机向量,而X的分布也就完全描述了我们所关心的指标,即总体的分布。
为方便起见,以后我们将X的可能取值的全体组成的集合称为总体,或直接称随机变量X为总体,X的分布也就是总体的分布。
例如:正态总体:是指表示总体某个数量指标的随机变量服从正态分布。
【注1】总体的分布一般情况下是未知的,这就需要利用总体中部分个体的数据资料来对总体服从的分布进行检验—这是分布拟合检验(非参数检验)问题;有时即使知道总体所服从的分布,但分布中的参数未知,这也需利用利用总体中部分个体的数据资料来对总体服从的分布中的未知参数进行统计推断(参数估计)。
而这就需要从总体中抽取若干个体进行观察,从中获得研究总体的一些观察数据,然后通过这些数据的统计分析,对总体的分布进行判断或对总体的参数做出合理的估计。
而一般的方法是按照一定的原则从总体中抽取若干个体进行观察,这个过程称为随机抽样。
二、样本与样本的分布由于每个个体的观察结果具有随机性,因此可以将第i 次抽取的个体记为i X ,则为随机变量,为此引入以下概念。
1、样本:从一个总体X 中,随机的抽出n 个个体12,,,n X X X L ,通常记为),,,(21n X X X 这样取得的12,,,n X X X L 称为总体X 的一个样本。
样本所含的个体数目称为样本容量.【注2】:(1)由于每个i X 都是从总体X 中随机抽出的,因此是一个随机变量,而样本),,,(21n X X X 就是n 维的随机向量。
(2)在依次取n 个个体12,,,n X X X L 观测完毕后,得到n 个具体的数据),,,(21n x x x ,称为样本),,,(21n X X X 的观测值—样本值。
因此样本本身是随机向量,而一经抽取就是一组确定的数值,这就是所谓的样本两重性。
2、简单随机样本我们的目的是根据从总体中抽取的一个样本值),,,(21n x x x 对总体X 的分布或某些特征进行各种分析推断,所以要求抽取的样本能很好地反映总体的特性,为此我们要求随机抽取的样本),,,(21n X X X 满足:(1)具有代表性。
即样本的每个分量X i 与总体X 有相同的分布;(2)具有独立性。
即12,,,n X X X L 是相互独立的随机变量,也就是说,n 次观察值之间是互相独立的;满足上述两条的样本称为简单随机样本,今后如无特别说明,所说的样本均指简单随机样本。
在实际问题中,抽取简单随机样本的方法很简单: (1)放回抽样;(2)不放回抽样:有限总体,当样本容量远小于总体容量时,不放回近似代替放回; 无限总体,总是用不放回抽样.综合上述,给出明确的数学概念:定义一:一个随机变量X 或其相应的分布函数(分布律、密度函数)称为一个总体。
定义二:若随机向量12,,,n X X X L 是相互独立的随机变量且每个分量X i 与总体X 有相同的分布,则称12,,,n X X X L 是来自总体的容量为n 的简单随机样本。
简单随机样本的分布有如下性质:设总体X 的分布函数为()F x (称为总体分布函数),或密度函数()f x 或分布律(称为总体概率密度),则来自总体的样本),,,(21n X X X 的 联合分布函数:121(,...)()nn ii F x x x F x,称为样本分布函数联合密度函数:121(,...)()nn ii f x x x f x,称为连续样本密度函数联合分布律:1211221(,,)(,...)()nn n n ii p x x x P X x X x X x P X x L ,称为离散样本密度【例1】 总体X 服从参数为p 的(0-1)分布,{1},{0}1P X p P X p ,求),,,(21n X X X 的分布。
【解】由题意X 的分布律为1{}(1),(0,1)xxP X x p p x ,设12(,,,)n x x x L 为来自X 的简单随机样本值,则),,,(21n X X X 的联合概率分布为1111211221(,,)(,...)(1)(1)nniiiii i nx n x x x n n n i p x x x P X x X x X x p p ppL【例2】总体X 服从2(,)N ,求样本),,,(21n X X X 的联合密度函数.【解】设12(,,,)n x x x L 为来自X 的简单随机样本值,则),,,(21n X X X 的联合概率分布为221221111(,,,)()]exp{()}22nnn i n ii i x f x x x x L 三、统计推断问题简述总体和样本是数理统计中的两个基本概念. 样本来自总体,自然带有总体的信息,从而可以从这些信息出发去研究总体的某些特征(分布或分布中的参数). 另一方面,由样本研究总体可以省时省力(特别是针对破坏性的抽样试验而言). 我们称通过总体X 的一个样本n X X X ,,,21 对总体X 的分布进行推断的问题为统计推断问题.总体、样本、样本值的关系:总体↙ ↖推断(个体)样本 → 样本值抽样在实际应用中, 总体的分布一般是未知的, 或虽然知道总体分布所属的类型, 但其中包含着未知参数. 统计推断就是利用样本值对总体的分布类型、未知参数进行估计和推断.通过观察或试验得到的样本值,一般是杂乱无章的,例如: 例1样本的一些例子与观察值的表示方法:(1) 某食品厂用自动装罐机生产净重为345克的午餐肉罐头, 由于随机性, 每个罐头的净重都有差别. 现在从生产线上随机抽取10个罐头, 秤其净重, 得如下结果:344 336 345 342 340 338 344 343 344 343这是一个容量为10的样本的观察值, 它是来自该生产线罐头净重这一总体的一个样本的观察值.(2) 对363个零售商店调查周售额(单位:元)的结果如下:154211013561]30000,20000(]20000,10000(]10000,5000(]5000,1000(1000商店数零售额这是一个容量为363的样本的观察值, 对应的总体是所有零售店的周零售额. 不过这里没有给出每一个样本的具体的观察值, 而是给出了样本观察值所在的区间, 称为分组样本的观察值.这样一来当然会损失一些信息, 但是在样本量较大时, 这种经过整理的数据更能使人们对总体有一个大致的印象.通过该例可以看出,以上的两种样本值的表示方法,虽然能够反应出总体的一些大致的信息,但不够直观,判断不出总体服从什么分布。
为了对总体的分布有一个大致的判断,就需要对所获得的样本值进行整理,而分组数据统计表或频率直方图是两种常用整理方法.四、分组数据统计表和频率直方图1. 分组数据表:若样本值较多时,可将其分成若干组,分组的区间长度一般取成相等, 称区间的长度为组距. 分组的组数应与样本容量相适应. 分组太少,则难以反映出分布的特征,若分组太多,则由于样本取值的随机性而使分布显得杂乱. 因此,分组时,确定分组数(或组距)应以突出分布的特征并冲淡样本的随机波动性为原则. 区间所含的样本值个数称为该区间的组频数. 组频数与总的样本容量之比称为组频率.2. 频数直方图:设n X X X ,,,21 是总体X 的一个样本,又设总体具有概率密度f ,如何用样本来推断f ?注意到现在的样本是一组实数,因此,一个直观的办法是将实轴划分为若干小区间,记下诸观察值i X 落在每个小区间中的个数,根据大数定律中频率近似概率的原理,从这些个数来推断总体在每一小区间上的密度。
具体做法如下:设n x x x ,,,21 是样本的n 个观察值.(i) 求出n x x x ,,,21 中的最小者)1(x 和最大者)(n x ;(ii) 选取常数a (略小于)1(x )和b (略大于)(n x ),并将区间],[b a 等分成m 个小区间(一般取m 使nm在101左右): mab t m i t t t i i,,,2,1),,[ , 一般情况下,小区间不包括右端点.(iii) 求出组频数i n ,组频率i i f nn,以及),,2,1(,n i tfh i i(iv) 在),[t t t i i 上以i h 为高,t 为宽作小矩形,其面积恰为i f ,所有小矩形合在一起就构成了频率直方图频率直方图能够大体刻画总体的分布情况。