数理统计基本概

数理统计基本概
数理统计基本概

第五章 样本及抽样分布

从本章开始, 我们将讲述数理统计的基本内容. 数理统计作为一门学科诞生于19世纪末20世纪初, 是具有广泛应用的一个数学分支, 它以概率论为基础, 根据试验或观察得到的数据, 来研究随机现象, 以便对研究对象的客观规律性作出合理的估计和判断.

由于大量随机现象必然呈现出它的规律性, 故理论上只要对随机现象进行足够多次观察, 则研究对象的规律性就一定能清楚地呈现出来, 但实际上人们常常无法对所研究的对象的全体(或总体) 进行观察, 而只能抽取其中的部分(或样本) 进行观察或试验以获得有限的数据.

数理统计的任务包括: 怎样有效地收集、整理有限的数据资料; 怎样对所得的数据资料进行分析、研究, 从而对研究对象的性质、特点, 作出合理的推断, 此即所谓的统计推断问题, 本课程主要讲述统计推断的基本内容.

第一节 数理统计的基本概念

内容分布图示

★ 引言 ★ 总体与总体分布 ★ 样本与样本分布 ★ 例1

★ 例2 ★ 例3 ★ 例4

★ 统计推断问题简述

★ 分组数据统计表和频率直方图 ★ 例5 ★ 经验分布函数 ★ 例6

★ 统计量 ★ 样本的数字特征

★ 例7 ★ 例8 ★ 例9 ★ 内容小结 ★ 课堂练习 ★ 习题5-1 ★ 返回

内容要点:

一、总体与总体分布

总体是具有一定共性的研究对象的全体, 其大小与范围随具体研究与考察的目的而确定. 例如, 考察某大学一年级新生的体重情况, 则该校一年级全体新生就构成了待研究的总体. 总体确定后, 我们称总体的每一个可观察值为个体. 如前述总体(一年级新生) 中的每一个个体即为每个新生的体重. 总体中所包含的个体的个数称为总体的容量. 容量为有限的称为有限总体, 容量为无限的称为无限总体.

数理统计中所关心的并非每个个体的所有性质, 而仅仅是它的某一项或某几项数量指标. 如前述总体(一年级新生)中, 我们关心的是个体的体重, 进而也可考察该总体中每个个体的身高和数学高考成绩等数量指标.

总体中的每一个个体是随机试验的一个观察值, 故它是某一随机变量X 的值,于是, 一个总体对应于一个随机变量X , 对总体的研究就相当于对一个随机变量X 的研究, X 的分布就称为总体的分布函数, 今后将不区分总体与相应的随机变量, 并引入如下定义:

定义 统计学中称随机变量(或向量)X 为总体, 并把随机变量(或向量)的分布称为总体分布.

注(i) 有时个体的特性很难用数量指标直接描述, 但总可以将其数量化,如检验某学校全体学生的血型, 试验的结果有O 型、A 型、B 型、AB 型4种, 若分别以1,2,3,4依次记这4种血型,则试验的结果就可以用数量来表示了;

(ii) 总体的分布一般来说是未知的, 有时即使知道其分布的类型(如正态分布、二项分布等),但不知这些分布中所含的参数等(如p ,,2σμ等).数理统计的任务就是根据总体中部分个体的数据资料对总体的未知分布进行统计推断.

二、样本与样本分布

由于作为统计研究对象的总体分布一般来说是未知的,为推断总体分布及其各种特征,一般方法是按一定规则从总体中抽取若干个体进行观察,通过观察可得到关于总体X 的一组数值),,,(21n x x x Λ,其中每一i x 是从总体中抽取的某一个体的数量指标i X 的观察值.上述抽取过程为抽样,所抽取的部分个体称为样本.样本中所含个体数目称为样本的容量.为对总体进行合理的统计推断,我们还需在相同的条件下进行多次重复的、独立的抽样观察,故样本是一个随机变量(或向量).容量为n 的样本可视为n 维随机向量),,,(21n X X X Λ,一旦具体取定一组样本,便得到样本的一次具体的观察值

),,,(21n x x x Λ,

称其为样本值.全体样本值组成的集合称为样本空间.

为了使抽取的样本能很好地反映总体的信息, 必须考虑抽样方法,最常用的一种抽样方法称为简单随机抽样, 它要求抽取的样本满足下面两个条件:

1. 代表性: n X X X ,,,21Λ与所考察的总体具有相同的分布;

2. 独立性: n X X X ,,,21Λ是相互独立的随机变量.

由简单随机抽样得到的样本称为简单随机样本, 它可用与总体独立同分布的n 个相互独立的随机变量n X X X ,,,21Λ表示. 显然, 简单随机样本是一种非常理想化的样本, 在实际应用中要获得严格意义下的简单随机样本并不容易.

对有限总体, 若采用有放回抽样就能得到简单随机样本,但有放回抽样使用起来不方便, 故实际操作中通常采用的是无放回抽样, 当所考察的总体很大时, 无放回抽样与有放回抽样的区别很小, 此时可近似把无放回抽所得到的样本看成是一个简单随机样本. 对无限总体, 因抽取一个个体不影响它的分布, 故采用无放回抽样即可得到的一个简单随机样本.

注: 今后假定所考虑的样本均为简单随机样本, 简称为样本.

设总体X 的分布函数为)(x F ,则简单随机样本),,,(21n X X X Λ的联合分布函数为

∏==n

i i n x F x x x F 121)(),,,(Λ

并称其为样本分布.

特别地, 若总体X 为连续型随机变量,其概率密度为)(x f ,则样本的概率密度为

∏==n

i i n x f x x x f 121)(),,,(Λ

分别称)(x f 与),,,(21n x x x f Λ为总体密度与样本密度.

若总体X 为离散型随机变量,其概率分布为}{)(i i x X P x p ==, x 取遍X 所有可能取值, 则样本的概率分布为

,)(},,,{),,,(12121∏======n

i i n n x p x X x X x X p x x x p ΛΛ

分别称)(i x p 与),,,(21n x x x p Λ为离散总体密度与离散样本密度.

三、统计推断问题简述

总体和样本是数理统计中的两个基本概念. 样本来自总体,自然带有总体的信息,从而可以从这些信息出发去研究总体的某些特征(分布或分布中的参数). 另一方面,由样本研究总体可以省时省力(特别是针对破坏性的抽样试验而言). 我们称通过总体X 的一个样本n X X X ,,,21Λ对总体X 的分布进行推断的问题为统计推断问题.

总体、样本、样本值的关系:

总体

↙ ↖推断

(个体)样本 → 样本值

抽样

在实际应用中, 总体的分布一般是未知的, 或虽然知道总体分布所属的类型, 但其中包

含着未知参数. 统计推断就是利用样本值对总体的分布类型、未知参数进行估计和推断.

为对总体进行统计推断, 还需借助样本构造一些合适的统计量, 即样本的函数, 下面将对相关统计量进行深入的讨论.

四、分组数据统计表和频数直方图 通过观察或试验得到的样本值,一般是杂乱无章的,需要进行整理才能从总体上呈现其统计规律性. 分组数据统计表或频率直方图是两种常用整理方法. 1. 分组数据表:若样本值较多时,可将其分成若干组,分组的区间长度一般取成相等, 称区间的长度为组距. 分组的组数应与样本容量相适应. 分组太少,则难以反映出分布的特征,若分组太多,则由于样本取值的随机性而使分布显得杂乱. 因此,分组时,确定分组数(或组距)应以突出分布的特征并冲淡样本的随机波动性为原则. 区间所含的样本值个数陈为该区间的组频数. 组频数与总的样本容量之比称为组频率.

2. 频数直方图:频率直方图能直观地表示出频数的分布,其步骤如下: 设n x x x ,,,21Λ是样本的n 个观察值.

(i) 求出n x x x ,,,21Λ中的最小者)1(x 和最大者)(n x ;

(ii) 选取常数a (略小于)1(x )和b (略大于)(n x ),并将区间],[b a 等分成m 个小区间(一般取m 使

n

m 在101

左右): m

a

b t m i t t t i i -=

?=?+,,,2,1),,[Λ, 一般情况下,小区间不包括右端点.

(iii) 求出组频数i n ,组频率i i f n

n ?

=,以及

),,2,1(,n i t

f

h i i Λ=?=

(iv) 在),[t t t i i ?+上以i h 为高,t ?为宽作小矩形,其面积恰为i f ,所有小矩形合在一起就构成了频率直方图

五、经验分布函数

样本的直方图可以形象地描述总体的概率分布的大致形态,而经验分布函数则可以用来描述总体分布函数的大致形状。

定义 设总体X 的一个容量为n 的样本的样本值n x x x ,,,21Λ可按大小次序排列成

.)()2()1(n x x x ≤≤≤Λ

,)1()(+<≤k k x x x 若则不大于x 的样本值的频率为

.n

k

因而函数 ???

????≥<≤<=+.,1,,,,0)()()1()()1(n k k n x x x x x n

k

x x x F 若若若

与事件}{x X ≤在n 次独立重复试验中的频率是相同的,我们称)(x F n 为经验分布函数。

对于经验分布函数)(x F n , 格里汶科(Glivenko)在1933年证明了以下的结果: 对于任一实数x , 当∞→n 时)(x F n 以概率1一致收敛于分布函数)(x F , 即

.1}0|)()(|sup lim {==-∞

<<∞-∞→x F x F P n x n

因此, 对于任一实数x 当n 充分大时, 经验分布函数的任一个观察值)(x F n 与总体分布函数)(x F 只有微小的差别, 从而在实际中可当作)(x F 来使用. 这就是由样本推断总体其可行性的最基本的理论依据.

六、统计量

为由样本推断总体,要构造一些合适的统计量, 再由这些统计量来推断未知总体. 这里, 样本的统计量即为样本的函数. 广义地讲, 统计量可以是样本的任一函数, 但由于构造统计量的目的是为推断未知总体的分布,故在构造统计量时, 就不应包含总体的未知参数, 为此引入下列定义.

定义 设),,,(21n X X X Λ为总体X 的一个样本, 称此样本的任一不含总体分布未知参数的函数为该样本的统计量.

七、样本的数字特征

以下设n X X X ,,,21Λ为总体X 的一个样本. 1. 样本均值 ∑==n

i i X n X 1

1

2. 样本方差 ∑=--=n

i i X X n S 1

22

)(11 3. 样本标准差 ∑=--=

n

i i X X n S 1

2)(11 4. 样本(k 阶)原点矩 Λ,2,1,11==∑=k X n A n i k

i k

5. 样本(k 阶)中心矩 Λ,3,2,)(11

=-=∑=k X X n B n

i k i k

注: 上述五种统计量可统称为矩统计量,简称为样本矩,它们都是样本的显示函数,它们的观察值仍分别称为样本均值、样本方差、样本标准差、样本(k 阶)原点矩、样本(k 阶)中心矩.

6. 顺序统计量 将样本中的各分量按由小到大的次序排列成

,)()2()1(n X X X ≤≤≤Λ 则称)()2()1(,,,n X X X Λ为样本的一组顺序统计量, )(i X 称为样本的第i 个顺序统计量. 特别地, 称)1(X 与)(n X 分别为样本极小值与样本极大值, 并称)1()(X X n -为样本的极差.

例题选讲:

例1 (讲义例1) 样本的一些例子与观察值的表示方法:

(1) 某食品厂用自动装罐机生产净重为345克的午餐肉罐头, 由于随机性, 每个罐头的净重都有差别. 现在从生产线上随机抽取10个罐头, 秤其净重, 得如下结果:

344 336 345 342 340 338 344 343 344 343

这是一个容量为10的样本的观察值, 它是来自该生产线罐头净重这一总体的一个样本的观察值.

(2) 对某型号的20辆汽车记录每加仑汽油各自行驶的里程数(单位:公里)如下:

29.8 27.6 28.3 28.7 27.9 30.1 29.9 28.0 28.7 27.9 28.5 29.5 27.2 26.9 28.4 27.8 28.0 30.0 29.6 29.1

这是一个容量为20的样本的观察值, 对应的总体是该型号汽车每加仑汽油行驶的里程.

(3) 对363个零售商店调查周售额(单位:元)的结果如下:

15

42

110

135

61

]30000,20000(]20000,10000(]10000,5000(]5000,1000(1000商店数

零售额≤

这是一个容量为363的样本的观察值, 对应的总体是所有零售店的周零售额. 不过这里没有给出每一个样品的具体的观察值, 而是给出了样本观察值所在的区间, 称为分组样本的观察值.这样一来当然会损失一些信息, 但是在样本量较大时, 这种经过整理的数据更能使人们对总体有一个大致的印象.

例2 (讲义例2) 称总体X 为正态总体, 如它服从正态分布. 正态总体是统计应用中最常

见的总体. 现设总体X 服从正态分布),(2σμN , 则其样本密度由下式给出:

.)(21exp 2121exp 21

),,,(1221221??????--???

? ??=?????????????? ??--=∑∏==n i i n n

i i n x x x x x f μσπσσμπσΛ 例3 (讲义例3) 称总体X 为伯努利总体,如果它服从以)10(<

.1}0{,}1{p X P p X P -====

不难算出其样本),,,(21n X X X Λ的概率分布为

n n s s n n p p i X i X i X P )1(},,,{2211-====Λ

其中)11(≤≤k i k 取1或0, 而n n i i i s +++=Λ21, 它恰等于样本中取值为1的分量之总数. 服从伯努利分布的总体也具有较广泛的应用背景. 概率p 通常可视为某实际总体(如工厂的某一批产品)中具有一特征(如废品)的个体所占的比例, 称为比率. 从总体中随机抽取一个个体, 可视为一个随机试验, 试验结果可用一随机变量X 来刻画: 若恰好抽到具有该特征的个体, 记1=X ; 否则, 记0=X . 这样, X 便服从以p 为参数的伯努利分布. 通常参数p 是未知的, 故需通过抽样对其作统计推断.

例 4 设总体X 服从参数为λ的泊松分布, n X X X ,,,21Λ为其样本, 则样本的概率分布为

,!,,!,!!}{},,,{21112211λλλλn n s n

k k i n k k n n e i i i e i i X P i X i X i X P n

k -=-========∏∏ΛΛ

其中)1(n k i k ≤≤取非负整数, 而n n i i i s +++=Λ21.

例5 (讲义例4) 从某厂生产的某种零件中随机抽取120个, 测得其质量(单位: g) 如表

5.1所示. 列出分组表, 并作频率直方图.

表5-1-1

198

200

207

206

206

213

216

206

205

220

207211202209208209211216201211204199214214209208221204216210206216212211213212201214217206214207207214199208211219190218218211221208211219214218209211221

216203211220214211211208210208213207208201196207206203213209208206204206204208208213193211213203194202208207218213206203202208206209206208197203216219209213222206216208203202200

例6 (讲义例5) 随机观察总体X ,得到一个容量为10的样本值:

3.2, 2.5, 2-, 2.5, 0, 3, 2, 2.5, 2, 4

求X 经验分布函数.

例7 (讲义例6) 某厂实行计件工资制, 为及时了解情况,随机抽取30名工人, 调查各自在一周内加工的零件数, 然后按规定算出每名工人的周工资如下: (单位:元)

156 134 160 141 159 141 161 157 171 155 149 144 169 138 168 147 153 156 125 156 135 156 151 155 146 155 157 198 161 151

这便是一个容量为30的样本观察值, 其样本均值为:

5.153)151161134156(30

1

=++++=

Λx 它反映了该厂工人周工资的一般水平. 试计算其样本方差与样本标准差.

例8 (讲义例7) (分组样本均值的近似计算) 如果在例7中收集得到的样本观察值用分组样本形式给出(见表 4.2.1), 此时样本均值可用下面方法近似计算: 以i x 表示第i 个组的组中值(即区间的中点), i n 为第i 组的频率, n n k i k

i i ==∑=1,,,2,1, 则

∑=≈k

i i i x n n x 1

1 (4.2.3)

表4.2.1 某厂30名工人周平均工资额 4600

30

195195

1]200,190(01850]190,180(1751751]180,170(6601654]170,160(217015514]160,150(8701456]150,140(4051353]140,130(1251251]130,120(合计

组中值工人数周工资额区间i i i

i

x n x n

则本例中

33.15330

4600

=≈

x 这与例4.2.2的完全样本结果差不多.

注:在样本容量较大时,给出分组样本是常用的一种方法,虽然会损失一些信息,但对总体数学期望给出的信息还是十分接近的.

例9 (讲义例8) 设我们获得了如下三个样本:

样本A : 3,4,5,6,7;样本B : 1,3,5,7,9; 样本C : 1,5,9

如果将它们画在数轴上(图5-1-3), 明显可见它们的“分散”程度是不同的: 样本A 在这三个样本中比较密集, 而样本C 比较分散.

这一直觉可以用样本方差来表示. 这三个样本的均值都是5, 即,5===C B A x x x 而样

本容量,3,5,5===C B A n n n 从而它们的样本方差分别为:

10

440])59()57()55()53()51[(1515

.24

10])57()56()55()54()53[(1512

22222222222

==-+-+-+-+--===-+-+-+-+--=B A s s

16232)59()55()51[(1312222

==-+-+--=C s .

由此可见222A B C s s s >>,这与直觉是一致的, 它们反映了取值的分散程度. 由于样本方差

的量纲与样品的量纲不一致, 故常用样本标准差表示分散程度, 这里有

,4,16.3,58.1===C B A s s s 同样有.A B C s s s >>

由于样本方差(或样本标准差)很好地反映了总体方差(或标准差)的信息, 因此若当方差

2σ未知时, 常用2S 去估计, 而总体标准差σ常用样本标准差S 去估计.

课堂练习

1. 一组工人完成某一装配工序所需的时间(分)分别如下:

35 38 44 33 44 43 48 40 45 30

45 32 42 39 49 37 45 37 36 42

35 41 45 46 34 30 43 37 44 49

36 46 32 36 37 37 45 36 46 42

38 43 34 38 47 35 29 41 40 41

(1) 将上述数据整理成组距为3的频数表,第一组以27为起点;

(2) 绘制样本直方图;

(3) 写出经验分布函数.

数理统计的基本概念知识点

10 06 数理统计的基本概念 知识网络图 正态总体下的四大分布统计量样本函数样本个体总体数理统计的基本概念→???? ?????????????? 主要内容 一、样本 我们把从总体中抽取的部分样品n x x x ,,,21Λ称为样本。样本中所含的样品数称为样本容量,一般用n 表示。在一般情况下,总是把样本看成是n 个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,n x x x ,,,21Λ表示n 个随机变量(样本);在具体的一次抽取之后,n x x x ,,,21Λ表示n 个具体的数值(样本值)。我们称之为样本的两重性。 二、.统计量 1.定义:称不含未知参数的样本的函数),,,(21n X X X f Λ为统计量 2.常用统计量 样本均值 .11 ∑==n i i x n x 样本方差 ∑=--=n i i x x n S 122.)(11 样本标准差 .)(111 2∑=--=n i i x x n S 样本k 阶原点矩 ∑===n i k i k k x n A 1 .,2,1,1Λ 样本k 阶中心矩

∑==-=n i k i k k x x n B 1 .,3,2,)(1Λ μ=)(X E ,n X D 2 )(σ=, 22)(σ=S E ,221)(σn n B E -=, 其中∑=-=n i i X X n B 1 22)(1,为二阶中心矩。 三、抽样分布 1.常用统计量分布 (1)设n X X X ,,,21Λ是相互独立的随机变量,且均服从与标准正态分布)1,0(N ,则222212n n X X X X Λ++=,服从自由度为n 的-2χ分布,记为()n 2~χχ. (2)设()()n Y N X 2~,1,0~χ,且X 与Y 相互独立,则.n Y X T =服从自由度为n 的-t 分 布,记为()n t T ~. (3)设X 与Y 相互独立,分别服从自由度为1n 和2n 的-2χ分布,则1 22 1n n Y X n Y n X F ?==。服从自由度为()21,n n 的-F 分布,记为()21,~n n F F 2.正态总体场合 设n X X X ,,,21Λ是从正态总体()2,σμN 中抽取的一个样本,记 ()2 1211,1∑∑==-==n i i n n i i X X n S X n X ,则 (1);,~2??? ? ??n N X σμ (2)X 与2 n S 相互独立. (3)()()1~1222 --n S n χσ;或()1~)(2212 --∑=n X X n i i χσ

(完整版)概率论与数理统计课后习题答案

·1· 习 题 一 1.写出下列随机试验的样本空间及下列事件中的样本点: (1)掷一颗骰子,记录出现的点数. A =‘出现奇数点’; (2)将一颗骰子掷两次,记录出现点数. A =‘两次点数之和为10’,B =‘第一次的点数,比第二次的点数大2’; (3)一个口袋中有5只外形完全相同的球,编号分别为1,2,3,4,5;从中同时取出3只球,观察其结果,A =‘球的最小号码为1’; (4)将,a b 两个球,随机地放入到甲、乙、丙三个盒子中去,观察放球情况,A =‘甲盒中至少有一球’; (5)记录在一段时间内,通过某桥的汽车流量,A =‘通过汽车不足5台’,B =‘通过的汽车不少于3台’。 解 (1)123456{,,,,,}S e e e e e e =其中i e =‘出现i 点’ 1,2,,6i =L , 135{,,}A e e e =。 (2){(1,1),(1,2),(1,3),(1,4),(1,5),(1,6)S = (2,1),(2,2),(2,3),(2,4),(2,5),(2,6) (3,1),(3,2),(3,3),(3,4),(3,5),(3,6) (4,1),(4,2),(4,3),(4,4),(4,5),(4,6) (5,1),(5,2),(5,3),(5,4),(5,5),(5,6) (6,1),(6,2),(6,3),(6,4),(6,5),(6,6)}; {(4,6),(5,5),(6,4)}A =; {(3,1),(4,2),(5,3),(6,4)}B =。 ( 3 ) {(1,2,3),(2,3,4),(3,4,5),(1,3,4),(1,4,5),(1,2,4),(1,2,5) S = (2,3,5),(2,4,5),(1,3,5)} {(1,2,3),(1,2,4),(1,2,5),(1,3,4),(1,3,5),(1,4,5)}A = ( 4 ) {(,,),(,,),(,,),(,,),(,,),(,,), S ab ab ab a b a b b a =--------- (,,),(,,,),(,,)}b a a b b a ---,其中‘-’表示空盒; {(,,),(,,),(,,),(,,),(,,)}A ab a b a b b a b a =------。 (5){0,1,2,},{0,1,2,3,4},{3,4,}S A B ===L L 。 2.设,,A B C 是随机试验E 的三个事件,试用,,A B C 表示下列事件:

概率论与数理统计课后习题答案

第一章 事件与概率 1.写出下列随机试验的样本空间。 (1)记录一个班级一次概率统计考试的平均分数 (设以百分制记分)。 (2)同时掷三颗骰子,记录三颗骰子点数之和。 (3)生产产品直到有10件正品为止,记录生产产 品的总件数。 (4)对某工厂出厂的产品进行检查,合格的记上 “正品”,不合格的记上“次品”,如连续查出2个次品 就停止检查,或检查4个产品就停止检查,记录检查的 结果。 (5)在单位正方形内任意取一点,记录它的坐标。 (6)实测某种型号灯泡的寿命。 解(1)},100,,1,0{n i n i ==Ω其中n 为班级人数。 (2)}18,,4,3{ =Ω。 (3)},11,10{ =Ω。 (4)=Ω{00,100,0100,0101,0110,1100, 1010,1011,0111,1101,0111,1111},其中 0表示次品,1表示正品。 (5)=Ω{(x,y)| 0

(2)A 与B 都发生,而C 不发生。 (3)A ,B ,C 中至少有一个发生。 (4)A ,B ,C 都发生。 (5)A ,B ,C 都不发生。 (6)A ,B ,C 中不多于一个发生。 (7)A ,B ,C 至少有一个不发生。 (8)A ,B ,C 中至少有两个发生。 解 (1)C B A ,(2)C AB ,(3)C B A ++,(4)ABC , (5)C B A , (6)C B C A B A ++或 C B A C B A C B A C B A +++, (7)C B A ++, (8)BC AC AB ++或 ABC BC A C B A C AB ??? 3.指出下列命题中哪些成立,哪些不成立,并作 图说明。 (1)B B A B A =(2)AB B A = (3)AB B A B =?则若,(4)若 A B B A ??则, (5)C B A C B A = (6)若Φ=AB 且A C ?,

概率论与数理统计答案,祝东进

习题 1. 写出下列随机试验的样本空间: (1) 掷两颗骰子,观察两颗骰子出现的点数. (2) 从正整数中任取一个数,观察取出数的个位数. (3) 连续抛一枚硬币,直到出现正面时为止. (4) 对某工厂出厂的产品进行检查,如连续检查出两个次品,则停止检查,或 检查四个产品就停止检查,记录检查的结果. (5) 在单位圆内任意取一点,记录它的坐标. 解:(1){(,)|1,2,,6,1,2, ,6}i j i j Ω===; (2){|0,1, ,9}i i Ω==; (3)Ω={(正), (反, 正), (反, 反, 正), (反, 反, 反, 正), … }; (4)Ω={(次, 次), (次, 正, 正, 正), (次, 正, 正, 次), (次, 正, 次, 次), (次, 正, 次,正), (正, 次, 次), (正, 次, 正, 正), (正, 次, 正, 次)}; (5)22{(,)|,,1}x y x R y R x y Ω=∈∈+≤. 2. 在掷两颗骰子的试验中写出下列事件的集合表示: (1) A =”出现的点数之和为偶数”. (2) B =”出现的点数之和为奇数, 但没有骰子出现1点”. (3) C =”至少掷出一个2点”. (4) D =”两颗骰子出现的点数相同”. 解: (1) {(1,1),(1,3),(1,5),(2,2),(2,4),(2,6),(3,1),(3,3),(3,5),A = {(4,2),(4,4),(4,6),(5,1),(5,3),(5,5),(6,2),(6,4),(6,6)}=; (2){(2,3),(2,5),(3,2),(3,4),(3,6),(4,3),(4,5),(5,2),(5,4),(5,6),(6,3),(6,5)}B =; (3){(2,1),(2,2),(2,3),(2,4),(2,5),(2,6),(1,2),(3,2),(4,2),(5,2),(6,2)}C =; (4){(1,1),(2,2),(3,3),(4,4),(5,5),(6,6)}D =. 3. 设,,A B C 是三个事件,试用,,A B C 来表示下列事件:

应用数理统计课后习题参考答案

习题五 1 试检验不同日期生产的钢锭的平均重量有无显著差异?(=0.05) 解 根据问题,因素A 表示日期,试验指标为钢锭重量,水平为5. 假设样本观测值(1,2,3,4)ij y j =来源于正态总体2 ~(,),1,2,...,5i i Y N i μσ= . 检验的问题:01251:,:i H H μμμμ===不全相等 . 计算结果: 表5.1 单因素方差分析表 ‘*’ . 查表0.95(4,15) 3.06F =,因为0.953.9496(4,15)F F =>,或p = 0.02199<0.05, 所以拒绝0H ,认为不同日期生产的钢锭的平均重量有显著差异. 2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验 试检验在四种不同催化剂下平均得率有无显著差异?(=0.05) 解 根据问题,设因素A 表示催化剂,试验指标为化工产品的得率,水平为4 . 假设样本观测值(1,2,...,)ij i y j n =来源于正态总体2 ~(,),1,2,...,5i i Y N i μσ= .其中

样本容量不等,i n 分别取值为6,5,3,4 . 检验的问题:012341:,:i H H μμμμμ===不全相等 . 计算结果: 表5.2 单因素方差分析表 查表0.95(3,14) 3.34F =,因为0.952.4264(3,14)F F =<,或p = 0.1089 > 0.05, 所以接受0H ,认为在四种不同催化剂下平均得率无显著差异 . 3 试验某种钢的冲击值(kg ×m/cm2),影响该指标的因素有两个,一是含铜量A , 试检验含铜量和试验温度是否会对钢的冲击值产生显著差异?(=0.05) 解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用. 设因素,A B 分别表示为含铜量和温度,试验指标为钢的冲击力,水平为12. 假设样本观测值(1,2,3,1,2,3,4)ij y i j ==来源于正态总体2 ~(,),1,2,3,ij ij Y N i μσ= 1,2,3,4j = .记i α?为对应于i A 的主效应;记j β?为对应于j B 的主效应; 检验的问题:(1)10:i H α?全部等于零,11 :i H α?不全等于零; (2)20:j H β?全部等于零,21:j H β?不全等于零; 计算结果: 表5.3 双因素无重复试验的方差分析表 查表0.95(2,6) 5.143F =,0.95(3,6) 4.757F =,显然计算值,A B F F 分别大于查表值, 或p = 0.0005,0.0009 均显著小于0.05,所以拒绝1020,H H ,认为含铜量和试验温度都会对钢的冲击值产生显著影响作用. 4 下面记录了三位操作工分别在四台不同的机器上操作三天的日产量:

福州大学概率论与数理统计课后习题答案高等教育出版社

福州大学概率论与数理统计课后习题答案 高等教育出版社 习题1.1解答 1. 将一枚均匀的硬币抛两次,事件C B A ,,分别表示“第一次出现正面”,“两次出现同一面”,“至少有一次出现正面”。试写出样本空间及事件C B A ,,中的样本点。 解:{=Ω(正,正),(正,反),(反,正),(反,反)} {=A (正,正),(正,反)};{=B (正,正),(反,反)} {=C (正,正),(正,反),(反,正)} 2. 在掷两颗骰子的试验中,事件D C B A ,,,分别表示“点数之和为偶数”,“点数 之和小于5”,“点数相等”,“至少有一颗骰子的点数为3”。试写出样本空间及事件D C B A BC C A B A AB ---+,,,,中的样本点。 解:{})6,6(,),2,6(),1,6(,),6,2(,),2,2(),1,2(),6,1(,),2,1(),1,1( =Ω; {})1,3(),2,2(),3,1(),1,1(=AB ; {})1,2(),2,1(),6,6(),4,6(),2,6(,),5,1(),3,1(),1,1( =+B A ; Φ=C A ;{})2,2(),1,1(=BC ; {})4,6(),2,6(),1,5(),6,4(),2,4(),6,2(),4,2(),5,1(=---D C B A 3. 以C B A ,,分别表示某城市居民订阅日报、晚报和体育报。试用C B A ,,表示以下 事件: (1)只订阅日报; (2)只订日报和晚报; (3)只订一种报; (4)正好订两种报; (5)至少订阅一种报; (6)不订阅任何报; (7)至多订阅一种报; (8)三种报纸都订阅; (9)三种报纸不全订阅。 解:(1)C B A ; (2)C AB ; (3)C B A C B A C B A ++; (4)BC A C B A C AB ++; (5)C B A ++; (6)C B A ; (7)C B A C B A C B A C B A +++或C B C A B A ++ (8)ABC ; (9)C B A ++ 4. 甲、乙、丙三人各射击一次,事件321,,A A A 分别表示甲、乙、丙射中。试说明下列事件所表示的结果:2A , 32A A +, 21A A , 21A A +, 321A A A , 313221A A A A A A ++. 解:甲未击中;乙和丙至少一人击中;甲和乙至多有一人击中或甲和乙至少有一人未击中;甲和乙都未击中;甲和乙击中而丙未击中;甲、乙、丙三人至少有两人击中。 5. 设事件C B A ,,满足Φ≠ABC ,试把下列事件表示为一些互不相容的事件的和: C B A ++,C AB +,AC B -.

应用数理统计试题库

一 填空题 1 设 6 21,,,X X X 是总体 ) 1,0(~N X 的一个样本, 26542321)()(X X X X X X Y +++++=。当常数C = 1/3 时,CY 服从2χ分布。 2 设统计量)(~n t X ,则~2X F(1,n) , ~1 2 X F(n,1) 。 3 设n X X X ,,,21 是总体),(~2 σu N X 的一个样本,当常数C = 1/2(n-1) 时, ∑-=+-=1 1 212 )(n i i i X X C S 为2σ的无偏估计。 4 设)),0(~(2σεε βαN x y ++=,),,2,1)(,(n i y x i i =为观测数据。对于固定的0x , 则0x βα+~ () 2 0201,x x N x n Lxx αβσ?? ? ?- ???++ ??? ?????? ? 。 5.设总体X 服从参数为λ的泊松分布,,2,2,, 为样本,则λ的矩估计值为?λ = 。 6.设总体2 12~(,),,,...,n X N X X X μσ为样本,μ、σ2 未知,则σ2的置信度为1-α的 置信区间为 ()()()()22 2212211,11n S n S n n ααχχ-??--????--???? 。 7.设X 服从二维正态),(2∑μN 分布,其中??? ? ??=∑??? ? ??=8221, 10μ 令Y =X Y Y ???? ??=???? ??202121,则Y 的分布为 ()12,02T N A A A A μ??= ??? ∑ 。 8.某试验的极差分析结果如下表(设指标越大越好): 表2 极差分析数据表

第六章数理统计学的基本概念

第六章数理统计的基本概念 一、教学要求 1.理解总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本方差及样本矩的计算。 2.了解分布、t分布和F分布的定义和性质,了解分位数的概念并会查表计算。 3.掌握正态总体的某些常用统计量的分布。 4.了解最大次序统计量和最小次序统计量的分布。 本章重点:统计量的概念及其分布。 二、主要内容 1.总体与个体 我们把研究对象的全体称为总体(或母体),把组成总体的每个成员称为个体。在实际问题中,通常研究对象的某个或某几个数值指标,因而常把总体的数值指标称为总体。设x为总体的某个数值指标,常称这个总体为总体X。X的分布函数称为总体分布函数。当X为离散型随机变量时,称X的概率函数为总体概率函数。当X为连续型随机变量时,称X的密度函数为总体密度函数。当X服从正态分布时,称总体X为正态总体。正态总体有以下三种类型: (1)未知,但已知; (2)未知,但已知; (3)和均未知。 2.简单随机样本 数理统计方法实质上是由局部来推断整体的方法,即通过一些个体的特征来推断总体的特征。要作统计推断,首先要依照一定的规则抽取n个个体,然后对这些个体进行测试或观察得到一组数据,这一过程称为抽样。由于抽样前无法知道得到的数据值,因而站在抽样前的立场上,设有可能得到的值为,n维随机向量()称为样本。n称为样本容量。()称为样本观测值。 如果样本()满足 (1)相互独立; (2) 服从相同的分布,即总体分布; 则称()为简单随机样本。简称样本。 设总体X的概率函数(密度函数)为,则样本()的联合概率

函数(联合密度函数为)

3. 统计量 完全由样本确定的量,是样本的函数。即:设是来自总体X 的 一个样本,是一个n 元函数,如果中不含任何总体的未知参数,则称 为一个统计量,经过抽样后得到一组样本观测值 ,则称 为统计量观测值或统计量值。 4. 常用统计量 (1)样本均值: (2)样本方差: (3)样本标准差: 它们的观察值分别为: 这些观察值仍分别称为样本均值、样本方差和样本标准差。 (4)样本(k 阶)原点矩 1 1,1,2,n k k i i A X k n ===∑L (5)样本(k 阶)中心矩 1 1(),2,3,n k k i i B X X k n ==-=∑L 其中样本二阶中心矩21 1(),n k i i B X X n ==-∑又称为未修正样本方差。 (6)顺序统计量 将样本中的各个分量由小到大的重排成 (1)(2)()n X X X ≤≤≤L 则称(1)(2)(),,n X X X L 为样本顺序统计量,()(1)n X X -为样本的极差。 (7)样本相关系数: 1 1 2 211 ()()()() 11()()n n i i i i i i xy n n x y i i i i x x y y x x y y r S S x x y y n n ====----= = --∑∑∑∑

应用数理统计吴翊李永乐第三章假设检验课后作业参考答案

第三章 假设检验 课后作业参考答案 某电器元件平均电阻值一直保持Ω,今测得采用新工艺生产36个元件的平均电阻值为Ω。假设在正常条件下,电阻值服从正态分布,而且新工艺不改变电阻值的标准偏差。已知改变工艺前的标准差为Ω,问新工艺对产品的电阻值是否有显着影响(01.0=α) 解:(1)提出假设64.2:64.2:10≠=μμH H , (2)构造统计量36 /06.064 .261.2/u 00 -=-= -= n X σμ (3)否定域???? ??>=???? ??>?? ??? ??<=--21212 αααu u u u u u V (4)给定显着性水平01.0=α时,临界值575.2575.22 12 =-=- α αu u , (5) 2 αu u <,落入否定域,故拒绝原假设,认为新工艺对电阻值有显着性影响。 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测 得其寿命平均值为950(小时)。已知这种元件寿命服从标准差100σ=(小时)的正态分布, 试在显着水平下确定这批元件是否合格。 解: {}01001:1000, H :1000 X 950 100 n=25 10002.5 V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得: 拒绝域: 本题中:0.950.950 u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。 某厂生产的某种钢索的断裂强度服从正态分布( )2 ,σ μN ,其中()2 /40cm kg =σ。现从一

数理统计的基础知识

第4章数理统计的基础知识 数理统计与概率论是两个有密切联系的学科, 它们都以随机现象的统计规律为研究对象.但在研究问题的方法上有很大区别:概率论——已知随机变量服从某分布,寻求分布的性质、数字特征、及其应用; 数理统计——通过对实验数据的统计分析, 寻找所服从的分布和数字特征, 从而推断整体的规律性. 数理统计的核心问题——由样本推断总体 从本章开始,我们将讨论另一主题:数理统计。 数理统计是研究统计工作的一般原理和方法的科学,它主要阐述搜集、整理、分析统计数据,并据以对研究对象进行统计推断的理论和方法,是统计学的核心和基础。 本章将介绍数理统计的基本概念:总体、样本、统计量与抽样分布。 由于大量随机现象必然呈现出它的规律性,因而从理论上讲,只要对随机现象进行足够多次观察,被研究的随机现象的规律性一定能清楚地呈现出来。但客观上只允许我们对随机现象进行次数不多的观察试验,也就是说, 我们获得的只是局部观察资料。 数理统计就是在概率论的基础上研究怎样以有效的方式收集、整理和分析可获的有限的, 带有随机性的数据资料,对所考察问题的统计性规律尽可能地作出精确而可靠的推断或预测,为采取一定的决策和行动提供依据和建议.

§4.1 总体与样本 一、 总体与总体分布 1.总体:具有一定的共同属性的研究对象全体。总体中每个对象或成员称为个体。 研究某批灯泡的质量,该批灯泡寿命的全体就是总体;考察国产 轿车的质量,所有国产轿车每公里耗油量的全体就是总体;某高校学习“高等数学”的全体一年级学生。 个体与总体的关系,即集合中元素与集合之间的关系。统计学中关心的不是每个个体的所有具体特性,而是它的某一项或某几项数量指标。某高校一年级学生“高等数学”的期末考试成绩。 对于选定的数量指标 X (可以是向量)而言,每个个体所取的值是不同的,这一数量指标X 就是一个随机变量(或向量);X 的概率分布就完全描述了总体中我们所关心的这一数量指标的分布情况。数量指标X 的分布就称为总体的分布。 说明 例如 服装厂生产的各式服装,玩具厂生产的儿童玩具,检验部门通常将产品分成若干等级。 3X 总体分布就是设定的表示总体的随机变量.的分布. 4.1 X X 定义统计学中称随机变量(或向量)为,并把随机 变量(或向量)的分布称为总体总体分布.1X 表示总体的既可以是随机变量,也可以.是随机向量.2 有时个体的特性本身不是直接由数量指.标来描述的.

数理统计的基本概念

6 数理统计的基本概念 基本要求 1 理解总体、样本(品)、样本容量、简单随机样本的概念。能在总体分布给定情况下,正确无误地写出样本的联合分布,这是本章的难点。 2*了解样本的频率分布、经验分布函数的定义,了解频率直方图的作法。 3 了解χ2分布、t分布和F分布的概念及性质,了解临界值的概念并会查表计算。 4 理解样本均值、样本方差及样本矩的概念。了解样本矩的性质,能借助计算器快速完成样本均值、样本方差观察值的计算。了解正态总体的某些常用抽样分布。 疑难解答 1、采用抽样的方法推断总体,对样本应当有怎样的要求? 答:为了对总体X的分布进行研究,逐个研究每个个体是不现实的。采用抽样推断总体,其出发点是利用局部认识整体,因此抽出的样本要具有代表性。即要求每个个体被抽取的机会均等,并且抽取一个个体后总体成分不变。首先要求抽样具有“随机性”,第一次抽取的样品X1的可能取值应与总体的可能取值是完全一样的,且去取个个值的概率相同。因此,X1是一个随机变量,并且是与X同分布的随机变量。其次,应具有“独立性”,第一次抽样不改变总体成分,第二次抽取的样品X2可能的值也与X完全一样,且取值的概率也是相同的,因此X2也是与X同分布的一个随机变量且与X1是相互独立的,同样道理,X3,X4,…,X n都是与X同分布的随机变量,并且X1,X2,…,X n是一组相互独立的随机变量,故要求X1,X2,…,X n是简单随机样本。 2、什么是简单随机样本?在实践中如何获得简单随机样本? 答:设X1,X2,…,X n是来自总体X的容量为n的样本,如果它满足以下两个条件,则称它为简单随机样本: (1)X1,X2,…,X n与总体X具有相同的分布 (2)X1,X2,…,X n相互独立 由简单随机样本的定义知,用简单随机样本研究总体,可以更好地用概率论中独立条件下的一系列结论,正是这些结论为概率统计提供了必要的理论基础。 一般说来,对总体进行独立重复观测,便可以获得简单随机样本。 具体来说,当抽取样本容量n相对于总体数N很小时(一般) ≤ n),则连续抽 N 10 1 取n个个体,就近似地看做一个简单随机样本。这是因为抽取的个数很小时,可认为对总体不影响或影响很小。 如果采取有放回抽样,则不必要求n相对很小。 3、什么叫大样本和小样本?它们之间的区别是否是一样本容量的大小来区分的? 答:在样本容量固定的条件下,进行的统计推断、分析问题称为小样本问题,而在样本容量趋于无穷的条件下,进行的统计推断、分析问题称为大样本问题。 然而,众多统计推断与分析问题与统计量或样本的函数的分布相关联。能否得到有关统计量或样本的函数的分布常成为解决问题的关键。所以,大、小样本的区分常与这一分布 *该部分内容考研不作要求。

概率论与数理统计作业及解答

概率论与数理统计作业及解答

概率论与数理统计作业及解答 第一次作业 ★1. 甲, 乙, 丙三门炮各向同一目标发射一枚炮弹, 设事件A , B , C 分别表示甲, 乙, 丙击中目标, 则三门炮最多有一门炮击中目标如何表示. 事件E ={事件,,A B C 最多有一个发生},则E 的表示为 ;E ABC ABC ABC ABC =+++或;AB AC BC =U U 或;AB AC BC =U U 或;AB ACBC =或().ABC ABC ABC ABC =-++ (和A B +即并A B U ,当,A B 互斥即AB φ=时,A B U 常记为A B +.) 2. 设M 件产品中含m 件次品, 计算从中任取两件至少有一件次品的概率. 22 1M m M C C --或1122 (21)(1)m M m m M C C C m M m M M C -+--=- ★3. 从8双不同尺码鞋子中随机取6只, 计算以下事件的概率. A ={8只鞋子均不成双}, B ={恰有2只鞋子成双}, C ={恰有4只鞋子成双}. 61682616()32()0.2238,143C C P A C ===1414 8726 16()80 ()0.5594,143C C C P B C === 22128626 16()30 ()0.2098.143 C C C P C C === ★4. 设某批产品共50件, 其中有5件次品, 现从中任取3件, 求: (1)其中无次品的概率; (2)其中恰有一件次品的概率. (1)34535014190.724.1960C C == (2)21455350990.2526.392 C C C == 5. 从1~9九个数字中, 任取3个排成一个三位数, 求: (1)所得三位数为偶数的概率; (2)所得三位数为奇数的概率. (1){P 三位数为偶数}{P =尾数为偶数4 },9= (2){P 三位数为奇数}{P =尾数为奇数5 },9 = 或{P 三位数为奇数}1{P =-三位数为偶数45 }1.99 =-= 6. 某办公室10名员工编号从1到10,任选3人记录其号码,求:(1)最小号码为5的概率;(2)最大号码为5的概率. 记事件A ={最小号码为5}, B ={最大号码为5}. (1) 253101();12C P A C ==(2) 2 43101 ().20 C P B C == 7. 袋中有红、黄、白色球各一个,每次从袋中任取一球,记下颜色后放回,共取球三次, 求下列事件的概率:A ={全红},B ={颜色全同},C ={颜色全不同},D ={颜色不全同},E ={无黄色球},F ={无红色且无黄色球},G ={全红或全黄}. 311(),327P A ==1()3(),9P B P A ==33333!2(),339A P C ===8 ()1(),9 P D P B =-=

北航应用数理统计考试题及参考解答

北航2010《应用数理统计》考试题及参考解答 09B 一、填空题(每小题3分,共15分) 1,设总体X 服从正态分布(0,4)N ,而12 15(,,)X X X 是来自X 的样本,则22 110 22 11152() X X U X X ++=++服从的分布是_______ . 解:(10,5)F . 2,?n θ是总体未知参数θ的相合估计量的一个充分条件是_______ . 解:??lim (), lim Var()0n n n n E θθθ→∞ →∞ ==. 3,分布拟合检验方法有_______ 与____ ___. 解:2 χ检验、柯尔莫哥洛夫检验. 4,方差分析的目的是_______ . 解:推断各因素对试验结果影响是否显著. 5,多元线性回归模型=+Y βX ε中,β的最小二乘估计?β 的协方差矩阵?βCov()=_______ . 解:1?σ-'2Cov(β) =()X X . 二、单项选择题(每小题3分,共15分) 1,设总体~(1,9)X N ,129(,, ,)X X X 是X 的样本,则___B___ . (A ) 1~(0,1)3X N -; (B )1 ~(0,1)1X N -; (C ) 1 ~(0,1) 9X N -; (D ~(0,1)N . 2,若总体2(,)X N μσ,其中2σ已知,当样本容量n 保持不变时,如果置信度1α-减小,则μ的 置信区间____B___ . (A )长度变大; (B )长度变小; (C )长度不变; (D )前述都有可能. 3,在假设检验中,就检验结果而言,以下说法正确的是____B___ . (A )拒绝和接受原假设的理由都是充分的; (B )拒绝原假设的理由是充分的,接受原假设的理由是不充分的; (C )拒绝原假设的理由是不充分的,接受原假设的理由是充分的; (D )拒绝和接受原假设的理由都是不充分的. 4,对于单因素试验方差分析的数学模型,设T S 为总离差平方和,e S 为误差平方和,A S 为效应平方和,则总有___A___ .

1-数理统计基础

1、数理统计基础 1.1 随机变量 1.1.1随机事件和概率 观测或试验的一种结果,称为一个事件。在一定条件下进行大量重复试验时,每次都发生的事件,称为必然事件(Ω);反之,每次都不发生的事件,称为不可能事件(Φ);有时发生有时不发生的事件,称为随机事件或偶然事件(A )。 随机事件的特点是在一次观测或试验中,它可能出现,也可能不出现,但在大量重复观测或试验中呈现统计规律性。用来描述事件发生可能性大小的量就是概率。 概率的统计定义是:在相同条件下进行n 次重复试验,事件A 发生了m 次,称m 为事件的频数,称m /n 为事件的频率。当n 足够大时,频率m /n 稳定地趋向于某一个常数p ,此常数p 称为事件A 的概率,记为)(A P =p ,即: )(A P =n m n ∞→lim =p (1.1) 即概率是频率的极限值。 由概率的定义可归纳出概率的三个基本性质: (1)必然事件Ω的概率等于1,即)(Ωp =1; (2)不可能事件Φ的概率等于0,即)(Φp =0; (3)任何事件的概率都介于0和1之间,即0≤)(A P ≤1。 小概率原理:当某一事件的概率非常接近于0时,说明这个事件在大量的试验中出现的概率非常小,这样的事件称为小概率事件。小概率事件虽然不是不可能事件,但在一次连续试验中出现的可能性很小,一般可以认为不会发生,此即为小概率原理。 概率的三个定理: (1)互补定理:某事件发生的概率与不发生的概率之和为1。当发生的概

率为p,则不发生的概率为1-p。全部基本事件之和为必然事件。 (2)加法定理:相互独立而又互不相容的各个事件,其概率等于它们分别 出现之和。例如,A 1,A 2 ,…A n 为相互独立而又互不相容的事件,其中任一事件 出现的概率为各个事件概率的总和,即 P(A)=P(A 1)+P(A 2 )+…+P(A n )=∑ = n i i A P 1 ) ((1.2) (3)乘法定理:相互独立的事件同时发生的概率是这些事件各自发生的概率的乘积,即 P(A 1A 2 …A n )=P(A 1 )P(A 2 )…P(A n )=∏ = n i i A P 1 ) ((1.3) 1.1.2 随机变量与分布函数 每次试验的结果可以用一个变量X的数值来表示,这个变量的取值随偶然因素而变化,但又遵从一定的概率分布规律,这种变量称为随机变量。 随机变量根据其取值的特征可以分为离散型随机变量和连续型随机变量。 离散型随机变量试验结果的可能值可以一一列举出来,即随机变量X可取的值是间断的、可数的。 连续型随机变量试验结果的可能值不能一一列举出来,即随机变量X可取的值是连续充满在一个区间的。 随机变量的特点是以一定的概率在一定的区间范围内取值,但并不是所有的观测值都能以一定的概率取某一固定值。因此人们关心的是随机变量在某一个区间取值的概率是多少?即P(a≤X≤b)=? 根据概率的加法定理,某随机变量X在区间[a,b]的取值概率为: P(a≤X≤b)=P(X<b)-P(X<a)显然只要求出P(X<b)和P(X<a)即可,这比求出P(a≤X≤b)简单得多。 对于任何实数x,事件(X<x)的概率当然是x的函数,令F(x)=P(X <x)表示(X<x)的概率,并定义F(x)为随机变量X的概率分布函数,

《概率论与数理统计》习题 第五章 数理统计的基本概念

第五章 数理统计的基本概念 一. 填空题 1. 设X 1, X 2, …, X n 为来自总体N(0, σ2 ), 且随机变量)1(~) (22 1 χ∑==n i i X C Y , 则常数 C=___. 解. ∑=n i i X 1 ~ N(0, n σ2 ), )1,0(~1 N n X n i i σ ∑= 所以 2 1,1σ σ n c n c = = . 2. 设X 1, X 2, X 3, X 4来自正态总体N(0, 22)的样本, 且2 43221)43()2(X X b X X a Y -+-=, 则a = ______, b = ______时, Y 服从χ2分布, 自由度为______. 解. X 1-2X 2~N(0, 20), 3X 3-4X 4~N(0, 100) )1,0(~2022 1N X X -, )1,0(~1004343N X X - 20 1 ,20 1 = = a a ; 100 1,100 1 = = b b . Y 为自由度2的χ2分布. 3. 设X 1, X 2, …, X n 来自总体χ2(n)的分布, 则._____)(______,)(==X D X E 解. 因为X 1, X 2, …, X n 来自总体χ2(n), 所以 E(X i ) = n, D(X i ) = 2n (i = 1, 2, …, n) ,)(n X E = 22) ()(2 2 1=?= =∑=n n n n X D X D n i i 二. 单项选择题 1. 设X 1, X 2, …, X n 为来自总体N(0, σ2 )的样本, 则样本二阶原点矩∑==n i i X n A 1 2 21的方差为 (A) σ2 (B) n 2 σ (C) n 42σ (D) n 4 σ 解. X 1, X 2, …, X n 来自总体N(0, σ2), 所以

《概率论与数理统计》袁荫棠_课后答案__概率论第一章

概论论与数理统计 习题参考解答 习题一 8.掷3枚硬币,求出现3个正面的概率. 解:设事件A ={出现3个正面} 基本事件总数n =23,有利于A 的基本事件数n A =1,即A 为一基本事件, 则.125.0812 1)(3====n n A P A 9.10把钥匙中有3把能打开门,今任取两把,求能打开门的概率. 解:设事件A ={能打开门},则为不能打开门 A 基本事件总数,有利于的基本事件数,210C n =A 27C n A =467.0157910212167)(21027==××?××==C C A P 因此,.533.0467.01(1)(=?=?=A P A P 10.一部四卷的文集随便放在书架上,问恰好各卷自左向右或自右向左的卷号为1,2,3,4的概率是多少?解:设A ={能打开门},基本事件总数,2412344=×××==P n 有利于A 的基本事件数为,2=A n 因此,.0833.012 1)(===n n A P A 11.100个产品中有3个次品,任取5个,求其次品数分别为0,1,2,3的概率. 解:设A i 为取到i 个次品,i =0,1,2,3, 基本事件总数,有利于A i 的基本事件数为5100C n =3,2,1,0,5973==?i C C n i i i 则w w w .k h d a w .c o m 课后答案网

00006.098 33512196979697989910054321)(006.0983359532195969739697989910054321)(138.098 33209495432194959697396979899100543213)(856.033 4920314719969798991009394959697)(5100297335100 39723225100 49711510059700=××==××?××××××××====××= ×××××?××××××××====×××=×××××××?××××××××=×===××××=××××××××===C C n n A P C C C n n A P C C n n A P C C n n A P 12.N 个产品中有N 1个次品,从中任取n 个(1≤n ≤N 1≤N ),求其中有k (k ≤n )个次品的概率.解:设A k 为有k 个次品的概率,k =0,1,2,…,n ,基本事件总数,有利于事件A k 的基本事件数,k =0,1,2,…,n ,n N C m =k n N N k N k C C m ??=11因此,n k C C C m m A P n N k n N N k N k k ,,1,0,)(11?===??13.一个袋内有5个红球,3个白球,2个黑球,计算任取3个球恰为一红,一白,一黑的概率.解:设A 为任取三个球恰为一红一白一黑的事件, 则基本事件总数,有利于A 的基本事件数为, 310C n =121315C C C n A =则25.04 12358910321)(310121315==×××××××===C C C C n n A P A 14.两封信随机地投入四个邮筒,求前两个邮筒内没有信的概率以及第一个邮筒内只有一封信的概率.解:设A 为前两个邮筒没有信的事件,B 为第一个邮筒内只有一封信的事件,则基本事件总数,1644=×=n 有利于A 的基本事件数,422=×=A n 有利于B 的基本事件数, 632=×=B n 则25.041164)(====n n A P A .375.083166)(====n n B P B w w w .k h d a w .c o m 课后答案网

应用数理统计大作业1——逐步回归法分析终

应用数理统计多元线性回归分析 (第一次作业) 学院:机械工程及自动化学院 姓名: 学号: 2014年12月

逐步回归法在AMHS物流仿真结果中的应 用 摘要:本文针对自动化物料搬运系统(Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。 关键词:逐步回归;残差;SPSS;AMHS;物流仿真

目录 1、引言 (1) 2、逐步回归法原理 (4) 3、模型建立 (5) 3.1确定自变量和因变量 (5) 3.2分析数据准备 (6) 3.3逐步回归分析 (7) 4、结果输出及分析 (8) 4.1输入/移去的变量 (8) 4.2模型汇总 (9) 4.3方差分析 (9) 4.4回归系数 (10) 4.5已排除的变量 (11) 4.6残差统计量 (11) 4.7残差分布直方图和观测量累计概率P-P图 (12) 5、异常情况说明 (13) 5.1异方差检验 (13) 5.2残差的独立性检验 (14) 5.3多重共线性检验 (15) 6、结论 (15) 参考文献 (17)

1、引言 回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。 SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。SPSS软件不仅具有包括数据管理、统计分析、图表分析、输出管理等在内的基本统计功能,而且用它处理正交试验设计中的数据程序简单,分析结果明了。基于以上优点,SPSS已经广泛应用于自然科学、社会科学中,其中涉及的领域包括工程技术、应用数学、经济学、商业、金融等等。 本文研究内容主要来源于“庆安集团基于物联网技术的航空柔性精益制造系统”,在庆安集团新建的320厂房建立自动化物料搬运系统(AMHS),使用生产仿真软件EM-Plant对该系统建模并仿真,设计实验因子及各水平如表1-1,则共有3*4*6=72组实验结果,如表所示。为方便描述,将各因子定义为:X1表示AGC物料交换服务水平,X2表示周转箱交换周期,X3表示EMS数量,Y表示因变量年产量箱数。本文目的就是建立年产量箱数与AGC物料交换服务水平、周转箱交换周期和EMS数量之间的关系。 表1-1 三因子多水平实验方案

相关文档
最新文档