随机变量独立性性质及其判定论文

随机变量独立性性质及其判定论文
随机变量独立性性质及其判定论文

议随机变量独立性及其应用

作者:xxx 指导老师:xxx

摘要 随机变量的独立性是概率论中的一个重要概念.本文首先介绍了随机变量独立性的定义,

随机变量独立性的性质,然后对离散型随机变量和连续型随机变量的独立性分别给出了不同的判别方法,从而针对不同的问题运用相应的判别方法进行判定,除此还通过随机变量独立性的性质及其判别方法得出了一些相关的推论,并对其应用进行了举例说明.

关键词 离散型随机变量 连续型随机变量 独立性 联合分布

1 引言

概率统计是研究随机现象中数量规律的一门数学学科,它是近代数学的重要分支,理论严谨、应用广泛,并且与其他学科互相渗透结合.概率论是对随机现象统计规律演绎的研究,由于随机现象的普遍性,使得其具有极其广泛的应用,特别是在科学技术、工农业生产等方面.独立性是概率统计中最基本的概念之一,无论在理论研究还是在实际应用中都具有特别重要的意义.概率论和数理统计已有的成果大部分都是在某种独立性的前提下才得到的.因而随机变量独立性的研究倍受重视.

随机变量独立性的研究一直经历着缓慢的发展过程.进入二十世纪九十年代后,随机变量独立性判定的研究进入了一个新的阶段.关于这方面的著作、文献逐渐多了起来,如文献[2]中毛纲源对随机变量独立性的判定进行了分析并举例说明;文献[7]中明杰秀等对二维随机变量独立性的判定及其应用等相关内容进行了论述.本文将在此基础上对随机变量独立性做一下详细、全面的论述,重点介绍离散型随机变量和连续型随机变量独立性的判定方法,并对随机变量的独立性的应用进行举例说明.

2 随机变量独立性的定义

定义]

1[ 设),(Y X 为二维随机变量,若对于任意的实数y x ,,事件{}x X ≤与{}y Y ≤相互

独立,即

()()()y Y P x X P y Y x X P ≤?≤=≤≤,, )(1

则称X 与Y 相互独立.

若()y x F ,为X 与Y 的联合分布函数,()x F X 、()y F Y 分别是X 与Y 的边缘分布函数,则

)1(式等价于

()()()y F x F y x F Y X ?=,.

3 随机变量独立性的性质及其判别方法 3.1离散型随机变量独立性的判定

判别法一

定理1 设二维离散型随机变量()Y X ,的联合分布列为

()j i ij y Y x X P p ===,, () ,2,1;2,1==j i ,

X 的边分缘布列是

()i i x X P p ==?,() ,2,1=i ,

Y 的边缘分布列是

()j j y Y P p ==?,() ,2,1=j ,

则X 和Y 相互独立的充要条件为:对所有的取值()

j i y x ,有

() ,2,1;,2,1,==?=??j i p p p j i ij .

证明 充分性:若() ,2,1,,2,1,==?=??j i p p p j i ij ,因为()Y X ,是二维离散型随机变量,所以对任意的y x ,有

()()

,,()()

()()

i j i j i j i j ij i j x x y y

ij i j

x x y y

x x

y y

i j x x

y y

p P X x Y y P X x Y y p p p P X x P Y y P X x P Y y ≤≤??≤≤≤≤≤≤=≤≤=====?====≤≤∑∑∑∑∑∑∑∑

即X 和Y 相互独立.

必要性:若X 和Y 相互独立,不妨设

123123,i j x x x x y y y y <<<

<<<<<<<

,

则对任意y x ,,有

()()()y Y P x X P y Y x X P ≤?≤=≤≤,.

当11,y y x x ==时,有

()()()1111,y Y P x X P y Y x X P ≤?≤=≤≤,

()()()1111,y Y P x X P y Y x X P =?====,

亦即

1111???=p p p . )2(

如此进行下去,最后可得

() ,2,1,11=?=??j p p p j j .

如此下去,最后得出.

() ,2,1,,2,1,==?=??j i p p p j i ij .

由此定理得证.

例1 设随机变量X 和Y 相互独立,并且有

{}{}p Y P X P ====11,{}==0X P {}q p Y P =-==10,10<

定义随机变量ζ为

?

?

?++=.0,1为奇数若,为偶数;

若Y X Y X ζ

问当p 取何值时,X 和ζ相互独立?

解 由于

{}{}{}0,01,11======Y X Y X ζ, {}{}{}0,11,00======Y X Y X ζ

,

所以

{}{}{}{}2111,11,1p Y P X P Y X P X P ==?=======ζ,

{}{}{}{}pq Y P X P Y X P X P ==?=======010,10,1ζ, {}{}{}{}2000,01,0q Y P X P Y X P X P ==?=======ζ,

{}{}{}{}pq Y P X P Y X P X P ==?=======101,00,0ζ.

由此得()ζ,X 的联合分布列及其边缘分布列如表1所示.

表 1

0 1

j p ?

pq 2q q 1

pq

2p

p

?i p

pq 2

22q p +

1

为使X 和ζ相互独立,有

ζ

X

()(

)222

2222,,2,.

pqq pq p q q q pqp pq p q p p =??+=?

?

=?

?+=? 由于10<

判别法二:设()Y X ,是二维离散型的随机变量,它的联合概率分布列为

()j i ij y Y x X P p ===,, () ,2,1,=j i 可以用下表所示

表 2

1y

2y

j y

1x 11p

12p

j p 1

2x 21p

22p

j p 2

i x 1i p

2i p

ij p

且∑∑=≥i

j

ij

ij p

p 1,

0,矩阵

??????

?

?

?

?=

ij i i j j p p p p p p p p p A 212222111211

称为()Y X ,的联合概率分布矩阵,其行向量记为

()() ,2,1,,,,,21==i p p p a ij i i i ,

记()Y X ,的联合分布列()A Y X ~,.

引理

]

7[ 设1α是非零向量,1α和2α线性相关,则2α可由1α线性表出.

证明 因为1α和2α线性相关,所以存在不全为零的两个数1λ和2λ,使02211=+ααλλ又因为1α是非零向量,如果02=λ,则01=λ,则02≠λ,所以

Y X

12

1

2ααλλ-

=, 即2α可由1α线性表出.

定理2 若()A Y X ~,,则X 与Y 相互独立的充要条件是联合概率矩阵的任意两个行向量(或列向量)线性相关.

证明 充分性:若A 中任意的两个行向量线性相关,由∑∑=≥i

j

ij

ij p

p 1,

0,则A 中至少

有一个元素不为零,即至少有一个非零行向量,不妨设1α是非零向量,由引理可知,2α

,3α ,,i α都可以由1α线性表示,则() ,2,1,1==i k i i αα,11=k ,且

???????

?

?

?=

j i i i j j

p k p k p k p k p k p k p k p k p k A 112111212211211121111, 这里() ,2,1,,1=?=j i p k p j i ij ,且

111∑∑∑∑∑∑===i

j

i

j

j i j

i i

j

ij

p k p k p .

又由于X ,Y 的边缘分布分别为:

()∑∑===j

j i j

ij i p k p x X P 1,

()∑∑∑?====i

i j i

j i i

ij j k p p k p y Y P 11,

因此

()()),

,(1111j i j

i

i

j j i i

i

j j

j i i

ij j

ij j i y Y x X P k p p k k p p k p p y Y P x X P ===?=?===?=∑∑∑∑∑∑

即X 与Y 相互独立.

必要性:若X 与Y 相互独立,由j i ij p p p ??=,则A 中的任意两个行向量可写为

()() ,,,,,,,,2121j m j m m m m p p p p p p p p p p ??????????==α, ()() ,,,,,,,,2121j n j n n n n p p p p p p p p p p ??????????==α,

显然m α与n α线性相关.

推论1 若()A Y X ~,,则X 与Y 相互独立的充要条件是矩阵A 的任意两行(或两列)对应元素成比例.

推论2 若()A Y X ~,,则X 与Y 不相互独立的充要条件是存在矩阵A 的任意两个行向量(或列向量)线性无关.

推论3 若()A Y X ~,,则X 与Y 不相互独立的充要条件是存在矩阵A 的任意两行(或两列)对应元素不成比例.

推论4 若()A Y X ~,,则X 与Y 相互独立的充要条件是矩阵A 的秩为1. 推论5 若()A Y X ~,,则X 与Y 不相互独立的充要条件是矩阵A 的秩大于1. 推论6 若()A Y X ~,中有某个0=ij P ,但元素ij P 所在的行与列的所有元素不全为零,则

X 与Y 不相互独立.

例2 从一只装有三个黑球和二个白球的口袋中取球两次,每次去一个球,设

???=.,1;,0第一次取出黑球第一次取出白球X ???=.,1;,0第二次取出黑球

第二次取出白球Y 分别在放回抽样和不放回抽样的试验条件下写出二维随机变量()Y X ,的联合分布列,并判别

X 与Y 的相互独立性.

解 1)放回抽样 二维随机变量()Y X ,的联合分布列为

表 3

0 1

0 254 256 1

256 25

9 且

???? ??→???? ??→?????

? ??=0032966425925

625625

4A , 因此()1=A r ,故X 与Y 相互独立.

2)不放回抽样 二维随机变量()Y X ,的联合分布列为

表 4

0 1

Y

X

Y

X

0 202 206 1

206 20

6 且

???? ??→???? ??→?????

? ??=1031666220620620620

2A , 因此()12>=A r , 所以X 与X 不相互独立.

3.2 连续型随机变量独立性的判定

判别法一

定理3 设()Y X ,是二维连续型随机变量,若它们的联合密度函数和边缘分布函数分别为

()()()y f x f y x f Y X ,,,,并且都是除面积为零的区域外的连续函数,则X 和Y 相互独立的充要

条件为:除面积为零的区域外,恒有

()()()y f x f y x f Y X ?=,.

证明 充分性:设()()()y f x f y x f Y X ?=,,则对任意的实数y x ,,有

()()()()?

???

∞-∞-∞-∞

-==x

y x y

Y X u v v f u f u v v u f y x f d d d d ,,

()()()()y f x f v v f u u f Y X y Y x

X ==

??

-∞

-d d .

所以,X 和Y 相互独立.

必要性:设X 和Y 相互独立,则有

()()()()()??

??∞

-∞

∞-∞

==y

Y X Y

X

x y v v f u u f y f x f u v v u f d d d d ,x

--

()()??

∞-∞

-=

x y

Y X u v u f u f d d .

因为上式对任意的y x ,都成立,于是有()()()y f x f y x f Y X ?=,,综上,定理得证.

例3

]

1[ 若()Y X ,的联合密度函数为

()8,0,01;

,0,

xy x y y f x y ≤≤≤≤?=?

?其他. 问X 和Y 是否相互独立?

解 先分别求X 和Y 的边缘密度函数: 当0x 时,()0=x f X .当10≤≤x 时,有

()31

44d 8x x y xy x f x

X -==?.

因此

()?

?

?≤≤-=.,0;

10,443其他x x x x f X 当0y 时,()0=y f Y .当10≤≤y 时,()3

048y dx xy y f y

Y ==?.

因此

()?

??≤≤=.,0;10,43其他y y y f Y

很明显,()()()y f x f y x f Y X ≠,,所以X 和Y 不相互独立.

判别法二 定理]

2[4

设),(Y X 是连续型随机变量, 其联合密度函数为

??

?≤≤≤≤=.,

0;

,),,(),(其他d y c b x a y x f y x F 则随机变量相互独立的充要条件为

(i) 存在连续函数)(),(y g x h 使)()(),(y g x h y x f =. (ii) d c b a 、、、 是分别与y x 、 无关的常数.

证明 充分性: 首先分别求随机变量),(Y X 对y x 、 的边缘密度函数.

??????∞

-∞∞-======b a

b

a

Y d c

d

c

X dx x h y g dx y g x h dx y x F y f dy y g x h dy y g x h dy y x F x f .

)()()()(),()(,

)()()()(),()(

d c b a 、、、是分别与y x 、 无关的常数, 所以上式积分中的结果?d c dy y g )( 与?b

a dx x h )(

是分别与y x 、 无关的常数, 分别记为B A 、 进一步由联合密度函数的性质,有

(,)()()()()()()()()()()(,)

b d

b

d

a

c

a

c

X Y b

d

a

c

f x y dxdy h x

g y dxdy

f x f y h x

g y AB

h x g y h x dx g y dy

f x y =====??

?

?

??

即)()(),(y f x f y x f Y X = 故Y X ,相互独立.

必要性: 若Y X , 相互独立, 有

)()(),(y f x f y x f Y X =, ,,d y c b x a ≤≤≤≤

取)()(),()(y g y f x h x f Y X ==, 则有)()(),(y g x h y x f =, 所以定理中的条件1) 成立. 以下用反证法证明,若d c b a 、、、中至少有一个是与x 或y 有关的函数,不妨设)(y a a =,由于

)()(x h x f X = 是关于x 的边缘密度函数, 必有1)(=?dx x f b a

X , 而)()(y Ag dx x f b

a

X =?是一

个与y 有关的不恒为1的y 的函数, 与前述结果矛盾.因此必有a 与y 无关,进一步可得

d c b a 、、、都应与y 无关, 从而必要性得以证明.

推论1 定理4 的条件中如果c a 、 有一个或两个都趋于d b 、,∞- 中有一个或两个都趋于∞+,则定理的结果也成立.

推论2 若上述定理的条件成立, 则)(x h 与)(x f X 呈正比例关系,)(y g 与)(y f Y 呈正比例关系.

在n 维连续型随机变量场合, 我们有

定理5 设),,,(21n X X X 是连续型随机变量, 其联合密度函数为),,,(21n x x x f , 满足n i b x a x x x f i i i n ,,2,1,,0),,,(21 =≤≤> 则随机变量n X X X ,,,21 相互独立的充要条件为

(i) 存在连续函数n i x h i i ,,2,1),( =, 满足∏==n

i i

i

n x h x x x f 1

21)(),,,( .

(ii))1(,n i b a i i ≤≤ 均为与n x x x ,,,21 无关的实常数.

证明 充分性: 设),,,(21n x x x f 满足条件(i)与(ii) , 则可求得)1(n i X i ≤≤ 的边缘分布函数为

1

1

1212

111

1()(,,,)()

()()

(),,

i n n

j j

X i n n

b b n n n

a a

b i i j j j i i i a j i n

f x f x x x dx dx dx h x h x dx dx h x h x dx a x b +∞

+∞

-∞-∞

≤≠≤===≤≤?

??

?

∏?

而当[]i i i b a x ,?时, n i x f i X i ,,2,1,0)( ==. 又因其中)1(,n i b a i i ≤≤均为与n x x x ,,,21 无关的实常数, 故上述积分j j b a j dx x h j

j

)(?

,n j ,,2,1 = 分别是与n x x x ,,,21 无关的实常

数, 故记为

,,,2,1,)(n j dx x h A j j b a j j j

j

==?

则当)1(n i b x a i i i ≤≤≤≤ 时, 有

1

1

2111221121))(,,,())(()()()()()(21-=-=∏∏==n n

i i n n n

i i n n n X X X A x x x f A x h x h x h x f x f x f n

其中

n n b a n b a b a n

i i dx x h dx x h dx x h A n

n

)()()(2221111

22

1

1

???

∏== ,

而n n b b a a ,,,,,11 与n x x x ,,,21 无关, 故(1) 式可合并为n 重积分, 即

1

),,,()()(212121111

1

1

112

2===???

??∏=n

b a b a n n

n n b a b a b a n

i i dx dx dx x x x f dx dx dx x h x h A n n

n

n

故),,,()()()(212121n n X X X x x x f x f x f x f n =,即n X X X ,,,21 相互独立.

必要性: 设n X X X ,,,21 相互独立, 则有

)()()(),,,(212121n X X X n x f x f x f x x x f n =

成立.

此时只须取n i x f x h i X i i i ,,2,1),()( ==, 故条件(i) 成立.

现假定条件(ii) 不成立, 则)1(,n i b a i i ≤≤中至少有一个是与n x x x ,,,21 有关的函数, 不妨设),,,(2111n x x x a a =, 由于)()(1111x h x f X = 是关于1X 的边缘密度函数, 则必有

.1)()(1

1

11

1

11111==??

b a X b a dx x f dx x h

而此时

),,,()(21)

,,,(111

2111n b x x x a X x x x Ag dx x f n =?

是关于n x x x ,,,21 的函数, 并非恒等于1. 这于上式相矛盾, 因而必有1a 与n x x x ,,,21 无关. 同理证得)1(,n i b a i i ≤≤均与n x x x ,,,21 无关. 从而条件(ii) 满足. 必要性得证. 由上述连续型随机变量的定理4及其对应的推论进行判别X 与Y 的独立性,该定理的方便之处在于不需要求边缘分布函数,故用此方法判别连续型随机变量的独立性比较容易.

例4 设()Y X ,的联合密度函数为

()2222

122,,0;,220,

.x ny n

n n y e x y f x y n π+--?

??? ?????-∞<<+∞<<+∞=???Γ ?

????

??其他 讨论Y X ,的独立性.

解 令

()()

2222

122222x

n

ny n n h x e g y y e n π---?? ???==???Γ ?

??

,,

则有()()()y g x h y x f ?=,,又因为∞→=∞→∞→d c b a ,0,,,由推论7可知Y X ,相互独立.

4 随机变量独立性的应用

应用一 由离散型随机变量的独立性及其边缘分布列,求其联合分布列.

例5 n 重贝努里试验中,若令i X 表示第i 次试验中事件A 出现的次数).,,2,1(n i =请写出),,,(21n X X X 的联合分布列.

解 ),,2,1(.

,0,1n i A i A i X i =???=不出现次试验第出现;

次试验第令

其分布列为

).,,2,1)(1,0()(1n i x q p x X P i x x i i i i ====-

由试验的独立性知,n X X X ,,,21 相互独立,得出),,,(21n X X X 的联合分布列为

).1,0(),,,(1

1

2211=∑∑

======-

i x n x n n x q

p

x X x X x X P n

i i

n

i i

应用二 利用离散型随机变量的独立性确定分布中的参数. 例6 设二维随机变量),(Y X 的联合分布律为

1x 2x 3x

1y

a

91 c

2y

9

1 b

3

1 Y

X

若X 与Y 相互独立,求参数c b a 、、的值.

解 由随机变量的独立性及联合分布律的基本性质:

??

??

???

==?====≥??∑∑)

,2,1;,2,1(;1),2,1;,2,1(0 j i p p p p j i p j i ij i j ij ij 得出X 与Y 的边缘分布律:

1x 2x 3x

j P ?

1y

a

91 c

91

1++=?c a p

2y

9

1 b

3

1 3

1912++

=?b p ?i p

9

1

1+=?a p

9

1

2+=?b p

3

1

3+=?c p

∑∑===313

1

1i j ij

p

从而解得

???

?

?

???

?===6192181c b a 注意 求出c b a 、、后,要验证它们对任意j i ,是否均满足.j i ij p p p ???=若不满足,则所求参数不符合要求,舍去.通过验证上面所求得的c b a 、、的值均满足条件,故上面

c b a 、、的值为所求.

应用三 利用连续型随机变量的独立性求常用分布函数的联合概率密度.

例7 设随机变量X 和Y 相互独立,并且X 服从),(2

σμN ,Y 在],[b b -上服从均匀分布,求),(Y X 的联合概率密度函数.

解 因为X 和Y 相互独立,所以

)()(),(y f x f y x f Y X =.

);(,21

)(2

22)(+∞<<-∞=--x e

x f x X σμσ

π

?????≤≤-=.,

0,

,21

)(其他b y b b y f Y

得:

Y

X

,2121),(2

22)(σμσ

π--

?=

x e b y x f

其中.,b y b x ≤≤-∞<<∞-当b y >时,.0),(=y x f

应用四 随机变量的独立性与实际生活相结合

例8 一负责人到达办公室的时间均匀分布在12~8时,他的秘书到达办公室的时间均匀分布在9~7时,设他们到达的时间相互独立求他们到达办公室的时间相差不超过5分钟的概率

.

解 如图所示,设负责人和他秘书到达办公室的时间分别记为X 和Y ,则X 和Y 的概率密度分别为

11,812;,79;

() ()420,.0,

.X Y x y f x f y ??<<<

由于X 和Y 相互独立,得),(Y X 的概率密度为

?????<<<<==.,

0;

97,128,81

)()(),(其他y x y f x f y x f Y X

G G S dxdy y x f Y X P ?==????

??

≤-??81),(121

6

1

'=

-=??C AB ABC G S S S . 于是

48181121=

?=?

?????

≤-G S Y X P 所以他们到达办公室的时间之差不超过5分钟的概率是

.48

1

结 束 语

本论文在随机变量独立性定义的基础上讨论了随机变量独立性的性质,并分别对离散型随机变量和连续型随机变量用多种方法进行判定,最后通过随机变量独立性的相关应用说明其在生活中的重要性,从而让人们更深入的认识概率论的思想和方法,更好的解决我们身边的实际问题.除此之外,随机变量的独立性还可以和其他数学分支紧密结合,以便很好地解决数学问题.

参考文献

[1] 缪铨生.概率论与数理统计[M].上海:华东师范大学出版社,2006.

[2]毛纲源.概率论与数理统计解题方法技巧归纳[M].武汉:华中理工大学出版社.1999.

[3]魏宗舒等.概率论与数理统计教程[M].北京:高等教育出版社,1983.

[4]王梓坤.概率论基础及其应用[M].北京:科学出版社,1997.

[5]严士健等.概率论与数理统计[M].北京:北京师范大学出版社,1998.

[6]钟开莱著.吴让泉译.概率论教程[M].上海:上海科技出版社.

[7]明杰秀等.二维随机变量独立性的判定及其应用[J].高等函授学报(自然科学版),2011.

[8] Rick Durrett.Probability Theory and Examples[M].Springer-verlag Berlin Heidelberg,New York,2005.

About independent random variables and its application

Author: Zhang Lirong Supervisor: Gui Chunyan

Abstract The independence of the random variables is an important concept in probability theory. The paper first introduces the definition and the nature of independent random variables, then it gives different discriminant methods of the independence of the discrete random variable and continuous random variable, according to the different problems using the method to determine the corresponding discriminant. In addition , it also gets some relevant inference by the nature and the determination of the independence of random variables. At last it gives some examples of its application.

Keywords Discrete random variables Continuous random variables Independence Joint distribution

随机变量独立性的判断方法探究

1 引言 概率与统计是研究随机现象统计规律的一门数学学科,是对随机现象的统计规律进行演绎和归纳的科学.随着社会的不断发展,概率与统计的知识越来越重要,运用抽样数据进行推断已经成为现代社会一种普遍适用且强有力的思考方式.独立性[5]是随机变量非常重要的性质,其应用也很广泛.在解决很多问题时都有随机变量独立这样的前提,只有这样问题才能得以解决或解决起来比较简单.众所周知,随机变量独立性的判定无论从理论还是在实践中都有着重要意义,因此寻找独立性判断方法显得尤为重要.不少的文献对此进行了深入的研究,给出了一些很好的判断方法[3],但到目前为止人们还没找到简便有效的方法,从而对其深入研究很有必要. 2 相关定义 定义1离散型随机变量 定义在样本空间Ω上,取值于实数域R ,且只取有限个或可列个值的变量()ξξω=,称做是一维(实值)离散型随机变量,简称离散型随机变量. 定义2 n 维离散型随机变量 设12,,,n ξξξ???是样本空间Ω上的n 个离散型随机变量,则称n 维向量(12,,,n ξξξ???)是Ω上的一个n 维离散型随机变量. 定义3 联合分布型 设(,)ξη是一个二维离散型随机变量,它们一切可能取值为(,),,1,2,i j a b i j =???,令 (,),,1 ,2,ij i j P P a b i j ξη====??? 称(,1 ,2,)ij P i j =???是二维离散型随机变量(,)ξη的联合分布列. 我们容易证明()(1,2,i i P a P i ξ?===???是ξ的分布列,同理有()(1 ,2,)j j P b P j η?===???是η的分布列,称,ξη的分布列是(,ξη)的联合分布列的边际分布列. 定义 4 离散型随机变量独立性 设离散型随机变量ξ的可能取值为(1,2,)i a i =???,η的可能取值为(1,2,)j b j =???,如果对任意的,i j a b ,有

8.4 列联表独立性分析案例(2)

8.4 列联表独立性分析案例(2) 一、教学目标 (一)知识目标 通过对典型案例(如“新药的副作用 ”“秃顶与患心脏病是否有关系”)的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。 (二)能力目标 让学生经历数据处理的过程,提高探索解决问题的能力。 (三)情感目标 通过独立性检验的基本思想的学习,让学生有真正对统计思维和确定思维差异的理解,体会到统计在现实生活的广泛应用。 二、教学重点 理解独立性检验的实施步骤 三、教学难点 理解独立性检验的实施步骤 四、教学过程 (一)引入课题 1.复习 A :独立性检验 B : () ()()()() 2 2 n ad bc k a b c d a c b d -= ++++ 2.独立性检验的思想(类似反证法) (二)案例讲解 了研究某种新药的副作用(如恶心等),给50位患者服用此新药,另外50位患者服用安慰剂,得到下列实验数据: 请问服用新药是否可产生副作用? 分析: 假定服用新药与产生副作用没有关联.那么,首先要给“没有关联”下一个“能够操作”的定义。根据直观的经验,在服用新药与产生副作用的情形下,这个定义可以是这样的:如果服用新药与产生副作用没有关联,就意味着,无论服用新药与否,产生副作用的概率都是一样的。就此例题而言: .19.0100 19)(== 全体实验者产生副作用 P , 3.050 15)(== 服用新药产生副作用 P 二者相差较大。由此可以推断,开始的假设是不成立的。也就是说,服用新药与产生副作用是有关联的。

由统计的常识知道,要求等号成立是非常苛刻的条件,实际上一般也是办不到的,我们所能追求的是在概率意义下的可靠性。对于上面的独立性问题,我们应当寻找一个适当的统计量,用它的大小来说明独立性是否成立。在统计中,我们引入下面的量 在前面的例 子中 a =15, b =35, c =4, d =46。注意到独立性要求: P (全体生实验者产生副作用)=P (服用新药产生副作用) 即 b a a n c a += + 这等价于 n a n c a n b a = +? + 因此,可以用n c a n b a n a +? +- 的大小来衡量独立性的好坏。 问题: (1)用 n c a n b a n a +?+- + n d b n b a n b +?+- + n c a n d c n c +? +- + n d b n d c n d +? +- 是不是更好些? (2)用n c a n b a n c a n b a n a +?++?+- | | 比用n c a n b a n a +? +-合理,你认为有道理吗? (3)为了得到统计量的近似的分布,统计学家最终选用了: Q 2 =?? ??? ? ??+?++?+-++?++?+-++?++?+-++?++?+-n d b n d c n d b n d c n d n d c n c a n d c n c a n c n d b n b a n d b n b a n b n c a n b a n c a n b a n a n 2222)()()()( 用它的大小来衡量独立性的大小,你能把它化简得到下式吗? ,) )()()(() (2 2 d b c a d c b a bc ad n Q ++++-= c +

独立随机变量期望和方差的性质

第七周多维随机变量,独立性 7.4独立随机变量期望和方差的性质 独立随机变量乘积的期望的性质: Y X ,独立,则()()() Y E X E XY E =以离散型随机变量为例,设二元随机变量(),X Y 的联合分布列() ,i j P X x Y y ==已知,则()()(),i j i j P X x Y y P X x P Y y ====?=, () 1,2,,; 1,2,,i m j n == ()() 11,m n i j i j i j E XY x y P X x Y y =====∑∑()() 11 m n i j i j i j x y P X x P Y y =====∑∑()() 1 1 m n i i j j i j x P X x y P Y y =====∑∑()() E X E Y =***********************************************************************独立随机变量和的方差的性质: Y X ,独立,则()()() Y Var X Var Y X Var +=+()()() 2 2 Var X Y E X Y E X Y ??+=+-+?? ()222E X XY Y =++()()()()22 2E X E X E Y E Y ??-++? ? ()()()()2 2 22E X E X E Y E Y =-+-()()()22E XY E X E Y +-()()()() 2 2 22E X E X E Y E Y =-+-()() Var X Var Y =+若12,,,n X X X 相互独立,且都存在方差,则()() 121 n m k k Var X X X Var X =+++=∑ ***********************************************************************利用独立的0-1分布求和计算二项分布随机变量()~,X b n p 期望和方差 我们在推导二项分布随机变量的方差时,已经利用了独立随机变量和的方差等于方差

高中数学 8_4 列联表独立性分析案例同步精练 湘教版选修2-31

高中数学 8.4 列联表独立性分析案例同步精练湘教版选修2-3 基础巩固 1在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( ) A.若χ2=6.64,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病 B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病 C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误 D.以上三种说法都不正确 2由下表中的数据计算χ2的值约为( ) A.9.45 B.6.08 C.1.78 D.0.01 3博士生和研究生毕业情况的一个随机样本给出了关于所获取的学位类别与学生性别的分类数据如下表,由表中的数据,可得( )

A .性别与获取学位类别有关 B .性别与获取学位类别无关 C .性别决定获取学位的类别 D .以上说法都不正确 4关于2×2列联表: 下列说法正确的是( ) A .表中的数据n 11,n 12,n 21,n 22可以取任意的正整数 B .n =n +1+n 2+ C .χ2= n n 11n 12-n 21n 222 n 1+n 2+n +1n +2 D .两个因素X ,Y 的值域分别为{A ,A },{B ,B } 5为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表: 药物效果与动物试验列联表 患病 未患病 总计 服用药 10 45 55 没服用药 20 30 50 总计 30 75 105 依据表中的数据求χ2≈________.(精确到0.01)

6为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射后14小时的结果如下表所示: 列联表独立性分析时的假设是______________________________. 7为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在现场时,990件产品中合格品有982件,次品有8件,甲不在现场时,510件产品中,合格品有493件,次品有17件.试用列联表独立性分析的方法对数据进行分析. 综合过关 8有人发现多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果: 则大约有________的把握认为多看电视与人变冷漠有关系.〔已知P(χ2≥10.828)≈0.001〕9某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:

(完整版)随机变量及其分布列与独立性检验练习题附答案

数学学科自习卷(二) 一、选择题 1.将三颗骰子各掷一次,记事件A =“三个点数都不同”,B =“至少出现一个6点”,则条件概率()P A B ,()P B A 分别是( ) A.6091,12 B.12,6091 C.518,6091 D.91216,12 2.设随机变量ξ服从正态分布()3,4N ,若()()232P a P a ξξ<-=>+,则a 的值为 A .73 B .53 C .5 D .3 3.已知随机变量ξ~)2,3(2N ,若23ξη=+,则D η= A . 0 B . 1 C . 2 D . 4 4.同时拋掷5枚均匀的硬币80次,设5枚硬币正好出现2枚正面向上,3枚反面向上的次数为ξ,则ξ的数学期望是( ) A .20 B .25 C. 30 D .40 5. 甲乙两人进行乒乓球比赛, 约定每局胜者得1分, 负者得0分, 比赛进行到有一人比对方多2分或打满6局时停止, 设甲在每局中获胜的概率为 23,乙在每局中获胜的概率为13 ,且各局胜负相互独立, 则比赛停止时已打局数ξ的期望()E ξ为( ) A .24181 B .26681 C .27481 D .670243 6.现在有10张奖券,8张2元的,2张5元的,某人从中随机无放回地抽取3张奖券,则此人得奖金额的数学期望为( ) A .6 B .395 C .415 D .9 7.一个篮球运动员投篮一次得3分的概率为a ,得2分的概率为b ,不得分的概率为c ,,,(0,1)a b c ∈,且无其它得分情况,已知他投篮一次得分的数学期望为1,则ab 的最大值为 ( ) A .148 B .124 C .112 D .16 8.位于数轴原点的一只电子兔沿着数轴按下列规则移动:电子兔每次移动一个单位,移动的方向向左或向右,并且向左移动的概率为 23,向右移动的概率为13,则电子兔移动五次后位于点(1,0)-的概率是 ( ) A .4243 B .8243 C .40243 D .80243

二维随机变量及独立性--教学设计

概率论与数理统计教学设计 课程名称概率论与数理 统计 课时100分钟 任课教师刘涛专业与班级财务管理B1601---B1606课型新授课课题二维随机变量及其分布 教材分析 “二维随机变量及其分布”属于教材第三章内容,位于教材的第75页至第93页.是在前一章“一维随机变量及其分布”的概念提出的基础上,对两个及两个以上的随机变量进行描述。可以说,二维随机变量及其分布是对前一章一维随机变量内容的总结以及综合应用。 学习目标 知识与技能 了解二维随机变量的背景来源; 了解二维随机变量的基本思想; 掌握二维随机变量的适用范围、基本步骤及其具体运 用。 过程与方法 通过日常生活中常常出现的实例的引入,引导学生分 析、解决问题,培养学生将实际问题转化为数学问题的 能力,培养学生提出、分析、理解问题的能力,进而发 展整合所学知识解决实际问题的能力。 情感态度与价 值观 通过介绍概率论与数理统计在实际生活中的运用,激发 学生自主学习的兴趣,也培养了学生的创新意识和探索 精神。 教学分析教学内容1.二维随机变量及联合分布函数定义 2.二维离散型随机变量及联合概率函数 3.二维连续型随机变量及联合概率密度 4.二维随机变量的边缘分布

5.随机变量的相互独立性 教学重点二维离散型、连续随机变量及其分布,相互独立性教学难点二维连续型随机变量及其分布 教学方法与策略 板书设计 前50分: 1.引例 3.二维离散变量 2.联合分布函数定义 4.二维连续变量 后50分: 5.边缘分布 6.相互独立性 教学时间设计 1.引导课题…………2分钟 2.学生活动…………3分钟 3.二维随机变量及联合分布函数定义……15分钟 4.二维离散型随机变量及联合概率函数……10分钟 5.二维连续型随机变量及联合概率密度……20分钟 6.二维随机变量的边缘分布……20分钟 7.随机变量的相互独立性……25分钟 8.课堂小结…………5分钟 教学手段多媒体播放教学视频、PPT演示与板书演练书写相结合。 教学进程 教学意图教学内容教学理念

最新应用SPSS软件进行列联表分析

应用SPSS软件进行列联表分析 在许多调查研究中,所得到的数据大多为定性数据,即名义或定序尺度测量的数据。例如在一项全球教育水平的研究中,调查了400余人的个人信息,包括性别、学历、种族等,对原始资料进行整理就可以得到频数分布表。 定义四个变量:gender(性别)、educat(学历)、minority(种族)、count(人数),其中前三个为分类变量,并且gender变量取值为0、1,标签值定义为:0表示female,1表示male;educat变量取值为1、2、3,标签值定义为:1表示学历低,2表示学历中等,3表示学历高;minority变量值为0、1,标签值定义为:0表示非少数种族,1表示为少数种族。下面做gender、educat、minority的三维列联表分析及其独立性检验。数据文件如图1所示。 图1 第一步:用“count”变量作为权重进行加权分析处理。从菜单上依次选Data--weight Cases 命令,打开对话框,如图2所示。

图2 点选Weight Cases by项,并将变量“count”移入Frequency Variable栏下,之后单击OK按钮。 第二步:从菜单上依次点选Analyze--Deseriptive Statistics--Crosstabs命令,打开列联分析对话框(Crosstabs),如图3所示。 图3 第三步:在Crosstabs对话框中,如图4将变量性别gender从左侧的列表框内移入行变量Row(s)框内,并将受教育年限编码后得到的学历变量educat移入列变量Column(s)框内(若

此时单击OK按钮,则会输出一个2*3的二维列联表)。这里要输出一个三维列联表,将变量种族minority作为分层变量移入Layer框中,并且可以勾选左下方的Display clustered bar charts项,以输出聚集的条形图,如图8图9所示。 图4 第四步:选择统计量,单击Cosstabs对话框下侧的Statistics按钮,打开其对话框,如图5 所示。 图5 在Statistics对话框内,勾选Chi-square项,以输出表2进行独立性检验。这里由于不是定距

随机变量独立性的性质

议随机变量独立性及其应用 作者:张利荣 指导老师:桂春燕 摘要 随机变量的独立性是概率论中的一个重要概念.本文首先介绍了随机变量独立性的定义, 随机变量独立性的性质,然后对离散型随机变量和连续型随机变量的独立性分别给出了不同的判别方法,从而针对不同的问题运用相应的判别方法进行判定,除此还通过随机变量独立性的性质及其判别方法得出了一些相关的推论,并对其应用进行了举例说明. 关键词 离散型随机变量 连续型随机变量 独立性 联合分布 1 引言 概率统计是研究随机现象中数量规律的一门数学学科,它是近代数学的重要分支,理论严谨、应用广泛,并且与其他学科互相渗透结合.概率论是对随机现象统计规律演绎的研究,由于随机现象的普遍性,使得其具有极其广泛的应用,特别是在科学技术、工农业生产等方面.独立性是概率统计中最基本的概念之一,无论在理论研究还是在实际应用中都具有特别重要的意义.概率论和数理统计已有的成果大部分都是在某种独立性的前提下才得到的.因而随机变量独立性的研究倍受重视. 随机变量独立性的研究一直经历着缓慢的发展过程.进入二十世纪九十年代后,随机变量独立性判定的研究进入了一个新的阶段.关于这方面的著作、文献逐渐多了起来,如文献[2]中毛纲源对随机变量独立性的判定进行了分析并举例说明;文献[7]中明杰秀等对二维随机变量独立性的判定及其应用等相关内容进行了论述.本文将在此基础上对随机变量独立性做一下详细、全面的论述,重点介绍离散型随机变量和连续型随机变量独立性的判定方法,并对随机变量的独立性的应用进行举例说明. 2 随机变量独立性的定义 定义]1[ 设),(Y X 为二维随机变量,若对于任意的实数y x ,,事件{}x X ≤与{}y Y ≤相互独立,即 ()()() y Y P x X P y Y x X P ≤?≤=≤≤, , )1( 则称X 与Y 相互独立. 若()y x F ,为X 与Y 的联合分布函数,()x F X 、()y F Y 分别是X 与Y 的边缘分布函数,则 )1(式等价于 ()()()y F x F y x F Y X ?=,. 3 随机变量独立性的性质及其判别方法

随机变量的独立性判别

分类号:密级: 毕业论文 (本科生) 论文题目(中文)随机变量的独立性判别 论文题目(外文)The discrimination of the independence of random variables 学生姓名 导师姓名、职称 学生所属学院 专业 年级

诚信责任书 本人郑重声明:本人所呈交的毕业论文(设计),是在导师的指导下独立进行研究所取得的成果。毕业论文(设计)中凡引用他人已经发表或未发表的成果、数据、观点等,均已明确注明出处。除文中已经注明引用的内容外,不包含任何其他个人或集体已经发表或在网上发表的论文。 本声明的法律责任由本人承担。 论文作者签名:日期: 关于毕业论文(设计)使用授权的声明本人在导师指导下所完成的论文及相关的职务作品,知识产权归属兰州大学。本人完全了解兰州大学有关保存、使用毕业论文的规定,同意学校保存或向国家有关部门或机构送交论文的纸质版和电子版,允许论文被查阅和借阅;本人授权兰州大学可以将本毕业论文的全部或部分内容编入有关数据库进行检索,可以采用任何复制手段保存和汇编本毕业论文。本人离校后发表、使用毕业论文或与该论文直接相关的学术论文或成果时,第一署名单位仍然为兰州大学。 本毕业论文研究内容: √可以公开 □不易公开,已在学位办公室办理保密申请,解密后适用本授权书。 (请在以上选项内选择其中一项打“√”)

论文作者签名:导师签名:日期:日期:

随机变量的独立性判别 摘要 随机变量独立性的判别历来都是高等学校概率论与数理统计教学的一个课题, 通过研究文献资料,理解随机变量及其独立性的相关概念,对离散型和连续型随机变量综合列举的几种常见求法,讨论几种常见的随机变量独立性判别方法 并对其进行概括、总结,加深自己对随机变量及其分布的理解,争取有新的发现。 关键词:随机变量独立性连续型离散型判别方法

随机变量的独立性

第三章多元随机变量 3.1 二维随机向量及其分布函数 3.2 二维离散随机向量 3.3 二维连续随机向量 3.4 边缘分布 3.5 条件分布 3.6 随机变量的独立性 3.7 随机向量函数的分布 3.8 n维随机向量函数的分布(不讲)

§3.6 随机变量的独立性 事件A 与 B 独立的定义是: 若 P (AB ) = P (A )P (B ),则称事件A 与B 相互独立 。 设 X , Y 是两个随即变量, 对任意的 x , y , 若 , )( )() ,(y Y P x X P y Y x X P ≤≤=≤≤则称 X 与Y 相互独立。 用联合分布函数与边缘分布函数表示上式, 就是 . )( )(),(y F x F y x F Y X =,,x y ?

P70例3.6.2:P61例3.4.3:设(X ,Y )服从单位圆域 x 2+y 2≤1上的均匀分布。已求得X 和Y 的边缘概率密度如下, ?? ?? ??∈=.),( 0,),( 1 ),(D y x D y x y x f ,, π解:因2 21,[1,1], ()0,[1,1];X x x f x x π ??∈???=? ????? ?? ?? ????∈?=].1,1[,0],1,1[,12)(2y y y y f Y π ,)x y D ∈(时, 故,X 和Y 不相互独立。 问X 与Y 的独立性。 ()() X Y f x f y 222211x y π π???? ??=????????,,(,)()() X Y x y f x y f x f y ?=连续型X 与Y 相互独立 ?1π≠(,)f x y = ,[1,1]x y ∈?,

第12章 列联表和对应分析

第十二章 列联表和对应分析 我们前面介绍的相关分析可以用来分析定量变量之间的关系,但不能用于定性变量的分析。本章介绍的列联表检验和对应分析方法则可以用来分析定性变量之间的关系。 第一节 列联表与独立性检验 【例12.1】美国的一般社会调查(General Social Survey )是由美国芝加哥大学的民意调查中心进行的一项随机抽样调查,调查对象为18岁以上的成年人。调查中获得了居民的婚姻状况和幸福状况方面的数据。下面我们根据1996年的调查结果来分析两个变量之间的关系(数据文件gss96.sav )。在调查中,婚姻状况的取值为已婚、丧偶、离异、分居和未婚(分别用1-5表示);幸福状况的取值为:非常幸福、比较幸福和不太幸福(分别用1-3表示)。在SPSS 软件中打开数据文件,选择“分析”→“描述统计”→“交叉表”,把“婚姻状况”设为行变量,把“幸福状况”设为列变量,可以得到表12-1所示的列联表。从表中我们可以看出,从婚姻状况看,已婚人员的比重最高;从幸福状况看,比较幸福的人员比重最高。但从表中我们很难直观地看出两个变量之间的内在联系。 表12-1 婚姻状况和幸福状况列联表 幸福状况 合计 非常幸福 比较幸福 不太幸福 婚姻状况 已婚 574 726 82 1382 丧偶 70 149 59 278 离异 83 292 79 454 分居 14 73 30 117 未婚 136 419 99 654 合计 877 1659 349 2885 要研究二维列联表中的两个变量是否相互独立,可以使用我们在非参数检验中讲过χ2 检验。检验的零假设和备择假设为 H 0:婚姻状况和幸福状况这两个变量相互独立;H 1:婚姻状况和幸福状况不相互独立。 假定样本量为n ,列联表有r 行、s 列,表中各行的合计值分别为r i R i ,,2,1,Λ=,各列的合计值分别为s j C j ,2,1,Λ=。每个单元格中的频数为j i O ,。在零假设成立,即行变量和列变量相互独立时,每个单元格频数的期望值可以按照式(12-1)计算: n C R n n C n R E j i j i ij ?= ??= (12-1) 显然,如果期望频数ij E 和观测频数ij O 相差不大,则零假设可能是正确的;如果二者差别很大,则零假设可能不成立。按照式(12-2)构造检验统计量:

《8.4 列联表独立性分析案例》教案

《4.3 列联表独立性分析案例》教案 教学目标 (一)知识与技能:通过本节知识的学习,了解独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确的判断。明确对两个分类变量的独立性检验的基本思想具体步骤,会对具体问题作出独立性检验。 (二)过程与方法: 在本节知识的学习中,应使学生从具体问题中认识进行独立性检验的作用及必要性,树立学好本节知识的信心,在此基础上学习三维柱形图和二维柱形图,并认识它们的基本作用和存在的不足,从而为学习下面作好铺垫,进而介绍K的平方的计算公式和K的平方的观测值R的求法,以及它们的实际意义。从中得出判断“X与Y有关系”的一般步骤及利用独立性检验来考察两个分类变量是否有关系,并能较准确地给出这种判断的可靠程度的具体做法和可信程度的大小。最后介绍了独立性检验思想的综合运用 (三)情感、态度与价值观:通过本节知识的学习,首先让学生了解对两个分类博变量进行独立性检验的必要性和作用,并引导学生注意比较与观测值之间的联系与区别,从而引导学生去探索新知识,培养学生全面的观点和辨证地分析问题,不为假想所迷惑,寻求问题的内在联系,培养学生学习数学、应用数学的良好的数学品质。加强与现实生活相联系,从对实际问题的分析中学会利用图形分析、解决问题及用具体的数量来衡量两个变量之间的联系,学习用图形、数据来正确描述两个变量的关系。明确数学在现实生活中的重要作用和实际价值。教学中,应多给学生提供自主学习、独立探究、合作交流的机会。养成严谨的学习态度及实事求是的分析问题、解决问题的科学世界观,并会用所学到的知识来解决实际问题。教学重点: 理解独立性检验的基本思想及实施步骤. 教学难点: K的含义. 了解独立性检验的基本思想、了解随机变量2 教学方法: 诱思探究教学法 学习方法: 自主探究、观察发现、合作交流、归纳总结。

二维随机变量及独立性教学设计

二维随机变量及独立性--教学设计

————————————————————————————————作者:————————————————————————————————日期:

概率论与数理统计教学设计 课程名称概率论与数理 统计 课时100分钟 任课教师刘涛专业与班级财务管理B1601---B1606 课型新授课课题二维随机变量及其分布 教材分析 “二维随机变量及其分布”属于教材第三章内容,位于教材的第75页至第93页.是在前一章“一维随机变量及其分布”的概念提出的基础上,对两个及两个以上的随机变量进行描述。可以说,二维随机变量及其分布是对前一章一维随机变量内容的总结以及综合应用。 学习目标 知识与技能 了解二维随机变量的背景来源; 了解二维随机变量的基本思想; 掌握二维随机变量的适用范围、基本步骤及其具体运 用。 过程与方法 通过日常生活中常常出现的实例的引入,引导学生分 析、解决问题,培养学生将实际问题转化为数学问题的 能力,培养学生提出、分析、理解问题的能力,进而发 展整合所学知识解决实际问题的能力。 情感态度与价 值观 通过介绍概率论与数理统计在实际生活中的运用,激发 学生自主学习的兴趣,也培养了学生的创新意识和探索 精神。 教学分析教学内容1.二维随机变量及联合分布函数定义 2.二维离散型随机变量及联合概率函数 3.二维连续型随机变量及联合概率密度 4.二维随机变量的边缘分布

5.随机变量的相互独立性 教学重点二维离散型、连续随机变量及其分布,相互独立性教学难点二维连续型随机变量及其分布 教学方法与策略 板书设计 前50分: 1.引例 3.二维离散变量 2.联合分布函数定义 4.二维连续变量 后50分: 5.边缘分布 6.相互独立性 教学时间设计 1.引导课题…………2分钟 2.学生活动…………3分钟 3.二维随机变量及联合分布函数定义……15分钟 4.二维离散型随机变量及联合概率函数……10分钟 5.二维连续型随机变量及联合概率密度……20分钟 6.二维随机变量的边缘分布……20分钟 7.随机变量的相互独立性……25分钟 8.课堂小结…………5分钟 教学手段多媒体播放教学视频、PPT演示与板书演练书写相结合。 教学进程 教学意图教学内容教学理念

随机变量独立同分布的概念

1、随机变量独立同分布的概念 随机变量X1和X2独立,是指X1的取值不影响X2的取值,X2的取值也不影响X1的取值。随机变量X1和X2同分布,意味着X1和X2具有相同的分布形状和相同的分布参数,对离散型随机变量具有相同的概率函数,对连续型随机变量具有相同的概率密度函数,有着相同的分布函数,相同的均值、方差与标准差。 反之,若随机变量X1和X2是同类型分布,且分布参数全相同,则X1和X2一定同分布。 一般来说,在相同条件下,进行两次独立试验,则这两次实验结果所对应的随机变量是独立同分布的。 比如,将一枚质地均匀的硬币抛掷两次,设X1为第一次抛掷硬币的结果,X2为第二次抛掷硬币的结果。显然,第一次抛掷硬币的结果对第二次的结果没有影响,反之亦然,故X1和X2相互独立。 同时,X1和X2都只有两种试验结果:正面朝上和背面朝上,以0代表正面朝上,1代表背面朝上,则 P(X1=0)=P(X2=0)=0.5, P(X1=1)=P(X2=1)=0.5, 故X1和X2是独立同分布的随机变量。 随机变量独立同分布的特性可以推广到三个或更多个随机变量。 2、独立同正态分布(定理1) 3、独立同分布(定理2——中心极限定理) 当的分布对称时,只要n 5,那么,近似效果就比较理想;当的分布非对称时,要求n 值较大,一般n 30近似效果较理想。 这个定理表明:无论随机变量服从何种分布,可能是离散分布,也可能是连续分布,连续分布可能是正态分布,也可能是非正态分布,只要独立同分布随机变量的个数n较大,那么,随机变量之和的分布、随机变量均值X-的分布都可以近似为正态分布。这一结论意义深远。 4、标准误 统计学中把均值X-的标准差称为均值的标准误,记为,无论是正态还是非正态,均值X-的标准误都有 SEM随着n的增加而减少。 常常对一个零件的质量特性只观测一次,就用该观测结果去估计过程输出的质量特性。这里建议一种简单有效的减少测量系统误差的方法。对同一个零件的质量特性作两次或更多次重复测量,用其观测结果的平均值去估计过程输出的质量特性,就可以减少标准差。当然,这不是回避使用更精确量具的理由,而是一种提高现有量具精度的简易方法,多次测量值的平均值要比单次测量值更精确。

8.4 列联表独立性分析案例(3)教学设计

8.4 列联表独立性分析案例(3) 一、教学目标 (一)知识目标 通过对典型案例(如“色弱与性别是否有关”“中学生物理考试成绩和吃早点是否相关”)的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。 (二)能力目标 让学生经历数据处理的过程,会用所学知识对具体案例进行检验,提高探索解决问题的能力。 (三)情感目标 从实例中发现问题,提高学习兴趣,激发学习积极性和主动性,不断自我完善,养成不断探求知识完善自我的良好态度。 二、教学重点 进一步理解独立性检验的实施步骤 三、教学难点 对临界值的理解作出判断 四、教学过程 (一)引入课题 独立性检验的步骤。 1.若要推断的论述为H1:“X与Y有关系”。可按如下步骤判断H1成立的可能性。 A 通过三维柱形图和二维条形图,粗略判断两个分类变量是否有关系。 B 可以利用独立性检验来考察两个分类变量是否有关系。并能精确判断可靠程度。 2.由观测数据算2 χ,其值越大,说明“X与Y有关系”成立的可能性越大。 3.由临界值表确定可靠程度。 (二)案例讲解 分析:设从表格中提供的统计数据,可以计算得到如下数值: 男性所占百分比:13212 0.48 300 + =;女性所占百分比: 1515 0.52 300 + = 在这300人的样本中,男性色弱患者的百分比:12 0.04 300 ≈;女性色弱的百分比: 5 0.017 300 ≈ 直观上看,300人中男性色弱的比例高于女性(0.040.017 >)。色弱应该与性别有关。下面进一步运用独立性的概念进行检验。

从300人中随机选取一人,设1A 表示男性,2A 表示女性,1B 表示色觉正常,2B 表示色弱。则: 1()0.48P A =,2()0.52P A =,2125 ()0.06300 P B += ≈ P (此人为男性且色弱)=12()0.04P A B = 而12()()0.480.060.028P A P B =?= 显然1212()()()P A B P A P B ≠ P (此人为女性且色弱)=22()0.017P A B =, 22()()0.520.060.031P A P B =?= 显然2222()()()P A B P A P B ≠ 因此,1A 与2B 、2A 与2B 都不是独立的。即色弱与性别有关。 我们用2χ独立性检验的方法计算得: 2 4.006χ≈ 由于220.05 3.84χχ>=,所以认为色弱与性别有关。 (三)巩固练习 为考察高中生的性别与是否喜欢数学课程之关系,在某城市的某校高中生中随机抽取300名学生,如下列联表: 与是否喜欢数学课程之间有关系,为什么? 解:在假设“性别与是否喜欢数学课程之间没有:的前提下,K 2应该很小,并且 P (K 2≥3.841)≈0.05, 而我们所得到的K 2的观察值是≈κ4.513超过3.841,这就意味着“性别与是否喜欢数学课之间有关系”这一结论是错误的可能性约为0.05,即有95%的把握认为“性别与是否喜欢数学课程之间有关系”. (四)课堂小结 可以按如下步骤判断结论成立的可能性: 1.通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度。

数学:人教版选修2-3第二章离散型随机变量教案(2.2.2事件的相互独立性)

2.2.2事件的相互独立性 教学目标: 知识与技能:理解两个事件相互独立的概念。 过程与方法:能进行一些与事件独立有关的概率的计算。 情感、态度与价值观:通过对实例的分析,会进行简单的应用。 教学重点:独立事件同时发生的概率 教学难点:有关独立事件发生的概率计算 授课类型:新授课 课时安排:2课时 教 具:多媒体、实物投影仪 教学过程: 一、复习引入: 1 事件的定义:随机事件:在一定条件下可能发生也可能不发生的事件; 必然事件:在一定条件下必然发生的事件; 不可能事件:在一定条件下不可能发生的事件 2.随机事件的概率:一般地,在大量重复进行同一试验时,事件A 发生的频率 m n 总是接近某个常数,在它附近摆动,这时就把这个常数叫做事件A 的概率,记作()P A . 3.概率的确定方法:通过进行大量的重复试验,用这个事件发生的频率近似地作为它的概率; 4.概率的性质:必然事件的概率为1,不可能事件的概率为0,随机事件的概率为0()1P A ≤≤,必然事件和不可能事件看作随机事件的两个极端情形 5基本事件:一次试验连同其中可能出现的每一个结果(事件A )称为一个基本事件 6.等可能性事件:如果一次试验中可能出现的结果有n 个,而且所有结果出现的可能性都相等,那么每个基本事件的概率都是1n ,这种事件叫等可能性事件 7.等可能性事件的概率:如果一次试验中可能出现的结果有n 个,而且所有结果都是等可能的, 如果事件A 包含m 个结果,那么事件A 的概率()m P A n = 8.等可能性事件的概率公式及一般求解方法 9.事件的和的意义:对于事件A 和事件B 是可以进行加法运算的 10 互斥事件:不可能同时发生的两个事件.()()()P A B P A P B +=+ 一般地:如果事件12,,,n A A A 中的任何两个都是互斥的,那么就说事件12,,,n A A A 彼此互斥 11.对立事件:必然有一个发生的互斥事件.()1()1()P A A P A P A +=?=- 12.互斥事件的概率的求法:如果事件12,,,n A A A 彼此互斥,那么 12()n P A A A +++ =12()()()n P A P A P A +++

2019年数学2-3讲义+第8章 8.4 列联表独立性分析案例

8.4列联表独立性分析案例 [读教材·填要点] 1.列联表 一般地,对于两个因素X和Y,X的两个水平取值:A和A(如吸烟和不吸烟),Y也有两个水平取值:B和B(如患肺癌和不患肺癌),我们得到下表中的抽样数据,这个表格称为2×2列联表. 2.χ2的求法 公式χ2=n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) . 3.独立性检验的概念 用随机变量χ2研究两变量是否有关的方法称为独立性检验.4.独立性检验的步骤 要判断“X与Y有关系”,可按下面的步骤进行: (1)提出假设H0:X与Y无关; (2)根据2×2列联表及χ2公式,计算χ2的值; (3)查对临界值,作出判断. 其中临界值如表所示: 表示在H0成立的情况下,事件“χ2≥x0”发生的概率.5.变量独立性判断的依据

(1)如果χ2 >10.828时,就有99.9%的把握认为“X 与Y 有关系”; (2)如果χ2>6.635时,就有99%的把握认为“X 与Y 有关系”; (3)如果χ2>2.706时,就有90%的把握认为“X 与Y 有关系”; (4)如果χ2≤2.706时,就认为没有充分的证据显示“X 与Y 有关系”,但也不能作出结论“H 0成立”,即X 与Y 没有关系. [小问题·大思维] 1.利用χ2进行独立性分析,估计值的准确度与样本容量有关吗? 提示:利用χ2进行独立性分析,可以对推断的正确性的概率作出估计,样本容量n 越大,这个估计值越准确.如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性. 2.在χ2运算后,得到χ2的值为29.78,在判断因素相关时,P (χ2≥6.64)≈0.01和P (χ2≥7.88)≈0.005,哪种说法是正确的? 提示:两种说法均正确.P (χ2≥6.64)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两因素相关;而P (χ2≥7.88)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两因素相关. [例1] 数据: [解] 由列联表中的数据,得χ2的值为 χ2 =1 633×(30×1 355-224×24)2 254×1 379×54×1 579 ≈68.033>6.635. 因此,有99%的把握认为每一晚打鼾与患心脏病有关系. 解决一般的独立性分析问题,首先由所给2×2列联表确定a ,b ,c ,d ,a +b +c +d 的值,然后代入随机变量的计

北邮概率论与数理统计3.3随机变量的独立性

§3.3随机变量的独立性 随机变量的独立性 我们可利用事件间的独立性的定义给出随机变量间的独立性之概念。 随机变量X 和Y 相互独立,如果对于任意有关X 的事件和有关Y 的事件都相互独,换言之,对于任意两个实数集I 和J ,有 },{J Y I X P ∈∈}{}{J Y P I X P ∈∈= (1) 理论上可证明(其证明超出了我们的知识范围)(1)式成立当且仅当对),(,+∞-∞∈?y x ,有 },{y Y x X P ≤≤}(){y Y P x X P ≤≤=. 于是有以下定义。 定义 设二维随机变量),(Y X 的联合分布函数为),(y x F ,两个边际分布函数分别为)(x F X 和)(y F Y ,如果),(,+∞-∞∈?y x ,有 ),(y x F )()(y F x F Y X = (2) 则称Y X ,相互独立。 当),(Y X 为离散随机向量时,独立的条件(2)等价于等式 }{}{},{j i j i y Y P x X P y Y x X P ===== (3) 对所有的),(j i y x ),2,1,( =j i 成立。 当),(Y X 为连续随机向量时,独立的条件(2)等价于等式 )()(),(y f x f y x f Y X = (4) 几乎处处成立。 例3.3.1 设二维随机向量),(Y X 的联合分布函数为

???≥≥+--=λ-----其他 ,00,0,1),(y x e e e y x F xy y x y x , 则Y X ,相互独立的充要条件是0=λ。 例3.3.2 (续3.1.2)问X 与Y 是否相互独? 对于离散随机向量),(Y X ,若说明X 与Y 不相互独立,则只需找一个数对),(j i y x ,使得}{}{},{j i j i y Y P x X P y Y x X P ==≠==;若要说明X 与Y 相互独立,则需要验证,对),(Y X 所有可能取的数对),(j i y x ,都有}{}{},{j i j i y Y P x X P y Y x X P =====, 2,1,=j i 。 例3.3.3 设二维随机向量),(Y X 的联合密度函数为 ???<<<<=其他 ,010,10,4),(y x xy y x f 判断X 与Y 的独立性。 解:由联合密可得两个边缘密度分别为 ?? ?<<==?∞+∞-其他,010,2),()(x x dy y x f x f X , ???<<==?∞+∞-其他 ,010,2),()(y y dx y x f y f Y 故有)()(),(y p x p y x p Y X =,y x ,?,所以X 与Y 相互独立。 在上例子中,),(Y X 的联合密度函数可以分解成两部分,其中一部分仅与x 有关,而另一部分仅与y 有关。一般地若),(Y X 的联合密度函数可以分解为 )()(),(y g x h y x p = 则X 与Y 的相互独立。 例3.3.4 设二维随机向量),(Y X 的联合密度函数为

第12章列联表和对应分析

第十二章 列联表和对应分析 我们前面介绍的相关分析可以用来分析定量变量之间的关系, 但不能用于定性变量的分 析。本章介绍的列联表检验和对应分析方法则可以用来分析定性变量之间的关系。 第一节 列联表与独立性检验 【例 12.1】美国的一般社会调查 ( General Social Survey )是由美国芝加哥大学的民意调 查中心进行的一项随机抽样调查,调查对象为 18 岁以上的成年人。调查中获得了居民的婚 姻状况和幸福状况方面的数据。下面我们根据 1996 年的调查结果来分析两个变量之间的关 系(数据文件 gss96.sav )。在调查中,婚姻状况的取值为已婚、丧偶、离异、分居和未婚 (分别用 1-5 表示);幸福状况的取值为:非常幸福、比较幸福和不太幸福(分别用 1-3 表 示)。在 SPSS 软件中打开数据文件,选择“分析” “描述统计” “交叉表”,把“婚 姻状况”设为行变量,把“幸福状况”设为列变量,可以得到表 12-1 所示的列联表。从表 中我们可以看出,从婚姻状况看,已婚人员的比重最高; 从幸福状况看,比较幸福的人员比 重最高。但从表中我们很难直观地看出两个变量之间的内在联系。 表 12-1 婚姻状况和幸福状况列联表 要研究二维列联表中的两个变量是否相互独立,可以使用我们在非参数检验中讲过 检验。检验的零假设和备择假设为 H 0:婚姻状况和幸福状况这两个变量相互独立; H 1:婚姻状况和幸福状况不相互独立。 假定样本量为 n ,列联表有 r 行、 s 列,表中各行的合计值分别为 R i ,i 1,2, ,r ,各列 的合计值分别为 C j , j 1,2 ,s 。每个单元格中的频数为 O i,j 。在零假设成立, 即行变量和列 变量相互独立时,每个单元格频数的期望值可以按照式( R i C j R i C j E ij n n n n E ij 和观测频数 O ij 相差不大,则零假设可能是正确的;如果二者差 12-1)计算: 12-1) 显然,如果期望频数 别很大,则零假设可能不成立。按照式( 12-2)构造检验统计量:

相关文档
最新文档