概率统计补充案例

概率统计补充案例
概率统计补充案例

补充案例:概率部分:

案例1、“三人行必有我师焉”

案例2、抓阄问题

案例3、贝叶斯方法运用案例介绍

案例4、化验呈阳性者是否患病

案例5、敏感性问题的调查

案例6、泊松分布在企业评先进中的应用

案例7、碰运气能否通过英语四级考试

案例8、检验方案的确定问题

案例9、风险型决策模型

案例10、一种很迷惑游客的赌博游戏

案例11、标准分及其应用

案例12、正态分布在人才招聘中的应用

案例13、预测录取分数线和考生考试名

统计部分:

案例14、随机变量函数的均值和标准差的近似计算方法案例15、如何表示考试成绩比较合理

案例16、如何估计湖中黑、白鱼的比例

案例17、预测水稻总产量

案例18、工程师的建议是否应采纳

案例19、母亲嗜酒是否影响下—代的健康

案例20、银行经理的方案是否有效

案例21、一元线性回归分析的Excel实现

案例22、方差分析的Excel实现

案例23、预测高考分数

案例24、两次地震间的间隔时间服从指数分布

案例1、“三人行必有我师焉”

我们可以运用概率知识解释孔子的名言“三人行必有我师焉”. 首先我们要明确一个问题,即只要在某一方面领先就可以为师(韩愈说“术业有专攻”). 俗语说“三百六十行,行行出状元”,我们不妨把一个人的才能分成360个方面。孔子是个大圣人,我们假设他在一个方面超过某个人的概率为99%,那么孔子在这方面超过与他“同行”的两个人的概率为99% ×99% =98.0l %,在360个方面孔子总比这两人强的概率为

(98.01%)360=0.07% ,即这两个人在某一方面可以做孔子老师的概率为99.93%.从数学角度分析,孔子的话是很有道理的. 案例2、抓阄问题

一项耐力比赛胜出的10人中有1 人可以获得一次旅游的机会,组织者决定以抓阄的方式分配这一名额. 采取一组10人抓阄,10张阄中只有一张写“有”. 每个人都想争取到这次机会,你希望自己是第几个抓阄者呢? 有人说要先抓,否则写有“有”的阄被别人抓到,自己就没有机会了;有人说不急于先抓,如果前面的人没有抓到写有“有”的阄,这时再抓抓到“有”的机会会大一些. 为了统一认识,用概率的方法构造一个摸球模型来说明问题.

摸球模型:袋中装有1 个红球和9 个黄球除颜色不同外球的大小、形状、质量都相同. 现在10 人依次摸球(不放回),求红球被第 k 个人摸到的概率( k = 1, 2, ?, 10).

解决问题 :设

k A = “

{

第 k 个人摸到红球

}, k = 1, 2, ?

, 10. 显然,红球被

第一个人摸到的概率为

101

)(1=

A P . 因为 12A A ?,于是红球被第二个人摸到的概率为 101

91109)()()()(121212=

?===A A P A P A A P A P .

同样,由

213A A A ?知红球被第三个人摸到的概率为

1018198109)()()()()(2131213213=

??=

==A A A P A A P A P A A A P A P .

如此继续,类似可得 )(4A P =

==ΛΛ)(5A P 101

)(10=A P . 由此可见,其结果与 k 无关,表明10 个人无论摸球顺序如何,每个人摸到红球的机

会相等. 这也说明10 个人抓阄,只要每个人在抓之前不知道他前边那些已经抓完的结果,无论先后, 抓到的机会是均等的. 在现实生活中单位分房、学生分班、短缺物品的分配等,人们常常乐于用抓阄的办法来解决,其合理性保证当然得归功于“概率”. 通过上面的摸球模型,我们总结出分配中的“抓阄”问题,无论先抓后抓, 结果是一样的.学完概率之后再遇到抓阄问题时不必争先恐后,我们要发扬风格让他人先抓.

案例3、贝叶斯方法运用案例介绍 什么是贝叶斯过滤器?

垃圾邮件是一种令人头痛的顽症,困扰着所有的互联网用户。

正确识别垃圾邮件的技术难度非常大。传统的垃圾邮件过滤方法,主要有"关键词法"和"校验码法"等。前者的过滤依据是特定的词语;后者则是计算邮件文本的校验码,再与已知的垃圾邮件进行对比。它们的识别效果都不理想,而且很容易规避。

2002年,Paul Graham提出使用"贝叶斯推断"过滤垃圾邮件。他说,这样做的效果,好得不可思议。1000封垃圾邮件可以过滤掉995封,且没有一个误判。

另外,这种过滤器还具有自我学习的功能,会根据新收到的邮件,不断调整。收到的垃圾邮件越多,它的准确率就越高。

建立历史资料库

贝叶斯过滤器是一种统计学过滤器,建立在已有的统计结果之上。所以,我们必须预先提供两组已经识别好的邮件,一组是正常邮件,另一组是垃圾邮件。

我们用这两组邮件,对过滤器进行"训练"。这两组邮件的规模越大,训练效果就越好。Paul Graham使用的邮件规模,是正常邮件和垃圾邮件各4000封。

"训练"过程很简单。首先,解析所有邮件,提取每一个词。然后,计算每个词语在正常邮件和垃圾邮件中的出现频率。比如,我们假定"sex"这个词,在4000封垃圾邮件中,有200封包含这个词,那么它的出现频率就是5%;而在4000封正常邮件中,只有2封包含这个词,那么出现频率就是0.05%。(【注释】如果某个词只出现在垃圾邮件中,Paul Graham 就假定,它在正常邮件的出现频率是1%,反之亦然。随着邮件数量的增加,计算结果会自动调整。)

有了这个初步的统计结果,过滤器就可以投入使用了。

贝叶斯过滤器的使用过程

现在,我们收到了一封新邮件。在未经统计分析之前,我们假定它是垃圾邮件的概率为50%。(【注释】有研究表明,用户收到的电子邮件中,80%是垃圾邮件。但是,这里仍然假定垃圾邮件的"先验概率"为50%。)

我们用S表示垃圾邮件(spam),H表示正常邮件(healthy)。因此,P(S)和P(H)的先验概率,都是50%。

然后,对这封邮件进行解析,发现其中包含了sex这个词,请问这封邮件属于垃圾邮件的概率有多高?

我们用W表示"sex"这个词,那么问题就变成了如何计算P(S|W)的值,即在某个词语(W)已经存在的条件下,垃圾邮件(S)的概率有多大。

根据条件概率公式,马上可以写出

公式中,P(W|S)和P(W|H)的含义是,这个词语在垃圾邮件和正常邮件中,分别出现的概率。这两个值可以从历史资料库中得到,对sex这个词来说,上文假定它们分别等于5%和0.05%。另外,P(S)和P(H)的值,前面说过都等于50%。所以,马上可以计算P(S|W)的值:

因此,这封新邮件是垃圾邮件的概率等于99%。这说明,sex这个词的推断能力很强,将50%的"先验概率"一下子提高到了99%的"后验概率"。

联合概率的计算

做完上面一步,请问我们能否得出结论,这封新邮件就是垃圾邮件?

回答是不能。因为一封邮件包含很多词语,一些词语(比如sex)说这是垃圾邮件,另一些说这不是。你怎么知道以哪个词为准?

Paul Graham的做法是,选出这封信中P(S|W)最高的15个词,计算它们的联合概率。(【注释】如果有的词是第一次出现,无法计算P(S|W),Paul Graham就假定这个值等于0.4。因为垃圾邮件用的往往都是某些固定的词语,所以如果你从来没见过某个词,它多半是一个正常的词。)

所谓联合概率,就是指在多个事件发生的情况下,另一个事件发生概率有多大。比如,已知W1和W2是两个不同的词语,它们都出现在某封电子邮件之中,那么这封邮件是垃圾邮件的概率,就是联合概率。

在已知W1和W2的情况下,无非就是两种结果:垃圾邮件(事件E1)或正常邮件(事件E2)。

其中,W1、W2和垃圾邮件的概率分别如下:

如果假定所有事件都是独立事件(【注释】严格地说,这个假定不成立,但是这里可以忽略),那么就可以计算P(E1)和P(E2):

又由于在W1和W2已经发生的情况下,垃圾邮件的概率等于下面的式子:

将P(S)等于0.5代入,得到

将P(S|W1)记为P1,P(S|W2)记为P2,公式就变成

这就是联合概率的计算公式。 最终的计算公式

将上面的公式扩展到15个词的情况,就得到了最终的概率计算公式:

一封邮件是不是垃圾邮件,就用这个式子进行计算。这时我们还需要一个用于比较的门槛值。Paul Graham 的门槛值是0.9,概率大于0.9,表示15个词联合认定,这封邮件有90%以上的可能属于垃圾邮件;概率小于0.9,就表示是正常邮件。 有了这个公式以后,一封正常的信件即使出现sex 这个词,也不会被认定为垃圾邮件了。 案例4、化验呈阳性者是否患病

在医疗中经常通过化验来诊断。当某人做癌症检查结果呈阳性时,他就患癌症了?其实不然。假设某一地区患有癌症的人占0.005,患者对一种试验反应是阳性的概率为0.95,正常人对这种试验反应是阳性的概率为0.04,现抽查了一个人,试验反应是阳性,问此人是癌症患者的概率有多大?

设C={抽查的人患有癌症},A={试验结果是阳性},则C 表示“抽查的人不患癌症”。已知()0.005P C =, ()0.995P C =,

()0.95

P A C =,

()0.04

P A C =。

由贝叶斯公式,可得

)

()()()()

()()(C A P C P C A P C P C A P C P A C P +=

代入数据计算得: P (C |A )= 0.1066 。在以上假设下,做癌症检查结果呈阳性的人确患癌症的概率为仅为0.1066,平均来说,1000个人中大约只有107人确患癌症。

这是不是意味着这种试验对于诊断一个人是否患有癌症没有意义呢?不是!如果不做试验,一人是患者的概率为0.005。若试验后得阳性反应,则此人是患者的概率为0.1066, 从0.005增加到0.1066,将近增加约21倍,说明这种试验对于诊断一个人是否患有癌症有意义。

案例5、敏感性问题的调查

学生阅读不健康书刊或录像会严重影响学生的身心健康. 但这些都是避着家长和教师进行的,属个人隐私行为. 我们如何设计一种调查方案,能够估计出大学生中看过不健康书刊或录像的人数的比率呢?

对这种敏感性问题的调查,被调查者会有一种顾虑,害怕调查者不能很好的保守秘密. 如果被调查者不愿意真实回答问题,将使调查数据失真,这样的统计结果将没有意义. 因此巧妙设计调查方案是获得真实数据的关键. 经过多年的研究和实践,一些统计学家和心理学家发明了一种能消除人们抵触情绪的“随机化应答”方法. 被调查者只需回答两个问题之一,而且只需回答“是”或“否”,设计的问题如下:

问题A :你的生日是否在 7月1日 之前? 问题B :你是否看过不健康书刊?

被调查者在没有外人的情况下,从一个装有黑球和白球的箱子中随机抽取一个球,看过颜色后又放回.若抽出白球则回答问题A ;若抽出黑球则回答问题B. 箱中黑球所占比率 α是已知的,即

{}P α=任意抽取一个是黑球, {}1P α

=-任意抽取一个是白球.

被调查者无论回答A 或B ,都只需在一张只有“是”、“否”两个选项的答案上做出选择,然后投入密封的投票箱内. 上述抽球和答卷都在无人的情况下进行,这样就可以消除被调查者的顾虑,从而可以保证答卷的真实可靠性.

打开投票箱进行统计,设共有 n 张有效答卷,其中 k 张选择“是”,那么可用频率 n

k

估计回答“是”的概率 ?为:

{}/P k n

?==答“是”.

回答“是”有两种情况:一种是摸到白球后对问题A 回答“是”,也就是被调查者 “生日在7月1日之前”的概率,一般认为这个概率是0.5,即 }{

0.5

P =答“是”抽白球;另一种是摸到黑球后对问题B 回答“是”,这个条件概率就是看不健康书刊的学生在参加调查的学生中的比率 p ,即

}{

P p

=答“是”抽黑球.

利用全概率公式得

{}{}}{{}}

{

P P P P P =?+?答“是”抽白球答“是”抽白球抽黑球答“是”抽黑球,

即 αα?p +-=)(

15.0. 由此可获得

/0.5(1)

k n p αα

--==

.

假设在一次实际调查中,箱子中共有50个球,其中30个是黑球,20个白球,则 6.0=α. 调查结束时共收到1583张有效答卷,其中有389张回答“是”,据此可估算出

0762

.06.04.021

1583389=?-=p .

这表明1583名学生中,约 62.7%的学生看过不健康书刊.

案例6、泊松分布在企业评先进中的应用

某工业系统在进行安全管理评选时,有两家企业在其它方面得分相等,难分高下。只剩下千人事故率这个指标,甲企业有2000人,发生事故率为0.005,即发生事故10起。乙企业有1000人,发生事故率也为0.005,即发生事故5起。那么,应该评选谁为先进企业呢?

显然,按事故数来评,则应评乙企业为先进。但甲企业不服。因为甲企业的事故数虽然是乙企业的2倍。但甲企业的人数正好是乙企业的2倍。按事故率来评,两企业应榜上有名。由于指标限制,只能评出一家企业,究竟评谁好呢? 可用泊松(Poisson )分布来解决这个问题。

统计资料表明:安全管理中的事故次数、负伤人数是服从泊松分布的。服从泊松分布的随机变量 X 取 k 值的概率为:

{}!

k

P X k e k λ

λ-==

其中 np λ=( n 为人数, p 为平均事故概率)

事件发生了至少

x 次的概率为

{}!

k

k x P X x e k λ

λ∞

-=≥=∑

若 0x =,上式 {0}1P X ≥=成为必然事件。

假设两厂均不发生事故得满分10分。两厂的均值分别为10与5,则两厂发生事故的概率为

105

105(),()!!k k P X k e P X k e k k --==

==乙甲

两厂的得分为

应评选乙企业为先进。

案例7、碰运气能否通过英语四级考试

大学英语四级考试是全面检验大学生英语水平的一种综合考试,具有一定难度.这种考试包括听力、语法结构、阅读理解、写作等.除写作占15分外,其余85道为单项选择题,每

道题附有A 、B 、C 、D 四个选项.这种考试方法使个别学生产生碰运气和侥幸心理. 那么,靠运气能通过英语四级考试吗?

答案是否定的. 下面我们计算靠运气通过英语四级考试的概率有多大. 假定不考虑写作所占的15分,若按及格为60分计算,则85道选择题必须要答对51道题以上才行,这可以看成是85重伯努利试验.

设随机变量X 表示答对的题数,则)25.0,85(~B X ,其分布律为:

()

8585()(0.25)0.75,0,1,2,,85

k

k

k P X k C k -===L

若要及格,必须51≥X

,其概率为

()

85

8512

85

51

(51)(0.25)0.758.7410k

k

k k P X C

--=≥=

≈?∑

此概率非常之小,故可认为靠运气通过英语四级考试几乎是不可能发生的事件,它相当于在1000亿个碰运气的考生中,只有0.874个人可以通过考试. 然而,我们地球上只有60多亿人口.

案例8、检验方案的确定问题

在某地区为了进行某种疾病普查,需要检验N 个人的血液,可用两种方法进行,方法(一):对每个人的血液逐个检验,这时需要检验N 次;方法(二):将N 个检验者分组,每组k 个人,把一组的k 个人抽出的血液混合在一起进行一次检验,如果检验结果为阴性,则说明这k 个人的血液均为阴性,这时这k 个人总共检验了一次;如果检验结果为阳性,为了明确这k 个人中哪些人为阳性,就要对这k 个人再逐个进行检验,这时这k 个人总共进行了 1 + k 次检验. 假设每个人的检验结果是否为阳性是独立的,且每个人为阴性的概率为q. 问哪种检验方法检验次数少些?

对方法(二),设每个人所需检验次数是一个随机变量X ,则X 的分布律为

????? ?

?-+

k k q q k k 1111 k q q k q k EX k k k 1

1)1)(11(1+-=-++=

那么,N 个人平均需要检验的次数为

)

1

1(k q N k +- 由此可知,适当选择k ,使得 1

k

k q 1>时,则N 个人的平均需要检验的次数小于N ,这时方法(二)比方法(一)检验次数少.

如果q 已知,还可以根据

k q EX k 1

1+

-=选出使其最小的整数 0k ,从而使得检验次数最少. 比如, 若需检验 1000人,且 9.0=q ,则 40

=k ,按方法(二)平均只需进行

检验 594

)41

9.01(10004=+-?次,这样可以减少约 40%的工作量,为检验工作节约大

量的人力、物力、财力.

案例9、风险型决策模型

决策是人们在政治、经济、军事和日常生活等多方面普遍存在的一种选择方案的行为.风险型决策是指在作出决策时,由于某些随机性的因素影响,决策因存在一定的风险,称为

风险型决策.

某渔船要对下个月是否出海打鱼作出决策. 如果出海后是好天,可获收益 5000元,若出海后天气变坏,将损失 2000元;若不出海,无论天气好坏都要承担 1000元损失费. 据预测下月好天的概率为 0.6,天气变坏的概率为0.4,应如何选择最佳方案?

我们将出海的收益作为随机变量

X ,其概率分布如下:

X 的数学期望为

22004.0)2000(6.05000=?-+?=EX (元) 显然出海的收益比不出海的收益好. 案例10、一种很迷惑游客的赌博游戏

在一个游客很多的旅游圣地,发现一类赌博游戏。形式是这样的:摊主(以下称赌主)拿着一个装有20个同样大小的玻璃球的小袋,玻璃球共有红、黄、蓝、白、黑5种颜色,每种颜色均为4个球。让游客(以下称赌客)从袋中任意摸出10个球。如摸到红球4个,黄球4个,白球2个,则数字排列为442(数字大者排前,小者排后),以摸到各种球组成的数不同球色数字排

4 4 2 4 3 3 4 4 1 1 4 2 2 2 4 3 1 1 1 3 3 3 1 2 2 2 2 2 4 3 2 1 4 2 2 1 1 3 3 2 2 3 3 2 1 1 3 2

2

2

1 输赢金额(元) +10 +5 +5 +

2 +2 +2 +1 +1 +0.5 +0.5 -2 -2.5 表面上看12中可能只有2中可能赌客输钱,似乎赌客赢钱的可能性大。也正是如此,很能吸引过往的旅客参赌。最后结果如何?若每天有100人参赌,则赌主每天能赢100来元。下面具体计算。

()i P x 表示摸到某球色数字排列

i x 的概率。由古典概率公式可得如下概率分布表

1020184756C =球色数字排列种类 组合种数

概率 ()p x 输赢金额 1(442)x

24412

54434180C C C C C = 0.0010 +10 2(433)x 1423354444480C C C C C = 0.0026 +5 3(4411)x

244211544344480C C C C C C =

0.0026 +5 4(4222)x 1432225444444320C C C C C C = 0.0234 +2 5(43111)x

141311154444445120C C C C C C C = 0.0277 +2 6(331)x 33311

544245120C C C C C = 0.0277 +2 7(22222)x

22222444447776C C C C C = 0.0421 +1 8(4321)x 1413121544434411520C C C C C C C = 0.0642 +1 9(42211)x

1422211544444417280C C C C C C C = 0.0935 +0.5 10(3322)x

23322254434417280C C C C C C =

0.0935

+0.5

由上表可得 赌客赢钱概率

1

()0.3765

i

i p x ==∑

赌客输钱概率

1112()()0.6235p x p x +=

当摸的次数很多时,赌主赢钱几乎是必然的。

设随机变量 X 为赌客每赌一次输赢的金额,则其数学期望为:

()100.001520.00262(0.023420.0277)1(0.04210.0624)0.520.093520.2494 2.50.3741

1.04E X =?+??+?+?+?++??-?-?=-

从整体上看赌客每赌一次平均输1.04元。如果每天有100人参赌,则赌主每天平均进帐104元。

案例11、标准分及其应用

原始分数不利于各科水平的横向比较和考试的评价分析. 一是其位置含义不明确. 原始分数是75分,这个分数是高还是低?该考生在全体考生中的位置靠前还是靠后?单从这个分数看不出来,因为没有一个稳定的参照点. 二是不可比. 原始分数往往受试题难度和区分度大小的影响,具有不稳定性. 题目难,原始分数就偏低;试题容易,分数就偏高,从而导致了原始分数之间的不可比性. 三是不可加. 各科原始分数、位置标准不一致,不可直接累加后比较,就像我们不能将甲乙两人口袋里的美元与港币数直接相加来比较哪个钱多一样.所以,在评价学生学业水平时,为了可比性,比较一学生几门课的情况、两个学生多科的总成绩等,可将卷面分转化为标准分来比较. 对一门课,比较标准分的大小;对多门课,比较

标准分总和. 标准分就是分数这个随机变量

X 的标准化:

DX EX X -.

由于标准分数分值小,并带有小数和负值,在许多情形下直接使用不大合乎人们的习惯,故通常根据具体情况,把标准分数通过线性变换化为各种导出分数. 常见的有: ①教育与心理测验中的分数:T=50+10Z

②韦氏智力量表中各分测验的量表分:T=10+3Z

③韦氏智力量表智商(离差智商):IQ=100+15Z

④美国大学入学考试委员会使用的标准分数:CEEB=500+100Z

⑤美国教育测验中心举办“托福”考试:TOEFL=500+70Z

⑥我国出国人员英语水平考试即EPT 所使用的分数:EPT=90+20Z

⑦五等级分数:由标准分的值按表4来分段确定等级。按此方式,40人的班,每次考试,不管原始分数如何,大约有3人(占7%)不及格。美国不少大学采用这种“竞争”的评分方式。

案例某公司准备通过考试招工 300 名。其中 280 名正式工,20 名临时工. 实际报考人数为 1657名. 考试满分400 分。考试不久后,通过当地新闻媒体得到如下消息:考试平

均成绩是166 分, 360 分以上的高分考生31 名. 某考生A 的成绩为 256分. 问他能否被录取?若被录取,能否是正式工?

我们用正态分布来解决这个问题. 先预测最低录取分数线,记最低录取分数为 0x 。设考生成绩为 X ,对一次成功的考试

来说,X 应服从正态分布,即 ),166(~2

σN X ,从而 )1,0(~166N X Y σ-= 由题设知 165731

)166

360()360(≈

->

=>σ

Y P X P

于是

981.01657311)166

360(

=-

≈-Φσ

。查正态分布表,得 08.2166

360≈-σ,

从而 93=σ。因此

)

93,166(~2N X .

因为最低录取分数线 0x 的确定,应使高于此线的考生的频率等于 1657300,即

1657300

)93166()(00≈->

=>x Y P x X P

819

.016573001)93166(0=-≈-Φx

于是 251,91.093166

00≈≈-x x .即最低录取分数线是251 分.

下面预测考生 A 的名次,其考分 256 = x .

831.0)93166

256()93166256()256(≈-Φ=-<

=

故 169.0831.01)256(=-≈>X P ,此表示成绩高于考生A 的人数约占总人数的 16.9%. 由 282169.01657≈?知考生A 大约排在 283名.

因为该考生的成绩是 256 分,大于录取分数限 251 分,因此该考生 A 能被录取. 但他的排名是283,排在280 名之后,所以他不能被录取为正式工,只能是临时工。 案例13、预测录取分数线和考生考试名次

当今社会,考试作为一种选拔人才的有效途径,正被广泛采用.每次考试过后,考生最关心的两个问题是:自己能否达到最低录取分数线?自己的考试名次如何?其实,学了概率之后我们可以通过二项分布来解决这些问题.

招工问题: 某公司通过招聘考试,准备招工300名(其中 280名正式工,20名临时工),而报考的人数是 1657名,考试满分为400分.考试后不久,通过当地新闻媒介得到如下信息:考试总评成绩是166分,360分以上的高分考生31名.某考生A 的成绩是256分,问他能否被录取?如被录取能否是正式工?

解决问题: 先来预测一下最低录取分数线,记该最低分数线为

0x .

设考生考试成绩为 ξ,则 ξ是随机变量,对于一次成功的考试来说, ξ应服从正态分布.本题中, ),166(~2

σξN ,则

)1,0(~166

N σξη-=

因为考试成绩高于360分的频率是 165731

,所以

165731)166

360()360(≈

->

=>σ

ηξP P .

于是

981.0165731

1)166

3600()3600(=-

≈-≤

≤=≤≤σ

ηξP P ,

查正态分布表知,

08

.2166

360≈-σ

,即 93≈σ.

所以 )93,166(~2

N ξ.

因为最低录取分数线 0x 有确定应使高于此线的考生的频率等于

1657

300

,即

1657300

)93166()(00≈->

=>x P x P ηξ,

所以

819.01657300

1)931660()0(00=-≈-≤

≤=≤≤x P x P ηξ.

查正态分布表,得 0166

0.911593x -≈,求得 0

250.77x ≈. 即最低录取分数线是251.

下面预测考生A 的考试名次.他的考分x=256,查正态分布表知,

166.0834.01)968.0(1)93166

256()256(=-≈Φ-=->

=>ηξP P .

这说明,考试成绩高于256分的频率是0.166,也就是说成绩高于考生A 的人数大约占总

人数的16.6%.所以,考试名次排在A 之前的人大约有

165716.6%275.06?=(名), 即考生A 大约排在第276名.

从以上分析得出:最低录取分数线为251分,低于考生A 的分数,所以,考生A 能被录取.但因其考试名次大约是276名,排在280名之前,所以,有可能被录取为正式工. 案例14、随机变量函数的均值和标准差的近似计算方法

在工程上,已知随机变量的均值和标准差,求随机变量函数的均值和标准差的近似方法主要有泰勒展开式、变异系数法、基本函数法. 例1 设 X 、 Y 的均值、标准差分别为

Y Y X X σμσμ,;,.找出函数 2)(X X f =均值、

标准差的近似计算公式.

对 2

)(X X f Z ==在 X X μ=

附近进行线性逼近:

)(2))(()()(2

X X X X X X X X f f X f μμμμμμ-+=-'+≈

所以

X

X X X X X X X X D X D σμσσμμμμ2,4)](2[)(22

222==-+=,

而 222)(2

X X X EX DX μσμ+=+= .

例2 设 X 、 Y 的均值、标准差分别为

Y Y X X σμσμ,;,。找出函数

Y X Y X g =

),(均

值、标准差的近似计算公式.

Y X

Y X g =

),(在 X X μ=附近进行线性逼近: ))(,())(,(),(),(Y Y X Y X Y X X Y X Y g X g g Y X g μμμμμμμμ-'+-'+≈

)()(12Y Y

X X Y Y X Y X μμμμμμμ---+=

所以 Y X Y X E μμ=)(,

242

22)(Y Y X Y X Y X D σμμμσ+=,即 2

1

22222)(1X Y Y X Y Y X σμσμμσ+=. 案例15、如何表示考试成绩比较合理

——TOEFEL 成绩是如何计算出来的 考试成绩是考生水平的反映,考试成绩的合理表示不但能反映考生的实际水平,而且还应该尽量减少因题目难易程度对考试成绩的影响。

目前,我国普遍采用百分制记分法、即满分设计为100分,考生在这 100分中所得分数即为他们的成绩。

这种记分法的主要缺点是分数受题目难易程度的影响很大,若考题容易,很可能大部分考生成绩都在80分以上,这样80分未必是好成绩。从这个角度看,百分制不能完全反映考生实际水平的高低.

采用排名次的方法,或者称为秩方法,对于评定考生间的相对成绩不失为一个好办法。 该方法将考生的成绩由低到高排列,考生所排位置成为该考生的秩,成绩越好的考生秩越大

(注意这与我们通常的考生的排名正好相反),而相同成绩的考生的秩规定为这几个考生在他们应排位置上的平均数.例如,某6位考生的考试成绩的百分制和秩方法有如下关系: 百分制 90 80 70 70 65 60 秩 6 5 3.5 3.5 2 1 其中两位考生的成绩相同,他们应排在3,4的位置上,从而他们的秩同为(3+4)/2=3.5。 秩方法也有其不足之处,由于秩的大小与考生人数有关,1000人中的第三和10人中的第三是难以比较的.

为了克服百分制和秩方法的不足,可以将百分制分数或秩改换为百分位.某考生的百分位是假定有l 00人参加考试时,成绩等于或小于该考生成绩的人数.若有4人参考,考生成绩的百分制及百分位有如下关系: 百分制 67 78 90 95 秩 l 2 3 4 百分位 25 50 75 100

又如,若有50人参考,某位考生的成绩是第11名,倒数是第40名,则他的百分位为80,也就是说,有80%同学的成绩不如他或和他持平。

百分制是将满分定位100,而百分位是将考生中的最好成绩定位100.具体算法为: 百分位也有其不足之处,就是不能根据百分位确定原来的考试得分。

一种比较合理因而也是国际上较通用的记分方法就是标准分方法;一个考生的标准分等于一个考生的考试得分见减去全体考生得分的平均值再除以所有考生的得分的标准查(样本方差开方),

i i X X Y S -=

正的标准分表示该考生的成绩高于平均分,负的标准分表示该考生的成绩低于平均分,且在一般情况下,根据中心极限定理,标准分可认为服从正态分布 (0,1)N ,这样标准分不仅与考试的原始得分相对应,而且可有标准正态分布表。确定出某标准分下的相应的百分位 (即标准分小于或等于所给定标准分的概率乘100),由标准正态分布表可得百分位与标准 分的对应关系如下表:

【免费下载】概率论与数理统计案例

实例1 发行彩票的创收利润某一彩票中心发行彩票 10万张, 每张2元. 设头等奖1个, 奖金 1万元, 二等奖2个,奖金各 5 千元;三等奖 10个, 奖金各1千元; 四等奖100个, 奖金各100元; 五等奖1000个, 奖金各10 元.每张彩票的成本费为 0.3 元, 请计算彩票发行单位的创收利润.解:设每张彩票中奖的数额为随机变量X , 则X 10000 5000 1000 100 10 0p 51/1052/10510/105100/1051000/100p 每张彩票平均能得到奖金 05512()10000500001010E X p =? +?++? 0.5(),=元每张彩票平均可赚20.50.3 1.2(), --=元因此彩票发行单位发行 10 万张彩票的创收利润为:100000 1.2120000().?=元实例2 如何确定投资决策方向?某人有10万元现金,想投资于某项目,预估成功的机会为 30%,可得利润8万元 , 失败的机会为70%,将损失 2 万元.若存入银行,同期间的利率为5% ,问是否作此项投资?解:设 X 为投资利润,则 X 8 -2p 0.3 0.7()80.320.71(),E X =?-?=万元存入银行的利息:故应选择投资.1050.5(),%?=万元实例3 商店的销售策略某商店对某种家用电器的销售采用先使用后付款的方式,记使用寿命为X (以年计),规定1,1500;12,2000;23,2500; 3,3000.X X X X ≤<≤<≤>一台付款元一台付款元一台付款元一台付款元10,1e ,0,()100, 0.x X x f x x Y -?>?=??≤? 设寿命服从指数分布概率密度为试求该商店一台家用电器收费的数学期望定盒位置保护层防腐跨接地线弯曲半径标高等,要求技术交底。管线敷设技术、电气课校对图纸,编写复杂设备与装置高中资料试卷调试方案,编写重要设备高中资料、电气设备调试高中中资料试卷工况进行自动处理,尤其要避免错误高中资料试卷保护装置动作,并

应用概率论与数理统计试题

试卷 学期: 2011至 2012 学年度第一学期 课程:应用概率论与数理统计专业: 班级:姓名:学号: 解答下列各题(每小题3分,共计51分) 1.设随机事件A与B互不相容,P(A)=0.2,P(B)=0.4,求P(B|A)2.设事件A、B满足P(A B)=0.2,P(A)=0.6,求P(AB)。 3.某人射击三次,其命中率为0.8,求三次中至多命中一次的概率为。

4.已知随机变量X 的分布函数为 F(x)= ????? ????? ?≥<≤<≤<3131321021 00x x x x , 求P }{1X =。 5.已知离散型随机变量X的分布函数为F(x)=???? ???≥<≤<≤<4 ,143,6.031,1.010x x x x ,, 求1}X |4P{X ≠<。 6.设随机变量X 的概率密度为 ??? ??<<-=,, ;x ,x )x (f 其他0224求P {-1

7.设随机变量X~N(1,4),F(x)为X的分布函数,Φ(x)为标准正态分布函数,求F(3)。 8.一口袋装有3只红球,2只黑球,今从中任意取出2只球,求这两只恰为一红一黑的概率. 9.某仪器上装有4只独立工作的同类元件,已知每只元件的寿命(以小时计)σ),当工作的元件不少于2只时,该仪器能正常工作。 X~N(5000,2 求该仪器能正常工作5000小时以上的概率。 10.设事件A与B互不相容,P(A)=0.2,P(B)=0.3,求P(B A?). 11.20件产品中,有2件次品,不放回地从中接连取两次,每次取一件产品,求第二次取到的是正品的概率.

关于“概率论与数理统计”课程中案例教学的研究

关于“概率论与数理统计”课程中案例教学的研究“概率论与数理统计”是理工院校绝大部分理工科专业重要的基础课程,它是 从数量化的角度来研究现实世界中的一类不确定现象及其规律性的一门应用数学学科。在当前现代化的教学改革之中,加强案例的应用,对提高学生在应用数学方面的兴趣和创新能力具有重要意义。本文将结合相关案例探讨案例法在“概率论与数理统计”课程教学中的应用与研究。 标签:概率论与数理统计;课程案例;教学改革 以往的教学内容、教学方法、教学手段已不能满足新形势下的教学要求,应改变“重理论,轻应用”的思想。案例教学是以培养学生的能力为目标,以相关案例为媒介,以分析案例为切入点,以与学生共同探究为主的一种教学手段和方法。案例教学法是一种创新的教学理念,有利于调动教师与学生教和学的积极性,实现师生之间、学生与学生之间的多方面的互动,能够促进理论与实践有效地结合,实现理论向实践的转化,能够培养学生的创造性思维和分析处理实际问题的能力。 1.案例教学引入到“概率论与数理统计”课程的实践 下面我们通过两个案例来说明案例教学在“概率论与数理统计”课程中的作用。 全概率公式和贝叶斯公式是概率论的重点和难点,它们都反映了“因果”的概率规律,然而区别在于:全概率公式做出的是“由因溯果”的推断,而贝叶斯公式则是“由果溯因”。 案例1:某市统计局三名统计员登录一批工业经济调查表,王宁登录了38%,李红登录了40%,张建登录了22%。根据以往的经验,王宁的出错率为1%,李红的出错率为2%,张建的出错率为0.8%。局长从三人登录的调查表中随机抽取一张,试问该表有误的概率是多少?另外,若发现这张表有误,试问是王宁登录的可能性是多少? 让学生从问题出发,体会“由因溯果”和“由果溯因”,思考如何正确地使用全概率公式和贝叶斯公式来解决上述两个概率问题。另外,注意贝叶斯公式归根结底是个条件概率问题。 另外,一个随机变量如果受到许多随机因素的影响,而其中每个因素都起不到主导作用(作用微小),则它近似服从正态分布。这就是中心极限定理所要表明的结论。这个定理也是结合案例讲解更加清楚明了。 案例2:一盒同型号的螺丝钉共100个,已知该型号的螺丝钉的重量是一随机变量,期望值是100克,标准差是10克,求一盒螺丝钉的重量超过10.2千克

概率论与数理统计在大数据分析中的应用3篇 概率论与数理统计

概率论与数理统计在大数据分析中的应用3篇概率论与 数理统计 精品文档,仅供参考

概率论与数理统计在大数据分析中的应用3篇概率 论与数理统计 在大数据时代,利用概率论与数理统计方法来对繁杂数据进行分析与挖掘不失为是一种简单高效的方法。下面是本站为大家带来的,希望能帮助到大家! 概率论与数理统计在大数据分析中的应用1 概率论与数理统计知识是数学知识体系中的重要分支,对日常生活有着广泛的理论指导。基于此,本文首先介绍了概率论与数理统计的主要学科知识,其次对于概率论与数理统计知识在日常生活中的应用,从等概率问题、序列概率问题、几何概率模型问题、统计模型、常识性统计几个方面,进行具体的研究与分析,最后对概率与数理统计的应用做出展望。 概率论和数理统计是高等数学中的重要组成部分。在自然界和人们的日常生活中,随机现象与随机事件非常普遍,概率论和数理统计是对某一事件可能结果的客观分析和理性判断。只要我们细心研究就会发现,概率论和数理统计在日常生活中有着多方面的应用。 一、概率论与数理统计知识 概率论(Probability Theory)是研究随机现象数量规律的数学分支,数理统计(Mathematics Statistics)是以概率论为基础,研究人类社会和自然界中的随机现象变化规律的

一种数学模型[1]。概率论与数理统计知识主要包含事件间关系的确定、概率的计算、概率计算模型、概率计算公式、相关性分析、参数估计、假设检验与回归分析、随机变量知识、中心极限定理等等[2]。概率论与数理统计来源与生活,是对生活中的多种随机现象的逻辑分析与抽象总结。在日常生活中,也能找到多种应用概率论与数理统计知识的具体体现。 二、概率论与数理统计在日常生活中的具体应用体现 (一)概率论与数理统计在等概率事件中的应用 等概率事件是指每一个随机事件发生的概率都是相同的,等概率问题是生活中常见的问题,小到我们玩狼人杀时的身份抽取、值日生分组中的抓阄分组,大到工厂的货物质检、食品安全部门的卫生抽检,都能应用到概率论与数理统计的相关知识。 例1:一个罐头生产厂将密封不严、颜色不达标、微生物超標的罐头列为次品。该工厂每月生产十五批货。一批货的次品率是1/20,数量很大,有几万个,现在随机取9个。问9个里面次品数量大于2个(包括2个)的概率有多少? 解:P(B1)代表9个产品中次品数量大于2的概率 P(B2)代表9个里面次品数量小于1个(包括1个)的概率,也相当于只有一个次品的概率+没有次品的概率 P(B2)=9*(1/20)*(19/20)8 +(19/20)9

(精选)概率论与数理统计第一章

第一章测试题 一、选择题 1.设A, B, C 为任意三个事件,则与A 一定互不相容的事件为 (A )C B A ?? (B )C A B A ? (C ) ABC (D ))(C B A ? 2.对于任意二事件A 和B ,与B B A =?不等价的是 (A )B A ? (B )A ?B (C )φ=B A (D )φ=B A 3.设A 、B 是任意两个事件,A B ?,()0P B >,则下列不等式中成立的是( ) .A ()()P A P A B < .B ()()P A P A B ≤ .C ()()P A P A B > .D ()()P A P A B ≥ 4.设()01P A <<,()01P B <<,()()1P A B P A B +=,则( ) .A 事件A 与B 互不相容 .B 事件A 与B 相互独立 .C 事件A 与B 相互对立 .D 事件A 与B 互不独立 5.对于任意两事件A 与B ,()P A B -=( ) .A ()()P A P B - .B ()()()P A P B P AB -+ .C ()()P A P AB - .D ()()() P A P A P AB +- 6.若A 、B 互斥,且()()0,0P A P B >>,则下列式子成立的是( ) .A ()()P A B P A = .B ()0P B A > .C ()()()P AB P A P B = .D ()0P B A = 7.设A 、B 、C 为三个事件,已知()()0.6,0.4P B A P C AB ==,则()P BC A =( ) .A 0.3 .B 0.24 .C 0.5 .D 0.21 8.设A ,B 是两个随机事件,且00,)|()|(A B P A B P =,则必有 ( )

概率论与数理统计在电子专业的应用

概 率 统 计 在 电 子 专 业 的 应 用 姓名:储东明 学号:1305062023 专业班级:电子信息工程 成绩: 教师评语:

论概率统计在电子专业中的应用 概率论与数理统计是一门十分重要的大学数学基础课,也是唯一一门研究随机现象规律的学科,它指导人们从事物表象看到其本质.的概率论与数理统计学实际应用背景很广范。正如世界知名概率学家、华裔数学家钟开莱于1974年所说:“在过去半个世纪中,概率论从一个较小的、孤立的课题发展为一个与数学许多其它分支相互影响、内容宽广而深入的学科。”概率论与数理统计学应用于自然科学、社会科学、工程技术、经济、管理、军事和工农业生产等领域.经过不断的发展,学科本身的理论和方法日趋成熟,在社会生活中,就连面试、赌博、彩票、体育和天气等等也都会涉及到概率学知识。近年来,概率统计知识也越来越多的渗透到诸如物理学、遗传学、信息论等学科当中。尤其在电子信息通信方面尤为重要,甚至是通信原理的基础课程。可以说,概率统计是当今数学中最活跃,应用最广泛的学科之一。在此文中,进一步讨论概率统计在电子信息方面的应用。 概率论与数理统计在电子电路的随机信号处理及实验中有着广泛的应用,通信工程中信号的接收和发射,都需要概率论与数理统计学的理论作为基础。因为,信号是信息的载体。信号源的输出都是随机的,怎样在随机信号中找出我们所需要的信息,就需要使用统计方法来描述。同时,对于接收者来说怎样从一个不缺定或不可预测的信号中获取我们所需要的信息,仍然需要再次利用统计学中的知识。 根据概率论与数理统计中的知识所描述,事件的概率就是对于一次随机试验E,S是它的样本空间,那么对于随机试验E中的每一个

概率统计补充案例

补充案例:概率部分: 案例1、“三人行必有我师焉” 案例2、抓阄问题 案例3、贝叶斯方法运用案例介绍 案例4、化验呈阳性者是否患病 案例5、敏感性问题的调查 案例6、泊松分布在企业评先进中的应用 案例7、碰运气能否通过英语四级考试 案例8、检验方案的确定问题 案例9、风险型决策模型 案例10、一种很迷惑游客的赌博游戏 案例11、标准分及其应用 案例12、正态分布在人才招聘中的应用 案例13、预测录取分数线和考生考试名 统计部分: 案例14、随机变量函数的均值和标准差的近似计算方法案例15、如何表示考试成绩比较合理 案例16、如何估计湖中黑、白鱼的比例 案例17、预测水稻总产量 案例18、工程师的建议是否应采纳 案例19、母亲嗜酒是否影响下—代的健康 案例20、银行经理的方案是否有效 案例21、一元线性回归分析的Excel实现 案例22、方差分析的Excel实现 案例23、预测高考分数 案例24、两次地震间的间隔时间服从指数分布

案例1、“三人行必有我师焉” 我们可以运用概率知识解释孔子的名言“三人行必有我师焉”. 首先我们要明确一个问题,即只要在某一方面领先就可以为师(韩愈说“术业有专攻”). 俗语说“三百六十行,行行出状元”,我们不妨把一个人的才能分成360个方面。孔子是个大圣人,我们假设他在一个方面超过某个人的概率为99%,那么孔子在这方面超过与他“同行”的两个人的概率为99% ×99% =98.0l %,在360个方面孔子总比这两人强的概率为 (98.01%)360=0.07% ,即这两个人在某一方面可以做孔子老师的概率为99.93%.从数学角度分析,孔子的话是很有道理的. 案例2、抓阄问题 一项耐力比赛胜出的10人中有1 人可以获得一次旅游的机会,组织者决定以抓阄的方式分配这一名额. 采取一组10人抓阄,10张阄中只有一张写“有”. 每个人都想争取到这次机会,你希望自己是第几个抓阄者呢? 有人说要先抓,否则写有“有”的阄被别人抓到,自己就没有机会了;有人说不急于先抓,如果前面的人没有抓到写有“有”的阄,这时再抓抓到“有”的机会会大一些. 为了统一认识,用概率的方法构造一个摸球模型来说明问题. 摸球模型:袋中装有1 个红球和9 个黄球除颜色不同外球的大小、形状、质量都相同. 现在10 人依次摸球(不放回),求红球被第 k 个人摸到的概率( k = 1, 2, ?, 10). 解决问题 :设 k A = “ { 第 k 个人摸到红球 }, k = 1, 2, ? , 10. 显然,红球被 第一个人摸到的概率为 101 )(1= A P . 因为 12A A ?,于是红球被第二个人摸到的概率为 101 91109)()()()(121212= ?===A A P A P A A P A P . 同样,由 213A A A ?知红球被第三个人摸到的概率为 1018198109)()()()()(2131213213= ??= ==A A A P A A P A P A A A P A P . 如此继续,类似可得 )(4A P = ==ΛΛ)(5A P 101 )(10=A P . 由此可见,其结果与 k 无关,表明10 个人无论摸球顺序如何,每个人摸到红球的机 会相等. 这也说明10 个人抓阄,只要每个人在抓之前不知道他前边那些已经抓完的结果,无论先后, 抓到的机会是均等的. 在现实生活中单位分房、学生分班、短缺物品的分配等,人们常常乐于用抓阄的办法来解决,其合理性保证当然得归功于“概率”. 通过上面的摸球模型,我们总结出分配中的“抓阄”问题,无论先抓后抓, 结果是一样的.学完概率之后再遇到抓阄问题时不必争先恐后,我们要发扬风格让他人先抓. 案例3、贝叶斯方法运用案例介绍 什么是贝叶斯过滤器? 垃圾邮件是一种令人头痛的顽症,困扰着所有的互联网用户。 正确识别垃圾邮件的技术难度非常大。传统的垃圾邮件过滤方法,主要有"关键词法"和"校验码法"等。前者的过滤依据是特定的词语;后者则是计算邮件文本的校验码,再与已知的垃圾邮件进行对比。它们的识别效果都不理想,而且很容易规避。

概率论与数理统计MOOC课程中的案例设计

概率论与数理统计MOOC课程中的案例设计 发表时间:2018-07-06T10:44:29.247Z 来源:《防护工程》2018年第5期作者:郭珂琪 [导读] 概率论与数理统计是工程数学非常重要的组成部分,甚至有西方学者提出:在大数据时代,统计比微积分更基础。 北京计算机技术及应用研究所北京 100854 摘要:概率论与数理统计是工程数学非常重要的组成部分,甚至有西方学者提出:在大数据时代,统计比微积分更基础。在西方,这门课是几乎所有大学生都要学习的必修课程,在我国,概率论与数理统计也是理工,农林,经管,医药卫生等各领域学生的必修课程,如何让学生学好这门课程一直是很多教师关注的热点。这门课程成为MOOC 课程,可以面向更多的学生,整合并充分利用优质教育资源,方便不同专业的交流;但同时也面临了学生专业跨度大,数学基础差别大的困难。针对这样的学生群体,该课程的MOOC 课程制作面临更大的挑战,必须深入浅出,形象生动,难度层次递进,且有连贯性,才能达到更好的教学效果,并有效降低学生辍学率。 关键词:MOOC 课程;概率论与数理统计;案例教学;概率统计 随着各种MOOC资源平台的涌现和推广,新的在线教学模式—MOOC已经成为大学教育中不可忽视的一种教育模式。MOOC对学校而言,能更好地整合教育资源;对学生而言,能更好地锻炼自学、思考和反思的能力。但MOOC也存在一些较难克服的障碍,对于内容抽象、学习难度大的课程,基础有欠缺、自制力缺乏的学生的辍学率始终居高不下,故可以预见,在较长时期内,部分学生还是会选择以传统课堂教学课程为主的学习方式。对于这门内容抽象、学习难度大的课程,如何保证学生课下自学的效果,不影响课程内容的进度,成为翻转课堂实施的一个关键问题,MOOC相关课程的资源便成为学生课下自学中最好的辅助;同时在课上讨论中,为了更好地提高学生的兴趣,锻炼学生的思考能力,也可以适当结合和借鉴MOOC灵活开放的教学方式。 一、案例教学对概率论与数理统计课堂教学的意义 在概率论与数理统计课堂教学中积极提倡案例教学是十分必要的,并具有其独特的意义。 1、概率论与数理统计的教学目标,既有学习理论方面的目标,又有实践层面的目标,既培养学生具有扎实的概率统计基础理论,又能将该理论和实践结合起来。而案例教学能将理论和实践很好地结合起来,可以使两个目标得以同时实现,且在两者结合方面拉近了距离,使得理论不再是空中楼阁,而是活生生的理论,实践也不是盲目的实践,而是有指导、有方向、有目的的实践。概率论与数理统计是一门应用性很强的学科,很适合用案例教学方法来组织课堂教学。 2、概率论与数理统计是一门研究随机现象的学科,在学习中有许多难点,需辅以案例教学才能理解概率论与数理统计的思想方法、基本原理和统计工具。概率论与数理统计这门课程不同于以往学习的确定性数学,其中随机变量、分布函数、大数定理、中心极限定理、极大似然估计方法以及假设检验的思想方法等都是该课程中难以理解的内容,如果教师在课堂教学上照本宣科,只强调教学过程的理论性、严谨性和逻辑性而脱离实际应用,学生要真正掌握和理解概率统计思想方法和概率统计模型是很困难的,必须从案例出发,才能清晰地阐明其概念和统计思想,必须通过案例的描述、假设、建模与求解,演示理论与方法的应用过程。 3、在概率论与数理统计课堂教学中实施案例教学也是教学改革的必然要求。案例教学法是把案例作为一种教学工具,把学生引导到实际问题中去,通过分析与相互讨论,调动学生的主动性和积极性,并提出解决问题的基本方法和途径的一种教学方法,它是连接理论和实践的桥梁。将理论教学与实际案例有机地结合起来,使得课堂讲解生动而清晰,可收到良好的教学效果。同时案例教学可以促进学生全面地看问题,从数量的角度分析事物的变化规律,使概率与数理统计的思想和方法在现实生活中得到更好的应用,从而提高学生分析问题和解决问题的能力。 二、案例教学在概率论与数理统计课堂教学中的运用 案例教学一般适合于既要注重理论教学,又注重实际操作的课程,而概率论与数理统计作为一门应用性很强的随机学科,在课堂上很适合采用案例教学方法,根据该学科的特点,在案例教学时应按照以下步骤组织实施: 1、案例的选择。选择合适的案例是整个案例教学的核心,同时也是一项十分复杂的工作,这主要是由于大学各理工科的专业性质不同,对案例的选择也不同,一般来说,所选择的案例要与相应专业比较接近,这样才能调动学生学习的积极性,以达到好的教学效果。因而在选择案例时需把握以下几点:一要考虑案例的实用性;二要考虑案例的典型性;三要考虑案例的针对性。根据案例的选择原则,这就要求我们在选择案例时要深入各个相关专业进行调研,与专业教师交流探讨,对专业教材阅读分析,收集专业课程中使用概率论与数理统计知识的案例和学生感兴趣的案例,安排教研活动组织专题讨论,进行分类汇总,编写《概率论与数理统计案例选编》,对于来自各个学科专业的数学应用案例,要有问题的提出和分析,有模型的建立与求解,有应用的讨论和评注。 2、明确案例教学思路,做好案例教学设计。根据教学内容,结合学生的专业特点,从概率论与数理统计案例选编中选取合适案例,选取好案例后,要合理分配好课堂上案例讨论与分析的时间,选择好教学方法和教学手段,并以多媒体的形式在课堂上呈现。概率论与数理统计从内容到方法与以往的数学课程有本质的不同,因此其基本概念的引入就显得更为重要。在教学中,应首先从案例出发引入概率统计的相关概念、概率统计的基本原理、统计方法,然后再选择合适案例来说明概率统计原理与方法的应用。当然,在课堂上不是要一味地讲解案例,也不是案例越多越好,而是要把握好案例与课堂知识点的结合,不能公式化,在教学过程中要充分体现“实践—理论—实践”的认识过程,做到理论与实际的有机结合。 3、有效组织案例教学,做好案例的讨论、分析。案例的讨论与分析是案例教学的中心环节,对案例进行讨论的目的是提出解决问题的途径与方法,可以从自身角度出发来剖析案例,说明自己的观点和看法,教师要掌握讨论的进程,让学生成为案例讨论的主体,同时把握好案例讨论的重点和方向,进行必要的引导。同时在组织案例教学时要辅以各种有效的教学方法,如启发式教学、讨论式教学,让学生积极参与,大胆发表意见,提出观点,深入思考,激发学生的学习热情及科研兴趣,使案例教学效果达到最佳,培养学生运用概率统计原理解决实际问题的能力。 4、案例的总结。案例总结是保证和提高案例教学质量的必备环节。对案例的总结一般要包括以下内容:一是对讨论过程进行总结,对于一个案例,让学生提出各种观点及其案例所包含的概率统计原理,让学生通过分析和评价案例,掌握正确处理和解决复杂多变的现实

概率论与数理统计在生活中的应用

概率论与数理统计在生活中的应用 单位:兴隆场初级中学姓名:姜宏琼 摘要:随机现象无处不在,渗透于日常生活的方方面面和科学技术的各个领域,概率论就是通过研究随机现象及其规律从而指导人们从事物表象看到其本质的一门科学。生活中买彩票显示了小概率事件发生的几率之小,抽签与体育比赛赛制的选择用概率体现了公平与不公平,用概率来指导决策,减少错误与失败等等,显示了概率在人们日常生活中越来越重要。数理统计在人们的生活中也不断的发挥重要的作用,如果没有统计学,人们在收集资料和进行各项的大型的数据收集工作是非常困难的,通过对统计方法的研究,使得我们处理各种数据更加简便,所以统计也是一门很实用的科学,应该受到大家的重视。 关键字:概率、保险、彩票、统计、数据、应用 由赌徒的问题引起,概率逐渐演变成一门严谨的科学。1654年,有一个法国赌徒梅勒遇到了一个难解的问题:梅勒和他的一个朋友每人出30个金币,两人谁先赢满3局谁就得到全部赌注。在游戏进行了一会儿后,梅勒赢了2局,他的朋友赢了1局。这时候,梅勒由于一个紧急事情必须离开,游戏不得不停止。他们该如何分配赌桌上的60个金币的赌注呢?梅勒的朋友认为,既然他接下来赢的机会是梅勒的一半,那么他该拿到梅勒所得的一半,即他拿20个金币,梅勒拿40个金币。然而梅勒争执道:再掷一次骰子,即使他输了,游戏是平局,他最少也能得到全部赌注的一半——30个金币;但如果他赢了,并可拿走全部的60个金币。在下一次掷骰子之前,他实际上已经拥有了30个金币,他还有50%的机会赢得另外30个金币,所以,他应分得45个金币。 赌本究竟如何分配才合理呢?后来梅勒把这个问题告诉了当时法国著

第3章-概率统计实例分析及MatlAb求解

第3章概率统计实例分析及MatlAb求解 第3章概率统计实例分析及MatlAb求解 (1) 3.1 随机变量分布与数字特征实例及MA TLAB求解 (1) 3.1.1 MATLAB实现 (1) 3.1.2 相关实例求解 (2) 3.2 数理统计实例分析及MATLAB求解 (4) 3.1.1 MATLAB实现 (4) 3.1.2 相关实例求解 (4) 3.3参数估计与假设检验实例分析及MATLAB求解 (5) 3.1.1 MATLAB实现 (5) 3.1.2 相关实例求解 (5) 3.4 方差分析实例求解 (10) 3.1.1 MATLAB实现 (10) 3.1.2 相关实例求解 (10) 3.5 判别分析应用实例及求解 (14) 3.1.1 MATLAB实现 (14) 3.1.2 相关实例求解 (14) 3.6 聚类分析应用实例及MATLAB求解 (16) 3.1.1 MATLAB实现 (16) 3.1.2 相关实例求解 (16) 3.1 随机变量分布与数字特征实例及MATLAB求解 3.1.1 MATLAB实现 用mvnpdf和mvncdf函数可以计算二维正态分布随机变量在指定位置处的概率和累积分布函数值。 利用MATLAB统计工具箱提供函数,可以比较方便地计算随机变量的分布律(概率密度函数)、分布函数及其逆累加分布函数,见附录2-1,2-2,2-3。 MATLAB中矩阵元素求期望和方差的函数分别为mean和var,若要求整个矩阵所有元素的均方差,则要使用std2函数。 随机数生成函数:rand( )和randn( )两个函数 伪随机数生成函数: A=gamrnd(a,lambda,n,m) % 生成n*m的 分布的伪随机矩阵 B=raylrnd(b,n,m) %生成rayleigh的伪随机数

(完整word版)高中数学统计与统计案例概率知识点,推荐文档

统计与统计案例概率(文科) 知识点 1.抽样调查 (1)抽样调查 通常情况下,从调查对象中按照一定的方法抽取一部分,进行______,获取数据,并以此对调查对象的某项指标作出______,这就是抽样调查. (2)总体和样本 调查对象的称为总______体,被抽取的称为样______本. (3)抽样调查与普查相比有很多优点,最突出的有两点: ①______ ②节约人力、物力和财力. 2.简单随机抽样 (1)简单随机抽样时,要保证每个个体被抽到的概率. (2)通常采用的简单随机抽样的方法:_____ 3.分层抽样 (1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样. (2)分层抽样的应用范围: 当总体是由差异明显的几个部分组成时,往往选用分层抽样. 4.系统抽样 系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按______(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机械抽样. 5.统计图表 统计图表是______数据的重要工具,常用的统计图表有______ 6.数据的数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数最多的数据叫作这组数据的众数. 中位数:将一组数据按大小依次排列,把处在______位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.

平均数:样本数据的算术平均数,即x =1n (x 1+x 2+…+x n ). 在频率分布直方图中,中位数左边和右边的直方图的面积应该______ (2)样本方差 标准差s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2], 其中x n 是样本数据的第n 项,n 是,______x 是______ 标准差是刻画数据的离散程度的特征数,样本方差是标准差的______.通常用样本方差估计总体方差,当______时,样本方差很接近总体方差. 7.用样本估计总体 (1)通常我们对总体作出的估计一般分成两种,一种是______,另一种______. (2)在频率分布直方图中,纵轴表示,______数据落在各小组内的频率用______表示,各小长方形的面积总和等于.______ (3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图. (4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且______,方便表示与比较. 8.相关性 (1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的______ (2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为____________ (3)在两个变量x 和y 的散点图中,若所有点看上去都在一条直线附近波动,则称变量间是______,若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是______的.如果所有的点在散点图中没有关系,则称变量间是______的. 9.线性回归方程 (1)最小二乘法 如果有n 个点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),可以用[y 1-(a +bx 1)]2+[y 2-(a +bx 2)]2+…+ [y n -(a +bx n )]2来刻画这些点与直线y =a +bx 的接近程度,使得上式达到最小值的直线y =a +bx 就是所要求的直线,这种方法称为最小二乘法. (2)线性回归方程 方程y =bx +a 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的线性回归方程,其中a ,b 是待定参数.

概率论与数理统计在日常生活中的应用

概 率 论 与 数 理 统 计 在 日 常 经 济 生 活 中 的 应 用 内容摘要:数学作为一门工具性学科在我们的日常生活以及科学研究中扮演着极其重要的角色。概率论与数理统计作为数学的一个重要组成部分,在生活中的应用也越来越广泛,近些年来,概率论与数理统计知识也越来越多的渗透到经济学,心理学,遗传学等学科中,另外在我们的日常生活之中,赌博,彩票,天气,体育赛事等都跟概率学有着十分密切的关系。本文着眼于概率论与数理统计在我们生活中的应用,通过前半部分对概率论与数理统计的一些基本知识的介绍,包括概率的基本性质,随机变量的数字特征及其分布,贝叶斯公式,中心极限定理等,结合后半部分的事例分析讨论了概率论与数理统计在我们生活中的指导作用,可以说,概率论与数理统计是如今数学中最活跃,应用最广泛的学科之一。 关键词:概率论 数理统计 经济生活 随机变量 贝叶斯公式 第一章 基本知识 §1.1 概率的重要性质 1.1.1定义 设E 是随机试验,S 是它的样本空间,对于E 的每一事件A 赋予一个实数,记为P (A ),称为事件的概率。 概率)(A P 满足下列条件: (1)非负性:对于每一个事件A 1)(0≤≤A P (2)规范性:对于必然事件S 1)S (=P (3)可列可加性:设n A A A ,,,21 是两两互不相容的事件,有∑===n k k n k k A P A P 1 1 )()( (n 可以 取∞) 1.1.2 概率的一些重要性质 (i ) 0)(=φP (ii )若n A A A ,,,21 是两两互不相容的事件,则有∑===n k k n k k A P A P 1 1 )()( (n 可以取∞) (iii )设A ,B 是两个事件若B A ?,则)()()(A P B P A B P -=-,)A ()B (P P ≥

《概率与统计》教学案例

“统计与概率”教学案例 南昌市洪都小学谭琴 教材内容:人教版义务教育课程标准实验教科书数学三年级下册第38页内容及练习十第1题。 教材分析 统计最基础的知识是比较、排列和分类。对现实生活中一类物体根据其不同的标准进行比较,从中分辨出异同,并按一定的顺序进行排列,这些都是统计的萌芽思想,而分类则是在比较、排列的基础上,进一步划分不同标准的结果。 本课在学生认识了一格代表2个单位、5个单位的纵向条形统计图的基础上,通过两个例题继续介绍一些常见的条形统计图:一种是横向条形统计图,另一种是起始格与其他格表示不同单位量的条形统计图。让学生根据统计图表进行初步的数据分析,通过分析寻找信息,并根据这些信息作出进一步的判断和决策。学生通过这一阶段的学习,对条形统计图的结构、数据的表示方式,以及条形统计图的作用,都有了一个基本的了解,为下一阶段学习折线统计图打下坚实的基础。练习十中的习题除了让学生根据统计图进行简单的数据分析以外,还注意加强对学生进行提出问题、解决问题能力的培养,让学生根据统计图寻找信息,提出问题并加以解决的要求。 设计思路 1. 数学生活化,让学生学习现实的数学。围绕新课标的这一具体要求,力图让学生在熟悉、亲切的生活背景素材中提出数学问题,让学生感到生活中处处有统计,处处有数学。 2.数学活动化,让学生学习动态的数学。为了让学生真正投入到统计的过程中,为此创设了画一画、议一议的活动氛围,从活动中初步感受数据收集、整理、分析的全过程,从而形成统计观念。 3.数学问题化,让学生学习思考的数学。注意在课中引导学生用精确的数学语言描述数据,根据数据提出问题并解决问题,充分拓展思维,深化对统计意义的理解。 学情分析 在前几册的教材中,学生已经学会了收集和整理数据的方法,会用统计表(包括单式统计表和复式统计表)和条形统计图(一格表示一个或多个单位)来表示统计的结果,并能根据统计图表提出问题加以解决。学生已经掌握基本的统计方法,建立了初步的统计观念。这是本节课的基础和起点。这节课进一步学习统计知识,通过有限样本的数据分析来推断总体样本的大致情况,有些学生在课前已经试着进行了分析,有一定基础,但有一些学生动手能力较弱,推理能力不强,对学生这部分内容会产生一定的困难。主要的难点是在“分析数据”和“合理推断上。 教学目标 1、引导学生自主探索、合作交流,学会看横向条形统计图和起始格与其他格代表的单位量不一致的条形统计图,并能根据统计表中的数据完成统计图。 2、初步学会简单的数据分析,进一步感受到统计对于决策的作用,体会统计在现实生活中的作用,理解数学与生活的紧密联系。 3、加强学生提出问题、解决问题能力的培养。

《概率论与数理统计》案例

实例1 发行彩票的创收利润 某一彩票中心发行彩票 10万张, 每张2元. 设头等奖1个, 奖金 1万元, 二等奖2个,奖金各 5 千元;三等奖 10个, 奖金各1千元; 四等奖100个, 奖金各100元; 五等奖1000个, 奖金各10 元.每张彩票的成本费为 0.3 元, 请计算彩票发行单位的创收利润. 每张彩票平均能得到奖金 05512()10000500001010 E X p =?+?++? 0.5(),=元 每张彩票平均可赚20.50.3 1.2(),--=元 因此彩票发行单位发行 10 万张彩票的创收利润为:100000 1.2120000().?=元 实例2 如何确定投资决策方向? 某人有10万元现金,想投资于某项目,预估成功的机会为 30%,可得利润8万元 , 失败的机会为70%,将损失 2 万元.若存入银行,同期间的利率为5% ,问是否作此项投资? 解:设 X 为投资利润,则 ()80.320.71(),E X =?-?=万元 存入银行的利息:1050.5(),%?=万元故应选择投资. 实例3 商店的销售策略 某商店对某种家用电器的销售采用先使用后付款的方式,记使用寿命为X (以年计),规定 1,1500;12,2000;23,2500;3,3000.X X X X ≤<≤<≤>一台付款元一台付款元一台付款元一台付款元 10,1e ,0,()100, 0.x X x f x x Y -?>?=??≤? 设寿命服从指数分布概率密度为 试求该商店一台家用电器收费的数学期望

解:1 1001{1}e d 10 x P X x -≤=?0.11e -=-0.0952,= 21011{12}e d 10 x P X x -<≤=?0.10.2e e --=-0.0861,= 31021{23}e d 10 x P X x -<≤=?0.20.3e e 0.0779,--=-= 1031{3}e d 10x P X x +∞->=?0.3e 0.7408.-== Y 因而一台收费的分布律为 ()2732.15,E Y =得2732.15.即平均一台家用电器收费元 例1 某单位内部有260部电话分机,每个分机有4%的时间要与外线通话,可以认为每个电话分机用不同的外线是相互独立的,问总机需备多少条外线才能95%满足每个分机在用外线时不用等候? 解: 令),260,2,1(01 =? ??=k k k X K 个分机不要用外线第个分机要用外线第,26021,,,X X X 是260个相互独立的随机变量,且04.0)(=i X E ,26021X X X m +++= 表示同时使用外线的分机数,根据题意应确定最小的x 使%95}{≥=Φ,故,取65.1=b ,于是 61.1504.026096.004.026065.1260)1(260≈?+???=+-=p p p b x 也就是说,至少需要16条外线才能95%满足每个分机在用外线时不用等候。 例2 用机器包装味精,每袋净重为随机变量,期望值为100克,标准差为10克,一箱内装200袋味精,求一箱味精净重大于20500克的概率。 解: 设一箱味精净重为X 克,箱中第k 袋味精的净重为k X 克,200,,2,1 =k . 20021,,,X X X 是200个相互独立的随机变量,且100)(,100)(==k k X D X E ,

概率论与数理统计及其应用课后答案

第1章 随机变量及其概率 1,写出下列试验的样本空间: (1) 连续投掷一颗骰子直至6个结果中有一个结果出现两次,记录 投掷的次数。 (2) 连续投掷一颗骰子直至6个结果中有一个结果接连出现两次, 记录投掷的次数。 (3) 连续投掷一枚硬币直至正面出现,观察正反面出现的情况。 (4) 抛一枚硬币,若出现H 则再抛一次;若出现T ,则再抛一颗骰 子,观察出现的各种结果。 解:(1)}7,6,5,4,3,2{=S ;(2)},4,3,2{ =S ;(3)},,,,{ TTTH TTH TH H S =;(4)}6,5,4,3,2,1,,{T T T T T T HT HH S =。 2,设B A ,是两个事件,已知,125.0)(,5.0)(,25.0)(===AB P B P A P ,求 )])([(),(),(),(___ ___AB B A P AB P B A P B A P ??。 ~ 解:625.0)()()()(=-+=?AB P B P A P B A P , 375.0)()(])[()(=-=-=AB P B P B A S P B A P , 875.0)(1)(___ --=AB P AB P , 5 .0)(625.0)])([()()])([()])([(___ =-=?-?=-?=?AB P AB B A P B A P AB S B A P AB B A P 3,在100,101,…,999这900个3位数中,任取一个3位数,求不包含数字1个概率。

解:在100,101,…,999这900个3位数中不包含数字1的3位数的个数为648998=??,所以所求得概率为 72.0900 648 = 4,在仅由数字0,1,2,3,4,5组成且每个数字之多出现一次的全体三位数中,任取一个三位数。(1)求该数是奇数的概率;(2)求该数大于330的概率。 解:仅由数字0,1,2,3,4,5组成且每个数字之多出现一次的全体三位数的个数有100455=??个。(1)该数是奇数的可能个数为 48344=??个,所以出现奇数的概率为 ` 48.0100 48 = (2)该数大于330的可能个数为48454542=?+?+?,所以该数大于330的概率为 48.0100 48 = 5,袋中有5只白球,4只红球,3只黑球,在其中任取4只,求下列事件的概率。 (1)4只中恰有2只白球,1只红球,1只黑球。 (2)4只中至少有2只红球。 (3)4只中没有白球。 解: (1)所求概率为338 4 12 1 31425=C C C C ;

( 一轮复习用卷)计数原理、概率、随机变量及其分布、统计、统计案例

计数原理、概率、随机变量及其分布、统计、统计案例 第Ⅰ卷(选择题 共60分) 一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的) 1.已知随机变量ξ服从正态分布N (1,σ2 ),P (ξ≤4)=0.84,则P (ξ≤-2)=( ) A .0.16 B .0.32 C .0.68 D .0.84 2.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分) 已知甲组数据的平均数为17,乙组数据的中位数为17,则x ,y 的值分别为( ) A .2,6 B .2,7 C .3,6 D .3,7 3.将4个颜色互不相同的球全部收入编号为1和2的两个盒 子里,使得放入每个盒子里的球的个数不小于该盒子的编号,则不同的放球方法有( ) A .10种 B .20种 C .36种 D .52种 4.已知f (x )、g (x )都是定义在R 上的函数,g (x )≠0,f ′(x )g (x )-f (x )g ′(x )<0,f x g x =a x , f 1 g 1+f -1g -1=52,则关于x 的方程abx 2 +2x +52 =0(b ∈(0,1))有两个不同实根的概率为( ) A.35 B.25 C.15 D.12 5.用0,1,…,9十个数字,可以组成有重复数字的三位数的个数为( ) A .243 B .252 C .261 D .279 6.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论: ①y 与x 负相关且y ^ =2.347x -6.423; ② y 与x 负相关且y ^ =-3.476x +5.648; ③y 与x 正相关且y ^ =5.437x +8.493;

相关文档
最新文档