统计学的故事

统计学的故事
统计学的故事

统计学的故事

纪宏袁卫文

2004年1月

第一回人类发现①了统计统计改变了世界若想了解上帝在想什么,我们就必须学统计,因为统计学就是在量测他的旨意。

——南丁格尔

列位,一般故事或小说的开头总是写的比较虚,没有什么干货,只是交代一些背景。平均说来,到了第三回主要人物才出现,到了第五回矛盾冲突才展开。本文也决不敢例外。

大千世界,芸芸众生,悠悠上下五千年,坐地日行八万里。这个世界所在的宇宙真奇妙,时间上没头没尾,空间上没边没沿。世界上的万物真复杂,自然界和人类社会好像都受到某种力量和规律的支配,可怜的是我们还无法确切地认识、把握这些力量和规律,偶然事件常常捉弄我们的命运。这个世界上的人们真倔,非要把这个很难描述的世界,包括客观世界和我们的主观世界整明白不可,大到宇宙空间,小到基因和纳米,探索者前仆后继,没完没了。

任何值得一提的文明都探索过真理,冥思苦想的人们尽管不能完全确切的,但总是试图解释复杂多变的自然现象和人类自身。

在很早很早以前,人们认为自然是神秘、无序,甚至是恐怖的。而人类自身也有很多谜题,例如,人类为何定居在这个地球上,人生的目的是什么,人类的终极归宿何在,等等。这些问题的答案一般是由宗教领袖给出的。

过了很多很多年,智者、思想家和勇敢的科学先驱们,或统称为人民,逐渐摒弃了上帝按其意愿创造了人和物质世界的信仰。他们发现人类有智慧,用思维,佐以观察或实验,就能够发现各种谜一样的自然活动和人们自己。他们用思维与似乎瞬息万变的现象抗争,并将理性之光洒于其上。先驱的态度是理性的、批判的和反宗教的。由于他们的态度较好,终于得出了这样一些结论:自然和人类社会是有序的,按完美的设计而恒定地运行着,从星体的运动到树叶的颤动,从人们的行为到人们的观念,所有感官能感知的东西都能用一种精确、和谐而理想的

①我们实在想不通,用“发现”和“发明”哪个词更符合实际。

形式来描述。用土话说,自然和社会都是有规律的,这种规律虽然不受人的主观意志的影响,却能被人的思维所理解。

又过了很多很多年,经过无数人大胆的观察、敏锐的猜想、天赋的直觉和一不怕苦二不怕死的精神,建立了现代科学的理论体系和思想体系。在天文学、物理学、生物学、人文社会科学以及数学和哲学等领域都取得了重大成果。虽然数百年来,科学和哲学的门派林立,各自有各自的掌门人,各自占据着各自的山头,都因自己发现真理而笑傲江湖。但有一个基本观点被大多数人承认,即这个世界是有规律的。我们是否可以用身边的事和通俗的语言解读一下科学巨匠们所研究的规律。请想一想,我们身边经常发生的重复出现的、有规律的现象:太阳每天从东方升起,冬天过去春天就要来临,物体失去支撑就会坠落,“神舟五号”飞航按设计的轨道运转,经济按市场规则运行,奔波的人们按自己的哲学度日。对不同领域中的规律进行探索和描述便形成了不同的学科。将不同学科的理论、方法、思想进行提炼,便形成了哲学、数学、统计学这样一些横断科学。

同时,我们在发现我们周围的事物没有任何一次重复是完全的“克隆”,没有任何东西会把一切细节完全重复出来。太阳每天从东方升起,但天安门广场上与太阳同时升起的国旗其升旗时间却每天不同;冬天过去春天就要来临,但今年的春色比去年更加明媚;物体失去支撑就会坠落,但受风速、风向、地心引力等很多细小因素的影响,两个同样重的物体坠落速度和落点会有差别;“神舟五号”飞船按设计的轨迹运转,但每次经过我国领空的时间都略有差距;经济按市场规则运行,但今年的GDP比去年增长8%;奔波的人们按自己的哲学度日,但一年又一年我们的生活逐渐发生了改变。因此,任何科学都只能预见大体上的重复现象。

行笔至此,我们是否感到统计学太重要了。统计学就是通过差异描述规律;透过现实走向理性,走出混沌,走向秩序的学科。“可以毫不夸大地说,现代科学的发展是在关注大数目现象的标志下进行的,很快就不会有不了解研究的随机性——统计方法的知识分支了”。的确,理、工、农、医、文,今天很难找到一个不使用统计的学科了,它在解决现代科学的那些最重要的和最多样化的课题中起着主导作用。统计学是科学的“母亲”和“仆人”。说她是“母亲”,因为统计学为其他学科起着孕育、生产新思想的作用;说她是“仆人”,因为统计学是其他学科的工具,用统计规律逼近客观规律的工具。

但是,故事总有插曲,关于统计学客观基础问题的争论,从来未停止过。从古

希腊思想家那里开始到现在,一直存在两种对立的意见。一种意见认为,世界的本质是确定的,随机性只是由于人们认识的局限性而产生的噪音,他们总是将所有现象都解释成无微不至的事物秩序所产生的结果,在事物的重复出现中会因很多细节而产生差异,但这种差异只是目前人们还不了解这些细节而已。统计学只是对随机性差异的度量,是主观内容的范畴,在客观世界中没有什么对应他们的东西。虽然,统计学在科学研究中起着重要作用,但这个作用只是在认识过程中由相对真理到绝对真理的迈进中的作用。因而,这种意见认为,只有数学才能牢固把握客观世界的所作所为,能瓦解玄秘并代之以规律和秩序。而统计学则是由于人力所不及不得已而为之的方法,其基础不是客观的,只是人们知识不足和信息不完备的代名词,虽然统计学是我们人类自己发明的探索客观规律最好用的方法,但数学才是上帝的宠儿,统计学只是人类的智慧。爱因斯坦给波尔的一封信中有这样一句名言:“你信仰掷骰子的上帝,我却信仰客观存在的世界中完备的定律和秩序”。?文中暗表,那个时期人们所说的上帝似乎有两种意思,一种意思是神学中的上帝,和中国的玉皇大帝、灶王爷之类的东西相似;另一种意思是好像是指不为人们的意志为转移的客观规律,斯密的“看不见的手”与其有点相近。在那个神学和科学混合的时代,这两种意思很难分清楚,只好麻烦读者自己判断。直到20世纪初,科学界一直是这种观点,即机械决定论占统治地位。牛顿力学被称为科学思想的典范,学者们总是力图使科学规律符合严格确定性的理想。

关于统计学客观基础问题的另一种意见认为,随机性本身也是客观的,统计学则反映的是知识体系中不依赖于人的关于客体的内容,上帝和人间的赌徒一样,也喜欢掷骰子。有一个著名的故事:拉普拉斯把他写的《天体力学》献给拿破仑。《天体力学》是一本极具影响力的书,描述了如何根据地球上的观测数据,来计算行星与彗星的位置。拿破仑看后说:“拉普拉斯先生,你写了这本关于宇宙系统的书,却根本没有提到他的创造者——上帝”。据传说,拉普拉斯回答道:“我不需要这个假设条件”。

拉普拉斯的《天体力学》虽不需要上帝,但它需要另一种东西,叫误差函数。从地球上观测行星与彗星的位置与预测值并不完全吻合,拉普拉斯将其原因归结为观测误差,包括随机误差和人为误差,并都放入误差函数中。当时的科学家都

?《爱因斯坦文集》商务印书馆1976年版,第415页。

认为,随着测量越来越精确,最后一定不再需要这项误差函数。谁知,到19世纪末,随着测量越来越精确,反而越来越测不准了。最终人们发现,这些误差一方面是由于测量技术问题,另一方面是由于被测量的客体本身具有随机性。机械式的宇宙观开始动摇,一些企图寻找生物学定律和社会学定律的努力也徒劳无功,甚至有些传统学科领域,如物理学和化学当时所用的那些定律,也被认为仅仅是粗略的逼近。科学家从理论上和实践上都充分证实了严格决定论对描述客观现象的不适应性和不可归结性。布朗运动、混沌动力学、量子力学、耗散结构都证明了经典决定论已逐渐向统计决定论转移。人们的科学观念发生了新的变化。自然和社会中不规则、不连续、不稳定、非平衡的领域不断扩大,其中充满了涌现、转化、意外和机遇。科学探索也达到了这样的境界:科学家对客观事物的描述和预测的精度已不能通过改进操作技巧,提高测量的精密度加以改善,他们发现根本没有可能发现严格的因果依赖性,可以找到的只是统计的因果规律。

您瞅瞅,统计的用处有多大,尽管统计学的客观基础问题还在争论不休,但统计已改变了世界,已成为科学与管理的工作母机,现在,谁也离不开统计了。人们形容一个智障的人时常说:“这个人缺数”,译成专业术语就是:“这个人不懂统计”。统计也成为现代人基本素质的构成要素,成为我们世界观的一个组成部分。人类的处境挺可怜的,我们是广褒宇宙中的流浪汉,孤单地生存在一个冷酷、陌生的空间里。我们可能是在最近一个冰川期后起源的,在自然的劫后余迹前孤立无援,生存在茫茫的时间中。我们依靠地球提供衣食,我们每个个体的出生都是随机事件的牺牲品。为了解决生命的寂寞、穷困、艰险和短暂,我们要与天斗、与地斗,不知为什么还非要与人斗。斗争中却也其乐无穷,凭着一点有限的感性知识和大脑,人类开始探究自然和自身,寻求真理和秩序,建立可以帮助我们获取有关生存环境奥妙的知识体系和解释模型,而我们的辉煌成就之一就是统计学。尽管我们现在还不很清楚,统计学的出现是由于人的聪明,还是“天籁之音”。

多少年来,在深奥的学术争论和枯燥的统计数据背后,有好多美丽的故事和动人的传说。我们试图收集一些讲给大家听。一般故事中没有美女,便不引人入胜,为满足大家对美的渴望,本文下期便有美女出现,请君欣赏,请看第二回:美女午间品茶费雪突发灵感。

参考文献:

[1]《统计,改变了世界》萨尔斯伯格著,叶伟文译,台湾天下文化书坊,2002.4

[2]《世界统计名人传记》龚鉴尧著,中国统计出版社,2001.1

[3]《统计发展史》陈善林、张浙编著,立信会计图书用品社,1987.9

[4]《殴美统计学史》高庆丰,中国统计出版社,1987.8

第二回美女午后品茶费雪突发灵感

养猴人心中暗笑:“朝四暮三和朝三暮四,不是都等于七吗?这畜牲就是不如人聪明。”猴子们窃窃私语:“朝四暮三和朝三暮四,虽然吃到肚子里都等于七,但朝四暮三更符合早吃饱,晚吃少的科学道理,不信去问问费雪。人虽然比我们聪明,但没学过统计的人,智商还真不如我们高。”

——新《齐物论》

二十世纪二十年代后期的一个夏日午后,一群风度翩翩的学者偕夫人及漂亮的女友,正在英国剑桥的户外餐桌旁,悠闲的品茶论道。席间,一位美丽的女士惊呼,午茶的调制顺序对味道有很大影响。把茶加进牛奶里和把牛奶加进茶里,喝起来风味完全不同。出于对女性的尊重,那些学者们面带绅士的微笑,内心却不以为然,甚至是藐视,依据他们的科学头脑分析,茶和牛奶两种物质混合结果的化学成份不会因为调制顺序不同而产生不同,怎么会喝起来不一样呢?文中暗表,这个命题的假定前提是不论调制顺序如何,牛奶和茶的比例是固定的或是基本不变的。美丽女士提出的问题是朝四暮三和朝三暮四的关系,而不是朝四暮三和朝四暮四的关系。古板的英国绅士一定会把古板的精神带到生活细节中,所以这个假设前提一般会成立。书归正传,正当众学者对美丽女士的说法嗤之以鼻时,有个身材瘦小的,嘴上留着灰白胡子的绅士挺身而出,抓住了这个问题。

此人便是在统计发展史上地位显赫、大名鼎鼎的费雪(Ronald Aylmer Fisher,1890-1962),伦敦人氏,英国统计学家。费雪当时显得非常兴奋,好像发现了大元宝。“让我们来检定这个命题。”说着,在众位学者的帮助下,他开始进行实验。他们设计并调制出很多杯不同的茶,有些先放茶水再加牛奶,有些先放牛奶再加茶水,然后按照既定的顺序一杯一杯拿给美丽女士品尝分辨,但她并不知道每杯茶的调法。费雪端给她第一杯茶,她尝了一口,然后说出这杯茶是先放茶水后加的牛奶,还是先放牛奶后加的茶水。费雪记录下她的说法,再送上第二杯,……。

读者可能会问,这个看上去没什么科学价值的实验,是我们的这位尊敬的费雪先生从事科研之余闲着没事干,找个由头和美女套近乎,还是有什么别的原因。

说来话长,从16世纪甚至更早的时候起,科学实验已经进行了几百年。实验是发现、检验和积累知识的工具。但是在费雪时代以前,实验带有科学家个人浓厚的独特风格,并没有科学的规范、程序,更谈不上实验设计。一流的科学家可以做出很有价值的实验,产生新知识;而不入流的科学家只是盲目地进行实验,虽然生产出一些数据,但对生产和积累知识没什么用处。此外,19世纪以前的科学家很少发表自己的实验结果,他们仅描述研究结论,并公布那些能证明此结论真实性的数据。至于实验过程和实验结果的科学性和可靠性我们不得而知。虽然科学是从发现问题、周密思考、观测与实验发展而成的,但究竟要怎样做实验,却从来没有被提及。经过多年的成功与失败,实验设计的理论和方法才发展起来。

1857年,奥地利统计学家孟德尔(Gregor Johann Mendel,1822-1884)不知为什么突然对豌豆情有独钟,非要把豌豆及遗传规律弄明白不可。他在教堂的后花园内一块不到2400平方英尺的畦田上,对豌豆及和豌豆有关的属类进行了实验,一干就是八年。经过八个春秋的耐心实验、仔细观测、不厌其烦,终于从宝贵的实验数据中获得了具有普遍意义的遗传统计规律。孟德尔成功的诀窍之一就是在整个实验进程中,自始至终都闪烁着可贵的统计思想。孟德尔靠自己敏锐的直觉,无意中按照现代推断统计的初步原则,粗糙地进行了实验设计。也就是说要设计一种较少规模的实验,既要保持植物天然杂交的程序,具有一定的代表性,又要尽量简化不必要的过程和减少偶然的随机干扰,便于观察研究。费雪在1936年指出:孟德尔是在总结前人实验的基础上,已经从理论上预料到会出现什么样的数据,然后才去安排实验的,因而只需要不多的数据就得出完美的结果。但是孟德尔只是公布了能够证明结论的数据,而不是全部实验数据。1940年,费雪检验了孟德尔公布的数据,发现这些数据完美得像真的,根本没有展现应有的随机程度。

在孟德尔之后,统计实验有了很大的发展,以剑桥学派首要人物贝特森(William Bateson,1861-1926)教授为首的遗传实验学派主张在实验中贯彻样本统计推断思想,以园田小样本实验为基本方法。他们认为没有一定实验设计在事先指导,就是把数据收集得再多,也难说是很充分的,说不定还可能是没有价值的。如果事先有了精心的实验设计,就不需要大样本,其结果也能够接近理论预测水平。可见,贝特森学派的统计实验已接近现代推断统计。

以英国生物学家和统计学家皮尔逊(Karl Pearson,1857-1936)为首的生物统计学派以统计观察和描述作为进化和遗传的研究方法。他们认为:从大量信息中

提取出的数据是得出一切正确结论的充要条件,其有效性是不可怀疑的。而仅仅做几个实验就推出全面的结论,在他们看来只是井底观天,是危险的。令人反感的(Naughty)从大量观察中整理和计算出有说服力的数据才是实验的关键。因而生物统计学派在整理手段和计算手段上取得了很大的成绩,如卡方检验、相关法、回归法的发展和完善等。

1899年,英国统计学家戈塞特(William Seely Gosset,1876-1937)在都柏林找到了一个令笔者垂涎的职业,到一家酿酒公司担任酿造化学技师,从事统计和实验分析工作,可以边喝啤酒边搞科研。但戈塞特首先碰到的困难,是供应实验用的麦子数量有限,无法采用当时通行的大样本观察和推断理论,而且每批进厂原料的质量都有所波动,对温度的变化也很敏感。万般无奈,戈塞特着手从小样本开始分析实验数据。小样本数据存在两个问题:一是误差怎样解决,二是如何从中尽可能得到较为可靠的结果。酒是个好东西,李白斗酒诗百篇,戈塞特的酒也没白喝。他经过反复研究实验,确立了小样本理论。1908年戈塞特以学生(student)为笔名,在《生物计量学》杂志上发表了“平均数的概率误差”。由于这篇文章确立了“学生t检验”的基础,因而许多统计学家把1908年看作统计推断理论发展史上的里程碑。将戈塞特称为小样本理论的创立者和实验分析的先驱。费雪称他为“统计学史中的法拉第”。

费雪生的挺是时候,前面有很多科学家在实验设计方面积累了经验和教训,眼下又有美女相伴引发了灵感,更重要的是他的天赋和勤奋,创立和完善了实验设计理论和方法。

自1919年起,费雪在卢桑姆斯坦德农业实验站工作了14年,在实验活动中,不断收集肥料、雨量、遗传、土质、细菌、收获量等资料。与孟德尔修道院的后花园的条件相比,实验的环境更不易控制。引起实验结果差异的因素主要有两个:一是在田间实验中,土质、光照等客观条件不同;二是实验方法不同。由于这两个因素往往同时起作用,因此,如何从总差异中分解出这两个因素各自的影响以及如何测定它们,是费雪所面临的问题。经过多年的努力,自1923年费雪陆续发表了关于在农业实验中控制误差的论文。首次提出了方差分析、随机区组、拉丁方等控制、分解和测定实验误差的方法。这样,费雪的主要实验设计方法在20至40年代完成。

1935年,费雪完成了在科学实验理论和方法上具有划时代意义的一本书《实

验设计》。在书的第二章,费雪就提到了剑桥午后的品茶和那位美丽的女士。当时,费雪设计了各种可能的实验方法,来测试美丽女士能否分辨出不同的茶。问题是,如果美丽女士只是哗众取宠而没有真本领能分辨出不同的茶,那么拿一杯茶给她品尝,她也有50%的机会猜出这杯茶的调制方法;如果给她两杯茶,她还是有猜出的可能;如果给她两杯调制方法不同的茶,她可能一次全部猜错或全部猜对。如果美丽女士有真本事,确实能够分辨调制方法不同的茶,但她还有可能弄错,或是茶水和牛奶没有混合好,或茶水温度不够影响了味道,或她喝了很多杯以后感觉已经不太灵敏。总之,品了十杯茶,有可能会弄错一杯。在书里,费雪讨论了各种可能结果,描述了该准备多少杯茶,依照什么顺序拿给她,然后根据她回答的正确与否,计算出各种结果的概率。这就像笔者给学生出考卷一样,根据教学的内容,一份考卷应出多少道题,各类题的顺序如何,选择题的备选答案如何排列。总之,是为了让学生考出水平,让好学生可以得高分,让不好好学习、仅凭临阵蒙事的学生,可能蒙对一、两道题,但还是不及格。

费雪的成就引起了广泛关注,首先是农业科学家了解到实验设计的伟大价值。不久,费雪的方法成为农业科技上的主流学派,后来又被他的学生推广到其他科学领域。

至于剑桥午后品茶的那位女士,据说她能分辨出每一杯茶,全部答对,看来,这位女士不仅仅是美丽。

哲人说得好,女人是感性动物,男人是理性动物。如果感性动物与理性动物联起手来,科学的天空将更加美丽。请看第三回:彩虹为何眩目且听统计描述。

参考文献:

[1]《统计,改变了世界》萨尔斯伯格著,叶伟文译,台湾天下文化书坊,2002.4

[2]《世界统计名人传记》龚鉴尧著,中国统计出版社,2001.1

[3]《统计发展史》陈善林、张浙编著,立信会计图书用品社,1987.9

[4]《殴美统计学史》高庆丰,中国统计出版社,1987.8

第三回彩虹为何眩目且听统计描述

如果人总是从一滴水中观察光线的反射,他就很难理解美丽的彩虹现象

——凯特莱

有一句歌词写的挺好:“不经历风雨怎能见彩虹”。好就好在写得有些道理。

第一,这句歌词写清楚了风雨和彩虹的关系。风雨在前,彩虹在后;风雨是因,彩虹是果;风雨是解释变量,彩虹是被解释变量。

第二,这句歌词还告诉我们,透过一滴雨水是看不见彩虹的。虽然歌词没有讲清楚能够看见彩虹的雨是中雨、大雨、还是暴雨,但必须是有足够多的雨滴组成的雨。词作者可能不懂统计,但他有大数定律的朴素思想。

但是,歌词写得虽好,在理论上还存在一些问题。在自然现象中,风雨一般是结伴而行的,有一句话叫“风雨交加”嘛。但经科学分析,我们可以得出结论,风和彩虹没什么相关关系,将风雨加在一起写进歌词,好像风和雨对彩虹的出现各有50%的贡献,与事实不符。显然,词作者在这方面的知识不如凯特莱,至少他不懂变量筛选技术。更严重的问题是,词作者遗漏了一个更重要的变量,即雨后的阳光。不论雨量大小多么适合彩虹出现,如果雨停的时间正好是后半夜,也绝见不到彩虹。

如果笔者写这句歌词,绝不会出现上述的不严密。

比较准确的表述是:雨后的天空,当雨滴还飘散在空气中,来自远距离的太阳光线投射在雨滴上,产生一系列的彩色圆弧,可分解为赤、橙、黄、绿、青、蓝、紫七色光带,此时天空中的景色异常美丽,这就是人们通常所说的彩虹现象,简称彩虹。有时在彩虹的外侧还能看到第二道虹,光彩比第一道彩虹稍淡,称为霓。虹和霓的色彩排列次序正好相反。虹的色序是外赤内紫,而霓的色序是外紫内赤。以上表述便是彩虹的比较全面的定义。此定义虽比原歌词严密,但估计谱上曲子唱出来,可能没有原歌词上口。

多少年来,在人们看来,彩虹是美丽而神秘的。史书有记载,民间有传说,少女借其抒情,词人借其咏志。早年间,希腊女神Iris把彩虹作为警示和希望的征兆;

在非洲的神话中,彩虹被认为是暴风雨过后出来掠物的巨蟒;我国殷代甲骨文中,认为彩虹是龙在雨后的显形,所以虹字带上了“虫”字旁,并一直沿用至今。

科学家,这里主要指物理学家和统计学家忒不会浪漫,他们非要打破人们对彩虹的七色梦幻,还其以一个用科学解释和变量描述的本真。经过他们几百年的努力,彩虹的谜团正在解开。

“赤橙黄绿青蓝紫,谁持彩练当空舞”。是什么东西决定了彩虹的出现,彩虹为什么有七种颜色,七种颜色为什么又有特殊的排列,彩虹为什么在当空舞成一个抛物线,即一段圆弧,“当空”到底有多高,即什么决定了彩虹的高度,为什么虹出现以后,有时还会出现霓,等等。从十四世纪开始,科学家包括笛卡尔、牛顿等一些科学巨匠就开始捉摸这些问题。逐渐地,人们开始认识到彩虹与雨滴对光的反射和折射有关。

任何一门应用统计,都是统计理论与方法和所应用领域学科的结合。经济统计学就是统计理论与方法和经济理论的结合。彩虹问题也不例外,应当是光学与统计学的结合。但笔者的光学知识甚少,只停留在光线太暗了什么都看不见,光线太强了刺眼的水平上。所以,在彩虹问题上笔者出现的系统误差请读者不要太挑剔。

远在1657年,法国数学家、物理学家、概率统计的奠基人费尔马(Pierre de Fermat,1601—1665)提出了著名的Fermat原理。费尔马发现光线是沿直线传播的,遇到障碍物又能拐弯,由于介质不同或不严格地说障碍物不同,光线的拐弯可分为反射和折射。

我们假定天空中的雨滴是一个球体。太阳光从远处通过空气射到雨滴,由于远处很远,所以可以假定太阳光线是相互平行的。阳光从空气穿过雨滴的过程中,一部分光线被反射,另一部分光线通过折射而进入雨滴内部,进入雨滴内部的光线又经过反射和折射,最后再折射回空气中,便形成了虹。如图所示:

A 点为光线的照射点,即光线通过空气和雨滴的交接点。一部分光线经过A 点反射出去,其余光线通过雨滴而折射,α是入射角,β是折射角,当光线折射到

B 点,再B 点光线又经过反射通过

C 点,最后在C 点折射回到空气中,这一过程称为一次反射途径。

如图所示,只要A 点在雨滴的左侧上方任何一点,它都在雨滴的下半部离开雨滴。虹的出现与光线离开雨滴时的方向折射情况有关,即与光线的折射的角度有关。若光线是沿着圆的直径方向进入雨滴,则入射角为0°,折射角也是0°,最后光线从雨滴的后面反射出来退出雨滴,从顺时针方向来看,总的折射角是180°。由于圆是对称的,因而只需考虑左上部的四分之一圆上的点即可,即对于

(0,90)α∈ 。在A 点经折射,折转了()αβ-,在B 点经反射又折射了

(1802)β- ,最后在C 点再折射()αβ-,设()F α为光线折射的角度,则:

()()(1802)()18024F ααββαβαβ=-+-+-=+-

4'()2d F d β

αα=- 根据折射定理:入射角的正弦与折射角的正弦之比为常数,即有sin sin R αβ=,称

R 为折射率。因此cos cos d R d βαβα=,令'()0F α=,得4cos 20cos R αβ-= 由cos cos 2sin sin R R αβαβ?=????=?? 可以得到2221cos 4cos R αα-+=

,即cos α=实验证明,光在空气中的速度大于在水中的速度。由于雨滴是水,折射率

1.33R =,所以有cos 0.506,59.6,()137.5F ααα=== 。并且有:

22()4d F d βαα''=-。由于

cos cos d R d βαβα=,222sin (sin )()cos d d R R d d ββαββαα-=-+,223sin 4cos d d ββαβ=。其中,(0,90)βαα<∈ 。 所以022<αβd d ,故()0F α''>,这表明在(59.6)137.5F = 时,()F α取得最小值。这就是虹出现的位置,射入角为59.6°的光线为虹光线,42.5°=180°– 137.5°为

虹角。因此,雨滴在观测者的特定角度下,它将呈现较亮的光线。如果观测者处于顶角为二倍虹角的圆锥顶点处,这时用垂直于轴的平面去截圆锥,就会得到一个圆形的截面,每个锥表面上的雨滴都构成虹角,于是观测者就看到了天空中一条明亮的圆弧,这就是虹。

虹出现的高度依赖于太阳的高度。对于地面上的观察者来说,虹最多是个半圆。如果观察者能飞行到一定高度,虹则是一个完整的圆。

虹为什么有七种颜色呢,因为光线是一种电磁波,具有连续的波长光谱。波

长在6470—7000

10

(110)

A A m

-

=

,看到的是红色,波长在4000—4240A

,看到的

是紫色,其它颜色的波长介于二者之间。而且,水的折射也依赖于所通过的光的颜色,红光的折射率为1.3318,紫色的折射率为1.3435。针对不同颜色的光,可以重复计算最小折转角。红光的最小折转角为137.7°,相对应的虹角为42.3°,紫光的最小折转角为139.4°,相对应的虹角为40.6°。也就是说,观测者在观看彩虹时,看到的红光圆弧略高于紫光圆弧,混有不同波长的阳光射在雨滴上,折射出各种不同颜色的圆弧,顺序为赤、橙、黄、绿、青、蓝、紫。

我们构造的彩虹模型只是一个理论模型,相当于回归分析中设定的理论曲线。在实际观测中,我们会发现彩虹的高度是有时高有时低,长度是有时长有时短,亮度有时明有时暗,弧度是有时弯有时缓,更接近一幅散点图。很多年来,时有学者对其进行观测和计算。牛顿经过测算,更正了“平行光线”的假定,得出了太阳直径允许有0.5°的偏差,虹的宽度约为2.2°的结论,与实际观测结果基本一致。

虹是由阳光的第一次反射形成的,而霓则是由第二次反射形成的,建立模型的基本道理一样,只是更复杂一些。为避免言多语失,让物理学家看见笑话,恕不赘述。

读者看罢此回,可能产生不满,统计是有用处,但彩虹用处不大。它

不顶吃,不顶喝,远在天边,只有视觉享受。不如将有用的统计用于我们身边。笔者十分理解读者感受,我们不仅要将统计应用于我们身边,还要应用于我们身上。请看第四回:君欲减肥成功统计授你秘诀。

第四回君欲减肥成功统计授你秘诀

“楚王爱细腰,宫中多饿死”。旧时的女儿家不仅痴情,而且无知,他们不知道不仅饿饭可以形成美丽腰身,而学会了统计学的有关知识后,不饿死也能使腰细得让“楚王”或白马王子喜爱。

——新编《人体投入产出模型》第五章

随着生活水平的提高,似乎出现了这样一个统计规律,恩格尔系数逐渐降低,人们身上的肉增长到临界值以上便形成了肥胖。目前,肥胖已成为社会关注的、特别是少女关注的一个重要问题。不仅从健康的角度,还是从审美的角度,人们越来越重视自己的身条儿。虽然,这些减肥食品中有蒙事儿的,众多减肥中心中有不健康的,但从人体所需能量的摄入和消费两个方面看,减肥的做法是有一定科学道理的。

古今中外,不少医学家、遗传学家、运动生理学家和追求瘦身的美女都探讨、研究和实践过减肥问题。笔者经研究认为,只有统计学进入这个领域后,才使得减肥问题变得更加科学和可测度。

古希腊哲学家亚里士多德有句名言:“运动太多和太少,同样地损伤体力,饮食过多和过少,同样地损伤健康;唯有适度可以产生、增进、保持体力和健康”。但是,亚里士多德没有提出适度的数量界限,即运动量多大才适度,运动量和饮食量如何搭配才适度。同理,几千年后,伟人毛泽东提出了“忙时吃干、闲时吃稀”的科学道理,但他也没有界定,忙到什么程度吃干,闲到什么程度吃稀,吃干时可忙到什么程度,吃稀时可忙到什么程度的数量标准。统计学介入后,情况就不一样了。

20世纪50至70年代,日本香川女子营养大学香川绫博士和五明纪春博士在数据调查、测算和分析的基础上,对800多种经常食用的食品进行了分析,根据营养成分、热量、对肥胖的作用以及膳食搭配习惯等标志将其分成四组;又根据日本人的基本代谢、日常生活活动和运动对能量的消耗进行了数据分析,得出了相应的数据标准;绘制了不同性别、不同年龄组的人判定胖与瘦的相关图。同时,

世界上许多国家的学者或研究机构也根据自己的人种,制定了有利于健康的膳食和运动的数量标准。我国生理科学会也修订了我国人民的每日膳食指南,刘来福和曾文艺教授提出了减肥模型。

为了维持人体正常生理功能的需要,我们要不断的补充能量。能量之源是营养素,或不严格地讲是食物。所以,我们一顿不吃饭就饿得慌。

人体需要多少能量,主要取决于三个因素:

一是维持人体基本代谢所需要的能量。基本代谢是指我们躺在炕上一动也不动,机体仍要进行的最低限度的必要活动,如保持体温、心跳、呼吸等。从理论上讲,基本代谢所需能量与人的体表面积正相关,在实际测度时,一般用人的体重代替体表面积。平均来说,成年男子每千克体重每小时平均消耗能量4200焦耳,成年女子为3500焦耳。

二是食物的特殊动力作用所消耗的能量,即将食物转化为人体所需能量而消耗的能量。不同种类的食物其特殊动力作用所消耗的能量不同,平均说来,食用普通的混合食物,其特殊动力作用所消耗的能量相当于基本代谢的10%。

三是人们从事劳动(包括体力劳动和脑力劳动)和各种活动(包括运动)所消耗的能量。不同种类的劳动和活动所消耗的能量不同,读者可参阅有关专业书籍。

如果我们日常摄入的能量等于上述人体的需要量,就能保持现有体重。如果摄入量小于需要量就要动用体内储存的能量而起到减肥效果,时间长了就会对身体产生不利影响,从腰变细直至饿死。如果摄入量大于需要量,多余的部分就会变成脂肪存储与皮肤下,久之,就使腰身变粗。

由于人体的脂肪使能量存储和提供的主要方式,也是减肥的主要目标,我们不妨以人体脂肪的重量作为体重和减肥的标志。已知每千克脂肪可以转换为4.2×102焦耳的能量,记作:D=4.2×102焦耳/千克,称为脂肪的能量转换系数。

人体每天摄入的能量用A表示。

人体通过劳动和活动消耗的能量用R表示:R=rh(焦耳/日)。其中,r为每千克体重每小时劳动和活动所消耗的能量。人不可能一天24小时都在劳动或活动,h表示每天劳动和活动的小时数。

人体用于基本代谢和食物特殊动力作用所消耗的能量用B表示,B=24b(焦耳/日)。其中,b为每千克体重每小时所消耗的能量,因为人体每时每刻都在进行基本代谢,所以要乘以24小时。

人,不可能一口吃成胖子,身上的肉是一天天攒起来的。同理,减肥也是个慢功,不可能一天就使得小蛮腰变成小细腰。所以体重是时间t的函数W(t)。因而,任何时间段内(t,t+△t),由于体重改变所引起的人体内能量变化应该等于这段时间内摄入的能量与消耗的能量之差,即:

[W(t+△t )-W(t)]D=[A-(B+R)W(t)]△t (1) 以△t除以式(1)两端,并令△t→0取极限,可得:

dw/dt=a-dw (2) 其中:a=A/D,d=(B+R)/D。

式(2)就是减肥的理论模型。

设t=0位减肥模型启动的初始时刻,这时人的体重为w(0)=w0,以此为初始条件可求出式(2)的解为:

w(t)=W(0)e-dt+a/d(1-e-dt) (3) 在式(3)中,设a=0,即停止进食,从而无能量摄入,这时体重的减少完全是由于体内脂肪的消耗而产生,于是有[W(0)-W(t)]/W(0)=1-e-dt,1-e-dt表示在时间(0,t)内体重减少的比率,称为(0,t)内的体重消耗率。特别当t=1时,1-e-dt给出了单位时间的体重消耗率。

a/d是个重要指标。由于a=A/D表示能量的摄入而增加的体重,而d=(B+R)/D 表示能量的消耗而减少的体重,于是a/d就表示通过能量的摄取对每1%的体重消耗所获得的体重的补充量。

可以证明,对于式(2)来说,当且仅当W*=a/d

A与R如何对W* 产生影响呢,显然有:

A= W*B+ W*R (4) 式(4)是R-A坐标系中过(-B,0)点,斜率为W* 的直线。

我们知道,人通过饮食摄入的能量不能低于维持人体正常生理功能所需要的能

量,因而减肥指标存在着一个下限W1,当W*〈W1时,表明能量摄入过低,不能维持人的正常生理功能所需,时间长了就有饿死的危险,我们称W1为减肥临界指标。

人们为减肥所采用的各种劳动和活动也有一个人体所能承受的范围,因而能量消耗存在着一个上限R1,否则虽没饿死,有可能累死,我们记为0

A区表明能量的摄取量高于体重为W0时的消耗量W0(B+R),这时体重不会从W0减少,称为非减肥区。日本相扑运动员增肥时,一定经过这个区。

C区表明能量的摄取是A低于体重为W1时的消耗是W1(B+R),因为W1为减肥临界指标,所以C区为危险减肥区,饿死的美女都落在这个区。

只有B区所表示的能量摄取量A与劳动和活动消耗量R的组合才能实现有效的减肥,故称B区为有效减肥区。上图还表明,活动量不变,只是一味节食,或饭量不变,只是一味加大活动量,都不能产生理想的减肥效果,两个因素必须协调。

上述减肥模型是从总体上构成的,忽略了年龄、性别、遗传、健康状况等个体差异。但减肥是个对症下药的个体行为,而个体差异对减肥的影响较大,有的人有遗传,是祖传的胖子,有的人吃多少东西都胖不起来,有的人喝凉水都长肉。因此,读者如果有兴趣,可以对自己的减肥状况进行一段时间的观察,记录下自己饮食的种类和数量,劳动和活动的种类和数量,将其核算成以焦耳或卡路里为单位的能量,利用减肥模型估计出自己的参数,科学有效地指导减肥。

本文的目的是想给大家提个醒儿,不要盲目减肥,要树立科学的减肥观念。可能会有读者责问:“按照你们故事里教的秘诀,不但减肥没有成功,反而更胖了,

怎么办”。好办,笔者再给您支一招儿,去学唱歌,身宽体胖底气足,可能会产生音箱的效果,特别适合唱美声。请看下一回,统计与音乐的交融,科学与艺术的平均。

第五回统计与音乐的交融科学与艺术的平均音乐是人类灵魂从计数中感受到而没有意识到这是计数的那种快乐。

——莱布尼兹

声音是由物体的振动产生的,不论是音乐,还是噪声;不论是嘹亮悦耳,富有穿透力的抒情男高音,还是摇头晃脑,五音不太全的通俗女杂音儿,都是从振动源,如嗓子、胸腔等,在三维空间上向外行进。当这些振动到达我们的耳膜时,耳膜的振动就把信息传提到我们的脑中,于是造成了听觉。通俗地讲,音乐就是高于20赫兹,我们的耳朵能感受到的那种美好的动静儿。

为什么音乐有高音和低音呢,一般来讲,这和发声体的振动频率有关。如何描述音乐中声音的高度呢,最开始用的是由七个阿拉伯数字组成的简谱,后来发展成由小蛤蟆骨朵组成的五线谱。简谱是一位法国修道士苏埃蒂于1665年首先使用的。上世纪初我国留学生沈心工、李叔同等从日本引入我国的。

七个阿拉伯数字加上休止符、节拍等音乐符号,进行各种排列组合便形成了乐谱。十个阿拉伯数字加上各种数学符号便可组成数学和统计学的研究内容。但音乐与统计学不仅仅是形似。若干世纪以来,音乐与数学、统计学一直被联系在一起。所不同的事,从理论上讲十个音符比七个音符能组合出更丰富的乐章。

声乐的奠基人、德国物理学家亥姆霍兹说:“音调、响度和音色是音乐的三个主观量。”关于音乐这三大要素的研究与统计学有着不解之缘。

音调与频率有密切的关系,但他们又不是按严格的比例对应的。早在古希腊、毕达哥拉斯学派就发现,频率每提高一倍,音调又回到同一个调,但提高了八度,略有偏低,还要把频率再提高一点,以适应人的听觉。同理,低音部分则听感偏高,又需要将频率调低一点。

两个相差八度的音之间可再划分若干个音,它们按顺序排列起来形成音阶。有七个音的叫七声音阶,有十二个音的叫半音阶,还有五个音的叫五声音阶。五声音阶比七声音阶少了4和7两个半音。五声音阶现已不常用,它在我国公元前21世纪就产生了。所以现在形容一个人唱歌音不准时,常称他五音不全。

数学小故事集合1

数学小知识集合 1.符号“+”“-”是五百年前一位德国人最先使用的。当时他们并不表示“加上”“减去”。知道三百多年前才正式用来表示“加上”“减去”。 2.“七巧板”是我国古代的一种拼板玩具,有七个块可以拼成一个大正方形的薄板组成,拼出来的图案变化万千。后来传到国外叫做“唐图”。“七巧板”流传到今天,成为人们喜爱的一种智力玩具。 3.传说早在四五千年前,我们的祖先就用一种滴水的器具来计时,名叫刻漏。 4.乘号“×”是三百多年前一位英国数学家最先使用的。因为乘法是一种特殊的加法,所以他把加号斜过来表示。 5.公元前46年,罗马统帅儒略·恺撒指定历法。由于他出生在7月,为了表示他的伟大,决定将7月改为“儒略月”,连同所有的单月都规定为31天,双月为30天。这样一年多出一天,2月是古罗马处死犯人的月份,为了减少处死的人数,将2月减少1天,为29天。 6.小方是一个木匠,但他很傲慢,有一天,师傅问他:“桌子有4个角,我砍去一个,还剩几个?”小芳说4-1=3,三个。师傅告诉他,有5个 7、数字趣联 宋代大诗人苏东坡年轻时与几个学友进京考试.他们到达试院时为时已晚.考官说:"我出一联,你们若对得上,我就让你们进考场."考官的上联是:一叶孤舟,坐了二三个学子,启用四桨五帆,经过六滩七湾,历尽八颠九簸,可叹十分来迟. 苏东坡对出的下联是:十年寒窗,进了九八家书院,抛却七情六欲,苦读五经四书,考了三番两次,今日一定要中. 考官与苏东坡都将一至十这十个数字嵌入对联中,将读书人的艰辛与刻苦情况描写得淋漓尽致. 8、大约1500年前,欧洲的数学家们是不知道用“0”的。他们使用罗马数字。罗马数字是用几个表示数的符号,按照一定规则,把它们组合起来表示不同的数目。在这种数字的运用里,不需要“0”这个数字。 而在当时,罗马帝国有一位学者从印度记数法里发现了“0”这个符号。他发现,有了“0”,进行数学运算方便极了,他非常高兴,还把印度人使用“0”的方法向大家做了介绍。过了一段时间,这件事被当时的罗马教皇知道了。当时是欧洲的中世纪,教会的势力非常大,罗马教皇的权利更是远远超过皇帝。教皇非常恼怒,他斥责说,神圣的数是上帝创造的,在上帝创造的数里没有“0”这个怪物,如今谁要把它给引进来,谁就是亵渎上帝!于是,教皇就下令,把这位学者抓了起来,并对他施加了酷刑,用夹子把他的十个手指头紧紧夹注,使他两手残废,让他再也不能握笔写字。就这样,“0”被那个愚昧、残忍的罗马教皇明令禁止了。 但是,虽然“0”被禁止使用,然而罗马的数学家们还是不管禁令,在数学的研究中仍然秘密地使用“0”,仍然用“0”做出了很多数学上的贡献。后来“0”终于在欧洲被广泛使用,而罗马数字却逐渐被淘汰了。二十一世纪从哪年开始? 世纪是计算年代的单位,一百年为一个世纪. 第一世纪的起始年和末尾年,分别是公元1年和公元100年.常见的错误是有人把起始年当作是公元零年,这显然不符合逻辑和我们的习惯,因为在一般情况下,序数的计算是从“1”开始的,而不是从“0”开始的。而正是这个理解上的错误,所以才导致了世纪末尾年为公元99年的错误认识,这也是错把1999年当作是二十世纪末尾年,错把2000年当作是二十一世纪起始年的原因.因为公元计数是序数,所以应该从“1”开始,21世纪的第一年是2001年.

趣味数学故事大全

趣味数学故事大全 路遇哪吒:八戒正往前走,忽听背后有人叫他:“老猪,好自在啊!”八戒回头一看,是托塔天王的三太子哪吒。 八戒摇晃着脑袋说:“这不是那个三头六臂的妖精吗?” 哪吒听八戒叫他妖精,勃然大怒,大喝一声:“变!”随即变做三头六臂,6只手分别拿着6件兵器:斩妖剑、砍妖刀、缚妖索、降妖杵、绣球儿、火轮儿,恶狠狠地朝八戒打来。 八戒不敢怠慢,舞动钉耙迎了上去,两人“叮叮当当”地打了起来。过了一阵子哪吒见没占到便宜,又喊了一声:“换!”6只手拿着的兵器立刻交换了一下位置。就这样哪吒不断变换着兵器的拿法,可把八戒打晕了。 八戒连连摆手说:“不打啦,不打啦,我说你这6只手一共有多少种不同的拿法?” “720种!”哪吒神气活现。 “吹牛!”八戒把大嘴一撇说,“有个二三十种我还信,720种?你别骗我啦!” 哪吒让5只手依次拿着斩妖剑、砍妖刀、缚妖索、降妖杵、绣球儿,对八戒说:“你看,我5只手拿的兵器固定不变,这时我第6只手只有拿火轮儿这一种拿法。” 八戒点点头说:“嗯,不错,就一种拿法。” 哪吒又让4只手依次拿着斩妖剑、砍妖刀、缚妖索、降妖杵,这时第5、6只手可以轮换拿绣球儿、火轮儿,共有两种拿法。 哪吒再让3只手依次拿着斩妖剑、砍妖刀、缚妖索,而另3只手变换出以下6种拿法: 降妖杵、绣球儿、火轮儿; 降妖杵、火轮儿、绣球儿; 绣球儿、降妖杵、火轮儿; 绣球儿、火轮儿、降妖杵; 火轮儿、绣球儿、降妖杵; 火轮儿、降妖杵、绣球儿。

八戒摸摸脑袋说:“这要是6只手都随便拿可怎么个排法呀?还不排晕喽!” 哪吒笑骂着:“真是个呆子!你观察一下下面的3个数:1=1,2=1×2,6=1×2×3。由此推想:如果固定两只手,而剩下的4只手随意拿,可有1×2×3×4×=24种拿法。而6只手都随意拿呢?有1×2×3×4×5×6=720种不同拿法。” 八戒向哪吒一拱手:“你的变化真多,我服了。” 大约1500年前,欧洲的数学家们是不知道用“0”的。他们使用罗马数字。罗马数字是用几个表示数的符号,按照一定规则,把它们组合起来表示不同的数目。在这种数字的运用里,不需要“0”这个数字。 而在当时,罗马帝国有一位学者从印度记数法里发现了“0”这个符号。他发现,有了“0”,进行数学运算方便极了,他非常高兴,还把印度人使用“0”的方法向大家做了介绍。过了一段时间,这件事被当时的罗马教皇知道了。当时是欧洲的中世纪,教会的势力非常大,罗马教皇的权利更是远远超过皇帝。教皇非常恼怒,他斥责说,神圣的数是上帝创造的,在上帝创造的数里没有“0”这个怪物,如今谁要把它给引进来,谁就是亵渎上帝!于是,教皇就下令,把这位学者抓了起来,并对他施加了酷刑,用夹子把他的十个手指头紧紧夹注,使他两手残废,让他再也不能握笔写字。就这样,“0”被那个愚昧、残忍的罗马教皇明令禁止了。 但是,虽然“0”被禁止使用,然而罗马的数学家们还是不管禁令,在数学的研究中仍然秘密地使用“0”,仍然用“0”做出了很多数学上的贡献。后来“0”终于在欧洲被广泛使用,而罗马数字却逐渐被淘汰了。 小朋友你们可知道数学天才高斯小时候的故事呢? 高斯念小学的时候,有一次在老师教完加法后,因为老师想要休息,所以便出了一道题目要同学们算算看,题目是: 1+2+3+ ..... +97+98+99+100 = ? 老师心里正想,这下子小朋友一定要算到下课了吧!正要借口出去时,却被高斯叫住了!!原来呀,高斯已经算出来了,小朋友你可知道他是如何算的吗? 高斯告诉大家他是如何算出的:把 1加至 100 与 100 加至 1 排成两排相加,也就是说:1+2+3+4+ ..... +96+97+98+99+100 100+99+98+97+96+ ..... +4+3+2+1 =101+101+101+ ..... +101+101+101+101 共有一百个101相加,但算式重复了两次,所以把10100 除以 2便得到答案等于 <5050> 从此以后高斯小学的学习过程早已经超越了其它的同学,也因此奠定了他以后的数学基础,更让他成为——数学天才! 在日常生活中,数学无处不在,比如说:买菜、卖菜、算多少钱……

小学生数学故事:两个统计小故事

小学生数学故事:两个统计小故事 死记硬背是一种传统的教学方式,在我国有悠久的历史。但随着素质教育的开展,死记硬背被作为一种僵化的、阻碍学生能力发展的教学方式,渐渐为人们所摒弃;而另一方面,老师们又为提高学生的语文素养煞费苦心。其实,只要应用得当,“死记硬背”与提高学生素质并不矛盾。相反,它恰是提高学生语文水平的重要前提和基础。两个统计小故事 这两个故事都发生在二战期间,并且都是盟军方面机智的统计学家,数学在二战期间充当了十分重要的角色,今天说的是统计。 第一个故事发生在英国,二战前期德国势头很猛,英国从敦刻尔克撤回到本岛,德国每天不定期地对英国狂轰乱炸,后来英国空军发展起来,双方空战不断。 为了能够提高飞机的防护能力,英国的飞机设计师们决定给飞机增加护甲,但是设计师们并不清楚应该在什么地方增加护甲,于是求助于统计学家。统计学家将每架中弹之后仍然安全返航的飞机的中弹部位描绘在一张图上,然后将所有中弹飞机的图都叠放在一起,这样就形成了浓密不同的弹孔分布。工作完成了,然后统计学家很肯定地说没有弹孔的地方就是应该增加护甲的地方,因为这个部位中弹的飞机都没能幸免于难。 “教书先生”恐怕是市井百姓最为熟悉的一种称呼,从最初的

门馆、私塾到晚清的学堂,“教书先生”那一行当怎么说也算是让国人景仰甚或敬畏的一种社会职业。只是更早的“先生”概念并非源于教书,最初出现的“先生”一词也并非有传授知识那般的含义。《孟子》中的“先生何为出此言也?”;《论语》中的“有酒食,先生馔”;《国策》中的“先生坐,何至于此?”等等,均指“先生”为父兄或有学问、有德行的长辈。其实《国策》中本身就有“先生长者,有德之称”的说法。可见“先生”之原意非真正的“教师”之意,倒是与当今“先生”的称呼更接近。看来,“先生”之本源含义在于礼貌和尊称,并非具学问者的专称。称“老师”为“先生”的记载,首见于《礼记?曲礼》,有“从于先生,不越礼而与人言”,其中之“先生”意为“年长、资深之传授知识者”,与教师、老师之意基本一致。 单靠“死”记还不行,还得“活”用,姑且称之为“先死后活”吧。让学生把一周看到或听到的新鲜事记下来,摒弃那些假话套话 空话,写出自己的真情实感,篇幅可长可短,并要求运用积累的成语、名言警句等,定期检查点评,选择优秀篇目在班里朗读或展出。这样,即巩固了所学的材料,又锻炼了学生的写作能力,同时还培养了学生的观察能力、思维能力等等,达到“一石多鸟”的效果。第二个故事与德国坦克有关。我们知道德国的坦克战在二战前期占了很多便宜,直到后来,苏联的坦克才能和德国坦克一拼高下,坦克数量作为德军的主要作战力量的数据是盟军非常希望获得的情报,有很多盟军特工的任务

统计学案例

统计学案例 总量指标与相对指标 案例1:指出下面得统计分析报告摘要错在哪里?并改正: 1、本厂按计划规定,第一季度得单位产品成本应比去年同期降低10%,实际执行结果就是,单位产品成本较去年同期降低8%,仅完成产品成本计划得80%(即8%÷10%=80%)。 2、本厂得劳动生产率(按全部职工计算)计划在去年得基础上提高8%,计划执行结果仅提高4%,劳动生产率得计划任务仅实现一半(即4%÷8%=50%)。 3、该车间今年1月份生产老产品得同时,新产品首次小批投产,出现了2件废品(按计算,车间废品率为1、2%)。2月份老产品下马,新产品大批投产,全部制品1000件,其中废品8件,废品量就是1月份得4倍,因此产品质量下降了。 4、在组织生产中,本厂先进小组向另一组提出高产优质得挑战竞赛。本月先进小组得产量 超过了另一小组得1倍,但就是在两组废品总量中该组却占了60%,所以在产品质量方面,先进小组明显地落后了。 案例11 案例2:根据下表资料分析哪个企业对社会贡献更大? 平均指标与变异指标 案例3、以组平均数补充说明总平均数 根据上表资料分析哪个村成绩更好?为什么? 案例4:某单位有10个人,其中1人月工资为10万元,9人每人月工资为1000元。该单位职工月平均工资为10900元。即:

)(1090010 9 1000100000元=?+ 您认为这个平均数有代表性吗?如果缺乏代表性应如何改正? 案例5:以下就是各单位统计分析报告得摘录 1、 本局所属30个工厂,本月完成生产计划得情况就是不一致得。完成计划90%得有3个, 完成96%得有5个,完成102%得有10个,完成110%得有8个,完成120%得有4个。平均全局生产计划完成程度为104、33%。 即: 30 4 %1208%11010%1025%963%90?+?+?+?+?=104、33% 2、 本厂开展增产节约运动以后,产品成本月月下降,取得显著得成绩,根据财务部门得报 告,1 月份开支总成本15000元,平均单位产品成本为15元,2月份开支总成本25000元,平均单位产品成本下降为10元,3月份开支总成本45000元,平均单位产品成本仅 8元。这样,第一季度平均单位产品成本只为11元( 。 元)113 8 1015=++ 以上报告所用平均指标就是否恰当?如果不恰当应如何改正? 案例6、变异指标与平均指标得结合运用 案例7、录取中有无歧视? 某高校只有两个系---------财经系(文科)与工程系(理科)。该校报考及录取得总体情况如表2、1所示 如果我们只瞧该校男女生录取得比率,即男生为3500/8000=44%,女生为2000/8000=33%。这时我们不免会问,就是男同学得成绩比女同学好,还就是在录取中存在着性别得歧视? 继续收集数据并得到两个系各自录取得男女生数据,如表2、2所示。 表2、2两个系得报考及录取情况 有了各系得录取数据,不难瞧到工程系录取得人数比较多,男女生录取得比率都就是

浅析统计学的起源

浅析统计学的起源 摘要从逻辑和历史两个角度对推断统计学的起源进行了尝试性的索关键词:统计史;起源 引言:史学研究历来受思想家们的重视,说史学研究应成为任何学科永恒的研究主题丝毫也不过分,因为早在两千多年前,中国古代伟大的思想家孔子,在论语中就曾留下了温故而知新的至理名言,而16世纪著名的英国哲学家培根也曾说过,读史使人明智。如果套用统计学里的一句专业术语,那就是历史具有遍历性。。 任何历史研究都必须首先限定其研究的时间范畴,对于推断统计史而言,一个首要问题就是:推断统计学的历史应该从哪里开始?为说明这个问题,我们首先探究一下统计学是什么。按一般统计学教材或百科全书上的定义:统计学是一门关于如何有效地收集、整理、表述、分析和解释数据的学科。其中的数据即为统计学的研究对象,因此统计学也被认为是一门从数据中获得有用信息的数据分析学科。需要强调的是,统计学研究的数据一定要具有随机性,也就是说可以通过某种概率分布规律来描述数据的分布状态,这一点也是统计学有别于其他处理数据学科的最重要特征。 在上述统计学的定义下,统计学又可划分为描述统计与推断统计。描述统计是一种通过图形、列表、数量化度量等方法描述样本数据基本特征的统计方法,其作用是对样本数据进行初步精炼,虽然在很多情况下样本数据的特征可用来推断总体的特征,但这需要给出推断的误差精度,由于描述统计中不包含任何关于误差精度的陈述,故

其结论也就仅局限于样本数据,与总体无关,从而也不存在推断问题。不过统计学的终极目的是希望通过样本来获取总体信息,故推断统计,即利用样本信息以及其它信息,获取有关样本所处总体信息的推断理论,就成为描述统计进一步发展的必然产物。下面我们引述有关文献给出的几个相当久远的例子加以说明。 古印度部落国王图潘纳为了炫耀自己的数学能力,他告诉自己的马车夫纳拉一个被放逐的国王,说他猜测出了一颗巨大果树两个枝干上的树叶与果实的数量,纳拉经过一夜的计算,吃惊地发现图潘纳的猜测非常接近实际的真实数量。这个故事来源于印度史诗摩诃婆罗多它最迟完成于公元400年。相当多的现代学者们认为,图潘纳是通过计算某一个典型小枝上树叶与果实的数量后,将其乘以整个果树上小枝的个数得到他的猜测的。 在伯罗奔尼撒战争中,古希腊的雅典人曾采取过架云梯突破敌人城墙的方法。由于建造适当高度的云梯就必须知道敌方城墙的高度,为此雅典人采取了如下方法来估算城墙高度:首先派一些士兵同时数前方敌城裸露部分城墙所砌砖的层数。虽然有一部分士兵的计数会发生错误,但大多数的计数结果应该是正确的,特别是出现最频繁的层数与那部分无法看见的城墙的层数会足够接近。然后通过猜测出来的城砖厚度乘以最频繁的层数估算出城墙的高度。这个故事来源于古希腊历史学家修西得底斯所著的伯罗奔尼撒战争史 应该说在我们给出的这些例子中,古人所使用的推断方法在形式上是属于推断统计学的,但这些方法没有给出有关推断结果的不确

生活中的统计学小例子

生活中的统计学小例子 1、鞋子的尺码,因为成年女子鞋码以37为多数,所以无论生产与配货时,都要多一些。 2、某区域里人的工资与消费水平有关,因为这个区域以3500元/月的人数最多,所以消费水平就要以他们为主。 3、卫生间台面与身高有关,因为单位里男子的身高以172cm为最多,人数占85%,所以台面高度设计就要以他们的身高为参考。 4、某学校某班开联欢会,买水果的数量与同学们的口味有关,因为大家都喜欢吃香蕉,所以就要多买点。 5、菜摊上买菜不许挑,价格与人们的接受心理有关,因为每十个西红柿中有二个烂的是人们的心理接受极限,所以搭配时就不能超过这一比例。 6、买车险与车出险概率有关,因为车辆的刮碰情况出现的多,所以车损险就必须买。 7、碰运气与中奖有关,因为中奖是一个小概率事件,所以我们不能寄希望于中奖来改变自己的生活。

8、人气与点击率有关,因为写网络小说的点击率要达到1000以上,才能成功,所以选一家大的阅读网络就很重要。 9、打字时,因为左手使用频率要比右手高,所以打字的速度往往决定于左手。 10、因为生活中不如意事常十居八九,所以乐观就很重要,常体会那如意之一二,忘了那十之八九,幸福就会不期而至。 篇二 由于战争,德国有一个时期物资特别紧缺,对面包实行配给制:政府把面粉发给指定的面包房,面包师傅烤好了面包再发给居民。有一个统计学家,怀疑他所在区域的面包师傅私扣面粉,于是就天天称自己的面包。几个月以后,他去找面包师傅,说:“政府规定配给的面包是400克,因为模具和其他因素,你做的面包可能是398、399克,也可能是401、402克,但是按照统计学的正态分布原理,这么多天的面包重量平均应该等于400克,可是你给我的面包平均重量是398克。我有理由怀疑是你使用较小的模具,私吞了面粉。”面包师傅承认确实私吞了面粉,并再三道歉保证马上更换正常的模具。又过了几个月,统计学家又去找这个面包师傅,说:“虽然这几个月你给我的面包都在400克以

数学趣味小故事20字

数学趣味小故事20字 数学家同女朋友在公园漫步。女朋友问他:"我满脸雀斑,你真的不介意?" 数学家温柔地回答:"绝对不!我生来最爱跟小数点打交道。" ------------------------ 爱的圆圈 一对青年男女坐在沙滩上。男青年在地上划个圆圈说道:"我对你的爱,就像这 圆圈一样,永远没有终点。" 女青年也用手指在地上划个圆,然后说:"我对你的爱,永远没有起点"。 ------------------------ 抽象 我的朋友的一个朋友一次在餐馆里喝多了几杯。营业时间已经过去快一个钟头了。 服务员来提醒能够走人了。当时,那位大侠说了一句很震动人的话。 他是这么说的。"你别惹我,不然我一拳把你打得很抽象。" ------------------------ 消防 一天,数学家觉得自己已受够了数学,于是他跑到消防队去宣布他想当消防员。消防队长说:"您看上去不错,不过我得先给您一个测试。" 消防队长带数学家到消防队后院小巷,巷子里有一个货栈,一只消防栓和一卷软管。消防队长问:"假设货栈起火,您怎么办?"数学家回答:"我把消防栓接到软管上,打开水龙,把火浇灭。"

消防队长说:"完全准确!最后一个问题:假设您走进小巷,而货栈没有起火,您怎么办?"数学家疑惑地思索了半天,终于答道:"我就把货栈点着。" 消防队长大叫起来:"什么?太可怕了!您为什么要把货栈点着?" 数学家回答:"这样我就把问题化简为一个我已经解决过的问题了。" ------------------------ 数学家的幽默 一名统计学家遇到一位数学家,统计学家调侃数学家说道: 你们不是说若X=Y且Y=Z,则X=Z吗!那么想必你若是喜欢一个女孩,那么那个女孩喜欢的男生你也会喜欢罗!?" 数学家想了一下反问道: 那么你把左手放到一锅一百度的开水中,右手放到一锅零度的冰水里想来也没事吧!因为它们平均不过是五十度而已!" ------------------------ 测谎器 爸爸有一个测谎器,他问儿子:"你今天数学成绩如何呢?" 儿子答道:"90分。"测谎器响了。 儿子又改说:"70分。"测谎器还是响了。 爸爸很生气地叫道:"我以前都是90分以上。"这时,测谎器没有响却翻倒了。 ------------------------ 关心 教授是个和善而幽默的老头,班上有个高大强壮的体育生。每次上课当教授的声

统计学不得不说的二三事

统计学不得不说的二三事 毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI 杂志上,乱用统计学的现象多如牛毛。还有很多医疗同行,对于统计甚为迷恋,能统计的也统计,不能统计创造条件也要统计,看见P小于0.05比亲爹还亲爹。话说,统计是门很有神奇的学科,在讲之前我又要开始讲几个冷笑话,看懂了的可以举手。 话说:你知道吗,这个世界上绝大多数人拥有的腿的数量高于平均值?(第一遍没有看懂的小伙伴可以去面壁) 再讲一个:你知道一个普通的民众有多笨吗?世界上一半的人都比他更聪明。(其实这是不对的,世界上一多半的人都比他更聪明。因为人类的智能有上限,愚蠢却没有下限,所以不是一个完美的正态分布。) 不过瘾,再讲一个:曼德勃罗有一次说,他出生在波兰,但在法国上的学,所以平均而言他是个德国人。(所以,我出生在广东,但在东北上过学,所以平均而言我是个湖北人……) 好冷好冷,我们还是来讲点正事,分享几则统计小故事。1、两个指标诊断疾病的问题 路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。路人甲以A和B的参考范围上限作为诊断界值,

得出了A和B在该界值下对应的诊断敏感性和特异性。结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A 和B的诊断价值。文章的结论到底是想说明A优秀还是B 优秀呢?Reject!这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。稿件被退了,路人甲有些许郁闷。经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。路人甲很快绘制了ROC曲线,统计结果表明,A的曲线下面积为0.80,B的曲线下面积为0.82。路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:B的诊断效率是优于A 的,其理由就是因为B的曲线下面积大于A。路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上看,B的曲线下面积高于A,

统计学实训资料例子

关于大学生上网情况的调查报告 调查过程 为了了解现代大学生的上网情况,本人策划并在全校针对大学生上网情况进行了调查。调查时间是从6月21号到6月25号。21号上午制定了调查方案, 21号下午将调查需要的表格进行打印,由于制作样本框需要了解有多少寝室,所以我到生活老师那对寝室进行了了解。最后制作出样本框并抽出了25个寝室进行调查。依照策划我22、23号分别对抽到的寝室进行了调查,并对资料进行了整理。24号回到教室对调查的资料涉及的数据进行了计算。25号写出本次调查的报告。 成果展示及分析 通过这次调查我了解了农校大一、大二在校大学的上网情况。并得到了一些相关数据。数据如下: 上网花费/月(元)(一) 由以上数据可得: 平均数X=46.9 标准差=19.96 平均误差=1.44 极限误差=2.88 平均数区间44.02

平均数X=704 标准差=179 平均误差=12.88 极限误差=25.76 平均数区间678.24

几则很有趣的医学统计学故事

几则很有趣的医学统计学故事 医学统计学是一门很奇妙的科学。要说它简单吧,其实也挺简单的,常见的统计方法也就十余种,在教科书上都能找到,只要熟练掌握了,虽不敢夸下海口说可以“以秋风扫落叶的气概横扫四海之内的杂志”,但足以轻车熟路地应付99%的科学研究。要说它复杂吧,也挺复杂的,毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。 很多同行在学习医学统计学时,都在抱怨自己很难走出“一学就会,一会就用,一用就错,一错就懵”的怪圈。究其原因,主要是部分同行学习医学统计学时都抱着一副“依葫芦画瓢”的态度,试图“套用统计学方法”来解决自己面临的问题,而不去仔细思考统计学方法的来龙去脉。本文拟谈几则与医学统计学相关的故事,希望能帮助大家从宏观上正确认识医学统计学这门科学。 1、两个指标诊断疾病的问题 路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。路人甲以A和B 的参考范围上限作为诊断界值,得出了A和B在该界值下对应的诊断敏感性和特异性。结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。 路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A和B的诊断价值。文章的结论到底是想说明A优秀还是B优秀呢?Reject! 这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。 稿件被退了,路人甲有些许郁闷。经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。路人甲很快绘制了ROC 曲线,统计结果表明,A的曲线下面积为0.80,B的曲线下面积为0.82。路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:B的诊断效率是优于A的,其理由就是因为B的曲线下面积大于A。 路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上看,B的曲线下面积高于A,但是导致这种差异的原因有两种,一种是抽样误差,一种是试验效应,即B确实是高于A的。你怎么能确定这不是抽样误差呢?在统计学上,要确定0.82是否高于0.80,就一定要经过统计学检验的。Reject! 这个故事说明:在医学科研中,没有经过统计学检验的结论多半是不科学的。

统计学的故事

统计学的故事 纪宏袁卫文 2004年1月

第一回人类发现①了统计统计改变了世界若想了解上帝在想什么,我们就必须学统计,因为统计学就是在量测他的旨意。 ——南丁格尔 列位,一般故事或小说的开头总是写的比较虚,没有什么干货,只是交代一些背景。平均说来,到了第三回主要人物才出现,到了第五回矛盾冲突才展开。本文也决不敢例外。 大千世界,芸芸众生,悠悠上下五千年,坐地日行八万里。这个世界所在的宇宙真奇妙,时间上没头没尾,空间上没边没沿。世界上的万物真复杂,自然界和人类社会好像都受到某种力量和规律的支配,可怜的是我们还无法确切地认识、把握这些力量和规律,偶然事件常常捉弄我们的命运。这个世界上的人们真倔,非要把这个很难描述的世界,包括客观世界和我们的主观世界整明白不可,大到宇宙空间,小到基因和纳米,探索者前仆后继,没完没了。 任何值得一提的文明都探索过真理,冥思苦想的人们尽管不能完全确切的,但总是试图解释复杂多变的自然现象和人类自身。 在很早很早以前,人们认为自然是神秘、无序,甚至是恐怖的。而人类自身也有很多谜题,例如,人类为何定居在这个地球上,人生的目的是什么,人类的终极归宿何在,等等。这些问题的答案一般是由宗教领袖给出的。 过了很多很多年,智者、思想家和勇敢的科学先驱们,或统称为人民,逐渐摒弃了上帝按其意愿创造了人和物质世界的信仰。他们发现人类有智慧,用思维,佐以观察或实验,就能够发现各种谜一样的自然活动和人们自己。他们用思维与似乎瞬息万变的现象抗争,并将理性之光洒于其上。先驱的态度是理性的、批判的和反宗教的。由于他们的态度较好,终于得出了这样一些结论:自然和人类社会是有序的,按完美的设计而恒定地运行着,从星体的运动到树叶的颤动,从人们的行为到人们的观念,所有感官能感知的东西都能用一种精确、和谐而理想的 ①我们实在想不通,用“发现”和“发明”哪个词更符合实际。

统计学小故事(一)素材尕多烈

人教版小学数学第六册第三单元 《复式统计表》课后连接1 统计学小故事(一) 养猴人心中暗笑:“朝四暮三和朝三暮四,不是都等于七吗?这畜牲就是不如人聪明。”猴子们窃窃私语:“朝四暮三和朝三暮四,虽然吃到肚子里都等于七,但朝四暮三更符合早吃饱、晚吃少的科学道理,不信去问问费雪。人虽然比我们聪明,但没学过统计的人,智商还真不如我们高”。 ——新编《齐物论》 统计学小故事(二) 这两个故事都发生在二战期间,并且都是盟军方面机智的统计学家,数学在二战期间充当了十分重要的角色,今天说的是统计。 第一个故事发生在英国,二战前期德国势头很猛,英国从敦刻尔克撤回到本岛,德国每天不定期地对英国狂轰乱炸,后来英国空军发展起来,双方空战不断。

为了能够提高飞机的防护能力,英国的飞机设计师们决定给飞机增加护甲,但是设计师们并不清楚应该在什么地方增加护甲,于是求助于统计学家。统计学家将每架中弹之后仍然安全返航的飞机的中弹部位描绘在一张图上,然后将所有中弹飞机的图都叠放在一起,这样就形成了浓密不同的弹孔分布。工作完成了,然后统计学家很肯定地说没有弹孔的地方就是应该增加护甲的地方,因为这个部位中弹的飞机都没能幸免于难。 第二个故事与德国坦克有关。我们知道德国的坦克战在二战前期占了很多便宜,直到后来,苏联的坦克才能和德国坦克一拼高下,坦克数量作为德军的主要作战力量的数据是盟军非常希望获得的情报,有很多盟军特工的任务就是窃取德军坦克总量情报。然而根据战后所获得的数据,真正可靠的情报不是来源于盟军特工,而是统计学家。 统计学家做了什么事情呢?这和德军制造坦克的惯例有关,德军坦克在出厂之后按生产的先后顺序编号,1,2,…,N,这是一个十分古板的传统,正是因为这个传统,德军送给了盟军统计学家需要的数据。盟军在战争中缴获了德军的一些坦克并且获取了这些坦克的编号,现在统计学家需要在这些编号的基础上估计N,也就是德军的坦克总量,而这通过一定的统计工具就可以实现。

统计学的魅力

统计学的魅力 ——2013-2014学年暑期《女士品茶》读书心得体会放假期间,阅读了老师推荐的美国统计学家萨尔斯伯格所写的《女士品茶》这本书,一开始看到书名时,我以为这是一本与女性或者茶有关的书籍,正纳闷为什么这样一本书会和统计学有关时,我开始阅读如此一本“统计学”书籍,但是,当开始慢慢展开阅读后,我发现这是在英国剑桥一个夏日的午后,一群人坐在一起品茶,而其中一位女士提出把茶加进奶里,或把奶加进茶里,不同的做法,会使茶的味道品起来不同。这样的“胡言乱语”让一个身材矮小、戴着厚眼镜、下巴上蓄着的短尖髯开始变灰的先生即休·史密斯起了兴趣,并设计了一系列的实验来验证这一说法。而实验的结果是那位女士竟然正确地分辨出了每一杯茶!就是这样的一个小故事,带领我们一起走进了统计学的世界。 《女士品茶》一书不像我想象中那样枯燥繁琐,让人提不起兴趣,相反的,它的书名新颖独到,内容新意盎然。正如萨尔斯伯格所说:“我所选择贯穿20世纪统计学复杂理论的主线是与别人不同的。我希望读了本书后能有所启发,去进一步了解统计革命的内涵。”。通过一些趣味盎然的统计发展故事,这本书的确给那些不懂或只是略懂数学的人带去了对统计学的兴趣。一改过去统计学只有越难才越有价值的观念。作为一本讲统计学的书,平均数、标准差、估计值、概率、正态概率分布随机变量等等一系列的概念和术语,自是绵亘不绝,但是不同于其他书的是,这些概念和术语的背后,是一个个统计大师鲜活的形象、是一段段他们探索创新,历尽坎坷的人生故事。故事中穿插着大师们睿智的珍言、友谊的情怀、幽默的细节、个性的遭际,像一个个人生的小舞台剧,富含着哲理和知识。让人感觉到,大师之所以为大师是因为即使是生活的问题,在他们眼中也是有研究的意义的。 例如“可爱的戈赛特先生”中,戈赛特先生给我留下了深刻的映象。戈塞特先生是爱尔兰都柏林吉尼斯酿造公司的负责大伦敦区业务的主管,在进入公司之初他是牛津大学的新秀,拥有化学和数学两个学位,当时公司雇佣他是因为他的化学专长,在该公司看来,作为一个酿酒企业,数学对于他们来说是没有作用的,但是戈塞特对公司做出的第一个贡献就是以数学家的身份完成的。因为酿酒是需要进行麦芽浆发酵的,在发酵的时候就需要测量用酵母的量,这时就需要用到数

对於统计学的看法与小故事范例

對於統計學的看法與小故事範例 班級:閩廣3 學號:A4522594 姓名:林敏 指導老師:陶聖

目錄 1、我對於統計學的初步認識?????????? 3 2、小故事之一???????????????? 4 3、小故事之二???????????????? 6 4、小故事之三???????????????? 7 5、小故事之四???????????????? 8 6、小故事之五???????????????? 9 7、學習心得????????????????? 11

我對於統計學的初步認識 統計學是在資料分析的基礎上,自17世紀中葉產生並逐步發展起來的一門學科。它是研究如何測定、收集、整理、歸納和分析反映資料資料,以便給出正確訊息的科學。谷歌給出的解釋太書面太拗口太籠統不好記憶與理解。在我看來,統計學如字面所說,是一門有關“統計”的學科,是一種讓問題更快找到答案的輔助方法,運用的好可以輕鬆的事半功倍。當然這只是我初步的淺薄認識。 目前統計廣泛地應用在各門學科,從自然科學、社會科學到人文學科,甚至被用來工商業及政府的情報決策之上。並且與資訊、計算等領域密切結合,是資料科學(Data Science)中的重要主軸之一。而關於統計學的歷史,我從網絡資料上了解到統計手法最早可以追溯至公元前5世紀。最早的統計著作來自公元9世紀的《密碼破譯》,由阿拉伯人肯迪編著。在書中,肯迪詳細記錄了如何使用統計資料和頻率分析進行密碼破譯。根據沙烏地阿拉伯工程師易卜拉欣·阿凱笛(Ibrahim Al-Kadi)的說法,統計學和密碼學分析便如此一同誕生了。 統計方法則包括實驗法、觀察法和實驗觀察法。統計研究中的共同目標是分析因果關係,具體來講就是從預估資料變化中得出結論,或是研究自變量與因變量之間的關係。方法概括起來很簡單,運用起來卻很靈活,書本知識的更好掌握需要更多的實踐。老師給我們上課理論知識會貫徹在實踐中來說,讓我們受益匪淺。 統計學的範疇和延伸學科都很廣,在這裏就不一一舉例了。條形統計圖是最容易使用、最容易理解的圖表了,它可以用手或電腦繪製而成。[13]不巧的是,許多人忽視其中的偏差、誤差,因為他們不留意。因此,雖然圖表品質低劣,但人們常常願意去相信。統計資料時常被濫用,對結果的解釋時常有利於演講者。[10]對統計的懷疑與誤導可被稱為:「世上有三種謊言:謊言,該死的謊言,統計數字」。許多對統計的濫用可能出於無意,也可能出於故意。老師在上課時特意強調了這個問題,統計學運用的好,得出的研究成果讓人受益匪淺;但倘若有心引誘,亂出題,採取不嚴謹的態度,樣本的可靠性可以被偏差破壞,得出的結果也將會南轅北轍。 统计学是一个枯燥的专业,我们要和大量的数据打交道,堆积如山的各式表格看了都让人害怕,更别说还要去整理和分析这一堆堆冷冰冰的数字了,不过,统计学又是一个有趣的专业,毕竟它是和生活紧密联系在一起的。

浅析统计学的起源

浅析统计学的起源

浅析统计学的起源 摘要从逻辑和历史两个角度对推断统计学的起源进行了尝试性的索关键词:统计史;起源 引言:史学研究历来受思想家们的重视,说史学研究应成为任何学科永恒的研究主题丝毫也不过分,因为早在两千多年前,中国古代伟大的思想家孔子,在论语中就曾留下了温故而知新的至理名言,而16世纪著名的英国哲学家培根也曾说过,读史使人明智。如果套用统计学里的一句专业术语,那就是历史具有遍历性。。 任何历史研究都必须首先限定其研究的时间范畴,对于推断统计史而言,一个首要问题就是:推断统计学的历史应该从哪里开始?为说明这个问题,我们首先探究一下统计学是什么。按一般统计学教材或百科全书上的定义:统计学是一门关于如何有效地收集、整理、表述、分析和解释数据的学科。其中的数据即为统计学的研究对象,因此统计学也被认为是一门从数据中获得有用信息的数据分析学科。需要强调的是,统计学研究的数据一定要具有随机性,也就是说可以通过某种概率分布规律来描述数据的分布状态,这一点也是统计学有别于其他处理数据学科的最重要特征。 在上述统计学的定义下,统计学又可划分为描述统计与推断统计。描述统计是一种通过图形、列表、数量化度量等方法描述样本数据基本特征的统计方法,其作用是对样本数据进行初步精炼,虽然在很多情况下样本数据的特征可用来推断总体的特征,但这需要给出推断

的误差精度,由于描述统计中不包含任何关于误差精度的陈述,故其结论也就仅局限于样本数据,与总体无关,从而也不存在推断问题。不过统计学的终极目的是希望通过样本来获取总体信息,故推断统计,即利用样本信息以及其它信息,获取有关样本所处总体信息的推断理论,就成为描述统计进一步发展的必然产物。下面我们引述有关文献给出的几个相当久远的例子加以说明。 古印度部落国王图潘纳为了炫耀自己的数学能力,他告诉自己的马车夫纳拉一个被放逐的国王,说他猜测出了一颗巨大果树两个枝干上的树叶与果实的数量,纳拉经过一夜的计算,吃惊地发现图潘纳的猜测非常接近实际的真实数量。这个故事来源于印度史诗摩诃婆罗多它最迟完成于公元400年。相当多的现代学者们认为,图潘纳是通过计算某一个典型小枝上树叶与果实的数量后,将其乘以整个果树上小枝的个数得到他的猜测的。 在伯罗奔尼撒战争中,古希腊的雅典人曾采取过架云梯突破敌人城墙的方法。由于建造适当高度的云梯就必须知道敌方城墙的高度,为此雅典人采取了如下方法来估算城墙高度:首先派一些士兵同时数前方敌城裸露部分城墙所砌砖的层数。虽然有一部分士兵的计数会发生错误,但大多数的计数结果应该是正确的,特别是出现最频繁的层数与那部分无法看见的城墙的层数会足够接近。然后通过猜测出来的城砖厚度乘以最频繁的层数估算出城墙的高度。这个故事来源于古希腊历史学家修西得底斯所著的伯罗奔尼撒战争史 应该说在我们给出的这些例子中,古人所使用的推断方法在形

数学故事之--生活中的统计学陷阱

生活中的统计学陷阱 在你听到一种统计关系时,可得慎重一些,千万不要轻率地对事件发生的因果关系做出判定,因为事情并不那么简单。 让我们来看几个不可轻率做出结论的例子。 ①统计资料表明,大多数汽车事故出在中等速度的行驶中,极少的事故是出在大于150公里/小时的行驶速度上。这是否就意味着高速行驶比较安全呢? 正确答案:绝不是这样。统计关系往往不能表明因果关系。由于多数人是以中等速度开车,所以多数事故是出在中等速度的行驶中。 ②有一个调查研究说脚大孩子的拼音比脚小的孩子好。这是否是说一个人脚的大小是他拼音能力的度量? 正确答案:不是的。这个研究对象是一群年龄不等的孩子。它的结果实际上是因为年龄较大的孩子脚大些,他们当然比年龄小的孩子拼得好些。 ③常常听说,汽车事故多数发生在离家不远的地方,这是否就意味着在离家很远的公路上行车要比在城里安全些呢? 正确答案:不是,统计只不过反映了人们往接是在离家不远的地方开车,而很少在远处的公路上开车。 ④有一项研究表明某一个国家的人民,喝牛奶和死于癌症的比例都很高。这是否说明是牛奶引起癌症呢? 正确答案:不对!原因是这个国家老年人的比例也很高。由于癌

症通常是年龄大的人易得,正是这个因素提高了这个国家癌症死亡者的比例。 上述例子表明,统计学论述在涉及因果关系时很容易造成误读。现代的广告,尤其是很多电视的商业广告正是以这种统计误读为根基的。 很多人以为自己是数学天才,直到遇见了极限 反比例函数是大家接触最早和最熟悉的函数之一,它的函数解析式是y=k/x (k为常数,k≠0)。我们利用反比例函数的解析式,就可以画出它的图像,如下图所示:

统计学中几个典型案例分析

第28卷第3期20199 河南教育学院学报!自然科学版) Journal of Henan Institute of Education(Natural Science Edition) Vol.28No.3 Sep.2019 dot:10.3969/j.issn.1007-0834.2019.03.011 统计学中几个典型案例分析 刘倩 (西安电子科技大学数学与统计学院,陕西西安710071) 摘要:在统计概率课程的教学中,转变教师的教育观念、更新教学内容已经成为当前提高课程教学质量的关键.在教学中教师应该注重理论知识与实际结合,通过引入大量的生动案例,培养学生统计思维的能力,并创造实践环境、夯实学生的基础知识,激发学生的学习兴趣? 关键词:统计思—;案例教学;统计建模 中图分类号:G642.0;0212,1文献标志码:A文章编号:1007-0834(2019)03-0049-05 0引言 统计是研究如何有效地收集、整理和分析带有随机性的数据以及由数据分析结果做出决策,为人们制定决策提供依据.日常生活中随处可见随机现象,概率就是研究随机现象统计规律的学科,它为人们认识客观世界提供了重要的思维模式和解决问题的方法,同时也为统计学的发展提供了坚实的理论基础.正如英国著名社会改革家、统计学家乔治威尔斯所说:“统计思维总有一天会像读和写一样成为一个有效率公民的必备能力.”然而,统计与概率知识被学生难以驾驭,这主要是由以下3个方面造成的. 1)传统的统计与概率教学体系是把统计与概率作为应用数学的一个分支,注重讲授统计、概率的基本原理及计算方法,忽视学生对方法产生背景和思想的理解,因此,传统的课堂教学模式人为地割裂了数学理论、教学方法与现实世界的联系,最终使得学生不能灵活运用所学知识分析解决具体问题. 2)由于统计与概率的内容从小学到初、高中均有涉及,学生从经历简单的数据统计过程,即从学习收集、整理和描述数据的方法到逐渐体会到抽样的必要性,从能够根据数据分析的结果做出简单的判断与预测到掌握用样本估计总体的思想,并进一步学习描述数据的方法和体会概率的意义.学生在教师引导下,已经逐步从“经历”过渡到“从事”某些简单统计活动.然而,已有的一些先入为主的概念和方法使得学生误以为大学阶段的统计知识不过如此,思想上不重视.但事实上,大学阶段除了要求学生掌握统计推断的一般理论和方法,厘清统计学中主要概念和方法产生的直观背景和实际意义,引导学生用数学的语言描述和研究随机现象外,更注重培养学生对数据的理解和分析能力,使其具备一定的综合应用所学知识分析和解决一些实际问题的能力,并为后续课程奠定基础. 3)教学过程中多以概率论为教学重点,而真正在实际中有重要应用价值的数理统计部分往往被轻视,使得学生在学完整门课程后仅仅记住了几个抽象的分布和定理,把统计学片面地理解为简单的加减乘除计算公式,甚至连最基本的数据处理分析方法和软件都不会应用. 随着西方统计学教学方法的逐步渗透,我国现代统计学教学体系也在不断进行改革,在教学中也越来越注重统计思想的传授、统计方法的实际应用.“如何将统计思想更好地传授给学生”已成为统计学教学面临的一个难题.我们必须遵从人类思维模式的发展规律,将形象思维与逻辑思维相结合,在情感、态度与价值观层面上,注重贴近生活,注重解决实际问题.笔者认为统计教学必须通过案例进行,通过案例建立学生的统计直觉,体会统计思维与确定性思维的差异,并建议通过计算机模拟帮助学生理解统计思想和原理,从而增强学生用统计思想和方法提出问题、分析问题和解决问题的能力,而不应把统计问题简单处理成数字运算.此 收稿日期#2019-04-03 基金项目:西安电子科技大学高等教育教学改革研究项目“大学助推中学教改、吸引高考优质生源的途径探索” 作者简介:刘倩(1979―),女,陕西西安人,西安电子科技大学数学与统计学院副教授,博士,主要研究方向:数理统计.

相关文档
最新文档