《数学之美》读后感

《数学之美》读后感
《数学之美》读后感

《数学之美》读后感

《数学之美》读后感

我在想,为什么我们要学习数学?也许这个问题成年人有一万个答案,可是当我们第一次走进教室,学习数学的时候,大概率还是

个孩子,你怎么跟一个孩子解释为什么要学习数学呢?我把这个问

题抛给了一个朋友,他说:“为了提高思维逻辑能力,这是我初中

老师在第一节数学课上告诉我们的”。或者一位5岁的小朋友又会问:“什么是逻辑能力呢?”

也许从出生第一天,我们就一直在被动的接收一些东西,父母的劝导,老师的传授,可5岁的孩子还是会把玩具散落一地,6岁的

孩子仍然会因为父母不给买玩具而嗷嗷大哭,无论你怎么劝导一个人,怎么劝诫一个人,他可能仍然会犯你认为会出现的错误。我记

得有位教育专家这么说:“你告诉宝宝他把玩具弄坏了,就等于丢

了10个棒棒糖”,从此以后这个宝宝可能会更加珍惜玩具。这个方

法很简单,但是貌似最有效。数学是什么?数学不就是把复杂的东

西简单化么?

现在我们再回答前面的问题:为什么我要学习数学?我们可以这么跟5岁的小朋友说:“妈妈给你10元钱,让你买酱油,酱油7元、棒棒糖1元一个,剩下的钱你可以买几个棒棒糖?”或许想吃棒棒

糖的就会苦思冥想一番,或许未来妈妈真的给他10元钱去买酱油,

结果回来就变成了一瓶酱油和3个棒棒糖。或者再过一段时间,这

位小朋友会选择6元的酱油,因为可以获得4个棒棒糖了。他这么

计算着:7+3和6+4都可以等于10,那么如果要必须买酱油的情况下,1+9也可以等于10。我们都知道也有1元的袋装酱油,于是9

个棒棒糖到手了。任何知识的魅力都在于自我的发现,只有你对它

产生了无限的兴趣,你就会不断的发现它的美,《数学之美》也可

以变成《物理之美》。

有些人会说,上面的例子是利益驱动型,不是兴趣驱动型,对于一个孩子来说,你能指望他向成人那样:“我需要的不是物质世界,我需要的是精神世界?”。5岁宝宝最喜欢做得事情就是在吃和玩

上面,请问,成年人不也是如此么?这就是天性。只不过成年人的

自控能力足够大罢了。

我们回到书本上,这本书是否合适自己?如果没有专业的数学知识,很难读懂。但是它又有着无限的魅力,让你不自觉的读下去,

为什么?因为“数学之美”,虽然大多数人看不懂里面的公式,但

是能够明白数学能解决的问题:概率统计学能够解决自然语言处理、布尔代数能解决搜索引擎的问题、有限状态机和动态规划能解决地

图问题、向量+特征向量+余弦定理能解决自动新闻分类问题、最大

熵模型解决金融问题,看着看着我就莫名的产生了一种想要学习算

法的冲动,这不就是本书的意义所在么?

1.信息指纹,可以让复杂的数据用简单的一串数字存储

2.13章,提到的简单之美。当然之后多次提到

3.余弦定理(通过向量+特征向量+余弦定理)可以判断两条数据的相似性

4.17章,简单密码学(对密码感兴趣的可以看看)

5.布隆过滤器,用很少的空间存储大量的数据,从而解决黑名单的问题(黑名单数据量庞大的时候,会增加判断某一个名单是否出

现过的难度)。

6.29章,分治算法,虽然没有很明白算法,但是原理其实很简单:把复杂的东西拆分成若干小的部分,然后进行逐个解决或者说

各个击破

7.30章,神经网络,其实没那么神秘,神经就好比一个网络

(马尔科夫模型+贝叶斯网络)中的各个节点而已。

那么,对我而言,到底提升了什么境界呢?

首要的肯定是思想境界。在未读这本书之前,我知道对于这个世界的事件形成的信息集合,人类只有两种方式可以表达,一个是数字,一个是语言。整个实数的集合是无穷个,而且每个数字都是唯

一的;整个世界中的事件也是无穷个的,而且每个事件也时独一无

二的,这样数学中的数字集合与世界中的事件集合就构成一个一一

对应的关系,所以研究数字之间的关系,实际上就是在研究世界中

事件之间的关系。语言中的概念和世界中的事件之间也是可以构成

一个对应关系的,但问题是,语言中概念的集合是有限的,所以它

和数字集合的对应显然只能是部分对应。

计算机科学的发展,人类需要把语言处理成数字,因为计算机只能识别数字信号,所以“语言的数字化”成为计算机产生以来发展

最快、而且最有创新性的领域,而许多华人科学家成为了这个领域

的顶尖专家,如李开复,吴军博士是卓越的科学家之一。至此我才

感到,在计算机主导的世界中,信息化就是数字化,而最难的数字化、也是最有成就的数字化,就是对人类自然语言的数字化,因为

人类的信息几乎100%是用语言承载、传播的,计算机要与人对话,

变成智能化的机器,首先要解决的就是语言的数字化问题。但我们

在电脑上自如地输入文字时、或者拿着手机通话时,我们跟本没有

意识到,那些卓越的语言科学家,早已经把我们的语言,转化成数

字信号,通过输入、处理、解码的方式,让我们无障碍地联络、工作。

我似乎感到,语言与数字的关系,就是人与自然关系的接口。套用古希腊毕达哥拉斯学派的观点,加上我的理解,即是,数是万物

的本原,语言是人的本原!

吴军博士似乎也在提升我对方法的认识境界。科学研究的思考方式,习惯遵循本质、规律、连续性思维,在语言学研究的早期,人

类为了让计算机识别语言,采用建立语言规则和语言规则数据库的

办法,但最终以失败告终(20世纪50-70年代),70年代后科学家

采用了语言统计模型,研究取得了突飞猛进。语言统计模型的胜利,再一次证明了宇宙量子模型的信念,世界是不连续的随机性的粒子

构成,人类数千年文明进化出来的语言系统,就是动态的随机概率

事件。其二,物理思维再也难逃牛顿的经典本质思维方法,即找寻

到百分之百确定性的规律,而信息论思维是研究如何把握不确定性

现象,利用概率统计是不二法门。其三,语言本质上就是信息传播,只有从通信模型视角才能真正理解计算机的功能,对语言的编码、

处理、传输、解码是计算机的强项,计算机是永远不可能理解语言

的意思的。

在《数学之美》中,吴军博士对他的老师、师兄弟、同事的经历、掌故进行了叙述,让我们了解到这些世界一流的学科家、技术精英

们的为人处世品质、鲜明个性、科学素养及其管理风格。例如贾里

尼克对博士生的严酷淘汰,马库斯对学生的宽宏大度,但我感到他

们有一样东西是共同的,就是对科学创造、顶尖人才的识别和器重,甚至是无条件的包容。如此为人的境界才是根本,因为伟大的科学

创造毕竟是人做出来的,只有崇高的人文精神之下才能造就顶尖的

人才、一流的科学和技术。

观国内的学说界,官风盛行、人情充斥,与这些一流学说群对科学创造的赏识、对个性人才的包容,对科学探索的热诚,可谓相去

甚远。

看来,我们只能寄希望于年轻一代,但愿吴博士的《数学之美》,能让我们的学子们,初步体验到科学精英们卓越的才智与情怀。

第8章里的“索引”,作者讲到谷歌面试产品经理的一道题目:如何向你的奶奶解释搜索引擎。关于这个问题,好的回答据说是用

图书馆的索引卡片做类比。

我奶奶是个文盲,一生为农,日出而作,日落而息。她很少看电视,更别说图书馆。所以用图书馆的例子,对我们来说,很生动;

对她来说,很生涩。

我们村的田地是按照地形、土质和流水等来划分的,计有一等地、二等地和三等地。一般情况下,一等地用来种水稻,二等地用来种菜,三等地用来种水果。

所以当我奶奶想要给我摘桔子的时候,她肯定不会从一等地或者二等地一块地一块地找过来,而是直接跑到三等地(一般就是山上)。

像这样的索引,是基于脑子里的“数据库”,因为田地不会很多,多了也来不及种,所以跟布尔代数没什么关系。但是这样解释,我

奶奶就会大概明白了。我奶奶生前一次电脑也没用过,跟她解释这些,唯一的意义是,她会觉得我没有敷衍她,这会使她欣慰——如

果有机会解释的话。

杨小凯曾经说,如果张五常多加注重使用数学模型,那诺奖也许就拿下了。张五常对此不以为然,反以为傲,自诩当今世上只有科斯、阿尔钦和他才敢只用文字,不借助数学模型就在经济学界占有

一席之地。

当然,张五常也不是彻底否定数学的作用,他认为能够用文字解释的经济学原理,不必使用数学对其复杂化。

数学在信息学和经济学里都有广泛应用,但是在信息科学方面,对数学作用大小的争论就没有经济学那么大了。

我们常说搜索引擎的竞价广告,就可能经历到第三方公司,通常他们宣传自己是谷歌或者别的搜索引擎公司的代理商,然后通过不

正当手段为客户提高网页的排名。谷歌在消除网络作弊方面做了很

多努力,通过修改排序算法来为搜索者提供更加准确实效的信息。

“作弊的本质是在网页排名信号中加入噪音,因此反作弊的关键是去噪音。沿着这个思路可以从根本上提高搜索算法抗作弊的能力。”我们公司就是吃了这个亏,交了不少钱给第三方公司,结果

算法一变,关键词的排名从前三下降到前三页没影。

社交搜索正在雄起,但是如果想要在传统的搜索引擎中占据有利排名,我想,第三方公司的技术水平是很关键的。

大学专业课里,数电总是要比模电简单不少。

自然界里大部分的信号都属于模拟信号。所谓模拟信号,是指时间和数值上都是连续变化的信号。在实际电路中,模/数转换是一个

很重要的过程,将预处理的模拟信号经过模/数变换为数字信号,然

后进行数字信号处理。而数字化处理有很多优点,比如功能强大、

抗干扰能力强、易集成化等。

简而言之,如果没有数学,就没有数字信号处理的概念,也就无法进行信号的传输,而数字信号传输在大规模的集成电路里是必不

可少的,这是通信成功的基本要求。

之前看到有人说如果高中看这本书,也许数学就是另一番天地,会有所突破。我不觉得,如果高中看这种书,我想,大多数人还是

会对数学更加望而却步。本书更适合通信电子这些专业的学生,在

学习专业课的时候辅助阅读,对理解通信原理、数电模电等都有更

形象生动的想法。

看完《浪潮之巅》,了解了硅谷很多公司尤其是互联网公司的沉浮,对吴军的书就非常感兴趣,看到吴军的另一本书《数学之美》,

激起了很深的兴趣,所以很快把书看完了,普及了很多基础的知识

的同时也启发了很多想法,感觉很爽。

我自己在交大学的是工科(虽然没怎么上过课),小学、初中、高中都是一路参加数学竞赛,名次都还不错,也因此没有参加中考、高考,一路保送,自己对数学有很深的感情,同时女朋友大学也是

数学系,有点后悔的大学选了个并不感兴趣的专业(交大当时允许

我随便选专业,我没有跟父母商量自己选了船舶制造)。看这本书

的过程中找到了很多高中在看竞赛书的感觉,里面提到的很多概率

论(不等式)、图论、数论的知识是高中数学联赛复试的重点,高

中的时候已经研究的很深了,不过大学荒废了之后也忘得差不多了,书中提到的很多定理还很有亲切感

书名叫做《数学之美》,显得有些太大,毕竟更多的是吴军在google做搜索相关工作用到的数学模型的介绍与总结,提到的数学

部分大多集中在概率论、图论、数论领域,所以书名太大了,可能hax说得对,也许是出版社为了卖书取得名字

不得不说吴军是一个大家,文字中能够透露出大家的气势,书中不断的穿插着各种历史上的大科学家以及科技领域的大家的小故事

甚至八卦,从文字中非常能够感受到吴军是一个和他们一个层次的

人(即使他自己会自谦说是一个二流的工程师之类)

书中具体的模型就不介绍了,说几点我学到的知识(仅仅皮毛),能列出来的都是看完还有点印象的:

1.在互联网的世界中,信息是如何量化的,信息熵是怎么回事?有啥用?

2.搜索领域中,语言是如何统计的,尤其是如何通过概率模型进行分词

3.搜索引擎是如何工作的—网络爬虫是怎么回事儿

4.PageRank是怎么回事?为了解决什么问题?

5.密码与解密领域的数学模型,尤其提到的二战时候的各种解密的趣事儿,提到的电视剧《暗算》打算抽空看下

6.拼音输入法的数学模型

7.、文本自动分类的模型

……

看完之后最大的感受就是:

1.数学模型巨大作用,推动着新技术的发展

2.攻城师是一个伟大的职业,能够运用这些知识转化为生产力,非常牛叉

3.书中提到了很多数学模型都是在不断的进化、改良、升级,也就是说有人不断的在做优化,会有不断更好的模型、更新的技术出现,跟得上技术的发展可能也是比较重要的,否则很多人一直在做

某一点上的持续优化就没有意义了。

但同时技术很大的作用是用来解决实际问题的,书中提到的各个数学模型、各种方法都是为了解决人们的需求或者业务的需求,毕

竟公司不是科学研究所,所以追求通过技术直接解决用户需求或者

做成易用的工具给业务人员、运营人员来间接解决用户需求是挺重

要的,可能不是技术人员觉得做到80分就可以了,而是用户、使用

工具的人觉得做到80分是一个重要的衡量

提到“工具”,想到赵赵说过的一句话:“不好用就等于没有”,可能就是这个点,同时运用工具的人必须好好的运用,如果用不好

甚至不用就太对不起技术了

上个月去北京开会,顺道拜访了人民邮电出版社,合作多年的编辑陈冀康赠我一本《数学之美》,说一定是我喜欢看的类型。以前

也在网上零散看过Google黑板报上吴军先生的文章,对他的前一本

书《浪潮之颠》也有耳闻,但没有读过。这次有机会集中阅读他的

文章,确实是一段美妙的体验。

读完这本书有一点强烈的感受:工具一定要先进。数学是强大的工具,计算机也是。这两种工具结合在一起,造就了强大的google、百度、亚马逊、阿里、京东、腾迅等公司。他们不是百年老店,但

他们掌握了先进的工具。

掌握了先进的工具,必将获得竞争优势。如果你知道哪里有一群软件工程师,维护着更大的一群计算机,那么不要犹豫,想办法使

用他们提供的服务,因为这会给你带来优势。所以我们使用Google

的搜索和邮件,在亚马逊、京东和淘宝上购物,用QQ和微博联系朋友,使用银行卡和网上银行,利用交易终端在全球市场上进行各种

交易……

人类历史就是一部工具的进化史。石器、青铜、铁器、火药、蒸汽机、内燃机、电报、电话、电视、计算机、卫星、互联网,工具

的进步引领着文明的进步。新的工具不断淘汰老的工具,就像互联

网视频点播正在淘汰电视、微博正在淘汰报纸、电子书正在淘汰纸

质书那样。

但有一些古老的工具,今天仍有人在学习和使用,甚至在上面花费许多时间。毛笔就是这样一个例子。今天学习掌握毛笔这种“落

后的”工具,还有什么意义?其实我们在使用一些“落后的”工具时,主要是在学习工具背后的思想。书法和绘画中蕴含的艺术审美

的一般原则,经得起具体工具变迁的考验。甲骨文、金文、石鼓文

所包含的对空间构图的理解,仍然值得现代人学习。思想工具是比

实物工具更强大的工具。

工具组合使用,形成更强大的新工具。《数学之美》中提到的马尔可夫链虽然是很强大的工具,但我在数学课上没有听老师提到过。这本书中给我印象最深的例子是余弦定理和新闻分类。余弦定理是

中学数学,再加上一些不算很难的多维向量的知识,竟然解决了计

算机新闻分类这样的难题!

每一种工具的背后,是人们对世界的一种理解。蒸汽机和内燃机背后,是力学的世界。电报、电话、电视、计算机和互联网背后,

是信息的世界。数学是抽象的工具,是其他工具背后的工具。每一

门学科要成为科学,都少不了数学。也许有一天人们会习惯,用数

学工具来分析艺术。数学是一种语言,它源于具体的世界,又高于

具体的世界。如果说语言是对世界的认识和描述,如果说数学是一

种语言,那么它一定是最接近神的语言。看似毫不相关,却又能描

述万事万物。

学习数学有什么用?物理学家费曼当年在大一时提出这个问题,他的师兄建议他转到物理系。今天,这个问题已不成为问题。具有

扎实数学功底的人才正进入各行各业,例如金融业。我认识一个出

版社的老总,他招应届毕业生有一个条件:数学要好。

工具虽好,关键还要会用。最终要回到掌握先进工具的人。软件算法工程师加上计算机集群,这是目前一流企业必需的装备。正如

马克.安德森所说的,各行各业的一流公司,都是软件公司。优秀的

软件算法工程师,是人才争夺的焦点。这样,我们就容易理解Google招工程师的要求。

对信息加工处理和传递的能力不断增强,是知识经济的特点。《数学之美》展示了Google如何运用数学和计算机网络,带领我们

进入云计算和大数据时代。

知识经济时代的工作,就是在各自的领域中进行科学研究。科学研究要大胆假设,小心求证。科学研究要量化。科学研究要有对比

实验。科学研究要有数学模型。科学研究要有田野调查。科学研究

要有文献查证。科学研究要有同行评议。《数学之美》向我们介绍

了自然语言分析领域的科研方法和过程。

任何一个领域,深入进去都有无数的细节。有兴趣的人不但没被这些细节吓倒,反而会兴致勃勃地研究,从而达到令人仰慕的高度。吴军先生向我们展示了数学和算法中的这些细节,也展示了他所达

到的高度。值得我学习。

感谢吴军先生分享他的知识和深刻见解,也感谢人民邮电出版社出了这样一本好书。

确切的来说,《数学之美》并不是一本书,它是谷歌黑板报中的一系列文章,介绍数学在信息检索和自然语言处理中的主导作用和

奇妙应用,每一篇文章都不长,但小中见大,从看似高深的高科技

中用通俗易懂的案例展示了数学之美,深深的吸引了我。

这一系列文章的作者是google公司的科学家吴军。他毕业于清

华大学计算机系(本科)和电子工程系(硕士),并于1993-1996年在

清华任讲师。他于1996年起在美国约翰霍普金斯大学攻读博士,并

于XX年获得计算机科学博士学位。在清华和约翰霍普金斯大学期间,吴军博士致力于语音识别、自然语言处理,特别是统计语言模型的

研究。他曾获得1995年的全国人机语音智能接口会议的最佳论文奖

和XX年eurospeech的最佳论文奖。

吴军博士于XX年加入google公司,现任google研究院资深研

究员。到google不久,他和三个同事们开创了网络搜索反作弊的研

究领域,并因此获得工程奖。XX年,他和两个同事共同成立了中日

韩文搜索部门。吴军博士是当前google中日韩文搜索算法的主要设

计者。在google其间,他领导了许多研发项目,包括许多与中文相

关的产品和自然语言处理的项目,并得到了公司首席执行官埃里克.

施密特的高度评价。吴军博士在国内外发表过数十篇论文并获得和

申请了近十项美国和国际专利。他于XX年起,当选为约翰霍普金斯

大学计算机系董事会董事。

正是他在信息检索与自然语言处理领域中的一系列工作,使他讲述了我所看到的内容-数学之美。

看了数学之美,立即联想到了金庸小说中的武林高人,总是把一套大多数人都会的入门功夫使得威力无比,击溃众多敌者。东西放

在那,它的威力如何,并键在于使用者,武术如此,数学同样如此。

于我而言,语音视别是一类高科技,作为非专业人土,深觉高奥。但看完数学之美之后,顿感惊诧,原来如此深奥东西的解决方法自

己也学过,并且理工科读过大学的人都学过,那就是统计学中的条

件概率p(a/b),即b事件发生条件下a事件发生的概率。

如果s表示一连串特定顺序排列的词w1,w2,…,wn,换句话说,s可以表示某一个由一连串特定顺序排练的词而组成的一个有

意义的句子。现在,机器对语言的识别从某种角度来说,就是想知

道s在文本中出现的可能性,也就是数学上所说的s的概率用p(s)

来表示。利用条件概率的公式,s这个序列出现的概率等于每一个

词出现的概率相乘,于是p(s)可展开为:

p(s)=p(w1)p(w2|w1)p(w3|w1w2)…p(wn|w1w2…wn-1)

其中p(w1)表示第一个词w1出现的概率;p(w2|w1)是在已知第一

个词的前提下,第二个词出现的概率;以次类推。不难看出,到了词wn,它的出现概率取决于它前面所有词。从计算上来看,各种可能

性太多,无法实现。因此我们假定任意一个词wi的出现概率只同它

前面的词wi-1有关(即马尔可夫假设),于是问题就变得很简单了。

现在,s出现的概率就变为:

p(s)=p(w1)p(w2|w1)p(w3|w2)…p(wi|wi-1)…

(当然,也可以假设一个词又前面n-1个词决定,模型稍微复杂些。)

接下来的问题就是如何估计p(wi|wi-1)。现在有了大量机读文

本后,这个问题变得很简单,只要数一数这对词(wi-1,wi)在统计的

文本中出现了多少次,以及wi-1本身在同样的文本中前后相邻出现

了多少次,然后用两个数一除就可以了,p(wi|wi-1)=p(wi-

1,wi)/p(wi-1)。

也许很多人不相信用这么简单的数学模型能解决复杂的语音识别、机器翻译等问题。其实不光是常人,就连很多语言学家都曾质疑过

这种方法的有效性,但事实证明,统计语言模型比任何已知的借助

某种规则的解决方法都有效。比如在google的中英文自动翻译中,

用的最重要的就是这个统计语言模型。去年美国标准局(nist)对所

有的机器翻译系统进行了评测,google的系统是不仅是全世界最好的,而且高出所有基于规则的系统很多。

这就是数学的美妙之处了,它把一些复杂的问题变得如此的简单。

看到《数学之美》,在感叹数学的美妙与神奇之处时,自然而然联系到自己专业(地质工程而或岩土工程)中的数学应用。

现在找文献,搜索期刊一大堆基于数学的专业文献,灰色数学的、模糊数学的、非线性的、系统的,等等,这么多的数学的使用,促

进了一大批的文章,但这些数学方法的应用究竟是发现了哪些问题?

还是解决了实际问题吗?还是仅发了文章,满足了需求?现实是文章

好发,用着难用,解决问题还得传统的方法,那么是这些数学方法

不行,还是用的太肤浅,根本没发挥其威力来?如果没有发挥出威力来,那怎么用?怎么发挥?

前一阵子因兴趣研究CMUSphinx这套库的应用不得要领,就去查看了下一些语音识别的基本原理的文章,偶然碰到了数学之美。其

实浪潮之巅也是因此开始看的、结果先一步看完了,毕竟一本历史书,一本介绍数学和语言处理的,难度不同

说实话,因为初中高中荒废了太多时间,我的英文和数学基础比较差,我大学的数学都是勉强修过的。一直以来数学对我是一个很

恐怖的学科,也不知道为什么计算机专业对数学要求比较高。我个

人就是数学分数很低,但是专业课学的还不错,唯一好点的数学科

目就是离散数学吧,另外的工科数学分析和高等代数都是惨不忍睹

看完这本书后,我发现我还真是低估了数学的作用,一个复杂的语言识别过程,用统计语言模型竟然用那么简单的数学模型就解决了,这对我的冲击很大。另一个对我影响比较大的就是余弦定理和

新闻的分类。以前那些各种三角函数的变换、三角函数,各种向量,各种空间图形在我印象中就只能用于画设计图,或者搞空间物理化

学等基础学科的应用上,想着“这种东西和计算机编程有什么关系?要计算角度,库里不都提供了吗?”,哪成想到改变一下思路,改

变一下方法,就简单的把那么复杂的分裂问题给解决了。现在想想

我当初想法还真是幼稚啊,可惜覆水难收,过去的时间已经回不来了,但至少我现在明白了数学的重要性,总能想办法弥补的。

不得不说国内的教科书还真是太死板了。很多书上,先不说没讲应用领域和这个能干吗,有些教科书连推导过程也没说明白。像我

大学时候的那几本高代高数的教科书,在某一步关键的过程写一句“显而易见”,然后就莫名其妙的出现了结果,这让我们基础差的

人情何以堪啊,更何况我问了那些数学好的,他们想推导出那一步

也要想好久。后来换了一下同济大学版,发现同样的定理,同样的

范围,就是理解起来容易了不少。果然好书和差一点的书差别真不少。所以我就在网上整理了一些好的数学书籍,等会儿x就贴到文后,以后慢慢补。

"技术分为术和道两种,具体的做事方法是术,做事的原理和原

则是道。这本书的目的是讲道而不是讲术。很多具体的搜索技术很

快会从独门绝技到普及,再到落伍,追求术的人一辈子工作很辛苦。只有掌握了搜索的本质和精髓才能永远游刃有余。”,然后吴军先

生用搜索反作弊的例子漂亮的解释了这两种差别。我以前做过的项

目里,如果出现没想过的情况,就加一个异常处理处理特殊情况,

本来很简单的东西,愣是被我搞复杂了。现在想回来,那时候境界

太低,连开始的本质和原理都没弄清楚,就埋头搞下去了,以后要

多注意点。

我一向喜欢实用性强的方法和工具,在这书里我特别喜欢阿米特·辛格博士的那一章。吴军博士就用寥寥几页的描述中讲解了辛

格博士的处理事情的方法和原则,先帮用户解决主要的问题,再决

定要不要纠结在次要的部分上;要知道修改代码的所作所为,知其

所以然;能用简单方法解决就用简单的,可读性很重要。

不过中间有两个部分没搞明白,最大熵模型和贝叶斯网络,没搞懂为什么能解决那些问题。贝叶斯网络还能稍微理解,少了马尔科

夫链的线性约束,更自由;但最大熵模型真搞不懂为什么那么好用,以后继续研究。

1、学科之间的联系是如此的重要

全书主要是围绕着吴军博士所研究的自然语言处理方向来讲述一些应用在这个研究领域的数学知识,用了很大篇幅讲解了将通信的

原理应用到自然语言处理上所取得的巨大成功。以前学习计算机网

络的时候,学过一个香农定理。对香农的认识就从香农定理开始,

因为考研会考相关的计算题。看了这本书才知道,香农的《信息论》对今天的影响真的是不可估量。通过这样一个过程,我也对以前的

本科学校的学科建设产生了一些忧虑。对于培养计算机人才来说,

无论是培养应用型人才,还是培养研究型人才,都应该与电子、通

信有一定的交叉,这样对学生思考问题的启发与视野的开阔有着重

要的作用。计算机本身就是从电子、通信、数学等学科中抽出来的

新兴的学科,在发展了多年之后,我们发现它仍然需要继承一些传统。回想自己的本科四年,上的更多的课时

语言类、技术类的课程,这些课程的确对提升学生的就业有很大帮助。但是我想说的是,一个忽视数学基础、学科交叉的学校,他

无法成为一所国内的一流大学。作为一个母校培养的学生,我深知

改革的阻力与困难,但是我希望母校的计算机学院能越办越好。我

们现在已经培养出很多高薪优秀的技术人才,我希望将来也能培养

出更多的研究型人才。

2、看起来很牛的东西却用着难以置信的`简单数学原理

在整本书中让我最为印象深刻的是解释Google搜索的原理,居

然就是简单的布尔代数运算。这个的确让我大跌眼镜,我一直认为

搜索时一个非常复杂而庞大的问题,其数学原理也是相当高深的,

但是吴军博士的解释让我大开眼界。与此同时也知道了Google为什

么牛,牛在哪了。搜索的原理虽然非常简单,但是搜索是一个需要

对海量数据进行操作的工作。Google在海量数据的处理方面的确是

相当先进的,MapReduce、BigTable等等一些技术的发明与应用使

得Google在搜索上无出其右。目前分布式存储、分布式计算、数据

仓库与存储等研究领域近些年来的大热也说明Google在引领研究方

向上的超凡本领。

3、感谢概率老师的教诲

在大二的时候,有一个在我们学生中声望很高的概率老师,他在课程即将结束的时候跟我们说我们将的是前几章,这些事概率论与

数理统计的基础。对于你们计算机的学生来时,后面的章节才是最

有用的,以后一定要好好的研究,弄上一两个在你的毕业设计上就

会让你毕业设计提升一个档次,有可能验收你毕业设计的老师也不懂。我当时对他的话没有特别在意,我只关心期末考试要考哪些题目,因为我那个学期的概率课基本上都在睡觉,只有他讲笑话的时

候不睡。我看《数学之美》后发现马尔科夫链、贝叶斯网络之后,

对以前的概率老师充满无限的敬意。我发现我们再本科阶段学习的《高等数学》、《线性代数》、《概率论与数理统计》在计算机学

科应用较多的要数概率论与数理统计,还有一门我学的不好的《离

散数学》在计算机中也是有着举足轻重的地位。我在看米歇尔的

《机器学习》时也发现很多熟悉的概率论与数理统计的知识,这让

我不得不开始考虑重新弥补自己的数学短板。我的想法是在研一这

一年把概率论与数理统计、线性代数、离散数学尽我最大的努力补

一补,希望他们对我今后的学习有所帮助。

4、说说作者吴军博士

吴军博士写的书对于学习计算机的学生来说,读起来有种说不出的亲切感。可能这跟他是技术出身的原因有关,流畅的文笔、质朴

的文风也让人读起来很舒服。看高晓松在优酷上的《晓说》就知道,在硅谷有着众多的华裔工程师,他们很多都来自清华、北大等国内

的名牌大学,这些人在美国实现着自己的梦想。吴军博士也曾是这

其中的一员,我非常希望那些像吴军博士一样的牛人们能够写书或

者来国内的大学做一些演讲、论坛等等,开阔一下我们的视野,传

授一下做学问的经验。与此同时,我也在想为什么我们国家那么多

优秀的IT人才都去了美国。这个问题在我去苹果公司在东软信息学

院组织的培训过程中得到了答案,那个南京邮电的老师讲了讲中国

为什么不像美国那么有创造力。我们中国人并不缺乏创造力,很多时候是我们所处的外部环境恰恰阻碍了创新。我想那么多优秀的清华北大学子纷纷到大洋彼岸的美国,正是被美国开放的学术环境、创新氛围所吸引,每个人都有自己的梦想,他们去美国也是为了能实现自己的梦想。以前都觉得他们是不爱国,现在长大了,对于这个问题看得更清楚了一点。我想说我们的祖国在经历了改革开放30多年的飞速发展之后,目前正处于一个关键和脆弱的时期。我们靠着人口红利取得了巨大的成就,我们能不能凭借人才红利取得更大的成就还是未知。希望有更多的人才能像李开复博士、吴军博士那样,为我们这个民族青年的成长和国家发展做出贡献。

《数学之美》,一个从事多年工作的谷歌研究员眼中的数学。令我大饱眼福的是,大学里面的数学知识竟能如此广泛运用到了计算机行业中。

在语音识别、翻译,还有密码学领域,有着许多基于概率统计的模型和思想。当然,贝叶斯公式是基础,应用到隐含马尔科夫链模型,神经网络模型。

在搜索中,一些相关性的计算,无不用到了概率的知识。在新闻分类中,用到了一些有关矩阵特征值、相似对角化的知识。当然,在图像处理方面,矩阵变换可谓是无处不在。另外,在识别方面,有一些通信模型,涉及到了信道、误码率、信息熵。

最近刚开学也没什么事,所以就想随便找几本书看一下,但最好别是那种太艰深晦涩的书。8月份一直到现在,吴军写的这本12年5月出版的《数学之美》一直盘踞京东、亚马逊等各大网上商城科技类图书的榜首,当然,还有早些时候出版的《浪潮之巅》也排在很靠前的位置。心想市场的力量应该能帮我挑出好书吧,于是就从图书馆借了一本来,一直到今天晚上把它给看完了。

因此想写一点东西来总结、反思一下,反正刚开完班会也没什么事干。

废话就不多说了,《数学之美》其实是一本科普类的读物,所面向的是接受过普通高等教育的人,完全不需要在特定领域有很深的

造诣就可以看懂,大概懂一点线性代数、概率统计、组合数学、信

息论、计算机算法、模式识别最好(虽然列举了这么多,其实有些

不懂也没关系……),所以尤其适合信科的人看。内容大部分是和

人工智能、计算机相关的,这并非我所学的专业,但作者比较擅长

将看似复杂的原理用简明的语言表达出来,所以可读性还是很好的。

吴军是清华大学毕业的,之前任职于Google,后来到了腾讯,

这些文章都是发表在Google黑板报上的,后来经过了重写,所以网

上下载的和书本内容有所差异。由于吴军本人是研究自然语言处理

和语音识别的,所以统计语言模型的东西可能会多一点,不过我觉

得这丝毫不妨碍全书数学之美的展现……感觉收获还是挺多的,知

识上的有一些,但更多还是思维方式上的。作者举了很多例子试图

让人明白很多看似复杂的高科技背后,基本原理其实是出乎意料简

单的(当然,必须承认第一个想到这些方法的人还是非常了不起的……)。比如高准确率的机器翻译,看上去好像是计算机能够理

解各国语言,隐藏在背后的却是很多具有大学理科学历的人都非常

清楚的统计模型和概率模型;再比如拼音输入法的数学原理,早期

的研究主要集中在缩短平均编码长度,比如曾经流行一时的五笔输

入法,而现今真正实用的输入法却是有很多信息冗余、编码长度比

较长的拼音输入法,作者从信息论和市场的角度做了简单的阐述;

又比如新闻的自动分类,许多非IT领域的人可能会认为计算机可以

读懂新闻并进行分类,而实际上只是特征向量的抽取、多维空间中

向量夹角的计算,非常非常简单,但凡学过一点线性代数的人绝对

是一看就懂的……当然,完美的实现还需要考虑很多细节和现实的

情况,但这并不是这本书所关注的地方,数学之美在于其简洁而不

是繁琐。

除了对于具体信息技术的剖析之外,作者还花了很大篇幅来讲一些杰出人士的成长过程,特别是把这些人的成长经历和中国学生的

成长经历作对比。虽然作者并没有明说,但字里行间多少流露出对

于中国高等教育以及很多中国企业的批评,一是教育的功利性,缺

乏宽松的独立思考的环境,即使学了一堆理论也难有用武之地,自

然也就缺乏创新性的成果;二是中国企业的短视,大部分都不舍得

在新框架开发上投资,而是坐享学术界和国外企业的研究成果。

总结一下呢,《数学之美》事实上不能带给你编程能力的提升,也没法让人的数学水平有显着的提升,但它在很大程度上让你跳出教科书式的繁琐细节的束缚,能够从更宏观的角度来思考信息世界背后的数学引擎的运行原理,让人明白看似很高级、复杂的东西背后其实并不如我们所想象的那样复杂,而我们所学的“枯燥”的数学真的可以“四两拨千斤”,改变亿万人的生活。

数学手抄报数学之美读后感文字稿

数学手抄报数学之美读后感 上个月去北京开会,顺道拜访了人民邮电出版社,合作 多年的编辑陈冀康赠我一本《数学之美》,说一定是我喜欢看的 类型。以前也在网上零散看过Google黑板报上吴军先生的文章, 对他的前一本书《浪潮之颠》也有耳闻,但没有读过。这次有机 会集中阅读他的文章,确实是一段美妙的体验。 读完这本书有一点强烈的感受:工具一定要先进。数学 是强大的工具,计算机也是。这两种工具结合在一起,造就了强 大的google、百度、亚马逊、阿里、京东、腾迅等公司。他们不 是百年老店,但他们掌握了先进的工具。 掌握了先进的工具,必将获得竞争优势。如果你知道哪 里有一群软件工程师,维护着更大的一群计算机,那么不要犹豫,想办法使用他们提供的服务,因为这会给你带来优势。所以我们 使用Google的搜索和邮件,在亚马逊、京东和淘宝上购物,用QQ 和微博联系朋友,使用银行卡和网上银行,利用交易终端在全球 市场上进行各种交易…… 人类历史就是一部工具的进化史。石器、青铜、铁器、 火药、蒸汽机、内燃机、电报、电话、电视、计算机、卫星、互 联网,工具的进步引领着文明的进步。新的工具不断淘汰老的工具,就像互联网视频点播正在淘汰电视、微博正在淘汰报纸、电 子书正在淘汰纸质书那样。 但有一些古老的工具,今天仍有人在学习和使用,甚至 在上面花费许多时间。毛笔就是这样一个例子。今天学习掌握毛

笔这种“落后的”工具,还有什么意义?其实我们在使用一些“落 后的”工具时,主要是在学习工具背后的思想。书法和绘画中蕴 含的艺术审美的一般原则,经得起具体工具变迁的考验。甲骨文、金文、石鼓文所包含的对空间构图的理解,仍然值得现代人学习。思想工具是比实物工具更强大的工具。 工具组合使用,形成更强大的新工具。《数学之美》中 提到的马尔可夫链虽然是很强大的工具,但我在数学课上没有听 老师提到过。这本书中给我印象最深的例子是余弦定理和新闻分类。余弦定理是中学数学,再加上一些不算很难的多维向量的知识,竟然解决了计算机新闻分类这样的难题! 每一种工具的背后,是人们对世界的一种理解。蒸汽机 和内燃机背后,是力学的世界。电报、电话、电视、计算机和互 联网背后,是信息的世界。数学是抽象的工具,是其他工具背后 的工具。每一门学科要成为科学,都少不了数学。也许有一天人 们会习惯,用数学工具来分析艺术。数学是一种语言,它源于具 体的世界,又高于具体的世界。如果说语言是对世界的认识和描述,如果说数学是一种语言,那么它一定是最接近神的语言。看 似毫不相关,却又能描述万事万物。 学习数学有什么用?物理学家费曼当年在大一时提出这个 问题,他的师兄建议他转到物理系。今天,这个问题已不成为问题。具有扎实数学功底的人才正进入各行各业,例如金融业。我 认识一个出版社的老总,他招应届毕业生有一个条件:数学要好。 工具虽好,关键还要会用。最终要回到掌握先进工具的人。软件算法工程师加上计算机集群,这是目前一流企业必需的 装备。正如马克.安德森所说的,各行各业的一流公司,都是软件 公司。优秀的软件算法工程师,是人才争夺的焦点。这样,我们 就容易理解Google招工程师的要求。

《数学之美》读后感

《数学之美》读后感 《数学之美》读后感 我在想,为什么我们要学习数学?也许这个问题成年人有一万个答案,可是当我们第一次走进教室,学习数学的时候,大概率还是 个孩子,你怎么跟一个孩子解释为什么要学习数学呢?我把这个问 题抛给了一个朋友,他说:“为了提高思维逻辑能力,这是我初中 老师在第一节数学课上告诉我们的”。或者一位5岁的小朋友又会问:“什么是逻辑能力呢?” 也许从出生第一天,我们就一直在被动的接收一些东西,父母的劝导,老师的传授,可5岁的孩子还是会把玩具散落一地,6岁的 孩子仍然会因为父母不给买玩具而嗷嗷大哭,无论你怎么劝导一个人,怎么劝诫一个人,他可能仍然会犯你认为会出现的错误。我记 得有位教育专家这么说:“你告诉宝宝他把玩具弄坏了,就等于丢 了10个棒棒糖”,从此以后这个宝宝可能会更加珍惜玩具。这个方 法很简单,但是貌似最有效。数学是什么?数学不就是把复杂的东 西简单化么? 现在我们再回答前面的问题:为什么我要学习数学?我们可以这么跟5岁的小朋友说:“妈妈给你10元钱,让你买酱油,酱油7元、棒棒糖1元一个,剩下的钱你可以买几个棒棒糖?”或许想吃棒棒 糖的就会苦思冥想一番,或许未来妈妈真的给他10元钱去买酱油, 结果回来就变成了一瓶酱油和3个棒棒糖。或者再过一段时间,这 位小朋友会选择6元的酱油,因为可以获得4个棒棒糖了。他这么 计算着:7+3和6+4都可以等于10,那么如果要必须买酱油的情况下,1+9也可以等于10。我们都知道也有1元的袋装酱油,于是9 个棒棒糖到手了。任何知识的魅力都在于自我的发现,只有你对它 产生了无限的兴趣,你就会不断的发现它的美,《数学之美》也可 以变成《物理之美》。

《数学之美》读书笔记

《数学之美》读书笔记 《数学之美》读书笔记 《数学之美》是一本领域相关的数学概念书,生动形象地讲解了关于数据挖掘、文本检索等方面的基础知识,可以作为数据挖掘、文本检索的入门普及书。另外,就像作者吴军老师提到的,关键是要从中学到道----解决问题的方法,而不仅仅是术。书中也启发式的引导读者形成自己解决问题的道。 下面记录一下自己读这本书的一些感想: 第一章《文字和语言vs数字和信息》:文字和语言中天然蕴藏着一些数学思想,数学可能不仅仅的是一门非常理科的知识,也是一种艺术。另外,遇到一个复杂的问题时,可能生活中的一些常识,一些简单的思想会给你带来解决问题的灵感。 第二章《自然语言处理----从规则到统计》:试图模拟人脑处理语言的模式,基于语法规则,词性等进行语法分析、语义分析的自然语言处理有着很大的复杂度,而基于统计的语言模型很好的解决了自然语言处理的诸多难题。人们认识这个过程,找到统计的方法经历了20多年,非常庆幸我们的前辈已经帮我们找到了正确的方法,不用我们再去苦

苦摸索。另外,这也说明在发现真理的过程中是充满坎坷的,感谢那些曾经奉献了青春的科学家。自己以后遇到问题也不能轻易放弃,真正的成长是在解决问题的过程中。事情不可能一帆风顺的,这是自然界的普遍真理吧! 第三章《统计语言模型》:自然语言的处理找到了一种合适的方法---基于统计的模型,概率论的知识开始发挥作用。二元模型、三元模型、多元模型,模型元数越多,计算量越大,简单实用就是最好的。对于某些不出现或出现次数很少的词,会有零概率问题,这是就要找到一数学方法给它一个很小的概率。以前学概率论的时候觉的没什么用,现在开始发现这些知识可能就是你以后解决问题的利器。最后引用作者本章的最后一句话:数学的魅力就在于将复杂的问题简单化。 第四章《谈谈中文分词》:中文分词是将一句话分成一些词,这是以后进一步处理的基础。从开始的查字典到后来基于统计语言模型的分词,如今的中文分词算是一个已经解决的问题。然而,针对不同的系统、不同的要求,分词的粒度和方法也不尽相同,还是针对具体的问题,提出针对该问题最好的方法。没有什么是绝对的,掌握其中的道才是核心。 第五章《隐马尔科夫模型》:隐马尔科夫模型和概率

太阳的话读后感

太阳的话读后感 本文是关于读后感的,仅供参考,如果觉得很不错,欢迎点评和分享。 太阳的话读后感(一) 四年级的一篇诗歌《太阳的话》,文章比较简单明了,这节课严老师在指导小组合作的方法切实可行,如在小组读文的时候,老师强调:你给他提的建议要让他马上能得到提高。我想我们在教学生时就是要具体告诉他怎样做到最好,说话要到位。本节课学生在仿说诗歌和仿写诗歌时,学生们展示了较高的运用语言能力。严老师自己说讲完课后,知道自己在讲课时出现了诸多语病,如不能说“ 读出你的感受和感情” 。可以说“ 读出你的感受” 或者“ 有感情的读一读” 。总体来说,这是一节成功的课。 解读一篇文章,是探讨生活;用动听的语言引导别人,是一种艺术。 太阳的话读后感(二) 在《太阳的话》这首诗中,诗人以拟人的手法,赋予太阳人的语言与思想,展示了太阳渴望走进小屋,打开人们关闭的心灵,让人们享受亮光、温暖、花束、香气和露水,享受太阳带来的欢乐和美好。召唤人们敞开心扉迎接光明,促使人们树立起积极乐观的信念。 生活,一个普普通通的词,热爱生活,一个最简单的道理,但是谁也没有真正理解过这个词,生活是由几千几万个小事构成的,做好事是生活,受批评是生活,同情一个人还是生活,生活不一定要干出

大事,有什么壮举,平凡人就要过平凡的生活。 什么是热爱生活,是想着今天赚多少钱去吃喝玩儿乐吗?是想着怎样做自己才不吃亏吗?还是想着怎么样才能赢的上司的欢心吗?都不是,热爱生活是信任自己,信任他人,把每一件为大家着想的事放在心上,活的有价值。整天勾心斗角,疑心重重,问心有愧,这样不如放弃生活。一个人只是躯壳在装样子,毫无意义可言,这样的的生活何趣之有? 遇到困难,要去面对,不能逃避问题,躲避生活,贝壳之所以玲珑剔透,是因为它经过浪花的淘洗,松柏之所以苍翠挺拔,是因为它受过风雨的考验。生活就像一把花伞,只要你热爱它,没有解决不了的问题,它总会转到精彩的那一面。 热爱生活吧,它将让你的人生五颜六色! 太阳的话读后感(三) 这首现代诗,作者用了第一人称将自己当成太阳来描写。淋漓尽致地描绘出了太阳渴望走进小屋,渴望走进人们心灵的感想。从第一小节中的两个“打开”,突显了太阳走进人们心灵的渴望。“让我进去,让我进去”这两次重复的短句,就形象地展现了太阳急切的心情。“我带着……我带着……”四个“我带着”用了排比的手法。花束,香气,温暖,亮光,温暖,露水,这一连串美好的事物,再加上形容词:金黄的,林间的,满身的。就让人有着对美好事物的憧憬和对生活的希望和生机。“让你的眼看见我的到来”可以看出太阳希望人闪能看到希望和光芒。这首诗表达了太阳渴望将希望和阳光洒满人们心

数学之美小论文

数学之美小论文 13-会计2班1322158 周宇宸这学期报了一门益智游戏与数学欣赏的选修课,这节课让我学到了很多的知识。 数学世界五光十色,没有接触这门课之前我一直以为数学只是停留在学过的课本上,大学前学的导数函数,到大学后的高数,印象里只有运算符号和数字还有就是繁琐的解题步骤,虽然并不讨厌但是对于很懒的我写太多数字费太多脑子也会让我觉得很麻烦,而且高中数学比起初中的,内容增多难度加大且抽象性理论性更强,思维密度和难度都大幅度加大,到了大学的高数就又上了一个台阶,就算成年人对高数大部分也是投降的态度。然而接触了这门课之后,我抛弃了数学只是用来得试卷上的分数的固有思维,发现了数学的有趣之处。 数学的有趣之处我认为最主要的就是结合实际,现实中的很多麻烦的事情通过数学就可以迎刃而解,不然如此还可以发现很多神奇的东西。比如说之前有一节课看到的视频,大概意思就是一个人向天空看,然后会影响到周围多少个人,然后一群人向天空看可以影响到多少个人,通过概率计算出的结果令我感到非常的神奇。还有黄金分割比例,是指将整体一分为二,较大部分与整体部分的比值等于较小部分与较大部分的比值,其比值为0.618,这个比例被公认是最能引起美感的比例,所以被称为黄金分割比例,五角星之所以看起来那么的赏心悦目,是因为其中充满了黄金比例,它的边互相分割为黄金比例,不论横看竖看都是匀称的,我想这也是被称为数学之美的一部分吧。

接下来有接触到了一些数学相关的小游戏,最常见的就是小时候的脑筋急转弯一样的题目,还有就是最经典的华容道,魔方,七巧板,九连环这些了。华容道就是通过移动各个棋子,帮助曹操从初始位置移到棋盘最下方中部,从出口逃走就算胜利;魔方大家最为熟悉,就是通过旋转使每面都是同样的颜色;七巧板顾名思义是七块板组成的,而这七块版可以拼成许多图形;九连环是中国传统智力玩具,用金属丝制成九个圆环,将圆环套装在横版或者各种框架上,并贯以环柄,玩的时候按照一定程序反复操作,就可以使九个圆环分别解开,或者合二为一。我认为这些多是运用了数学中几何的知识,了解了这些之后也对这些早已熟知的游戏有了更深刻的理解。 数学的学习过程是一个逐步发展并统一的过程。统一的目的是“追求更有力的工具和更简单的方法”,而通过不同的方面来看数学,这对认识到数学的魅力我觉得有很大的帮助。数学之美,表现形式我认为是多种多样的,有简约之美,概念之美,公式之美,繁杂的数字虽然看上去并不美观,可是如果细细品味就会认识到其中的奥秘,在纸上它们也许只是不起眼的公式,但凡运用到实际中,可将许多难题化解。这些我认为要感谢伟大的数学家们,是因为他们我们才有现在的生活,才能体会到数学原来也有如此的耀眼。

《太阳》读后感

《太阳》读后感 下面是带来的《太阳》读后感,让我们共同来了解太阳的重要性。 通过学习《太阳》这篇课文,我深深地感受到它对我们的重要性。 首先,从课文中我知道了太阳离我们有亿里远,如果我们日夜不停地走,还要3500年呢!而太阳又是那么的大,130万个地球才能抵得上一个太阳。太阳会发光、发热,是个大火球,它表面温度有6000摄氏度,中心温度是表面温度的2500倍,就是钢铁碰到它,也会变成气。正因为太阳这么大,温度这么高,距离我们又这么远,才能给地球送来光明和温暖。 地球上一切的生物都和太阳有着密切的关系。万物的生长需要太阳,有了太阳,地球上的树木、花草、动物才能生存、繁殖。如果没有太阳,地球上不会有植物、也不会有动物。我们人类的吃、穿、住、行也都离不开太阳。没有太阳,我们人类就不能在地球上生存。可见太阳对人类是多么的重要啊! 因为有了太阳的热量,才形成了空气中的水蒸气、云、风、雨、雪······这些自然现象。太阳还有杀菌的作用,我们利用它来预防疾病。我们生活中用的太阳能热水器,就是利用太阳的热能来工作的。在其他的科学技术中,也用到

了很多有关太阳的能量······ 地球上的一切光明和温暖,都是太阳送来的,如果没有太阳,地球上将到处是黑暗。我们生活的世界这么美丽,太阳有多么神奇的力量啊! 读完了《太阳》这本书,我觉得里面的诗歌真的很优美,让我很感动。 《太阳》讲述了动人的母爱,它用真诚与柔美的诗句讲述了孩子们对童年的渴望。童年,孩子们一生中那最最美丽的时光,那纯真而又美丽的时光,讲述了孩子们的梦想。孩子们希望让梦想飞翔,《太阳》恰恰写出了孩子们这一个愿望。 让太阳长上翅膀这本书的内容我已经深刻的理解了,让太阳长上翅膀里写着每一个母亲的母爱和孩子们的梦想。假如生活是四季,那母爱便是春天的第一个绿叶,假如生活是太阳,那母爱便是太阳升起的第一缕阳光。 《太阳》让我收获了很多感动,亲爱的朋友们,希望你们也去读一读,让它也能给你们带去感动。 推荐阅读: 《赵州桥》读后感 《文言文两则》读后感 《“走”完长征的婴儿》读后感

数学之美读后感

数学之美读后感 读了一篇文章,你有什么感想,以下是一则读后感美文,请阅读,VOM; 这本书分为三个单元,每个单元都有两个部分。第一单元主要讲的是节俭。“历览前贤国与家,成由勤俭破由奢”。这句话是唐代诗人李商隐在总结唐朝由盛世走向衰败的历史教训时写下的警世名言。意思是:历观前代王朝和古老的家风,往往勤俭节约意味着成功,奢侈浮夸意味着失败。是呀,这句话用于我们现在是再适合不过了。 一节语文课上,老师告诉我们要写作文了,而写作文其实很简单,就是自己想什么就说什么,只要能通顺地组成200字的文段就成。“想什么就说什么”,原来写文章就这么简单呀。我美滋滋地,一直胸有成竹地写,将心中的秘密哗啦啦地倾泻了出来。不知不觉中远远超过200字了。作文本发下来了,我的作文获得了一个大大的“好”字,老师还把它当作范文在班上进行了示范朗读。当时的我别提有多开心呀。至今想来,我写作文与香菱学诗一样,大家都是兴趣当头。 要说起让我们方便的最大功臣当然是他了……1954年10月,中央人民政府委员会第30次会议上毛泽东对大家说:“我们会造什么?除了桌子,椅子,连一辆汽车都造不出来。”于是我们中国便努力地开始制造汽车了。1956年7月13日

在日本侵华时留下的细菌工厂的残骸中建立起来的工厂中,一辆中国造的第一辆汽车开出来了,他叫“解放牌”。从这一天起,中国不能制造汽车的历史结束了,我们自己造的汽车一天比一天多的开了出去。 在现实生活中作为子女,每天目送父母的容颜老去;作为父母,目送孩子背着书包上学渐渐远去的背影;作为老师目送一批批的学生走出校门。其实,就算是让你追,你也追不上!这就是一代代的人生啊!《目送》读后感 所以我们一定要珍惜现在的童年生活,绝不浪费时间,遇到困难不要退缩和逃避,踏踏实实去做好每一件事,做个善良、富有同情心和乐观向上的人。 我是一口气把它读完的。我走进安利科的生活,目睹了他的生活,目睹了他和他的同学们是怎样生活、怎样学习的,是怎样去爱的,我发现爱中包含着对生活的追求! 《数学之美》,一个从事多年工作的谷歌研究员眼中的数学。令我大饱眼福的是,大学里面的数学知识竟能如此广泛运用到了计算机行业中。 在语音识别、翻译,还有密码学领域,有着许多基于概率统计的模型和思想。当然,贝叶斯公式是基础,应用到隐含马尔科夫链模型,神经网络模型。 在搜索中,一些相关性的计算,无不用到了概率的知识。在新闻分类中,用到了一些有关矩阵特征值、相似对角化的

太阳读后感100字三篇

太阳读后感100字三篇 太阳读后感(一) 通过学习《太阳》这篇课文,我深深地感受到它对我们的重要性。 首先,从课文中我知道了太阳离我们有1.5亿里远,如果我们日夜不停地走,还要3500年呢!而太阳又是那么的大,130万个地球才能抵得上一个太阳。太阳会发光、发热,是个大火球,它表面温度有6000摄氏度,中心温度是表面温度的2500倍,就是钢铁碰到它,也会变成气。正因为太阳这么大,温度这么高,距离我们又这么远,才能给地球送来光明和温暖。 地球上一切的生物都和太阳有着密切的关系。万物的生长需要太阳,有了太阳,地球上的树木、花草、动物才能生存、繁殖。如果没有太阳,地球上不会有植物、也不会有动物。我们人类的吃、穿、住、行也都离不开太阳。没有太阳,我们人类就不能在地球上生存。可见太阳对人类是多么的重要啊! 因为有了太阳的热量,才形成了空气中的水蒸气、云、风、雨、雪……这些自然现象。太阳还有杀菌的作用,我们利用它来预防疾病。我们生活中用的太阳能热水器,就是利用太阳的热能来工作的。在其他的科学技术中,也用到了很多有关太阳的能量…… 地球上的一切光明和温暖,都是太阳送来的,如果没有太阳,地球上将到处是黑暗。我们生活的世界这么美丽,太阳有多么神

奇的力量啊! 太阳读后感(二) 今天我们学习了《太阳》这篇课文,它让我了解到太阳离我们有1.5亿公里远,如果步行到太阳去要走3500年,就是坐飞机,也要飞二十几年。太阳很大,130万个地球才能抵得上一个太阳。因为太阳离地球太远了,所以我们看到的太阳只有一个盘子那么大。太阳光有杀菌的能力。我们可以利用他来预防和治疗疾病。 地球上的光明和温暖,都是太阳送来的。有了太阳才有了我们这个美丽可爱的世界! 太阳读后感(三) 语文书上的第二十一课《太阳》主要内容是: 有这么一个传说,古时候,天上有10个太阳,后来用箭射死9个太阳。其实,太阳离我们有1.5亿公里远,到太阳上去,如果步行,日夜不停地走,差不多要走3500年,就是坐飞机也要走20多年。 我们看到太阳,觉得它并不大,实际上太阳特别的大,130万个地球才能抵得上一个太阳。因为,太阳离地球太远了,所以我们看起太阳来只是一个盘子一样大。 太阳会发光,会发热,是个大火球。太阳的温度很高,表面温度有6000摄氏度。就是什么东西碰到太阳,就会变样子或非常的很烫。 所以地球上的太阳给我们了很多很多帮助,我们一定要珍惜每一分时间,太阳没有,我们的世界也不会这么美好这么可爱! 词语理解:1、凝成:凝聚在一起

数学美欣赏数学的简洁性

数学美欣赏 (内容选自《数学美拾趣》、《数学聊斋》和《直观几何》) 课程简介了解数学的趣味性,初步懂得数学在理论和实际中的应用,欣赏数学的绚丽多彩的艺术世界. 学习要求 1. 用U盘复制电子讲稿,并打印. 2. 课后认真阅读讲稿. 3. 适当安排若干次课堂独立作业. 做课堂作业时, 允许参考本讲稿, 可以摘录讲稿内容. 考核要求 1. 进行期中考试和期末考试,均为开卷. 2. 期末总评成绩=期中考试成绩×50%+期末考试成绩×50%. 3. 期中考试、期末考试和课堂独立作业中没有任何计算题和证明题,也没有填空题和选择题, 题型均为问答题. 第1讲

第1章数学的简洁性 序言 著名科学家伽利略说过:“数学是上帝用来书写宇宙的文字”. 简洁本身就是一种美,而数学的首要特点在于它的简洁. 数学家莫德尔说:在数学美的各个属性中,首先要推崇的大概是简单性了. 自然界原本就是简洁的: 光是沿直线方向传播的——这是光传播的最捷路线. 植物的叶序排布是植物叶子通风、采光最佳的布局. 某些攀缘植物如藤类,它们绕着攀依物螺旋式的向上生长,它们所选的螺线形状对于植物上攀路径来讲是最节省的. 大雁迁徙时排成的人字形,一边与其飞行方向夹角是 54448''',从空气动力学角度看,这个角度对于大雁队伍飞行是最佳的,即阻力最小(顺便一提:金刚石晶体中也蕴含这种

角度). ,这种比值 在人体中,人的粗细血管直径之比总是 的分支导流系统经流体动力学研究表明,它在输导液体时能量消耗最少. 生物学家和数学家们(如著名科学家开普勒、数学家列厄木、柯尼希等)在研究蜂房构造时发现:在体积一定的条件下,蜂房的构造是最省材料的. 这些最佳、最好、最省、……的事实,来自生物的进化与自然选择,然而它同时展现了自然界的简洁,而且也展现了自然界的和谐. 宇宙万物如此,数学,它作为用来描述宇宙的文字和工具也应当是简洁与和谐的. 诗人但丁曾赞美道:“圆是最美的图形”.太阳是圆的、满月是圆的、水珠看上去(投影)是圆的、……,圆的线条明快、简练、对称. 近代数学研究还发现圆的等周极值性质:在周长给定的封闭图形中,圆所围的面积最大.

数学之美读后感3篇

数学之美读后感3篇 数学之美读后感(一) 看到吴军的另一本书《数学之美》,激起了很深的兴趣,所以很快把书看完了,普及了很多基础的知识的同时也启发了很多想法,感觉很爽。 我自己在交大学的是工科(虽然没怎么上过课),小学、初中、高中都是一路参加数学竞赛,名次都还不错,也因此没有参加中考、高考,一路保送,自己对数学有很深的感情,同时女朋友大学也是数学系,有点后悔的大学选了个并不感兴趣的专业(交大当时允许我随便选专业,我没有跟父母商量自己选了船舶制造)。看这本书的过程中找到了很多高中在看竞赛书的感觉,里面提到的很多概率论(不等式)、图论、数论的知识是高中数学联赛复试的重点,高中的时候已经研究的很深了,不过大学荒废了之后也忘得差不多了,书中提到的很多定理还很有亲切感 书名叫做《数学之美》,显得有些太大,毕竟更多的是吴军在google做搜索相关工作用到的数学模型的介绍与总结,提到的数学部分大多集中在概率论、图论、数论领域,所以书名太大了,可能hax说得对,也许是出版社为了卖书取得名字 不得不说吴军是一个大家,文字中能够透露出大家的气势,书中不断的穿插着各种历史上的大科学家以及科技领域的大家的小故事甚至八卦,从文字中非常能够感受到吴军是一个和他们一个层次的人(即使他自己会自谦说是一个二流

的工程师之类) 书中具体的模型就不介绍了,说几点我学到的知识(仅仅皮毛),能列出来的都是看完还有点印象的: 1.在互联网的世界中,信息是如何量化的,信息熵是怎么回事?有啥用? 2.搜索领域中,语言是如何统计的,尤其是如何通过概率模型进行分词 3.搜索引擎是如何工作的—网络爬虫是怎么回事儿 4.PageRank是怎么回事?为了解决什么问题? 5.密码与解密领域的数学模型,尤其提到的二战时候的各种解密的趣事儿,提到的电视剧《暗算》打算抽空看下 6.拼音输入法的数学模型 7.、文本自动分类的模型 …… 看完之后最大的感受就是: 1.数学模型巨大作用,推动着新技术的发展 2.攻城师是一个伟大的职业,能够运用这些知识转化为生产力,非常牛叉 3.书中提到了很多数学模型都是在不断的进化、改良、升级,也就是说有人不断的在做优化,会有不断更好的模型、更新的技术出现,跟得上技术的发展可能也是比较重要的,否则很多人一直在做某一点上的持续优化就没有意义了。 但同时技术很大的作用是用来解决实际问题的,书中提到的各个数学模型、各种方法都是为了解决人们的需求或者

《数学之美》读后感:数学的艺术_读后感_模板

《数学之美》读后感:数学的艺术_读后感_模板 数学的艺术 ——《数学之美》读后感 -张小镛 这本书一共31章,主要介绍了这些数学方法:统计方法、统计语言模型、中文信息处理、隐含马尔科夫模型、布尔代数、图论、网页排名技术、信息论、动态规划、余弦定理、矩阵运算、信息指纹、密码学、搜索技术、数学模型、最大熵模型、拼音输入法、贝叶斯网络、句法分析、维特比算法、各个击破算法等。从第一章开始其明了幽默的语言就深深的吸引了我,让我觉得如果早一点看这本书,也许数学之于我就是另一番天地。 第一章里作者从原始人类的通信方式开始入手,人类最早利用声音进行的通信依赖于开篇给出的”编码-传输-解码”的基本原理,指出原始人的通信方式和今天的通信方式没什么不同,这世界上近现代最普遍的原理大部分都在人类发展的历史上被无意识的使用着。 第六章信息论给出了信息的度量,它是基于概率的,概率越小,其不确定性越大,信息量就越大。引入信息量就可以消除系统的不确定性,同理自然语言处理的大量问题就是找相关的信息。信息熵的物理含义是对一个信息系统不确定性的度量,这一点与热力学中的熵概念相同,看似不同的学科之间也会有着很强的相似性。事务之间是存在联系的,要学会借鉴其他知识。 这本书里也能找到不少在学的课程知识,如大学专业课里,数电总是要比模电简单不少,而自然界里大部分的信号都属于模拟信号。所谓模拟信号,是指从时间和数值两种维度上看来都是连续变化的信号。在实际电路中,模/数转换是一个很重要的过程,将预处理的模拟信号经过模/数变换为数字信号,然后进行数字信号处理。而数字化处理有很多优点,比如功能强大、抗干扰能力强、易于传输等。 简而言之,如果没有数学,就没有数字信号处理和传输的概念,而数字信号传输在当下大规模的集成电路里是必不可少的,这是通信成功的基本要求。 作者把生活中遇到的复杂的问题,以简单清晰,直观的模型或者公式展现出来。我们可能过于注意生活中的种种奇妙现象,往往忽略了追求其理论逻辑的演绎,而这,()也是大部分问题的主要根源。 罗素曾经说过:”数学,如果正确地看,不但拥有真理,而且也具有至高的美”;爱因斯坦也曾说过:”纯数学使我们能够发现概念和联系这些概念的规律,这些概念和规律给了我们理解自然现象的钥匙。”数学在所有科学领域起着基础和根本的作用。”哪里有数,哪里就有美”.在这里,我也想把《数学之美》真诚推荐给每一位对自然、科学、生活有兴趣有热情的朋友,不管你是从事职业,读一读它,会让你受益良多。 吴军老师在《数学之美》中提到:”这本书的目的是讲道而不是讲术。很多具体的搜索技术很快会从独门绝技到普及,再到落伍,追求术的人一辈子工作很辛苦。只有掌握了搜索的本质和精髓才能永远游刃有余”.回到我们日常的生活中,需要学习的东西、技术太多太多,如果一味地只为去追技术的脚步,那么我们也会很累很累。然而基本的原理却是没有怎么变化的。只见森林,不见树木,难免迷失;站在高处向下看,也许我们一直看不到底,但是站在底处却是可以看见底的。 野犬女皇读后感 最近,我读了沈石溪的动物小说——《野犬女皇》,给我的感悟非常深刻。

读《数学之美》感悟

读《数学之美》感悟 读这本书纯属偶然,原本只是爱人的读物,后来用来给孩子做早之又早的早教启蒙,再后来,在旁边当听众的我也开始感兴趣了。 大学时候有一个段子广为流传:盛传大学有一棵树叫高树,许多童鞋在上面吊死了。后来发现一棵长在数学系的树,叫分析树,它足够高,很多人趴在上面往下看,结果吓死了。作为一个被高数虐过的文科学生,面对数学俩字确实是心有余悸。如果之前有个人问我矩阵是不是很美,我一定会像见到外星人一样盯着他看半天。可是这本书却相当奇妙,读过之后,才发现大学时学的数学知识,比如马尔可夫链、矩阵计算,甚至余弦函数原来都如此亲切,并且栩栩如生,才发现自然语言和信息处理这么有趣。 但同样不得不说的是,尽管读完了,却也仅仅是囫囵吞枣,真的不敢说自己读懂了,能粗略领会其三分之一的精神已是自夸之词了。这本书最大的价值就在于,它没有直接告诉你答案,而是让你带着新的启示、新的方法以及新的眼光、新的境界来重新理解这个世界。 关于教育。 作者在书中提到一个观点:每个人随着年龄的增长,理解力会提高,因此小时候需要1000个学时才能学会的知识,上了大学后只需要500个学时就够了。联想到孩子的教育问题,在培养孩子的时候,没必要太早给孩子灌输一些所谓的技能,没必要太执着于为了通过考试而进行优化。最重要的是为他们树立正确的人生观、价值观,培养认知世界的兴趣和方法,孩子的社会经验、生活能力以及儿时树立的志向才是伴随他们一生的东西。知识可以早学,也可以晚学,而且长大了学的更快,但是错过的成长阶段是无法补回来的。当理解能力增强后,以前花很久才能领悟的东西,上大学之后可以用非常短的时间读完。所谓的早期优势,在大学时很快就丧失殆尽。教育和学习是一生的事情,以长远的目光看待,才能抵御拔苗助长和伤仲永似的问题。

最新发现数学之美--感受数学魅力

发现数学之美感受数学魅力 方山学校宋宏文数学是什么?不同的人对数学的认识是不一样的。在多数人心中,它也许只是“1、2、3……”这些数字之间的游戏。在大多数学生看来数学就是计算,推理和证明,觉得数学很抽象,感觉枯燥无味。其实数学是一门很美的学科,很多大数学家都从不同的角度称颂数学之美。例如:“数学是壮丽多彩,千姿百态,引人入胜的”(华罗庚);“数学之美,美在纯净”(纳什); 既然数学是美丽和魅力无穷的,为什么不少学生从小学开始便讨厌数学,觉得数学难懂难学,枯燥无味呢?主要原因是孩子们刚接触数学时,家长或老师只教他们算法和算理,不重视让他们领略到数学美和好玩的一面。数学家杨乐说得好:“学数学的关键是培养学生的兴趣,使数学成为爱好和兴趣。”因此,如果我们的教师能够欣赏数学的美,重视在教学中让学生体验数学之美,领略数学魅力,培养学生对数学知识美的热爱,从而激发学生对数学的学习兴趣,开发学生的智力,从而达到育人的目的,那是多么的重要。 数学是美的,关键是我们要有一双善于发现美的眼睛,要有一颗善于发现美的心灵。数学是一门美学,它具有符号美、抽象

美、和谐美、简洁美、形式美、奇异美、变化美等等。下面就本人在近年的教学探索中的一些做法加以举例说明如何去发现,展示小学数学中的美。 一、认识数字的有趣和神奇,感受数学美,让学生体验数学的精彩。 学习数学首先是从认识数字开始,如何让学生觉得数字生动、形象、有趣,给学生留下一个深刻的印象,迈好开始的第一步,对今后的学习十分重要。我们在教学中可以采取多种不同的方法来加强学生对数字的学习兴趣。比如:通过故事学数字就是一个很好的方法,在一年级的语文书上有这样一首诗:“一去二三里,烟村四五家,亭台六七座,八九十枝花。”这首诗“巧妙的把‘一’到‘十’这10个数嵌入其中。这样的数字诗,读起来妙趣横生,学生既记住了数字,又学习了古诗,令人回味悠长,学生各积极性很高,学习效果也好。另外,用联想的方法,让学生想象,每个数字的样子像什么,有助于学生对数字产生亲切感,觉得数字原来就在我们的身边,生活中处处是数学,发现数学的妙处不但有趣,而且还能解决问题。比如数字“1”,我们可以把它看作“一枝铅笔,一根筷子,一根棍子”等等。数字“7”这是一个抽象的数字,学生看到它,可能想起神话传说中的“七仙女”,想起白雪公主身旁的“七个小矮人”,想起每周的“七天”等等。根据学生的想象,我们可以编出数字儿歌,这样数形结合,

数学之美系列完整版

数学之美系列完整版(最新全集列表) 作者:吴军, Google研究员来源:Google黑板报酷勤网收集2007-12-04 数学之美一统计语言模型 数学之美二谈谈中文分词 数学之美三隐含马尔可夫模型在语言处理中的应用?数学之美四怎样度量信息??数学之美五简单之美:布尔代数和搜索引擎的索引 数学之美六图论和网络爬虫(Web Crawlers)?数学之美七信息论在信息处理中的应用 数学之美八贾里尼克的故事和现代语言处理 数学之美九如何确定网页和查询的相关性?数学之美十有限状态机和地址识别 数学之美十一Google 阿卡 47 的制造者阿米特。辛格博士 数学之美十二余弦定理和新闻的分类 数学之美十三信息指纹及其应用 数学之美十四谈谈数学模型的重要性?数学之美十五繁与简自然语言处理的几位精英 数学之美十六不要把所有的鸡蛋放在一个篮子里最大熵模型?数学之美十七闪光的不一定是金子谈谈搜索引擎作弊问题(Search Engine Anti—SPAM) 数学之美十八矩阵运算和文本处理中的分类问题?数学之美十九马尔可夫链的扩展贝叶斯网络(Bayesian Networks) 数学之美二十自然语言处理的教父马库斯?数学之美二十一布隆过滤器(BloomFilter) 数学之美二十二由电视剧《暗算》所想到的—谈谈密码学的数学原理?数学之美二十三输入一个汉字需要敲多少个键—谈谈香农第一定律?数学之美二十四从全球导航到输入法——谈谈动态规划

数学之美系列一:统计语言模型 在很多涉及到自然语言处理的领域,如机器翻译、语音识别、印刷体或手写体识别、拼写纠错、汉字输入和文献查询中,我们都需要知道一个文字序列是否能构成一个大家能理解的句子,显示给使用者。对这个问题,我们可以用一个简单的统计模型来解决这个问题. 前言? 也许大家不相信,数学是解决信息检索和自然语言处理的最好工具。它能非常清晰地描述这些领域的实际问题并且给出漂亮的解决办法。每当人们应用数学工具解决一个语言问题时,总会感叹数学之美.我们希望利用 Google 中文黑板报这块园地,介绍一些数学工具,以及我们是如何利用这些工具来开发 Google产品的. ?Google 的?系列一:统计语言模型(StatisticalLanguage Models)? 使命是整合全球的信息,所以我们一直致力于研究如何让机器对信息、语言做最好的理解和处理。长期以来,人类一直梦想着能让机器代替人来翻译语言、识别语音、认识文字(不论是印刷体或手写体)和进行海量文献的自动检索,这就需要让机器理解语言.但是人类的语言可以说是信息里最复杂最动态的一部分。为了解决这个问题,人们容易想到的办法就是让机器模拟人类进行学习 - 学习人类的语法、分析语句等等。尤其是在乔姆斯基(Noam Chomsky 有史以来最伟大的语言学家)提出“形式语言” 以后,人们更坚定了利用语法规则的办法进行文字处理的信念。遗憾的是,几十年过去了,在计算机处理语言领域,基于这个语法规则的方法几乎毫无突破。 其实早在几十年前,数学家兼信息论的祖师爷香农(Claude Shannon)就提出了用数学的办法处理自然语言的想法。遗憾的是当时的计算机条件根本无法满足大量信息处理的需要,所以他这个想法当时并没有被人们重视.七十年代初,有了大规模集成电路的快速计算机后,香农的梦想才得以实现。? 首先成功利用数学方法解决自然语言处理问题的是语音和语言处理大师贾里尼克(FredJelinek)。当时贾里尼克在 IBM 公司做学术休假(Sabbatical Leave),领导了一批杰出的科学家利用大型计算机来处理人类语言问题。统计语言模型就是在那个时候提出的. 给大家举个例子:在很多涉及到自然语言处理的领域,如机器翻译、语音识别、印刷体或手写体识别、拼写纠错、汉字输入和文献查询中,我们都需要知道一个文字序列是否能构成一个大家能理解的句子,显示给使用者。对这个问题,我们可以用一个简单的统计模型来解决这个问题. ?如果 S 表示一连串特定顺序排列的词w1,w2,…,wn ,换句话说,S 可以表示某一个由一连串特定顺序排练的词而组成的一个有意义的句子。现在,机器对语言的识别从某种角度来说,就是想知道S在文本中出现的可能性,也就是数学上所说的S 的概率用 P(S) 来表示。利用条件概率的公式,S这个序列出现的概率等于每一个词出现的概率相乘,于是P(S) 可展开为:??P(S) = P(w1)P(w2|w1)P(w3|w1 w2)…P(wn|w1 w 2…wn-1)??其中 P (w1)表示第一个词w1出现的概率;P (w2|w1) 是在已知第一个词的前提下,第二个词出现的概率;以次类推。不难看出,到了词wn,它的出现概率取决于它前面所有词。从计算上来看,各种可能性太多,无法实现。因此我们假定任意一个词wi的出现概率只同它前面的词 wi—1有关(即马尔可夫假设),于是问题就变得很简单了。现在,S 出现的概率就变为:??P(S) = P(w1)P(w2|w1)P(w3|w2)…P (wi|wi—1)…?(当然,也可以假设一个词又前面N—1个词决定,模型稍微复杂些。)?

《数学之美》读后感

读《数学之美》有感 第一次听到这本书名字时,我并没有什么想要阅读它的兴趣。作为一名文科生,数学在我眼里是看起来毫无实用价值的公式定理,是繁琐复杂的演算步骤,是永远考不到高分的那门课程,我对它“深恶痛绝”,丝毫不觉它会有任何美感。但在老师的强烈推荐下,我还是对它产生了好奇。或许一直以来,我对数学都存在着一种误解,我很想知道,我所以为的刻板枯燥的数学,究竟如何产生美感,或许这本书能给我新的认识。 准确的说,这并不是一本单纯讲述数学原理的书,更多的是将数学放在IT 领域中,让数学原理与语音识别,搜索引擎等技术相碰撞,从而呈现数学之美。书中所讲的数学更多的是作为一种工具,或者说是一把万能的钥匙,信息科技如同宏伟的城堡,语音识别,自然语音处理和信息搜索领域就如同其中一个个充满未知的房间,每一次研究遭遇难题时,科学家们被拒之门外时,最终打开它的钥匙总是数学。这样一把钥匙的迷人之处,或许就在于它以最精简的形态,突破了最复杂的障碍。 谈起数学之美,本书的第一章却先从语言入手,让我颇为意外。但一步步读下来也体会到了作者的用心。相对于理解深刻的数学原理,理解语言更易于读者接受,更易于传递其中的趣味。而语言和数学之间确实也存在着密不可分的联系。数字与文字同是信息的载体,其目的也都是为了传递和存储信息,但两者又各自有鲜明的特点。由于不同文化背景的影响,文字有着千差万别的形态,在不同语义和语法规则的组织下,更是有着丰富多彩的内涵。而数字的特点就在于它形式的简洁和规则的统一。有限的数字符号,按照世界公认的计算规则,就能承载庞大的信息量,可以说,数字是世界通用的一种语言,也是互联网联通世界必不可少的一种语言。从语言的角度去了解数字给了我一种新的认识,就好像互联网如同一个新的国度,在这里通用的语言是数字,面对用户的需求,互联网在接受和处理的过程中经过种种程序以实现最准确的回应,而这种回应遵从的语法规则就是数学。 对于数学在IT领域的应用,作者在后面几章有了更为具体详细的阐述。马尔可夫链,矩阵计算,乃至是余弦定理,这些看似如空中楼阁的原理,其实恰恰是信息技术大厦的地基之一。我一直怀疑数学无实用,其实只是自己的理解太过表面狭隘,当更深入的了解到某些学科,才发现数学其实已被广泛应用与各个领域。作者在密码学那一章谈到日本军方因为对密码学中一些数学原理缺乏了解,在二战中吃了不少亏,说道:“都说落后就要挨打,其实数学没学好也要挨打。”虽是玩笑,但确实反映出数学在现代科技发展过程的重要地位,尤其是在这样一个互联网时代,数学的作用更是举足轻重。从20世纪50年代到70年代,科学家们在自然语言处理方面的研究之所以走进死胡同,其实就是没有很好的利用数学的作用,以致对计算机智能的理解出现偏差。事实上人类有人类的思维方式,计算机有计算机的思维方式,而这种思维方式就是以数学为依托。为计算机的种种程序建立数学模型,或许就如同为计算机构建脑回路。 书本越读到后面,对IT领域数学的应用介绍就越多也越具体,对于数学基础相对薄弱的我而言,理解起来越困难。后面章节中涉及到的奇异值分解、最大熵模型、条件随机场等等概念更为抽象,也许是由于相关基础知识的欠缺,我并不能很好地理解,但其实作者在阐述的过程中并没有多少繁琐的演算过程和空洞

数学之美系列完整版

数学之美系列完整版(最新全集列表) 作者:吴军, Google 研究员来源:Google黑板报酷勤网收集2007-12-04 数学之美一统计语言模型 数学之美二谈谈中文分词 数学之美三隐含马尔可夫模型在语言处理中的应用 数学之美四怎样度量信息? 数学之美五简单之美:布尔代数和搜索引擎的索引 数学之美六图论和网络爬虫 (Web Crawlers) 数学之美七信息论在信息处理中的应用 数学之美八贾里尼克的故事和现代语言处理 数学之美九如何确定网页和查询的相关性 数学之美十有限状态机和地址识别 数学之美十一 Google 阿卡 47 的制造者阿米特.辛格博士 数学之美十二余弦定理和新闻的分类 数学之美十三信息指纹及其应用 数学之美十四谈谈数学模型的重要性 数学之美十五繁与简自然语言处理的几位精英 数学之美十六不要把所有的鸡蛋放在一个篮子里最大熵模型 数学之美十七闪光的不一定是金子谈谈搜索引擎作弊问题(Search Engine Anti-SPAM) 数学之美十八矩阵运算和文本处理中的分类问题 数学之美十九马尔可夫链的扩展贝叶斯网络 (Bayesian Networks) 数学之美二十自然语言处理的教父马库斯 数学之美二十一布隆过滤器(Bloom Filter) 数学之美二十二由电视剧《暗算》所想到的 — 谈谈密码学的数学原理数学之美二十三输入一个汉字需要敲多少个键—谈谈香农第一定律 数学之美二十四从全球导航到输入法——谈谈动态规划

数学之美系列一:统计语言模型 在很多涉及到自然语言处理的领域,如机器翻译、语音识别、印刷体或手写体识别、拼写纠错、汉字输入和文献查询中,我们都需要知道一个文字序列是否能构成一个大家能理解的句子,显示给使用者。对这个问题,我们可以用一个简单的统计模型来解决这个问题。 前言 也许大家不相信,数学是解决信息检索和自然语言处理的最好工具。它能非常清晰地描述这些领域的实际问题并且给出漂亮的解决办法。每当人们应用数学工具解决一个语言问题时,总会感叹数学之美。我们希望利用Google 中文黑板报这块园地,介绍一些数学工具,以及我们是如何利用这些工具来开发Google 产品的。 系列一:统计语言模型(Statistical Language Models) Google 的使命是整合全球的信息,所以我们一直致力于研究如何让机器对信息、语言做最好的理解和处理。长期以来,人类一直梦想着能让机器代替人来翻译语言、识别语音、认识文字(不论是印刷体或手写体)和进行海量文献的自动检索,这就需要让机器理解语言。但是人类的语言可以说是信息里最复杂最动态的一部分。为了解决这个问题,人们容易想到的办法就是让机器模拟人类进行学习- 学习人类的语法、分析语句等等。尤其是在乔姆斯基(Noam Chomsky 有史以来最伟大的语言学家)提出“形式语言” 以后,人们更坚定了利用语法规则的办法进行文字处理的信念。遗憾的是,几十年过去了,在计算机处理语言领域,基于这个语法规则的方法几乎毫无突破。 其实早在几十年前,数学家兼信息论的祖师爷香农(Claude Shannon)就提出了用数学的办法处理自然语言的想法。遗憾的是当时的计算机条件根本无法满足大量信息处理的需要,所以他这个想法当时并没有被人们重视。七十年代初,有了大规模集成电路的快速计算机后,香农的梦想才得以实现。 首先成功利用数学方法解决自然语言处理问题的是语音和语言处理大师贾里尼克(Fred Jelinek)。当时贾里尼克在IBM 公司做学术休假(Sabbatical Leave),领导了一批杰出的科

相关文档
最新文档