统计机器翻译简明教程

《数理统计》试卷及答案

---------------------------------------- 说明:本试卷总计100分,全试卷共 5 页,完成答卷时间2小时。 ---------------------------------------- 一、填空题(本大题共8小题,每题4分,共32分) 1、随机事件A 、B 互不相容,且A =B ;则()P A = 2、已知,10/1)/(,5/1)(,5/2)(===B A P B P A P 则=+)(B A P 3、同时掷三枚均匀硬币,则恰有两枚正面向上的概率为 。 4、若随机变量)2.0,20(~B X ,则X 的最可能值是 。 5、若n X X X ,...,,21为来自泊松分布)(λP 的一个样本,2,S X 分别为样本均值和样本方差,则 =)(X E ,=)(2S E 。 6、样本0,5,10,-3样本均数为 ,样本方差为 。 7、2σ已知时检验假设0100:;:μμμμ≠=H H ,应构造统计量为 ,拒绝域为 。 8、考查4个3水平的因子A,B,C,D 及其交互作用A ×B 与A ×C ,则做正交实验设计时,可选用的行数最少的正交表为 。 二、单项选择题(本大题共8小题,每题4分,共32分) 1、设随机事件A 、B 互不相容,且()0,()0,P A P B >>则下列结论只有( ) 成立。 A 、A 、 B 是对立事件; B 、A 、B 互不相容; C 、A 、B 不独立; D 、 A 、 B 相互独立。 2、射击三次,事件i A 表示第i 次命中目标(i =1,2,3),下列说法正确的是( )。 A 、321A A A 表示三次都没击中目标; B 、313221A A A A A A ++表示恰有两次击中目标; C 、313221A A A A A A ++表示至多一次没击中目标;D 、321A A A 表示至少有一次没击中目标。 3、随机变量),(~2σμN X ,则随着σ的减小,)|(|σμ<-X P 应( )。 A 、单调增大; B 、单调减少; C 、保持不变; D 、增减不能确定

搭建属于自己的机器翻译系统

搭建属于自己的机器翻译系统——MTI专业“技术小白”走进小牛翻译开源社区的心得 搭建属于自己的机器翻译系统 ——MTI专业“技术小白”走进小牛翻译开源社区的心得首先,自我介绍一下。我是一个MTI(翻译硕士)专业、没有计算机编程背景、没有机器翻译理论基础的菜鸟,任职于一家网络科技公司的市场部门,之前的工作中需要做些翻译工作,有时候求助百度翻译、有道翻译等免费的机器翻译系统来解决问题,但是对于一些涉及我们商业机密的数据,由于担心泄密,只能借助于有道词典查查词,然后再自己形成翻译结果。很早之前我就想,要是能有自己的机器翻译系统就好了。 我心目中的翻译技术大牛、对外经贸大学的崔启亮老师曾在微博中给MTI的学生提建议,“学好翻译技术,有前途。对于仍在迷茫MTI的同学,我建议学机器翻译设计与开发,走出迷茫。”非常非常幸运的是,我一个东大毕业的同学告诉我,东北大学自然语言处理实验室(国内搞机器翻译最好的团队之一)联合沈阳雅译网络技术有限公司推出了“小牛翻译开源社区”,社区中有一项内容,就是教不懂机器翻译的人学习“快速搭建自己的机器翻译系统”。于是,我走进社区,按照社区里的相关说明,亲身体验了搭建过程。下面,我想谈谈这个被誉为“目前国内首个以机器翻译为核心的交流平台”的菜鸟级用户体验。 小牛翻译开源社区里提供了统计机器翻译开源系统的全部代码。我了解了一下,NiuTrans开源系统在国际上比较有名,据说是目前国际上能够支持统计机器翻译模型最全的两套统计机器翻译系统之一(另一套是爱丁堡大学的Moses)。这些内容对MT(机器翻译)的专业学者应该很有用吧,但是对于我这个非科班出身的人来说,其实会完全忽略这部分内容。我还是讲讲我在社区里的真正收获——快速搭建实用的机器翻译系统。 一、搭建过程详细说明 需要说明的是,我是在在网页指导与人工指导下才在自己的电脑(Windows7 64位系统,硬盘500G,内存8G)上成功搭建机器翻译系统的。解释一下为什么我不仅看了网页上操作指导,还需要人工指导。身为“技术小白”的我,虽然网页上的操作指导写的很规范,但是第一次接触这么“高大上”的东西,还是有点小紧张的。于是,我加入了小牛翻

数理统计试题及答案

数理统计考试试卷 一、填空题(本题15分,每题3分) 1、总体得容量分别为10,15得两独立样本均值差________; 2、设为取自总体得一个样本,若已知,则=________; 3、设总体,若与均未知,为样本容量,总体均值得置信水平为得置信区间为,则得值为________; 4、设为取自总体得一个样本,对于给定得显著性水平,已知关于检验得拒绝域为2≤,则相应得 备择假设为________; 5、设总体,已知,在显著性水平0、05下,检验假设,,拒绝域就是________。 1、; 2、0、01; 3、; 4、; 5、。 二、选择题(本题15分,每题3分) 1、设就是取自总体得一个样本,就是未知参数,以下函数就是统计量得为( )。 (A) (B) (C) (D) 2、设为取自总体得样本,为样本均值,,则服从自由度为得分布得统计量为( )。 (A) (B) (C) (D) 3、设就是来自总体得样本,存在, , 则( )。 (A)就是得矩估计(B)就是得极大似然估计 (C)就是得无偏估计与相合估计(D)作为得估计其优良性与分布有关 4、设总体相互独立,样本容量分别为,样本方差分别为,在显著性水平下,检验得拒绝域为( )。 (A) (B) (C) (D) 5、设总体,已知,未知,就是来自总体得样本观察值,已知得置信水平为0、95得置信区间为(4、71,5、69),则取显著性水平时,检验假设得结果就是( )。 (A)不能确定(B)接受(C)拒绝(D)条件不足无法检验 1、B; 2、D; 3、C; 4、A; 5、B、 三、(本题14分) 设随机变量X得概率密度为:,其中未知 参数,就是来自得样本,求(1)得矩估计;(2)得极大似然估计。 解:(1) , 令,得为参数得矩估计量。 (2)似然函数为:, 而就是得单调减少函数,所以得极大似然估计量为。 四、(本题14分)设总体,且就是样本观察值,样本方差,

统计机器翻译

统计机器翻译 来自维基百科,免费的百科全书 统计机器翻译(SMT)是一种机器翻译的模型,译文在统计模式的基础上生成,而统计模式所需的参数来自于对双语文本语料库的分析。 机器翻译中基于统计的方法与基于规则的方法和基于实例的方法相对。 统计机器翻译的最初想法由Warren Weaver在1949年〔1〕提出,其中包括对Claude Shannon 的信息理论。 统计机器翻译在1991年时由IBM公司的托马斯?J?沃森研究中心的研究者们再次提出,并且对近些年来重新唤起人们对机器翻译的兴趣作出重大贡献。到2006年为止,它已经是研究最广泛的机器翻译模型。 优势 统计机器翻译相对于最常被人们谈论的传统模型的优势如下: ?更好地利用资源 o存在着大量可被机器读取的格式的自然语言。 o通常,统计机器翻译系统不是针对于任何具体的语言配对。 o基于规则的翻译系统需要对语言规则的手动开发,这样不仅成本很高,而且通常对其它语言不适用。 ?更多的自然语言翻译资料 统计机器翻译的想法来自于信息理论。本质上来说,文档的翻译在基于可能性的p(e | f),其中的本国语言(例如英语)字符“e”就是对外国语言(例如法语)中字符“f”的翻译。一般来说,这些可能性都是利用参数估算的技术实现。 将贝叶斯法则应用于p(e | f)这个外语字符译成母语字符的可能性,会得到这一可能性,其中的翻译模型p(f | e)表示母语字符是对外语字符的翻译的可能性,而语言模型p(e)表示那个母语字符出现的可能性。从算术上来说,发现最佳译文也就是选取出现概率最高的那个。 要严格执行这一过程就必须对母语中所有字符e *进行穷举搜索。有效搜索就是机器解码器要做的工作,利用外语字符、启发式的或其它方法来限制搜索范围,同时保证合意的译文质量。质量和所耗时间之间的这种交换在语音识别方面也可以看到。 翻译系统不能将所有的母语字符串和它们的译文都存储起来,所以只能对文档进行逐句翻译,但即使这样也还是不够的。语言模型是典型的可被稳定的n-gram模型模拟的,并且同样的方法已经应用于翻译模型,但是语言中不同的句子长度和词汇顺序造成了更多的复杂问题。 统计机器翻译模型最初是基于词汇的(来自IBM的模型1-5),但是在引入了基于短语的模型之后有了重大的发展。近期已经引入了句法或类似语法的结构。 基于词汇的的翻译 在基于词汇的翻译中,待译的元素是所有的词汇。实际上,由于复合的词汇、词法和习惯用

一个汉英机器翻译系统的设计与实现

一个汉英机器翻译系统的 计算模型与语言模型* 刘群+詹卫东++常宝宝++刘颖+ (+中国科学院计算技术研究所二室北京100080) (++北京大学计算语言学研究所北京100871) 摘要:本文介绍我们所设计并实现的一个汉英机器翻译系统。在概要介绍本系统的主要目标和设计原则的基础上,着重说明系统的计算模型和语言模型,最后给出实验结果和进一步的打算。 关键词:自然语言处理机器翻译中文信息处理 一、引言 我国的机器翻译研究近年来取得了很大的发展。特别是英汉机器翻译系统的研制已经取得了较大的成功,达到了初步实用的阶段。相对而言,汉英机器翻译的研究却进展比较缓慢,离实用化还有相当的距离[1]。我们的目的是利用目前最新的计算机软件技术、相对成熟的机器翻译方法和先进的汉语语法理论,构造一个初步实用的汉英机器翻译系统。本文将对我们所开发的系统所采用的计算模型和语言模型作一个总体性的介绍,而不涉及过多的细节。 下面我们简要介绍一下本系统的几个主要设计原则: ⑴采用成熟的技术 我们的目的是构造一个真正实用的汉英机器翻译系统,因而在可供选择的若干技术路线面前,我们将尽量选用比较成熟的技术,而在现有技术难以解决问题时再尝试一些新技术。 ⑵开放的体系结构 开放的体系结构主要体现在系统的实现上所采用的软件构件技术[8]。整个系统采用一些相对独立的软件构件组成,因而可以方便地对系统进行修改、维护和扩充。翻译的过程严格按照独立分析、独立生成的原则进行组织,每一阶段的算法相互独立,对其中一个阶段算法的修改不会对其他算法造成影响。 ⑶方便的调试环境 本系统强调为语言工作者提供一个方便的调试环境。系统提供多窗口图形界面的知识库调试工具,支持课题组中多人同时通过网络对一个知识库进行操作。提供对翻译过程直观显示,用户可以清晰地看到翻译过程的每一步操作。提供翻译出错原因查找机制,用户 *本项目的研究受到863-306资助,合同号为863-306-03-06-2

概率论与数理统计期末考试题及答案

创作编号: GB8878185555334563BT9125XW 创作者: 凤呜大王* 模拟试题一 一、 填空题(每空3分,共45分) 1、已知P(A) = 0.92, P(B) = 0.93, P(B|A ) = 0.85, 则P(A|B ) = 。 P( A ∪B) = 。 3、一间宿舍内住有6个同学,求他们之中恰好有4个人的生日在同一个月份的概率: ;没有任何人的生日在同一个月份的概率 ; 4、已知随机变量X 的密度函数为:, ()1/4, 020,2 x Ae x x x x ??

8、设总体~(0,)0X U θθ>为未知参数,12,,,n X X X 为其样本, 1 1n i i X X n ==∑为样本均值,则θ的矩估计量为: 。 9、设样本129,, ,X X X 来自正态总体(,1.44)N a ,计算得样本观察值10x =, 求参数a 的置信度为95%的置信区间: ; 二、 计算题(35分) 1、 (12分)设连续型随机变量X 的密度函数为: 1, 02()2 0, x x x ??≤≤?=???其它 求:1){|21|2}P X -<;2)2 Y X =的密度函数()Y y ?;3)(21)E X -; 2、(12分)设随机变量(X,Y)的密度函数为 1/4, ||,02,(,)0, y x x x y ?<<??

Matlab中文简明教程

MatLab简介 MATLAB是什么? 典型的使用包括: 数学和计算 算术发展模型, 模拟,和原型 数据分析,开发,和可视化 科学和工程图学 应用发展包括图形用户界面设计 MATLAB表示矩阵实验室。 MATLAB系统 MATLAB系统由5主要的部分构成: 1. MATLAB语言。这是高阶的矩阵/数组语言,带控制流动陈述,函数,数据结构,输入/输出,而且面向目标的编程特点。 Ops 操作符和特殊字符。 Lang 程序设计语言作。 strfun 字符串。 iofun 输入/输出。 timefun 时期和标有日期。 datatypes数据类型和结构。 2. MATLAB工作环境。这是你作为MATLAB用户或程序编制员的一套工具和设施。 3. 制图这是MATLAB制图系统。它为2维上,而且三维的数据可视化,图象处理,动画片制作和表示图形包括高阶的指令在内。它也为包括低阶的指令在内,允许你建造完整的图形用户界面(GUIs),MATLAB应用。制图法功能在MATLAB工具箱中被组织成5文件夹: graph2d 2-的维数上的图表。 graph3d 三维的图表。 specgraph 专业化图表。 graphics 制图法。 uitools 图形用户界面工具。 4. MATLAB的数学的函数库。数学和分析的功能在MATLAB工具箱中被组织成8文件夹。 elmat 初步矩阵,和矩阵操作。 elfun 初步的数学函数。 specfun 专门的数学函数。

matfun 矩阵函数-用数字表示的线性的代数。 datafun 数据分析和傅立叶变换。 polyfun 插入物,并且多项式。 funfun 功能函数。 sparfun 稀少矩阵。 5. MATLAB应用程序接口(API)。这是允许你写C、Fortran语言与MATLAB交互。 关于 Simulink Simulink ? MATLAB为做非线性的动态的系统的模拟实验的交互式的系统。它是允许你通过把方框图拉到屏幕,灵活地窜改它制作系统的模型的用图表示的鼠标驱动的程序。实时工作室?允许你产生来自你的图表块的C代码,使之能用于各种实时系统。 关于工具箱 工具箱是为了解答特别种类的问题扩展MATLAB环境的MATLAB函数的综合的(M-文件)收集 MatLab工作环境 命令窗口 若输入 A = [1 2 3; 4 5 6; 7 8 10] 按下回车键后显示如下 A = 1 2 3 4 5 6 7 8 10 清除命令窗口 clc 这并不清除工作间,只是清除了显示,仍可按上箭头看到以前发出的命令

概率论与数理统计试题与答案

概率论与数理统计试题 与答案 Company number:【0089WT-8898YT-W8CCB-BUUT-202108】

概率论与数理统计试题与答案(2012-2013-1) 概率统计模拟题一 一、填空题(本题满分18分,每题3分) 1、设,3.0)(,7.0)(=-=B A P A P 则)(AB P = 。 2、设随机变量p)B(3,~Y p),B(2,~X ,若9 5 )1(= ≥X p ,则=≥)1(Y p 。 3、设X 与Y 相互独立,1,2==DY DX ,则=+-)543(Y X D 。 4、设随机变量X 的方差为2,则根据契比雪夫不等式有≤≥}2EX -X {P 。 5、设)X ,,X ,(X n 21 为来自总体)10(2 χ的样本,则统计量∑==n 1 i i X Y 服从 分布。 6、设正态总体),(2σμN ,2σ未知,则μ的置信度为α-1的置信区间的长度 =L 。(按下侧分位数) 二、选择题(本题满分15分,每题3分) 1、 若A 与自身独立,则( ) (A)0)(=A P ; (B) 1)(=A P ;(C) 1)(0<

机器翻译

机器翻译 1 概述 机器翻译(machine translation),又称为自动翻译,是利用计算机把一种自然源语言转变为另一种自然目标语言的过程,一般指自然语言之间句子和全文的翻译。它是自然语言处理(Natural Language Processing)的一个分支,与计算语言学(Computational Linguistics )、自然语言理解( Natural Language Understanding)之间存在着密不可分的关系。 2 国内外现状 机器翻译思想的萌芽关于用机器来进行语言翻译的想法,远在古希腊时代就有人提出过了。在17世纪,一些有识之士提出了采用机器词典来克服语言障碍的想法。笛卡(Descartes)和莱布尼兹(Leibniz)都试图在统一的数字代码的基础上来编写词典。在17世纪中叶,贝克(Cave Beck)、基尔施(Athanasius Kircher)和贝希尔(Johann JoachimBecher)等人都出版过这类的词典。由此开展了关于“普遍语言”的运动。维尔金斯(JohnWilkins)在《关于真实符号和哲学语言的论文》(An Essay towards a Real Character andPhilosophical Language, 1668)中提出的中介语(Interlingua)是这方面最著名的成果,这种中介语的设计试图将世界上所有的概念和实体都加以分类和编码,有规则地列出并描述所有的概念和实体,并根据它们各自的特点和性质,给予不同的记号和名称。本世纪三十年代之初,亚美尼亚裔的法国工程师阿尔楚尼(G.B. Artsouni)提出了用机器来进行语言翻译的想法,并在1933年7月22日获得了一项“翻译机”的专利,叫做“机械脑”(mechanical brain)。这种机械脑的存储装置可以容纳数千个字元,通过键盘后面的宽纸带,进行资料的检索。阿尔楚尼认为它可以应用来记录火车时刻表和银行的帐户,尤其适合于作机器词典。在宽纸带上面,每一行记录了源语言的一个词项以及这个词项在多种目标语言中的对应词项,在另外一条纸带上对应的每个词项处,记录着相应的代码,这些代码以打孔来表示。机械脑于1937年正式展出,引起了法国邮政、电信部门的兴趣。但是,由于不久爆发了第二次世界大战,阿尔楚尼的机械脑无法安装使用。1903年,古图拉特(Couturat)和洛(Leau)在《通用语言的历史》一书中指出,德国学者里格(W. Rieger) 曾经提出过一种数字语(Zifferngrammatik),这种语法加上词典的辅助,可以利用机械将一种语言翻译成其他多种语言,首次使用了“机器翻译” (德文是ein mechanisches Uebersetzen)这个术语。 真正对机器翻译进行研究应该说是从布恩和韦弗开始的。他们研究的是自动词典万, 从1954年1月7日公开展示的IBM701型计算机开始, 机器翻译进人一个繁荣发展的时期。从那时起, 很多国家都投人了大量的人力、物力从事这方面的研究和开发。随着 Internet 的普遍应用,世界经济一体化进程的加速以及国际社会交流的日渐频繁,传统的人工作业的方式已经远远不能满足迅猛增长的翻译需求,人们对于机器翻译的需求空前增长,机器翻译迎来了一个新的发展机遇。国际性的关于机器翻译研究的会议频繁召开,中国也取得了前所未有的成就,相继推出了一系列机器翻译软件,例如“译星” 、“雅信” 、“通译” 、“华建”等。在市场需求的推动下,商用机器翻译系统迈入了实用化阶段,走进了市场,来到了用户面前。 中国机器翻译研究起步于1957年,是世界上第4个开始搞机器翻译的国家,60年代中期以后一度中断,70年代中期以来有了进一步的发展。现在,中国社会科学院语言研究所、中国科学技术情报研究所、中国科学院计算技术研究所、黑龙江大学、哈尔滨工业大学等单位都

《概率与数理统计》试题与参考答案

一、填空题(本大题共有10个小题,每小题3分,共30分) 1.设C B A 、、是3个随机事件,则“三个事件中至少有两个事件发生” 用 C B A 、、 表示为 ; 2.设P (A )=0.3,P (B )=0.6,若A 与B 独立,则)(B A P ?= ; 3.设X 的概率分布为C k k X P k ?-= =21 2)(,4,3,2,1=k ,则=C ; 4.设随机变量ξ~),(p n B ,且4=ξE ,2=ξD ,则n = ; 5.设随机变量ξ的密度函数为????? ≤ =其他,02||,cos )(πx x C x f ,则常数 C = ; 6.设n X X X ,,,21 是来自),(2σμN 的样本,则=)(X E ; 7.设随机变量X 与Y 相互独立,且X ~N (0,9),Y ~N (0,1),令Z =X -2Y ,则 D (Z )= ; 8.n X X X ,,,21 是取自总体),(2 σμN 的样本,则∑== n i i X n X 1 1 ~ ; 9.若总体),(~2σμN X ,且2σ未知,用样本检验假设0H :0μμ=时,则采用的统计量是 ; 10.设总体)(~λP X ,则λ的最大似然估计为 。

二、单项选择题(本大题共10小题,每小题2分,共20分) 1.若 A 与 B 互为对立事件,则下式成立的是 ( ) A.P (A ?B )=Ω B.P (AB )=P (A )P (B ) C. P (AB )=φ D. P (A )=1-P (B ) 2.已知一射手在两次独立射击中至少命中目标一次的概率为0.96,则该射手每次射击的命中率为 ( ) A.0.04 B.0.2 C.0.8 D.0.96 3.设A ,B 为两事件,已知P (A )=31,P (A|B )=32,5 3)A |B (P =,则P (B )=( ) A. 5 1 B. 5 2 C. 5 3 D. 5 4 4. 随机变量X )3(~E ,则=)(X D ( ) A. 31 B. 91 C. 271 D. 81 1 5. 设随机变量X ~N (2,32),Φ(x )为标准正态分布函数,则P { 2

机器翻译研究现状与展望1 Machine TranslationPast,Present,future

机器翻译研究现状与展望1 戴新宇,尹存燕,陈家骏,郑国梁 (南京大学计算机软件新技术国家重点实验室,南京 210093) (南京大学计算机科学与技术系,南京 210093) 摘要:本文回顾机器翻译研究的历史,介绍典型的机器翻译方法,包括:基于规则、基于统计以及基于实例的机器翻译方法;针对机器翻译的研究现状,详细介绍和分析了基于混合策略的机器翻译方法,对统计以及机器学习方法在机器翻译中的应用进行了描述;论文还介绍了当前机器翻译评测技术;最后对机器翻译进行总结和展望。 关键字:机器翻译,基于规则,基于统计,基于实例,混合策略,机器学习 Machine Translation:Past,Present,future Dai Xinyu, Yin Cunyan, Chen Jiajun and Zheng Guoliang (State Key Laboratory for Novel Software Technology, Department of Computer Science & Technology Nanjing University, Nanjing 210093) Abstract:This paper firstly presents the history of machine translation, and introduces some classical paradigms of machine translation: RBMT, SBMT and EBMT. Secondly, we introduce the recent research on machine translation, and describe the hybrid strategies on machine translation in detail, and discuss the applications of machine learning for machine translation. We also analyze the current techniques about evaluation on machine translation. Finally, we draw a conclusion and prospect on the research of machine translation. Keywords:Machine Translation, RBMT, SBMT,EBMT, HSBMT, Machine Learning. 1本论文工作得到863课题资助(编号:2001AA114102, 2002AA117010-04) 戴新宇博士生,主要研究自然语言处理;尹存燕助教,主要研究自然语言处理;陈家骏教授,博士生导师,主要研究自然语言处理、软件工程;郑国梁教授,博士生导师,主要研究软件工程。

计算机网络简明教程课后答案第三章

数据链路(即逻辑链路)与链路(即物理链路)有何区别“电路接通了”和“数据链路接通了”的区别何在 1数据链路与链路的区别在于数据链路除链路外,还必须有一些必要的规程来控制数据的传输。因此,数据链路比链路多了实现通信规程所需的硬件和软件。 2“电路接通了”表示链路两端的结点交换机已经开机,物理连接已经能够传送比特流了。但是,数据传输并不可靠。在物理连接基础上,在建立数据链路连接,才是“数据链路接通了”。此后,由于数据链路连接具有检测、queen和重传等功能,才使不太可靠地物理链路变成可靠的数据来南路,惊醒可靠的数据传输。当数据链路断开连接时,物理电路连接不一定跟着断开连接。 数据链路层的三个基本问题为什么都必须加以解决 帧定界是分组交换的必然要求 透明传输避免消息符号与帧定界符号相混淆 差错检测防止合差错的无效数据帧浪费后续路由上的传输和处理资源 PPP协议的主要特点是什么为什么PPP不适用帧的编号PPP适用于什么情况为什么PPP协议不能使数据链路层实现可靠传输 简单,提供不可靠的数据报服务,检错,无纠错 PPP协议是点对点线路中的数据链路层协议;它有三部分组成:一个将IP数据报封装到串行链路的方法,一个用来建立、配置和测试数据链路的链路控制协议LCP,一套网络控制协议;PPP是面向字节的,处理差错检测,支持多种协议;PPP不使用序号和确认机制,因此不提供可靠传输的服务。它适用在点到点线路的传输中。 PPP协议适用同步传输技术传送比特串000。试问经过零比特填充后变成怎样的比特串若接收方收到的PPP帧的数据部分是000110110,问删除发送方加入零比特后变成怎样的比特串 经过比特填充后:0100 去掉填充的比特:0001110 局域网的主要特点是什么为什么局域网采用广播通信方式而广域网不采用呢局域网LAN是指在较小的地理范围内,将有限的通信设备互联起来的计算机通信网络从功能的角度来看,局域网具有以下几个特点:(1)共享传输信道,在局域网中,多个系统连接到一个共享的通信媒体上。(2)地理范围有限,用户个数有限。通常局域网仅为一个单位服务,只在一个相对独立的局部范围内连网,如一座楼或集中的建筑群内,一般来说,局域网的覆盖范围越位10m~10km内或更大一些。从网络的体系结构和传输检测提醒来看,局域网也有自己的特点:(1)低层协议简单(2)不单独设立网络层,局域网的体系结构仅相当于相当与OSI/RM的最低两层(3)采用两种媒体访问控制技术,由于采用共享广播信道,而信道又可用不同的传输媒体,所以局域网面对的问题是多源,多目的的连连管理,由此引发出多中媒体访问控制技术 在局域网中各站通常共享通信媒体,采用广播通信方式是天然合适的,广域网通常采站点间直接构成格状网。 常用的局域网的网络拓扑有哪些种类现在最流行的是哪种结构为什么早期的以太网选择总

概率论与数理统计试题及答案

一.选择题(18分,每题3分) 1. 如果 1)()(>+B P A P ,则 事件A 与B 必定 ( ) )(A 独立; )(B 不独立; )(C 相容; )(D 不相容. 2. 已知人的血型为 O 、A 、B 、AB 的概率分别是; ;;。现任选4人,则4人血 型全不相同的概率为: ( ) )(A ; )(B 40024.0; )(C 0. 24; )(D 224.0. 3. 设~),(Y X ???<+=., 0, 1,/1),(22他其y x y x f π 则X 与Y 为 ( ) )(A 独立同分布的随机变量; )(B 独立不同分布的随机变量; )(C 不独立同分布的随机变量; )(D 不独立也不同分布的随机变量. 4. 某人射击直到中靶为止,已知每次射击中靶的概率为. 则射击次数的数 学期望与方差分别为 ( ) 、 )(A 4934与; )(B 16934与; )(C 4941与; (D) 9434与. 5. 设321,,X X X 是取自N (,)μ1的样本,以下μ的四个估计量中最有效的是( ) )(A 32112110351?X X X ++=μ ; )(B 32129 4 9231?X X X ++=μ ; )(C 321321 6131?X X X ++=μ ; )(D 32141254131?X X X ++=μ. 6. 检验假设222201:10,:10H H σσ≤>时,取统计量)(~10 )(22 2 12n X i n i χμχ-= ∑=,其 拒域为(1.0=α) ( ) )(A )(21.02n χχ≤;)(B )(21.02n χχ≥;)(C )(205.02n χχ≤;)(D )(2 05.02n χχ≥. 二. 填空题(15分,每题3分) 1. 已知事件A ,B 有概率4.0)(=A P ,5.0)(=B P ,条件概率3.0)|(=A B P ,则 =?)(B A P . 2. 设随机变量X 的分布律为??? ? ??-+c b a 4.01.02.043 21 ,则常数c b a ,,应满足的条件 ) 为 . 3. 已知二维随机变量),(Y X 的联合分布函数为),(y x F ,试用),(y x F 表示概率

计算方法简明教程插值法习题解析

第二章 插值法 1.当1,1,2x =-时,()0,3,4f x =-,求()f x 的二次插值多项式。 解: 0120121200102021101201220211,1,2, ()0,()3,()4;()()1()(1)(2)()()2 ()()1()(1)(2)()()6()()1()(1)(1) ()() 3x x x f x f x f x x x x x l x x x x x x x x x x x l x x x x x x x x x x x l x x x x x x x ==-===-=--==-+-----==------= =-+-- 则二次拉格朗日插值多项式为 2 20 ()()k k k L x y l x == ∑ 022 3()4() 14(1)(2)(1)(1)2 3 5376 2 3 l x l x x x x x x x =-+=- --+ -+=+ - 2.给出()ln f x x =的数值表 用线性插值及二次插值计算ln 0.54的近似值。 解:由表格知, 01234012340.4,0.5,0.6,0.7,0.8;()0.916291,()0.693147()0.510826,()0.356675()0.223144 x x x x x f x f x f x f x f x ======-=-=-=-=- 若采用线性插值法计算ln 0.54即(0.54)f , 则0.50.540.6<<

21121221 11122()10(0.6)()10(0.5) ()()()()() x x l x x x x x x l x x x x L x f x l x f x l x -==----= =---=+ 6.93147( 0.6) 5.10826 (x x =--- 1(0.54)0.62021860.620219L ∴=-≈- 若采用二次插值法计算ln 0.54时, 1200102021101201220212001122()()()50(0.5)(0.6)()()()()()100(0.4)(0.6)()()()()()50(0.4)(0.5) ()() ()()()()()()() x x x x l x x x x x x x x x x x l x x x x x x x x x x x l x x x x x x x L x f x l x f x l x f x l x --==------==-------= =----=++ 500.916291( 0.5)( 0.6) 69.3147( 0.4)(0.6)0.51082650(0.4)(0.5 x x x x x x =-?--+---?--2(0.54)0.615319840.615320 L ∴=- ≈- 3.给全cos ,090x x ≤≤ 的函数表,步长1(1/60),h '== 若函数表具有5位有效数字,研究用线性插值求cos x 近似值时的总误差界。 解:求解cos x 近似值时,误差可以分为两个部分,一方面,x 是近似值,具有5位有效数字,在此后的计算过程中产生一定的误差传播;另一方面,利用插值法求函数cos x 的近似值时,采用的线性插值法插值余项不为0,也会有一定的误差。因此,总误差界的计算应综合以上两方面的因素。 当090x ≤≤ 时, 令()cos f x x = 取0110,( )6060 180 10800 x h π π === ? = 令0,0,1,...,5400i x x ih i =+= 则5400902x π = = 当[]1,k k x x x -∈时,线性插值多项式为

概率论与数理统计试题及答案

考试时间120分钟班级姓名学号 .则 . 2. 三人独立的破译一个密码,他们能译出密码的概率分别为1/5、1/4、1/3,此密码能被译出的概率是 = . 3. 设随机变量2 (,) Xμσ N,X Y e =,则Y的分布密度函数为. 4. 设随机变量2 (,) Xμσ N,且二次方程240 y y X ++=无实根的概率等于0.5,则 μ=. 5. 设()16,()25 D X D Y ==,0.3 X Y ρ=,则() D X Y +=. 6. 掷硬币n次,正面出现次数的数学期望为. 7. 某型号螺丝钉的重量是相互独立同分布的随机变量,其期望是1两,标准差是0.1两. 则100个该型号螺丝钉重量不超过10.2斤的概率近似为(答案用标准正态分布函数表示). 8. 设 125 ,, X X X是来自总体(0,1) X N的简单随机样本,统计量 12 ()~() C X X t n +,则常数C= ,自由度n=. 二(共50分) 1.(10分)设袋中有m只正品硬币,n只次品硬币(次品硬币的两面均有国徽),从袋中 任取一只硬币,将它投掷r次,已知每次都得到国徽.问这只硬币是正品的概率是多少? 2.(10分)设顾客在某银行窗口等待服务的时间(以分计)X服从指数分布,其概率密 度函数为 某顾客在窗口等待服务,若超过10分钟,他就离开. 他一个月到银行5次.以Y表示一个月内他未等到服务而离开窗口的次数,写出Y的分布律,并求{1} P Y≥. 3.(10分)设二维随机变量(,) X Y在边长为a的正方形内服从均匀分布,该正方形的对角线为坐标轴,求: (1) 求随机变量X,Y的边缘概率密度; (2) 求条件概率密度 | (|) X Y f x y. 4.(10分)某型号电子管寿命(以小时计)近似地服从2 (160,20) N分布,随机的选取四只,求其中没有一只寿命小于180小时的概率(答案用标准正态分布函数表示). 5.(10分)某车间生产的圆盘其直径在区间(,) a b服从均匀分布, 试求圆盘面积的数学 期望. 三. (10分)设 12 ,, n X X X是取自双参数指数分布总体的一组样本,密度函数为其中,0 μθ>是未知参数, 12 ,,, n x x x是一组样本值,求:

机器翻译研究综述

机器翻译综述 1.引言 1.1机器翻译的历史 现代机器翻译的研究应该是从20世纪50年代开始,但是早在这以前很多人已经提出了相应的想法,甚至是远在古希腊时期就有人提出要用机器来进行语言翻译的想法。 在1946年,美国宾夕法尼亚大学的两位科学家设计并制造了世界上第一台电子计算机。与此同时,英国工程师同美国洛克菲勒基金会副总裁韦弗在讨论计算机的应用范围时,就提出了利用计算机实现语言的自动翻译的想法。在1949年,韦弗发表了一份名为《翻译》的备忘录,正式提出了机器翻译问题。他提出了两个主要观点: 第一,他认为翻译类似于解读密码的过程。 第二,他认为原文与译文“说的是同样的事情”,因此,当把语言A翻译为语言B时,就意味着从语言A出发,经过某一“通用语言”或“中 间语言”,可以假定是全人类共同的。 在这一段时间由于学者的热心倡导,实业界的大力支持,美国的机器翻译研究一时兴盛起来。 1964年,美国科学院成立语言自动处理咨询委员会,调查机器翻译的研究情况,给出了“在目前给机器翻译以大力支持还没有多少理由”的结论,随后机器翻译的研究就陷入了低潮期。直到70年代以后机器翻译的研究才重新进入了一个复苏期,随后机器翻译的发展又迎来了繁荣期 1.2机器翻译的主要内容 经过50多年的发展,在机器翻译领域中出现了很多的研究方法,总结如下:●直接翻译方法 ●句法转换方法 ●中间语言方法 ●基于规则的方法 ●基于语料库的方法 基于实例的方法(含模板、翻译记忆方法) 基于统计的方法 在当前的研究中,更多的是基于统计的方法进行的,因为基于统计的方法可以充分的利用计算机的计算能力,并且并不需要过多的语言学知识作为支撑,可以让更多的计算机科学家投入到实用系统的研究中,极大的促进了统计机器翻译的发展。 下面对各个方法逐一的进行介绍。

人工智能与机器翻译期末复习题

一、名词解释(5X3‘)15’ 1.兼类(P121):一个单词既可以作名词动词又可以作其他词类 2.机器翻译:用计算机软件代替人做的书面翻译 3.组合型歧义:一个字与前面的字成词,与后面的字成词,合起来也成词。 4.交集型歧义(P117):一个字与前面的字成词,与后面的字也成词。 5.人工智能:用计算机硬件、软件模拟人的行为,解决人类目前尚未认识清楚的问题。 6.人工智能软件的三大技术:知识表示、知识推理、知识获取。 7.语料库:单词、短语和句子组成的数据库。 8.知识工程:包括人工智能软件技术的工程。(知识工程是以知识为基础的系统,就 是通过智能软件而建立的专家系统) 9.深度学习:一步一步在丰富起来的特征规律引导下,由浅入深完成推理的方法。 10.语用分析:分析成语和习惯用语的方法。 二、题解P36 例2.1 、2.2 例2.1 设有下列语句: (1)高山比他父亲出名。 (2)刘水是计算机系的一名学生,但他不喜欢编程序。 (3)人人爱劳动。 为了用谓词公式表示这些语句,应先定义谓词: BIGGER(x,y):x比y出名 COMPUTER(x):x是计算机系的学生 LIKE(x,y):x喜欢y LOVE(x,y):x爱y

M(x):x是人 定义函数father(x)表示从x到其父亲的映射此时可用谓词公式把上述三个语句表示为:(1)BIGGER(高山,father(x)) (2)COMPUTER(刘水)∧∽LIKE(刘水,程序) (3)(?x)(M(x) →LOVE(x,劳动)) 例2.2 设有下列语句: (1)自然数都是大于零的整数。 (2)所有整数不是偶数就是奇数。 (3)偶数除以2是整数。 定义谓词如下: N(x):x是自然数 I(x):x是整数 E(x):x是偶数 O(x):x是奇数 GZ(x):x大于零 另外,用函数S(x)表示x除以2。此时,上述三个句子可用谓词公式表示为: (?x)(N(x) →GZ(x)∧I(x)) (?x)(I(x) →E(x)∨O(x)) (?x)(E(x) →I(S(x))) 三、论述(4X5‘)20’ 1.阐述深度、广度、代价驱动搜索方法。(P68) 答:广度优先搜索法:对全部节点沿广度进行横向扫描,按各节点生成的先后次序,

《数理统计》考试题及参考答案

《数理统计》考试题及参考答案 一、填空题(每小题3分,共15分) 1,设总体X 和Y 相互独立,且都服从正态分布2 (0,3)N ,而12 9(,,)X X X 和129(,,)Y Y Y 是分 别来自X 和Y 的样本,则929 U Y = + +服从的分布是_______ .解:(9)t . 2,设1?θ与2?θ都是总体未知参数θ的估计,且1?θ比2?θ有效,则1?θ与2?θ的期望与方差满足_______ . 解:1212 ????()(), ()()E E D D θθθθ=<. 3,“两个总体相等性检验”的方法有_______ 与____ ___.解:秩和检验、游程总数检验. 4,单因素试验方差分析的数学模型含有的三个基本假定是_______ . 解:正态性、方差齐性、独立性. 5,多元线性回归模型=+Y βX ε中,β的最小二乘估计是?β =_______ .解:1?-''X Y β=()X X . 二、单项选择题(每小题3分,共15分) 1,设12(,,,)(2)n X X X n ≥为来自总体(0,1)N 的一个样本,X 为样本均值,2S 为样本方差,则 ____D___ . (A )(0,1)nX N ; (B )22()nS n χ; (C ) (1)()n X t n S -; (D ) 2 122 (1)(1,1)n i i n X F n X =--∑. 2,若总体2(,)X N μσ,其中2σ已知,当置信度1α-保持不变时,如果样本容量n 增大,则μ的置 信区间____B___ . (A )长度变大; (B )长度变小; (C )长度不变; (D )前述都有可能. 3,在假设检验中,分别用α,β表示犯第一类错误和第二类错误的概率,则当样本容量n 一定时,下列说法中正确的是____C___ . (A )α减小时β也减小; (B )α增大时β也增大; (C ),αβ其中一个减小,另一个会增大; (D )(A )和(B )同时成立. 4,对于单因素试验方差分析的数学模型,设T S 为总离差平方和,e S 为误差平方和,A S 为效应平方和,则总有___A___ . (A )T e A S S S =+; (B ) 22 (1)A S r χσ -;

相关文档
最新文档