中科院自动化所评测技术报告(SYSTEMII).pptx

合集下载

ATA测评报告完整版

ATA测评报告完整版

职场个性剖析测验分析报告测试你的职场情况目录前言 (3)名词解释 (4)第一部测试报告概要 (5)第二部分:测试报告详解 (6)一、你的个性特征 (6)A.优势 (6)B.不足 (7)C.提升工作效能的建议 (7)二、你的行事风格 (8)三、你的工作状态 (9)第三部分:管理指导建议 (10)一、激励建议 (10)二、沟通建议 (10)三、培训建议 (10)前言报告阅读说明:该测试通过测查你在职场中的表现,系统,深入地分析你的职场个性,具体包含以下几个方面:•帮助你了解更真实的自己•帮助你了解职场中的自己•帮助你了解职场中的行为风格(管理风格、目标追求、回避因素、冲突应对等)此外,针对你的个性特征,该报告也提供了相关的管理沟通建议,比如如何与你有效沟通、如何给你提供更有效的培训,如何对你实现有效的激励。

总之,希望该报告能够有助于你扬长避短,遨游职场。

名词解释目标导向(O)“目标导向”是剖面分析所描述的第一个因素,用字母O来表示。

目标导向倾向强的人具有喜欢用做事来证明能力,讨厌犹豫不决,喜欢抓大方向,不喜欢被人干涉等作风。

很可能选择致力于克服障碍来塑造环境,并以此获得成功。

影响感召(I)“影响感召”是剖面分析所描述的第二个因素,用字母I来表示。

影响感召倾向强的人具有典型的外向、社交特征。

与善于交际,乐观、滔滔不绝的特点有关。

会对外在环境采取主动,通过人的关系来发挥影响作用。

耐心合作(P)“耐心合作”是剖面分析所描述的第三个因素,用字母P来表示。

耐心合作倾向强的人具有按步调做事的特征,并且是个有耐心且富同情心的倾听者,他们是真的对别人的问题和感受感兴趣,特别适合担任支持者的角色,也具有非常坚定的行事态度,以及稳定地从事一件工作的专注力。

具有这个特点的人通常被所处环境所影响,审慎地调节节奏。

精确服从(E)“精确服从”是剖面分析所描述的第四个因素,用字母E来表示。

该因素的典型特征是精确行动。

该因素倾向强的人,生来被动,并且不喜主动表达,通常服从组织规则,重视结构及系统导向。

测试报告_ISR41

测试报告_ISR41

呼叫导航主观识别效果数据:通过实际电话流程进行测试,体验号码:5373052测试人员导航正确率识别总句数开始系统提示:对不起,没有听清系统提示:……请问有什么可以帮您?是否有结果系统提示:播报识别结果无识别结果有识别结果测试人员:说出业务说法并发路数LastRespTimeTotalTimeNet TotalTimeTHREADS-RECOGTHREADS-COMPUTE max avg90 0.828 0.0671 34.719 44.36 89.9496 78.2992 90 1.578 0.3334 60.188 69.64 89.6992 71.6624 90 3.075 1.0328 65.313 75.282 89.4024 63.6808高配上:LastRespTimeTotalTimeNet TotalTime THREADS-RECOGTHREADS-COMPUTEcapsmax avg2.094 0.6037 57.453 69.922 59.9993 45.0881 24.36771.938 0.2109 195.5 203.86 14.9978 12.5025 7.1611 Beam为默认值。

高配上:LastRespTimeTotalTimeNet TotalTime THREADS-RECOGTHREADS-COMPUTEcapsRecTimeRatiomax avg max 0.39 0.1313 115.187 128.703 1 1 0.4341 6.3648Beam=-150:高配上:LastRespTimeTotalTimeNet TotalTime THREADS-RECOGTHREADS-COMPUTEcapsRecTimeRatiomax avg max标配上:ISR41LastRespTimeTotalTimeNet TotalTime THREADS-RECOGTHREADS-COMPUTEcapsRecTimeRatiomax avg max网络版数据:LastRespTimeTotalTimeNet TotalTime THREADS-RECOGTHREADS-COMPUTEcapsRecTimeRatioGlobalRecTRatioavg max avg0.2097 614.968 619.172 1 1 0.0813 0.8082 0.4633 0.2437 81.844 86.75 5 3.4632 1.2218 2.1284 1.3232Callog打开:并发路数LastRespTimeTotalTimeNet TotalTimeTHREADS-RECOGTHREADS-COMPUTEcapsRecTimeRatioGlobalRecTRatio max avg max avg1 0.39 0.1328 114.297 126.688 1 1 0.4375 6.2733 2.593 0.3963 5 0.375 0.1521 43.063 54.5 5 4.4 2.3222 6.2313 2.4205 0.4208 10 0.906 0.2145 271.844 283.797 10 8.7266 5.15 10.8792 2.4431 0.423 15 0.938 0.2312 184.125 196.75 15 12.8845 7.6035 10.7751 2.4188 0.4265 20 1.172 0.2566 140.406 152.782 20 17.1587 9.9711 10.0812 2.3844 0.4318 25 1.157 0.2686 114.219 125.766 25 21.4836 12.2572 10.3677 2.3657 0.4351 30 1.125 0.2748 95.969 107.829 30 25.6679 14.588 10.0256 2.3584 0.4359 35 1.219 0.2803 83.171 95.844 35 29.7934 16.8328 9.6332 2.3525 0.4367 40 1.36 0.3093 74.297 86.844 40 33.5441 18.8433 9.3392 2.3226 0.4427 45 1.453 0.3677 67.953 79.907 45 36.8716 20.6025 9.3392 2.2648 0.4547缺陷统计和分析缺陷修复状态满足验收指标(有2个bug000059和000063已修复但开发尚未来得及回复。

第五章光电信息处理技术成像目标探测与跟踪技术.pptx

第五章光电信息处理技术成像目标探测与跟踪技术.pptx


光光光光光光光光光 光光光光光光光光光
光光光光光
一、成像探测与跟踪系统概述
研究现状(国际)
1997年,美国国防高级研究项目署设立了以卡内基梅隆大学牵头,麻省理工 学院等高校参与的视觉监控重大项目VSAM,主要研究用于战场及普通民用 场景监控的自动视频理解技术。
1999年,美国康奈尔大学计算机系设计了一套航拍视频检测与持续跟踪系 统,该系统能够对多运动目标实现长时间的准确跟踪,即使发生短时间内 目标被遮挡或目标时静时动的情况 。
一、成像探测与跟踪系统概述
红外监控系统
一、成像探测与跟踪系统概述
什么是视频(成像)目标跟踪?
一、成像探测与跟踪系统概述
什么是视频(成像)目标跟踪?
一、成像探测与跟踪系统概述
成像跟踪系统流程及框图
监视器
摄像头 伺候机构
图像预处理
目标特性分析、

特征提取




自动跟踪

目标识别
目标检测

图像分割
主要内容
成像探测与跟踪系统概述 运动目标检测方法 成像目标跟踪方法 目标跟踪技术应用及发展
二、运动目标检测
1、静止背景下的目标检测
帧差分法:
g x, y ft1 x, y ft x, y
g x, y
ft1 x, y
ft x, y
=
-
静态场景帧差的一个例子
二、运动目标检测
视频序列运动检测
该系统在运动背景估计与补偿中所涉及的主要技术是基于KanadeLucas-Tomasi算法的特征点跟踪和基于M估计的鲁棒性仿射参数估计。然后 利用三帧差减的方法检测目标运动,利用形态学操作分割图像并定位运动目 标。对多目标进行标记之后,利用Hausdorff距离匹配和模板更新的方法对目 标进行长时间的跟踪。

一_二级概率安全评价技术研究及其在300MW核电厂二期工程设计中的应用

一_二级概率安全评价技术研究及其在300MW核电厂二期工程设计中的应用

第33卷 第2期 核 技 术 V ol. 33, No.2 2010年2月 NUCLEAR TECHNIQUES February 2010——————————————第一作者:严锦泉,男,1963年出生,1989年于上海交通大学获硕士学位,研究员级高级工程师,从事核安全分析工作 收稿日期:2009-11-18一、二级概率安全评价技术研究及其在300 MW核电厂二期工程设计中的应用严锦泉 张琴芳 仇永萍 周全福 邱忠明 陈 松(上海核工程研究设计院 上海 200233)摘要 通过引进及自行研制,建立了一、二、三级概率安全评价(PSA)分析程序;结合300 MW 核电厂二期工程(C-2)设计,对一、二级PSA 技术进行研究及应用——包括始发事件分析、事件树分析、故障树分析、相关性分析、人员可靠性分析、数据分析、事件序列定量化、电厂损伤状态分析、事故进程和安全壳响应分析、源项分析、大量放射性早期释放频率(LERF)的计算和分析、不确定性分析、重要度和敏感性分析以及设计过程中的应用等。

建造了C-2一、二级PSA 模型,通过在C-2设计过程中基于PSA 的发现进行了一些重要设计改进,如安注泵和喷淋泵的小流量回流管上隔离阀的设计改进;化容系统的往复式上充泵的设计改进;重要厂用水系统的设计改进等,得到C-2功率运行内部事件的堆芯损伤频率(CDF)为7.25×10–6/堆年,LERF 定量化结果为3.24×10–7/堆年。

关键词 概率安全评价,事件树,故障树,严重事故,设计改进 中图分类号 TL36490年代初,美国核管会(Nuclear Regulatory Commission, NRC)公开发表的NUREG-1150[1]《严重事故风险:5座美国核电厂的评价》以及配套报告,总结了PSA(Probabilistic Safety Assessment)技术的数十年研究成果,对后来的PSA 工作起了重要指导作用;也为美国核管会执行安全监管时如何应用这些分析技术提供了有益见解,可作为开展系统研究的重要参考。

一种人工智能的自动化软件测试系统及方法[发明专利]

一种人工智能的自动化软件测试系统及方法[发明专利]

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 201910627860.0(22)申请日 2019.07.12(71)申请人 北京精密机电控制设备研究所地址 100076 北京市丰台区南大红门路1号申请人 中国运载火箭技术研究院(72)发明人 黄葵 刘海山 丁怀龙 樊茜 焦震 杨帆 张震 栾婷 张成浩 (51)Int.Cl.G06F 11/36(2006.01)(54)发明名称一种人工智能的自动化软件测试系统及方法(57)摘要本发明公开了一种基于人工智能算法构建的自动化软件测试系统与方法,该系统可自主学习测试规范要求和往期的测试数据与结果,总结提炼测试规范要求模型;该系统可自主学习编程语言设计内容,生成编程语言模型;该系统可结合不同的软件平台、硬件平台,对编程语言模型进行自适应,生成目标系统模型,用以指导在不同的软硬件平台开展自动化软件测试。

采用本发明的测试系统,可以提供一种自主学习测试要求和编程规范、自主适应不同软硬件平台自动化生成测试用例、自动化开展软件测试、自动化提供软件测试报告的系统及方法。

权利要求书4页 说明书15页 附图4页CN 110347603 A 2019.10.18C N 110347603A1.一种人工智能的自动化软件测试系统,其特征在于,包括基于人工智能算法构建的测试要求规范模型、编程语言模型、目标系统模型、测试用例自动生成模型;软件自动测试与分析过程模型;所述测试要求规范模型的构建步骤如下:(1-1)收集往期的测试数据;(1-2)获取测试要求规范说明书;(1-3)基于测试数据构建人工智能数据分析模型;(1-4)基于测试要求规范说明书构建人工智能数据分析模型;(1-5)语义模型融合;(1-6)模型优化适配;(1-7)模型自更新;所述编程语言模型的构建步骤如下:(2-1)确定需要建模的编程语言范围;(2-2)收集每种编程语言的编程规范和相关的编程实例;(2-3)按照编程规范的条目进行逐条解析,获得编程规范的语义集;(2-4)语义集的完善与清洗;(2-5)编程语义扩展;(2-6)语义集关联代码语义句模型表征;(2-7)语义集关联代码语义句模型表征更新与完善;(2-8)语义集的自学习完善;所述目标系统模型的构建步骤如下:(3-1)基于目标系统使用说明书构建语义模型;(3-2)匹配编程语言模型;所述测试用例自动生成模型的构建步骤如下:(4-1)测试需求解析;(4-2)测试代码输入清洗与归类;(4-3)编程语言模型指导测试代码提炼获得待测试语义集和代码段;(4-4)目标系统模型通过事先学习所得,该模型可知道软件测试用例自动化生成模型按照特定软件和硬件平台的要求生产符合要求的测试用例;(4-5)测试用例自动生成;所述软件自动测试与分析过程模型如下:(5-1)对每一个测试用例的测试结果反馈进行记录,对于不通过的测试用例进行分析;(5-2)分析的结果结合编程语言模型中的关键词记录出问题的原因,同时根据关键词对应的表征意义给出不通过的原因说明,给出风险说明和报告;(5-3)基于编程语言模型,可对风险代码段给出相似代码测试通过的风险消除解决方案;(5-4)对于通过的测试用例可以进一步结合编程语言模型分析编程规范是否达标,给出编程规范分析报告。

16949质量手册

16949质量手册

质量手册Quality ManualHTQM01版本号: G/0编制:审核: XXX批准:01、目录01、目录 (2)02、企业概况 (6)03 、发布令 (7)04、质量方针目标 (8)05、任命书 (9)1、目的和范围 (10)1.1、目的 (10)1.2、质量管理体系的应用范围 (10)1.3、顾客特殊要求 (10)2、引用标准 (10)3、主要术语和定义 (11)4、组织环境 (14)4.1、理解组织及其环境 (14)4.2、理解相关方需求和期望 (14)4.3、确定质量管理体系范围 (14)4.4、质量管理体系及其过程 (15)5、领导作用 (17)6、策划 (17)7、支持 (18)7.1.1总则 (18)7.1.2人员 (18)7.1.4 过程运行环境 (18)7.1.5 监视和测量资源管理 (18)7.1.5.1测量和监控装置的控制 (18)7.1.5.2测量系统分析 (18)7.1.5.3内部实验室 (18)7.1.5.4外部实验室 (19)7.1.6 知识管理 ................. . (19)7.2人力资源管理. ................. (19)7.3 意识 ................. (19)7.4 沟通. ................. .. (19)7.5 形成文件的信息 (20)7.5.1 总则 (20)7.5.1.1公司质量管理体系文件结构 (20)7.5.2 文件记录管理 (20)8、运行 (20)8.1 顾客要求识别及评审 (20)8.1.1市场营销 (20)8.1.2报价立项 (21)8.1.3 合同订单评审 (21)8.3产品、过程设计开发 (21)8.3.1产品设计开发策划 (21)8.3.2产品设计和开发输入 (22)8.3.3过程设计输入 (22)8.3.4产品和过程特殊特性 (22)8.3.6 产品设计和开发的输出 (22)8.3.7 过程设计输出 (22)8.3.8 设计和开发的变更 (22)8.4 采购控制 (22)8.4.1采购过程 (23)8.5产品生产 (23)8.6 控制计划 (23)8.7生产设备管理 (23)8.8工装管理 (24)8.9产品防护 (24)8.10 产品交付 (24)8.11顾客反馈处理 (24)8.12 产品监视 (24)8.13 不合格品控制 (25)9、绩效评价 (25)9.1 监视、测量、分析和评价 (25)9.1.1总则 (25)9.1.2顾客满意度测量 (26)9.1.3分析和评价 (26)9.2内部审核 (26)9.2.1质量管理体系审核 (26)9.2.2产品及过程审核 (26)9.3管理评审 (26)10、持续改进 (26)10.2 持续改进 (27)11、附录附录1、手册修订状态表 (28)附录2、XX集团有限公司组织架构图 (29)附录3、IATF16949:2016条款与过程识别对应表 (30)附录4、XX投资集团有限公司主要程序文件 (32)02、企业概况XX投资集团成立于1993年,是以汽车零部件和装备制造为主,集投资、商贸等一体的多元化、现代化企业。

中南大学自动化(2012)专业本科培养方案

中南大学自动化(2012)专业本科培养方案

自动化专业本科培养方案一、专业简介自动化专业是1958年开办的专业,已获得硕士、博士授予权、博士后流动站、一级学科博士点、国家级特色专业建设点和“控制理论与控制工程”国家级二级重点学科,在国内外有较大影响。

培养和造就知识、能力、素质全面发展的具有较强实践能力和创新意识的高水平自动化应用研究型人才,全面提高教育质量,适应社会主义市场经济需求,近年来自动化专业的毕业生普遍受到社会的欢迎。

二、培养目标培养适应社会主义现代化建设需求,德、智、体、美全面发展,素质、能力、知识协调统一,具有“宽厚、复合、开放、创新”特征的自动化科学技术高级研究及应用型人才。

本专业培养的学生应具有较强的获取知识和综合运用知识的能力,发现、分析、解决问题的能力。

能在控制科学与工程、运动控制、过程控制、检测与自动化仪表、智能系统、电气自动化、信息处理、管理与决策等相关方面从事理论研究、系统设计和开发、教学及管理等工作,并为今后的进一步深造奠定基础。

三、培养要求1.具有扎实宽广的自然科学基础,扎实的控制理论基础知识,较好的管理科学、人文社会科学知识和良好的外语综合能力。

2.掌握本专业领域必需的宽广的工程技术基础,主要包括电路理论、电工电子技术、电气技术、控制理论、信息处理、计算机软硬件和网络技术等。

3.较好地掌握运动控制、工业过程控制及自动化仪表、电力电子技术及信息处理等方面的知识,具有本专业领域1~2个专业方向的专业知识和技能,了解本专业学科的前沿发展趋势。

4.获得较好的系统分析、系统设计及系统开发方面的工程实践训练。

5.在本专业领域内具有一定的科学研究、科技开发和组织管理能力,具有较强的工作适应能力和创新思维能力。

四、主干课程和特色课程主干课程:电路理论、模拟电子技术、数字电子技术、电机与电力拖动、自动控制理论、现代控制理论、计算机控制技术、微机原理与接口技术、电力电子技术、供配电技术、运动控制系统、检测技术与仪表、过程控制系统、嵌入式微控制器技术、最优控制、嵌入式系统、电气控制及PLC应用技术、系统仿真技术特色课程:电力电子技术、自动控制理论、运动控制系统、过程控制系统五、学制与学位标准学制:4年,学习年限3-6年授予学位:工学学士六、毕业合格标准学生应达到学校对本科毕业生提出的德、智、体、美等方面的要求,完成培养方案规定的各教学环节的学习,最低修满191学分(其中必修132.5学分),毕业设计(论文)答辩合格,方可准予毕业。

南京信息工程大学自动化实验教学示范中心

南京信息工程大学自动化实验教学示范中心

目录1国家制定的文件 (3)1.1高等学校实验室工作规程 (3)1.2 国家教育委员会关于加强高等学校实验室工作的意见 (9)2南京信息工程大学实验室管理规章制度 (15)2.1南京信息工程大学实验室工作条例 (15)2.2南京信息工程大学实验室使用基本规则 (18)2.3 南京信息工程大学实验室基本信息整理上报制度 (19)2.4 南京信息工程大学实验室档案管理制度 (21)2.5 南京信息工程大学实验教学管理办法 (22)2.6 南京信息工程大学实验教学规范 (25)2.7 南京信息工程大学学生实验守则 (26)2.8 南京信息工程大学开放性实验室管理的暂行规定 (27)2.9 南京信息工程大学仪器设备管理办法 (29)2.10 南京信息工程大学大型贵重教学仪器设备管理办法(试行) (32)2.11 南京信息工程大学仪器设备损坏丢失赔偿处理办法(试行) (34)2.12 南京信息工程大学校内自制仪器设备管理暂行办法 (36)2.13 南京信息工程大学实验室安全制度 (38)2.14 南京信息工程大学实验室主任职责 (39)2.15 南京信息工程大学实验室工作人员岗位职责 (40)2.16 南京信息工程大学大学生实验室科研创新项目管理办法 (42)3 自动化实验教学中心规章制度 (44)3.1 自动化实验中心规则 (44)3.2 实验报告评分标准 (45)3.3实验成绩评定标准 (47)1国家制定的文件1.1高等学校实验室工作规程中华人民共和国国家教育委员会令第20号各省、自治区、直辖市教委、高教(教育)厅(局)、国务院有关部委教育司(局),委直属高校:现发布《高等学校实验室工作规程》,自发布之日起施行。

主任李铁映1992年6月27日第一章 总 则第一条为了加强高等学校实验室的建设和管理,保障学校的教育质量和科学研究水平,提高办学效益,特制定本规程。

第二条高等学校实验室(包括各种操作、训练室),是隶属学校或依托学校管理,从事实验教学或科学研究、生产试验、技术开发的教学或科研实体。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中国科学院自动化所
技术说明-依存树到串系统
❖ 在源语言端运用依存结构进行统计翻译的新模型: Dependency-String Structure Model (DSS模型)
❖ 由于计算资源和时间的限制,参加本次评测的系统仍然沿 用和分层短语相同的文法
❖ DSS解码算法的输入是一棵树,而不是一个串,所以线图 是按照树节点来索引的,而不是按照串中的跨距(span)来 建立索引的
Institute of Automation, Chinese Academy of Sciences
中国科学院自动化所
技术说明-分层短语系统
中国科学院自动化所
❖ 主要借鉴了Wei[5]的基本思想,引入分层短语的 概念
❖ 有效地结合了短语模型和同步上下文无关文法 ❖ 分层短语模型将语序信息包含在模型之中,克服
❖ 后处理
▪ 大小写转换:未翻译词保留其原始格式 ▪ 格式转换:去除中文中的空格 ▪ 未登录词
Institute of Automation, Chinese Academy of Sciences
技术说明-系统融合[6][7]
MT1
……
MTm
中国科学院自动化所
N-best
N-best
MBR 解码器 对齐参考
了传统短语翻译的调序问题 ❖ 沿用了统计线性对数方法进行概率计算,使用了
如下6个特征:
▪ 双向短语翻译概率p(e/f)和p(f/e) ▪ 双向词汇化概率l(e/f)和l(f/e) ▪ 4gram语言模型 ▪ 句子长度惩罚
Institute of Aห้องสมุดไป่ตู้tomation, Chinese Academy of Sciences
中科院自动化所评测技术报 告(SYSTEM II)
魏玮 于东 王韦华 宗成庆 徐波
CASIA
内容概要
❖ 技术说明与参评系统
▪ 短语系统 ▪ 分层短语系统 ▪ 基于依存树到串系统 ▪ 前后处理 ▪ 系统融合 ▪ CASIA_SYSTEM II英中翻译系统
❖ 评测环境概要 ❖ 数据 ❖ 总结
中国科学院自动化所
评测环境概要
中国科学院自动化所
❖ 软硬件环境
运行平台 PC机
操作系统 Windows 2003
服务器
Linux (Ubuntu)
数量
CPU
2 Pentium 4, 3.0G
1
Xeon 2.0×2
RAM 2.0G 16.0G
❖ 运行时间(约4000句测试集)
系统 短语系统 分层短语 依存树到串
新闻领域 (小时)
▪ 新闻-CWMT08提供的Common,约85万句对和; NIST MT08评测提供语料,大约670万句对
▪ 科技- CWMT08提供的Special部分语料,约52万句 对; NIST MT08评测提供语料,大约670万句对
❖ 语言模型训练数据:
▪ LDC2007T38提供的Chinese Gigaword Third Edition,约3900万句
❖ 解码时使用了8个特征,最后两个为依存子树的惩罚
▪ 双向短语翻译概率p(e/f)和p(f/e) ▪ 双向词汇化概率l(e/f)和l(f/e) ▪ 4gram语言模型 ▪ 句子长度惩罚 ▪ 符合依存子树惩罚 ▪ 不符合依存子树惩罚
Institute of Automation, Chinese Academy of Sciences
Part-Of-Speech Tagger ❖ 英文依存树分析工具:Minimum-Spanning
Tree Parser (MSTparser)
Institute of Automation, Chinese Academy of Sciences
中国科学院自动化所
参评系统-CASIA_SYSTEM II
技术说明-前后处理
中国科学院自动化所
❖ 前处理
▪ 时间,数字处理模块 ▪ 地名,人名,机构名处理模块 ▪ 英文转化为小写 ▪ 预处理
• 乱码过滤(中文中的乱码、英文中的乱码以及包含中文词的句 子)
• 标点符号及数字变换(中文中的部分标点符号、英文中的双字 节符号及数字)
• 英文缩写处理 • 中文分词、英文Tokenization
Institute of Automation, Chinese Academy of Sciences
技术说明-短语系统
❖ 典型的短语系统[2] ❖ 非单调解码,任意跳转 ❖ 对数线性模型 ❖ 10个特征
▪ 双向短语翻译概率p(e/f)和p(f/e) ▪ 双向词汇化概率l(e/f)和l(f/e) ▪ 4gram语言模型 ▪ 扭曲概率 ▪ 句子长度惩罚 ▪ 短语惩罚 ▪ 方向概率[3] ▪ IBM扭曲模型[4]
4-gram LM
分层短语系
统,抽取带变
分 层
量短语与概率 计算
短 语 系
转换数据结 构,二进制存


多个1-best结 果以替代Nbest结果
调序 模型
转换数据结
构,二进制存 储
短 语

多个1-best结 统

生成1-best
融 构建混淆网络 合
模 块
MBR解码器
Institute of Automation, Chinese Academy of Sciences
20 18
科技领域 (小时) 16 18 16
Institute of Automation, Chinese Academy of Sciences
数据
中国科学院自动化所
❖ 开发数据:
▪ 新闻-2007 SSMT英中翻译测试集 ▪ 科技-CWMT08提供的Special语料中随机挑选200句
❖ 翻译模型训练数据:
原始语 料

存 采用和分层短 树 语相同的文法

串 转换数据结
系 构,二进制存


解码算法输入 是树,线图
按照树节点来 索引
多个1-best结 果以替代Nbest结果
数据过滤
CASIA预处 理模块
LMSRI工具 包
源语言依存句 法分析
双语语料 GIZA++
作为Initial Phrase
CASIA短语抽取 与概率计算
GIZA++词对齐
GIZA-TER 混淆网络
CN解码 Institute of Automation, Chinese Academy of Sciences
技术说明-外部技术
中国科学院自动化所
❖ 汉语分词工具:计算所开发的ICTCLAS3.0 ❖ 双语词对齐工具:GIZA++ ❖ 语言模型训练工具:SRILM工具包 ❖ 英文词性标注工具:Stanford Log-linear
相关文档
最新文档