自然语言理解技术

合集下载

第4章走进智能时代知识点人教中图版高中信息技术必修

第4章走进智能时代知识点人教中图版高中信息技术必修

第4章走进智能时代1.人工智能两大研究领域:模式识别和自然语言理解技术(1)模式识别应用:指纹打卡、人脸识别、语音输入汉字、手写板、触摸屏、OCR光学字符识别(2)自然语言理解应用:翻译软件,在线翻译、网络上与机器人对话2.其他人工智能应用::PDA(个人数字助理)、智能机器人、计算机博弈、智能代理、机器证明、无人驾驶飞机、专家系统等练习题1.(多选)下列应用中,体现了人工智能技术的有()A.通过天猫精灵语音控制房内电子设备B.智能翻译机实现实时语言翻译C.安装科技馆游馆 APP,系统提供选择中英文的游馆导图D.应用软件“作业帮”识别图片内容进行检索2.下列关于人工智能的说法,正确的是()A.人工智能技术就是虚拟现实技术B.计算机病毒具有传染性和破坏性,也是人工智能技术的体现C.烟雾探测器探测到浓烟时自动启动喷淋系统,体现了人工智能技术D.人工智能是一种模拟人类智能活动,尝试对事物进行识别、理解、学习和推理的技术4.人工智能在学习领域有广泛的应用。

下述关于人工智能的说法正确的是()A.能模拟教师教学的经验和方法,对同学们实施一对一的教学B.能跟踪、记录和分析学习者的学习过程和结果,并据此推送、传递知识C.能利用大数据技术分析学习者的情感、爱好,让学习者戒除各种恶习D.能利用大数据技术分析学习者的学习情况,为每一名学习者选择合适的学习资源,制订个性化的学习方案5.用微信或支付宝付款的时候,会生成一个条形码,收银员可以扫描此条形码收款,这种技术属于人工智能中()技术。

A.人脸识别 B.语音识别 C.条码识别 D.字符识别6.的功能:按住“麦克风”按钮后,对讲话,能将声音信息识别并转换为文本信息。

这主要采用的技术是()。

A.人工智能技术 B.视频技术 C.虚拟现实 D.数据压缩技术7.通过交通信息采集系统采集道路中的车辆流量、行车速度等信息,经智能系统分析后调整各路口红绿灯时长属于人工智能在()领域的应用。

自然语言理解与生成技术:Text-to-speech和Speech-to-text

自然语言理解与生成技术:Text-to-speech和Speech-to-text

自然语言理解与生成技术:Text-to-speech和Speech-to-text自然语言理解与生成技术:Text-to-speech和Speech-to-text 随着科技的快速发展,自然语言理解与生成技术得到了越来越多的关注。

其中,Text-to-speech (TTS)和Speech-to-text (STT)技术被广泛应用于日常生活中,它们的应用范围涉及到电子商务、智能家居、语音识别、自动化售货等多个领域。

本文将从两个方面介绍TTS 和STT技术,分别从原理、技术发展、应用场景、发展前景等角度展开讲解。

一、Text-to-speech1.原理Text-to-speech是将文本转换为语音的技术。

其基本原理是通过语音合成技术,将文字转换为声音。

传统的语音合成技术是通过将已有的语音样本组成音素库,然后根据待合成的文本,选取相应的音素并拼接成语音。

这种方法由于采用的是固定的音素库,因此,合成出的语音比较生硬,没有很好的感观效果。

为此,近年来,人们开发了多种新的文本转语音技术,如HMM、DNN、TTS和Tacotron等。

2.技术发展TTS技术的发展历程可追溯到二十世纪五十年代。

1950年,贝尔实验室开始研究语音合成技术,并于1957年推出了第一款语音合成器。

此后,一系列语音合成器相继问世,包括基于规则的语音合成技术、基于聚类的语音合成技术、基于统计的语音合成技术等。

到了21世纪,随着深度学习技术的发展,TTS技术得到了快速发展。

2017年,Google推出了Tacotron2模型,该模型能够将文本转换为自然语言的语音。

3.应用场景TTS技术的应用场景非常广泛。

其可以用于语音提醒、新闻播报、语音导航、交互式语音应答系统等。

目前,TTS技术在智能助手、语音合成考试、虚拟主播等领域已经得到了广泛应用。

例如,Siri和小度在语音合成方面的表现就是典型的TTS技术应用案例。

4.发展前景从历史上看,TTS技术对于人工智能行业的长期发展势必产生深远的影响。

自然语言处理中的语义理解技术

自然语言处理中的语义理解技术

自然语言处理中的语义理解技术随着人工智能的快速发展,自然语言处理(Natural Language Processing,简称NLP)成为了一个热门的研究领域。

其中,语义理解技术在NLP中扮演着至关重要的角色。

语义理解是指将自然语言转化为有意义的表示形式或者是执行相应任务的过程。

本文将介绍自然语言处理中的语义理解技术,并探讨其应用和挑战。

一、语义理解的基本概念和方法语义是指语言表达的意义和推理背后的逻辑关系。

在自然语言处理中,语义理解旨在对文本中的语义进行理解和表示,以便计算机能够理解和处理文本信息。

语义理解涉及语义角色标注、语义关系抽取、情感分析等多个相关任务。

1. 语义角色标注(Semantic Role Labeling,简称SRL)语义角色标注是一种将词语与句子内部语义结构进行对应的技术。

通过将句子中各个成分的语义角色进行划分和标注,可以更好地理解句子的意义。

例如在句子“小明吃了一个苹果”中,可以将“小明”标注为“施事角色”,“吃了”标注为“谓事角色”,“一个苹果”标注为“受事角色”。

语义角色标注技术的应用包括问答系统、信息抽取等领域。

2. 语义关系抽取(Semantic Relation Extraction)语义关系抽取是指从文本中提取出实体之间的语义关系的技术。

例如在句子“苹果是一种水果”中,可以提取出“苹果”与“水果”的“属于”关系。

语义关系抽取的应用广泛,包括知识图谱构建、信息检索等领域。

3. 情感分析(Sentiment Analysis)情感分析是指判断文本中的情感极性(积极、消极或中性)的技术。

情感分析可以应用于舆情分析、社交媒体挖掘等领域。

例如在评论“这家餐厅的食物很好吃!”中,情感分析可以判断评论为积极情感。

二、语义理解技术的应用语义理解技术在各个领域都有广泛的应用。

1. 机器翻译机器翻译是指计算机将一种语言的文本转化为另一种语言的过程。

语义理解技术在机器翻译中起着重要的作用,帮助计算机充分理解源语言的语义,从而更准确地翻译为目标语言。

自然语言理解的五大难题

自然语言理解的五大难题

自然语言理解的五大难题全文共四篇示例,供读者参考第一篇示例:自然语言理解是人工智能领域中的一个重要研究方向,其目标是帮助计算机系统理解和处理人类日常使用的自然语言,使计算机具有类似人类的语言智能能力。

自然语言理解面临着许多挑战和困难,下面将介绍自然语言理解的五大难题。

词义消歧是自然语言理解中的一个重要问题。

在自然语言中,一个词可能有多种不同的含义,而且同一个词在不同的上下文中可能具有不同的含义。

计算机系统需要能够识别并理解文本中词语的具体含义,以确保正确理解句子的意思。

语言歧义是自然语言理解中的另一个重要难题。

语言歧义指的是一个句子有多种不同的解释或理解方式,例如歧义词、歧义句等。

计算机系统需要具备智能的能力来区分并选择最合适的解释或理解方式,从而准确理解句子的意思。

语言规则的复杂性是自然语言理解的难题之一。

自然语言具有复杂的语法和句法规则,而且不同语言之间的规则也各不相同。

计算机系统需要能够理解并遵循这些复杂的语言规则,以正确理解和处理自然语言文本。

第四,语言的上下文依赖性是自然语言理解的重要问题。

在自然语言中,句子的意思往往依赖于其上下文环境,即前后文的内容和语境对句子的理解都会产生影响。

计算机系统需要能够识别和理解句子的上下文环境,以更准确地理解句子的意思。

语言的复杂性和多样性也是自然语言理解的挑战之一。

自然语言具有丰富多样的表达方式和结构形式,而且人类语言的演变和发展也会使语言变得更加复杂和多样化。

计算机系统需要具备强大的学习和适应能力,以应对不断变化的自然语言环境。

自然语言理解面临着诸多难题和挑战,包括词义消歧、语言歧义、语言规则的复杂性、语言的上下文依赖性以及语言的复杂性和多样性等。

要解决这些难题,需要不断地深入研究和创新,发展更加智能和高效的自然语言理解技术,以实现计算机系统对自然语言的准确理解和处理。

希望未来能够有更多的突破和进展,使人工智能系统能够更好地理解和应用自然语言,为人类生活和工作带来更多的便利和效益。

人工智能的自然语言理解和生成技术

人工智能的自然语言理解和生成技术

人工智能的自然语言理解和生成技术在当今社会中扮演着至关重要的角色,随着技术的不断发展和普及,人们对于智能系统在语言理解和生成方面的需求也越来越迫切。

随着大数据、机器学习等技术的不断成熟,自然语言处理已经取得了长足的进步,从而推动了人工智能和人机交互技术的快速发展。

自然语言理解是指计算机系统能够理解人类自然语言的能力,包括语法结构、语义和逻辑推理等。

而自然语言生成则是指计算机系统能够按照一定的规则和模型生成符合语法和语义要求的自然语言文本。

人工智能的自然语言理解和生成技术的发展,旨在构建更加智能和人性化的机器学习系统,为人们提供更加便捷和高效的人机交互方式。

在自然语言理解方面,人工智能系统需要能够识别并理解人类语言中的语法结构、语义信息和上下文关系。

传统的基于规则的自然语言处理方法在这方面存在着诸多限制,无法处理复杂的语言变化和语义歧义。

而基于统计和机器学习的自然语言处理方法,则能够通过大规模语料的学习,自动学习到语言的规律和潜在的语义信息,从而实现更加准确和高效的语言理解。

近年来,深度学习技术的兴起为自然语言理解带来了新的突破。

深度学习模型如循环神经网络(RNN)和长短时记忆网络(LSTM)等,在处理自然语言理解任务时表现出色,能够有效地捕捉语言中的长距离依赖关系和上下文信息。

同时,基于预训练的语言模型如BERT和GPT等也在自然语言理解任务中取得了显著的成绩,大大提升了机器对于语言的理解能力。

除了自然语言理解,自然语言生成技术也是人工智能领域的热门研究方向之一。

自然语言生成不仅要求机器能够生成符合语法规则的文本,还需要具备一定的语义逻辑推理能力,能够根据上下文信息和语境生成合理的文本输出。

传统的基于规则的自然语言生成方法,无法处理复杂的语义信息和上下文关系,难以生成质量较高的文本。

而基于深度学习的自然语言生成模型,如生成对抗网络(GAN)和变分自编码器(VAE)等,在文本生成任务中展现了出色的性能,能够生成质量高且具有一定逻辑连贯性的文本。

什么是自然语言理解技术

什么是自然语言理解技术

什么是自然语言理解技术自然语言理解技术(Natural Language Understanding,简称NLU),顾名思义是指计算机针对自然语言文本进行的理解,是人工智能领域中的一项重要技术。

它是人工智能的核心应用领域之一,是AI技术发展的重要方向。

自然语言理解技术与语音识别技术、自然语言生成技术等技术共同构成了人工智能的自然语言处理分支。

自然语言理解技术主要用于解决人机交流、信息处理、知识获取、文本分类、机器翻译、智能问答等问题。

通过自然语言理解技术,计算机能够解析人类语言的含义,实现语义分析、情感分析、实体识别、关系提取、语境理解、逻辑推理等功能。

它可以将自然语言的文本信息转化为机器可处理和理解的语言知识,为人工智能应用提供了基础和支撑。

自然语言理解技术的应用非常广泛。

在智能客服、智能家居、智能教育、智能医疗、智能金融等各个领域都有重要的应用。

比如,智能客服可以通过自然语言理解技术为客户提供快速、准确、个性化的服务;智能家居可以通过自然语言理解技术实现语音控制家电的功能;智能医疗可以通过自然语言理解技术提供精准的病情分析和医疗建议等。

自然语言理解技术目前包括以下几个主要方面:1. 语义分析语义分析是自然语言理解技术中的一个关键环节,它是将原始文本分析为语义结构的过程。

通过语义分析,可以将原始文本转化为计算机可处理的形式,为后续处理提供基础支撑。

语义分析主要包括词法分析、句法分析和语义分析三个阶段。

其中,词法分析是将自然语言文本分解为词汇单元的过程;句法分析是将自然语言文本分解为语法结构的过程;语义分析则是将自然语言文本转化为计算机可识别的语义结构的过程。

2. 情感分析情感分析是指通过自然语言理解技术对文本中的情感信息进行分析和提取的过程。

情感分析可以将自然语言文本分为积极、消极和中性三种情感类型,并对情感信息进行量化和分析。

如情感极性分析、情感趋势分析、情感原因分析等。

3. 实体识别实体识别是指自然语言理解技术对文本中的实体名称进行识别和提取。

nlp语义理解方法

nlp语义理解方法

nlp语义理解方法NLP(自然语言处理)的语义理解方法和技术有很多,以下列举几种常用的方法:1. 基于规则的方法(Rule-based Approach):通过事先定义的一系列规则,对输入的文本进行分析和解析,从中提取出意义,并通过与语言模型或知识图谱等进行匹配,来理解文本的语义。

这种方法需要大量的人工定义和维护规则,适用于一些特定领域和应用场景。

2. 基于统计的方法(Statistical Approach):使用统计模型和机器学习算法,通过对大规模语料库的训练和学习,从中抽取出词语、短语、句子、语义关系等的统计规律,来识别和理解文本的语义。

这种方法需要大量的标注数据和强大的计算资源,常用的统计模型有隐马尔可夫模型(Hidden Markov Model,HMM)和条件随机场(Conditional Random Field,CRF)等。

3. 基于深度学习的方法(Deep Learning Approach):利用深度神经网络模型,如循环神经网络(Recurrent Neural Network,RNN)、卷积神经网络(Convolutional Neural Network,CNN)和注意力机制(Attention Mechanism)等,通过对大规模语料库的端到端训练和学习,来自动抽取并表示文本的语义信息。

这种方法在语义理解任务上取得了较好的效果,如文本分类、命名实体识别和语义角色标注等。

4. 基于知识图谱的方法(Knowledge Graph Approach):利用知识图谱中的实体、关系和属性等信息,结合大规模文本语料库的挖掘和分析,来推理和理解文本的语义。

知识图谱提供了丰富的背景知识和语义关系,可以用来解决歧义消解、上下文理解和推理等问题。

以上是一些常见的NLP语义理解方法,不同的方法各有优缺点,选择合适的方法取决于具体的任务和场景。

近年来,随着深度学习的发展和技术的进步,基于深度学习的方法在NLP语义理解任务上取得了很大的突破和进展。

自然语言处理中的语义理解技术

自然语言处理中的语义理解技术

自然语言处理中的语义理解技术自然语言处理(Natural Language Processing,NLP)是计算机科学与人工智能领域的一个重要研究方向,旨在让机器能够理解和处理人类语言。

而语义理解技术则是NLP中的关键环节,它涉及到对语言中的意义进行分析和解释。

本文将探讨自然语言处理中的语义理解技术及其应用。

语义理解是指从文本中抽取出其中的语义信息,使计算机能够理解人类的意图和含义。

在NLP中,语义理解技术的目标是将自然语言转化为机器可以理解和处理的形式,以便进行后续的自动化处理。

在实际应用中,语义理解技术可以帮助机器实现文本分类、信息提取、问答系统等多种功能。

在语义理解技术中,词义消歧是一个重要的问题。

词义消歧是指在文本中确定一个词语的具体含义。

由于一个词语可能有多个不同的含义,机器需要根据上下文来确定其具体含义。

例如,在句子“我想吃个苹果”中,词语“苹果”可以指水果,也可以指苹果公司。

通过语义理解技术,机器可以根据上下文确定“苹果”的具体含义。

另一个重要的语义理解技术是语义角色标注。

语义角色标注是指对句子中的每个词语进行语义角色的标注,以表示其在句子中的语义角色。

例如,在句子“小明买了一本书送给了小红”中,语义角色标注可以标注出“小明”为施事者,“买了”为动作,“一本书”为物品,“送给了”为目标,“小红”为受事者。

通过语义角色标注,机器可以更好地理解句子中的语义信息。

除了词义消歧和语义角色标注,还有其他一些语义理解技术在NLP中发挥着重要作用。

其中之一是命名实体识别。

命名实体识别是指在文本中识别出具有特定意义的实体,如人名、地名、组织机构名等。

通过命名实体识别,机器可以将文本中的实体进行提取和分类,为后续的信息提取和知识图谱构建提供基础。

此外,语义理解技术还包括情感分析、语义关系抽取等。

情感分析是指通过对文本中的情感信息进行分析,判断文本的情感倾向,如正面、负面或中性。

而语义关系抽取则是指在文本中抽取出实体之间的关系,如“小明是小红的哥哥”。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

自然语言理解技术,未来人工智能的核动力摘要:自然语言理解是人工智能研究重要的领域之一,同时也是目前前沿的难题之一。

它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,是未来人工智能的核动力。

因此理解自然语言理解以及自然语言理解技术的含义,阐述自然语言理解的研究及其相关应用,综述自然语言理解技术研究方向变化并对自然语言理解的发展前景进行分析和展望,是十分有意义的。

关键词:自然语言理解技术;智能信息服务;1.引言:随着计算机科学的不断发展和成熟,计算机应用开始迈人知识处理、语言理解阶段,人们对计算机的智能提出了新的要求随着社会的日益信息化,人们越来越强烈地希望能更好地同计算机交流。

自然语言就是这样一个媒介。

2. 1自然语言理解的含义:广义的“语言”是任何一种有结构的符号系统。

其中, 最重要的两类语言,自然语言和形式语言。

而狭义的“语言”是人类在社会牛活中发展出来的用来互相交际的声音符号系统,是“自然语言”。

“自然语言理解”即Natural Language Understanding 俗称人机对话,指的就是使计算机来按照这种语言所表达的意义做出相应反应的机制。

它主要研究用电子计算机模拟人的语言交际过程,使计算机能理解和运用人类社会的自然语言如汉语、英语等,实现人机之间的自然语言通信,以代替人的部分脑力劳动,包括查询资料、解答问题、摘录文献、汇编资料以及一切有关自然语言信息的加工处理。

这在当前新技术革命的浪潮中占有十分重要的地位。

自然语言理解是计算机科学中的一个引人入胜的、富有挑战性的课题。

从计算机科学特别是从人工智能的观点看,自然语言理解的任务是建立一种计算机模型,这种计算机模型能够给出象人那样理解、分析并回答自然语言(即人们日常使用的各种通俗语言)的结果。

2. 1自然语言理解技术的含义:首先, 自然语言是极其复杂的符号系统。

一个人尽管可以对自己的母语运用自如, 但却无法把自己母语的构成规律、意义的表达规律和语言使用的规律用计算机可以接受的方式彻底说清楚。

传统的语言学是在没有计算机参照的条件下发展起来的, 虽然为自然语言理解积累了宝贵的财富, 但那是讲给人的, 真正要让语言学知识变成计算机上可操作的, 绝不是那么简单, 也不能那么模糊。

这个目标的实现,需要大量又懂语言学又懂计算机的人在正确的技术路线的指导下一起做非常大规模的基本建设, 绝不是一拍脑袋想出个“绝招”就能解决的。

其次, 自然语言的各个层次上都含有巨大的不确定性。

在语音和文字层次上,有一字多音、一音多字的问题; 在词法和句法层次上, 有词类词性、词边界、句法结构的不确定性问题; 在语义和语用层次上, 也有大量的因种种原因造成的内涵、外延、指代、言外之义的不确定性。

语言学上把这些不确定性叫做“歧义”。

歧义一般不能通过发生歧义的语言单位自身获得解决, 而必须借助于更大的语言单位乃至非语言的环境背景因素和常识来解决。

人类有很强的依靠整体消除局部不确定性的能力和常识推理能力, 体现在语言上就是利用语境信息和常识消除歧义的能力。

使计算机获得同样强大的能力, 是从事自然语言理解的学者梦寐以求的目标。

另外, 自然语言不是一成不变的死的语言, 它在社会生活中发展, 在操不同语言和同一语言的不同变体的人们之间的相互影响中变化。

一个词、一个说法可能在一夜之间突然流行起来; 特殊的人群结构变化会导致新的语言或新的语言变体 (如方言) 的出现。

这些都要求理解自然语言的计算机程序要具有对外界语言环境的应变能力。

最后一点, 自然语言是人们交流思想的工具。

既然交流的是思想, 那思想本身在计算机里的组织结构就显得格外重要。

在人工智能里, 这就是“知识表示”的问题。

可以说, 在知识表示问题上的突破, 对于自然语言理解的进展将产生决定性的影响。

在上述四个方面, 都有许多学者在勇敢地迎接挑战, 使计算机程序一步步地朝着不限领域的自然语言理解的远大目标前进。

3.1自然语言处理的层次1.语音分析根据音位规则,从语音流中区分出一个个独立的音素,再根据音位形态规则找出一个个音节及其对应的词素或词。

2.词法分析分析目的是找出词汇的各个词素,从中获得语言学的信息。

3.句法分析对句子和短语的结构进行分析,目的是找出词、短语等的相互关系以及各自在句中的作用。

4.语义分析分析目的是找出词义、结构意义及其结合意义,从而确定语言所表达的真正含义或概念。

5.语用分析研究语言所存在的外界环境对语言使用者所产生的影响。

3.2自然语言理解的主要思想:1.认知学观点将人类视为一种高级信息处理系统,强调对于人类智能活动的研究以及在计算机上的模拟和实现。

2.语用学观点将语言视为人与人之间的通信媒介,任何对于话语的理解或生成都不能脱离该话语存在的前后语境和该话语使用者的心理背景。

3.语言学观点对自然语言进行研究的最初也是最基本的方法,强调对于句子结构和语法的研究,重点在于描述语言,寻找或构造一组能包含尽可能多的语言现象的普遍适用的语法规则。

4.1自然语言理解技术研究方向变化:大约90年代开始,自然语言处理领域发生了巨大的变化。

这种变化的两个明显的特征是:(1)对系统输入,要求研制的自然语言处理系统能处理大规模的真实文本,而不是如以前的研究性系统那样,只能处理很少的词条和典型句子。

只有这样,研制的系统才有真正的实用价值。

(2)对系统的输出,鉴于真实地理解自然语言是十分困难的,对系统并不要求能对自然语言文本进行深层的理解,但要能从中抽取有用的信息。

例如,对自然语言文本进行自动地提取索引词,过滤,检索,自动提取重要信息,进行自动摘要等等。

同时,由于强调了“大规模”,强调了“真实文本”,下面两方面的基础性工作也得到了重视和加强。

(1)大规模真实语料库的研制。

大规模的经过不同深度加工的真实文本的语料库,是研究自然语言统计性质的基础。

没有它们,统计方法只能是无源之水。

(2)大规模、信息丰富的词典的编制工作。

规模为几万,十几万,甚至几十万词,含有丰富的信息(如包含词的搭配信息)的计算机可用词典对自然语言处理的重要性是很明显的。

虽然上述新趋势给自然语言处理领域带来了成果,但从理论方法的角度看,由于采集、整理、表示和有效应用大量知识的困难,这些系统更依赖于统计学的方法和其他“简单”的方法或技巧。

而这些统计学的方法和其他“简单”的方法似乎也快达到它们的极限了,因此,目前在自然语言处理界广泛争论的一个问题便是:要取得新的更大的进展,主要有待于理论上的突破呢,还是可由目前已有的方法的完善和优化实现?答案还不清楚。

大致上,更多的语言学家倾向于前一种意见,而更多的工程师则倾向于后一种意见。

回答或许在“中间”,即应将基于知识和推理的深层方法与基于统计等“浅层”方法结合起来。

4.2发展历程:现在的计算机的智能还远远没有达到能够象人一样理解自然语言的水平,而且在可预见的将来也达不到这样的水平。

因此,关于计算机对自然语言的理解一般是从实用的角度进行评判的。

如果计算机实现了人机会话,或机器翻译,或自动文摘等语言信息处理功能,则认为计算机具备了自然语言理解的能力。

目前存在的问题有两个方面:一方面,迄今为止的语法都限于分析一个孤立的句子,上下文关系和谈话环境对本句的约束和影响还缺乏系统的研究,因此分析歧义、词语省略、代词所指、同一句话在不同场合或由不同的人说出来所具有的不同含义等问题,尚无明确规律可循,需要加强语用学的研究才能逐步解决。

另一方面,人理解一个句子不是单凭语法,还运用了大量的有关知识,包括生活知识和专门知识,这些知识无法全部贮存在计算机里。

因此一个书面理解系统只能建立在有限的词汇、句型和特定的主题范围内;计算机的贮存量和运转速度大大提高之后,才有可能适当扩大范围.4.2.1我国的发展状况:我国自然语言理解的研究起步较晚,比国外晚了17年。

国外在1963年就建成了早期的自然语言理解系统,而我国直到1980年才建成了两个汉语自然语言理解模型,都以人机对话的方式来实现。

八十年代中期,在国际新一代计算机激烈竞争的影响下,自然语言理解的研究在国内得到了更多的重视,"自然语言理解和人机接口"列入了新一代计算机的研制规划,研究单位增多了,研究队伍也壮大了。

自然语言处理研究在电子计算机问世之初就开始了,并于 50年代初开展了机器翻译试验。

当时的研究方法还不能称作带有"智能"。

到了60年代乔姆斯基的转换生成语法得到广泛的认可,生成语法的核心是短语结构规则,分析句子结构的过程就是利用规则自顶向下或自底向上的句法树生成过程。

60年代至70年代初期,研究工作一直停留在单词的语音识别上,进展不大。

直到70年代中期才有所突破,建立了一些实验系统,能够理解连续语音的内容,但是还限于少数简单的语句大约90年代开始,自然语言处理领域发生了巨大的变化。

这种变化的两个明显的特征是:(1)对系统输入,要求研制的自然语言处理系统能处理大规模的真实文本,而不是如以前的研究性系统那样,只能处理很少的词条和典型句子。

只有这样,研制的系统才有真正的实用价值。

(2)对系统的输出,鉴于真实地理解自然语言是十分困难的,对系统并不要求能对自然语言文本进行深层的理解,但要能从中抽取有用的信息。

例如,对自然语言文本进行自动地提取索引词,过滤,检索,自动提取重要信息,进行自动摘要等等。

同时,由于强调了“大规模”,强调了“真实文本”,下面两方面的基础性工作也得到了重视和加强。

(1)大规模真实语料库的研制。

大规模的经过不同深度加工的真实文本的语料库,是研究自然语言统计性质的基础。

没有它们,统计方法只能是无源之水。

(2)大规模、信息丰富的词典的编制工作。

规模为几万,十几万,甚至几十万词,含有丰富的信息(如包含词的搭配信息)的计算机可用词典对自然语言处理的重要性是很明显的。

5结论:自然语言处理意义在于:一方面,如果计算机能够理解、处理自然语言,将是计算机技术的一项重大突破;另一方面,自然语言处理有助于揭开人类高度智能的奥秘,深化对语言能力和思维本质的认识。

和人类进步过程中其他任何一种技术的发展历程一样,自然语言理解技术在任何一个不同的成熟阶段都有一个不同的应用形式和不同的市场定位。

在这种技术到市场再到技术的螺旋式上升的过程中,技术越来越成熟,市场也越来越成熟,从而让技术更好地为人类服务。

自然语言理解技术给人工智能服务提供了威力巨大的核动力,智能信息服务给人类更自然、自主的信息交流手段,将创造出全新的产业空间。

人们渴望发展自然语言理解技术以加速信息、知识与文化的交流,促进社会、经济、科学的进步,这是自然语言理解技术新的强大的推动力量,也是每一个国家都面临的新的挑战。

[参考文献] :[1]黄培红.基于自然语言理解的认知系统算法初探一人机对话系统算法基础与构造[C].2004计算机应用技术交流会议论文集.2004:236—240.[2] 黄培红.自然语言理解的机器认知形式系统[J].湖南:计算机工程与科学,2007,29(6):l13一l16.[3] 姚天顺,自然语言理解-一种让机器懂得人类语言的研究,清华大学、广西科技出版社,2002(第二版)。

相关文档
最新文档