网络舆情监测系统评价标准

合集下载

网络舆情评估指标

网络舆情评估指标

网络舆情评估指标网络舆情评估指标是对网络上生成的各种言论、情绪和信息进行综合分析和评估的一种方法。

随着互联网技术的发展和普及,网络舆情评估在政府、企业、媒体等各个领域中得到了越来越广泛的应用。

它可以帮助相关机构和个人了解网民对一些事件、产品或话题的态度和情感倾向,观察网络舆情的发展趋势,及时发现和处理可能引发负面影响的问题。

1.舆情热度:舆情热度指标是评估一个事件或话题在网络上引起的关注程度。

可以通过关注度、访问量、浏览量等指标来衡量。

舆情热度的高低可以反映对一些事件或话题的关注度,较高的舆情热度可能会引发更大的影响力。

2.舆情情感:舆情情感指标是评估网民对一些事件或话题的情感倾向,主要分为正面、负面和中性。

可以通过情感分析算法对网络言论进行情感倾向分类和打分。

舆情情感的分析有助于了解网民对事件的态度和情感倾向,可以为相关机构制定应对策略提供参考依据。

3.舆情议题:舆情议题指标是评估网络上关注的具体议题或关键词。

可以通过对网络文本的关键词提取和频率统计,了解网民对一些事件或话题的讨论焦点和热点。

舆情议题的分析可以帮助相关机构了解网民对一些事件或话题关注的重点和热度,及时捕捉问题,并及时回应。

4.舆情传播路径:舆情传播路径指标是评估网络舆情的传播路径和关联程度,可以通过社交网络分析和传播网络模型来研究。

对于物理世界中的舆情传播路径,可以通过分析模拟和数据挖掘方法来进行研究。

舆情传播路径的分析可以帮助相关机构了解舆情发生的原因和传播途径,制定针对性的应对策略,及时遏制负面舆情的蔓延,推动正面舆情传播。

5.舆情影响力:舆情影响力指标是评估一些事件或话题在网络舆情中的影响力大小。

可以通过网民参与度、转发量、评论量等指标来衡量。

舆情影响力的分析可以帮助相关机构和个人了解事件在网络舆情中的影响力大小,制定相应的应对策略和传播策略。

综上所述,网络舆情评估指标是对网络上生成的各种言论、情绪和信息进行综合分析和评估的一种方法。

网络舆情监控系统建设及运行机制精选全文

网络舆情监控系统建设及运行机制精选全文

可编辑修改精选全文完整版附件2:舆情监控系统建设及运行机制为进一步完善公司网络舆情监控工作,加强网络舆情监测和引导,形成了一套较完整的网络舆情监测系统和运行机制,结合公司实际情况,制定本细则。

第一条网络舆情监控系统建设网络舆情监测系统及时全面监测互联网信息(新闻、论坛、微博等),并在此基础上进行全面检索、主题检测、专题聚焦、相关信息推荐,主题演化分析、时间趋势分析、话题传播分析,为监控员提供辅助分析工具和信息服务,为公司领导层针对热点事件、突发事件做出适当决策提供帮助。

(一)网络舆情监控系统的组成1.舆情监控平台舆情监控平台是整个系统的业务支撑,负责系统所有信息的存储、交换和处理。

包括:(1)机房:包括精密空调及通风系统、UPS及蓄电池系统、供配电系统、接地及防雷系统、环境监控系统和机房内的综合布线等。

(2)通讯设备:包括VPN 网关、路由器、交换机等,负责整个平台的对内、对外通信。

(3)服务器、存储设备、备份设备:包括收集服务器、分析服务器、存储服务器、SAN磁盘阵列、SAN 交换机、磁盘柜、备份软件、备份磁带等。

(4)安全措施:提供防火墙、防病毒、入侵检测、漏洞扫描、身份认证等技术防护手段形成安全保障体系。

(5)系统软件、应用软件:包括windows操作系统、数据库管理系统软件、网络管理软件、应用中间件、通讯软件等。

2.网络舆情监控分析系统数据库包括:(1)舆情规划信息数据库:存储对舆情收集对象的需求信息,包括主要的网站、论坛、微博等相关网络媒体的信息。

(2)舆情收集信息数据库:存储从互联网上收集的大量舆情信息。

(3)舆情分析信息数据库:存储对收集的数据进行分类聚类、提取关键词、消重过滤、数据挖掘等处理后的相关信息。

(4)舆情预警信息数据库:存储相关舆情分析报告、调查报告、经验教训总结等相关信息。

3.网络舆情监控应用系统包括:(1)舆情规划子系统:确定需要实时跟踪监控的网站,对网站监控的内容;确定需要实时跟踪的关键舆情;根据实际需求,调整采集内容。

媒体舆情监测比选评分表

媒体舆情监测比选评分表
(2)质量承诺、服务承诺较差的得0-5分。
服务业绩
10分
(1)近3年承担完成过类似或其他科技项目的得10分(需提供有效证明如合同);
(2)没有得0-5分。
媒体舆情监测比选评分表
内容
编列内容
分值构成
(满分100分)
总分为:100分
评分因素
权重
评分标准
比选文件是否符合要求
35分
比选文件内容是否齐全有无按要求编写,缺少一项减5分(扣完为止);
工作方案与ቤተ መጻሕፍቲ ባይዱ容
30分
(1)依据国家法律、法规和标准、甲方所提出的合理要求,制定全面的工作方案。从方案针对性、体系健全完善、合理性及可行性酌情计分;
(2)工作内容编制完整齐全,科学合理,方案针对性强,满足本项目要求的得5~30分;
(3)工作内容编制不完整,方案针对性空泛,得0-5分。(扣完为止)。
人员配置
15分
(1)能提供专职对口服务人员,有专业技术的开发工程师得15分;
(2)没有得0-5分。
服务质量承诺
10分
(1)有质量承诺、服务承诺满足竞争性谈判文件且有具体的违约承诺,且能保证质量、服务的得10分;

舆情监测系统重要性能指标

舆情监测系统重要性能指标

舆情监测系统重要性能指标舆情信息采集指标:通过定向采集,自由设定采集目标到网站、频道、栏目、网页直至网页中的信息单元,从而保证所搜集的信息高度相关和准确;对高权重监测信息实施动态监测信息源变化并预警;监测主流七大搜索引擎,以及各大行业搜索引擎,并全面搜集动态网页,支持ASP、ASPX、JSP、PHP等各种动态网页;采用支持多种语言的信息搜集方案,包括简体中文、繁体中文、英文、日文、韩文的呢过以及其它多种语言。

同时采用多线程架构,可实现单机日均百万级搜集速度和分钟级的信息更新效率。

信息分析与热点研判:相关信息检索结果按不同维度展现,包括内容分类、舆情类别、相关人物、相关机构、相关地区等,想按照各分类维度统计舆情分布。

通过基于内容相似的智能聚类和相似性检索技术,结合转载、点击、评论、回复和报道率等数值,自动发现网络的热点词汇,包括热点人名、地名、机构名以及其它热点词汇,并通过关联技术组织一起,直观地展现网络热点。

舆情分析:传播路径分析:针对某个事件或新闻分析其传播路径,即信息的转载路径,进一步找出源爆发点和二次爆发点。

事件热敏指数分析:根据信息统计数据以及事件倾向性分析技术,智能识别出事件的热度和敏感度指数,帮助用户综合了解所关注的事件。

事件发展趋势分析:统计突发事件或者主题的信息时间分布,预测事件的发展趋势。

多维度关联信息分析:基于相似性算法的自动聚类技术,可以把一条新闻和相关的新闻、BBS、评论、博客评论等信息关联到一起,自动对每天采集的海量的、无类别的信息进行归类,把内容相近的网民评论等信息,全面地掌握各种相关信息。

舆情统计:通过对舆情分析结果生成各种量化的统计图表,给用户的决策提供强有力的数据支持。

主题统计:热点专题总分布、重点预警事件总分布、各类重点预警事件分布。

站点统计:可统计各采集站点的采集文章数、统计各论坛站点的采集文章数。

地名统计:系统自动抽取文章中的地方,并按照该地名出现的文章次数进行统计,可查看热点地名的传播趋势。

舆情监测标准

舆情监测标准

舆情监测标准
舆情监测是指对公众的言论、态度、情感等进行监测和分析,以了解公众对某个事件、话题或组织的看法和反应。

以下是一些常见的舆情监测标准:1. 监测范围:确定需要监测的信息来源,如社交媒体、新闻网站、论坛、博客等。

2. 监测时间:确定监测的时间范围,如每天、每周、每月等。

3. 监测指标:确定需要监测的指标,如关键词出现的频率、情感倾向、话题热度等。

4. 数据分析:对监测到的数据进行分析,如统计关键词出现的次数、分析情感倾向的分布等。

5. 报告生成:根据分析结果生成报告,报告内容包括监测的时间范围、监测的信息来源、监测的指标、数据分析结果等。

需要注意的是,舆情监测标准可能因不同的监测目的、监测对象和监测环境而有所不同。

在进行舆情监测时,需要根据实际情况制定合适的监测标准。

2018-网络舆情工作考核标准-word范文模板 (8页)

2018-网络舆情工作考核标准-word范文模板 (8页)

本文部分内容来自网络整理,本司不为其真实性负责,如有异议或侵权请及时联系,本司将立即删除!== 本文为word格式,下载后可方便编辑和修改! ==网络舆情工作考核标准篇一:网络舆情管理处置实施办法第一条为进一步加强全院网络舆情的处置与管理工作,建立健全网络舆情应对机制,有效引导网络舆论,妥善处置网上负面舆情,维护学院和谐稳定,为咸宁职业技术学院发展营造良好的舆论环境,根据《突发公共事件新闻报道应急办法》﹙中办发〔201X〕22号﹚和(鄂宣发〔201X〕6号)文件精神,制订本办法。

第二条本办法中的网络舆情,特指可能或已经对我院形象产生影响的网上负面报道和负面言论。

网络舆情的处置与管理,是指对涉及我院各项工作的新闻报道或评论所引发的反应、言论、评论等综合舆论情况进行监测、研判、预警、处置和引导。

第三条院属各单位要安排一名负责人分管网络舆情工作,配备一名政治素质高、责任心强、有一定写作能力的同志担任网络信息员。

(亦可由宣传员担任)网络信息员并入院党办宣传联络群。

第四条建立健全预警机制,各部门要通过报送、人工搜索,争取第一时间发现舆情。

第五条突发事件发生后,涉事单位必须在第一时间报告分管院领导,重大事件报告院主要领导。

同时,向党委办公室报送信息,需要上报上级的舆情由党委办公室统一负责。

第六条建立突发事件舆情研判制度,突发事件和网络热点事件发生后,由分管领导和党办召集相关部门开展舆情研判,对事件性质、舆情走势、可能出现的风险进行及时准确地评估,研究制定相应的处置方案,报党委讨论审定后实施。

第七条已在市级以上引起广泛关注的重大事件和网络热点事件,应与市委宣传部、市网管办及时沟通,联合研判,需要市网管办协调处理的网上信息,以书面报告,请求上级主管部门的支持。

第八条网络舆论引导工作要按照“及时准确、公开透明、有效管理、正确引导”原则进行,需要组织网上舆论引导的,由党办提供引导口径,信息员网评在党办和网络中心指导下进行。

网络舆情监测及预警指标体系研究综述

网络舆情监测及预警指标体系研究综述

网络舆情监测及预警指标体系研究综述在现代社会中,网络舆情监测和预警越来越重要。

随着互联网的普及,人们在网络上发表意见和观点的机会越来越多,这将影响到社会的稳定和发展。

因此,建立有效的网络舆情监测和预警指标体系具有重要意义。

本文将总结近年来网络舆情监测和预警指标体系研究的相关成果。

网络舆情监测指标体系是指对网络舆情的各种内容和特征进行定量或定性分析的指标的集合。

这些指标可以从不同的角度和层面来考察网络舆情,从而更好地理解和分析网络舆情的变化和趋势。

研究发现,网络舆情监测指标体系主要包括以下几个方面:情感分析指标、关键词监测指标、社会网络分析指标、信息传播指标等。

情感分析指标是对网络舆情中的情感倾向进行评估的指标。

情感分析可以通过对网络舆情中的文字、图片、语音等内容进行分析,判断其中的情感倾向。

研究表明,情感分析指标体系可以用于挖掘网络舆情中的正面和负面评论,以及评估舆情中的情感变化趋势。

关键词监测指标是对网络舆情中的关键词进行监测和分析的指标。

关键词监测可以通过对网络舆情中的关键词进行词频统计、相关性分析等,来了解网络舆情的重点内容和舆情事件的关联性。

研究发现,关键词监测指标体系可以用于识别网络舆情中的热点话题和舆情事件,并及时对其进行跟踪和分析。

社会网络分析指标是对网络舆情中的社会网络结构和关系进行分析的指标。

社会网络分析可以通过分析网络舆情中的用户关系、网络拓扑结构等,来了解网络舆情的传播路径和影响因素。

研究表明,社会网络分析指标体系可以用于识别网络舆情中的关键用户和影响力节点,并对舆情传播路径进行预测和调控。

信息传播指标是对网络舆情中的信息传播行为进行评估的指标。

信息传播指标可以通过对网络舆情中的信息发布、转发、评论等行为进行分析,来了解网络舆情的传播速度和影响范围。

研究发现,信息传播指标体系可以用于评估网络舆情的传播效果和影响力,并为相关部门提供参考和决策支持。

总之,网络舆情监测及预警指标体系的研究对于有效掌握舆情动态、准确预测舆情发展趋势具有重要意义。

舆情管控指标

舆情管控指标

舆情管控指标
舆情管控指标是用于评估和监测网络舆情的关键参数。

这些指标有助于企业或组织了解公众对其的看法,并采取适当的行动来维护其品牌形象和声誉。

以下是一些常见的舆情管控指标:
1. 传播扩散:这是衡量信息在网络上的传播速度和范围的指标。

例如,一篇文章或帖子在多长时间内被多少人分享或转发。

2. 发布主体:这涉及到发布信息的个人、组织或媒体的性质和影响力。

3. 内容要素:这关注于信息的内容,如其真实性、准确性和敏感性。

4. 舆情受众:这是关于受众的反馈和参与度的指标,例如网民关注度,它反映了网民对企业网络舆情的参与程度。

5. 民众关注:这是衡量某一特定舆情受关注的程度,即该舆情吸引了多少网民的关注和讨论。

6. 内容敏感及态度倾向:这涉及到信息的内容是否具有争议性或可能引起公众的不满,以及公众对该信息的整体态度倾向。

为了有效地进行舆情管控,企业或组织不仅可以使用各种舆情监测软件或系统,如百分点舆情监测、新舆盾、舆情管家等,还需要结合上述指标,制定相应的策略和措施,以规避舆情风险并维护其品牌形象。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

网络舆情监测系统评价标准随着互联网的快速增长,网络舆情监测软件及其服务市场也迅速地发展起来,保守地估计,在中国大陆地区这个市场的总量已经逼近10亿元人民币规模。

市场参与者主要包括四种类型的公司:第一类是拥有网络信息搜索或(中文)文字信息处理等相关技术的软件公司;第二类是公关、广告公司,这类公司是在传统媒体监测业务基础上发展出网络新媒体监测业务;第三类是网络营销服务公司,近几年这类公司增长迅猛,网络社会化媒体的飞速发展是其发展的催化剂;第四类是依托传统媒体延伸出的增值服务。

随着网络的发展,不少传统媒体也开始“触网”,并逐步发展出针对网络媒体的新业务,而网络舆情监测是其中的一个方面。

例如,人民网舆情监测室。

除了以上四类公司之外,还有一类进行网络舆情监测业务的参与者,他们是主管部门或行业机构所属的网络舆情监测机构,但严格意义上讲,此类机构和参与完全市场竞争的公司是不同的,因此,单独另归为一类。

社会化网络媒体的兴起,正在改变传统的信息传播机制。

网络传播具有匿名性、速度快、范围大、持续力强、传播渠道多元化、传播效果可测量等特点。

一条负面信息从出现到形成舆论热点的周期,从原来的24小时(传统新闻媒体比较典型的更新周期)缩短到现在的4小时(微博热点话题达到第一个传播峰值比较典型的时间周期)。

如果不能在这4小时内做出解释、反馈、制定应对策略,就可能出现舆论一边倒的局面,甚至可能发生极具品牌杀伤力的公共危机。

由此,也就有了网络舆情监测响应“黄金4小时”的说法。

做出及时、准确应对的前提是,要能够在第一时间了解网络舆情的内容、发生源、关键传播途径等相关信息数据。

由此,对于网络舆情监测软件的性能提出相应要求。

如何来评价网络舆情监测软件(系统)的性能呢?个人认为主要着眼于以下三个方面。

评价标准之一:对网络内容监测的准确性。

对于内容的判断是一个关键技术,目前的监测系统还不能做到对内容信息的完全自动判断和处理,在不能保证内容识别百分之百准确率的情况下,往往需要对监测分析的中间产物或不能识别的信息进行一定程度的人工校验和清洗。

中文信息在处理上具有一定特殊性和技术难点。

英文每个单词之间用空格或标点符号进行分隔,与英文不同,中文字之间没有空格,由字组成词存在多种可能情况,中文分词是识别的一个难点。

分词难点:一是分词的歧义识别,歧义是指同样的一句话,可能有两种或者更多的切分方法。

主要有“交叉歧义”、“组合歧义”、“真歧义”(相关定义参见附录)三类情形。

“真歧义”必须要联系上下文才能够确定在文中的具体涵义;二是新词识别,随着时代的发展,中文新词不断涌现,如果没有被收录而要进行自动识别是非常困难的。

与之相似的还有专业术语、名称(包括,人名、商标、简称、机构名、缩略语等)等的识别问题。

新词识别准确率已经成为评价一个分词系统好坏的重要标志之一。

在分词基础上,中文内容监测还需要对信息自动进行聚类、情感分析、提取摘要,特别是自动根据上下文内容判断情感倾向与危机度、区分正负面。

而这正是网络舆情监测的核心工作之一。

为了提高内容识别的准确性,大部分网络舆情监测系统采取了专业化发展的策略,通过面向特定领域的知识、经验和基础数据的积累与不断更新,逐步建立起舆情监测系统在特定领域内的服务特长和功能优势。

由此,也就有了舆情监测服务市场的细分化,有的专注于民生与社会动向、有的专注于消费品牌、有的专注于特定行业……也有一些监测系统提供全方位的监测服务,这些系统有较好的业务包容性,能够满足网络舆情监测的主要需求,或者能够根据客户需要做到定制化的服务,这类系统通常都会针对新客户有一个系统部署阶段,在部署过程中完成一些定制化的工作。

“专用型系统”与“通用型系统”各有特色,客户在选择时主要评估是否能够充分满足自身需求,同时拥有较好的性价比。

两类系统相比较,我个人更看好“专用型系统”未来的发展。

主要根据是,网络媒体和内容形式的发展非常迅速,一个好的舆情监测系统必须有一个持续而专业化的服务保障体系为支撑,而“专用型系统”在此方面会有比较明显的优势。

另外,“专用型系统”还可以根据特定行业或其他特定领域的特殊需求事先预置一些特色功能,如果设计得当,这些功能会对目标客户有很大帮助和价值,也会成为营销中的主要卖点之一。

准确性方面不同系统的表现差异很大。

从市场反馈的情况看,在商用领域,需要分行业进行监测服务的业务积累,在某个行业或细分领域有的系统监测得好、有的系统就不行;同样,在政府管理服务领域,也有数个细分领域,不同系统的表现也是参差不齐。

评价标准之二:网络内容监测时效性。

时效性的高低与软硬件技术和运营设备资源都有密切关系,其中涉及到的专业技术不是本文关注的范畴。

这里要指出的是,时效性与前面提到的准确性是紧密相关的。

如果系统对内容的判断准确性高,需要的人工干预就少(当然,理想状态是完全不需要人工干预),监测信息处理的时滞就少,监测的时效性自然就会有保障。

如果系统需要一定的人工干预,通常情况下,会平均滞后0.5~3天左右。

这个时间已经远远超出了前文提到的网络舆情监测及响应“黄金4小时”周期。

如果系统的时效性低,就不能对网络突发舆情进行及时监测和应急处理,而这对危机公关服务是非常关键的。

有一些监测系统的结果是依赖于baidu、google等搜索引擎的搜索结果进行再分析(所谓的元数据抓取),而这些大型搜索引擎的数据抓取更新是有自己的特定规律和周期。

对于排名靠后的网站,搜索引擎爬虫软件会隔几天,甚至更长时间,才会光顾一次。

这种情况下,时效性自然不会有保障。

当然,对于时效性,不同的客户会有不同的要求。

有的客户会要求做到“实时监测”,例如提供危机公关服务的公关公司、广告公司和一些关注于民生与社会动向的机构等;也有的客户对时效性要求不是这么高,例如对品牌价值进行评估的服务需求,对特定事件做事后评估的服务需求等等。

通常情况下,时效性高低是网络舆情检测系统定价的一个重要基础,从节约经费的角度出发,客户还是应当选择满足自身业务时效性需求前提下性价比较高的系统和服务,不一定非要求做到“实时监测”。

评价标准之三:网络内容监测全面性。

网络内容监测全面性的概念很好理解,就是系统所监测网站的类别及总量。

通常情况下,监测系统不会做全网监测,先不说技术上的困难,仅在运营费用和投入上就是中小规模公司难以承受的。

性能优越的监测系统会有选择地进行网络监测,客户关注领域的相关网站、排名靠前的大网站、热点网站是监测的主要对象。

绝大多数号称能够做到“全网监测”的系统都是依赖对搜索引擎的搜索结果进行再分析——元数据抓取。

前文已经指出,这种方式可以达到了大覆盖,但牺牲了时效性。

不过在全面性方面也有一些技术问题需要处理,一些主要的内容服务网站、社会化网络媒体和电商网站对于爬虫软件已经做了限制。

限制的原因有所不同,内容服务网站、社会化网络媒体(SNS 网站、微博等)主要是出于对信息及用户数据的保护和主管部门的特定要求,电商网站(自主平台类)主要为了防范网络商品比价。

综合地看,相对于“准确性”与“时效性”而言“全面性”问题更容易解决,技术因素是一方面,通过加大服务器和带宽等运营资源的投入也能够取得显著地改善。

网络舆情监测软件及其服务市场的发展趋势网络舆情监测软件及其服务市场具有很大的发展潜力,个人观点在今后5年内这个市场都会保持快速发展势头,年复合增长率在30%以上。

我很赞同计世资讯研究(CCW Research)的观点——“舆情监测分析软件市场未来的发展方向是行业化与服务化”。

行业化主要是指软件及服务要与各行业的特点紧密结合,服务化是指舆情监测软件将采用软件运营服务SaaS模式,舆情监测运营服务将成为一种新的发展模式,在降低投入门槛的同时将受到更多客户的青睐。

目前,市场格局还很分散,还没有上规模的运营服务商,这是一个市场空白。

近几年云计算技术的快速发展将创造新的发展机会,在通过云计算大幅度提升软件系统效能和服务品质的同时,也有利于催生在这个细分领域内上规模的运营服务提供商。

从服务对象角度看,专业网络舆情监测软件及服务公司主要服务于政府部门、专业服务公司(主要是,公共公司、广告公司、网络营销服务公司)和互联网公司。

然而,随着互联网对社会经济发展的快速渗透和融合,越来越多的企业和机构认识到了网络营销、网络舆情的重要性,他们中的一小部分已经开始尝试使用网络舆情监测软件及服务。

虽然他们在客户市场中目前所占的比重还不到10%,但是到2018年很有可能占到30%以上的比重。

从商业服务角度,网络舆情监测软件及服务与网络营销服务之间存在着密切的联系。

对于能够提供品牌监测的软件系统,如果能够把营销评估(营销决策支持)和营销管理工具结合起来,把系统服务延伸到营销管理与营销作业流程中,将具有更大的市场潜力。

在这方面市场参与者还较少,做得好的系统很少,未来应该有不错的发展空间。

(陈兴跃)附录:中文分词的歧义类型(此附录的相关内容来自互联网)歧义是指同样的一句话,可能有两种或者更多的切分方法。

例如:“表面的”,因为“表面”和“面的”都是词,那么这个短语就可以分成“表面▁的”和“表面的”。

这种称为交叉歧义。

像这种交叉歧义十分常见,前面举的“和服”的例子,其实就是因为交叉歧义引起的错误。

“化妆和服装”可以分成“化妆▁和服装”或者“化妆▁和服▁装”。

由于没有人的知识去理解,计算机很难知道到底哪个方案正确。

交叉歧义相对组合歧义来说是还算比较容易处理,组合歧义就必需根据整个句子来判断了。

例如,在句子“这个门把手坏了”中,“把手”是个词,但在句子“请把手拿开”中,“把手”就不是一个词;在句子“将军任命了一名中将”中,“中将”是个词,但在句子“产量三年中将增长两倍”中,“中将”就不再是词。

这些词计算机又如何去识别?如果交叉歧义和组合歧义计算机都能解决的话,在歧义中还有一个难题,是真歧义。

真歧义意思是给出一句话,由人去判断也不知道哪个应该是词,哪个应该不是词。

例如:“乒乓球拍卖完了”,可以切分成“乒乓▁球拍▁卖▁完▁了”、也可切分成“乒乓球拍卖▁完▁了”,如果没有上下文其他的句子,恐怕谁也不知道“拍卖”在这里算不算一个词。

1.林黛玉:三生石畔,灵河岸边,甘露延未绝,得汝日日倾泽。

离恨天外,芙蓉潇湘,稿焚情不断,报汝夜夜苦泪。

2.薛宝钗:原以为金玉良缘已成,只待良辰,奈何君只念木石前盟,纵然艳冠群芳牡丹姿,一心只怜芙蓉雪。

3.贾元春:贤孝才德,雍容大度,一朝宫墙春不再,一夕省亲泪婆娑。

昙花瞬息,红颜无罪,到底无常。

4.贾探春:虽为女流,大将之风,文采诗华,见之荡俗。

诗社杏花蕉下客,末世悲剧挽狂澜,抱负未展已远嫁。

5.史湘云:醉酒卧石,坦荡若英豪,私情若风絮,嫁与夫婿博长安,终是烟销和云散,海棠花眠乐中悲。

6.妙玉:剔透玲珑心,奈何落泥淖,青灯古佛苦修行,高洁厌俗袅亭亭。

相关文档
最新文档