中文分词技术在智能评分系统中的应用研究
中文bpe分词

中文bpe分词摘要:一、引言二、中文BPE 分词的概念与原理三、中文BPE 分词的应用场景四、中文BPE 分词的优缺点分析五、总结与展望正文:一、引言随着互联网的普及和大数据时代的到来,自然语言处理技术在人工智能领域中占据着越来越重要的地位。
中文分词作为自然语言处理的基本任务之一,具有很高的研究价值。
本文将介绍一种高效的中文分词方法——BPE 分词,并结合实际应用场景对其进行深入探讨。
二、中文BPE 分词的概念与原理BPE(Byte-Pair Encoding)是一种基于字节的编码方法,通过将文本中出现频率较高的字节组合成一个新的字符,从而实现对文本的压缩。
BPE 分词则是基于BPE 编码的一种分词方法。
首先对原始文本进行BPE 编码,然后根据编码结果进行分词。
BPE 分词具有较高的准确性,适用于多种语言的分词任务。
三、中文BPE 分词的应用场景1.搜索引擎:在搜索引擎中,BPE 分词可以帮助提取关键词,提高搜索结果的相关性。
2.文本挖掘:在文本挖掘任务中,BPE 分词可以有效地提取文本中的实体、关键词等信息,为后续分析提供便利。
3.机器翻译:在机器翻译中,BPE 分词可以帮助实现词性的标注,提高翻译质量。
四、中文BPE 分词的优缺点分析优点:1.分词准确度高,能够较好地处理未登录词等问题。
2.适用于多种语言,具有较强的普适性。
3.BPE 编码有助于文本压缩,节省存储空间。
缺点:1.BPE 编码过程复杂,计算量较大。
2.对于一些词汇量较小的领域,BPE 分词的效果可能不尽如人意。
五、总结与展望中文BPE 分词作为一种高效、准确的分词方法,在自然语言处理领域具有广泛的应用前景。
然而,针对不同应用场景,BPE 分词仍需结合其他技术进行优化和改进。
基于人工智能技术的智能文本分析系统研究与实现

基于人工智能技术的智能文本分析系统研究与实现第一章:引言随着互联网技术的飞速发展,网络上产生的文本数据呈现出爆炸式的增长。
同时,随着人工智能技术的不断成熟,如何利用人工智能技术处理这些文本数据,成为了当前研究的热点问题之一。
在这种背景下,本文基于人工智能技术,设计并实现了一个智能文本分析系统,旨在为用户提供更便捷且精准的文本处理方案。
第二章:研究现状当前,人工智能技术在文本处理中的应用已经十分广泛,主要集中在文本分类、情感分析、实体识别、关键词提取等方面。
其中,基于机器学习和深度学习算法的文本分类方法已经实现了很好的效果,比如朴素贝叶斯、支持向量机、神经网络等方法。
同时,情感分析也是一个重要的研究方向,它可以自动识别文本所表达的情感极性。
此外,随着自然语言处理技术的不断进步,实体识别、关键词提取等文本处理方面的技术也得到了大量发展。
第三章:系统设计本文设计一个基于人工智能技术的智能文本分析系统,系统主要由以下几个模块组成:1. 数据预处理模块:该模块主要是对原始文本数据进行处理,包括分词、去除停用词、词性标注等操作,以便于后续的文本处理。
2. 文本分类模块:该模块基于机器学习算法,将文本数据分成不同的类别,可以通过朴素贝叶斯、支持向量机、神经网络等方法来实现分类。
3. 情感分析模块:该模块主要是自动识别文本所表达的情感极性,包括正向情感、负向情感和中性情感等,可以通过情感词典等方法来实现。
4. 实体识别模块:该模块主要是识别文本中的实体,如人名、地名、组织机构等实体,可以通过基于规则的方法和基于机器学习的方法来实现。
5. 关键词提取模块:该模块主要是提取文本中的关键词,包括单词、短语、实体等关键词,可以通过基于关键词提取算法和基于权重算法等方法来实现。
第四章:系统实现系统采用Python编程语言实现,主要使用了sklearn、NLTK、Numpy等第三方库,具体实现过程如下:1. 数据预处理:利用jieba库完成文本分词,并去除停用词,同时利用NLTK库进行词性标注。
基于统计语言模型的中文分词算法研究

基于统计语言模型的中文分词算法研究中文是世界上使用人数最多的语言之一,它的排列方式和英语等西方语言有很大的不同,因此分词是中文自然语言处理的重要一环。
中文分词的主要目标是将一段连续的中文文本切分成单个的词语。
目前,基于统计语言模型的中文分词算法是最为流行和使用广泛的算法。
本文将会探讨中文分词的基础知识,以及基于统计语言模型的中文分词算法的核心思想和实现方法。
一、中文分词的基础知识中文文本是由汉字组成的,中文词语并不像英语词汇那样有明显的边界。
因此,中文分词器需要解决的第一个问题就是识别出哪些汉字是组成词语的基本单元。
然后,再根据组合方式将词语划分出来。
中文分词可以分为基于规则的分词和基于统计的分词两种算法。
基于规则的分词算法是手动编写规则,根据这些规则来解决分词问题。
但是这种方法实现起来非常困难,因为包含规则的样本集必须足够大而且需要频繁更新。
而且,规则往往是比较复杂的,需要人工不断调整和改进。
基于统计的分词算法是通过分析一定量的语言样本集,建立起一个统计模型来解决分词问题。
这种方法不需要手动编写规则,而是通过分析大量的语言样本,了解自然语言的规律,然后再根据语言的规律来处理分词问题。
因此,基于统计的分词方法相对于基于规则的方法更加高效和精确。
二、基于统计语言模型的中文分词算法基于统计语言模型的中文分词算法并不是直接对每个汉字进行分词,而是在每个可能的词边界处赋予一个概率权重,然后取最大概率的词语作为对应的分词结果。
基于统计语言模型的分词算法包含三个主要组成部分:分词模型、特征提取和概率计算。
1. 分词模型分词模型是中文分词的核心模型,它可以对中文句子进行分词。
分词模型可以分为两种类型:基于统计的分词模型和基于规则的分词模型。
基于统计的分词模型通常基于最大概率模型或条件概率模型,常用的模型包括Hidden Markov Model (隐马尔可夫模型)和Conditional Random Fields(条件随机场)模型。
中文分词与词性标注技术研究与应用

中文分词与词性标注技术研究与应用中文分词和词性标注是自然语言处理中常用的技术方法,它们对于理解和处理中文文本具有重要的作用。
本文将对中文分词和词性标注的技术原理、研究进展以及在实际应用中的应用场景进行综述。
一、中文分词技术研究与应用中文分词是将连续的中文文本切割成具有一定语义的词语序列的过程。
中文具有词汇没有明确的边界,因此分词是中文自然语言处理的基础工作。
中文分词技术主要有基于规则的方法、基于词典的方法和基于机器学习的方法。
1.基于规则的方法基于规则的中文分词方法是根据语法规则和语言学知识设计规则,进行分词操作。
例如,按照《现代汉语词典》等标准词典进行分词,但这种方法无法处理新词、歧义和未登录词的问题,因此应用受到一定的限制。
2.基于词典的方法基于词典的中文分词方法是利用已有的大规模词典进行切分,通过查找词典中的词语来确定分词的边界。
这种方法可以处理新词的问题,但对未登录词的处理能力有所限制。
3.基于机器学习的方法基于机器学习的中文分词方法是利用机器学习算法来自动学习分词模型,将分词任务转化为一个分类问题。
常用的机器学习算法有最大熵模型、条件随机场和神经网络等。
这种方法具有较好的泛化能力,能够处理未登录词和歧义问题。
中文分词技术在很多自然语言处理任务中都起到了重要的作用。
例如,在机器翻译中,分词可以提高对齐和翻译的质量;在文本挖掘中,分词可以提取关键词和构建文本特征;在信息检索中,分词可以改善检索效果。
二、词性标注技术研究与应用词性标注是给分好词的文本中的每个词语确定一个词性的过程。
中文的词性标注涉及到名词、动词、形容词、副词等多个词性类别。
词性标注的目标是为后续的自然语言处理任务提供更精确的上下文信息。
1.基于规则的方法基于规则的词性标注方法是根据语法规则和语境信息,确定每个词语的词性。
例如,根据词语周围的上下文信息和词语的词义来判断词性。
这种方法需要大量的人工制定规则,并且对于新词的处理能力较差。
中文分词技术的研究现状与困难

四、解决方案
为了克服中文分词技术的研究困难,以下一些解决方案值得:
1、优化分词算法:针对分词算法的复杂性问题,可以尝试优化算法的设计和 实现,提高其效率和准确性。例如,可以通过引入上下文信息、利用语言学知 识等方式来改进算法。
2、改进信息检索技术:在信息检索领域,可以尝试将先进的排序算法、推荐 系统等技术引入到检索过程中,以提高检索效果。此外,还可以研究如何基于 用户行为和反馈来优化检索结果。
3、缺乏统一的评价标准:中文分词技术的评价标准尚未统一,这使得不同研 究之间的比较和评估变得困难。建立通用的中文分词技术评价标准对于推动相 关研究的发展至关重要。
4、特定领域的应用场景:中文分词技术在不同领域的应用场景中面临着不同 的挑战。例如,在金融领域中,需要分词技术对专业术语进行精确识别;在医 疗领域中,需要处理大量未登录词和生僻字。如何针对特定领域的应用场景进 行优化,是中文分词技术的重要研究方向。
3、建立大型标注语料库:通过建立大型标注语料库,可以为分词算法提供充 足的训练数据,提高其准确性和自适应性。此外,标注语料库也可以用于开发 基于规则的分词方法和测试集的构建。
4、研究跨领域的应用场景:针对不同领域的应用场景,可以研究如何将中文 分词技术进行迁移和适配。例如,可以通过知识图谱等技术将不同领域的知识 引入到分词过程中,以提高分词效果。
然而,各种分词方法也存在一定的局限性和不足。例如,基于规则的分词方法 需要人工编写规则和词典,难以维护和更新;基于统计的分词方法需要大量标 注语料库,而且训练模型的时间和计算成本较高;基于深度学习的分词方法虽 然取得了较好的效果,但也需要耗费大量的时间和计算资源进行训练。
三、研究困难
中文分词技术的研究面临着诸多困难和挑战,以下是一些主要词方法:该方法主要依靠人工编写的分词规则来进行分词。 代表性的工作包括台湾大学开发的中文分词系统“THULAC”和北京大学开发 的“PKU中文分词系统”。这些系统均基于词典和规则,具有较高的准确率和 召回率。
文本分类技术在网络评论分析中的应用

文本分类技术在网络评论分析中的应用随着互联网的发展,人们接收信息的方式也越来越多样化。
互联网上的评论和评价对一款产品或服务的好坏往往具有很大的影响力。
因此,如何对这些评论进行分析,挖掘有价值的信息,已成为企业决策者必须考虑的问题。
而文本分类技术就是一种应用广泛的方法,能够从大量的文本数据中提取有用的信息。
一、文本分类技术的基本原理文本分类技术是一种自然语言处理技术,它的主要目的是将大量的文本数据按照预定义的类别进行分类。
文本的分类通常需要经过以下几个步骤:1. 收集数据:首先需要收集大量的文本数据,这些数据可以是用户的评论、新闻报道、论文等等。
2. 数据清洗:对采集到的数据进行清洗,去除其中的无用信息,比如标点符号、乱码等。
3. 特征提取:将文本数据转化为有意义的数值特征向量,以便于机器学习算法进行处理。
一般来说,特征提取的方法可以是词袋模型、TF-IDF等。
4. 建立模型:选择合适的分类算法,建立文本分类模型。
常用的文本分类算法有朴素贝叶斯、支持向量机、决策树等。
5. 测试和评估:用测试数据对分类模型进行评估,查看分类结果的正确率和召回率等指标。
二、文本分类技术应用于网络评论分析文本分类技术可以应用于众多领域,其中包括网络评论的分析。
通过对互联网上的评论和评价进行分析,企业决策者可以更好地了解产品或服务的优点和缺点,从而优化产品或服务的质量,提高用户的满意度。
1. 情感分析情感分析是一种文本分类技术,它的主要目的是分析文本中所体现的情感极性,即积极、中性或消极。
通过对用户的评论和评价进行情感分析,企业可以了解用户对产品或服务的整体满意度。
比如,苹果公司就曾利用情感分析技术对iPhone手机的用户评论进行分析,以了解用户对新产品的反应和满意度。
2. 主题分析主题分析是一种基于文本分类技术的数据挖掘方法,它的主要目的是从大量的文本数据中提取出主题信息。
通过对用户的评论和评价进行主题分析,企业可以了解用户对某一方面的关注程度及其满意度。
中文文本分类系统的研究与实现的开题报告

中文文本分类系统的研究与实现的开题报告一、项目背景中文文本分类是自然语言处理中的一个重要分支,它的应用场景广泛,包括情感分析、实体识别、垃圾邮件过滤、新闻分类等。
随着互联网的快速发展和普及,中文文本数据量也越来越大,如何快速准确地对海量文本进行分类已经成为亟待解决的问题。
二、项目目标本项目旨在研究中文文本分类的算法和技术,并实现一个中文文本分类系统。
具体目标包括以下几个方面:1.研究中文文本分类的基本概念、算法、技术和性能评估指标等。
2.选择适合中文文本分类的算法模型,如朴素贝叶斯、支持向量机、决策树等。
3.对中文文本数据进行预处理,包括去停用词、分词、词向量化等。
4.利用机器学习算法对数据进行训练和测试,采用准确率、召回率、F1值等指标评估模型的性能。
5.根据模型训练的结果,实现一个中文文本分类系统,能够对用户输入的文本进行分类,并返回分类结果。
三、项目计划1.文献调研和算法选择(1周)在本阶段,需要对中文文本分类的相关文献进行调研,了解中文文本分类的算法、技术以及各种性能评估指标,选择适合本项目的算法模型。
2.数据预处理(1周)对中文文本数据进行预处理,包括去除停用词、对文本进行分词、将文本转换为词向量等,以便进行机器学习的训练和测试。
3.模型训练与测试(4周)利用机器学习算法对数据进行训练和测试,采用准确率、召回率、F1值等指标评估模型的性能,并对模型进行调优。
4.系统设计与实现(3周)根据模型训练的结果,设计一个中文文本分类系统,能够对用户输入的文本进行分类,并返回分类结果。
5.测试与优化(1周)对系统进行测试,并对系统进行优化,以提高系统的准确率、速度和稳定性。
四、预期成果本项目预期达到以下两个方面的成果:1.研究成果(1)对中文文本分类算法、技术、性能评估指标等进行深入的研究;(2)选择适合本项目的中文文本分类算法模型,并对其进行调优和评估。
2.实现成果实现一个中文文本分类系统,能够对用户输入的文本进行分类,并返回分类结果。
基于神经网络的中文分词技术研究

基于神经网络的中文分词技术研究
中文分词是将连续的汉字序列切分为有意义的词语的过程。
传统的中文分词方法主要基于词典、规则和统计等方法,但这些方法在处理复杂的语言现象时存在一定的局限性。
近年来,基于神经网络的中文分词技术逐渐受到广泛关注。
这些技术通过神经网络模型学习中文分词任务的特征和规律,具有更好的泛化能力和鲁棒性。
以下是一些常见的基于神经网络的中文分词技术:
1.基于循环神经网络(RNN)的中文分词:RNN是一种递归神经网络结构,能够处理序列数据。
通过将汉字序列作为输入,RNN可以对每个汉字的边界进行预测,从而实现中文分词。
2.基于长短期记忆网络(LSTM)的中文分词:LSTM是一种特殊的RNN 结构,能够捕捉长期依赖关系。
通过LSTM网络,可以更好地处理一词多义、歧义和复合词等语言现象,提高中文分词的准确性。
3.基于注意力机制的中文分词:注意力机制是一种能够学习输入序列不同位置重要性的技术。
通过引入注意力机制,可以使神经网络更加关注汉字序列中与分词有关的信息,提高中文分词的效果。
4. 基于Transformer模型的中文分词:Transformer是一种基于自注意力机制的神经网络模型,具有较强的并行计算能力。
通过使用Transformer模型,可以有效地处理中文分词任务,并且在大规模语料库上获得较好的性能。
基于神经网络的中文分词技术在不同的任务和数据集上取得了较好的效果。
然而,由于中文分词任务的复杂性和语言差异,仍然存在一些困难
和挑战。
未来的研究可以进一步探索如何融合多种神经网络技术、优化网络结构和改进训练算法,以提高中文分词的性能和效果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中图分类号 :T P 3 9 1
文献标识码 : A
文章编号 :1 6 7 4 - 7 7 1 2( 2 0 1 4 ) 0 2 息技术 的普 及和发展,计算机智 能阅卷 已经得到 多 ,就越有可 能构成一个词 。从统计 学上讲就是求概 率的 问 了广 泛的应用 ,如 :大 学英语等级考试 、计算机 等级考试等 题 ,可 以通过对 训练 文本 中相邻 出现 的各个字 的组合 的频率 国家 级考 试 中的客观题 都参用 了计算机智 能阅卷 。同时一些 进行统计学 习,计算它们 的互现信 息得 出规律 。在 中文处理 远程考试 系统在主观题 智能评分方面也取得 了许 多成果 ,中 时 ,如果文本 串中的字与字互现信 息大于某个值 时,就可 以 文分 词是 自然语言处理 系统中的重要步骤 ,而主观题 智能评 判断此字组可 能构成 了一个词 。该 方法又称为无字 典分词 。 分首 要解 决的 问题就是 中文分词,本文试从现有 的中文分词 互现 信 息 的计 算 ,设有 词 A和 B ,A B之 间 的互现 信 息 为: 技术进行 了探讨 ,并就智能评分系统 中的应用做出研 究分析。 M ( A , B ) = 供中P( A , B ) 为A 、 B 相邻出 现的频率, 中文分词技术概述 P( A )为 A出现 的频率 ,P( B ) 为 B出现 的频率 。 中文分词是指按照 一定的算法 ,将一个 中文序 列切分成 ( 三 )依据 理解 的分词算法 。该方 法又称依据人 工智能 个 一个 单独 的词 。分词就 是计 算机 自动识别文 中词的边界 的分词方法 ,这种方 法模拟 了人对句 子的理解过程 ,其 基本 的过程 。我们知道 ,在英文 中,单词之间是 以空格 作为 自然 思想就是对文本 串进 行句法 、语义 理解 ,并利用句法信 息和 分界 符的,而 中文只是字 、句和 段能通过 明显 的分 界符来简 语义信 息来进行分词 并处理歧 义现象 。此算法一般包括三个 单划 界,唯独词没有一个 形式上的分界符 ,人工 在阅读时 , 部分 :分词子系统、句法语义子系统和总控部分。分词子系统 都需要通 过对句子分词才 能正确理解意思 ,可见 中文 分词技 是在 总控部分的协调下,来得到有关 的词、句子等的句法 ,通 术对主观题智能评分有着重要的意义 。 过语义信息对分词中的歧义进行判 断的。此分词方法通常使用 二、现有的中文分词技术 较大量的语言知识及信息。 由于汉语 中语言知识较为笼统、 复杂, 在近 3 0年 的研 究 中,各 位开发 人员研 究 了中文分 词技 很难将各种语 言信息完全组织成机器可直接读取 的形式,因此 术在 词典和概率方面统 计的一些算法 。 目前 中文 分词主要算 目前依据理解的分词系统还不成熟。 法有 三大类 :依据词典 的分词方法 ,依据统计 的分词方法 , 三 、中文分词算法在智能评 分系统 中的应用 依据理解 的分词方法 。 就 以往客观 题人工阅卷过程来 看,教师通常首先 查看正 下面 简要介绍一下这些算法 。 确答案 中的关键 点,然后再与学生答案 对 比,通过学 生答 对 ( 一 )依据 字典 的分词算法。又名机械分词 算法,此方 关键点所 占的比重来 确定学生得分情况 。基 于这样 的阅卷 过 法是根据 词库确立词典 ,然 后以一定策略将准备分 析的中文 程,尝试通过 中文分词模拟人工 阅卷过程 。 字符 串和这个词典 中的各词进行 比对 ,如果在词典中能找到, 首先 ,题库 中试题 要配有相应 的答 案及 关键 点,记 为一 则 比对 成功,那么就需要 一个相当大容量 的中文 词典,词典 个集合 ,如:关键字 = { K 1 ,K 2 ,K 3 …. K n ) 。在对学生 的答 案 的词语越 广泛 ,分词的越准 确。依据 比对方 向的不一 样可分 使用 中文 分词技术 中 删 法和 R M M法结合 ,得出学生答案中所 为正 向比对和逆 向比如 ;依据 长度 比对 的情况 ,分 为最大 比 占关键词 的比例 ,给相应的得分 。 对和最 小 比对;其 中最常用 的方 法是正 向最大 比对法 和逆 向 四、结束语 最大 比对法 。正向最大比对法 ( M a x i m u m at M c h i n g M e t h o d ), 本文就现有 的中文分词技术做 出了分析,系统地 阐述 了 其主要思想为:从待匹配的文本 串最左端开始,依次取出 i , 三种算法,他们都有各 自的优缺点 :首先依 据词典 的分词 算 2 ,3 ,…n 个字符来与 已有的词典 比较,看看在词典 中是否有 法简单 , 易于实现, 不足在于比对速度慢, 歧义 问题较难解决 这个词,若有,则匹配成功,将它放入词队列或数组中暂存, 依据 统计的分词算法 可以发现所有 的歧 义切分,但统计语 言 接着对 中文语句 /字 串中剩余的部分进匹配,直到全部分词完 的精 度和决策算法又在很 大程度上决定 了解 决歧义 的方法 , 毕。正向最大匹配算法按照从左到右 的顺序进行匹配,在分词 并且速度较慢 。后面又分析 了中文分词算法在 智能评分系 统 要遵循所谓的最大化原则,即确保 已扫描出的词不是某个 已存 中的应用,具体采用 了依 据词典 的分词 算法。 由于 中文 的复 在词 的前 缀。逆 向最 大 比对 法 ( R e v e r s e M a x i m u m M a t c h i n g 杂性 , 决定 了中文分词技术还不够成熟, 很多技术还在探索 中。 M e t h o d )。R M M法的主要 原理 与 删 法相 同,区别在于 分词的 参考文献: 扫描方 向。 如A 代表词典 , M A X 表示 A中的最长文本 串长度 , Ⅲ 1袁春凤 . 主观题 的计算机 自动批发技 术研 究 盯 ] . 计算 s t r i n g为准备切分 开的字符 串。删 法 是从 s t r i n g中取 出长 机 应 用研 究 , 2 0 0 4 ( 0 2 ) : 1 8 1 — 1 8 5 . 度为M A X的子 串 ( 即最长 文本 串)和 A中的词条进 行 比对 。 『 2 ] 高斯 丹 . 基 于 自然语 言理解的主观试题 自动批 发技 术 如 果成功 ,那么该 子串为词,然后指针 向后移 M AX 个 汉字后 的 研 究 与 初 步 实现 [ D1 . 继 续 比对 ,否则该子 串每次减少一个进行 比对。 由于汉语 多 『 3 1 谭 冬晨 . 主观题 评 分 算 法模 型研 究 f 【 ) ] . 电子 科技 大 数情 况下 中心词位 置相对靠后 ,所 以逆 向最 大匹配法 的精度 学 , 2 0 1 1 . 『 4 ] 贾电如 . 基 于 自然语语 句结构及语 义相似 度计算主观 要高于正 向最 大匹配法,在实际应用 中通 常将 正 向最大匹配 2 0 0 9 ( 0 5 ) : 5 — 7 . 算法 与逆 向最 大匹配算法两者结合起来 使用,这样可提高分 题评分算法的研究 卟 信 息化 纵横 , 词结果的正确率 。 [ 作者简介 ]张微微 ( 1 9 8 2 . 0 4 一 ),女 ,黑龙江讷河人 , ( 二 )依据 统计的分词算法 。该方 法的主要 思想 :词 是 稳定 的组合 ,因此 在上下文 中,相邻 的字同时 出现 的次数 越 教师 ,讲师 ,理学学士,研究方 向:计算机软件应 用。
…
酾软 件 应 用 与 设 计
S o f t wa r e Ap p l i c a t i o n a n d De s i g n
中文分词技术在智能评分系统中的应用研究
张微 微
( 1 . 青 岛科技大学 ,山 东青岛 2 6 6 0 6 1 ; 2 . 山东省轻工工程学校 ,山东青岛 2 6 6 1 1 2 )
摘 要 :在 计算机 考试 系统 开发过程 中,对于主观题 的智能评 分一直是重点 ,也是难 点 ,而在 主观题评 分 中首 要 解决的 问题就是 中文分词技 术,本文就现有 的 中文分词技 术做 分析 比较 ,并根据智 能评分 系统应 用研 究 中具体做
法做 出分析 。 关键 词 :中文分词 ;依 据词典 ;智能评分 系统