知识图谱构建
构建知识图谱的详细步骤

构建知识图谱的详细步骤研究方向是知识图谱,需要整理数据集,所以这里想简单分享一下构建知识图谱的完整步骤,也算记录一下我的学习进程!网上说的最多的知识图谱构建的步骤就是:知识抽取、知识融合、知识存储但是在这些步骤之前我们还要先完成“构建模式、概念本体设计” 两个步骤,所以完整的步骤就是:构建模式、概念本体设计、知识抽取、知识融合、知识存储接下来,根据上面的步骤结合我自己整理数据的经验,详细讨论一下构建知识图谱的过程1.本体构建构建模式和概念本体设计也就是本体的构建,本体的构建一般包括两种方式,有自顶向下和自底向上两种方式。
自顶向下是先设计本体构建层,再将结构化知识加入知识库中,即先模式后数据;自底向上是先从公开数据集选择一些置信度较高的信息加入知识库,然后构建本体模式层,即先数据后模式。
2. 知识抽取我们构建知识图谱最终要的就是数据集,但是结构化的数据很少,大多都是半结构化数据和非结构化数据,所以需要将这些数据转化为结构化的数据,也就是三元组(主体,关系/属性,客体)知识抽取是从非结构化文本中抽取出三元组,说白了知识抽取就是一个将非结构化数据转化为结构化数据的过程。
知识抽取一般分为两种,一种是先抽取实体后抽取关系的流水线式的方法,一种是同时抽取实体关系,简单介绍一下这两种方法。
流水线抽取方法:这种方法很简单明了,就是先完成对实体的抽取,再去抽取实体之间的关系,或者实体的属性,但是一旦实体出现错误,那对应的关系和属性也会出错,即容易产生联级错误;联合抽取方法:不再把实体抽取和关系抽取分为两个独立的子过程,用的最多的就是先抽取头实体,后同时抽取关系和尾实体。
3. 知识融合知识融合分为实体消歧和共指消解实体消歧是解决一个实体具有不同意义的问题,如“苹果”既指水果,又指“苹果”公司;共指消解是解决不同实体具有相同的意义,例如“西红柿”和“番茄”,也称实体对齐。
常用的实体对齐方法有:•基于统计机器学习方法•基于文本向量距离计算相似度•基于神经网路的方法4. 知识存储知识存储目前主要有两种:RDF和图数据库Neo4jRDF:以三元组的形式存储在关系数据库,搜索效率低,查询语言为SPARQL;Neo4j:图数据库以图的形式存储,支持高效的图查询和搜索,查询语言为Cypher。
学科知识图谱构建的整体流程

学科知识图谱构建的整体流程学科知识图谱构建的整体流程主要包括以下步骤:
(一)需求分析:明确构建目的,界定学科范围,分析目标用户需求,确定知识图谱应涵盖的核心概念和实体。
(二)数据收集:从教材、学术文献、数据库及网络资源中收集相关学科信息,包括实体数据(如人物、事件、理论)和关系数据(如因果、归属关系)。
(三)数据预处理:清洗、去重数据,进行文本解析,为后续步骤准备好结构化数据。
(四)本体设计:构建学科本体,定义实体类型、属性及关系,形成知识框架,这是知识图谱的骨架。
(五)知识抽取:运用自然语言处理、机器学习等技术,从文本中自动或半自动抽取实体、属性和关系,包括命名实体识别、关系抽取等。
(六)知识融合:解决实体歧义,合并重复信息,标准化数据格式,确保知识的一致性和完整性。
(七)图谱构建:根据本体和抽取的知识,利用图数据库技术,构建实体-关系-实体三元组形式的知识图谱。
(八)质量评估:通过专家审核、算法评估等方法,确保图谱的准确性和覆盖度。
(九)应用开发:基于构建好的知识图谱,开发查询系统、推荐系统等上层应用,服务于教学、科研和学习。
(十)维护更新:持续监控数据源,定期更新图谱内容,适应学科发展变化,保持图谱时效性。
知识图谱的构建和应用

知识图谱的构建和应用一、知识图谱简介知识图谱是一种基于图的全局知识表达方法,将知识以一种结构化的形式进行存储和表达,帮助人们更好地组织、理解和利用知识。
知识图谱主要由实体、属性和关系三部分组成,其中实体表示具体的事物或概念,属性表示实体的性质或特征,关系表示实体之间的连接或依赖关系。
二、知识图谱构建技术知识图谱的构建需要从多个信息源中获取知识,并将其整合成一个完整的知识体系。
常用的构建技术包括以下几种:1、实体识别和属性抽取技术。
通过对语料库进行分析和处理,自动识别文本中的实体,并抽取实体的属性信息。
2、关系抽取技术。
通过分析文本中的语法和语义信息,从文本中抽取实体之间的关系。
3、知识表示和存储技术。
将获取的知识以一种结构化的方式存储在数据库中,以便后续的查询和检索。
4、知识推理和推断技术。
通过对知识图谱进行推理和推断,从而获取新的知识和结论。
三、知识图谱应用场景知识图谱具有广泛的应用场景,以下是几个常见场景的介绍:1、智能客服。
将知识图谱应用于智能客服,可以提高客户服务效率,快速解决客户问题。
2、智能推荐。
将知识图谱应用于电商平台的商品推荐,可以根据用户的需求和历史行为,向其推荐符合其喜好的商品。
3、医疗诊断。
将知识图谱应用于医疗诊断,可以快速对疾病进行诊断和治疗,帮助医生快速确定病情并开展治疗。
4、智能交通。
将知识图谱应用于智能交通中,可以实现交通监控和管理,减少交通事故和拥堵。
四、知识图谱的挑战和未来发展知识图谱的构建和应用面临一些挑战。
首先,知识的获取和整合是一个大量工作量的任务,需要付出大量的时间和人力成本。
其次,知识图谱中的数据量非常庞大,如何有效地管理和更新也是一个重要问题。
未来,预计将出现针对知识图谱构建和应用的更加高效和精准的技术。
同时,相信将会涌现出更多的知识图谱相关的应用,推动其向着更加广阔的领域发展。
知识图谱构建

知识图谱构建知识图谱构建是一项广泛应用于各个领域的关键技术,它以图结构的形式表示并组织各种领域的知识,并可用于语义搜索、智能推荐、自然语言处理等多个领域。
本文将介绍知识图谱构建的定义、关键技术和应用场景。
知识图谱构建是指通过整合、分析和抽取大量的结构化和半结构化数据,构建出一个具有语义关系的、描述实体和概念之间关联的知识图谱。
知识图谱通常由实体、属性和关系构成,其中实体表示具体的事物,属性描述实体的特征,关系表示实体之间的关联。
知识图谱构建的核心技术包括实体识别、属性抽取和关系抽取。
实体识别是指从文本中识别出具体的事物,例如人、地点、组织等。
属性抽取是指从文本中抽取出实体的特征,例如人的姓名、年龄、职业等。
关系抽取是指从文本中抽取出实体之间的关联,例如人与地点之间的出生地关系。
为了构建一个准确和丰富的知识图谱,需要使用大规模的数据集进行训练和学习。
常用的数据集包括维基百科、百度百科等。
通过对这些数据集进行语义解析和标注,可以提取出实体、属性和关系,并将其组织成图结构,构建一个完整的知识图谱。
知识图谱构建的应用场景十分广泛。
首先,它可以用于语义搜索,通过对知识图谱的查询,用户可以获取到更准确和相关的搜索结果。
其次,它可以用于智能推荐,通过分析用户的兴趣和行为数据,将用户与感兴趣的实体和关系进行匹配,从而实现个性化的信息推荐。
此外,它还可以用于自然语言处理,通过对知识图谱的语义解析,可以更好地理解和处理自然语言。
在知识图谱构建的过程中,还面临一些挑战和问题。
首先,实体识别和关系抽取的准确性是关键,因为错误的实体和关系会影响整个知识图谱的质量。
其次,知识图谱的扩展和更新也是一个挑战,因为新的实体和关系不断涌现,需要及时更新到知识图谱中。
此外,知识图谱的构建还需要大量的人力和时间成本。
总之,知识图谱构建是一项重要且具有挑战性的技术,它可以帮助我们更好地组织和利用各种领域的知识。
通过不断改进和发展知识图谱构建的技术,相信它将在更多的领域发挥重要的作用,为人们提供更智能和高效的服务。
知识图谱构建与应用方法介绍与示例

知识图谱构建与应用方法介绍与示例知识图谱是一种用于描述和组织知识的技术,它可以将各种不同领域的知识整合在一起,形成一个结构化的知识网络。
知识图谱可以帮助人们更好地理解和利用知识,在许多领域具有广泛的应用前景。
本文将介绍知识图谱的构建方法和应用示例,帮助读者了解并应用这一强大的技术。
一、知识图谱构建方法1. 知识抽取:知识抽取是构建知识图谱的第一步,它包括从文本、数据库或其他数据源中提取结构化的知识。
常用的技术包括自然语言处理、信息抽取和实体识别等。
通过这些技术,我们可以从大量数据中提取出实体、关系和属性等信息,用于构建知识图谱的节点和边。
2. 知识表示:知识表示是将抽取得到的知识转化为计算机可以理解和处理的形式。
常用的表示方法有本体表示、三元组表示和图表示等。
本体表示使用本体语言(如OWL)定义概念和属性之间的关系,三元组表示使用主语-谓语-宾语的形式表示实体之间的关系,图表示使用节点和边的形式表示知识的结构。
3. 知识融合:知识融合是将从不同数据源中抽取得到的知识整合在一起,形成一个统一的知识图谱。
融合知识需要解决实体对齐、关系对齐和属性对齐等问题,常用的方法包括基于规则的匹配、基于语义的匹配和基于机器学习的匹配等。
4. 知识推理:知识推理是对知识图谱进行推理和推断,发现其中的隐藏知识和规律。
常用的推理方法包括规则推理、语义推理和统计推理等。
通过知识推理,我们可以发现新的关系、属性和实体,提高知识图谱的质量和可用性。
二、知识图谱应用示例1. 智能问答系统:知识图谱可以用于构建智能问答系统,帮助用户快速获取有关问题的答案。
通过将问题转化为图谱查询,系统可以在知识图谱中找到相关的实体和关系,并生成相应的回答。
例如,用户可以询问“谁是美国第一位女性总统?”,系统可以通过知识图谱回答“希拉里·克林顿是美国第一位女性总统”。
2. 智能推荐系统:知识图谱可以用于构建智能推荐系统,帮助用户发现符合其需求和兴趣的内容。
知识图谱的构建及应用

知识图谱的构建及应用随着人工智能的发展,知识图谱成为了当前人工智能领域研究的热点。
知识图谱是一种结构化知识表示方式,可以将海量的不同领域的知识进行整合,从而形成更为有效地知识计算表示。
本篇文章将着重探讨知识图谱的构建技术及其应用,希望能带给读者对知识图谱的更深入认识。
一、知识图谱的构建方法知识图谱的构建可以分为三个阶段,分别是知识源收集、知识表示和知识表示优化。
1. 知识源收集知识源收集是知识图谱构建的第一步。
可收集的知识源包括结构化文本、非结构化文本、原始数据等。
其中结构化文本和非结构化文本是最常见的知识源类型。
结构化文本指已经被格式化处理过的文本,如可以在表格或者数据集中呈现的数据。
而非结构化文本,指的是没有被格式化处理的文本,如新闻、博客等。
知识来源多样化可以充分利用到多方面的信息以促进知识图谱的建立。
2. 知识表示知识的表示可以分为两个阶段:知识抽取和知识表示。
知识抽取可以通过命名实体识别、关系抽取、实例抽取等手段,对结构化文本、非结构化文本以及原始数据进行分析,抽取出实体、关系、属性等元素。
知识表示则是将抽取出来的知识表示成图形的形式。
常用的知识表示包括知识库、三元组、概念图等。
3.知识表示优化知识表示优化则是指在整个知识图谱建立过程中,对知识图谱的表达进行优化。
一般情况下,知识图谱的表达需要考虑点的排列方式、边的长度和相对位置以及节点说明等要素,并结合其他信息来进一步优化。
二、知识图谱的应用知识图谱的应用可以分为三个方面:搜索引擎、智能客服和推荐系统等。
1.搜索引擎通过知识图谱的构建,可以增强搜索引擎的检索效率和准确性。
知识图谱可以将现有的大量信息进行结构化处理,从而建立一个对用户更加直观、方便的信息检索方式。
例如,在目前知识图谱对于百度等使用,用户可以在搜索过程中找到与搜索主题有关的所有信息,并且提供给用户搜索的结果还特别针对用户的信息进行自动过滤,并快速准确地呈现给用户。
2.智能客服随着知识图谱的升级,在智能客服领域中应用也越来越多。
知识图谱构建

知识图谱构建知识图谱是一种基于语义网络的知识表示方式,可以帮助我们理解和组织大规模的知识和信息。
它通过将实体、关系和属性以图的形式进行建模和表示,提供了一个结构化的知识存储和检索方法。
本文将介绍知识图谱的构建过程以及相关的技术与应用。
一、知识图谱构建的步骤知识图谱的构建通常可以分为以下几个步骤:1. 问题定义与领域分析:在构建知识图谱之前,我们需要明确所建模的问题和领域范围。
进行充分的问题定义和领域分析,有助于确定所需要采集和整理的知识和数据。
2. 数据采集与清洗:在构建知识图谱的过程中,需要从不同的数据源中采集数据。
可以使用网络爬虫技术、数据API接口或者数据集等方式进行数据的获取。
获取的数据需要进行清洗和预处理,包括去重、去噪、格式规范化等。
3. 实体识别与属性抽取:在清洗和预处理的基础上,需要进行实体识别和属性抽取。
通过自然语言处理和信息抽取等技术,将文本数据中的实体和实体属性进行提取和标注。
4. 关系抽取与链接:在知识图谱中,实体之间的关系是非常重要的。
通过语义分析和关系抽取等技术,可以从文本数据中提取实体之间的关系信息,并进行关系的建模和链接。
5. 知识表示与存储:构建好的知识图谱需要进行知识表示和存储。
可以使用图数据库等工具和技术,将知识图谱以图的形式进行存储,方便后续的查询和应用。
二、知识图谱构建的技术与应用1. 自然语言处理(NLP):自然语言处理是知识图谱构建的核心技术之一。
通过分词、词性标注、命名实体识别等技术,可以对文本数据进行处理和分析,提取实体和属性信息。
2. 信息抽取(IE):信息抽取是从非结构化文本中抽取结构化信息的过程。
通过信息抽取技术,可以从文本数据中提取实体之间的关系信息,为知识图谱的构建提供支持。
3. 本体构建与推理:本体是知识图谱中的一种重要组成部分,用于描述概念和属性之间的关系。
通过本体构建和推理技术,可以对知识进行逻辑推理和推断,提高知识图谱的表达能力和应用效果。
知识图谱的构建

知识图谱的构建知识图谱(Knowledgegraph)是以图谱模型为基础构建的知识体系,它将各种实体(entity)映射到图中的节点上,以及将实体之间的关系(relationship)映射到图中的边上,以此描述一个拥有强大表示能力的知识体系。
知识图谱综合了各种信息源(如文本、数据库、网络等),可以抓取、链接、表示和理解复杂的知识,能够深度挖掘人类基础知识并融合重要维度,将有形的知识和无形的概念转化为信息,从而支撑语义理解和机器智能应用。
知识图谱的构建1、数据源构建知识图谱的第一步是确定数据源,数据源可以是多种多样的包括文本、图片、视频、数据库和网络资源等。
文本作为最主要的知识表示方式,包括文字、数据库记录、网页内容、社交媒体等,大多数知识图谱都以文本提取信息作为数据基础。
2、知识抽取知识抽取是指从指定数据源中获取有效信息的技术。
知识抽取包括实体抽取(Entity Extraction)、关系抽取(Relation Extraction)、属性抽取(Attribute Extraction)和事件抽取(Event Extraction)等,这些技术都可以用来抽取文本中包含的实体和关系,以便构建知识图谱。
3、知识表示和验证构建知识图谱需要使用有效的知识表示方式来保存抽取的知识,可以使用OWL(Web Ontology Language)、RDF(Resource Description Framework)或者OWL和RDF的语义网络的混合模型等。
除此之外,还需要在构建知识图谱之前对数据进行归一化,并将认知数据等信息标记出来,以便进一步验证实体和关系的准确性,确保知识图谱的准确性和可靠性。
4、知识图谱建模知识图谱建模是指将知识内容组织成实体和关系网络,将实体和关系映射到图中的节点和边上,从而建立起知识图谱的技术。
知识图谱的建模一般分为实体建模和关系建模两个过程,实体建模是指确定实体类型、属性和标签,而关系建模是指确定实体间关系、关系类型和标签等,从而构建起一个准确的知识图谱网络。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
上下文无关文法
Abraham Lincoln was born in Kentucky.
NNP
NNP
V
V
P PP
NP
Classifier
which class?源自NPBEGIN END BEGIN END
VP
VP S
分水岭
Wikipedia
Cyc
按需抽取:Bootstrapping
Bootstrapping:模板生成->实例抽取->迭代直至收敛 语义漂移问题:迭代会引入噪音实例和噪音模板 − 首都:Rome 城市模板 “* is the city of” (McIntosh et al. ACL 09):同时扩展多个互斥类别
Label
Founder-of CEO-of Founder-of CEO-of
√
x x x
基于噪音实例去除的DS方法
通过去除噪音实例来提升远距离监督方法的性能 假设:一个正确的训练实例会位于语义一致的区域, 也就是其周边的实例应当都有相同一致的Label
− 基于生成式模型的方法(Takamatsu et al. ACL 12) − 基于稀疏表示的方法(Han et al. ACL 14)
知识库
标注训练语料 Relation Instance Label Founder-of, CEO-of Founder-of, CEO-of
CEO_Of(乔布斯, 苹果公司) Founder_Of(乔布斯, 苹果公司)
S1: 乔布斯是苹果公司的创始
人之一 S2: 乔布斯回到了苹果公司
简单远距离监督方法(Mintz et al.,
同时扩展人物、地点、机构,一个实体只能属于一个类别
COLING 14:引入负实例来限制语义漂移
开放抽取:ReVerb
通过识别表达语义关系的短语来抽取实体之间的关系
− (华为,总部位于, 深圳),(华为,总部设置于,深圳),(华为,
将其总部建于,深圳)
同时使用句法和统计数据来过滤抽取出来的三元组
是一种 编程语言
??? Swift
是一种
知识链接计算文本提及到实体之间的 匹配程度,使用多方位的信息: • 先验可能性(Popularity) • 上下文相似度(Context Similarity) • 文本的主题一致性(Coherence)
使用知识库提供构建模块: • 名字-实体词典 • 实体关系,类别 • 实体的文本描述和关键特征 • 用来构建权重的参数
乔丹(机器 学习)
乔丹
0.12 0.03
计算最大似然链接结构的算法
− 寻找具有最大似然值的子图/最稠密子图(Chakrabarti et al.: KDD’09, Hoffart et al., EMNLP’11,…) − 基于Graph Ranking寻找最大可能节点(Han et al., SIGIR’11, Alhelbawy and Gaizauskas, ACL’14…)
面向知识图谱的IE—核心模块
高价值 信息检测 知识链接 开放抽取 验证集成
Fuel Pump Pump Relay Headlight Engine Shorts Fails Stalls Cold wether Running hot At low speeds
高价值信息检测
目的:对目标知识,找到容易抽取的数据块(Nugget )
基于协同推荐的DS方法
使用矩阵来表示实体 对与Pattern,实体对 与语义关系,Pattern 与语义关系之间的关 联 关系抽取任务被建模 为矩阵填空问题 基于协同过滤推荐的 方法(Riedel et al. NAACL 13) 基于Low-Rank矩阵分 解的方法(Fan et al. ACL 14)
传统信息抽取的核心技术
字典匹配
Abraham Lincoln was born in Kentucky.
member?
对每个分割候选进行分类
Abraham Lincoln was born in Kentucky.
Classifier
滑动窗口分类器
Abraham Lincoln was born in Kentucky.
WordNet
知网
高质量数据源 500万概念 多语言 富含丰富语义结构 的文档: Infobox,table, list,category…
1985
1990
2005-2010
信息抽取目标的转变
从文本中抽取指定 类型的实体、关系、 事件等事实信息 ACE
从海量数据中发现 实体相关的信息, 并将其与现有知识 库进行集成 KBP
− 关系短语应当是一个以动词为核心的短语 − 关系短语应当匹配多个不同实体对
优点:无需预先定义关系类别 缺点:语义没有归一化,同一关系有不同表示
关系短语的句法结构约束
知识监督开放抽取-Distant Supervision
开放域信息抽取的一个主要问题是缺乏标注语料 Distant Supervision: 使用知识库中的关系启发式的 标注训练语料
ACL09)
DS假设: 每一个同时包含两个实体的句子都会表述 这两个实体在知识库中的对应关系 基于上述假设标注所有句子作为训练语料 使用最大熵分类器来构建IE系统 最大的问题:噪音训练实例
噪音训练实例 Relation Instance
S1:乔布斯是苹果公司的创始人之一 S1:乔布斯是苹果公司的创始人之一 S2:乔布斯回到了苹果公司 S2:乔布斯回到了苹果公司
实体链接代表性方法—统计方法
水果苹果
苹果公司 苹果银行 电影苹果 0.00%20.00% 40.00%
使用统计量来表示实体链接所需的知识 使用知识库和大规模语料库来估计上述统计量 设计统计模型综合多个不同的统计量来进行决策
− 生成式模型(实体-提及模型 ACL 11, 实体-主题模型 EMNLP 12, …) − 深度学习模型(He et al., ACL 13, Sun et al., IJCAI’15,…)
文本分析为核心 -->知识发现为核心 主要任务:抽取 --> 发现 数据源:文本 --> 海量数据 抽取对象:预先指定类型 -->Open Domain 与现有知识库的集成成为了新的核心任务
面向知识图谱的IE—核心模块
高价值 信息检测 知识链接 开放抽取 验证集成
Fuel Pump Pump Relay Headlight Engine Shorts Fails Stalls Cold wether Running hot At low speeds
面向知识图谱的IE—核心模块
实体链接代表方法—图方法
大灌篮
0.20
宇宙大 灌篮 芝加哥 公牛队
0.66 0.82
乔丹(NBA 球星)
0.08
0.13
公牛
公牛(动物)
0.01
乔丹(好莱 坞影星)
乔丹(机器 学习)
乔丹
0.12 0.03
使用知识库中的知识来构建mention-entity graph 构建算法来计算最大似然链接结构
− 语料构建成本过高 − 跨领域跨文本类别时抽取性能严重下降 − 需要抽取的信息类别通常未预先指定
需要研究新的抽取方法
− 按需抽取—Bootstrapping − 开放抽取—Open IE − 知识监督抽取—Distant Supervision − …(如知识库挖掘算法Path Ranking算法)
− 大大降低信息抽取的难度 − 面向知识图谱的IE以知识为核心,目标是覆盖要抽取的 知识,不需要覆盖所有文档 − 数据规模导致无法覆盖数据的每一部分
高价值结构:Wikipedia Infobox,Web Table,List,… 高价值文本:匹配特定模板的文本,概念定义句…
姚明身高2.29米
姚明父亲姚志源身高2.08米, 姚明比他还高了21厘米
0
1
1
0
0
{0, 1}
1
0
...
{bornIn,…} founder Z1 创始人
{bornIn,…} Z2
founder UN
{bornIn,…} Z3
...
CEO-of CEO
乔布斯是苹果公司的创 始人之一.
乔布斯回到了苹果公司.
乔布斯重新成为了 苹果公司的CEO.
...
一个实体对由一个句子集合表示 AtLeastOne假设:只要实体对的一个句子具有特 定关系,那么该实体对也就具有该关系 使用Factor Graph来表示多个变量之间的关系 (Surdeanu et al. EMNLP 12, …)
构建了有限状态自动机来识别给定概念的所有定义句
计算机科学 像素 中
, <Target> 是 计算机图像 NN2 的 一个 JJ 点 NN3 NN1
在
面向知识图谱的IE—核心模块
高价值 信息检测 知识链接 开放抽取 验证集成
Fuel Pump Pump Relay Headlight Engine Shorts Fails Stalls Cold wether Running hot At low speeds
面向知识图谱构建的 信息抽取技术
韩先培 中国科学院软件研究所
2015-6-27
传统信息抽取
Grishman(1997):从自然语言文本中抽取 指定类型的实体、关系、事件等事实信息,并 形成结构化数据输出的文本处理技术