知识图谱研究概况及其在中医药领域的应用
知识图谱研究综述及其在医疗领域的应用

目录
01 知 识 图 谱 02 N L P 相 关 技 术 03 知 识 图 谱 的 应 用
01
知识图谱
发展
知
识
图
谱
知
识
图
谱
定义
是一种基于图的数据结构,由节点(实体)和标注的边(实体间的关系)组成,它本质上是一种揭示实体 之间关系的语义网络,可以对现实世界的事物及其相互关系进行形式化地描述。
NLP相关技术
关系抽取(RE)
关系抽取(Relation Extraction,简称RE),是指从识别出实体的文本中抽取实体之间的语义关系。
有监督关系抽取模型: 基于统计方法:特征工程方法、核函数方法、图模型方法、特征嵌入方法 神经抽取模型:卷积神经网络、递归神经网络、基于依存关系的神经网络
半监督关系抽取模型:远程监督方法
三元组是知识图谱的一种通用表示形式,由2个具有语义连接关系的实体和实体间关系组成,是知识 的直观表示,即G=(head ,relation,tail),其中, head为三元组中的头实体, tail为三元组中的尾 实体,relation = {r1,r2,...,r|R|}是知识库中的关系集合,共包含|R|种不同关系。三元组的基本形 式主要包括实体1、关系、实体2和概念、属性、属性值等。
定义
知
识
图
谱
架构
知
识
图
谱
构建知识图谱的主要目的是抽取大量的、让计算 机可读的知识。
知识大量存在于非结构化的文本数据、半结构化 的表格、网页以及部分信息系统的结构化数据中。
知识图谱的构建流程可以被归纳为3个模块,即 知识抽取、知识融合以及知识推理。
知识图谱技术在医学研究中的应用

知识图谱技术在医学研究中的应用随着互联网时代的发展,数据规模呈指数级增长,医学领域亦是如此。
如何高效、准确地管理、分析、应用这些数据成为大家所共同关注的话题。
知识图谱技术作为一种新型的本体化、关联型的数据结构模型,可以转换、连接、抽象、推理医学领域的数据和知识,近年来在医学研究领域的应用越来越广泛,成为医学领域研究的重要工具,本文主要介绍知识图谱技术在医学领域的应用。
一、知识图谱技术在疾病诊断中的应用疾病的诊断是医生工作中最重要的内容之一,知识图谱技术可以通过抽取、整合医学文献、疾病标准、诊疗规范、临床经验、实验室检查数据等多种数据信息,构建医学领域的知识图谱,为医生提供一个全面、准确的疾病诊断依据。
例如,全球首个肺癌知识图谱项目使用肺癌相关的数据资源,利用知识抽取技术和本体构建工具来构建了一个包含2,813个疾病实体和7,780个关系的肺癌知识图谱,帮助医生更好地了解疾病复杂性及其诊断、治疗和预后等方面的相关信息。
二、知识图谱技术在药物研发中的应用药物的研发过程十分复杂,需要大量耗时、费力的实验数据。
知识图谱可以整合、结构化药物相关的多种数据信息,包括化学式、药物作用、身体器官和细胞的关系、基因、蛋白质等,为药物研发提供数据支持,加速药物研发进程。
例如,德国柏林自然历史博物馆团队利用知识图谱技术构建了药物全周期(drug life cycle)知识图谱,能够表示药物在不同历史阶段的特征,包括化学结构与活性、药物审批和上市、治疗效果、有害反应和临床使用。
这将有助于药物研发过程的优化以及新药的审批和上市。
三、知识图谱技术在健康管理中的应用健康管理是针对个体和群体的综合性医学服务,是现代医学的重要组成部分。
知识图谱技术可以为健康管理提供数据支持,将个体化的健康数据抽象成结构化的知识图谱,通过对用户不同维度的健康数据、上下游的健康数据、健康状况的知识图谱进行分析,可以为用户提供行为相关的个性化健康管理建议,以更好地应对健康问题。
知识图谱技术在医疗领域中的应用

知识图谱技术在医疗领域中的应用在当今信息技术的浪潮中,人们对于知识图谱技术的使用越来越广泛,而医疗领域也不例外。
知识图谱技术是一种将文本、图像、声音等多种媒体中的不同信息进行分类、关联、网状化的先进技术,其应用在医疗领域可以帮助医生更加高效准确地进行疾病诊断、治疗,提高医疗服务的质量。
本文将围绕知识图谱技术在医疗领域的应用进行探讨。
一、知识图谱技术的基本原理知识图谱是基于语义网技术和人工智能技术的新型知识表示方式,它将较大规模的知识进行了高度的连接,表达了知识之间的关系,使得计算机可以更优秀地进行数据挖掘及信息处理,进而推动人机交互模式向更有效的认知交互方向发展。
知识图谱技术的基本组成有三部分,即实体、属性和关系。
实体是对于现实生活中具体或抽象的个体进行的一种抽象描述,如疾病、药品等。
属性是实体的一种描述,可以是该实体的属性特征,如疾病的症状、药品的成份等。
关系则是将不同实体之间的联系进行表示,如一个疾病可以由多种病因导致。
二、知识图谱在医疗领域的应用1. 疾病诊断知识图谱技术在医疗领域的应用最为主要的是对疾病诊断的辅助。
现在的疾病诊断主要依靠医生根据患者的病史、症状和体检结果进行判断,但是这样的诊断依赖于医生的经验,不完全可靠。
而通过知识图谱技术,我们可以将医学相关的各种信息统一起来,生成一个知识图谱数据库,实现疾病数据标准化。
疾病咨询系统可以根据用户的输入从数据库中搜索相应的疾病信息,以此进行分类诊断或辅助诊断。
2. 药品治疗除了帮助医生进行疾病的诊断外,知识图谱技术还可以帮助医生进行药品治疗的选取。
医生根据病情开出的药方背后是非常丰富的知识体系,这些知识可以被记录下来,形成一个药物知识数据库。
通过知识图谱技术,可以将药品的化学成分、疗效、治疗范围、不良反应等信息进行标准化,并将其连接到实体、属性和关系三部分中去,实现药品数据的高效、一致性管理,减小由于人工处理产生的错误,增强了药品治疗的准确性和安全性。
知识图谱在医学领域的应用研究

知识图谱在医学领域的应用研究知识图谱是一种新兴的计算机图像技术,它可以将各种数据和信息联系起来,形成一个包括实体、属性和关系的语义网络。
在医学领域,知识图谱可以帮助医学工作者发现规律、解决问题以及为临床决策提供有力的支持。
本文将从知识图谱的原理和应用案例入手,探讨其在医学领域的应用研究。
一、知识图谱的原理知识图谱是通过将不同类型的实体和它们的属性和关系表示为图结构进行知识表示和推理的一种技术。
知识图谱可以将不同领域的信息整合在一起,例如疾病、药品、病人、医学概念等,从而可以帮助医生分析一些较为复杂的疾病情况,并给出更为准确的诊断结果。
其次,知识图谱所依赖的底层技术是自然语言处理技术和人工智能技术。
其中自然语言处理技术可以将医生和患者的信息转化为电子化的数据,而人工智能技术可以让电脑模拟医生的思维方式,从而建立医学知识图谱。
二、医学知识图谱案例知识图谱已经在医学领域得到越来越广泛的应用。
下面我们将介绍一些医学领域的知识图谱应用案例。
1.基于知识图谱的疾病诊断辅助系统该系统的目的是通过整合大量的临床数据,构建一个能够支持疾病诊断的知识图谱,并基于该图谱为医生提供决策支持。
该系统可自动化地从不同的数据源中获取和整合患者的病历信息和医疗数据,构建出一个包含疾病、药品、诊断标准和医学术语等元素的高度关联的知识图谱。
2.基于知识图谱的药品研发模型该系统基于药品知识图谱,利用深度学习技术,处理来自不同药物研究领域的文本,并使用各种药品之间现有的关系和规则,预测新药物可能的性能、副作用和安全性。
该系统可以为医学研究人员、生物制药公司和药品监管机构提供有力的支持。
3.基于知识图谱的癌症领域研究癌症是现代医学领域中致命的疾病之一。
知识图谱可以通过整合大量的疾病数据和基因数据,帮助癌症研究人员进行更为准确和高效的疾病研究,并且可以快速找到导致癌症发生和发展的关键因素,从而为临床治疗提供新的治疗方法和策略。
三、总结医学领域中的知识图谱技术已经得到了广泛的应用。
面向医药研发的知识图谱构建与应用研究

面向医药研发的知识图谱构建与应用研究随着信息技术的不断发展,知识图谱成为了当前智能应用和人工智能的研究热点之一。
它作为知识表达和知识处理的一种重要方式,正在被广泛应用于医药研发领域。
一、知识图谱概述知识图谱是指将具有语义关系的知识元素以图谱形式进行表示的一种技术。
知识元素包括实体、属性和关系三部分,其中实体指具有独立存在或在某种语境下有意义的事物;属性则是描述实体特征的属性值;关系则是连接实体之间关联性的一种关系类型。
通过知识图谱的搭建,可将复杂的知识体系结构化地表示出来。
二、医药研发中的知识图谱应用在医药研发中,知识图谱的应用主要包括以下几个方面:1. 新药研发新药研发过程是很复杂的,需要许多领域知识的综合使用。
知识图谱通过建立药物、疾病、基因等实体之间的关系,将关联的知识融合在一起,使得研发人员可以更加直观地了解药物的适应症、副作用等信息,也可以更好地探索药物研发的新方向。
2. 临床医学在临床医学领域,知识图谱的应用可以帮助医生更快速地获取病情的相关信息,并给出治疗方案。
通过构建知识图谱,我们可以将药物、疾病、症状、检查和治疗等实体信息进行关联,建立知识之间的语义关系,将临床医学领域的知识体系可视化、结构化,帮助医生做出更科学的诊疗决策。
3. 医药营销知识图谱在医药营销中也得到了广泛应用。
通过构建医药行业的知识图谱,我们可以了解不同种类药物的营销策略,帮助企业更好地进行市场调研。
同时,通过分析患者的病情以及不同医院之间的关系,我们也可以制定合适的销售策略,增加销售额。
三、知识图谱构建的挑战虽然知识图谱在医药研发中应用带来众多优势,但构建知识图谱仍然存在一些挑战。
1. 数据缺失数据缺失是知识图谱构建的一个重要问题。
在医药研发领域,数据量庞大,但可用的数据却十分有限。
因此,构建知识图谱需要先进行数据清洗和数据集成,建立统一的数据标准,并进行数据审核和验证。
2. 数据来源不一医药研发中数据来源不一,有些来自药企,有些来自医院,还有些来自科研机构。
知识图谱技术在医学领域中的应用

知识图谱技术在医学领域中的应用引言随着信息时代的到来,海量的医学数据不断增长,这给医学研究和临床实践提出了巨大的挑战。
知识图谱技术作为一种对数据进行存储、组织和分析的方法,为医学领域的研究人员和临床医生提供了宝贵的工具。
本文将介绍知识图谱技术在医学领域中的应用,并逐章进行详细讨论。
第一章:知识图谱技术概述1.1 知识图谱技术的定义和特点知识图谱技术是一种用于建模、组织和表示知识的方法。
它将知识以图的形式表示,其中图的节点表示实体或概念,边表示实体之间的关系。
知识图谱技术具有可扩展性、可视化、语义一致性和推理能力等特点,可以有效地存储和管理复杂的医学数据。
1.2 知识图谱技术与传统关系数据库的区别与传统的关系数据库相比,知识图谱技术具有更好的灵活性和可扩展性。
传统关系数据库需要预先定义数据库的结构,而知识图谱技术可以根据数据之间的关系动态地生成图。
此外,知识图谱技术还可以通过推理来发现数据之间的隐藏关系,而传统关系数据库则无法做到这一点。
第二章:知识图谱在医学知识管理中的应用2.1 医学知识的组织和分类医学领域的知识非常庞杂,包括疾病、症状、治疗方法等多个方面。
知识图谱技术可以将这些知识进行组织和分类,建立起一张包含医学知识的全局图谱。
这样一方面可以帮助医学研究人员更好地掌握和理解医学知识,另一方面也可以为临床医生提供个性化的诊疗建议。
2.2 知识图谱在疾病诊断中的应用疾病诊断是医学领域的核心任务之一。
传统的疾病诊断往往基于医生的经验和专业知识,容易出现主观性和片面性的问题。
知识图谱技术可以将大量的医学文献和临床案例进行结构化的存储和管理,为医生提供可靠的诊断依据。
此外,知识图谱技术还可以通过推理来发现疾病之间的关联性,进一步提升诊断的准确度和效率。
第三章:知识图谱在药物研发中的应用3.1 药物结构与活性关系的预测药物研发是一个漫长而复杂的过程,其中一个核心问题是药物分子的结构与活性之间的关系。
传统的药物研发往往基于试错的方法,效率低下且成本高昂。
知识图谱研究概况及其在中医药领域的应用

知识图谱研究概况及其在中医药领域的应用作者:李新龙刘岩何丽云刘保延张艳宏来源:《中国中医药信息》2017年第07期摘要:作为科学计量学和信息计量学的新发展方向,知识图谱技术已经广泛应用到金融、工业、医学等领域,成为真实世界研究中的热点问题。
本文就知识图谱的概念和特点、绘制流程、现有软件及其在中医药领域的应用现状、发展前景等进行文献梳理,以期为中医药领域知识图谱相关研究提供参考。
关键词:知识图谱;中医药;应用前景;综述DOI:10.3969/j.issn.1005-5304.2017.07.033中图分类号:R2-05 文献标识码:A 文章编号:1005-5304(2017)07-0129-04Abstract: As the new development of scientometrics and informetrics, knowledge graph has infiltrated into the financial, industrial and medical fields, and become a hot issue in the real world research. In this article, the concept and features of knowledge graph, construction and the existing softwares, the application status and development prospect in the TCM field were reviewed, which may provide references for research on the knowledge graph in the TCM field.Key words: knowledge graph; TCM; application prospect; review随着2012年谷歌第一版知识图谱的发布,特定领域的知识图谱构建成为真实世界研究中的热点问题。
知识图谱技术在医学中的应用

知识图谱技术在医学中的应用随着人们对医学知识需求的不断增加,医学科研也在不断发展,以满足医疗领域需求的知识图谱技术成为了医学界的重要研究方向。
简单来说,知识图谱是一种把实体、属性和它们之间的关系整合成一个知识网络的方法。
通过使用知识图谱技术,医学工作者可以从大量的数据中提取信息、获取分析结果、预测未来、制定治疗方案等。
在这篇文章中,我们将探讨知识图谱技术在医学中的应用。
1. 医学领域的大数据随着医学数据的不断增加,研究人员需要找到一种更好的方法来整合和分析这些数据以制定更准确、更精细的诊断和治疗方案。
知识图谱技术是一种旨在解决这一挑战的方法。
在医学领域,知识图谱涵盖了从世界各地收集的大量患者记录、药品和器械信息,到各种化学分子、基因和生物标志物的统计信息,都被有机而有序地整合到一个系统中。
这样一来,研究人员就能够确保他们所使用的信息是准确可靠的,并且通过研究这些信息所建立的知识图谱能够被有效地转化为临床实践中的实用性信息。
2. 医学知识图谱的构建要想构建一个医学知识图谱,需要进行大量的工作。
首先,需要将医学数据从各种来源整合起来,包括患者病历、影像学、生化检测和遗传学数据等。
之后,需要对这些数据进行分类和标记,使其可以被精确地关联起来,并建立知识图谱的节点。
最后,需要进行算法优化,以确保知识图谱的准确性和可靠性。
这些步骤都需要专业的团队进行科学研究和技术创新,从而构建一个高度可靠和实用的医学知识图谱。
3. 医学知识图谱的应用知识图谱技术的应用可以大大提高医生诊断和治疗的效率和精度。
基于知识图谱的医疗诊断工具可以对患者的致病原因进行深度分析和评估,从而更准确地制定个性化的治疗方案。
例如,医疗系统可以通过分析患者的基因信息,为患者推荐更合适的药物。
此外,知识图谱技术还可以帮助医生减少手工输入数据的时间,从而提高他们的工作效率。
它还可以对患者进行远程监测并提供有关康复进度的反馈,以便医生及时调整治疗方案。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
知识图谱研究概况及其在中医药领域的应用作为科学计量学和信息计量学的新发展方向,知识图谱技术已经广泛应用到金融、工业、医学等领域,成为真实世界研究中的热点问题。
本文就知识图谱的概念和特点、绘制流程、现有软件及其在中医药领域的应用现状、发展前景等进行文献梳理,以期为中医药领域知识图谱相关研究提供参考。
Abstract:As the new development of scientometrics and informetrics,knowledge graph has infiltrated into the financial,industrial and medical fields,and become a hot issue in the real world research. In this article,the concept and features of knowledge graph,construction and the existing softwares,the application status and development prospect in the TCM field were reviewed,which may provide references for research on the knowledge graph in the TCM field.Key words:knowledge graph;TCM;application prospect;review随着2012年谷歌第一版知识图谱的发布,特定领域的知识图谱构建成为真实世界研究中的热点问题。
从搜索引擎优化,到新药发现,知识图谱在学术界掀起了一股热潮,并渗透到金融、工业和医学等领域。
这种以科学学为基础,涉及应用数学、信息学及计算机学等多学科的可视化技术,成为科学计量学和信息计量学的新发展方向。
本文就知识图谱的概念、特点及其在中医药领域的应用现状、前景进行梳理,以期为中医药领域知识图谱相关研究提供参考。
1 知识图谱概念及特点1.1 知识图谱的概念在知识图谱的定义上,陈悦等[1-2]从其功能角度进行阐释,认为知识图谱能够可视化地描述人类随时间拥有的知识资源及其载体,绘制、挖掘、分析和显示科学技术知识以及它们之间的相互联系,在组织内创造知识共享的环境以促进科学技术研究的合作和深入。
杨国立等[3]从理论和方法层面,将其定义为把应用数学、计算机科学、科学学、信息科学等学科的理论和方法与科学计量学引文分析、共现分析、社会网络分析等方法结合,用可视化的图谱形象地揭示科学发展进程和结构关系的一种研究方法,属于科学计量学的范畴。
杨思洛等[4]提出知识图谱有广义与狭义之分,广义上可包括生物的基因图谱、教育教学中的认知地图、探索太空的天体图、描绘地形的地理信息系统(GIS)图、模拟人脑的神经网络图、各种金属图谱等;狭义的知识图谱主要是运用文献计量学方法,通过文献知识单元分析来可视化科学知识的结构、关系与演化过程,包括“科学图”“文献计量图”“文献图”“知识图谱”等。
简言之,知识图谱是随着计算机技术的发展,应用数学算法来简化知识单元结构以达到可视化知识结构关系的一种方法,是显示科学知识的发展进程与结构关系的一种图形,是一种有效的知识管理工具。
1.2 研究对象知识图谱所描绘的对象主要包括:①从事科学技术活动和作为知识载体的人,包括科学家、技术专家、项目组、实践团体或某一知识领域共同体;②显性或编码化的知识,如论文、专利、所学课程、数据库等;③过程或方法,包括研究问题和解决问题的过程或方法、组织的业务流程,以及相关的知识投入等。
知识图谱主要源于三大领域:①计算机科学领域的数据、信息、知识与知识域可视化研究;②图书情报领域的引文分析可视化、知识地图和知识网络等研究;③复杂网络系统和社会网络分析的研究。
上述领域的研究方向和内容正在走向融合[5]。
2 知识图谱绘制流程参考国内外已有研究,目前知识图谱的绘制主要包括以下几个版块[4,6-7]。
数据检索:绘制知识图谱的基础,其数据源在传统文献数据库的基础上逐渐扩展到出版商、机构联盟等机构网站的网络日志、用户记录、点击流数据等。
数据清洗:即对数据的预处理,包括查重、勘误等,进行历时或分时段对比分析时需要对数据進行分段处理;若样本数据过大或分析目的不同,则需要进行有代表性的抽取。
构建关系矩阵:选择要分析的知识单元,如关键词、题名、作者等,构建其相互关系,常用方法有共词分析、共引分析、共作者分析、书目耦合分析、期刊耦合分析等。
数据标准化:根据数据间的相似度对数据进行标准化,常用方法有集合论方法(Cosine、Pearson、Spearman、Ochiai、Jaccard指数等)和概率论方法(合力指数、概率亲和力指数等)。
数据简化:运用因子分析、多为尺度分析、自组织映射图、寻径网络图谱、聚类分析、潜在语义分析、三角法等方法处理数据以更好地展示各数据单元。
可视化展示:是知识图谱构建过程中最重要的一环,通过运用不同的算法,调整相关参数,构建整个图谱。
可通过不同模拟实现可视化,如几何图、战略图、冲积图、主题河图、地形图、星团图、簸幅图等。
图谱解读:采用历时分析、突变检测、空间分析、网络分析等方法对图谱进行解读,同时需要结合研究者的经验、知识、学术背景、学术功底等。
3 知识图谱绘制软件目前可用于知识图谱绘制的软件非常丰富,根据主要功能可分为2类[4]:一类为通用软件,如SPSS、社会网络分析软件Ucinet和Pajek、词频分析软件Wordsmith Tools和GIS相关软件;另一类为绘制知识图谱的专用软件,如CiteSpace、Bibexcel、Gephi、VOSviewer、VantagePoint、Network Workbench Tool、NWB、Sci2 Tool、In-SPRIE、SciMAT、Histcite、GeoTime、ColPalRed、Guess、Leydesdorff、Jigsaw、Carrot等。
分析各软件的特点[6,8-9]可以看出,随着知识图谱的绘制软件越来越多,一方面其支持的数据格式愈发多样,相互之间的兼容性也逐步增强;另一方面,在可视化效果方面也日趋完善,知识展示的真实度、准确度逐渐提高。
详见表1。
4 知识图谱在中医药领域的应用目前知识图谱的研究中,国外学者主要集中在2个研究方向[10]:部分偏于技术研究,包括可视化工具和算法的开发;部分以应用为主,利用科学计量学理论及相关方法、知识图谱软件等进行分析研究。
国内研究也可分为2个方向:部分以科学计量学为理论基础,利用可视化方法研究科学学与管理学、科学技术合作等领域;部分以电子资源数据库为数据源,通过可视化方式展示某一学科的研究前沿和发展动向。
4.1 应用现状医学领域各学科中采用知识图谱理论与方法进行的研究尚处于起步阶段,中医药领域已有部分学者开展了相关研究。
在学科层面,赵蓉英等[11]以Web of Science为数据来源,运用CiteSpace对中医研究领域的研究热点进行了可视化探索。
徐浩等[12]以我国医药卫生领域中文核心期刊文献为数据来源,对我国中医学科交叉领域的研究热点进行了可视化分析,但研究仅限于中医学与医药卫生领域之间的合作。
杨秦等[13]采用共词分析及社会网络方法对中医外科疮疡领域的研究主题及分布进行了探索。
具体在疾病方面,谭火媛等[14]基于中国知识资源总库(CNKI)收录的近10年中医药治疗高血压相关文献,对前沿与热点研究进行了可视化分析。
王淑斌等[15]对中西医治疗2型糖尿病的国内外研究进行了系统梳理。
在证候方面,刘俊丽等[16]采用文本挖掘技术,通过数据清洗、实体抽取、构建共词矩阵并采用Ucinet软件绘制乙型肝炎热点研究知识图谱,分析了子模块中的中医证候描述及疾病名称。
秦义等[17-18]基于CiteSpace软件对气虚证、血瘀证证候诊断标准的相关研究进行了可视化分析。
在中药材方面,郭栋等[19]通过关键词共现网络和聚类图对中药枸杞的育种、种植、采收、加工、储存等5个领域的研究进行了热点分析。
在治疗措施方面,李曌嫱等[20]对针灸治疗腰椎间盘突出症常用腧穴的演变过程及施穴治疗的变迁进行了可视化分析,胡松洁等[21]运用Ucinet软件对“五行音乐”疗法的发展脉络进行了梳理。
此外,张静[22]基于CNKI核心期刊文献关键词,探讨了中医药专业人才培养热点主题。
陈姗姗等[23]对中医药传播发展的研究文献进行了可视化分析,荣光等[24]基于中医电子病历研究领域的相关文献,构建了该领域的研究者、研究机构、关键词的共现网络。
上述研究主要集中在不同领域的研究现状及热点分析,多以期刊文献为数据来源,多采用CiteSpace软件构建研究者、研究机构、关键词等信息的共现图和聚类图,从不同侧面宏观解释了中医学信息的整体结构特点。
但针对特定研究目标,尚未形成一套明确的建模策略及技术,导致已有研究结果中也有差异甚至矛盾之处[5]。
因此,中医药领域知识图谱理论尚处在针对各学科结构宏观概述阶段,急需解决对多层信息深度整合的知识图谱建模策略及其技术。
近年来,已有学者在中医药知识图谱构建方法与标准化流程方面进行了尝试和探索。
于彤等[25]提出以中医药学语言系统(TCMLS)为框架,以中医药领域现有的术语和数据库资源为内容,构建大型知识图谱的构想,并进行了探索和实践,但尚未实现中医药知识资源的有效整合及提供全面、及时、可靠的知识服务。
阮彤等[26]基于文本抽取、关系数据转换及数据融合等技术提出了中医药知识问答和辅助开药领域的知识图谱半自动化构建流程。
此外,该课题组对知识图谱进行了形式化定义,详细描述了数据驱动的增量式知识图谱构建方法,同时阐述了以此方法所构建的中医药知识图谱在辅助开方领域的应用,但未涉及其它领域[27]。
贾李蓉等[28]以中药知识图谱为例,从数据来源、研究内容、图形化展示等方面探讨如何构建中医知识图谱,但其应用尚局限于浏览检索方面,对多种数据资源间的映射及数据元等标准未进行详细论述。
张德政等[29]提出了基于本体的中医核心知识图谱表示及其构建方法,对中医本体与知识图谱的映射方法进行了探索,为中医知识图谱的构建提供了较系统的方法流程,但对多源数据的获取技术及中医师临床实际诊疗数据的研究未进行深入研究。
王华珍等[30]以中医慢性胃炎数据可视化处理为例,引入随机森林(RF)技术进行可视化前的数据预处理,根据高维中医数据的特征进行变换和降维,使数据在低纬空间呈现良好的分离性,从而增强了数据的可视化效果。
4.2 应用前景知识图谱研究已经渗透到金融、医学和工业等领域,对知识图谱定量与定性特征的科学理解已成为大数据时代科学研究中一个极其重要的挑战性课题。