数据挖掘技术在中医药研究中的应用

合集下载

数据挖掘在中医学术流派研究中的应用

数据挖掘在中医学术流派研究中的应用
3 首都 医科 大学 附属北京 中医医 院 , 京 . 北 10 1 ) 0 0 0
摘 要 :在中医学术流派研究中 存在着大量的数据, 利用数据挖掘技术可以获得隐藏在这些数据中的有用信息。文章结
合赵炳南学术流 派研 究的实例 , 简要 阐述 了利用数据挖掘进行 中医学术流派研究 的可行性 和先进性 , 并提 出 了数 据挖掘 的实施 步骤和具体的工具 、 算法 。

相关 , 这在 国际国内均未见相应的科研报道 。 指导意义 , 有利于解决 医疗 纠纷 。 通过本课题 的研究 , 总结 出肛 管直肠 功能与疾病 本身 、 治疗 手段密切相关 , 多病 种、 大范围 的研究提供 了更科学 、 可靠的数 参 考文 献 : 更 据, 避免 了单个病种的研究对 肛肠科 临床 医生 的不利影 响 , 多种 [ 1] 黄乃健.肛肠解 剖学 [ . M] 济南 : 山东科学技术出版社 ,96: .4 19 18 . 手术方式的比较为 医生提供 了手术改进方式 的依据 , 并通 过科学 [ 张东铭. 2] 盆底与肛门病学 [ . M] 贵阳: 贵州科技出版社 ,00, ,7, 20 l l l 2 7 l 4. 8, 5, 6, 4 的数据进行评定 , 使其 量化 , 避免 了医生 对临床症状 的主观臆 测 [ 3] 张东铭.盆底与肛 门病学 [ . M] 贵阳: 贵州科技出版社,00:. 20 1 和患者的 自主描述形成的误 区, 肛管直肠功能的鉴定有 重要 的 对
◇学术探讨◇
数 据 挖 掘 在 中 医 学 术 流 派 研 究 中 的 应 用
谭 勇1 ,吕爱平 车念聪 诚 蔡念 宁 , , 2都 医科大学 中 医药学 院 , 北京 106 ; 009 2 中 国中医科学 院中 医临床 医学基础 研究所 , . 北京 10 0 ; 0 7 0

中医活血化瘀方数据库及其数据挖掘

中医活血化瘀方数据库及其数据挖掘

中医活血化瘀方数据库及其数据挖掘中医活血化瘀方是一种传统医学的疗法,广泛应用于临床治疗各种瘀血阻滞病症。

为了更好地传承和发扬中医活血化瘀方的宝贵经验,我们建立了中医活血化瘀方数据库,并运用数据挖掘技术对数据库中的信息进行分析和挖掘。

本文将详细介绍中医活血化瘀方数据库的建立、结构和内容,以及数据挖掘技术在其中的应用。

中医活血化瘀方数据库是一个包含大量中医活血化瘀方的信息平台。

我们通过广泛的文献搜集和整理,建立了这个数据库。

数据库包含了各种中医活血化瘀方的组成、功效、适应症和用法等信息。

我们还为每个活血化瘀方提供了详细描述和使用方法的文本。

用户可以通过简单的操作,对数据库中的信息进行搜索、浏览和下载。

在中医活血化瘀方数据库中,我们运用了多种数据挖掘技术对数据进行深入分析和挖掘。

我们使用文献检索技术,从大量的文献中提取出与中医活血化瘀方相关的信息。

然后,我们运用关系分析方法,对数据库中的数据进行分析,找出各种活血化瘀方之间的关联和规律。

我们对数据进行预处理,包括数据清洗、数据转化等步骤,以备后续的数据挖掘和模式识别。

为了验证中医活血化瘀方数据库的有效性和可行性,我们进行了一系列实验。

我们对数据库中的数据进行检索,比较不同检索词的准确率和召回率。

我们运用关联规则挖掘算法,找出数据库中各种活血化瘀方之间的关联规则。

通过实验,我们发现数据库中的数据质量较高,能够满足用户的需求。

同时,数据挖掘技术能够帮助我们更好地理解中医活血化瘀方的组方原则和作用机制。

中医活血化瘀方数据库的建立为中医活血化瘀方的传承和发展提供了重要的信息支持。

数据挖掘技术的应用可以帮助我们更好地理解数据库中的信息,发现其中的规律和特点。

我们的实验结果表明,中医活血化瘀方数据库及其数据挖掘技术对于临床应用、药物研发等领域具有重要的应用价值。

虽然我们已经取得了一定的成果,但中医活血化瘀方数据库及其数据挖掘技术还有许多需要进一步研究和改进的地方。

数据挖掘技术在中药属性关系中的应用研究

数据挖掘技术在中药属性关系中的应用研究
21 第 1 0 2年 0期 文 章 编 号 :0 62 7 (0 2 1 - 5 o 10 — 5 2 1 ) 00 0一 4 4 0
计 算 机 与 现 代 化 JS A J Y 1 N A H A IU N I U X A D I U
ቤተ መጻሕፍቲ ባይዱ
第 2 6期 0
数 据 挖 掘 技 术 在 中药 属 性 关 系 中 的应 用 研 究
3 oeeo omao c nea dT cnl y D nh aU i r t,Sa ga 2 12 ,C ia .C Ug f n r t nS i c n eho g , og u n esy hnh i 0 60 hn ) I f i e o v i
Absr c :Daa mi ig p o i e e h ia u p r f rt e mo e iain o rd t n lChn s d cn . T i p p r b i s t e ta t t n n rv d s tc n c ls p o o h d r z t ta i o a i e e me ii e t n o f i hs a e ul h d
2 D p rme to ce t c R s ac . e at n f i ni e e r h,He a i est fT a i o a Chn s d cn ,Zh n z o 5 0 0,C i a S i f n n Un v r i o rd t n 1 i e e Me ii e y i . e g h u4 0 0 hn ;
t c n l g fa s cain r l of d f q e ti ms t i e p o e t so h n s d cn .Th o g n x e i n s t i p — e h o o o s o i t u e t n e u n t es n t rp ri f ie e me ii e y o i r e h e C r u h ma y e p r me t , h s a p rb i s te c o ey r lt n h p o e u n t ms t n f n t n p a a oo y,f t n i d c t n,fn t a w s r d cn e u l h ls l ea i s i ff q e ti d o r e es i u c i — h r c lg l o m mc i ・n i ai o o o c i — e t n me ii e o e n me h r c lg —n i ain,p ama o o — se dcn a ,ec a ,p ama oo i d c t y o h r c l g we t r me ii e n me t ,w i h p o i e v u be i fr ai n fr f d n h y n h c r vd a a l no l m t o n ig te o i rl t n h p b t e n te p o e is o i e e me ii e ea i s i ew e h r p r e f o t Ch n s d c n . Ke r s aa mi i g s o it n n l ;p o e is o h n s d cn ;f q e ti ms t y wo d :d t n n ;a s cai I o e r p r e c ie e me ii e r u n t es t f e e

数据挖掘方法在中医医案研究中的应用

数据挖掘方法在中医医案研究中的应用

数据挖掘方法在中医医案研究中的应用作者:王康尹玉洁李雅文秘红英李红蓉贾振华来源:《世界中医药》2021年第11期摘要中医医案作为中医诊疗经验及学术观点的载体,历来是中医传承研究的重中之重。

传统的“个人领悟式”方法在分析医案时难以避免存在片面性和主观性。

因此,寻找一种可以全面、客观地反映医案中隐藏信息的医案研究方法就显得尤为重要。

近些年随着信息技术的飞速发展,数据挖掘技术在医案研究中的应用也日益深入。

现通过对目前医案研究领域常用的数据挖掘方法、软件及平台的应用现状进行梳理,并对每种方法在医案研究中的适用领域进行简要评述,以期为医案研究者选择合适的研究方法提供参考,为传承医案中蕴含的诊疗经验及发展中医药事业提供新思路。

关键词中医医案;中医诊疗经验;数据挖掘;统计学方法Abstract As the carrier of experience of traditional Chinese medicine(TCM) diagnosis and treatment and academic viewpoints,medical records of TCM have always been the most priority in TCM inheritance and research.The traditional comprehension-based analysis method is hard to avoid partial face and subjectivity in the analysis of medical records.Therefore,it is important to find a method of medical records research that can comprehensively and objectively reflect the hidden information in medical records.With the rapid development of information technology in recent years,the application of data mining technology in medical records research is increasingly in-depth.The author analyzes the application status of data mining methods,software and platform commonly used in the field of medical records research,briefly reviews the application of each method in medical records research,in order to provide a reference for medical records researchers to choose the appropriate methods,and provide methods to inherit the experience of diagnosis and treatment hidden in medical records of TCM and provide ideas to develop TCM.Keywords Medical records of traditional Chinese medicine; Experience of traditional Chinese medicine diagnosis and treatment; Data mining; Statistical method中圖分类号:R242;R249文献标识码:Adoi:10.3969/j.issn.1673-7202.2021.11.003中医医案,又称病案、诊籍、方案、脉案等,是记录中医医家临床辨证、立法、处方用药的第一手资料[1]。

中医药综合统计体系构建及其数字化关键技术应用研究

中医药综合统计体系构建及其数字化关键技术应用研究

中医药综合统计体系构建及其数字化关键技术应用研究中医药综合统计体系构建及其数字化关键技术应用是在中医药领域中进行统计分析的一个重要研究方向。

该研究旨在通过收集、整理和分析中医药相关数据,构建一个综合的统计体系,从而为中医药领域的决策制定和科学研究提供支持。

中医药综合统计体系的构建需要涉及多方面的数据收集和整理工作。

首先,需要收集中医药领域各个方面的数据,包括中医医院的患者病例数据、中药材的产量和销售情况、中药制剂的生产和分销情况等。

然后,通过对这些数据的整理和标准化处理,建立一个统一的数据存储和管理系统。

最后,通过数据挖掘和统计分析的方法,对这些数据进行分析,提取有用的信息和知识。

在中医药综合统计体系的数字化关键技术应用方面,主要包括以下几个方面:1. 数据采集技术:通过使用各种传感器和监测设备,可以实时采集中医药领域的相关数据。

例如,利用传感器对中药材种植过程中的温度、湿度和光照等环境参数进行监测,可以获取更准确的中药材产量和质量数据。

2. 数据存储和管理技术:通过建立一个统一的数据存储和管理系统,可以方便地存储和管理中医药领域的各种数据。

同时,采用数据标准化和元数据管理的技术,可以提高数据的可维护性和可重用性。

3. 数据挖掘和分析技术:通过使用数据挖掘和统计分析的方法,可以对中医药领域的数据进行深入挖掘和分析,从而找到其中的规律和关联性。

例如,通过对患者病例数据的分析,可以发现某些中药方剂的疗效和适应症。

4. 可视化技术:通过使用可视化技术,可以将统计分析的结果以图表、图像或动画的形式展示出来,使得研究人员和决策者更容易理解和利用。

例如,可以利用地图和热力图等可视化技术,展示中药材的产地和产量分布情况。

综上所述,中医药综合统计体系的构建及其数字化关键技术应用研究对于推动中医药领域的发展具有重要意义,可以为中医药的疗效评价、临床决策制定和政策规划提供有效的支持。

中医信息学在中药药效中的应用探讨

中医信息学在中药药效中的应用探讨

中医信息学在中药药效中的应用探讨中医信息学是一门融合了中医学、信息科学和现代技术的交叉学科,它旨在通过对中医理论、临床实践和中药研究中的信息进行采集、整理、分析和挖掘,为中医药的发展提供新的思路和方法。

在中药药效的研究中,中医信息学发挥着越来越重要的作用,为中药的合理应用和新药研发提供了有力的支持。

一、中医信息学的概念和特点中医信息学是运用信息学的理论和方法,对中医领域中的数据、知识和信息进行处理和分析的学科。

它涵盖了中医文献的数字化、中医临床数据的采集与分析、中药方剂的信息化管理以及中医诊断和治疗的模型构建等多个方面。

中医信息学具有以下特点:1、多学科交叉:融合了中医学、信息科学、统计学、数学等多个学科的知识和方法。

2、数据量大:中医领域积累了丰富的文献、临床数据和实验数据,需要进行有效的管理和分析。

3、知识复杂:中医理论包含了阴阳五行、脏腑经络、气血津液等复杂的概念和关系,需要借助信息学手段进行清晰的表达和理解。

二、中药药效研究的现状与挑战中药药效的研究一直是中医药领域的重点和难点。

传统的中药药效研究主要依赖于动物实验和临床试验,但这些方法存在着周期长、成本高、样本量有限等问题。

此外,中药的化学成分复杂,作用机制多样,单一的研究方法往往难以全面揭示其药效。

随着现代科学技术的发展,新的研究方法和技术不断涌现,如基因组学、蛋白质组学、代谢组学等,但这些方法在中药药效研究中的应用还面临着诸多挑战,如数据整合困难、生物标志物的筛选和验证等。

三、中医信息学在中药药效研究中的应用1、中药数据库的建立建立完善的中药数据库是中药药效研究的基础。

这些数据库包括中药化学成分数据库、中药药理作用数据库、中药临床应用数据库等。

通过对这些数据库的整合和分析,可以为中药药效的研究提供丰富的信息资源。

例如,通过对中药化学成分数据库的分析,可以了解不同中药中所含的化学成分及其结构特点;通过对中药药理作用数据库的查询,可以获取中药在不同疾病模型中的作用效果和机制;通过对中药临床应用数据库的研究,可以总结中药在临床治疗中的经验和规律。

基于数据挖掘的石纯农伤科医案治疗伤筋疾病用药规律研究

基于数据挖掘的石纯农伤科医案治疗伤筋疾病用药规律研究

基于数据挖掘的石纯农伤科医案治疗伤筋疾病用药规律研究引言随着医疗技术的不断进步,数据挖掘技术在医学领域的应用越来越广泛。

石纯农伤科是我国传统医学中的一个重要学科,其治疗伤筋疾病的经验丰富而深厚。

本文旨在利用数据挖掘技术分析石纯农伤科医案,挖掘出治疗伤筋疾病的用药规律,从而为临床提供参考和指导。

一、石纯农伤科概述石纯,字季喉,号农伤,江苏人,明朝中期医学家。

他精通伤科、内科、外科、妇科、儿科等诸多学科,尤其以伤科见长。

石纯的《农伤科》一书是我国古代伤科医书中的经典之作,至今仍为临床医生所借鉴。

石纯在治疗伤筋疾病方面有着丰富的经验和独特的见解,他的医案中蕴含着许多宝贵的治疗经验。

二、数据挖掘在中医医案研究中的应用数据挖掘是指从大量数据中自动或半自动地发现规律、模式和知识的过程。

在医学领域,数据挖掘技术能够帮助医生发现病因、药效、病例分布规律等,从而提高临床诊疗水平。

在中医医案研究中,数据挖掘技术可以运用于各种研究,如药物组方规律分析、病证相关性研究、辨证规律挖掘等。

三、研究方法本研究选取石纯农伤科医案中的伤筋疾病治疗案例作为研究对象,采用数据挖掘技术对这些医案进行分析。

我们从古医书中整理筛选出了1000余例伤筋疾病的医案,包括跌打损伤、骨折脱臼、筋伤肌肉等病症。

然后利用数据挖掘软件对这些医案进行整理和分析,包括药物组方规律、病证相关性、辨证规律等方面的挖掘。

四、研究结果经过数据挖掘分析,我们发现了石纯农伤科医案中治疗伤筋疾病的用药规律。

石纯在治疗伤筋疾病时较为注重用药的温通活血和活络止痛的作用,常用的药物包括当归、川芎、独活、桂枝等。

在伤筋疾病的治疗中,石纯还注重辨证施治,根据病情的轻重缓急,采用不同的药物组合,如用于痹证的常见药物有细辛、木通、川乌等;用于寒湿痹痹证的常用药物有甘遂、独活、肉桂等。

石纯还注重辨证用药,选用具有不同功效的药物进行组合,以获得更好的疗效。

五、研究意义本研究通过对石纯农伤科医案的数据挖掘分析,系统地总结出了治疗伤筋疾病的用药规律。

中医信息学在中医药产品研发中有哪些应用

中医信息学在中医药产品研发中有哪些应用

中医信息学在中医药产品研发中有哪些应用中医信息学在中医药产品研发中的应用在当今科技飞速发展的时代,中医信息学作为一门交叉学科,正逐渐展现出其在中医药产品研发中的重要作用。

中医信息学是将信息技术应用于中医药领域,对中医相关的数据、知识和信息进行获取、处理、分析和利用的学科。

它融合了计算机科学、数学、统计学、信息科学等多学科的方法和技术,为中医药产品的研发提供了新的思路和方法。

一、中医信息学在中药研发中的应用1、中药资源信息管理中药资源丰富多样,但分布不均,且面临着资源短缺、质量参差不齐等问题。

中医信息学可以建立中药资源数据库,对中药的产地、种类、生态环境、采收时间等信息进行收集、整理和分析,为合理开发和利用中药资源提供科学依据。

2、中药化学成分分析利用现代分析技术,如色谱、质谱等,可以获取中药中化学成分的信息。

通过中医信息学的方法,对这些大量的化学数据进行处理和分析,筛选出具有活性的成分,为新药的研发提供先导化合物。

3、中药方剂的优化中医方剂是中医治疗疾病的重要手段。

通过对大量古代医籍和临床经验方剂的数字化整理,运用数据挖掘技术,可以发现方剂中药物的配伍规律、用量关系等。

在此基础上,结合现代药理研究成果,对传统方剂进行优化和创新,开发出更有效的中药复方制剂。

二、中医信息学在中医诊断技术研发中的应用1、中医脉象诊断的信息化脉象是中医诊断的重要依据之一。

利用传感器技术和信号处理方法,可以将脉象转化为数字化的信号,通过对这些信号的分析和处理,提取脉象的特征参数,建立脉象诊断模型。

这有助于实现脉象诊断的客观化和标准化,提高诊断的准确性。

2、舌象诊断的信息化舌象也是中医诊断的重要内容。

通过图像采集技术获取舌象图像,运用图像处理和模式识别技术,对舌象的颜色、形态、纹理等特征进行分析,为中医诊断提供辅助支持。

3、中医证候诊断模型的建立中医证候是对疾病状态的综合描述。

运用中医信息学方法,对临床病例中的症状、体征、实验室检查等数据进行整合和分析,建立证候诊断模型。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

随着医学机构积累的数据越来越多,促进了医学信息包括中医药信息的数字化;如何利用海量信息为防控疾病提供科学依据,总结优化各种诊治方案,已引起业内专家的高度关注。于是数据挖掘技术在中医药研究被日益重视,它将有力促进中医药的现代化进程。 1 数据挖掘的概念、步骤及常用方法 1.1 数据挖掘概念、步骤 数据挖掘(Data mining,DM)即数据库中的知识发现,是从大型数据库的海量数据中提取人们感兴趣的知识,这些知识是隐藏的、事先未知的、潜在有用的信息,挖掘的知识表现为概念、规则、规律、模式等形式[1]。数据挖掘的目的在于使用所发现的模式帮助解释当前的行为或预测未来的结果[2]。挖掘步骤大致有:问题定义、数据提取、数据预处理、数据挖掘、知识评估、结果应用这六步。 1.2 数据挖掘常用方法 1.2.1 描述统计 数据总结的目的是对数据进行从低层次抽象、浓缩到高层次,得出它的紧凑描述。最简单的数据总结方法是描述统计,它包括平均数、中位数、分位数等,它常和统计图配合应用。 1.2.2 关联规则 关联规则从本质上讲是条件概率,即当A发生时、B同时出现的概率有多大?只要B离50%较远就有意义。数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联包括简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时我们并不知道数据库中数据的关联函数,即使知道也不确定。因此关联分析生成的规则带有可信度。 1.2.3 分类和聚类 这是最常用的技术。分类方法主要有:回归、决策树、神经网络。分类分析在数据挖掘中是一项重要任务。分类器的构造方法有统计方法、机器学习方法、神经网络方法等。聚类是根据事物本身潜在的特性研究对象分类的方法。通过聚类把一个数据集合中的个体按照相似性归成若干类别,使其“物以类聚”,将数据库中的记录划分为一系列有意义的子集。聚类要解决的就是实现满足这种要求的类的聚合。在进行聚类前,这些类别是潜在的,可分割的类的个数(聚类数)也是未知的。聚类大致分为统计方法、机器学习方法、神经网络方法和面向数据库的方法等。 1.2.4 偏差检测 数据库中的数据可能有一些异常记录,检测这些偏差很有意义。偏差检测的基本方法是寻找观测结果与参照值之间有意义的差别。 2 中医病历中医学数据挖掘的特点 目前中医病历中采集的中医学信息具有如下特点。 2.1 症状的模糊性 中医学对疾病的诊断是通过望、闻、问、切的四诊合参,获取有用信息,再结合医生的经验,对疾病做出诊断。症状的模糊性不仅表现在获得信息的形式多样,而且因中医症状存在着一症多名,或多症一名的现象,因此不同医生即使对同样的症状,可能会用不同的文字加以描述,比如对“患者不欲进食”的记录,可能会有纳差、食欲不振、纳呆等的不同。这种模糊性模式加大了中医学数据挖掘的难度。[!--empirenews.page--] 2.2 症状的不完整性 病例和病案的有限性使医学数据库不可能对任何一种疾病信息都能全面地反映出来,表现为医学信息的不完全性。同时,许多医学信息的表达、记录本身就具有不确定和模糊性的特点[3],这方面在中医症状未做出标准量化方法并推行应用之前,尤为突出。疾病信息体现的客观不完整和描述疾病的主观不确切,形成了中医病历中医学信息的不完整性。2.3 证候的复杂性 著名的王永炎院士指出了证候具有动态时空、内实外虚、多维界面的特点,简明扼要的描述了证候的复杂性。中医证候的复杂性给数据挖掘增加了难度,但这也恰好是数据挖掘发挥效力的用武之地。 2.4 治疗信息的个体化特性 中医治病之本是辨证论治,体现在“三因治宜”、“同病异治、异病同治”等方面。即使针对同一疾病相同的证,医生的处方用药也可能会有差异。这种个体化的治疗,充分体现了中医治病的精髓,而其中所蕴涵的深奥哲理和规律,用一般的研究方法难以全面发掘。数据挖掘在这方面很可能会有很高的应用价值。 2.5 挖掘过程的复杂性 中医药领域中的数据属性有离散型的,也有连续型和混合型的,对这些数据的噪声处理等预处理相当复杂,挖掘过程还需要人机交互、多次反复,其中任何一个环节都不能缺少专业人员。只有靠中医药专家的引导,针对具体问题,选择合理的挖掘方法,才能挖掘出真正有价值的知识。 在中医学数据挖掘中,应针对上述数据特点和挖掘目标,结合运用不同的挖掘方法,对非线性、不完全的信息进行智能处理,发挥各自的技术及其整合优势。 3 数据挖掘在中医药研究中的应用 近年来,数据挖掘技术在中医药研究中已得到应用。有学者认为中医药数据挖掘是中医药现代化研究的重要组成部分[4]。 3.1 中医药信息化研究 姚氏等[5]综合文献指出对中医药理论和实践进行信息化、数字化、知识化,能够克服中医名词术语过于繁杂造成的中医发展障碍,对于中医药信息进行文本数据挖掘是促进中医药信息结构化的途径之一,该问题的解决,能极大促进中医药现代化发展的进程。 3.2 中药研究 陈凯先等[6]认为对大量中药化学成分进行药效基团的建模研究,并对中药化学成分数据库进行柔性搜索,能够为更充分利用中药化学成分所含的化学信息提供技术支持。冯雪松等[7]对中药指纹图谱的特点及数据挖掘技术在其中的应用做了综述,指出中药指纹图谱由于反映了药用植物的“共有特征”,又由于地域、生长环境、采收等多种因素影响,具有统计数学中多元随机分布的“模糊性”,利用模糊数学、统计学、计算机技术等建立一种同时反应这两种特征数据库,存储中药指纹图谱信息,应用数据挖掘技术发现和解析其中潜在的信息,以评价和控制中药质量及研究中药定量组效关系。 3.3 方剂研究 乔延江等[4]综述了KDD在中药研究开发中的意义。乔氏等认为中药(复方)的KDD研究是在中医理论指导下,以数据挖掘技术作为知识发现的主要环节,对中药研发、设计、中医组方理论及规律、中药作用机制、构效关系、中药药效集团群的确认、化学成分及药理指标的预测等进行多方位、多学科、系统的现代化研究,是一个高度复杂的系统。其目的是建立传统中医理论同现代中药的科学化、系统化、可描述化的关系,是中医药现代化的重要组成部分。杨林等[8]阐述了数据库技术与Web结合实现网上中医方剂的信息挖掘。将方剂文献资料进行全方位解析,设计内容详细的数据库与Web技术结合,通过Internet开发了网上中医方剂信息分析处理系统,选择支持Web-DB的ORACLE数据库管理系统作为系统开发和运行平台。经过数据预处理、选择和筛选数据、确定分析目标、信息挖掘结果显示等阶段,完成对一批方剂数据的信息挖掘。姚美村等[9]应用数据挖掘技术对治疗消渴病的中药复方配伍的内涵进行探索性研究。以文献收录的106个治疗消渴病的中药复方为对象,经解析后建立复方特征数据库;以数据挖掘系统Enterprise Miner为平台,在单味药层次上进行消渴病复方组成药味之间的关联规则分析研究,结果显示单味药、两味药组合、三味药组合的应用规律与历代中医在消渴病治疗用药方面的论述一致。挖掘结果的可信度可达到或接近中医专家的分析能力。秦首科等[10]在构建方剂、中药和病症数据仓库的基础上,通过对数据仓库内部各种关联和映射关系的定义,利用中药和病症数据仓库的联机分析功能,探讨了方剂和其针对症状之间的联系。蒋永光等[11]对从《中医大辞典·方剂分册》中筛选出1355首脾胃方中的414种药物,经用聚类分析、对应分析和频繁集方法,从功效、归经、药性和药味等方面进行了分类特征分析,并就脾胃方的核心药物、方[!--empirenews.page--][1][2]下一页 剂结构、“药对药”组和“方药证”的对应关联方面形成了有关技术规则和处理程序。 3.4 中医证候研究 张世筠等[12]应用流行病学和变量聚类分析的数理统计方法,对2442例中医肝证患者进行了初步研究。由调查组采集核对中医四诊资料,按肝证辨证记分标准记分,分为11个证型。经过聚类分为实证、风证、虚证3类,解决了中医各肝证的归属问题,本研究还定量地阐明肝的实证、虚证、风证的相互关系。白云静等[13]在充分阐释证候系统的非线性、复杂性特征的基础上,探析了人工神经网络方法用于证候研究的可行性,并介绍了基于人工神经网络的证候研究方法。徐蕾等[14]采用boot strap方法对406例样本进行扩增以满足数据挖掘对样本量的要求,采用基于信息熵的决策树C4.5算法建立中医辨证模型。通过决策树C4.5算法筛选出对辨证分型有意义的26个因素,按其重要程度排序;产生出清楚易懂可用于分类的决策规则,建立辨证模型,模型分类符合率为:训练集83.6%,验证集80.67%,测试集81.25%;模型区分各类证型的灵敏度和特异度也较高。认为决策树C4.5算法建立的模型效果较好,可用于慢性胃炎中医证型的鉴别诊断。吴斌[15]等探讨了肾阳虚证的辨证因子分布规律。以肾阳虚证量表为基础,从定性、定量角度收集资料。以定性评分计算各辨证因子的出现频率,用定量评分进行分层聚类分析。发现:畏寒、肢冷、夜尿、腰背发冷等辨证因子出现频率高,聚类分析提示肾阳虚主证、舌象、脉象分布较有规律。认为根据数理统计结果对肾阳虚证的辨证因子进行初筛,为肾阳虚证的量化研究奠定了基础。 4 小结与展望 利用数据挖掘技术探求中医药诊治疾病的规律,形成用数字描述和表达的中医药内容,能有力推动中医药研究的规范化进程。但由于中医药信息的复杂性和特殊性,中医药数据挖掘在挖掘对象的广泛性、挖掘算法的高效性和鲁棒性、提供知识或决策的准确性方面有更高的要求。目前中医药数据库资源已较丰富。数据挖掘技术将成为中医药现代化的重要组成部分。但从目前应用数据挖掘技术进行的中医药研究来看,中医数据挖掘尚处于起步阶段,多数是对古文献数据的整理挖掘,缺乏用于探求中医诊治疾病规律和复方用药规律的研究。这可能与中医数据的复杂性所致的数据预处理繁琐有关;如能通过建立结构化数据库,采用结构化的临床信息采集系统收集数据,将能提高中医学数据挖掘的效率及可信度。有助于发现中医的诊治规律,并创新诊治模式,提高诊疗与科研教学水平。

相关文档
最新文档