中医药信息数据的挖掘
中医药与大数据

中医药与大数据一、背景介绍中医药作为中国传统医学的重要组成部分,拥有悠久的历史和丰富的经验。
随着大数据技术的发展和应用,中医药领域也开始探索如何将大数据与中医药相结合,以提高中医药的疗效和推动中医药的发展。
本文将从以下几个方面进行详细介绍。
二、中医药大数据的概念和意义1. 中医药大数据的概念中医药大数据是指通过采集、整理和分析大量的中医药相关数据,挖掘其中的规律和价值,为中医药研究和临床实践提供支持和指导的一种技术手段。
2. 中医药大数据的意义- 提供丰富的病例数据:通过收集和整理大量的中医药病例数据,可以为中医药的研究和临床实践提供丰富的数据资源。
- 挖掘中医药规律:利用大数据技术,可以从海量的中医药数据中挖掘出中医药的规律和特点,为中医药的理论研究提供支持。
- 个性化中医药治疗:通过分析患者的病历和生理数据,结合中医药的经典理论,可以为患者提供个性化的中医药治疗方案,提高治疗效果。
三、中医药大数据的应用1. 中医药疾病预测通过分析大量的中医药病例数据和相关的生理指标数据,可以建立预测模型,预测患者患某种疾病的概率,并提前采取相应的预防措施。
2. 中医药药效评估利用大数据技术,结合临床试验数据和患者反馈数据,可以对中药的药效进行评估,为中药的研发和应用提供科学依据。
3. 中医药临床决策支持通过分析大量的中医药病例数据和临床指南,可以为医生提供中医药临床决策的支持,帮助医生做出更准确的诊断和治疗方案。
4. 中医药药物安全监测利用大数据技术,可以对中药的药物安全性进行监测和评估,提前发现和预防药物的不良反应和药物相互作用。
四、中医药大数据的挑战和未来发展方向1. 数据质量问题中医药大数据的质量直接影响到分析结果的准确性和可靠性,因此如何保证数据的质量是一个重要的挑战。
2. 数据隐私和安全问题中医药病例数据涉及患者的隐私,如何保护数据的隐私和安全是一个重要的问题。
3. 数据标准化问题中医药病例数据的标准化程度较低,不同医院和医生的记录方式不一致,如何进行数据的标准化是一个重要的挑战。
中医病证规律下的数据挖掘论文

中医病证规律下的数据挖掘论文1数据挖掘技术在中医病证规律研究中的应用数据挖掘技术已广泛应用于中医病证规律研究领域,其基本流程为针对所研究疾病或证候整理相关文献资料,搜集具备中医诊疗信息、处方信息的海量数据,使用数据挖掘技术相关算法及其程序系统实行数据分析[5],总结该病或该证候的核心理论、诊疗方法及特色方药,提炼具有中医特色的个性化诊疗方案。
因为疾病及中医证候种类繁多,作者通过中国知网信息检索平台,搜索关键词“数据挖掘”,查找并学习2010—2014年相关期刊文献,汇总中医病证诊疗方面的数据挖掘技术的应用成果,旨在为内、外、妇、儿等常见学科疾病的临床诊疗提供参考。
1.1内科疾病在心血管疾病方面,杨静等对冠心病的证候用药规律实行数据挖掘,结果显示冠心病以气虚血瘀证多见,另有心血瘀阻证、气阴两虚证,丹参、黄芪、葛根等为核心用药。
崔松等通过挖掘何立人治疗心悸的用药分析,总结其治疗心悸的基本方,归纳出以心悸为主重用淮小麦,以心律失常为主重用生黄芪等因症施药的特点。
赵健等通过对严季澜辨治的109例高血压病患者用方数据实行挖掘,总结出严季澜自拟调肝理血汤的用方要点与学术思想。
在消化系统疾病方面,王萍等挖掘整理了唐旭东治疗慢性萎缩性胃炎的辨证证型及用药规律。
Liu等[10]应用支持向量机技术研究中医舌诊舌象在胆囊炎患者中的分类,为数字化辨病辨证提供了可靠依据。
吴嘉瑞等[11]应用关联规则和复杂系统熵探索颜正华治疗泄泻用药经验。
杜斌等通过检索现代治疗溃疡性结肠炎的文献,挖掘出常用灌肠方药及药对。
在肾病及内分泌疾病方面,展俊平等[13]采用文本挖掘技术对慢性肾小球肾炎的证治方药规律实行总结分析,发现该病证候以气阴两虚、肝肾阴虚、脾肾阳虚为主,核心治法以益气养阴、化湿利水为主。
凌颖茹等挖掘了黄春林治疗肾病综合征的方药使用经验。
霍保民等[总结了戴希文教授分期诊疗慢性肾脏病的辨证及用药规律。
袁敏探析魏子孝教授诊治糖尿病善补气、活血的用药特点。
中医药信息学就业方向

中医药信息学就业方向
中医药信息学是将中医药知识与信息学技术相结合,应用于中医药领域的学科。
中医药信息学的就业方向包括但不限于:
1. 中医药信息系统开发:参与中医药信息系统的设计、开发和维护工作,包括中医药诊疗系统、中药资源数据库、中医药病案管理系统等。
2. 中医药数据挖掘与分析:利用信息学技术对中医药相关数据进行挖掘和分析,研究中医药的特点和规律,提供科学依据和决策支持。
3. 中医药人工智能研究与应用:结合人工智能技术,开展中医药数据分析、辅助诊断和治疗方案的智能化研究和应用,提高中医药的临床效果和治疗水平。
4. 中医药健康管理与服务:运用信息技术手段,设计和开发中医药健康管理平台、移动健康应用等,为人们提供中医药健康管理服务和指导。
5. 中医药教育与研究:参与中医药教育和科研工作,开展中医药教材和教学资源的开发、中医药临床研究等工作。
6. 中医药信息安全管理:负责中医药信息系统的安全管理、网络安全防护和数据隐私保护等工作。
7. 中医药大数据分析与应用:应用大数据分析技术,对中医药
相关的大规模数据进行整理、分析和应用,为中医药研究和临床实践提供支持。
总之,中医药信息学就业方向涵盖了中医药信息系统开发、数据挖掘与分析、人工智能应用、健康管理与服务、教育与研究、信息安全管理和大数据分析等多个领域,毕业生可根据自身兴趣和专业背景选择适合的就业方向。
数据挖掘及其在中医药现代化研究中的应用

数据挖掘及其在中医药现代化研究中的应用一、本文概述随着信息技术的快速发展,数据挖掘作为一种高效的信息处理技术,已经在各个领域展现出其独特的优势。
在中医药现代化研究领域,数据挖掘技术的运用更是为传统中医药的现代化发展提供了新的视角和工具。
本文旨在探讨数据挖掘技术在中医药现代化研究中的应用,以期推动中医药领域的科技进步和创新发展。
本文将首先介绍数据挖掘技术的基本概念、原理和方法,然后重点分析数据挖掘技术在中医药现代化研究中的应用案例和效果。
我们将从中药材的种植、采摘、炮制、配伍、药效评价等多个环节入手,详细阐述数据挖掘技术在这些方面的具体应用,以及所带来的实际效果和潜在价值。
本文还将对数据挖掘技术在中医药现代化研究中面临的挑战和问题进行深入探讨,包括数据挖掘技术的局限性、中医药数据的复杂性、数据挖掘与中医药知识的融合等问题。
通过这些问题的分析,我们希望能够为数据挖掘技术在中医药现代化研究中的进一步应用提供有益的思考和建议。
本文旨在全面、系统地探讨数据挖掘技术在中医药现代化研究中的应用,以期为中医药领域的科技进步和创新发展贡献一份力量。
二、数据挖掘技术概述数据挖掘(Data Mining)是一门新兴的交叉学科,它融合了数据库技术、机器学习、统计学等多个学科的理论和方法。
数据挖掘的主要目的是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识。
这些信息和知识可以表示为概念、规则、规律、模式等形式,它们可以用于决策支持、过程控制、信息查询、科学研究等多个领域。
数据挖掘的过程通常包括数据预处理、数据挖掘、结果解释和评估等步骤。
数据预处理是对原始数据进行清洗、转换和整合的过程,以消除噪声、处理缺失值、标准化数据等,使得数据更适合于挖掘。
数据挖掘阶段则利用各种算法和工具,如聚类分析、决策树、神经网络、关联规则挖掘等,来发现数据中的模式和关联。
数据挖掘在中医药领域应用研究进展

数据挖掘在中医药领域应用研究进展标签:数据挖掘;中医药;应用研究;综述数据挖掘是指从大量数据中提取或挖掘有效、新颖、有潜在应用价值和最终可理解的模式、知识,其涉及多学科技术集成,包括数据库和数据仓库技术、统计学、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索、图像处理以及空间或时间数据分析等。
数据挖掘技术在中医药研究领域得到广泛应用,兹将近年来研究进展作一综述。
1 中医药文献数据挖掘中医药文献数据来源主要包括中医药古典、名家医案、验方验案、书刊述评、期刊文献、中药词典等。
数据挖掘技术对这些数据整理挖掘,重新展现及总结名家学术思想、辨证论治、中药选材、中药炮制、中药制剂、用药规律等成果,对传承、借鉴与发展起到重要作用。
中医药数据具有非线性、模糊性、复杂性、非定量等特征,针对具体的中医药数据和不同的挖掘目标,往往要将几种方法融合起来应用,以发挥各自的技术优势,或引进其他学科方法共同解决一些问题,其中关联规则、频数分析、聚类、文本挖掘等为常用方法。
中医药文献数据研究,要求数据来源、文献纳入标准、排除标准、文献规范原则、证候名称规范、症状名称规范、中药名称规范、计量标准规范等进一步加强与完善,数据获取、保存、抽取等预处理及数据挖掘技术的运用也有待更科学深入。
1.1 关联规则郭氏等[1]采用关联规则分析方法分析了古医籍中治疗带下病的用药规律,发现明清时期治疗带下病的方药以健脾祛湿药物为最常用结构,其中又配伍一些专属度比较高的特色药物,如收涩止带药、补肾药、清热燥湿药等。
1.2 频数分析吴氏等[2]检索中国期刊全文数据库等1991-2011年发表的有关围绝经期综合征文献,进行整理及频数分析。
结果围绝经期综合征常见中医证候有49个,其中肝肾阴虚、肾阳虚、肾阴虚、肾阴阳两虚、心肾不交、肝郁气滞、脾肾阳虚最多见;提取常见症状共65个,包括月经紊乱、头晕耳鸣、失眠、烘热汗出、腰膝酸软、心悸、易怒、纳呆等;病位以肾、心、肝、脾为主;病性以虚为主;脉象以细数、沉细、弦细为主,舌象以舌淡或舌红、苔薄或少苔为主,说明围绝经期综合征的中医证候分布比较集中。
中医诊疗方法挖掘、整理

中医诊疗方法挖掘、整理与应用(一)五千年中华民族的文化底蕴是中医药发生、发展的基础。
中医药文献资料浩如烟海,每一个献身于中医药事业的人穷其毕生也难窥其一斑。
如此海量的中医药数据更要有效地利用这些宝贵资源。
近年来,随着医院信息系统和数字医疗设备的广泛应用,数据库的信息容量不断膨胀,文献挖掘的效能与可靠程度亦不断提高。
中医药研究积累了大量的文献数据,如何充分利用这些宝贵的医学信息资源来为疾病的诊断和治疗提供科学的决策,挖掘、整理出可以广泛应用的诊疗方法,提高中医药特色疗法的疗效、给患者带来福音,是我专科医护人员专注的焦点,旨在加速中医药现代化进程,更好的为广大患者服务。
一、文献挖掘方法中医药领域的无数临床实践与理论研究积累了海量的科学知识,这些知识包含在中医药古籍文献以及当前的研究文献中。
据统计,目前国收藏的中医药古籍文献13000多种,其中在社会上广为流传的古籍近1000种。
1911年以后出版的中医药书籍达12000多种,中医期刊230多种。
根据中国中医药期刊文献数据库显示,1987-2015年发表的中医药文献高达1715000篇。
其中涉及中医骨伤科学科的文献达312000余篇。
为从浩渺无际的中医药文献中找到适用于本专科的、有效的、实用的相关诊疗方法,挖掘出潜在的规律,我专科采用如下线索进行数据挖掘:1.以名老中医为线索的诊疗方法挖掘该法就某位名老中医诊疗肺系疾病的辨证思维方法、用药经验、组方特点、经验方应用、独特疗法进行归纳、总结及对其学术思想进行剖析。
如《炳南临床经验集》、《外台秘要》、《名老中医之路》、《林如高正骨经验》、《骨科诊疗学》等。
这种方法多为名老中医本人的经验总结,或其学术继承人、学生在跟随老师学习的过程中,对老师的学术思想和治疗某病的独特经验等进行总结,并列举典型病例加以论证,或对老师经验方的应用进行疗效观察,以典型医案、医论医话、有效验方等形式形成文献,对临床有很大的指导意义。
中医药数据挖掘技术及其应用研究

中医药数据挖掘技术及其应用研究随着信息化时代的到来,中医药行业也逐渐迎来了数字化时代。
如今,中医药数据大量产生与积累,数据资源的获取和整合成为了需求和发展的重要因素。
而中医药数据挖掘技术应运而生,成为整合和挖掘数据的重要手段。
本文将介绍中医药数据挖掘技术及其应用研究。
一、中医药数据挖掘技术基础中医药数据挖掘技术是数据挖掘技术在中医药领域中的应用,主要包括数据预处理、关联规则挖掘、分类、聚类、回归、异常检测等技术手段。
数据预处理主要是对数据进行清理、整合、选择和转换,以便后续的挖掘操作。
关联规则挖掘则主要是发现数据集中项与项之间的关联关系,例如,在多家中医药机构的病历数据中做关联规则挖掘,可以发现某种病的诊断方式,与该病的治疗方式的长短之间的关联关系。
分类、聚类、回归等技术手段则常常用于对数据进行分析和预测,以期发掘出中医药中的潜在规律和规律的应用。
二、中医药数据挖掘技术的应用中药材品质研究中药材品质研究是中医药数据挖掘技术的一个重要应用领域。
中药材品质的研究一直是中医药行业面临的重要问题之一。
传统的中药材品质研究常常需要依靠药材质量地方标准进行,由于药材的品质在物理、化学和生物特性等方面的不稳定性,可能会带来一定的争议和误解。
中药材品质研究的一个重要任务是寻找代表药材品质的特征变量,并对这些特征变量进行定量描述和分类。
中医药数据挖掘技术为这些操作提供了一种较好的手段。
将数据挖掘技术应用于中药材品质研究,能够从大量的中医药书籍、中药材标本、中医药诊断和治疗记录中挖掘出与药材品质相关的有效变量和数字特征。
中医证候分类中医证候分类是中医药学的重要分支之一,其分类依据是由与中医医学相关的诊断和治疗数据所提供的证候信息。
在传统中医诊疗实践中,中医证候往往是通过临床医师的经验和知识判断的。
而这种主观判断往往存在一定的偏差和局限性。
中医药数据挖掘技术能够利用大量的中医药证候信息,基于数据挖掘的方法,制定精确的证候分类标准。
基于CiteSpace软件中医数据挖掘文献的可视化分析研究

基于CiteSpace软件中医数据挖掘文献的可视化分析研究一、本文概述随着信息技术的飞速发展,数据挖掘技术在各个领域得到了广泛的应用。
在中医领域,数据挖掘技术的引入为中医药的研究和发展提供了新的视角和工具。
本文旨在利用CiteSpace软件对中医数据挖掘文献进行可视化分析,以期更深入地理解中医数据挖掘的现状、发展趋势以及研究热点。
本文首先介绍了中医数据挖掘的重要性和必要性,阐述了数据挖掘技术在中医领域的应用现状。
随后,详细介绍了CiteSpace软件的功能特点及其在文献分析中的应用优势。
在此基础上,本文利用CiteSpace软件对中医数据挖掘相关文献进行了可视化分析,包括文献的时间分布、关键词共现网络、主题演化等方面。
通过可视化分析,本文揭示了中医数据挖掘领域的研究热点和发展趋势,为中医药研究者提供了有价值的参考信息。
本文也指出了当前中医数据挖掘研究中存在的问题和不足,为进一步的研究提供了方向和建议。
本文的研究不仅有助于深入了解中医数据挖掘的研究现状和发展趋势,同时也为中医药的现代化、国际化提供了有力的支持。
未来,随着数据挖掘技术的不断进步和应用领域的不断拓展,相信中医数据挖掘研究将会取得更加丰硕的成果。
二、理论基础与文献综述随着信息技术的快速发展,数据挖掘技术在各个领域的应用日益广泛。
在中医领域,数据挖掘技术也被逐渐引入,以期通过对中医文献的深度挖掘和分析,发现传统医学知识中的新规律和新见解。
本文旨在利用CiteSpace软件对中医数据挖掘文献进行可视化分析,以期系统地梳理和归纳中医数据挖掘领域的研究现状和发展趋势。
理论基础方面,数据挖掘是一门通过特定算法对大量数据进行处理和分析,以发现数据中的潜在规律和有价值信息的科学。
在中医领域,数据挖掘技术可以应用于中药方剂配伍、疾病证候分析、名医经验传承等多个方面。
通过数据挖掘技术,可以对中医古籍、现代中医文献等海量数据进行深度挖掘,揭示传统医学知识中的隐藏规律和关联规则,为中医临床和科研提供新的思路和方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浅谈中医药信息数据的挖掘摘要:数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道但又是潜在有用的信息和知识的过程。
数据挖掘技术是对中医药海量数据进行智能分析的一个有效工具,关联规则、聚类、决策树、分类与回归、人工神经网络和支持向量机等数据挖掘方法在中医药新药开发、复方配伍规律、方症相应研究等领域中都得到了初步的应用并显示出独特的优越性,具有广阔的发展前景。
在实际应用中,可以根据数据特征和科研课题需要同时采用多种数据挖掘方法从不同角度加以研究。
中医药尚未被充分认识的丰富的科学内涵,已引起众多专家学者的关注,新的技术和方法不断引入中医药基础研究领域,如对中医证侯的现代科学基础、针刺镇痛原理和经络的研究以及中药复方作用机制的深入认识;中医药对特殊病、疑难杂症治疗的特殊疗效;活血化瘀中药治疗心脑血管病的重大疗效;中医药古典医籍的挖掘整理。
1、数据挖掘数据挖掘(Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道但又是潜在有用的信息和知识的过程。
数据挖掘是一个多步骤过程(它需要为数据挖掘算法访问和准备数据),包括挖掘数据、分析结果和采取行动。
数据挖掘的目的在于使用所发现的模式帮助解释当前的行为或预测未来的结果[1]。
数据挖掘技术主要包括组合或关联、聚类、分类、估计、预测等等,这些方法在实际应用时各有自己的特色和适用条件,需要结合实际的研究目的和不同的变量类型而加以使用。
下面对近年来中医药领域常用的数据挖掘方法进行一些浅析。
数据挖掘的特点是从数据库中识别出有效的、新颖的、潜在有用的并且最终可理解的模式的非平凡过程。
因为和数据库密切相关,又称为数据库知识发现,具有以下特性:(1)有效性,是指发现的模式应用于新的数据时要具有一定的可信度;(2)新颖性,是指要求发现的模式应该是新的、用户未知的或未预料到的;(3)潜在有用性,是指发现的知识将来具有实际效用,如用户根据发现的知识进行商业决策可产生一定经济效益;¼最终可理解性,要求所发现的模式容易被用户理解.数据挖掘技术从一开始就是面向应用的,它不仅是面向特定数据库的简单检索查询调用,而且要对数据进行统计、分析、综合和推理,以指导实际问题的求解,发现事件间的相互关联,甚至利用已有的数据对未来的活动进行预测。
当然,所有发现的知识都是相对的,是有特定前提和约束条件、面向特定领域的,同时还要能够易于被用户理解。
事实上,数据挖掘并不只是一种技术或是一套软件,而是一种结合数种专业技术的应用。
2、中医药信息数据的挖掘:数据挖掘技术是对中医药海量数据进行智能分析的一个有效工具,关联规则、聚类、决策树、分类与回归、人工神经网络和支持向量机等数据挖掘方法在中医药新药开发、复方配伍规律、方症相应研究等领域中都得到了初步的应用并显示出独特的优越性,具有广阔的发展前景。
在实际应用中,可以根据数据特征和科研课题需要同时采用多种数据挖掘方法从不同角度加以研究。
数据挖掘技术是一个相对年轻的研究领域,还面临着许多问题和挑战,需要中医药工作者和数据库、数据挖掘方面专家的共同协作,以便更好的理解中医药数据并在挖掘的效率和准确性方面进一步提高。
医学数据具有多态性、不完整性、较强的时间性、复杂性和冗余性。
由于中医药历史悠久,加之我国幅员辽阔,形成了地域性的中医药文化,带来数据的不完整、不一致和异常等。
使用数据挖掘技术能够针对中医药数据特点实施合理的数据处理和知识提取。
应采用聚类方法、数据归约技术、模糊集理论等进行数据的预处理,清理过滤数据,确保数据的确定性;采用数据融合技术消减数据的维数,使不同模式数据在属性上趋同或一致,之后进行综合;中医药数据库类型众多,信息量大,其挖掘算法应具有一定的容错性和鲁棒性。
3、数据挖掘在中医药领域的研究及应用中医药尚未被充分认识的丰富的科学内涵,已引起众多专家学者的关注,新的技术和方法不断引入中医药基础研究领域,如对中医证侯的现代科学基础、针刺镇痛原理和经络的研究以及中药复方作用机制的深入认识;中医药对特殊病、疑难杂症治疗的特殊疗效;活血化瘀中药治疗心脑血管病的重大疗效;中医药古典医籍的挖掘整理。
3.1中医药基础理论的现代化研究中药药性理论是中药配伍应用的核心内容之一,其内容完善的程度将直接影响到组方的准确性和治疗的有效性。
中医对于中药药性的认识是一个逐渐积累和完善的过程,至今还存在某些药物的药性不完整的情况,如华山参的药性特征为只有性味。
而无归经[2];对于中药的功效归类也因专家对药物认识程度的不同,而导致同一药物分属于不同类别,甚至功效分类名称也不统一的情况。
数据挖掘技术可以在分析大量历史数据的基础上,协助中药药性的完善研究。
如数据挖掘中的分类方法可以依据药性特征的辨识结果,将一些还未归类的中药进行分类预测;也可用聚类方法将药味聚类后,根据同类药物的药性相近,归类也应相近的特点进行分类预测;用决策树和关联规则分析可以自动对药物进行功效分类与其药性特征之间的关联模式或规则研究;粗糙集理论可以实现对药物分类的简化药性特征研究等。
进行中药药性特征的数据挖掘研究,将对于进行中药复方配伍的科学规律研究有着重要意义。
3.2在中医诊断标准化方面王学伟等[3]应用贝叶斯网络方法,通过分析474例血瘀证临床诊断数据进行血瘀证定量诊断。
结果发现了血瘀证的7个关键症状:疼痛程度、肢体麻木、舌质青紫、舌体瘀斑、舌脉曲张、口唇黯红和脉涩,并定量计算其诊断贡献度。
刘晋平等[4]以明清、近现代3 000余例病案为研究分析对象,将病案分为病名、证型、脉象、舌象及症状,探求疾病与其各个构成因素及各因素之间的相关影响。
结果:医案中细脉出现频率最高,为34. 39%。
秦中广等[5]运用粗糙集进行中医类风湿证候的诊断,收集224个病例,每个病例有81个属性,并从这224个病例中随机抽取学习样本180例,进行预测诊断44例。
利用属性约减得到寒湿阻络、湿热阻络、痰瘀阻络、气阴两虚、寒热错杂5种证的必定规则和可能规则。
诊断正确率达90%以上,高于传统模糊数学方法。
3.3单味药有效成分、化学成分研究使用数据挖掘可用于对单味药方的管理与分析,对多种单味药的性味功能、药理作用、化学成分、治疗疾病、药用部位和产地进行统计分析,并用关联规则方法挖掘出上述各部分之间的关联关系,进而获得它与其它药物在配伍后所产生的相须、相使、相畏和相杀等方面的规律,以帮助人们设计出对治疗某种疾病的最佳配伍的方剂,大大提高中药和天然药物在创制新药方面的命中率。
3.4在方剂配伍规律中的应用数据挖掘可在一定程度上发现和认识临床病症与复方组方关系、复方药物的配伍关系、药味之间的相互作用关系等。
姚美村等[6]应用关联规则分析技术,以文献收录的106个消渴中药复方为对象,经解析后建立复方特征数据库,以数据挖掘系统EnterPriseMiner为平台,关联规则分析为工具,在单味药层次上进行消渴复方组成药味之间的关联模式研究。
得出历代中医专家在治疗消渴的主要药物配伍方面的整体规律性。
3.5在中医药其他方面的应用数据挖掘技术不但可以应用到中医药研究中的上述方面,而且在研究中医病证与复方组方的关系、中医症候与现代医学临床表现之间关联的关系以及中医药信息数据仓库的开发研究等方面都可以得到广泛应用。
对中医药信息进行文本数据挖掘是促进中医药信息结构化的途径之一。
从中医诊断、辨证到组方的各个环节,用文字语言描述的过程占很大比例,使得定性内容相对多一些。
在中医诊断过程中,许多环节的忽略造成了部分信息的缺失,也相应导致了药物组方配伍的变化,在一定程度上造成中医药信息的不确定和不完全。
当中医药在实现以计算机技术为主要工具的信息化研究时,这种定性信息的量化常常会遇到相当的困难,即使是原先有量化信息的用药剂量,也因不同中药有效成分含量的差异而失去了原先的意义。
因此,对以古语言和纯文本为主的中医药理论和实践进行结构化解析是中医药信息化研究的重要内容,其中的某些内容可以通过对文本的数据挖掘技术来实现[7]。
进行中药临床功效的规范化和标准化处理是文本挖掘的典型应用,如可以采用特征抽取的方法,或者采用聚类的方法描述某些相似病症的内容,找出其中隐含的相似关系;也可以采用分类方法将不确切的病症分配到已存在的病症分类中,通过类的共同特征来预测与该病症相关的概念等。
4中医药信息数据挖掘的前景中医药在漫长的发展过程中形成了自己独特的理论和专业术语,在一定程度上保持了中医药系统的特色,但也成为中医药走向世界的障碍之一。
应用现代科学技术对中医药理论和实践进行科学阐释和解析,特别是进行信息化、数字化和知识化的研究是促进中医药国际化和现代化进程的重要内容。
在知识经济时代的今天,利用先进的信息技术加强中医药科技信息数据库的建设,加速中医药信息的全球性传播、共享和利用,加快有效信息转化为知识,促进中医药知识快速更新,已成为中医药学向前发展的关键所在。
目前,中医药学尚未能将先进的信息技术充分利用于中医药学领域,大量有用的中医药信息的流失严重影响了中医药学的发展。
因而,应以建设中医药科技信息数据库为基础,努力实现数字化中医药,以完成中医药学的跨跃性发展。
中医药是中华民族的瑰宝,进行中医药的数据挖掘是中医药现代化研究的重要组成部分[8]。
当前在中医领域,数据挖掘应用最广泛的是在中药(复方)的研究中,并已经取得了一定的进展。
进行中医药的数据挖掘是一个有着非常美好前景但又充满挑战的研究方向,相信任何希望中医药继续发扬光大的人都会支持应用现代科学技术进行中医药的研究,以加速中医药知识的更新和创新,并推进中医药的产业化和国际化进程。
数据挖掘作为一个在海量数据中获取知识的有力工具,目前已经不再仅仅限于技术层面的研究,而是越来越多地扩展到不同领域的应用中,这对中医药古籍文献的整理以及相关科学规律的获取研究将是难得的发展机遇,对于通过现代科学技术对中医药科学内涵进行证明和阐述,带动中医药学术水平的提高,拓展中医药的生存空间将会产生巨大的启迪和促进作用。
[ 1 ] Richard J.Roiger,Michael W.Geatz.data mining a tutoria-l based primer[M].清华大学出版社,2003,11.[2] 中华人民共和国卫生部药典委员会.中华人民共和国药典,一部.北京:化学工业出版社, 2000.107[3] 王学伟,瞿海斌,王阶.一种基于数据挖掘的中医定量诊断方法[J].北京中医药大学学报, 2005, 28(1): 4-7.[4] 刘晋平,黄宇虹,陆小左.数据挖掘在中医脉诊研究中的应用[J].天津中医学院学报, 2002, 22(3): 9-10.[5] 秦中广,毛宗源,邓兆智.粗糙集在中医类风湿证候诊断中的应用[J].中国生物医学工程学报, 2001, 20(4): 357-363.[6] 姚美村,艾路,袁月梅,等.消渴病复方配伍规律的关联规则分析[J].北京中医药大学学报, 2002, 25(6): 48-50.[7] 史忠植.知识发现.北京:清华大学出版社,2002.8[8] 乔延江,李澎涛,苏钢强,等.中药(复方)KDD研究开发的意义[J].北京中医药大学学报,1998,21(3):15-17.。