数据挖掘在中医文献研究中的应用

合集下载

数据挖掘在中医学术流派研究中的应用

数据挖掘在中医学术流派研究中的应用
3 首都 医科 大学 附属北京 中医医 院 , 京 . 北 10 1 ) 0 0 0
摘 要 :在中医学术流派研究中 存在着大量的数据, 利用数据挖掘技术可以获得隐藏在这些数据中的有用信息。文章结
合赵炳南学术流 派研 究的实例 , 简要 阐述 了利用数据挖掘进行 中医学术流派研究 的可行性 和先进性 , 并提 出 了数 据挖掘 的实施 步骤和具体的工具 、 算法 。

相关 , 这在 国际国内均未见相应的科研报道 。 指导意义 , 有利于解决 医疗 纠纷 。 通过本课题 的研究 , 总结 出肛 管直肠 功能与疾病 本身 、 治疗 手段密切相关 , 多病 种、 大范围 的研究提供 了更科学 、 可靠的数 参 考文 献 : 更 据, 避免 了单个病种的研究对 肛肠科 临床 医生 的不利影 响 , 多种 [ 1] 黄乃健.肛肠解 剖学 [ . M] 济南 : 山东科学技术出版社 ,96: .4 19 18 . 手术方式的比较为 医生提供 了手术改进方式 的依据 , 并通 过科学 [ 张东铭. 2] 盆底与肛门病学 [ . M] 贵阳: 贵州科技出版社 ,00, ,7, 20 l l l 2 7 l 4. 8, 5, 6, 4 的数据进行评定 , 使其 量化 , 避免 了医生 对临床症状 的主观臆 测 [ 3] 张东铭.盆底与肛 门病学 [ . M] 贵阳: 贵州科技出版社,00:. 20 1 和患者的 自主描述形成的误 区, 肛管直肠功能的鉴定有 重要 的 对
◇学术探讨◇
数 据 挖 掘 在 中 医 学 术 流 派 研 究 中 的 应 用
谭 勇1 ,吕爱平 车念聪 诚 蔡念 宁 , , 2都 医科大学 中 医药学 院 , 北京 106 ; 009 2 中 国中医科学 院中 医临床 医学基础 研究所 , . 北京 10 0 ; 0 7 0

中医病证规律下的数据挖掘论文

中医病证规律下的数据挖掘论文

中医病证规律下的数据挖掘论文1数据挖掘技术在中医病证规律研究中的应用数据挖掘技术已广泛应用于中医病证规律研究领域,其基本流程为针对所研究疾病或证候整理相关文献资料,搜集具备中医诊疗信息、处方信息的海量数据,使用数据挖掘技术相关算法及其程序系统实行数据分析[5],总结该病或该证候的核心理论、诊疗方法及特色方药,提炼具有中医特色的个性化诊疗方案。

因为疾病及中医证候种类繁多,作者通过中国知网信息检索平台,搜索关键词“数据挖掘”,查找并学习2010—2014年相关期刊文献,汇总中医病证诊疗方面的数据挖掘技术的应用成果,旨在为内、外、妇、儿等常见学科疾病的临床诊疗提供参考。

1.1内科疾病在心血管疾病方面,杨静等对冠心病的证候用药规律实行数据挖掘,结果显示冠心病以气虚血瘀证多见,另有心血瘀阻证、气阴两虚证,丹参、黄芪、葛根等为核心用药。

崔松等通过挖掘何立人治疗心悸的用药分析,总结其治疗心悸的基本方,归纳出以心悸为主重用淮小麦,以心律失常为主重用生黄芪等因症施药的特点。

赵健等通过对严季澜辨治的109例高血压病患者用方数据实行挖掘,总结出严季澜自拟调肝理血汤的用方要点与学术思想。

在消化系统疾病方面,王萍等挖掘整理了唐旭东治疗慢性萎缩性胃炎的辨证证型及用药规律。

Liu等[10]应用支持向量机技术研究中医舌诊舌象在胆囊炎患者中的分类,为数字化辨病辨证提供了可靠依据。

吴嘉瑞等[11]应用关联规则和复杂系统熵探索颜正华治疗泄泻用药经验。

杜斌等通过检索现代治疗溃疡性结肠炎的文献,挖掘出常用灌肠方药及药对。

在肾病及内分泌疾病方面,展俊平等[13]采用文本挖掘技术对慢性肾小球肾炎的证治方药规律实行总结分析,发现该病证候以气阴两虚、肝肾阴虚、脾肾阳虚为主,核心治法以益气养阴、化湿利水为主。

凌颖茹等挖掘了黄春林治疗肾病综合征的方药使用经验。

霍保民等[总结了戴希文教授分期诊疗慢性肾脏病的辨证及用药规律。

袁敏探析魏子孝教授诊治糖尿病善补气、活血的用药特点。

数据挖掘技术在医案研究中的应用与讨论_刘兴方

数据挖掘技术在医案研究中的应用与讨论_刘兴方

刘兴方,等: 数据挖掘技术在医案研究中的应用与讨论
爽等[39]利用粗糙集技术的 Johnson 算法对 776 首治 疗高血压病肝阳上亢证的中药处方中出现频率高的 53 种药物进行属性约简,进一步明确了高血压病肝 阳上亢证的用药规律。 3. 6 人工神经网络 特有的非线性适应性信息处 理能力克服了传统人工智能方法对于直觉,如非结 构化信息处理方面的缺陷,有较好的抑制噪声干扰 的能力。因此在医案挖掘中将两者结合起来,根据 粗集方法预处理后的信息结构构成神经网络信息处 理系统,不但可以减少信息表达的属性数量,减小神 经网络构成系统的复杂性,而且具有较强的容错及 抗干扰能力,为处理医案中不确定、不完整信息提供 了一条强有 力 的 途 径。 如 温 宗 良 等[40] 运 用 人 工 神 经网络技术,采用成比例的共轭梯度算法从 79 例高 血压病案样本中获取规则,建立高血压中医证候诊 断模型,并将其运用于新病例的判别,具有较好的诊 断、预测能力。 3. 7 贝叶斯网络 是目前不确定知识表达和推理 领域最有效的理论模型之一,是一种强有力的不确定 性推理方法,能在有限的,不完整的,不确定的信息条 件下进行学习和推理。如唐启盛等[41]运用贝叶斯网 络模型对 611 例抑郁症患者的横断面证候进行数据 研究,并结合前期聚类分析研究结果,拟定出抑郁症 的 6 个中医证型,认为基于贝叶斯网络研究的中医证 型具有一定客观性、科学性,较符合中医理论。 3. 8 典型相关分析 利用综合变量对之间的相关关 系来反映两组指标之间的整体相关性的多元统计分 析方法,其条件是两组变量都是连续变量,其资料都 必须服从多元正态分布。如张晶[42]对 743 例情志致 病症分类医案中的情志因子与左尺脉象进行典型相 关分析,总结出恐、烦、精神萎靡、郁、狂与左尺脉象的 相关性,为情志相关脉诊临床实践提供了文献支持。 4 讨论

数据挖掘技术在文献研究法中的应用——以RefViz为例

数据挖掘技术在文献研究法中的应用——以RefViz为例
系值 得 进一 步思考 与探 索 。
参 考 文 献
[] 9 于斐, 玉崧 成, 吴拥 军, . 等 卫生化 学实验教 学改革 与 实
践 [ ] 实验 室科 学 ,0 1 1 ( )4 4 4 J. 2 1 ,4 4 :1 2,5
[] 1 庞春红 , 郦晓 宁, 葵. 何 深化 实验教 学改革 , 高 高校 教 提 学质量 [ ] 科技信息 ,0 1 (0 :8 J. 2 1 ,2 ) 1 f ] 雪 飞. 于开 放 实验 室 的教 学 模 式 研 究一 以教 育技 术 2王 基 专业 为例 [ ] 长 沙铁道学 院学报 ,0 1 1 ( )2 829 J. 2 1 ,2 1 :4 —4 [] 3 林雅. 初探 提升 大学 生网络 自主 学习效果 的策略一 基 于
第2 6卷 第 4期 21 0 2年 8月








Vo _ 6 No 4 l2 .
Au . 2 1 g 02
CHI NA MEDI CAL EDUCAT 0N 1 TECHNOL OGY
数 据 挖掘 技 术 在 文 献 研 究 法 中 的应 用

以 R f i为 例 eVz
李华新 , 李望 秀
衡Байду номын сангаас 4 10 20 1
南华大学计算机学 院,湖南
【 摘要】在科学研 究文献激增 的今天, : 将数据挖掘技 术引入 文献研 究领域势在必行。R Ⅳi e z
是 一款 可视化 的数 据挖掘 工 具 , 用其独 特 的算 法能够发 现 文献之 间的关联性 , 利 并从 中挖 掘 出某一
研 究领域 的 热点 问题 和发展 趋 势 。

数据挖掘及其在中医领域的应用研究

数据挖掘及其在中医领域的应用研究

信息或知识对 于所讨 论 的业务 或研 究领 域是有 效 的、 是有 实 用价值和可实现 的 , 常识性 的结 论 或 已被人们 掌握 的事 实或
无法实现 的推测都是 没有 意义的 。
掘 的结果一部分 可能 与传 统 的诊 疗规 律相符 , 合 的部分 不符 可能是潜在 的新 知 , 也可能是没有 意义 的, 这都需要 在相应 目
起来 的。 1 数 据 挖 掘 介 绍
数据挖掘 的任务 主要是预测 和描述 。预测是 指用 一些变 量或数据库 的若干 已知字段 预测其他感兴趣 的变量 或字段 的 未知的或未来 的值 。描述 是指 找到描 述数 据 的可理解 模 式 。 预测方法有统 计 分 析、 关联 规则 和 决策 树 预测 、 回归 树 预测 等 。其 中关联 规则 反 映 了一 个事 务 与其他 事 务 之 间存究
丁 维 蒋永光

宋姚屏 吴孟旭 李 昆
成 都 60 7) 10 5
( 都 中医药大 学 图书馆 成
今后 的发展 趋势。
关键词 : 数据挖掘 ; 中医
要: 介 绍了数 据挖掘的意义和任务 , 综述 了近几年来数据 挖掘在 中医各领域 中的应用 , 分析 了 目 前存在 的问题 , 并探讨 了
代化过程 中建立 了很 多的数 据库 。堆积在 数据库 中的信 息呈 超指数爆炸式增 长 。例如 中 医药科技 信息 数据 库就有 5 O个 子数据库 、 1 个表 单及 数百个 自动生 成 的中间 表、 0 10 8 0余个
著 录项 目, 涵盖所有 中医药有关 医 、 药及 学术 的内容 。而数据 挖掘技术 的发展使我们有 可能从这些海量 数据 中发 现新 的知
的。
化研究 的重要组 成部 分[ , 1 必将 促进 中医药 的发展 。而数 据 ]

数据挖掘技术在中医药传承中的研究进展

数据挖掘技术在中医药传承中的研究进展
数据挖掘技术在 中医药传承 中的研 究进展
李 玲 周 学 平
( 南京 中 医药大学 , 苏南京 2 0 4 ) 江 1 0 6


数 据 挖 掘 技 术 作 为 一种 有 效 的信 息 处 理技 术 , 通过 分析 中 医个 体 化诊 疗信 息特 征 , 炼 出其 中蕴 藏 的 新 理 提
众 多 , 术 思 想 广 为 流 中 学
传 。中 医 药 事 业 的 发 展 需 要 “ 火 传 承 ” 传 统 的方 法 已 经越 薪 , 来 越 显 示其 不 足 。数据 挖 掘 技 术 作 为 一 种有 效 的信 息 处 理 技
术 , 过 分 析 中 医 个 体 化 诊 疗 信 息 特 征 , 炼 出 其 中蕴 藏 的 通 提
有 何关 系 , 尚待 进一 步研 究 。 5 参 考 文 献
[】 张 继 玲 , 曹碧 兰 .白癜 风 免 疫 学说 新 进 展 .遵 义 医 学 院 学报 , 1
2 o ,94)4 3 o 6 2 ( :0
中 国 药 物与 临床 ,0 7,( )2 1 20 7 4 :9 【l 张 玉 臣, 成 文 , 东 , . 7 熊 吕 等 虫草 提 取 物 抗 炎 及 免 疫 作 用 实 验 研
论、 方法 , 新 实现 中 医药 经 验 的有 效 总结 与 传 承 。目前 数 据 挖 掘 技 术在 中 医 药传 承 中的 应 用 主要 包括 : 疾病 研 究 中的 应 在 用 、 方 剂研 究 中的应 用 、 中 药研 究 中的 应 用 、 针 灸 临床 中 的应 用 。 同时 , 们 应 该 认 识 到 数 据 挖 掘 作 为 一 种 新 兴 的 在 在 在 我 前 沿技 术 , 多方 面 需要 完善 , 数 据 挖 掘 研 究 结 果 的不 确 定 性 , 据 挖 掘 系统 中的人 为 主观 影响 , 需 要 在 日后 的 实践 在 如 数 这 中予 以校 正和 改 良。

数据挖掘技术在中药属性关系中的应用研究

数据挖掘技术在中药属性关系中的应用研究
21 第 1 0 2年 0期 文 章 编 号 :0 62 7 (0 2 1 - 5 o 10 — 5 2 1 ) 00 0一 4 4 0
计 算 机 与 现 代 化 JS A J Y 1 N A H A IU N I U X A D I U
ቤተ መጻሕፍቲ ባይዱ
第 2 6期 0
数 据 挖 掘 技 术 在 中药 属 性 关 系 中 的应 用 研 究
3 oeeo omao c nea dT cnl y D nh aU i r t,Sa ga 2 12 ,C ia .C Ug f n r t nS i c n eho g , og u n esy hnh i 0 60 hn ) I f i e o v i
Absr c :Daa mi ig p o i e e h ia u p r f rt e mo e iain o rd t n lChn s d cn . T i p p r b i s t e ta t t n n rv d s tc n c ls p o o h d r z t ta i o a i e e me ii e t n o f i hs a e ul h d
2 D p rme to ce t c R s ac . e at n f i ni e e r h,He a i est fT a i o a Chn s d cn ,Zh n z o 5 0 0,C i a S i f n n Un v r i o rd t n 1 i e e Me ii e y i . e g h u4 0 0 hn ;
t c n l g fa s cain r l of d f q e ti ms t i e p o e t so h n s d cn .Th o g n x e i n s t i p — e h o o o s o i t u e t n e u n t es n t rp ri f ie e me ii e y o i r e h e C r u h ma y e p r me t , h s a p rb i s te c o ey r lt n h p o e u n t ms t n f n t n p a a oo y,f t n i d c t n,fn t a w s r d cn e u l h ls l ea i s i ff q e ti d o r e es i u c i — h r c lg l o m mc i ・n i ai o o o c i — e t n me ii e o e n me h r c lg —n i ain,p ama o o — se dcn a ,ec a ,p ama oo i d c t y o h r c l g we t r me ii e n me t ,w i h p o i e v u be i fr ai n fr f d n h y n h c r vd a a l no l m t o n ig te o i rl t n h p b t e n te p o e is o i e e me ii e ea i s i ew e h r p r e f o t Ch n s d c n . Ke r s aa mi i g s o it n n l ;p o e is o h n s d cn ;f q e ti ms t y wo d :d t n n ;a s cai I o e r p r e c ie e me ii e r u n t es t f e e

数据挖掘技术在中医医案研究中的应用

数据挖掘技术在中医医案研究中的应用

的 改善效果 明显 , 加强居 民健康教育是 吖行的 。 通过营养 知识 的宣传教育 能够提高 居 民学 习营养知 识的积极性 , 树立正 确的营 养观念 , 纠正 不 良的饮 食习惯和 改进 膳 食 的保健措施 。 随着我国人 民生活水平的提 高, 生活办式的 改变 , 膳食结构也随之改变。 在对居民实施膳 食营养的健 康教育 中 , 不但要关 注婴幼 儿、 青少年 的饮食健康 , 更应 关注老年 人的合理 膳食。 老年 人的合理膳 食町以减 少各 种慢 性病 的发 生机 会 , 高老年 人 的生 活质量 , 提 增进健 康, 延长寿命 。 【 参考文献】






Vo . 8 N0 3 2 l 12 . 0
J 0UlNAL OF CI E l NGDE MED1 CAL 0LL GEห้องสมุดไป่ตู้ C E
卜 高达7 .0 的 凋查对 象每年基 本不去医院进行体 检 , , 440 / 道 自己患有高血 压、 血脂 、 高 糖尿病和骨质疏松 的居 民 低 f50 4  ̄ 以上 的调查对 象不清 楚 自己是否 患有相 . %,0 0 / 父疾病 。 2 6 居 民获得 营 养信 息的途 径 调 查对 象 中营 养信息 来 源 于 电视/广播 的 有4 9人 , 58 o 来 源于 家 人/ 0 占6 .o; / 朋友 的有36人 ,i 37 来 源于报纸 书籍 的有10人 , 9 i6 . ! %; 0 f 6 1 来源 为讲 座 、 询 的有3 , . ̄; 中 电 1 . %; 咨 0人 占4 8 其 0 / 视/广播 为农村 老年人群获得营养信息的主要来源 。 3讨论 本次调 查结果 发现 , 农村老年 居 民中存 在诸 多不合 理的膳食 习惯 , 说明居 民对= 一 些食物 的营养成分 、 r 身体 营养需要和营养素来源以及食物营养合理搭配等知识还 缺乏基本的 了解 。 并且 , 在危害健康比较严重的膳食行为 方面 , 男性 高于女性 ; 听说过 ( ( 中国居 民膳 食指南 的居 民仅有5 5 而在今后的营养教育 中, .%, 应重点注意做到普 及基本营 养知识 和 ( 《 中国居 民膳食指南 内容 。 的 调 查发现 , 部分调查 对象对 改善 自身膳 食行 为习 人 惯 抱有 积极 的态度 ,7 3 7 .%人 的认 为有必 要进 行营养 知 以的宣传 ,42 6 .%对营 养知识感兴趣 , 说明居 民有主动获 舣 营养知识 和改变 不 良习惯 的意愿和可能 性 , 这肯定 了 进 行营养宣传和营养教育的可行性。 调 查发现 , 高达7 .%的居 民每年 基本 不去 医院进 44 行体 检 , 不清楚 自己是 否患有 高血压 、 高血 脂、 糖尿 病和 骨 质疏松等慢 性疾病 , 明该地区老年 人群 自我保 健意 说 识比较薄 弱 , 对预 防疾病 的意识较差 , 基本上是生病之后 或病情持续 恶化 后才去 医院 , 并且认为如果没 有生病 , 没 有去医院 的必要 。 并且 , 被调查者对营养与健康的重要性 认识不足 , 对饮食选择的重视程度不够 。 因此要通过各种
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据挖掘在中医文献研究中的应用作者:张胜男车立娟李明来源:《医学信息》2017年第13期摘要:大数据时代,数据挖掘作为有效地信息处理技术,可以在中医文献中提炼出潜在的、有用的信息。

数据挖掘广泛应用于特定疾病、方剂、医案、名老专家临床经验与针灸的文献研究中。

本文简要介绍了关联规则分析、聚类分析、决策树算法和神经网络数据挖掘方法,以及在中医文献研究中的应用情况。

关键词:中医;数据挖掘;文献研究中图分类号:R2-03 文献标识码:A 文章编号:1006-1959(2017)13-0022-03Abstract:The era of big data,data mining as an effective information processing technology,in the literature of traditional Chinese medicine extract potential and useful information.Data mining is widely applied to specific diseases,prescriptions,medical records,literature research and clinical experience of senior experts of acupuncture.This paper briefly introduces the association rules analysis,cluster analysis,decision making tree algorithm and neural network data mining method,and application in TCM literature research.Key words:Traditional Chinese medicine;Data mining;Literature research“大数据”已成为互联网信息技术行业的流行词汇。

大数据时代,人们不再追求精准和因果关系,而是更为关注相关关系[1]。

中医学也迎来了大数据时代,从海量中医数据中提取有用的信息也变得更加困难,数据挖掘作为有效地信息处理技术,可以帮助中医研究者挖掘海量数据中有用的信息。

数据挖掘(Data Mining,DM)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中、不为人知但又是潜在有用的信息和知识的过程[2],数据挖掘也被称为数据库中知识发现,即从一个大的数据堆中找出有用的知识,从数据中挖掘知识[3]。

这是一个从大量不完整的数据中发现、抽取有意义数据的过程。

数据库知识发现技术最早是在1989年的美国人工智能协会第11届年会上提出的[4],而后渐渐成为人们在海量数据中寻找有效知识的一个必备方法。

在中医文献研究中,常用的数据挖掘方法有关联规则分析、聚类分析、决策树算法和神经网络,尤其是关联规则分析和聚类分析最为常用。

也有很多中医文献研究需要综合应用多种数据挖掘方法。

1 关联规则分析关联规则分析又称为购物篮分析,目的是在一定的支持度和置信度限制下寻找事务之间的内在的联系。

它是由Agrawal等人于1993年提出来的。

关联规则里的重要概念[5]:项集、支持度、频繁项集、置信度。

支持度是度量一个项集出现的频率,例如项集{A,B}的支持度是由同时包含A和B的事务总数组成的。

频繁项集是在数据集中出现频率高的那些项集,利用这些频繁集创建描述关联关系的规则[6],这是关联规则的核心部分。

频率的阈值是用支持度来定义的。

概率(Probability)是关联规则的属性,规则A=>B的概率是使用{A}的支持度除项集{A,B}的支持度计算的,该概率在数据挖掘研究领域中也称置信度。

关联规则分析是数据挖掘领域中最活跃和成熟的方法之一,在中医文献研究中,关联规则分析常用在组方用药规律研究、病机的研究、针灸用穴规律的研究中,值得关注的是,关联规则分析在方证研究领域中也有所发展。

关联规则在用药规律研究中旨在寻找有用的药对、药组、药症,甚至可以发现新方;关联规则在症候病机的研究中着重挖掘病机与病机之间、症候与病机之间的关联;关联规则在针灸用穴研究中,着重发现特定疾病选穴与经络之间的联系;关联规则在方证研究中,旨在寻找经方里的规律,帮助临床更好的应用经方。

1.1组方用药规律的研究甘永康等[7]应用数据挖掘方法对叶天士《临证指南医案》治疗泄泻方剂的组方规律进行分析,得到叶天士治疗泄泻常用的药物、核心组合及发现新方,这为临床选方用药提供了新思路。

有些学者采用古今文献对比的思路研究了某病用药规律,沈劼等[8]运用关联规则分析并对比了古今医家治疗卵巢早衰的用药规律。

挖掘出古代中医治疗卵巢早衰的核心药物是当归、川芎、白芍、茯苓、熟地黄等,为八珍汤基础方加减。

得到关联度比较好的药对为当归-川芎、当归-白芍等。

现代中医治疗卵巢早衰的核心药物是当归、熟地黄、菟丝子、枸杞子、山药等。

得到关联度较好的药对为当归-熟地黄、熟地黄-菟丝子等;古代中医和现代中医治疗卵巢早衰共同选择的核心药物为当归、熟地黄、白芍、茯苓,核心药对为当归-熟地黄。

在分析古今医家治疗卵巢早衰时,得到支持度最高的药物为当归,可以认为古今医家均视阴血亏虚为本病的一个病理基础,但用药有一定区别,古代方用药立足于补益气血,现代方用药以滋补肝肾阴血为主。

1.2 症候病机的研究简维雄等[9]在基于现代文献研究高血压的证型病机特征时,运用了关联规则方法,得出高血压病机以肝肾阴虚为本,痰浊,瘀血为标,风阳内动为像。

瘀血与痰浊、阳亢、肝阳化风、肝肾阴虚、阴虚阳亢、肝火上炎等病机关联;痰浊与瘀血、肝阳化风、肝火上炎、肝肾阴虚、阳亢、阴虚阳亢、气虚、阴虚等病机关联;肝肾阴虚证与病机瘀血倾向关联;肝肾阴虚证和肝阳上亢证时与病机痰浊、肝阳化风、瘀血倾向关联;血瘀证与瘀血倾向关联。

1.3针灸用穴规律研究章薇等[10]运用关联规则探析古代针灸治疗尿失禁的用穴规律,得出治疗尿失禁多选阴经,重视手足三阴经腧穴偏重特定穴,阴经又以足厥阴肝经取穴最多,五输穴与其他特定穴配伍最为常用,原穴配伍五输穴支持度最高;而且发现古代医家治疗尿失禁不取膀胱经募穴中极。

这说明数据挖掘技术也可以用来研究针灸的用穴规律。

1.4方证研究在方证研究领域中,徐建虎等[11]运用数据挖掘技术分析古今医案专著、临床经验专著及期刊杂志中的小柴胡汤医案,发现小柴胡汤证临床病证规律。

子午二个时辰定时发作的病变常采用小柴胡汤治疗;少阳提纲证(口苦、咽干、目眩)和小柴胡汤四大主症(往来寒热、胸胁苦满、嘿(mo)嘿不欲饮食、心烦喜呕)具有诊断小柴胡汤证的指标意义;“但见一证”指往来寒热、胸胁苦满、心烦喜呕、嘿嘿不欲饮食四者之一;小柴胡汤证主脉是弦脉。

2 聚类分析聚类是指将物理或抽象对象集合构成为由类似的对象组成的多个类的过程[12],聚类分析是将数据进行类似对象组的划分,从而实现类的分析过程。

在人类的行为中是一项非常重要的分析方法,也是一种常见的数据挖掘方法。

聚类分析可分为R型聚类和Q型聚类。

R型聚类可以把有线性关系的变量归到一类,然后让研究者自己去根据变量的情况判断选择代表性指标。

而Q型聚类主要根据对象相似度,把整体分成若干类别,研究者在不同类别中寻找共同规律。

无论是R型还是Q型聚类分析,都仅仅归类而不呈现结论,需要完成下一步分析,属于探索性分析[4]。

多用于疾病的中医证候分类,为中医临床辨证论治依据提供分型的方法学[13],也应用于方剂中的用药规律、用药方案筛选等相关研究中。

刘嘉辉等[14]探讨名老中医治疗原发性肝癌的用药规律,搜集首届国医大师及首批国家级名老中医的医案提取方药信息,应用聚类分析和关联规则分析进行数据挖掘。

聚类分析显示名老中医治疗原发性肝癌的药物可归为5类:补益气血类、理气活血类、解毒软坚类、利水渗湿类和健脾消食类。

关联规则分析显示:关联性强的主要为益气健脾药和理气药、活血药、清热解毒药、消食药的配伍组合。

名老中医治疗原发性肝癌谨守“正虚邪实”的病机本质,在扶正健脾基础上辨证运用清热解毒、疏肝理气、活血散结等治法。

陈欣然[15]利用聚类分析和关联规则对近15年的反流性食管炎中医临床期刊文献进行了用药规律和证候研究。

药物聚类组得出7种证型,与《实用中医消化病学》中该病的5种分类证型比较,少1种脾虚胃热型,多出4种证型脾胃湿热证、气郁痰阻证、痰热互结证和脾虚痰湿证,证明临床用药的趋向已经改变。

在药物的研究中发现大部分排名靠前的药对中药物功能相近,如穿山甲、桃仁,穿山甲、红花均可活血化瘀、通络止痛;还有沿用经典用药配伍,如石青、寒水石出自《素问病机气宜保命集》中的双玉散等等。

对于药症研究,大便艰难与玉竹相关性最高,白花蛇舌草、太子参、丁香、大枣、槟榔、黄芪、竹茹均与烧心相关联,说明主症烧心的用药多选择扶正祛邪、清热解毒、软坚散结的药物。

3 决策树算法决策树算法是利用信息论中的信息增益,以寻找数据库中具有最大信息量的属性字段,建立一个决策树的节点,而后根据字段不同取之建立分支[4]。

这种方法以树状结构表示模型,容易理解。

国际上最早的最有影响的决策树算法是ID3算法。

决策树算法在基于临床病例数据探索辨证规则的研究中使用较多,可以是研究专家的辨证规律,也可以是临床专病的辨证规则研究。

决策树算法可用于中医临床疾病辨证的辅助诊断。

余学杰等[16]使用决策树算法将中医专家的临床诊断数据逐步分类以获得专家的辩证规律,研究者成功获取了多种证名与证候的规则,这说明利用决策树算法研究专家的辩证规律是可行的。

黄嘉韵等[17]收集临床鼻鼽病例资料,建立了鼻鼽辩证分型决策树模型,并且获得了较高的准确率。

通过决策树算法探索专病辨证规律具有可行性,在中医临床辨证过程中将会起到辅助诊断的作用。

4 神经网络神经网路又称为人工神经网络,是模仿人脑神经元而产生的一种仿生物技术类数据挖掘方法[4]。

神经网络的目的在于提取规则,在证候分类、证候诊断规则以及预测研究中经常使用,神经网络对已知证候与症状的关系或者对于建立专家系统都是有益的,但对某一个疾病的证候规律研究往往有局限性。

有学者将神经网络运用在诊断学中四诊的研究,例如张康等[18]通过神经网络对舌图像进行胖舌,瘦舌和正常舌的自动归类。

5 总结与展望数据挖掘技术在中医文献研究中已经得到广泛应用,在某一项研究中可以使用多种挖掘技术,这些挖掘技术不仅相互交叉又相互补充。

其中关联规则在中医文献研究中使用较多,也趋渐成熟。

聚类分析在中医文献研究中的使用频率也慢慢增多,然而在数据挖掘软件中,聚类分析呈现出的结果仅仅是归类而无结论,这就需要研究者深入探索再分析。

相关文档
最新文档