陈 超 男,1958年生5月生,现任西北大学教授,西大北美基因股份

合集下载

乙肝表面抗原在分泌型毕赤酵母中的表达及纯化

乙肝表面抗原在分泌型毕赤酵母中的表达及纯化

基 金项 目: 国家高技术研究发展计划基金资助项 目(0 5 A 02 0 20A 252 )
作者简 介 : 王亚妮 (9 l )女 , 1 8一 , 陕西岐 山人 , 西北 大学硕士生 , 从事细胞生物学研究 。
维普资讯
备单 克 隆抗体 。


词: 乙肝表 面抗 原 ; 泌表 达 ; 赤 酵母 分 毕 文献标 识码 : A 文章 编 号 :0 024 20 )400 - 10 -7 X(08 0 - 50 6 4 多用 p Ig 而 在 p IZt PC K, PC o 中表 达 乙肝 表 面 抗 原 尚 未见 报 道 。本 实 验 在 分 泌 型 毕 赤 酵 母 表 达 载 体
p IZt PC o 中表达乙肝表面抗原 , 为进一步制备高效的
乙肝疫 苗 , 防病 毒 感 染 和 制 备 抗 乙肝 表 面 抗 原单 预
的严重危害人类健康的疾病 。据不完全统计 , 全世 界大约有 35 . 亿乙型肝炎病毒感染者…。我国是 乙 肝高发区 , 约有 12亿的乙肝携带者 。因此 , . 乙肝病 毒 的 预 防 和 检 测 目前 备 受 关 注 。 乙 肝 表 面 抗 原 ( BA ) H s g 由乙肝 病 毒 的 S基 因 编码 , 乙肝 病 毒 的 是 包膜蛋 白 , 含有 主要 抗 原 决 定 簇 a 。病 毒 感 染 机 体 后4 l 一 0周即可检测到 , 且滴度很高 。同时 , 它能产 生保护性抗体 H s b 因此它是乙肝病毒 的重要血 BA , 清学标志 , 目前 乙肝疫 苗 的主要成 分 【3。 ’ 是 2】 . 毕赤 酵母 ( / / atr ) 近几年 来 常用 的真 Pc aps i 是 h os
接近哺乳动物。将重组蛋 白高效分泌出胞外是毕赤

西大校史上的几位“国”字号人物

西大校史上的几位“国”字号人物

西大校史上的几位“国”字号人物作者:千里青来源:《陕西教育·综合版》2021年第03期一、“國师”黎锦熙“国师”是一个古旧的称谓,这里姑且用之。

黎锦熙早年在长沙第一师范担任历史教员时,毛泽东是他的学生。

毛泽东后来成为国家主席,不忘旧缘,仍尊黎锦熙为“我的老师”。

因此,我们称黎锦熙为“国师”。

黎锦熙,字邵西,湖南湘潭人,1890年2月出生,仅比毛泽东年长三岁多。

他毕业于清末湖南优级师范学堂史地部,一生从事文史教育和国语统一事业,著述甚丰。

1931年任北师大文学院院长,抗战爆发后随北师大迁来西安,后至陕南城固,执教于西安临大、西北联大、西大,曾任国文系主任。

黎锦熙与毛泽东交往密切,常通音信,并一直甘冒风险保存着毛泽东写给他的信件。

1939年,毛泽东得知他在城固,曾从延安寄赠新著《论持久战》一书给他。

1942年,毛泽东在延安接见马师儒(时任西大文学院院长,后任校长)时,曾嘱托马师儒:“返陕南后,请代我问候我的老师黎邵西先生。

”黎锦熙是无党派人士,一贯坚持进步立场。

1939年在西大时,国民党区分部曾动员他入党,他坚决拒绝,将申请表掷于废纸篓中。

为此区党部向来校视察的教育部次长说他的坏话,要求解聘他,因他资格老而未敢轻动。

他常对人说:“一般人都说什么反动学生,我看他们功课都很好,相反地党团员则功课都不好。

”一般人说的“反动学生”即地下共产党员、进步学生,他所说的“党团员”指国民党员、三青团员。

现存档案有当时西大中共地下组织向省委的汇报材料,称黎锦熙“对共无成见,不顽固”。

黎锦熙为西北联大撰写的校歌歌词保留至今,他还以歌词为纲,写了一部简明的西大校史,最先把西大校史溯源至晚清。

解放前一年,黎锦熙返回北师大,仍任文学院院长兼国文系主任。

1949年6月北京解放不久,毛泽东就亲临北师大看望他,一见面就喊“黎老师”。

此后,毛泽东曾多次接黎锦熙到中南海叙谈,师生之间,情意绵长。

黎锦熙于1978年3月谢世,终年88岁。

学脉守清正 刊风崇创新——《西北大学学报》百年刊庆系列学术活动综述

学脉守清正 刊风崇创新——《西北大学学报》百年刊庆系列学术活动综述

科学事业的发展和人文精神的传播做出了不懈的努力 , 尤其为陕西的社会发展进步做出了积极贡献 。 与会专家学者认为 , 《 西北大学学报》 在创办早期 , 便构筑了旧中国西北地区的最高学术平台, 向我
者进行 了深入 探讨 。


百年学报 , 历久 弥新
( 一) 中 国西部 地 区创 办最 早的大 学 学报
《 西北大学学报》 是 中国西部地 区创办最早的文理综 合性大学学报 , 早于 1 9 1 5年创办 的《 清华学 报》 以及 1 9 1 9 年创办的《 北京大学月报》 。关于《 西北 大学学报》 的历史渊源及沿革 , 西北大学学报编辑 部主任、 哲学社会科学版主编刘炜评做了简要介绍 : 《 西北大学学报》 肇端于 1 9 1 3年创刊的《 学丛》 。作 为《 西北大学学报》 的前身 , 《 学丛》 不仅是我国西部地区最早创办的综合性大学学报 , 也是我 国创刊最 早 的三种文理综合性大学学报之一。在此后 的岁月 中, 经过《 西北大学周 刊》 ( 1 9 2 4年 ) 、 《 西大学报》 ( 1 9 3 9年 ) 、 《 西北学术》 ( 1 9 4 3 年) 、 《 西北大学校刊》 ( 1 9 5 4年) 、 《 西北大学学报》 ( 1 9 5 7 年) 等相关期刊
【 百年刊庆 】
学脉 守清正 刊风 崇创新
《 西北大学学报》 百年刊庆 系列学术 活动综述
雷 雁 林
( 西北大学 学 报编辑部 , 陕西 西安 7 1 0 0 6 9 )
2 0 1 3年 1 2月 1 9日至 2 1日, 西北在 西北 大 学举 行 。活动 由“ 主 编
( 二) 《 西北大学学报》 的学术贡献
乔学光 指 出 , 通过 几代 学报人 的不 懈努 力 , 《 西北 大学 学报 》 已经发 展 成为 国内外 知 名 的学术 期 刊 ,

基因芯片对胃癌和食管癌基因表达谱的对比研究

基因芯片对胃癌和食管癌基因表达谱的对比研究
维普资讯
西北 大学 学报 ( 自然科学 版) 20 0 8年 6月 , 3 第 8卷第 3期 , n ,0 8 V 13 , o3 J .2 0 , o.8 N . u Jun f otw sU i r t N tr cec dt n ora o r et nv sy( a a Si eE io ) l N h ei ul n i
1 3 实验方 法 .
寡核苷酸芯片( L ee 公司提供) 覆盖 266 由 i gn f , 5 个
肿 瘤相关 基 因 。通过 对这 两种 上 消化道 常见肿 瘤进
行基 因表达分析 , 初步探讨其发生的分子机制 , 并找 出它们差异表达基 因存在的共 性和区别 , 而为将 从 来基因诊断、 基因治疗提供一些参考依据。
微量高速离心机 545C( pedf ; 1 E pno ) 微量高 速冷冻离心机 584R( pedf ; 0 E pno ) 紫外分光光度 仪 8 5 ( get ; 3 A in) 杂交箱 H . 0 ( V ) 生物芯 4 l L2 0 U P ; 0 片扫描仪 40 0B A o ) 恒温水浴 C N . / M 0 ( xn ; B 83 H T 0 20 H t) 杂 交 盒装 置 ( ign ; 0(e ; o Lf e ) 电动 匀 浆 器 ( e 宁 波新 芝 ) 。
13 1 样品准备 ..
取经病理证实 胃体部位 胃癌 、 食
管中下段食管癌的临床标本各 3 。其 中胃癌取胃 例 正 常黏膜 组织 作 为 对 照 , 食 管 癌则 取 食 管切 除手 而
收稿 日期 :060 —2 2 0 -51 基金项 目: 国家 “ 十五” 8 3 重大专项基金资 助项 目(0 2 A Z 0 0 “6 ” 20A 223 )

黑斑蛙核型、C-带及Ag-NORs 研究

黑斑蛙核型、C-带及Ag-NORs 研究

带技术 (? !? !!> A + 选取 #!)2 片 龄 的 染 色 体 标 本 在 & Q M !C . : 室 温" $ 蒸 馏 水 漂 洗 后$ 再将标 5! O > :溶液中处 理 ( 本浸于 # 注 ! &a 的 #b \ 7 H O" &C 8 9! !( ! 溶液 中 # 意密闭 "$ 蒸 馏 水 漂 洗 后 放 入 !c+ + > 溶液! ’ &a " 中处理 (5 自来水漂洗后 $ 再经蒸馏水漂洗 $ 干燥后 $ $ 冲 洗$ 自然干燥后镜 #b S 8 1 C J 7液染色$ &C 8 9 % & ) 检 ( (? !? $!F A 6 H I J技术 G 在其上 培养 皿 底 部 放 一 用 蒸 馏 水 湿 润 的 滤 纸 $
!" # $ % (# ) *+ , ’ # *$ / 0 1 , ( % 2 ( ( % & . &’ & 3, ! 0 4 5 6 72 (6 , ( ,( 2 ’ 8 , 9 $ : , # , 3 3
$ $ $ $ $ $ + O PO 1 9 A Q 8 7 9 R O F 6 S> 5 , 9 TU V 7 . Q PW 1 8 A L 8 9 X H 6 SY , A T 1 8 W F 6 SY . 9 A O . 9 G G G G G $ $ $ Q P UO , 7 9 A V 8 9 < F 6 SZ 8 9 A @ 7 9 S F H[ 8 7 9 A S , . R O U\ 8 A > 7 8 G G
(! 材料和方法
(? (! 实验材料 黑斑蛙 ! 编号为 (! # ; ;+ 9 1 : ; / 6 2 ; ? ;" ( &只$ . 雌雄各 # 只 ! 雌# 雄# $ 于! ( &$ &" & & #年* (!#$ ’!( 月! 日捕捉自徐州市铜山新区 ( ) (? !! 实验方法 (? !? (! 染色体标本制备法 采用外周血淋巴细胞培养的方法制备染色体标

西北大学历史

西北大学历史

西北大学历史走进那里已经超过10年了,离开那里马上8年了,忘记是无可挽回的自然法则,可是,我们真的能够忘记?我们这些从那里走出来的“才子”或者“柴子”!-那是最好的四年,那是最坏的四年。

对这个我们似乎能够熟知一草一木,熟知孔子像背后紫藤园何时飘香,熟知图书馆前白玉兰何时绽放的地方,我们在告别了它这么多年之后,我们对它又有多少了解?-爱它也罢!恨它也罢!它已经在我们的生命深处雕上了深深的印痕。

-不说是怀念,不说是铭记,当我们漂流在外路过西安的时候,能再去西南城脚的边家村,走一走不知是否依旧熙熙攘攘的大学南路,在不知道还是否存在的大鹏网吧里呼吸着污浊的空气打开《暗黑破坏神》在细雨中继续斩妖除魔。

-在了解那些我们不曾了解的历史之前,谨以此并非废话为记!---西北大学文学院的贾三强教授,有一个理想,那就是有那么一天,可以中兴西大学的文学院。

毕竟对于这个培养出贾平凹、王刚、何西来、雷抒雁……等等一大批文化界名人的地方,它已经沉默了许久。

-西北大学经管学院的任保平教授的一个愿望,就是能够在西北大学再培养出一批如张曙光、张维迎、魏杰、刘世锦……那样的经济学家。

-西北大学考古学系的王建新教授,当他率先在中国考古界提出“三位一体”的理论时,在他身后,依然是要思考着如何让西北大学的考古重新恢复“两大一院”的声威。

-西北大学的舒德干教授,这个在《自然》、《科学》以第一作者发表10篇论文的大学者,在北京的高校出重金挖他时,他说了一句话:我爱西北大学。

-………… ­-西北大学,这所中国西北最早的国立综合大学,坐落在西安六百年古老明城墙下,到今天已经走过了105年。

-当1901年,西太后慈禧一夜狂奔几百里,惶惶乎如丧家之犬从北京城一路逃到13朝古都西安时,她终于明白,应该颁发昭令废科举,办新式学堂,维新变革才能拯救国家。

当她回到北京城的第二年,陕西,这个西北重镇,第一所大学堂建立了。

第一任校长是当时称呼为总办叫吴树棻的清朝光绪年间的进士。

融合随机森林与SHAP的心脏病预测及其特征分析研究

第13卷㊀第11期Vol.13No.11㊀㊀智㊀能㊀计㊀算㊀机㊀与㊀应㊀用IntelligentComputerandApplications㊀㊀2023年11月㊀Nov.2023㊀㊀㊀㊀㊀㊀文章编号:2095-2163(2023)11-0172-08中图分类号:TP391文献标志码:A融合随机森林与SHAP的心脏病预测及其特征分析研究程祉元,张博良,蔡雨晨,马雨生,邵泽国,刘巧红(上海健康医学院医疗器械学院,上海201318)摘㊀要:心脏病是一种常见的心血管疾病,对人类生命健康有极大的威胁,准确预测是否患有心脏病能够帮助心脏病的早发现㊁早治疗,提升心脏病患者的生活质量和寿命㊂本文以克利夫兰心脏病数据集为研究对象,首先对原始数据集进行数据变换㊁标准化处理等工作,将处理后的数据作为随机森林模型的输入进行训练,将预测结果与线性逻辑回归㊁K-最近邻㊁决策树等多种机器学习模型进行比较,结果表明本文模型在准确率㊁查准率㊁查全率㊁F1值㊁AUC值等5种性能评价指标上均优于对比的模型㊂最后,引入了SHAP模型加强预测模型的可解释性,并进行特征分析识别出影响心脏病的主要因素,为临床决策提供可参考的依据㊂关键词:心脏病;随机森林;预测模型;SHAP;特征分析CombinationofRandomForestandSHAPforheartdiseasepredictionandfeatureanalysisresearchCHENGZhiyuan,ZHANGBoliang,CAIYuchen,MAYusheng,SHAOZeguo,LIUQiaohong(SchoolofMedicalInstrumentation,ShanghaiUniversityofMedicineandHealthSciences,Shanghai201318,China)Abstract:Heartdiseaseisacommoncardiovasculardisease,whichfurtherposesthreatstohumanhealth.Accuratepredictionofheartdiseasecanfostertheearlydetectionandtreatmentofheartdisease,andfurthermoreimprovethelifequalityandlongevityofpatientswithheartdisease.ThisstudyisbasedontheClevelandheartdiseasedataset.Intheresearch,onthebasisofdatatransformationandnormalizationoftherawdataset,theprocesseddataaretrainedastheinputofrandomforestmodel.ThepredictionresultsarecomparedwithLR,KNN,decisiontreeandothermachinelearningmodels.Theresultsshowthatthemodelissuperiortothecomparisonmodelinfiveperformanceevaluationindexes,suchasaccuracy,precision,recall,F1-scoreandAUC.Therefore,theSHAPmodelisintroducedtoenhancetheinterpretabilityofpredictionmodel,andthemainfactorsaffectingheartdiseaseareidentifiedbyfeatureanalysis,providingareferencebasisforclinicaldecisionmaking.Keywords:heartdisease;RandomForest;predictionmodel;SHAP;featureanalysis基金项目:国家自然科学基金(61801288);上海市科委科技创新行动计划项目(22DZ2305300);国家社会科学基金(20BTQ073)㊂作者简介:程祉元(2001-),女,本科生,主要研究方向:医学大数据分析;张博良(2002-),男,本科生,主要研究方向:医学大数据分析;蔡雨晨(2003-),男,本科生,主要研究方向:医学大数据分析;马雨生(2001-),男,本科生,主要研究方向:医学大数据分析;邵泽国(1978-),男,博士,副教授,主要研究方向:人工智能与计算医疗㊂通讯作者:刘巧红(1979-),女,博士,副教授,硕士生导师,主要研究方向:医学图像处理㊂Email:hqllqh@163.com收稿日期:2022-11-090㊀引㊀言人的循环系统包括心脏㊁血管以及调节血液循环的神经体液组织,而循环系统疾病(心血管病)包括了上述所有组织器官的疾病,而心脏病在其中最为多见,也常见于内科疾病,会导致患者的劳动力严重丧失㊂随着生活水平的提高,人们对自己的生活质量,尤其是身体健康有着更高的要求㊂然而,根据‘中国心血管健康与疾病报告2020“,心血管疾病约有3.3亿人,包括1300万脑卒中,1139万冠心病,500万肺源性心脏病,4530万下肢动脉疾病以及2.45亿高血压[1]㊂心血管病给社会带来的经济负担日益加重,已成为重大的公共卫生问题㊂研究可知,心脏病因其多样复杂的发病类型㊁极高的死亡率,成为了医学上多年来想要攻克的难题[2]㊂现阶段心脏疾病的诊断更多依赖于医生对各类检查生成的医学影像的阅片以及患者的生活环境㊁家族病史㊁生理指标等因素的综合诊断㊂最终的诊断结果易受到医生经验和诊断方式等主观因素影响,不同医生的诊断结果常常不一致,甚至出现误诊和漏诊等现象[3]㊂近年来,随着人工智能在医疗领域逐步深入的应用,人们发现利用机器学习算法针对医疗健康数据建立模型,辅助医生对于疾病的诊断,增强评估的客观性,可以大大提高诊断准确率㊂同时,还可降低医生由于自身临床经验不足及疲劳工作而导致的误判风险,提高诊断效率,以及解决现阶段普遍存在的医疗诊断滞后性的问题,做到早发现㊁早干预㊂例如,林志远[2]采用了决策树算法构建了心脏病预测模型,分析了ID3和CART的区别㊂李岭海[4]对比SIFT㊁SURF㊁KAZE,发现深度学习可以提高分类超声心电图的准确率,对心脏病的分类效果更好㊂石胜源等学者[5]的实验结果表明,随机森林算法在心血管疾病预测中准确率为73.55%,具有较大的优势,并且性能优于其他算法,对心血管疾病的预测研究和早期病人的及时有效治疗具有重要意义㊂陈洞天等学者[6]利用Xgboost模型预测心脏病,准确率为76.5%,且利用了指标分析法对预测模型的进行特征分析㊂Krithiga等学者[7]利用贝叶斯分类器应用于冠心病的早期预测,取得了不错的效果㊂王健等学者[8]提出了一种基于特征组合和卷积神经网络的方法预测心脏病,准确率为89.9%,但缺少该预测方法的可解释性,即不能说明该算法的内部预测过程及其是否与临床诊断方法吻合㊂本文基于集成学习随机森林算法,以克利夫兰心脏病数据集作为研究对象,在对其进行数据预处理㊁模型训练㊁超参数优化㊁模型性能分析㊁可解释性等工作的基础上,建立了性能优越的预测模型㊂本文的主要工作体现在以下2个方面:(1)提出使用随机森林模型预测心脏病,并通过网格搜索技术进行参数优化提高模型性能,采用准确率㊁查准率㊁查全率㊁F1值㊁AUC值等5种指标评价预测效果,混淆矩阵㊁AUC可视化分析预测效果,与线性逻辑回归㊁K-最近邻㊁决策树等模型对比,验证了本文模型性能的优越性㊂(2)在保证随机森林模型预测性能的基础上,引入SHAP可解释性模型来增强随机森林模型的可解释性,对影响心脏病的关键因素进行了特征分析,为心脏病的临床诊断和决策提供了可参考的依据㊂1㊀方法及原理1.1㊀随机森林算法随机森林算法的本质是利用集成理论将多个弱分类器(决策树)通过训练之后生成多棵独立分布的决策树并将决策树集成一体,形成强分类器(随机森林)㊂算法有效地解决了单棵决策树存在的不稳定性㊁无法保证全局最优及过度拟合等问题㊂这是Bootstrap与决策树算法的结合,方法是先从原始数据集D中采用Bootstrap重采样技术,采用放回式取样抽取一定数量的训练样本集,生成对应数量的决策树;决策树训练过程中,每个节点的特征都是从该决策树数据集特征中按照特定比例地无放回随机抽取新的特征子集[9];最后,从新特征子集中选出能使信息增益率最大化的特征,并以其为分割点㊂信息增益公式如下:㊀Gain(D,a)=Ent(D)-ðvv=1|Dv|DEnt(Dv)(1)其中,Gain()表示信息增益;Ent()表示信息熵;D表示原始数据集;a表示新特征子集中某个特征;v表示使用特征a有v个可能的分支节点㊂最终分类结果,由所有独立决策树的结果投票决定,公式如下:H(x)=argmaxYðki=1I(hi(x)=Y)(2)㊀㊀其中,H(x)表示对样本x的包外预测;k表示弱分类器的迭代次数;h()表示基学习器;Y表示某个样本特征的标签;I表示示性函数㊂这种方式保证了输入每棵决策树的训练集的随机性以及每个划分节点的随机性㊂优势在于其能够处理高维度数据集,实现比较简单,训练速度快,还可以将不平衡数据集的误差缩小,并对于存在大量缺失值的数据样本也能较好地处理㊂1.2㊀SHAP模型解释随机森林预测模型虽然可以得到较高的准确率,但其 黑盒 性质决定了对结果的解释力很弱,例如很难解释为什么算法可以准确预测患者是否罹患特定的疾病㊂SHAP(SHapleyAdditiveexPlanation)能够观察到某一个样本的预测中各个特征对预测结果产生的影响,对随机森林模型的单个预测做出解释㊂SHAP模型的原理是给每个单独的预测样本都生成一个预测值,而单个样本中对应其特征分配的数值表现为SHAPvalue㊂假设第i个样本的第j个特征为xij,模型对该样本的预测值为yi,模型的基线(默认所有样本目标变量的均值为基线)为ybase,那么SHAPvalue服从以下公式:yi=ybase+f(xi1)+f(xi2)+ +f(xim)(3)371第11期程祉元,等:融合随机森林与SHAP的心脏病预测及其特征分析研究其中,f(xij)表示第i个样本的第j个特征对样本预测值yi的贡献度㊂当f(xij)>0,表示该特征使得预测值升高,有积极的影响;反之,则说明该特征使得预测值降低,有消极的影响[6]㊂SHAPvalue的优势在于SHAP能反映出每一个样本中各特征的影响力以及影响力的正负性,并且特征本身在模型内部还有交互作用㊂本文利用SHAP来解释随机森林算法内部是如何预测结果的㊂2㊀分类模型构建2.1㊀模型构建心脏病分类预测模型的设计思路主要包含数据探索,对数据集的统计分布进行可视化展示,观察数据的分布情况;特征工程,完成数据预处理,如数据变换㊁数据标准化等,保证数据的质量;模型构建,构建随机森林的心脏病预测模型;超参数优化,采用网格搜索技术对随机森林算法的超参数进行优化调参,提高模型的预测能力;模型训练,利用十折交叉验证将数据集随机地划分为训练集和测试集进行验证,提高模型的泛化能力;可解释性分析,采用SHAP对模型中的心脏病的影响因素进行解释分析,增强模型的可解释性㊂整个基于随机森林的心脏病风险预测及特征分析模型的构建流程如图1所示㊂泛化能力分析随机森林预测模型风险预测模型模型训练参数优化特征分析模型模型解释分析S H A P 模型数据标准化数据变换数据探索数据图1㊀心脏病风险预测及特征分析模型流程图Fig.1㊀Flowchartofheartdiseaseriskpredictionandcharacteristicanalysismodel2.2㊀数据探索本研究采用kaggle平台提供的数据集,其来源于UniversityofCalifornia,Irvine(UCI)机器学习数据库中的theClevelanddatabase数据集,此数据库包含76个属性,但所有已发布的实验都引用并使用其中14个属性的子集,即克利夫兰心脏病数据集㊂该数据集中一共有303个样本,每个样本有14个特征,其中13个特征为自变量,描述样本的基本患病信息,最后1个特征 Target 为因变量,表示患者是否患有心脏病,所有的特征及其含义见表1㊂表1㊀克利夫兰心脏病数据集的基本特征Tab.1㊀BasiccharacteristicsoftheClevelandheartdiseasedataset编号特征属性特征属性含义特征类型1age年龄,1 100数值型2sex性别,1=male,0=female分类型3cp胸痛类型,0=典型心绞痛,1=非典型心绞痛,2=非心绞痛,3=没有症状分类型4trestbps静息血压,90 200数值型5chol血清胆固醇,100 600数值型6restecg静息心电图,0=正常,1=患有ST-T波异常,2=根据Estes的标准显示可能或确定的左心室大分类型7fbs空腹血糖,>120mg/dl;1=true,0=false分类型8thalach达到的最大心率,90 200数值型9exang运动诱发的心绞痛,1=yes,0=no分类型10oldpeak相对于休息的运动引起的ST值,0 5数值型11slope运动高峰ST段的坡度,1=upsloping㊁向上倾斜,2=flat㊁持平,3=downsloping㊁向下倾斜分类型12ca大血管数量,0 3数值型13thal地中海贫血,1=正常,2=固定缺陷,3=可逆转缺陷分类型14target生病有无,1=yes,0=no分类型㊀㊀通过对数据质量的探索和数据特征的分析,观察数据样本和特征的数量㊁数据类型及数据概率分布等信息,用于指导预测模型建立㊂根据对心脏病原始数据的描述性统计分析发现,未患病人群中男性所占比例远超女性,而患病人群中男性占比仍多于女性㊂将年龄对患病情况的影响绘制出的柱状统计分布如图2所示㊂由图2可知,中年患病几率较大㊂471智㊀能㊀计㊀算㊀机㊀与㊀应㊀用㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第13卷㊀29343537383940414243444546474849505152535455565758596061626364656667686970717476771t a r g e t01t a r g e ta g ea g em i d d l e a g ep u b e re l d e r80706050403020100c o u n t121086420c o u n t 图2㊀根据年龄分析患病情况Fig.2㊀Analysisofprevalencebyage㊀㊀图3是心脏病数据集中14个特征的单变量分布密度图,从图3中可以看出每个特征的数据类型及取值分布,其中age㊁trestbps㊁chol㊁thalach和oldpeak五个特征为连续型特征,sex㊁cp㊁fbs㊁restecg㊁exang㊁slope㊁ca㊁thal和target九个特征为非连续型特征,需要进行数据预处理操作㊂0.050.040.030.020.01020304050607080a g e D e n s i t y0.80.60.40.20-11234C D0.0080.0060.0040.0020100200300400500600c h o l D e n s i t yD e n s i t y-0.500.51.01.52.52.01.51.00.50s e x0.030.020.01080100120140160180200220t r e s t b p s-0.2500.250.500.751.001.25f b s 14121086420D e n s i t yD e n s i t yD e n s i t y1.751.501.251.000.750.500.250-0.500.51.01.52.02.5r e s t e c gD e n s i t y2.52.01.51.00.5-0.500.51.01.5e x a n g D e n s i t y1.501.251.000.750.500.25-0.500.51.01.52.02.5s l o p eD e n s i t y2.01.51.00.50D e n s i t y-1012345c a 1.00.80.60.40.20D e n s i t y0246o l d p e a k0.0200.0150.0100.0050D e n s i t y5075100125150175200225t h a l a c h 2.01.51.00.50D e n s i t y-0.50-0.2500.250.500.751.001.251.50t a r g e t 0123t h a l2.01.51.00.50D e n s i t y图3㊀单变量特征统计分布Fig.3㊀Statisticaldistributionofunivariatecharacteristics2.3㊀特征工程2.3.1㊀特征相关性图4给出了能够反映特征之间关系的热力图,通过热力图来发掘特征之间的关系㊂热力图表示了571第11期程祉元,等:融合随机森林与SHAP的心脏病预测及其特征分析研究2个数据之间的相关性,数值范围是-1到1之间,大于0表示2个数据之间是正相关的,小于0表示2个数据之间是负相关的,等于0就是不相关㊂由图4可知,cp㊁thalach和slope这3个特征与target之间正相关且系数大,表明其与是否患病的关系较为密切㊂a g e s e x c p t r e s tb p sc h o l f b s r e s t e c g t h a l a c h e x a n g o ld pe a k s l o p e c a t h a l t a r g e ta g es e xc pt r e s t b p sc h o lf b sr e s t e c gt h a l a c he x a n go l d p e a ks l o p ec at h a lt a r g e t1.00.80.60.40.20-0.2-0.4图4㊀各项特征之间的相关性热力图Fig.4㊀Thermodynamicdiagramofcorrelationbetweenfeatures2.3.2㊀非连续型数值转换经过数据探索和特征相关性分析发现,cp㊁thal和slope为不连续的多分类特征,该类型的数据不适合作为分类器输入,因此,首先将cp㊁thal和slop三个特性转换成独热编码的形式参与模型训练㊂原始特征cp转换为4个代表不同取值的特征cp_0㊁cp_1㊁cp_2和cp_3,原始特征thal转换为4个代表不同取值的特征thal_0㊁thal_1㊁thal_2和thal_3,原始特征slope转换为3个代表不同取值的特征slope_0㊁slope_1和slope_2,并将原始特征删除㊂经过数据转换处理后的特征维度由原始数据的14增加到了22㊂2.3.3㊀数据归一化为了消除数据之间的量纲影响,减小数据集中数据的差异性,对数据进行了归一化处理,将数据统一归一化到[-1,1]之间㊂原始数据经过数据标准化处理后,处于同一数量级,能够有效地提升模型精度和收敛速度㊂2.4㊀参数优化随机森林模型涉及到多个参数选择,参数值的选择影响到模型的性能㊂具体的参数取值见表2㊂对于表2中的6个核心参数,本文采用了网格搜索技术进行调参㊂网格搜索在规定的参数取值范围内逐步调整参数,用调整后的参数对随机森林模型进行训练,使得模型性能最优的参数确定为最佳参数㊂表2㊀随机森林算法参数意义及取值Tab.2㊀Meaningandvalueofrandomforestalgorithmparameters编号参数参数意义参数取值范围参数取值1max_features构建决策树最优模型的最大特征数1,3,532max_leaf_nodes最大叶子节点数/163n_estimators对原始数据集进行有放回抽样生成的子数据集个数,即决策树的个数400,420,4404204n_jobs设定工作的core数量-1表示cpu里的所有core进行工作/-15oob_score是否采用袋外样本来评估模型的好坏/True6random_state随机模式的设置,指定随机数生成器的种子/6663㊀实验分析3.1㊀模型性能度量为了客观评价该算法的有效性,采用了F1值㊁准确率㊁查准率㊁查全率和AUC值这5种评价指标对模型性能进行度量㊂(1)准确率(Accuracy)㊂表示所有样本中被预测正确的样本的比率㊂可由如下公式计算求值:Accuracy=TP+TNTP+TN+FP+FN(4)㊀㊀(2)查准率(Precision)㊂表示预测样本中预测为真阳性的概率㊂可由如下公式计算求值:Precision=TPTP+FP(5)㊀㊀(3)查全率(Recall),真阳性率(TruePositiveRate,TPR),灵敏度(Sensitivity)㊂表示阳性样本被预测为真阳性的概率㊂可由如下公式计算求值:Recall=TPTP+FN(6)㊀㊀(4)F1值(F1-score)㊂用来衡量二分类模型671智㊀能㊀计㊀算㊀机㊀与㊀应㊀用㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第13卷㊀精确度的一种指标,可以看作是模型查准率和查全率的一种加权平均㊂该指标同时兼顾了分类模型的查准率和查全率,最大值是1,最小值是0㊂可由如下公式计算求值:F1-score=2ˑTP2ˑTP+FN+FP=2ˑprecisionˑrecallprecision+recall(7)其中,真阳性(TruePositive,TP)表示样本中正确识别的数量;假阳性(FalsePositive,FP)表示样本中错误识别的数量;真阴性(TrueNegative,TN)表示正确识别为错误的样本数;假阴性(FalseNegative,FN)表示错误识别为正确的样本数㊂除了上述指标之外,还使用了ROC曲线和AUC值㊂3.2㊀模型性能评估3.2.1㊀模型对比为验证本文的随机森林模型的有效性,与逻辑回归㊁K-最近邻㊁决策树等常用模型进行比较分析㊂为了提高模型之间对比的公平性及可靠性,实验中采用了十折交叉验证方法进行性能评估㊂各种模型在准确率㊁查准率㊁查全率㊁F1值和AUC值这5项指标上的对比结果见表3,各种模型的ROC曲线对比如图5所示㊂从表3和图5的实验结果可以看出,本文的集成学习模型随机森林的预测准确率为86%,查准率为85%,查全率为83%,F1值为84%,AUC值为0.89,均高于其它对比的方法㊂随机森林模型的ROC曲线(红色)下方面积比逻辑回归模型㊁K-最近邻模型㊁决策树模型的面积大,由ROC曲线的性质可知,曲线下方面积(AUC)越大㊁准确率越高,体现了本文模型的优越性㊂表3㊀不同分类模型对阳性样本的预测能力Tab.3㊀Thepredictiveabilityofdifferentclassificationmodelsforpositivesamples模型准确率查准率查全率F1值AUC值逻辑回归0.800.800.800.800.89K-最近邻0.820.830.830.830.86决策树0.720.730.730.720.79随机森林0.860.850.830.840.89㊀㊀各种模型的训练时间和测试时间的对比见表4㊂随机森林模型作为一种集成学习算法,模型复杂度本身高于其它几种对比的方法,同时采用网格搜索技术的参数优化较为耗时,因此在训练时间上相对较长㊂图6还给出了本文模型的混淆矩阵,可以看出预测结果中,测试集中非心脏病被预测为非心脏病有27例,心脏病被预测为心脏病有36例,非心脏病被预测为心脏病有8例,心脏病被预测为非心脏病有5例㊂显而易见的是,随机森林模型的真阳性和真阴性数量高,而假阳性和假阴性的值较低,因此,本文提出的模型有较好的分类性能㊂K N NL o g_R e gd t_C l fR F_C l f00.20.40.60.81.0F P r a t e1.00.80.60.40.2TPrate图5㊀四种模型的ROC曲线Fig.5㊀ROCcurvesforthefourmodels表4㊀各模型时间性能比较Tab.4㊀Comparisonoftimeperformanceofeachmodel模型Train平均用时/sTest平均用时/s逻辑回归3.260.00K-最近邻2.910.02决策树2.690.00随机森林9.890.0336302418126预测值0/1C o n f u s i o n m a t r i x-R a n d o m F o r e s t1实际值/101图6㊀随机森林的混淆矩阵Fig.6㊀Confusionmatrixofrandomforests3.2.2㊀相关研究对比为了进一步验证本文模型的优越性,与文献[8]㊁文献[10]㊁文献[11]和文献[12]等相关工作进行了对比实验㊂所有文献都针对克利夫兰心脏病数据集进行研究,文献[8]首先采用特征组合增强样本的属性关联,再利用卷积神经网络模型进行训练,在准确率上获得了高达90%的预测精度㊂文献[10]与本文模型相似,但其样本量在克利夫兰心脏病数据集的基础上增加到573个,且在网络搜索优化参数上仅优化了n_estimators㊁max_depth㊁max-771第11期程祉元,等:融合随机森林与SHAP的心脏病预测及其特征分析研究Leaf_nodes三个参数㊂文献[11]使用未优化的随机森林模型训练获得了85%的准确度㊂文献[12]基于聚类和XGBoost算法进行预测分析,准确率达到83%㊂不同方法的准确率比较见表5㊂从表5可以看出,本文模型的预测结果优于文献[10]㊁[11]和[12],但略低于文献[8]㊂然而本文与其它文献的最大区别之处在于,本文在模型训练后,引入了SHAP可解释性模型,对模型进行可解释增强,识别出临床实际中影响心脏病的主要因素,为临床上的诊断和决策提供了有利的参考㊂表5㊀不同方法的准确率比较Tab.5㊀Comparisonofaccuracyofdifferentmethods文献方法准确率[8]特征组合+卷积神经网络0.90[10]随机森林+网格搜索0.83[11]随机森林0.85[12]聚类+XGboost0.83本文随机森林+网格搜索+SHAP0.863.3㊀基于SHAP的模型可解释性分析图7是随机森林模型的特征重要性排序图㊂图7中,纵坐标是从上到下按照特征重要性排序的各个特征,横坐标是平均SHAP值㊂图7中显示特征重要性排序前六的特征分别是thal_2(固定缺陷型地中海贫血症)㊁cp_0(典型心绞痛)㊁ca(大血管数量)㊁thal_3(可逆转缺陷型地中海贫血症)㊁oldpeak(运动高峰的心电图ST段)㊁thalach(最大心率),可见这6个因素是影响是否患有心脏病的最关键因素㊂00.010.020.030.040.050.060.07m e a n (|S H A P v a l u e |)(a v e r a g e i m p a c t o n m o d e l o u t p u t m a g n i t u d e )t h a l _2c p _0c a t h a l _3o l d p e a k t h a l a c h e x a n g s l o p e _2c p _2s l o p e _1图7㊀基于SHAPvalue的特征重要性排序Fig.7㊀SortsbyfeaturesimportancebasedonSHAPvalue㊀㊀图8显示了SHAP摘要图,该图对影响心脏病患病的因素重要性进行了排序㊂图8中的一个点表示一个样本,样本点的颜色从蓝色到红色表示样本特征值从小到大,纵坐标的各特征标签不仅显示了特征重要性排序,还显示了各个特征值与SHAP值的关系与分布㊂图8中绘制了重要性排序前10的特征对预测结果的影响,其中thal_2(固定缺陷型地中海贫血症)㊁thalach(最大心率)对预测结果有正向贡献,cp_0(典型心绞痛)㊁ca(大血管数量)㊁thal_3(可逆转缺陷型地中海贫血症)㊁oldpeak(运动高峰的心电图ST段)对模型预测为心脏病的输出结果有负向贡献㊂t h a l _2c p _0c at h a l _3o l d p e a k t h a l a c h e x a n g s l o p e _2c p _2s l o p e _1-0.10-0.050.050.10S H A P v a l u e (i m p a c t o n m o d e l o u t p u t )H i g hL o wF e a t u r e v a l u e 图8㊀SHAP特征分析Fig.8㊀SHAPfeatureanalysis4㊀讨论与分析临床上,诊断心脏病的常规检查主要有常规心电图(ECG)与动态心电图(DCG),心电图异常可提示心肌梗死㊁心肌缺血㊁心肌炎㊁心室肥厚等病症㊂相关研究对于各类心脏疾病的诊断有如下常见的标准:(1)心电图ST段趋势的改变可以作为重要参考依据,指标过高可能是冠心病,指标过低则有可能是心肌缺血等病症,还用以诊断确定心室是否肥大[13-15]㊂(2)心肌缺血在ECG的诊断标准为在同一导联上,T波小于R波的十分之一,同时,ST段水平下移0.05mV及以上;在DCG的诊断标准为与等电位线比较,ST段下斜或压低0.1mV及以上并持续下移大于1min[16]㊂(3)冠心病㊁肥厚型心肌病常伴有心绞痛等症状,分为典型心绞痛和非典型心绞痛,主要的病因为心肌缺血㊂(4)荧光显色主要血管数目越少(数目与血糖㊁胆固醇相关)证明血液流动越通畅,血管腔狭窄会使患冠心病的风险大大增加[17-18]㊂临床常选择冠脉造影这种有创性检查,作为判断动脉狭窄程度的 金标准 ㊂871智㊀能㊀计㊀算㊀机㊀与㊀应㊀用㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第13卷㊀(5)地中海贫血症是先天性贫血症影响红细胞的寿命,易导致红细胞数量不足,使得体内铁超载,从而加重心脏负担,长期的慢性贫血会诱发心绞痛,会造成心力衰竭[19-20]㊂本文通过对原始数据集的预处理,构造了一个包括22个影响心脏病患病可能的特征,并将这些特征作为随机森林模型的输入,结合网格搜索技术的调优和十折交叉验证的模型训练,取得了高达86%的准确率㊂进一步利用SHAP模型对所有特征进行了事后解释分析,通过特征分析发现thal(地中海贫血类型)㊁ca(主要血管数目)㊁cp(心绞痛)㊁oldpeak(心电图ST段趋势的改变)㊁thalach(最大心率)㊁exang(心绞痛型胸痛)等指标都是影响心脏病患病的重要因素㊂对于地中海贫血,综合观察thal_2㊁thal_3,可以看出固定缺陷型地中海贫血与心脏病风险显著正相关,即会明显增加风险;而可逆转缺陷型对风险的增加不明显㊂对于心绞痛,综合观察cp_0㊁cp_2以及exang,可以看出心绞痛㊁无论典型心绞痛还是非典型心绞痛,亦或是运动诱发的心绞痛对风险的增加不明显;而非心绞痛型的胸痛与心脏病风险呈正相关,会明显增加风险;究竟哪些非心绞痛型的胸痛明显增加心脏病风险还需进一步探讨㊂从ca指标可以观察到,大血管数量越少,心脏病风险系数越高;同样,oldpeak值(即相对于休息的运动引起的ST值)越低,心脏病风险系数越高㊂从thalach指标可以很明显地看到最大心率值越大,心脏病风险系数越高㊂综合观察slope_1㊁slope_2,可见运动高峰ST段的坡度持平与心脏病风险成正相关,ST段的坡度向上倾斜与心脏病风险成负相关,这与心电图运动试验阳性诊断标准条件之一 运动中或运动后ST段程水平或下斜型压低ȡ0.10mV 相吻合㊂5 结束语本文基于集成学习的随机森林算法构建了心脏病预测模型,同时引入了SHAP对预测模型做进一步增强解释㊂首先针对Kaggle平台提供的心脏病数据集进行数据变换㊁标准化等预处理后,采用网格搜索技术对模型的参数进行优化,并对处理后的数据集进行十折交叉验证训练模型;然后,采用查准率㊁查全率㊁F1值㊁混淆矩阵㊁AUC值等指标对模型进行评估,与逻辑回归㊁K-最近邻㊁决策树等机器学习模型的结果进行对比,验证了随机森林具有较强的泛化能力㊁更好的分类效果;最后,还引入SHAP模型对随机森林模型做进一步解释,识别出影响心脏病患病的主要因素,并解释这些特征与临床诊断的关系㊂模型增加了可解释说明,从而提高了模型的分类识别效率,为临床决策服务,具有重要的实用价值㊂参考文献[1]国家心血管病中心.‘中国心血管健康与疾病报告2020“概述[J].中国心血管病研究,2021,19(7):582-590.[2]林志远.基于决策树算法的心脏病预测研究[J].电子制作,2019,370(6):25-27.[3]赵梦蝶,孙九爱.机器学习在心血管疾病诊断中的研究进展[J].北京生物医学工程,2020,39(2):208-214.[4]李岭海.基于深度学习的心脏病检测的研究[J].现代计算机(专业版),2017(9):91-93,110.[5]石胜源,朱磊,叶琳,等.基于随机森林算法的心血管疾病预测研究[J].智能计算机与应用,2021,11(4):176-178,181.[6]陈洞天,单杰,周文丹.基于Xgboost的心血管疾病预测模型和指标分析研究[J].现代医院,2021,21(6):958-961.[7]KRITHIGAB,SABARIP,JAYASRII,etal.EarlydetectionofCoronaryHeartDiseasebyusingNaiveBayesAlgorithm[J].JournalofPhysicsConferenceSeries,2021,1717(1):012040.[8]王健,李孝虔.一种基于特征组合和卷积神经网络的心脏病预测新方法[J].黑龙江大学自然科学学报,2019,36(1):115-120.[9]ASADIS,ROSHANSE,KATTANMW.Randomforestswarmoptimization-basedforheartdiseasesdiagnosis[J].JournalofBiomedicalInformatics,2021,115:103690.[10]赵金超,李仪,王冬,等.基于优化的随机森林心脏病预测算法[J].青岛科技大学学报(自然科学版),2021,42(2):112-118.[11]孙铁铮,于泽灏.基于机器学习的心脏病例分类预测研究[J].电脑知识与技术,2021,17(26):96-97+104.[12]刘宇,乔木.基于聚类和XGboost算法的心脏病预测[J].计算机系统应用,2019,28(1):228-232.[13]VOGELB,CLAESSENBE,ARNOLDSV,etal.ST-segmentelevationmyocardialinfarction[J].NatureReviewsDiseasePrimers,2019,5(1):39.[14]刘燕.心电图检查结合临床特征在冠心病心绞痛诊断中的应用价值分析[J].中国实用医药,2021,16(2):16-18.[15]臧传欣.动态心电图对冠心病诊断价值的研究进展[J].中国医疗器械信息,2021,27(14):27-28,122.[16]肖蕾,孙晓臣,罗溶.动态心电图在冠心病心肌缺血与心律失常诊断中的价值分析[J].解放军医药杂志,2022,34(01):61-64.[17]北京高血压防治协会,北京糖尿病防治协会,北京慢性病防治与健康教育研究会,等.基层心血管病综合管理实践指南2020[J].中国医学前沿杂志(电子版),2020,12(08):1-73.[18]张博,潘晓芳,隋春兴,等.运动负荷超声心动图诊断冠状动脉严重病变假阴性结果的影响因素分析[J].中国循环杂志,2021,36(08):756-761.[19]SALAMAK,ABDELSALAMA,ELDINHS,etal.IronoverloadparametersandearlydetectionofcardiacdiseaseamongEgyptianchildrenandyoungadultswithβ-thalassaemiamajorandsicklecelldisease:across-sectionalstudy[J].F1000Research,2020,9:1108.[20]PEPEA,PISTOIAL,GIUNTAN,etal.Thestronglinkbetweenpancreasandheartinthalassemiamajor[J].EuropeanHeartJournal,2018,39(suppl_1):P3706.971第11期程祉元,等:融合随机森林与SHAP的心脏病预测及其特征分析研究。

从人类文明交往的高度把握世界历史_访彭树智教授


从人类文明交往的高度把握世界历史 期和结束不久, 我就连续出版了 叛徒考茨基 ( 1978) 、 修正主义的鼻祖 伯恩斯坦 ( 1982) 和
无政府主义之父巴枯宁 ( 1985) 3 本专著 , 共计 100 余万字。这几本书从恢复历史人物的本来面目 出发 , 通过系统研究经典作家的直接论述, 以及对时代性、 创造性、 复杂性和阶段性的探讨, 锻炼了 我寻找科学研究生长点的毅力。后来我曾经自嘲地说, 十年 文革 中自己是闯进国际共运史领域 的一名 游击战士 。 问: 您在 文革 结束后不再研究共运史, 而转入中东史研究 , 是什么促使你这样做的 ? 这也是受时代的影响。实际上 , 早在 1958 年 7 月伊拉克革命爆发时 , 我就接触到了中东研究。 当时血气方刚的我仅用了三天时间 , 就写成一篇一万两千余字的激情文章 略论阿拉伯民族解 放斗争的新阶段 , 在 人文杂志 上发表。但是, 我真正转向中东 , 却是在 21 年以后。 1979 年 , 苏联军队入侵阿富汗的隆隆坦克声震惊了世界和中国。作为阿富汗的邻邦中国的学 者应当对此作出反应 , 而我过去在印度近现代史方面的积累为此奠定了良好的基础。不久, 我就在 百科知识 1980 年第 3 期上发表了 1841 年阿富汗人民反对英国侵略者的斗争 一文 , 由此 , 步入 了中东史研究领域。 当时意识到 , 这是一个学术生长点转折的契机。中东史是一个我国有待开拓的领域 , 于是 , 我 当机立断 : 一定要啃下这块硬骨头 ! 我从两个方面着手, 一是展开对阿富汗近现代史的研究 , 二是 结合当时世界现代史教学的需要 , 对土耳其 民族解放运动 的领导人凯末 尔深入挖掘 , 其结果是 1980 年提交给世界现代史研究会年会的论文 凯末尔和凯末尔主义 , 后来发表于 历史研究 1981 年第 5 期。西北大学有一个有利条件, 就是 1964 年成立的中东研究所, 是我国最早成立的国际问 题研究所之一, 集中了一批掌握多种外语的人才 , 积累了大量的外文资料。同时 , 从 1982 年开始 , 我就注意培养中东史的硕士研究生 , 为未来中国的中东研究补充新生力量。经过精心准备 , 1986 年, 经国家学位委员会批准, 在西北大学建立了 世界地区史、 国别史 ( 南亚中东史 ) 博士点。作为 创点博士生导师 , 我认识到这是我国第一个中东研究的博士点, 对于中国的中东研究和人才培养具 有重要意义。 1987 年 , 我以历史系主任的身份兼任中东研究所所长。我选择有开拓性的课题, 组织集体攻 关, 加强国内外学术联系 , 取得了明显的成果。二十年来, 中东研究所的科研硕果累累, 先后出版了 由我主编的一系列中东史著作 : 阿富汗史 ( 1993) ; 阿拉伯国家简史 ( 1991) , 2002 年改名为 阿拉 伯国家史 , 作为教育部确定的全国研究生教学用书第三次修订再版 , 并于 2000 年获得了国家级优 秀教学成果二等奖; 在 1990 年海湾危机和海湾战争后, 又完成了面对广大青年的 中东国家和中东 问题 ( 1991) ; 1992 年出版了 二十世纪中东史 , 2001 年同样列为教育部确定的全国研究生教学用 书修订再版。2000 2007 年 , 商务印书馆陆续出版了我主编的 13 卷 中东国家通史 。上述著作为 中国的中东史学科建设打下了基础。

中国的生物各领域牛人

中国的生物各领域牛人(导师简介~)中国生物学优秀研究生导师金颖教授研究单位:中科院上海生命科学研究院健康科学研究所研究方向:胚胎干细胞推荐理由:学术水平高,可能是国内在胚胎干细胞领域最有才华的导师之一,已发表JBC,Humangenetics 等多篇文章。

对人诚恳,开朗大方,对学生非常好!有口皆碑!陈国强教授研究单位:中科院上海生命科学研究院健康科学研究所/上海交通大学医学院病理生理系研究方向:白血病的分化与治疗推荐理由:年轻有为,学术水平高,是将来院士的必然人选!近两年发表Blood 等多篇文章,学生非常多,但是从不缺Idea ,因此学生毕业时都非常优秀,而且一直奉行:只有导师不行,没有学生不行的原则。

无论人品,还是学术水平,均有口皆碑!曹雪涛院士研究单位:上海第二军医大学免疫教研室研究方向:免疫推荐理由:原本应该是中国最年轻的院士!是一个学术奇才!虽然一直在国内,但其一系列成果和发现都是国际级的,学术水平非常高!去年刚刚获评院士。

其人品,学术均佳。

程和平(peace)职称:NIH 研究员,北大长江特聘教授单位:北京大学分子医学研究所研究方向:calciumspark ,mitochondria推荐理由:北京大学生物医学研究领域万人景仰的peace 老师是calciumspark( 钙火花)领域的奠基者之一,1993 年Science 的一作文章已经成为calciumspark 领域的经典之作,目前已关闭了NIH 的实验室,全职回国;对专业领域的进展有深层的理解,对学生教导有方。

曾益新院士研究单位:中山大学肿瘤医院研究方向:癌基因、抑癌基因及基因治疗研究推荐理由:年轻有为,学术水平高,平易近人,谦虚勤奋!2002 年他的团队成功地把鼻咽癌易感基因定位在4 号染色体4p15.14q12区域,这是该领域研究上的突破。

曹晓风研究员研究单位:中国科学院遗传与发育研究所研究方向:DNA 甲基化建立及维持的分子机制;小分子RNA 在基因沉默和发育调控的作用研究推荐理由:1988 年毕业于北京大学生物系应用生化专业。

西北大学现代学院校情资料

西北大学现代学院校情资料西北大学现代学院是由西北大学申办、国家教育部批准设立的独立本科院校。

学院坐落于长安滦镇科教园陈北路一号。

校园总占地面积近千亩。

学院校园分为南北两区,南区为教学区,由韶光门、大型教学楼(文法、理工、经管、艺术共四栋)、大型图书馆一栋组成。

学院设有四个二级学院,开设20多个热门的特色专业,从事专科段、本科段,研究生段的高等教育。

西北大学现代学院是由西北大学申办、国家教育部批准设立的独立本科院校。

西大现代继承百年名校的光荣历史,以创新模式兴教办学,适应了中国高等教育的发展方向。

她既是历史的结晶,也是时代的骄子,是新生代适应新社会的大熔炉和练兵场。

学院坐落于长安滦镇科教园陈北路一号。

校园总占地面积近千亩(为目前陕西独立学院中拥有产权者的最大)。

这里远望终南山,近伴沣河水,在历史上一直是一块风水宝地。

著名的关中八景之一的“草堂烟雾”发生草草堂寺近在咫尺,“终南捷径”的成语故事就发生在这里。

更有要者,据我国文化史专家研究,中华文化的主流源在西周,西周文化的源流则出自沣水,这就是有名的“沣镐文化”。

我国历史上的开明君王李世民,当政后夏季就在这里办公,最后又在这里去世。

西安古城曾是十三个王朝的建都地,而各个王朝都把这里划为皇家内苑。

现在还有叫“内苑村”的村子在沣峪十字东南角。

进入现当代尤其是改革开放以来,人们盛誉这里为古城的“后花园”和西安的“绿色肺”。

现已被西安市规划为人文旅游科教区,禁止在这里筹办工厂,而只发展科研教育事业。

近年来相继有电子科大、西工大、石油大学、西工大明德学院、陕西青年职业学院等在这里建校。

据环境专家监测,这里的空气洁净度和氧含量要比西安高许多,这里的地下水源自秦岭,比西安的地下水纯净得多。

2007年4月被西安市信用协会评选为“信用体系建设示范院校”学院位于被称为西安后花园的滦镇科教园内,这里风光秀丽,气候宜人,远看终南山,近看沣河绿水,别墅林立,荷塘片片,被称为北方的小江南。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

陈超博士简历
陈超,男,1958年4月生,西北大学教授,博士生导师,国家微检测系统工程技术研究中心主任、陕西西大北美基因股份有限公司董事长,国家“十五”863计划生物信息专家组成员,教育部科学技术委员会学部委员,美中后基因组专家联合会主席,陕西省十届人大代表。

1982年毕业于西北大学,1988年赴美进修,1995年获美国哥伦比亚大学分子生物学博士学位。

1996年至2000年,任美国加州大学旧金山分校格拉斯栋研究所研究员并创建了加州大学旧金山分校基因芯片中心,2000年至2001年在美国惠普公司任资深研究员、基因芯片项目负责人,领导开发出了具有世界先进水平的基因芯片产品。

在国际刊物上发表了数篇有关基因芯片技术和基因调控的研究论文,申报了多项美国专利和中国专利。

1998年起应国内有关机构邀请,积极回国进行生物芯片的学术交流,是我国生物芯片领域的主要开拓者之一。

2001年辞去美国的工作,回国组建西北大学生物芯片研发中心并发起创立陕西西大北美基因股份有限公司,重点从事功能基因组学及微检测领域的研发工作。

2002年度国家西安高新创业服务中心颁发的创业者奖。

2003年度荣获中华全国归国华侨联合会授予的“创业者”奖。

目前,陈超博士专有的制备技术可设计出高通量、高灵敏度、特异性强、检测直观的高密度芯片,其技术水平在国内处于领先地位。

在陈超博士带领下,目前在微检测前沿技术领域开发了多种新技术和一系列创新项目,尤其是快速、高通量的磁隧道结生物芯片及磁性荧光微球技术都处于国际领先水平,建立高覆盖率寡核苷酸微阵列产业化技术研究及相关信息平台,已试产成功了中、高密度寡核苷酸芯片,其产品质量已经达到或超出国内外同类产品先进水平。

陕西西大北美基因股份有限公司目前承担国家十五“863”重大专项主题为“功能基因组学与生物芯片研究”项目一项,国家十五“863”计划项目五项,国家十五科技攻关西部开发重大项目一项,国家十五自然科学基金一项,2002年国家科技型中小企业创新基金一项,省市级科技计划项目十余项,获得国家科技经费总计2300余万元。

2001年3月,公司生物芯片研发中心被评定为“陕西省生物芯片工程技术研究中心”;2001年12月公司被陕西省政府认定为高新技术企业;2002年12月,以西北大学和陕西西大北美基因股份有限公司作为依托单位申请的“国家微检测系统工程技术研究中心”,获得国家科技部批复组建,批复经费500万元。

相关文档
最新文档