基于TCGA数据库的肝癌发生关键基因筛选

合集下载

基于生物信息学分析筛选与宫颈癌预后相关的关键基因

基于生物信息学分析筛选与宫颈癌预后相关的关键基因

基于生物信息学分析筛选与宫颈癌预后相关的关键基因覃念群;刘楷;米镜霖;张勇【期刊名称】《医学信息》【年(卷),期】2022(35)10【摘要】目的基于生物信息学筛选与宫颈癌预后相关的关键基因,寻找新的宫颈癌预后的生物标志物。

方法对癌症基因组图谱(TCGA)数据库中的CESC数据集和基因表达总表(GEO)数据库中的GSE39001数据集进行加权基因共表达网络分析(WGCNA),通过构建PPI网络,筛选出与宫颈癌预后相关的关键基因,分析关键基因在宫颈癌中的表达情况、预后和功能作用,并进行验证。

结果共筛选出69个宫颈癌差异基因,这些基因主要参与细胞有丝分裂和细胞周期调控;PPI筛选出10个与宫颈癌相关的关键基因,均表达上调,其中KIF22的高表达与宫颈癌的预后良好相关(P<0.05);构建KIF22生存预测模型,5年生存率的ROC曲线的AUC值为0.612;Western Blot检测宫颈癌组中KIF22的表达,结果显示,与癌旁正常宫颈组织相比,KIF22在宫颈癌组织中表达上调(P<0.05);功能富集结果显示,KIF22高表达与p53通路显著富集。

结论KIF22在宫颈癌组织中高表达,其可能是宫颈癌患者预后良好的关键基因,有可能成为一种潜在的治疗靶点和预后生物标志物。

【总页数】6页(P8-13)【作者】覃念群;刘楷;米镜霖;张勇【作者单位】广西医科大学第一附属医院放疗科;广西区域性高发肿瘤早期防治研究重点实验室【正文语种】中文【中图分类】R737.33【相关文献】1.基于生物信息学方法筛选与肝细胞癌发生和预后相关的潜在关键基因2.基于生物信息学方法筛选乙型肝炎病毒相关肝癌的关键基因和临床预后3.基于生物信息学方法筛选与肝细胞癌发生和预后相关的潜在关键基因4.基于生物信息学分析宫颈癌关键基因及预后相关生物标志物5.基于生物信息学分析筛选宫颈癌进展中的关键基因因版权原因,仅展示原文概要,查看原文内容请购买。

TCGA大数据挖掘之癌症驱动基因和突变

TCGA大数据挖掘之癌症驱动基因和突变

Comprehensive Characterization of Cancer Driver Genesand MutationsCell, April 2018背景●在精准肿瘤学中,识别癌症驱动分子至关重要。

●虽然目前存在一些算法来识别驱动事件,但缺乏将这些算法整合、优化、并应用于大数据中的研究。

●本研究对33种疾病类型、9000多个患者的致癌驱动基因和突变进行最大规模的系统性研究,并强调了在肿瘤患者中普遍存在一些临床可诉性驱动事件。

摘要●对TCGA数据库中33个癌种、9423例患者的外显子组采用PanSoftware 策略分析(共涉及到26个计算工具),来识别驱动基因和驱动突变事件。

●共识别了299个驱动基因、这些基因与它们的解剖学位点及癌症/细胞类型相关。

●基于序列和结构的分析,识别了>3,400个错义驱动突变位点,这些位点被多线证据支持。

●预测到的驱动突变中,有60%~85%的位点通过了实验验证。

●300多个MSI的肿瘤样本与PD-1/PD-L1的高表达相关,其中有57%的肿瘤样本存在临床可诉性事件。

意义该研究是迄今为止,对癌症基因和突变进行的最大规模的系统性研究,可以为将来的生物学和临床研究做出指导。

1. 癌症驱动基因的识别策略与效能●Figure 1A. 发现癌症驱动基因的策略:数据收集、工具开发、异常值校正、人工搜索、下游分析以及功能验证。

●Figure 1B. 在每个癌症类型中,体细胞突变数目均成广泛分布。

●Figure 1C. 每个癌种中,6种碱基的类型改变分布(转换和颠换)。

●Figure 1D. 对于单个癌症,有效突变的背景突变率中值为6.1%,且样本量越大,统计效能越好。

2. 癌症驱动基因的识别1.共识别了299个基因,其中利用系统方法识别到了258个基因,41个基因是利用人工搜索及额外的组学工具发现的。

2.Figure 2A. 外层每个扇形代表一个癌种,以及该癌种特异突变的驱动基因。

基于ESTIMATE评分挖掘肝癌微环境相关的预后基因

基于ESTIMATE评分挖掘肝癌微环境相关的预后基因

基于ESTIMATE 评分挖掘肝癌微环境相关的预后基因黄佳怡,张文键,高蕾,刘玲珑福建中医药大学,福建福州350122【摘要】目的基于ESTIMATE 评分筛选与肝癌肿瘤微环境预后相关的基因。

方法从TCGA 数据库中下载肝癌转录组数据,使用ESTIMATE 法计算肝癌组织的免疫和基质评分。

分析肝癌基质、免疫评分与肿瘤分级、分期、生存时间的相关关系。

Limma 包分析差异表达基因,进行基因功能富集分析和通路富集分析。

采用Cytoscape 中Mcode 模块筛选核心差异表达基因,并分析核心基因与肝癌预后、诊断和肿瘤免疫浸润细胞的相关关系。

结果筛选出肝癌微环境相关差异表达基因329个。

基因功能富集分析显示其主要参与免疫激活和调节等过程。

Cytoscape 筛选PPI 网络核心基因CCR5、SLAMF1、TRAF3IP3,在肝癌中高表达,且基因表达量高的患者的总生存期较低表达患者长,与肿瘤免疫浸润细胞比例呈正相关关系。

结论CCR5、SLAMF1、TRAF3IP3基因表达与肝癌的诊断、预后显著相关。

【关键词】肝癌;肿瘤微环境;ESTIMA TE 评分;免疫浸润细胞;预后【中图分类号】R735.7【文献标识码】A 【文章编号】1003—6350(2023)16—2287—08Prognostic value of tumor microenvironment-related genes in hepatocellular carcinoma based on ESTIMATE algorithm.HUANG Jia-yi,ZHANG Wen-jian,GAO Lei,LIU Ling-long.Fujian University of Traditional Chinese Medicine,Fuzhou 350122,Fujian,CHINA【Abstract 】Objective To better understand the prognostic value of tumor microenvironment-related genes in hepatocellular carcinoma (HCC)based on ESTIMATE algorithm.Methods The transcriptome data of HCC were downloaded from The Cancer Genome Atlas (TCGA),and the immune/stromal scores of HCC tissue were calculated us-ing the ESTIMATE algorithm.The correlations between liver cancer matrix,immune score,tumor grading,staging,and survival time were analyzed.Limma package was used to analyze differentially expressed genes and conduct gene func-tion enrichment and pathway enrichment analysis.Mcode module of Cytoscape was used to screen for core differentially expressed genes and analyze the correlation of core genes with the prognosis and diagnosis of HCC,and tumor immune infiltrating cells.Results A total of 329differentially expressed genes related to the microenvironment of HCC were screened.Gene function enrichment analysis showed that they mainly participate in immune activation and regulation processes.Core genes CCR5,SLAMF1,and TRAF3IP3were highly expressed in HCC,and patients with higher expres-sion had a longer overall survival time compared to patients with lower R5,SLAMF1,and TRAF3IP3were positively correlated with the proportion of tumor immune infiltrating cells.Conclusion The expression of CCR5,SLAMF1,and TRAF3IP3genes is significantly correlated with the diagnosis and prognosis of HCC.【Key words 】Hepatocellular carcinoma;Tumor microenvironment;ESTIMA TE;Immune infiltrating cells;Prognosis ·论著·doi:10.3969/j.issn.1003-6350.2023.16.002基金项目:大学生创新创业训练计划项目(编号:202210393014)。

tcga重复基因平均值的最大值

tcga重复基因平均值的最大值

主题:TCGA数据中重复基因平均值的最大值分析一、TCGA简介1. TCGA(The Cancer Genome Atlas)是美国国立癌症研究所(NCI)和国立人类基因组研究所(NHGRI)在2006年启动的一个大型癌症基因组项目。

2. TCGA项目的目标是通过对各种癌症的肿瘤和正常细胞基因组的广泛分析,为癌症的诊断、预后和治疗提供研究基础。

二、TCGA数据中的重复基因1. 由于数据处理的复杂性,TCGA数据库中可能存在重复的基因序列。

2. 重复的基因序列对于基因表达分析和生物信息学研究可能造成误解和影响。

3. 研究人员对TCGA数据库中的重复基因进行了分析和处理。

三、重复基因平均值的最大值分析1. 研究人员首先将TCGA数据库中的基因序列进行筛选和去重。

2. 然后计算每个基因的表达量的平均值,并选取其中的最大值。

3. 通过统计分析和数据处理,得出TCGA数据中重复基因平均值的最大值。

四、重复基因平均值的最大值的应用意义1. 对于癌症基因组学研究而言,了解TCGA数据中重复基因平均值的最大值可以帮助研究人员更准确地评估基因表达水平。

2. 进一步地,可以通过比较不同癌症样本中的重复基因平均值的最大值,发现可能与特定癌症类型相关的基因表达差异。

3. 这对于癌症的分类、分子诊断和个性化治疗具有重要的指导作用。

五、结论通过对TCGA数据中重复基因平均值的最大值进行分析,可以更好地理解基因表达数据的特点和规律,为癌症研究和临床应用提供重要的参考和数据支持。

六、基因表达的多样性分析1. 在分析TCGA数据中重复基因平均值的最大值的基础上,研究人员还可以进一步探索基因表达的多样性。

2. 通过计算基因表达的标准差和变异系数,可以评估基因表达的稳定性和差异程度。

3. 这种多样性分析可以帮助研究人员发现在特定癌症类型或病理特征下,基因表达的变异情况,从而为疾病的分子分类和治疗指导提供更多信息。

七、基因亚型的发现1. 基因表达的多样性分析还可以为基因亚型的发现提供支持。

tcga数据库使用方法

tcga数据库使用方法

tcga数据库使用方法TCGA(The Cancer Genome Atlas)数据库是一个重要的公共数据资源,为研究人员提供了大量的癌症基因组数据。

本文将介绍如何使用TCGA数据库进行数据获取和分析,以帮助读者更好地利用这一资源。

1. TCGA数据库简介TCGA数据库是由美国国立癌症研究所(NCI)和国立人类基因组研究所(NHGRI)联合推出的一个综合性癌症基因组学数据库。

该数据库整合了来自世界各地的研究机构共享的癌症基因组数据,包括肿瘤组织样本和正常对照样本的基因表达、突变、甲基化等数据。

2. 数据获取要使用TCGA数据库,首先需要访问官方网站(www . tcga . nih . gov)。

在网站主页上,你可以找到关于TCGA项目的详细信息,包括参与机构、数据类型等。

3. 数据筛选在进入TCGA数据库后,你可以根据自己的研究需求进行数据筛选。

首先,选择你感兴趣的癌症类型,例如乳腺癌、肺癌等。

其次,根据不同的研究目的,你可以在筛选条件中选择不同的数据类型,比如基因表达数据、突变数据、甲基化数据等。

另外,你还可以根据样本类型(肿瘤组织、正常对照组织等)和患者特征(性别、年龄等)进行筛选。

4. 数据下载在完成数据筛选后,你可以选择下载符合条件的数据。

TCGA数据库提供了多种数据下载方式,包括整个癌症类型的数据包或特定基因的数据。

你可以选择合适的下载方式,并按照指引完成下载过程。

5. 数据分析在获取到TCGA数据库的数据后,你可以使用各种生物信息学工具对数据进行分析。

例如,你可以使用R语言中的Bioconductor包、Python中的pandas库等进行数据处理和统计分析。

根据具体的研究需求,你可以进行差异表达分析、生存分析、通路分析等。

6. 结果解释在完成数据分析后,你需要解释和讨论你的结果。

根据研究问题的不同,你可以从不同的角度对结果进行解读。

你可以参考相关文献和数据库,验证你的结果是否与已有研究相符,并给出你自己对结果的解释。

查询肿瘤突变基因的方法

查询肿瘤突变基因的方法

查询肿瘤突变基因的方法肿瘤的发生与发展与基因突变密切相关。

了解和查询肿瘤突变基因对于疾病的诊断、治疗及预防具有重要意义。

本文将详细介绍几种查询肿瘤突变基因的方法。

一、肿瘤基因数据库查询1.OncoKB:OncoKB是一个权威的肿瘤基因数据库,提供了丰富的肿瘤相关基因突变信息,包括基因变异、药物敏感性、临床研究等。

用户可以通过基因名称、变异类型等关键词进行搜索。

2.COSMIC(Catalogue of Somatic Mutations in Cancer):COSMIC 数据库收录了大量肿瘤体细胞突变信息,包括基因突变、基因表达、药物靶点等。

用户可以通过基因名称、肿瘤类型等条件进行查询。

3.TCGA(The Cancer Genome Atlas):TCGA是一个癌症基因组图谱项目,提供了多种癌症类型的基因突变数据。

用户可以通过基因名称、癌症类型等关键词进行搜索。

二、生物信息学工具分析1.MuPIT(Mutation Position Impact Tool):MuPIT是一个在线生物信息学工具,可以分析基因突变对蛋白质结构的影响。

通过输入基因名称和突变位置,可以查询到突变对蛋白质功能的影响程度。

2.SIFT(Sorting Intolerant From Tolerant):SIFT是一个预测基因突变的生物信息学工具,通过分析氨基酸替换对蛋白质功能的影响,判断突变是否具有致病性。

3.PolyPhen-2(Polymorphism Phenotyping):PolyPhen-2是一个预测单核苷酸多态性(SNP)对蛋白质功能影响的生物信息学工具,也可用于分析基因突变。

三、实验方法1.PCR(Polymerase Chain Reaction):聚合酶链式反应,是一种检测基因突变的方法。

通过设计特异性引物,扩增目标基因片段,然后进行测序分析,可以检测到基因突变。

2.NGS(Next-Generation Sequencing):下一代测序技术,是一种高通量、高灵敏度的基因检测方法。

生物信息学分析鉴定肝细胞癌中的关键基因和信号通路

生物信息学分析鉴定肝细胞癌中的关键基因和信号通路

基因组学与应用生物学,2020年,第39卷,第9期,第4345-4352页研究报告Research Report生物信息学分析鉴定肝细胞癌中的关键基因和信号通路殷松娜张翔*杜娟陈雅慧延安大学医学院,延安,716000*通信作者,**********************摘要肝细胞肝癌是死亡率较高的癌种之一。

本研究旨在为HCC的发生发展机制研究提供更多数据支持,从而对HCC的基因治疗提供一定的理论基础。

从GEO数据库检索下载肝癌患者芯片数据GSE62232,包括10个正常肝脏样本,81个HCC患者的肿瘤样本。

用Limma包分析HCC肿瘤组织中与正常肝组织中差异表达基因。

随后进行基因本体论(GO)和信号通路(KEGG)富集分析。

Cytoscape的MCODE插件用于分析差异基因的蛋白质相互作用关系。

并筛选出Hub基因并应用Kaplan-Meier分析其在肝癌患者中的总体存活率情况。

筛选得到237个DEGs(82个上调基因和155个下调基因),主要富集在视黄醇代谢通路,P53信号通路和PPAR信号通路。

从PPI网络中鉴定出2个关键子网络和29个Hub基因;并得到与肝癌患者预后不良相关的8个基因的生存曲线。

本研究可为HCC的发生发展的机制研究和药物靶点提供新的研究方向。

关键词肝细胞癌(HCC),差异基因,KEGG信号通路,蛋白质-蛋白质相互作用,Hub基因Identification of Key Genes and Pathways in Hepatocellular Carcinoma Using Bioinformatics AnalysisYin Songna Zhang Xiang*Du Juan Chen YahuiYan'an University Medical College,Yan'an,716000*Corresponding author,**********************DOI:10.13417/j.gab.039.004345Abstract Hepatocellular carcinoma(HCC)is one of the cancers species with high mortality rates.The purpose of this study is to provide more data for the underlying mechanism of HCC,which could be useful for the research of gene therapy.The array data of GSE62232was downloaded from GEO database,including10normal liver samples,and81HCC liver tumors corresponding to81patients.The differentially expressed genes(DEGs)in the HCC tumor tissues compared with the normal liver tissue were analyzed with limma package.The gene ontology(GO)and Kyoto Encyclopedia of Gene and Genomes pathway(KEGG)enrichment analyses were performed subsequently. The Molecular Complex Detection(MCODE)plug-in in Cytoscape was applied to identify protein-protein interaction (PPI)network of the DEGs.Hub genes were picked out and the Kaplan-Meier analysis for overall survival was also applied.237DEGs were identified(82up-regulated and155down-regulated genes),which were enriched in retinol metabolism,P53signaling pathway and PPAR signaling pathway.The top2modules and top29hub genes were identified from the PPI network;survival curves of8genes associated with poor prognosis in patients with liver cancer.This study could provide more data for the underlying mechanism and drug-target for HCC.Keywords Hepatocellular carcinoma(HCC),DEGs,KEGG pathway,PPI,Hub gene基金项目:本研究由陕西省教育厅专项项目(18JK0863)、陕西省教育厅专项项目(18JK0869)、延安大学博士科研启动项目(20504-0136)和延安大学校级引导项目(205100114)共同资助引用格式:Yin S.N.,Zhang X.,Du J.,and Chen Y.H.,2020,Identification of key genes and pathways in hepatocellular carcinoma using bioinformatics analysis,Jiyinzuxue Yu Yingyong Shengwuxue(Genomics and Applied Biology),39(9):4345-4352(殷松娜,张翔,杜娟,陈雅慧,2020,生物信息学分析鉴定肝细胞癌中的关键基因和信号通路,基因组学与应用生物学,39(9):4345-4352)基因组学与应用生物学肝细胞癌(hepatocellular carcinoma,HCC)在全球男性常见恶性肿瘤中占第5位,在全球女性中占第9位,每年约有500000和200000例新病例(Bray et al.,2013)。

基于免疫相关基因的肝细胞癌预后模型的构建和验证

基于免疫相关基因的肝细胞癌预后模型的构建和验证

基于免疫相关基因的肝细胞癌预后模型的构建和验证陈冬冬;楼金金;黄燕燕;周璐;李世波;续力云【期刊名称】《解剖学报》【年(卷),期】2024(55)3【摘要】目的构建一种基于免疫相关基因的肝细胞癌(LIHC)预后模型。

方法在UCSC Xena数据库和癌症基因组图谱(TCGA)数据库中下载肝癌和正常组织样本数据。

对LIHC样本和癌旁/正常样本的基因数据进行差异分析。

对差异表达基因(DEGs)进行富集分析。

使用TCGA队列中的肝癌样本进行Kaplan-Meier生存分析获得生存与免疫相关的差异表达基因,再采用LASSO Cox和多因素Cox回归分析构建基因风险预后模型。

从高通量基因表达(GEO)数据库中获取数据用于外部验证。

利用CellMiner数据库研究枢纽基因对常用抗肿癌药物的敏感性。

结果富集分析结果表明,差异表达基因主要与分解代谢相关。

通过差异分析和Kaplan-Meier 生存分析获得25个生存与免疫相关的差异表达基因。

再基于LASSO Cox和多因素Cox回归分析结果,获得5个枢纽基因(FYN、CSF3R、HLA-G、FOS和BIRC5),并构建列线图。

训练队列和验证队列的一致性指数(C-index)值分别为0.739和0.625。

根据枢纽基因与抗肿瘤药物的敏感性结果,选出12种抗肿瘤药物用于后续实验。

结论该模型能够有效预测LIHC患者的预后,为LIHC的免疫治疗提供了新的思路。

【总页数】10页(P319-328)【作者】陈冬冬;楼金金;黄燕燕;周璐;李世波;续力云【作者单位】温州医科大学附属舟山医院细胞分子生物学实验室;温州医科大学研究生培养基地(舟山医院);温州医科大学附属舟山医院传染病科【正文语种】中文【中图分类】R730.1【相关文献】1.基于TCGA和ICGC构建和验证肝细胞癌肿瘤微环境相关基因的预后风险模型2.衰老相关分泌表型相关的lncRNAs模型预测肝细胞癌患者预后的构建和验证3.基于COVID-19相关基因的肝细胞癌分子分型及预后模型构建与验证4.肝细胞癌免疫相关基因和lncRNA联合预后模型的构建及验证5.基于免疫相关基因标记的胃癌预后预测模型的构建和验证因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Hans Journal of Surgery外科, 2015, 4, 1-8Published Online January 2015 in Hans. /journal/hjs/10.12677/hjs.2015.41001Identification Key Genes of HepatocellularCarcinoma Base on TCGA DatabaseJunjun Jia, Ning He, Jing Zhang, Li Jiang, Yanfei Zhou, Lin Zhou, Shusen ZhengKey Laboratory of Combined Multi-Organ Transplantation, Ministry of Public Health, Department of Hepatobiliary and Pancreatic Surgery, First Affiliated Hospital of Zhejiang University School of Medicine, HangzhouEmail: jiajunjun1987@Received: Nov. 3rd, 2014; revised: Nov. 20th, 2014; accepted: Dec. 5th, 2014Copyright © 2015 by authors and Hans Publishers Inc.This work is licensed under the Creative Commons Attribution International License (CC BY)./licenses/by/4.0/AbstractObjective: Hepatocellular carcinoma (HCC) is a common cancer of the digestive system, is the third cause of death worldwide and the second cause of death in China. The Cancer Genome Atlas (TCGA) aims to better understand the molecular mechanisms of cancer by using a large-scale genome se-quencing-based analysis techniques and extensive cooperation. This study introduces TCGA data-base to find key genes of HCC events. Materials and Methods: The data from TCGA were processed, integrated according to the standard procedure of TCGA, data types and levels were carefully as-sessed. Bioinformatics analysis was done using the DESeq and edgeR package of R language (3.1.1 version). Results were showed as pheatmap, VennDiagram, hist, PlotMA etc. Differences were de-fined as follows: expression increased more than two folds; P <0.05; gene ranked in the top 10%.Results: 17 mRNA chips of HCC and 9 mRNA chips of normal tissue were collected from TCGA data- base. Hist figure reflected the number of different gene was large. PLotMA map showed the distribu-tion of gene expression, suggesting most genes of different expression were increased. 719 diffe-rentially expressed genes were found by DESeq, while 4413 by edger, among which 713 were com-mon different genes. Conclusion: Compared to conventional microarray, TCGA method has its own advantages such as larger number of samples, less cost and easier for analyzing, offering opportuni-ty for large-scale genomic studies of HCC and subsequent functional genomics-based research.KeywordsHepatocellular Carcinoma, TCGA, Chip基于TCGA数据库的肝癌发生关键基因筛选贾俊君,何宁,张静,姜骊,周燕飞,周琳,郑树森基于TCGA数据库的肝癌发生关键基因筛选浙江大学医学院附属第一医院肝胆胰外科,卫生部多器官联合移植研究重点实验室,杭州Email: jiajunjun1987@收稿日期:2014年11月3日;修回日期:2014年11月20日;录用日期:2014年12月5日摘要目的:肝癌是消化系统常见恶性肿瘤,是全世界第三位死亡原因和中国第二位死亡原因。

肿瘤基因组图谱(TCGA)计划利用大规模测序为主的基因组分析技术,通过广泛的合作,理解癌症的分子机制,本研究利用TCGA数据库深入挖掘肝癌发生关键基因。

材料方法:根据标准流程对TCGA数据进行处理、整合,对数据类型及水平进行评估,用R语言(3.1.1版本)中自带的DESeq和edgeR程序包进行分析,结果以热图(pheatmap)、韦恩图(VennDiagram)、hist、PlotMA等表示。

差异基因的判断标准:1,表达量在2倍以上或者0.5倍以下,2,P < 0.05,3,基因排名在前10%。

结果:TCGA数据库现有癌组织mRNA芯片信息17张,匹配正常组织mRNA芯片信息9张,共26张。

Hist图反映的是每个经统计后P值得分布规律,图中可刊出P值接近0处频率很高,反映差异基因的数量很大。

PLotMA图反应基因表达量的分布规律,提示表达上升基因数量较多。

用DESeq方法一共找到719个差异基因,而用edgeR方法找到4413个差异基因,两种方法都鉴别出的共同差异基因713个。

结论:TCGA法相较于传统的芯片筛选具有样本数量大、费用小、分析简单等优势,为更多的人进行大规模的肝癌基因组学研究以及基于基因组学的后续功能研究提供了可能性。

关键词肝癌,TCGA,芯片1. 引言肝癌是消化系统常见恶性肿瘤,是全世界第三位死亡原因[1]和中国第二位死亡原因[2]。

现有的治疗手段不能有效预防与控制肝癌切除或者肝移植后复发,肝癌患者预后仍然不容乐观。

因此需要进一步对肝癌发生及复发机制进行深入研究,寻找肝癌发生的关键基因及肝癌预后评估的生物学指标,以进一步改善患者预后。

肿瘤基因组图谱(TCGA)计划由美国National Cancer Institute (NCI)和National Human Genome Re- search Institute (NHGRI)于2006年联合启动的项目,第一阶段为期三年,耗资1亿美元,研究的癌症类型包括多形性成胶质细胞瘤(GBM)、卵巢癌,并于2008年在Nature发表了GBM的研究成果,2009年9月,再投$2.75亿,针对20余种癌症进行大规模实验,目前总计36种癌症类型。

TCGA利用大规模测序为主的基因组分析技术,通过广泛的合作,理解癌症的分子机制。

提高人们对癌症发病分子基础的科学认识及提高我们诊断、治疗和预防癌症的能力。

最终完成一套完整的与所有癌症基因组改变相关的“图谱”。

本文着重介绍TCGA数据库及利用TCGA数据库现有的数据深入挖掘寻找肝癌发生的关键基因。

2. 材料与方法2.1. TCGA数据处理流程2.1.1. 组织处理1) 癌症病人自愿捐赠肿瘤组织及正常组织样本,由人类癌症生物标本核心资源库承担癌症组织标本和正常组织标本的采集、处理和分配工作。

基于TCGA数据库的肝癌发生关键基因筛选2) 组织样本经过严格标准处理(处理标准根据不同后续分析类型而异,具体标准参见/cancergenomics/tissuesamples),确保质量可以用于进一步分析及测序,并由相关中心(基因组测序中心genome sequencing centers和肿瘤基因组鉴定中心cancer genome characterization centers)采用高通量测序技术进行基因和基因组排序。

3) 获得的临床资料中,可以识别病人身份的信息去掉。

2.1.2. 整合研究1) TCGA基因组分析中心(GCC)比对肿瘤和正常组织,寻找异常的基因重组现象。

2) 高通量测序中心(GSC)分析与各癌症或者亚型相关的基因突变、扩增或者缺失。

3) 资料分析中心(GDAC)进行资料的整理、汇总、并提供图表报告给全体研究团队。

2.1.3. 资料分享1) 资料综合中心(DCC)集中处理各个团队产生的资料,定期公开于网络上供全世界研究人员利用。

2) 提供公开的资料下载网站入口以方便进行资料搜索和下载。

2.2. TCGA数据类型和数据水平TCGA数据类型和数据水平,见表1、表2。

2.3. TCGA数据分析方法TCGA标准方法下载肝细胞肝癌癌症组织及正常组织信息,统计分析采用R语言(3.1.1版本)软件,需安装及加载的程序包(pheatmap,venndiagram,hist等),然后用DESeq和edgeR程序包进行分析,结果以热图(pheatmap)、韦恩图(VennDiagram)hist、PlotMA等表示。

具体的差异基因分析策略参考oshlack等报道的方法[3]。

相关文档
最新文档