实验5 利用Entrez 、SRS 工具检索权关核酸蛋白数据库
生物信息学数据库和核酸序列的检索实验心得

生物信息学数据库和核酸序列的检索实验心得生物信息学数据库和核酸序列的检索实验心得一、引言生物信息学是一门综合学科,它将计算机科学与生物学相结合,通过开发和应用计算机算法与技术来处理生物学数据并进行相关的研究。
数据库是生物信息学研究中不可或缺的工具之一,而核酸序列的检索是生物信息学研究中的基础工作之一。
本文将对生物信息学数据库和核酸序列的检索进行实验,并总结心得体会。
二、生物信息学数据库的选择在进行核酸序列的检索前,首先需要选择合适的生物信息学数据库。
常用的生物信息学数据库有GenBank、EMBL、DDBJ等。
在实验中,我选择了GenBank数据库进行核酸序列的检索。
三、核酸序列的检索方法1. 关键词检索关键词检索是最常用的核酸序列检索方法之一。
通过输入与所需核酸序列相关的关键词,系统会根据关键词在数据库中进行搜索,并返回相关的核酸序列结果。
在实验中,我以“人类乳腺癌”为关键词进行检索,得到了与人类乳腺癌相关的核酸序列信息。
2. 序列相似性比对序列相似性比对是另一种常用的核酸序列检索方法。
通过输入一个已知的核酸序列,系统会在数据库中寻找与之相似的序列,并返回相似序列的信息。
在实验中,我选择了一段已知的人类乳腺癌相关的核酸序列进行比对,得到了与之相似的核酸序列信息。
四、实验心得在进行生物信息学数据库和核酸序列的检索实验过程中,我深刻体会到了生物信息学的重要性和实用性。
通过生物信息学数据库,我们可以方便地获取到大量的生物学数据,为生物学研究和应用提供了重要的支持。
在实验中,我发现关键词检索是一种简单有效的核酸序列检索方法。
通过合理选择关键词,我们可以快速地获得与所需核酸序列相关的信息。
同时,关键词检索还可以帮助我们从大量的核酸序列中筛选出与特定研究对象相关的序列,提高研究的效率。
序列相似性比对也是一种非常重要的核酸序列检索方法。
通过比对已知的核酸序列,我们可以找到与之相似的序列,从而获得更多相关的信息。
常用分子生物学数据库检索方法及数据格式

作业标准记得牢,驾轻就熟除烦恼。 2020年 10月1 9日星 期一5时 4分29 秒17:0 4:2919 October 2020
•
好的事情马上就会到来,一切都是最 好的安 排。下 午5时4 分29秒 下午5 时4分1 7:04:2 920.10 .19
•
一马当先,全员举绩,梅开二度,业 绩保底 。20.1 0.1920. 10.191 7:041 7:04:2 917:04 :29Oc t-20
•
牢记安全之责,善谋安全之策,力务 安全之 实。20 20年1 0月19 日星期 一5时4 分29秒 Monda y, October 19, 2020
•
相信相信得力量。20.10.192020年1 0月19 日星期 一5时4 分29秒 20.10. 19
谢谢大家!
•
加强交通建设管理,确保工程建设质 量。17:04:29 17:04:2917:0 4Mond ay, October 19, 2020
•
安全在于心细,事故出在麻痹。20.1 0.1920. 10.191 7:04:2 917:0 4:29Oc tober 19, 2020
•
踏实肯干,努力奋斗。2020年10月1 9日下 午5时4 分20.1 0.1920. 10.19
•
树立质量法制观念、提高全员质量意 识。20. 10.19 20.10.1 9Mond ay, October 19, 2020
•
人生得意须尽欢,莫使金樽空对月。1 7:04:2 917:0 4:2917 :0410/ 19/20 20 5:04:29 PM
•
安全象只弓,不拉它就松,要想保安 全,常 把弓弦 绷。20. 10.191 7:04:2 917:0 4Oct-2019-Oct-20
使用Entrez 信息查询系统检索核酸序列NM_000230

青岛农业大学实验报告课程基因与蛋白质组学数据分析实验名称常用数据库与文件格式及数据获取院系生命科学学院实验日期8.24 ,8.26专业班级生技1301 实验报告日期8.26姓名位书磊学号20130623实验目的和要求•掌握常用的生物信息学数据库的类型•掌握常用的分子数据的格式;•强化培养计算机操作能力和网络搜索能力。
•掌握基因、核酸序列、蛋白质序列的查询方法•掌握基因组数据的查询方法实验内容和实验步骤1.NCBI数据库查询及Genbank数据格式1)Entrez (/Entrez/)查询输入所查询的物质编码或英文名称2)查询编码拟南芥(arabidopsis)phyE(光敏色素E)基因的核酸序列2. EMBL(UniProt)数据格式实验结果分析如下1~7实验总结通过本次试验,我初步掌握了常用的生物信息学数据库的类型和常用的分子数据的格式;也让生物信息搜索对我来说不再神秘。
同时我还掌握了基因、核酸序列、蛋白质序列的查询方法和基因组数据的查询方法。
为我以后实验数据查询奠定了良好的基础。
同时也加强了对英语的应用。
1Locus 名字序列长度序列形状子库修改日期数据库标识符定义 (标题)标题 发表论文信息 作者评论与其他数据库的链接特征表FJ039904蛋白质检索号:FJ039904.1426aa3.检索号:AB0119685816bp520aa or 540aa4.位于14号染色体14q24.3检索号:NM-0212571885bp151aaFASTA格式:>gi|10864065|ref|NP_067080.1| neuroglobin [Homo sapiens]5.genbank: 187066846 loci, 199823644287 bases, from 187066846 reported sequencesUniprot:50011027TrEMBL,549008Swiss-protPDB:111558个蛋白质结构1)/BioSino中国生物信息2)/北京基因组研究所序列本身Accessionnumber3)/重庆邮电大学生物信息学研究所4)/北京大学生物信息学中心5)/pages/source-bioinfo.htm中国生物信息学资源导航1)欧洲生物信息学研究所Ensembl基因组浏览器:/ensembl/index.html 2)欧洲生物信息学研究所Thornton研究组:/Thornton/index.html3)欧洲生物信息学研究所多序列联配数据库: /embl/Submission/alignment.html4)欧洲生物信息学研究所工具箱:/Tools/5)欧洲生物信息学研究所核酸数据库:/Databases/nucleotide.html6)欧洲生物信息学研究所计算基因组研究组:/research/CGG/index.html 7)欧洲生物信息学研究所完整基因组数据库:/genomes/8)欧洲生物信息学研究所序列数据库研究组:/seqdb/index.html9)Brutlag生物信息学研究组:/10)生物GBF信息学小组主页:http://transfac.gbf.de/11)Pune大学生物信息学中心:http://bioinfo.ernet.in/12)林奈斯生物信息学中心:http://www.lcb.uu.se/13)曼彻斯特大学生物信息学教育与研究:/14)《生物信息学》:/jnls/list/bioinformatics/etoc.html15)生物信息学趋势导向/genpedscrr/Trends.htm6: 染色体数目:19Statistics: total length (Mb): 486.197protein count: 38120GC%: 35.03367:cs: median total length (Mb): 42.1323最近文献:Draft Genome Sequence of Botrytis cinerea BcDW1, Inoculum for Noble Rot of Grape Berries. Blanco-Ulate B, et al. Genome Announc 2013 May 23。
2025年高考生物复习新题速递之基因工程(2024年9月)

2025年高考生物复习新题速递之基因工程(2024年9月)一.选择题(共18小题)1.关于“DNA的粗提取与鉴定”实验,下列说法错误的是()A.过滤液沉淀过程在4℃冰箱中进行是为了防止DNA降解B.DNA既溶于2mol/LNaCl溶液也溶于蒸馏水C.粗提取的DNA中含有核蛋白、多糖等杂质D.将粗提取的DNA溶于2mol/LNaCl溶液中,加入二苯胺试剂DNA被染成蓝色2.大肠杆菌经溶菌酶和洗涤剂处理后,拟核DNA就会缠绕在细胞壁碎片上,静置一段时间,质粒分布在上清液中,利用上述原理可初步获得质粒DNA。
用三种限制酶处理提取的产物,电泳结果如图所示。
下列关于质粒的粗提取和鉴定的叙述不正确的是()A.提取DNA时可加入酒精,使溶于酒精的蛋白质等物质溶解B.将提取的DNA溶于2mol/LNaCl溶液后;可用二苯胺试剂进行鉴定C.电泳鉴定DNA利用了DNA在电场中会向着它所带电荷相反的电极移动的原理D.根据电泳结果,质粒上一定没有限制酶Ⅰ和Ⅱ的切割位点,而有限制酶Ⅲ的切割位点3.某同学拟用限制酶(酶1、酶2、酶3和酶4)、DNA连接酶为工具,将目的基因(两端含相应限制酶的识别序列和切割位点)和质粒进行切割、连接,以构建重组表达载体。
限制酶的切割位点如图所示,下列分析合理的是()A.可选择酶3切割质粒和目的基因,再用E.coliDNA连接酶连接B.可选择酶2和酶4切割质粒和目的基因,再用E.coliDNA连接酶连接C.可选择酶2切割质粒、酶4切割目的基因,再用E.coliDNA连接酶连接,连接后的片段仍能被酶2和酶4切割D.为了让重组表达载体的构建合理且高效,可用酶1和酶2切割质粒和目的基因,再用T4DNA连接酶连接4.将马铃薯胰蛋白酶抑制剂基因PinⅡ导入杨树细胞,培育成了抗虫杨树。
如图表示含目的基因的DNA 分子和农杆菌质粒,图中Amp r表示氨苄青霉素抗性基因,Neo r表示新霉素抗性基因,箭头表示识别序列完全不同的几种限制酶的切割位点。
蛋白质数据库使用说明

引言:蛋白质数据是生物信息学领域中非常重要的资源之一,它提供了大量关于蛋白质序列、结构、功能以及相互作用等方面的信息。
本文旨在介绍如何使用蛋白质数据库,帮助用户更好地利用这一资源进行研究。
概述:蛋白质数据库是一个集成了许多蛋白质信息的在线资源,用户可以通过搜索、浏览、等方式获取所需的信息。
其中,常用的蛋白质数据库包括NCBI、UniProt、PDB等。
这些数据库提供了丰富的蛋白质数据,并且不断更新以满足用户需求。
正文内容:1.数据库搜索功能1.1.关键词搜索1.1.1.输入蛋白质名称1.1.2.输入序列片段1.1.3.输入关键词1.2.高级搜索选项1.2.1.提供更精确的搜索结果1.2.2.支持过滤和排序功能1.2.3.可以根据相关字段进行搜索2.数据库浏览功能2.1.蛋白质分类2.1.1.按物种分类2.1.2.按功能分类2.1.3.按家族分类2.2.数据表格浏览2.2.1.查看蛋白质基本信息2.2.2.查看蛋白质序列2.2.3.查看蛋白质结构2.3.数据图谱浏览2.3.1.查看蛋白质相互作用网络2.3.2.查看蛋白质结构域分布2.3.3.查看蛋白质功能注释3.数据库功能3.1.蛋白质序列数据3.1.1.全部序列3.1.2.特定物种的序列3.2.蛋白质结构数据3.2.1.已解析的蛋白质结构3.2.2.蛋白质结构预测结果3.3.蛋白质相互作用数据3.3.1.已验证的相互作用数据3.3.2.预测的相互作用数据4.数据库工具与资源4.1.序列比对工具4.1.1.BLAST4.1.2.PSIBLAST4.2.结构预测工具4.2.1.SWISSMODEL4.2.2.Phyre24.3.功能注释资源4.3.1.GeneOntology4.3.2.InterPro4.4.数据库交互接口4.4.1.提供API接口4.4.2.支持数据提交与5.数据库更新与维护5.1.数据更新频率5.2.数据质量保证5.3.用户反馈与支持5.4.数据库版本与历史记录总结:蛋白质数据库为研究人员提供了丰富的蛋白质信息资源,通过搜索、浏览、等功能,用户可以轻松地获取需要的数据。
实验2 序列查询(Entrez)、BLAST序列相似性搜索

实验二:序列查询(Entrez)、BLAST序列相似性搜索实验目的:1.学会用Entrez系统查找目标序列2.学会使用BLAST在数据库中搜索相似序列3.学会分析数据库搜索结果实验内容:一、EntrezEntrez是一个由NCBI创建并维护的基于Web界面的综合生物信息数据库检索系统。
用户不仅可以方便地检索Genbank的核酸数据,还可以检索来自Genbank和其它数据库的蛋白质序列数据、基因组图谱数据、来自分子模型数据库(MMDB)的蛋白质三维结构数据、种群序列数据集、以及由PubMed获得Medline的文献数据。
网址:/Entrez/(或在NCBI主页默认All Databases时点击搜索框右边的Search进入)。
如Figure 2.1所示:Figure 2.1 entrez 检索系统子数据库点击搜索框右边的help按钮,即可进入Entrez帮助页面。
在搜索栏输入你要查找的关键词,点击“GO”即可开始搜索。
如果输入多个关键词,它们之间默认的是“与”(AND)的关系。
Tips:搜索的关键词可以是一个单词,短语,句子,数据库的识别号,基因名字等等,但必须明确,不能是“gene”, “protein”等没有明确指向的词语。
但“transcription factor”这样有一定范围的词是可以接受的。
可以用你感兴趣的领域的专业术语,也可以是非专业术语,比如:h1n1,lung cancer,albinism; subtilism, peroxidase, myoglobin。
输入关键词,点击“GO”之后,每个数据库图标前方出现了数字,代表的是在相对应的数据库里搜索到的条目数。
点击进入对应的数据库,可以查看搜索到的条目。
如果在数据库图标前面为灰色,显示“none”,说明在对应的数据库里没有搜索到任何结果。
也可以直接通过NCBI任一页面上的搜索栏进行Entrez搜索。
点击“search”后面的下拉菜单,选择数据库,在下面的文本框里输入关键词,点击“Search”即可(Figure 2.2)。
生物信息学数据库和核酸序列的检索实验心得
生物信息学数据库和核酸序列的检索实验心得生物信息学数据库和核酸序列的检索实验心得近年来,随着生物学研究的快速发展,生物信息学成为了一个热门的研究领域。
在生物信息学研究中,生物信息学数据库和核酸序列的检索是非常重要的一环。
通过检索生物信息学数据库和核酸序列,我们可以获取到大量的生物学信息,为生物学研究提供重要的依据。
在这篇文章中,我将分享一些我在生物信息学数据库和核酸序列检索实验中的心得体会。
对于生物信息学数据库的检索,我发现选择合适的数据库非常关键。
目前,常用的生物信息学数据库包括GenBank、EMBL、DDBJ等。
这些数据库收集了大量的核酸序列和蛋白质序列,并提供了丰富的检索功能。
在选择数据库时,我们应该根据自己的研究方向和需要检索的信息类型来进行选择。
例如,如果我们研究的是人类基因组,那么选择NCBI的GenBank数据库就是一个不错的选择。
在进行数据库检索时,我发现合理的关键词选择非常重要。
关键词的选择直接影响到检索结果的准确性和全面性。
在选择关键词时,我们应该考虑到研究的目的和研究对象,并尽量选择具有代表性的关键词。
同时,我们还可以利用一些高级检索功能来进一步筛选出符合我们要求的结果。
例如,我们可以利用布尔运算符来组合多个关键词,从而缩小检索范围,提高检索结果的精确度。
对于核酸序列的检索,我发现序列比对是一个非常有效的方法。
通过序列比对,我们可以将待检索的核酸序列与数据库中已知的序列进行比较,从而找到相似的序列。
在进行序列比对时,我们可以利用一些常用的比对工具,如BLAST和FASTA等。
这些比对工具可以根据序列的相似性进行排序,并给出相应的分数和E值。
通过分析比对结果,我们可以判断待检索的序列与数据库中已知序列的相似度,从而推测其功能和结构。
在进行核酸序列检索时,我还注意到了一些细节问题。
首先,我们应该选择合适的序列类型进行检索。
核酸序列可以分为DNA序列和RNA序列,不同的序列类型对应着不同的生物学信息。
(2)第二章核酸数据库及核酸序列的分析(第二节序列数据库检索)
3). 引文匹配器(Citation Matcher)
作用:输入题录信息,查找特定文献
检索步骤:点击页面左边的“Single Citation Matcher”,按界面提示分别填入 所知信息,点击[Search]按钮,可得到相应 的特定文献信息。
生物信息学
杭州师范大学生命与环境科学学院 向太和
生物信息学
例如,通过“Related sequence”工具,可以直接找到与查 询所得蛋白质序列同源的其他蛋白质。查询得到的蛋白质 三维结构,可以通过在用户计算机上安装的Cn3D软件直接 显示分子图形。
Entrez系统的开发基于特殊的数据模型NCBI ASN.1,在对
于文献摘要中的关键词查询时,不仅考虑了查询对象和数 据库中单词的实际匹配,而且考虑了意义相近的匹配。
MEDLINE 光盘
收录范围
√
数据更新
检索的规范性 提供相关链接 速度及费用
生物信息学
√
√
√
√
杭州师范大学生命与环境科学学院 向太和
5、PubMed自动更新功能
生物信息学
杭州师范大学生命与环境科学学院 向太和
7种文献类型限制 7种语种 12种子集
生物信息学
杭州师范大学生命与环境科学学院 向太和
生物信息学
杭州师范大学生命与环境科学学院 向太和
Previw/index(检索策略预览)
浏览检索式
改变检索式(可用检索式编号如:
#1 OR #2)
浏览索引(index)
生物信息学
杭州师范大学生命与环境科学学院 向太和
内容涉及:医学、药学、牙医学、护理学、卫生 保健、兽医学等专业。
记录标注[PubMed - indexed for MEDLINE]
生物信息学填空题
填空题:1、蛋白质结构数据来源:①实验测定方法: X-ray 、 NMR 、Cryo-EM ②理论预测:同源建模、折叠识别、从头计算2、一级数据库:①一级核酸数据库:Genbank(美国)、EMBL (欧洲)、DDBJ(日本) NCBI②一级蛋白质序列数据库:SWISS-PORT 、PIR 、 NCBI③一级蛋白质结构数据库:PDB、 pfam 、 prosite大分子序列格式:fasta数据库基本文件格式:genbank蛋白质分类数据库:SCOP、CATH 、 FSSP二次数据库: GDB 、 Prosite、 TRANSFAC3、本地软件: Clustal-x 、 BioEdit 、 Mega、 sequencher、 spdbv、 Discovery-studio4、本课程主要理论依据:相似性、同源性、序列比对(3D结构比对)、数学方法、分子动力、分子力学5、基因鉴定三步骤:①找到序列中的非编码区(低复杂度区)②找基因③鉴定找到的基因6、主要的生物大分子数据:①DNA:基因组序列、基因序列、cDNA、EST、碱基修饰DNA 功能模块 /位点(如启动子、剪接体、表达调控位点等)②蛋白质:氨基酸组成、氨基酸序列、理化性质、原子坐标;二级结构、核体、结构域、功能域 /位点; 3D 结构常见的生物信息数据记录格式:FASTA 、GenBank、EMBL、 PDBFASTA 格式:序列文件的第一行由大于符号>大头的任意文字说明,主要为标记序列用。
从第二行开始是序列本身,标准核苷酸符号或氨基酸单字母符号,通过核苷酸符号大小写均可,而氨基酸一般用大写字母。
文件中和每一行都不要超过80 个字符(通常60 个字符)GenBank格式:序列名称、长度。
日期;序列说明、编号、版本号;物种来源、学名、分类60学位置;相关文献作者、题目、刊物、日期;序列特征表;碱基组成;序列本身(每行个)二 .填空题1.常用的三种序列格式: NBRF/PIR,FASTA 和 GDE2.初级序列数据库: GenBank, EMBL 和 DDBJ3.蛋白质序列数据库: SWISS-PROT 和 TrEMBLPIR (蛋白4. 提供蛋白质功能注释信息的数据库:KEGG (京都基因和基因组百科全书)和质信息资源) 5. 目前由 NCBI 维护的大型文献资源是PubMed6.数据库常用的数据检索工具: Entrez, SRS, DBGET7.常用的序列搜索方法: FASTA 和 BLAST8.高分值局部联配的 BLAST 参数是 HSPs(高分值片段对), E(期望值) 9. 多序列联配的常用软件: Clustal10.蛋白质结构域家族的数据库有:Pfam, SMART11. 系统发育学的研究方法有:表现型分类法,遗传分类法和进化分类法12. 系统发育树的构建方法:距离矩阵法,最大简约法和最大似然法13. 常用系统发育分析软件:PHYLIP 14.检测系统发育树可靠性的技术: bootstrapping 和 Jack-knifing 15. 原核生物和真核生物基因组中的注释所涉及的问题是不同的16. 检测原核生物ORF 的程序: NCBI ORF finder17. 测试基因预测程序正确预测基因的能力的项目是GASP(基因预测评估项目)18.二级结构的三种状态:α螺旋,β折叠和β转角19.用于蛋白质二级结构预测的基本神经网络模型为三层的前馈网络,包括输入层,隐含层和输出层20.通过比较建模预测蛋白质结构的软件有SWISS-PDBVIEWER ( SWISS — MODEL 网站) 21. 蛋白质质谱数据搜索工具:SEQUEST 22. 分子途径最广泛数据库:KEGG23. 聚类分析方法,分为有监督学习方法,无监督学习方法24. 质谱的两个数据库搜索工具:1、 SEQEST 和 Lutkefi 三大数据库:核酸序列数据库、蛋白质序列数据库、结构数据库世界三大核酸序列数据库:GenBank、 EMBL-Bank 、 DDBJ蛋白质序列数据库:Swiss-Prot、 TrEMBL 、UniProt蛋白质结构数据库:PDB 、SCOP、CATH2、 GenBank 文献、提供了提供的服务:提供了EntrezBLAST 序列类似性检索。
实验三 利用文本信息进行序列数据的查询
实验三、利用文本信息进行序列数据的查询(3学时)目的:掌握NCBI Entrez、EBI SRS两种数据库检索工具。
内容:掌握利用文本信息进行对库查询的方法,并学会如何根据需要保存结果并进行文件格式的转换。
一、熟悉NCBI的 Entrez。
1、Entrez的Limits界面。
在Limits界面下可将一个检索限定到特定的范围[如仅对作者(Author Field)进行检索],可以进行排除检索[如检出专利序列以外的所有记录],同样可以限定仅对特定类型的数据进行检索[如基因组RNA或DNA、mRNA等],或仅对特定的数据库进行检索[如RefSeq];同时提供了对检索记录的日期及序列长度的限制等。
熟练运用这些设置可大大加快一个检索的速度并大大简化了对输出结果的分析过程。
1)进入NCBI主页。
在NCBI主页上确定Search项的内容为Entrez,在随后的检索框中输入检索词rbp4,点击GO。
得到NCBI上整合的检索结果。
2)进入Nucleotide database(包含RefSeq、GenBank等),首先记录得到了多少检索结果。
点击Limits对检中结果进行限定。
将结果限定于特定的分子类型molecule为mRNA,点击上部的GO得到检索结果,再次记录检索结果数。
回到Limits,同时使用多个限定条件:分子类型molecule为mRNA,数据库only from为RefSeq,点击GO,记录检中结果数。
3)查找登录号为NM_006744的记录,点击记录后面的Links,可以从Gene中查找到本mRNA记录相关基因在染色体上的定位情况;从Full text in PMC中得到PubMed保存的两篇研究论文的电子全文;从UniGene中得到基因表达的部位等信息。
4)回到最初的NCBI整合检索结果页面,进入不同的有检中记录的数据库中再点击Limits,了解不同的数据库中Limits选项是不同的。
2、Preview/Index界面。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验五利用Entrez 、SRS 工具检索权关核酸蛋白数据库1. Limits Activated: exclude patents, Source database: EMBL(1). Hepatitis B virus complete genome, genotype A2, isolate P2.2.11GenBank: HE576989.1FASTA GraphicsGo to:LOCUS HE576989 3221 bp DNAcircular VRL 29-JUL-2011DEFINITION Hepatitis B virus complete genome, genotype A2, isolate P2.2.11.ACCESSION HE576989VERSION HE576989.1 GI:341823528KEYWORDS complete genome.SOURCE Hepatitis B virusORGANISM Hepatitis B virusViruses; Retro-transcribing viruses; Hepadnaviridae;Orthohepadnavirus.REFERENCE 1AUTHORS Martel,N., Cotte,L., Trabaud,M.A., Trepo,C., Zoulim,F., Gomes,S.and Kay,A.TITLE Glucocorticoid-induced reactivation of an occult HBV infection inan HIV+ patientJOURNAL UnpublishedREFERENCE 2 (bases 1 to 3221)AUTHORS Kay,A.C.TITLE Direct SubmissionJOURNAL Submitted (22-JUL-2011) to the INSDC. Kay A.C., U1052, INSERM, 151cours Albert Thomas, Lyon, 69003, FRANCE FEATURES Location/Qualifierssource 1..3221/organism="Hepatitis B virus"/mol_type="genomic DNA"/serotype="ayw1"/isolate="P2.2.11"/db_xref="taxon:10407"/country="France"/collection_date="09-Jun-2007"/note="genotype:A2"gene order(2307..3221,1..1623)/gene="pol"CDS join(2307..3221,1..1623)/gene="pol"/function="viral polymerase"/codon_start=1/product="reverse transcriptase-DNA polymerase"/protein_id="CCC82739.1"/db_xref="GI:341823532"/translation="MPLSYQHFRKLLLLDDGTEAGPLEEELPRLADADLNRRVAE DLNLGNLNVSIPWTHKVGNFTGLYSSTVPIFNPDWQTPSFPKIHLQEDIINRCQQFVG PLTVNEKRRLKLIMPARFYPTHTKYLPLDKGIKPYYPDQVVNHYFQTRHYLHTLWKAG ILY KRETTRSASFCGSPYSWEQELQHGRLVIKTSQRHGDESFCSQPSGILSRSSVGPC IRSQLKQSRLGLQPHQGPLASSQPGRSGSIRARAHPSTRRYFGVEPSGSGHIDHSVNN SSS CLHQSAVRKAAHSHLSTSKRQSSSGHAVESHCLPPSSAGSQSQGSVFSCWWLQFR NSKPCSEYCLSHLVNLREDWGPCDEHGEHHIRIPRTPARVTGGVFLVDKNPHNTTESR LVV DFSQFSRGITRVSWPKFAVPNLQSLTNLLSSNLSWLSLDVSAAFYHIPLHPAAMP HLLIGSSGLSGYVARLSSNSRINNNQYGTMQNLHDSCSRQLYVSLMLLYKTYGRKLHL YSHPIVLGFRKIPMGVGLSPFLLAQFTSAICSVVRRAFPHCLAFSYMDDVVLGAKSVQ HRESLYTAVTNFLLSLGIHLNPNKTKRWGYSLNFMGYIIGSWGTLPQDHIVQKIKHCF RKLPVNRPIDWKVCQRIVGLLGFAAPFTQCGYPALMPLYACIQAKQAFTFSPTYKAFL SKQ YMNLYPVARQRPGLCQVFADATPTGWGLAIGHQRMRGTFVAPLPIHTAELLAACF ARSRSGAKLIGTDNSVVLSRKYTSFPWLLGCTANWILRGTSFVYVPSALNPADDPSRG RLG LSRPLLRLPFQPTTGRTSLYAVSPSVPSHLPVRVHFASPLHVAWRPP"gene order(2854..3221,1..835)/gene="preS1"CDS join(2854..3221,1..835)/gene="preS1"/function="envelope protein"/codon_start=1/product="large surface antigen"/protein_id="CCC82740.1"/db_xref="GI:341823533"/translation="MGGWSSKPRKGMGTNLSVPNPLGFFPDHQLDPAFGANSNNP DWD FNPIKDHWPAANQVGVGAFGPGLTPPHGGILGWSPQAQGILTTVSTIPPPASTNR QSGRQPTPISPPLRDSHPQAMQWNPTAFHQALQDPRVRGLYFPAGGSSSGTVNPAPNI ASH ISSISARTGDPVTNMENITSGFLGPLLVLQAGFFLLTRILTIPQSLDSWWTSLNF LGGSPVCLGQNSQSPTSNHSPTSCPPICPGYRWMCLRRFIIFLFILLLCLIFLLVLLD YQG MLPVCPLIPGSTTTSTGPCRTCTTPAQGNSMFPSCCCTKPTEGNCTCIPIPLSWA FAKYLWEWASVRFSWLSLLVPFVQWFVGLSPTVWLSAIWMMWYWGPSLYSIVSPFIPL LPIFFCLWVYI"gene order(3211..3221,1..835)/gene="preS2"CDS join(3211..3221,1..835)/gene="preS2"/function="envelope protein"/codon_start=1/product="middle surface antigen"/protein_id="CCC82741.1"/db_xref="GI:341823534"/translation="MQWNPTAFHQALQDPRVRGLYFPAGGSSSGTVNPAPNIASH ISSISARTGDPVTNMENITSGFLGPLLVLQAGFFLLTRILTIPQSLDSWWTSLNFLGG SPVCLGQNSQSPTSNHSPTSCPPICPGYRWMCLRRFIIFLFILLLCLIFLLVLLDYQG MLP VCPLIPGSTTTSTGPCRTCTTPAQGNSMFPSCCCTKPTEGNCTCIPIPLSWAFAK YLWEWASVRFSWLSLLVPFVQWFVGLSPTVWLSAIWMMWYWGPSLYSIVSPFIPLLPI FFCLWVYI"gene 155..835/gene="sAg"CDS 155..835/gene="sAg"/function="envelope protein"/codon_start=1/product="small surface antigen"/protein_id="CCC82736.1"/db_xref="GI:341823529"/translation="MENITSGFLGPLLVLQAGFFLLTRILTIPQSLDSWWTSLNF LGG SPVCLGQNSQSPTSNHSPTSCPPICPGYRWMCLRRFIIFLFILLLCLIFLLVLLD YQGMLPVCPLIPGSTTTSTGPCRTCTTPAQGNSMFPSCCCTKPTEGNCTCIPIPLSWA FAKYLWEWASVRFSWLSLLVPFVQWFVGLSPTVWLSAIWMMWYWGPSLYSIVSPFIPL LPIFFCLWVYI"gene 1374..1838/gene="X"CDS 1374..1838/gene="X"/function="putative transactivating protein"/codon_start=1/product="HBx"/protein_id="CCC86611.1"/db_xref="GI:342186698"/translation="MAARLYCQLDPSRDVLCLRPVGAESRGRPLSGPLGTLSSPS PSAVPADHGAHLSLRGLPVCAFSSAGPCALRFTSARCMETTVNAHQILPKVLHKRTLG LPAMSTTDLEAYFKDCVFKDWEELGEEIRLKVFVLGGCRHKLVCAPAPCNFFTSA"gene 1814..2458/gene="preC/C"CDS 1814..2458/gene="preC/C"/function="soluble secreted antigen" /codon_start=1/product="HBeAg precursor"/protein_id="CCC82737.1"/db_xref="GI:341823530"/translation="MQLFHLCLIISCTCPTVQASKLCLGWLWGMDIDPYKEFGAT VEL LSFLPSDFFPSVRDLLDTASALYREALESPEHCSPHHTALRQAILCWGELMTLAT WVGNNLQDPASRDLVVNYVNTNMGLKIRQLLWFHISCLTFGRETVLEYLVSFGVWIRT PPAYRPPNAPILSTLPETTVVRRRDRGRSPRRRTPSPRRRRSQSPRRRRSQSRESQC"gene 1901..2458/gene="C"CDS 1901..2458/gene="C"/function="capsid protein"/codon_start=1/product="cAg"/protein_id="CCC82738.1"/db_xref="GI:341823531"/translation="MDIDPYKEFGATVELLSFLPSDFFPSVRDLLDTASALYREA LESPEHCSPHHTALRQAILCWGELMTLATWVGNNLQDPASRDLVVNYVNTNMGLKIRQ LLWFHISCLTFGRETVLEYLVSFGVWIRTPPAYRPPNAPILSTLPETTVVRRRDRGRS PRRRTPSPRRRRSQSPRRRRSQSRESQC"2. Hepatitis B virus complete genome, genotype A2, isolateP5.9GenBank: HE576988.1FASTA GraphicsGo to:LOCUS HE576988 3221 bp DNAcircular VRL 29-JUL-2011DEFINITION Hepatitis B virus complete genome, genotype A2, isolate P5.9.ACCESSION HE576988VERSION HE576988.1 GI:341823521KEYWORDS complete genome.SOURCE Hepatitis B virusORGANISM Hepatitis B virusViruses; Retro-transcribing viruses; Hepadnaviridae;Orthohepadnavirus.REFERENCE 1AUTHORS Martel,N., Cotte,L., Trabaud,M.A., Trepo,C., Zoulim,F., Gomes,S.and Kay,A.TITLE Glucocorticoid-induced reactivation of an occult HBV infection inan HIV+ patientJOURNAL UnpublishedREFERENCE 2 (bases 1 to 3221)AUTHORS Kay,A.C.TITLE Direct SubmissionJOURNAL Submitted (22-JUL-2011) to the INSDC. Kay A.C., U1052, INSERM, 151cours Albert Thomas, Lyon, 69003, FRANCE FEATURES Location/Qualifierssource 1..3221/organism="Hepatitis B virus"/mol_type="genomic DNA"/serotype="ayw1"/isolate="P5.9"/db_xref="taxon:10407"/country="France"/collection_date="09-Jun-2007"/note="genotype:A2"gene order(2307..3221,1..1623)/gene="pol"CDS join(2307..3221,1..1623)/gene="pol"/function="viral polymerase"/codon_start=1/product="reverse transcriptase-DNA polymerase"/protein_id="CCC82733.1"/db_xref="GI:341823525"/translation="MPLSYQHFRKLLLLDDGTEAGPLEEELPRLADADLNRRVAE DLN LGNLNVSIPWTHKVGNFTGLYSSTVPIFNPEWQTPSFPKIHLQEDIINRCQQFVG PLTVNEKRRLKLIMPARFYPTHTKYLPLDKGIKPYYPDQVVNHYFQTRHYLHTLWKAG ILYKRETTRSASFCGSPYSWEQELQHGRLVIKTSQRHGDESFCSQPSGILSRSSVGPC IRSQLKQSRLGLQPHQGPLASSQPGRSGSIRARAHPSTRRYFGVEPSGSGHIDHSVNN SSS CLHQSAVRKAAHSHLSTSKRQSSSGHAVEFHCLPPSSAGSQSQGSVFSCWWLQFR NSKPCSEYCLSHLVNLREDWGPCDEHGEHHIRTPRTPARVTGGVFLVDKNPHNTTESR LVV DFSQFSRGITRVSWPKFAVPNLQSLTNLLSSNLSWLSLDVSAAFYHIPLHPAAMP HLLIGSSGLSRYVARLSSNSRINNNQYGTMQNLHDSCSRQLYVSLMLLYKTYGRKLHL YSH PIVLGFRKIPMGVGLSPFLLAQFTSAICSVVRRAFPHCLAFSYMDDVVLGAKSVQ HRESLYTAVTNFLLSLGIHLNPNKTKRWGYSLNFMGYIIGSWGTLPQDHIVQKIKHCF RKL PVNRPIDWKVCQRIVGLLGFAAPFTQCGYPALMPLYACIQAKQAFTFSPTYKAFL SKQYMNLYPVARQRPGLCQVFADATPTGWGLAIGHQRMRGTFVAPLPIHTAELLAACF ARS RSGAKLIGTDNSVVLSRKYTSFPWLLGCTANWILRGTSFVYVPSALNPADDPSRG RLGLSRPLLRLPFQPTTGRTSLYAVSPSVPSHLPVRVHFASPLHVAWRPP"gene order(2854..3221,1..835)/gene="preS1"CDS join(2854..3221,1..835)/gene="preS1"/function="envelope protein"/codon_start=1/product="large surface antigen"/protein_id="CCC82734.1"/db_xref="GI:341823526"/translation="MGGWSSKPRKGMGTNLSVPNPLGFFPDHQLDPAFGANSNNP DWDFNPIKDHWPAANQVGVGAFGPGLTPPHGGILGWSPQAQGILTTVSTIPPPASTNR QSGRQPTPISPPLRDSHPQAMQWNSTAFHQALQDPRVRGLYFPAGGSSSGTVNPAPNI ASH ISSISARTGDPVTNMENITSGLLGPLLVLQAGFFLLTRILTIPQSLDSWWTSLNF QGGSPVCLGQNSQSPTSNHSPTSCPPICPGYRWMCLRRFIIFLFILLLCLIFLLVLLD YQG MLPVCPLIPGSTTTSTGPCRTCTTPAQGNSMFPSCCCTKPTEGNCTCIPIPSSWA FAKYLWEWASVRFSWLSLLVPFVQWFVGLSPTVWLSAIWMMWYWGPSLYSIVSPFIPL LPIFFCLWVYI"gene order(3211..3221,1..835)/gene="preS2"CDS join(3211..3221,1..835)/gene="preS2"/function="envelope protein"/codon_start=1/product="middle surface antigen"/protein_id="CCC82735.1"/db_xref="GI:341823527"/translation="MQWNSTAFHQALQDPRVRGLYFPAGGSSSGTVNPAPNIASH ISS ISARTGDPVTNMENITSGLLGPLLVLQAGFFLLTRILTIPQSLDSWWTSLNFQGG SPVCLGQNSQSPTSNHSPTSCPPICPGYRWMCLRRFIIFLFILLLCLIFLLVLLDYQG MLPVCPLIPGSTTTSTGPCRTCTTPAQGNSMFPSCCCTKPTEGNCTCIPIPSSWAFAK YLWEWASVRFSWLSLLVPFVQWFVGLSPTVWLSAIWMMWYWGPSLYSIVSPFIPLLPI FFCLWVYI"gene 155..835/gene="sAg"CDS 155..835/gene="sAg"/function="envelope protein"/codon_start=1/product="small surface antigen"/protein_id="CCC82730.1"/db_xref="GI:341823522"/translation="MENITSGLLGPLLVLQAGFFLLTRILTIPQSLDSWWTSLNF QGGSPVCLGQNSQSPTSNHSPTSCPPICPGYRWMCLRRFIIFLFILLLCLIFLLVLLD YQGMLPVCPLIPGSTTTSTGPCRTCTTPAQGNSMFPSCCCTKPTEGNCTCIPIPSSWA FAK YLWEWASVRFSWLSLLVPFVQWFVGLSPTVWLSAIWMMWYWGPSLYSIVSPFIPL LPIFFCLWVYI"gene 1374..1838/gene="X"CDS 1374..1838/gene="X"/function="putative transactivating protein"/codon_start=1/product="HBx"/protein_id="CCC86610.1"/db_xref="GI:342186697"/translation="MAARLYCQLDPSRDVLCLRPVGAESRGRPLSGPLGTLSSPS PSAVPADHGAHLSLRGLPVCAFSSAGPCALRFTSARCMETTVNAHQILPKVLHKRTLG LPAMSTTDLEAYFKDCVFKDWEELGEEIRLKVFVLGGCRHKLVCAPAPCNFFTSA"gene 1814..2458/gene="preC/C"CDS 1814..2458/gene="preC/C"/function="soluble secreted antigen" /codon_start=1/product="HBeAg precursor"/protein_id="CCC82731.1"/db_xref="GI:341823523"/translation="MQLFHLCLIISCTCPTVQASKLCLGWLWGMDIDPYKEFGAT VELLSFLPSDFFPSVRDLLDTASALYREALESPEHCSPHHTALRQAILCWGELMTLAT WVGNNLEDPASRDLVVNYVNNNMGLKIRQLLWFHISCLTFGRETVLEYLVSFGVWIRT PPA YRPPNAPILSTLPETTVVRRRDRGRSPRRRTPSPRRRRSQSPRRRRSQSRESQC"gene 1901..2458/gene="C"CDS 1901..2458/gene="C"/function="capsid protein"/codon_start=1/product="cAg"/protein_id="CCC82732.1"/db_xref="GI:341823524"/translation="MDIDPYKEFGATVELLSFLPSDFFPSVRDLLDTASALYREA LES PEHCSPHHTALRQAILCWGELMTLATWVGNNLEDPASRDLVVNYVNNNMGLKIRQ LLWFHISCLTFGRETVLEYLVSFGVWIRTPPAYRPPNAPILSTLPETTVVRRRDRGRS PRRRTPSPRRRRSQSPRRRRSQSRESQC"(3). Hepatitis B virus partial pol gene for polymerase, isolate Armin Lab. 3B1008GenBank: HE575213.1FASTA GraphicsGo to:LOCUS HE575213 624 bp DNA linear VRL 21-JUL-2011DEFINITION Hepatitis B virus partial pol gene for polymerase, isolate ArminLab. 3B1008.ACCESSION HE575213VERSION HE575213.1 GI:340805631KEYWORDS .SOURCE Hepatitis B virusORGANISM Hepatitis B virusViruses; Retro-transcribing viruses; Hepadnaviridae;Orthohepadnavirus.REFERENCE 1AUTHORS Pouryasin,A., Sharafi,H. and Malekzadeh,R.TITLE Direct SubmissionJOURNAL UnpublishedREFERENCE 2 (bases 1 to 624)AUTHORS Pouryasin,A.TITLE Direct SubmissionJOURNAL Submitted (14-JUL-2011) to the INSDC. Pouryasin A., Department ofMolecular Diagnostics, Armin Pathobiology Laboratory, Ghaem maghamst, Tehran 1235642351, IranFEATURES Location/Qualifierssource 1..624/organism="Hepatitis B virus"/mol_type="genomic DNA"/serotype="ayw2"/isolate="Armin Lab. 3B1008"/isolation_source="plasma of HBVinfected patient"/host="Homo sapiens"/db_xref="taxon:10407"/country="Iran"/collection_date="2011"/note="genotype:D1"gene <1..>624/gene="pol"CDS <1..>624/gene="pol"/codon_start=1/product="polymerase"/protein_id="CCC55934.1"/db_xref="GI:340805632"/translation="NLLSSNLSWLSLDVSAAFYHLPLHPAAMPHLLVGSSGLSRY VARLSSNSRIVNHQHGTMQNLHDSCSRNLYVSLLLLYQTFGRKLHLYSHPIILGFRKI PMGVGLSPFLLAQFTSAICSVVRRSFPHCLAFSYMDDVVLGAKSVQHLESLFTAVTNF LLS LGIHLNPNKTKRWGHSLHFMGYVIGTYGSLPQDHIIQKIKECFRKLPV"(4)Hepatitis B virus partial preS1/preS2/S gene for polyprotein, surface antigen region, isolate hungm8GenBank: FR750342.1FASTA GraphicsGo to:LOCUS FR750342 576 bp DNA linear VRL 17-FEB-2011DEFINITION Hepatitis B virus partial preS1/preS2/S gene for polyprotein,surface antigen region, isolate hungm8. ACCESSION FR750342VERSION FR750342.1 GI:323575242KEYWORDS .SOURCE Hepatitis B virusORGANISM Hepatitis B virusViruses; Retro-transcribing viruses; Hepadnaviridae;Orthohepadnavirus.REFERENCE 1AUTHORS Dencs,A., Farkas,A., Gyugos,M., Kurcz,A., Puskas,E., Barcsay,E. andTakacs,M.TITLE Phylogenetic analysis of a nosocomial transmission of hepatitis Bvirus on a pediatric haematology wardJOURNAL UnpublishedREFERENCE 2 (bases 1 to 576)AUTHORS Takacs,M.TITLE Direct SubmissionJOURNAL Submitted (17-DEC-2010) Takacs M., National Center forEpidemiology, Division of Virology, Gyali ut 2-6, H-1097, HUNGARYFEATURES Location/Qualifierssource 1..576/organism="Hepatitis B virus"/mol_type="genomic DNA"/isolate="hungm8"/db_xref="taxon:10407"gene <1..>576/gene="preS1/preS2/S"CDS <1..>576/gene="preS1/preS2/S"/codon_start=3/product="polyprotein, surface antigen region"/protein_id="CBY84032.1"/db_xref="GI:323575243"/translation="LLGWSPQAQGIIQTLPANPPPASTNRQSGRQPTPLSPPLRN THPQAMQWNSTTFHQTLQDPRVRGLYFPAGGSSSGTVNPVPTTASPISSIFSRIGDPV LNMENITSGFLGPLLVLQAGFFLLTRILTIPQSLDSWWTSLNFLGGTTVCLGQNSQSP TSNHSPTSCPPTCPGYRWMCLRRFIIFLFILLLC"(5)Hepatitis B virus partial preS1/preS2/S gene for polyprotein, surface antigen region, isolate hungm6GenBank: FR750340.1FASTA GraphicsGo to:LOCUS FR750340 576 bp DNA linear VRL 17-FEB-2011DEFINITION Hepatitis B virus partial preS1/preS2/S gene for polyprotein,surface antigen region, isolate hungm6. ACCESSION FR750340VERSION FR750340.1 GI:323575238KEYWORDS .SOURCE Hepatitis B virusORGANISM Hepatitis B virusViruses; Retro-transcribing viruses; Hepadnaviridae;Orthohepadnavirus.REFERENCE 1AUTHORS Dencs,A., Farkas,A., Gyugos,M., Kurcz,A., Puskas,E., Barcsay,E. andTakacs,M.TITLE Phylogenetic analysis of a nosocomial transmission of hepatitis Bvirus on a pediatric haematology wardJOURNAL UnpublishedREFERENCE 2 (bases 1 to 576)AUTHORS Takacs,M.TITLE Direct SubmissionJOURNAL Submitted (17-DEC-2010) Takacs M., National Center forEpidemiology, Division of Virology, Gyali ut 2-6, H-1097, HUNGARYFEATURES Location/Qualifierssource 1..576/organism="Hepatitis B virus"/mol_type="genomic DNA"/isolate="hungm6"/db_xref="taxon:10407"gene <1..>576/gene="preS1/preS2/S"CDS <1..>576/gene="preS1/preS2/S"/codon_start=3/product="polyprotein, surface antigen region"/protein_id="CBY84030.1"/db_xref="GI:323575239"/translation="LLGWSPQAQGIIQTLPANPPPASTNRQSGRQPTPLSPPLRN THPQAMQWNSTTFHQTLQDPRVRGLYFPAGGSSSGTVNPVPTTASPISSIFSRIGDPV LNMENITSGFLGPLLVLQAGFFLLTRILTIPQSLDSWWTSLNFLGGTTVCLGQNSQSP TSNHSPTSCPPTCPGYRWMCLRRFIIFLFILLLC"(6)Hepatitis B virus partial preS1/preS2/S gene for polyprotein, surface antigen region, isolate hungm7GenBank: FR750341.1FASTA GraphicsGo to:LOCUS FR750341 576 bp DNA linear VRL 17-FEB-2011DEFINITION Hepatitis B virus partial preS1/preS2/S gene for polyprotein,surface antigen region, isolate hungm7. ACCESSION FR750341VERSION FR750341.1 GI:323575240KEYWORDS .SOURCE Hepatitis B virusORGANISM Hepatitis B virusViruses; Retro-transcribing viruses; Hepadnaviridae;Orthohepadnavirus.REFERENCE 1AUTHORS Dencs,A., Farkas,A., Gyugos,M., Kurcz,A., Puskas,E., Barcsay,E. andTakacs,M.TITLE Phylogenetic analysis of a nosocomial transmission of hepatitis Bvirus on a pediatric haematology wardJOURNAL UnpublishedREFERENCE 2 (bases 1 to 576)AUTHORS Takacs,M.TITLE Direct SubmissionJOURNAL Submitted (17-DEC-2010) Takacs M., National Center forEpidemiology, Division of Virology, Gyali ut 2-6, H-1097, HUNGARYFEATURES Location/Qualifierssource 1..576/organism="Hepatitis B virus"/mol_type="genomic DNA"/isolate="hungm7"/db_xref="taxon:10407"gene <1..>576/gene="preS1/preS2/S"CDS <1..>576/gene="preS1/preS2/S"/codon_start=3/product="polyprotein, surface antigen region"/protein_id="CBY84031.1"/db_xref="GI:323575241"/translation="LLGWSPQAQGIIQTLPANPPPASTNRQSGRQPTPLSPPLRN THPQAMQWNSTTFHQTLQDPRVRGLYFPAGGSSSGTVNPVPTTASPISSIFSRIGDPV LNMENITSGFLGPLLVLQAGFFLLTRILTIPQSLDSWWTSLNFLGGATVCLGQNSQSP TSNHSPTSCPPTCPGYRWMCLRRFIIFLFILLLC"(7)Hepatitis B virus complete genome, isolate YL204, X/C recombinantGenBank: FR714506.1FASTA GraphicsGo to:LOCUS FR714506 3215 bp DNAcircular VRL 25-JAN-2011DEFINITION Hepatitis B virus complete genome, isolate YL204, X/C recombinant.ACCESSION FR714506VERSION FR714506.1 GI:310923518KEYWORDS complete genome.SOURCE Hepatitis B virusORGANISM Hepatitis B virusViruses; Retro-transcribing viruses; Hepadnaviridae;Orthohepadnavirus.REFERENCE 1AUTHORS Fang,Z.L., Hue,S., Sabin,C.A., Li,G.J., Yang,J.Y., Chen,Q.Y.,Fang,K.X., Huang,J., Wang,X.Y. andHarrison,T.J.TITLE A complex hepatitis B virus (X/C) recombinant is common in Long Ancounty, Guangxi and may have originated in southern ChinaJOURNAL J. Gen. Virol. 92 (PT 2), 402-411 (2011)PUBMED 20965984REFERENCE 2 (bases 1 to 3215)AUTHORS Harrison,T.J.TITLE Direct SubmissionJOURNAL Submitted (08-OCT-2010) Harrison T.J., UCL, Medicine, WindeyerBuilding, 46 Cleveland Street, London N14 4XG, UNITED KINGDOMFEATURES Location/Qualifierssource 1..3215/organism="Hepatitis B virus"/mol_type="genomic DNA"/isolate="YL204"/db_xref="taxon:10407"/note="X/C recombinant"geneorder(2307..3215,3205..3215,1..835,1..1623)/gene="P"CDS join(2307..3215,1..1623)/gene="P"/note="join 2307..3215,1..1623"/codon_start=1/product="polymerase"/protein_id="CBX46807.1"/db_xref="GI:310923522"/translation="MPLSYQHFRKLLLLDDEAGPLEEELPRLADEDLNRRVAEDL NLGNPNVSIPWTHKVGNFTGLYSSTVPVFNPEWQTPSFPNIHLHEDIINRCQQFVGPL TVNEKRRLNLIMPARFYPNLTKYLPLDKGIKPYYPEQAVNHYFKTRHYLHTLWKSGIL YKR ETTRSASFCGSPYSWEQELQHGRLVFQTSERHGDESFCSQSSGISSRSSVGPCIR SQLKQSRLGLQSQQGPLATSPSGRSGSIRARVHSSSRRSFGMEPSGSGHFNKRASSSS SCL HQSAVRKAANSHLSTSKRQSSSGHAVELHNLPPSSARSQNQGPVFSCWWLQFRNS KPCSDYCLSHLINLREDWGPCNEHGEHHIRIPRTPARVTGGVFLVDKNPHNTAESRLV VDF SQFSRGSTRVSWPKFAVPNLQSLTNLLSSNLSWLSLDVSAAFYHIPLHPAAMPHL LVGSSGLSRYVARLSSNSRILDHQYGSMQNLHDSCSRQLYVSLMLLYQTFGRKLHLYS HPI ILGFRKIPMGVGLSPFLLAQFTSAICSVVRRAFPHCLAFSYMDDVVLGAKSVQHL ESLYTAVTNFLLSLGIHLNSNKTKRWGYSLNFMGYVIGSWGTLPQDHIIQKIKQCFRK LPVNRPIDWKVCQRISGLLGFAAPFTQCGYPALMPLYACIQAKQAFTFSPTYKAFLCK QYMNLYPVARQRPGLCQVFADATPTGWGLAIGHQRMRGTFVAPLPIHTAELLAACFAR SRS GAKLIGTDNSVVLSRKYTSFPWLLGCTANWILRGTSFVYVPSALNPADDPSRGRL GIYRPLLHLPYRPSTGRTSLYAVSPFVPSHLPDRVHFASPLHVAWKPP"gene order(2848..3215,1..835,155..835)/gene="S"CDS join(2848..3215,1..835)/gene="S"/codon_start=1/product="large surface protein"/protein_id="CBX46808.1"/db_xref="GI:310923523"/translation="MGGWSSKPRKGMGTNLSVPNPLGFLPDHQLDPAFGANSNNP DWD FNPNKDHWPQAHQVGAGAFGPGFTPPHGGLLGWSPQAQGILTNVPAVPPPASTNR QLGRQPTPISPPLRDSHPQAMQWNSTTFHQALQDPRIRGLYFPAGGSSSGTVNPAPTI ASH ISSIFARIGDPATNMENTTSGFLGPLLVLQAGFFLLTKILTIPQSLDSWWTSLNF LGGAPVCLGQNSQSPTSNHSPTSCPPICPGYRWMCLRRFIIFLFILLLCLIFLLVLLD YQG MLPVCPLIPGSSTTSTGPCKTCTTPAQGNSMYPSCCCTKPSDGNCTCIPIPSSWA FAKYLWEWASARFSWLSLLVPFVQWFVGLSPTVWLSVIWMMWYWGPSLYNILSPFIPL LPIFFCLWVYI"CDS join(3205..3215,1..835)/gene="P"/codon_start=1/product="middle surface protein"/protein_id="CBX46809.1"/db_xref="GI:310923524"/translation="MQWNSTTFHQALQDPRIRGLYFPAGGSSSGTVNPAPTIASH ISSIFARIGDPATNMENTTSGFLGPLLVLQAGFFLLTKILTIPQSLDSWWTSLNFLGG APVCLGQNSQSPTSNHSPTSCPPICPGYRWMCLRRFIIFLFILLLCLIFLLVLLDYQG MLP VCPLIPGSSTTSTGPCKTCTTPAQGNSMYPSCCCTKPSDGNCTCIPIPSSWAFAK YLWEWASARFSWLSLLVPFVQWFVGLSPTVWLSVIWMMWYWGPSLYNILSPFIPLLPI FFCLWVYI"CDS 155..835/gene="S"/codon_start=1/product="major surface protein"/protein_id="CBX46804.1"/db_xref="GI:310923519"/translation="MENTTSGFLGPLLVLQAGFFLLTKILTIPQSLDSWWTSLNF LGG APVCLGQNSQSPTSNHSPTSCPPICPGYRWMCLRRFIIFLFILLLCLIFLLVLLD YQGMLPVCPLIPGSSTTSTGPCKTCTTPAQGNSMYPSCCCTKPSDGNCTCIPIPSSWA FAK YLWEWASARFSWLSLLVPFVQWFVGLSPTVWLSVIWMMWYWGPSLYNILSPFIPL LPIFFCLWVYI"gene 1374..1838/gene="X"CDS 1374..1838/gene="X"/codon_start=1/product="X protein"/protein_id="CBX46805.1"/db_xref="GI:310923520"/translation="MAARLYCQLDPARDVLCLRPVGAESCGRPLSGPLGDLPSSS SSAVPSVHGAHLSLRGLPVCAFSSAGPCALRFTSARRMETTVNAHLILPKVLHKRTLG LSAMSTTDLEAYFKDCVFKDWEELGEEMRLKVFVLGGCRHKLVCSPTPCNFFTSA"gene 1901..2452/gene="C"CDS 1901..2452/gene="C"/note="precore region has codon 28 stop" /codon_start=1/product="core protein"/protein_id="CBX46806.1"/db_xref="GI:310923521"/translation="MDIDPYKEFGASVELLSFLPTDFFPSVRDLLDTASALYREA LES PEHCSPHHTALRQAILCWGELMTLATWVGSNLEDPASRDLVVSYVNVNMGLKFRQ LLWFHISCLTFGRETVLEYLVSFGVWIRTPPPYRPPNAPILSTLPETTVVRRRGRTPR RRTPSPRRRRSQSPRRRRSQSRESQC"(8)Hepatitis B virus complete genome, isolate WL339, X/C recombinantGenBank: FR714504.1FASTA GraphicsGo to:LOCUS FR714504 3215 bp DNAcircular VRL 25-JAN-2011DEFINITION Hepatitis B virus complete genome, isolate WL339, X/C recombinant.ACCESSION FR714504VERSION FR714504.1 GI:310923502KEYWORDS complete genome.SOURCE Hepatitis B virusORGANISM Hepatitis B virusViruses; Retro-transcribing viruses; Hepadnaviridae;Orthohepadnavirus.REFERENCE 1AUTHORS Fang,Z.L., Hue,S., Sabin,C.A., Li,G.J., Yang,J.Y., Chen,Q.Y.,Fang,K.X., Huang,J., Wang,X.Y. andHarrison,T.J.TITLE A complex hepatitis B virus (X/C) recombinant is common in Long Ancounty, Guangxi and may have originated in southern ChinaJOURNAL J. Gen. Virol. 92 (PT 2), 402-411 (2011)PUBMED 20965984REFERENCE 2 (bases 1 to 3215)AUTHORS Harrison,T.J.TITLE Direct SubmissionJOURNAL Submitted (08-OCT-2010) Harrison T.J., UCL, Medicine, WindeyerBuilding, 46 Cleveland Street, London N14 4XG, UNITED KINGDOMFEATURES Location/Qualifierssource 1..3215/organism="Hepatitis B virus"/mol_type="genomic DNA"/isolate="WL339"/db_xref="taxon:10407"/note="X/C recombinant"geneorder(2307..3215,3205..3215,1..835,1..1623)/gene="P"CDS join(2307..3215,1..1623)/gene="P"/note="join 2307..3215,1..1623"/codon_start=1/product="polymerase"/protein_id="CBX46794.1"/db_xref="GI:310923507"/translation="MPLSYQHFRKLLLLDDEAGPLEEELPRLADEGLNRRVAEDL NLGNPNVSIPWTHKVGNFTGLYSSTVPVFNPEWQTPSFPNIHLHEDIINRCQQFVGPL TINEKRRLNLIMPARFYPNLTKYLPLDKGIKPYYPEQAVNHYFKTRHYLHTLWKAGIL YKR ETTRSASFCGSPYSWEQELQHGRLVFQTSERHGDESFCSQSSGISSRSSVGPCVR SQLKQSRLGLQPQQGPLATSPSGRSGSIRARVHPSTRRSFGVEPSGSGHINKRASSSS SCL HQSAVRKAANSHLSTSKRQSSSGHAVELHNLPPSSARPQSQGPIFSCWWLQFRNS KPCSEYCLSHLINLREDWGPCNEHGEHHIRIPRTPARVTGGVFLVDKNPHNTAESRLV VDF SQFSRGSTRVSWPKFAVPNLQSLTNLLSSNLSWLSLDVSAAFYHLPLHPAAMPHL LVGSSGLSGYVARLSSNSRILDHQHGTMQNLHDSCSRQLYVSLMLLYQTYGRKLHLYS HPI ILGFRKIPMGVGLSPFLLAQFTSAICSVVRRAFPHCLAFSYMDDVVLGAKSVQHL ESLYTAVTNFLLSLGIHLNPNKTKRWGYSLNFMGYVIGSWGSLPQDHIIQKIKQCFRK LPI NRPIDWKVCQRISGLLGFAAPFTQCGYPALMPLYACIQAKQAFTFSPTYKAFLCK QYMNLYPVARQRPGLCQVFADATPTGWGLAIGHQRMRGTFVAPLPIHTAELLAACFAR SRSGAKLIGTDNSVVLSRKYTSFPWLLGCAANWILRGTSFVYVPSALNPADDPSRGRL GIYRPLLHLPFRPSTGRTSLYAVSPFVPSRLPDRVHFASPLHVAWRPP"gene order(2848..3215,1..835,155..835)/gene="S"CDS join(2848..3215,1..835)/gene="S"/codon_start=1/product="large surface protein"/protein_id="CBX46795.1"/db_xref="GI:310923508"/translation="MGGWSSKPRKGMGTNLSVPNPLGFLPDHQLDPAFGANSNNP DWDFNPNKDHWPQAHQVGAGAFGPGFTPPHGGLLGWSPQAQGILTNVPVVPPPASTNR QSGRQPTPISPPLRDSHPQAMQWNSTTFHQALQDPRVRGLYFPAGGSSSGTVNPAPNI ASH ISSIFGRIGDPATSMENITSGFLGPLLVLQAGFFLLTRILTIPQSLDSWWTSLNF LGGAPVCLGQNSQSPTSNHSPTSCPPICPGYRWMCLRRFIIFLFILLLCLIFLLVLLD YQG MLPVCPLIPGSSTTSTGPCKTCTTPAQGNSMYPSCCCTKPTDGNCTCIPIPSSWA FAKYLWEWASARFSWLSLLVPFVQWFVGLSPTVWLSVIWMMWYWGPSLYNILSPFIPL LPIFFCLWVYI"CDS join(3205..3215,1..835)/gene="P"/codon_start=1/product="middle surface protein"/protein_id="CBX46796.1"/db_xref="GI:310923509"/translation="MQWNSTTFHQALQDPRVRGLYFPAGGSSSGTVNPAPNIASH ISSIFGRIGDPATSMENITSGFLGPLLVLQAGFFLLTRILTIPQSLDSWWTSLNFLGG APVCLGQNSQSPTSNHSPTSCPPICPGYRWMCLRRFIIFLFILLLCLIFLLVLLDYQG MLPVCPLIPGSSTTSTGPCKTCTTPAQGNSMYPSCCCTKPTDGNCTCIPIPSSWAFAK YLW EWASARFSWLSLLVPFVQWFVGLSPTVWLSVIWMMWYWGPSLYNILSPFIPLLPI FFCLWVYI"CDS 155..835/gene="S"/codon_start=1/product="major surface protein"/protein_id="CBX46790.1"/db_xref="GI:310923503"/translation="MENITSGFLGPLLVLQAGFFLLTRILTIPQSLDSWWTSLNF LGG APVCLGQNSQSPTSNHSPTSCPPICPGYRWMCLRRFIIFLFILLLCLIFLLVLLD YQGMLPVCPLIPGSSTTSTGPCKTCTTPAQGNSMYPSCCCTKPTDGNCTCIPIPSSWA FAK YLWEWASARFSWLSLLVPFVQWFVGLSPTVWLSVIWMMWYWGPSLYNILSPFIPL LPIFFCLWVYI"gene 1374..1838/gene="X"CDS 1374..1838/gene="X"/codon_start=1/product="X protein"/protein_id="CBX46791.1"/db_xref="GI:310923504"/translation="MAARLCCQLDPARDVLCLRPVGAESCGRPLSGPLGDLPSSS SSA。