HIV 1基因组序列
我国HIV-1 B'亚型流行株vif基因序列特征及变异分析

我国HIV-1 B'亚型流行株vif基因序列特征及变异分析李林;刘永健;鲍作义;李韩平;庄道民;刘思扬;李敬云【期刊名称】《中华微生物学和免疫学杂志》【年(卷),期】2006(026)008【摘要】目的研究人免疫缺陷病毒-1(HIV-1)B'亚型vif基因的变异特征,探讨其与HIV传播和致病性之间的关系.方法采集河南省部分HIV感染者的外周血,提取41例HIV感染者外周血淋巴细胞DNA,设计特异性引物扩增其前病毒基因组中的vif 基因,对于扩增阳性的29例PCR产物进行vif区基因的测序及分析.结果 29条vif 基因的平均离散率是0.0328,突变主要集中于90~120、270~302、372~405、450~470四个区域.Vif多肽链的90~93位和157~160位存在两个富含R和K 带有强烈正电荷的亲水区,带正电荷的R或K交替出现,几乎没有其他的氨基酸残基.29个Vif多肽链有21条在90~93位存在R90 RKR93基序;有26条在157~160位存在K157 RRK160基序,29条序列在114位和133位存在两个在HIV-1和HIV-2以及SIV内保守的半胱氨酸(A).结论 vif在HⅣ-1基因组内具有相对保守性,其特征性区域和氨基酸基序对于保持Vif蛋白的功能是十分重要的.【总页数】4页(P743-746)【作者】李林;刘永健;鲍作义;李韩平;庄道民;刘思扬;李敬云【作者单位】军事医学科学院微生物流行病研究所,病原微生物生物安全国家重点实验室,北京,100071;军事医学科学院微生物流行病研究所,病原微生物生物安全国家重点实验室,北京,100071;军事医学科学院微生物流行病研究所,病原微生物生物安全国家重点实验室,北京,100071;军事医学科学院微生物流行病研究所,病原微生物生物安全国家重点实验室,北京,100071;军事医学科学院微生物流行病研究所,病原微生物生物安全国家重点实验室,北京,100071;军事医学科学院微生物流行病研究所,病原微生物生物安全国家重点实验室,北京,100071;军事医学科学院微生物流行病研究所,病原微生物生物安全国家重点实验室,北京,100071【正文语种】中文【中图分类】R3【相关文献】1.柳州市16例吸毒者HIV-1病毒流行株亚型分布及耐药情况分析2.江苏省HIV-1流行株env和pol基因亚型及其系统分析3.新城疫病毒F48E9株及东北地区流行株F基因遗传变异分析4.山东省HIV-1流行株多基因区亚型分析5.陕西省HIV-1流行株膜蛋白基因C2-V3区序列特征和亚型分析因版权原因,仅展示原文概要,查看原文内容请购买。
HIV-1 env基因序列分析及其与长期感染不进展现象相关性研究

HIV-1 env基因序列分析及其与长期感染不进展现象相关性研究许晶;王媛;黎志东;徐志凯【期刊名称】《中国皮肤性病学杂志》【年(卷),期】2008(22)3【摘要】目的研究HIV-1长期感染不进展现象与HIV-1 env基因变异的关系。
方法用巢式聚合酶链反应(nested-PCR)对21例感染HIV-1毒株7年以上者外周血单一核细胞(PBMCs)的核酸样本进行扩增,获得HIV-1膜蛋白(env)基因的核酸片段,对其C2-V3及邻区350-450个核苷酸序列进行测定和分析,所得结果与HIV-1该亚型国际标准株进行比较,分析共享序列及突变序列,制作系统树,计算离散率。
结果离散率和系统树分析21个毒株均为HIV-1 B亚型,毒株间基因离散率在2%左右,高于前期研究结果;未见V3环顶端四肽特征性GPGR和GRGQ,也未见前期研究曾经发现的脯氨酸向异亮氨酸的变异现象。
结论HIV-1长期感染者体内毒株env基因无规律性突变。
【总页数】2页(P155-156)【关键词】HIV-1;长期感染不进展者;膜蛋白(env)基因【作者】许晶;王媛;黎志东;徐志凯【作者单位】第四军医大学微生物学教研室【正文语种】中文【中图分类】R711.72【相关文献】1.相同来源HIV-1 Env、Gag基因序列变异和宿主基因多态性与疾病进展关系的分析 [J], 白立石;王开利;周广恩;孟宾;刘颜成;曾毅2.中国HIV-1感染疾病长期不进展者CCR2-64I、SDF1-3′A和CCR5△32的基因变异研究 [J], 王树祥;尚红;韩晓旭;张子宁;王亚男;张旻;姜拥军;刘静;苏艳丽3.出入境人群HIV-1型env C2-V3区段基因序列分析和亚型研究 [J], 朱锦德;田桢干;邢辉;方筠;张晓航;刘胜牙4.云南瑞丽县IDUs人群HIV-1感染者毒株env基因C2-V3区序列的测定 [J], 方荣;王斌;路永波;宋旭霞;邵济钧5.HIV-1长期感染不进展者体内毒株env基因序列测定 [J], 黎志东因版权原因,仅展示原文概要,查看原文内容请购买。
艾滋病毒基因组的变异及演化分析

艾滋病毒基因组的变异及演化分析艾滋病毒(HIV)是一种致命性传染病,它攻击人体免疫系统,导致艾滋病的发展。
艾滋病毒有两种主要类型,即HIV-1和HIV-2。
HIV-1是全球感染最多的类型,而HIV-2主要在西非传播。
这两种类型的病毒都会发生变异,使其适应环境的能力增强,这给病毒的疫苗开发和治疗提出了巨大的挑战。
艾滋病毒基因组是一个非常复杂的结构,由数万个核苷酸组成。
它包含了多个基因,这些基因编码了不同的蛋白质,这些蛋白质在病毒的复制和传播过程中扮演着关键的角色。
艾滋病毒基因组的变异是病毒演化的结果,这种变异常常导致病毒对宿主免疫系统的逃逸和抗药性的产生。
艾滋病毒的变异主要通过两个机制发生,即突变和重组。
突变是指在病毒基因组中发生的错误复制过程导致的单个核苷酸(A、T、G或C)的改变。
由于HIV的复制速度非常快,每天产生数十亿个病毒颗粒,这意味着每天都会产生大量的突变。
这些突变可能会导致病毒对抗药物的变异、逃避免疫系统的攻击以及适应新的宿主环境。
另一方面,重组是指当一个宿主同时感染两个不同的病毒株时,病毒基因组之间的DNA片段可以进行重组。
这种重组现象使得新的变异株得以形成,进一步增加了病毒的变异性。
艾滋病毒的演化非常复杂,演化速度也非常快。
病毒基因组中高度变异的区域是HIV的外膜糖蛋白(Env)基因。
Env基因编码了病毒表面蛋白,它决定了病毒能否进入宿主细胞。
由于这个基因的高度变异性,病毒可以逃避宿主免疫系统的攻击,从而在宿主体内存活下来。
此外,HIV还具有高度变异的反转录酶和蛋白酶基因,对抗药物治疗的变异也通常发生在这些基因上。
了解艾滋病毒基因组的变异及演化对于病毒的疫苗研发和治疗的设计非常重要。
由于病毒的高度变异性,目前尚未找到具有广谱效力的疫苗。
然而,通过对不同病毒株的测序和分析,科学家们可以了解病毒的变异规律,为疫苗研发提供重要的参考。
此外,在制定抗病毒治疗方案时,了解艾滋病毒的变异情况和传播途径,可以针对特定的病毒株选择最有效的药物组合。
HIV全基因组分析

HIVⅠ全基因组分析HIV(human immunodeficiency virus)俗称艾滋病毒(AIDS)是逆转录病毒的一类,引起人类获得性免疫缺损综合症,长9.18kb。
已发现的HIV有两种:HIVⅠ和HIVⅡ. HIVⅠ从欧洲和美洲分离的毒株,致病力强,是引起全球艾滋病流行的主要病原;HIV Ⅱ毒力较弱主要局限于西部非洲。
一、资料:通过NCBI下载HIVⅠ的全基因组序列,序列信息如下:LOCUS NC_001802 9181 bp ss-RNA linear VRL08-DEC-2008DEFINITION Human immunodeficiency virus 1, complete genome.ACCESSION NC_001802VERSION NC_001802.1 GI:9629357DBLINK Project:15476KEYWORDS .SOURCE Human immunodeficiency virus 1 (HIV-1)ORGANISM Human immunodeficiency virus 1Viruses; Retro-transcribing viruses; Retroviridae;Orthoretrovirinae; Lentivirus; Primate lentivirus group.二、序列分析:1.基因结构及特点HIV-Ⅰ的基因列顺序为:LTR-gag-pol-vif-vpu-vpr-tat-rev-env-nef-LTR (如图.1)图 1 HIV基因结构两端是长末端重复序列(long terminal repeats, LTR),含顺式调控序列,控制前病毒的表达。
已证明在LTR有启动子和增强子并含负调控区。
LTR之间的序列编码了至少9个蛋白,可分为三类:结构蛋白、调控蛋白、辅助蛋白。
(1)gag基因:长约1536个核苷酸,编码合成约55KD非糖基化的多聚蛋白前体(p55),随后被pol基因编码的一种病毒蛋白水解酶裂解,加工为基质蛋白p17、衣壳蛋白p24及核衣壳蛋白(NC)。
关于HIV-1_pol基因的比较分析_生物信息(已处理)

关于HIV-1_pol基因的比较分析_生物信息关于HIV-1 pol基因的比较分析摘要 HIV是RNA病毒,属慢病毒科Lentiviridae,为正链RNA病毒,由两条相同的线状RNA组成,两条链通过氢键形成二聚体。
病毒基因组长约9.7KB,共由9个基因片段,3个结构基因编码病毒结构蛋白。
pol基因序列为:NH-蛋白酶-逆转录酶p66/p51-内切核酸酶p32?COOH。
本课题研究蛋白酶和逆转录酶段序列。
由于逆转录酶缺乏3′→5′外切酶活性,使得HIV在复制的过程中不能对错误掺入的单核苷酸加以校正,从而表现出易错倾向,这是HIV产生高度变异的最重要的原因。
本课题主要运用PHYLIP、TREEVIEW和CLUSTALX等软件,对HIV-1的pol基因进行了序列相似性比较。
系统发育推断软件PHYLIP即是Phylogeny Inference Package的缩写,共包括37个程序, 按照所处理数据对象的不同可分为五类。
PHYLIP的大多数程序运行时, 从一个名为“infile”的输入文件读入数据, 如果没有该文件, 程序将会询问你输入文件的名称。
然后会出现一些应答选项让你选择。
最后输出结果到outfile或treefile文件中。
CLUSTALX是CLUSTAL多重序列比对程序的Windows版本。
本课题采用了两种方法,即最大简约法和邻位相连法,最后得到了两个进化树。
关键词:PHYLIP,TREEVIEW,CLUSTALX,进化树,genetic distance1 绪论1.1 课题背景及目的1.1.1 HIV概述HIV是RNA病毒,属慢病毒科Lentiviridae,于1983年首次在法国一位患慢性淋巴结综合症的病人身上发现。
一年后,类似的病毒在美国的一位患艾滋病的患者身上发现。
当初这种病毒被认为是一种癌病毒,与人的T-细胞白血病病毒(HTLV-1)相近,于是命名为HTLV-Ⅲ,后来发现它是慢病毒的一种,改为HIV[1]。
艾滋病毒的基因结构和变异特点

艾滋病毒的基因结构和变异特点艾滋病毒(HIV)是一种引起人类免疫缺陷病毒感染综合症(AIDS)的病原体。
了解艾滋病毒的基因结构和变异特点对于预防和治疗艾滋病至关重要。
艾滋病毒是一种病毒,其基因组为单链正链RNA,序列长度约为9.8 kb,分为两种主要类型:HIV-1和HIV-2。
其中,HIV-1是全球范围内最常见的类型,也是最具致病性的类型。
HIV-2主要在非洲西部和中部地区流行,它在致病性和传播速度方面相对较低。
两种类型的艾滋病毒基因结构相似,但有一定的差异。
艾滋病毒的基因组可以分为三个主要部分:gag、pol和env。
gag区域编码内囊蛋白(p24)和固有核心蛋白(p7,p9等),pol区域编码反转录酶和整合酶等酶,env区域编码外壳蛋白(gp120和gp41)。
此外,艾滋病毒的基因组还编码一些调节基因,如tat和rev,它们在病毒复制和感染过程中起重要作用。
艾滋病毒的遗传变异是其生命周期中的常见现象。
艾滋病毒的高度变异性是由于其高度错误率的反转录酶和快速复制速度。
此外,艾滋病毒的复制过程也受到免疫系统选择的压力。
这些因素共同导致了艾滋病毒的快速进化和多样性。
艾滋病毒的变异主要分为两种类型:点突变和重组。
点突变是指在基因组中的某个位置发生的单个碱基替换,可能引起蛋白质的结构或功能的改变。
这些突变可以导致药物抵抗性的产生,使得治疗变得困难。
重组是指来自两个不同病毒的基因组相互组合产生的新基因组。
重组是艾滋病毒变异的主要驱动力之一,使得病毒具有更大的变异性和适应性。
艾滋病毒的变异性对治疗和疫苗开发带来了挑战。
由于艾滋病毒的高度变异性,单一抗病毒药物可能无法有效控制病毒复制。
因此,联合抗病毒疗法成为治疗艾滋病的主要策略。
联合抗病毒疗法通过同时使用多种抗病毒药物来抑制病毒复制,降低药物抵抗性的发生率。
对于疫苗开发,艾滋病毒的变异性也是一个重要问题。
由于艾滋病毒的快速进化和多样性,开发一种能够针对各种病毒亚型和变异株产生广谱免疫保护的疫苗是具有挑战性的。
武汉市HIV-1相关基因序列分析及亚型分布

( T h e S t a t e Ke y L a b o r a t o r y o f Vi r o l o gy,Co l l e g e 0 ,L f e S c i e n c e s ,Wu h a n Un i v e r s i t y, Wu h a n 4 3 0 0 7 2,C^ i n a )
武 汉 市 HI V 一 1相 关 基 因序列 分 析 及 亚 型 分布 *
唐 力L 。 , 邢 辉 。 , 彭劲松 。 , 刘胜 牙 , 王 夏。 , 周 旺。 , 郑华 英。 , 刘 满清。 , 鄢 慧 民
摘 要 : 目的 研 究 武 汉 市 HI V 感 染 人 群 中 的 HI V 毒 株 的亚 型 分 布 特 点 和 流 行 规 律 。方 法 采 集 武 汉 市 6 0名 已被 确 认 为 HI V 一 1 感 染 者 的抗 凝 全 血样 品, 提 取 前 病 毒 DN A, 用巢式聚合酶链反应方法( n e s t e d — P C R)扩 增 病 毒 膜 蛋 t l e n v基 因的 C 2 一 V 5区及 g a g基 因的 部 分 区段 , 对P C R纯化产物直接测序, 并 应 用 GC G 软件 对 序 列 进 行 分 析 。结 果 通 过 P C R扩增 因序 列 4 5份 、 g a g基 因 序 列 5 2份 。依 据 e n v和 g a g 区基 因序 列 . 与 HI V - I各 个 亚 型 国 际 参 考
f r a g me n t s o f t h e HI V- 1 e n v a n d g a g g e n e s we r e a mp l i f i e d wi t h n e s t e d P CR f r o m t h e a n t I . c o a g u l a t e d b l o o d s a mp l e s o f 6 0 HI V- i n f e c t e d i n d i v i d u a l s i n Wu h a n c i t y .Th e PC R p r o d u c t s o f t h e C2 一 V3 r e g i o n o f e n v g e n e a n d p a r t s o f g a g g e n e we r e s e q u e n c e d
男男性行为人群HIV-1基因序列测定和亚型分析

男男性行为人群HIV-1基因序列测定和亚型分析刘丽花;卜宪岭;李卫红;马学志;周红;王莹莹;刘晓松;党静;刘淑君【期刊名称】《河北医药》【年(卷),期】2010(32)3【摘要】目的了解男男性接触者(MSM)HIV-1感染者毒株亚型类型,分析HIV-1在该人群中传播的危险因素.方法收集石家庄市2006至2008年报告的51例HIV-1抗体阳性的MSM的血液样本,提取前病毒DNA,利用套氏PCR方法扩增包膜蛋白env基因部分片断,并对扩增片断进行序列测定和分析.结果 32份毒株为B 亚型,组内基因离散率为(13.3±0.8)%,与标准株B.NL.0067的基因离散率为(16.0±1.6)%;16份毒株为CRF01-AE亚型,组内基因离散率为(7.1±0.7)%,与标准株CRF01-AE.TH.90的基因距离为(11.0±1.5)%;3份毒株为CRF07-BC亚型,组内基因离散率为(9.0±1.2)%,与标准株.97的基因离散率为(9.3±1.3)%.结论 HIV-1在石家庄市MSM中的流行株以B亚型和重组亚型CRF01-AE最常见,也存在CRF07-BC重组亚型.【总页数】2页(P287-288)【作者】刘丽花;卜宪岭;李卫红;马学志;周红;王莹莹;刘晓松;党静;刘淑君【作者单位】050011,河北省石家庄市疾病预防控制中心;050011,河北省石家庄市疾病预防控制中心;050011,河北省石家庄市疾病预防控制中心;河北省赞皇县疾病预防控制中心;050011,河北省石家庄市疾病预防控制中心;050011,河北省石家庄市疾病预防控制中心;050011,河北省石家庄市疾病预防控制中心;050011,河北省石家庄市疾病预防控制中心;050011,河北省石家庄市疾病预防控制中心【正文语种】中文【中图分类】R512.19【相关文献】1.广西西部地区吸毒人群HIV-1毒株基因序列测定和亚型分析 [J], 梁绍伶;梁富雄;陈杰;刘伟;黄达春;Nuanjun Ruchusatstawat;Suthon Vongsheree2.桂林市HIV-1流行毒株的基因序列测定和亚型分析 [J], 蒋就喜;李赫伟;周方;骆安德;徐茹;曾思恩3.宁夏男男性行为人群HIV-1感染者基因亚型及耐药分析 [J], 曹慜;杨东智;吴忠兰;马学旻;詹军4.九江市HIV-1流行毒株基因序列测定和亚型分析 [J], 张红波;邢辉;肖云;杨泽民;马鹏飞;卫星;刘羽真;吴光中5.广西凭祥市和宾阳县HIV-1流行毒株gag基因的序列测定和亚型分析 [J], 梁淑家;陈杰;刘伟;朱秋映;梁富雄;黎峰;邢辉;邵一鸣因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
HIV-2 isolate ALI from Guinea-Bissau, complete genome LOCUS AF082339 10353 bp DNA linear VRL 13-DEC-1998DEFINITION HIV-2 isolate ALI from Guinea-Bissau, complete genome. ACCESSION AF082339VERSION AF082339.1 GI:4007991KEYWORDS .SOURCE Human immunodeficiency virus 2 (HIV-2)ORGANISM Human immunodeficiency virus 2Viruses; Retro-transcribing viruses; Retroviridae;Orthoretrovirinae; Lentivirus; Primate lentivirus group. REFERENCE 1 (bases 1 to 10353)AUTHORS Azevedo-Pereira,J.M., Goncalves,J., Freitas-Vieira,A., Vital,J., Santos-Costa,Q. and Moniz-Pereira,J.TITLE Complete nucleotide sequence of HIV-2ALI, a low infectious isolate with restricted tropism to primary CD4+ cellsJOURNAL UnpublishedREFERENCE 2 (bases 1 to 10353)AUTHORS Azevedo-Pereira,J.M., Goncalves,J., Freitas-Vieira,A., Vital,J., Santos-Costa,Q. and Moniz-Pereira,J.TITLE Direct SubmissionJOURNAL Submitted (04-AUG-1998) Microbiology, Fac Pharmacy of Lisbon, Avenue Forcas Armadas, Lisbon 1600, PortugalFEATURES Location/Qualifierssource 1..10353/organism="Human immunodeficiency virus 2"/proviral/mol_type="genomic DNA"/strain="HIV-2ALI"/isolate="ALI"/db_xref="taxon:11709"/country="Guinea-Bissau"/note="primary isolate recovered from a symptomaticpatient; differentiating biological characteristicscompared to other HIV-2: low infectivity in vitro,persistent incapability to induce syncytia formation,extremely narrow cellular host range; virus was onlypassaged twice in human PBMC before chromosomal DNA frominfected cells was harvested; direct PCR was performed toobtain the total proviral DNA in four overlappingfragments that were cloned into plasmid vector pCR3; bothstrands of proviral DNA were completely sequenced; theHIV-2 ALI genome reveals a similar localization of theopen reading frames for structural, regulatory andaccessory genes, compared to other HIV-2 viruses"repeat_region 1..850/note="5' long terminal repeat"/rpt_type=long_terminal_repeatgene 1096..2661/gene="gag"CDS 1096..2661/gene="gag"/note="encodes structural proteins of HIV-2 ALInucleocapside"/codon_start=1/product="gag protein"/protein_id="AAC95340.1"/db_xref="GI:4007992"/translation="MGARNSVLRGRKADELERIRLRPGGKKKYQLKHIVWAANELDR FGLAESLLESKEGCQRILKVLEPLVPTGSENLKSLFNTVCVVWCVHAEEKVKD TEGAKQIIQRHLAAEIETAEKMPSTSRPTAPPSEQGGNFPVQQV AGNYTHVPLSPRTLDA WVKL VEEKKFGAEVVPGFQALSEGCTPYDINQMLNCVGDHQAAMQIIREIINEEAAD WDV AHPIPGPLPAGQLREPRGSDIAGTTSTVEEQIQWMFRPRNPVPVGNIYRRWIQIGL QKCVRMYNPTNILDIKQGPKEPFQSYVDRFYKSLRAEQTDPA VKNWMTQTLLVQNA NPDCKL VLKGLGMNPTLEEMLTACQGVGGPGQKARLMAEALKEAMTPAPIPFAAAQQ RRTIKCWNCGKEGHSARQCRAPRKQGCWKCGKPGHLMANCPERQAGFLGLGPWGKKP RNFPVTRV PQGLTPTAPPAEPAADLLEQYMQQGRKQREQRERPYKEVTEDLLHLEQGETP HKEVTEDLLHLNSLFGKDQ"gene <2319..5486/gene="pol"CDS <2319..5486/gene="pol"/note="encodes protease, reverse transcriptase andintegrase"/codon_start=1/product="pol polyprotein"/protein_id="AAC95341.1"/db_xref="GI:4007993"/translation="KTGLLEMWQARTSYGKLPRKTGWFFRAWPMGKEASQLPRNPSS AGINTNSTPSRASSGPAGA VYAAGEKAKRAEREAIQRGDGGLTAPRAGRDTTQR GDRGLAAPQFSLWKRPVVTAYIEGQPVEVLLDTGADDSIV AGIELGSNYTPKIVGGIGG FINTKEYEDVEIKVLNKRVKATIMTGDTPINIFGRNILTALGMSLNLPV AKIEPIEVRL KPGKDGPKLRQWPLTKEKIEALKEICEKTEREGQLEEAPPTNPYNTPTFAIKKKDK NKWRM LIDFRELNKVTQDFTEIQLGIPHPAGLAKKRRITVLDVGDAYFSIPLHESFRQYT AFTLPSVNNAEPGKRYIYKVLPQGWKGSPAIFQHTMRQILEPFRKANQDVILIQYM DDILI ASDRTDLEHDKVVLQLKELLNGLGFSTPDEKFQKDPPYKWMGYGLWPTKW KLQKIQLPQKEVWTVNDIQKHVGVLNWAAQIYPGIKTKHLCRLIRGKMTLTEGVQWTEL AEAELEE NRIILSQEQEGHYYQEEKELEATVQKDQDNQWTYKIHQGEKILKVEKYAKMK NTHTNGVRLLAQVVQKIGKEALVIWGRIPRFHLPVERETWEQWWDDYWQVTWIPDW DFVSTPPLVRLAFNLVKDPILGAETFYTDGPCNRQSKEGKAGYITDRGRDKVKVLEQTTN QQAELEAFALA VTDSGPKANIIVDSQYVMGIV AGQPTESENRIVNQIIEEMIKKEAIYV A WVPAHKGIGGNQEVDHLVSQGIRQVLFLEKIEPAQEEHEKYHSNVKELSHKFGLPNL V ARQIVNTCAQCQQKGEAIHGQVNAELGTWQMDCTHLEGKVIIIA VHV ASGFIEAEVI PQESGRQTALFLLKLASRWPITHLHTDSGVNFTSQEVKMV AWWVGIEQSFGVPYNPQ SQGVVEAMNHHLKNQISRIREQANTVETIVLMA VHCMNFKRRGGIGDMTPAERLINMIS TEQEIQFLQTKNLKFKNFPVYYREGRDQLWKGPGELLWKGDGA VIVKVGTDIKVVP RRKAKIIRDYGGRQELDSGPHLEGAREDGEV A"gene 5416..6063/gene="vif"CDS 5416..6063/gene="vif"/function="accessory protein"/codon_start=1/product="vif protein"/protein_id="AAC95342.1"/db_xref="GI:4007994"/translation="MEEGKSWIVVPTWRVPGRMEKWHSLVKYLKYRTKDLEKVCYV PH HKVGWAWWTCSRVIFPLQGRSHLEIQAYWNLTPEKGWLSSYA VRITWYTEKF WTDVTPDCADSLIHGTYFSCFTAGEVRRAIRGEKLLSCCNYPQAHKSQVPSLQFLALVV VQQNGKPQRNSTTRKQWRRDYRRGLRV ARQDSRGLKQRGGESPAPGAHFPGV AKVL EILA"gene 5891..6229/gene="vpx"CDS 5891..6229/gene="vpx"/function="accessory protein"/codon_start=1/product="vpx protein"/protein_id="AAC95343.1"/db_xref="GI:4007995"/translation="MANPRETVPPGNSGEETIGEAFEWLDRTVEALNREA VNHLPREL IFQVWQRSWRYWHDEQGMSQSYTKYRYLCLMQKAMYTHFMKGCTCLGGG HGPGGWRSGPPPPPPPGLV"gene 6229..6546/gene="vpr"CDS 6229..6546/gene="vpr"/note="accessory protein"/codon_start=1/product="vpr protein"/protein_id="AAC95344.1"/db_xref="GI:4007996"/translation="MTEAPTEFPPAGMGPHQGARDEWVIEVLREIKEEALRHFDPRML IALGGYIYTRHGDTLERARELINALQRALFMHFRAGCGRSRVGQTRGRNPLSA IPTPRNMQ"gene 6392..8959/gene="tat"CDS join(6392..6687,8845..8959)/gene="tat"/function="regulatory protein"/codon_start=1/product="tat protein"/protein_id="AAC95345.1"/db_xref="GI:4007997"/translation="METPLKEPGSSLMPYNEPSSCTSEQDV A VQELAKQGEEILSQLY RPLETCNNTCYCKECCYHCQLCFLNKGLGIWYDRKGRRRRSPKKIKAHSSSA SDKSISTRTRNSQPEEKQKKTLETTLGTDCGPGRSHIYIS"gene 6618..9098/gene="rev"CDS join(6618..6687,8845..9098)/gene="rev"/function="regulatory protein"/codon_start=1/product="rev protein"/protein_id="AAC95346.1"/db_xref="GI:4007998"/translation="MTERAGEEDLQRKLRLIRLLHQTNPYPQGPGTANQRRNRRRRW RQRWGQIV ALADRIFTFPDPPASSPLDRA VQHLQGLTIQDLPDPPTDLPESSESAD NNQGLAET"gene 6694..9282/gene="env"CDS 6694..9282/gene="env"/codon_start=1/product="envelope glycoprotein"/protein_id="AAC95347.1"/db_xref="GI:4007999"/translation="MMSSRNQLLVTILLASACLVYCKQYVTVFYGVPAWKNASIPLFCATKNRDTWGTIQCLPDNDDYQEIALNVTEAFDAWDNTVTEQA VEDVWRLFE TSIKPCVKLTPLCIAMKCSNISTESTTTSPSPGSTLKPLINESDPCIKADNCPRGLGDEEMV NCRFNMTGLQRDKPKQYNETWYSKDVVCEPFNTTTNQTRCYMNHCNTSVITESC DKHYWDAIRFRYCAPPGYALLRCDDINYSGFAPNCSKVV AATCTRMMETQTSTWFGFNGT RAENRTYIYWHGRDNRTIISLNKHYNLTMHCKRPGNKTVVPITLMSGLIFHSQPINKRP RQAWCWFKGEWRKAMQEVKETLVKHPRYKGTNDTNQINFTKPGRGSDAEVVYMW TNCRGEFLHCNMTWFLNWVENKTGQEQHNYAPCHIKQIINIWHKAGKNVYLPPREGELT CNSTVTSLIANIDTDGNQTNITFSAEV AELYRLELGDYKLVEITPIGFAPTSERRYSSTPRRN KRGVFVLGFLGFLATAGSAMGTAALTLSAQSRTLLAGIVQQQQQLLDVVKRQQE MLRLTVWGTKNLQARVTAIEKYLKDQARLNSWGCAFRQVCHTTVPWVNNSLKPDWD NMTWQEWE QQVRYLEANISEQLERAQIQQEKNTYELQKLNSWDVFTNWLDLTAWVKYIQY GVYIIVGIV ALRIVIYVVQMLSRLRKGYRPVFSSPPGYIQQIHIHKDQEQPTRGETEEDV GDNV GDRLWPWPIAYLHFLIHLLARLLIGLYSICRDLLSRISPILQPIFRSLQRALTTIRD WLRLKAAYLQYGCEWIQEAFRAFARIARETLTNTWRDLWGA VQWVGRRILA VP RRIRQGAEIALL"gene 9116..9904/gene="nef"CDS 9116..9904/gene="nef"/function="accessory protein"/codon_start=1/product="nef protein"/protein_id="AAC95348.1"/db_xref="GI:4008000"/translation="MGASGSKKRSGPLQGLRERLLQTPGETCGGQCSGSGGGYSQSQ GGSGRGQKLPSCEGQRYQQGDFMNTPWRTPA TEREKELYKQQNMDDVDLDDD DSLVGVS VTPRVQLRTMTYKLAVDMSHLIKERGGLEGMFYSERRHRILDIYLEKEEGIIPD WQNYTHGPGIRYPMFFGWLWKLVPVDVPQEGEDTETHCLLHPVQTSRHDDTHGETL VWRFDP KLAHDYKAFILHPEEFGYKSGLPEDEWKARLKARGIPFSKNRNS"repeat_region 9504..10353/note="3' long terminal repeat"/rpt_type=long_terminal_repeatORIGIN1 tggaagggat gttttacagt gagagaagac atagaatctt agacatatac ttagaaaagg61 aagaagggat aattccagat tggcagaact atactcatgg gccaggaata aggtacccga121 tgttctttgg gtggctgtgg aagctagtac cagtagatgt cccacaagaa ggggaggaca181 ctgagactca ctgcctgcta cacccagtac aaacaagcag gcatgatgac acgcatgggg241 agacattagt ttggagattt gaccctaagc tggctcatga ttacaaagcc tttattctac301 acccagagga atttgggtac aagtcaggcc tgccagaaga tgagtggaag gcaagactga361 aagcaagagg gataccattt agtaagaaca ggaacagctg atttggtcag ggcaggaagt421 aactactgaa aacagctgag actgcaggga ctttccagaa ggggctgtaa ccaggggaag481 gacatgggag gagctggtgg ggaacgccct catactcctg tataaatgta cccgctgctt541 gcattgtatt cagtcgctct gcggagaggc tggcagattg agccctggga ggttctctcc601 agcactagca ggtagagcct gggtgttccc tgctagactc tcaccagtgc ttggccggca661 ctgggcagac ggctccacgc ttgcttgctt aaagacctct taataaagct gccaattaga721 agcaggttaa aggtgtgttc ccatctctcc tagtcgccgc ctggtcattc ggtgttcacc781 tgagtaacaa gaccctggtc tgttaggacc ctttctgctt tgggaaacgg aggcaggaaa841 atccctagca ggttggcgcc cgaacaggga cttgaagaag actgagaagt ctaggaacac901 ggctgagtga aggcagtaag ggcggcagga acaaaccacg acggagtgct cctagaaagg961 cgcaggccaa ggtaccaaag gccggcgtgt ggagcgggag tgaagaggcc tccgggtgaa1021 ggtaagtacc tacaccaaaa ttgtagccga aagggcttgt tatcctacct ttagacaggt1081 agaagattgt gggagatggg cgcgagaaac tccgtcttga gagggagaaa agcagacgaa1141 ttagaaagaa ttaggttacg gcccggcgga aagaaaaaat atcagctaaa acatattgtg1201 tgggcagcga atgaattgga cagattcgga ttggcagaaa gcctgttgga gtcaaaagaa1261 ggttgccaaa gaattcttaa agttttagaa ccattagtgc caacaggatc agaaaattta1321 aaaagccttt ttaatactgt ctgcgtagtt tggtgcgtgc acgcagaaga gaaagtgaaa1381 gatactgaag gagcaaaaca aataatacag agacatctag cggcagaaat agaaacagca1441 gagaaaatgc caagcacaag tagaccaaca gcaccaccta gtgaacaggg gggaaacttc1501 cccgtacaac aagtagccgg caactacacc catgtgccgc tgagcccccg aaccttagat1561 gcttgggtaa aattagtaga agaaaagaag ttcggggcag aagtagtgcc aggatttcag1621 gcactctcag aaggctgcac gccctatgat attaatcaaa tgcttaattg tgtgggcgac1681 catcaagcag ccatgcaaat aatcagggag attatcaatg aagaagcagc agactgggat1741 gttgcacatc ccataccagg ccccttacca gcagggcagc ttagagaacc aagagggtct1801 gacatagcag gaacaacaag cacagtagaa gaacagatcc agtggatgtt caggccacgg1861 aatcctgtgc cagtagggaa catctataga agatggatcc agatagggct acagaagtgt1921 gtcaggatgt acaacccaac caacatccta gacataaaac aaggaccaaa ggagccattc1981 caaagctatg tagatagatt ctacaaaagc ttaagggcag aacaaacaga tccagcagta2041 aagaattgga tgactcaaac actgctggta cagaatgcca acccagactg caaattagtg2101 ctgaaaggat tagggatgaa tcctacctta gaagagatgc taaccgcctg tcagggagta2161 gggggaccag gccagaaagc cagattaatg gcagaagcct taaaggaggc catgacacca 2221 gctcctatcc catttgcggc agcccaacaa agaaggacaa ttaagtgctg gaattgtgga 2281 aaggaagggc actcggcaag acaatgccga gcacccagaa aacagggctg ctggaaatgt 2341 ggcaagccag gacatcttat ggcaaactgc ccagaaagac aggctggttt tttagggctt 2401 ggcccatggg gaaagaagcc tcgcaacttc cccgtaaccc gagttccgca gggattaaca 2461 ccaacagcac ccccagcaga gccagcagcg gacctgctgg agcagtatat gcagcagggg 2521 agaaagcaaa gagagcagag agagaggcca tacaaagagg tgacggagga cttactgcac 2581 ctcgagcagg gagagacacc acacaaagag gtgacagagg acttgctgca cctcaattct 2641 ctctttggaa aagaccagta gtcacagcct acattgaggg ccagccagtg gaagttttac 2701 tagacacagg ggctgacgac tcaatagtag caggaataga gttagggagc aactataccc 2761 caaaaatagt agggggaata gggggattca taaataccaa agaatatgaa gatgtagaaa 2821 taaaagtact aaataaaaga gtaaaagcca ccataatgac aggtgacacc ccaatcaata 2881 tttttggcag aaacattttg acagccttag gcatgtcatt aaacctacca gttgccaaga 2941 tagagccaat agaggtaaga ttaaagccag gaaaagacgg gccaaaatta agacaatggc 3001 ccttaacaaa agaaaaaata gaggcactaa aagaaatctg tgaaaaaacg gaaagagaag 3061 gccaattaga ggaggcacct ccaactaacc cttataatac ccccacattt gcaataaaga 3121 agaaggacaa aaacaaatgg agaatgctaa tagattttag agaattaaac aaggtaactc 3181 aagatttcac agagattcag ttagggattc cacatccagc aggattagcc aagaaaagaa 3241 gaatcactgt gctggatgta ggggatgctt acttttccat accactgcat gagagcttta 3301 gacagtatac tgcatttact ctaccatcag taaacaatgc agaaccagga aaaagatata 3361 tatataaagt cttaccgcag ggatggaagg gatcaccagc aatttttcaa cacacaatga 3421 gacagatctt agagccattc agaaaggcaa accaggatgt cattctcatt caatacatgg 3481 atgatatctt aatagctagt gacaggacag atttagaaca tgacaaggtg gtcctgcagt 3541 taaaggaact cctaaatggc ctaggatttt ccaccccaga tgagaagttc caaaaagacc 3601 ctccatacaa atggatgggc tatggactgt ggccaactaa atggaagctg caaaaaatac 3661 aattgcccca gaaagaagta tggacagtca atgacatcca aaaacatgtg ggtgtcctaa 3721 attgggcagc acaaatctac ccaggaataa agaccaaaca cttatgtaga ctaattagag 3781 gaaaaatgac actcacagaa ggagtgcagt ggacagaact agcagaagca gaactagagg 3841 agaacagaat tatcttaagt caggaacaag aggggcacta ttaccaagaa gaaaaggagt 3901 tagaagcaac agtccaaaaa gatcaagaca atcaatggac atataaaata caccagggag 3961 aaaaaattct aaaagtggaa aagtatgcaa aaatgaaaaa tacccatacc aacggggtca 4021 gattgttagc acaggtagtt caaaaaatag gaaaagaagc actggtcatt tggggacgaa 4081 taccaagatt tcacctacca gtagaaagag aaacctggga acagtggtgg gatgactact 4141 ggcaagtgac atggatccca gactgggact ttgtatctac cccaccactg gtcaggctag 4201 catttaacct agtaaaagat cctatactag gcgcagagac cttctacaca gacgggccct 4261 gtaataggca atcaaaagaa ggaaaagcag gatatataac agatagaggg agagacaagg 4321 tgaaggtact agaacaaact accaatcagc aagcagaatt agaagccttc gcgctggcag 4381 taacagactc aggtccaaaa gccaatatta tagtagattc acagtatgta atgggaatag 4441 tagcaggcca gccaacagaa tcagaaaata gaatagtaaa tcaaatcata gaagaaatga 4501 taaaaaagga agccatctat gttgcgtggg tcccagccca caaaggcata gggggaaatc 4561 aggaagtaga ccatttagta agtcagggca tcagacaagt attgtttcta gaaaaaatag 4621 agccagctca ggaagaacat gaaaagtatc atagcaatgt gaaagaacta tcccataaat 4681 ttggattacc caatctggtg gcaagacaga tagtaaacac atgtgcccaa tgtcagcaga 4741 agggagaggc tatacatggg caagtgaatg cagaactagg cacttggcaa atggactgca4801 cacacttaga aggaaaagtc atcataatag cagtgcatgt tgccagtgga ttcatagaag 4861 cagaggtcat cccgcaggaa tcaggaagac aaacagcact cttcctatta aaactggcta 4921 gtagatggcc aataacacac ttgcacacag atagtggtgt caacttcacc tcacaggaag 4981 taaagatggt agcatggtgg gttggtatag agcaatcctt tggagtacct tacaatccac 5041 aaagccaagg agtagtagaa gcaatgaatc accacctaaa aaatcagata agcagaatta 5101 gagagcaggc aaatacagtg gaaacaatag tactaatggc agttcattgc atgaatttta 5161 aaagaagggg aggaataggg gatatgaccc cagcagaaag actcatcaat atgatctcca 5221 cagaacaaga aatacaattc ctccaaacaa aaaatttgaa atttaaaaat ttcccggtct 5281 attacaggga aggcagagat cagctgtgga aaggacctgg ggagctactg tggaaagggg 5341 acggagcagt catagttaag gtagggacag acataaaagt agtaccaaga aggaaggcca 5401 agatcatcag agactatgga ggaaggcaag agctggatag tggtccccac ttggagggtg 5461 ccagggagga tggagaagtg gcatagcctt gtcaagtacc taaagtacag aacaaaagat 5521 ctagaaaagg tgtgctatgt tccccaccat aaggtgggat gggcatggtg gacttgcagc 5581 agggtaatat tcccattaca aggaagaagt catctagaga tacaggcata ttggaaccta 5641 acaccagaaa aaggatggct ctcctcttat gcagtaagaa taacttggta tacagaaaag 5701 ttctggacag atgttacccc agactgtgca gactccctaa tacatggcac ttatttctct5761 tgctttacgg caggtgaagt aagaagagcc atcagagggg aaaagttatt gtcctgctgc 5821 aattatcccc aggcccataa gtcacaggta ccgtcactcc aatttctggc cttagtggta 5881 gtgcaacaaa atggcaaacc ccagagaaac agtaccacca ggaaacagtg gcgaagagac 5941 tatcggagag gccttcgagt ggctagacag gacagtagag gccttaaaca gagaggcggt 6001 gaatcacctg ccccgggagc tcattttcca ggtgtggcaa aggtcctgga gatactggca 6061 tgatgaacaa ggaatgtcac aaagttacac aaaatataga tacttgtgct taatgcagaa 6121 agctatgtac acacatttca tgaaagggtg cacctgcctg gggggagggc atgggccagg 6181 aggatggaga tcaggacctc cccctcctcc ccctccaggt ctagtctaat gactgaagca 6241 ccaacagagt ttcccccggc cggaatggga ccccaccagg gagccaggga tgagtgggta 6301 atagaagtcc tgagagaaat aaaagaagaa gctttaaggc attttgaccc tcgcatgcta 6361 attgctcttg gcggctatat ctatactaga catggagaca cccttgaaag agccagggag 6421 ctcattaatg ccctacaacg agccctcttc atgcacttca gagcaggatg tggccgttca 6481 agagttggcc aaacaagggg aagaaatcct ctctcagcta taccgacccc tagaaacatg 6541 caataacaca tgctattgta aggaatgctg ctaccattgc cagctgtgtt ttttaaataa6601 gggactcggg atatggtatg accgaaaggg caggcgaaga agatctccaa agaaaattaa 6661 ggctcattcg tcttctgcat cagacaagtg agtatgatgt ctagtagaaa tcagctgctt 6721 gttactatct tactagctag tgcttgctta gtatattgta aacaatatgt gactgttttt6781 tatggcgtgc cagcatggaa aaatgcatcc attcccctct tttgtgcaac caaaaataga 6841 gatacttggg gaaccataca gtgcttacca gacaatgatg attatcagga aatagctttg 6901 aatgtgacag aggctttcga tgcatgggat aatacagtaa cagaacaagc agtagaagat 6961 gtctggagac tatttgagac atcaataaaa ccatgtgtca agttaacacc tttatgtata7021 gcaatgaagt gtagcaacat aagcacagag agcacaacca catccccgag cccagggagc 7081 acactcaaac ccctgataaa tgagagcgat ccatgcataa aggcagacaa ctgccccagg 7141 ggactagggg atgaagagat ggtcaattgt cggttcaaca tgacaggatt acagagagat 7201 aagccaaaac agtataatga aacatggtac tcaaaagatg tggtttgtga accatttaac 7261 accaccacaa accagaccag gtgttacatg aaccattgca acacatcagt catcacagag 7321 tcatgtgata agcactattg ggatgctata aggtttagat actgtgcacc acctggttac 7381 gccctactaa gatgcgatga tatcaattat tcaggctttg cacccaattg ctctaaagta7441 gtagctgcta catgcacaag gatgatggag acgcaaactt ctacttggtt tggctttaat 7501 ggcactaggg cagaaaatag aacatatatc tattggcatg gtagagataa tagaactatc 7561 atcagcttaa acaaacatta taatcttact atgcattgta agaggccagg aaataagaca 7621 gttgtaccaa taacacttat gtcagggtta atatttcact cccagccaat caataaaaga 7681 cccagacaag catggtgctg gttcaaaggc gaatggagga aagccatgca ggaggtgaag 7741 gaaacccttg taaaacatcc caggtataaa ggaaccaatg acacaaacca aattaacttt 7801 acaaaaccag gaagaggctc agatgcagaa gtggtatata tgtggactaa ctgcagagga 7861 gaatttctcc attgcaacat gacttggttc ctcaattggg tggaaaacaa aacgggtcag 7921 gaacagcaca attatgcacc gtgccatata aagcaaataa ttaatatctg gcacaaagca 7981 gggaaaaatg tatatttgcc tcctagggaa ggagagttga cctgcaactc aacagtaacc 8041 agcttgattg ctaacattga cacggatggc aaccagacaa atattacctt tagtgcagag 8101 gtggcagaac tataccgatt agaattgggg gattataaat tagtagagat aacaccaatt 8161 ggcttcgcac ctacatcaga aaggagatac tcctctactc caaggaggaa taaaagaggt 8221 gtgttcgtgc tagggttctt aggttttctc gcgacagcag gttctgcaat gggcacggca 8281 gctttaacgc tgtctgctca gtctcggact ttattggccg ggatagtgca gcaacagcaa 8341 cagctgttgg acgtggtcaa gagacaacag gaaatgttgc gactgaccgt ctggggaacg 8401 aaaaatctcc aggcaagagt cactgctatc gagaaatact taaaggacca ggcgcggcta 8461 aattcatggg gatgtgcatt tagacaagtc tgccacacta ctgtaccatg ggtaaataac 8521 tccttaaaac ctgattggga caacatgacg tggcaagagt gggaacaaca agtccgttac 8581 ctagaggcaa atatcagtga acagttagaa cgggcacaaa ttcagcaaga aaagaatacg 8641 tatgaactac aaaaattaaa tagctgggat gtttttacca actggcttga cttaaccgcc 8701 tgggtcaagt atattcaata tggagtttat ataatagtag gaatagtagc tcttagaata8761 gtaatatatg tagtgcaaat gttaagtaga ctcaggaagg gctataggcc tgttttctcc 8821 tcccctcccg gttacatcca acagatccat atccacaagg accaggaaca gccaaccaga 8881 ggagaaacag aagaagacgt tggagacaac gttggggaca gattgtggcc ctggccgatc 8941 gcatatttac atttcctgat ccacctgcta gctcgcctct tgatcgggct gtacagcatc 9001 tgcagggact tactatccag gatctccccg atcctccaac cgatcttccg gagtcttcag 9061 agagcgctga caacaatcag ggactggctg agacttaaag cagcctacct gcagtatggg 9121 tgcgagtgga tccaagaagc gttccgggcc tttgcaagga ttgcgagaga gactcttaca 9181 aacacctgga gagacttgtg gggggcagtg cagtgggtcg ggaggaggat actcgcagtc 9241 ccaaggagga tcaggcaggg ggcagaaatt gccctcctgt gaaggacagc ggtatcagca 9301 gggagatttt atgaataccc catggagaac cccagcaaca gaaagagaga aagaattgta 9361 caagcaacag aatatggatg atgtagattt agatgatgat gatagcctag taggggtctc 9421 tgtcacacca agagtacaat taagaacaat gacatacaaa ttggcagtag atatgtcaca 9481 tttaataaaa gaaagggggg gactggaagg gatgttttac agtgagagaa gacatagaat 9541 cttagacata tacttagaaa aggaagaagg gataattcca gattggcaga actatactca 9601 tgggccagga ataaggtacc cgatgttctt tgggtggctg tggaagctag taccagtaga 9661 tgtcccacaa gaaggggagg acactgagac tcactgcctg ctacacccag tacaaacaag 9721 caggcatgat gacacgcatg gggagacatt agtttggaga tttgacccta agctggctca 9781 tgattacaaa gcctttattc tacacccaga ggaatttggg tacaagtcag gcctgccaga 9841 agatgagtgg aaggcaagac tgaaagcaag agggatacca tttagtaaga acaggaacag 9901 ctgatttggt cagggcagga agtaactact gaaaacagct gagactgcag ggactttcca 9961 gaaggggctg taaccagggg aaggacatgg gaggagctgg tggggaacgc cctcatactc 10021 ctgtataaat gtacccgctg cttgcattgt attcagtcgc tctgcggaga ggctggcaga10081 ttgagccctg ggaggttctc tccagcacta gcaggtagag cctgggtgtt ccctgctaga 10141 ctctcaccag tgcttggccg gcactgggca gacggctcca cgcttgcttg cttaaagacc 10201 tcttaataaa gctgccaatt agaagcaggt taaaggtgtg ttcccatctc tcctagtcgc 10261 cgcctggtca ttcggtgttc acctgagtaa caagaccctg gtctgttagg accctttctg 10321 ctttgggaaa cggaggcagg aaaatcccta gca。