HIV 1基因组序列
- 格式:docx
- 大小:22.64 KB
- 文档页数:12
我国HIV-1 B'亚型流行株vif基因序列特征及变异分析李林;刘永健;鲍作义;李韩平;庄道民;刘思扬;李敬云【期刊名称】《中华微生物学和免疫学杂志》【年(卷),期】2006(026)008【摘要】目的研究人免疫缺陷病毒-1(HIV-1)B'亚型vif基因的变异特征,探讨其与HIV传播和致病性之间的关系.方法采集河南省部分HIV感染者的外周血,提取41例HIV感染者外周血淋巴细胞DNA,设计特异性引物扩增其前病毒基因组中的vif 基因,对于扩增阳性的29例PCR产物进行vif区基因的测序及分析.结果 29条vif 基因的平均离散率是0.0328,突变主要集中于90~120、270~302、372~405、450~470四个区域.Vif多肽链的90~93位和157~160位存在两个富含R和K 带有强烈正电荷的亲水区,带正电荷的R或K交替出现,几乎没有其他的氨基酸残基.29个Vif多肽链有21条在90~93位存在R90 RKR93基序;有26条在157~160位存在K157 RRK160基序,29条序列在114位和133位存在两个在HIV-1和HIV-2以及SIV内保守的半胱氨酸(A).结论 vif在HⅣ-1基因组内具有相对保守性,其特征性区域和氨基酸基序对于保持Vif蛋白的功能是十分重要的.【总页数】4页(P743-746)【作者】李林;刘永健;鲍作义;李韩平;庄道民;刘思扬;李敬云【作者单位】军事医学科学院微生物流行病研究所,病原微生物生物安全国家重点实验室,北京,100071;军事医学科学院微生物流行病研究所,病原微生物生物安全国家重点实验室,北京,100071;军事医学科学院微生物流行病研究所,病原微生物生物安全国家重点实验室,北京,100071;军事医学科学院微生物流行病研究所,病原微生物生物安全国家重点实验室,北京,100071;军事医学科学院微生物流行病研究所,病原微生物生物安全国家重点实验室,北京,100071;军事医学科学院微生物流行病研究所,病原微生物生物安全国家重点实验室,北京,100071;军事医学科学院微生物流行病研究所,病原微生物生物安全国家重点实验室,北京,100071【正文语种】中文【中图分类】R3【相关文献】1.柳州市16例吸毒者HIV-1病毒流行株亚型分布及耐药情况分析2.江苏省HIV-1流行株env和pol基因亚型及其系统分析3.新城疫病毒F48E9株及东北地区流行株F基因遗传变异分析4.山东省HIV-1流行株多基因区亚型分析5.陕西省HIV-1流行株膜蛋白基因C2-V3区序列特征和亚型分析因版权原因,仅展示原文概要,查看原文内容请购买。
HIV-1 env基因序列分析及其与长期感染不进展现象相关性研究许晶;王媛;黎志东;徐志凯【期刊名称】《中国皮肤性病学杂志》【年(卷),期】2008(22)3【摘要】目的研究HIV-1长期感染不进展现象与HIV-1 env基因变异的关系。
方法用巢式聚合酶链反应(nested-PCR)对21例感染HIV-1毒株7年以上者外周血单一核细胞(PBMCs)的核酸样本进行扩增,获得HIV-1膜蛋白(env)基因的核酸片段,对其C2-V3及邻区350-450个核苷酸序列进行测定和分析,所得结果与HIV-1该亚型国际标准株进行比较,分析共享序列及突变序列,制作系统树,计算离散率。
结果离散率和系统树分析21个毒株均为HIV-1 B亚型,毒株间基因离散率在2%左右,高于前期研究结果;未见V3环顶端四肽特征性GPGR和GRGQ,也未见前期研究曾经发现的脯氨酸向异亮氨酸的变异现象。
结论HIV-1长期感染者体内毒株env基因无规律性突变。
【总页数】2页(P155-156)【关键词】HIV-1;长期感染不进展者;膜蛋白(env)基因【作者】许晶;王媛;黎志东;徐志凯【作者单位】第四军医大学微生物学教研室【正文语种】中文【中图分类】R711.72【相关文献】1.相同来源HIV-1 Env、Gag基因序列变异和宿主基因多态性与疾病进展关系的分析 [J], 白立石;王开利;周广恩;孟宾;刘颜成;曾毅2.中国HIV-1感染疾病长期不进展者CCR2-64I、SDF1-3′A和CCR5△32的基因变异研究 [J], 王树祥;尚红;韩晓旭;张子宁;王亚男;张旻;姜拥军;刘静;苏艳丽3.出入境人群HIV-1型env C2-V3区段基因序列分析和亚型研究 [J], 朱锦德;田桢干;邢辉;方筠;张晓航;刘胜牙4.云南瑞丽县IDUs人群HIV-1感染者毒株env基因C2-V3区序列的测定 [J], 方荣;王斌;路永波;宋旭霞;邵济钧5.HIV-1长期感染不进展者体内毒株env基因序列测定 [J], 黎志东因版权原因,仅展示原文概要,查看原文内容请购买。
艾滋病毒基因组的变异及演化分析艾滋病毒(HIV)是一种致命性传染病,它攻击人体免疫系统,导致艾滋病的发展。
艾滋病毒有两种主要类型,即HIV-1和HIV-2。
HIV-1是全球感染最多的类型,而HIV-2主要在西非传播。
这两种类型的病毒都会发生变异,使其适应环境的能力增强,这给病毒的疫苗开发和治疗提出了巨大的挑战。
艾滋病毒基因组是一个非常复杂的结构,由数万个核苷酸组成。
它包含了多个基因,这些基因编码了不同的蛋白质,这些蛋白质在病毒的复制和传播过程中扮演着关键的角色。
艾滋病毒基因组的变异是病毒演化的结果,这种变异常常导致病毒对宿主免疫系统的逃逸和抗药性的产生。
艾滋病毒的变异主要通过两个机制发生,即突变和重组。
突变是指在病毒基因组中发生的错误复制过程导致的单个核苷酸(A、T、G或C)的改变。
由于HIV的复制速度非常快,每天产生数十亿个病毒颗粒,这意味着每天都会产生大量的突变。
这些突变可能会导致病毒对抗药物的变异、逃避免疫系统的攻击以及适应新的宿主环境。
另一方面,重组是指当一个宿主同时感染两个不同的病毒株时,病毒基因组之间的DNA片段可以进行重组。
这种重组现象使得新的变异株得以形成,进一步增加了病毒的变异性。
艾滋病毒的演化非常复杂,演化速度也非常快。
病毒基因组中高度变异的区域是HIV的外膜糖蛋白(Env)基因。
Env基因编码了病毒表面蛋白,它决定了病毒能否进入宿主细胞。
由于这个基因的高度变异性,病毒可以逃避宿主免疫系统的攻击,从而在宿主体内存活下来。
此外,HIV还具有高度变异的反转录酶和蛋白酶基因,对抗药物治疗的变异也通常发生在这些基因上。
了解艾滋病毒基因组的变异及演化对于病毒的疫苗研发和治疗的设计非常重要。
由于病毒的高度变异性,目前尚未找到具有广谱效力的疫苗。
然而,通过对不同病毒株的测序和分析,科学家们可以了解病毒的变异规律,为疫苗研发提供重要的参考。
此外,在制定抗病毒治疗方案时,了解艾滋病毒的变异情况和传播途径,可以针对特定的病毒株选择最有效的药物组合。
HIVⅠ全基因组分析HIV(human immunodeficiency virus)俗称艾滋病毒(AIDS)是逆转录病毒的一类,引起人类获得性免疫缺损综合症,长9.18kb。
已发现的HIV有两种:HIVⅠ和HIVⅡ. HIVⅠ从欧洲和美洲分离的毒株,致病力强,是引起全球艾滋病流行的主要病原;HIV Ⅱ毒力较弱主要局限于西部非洲。
一、资料:通过NCBI下载HIVⅠ的全基因组序列,序列信息如下:LOCUS NC_001802 9181 bp ss-RNA linear VRL08-DEC-2008DEFINITION Human immunodeficiency virus 1, complete genome.ACCESSION NC_001802VERSION NC_001802.1 GI:9629357DBLINK Project:15476KEYWORDS .SOURCE Human immunodeficiency virus 1 (HIV-1)ORGANISM Human immunodeficiency virus 1Viruses; Retro-transcribing viruses; Retroviridae;Orthoretrovirinae; Lentivirus; Primate lentivirus group.二、序列分析:1.基因结构及特点HIV-Ⅰ的基因列顺序为:LTR-gag-pol-vif-vpu-vpr-tat-rev-env-nef-LTR (如图.1)图 1 HIV基因结构两端是长末端重复序列(long terminal repeats, LTR),含顺式调控序列,控制前病毒的表达。
已证明在LTR有启动子和增强子并含负调控区。
LTR之间的序列编码了至少9个蛋白,可分为三类:结构蛋白、调控蛋白、辅助蛋白。
(1)gag基因:长约1536个核苷酸,编码合成约55KD非糖基化的多聚蛋白前体(p55),随后被pol基因编码的一种病毒蛋白水解酶裂解,加工为基质蛋白p17、衣壳蛋白p24及核衣壳蛋白(NC)。
关于HIV-1_pol基因的比较分析_生物信息关于HIV-1 pol基因的比较分析摘要 HIV是RNA病毒,属慢病毒科Lentiviridae,为正链RNA病毒,由两条相同的线状RNA组成,两条链通过氢键形成二聚体。
病毒基因组长约9.7KB,共由9个基因片段,3个结构基因编码病毒结构蛋白。
pol基因序列为:NH-蛋白酶-逆转录酶p66/p51-内切核酸酶p32?COOH。
本课题研究蛋白酶和逆转录酶段序列。
由于逆转录酶缺乏3′→5′外切酶活性,使得HIV在复制的过程中不能对错误掺入的单核苷酸加以校正,从而表现出易错倾向,这是HIV产生高度变异的最重要的原因。
本课题主要运用PHYLIP、TREEVIEW和CLUSTALX等软件,对HIV-1的pol基因进行了序列相似性比较。
系统发育推断软件PHYLIP即是Phylogeny Inference Package的缩写,共包括37个程序, 按照所处理数据对象的不同可分为五类。
PHYLIP的大多数程序运行时, 从一个名为“infile”的输入文件读入数据, 如果没有该文件, 程序将会询问你输入文件的名称。
然后会出现一些应答选项让你选择。
最后输出结果到outfile或treefile文件中。
CLUSTALX是CLUSTAL多重序列比对程序的Windows版本。
本课题采用了两种方法,即最大简约法和邻位相连法,最后得到了两个进化树。
关键词:PHYLIP,TREEVIEW,CLUSTALX,进化树,genetic distance1 绪论1.1 课题背景及目的1.1.1 HIV概述HIV是RNA病毒,属慢病毒科Lentiviridae,于1983年首次在法国一位患慢性淋巴结综合症的病人身上发现。
一年后,类似的病毒在美国的一位患艾滋病的患者身上发现。
当初这种病毒被认为是一种癌病毒,与人的T-细胞白血病病毒(HTLV-1)相近,于是命名为HTLV-Ⅲ,后来发现它是慢病毒的一种,改为HIV[1]。
艾滋病毒的基因结构和变异特点艾滋病毒(HIV)是一种引起人类免疫缺陷病毒感染综合症(AIDS)的病原体。
了解艾滋病毒的基因结构和变异特点对于预防和治疗艾滋病至关重要。
艾滋病毒是一种病毒,其基因组为单链正链RNA,序列长度约为9.8 kb,分为两种主要类型:HIV-1和HIV-2。
其中,HIV-1是全球范围内最常见的类型,也是最具致病性的类型。
HIV-2主要在非洲西部和中部地区流行,它在致病性和传播速度方面相对较低。
两种类型的艾滋病毒基因结构相似,但有一定的差异。
艾滋病毒的基因组可以分为三个主要部分:gag、pol和env。
gag区域编码内囊蛋白(p24)和固有核心蛋白(p7,p9等),pol区域编码反转录酶和整合酶等酶,env区域编码外壳蛋白(gp120和gp41)。
此外,艾滋病毒的基因组还编码一些调节基因,如tat和rev,它们在病毒复制和感染过程中起重要作用。
艾滋病毒的遗传变异是其生命周期中的常见现象。
艾滋病毒的高度变异性是由于其高度错误率的反转录酶和快速复制速度。
此外,艾滋病毒的复制过程也受到免疫系统选择的压力。
这些因素共同导致了艾滋病毒的快速进化和多样性。
艾滋病毒的变异主要分为两种类型:点突变和重组。
点突变是指在基因组中的某个位置发生的单个碱基替换,可能引起蛋白质的结构或功能的改变。
这些突变可以导致药物抵抗性的产生,使得治疗变得困难。
重组是指来自两个不同病毒的基因组相互组合产生的新基因组。
重组是艾滋病毒变异的主要驱动力之一,使得病毒具有更大的变异性和适应性。
艾滋病毒的变异性对治疗和疫苗开发带来了挑战。
由于艾滋病毒的高度变异性,单一抗病毒药物可能无法有效控制病毒复制。
因此,联合抗病毒疗法成为治疗艾滋病的主要策略。
联合抗病毒疗法通过同时使用多种抗病毒药物来抑制病毒复制,降低药物抵抗性的发生率。
对于疫苗开发,艾滋病毒的变异性也是一个重要问题。
由于艾滋病毒的快速进化和多样性,开发一种能够针对各种病毒亚型和变异株产生广谱免疫保护的疫苗是具有挑战性的。
男男性行为人群HIV-1基因序列测定和亚型分析刘丽花;卜宪岭;李卫红;马学志;周红;王莹莹;刘晓松;党静;刘淑君【期刊名称】《河北医药》【年(卷),期】2010(32)3【摘要】目的了解男男性接触者(MSM)HIV-1感染者毒株亚型类型,分析HIV-1在该人群中传播的危险因素.方法收集石家庄市2006至2008年报告的51例HIV-1抗体阳性的MSM的血液样本,提取前病毒DNA,利用套氏PCR方法扩增包膜蛋白env基因部分片断,并对扩增片断进行序列测定和分析.结果 32份毒株为B 亚型,组内基因离散率为(13.3±0.8)%,与标准株B.NL.0067的基因离散率为(16.0±1.6)%;16份毒株为CRF01-AE亚型,组内基因离散率为(7.1±0.7)%,与标准株CRF01-AE.TH.90的基因距离为(11.0±1.5)%;3份毒株为CRF07-BC亚型,组内基因离散率为(9.0±1.2)%,与标准株.97的基因离散率为(9.3±1.3)%.结论 HIV-1在石家庄市MSM中的流行株以B亚型和重组亚型CRF01-AE最常见,也存在CRF07-BC重组亚型.【总页数】2页(P287-288)【作者】刘丽花;卜宪岭;李卫红;马学志;周红;王莹莹;刘晓松;党静;刘淑君【作者单位】050011,河北省石家庄市疾病预防控制中心;050011,河北省石家庄市疾病预防控制中心;050011,河北省石家庄市疾病预防控制中心;河北省赞皇县疾病预防控制中心;050011,河北省石家庄市疾病预防控制中心;050011,河北省石家庄市疾病预防控制中心;050011,河北省石家庄市疾病预防控制中心;050011,河北省石家庄市疾病预防控制中心;050011,河北省石家庄市疾病预防控制中心【正文语种】中文【中图分类】R512.19【相关文献】1.广西西部地区吸毒人群HIV-1毒株基因序列测定和亚型分析 [J], 梁绍伶;梁富雄;陈杰;刘伟;黄达春;Nuanjun Ruchusatstawat;Suthon Vongsheree2.桂林市HIV-1流行毒株的基因序列测定和亚型分析 [J], 蒋就喜;李赫伟;周方;骆安德;徐茹;曾思恩3.宁夏男男性行为人群HIV-1感染者基因亚型及耐药分析 [J], 曹慜;杨东智;吴忠兰;马学旻;詹军4.九江市HIV-1流行毒株基因序列测定和亚型分析 [J], 张红波;邢辉;肖云;杨泽民;马鹏飞;卫星;刘羽真;吴光中5.广西凭祥市和宾阳县HIV-1流行毒株gag基因的序列测定和亚型分析 [J], 梁淑家;陈杰;刘伟;朱秋映;梁富雄;黎峰;邢辉;邵一鸣因版权原因,仅展示原文概要,查看原文内容请购买。
HIV-1重组毒株gag区快速基因分型方法(1)目的建立一种简便、快速基因分型方法,对广西人类免疫缺陷病毒(HIV-1)重组毒株gag基因区进行亚型鉴定。
方法从HIV阳性样本中提取核酸,使用HIV-1 M组通用引物对gag区进行第1轮扩增,第2轮使用分别检测C亚型和CRF01-AE重组型的二套特异性引物放入同一反应管中进行扩增,根据不同亚型扩增的目的带位置不同判断亚型。
另外设计了一套引物,专门用于检测B'/C重组毒株。
扩增出的所有样本均进行基因测序和系统树分析以验证结果。
结果 54份样本中,经基因测序和系统树分析证实CRF08-BC样本4份(741%), CRF01-AE样本46份(8518%), 4份(741)无法确定亚型。
经亚型特异性引物PCR法检测出4份(100%) B'/C重组毒株,45份(9783%) CRF01-AE重组毒株,灵敏度为98%,特异性为100%。
2种方法检测结果经差异性检验显示,P>005,差异无统计学意义,结果一致性高达9815%。
与基因分析结果吻合。
重复实验显示,B'/C的平均重复性为100% (20/20),CRF01-AE为983% (59/60)。
结论该方法具有简便、快速,高度灵敏度和特异性的特点,可直接对广西HIV -1重组毒株CRFO 1-AE gag基因区进行分型。
关键词:人类免疫缺陷病毒1型;基因型;聚合酶链反应Rapid identification for gag region of circulating recombinant form of humanimmunodeficiency virus type 1Abstract: Objective To develope a simple and rapid subtype-screening assay for the gag region of the circulating recombinant form (CRF) of human immunodeficiency virus type 1 (HIV-1)in Guangxi.Methods Proviral DNA from HIV-positive samples were extracted and subjected to the first round PCR with universal primers for the gag region that can detect HIV-1 M group isolates.In the second round PCR,two pairs of subtype-specific primers that were designed to detect subtype C and CRF01-AE respectively were added into onetube.The PCR products of different subtypes could be distinguished in agarose-gel electrophoresis.Another pair of subtype-specific primers exclusively detecting the the prevalent recombinantstrains CRF07-BC and CRF08-BC was designed and used.Additionally,all of these samples were sequenced and analyzed phylogenetically.Results DNA sequencing and phylogenetic analysis of the gag region of the 54 samples showed that 4 samples (7.41%) were infected with CRF08-BC,46 (85.18%) with CRF01-AE and 4 (7.41%) remained unclassifiable.Detection of thesubtype-specific primer sets revealed that 4 were B'/C (100%),and 45 were CRF01-AE (97.83%),with an adequate sensitivity (98%) and a high specificity (100%).Non-specific bands occasionally appeared but did not interfere with interpretation of the results.The phylogenetic analysis was consistent with subtype-specific primer sets and the consistent rate was 98.15%.The average reproducibility was 100% forB'/C samples and 98.3% for CRF01-AE samples.Conclusion A simple,rapid and low cost assay is developed for subtype-screening of CRFO1-AE in Guangxi.For the B'/C strains in Guangxi,it needs to be verified further by increasing samples.Key words: human immunodeficiency virus type 1(HIV-1);genetic subtype;polymerase chain reaction (PCR)人类免疫缺陷病毒-1(HIV-1)高度变异,不同亚型毒株其生物学特性及;分子流行病学特征均有所不同〔1〕,若能快速、准确地对HIV进行基因分型不仅有助于了解HIV-1转播规律,而且可为阐明HIV基因型与生物表型关系、药物耐药性等研究提供资料。
HIV-1型病毒强终止DNA二级结构的确立和第一次链转移过程中退火机制的研究HIV-1型病毒是一类反转录病毒,其基因组包含两条(+)RNA单链(大小约为9.8kb)。
病毒的复制由多个步骤构成,其中病毒的反转录(reverse transcription)过程非常关键。
HIV-1型病毒通过反转录,将基因组单链RNA转变成双链DNA,以便能够整合到宿主基因组中。
病毒的反转录过程包括两次链转移(strand transfer)事件。
本论文的研究对象为病毒的第一次链转移(first strand transfer)。
HIV-1型病毒基因组的5’端与3’端有一段重复序列(Repeat sequence, R),它对病毒进行反转录起到很重要的作用。
基因组5’端有一个引物结合位点(Prime Binding Site,PBS),长度为18个核苷酸。
第一次链转移起始于宿主tRNA(Lys,3) 3’端的18个核苷酸与该PBS 区域的杂交,并且在反转录酶(reverse transcriptase, RTase)的作用下,沿着基因组从3’到5’的方向复制R-U5区域。
U5区位于R序列和PBS区域的中间,是5’端的特异序列(unique sequence)。
以病毒基因组R-U5区域为模板反转录出来的DNA被称为强终止DNA(strong-stop DNA, ssDNA)。
链转移的发生还依赖于RTase的RNase H活性,可以降解已被复制的RNA模板。
当5’端的RNA被降解完后,新生成的DNA就会被转移到基因组的3’端。
通过ssDNA与3’R序列的互补配对,病毒才能继续反转录。
经过这一关键步骤,病毒才得以将基因组全长的信息都逆转录成宿主细胞可以辨识的DNA信息。
链转移事件在RNA供体(RNA donor)和RNA受体(RNA acceptor)的水平上发生,它主要依赖于负链DNA和RNA受体的杂交反应。
同时,链转移的效率又受到相应核酸二级结构的影响。
浙江省HIV-1流行毒株的基因序列测定和亚型分析姚亚萍;梁浩;魏民;关琪;杨介者;郭志宏;潘晓红;邢辉;赵全壁;邵一鸣【期刊名称】《中国艾滋病性病》【年(卷),期】2004(10)1【摘要】目的利用脱氧核糖核酸 (DNA)序列分析浙江省境内艾滋病病毒 1型(HIV 1)流行毒株的亚型 ,为艾滋病预防控制工作提供参考。
方法采取 14份浙江省HIV 1抗体阳性者的全血 ,提取前病毒DNA作为扩增模板 ,设计引物对env基因的C2 V3 区进行聚合酶链反应 (PCR)扩增并测定其序列。
所得序列用Wisconsin公司的GCG软件包进行分析 ,确定亚型。
结果 14份标本中有 9份扩增阳性并得到相应序列 ,扩增率为 6 4 3%。
经过离散率计算和系统树分析后证实 :4份标本为E亚型的A/E流行重组模式 ,3份标本为B亚型 ,1份标本为C亚型的B/C流行重组模式 ,1份标本为G亚型。
结论目前浙江省境内有多种亚型的HIV 1毒株存在 ,流行形势严峻。
迫切需要深入调查研究 ,并在高危人群中开展行为干预措施。
【总页数】4页(P4-6)【关键词】浙江;HIV-1;脱氧核糖核酸;DNA;基因序列;艾滋病病毒;嵌套式聚合酶链反应;基因离散率【作者】姚亚萍;梁浩;魏民;关琪;杨介者;郭志宏;潘晓红;邢辉;赵全壁;邵一鸣【作者单位】浙江省疾病预防控制中心;中国疾病预防控制中心性病艾滋病预防控制中心【正文语种】中文【中图分类】R512.91;R392.11【相关文献】1.河北省2007年HIV-1流行毒株基因序列测定及亚型分析 [J], 赵翠英;邵一鸣;邢辉;赵宏儒;何翔;路新利;辛若雷;李巧敏;程春林;李保军2.北京市2006年HIV-1流行毒株的gag和env基因序列测定及亚型分析 [J], 叶景荣;卢红艳;贺雄;邵一鸣;邢辉;刘海林;黑发欣;赵月娟;刘胜牙;孙伟东;张启云;张琴3.湖州市HIV-1流行毒株gag基因序列测定和亚型分析 [J], 吴晓芳;金玫华;查赟峰;纪蕾;董正全;杨中荣4.北京市性传播HIV-1感染者流行毒株gag基因序列测定和亚型分析 [J], 叶景荣;郭蕾;白立石;辛若雷;卢红艳;余双庆;曾毅5.桂林市HIV-1流行毒株的基因序列测定和亚型分析 [J], 蒋就喜;李赫伟;周方;骆安德;徐茹;曾思恩因版权原因,仅展示原文概要,查看原文内容请购买。
人类免疫缺陷病毒的基因组结构研究人类免疫缺陷病毒(HIV)是一种攻击人类免疫系统的病毒,导致艾滋病。
自从HIV于1980年代被第一次发现以来,大量的研究一直在进行着,以便找到治疗艾滋病的方法。
其中,研究HIV的基因组结构是非常重要的一个方面。
本文将探讨HIV的基因组结构研究的现状和未来发展。
首先,HIV是一种RNA病毒,其基因组表现为两个含有单链RNA的体系:HIV-1和HIV-2。
HIV-1和HIV-2是不同的亚型病毒,它们的基因组结构有所不同。
与其他病毒不同,HIV-1的RNA基因组中含有反转录酶的编码序列。
反转录酶是一种特殊的酶,能够将病毒的RNA转录成DNA。
这是HIV-1与其他病毒最大的不同之处,也是一些抗病毒药物可以针对的主要靶标。
其次,在研究HIV-1的基因组结构时,人们发现了非常多的突变现象。
HIV-1是一种高度变异的病毒,这意味着即使同一人感染了同一亚型的HIV-1,其基因组结构也会存在巨大的差异。
这种高度变异的性质使得研究HIV-1的基因组结构变得困难,因为研究者需要同时研究许多不同的亚型,这需要耗费大量的时间和精力。
另外,HIV-1的基因组结构对于设计和发现新的抗病毒药物也非常重要。
HIV-1细胞侵染所需的蛋白质和酶都是由病毒基因组编码的。
因此,研究HIV-1的基因组结构可以为寻找新的靶标提供关键信息。
例如,目前已经发现了一些抗病毒药物可以选择性地靶向反转录酶或突触间蛋白等分子,从而遏制HIV-1的繁殖和扩散。
最后,随着现代生物技术的发展,人们能够更加深入地研究HIV-1的基因组结构。
例如,现在的测序技术使得我们能够以更高的分辨率和更便宜的价格解析HIV-1的基因组序列。
此外,生物统计学技术可以帮助我们更好地研究HIV-1的基因组变异和进化。
总的来说,现代生物技术的不断发展为研究HIV-1的基因组结构提供了巨大的机会和挑战。
在未来,我们可以期待更多的突破和发现,这些发现将帮助我们更好地理解HIV-1的生物学特性,为治疗艾滋病提供新的思路和可能性。
中国HIV-1序列的模式推断和特征分析的开题报告
题目:中国HIV-1序列的模式推断和特征分析
研究目的:
随着现代医学的发展和社会的变迁,HIV-1病毒已经成为全球性的公共卫生问题。
而在中国,HIV-1病毒仍然呈现出快速增长的趋势,对于中国HIV-1病毒的模式推断和特征分析,有着非常重要的现实意义。
本研究的目的是对中国HIV-1序列进行模式推断和特征分析,探讨
其在演化、流行及多重抗药性方面的特征,并为疫情防控提供理论依据。
研究方法:
本研究拟采用基因序列分析方法,主要包括以下内容:
1. 数据收集:采集HIV-1基因序列数据,包括中国及国际公共数据
库中提供的序列数据。
2. 序列比对:将采集到的序列进行比对,构建出HIV-1病毒的进化树,并进行分型和亚型划分,分析其在中国的分布情况。
3. 特征分析:对中国HIV-1序列的长度、GC含量、氨基酸序列的同源性进行分析,并探讨其在演化过程中发生的突变。
4. 多重抗药性分析:进行多重抗药性基因检测,分析中国HIV-1病
毒在抗药性方面的特征。
研究内容:
1. HIV-1病毒在中国的流行趋势和分布特征。
2. HIV-1病毒的进化模式和演化历程
3. HIV-1序列的特征分析,包括长度、GC含量、氨基酸序列同源性等方面。
4. HIV-1病毒在多重抗药性方面的特征分析。
研究意义:
本研究对于全面了解中国HIV-1病毒的分布、演化和多重抗药性具有非常重要的意义,可以为中国HIV-1病毒防控和治疗提供理论依据。
此外,本研究所探讨的基因序列分析方法也具有指导其他病毒研究项目的借鉴意义。
多个HIV-1基因的融合及其在BEVS中的表达的开题报告一、研究背景人类免疫缺陷病毒1型(HIV-1)是一种致命的病毒,已经成为全球性的造成严重公共卫生问题。
HIV-1病毒基因组结构复杂,包括长开放阅读框(ORF)和多个非翻译区(NTR)。
在HIV-1病毒感染过程中,多个基因之间存在复杂的相互作用。
因此,研究多个HIV-1基因的融合关系和在表达宿主中的表达特征具有重要的理论和实践意义。
二、研究目的本研究旨在构建多个HIV-1基因的融合质粒,并将其转化表达在昆虫细胞中,探讨多个基因的融合对宿主的影响及基因表达特征,为HIV-1有效的治疗和控制提供科学依据。
三、研究内容及方法1.构建多个HIV-1基因的融合质粒。
将HIV-1基因组中的若干基因通过基因克隆技术进行融合,构建多个相邻的基因序列,利用限制性内切酶切割产生合适的内切位点,进行质粒构建。
2.将融合质粒转化至昆虫细胞中。
使用Bac-to-Bac系统进行质粒转化,通过重组病毒载体的方式,将质粒表达到昆虫细胞(SF9)中。
3.分析多个基因的融合对宿主的影响。
比较转化表达多个基因和单个基因的宿主细胞之间的形态、生长速度及存活率等指标。
4.探讨多个基因的表达特征。
通过Western blotting技术检测表达的融合基因,分析其表达特征,并利用实时荧光定量PCR(RT-qPCR)对不同基因的表达进行定量分析。
四、预期结果及意义1.成功构建多个HIV-1基因的融合质粒,并将其表达于宿主细胞中。
2.探究多个基因的融合对宿主细胞的影响,对不同的基因融合方式进行比较分析,为后续的研究提供基础数据。
3.分析多个基因在表达宿主中的表达特征,为HIV-1病毒基因在宿主中的表达模式提供研究基础。
4.为HIV-1的治疗研究提供科学依据,为有效控制HIV-1传播提供理论与实践基础。
HIV-1env基因序列分析及DNA疫苗免疫原性研究
中期报告
这是一个研究报告的题目,下面是可能的研究内容简介:
背景:HIV-1是导致艾滋病的主要病毒,其表面糖蛋白gp120在疫苗研究中被广泛应用。
然而,最新的HIV-1序列数据表明,gp120多样性很高,疫苗的免疫原性和保护效果受到挑战。
研究目的:本研究旨在分析HIV-1env基因序列的多样性和演化,并评估基于DNA疫苗的免疫原性。
研究方法:首先,我们收集了来自美洲、非洲和亚洲地区的240个HIV-1env序列,并使用多种生物信息学工具(例如MAFFT、MEGA和BEAST)对其进行分析和比较。
其次,我们设计和合成了多个HIV-1env 基因片段的DNA疫苗,并在小鼠模型中进行了免疫和检测。
研究结果:我们发现HIV-1env序列的多样性与地理位置和宿主种类密切相关,并且不同基因片段的变异模式不同。
在DNA疫苗免疫方面,我们发现某些片段能够诱导小鼠产生高水平的特异性抗体和细胞免疫反应,而其他片段则表现出较弱的免疫原性。
结论:本研究对HIV-1env基因的演化和DNA疫苗的免疫原性提供了详细的分析和评估,为HIV-1疫苗的开发和改进提供了重要的依据和指导。
人类免疫缺陷病毒-HIVⅠ卢炳军 201330160119摘要病毒是非细胞形态的生命体,是迄今为止发现的最小、最简单的有机体。
但所有的病毒必须要在细胞内才能进行繁殖并表现出它们的基本生命活动。
因此,有关病毒的知识不仅有助于加深我们对细胞与生命概念的理解与认识,而且也涉及人们所面临的诸多重大的医学实践问题。
人类免疫缺陷病毒(HIV),俗称艾滋病(AIDS)病毒,诱发人类获得性免疫缺陷综合征。
该病毒在分类上属反转录病毒科慢病毒属中的灵长类免疫缺陷病毒亚属,过去还有人将其命名为LAV、ARV、IDAV和HTLV3,现统一命名为HIV。
1983年,法国巴斯德研究所的Montaginer 和美国国家卫生研究院癌症研究所Gallo等人首次证实HIV是艾滋病的病因。
该病已在20多年间席卷全球,几乎没有一个国家或地区可以幸免。
已发现的人类缺陷病毒有两种,即HIV-Ⅰ和HIV-Ⅱ。
HIV-Ⅰ是从欧洲和美洲分离的毒株,与猴艾滋病毒只有约45%的相似性,它的致病力很强,是引起全球艾滋病流行的主要病原。
HIV-Ⅱ与猴艾滋病毒的相似性高达75%,其致病力较弱,引起艾滋病的病程较长,症状较轻,且主要局限于西部非洲。
有关HIV的研究主要是针对HIV-Ⅰ进行的。
关键词病毒基本知识;HIV;形态结构;基因组;复制;致病机理作为非细胞形态的生命体,病毒与细胞的区别如下:(1 病毒很小,结构极其简单。
绝大部分病毒的大小只有20-200nm,可以通过细菌滤器。
必须在电镜下才可以看到。
(2 遗传载体的多样性,所有细胞中都含有DNA和RNA。
但病毒中仅含其中一种,且两种病毒都有单双链之分。
(3) 彻底的寄生性。
必须依附于细胞复制增殖。
(4 病毒以复制和装配的方式进行增殖,而细胞只能以分裂的方式增殖。
病毒可以分为真病毒(即由蛋白质与核酸组成的病毒),亚病毒(如类病毒,仅由一个有感染性的环状RNA分子构成,且只感染植物。
如最早发现的马铃薯纺锤块茎类病毒 PSTV),朊病毒(仅具有感染性的蛋白质,能侵染哺乳动物的神经组织,引起的疾病如疯牛病,人类克-雅氏症等)。
艾滋病病的基因型与亚型分类艾滋病病毒的基因型与亚型分类艾滋病(AIDS)是由人类免疫缺陷病毒(HIV)感染引起的一种严重的免疫系统损害疾病。
艾滋病毒主要通过血液、性接触和母婴传播,世界卫生组织统计数据显示,截至2020年底,全球感染HIV的人数已经达到3800万。
艾滋病毒属于反转录病毒(Retroviridae),其基因组为RNA,通过逆转录酶的作用转录为DNA进入感染人体细胞。
艾滋病毒的基因组包括两条单链RNA,分别命名为HIV-1和HIV-2,其中HIV-1是主要传播的类型。
根据全球研究的结果,艾滋病病毒有多种基因型和亚型。
基因型是指病毒基因组结构的整体差异,而亚型则是基因型之间的细分。
不同的基因型和亚型在地理分布、传播途径、疾病进展速度以及抗病毒药物敏感性方面呈现出差异。
目前已经发现的艾滋病毒基因型包括A、B、C、D、E、F、G、H、J和K型。
其中,A、B、C三个基因型是最为常见的。
A型主要分布在中西非地区,B型主要在欧洲、美洲和澳大利亚等地,C型则主要在南部非洲和印度次大陆流行。
其他基因型相对较为罕见,比如D型主要在中非和东欧发现,F型主要在西欧和南美洲,G型则在西非和欧洲被检测到。
每个基因型中又可以进一步细分为许多亚型。
例如,HIV-1基因型B可以细分为B1、B2、B3等亚型,而基因型C则有C1、C2、C3等亚型。
这些亚型之间在基因组序列上会有一些差异,从而导致不同的地理分布和临床特点。
研究艾滋病毒基因型和亚型主要是为了确定不同基因型对疫苗研发和抗病毒治疗的影响。
由于艾滋病毒的高变异性和细胞免疫反应的局限性,研发有效的疫苗一直是一个挑战。
了解不同基因型和亚型的分布情况,有助于针对不同地区的艾滋病疫苗研发制定更精确的策略。
此外,艾滋病病毒的基因型和亚型也会对抗病毒治疗的效果产生影响。
不同基因型和亚型的病毒对抗病毒药物的敏感性有差异,这也是制定个体化治疗方案的重要依据。
准确了解患者感染的艾滋病毒基因型和亚型,有助于医生选择适当的抗病毒药物,提高治疗效果,减少耐药性的产生。
HIV-2 isolate ALI from Guinea-Bissau, complete genome LOCUS AF082339 10353 bp DNA linear VRL 13-DEC-1998DEFINITION HIV-2 isolate ALI from Guinea-Bissau, complete genome. ACCESSION AF082339VERSION AF082339.1 GI:4007991KEYWORDS .SOURCE Human immunodeficiency virus 2 (HIV-2)ORGANISM Human immunodeficiency virus 2Viruses; Retro-transcribing viruses; Retroviridae;Orthoretrovirinae; Lentivirus; Primate lentivirus group. REFERENCE 1 (bases 1 to 10353)AUTHORS Azevedo-Pereira,J.M., Goncalves,J., Freitas-Vieira,A., Vital,J., Santos-Costa,Q. and Moniz-Pereira,J.TITLE Complete nucleotide sequence of HIV-2ALI, a low infectious isolate with restricted tropism to primary CD4+ cellsJOURNAL UnpublishedREFERENCE 2 (bases 1 to 10353)AUTHORS Azevedo-Pereira,J.M., Goncalves,J., Freitas-Vieira,A., Vital,J., Santos-Costa,Q. and Moniz-Pereira,J.TITLE Direct SubmissionJOURNAL Submitted (04-AUG-1998) Microbiology, Fac Pharmacy of Lisbon, Avenue Forcas Armadas, Lisbon 1600, PortugalFEATURES Location/Qualifierssource 1..10353/organism="Human immunodeficiency virus 2"/proviral/mol_type="genomic DNA"/strain="HIV-2ALI"/isolate="ALI"/db_xref="taxon:11709"/country="Guinea-Bissau"/note="primary isolate recovered from a symptomaticpatient; differentiating biological characteristicscompared to other HIV-2: low infectivity in vitro,persistent incapability to induce syncytia formation,extremely narrow cellular host range; virus was onlypassaged twice in human PBMC before chromosomal DNA frominfected cells was harvested; direct PCR was performed toobtain the total proviral DNA in four overlappingfragments that were cloned into plasmid vector pCR3; bothstrands of proviral DNA were completely sequenced; theHIV-2 ALI genome reveals a similar localization of theopen reading frames for structural, regulatory andaccessory genes, compared to other HIV-2 viruses"repeat_region 1..850/note="5' long terminal repeat"/rpt_type=long_terminal_repeatgene 1096..2661/gene="gag"CDS 1096..2661/gene="gag"/note="encodes structural proteins of HIV-2 ALInucleocapside"/codon_start=1/product="gag protein"/protein_id="AAC95340.1"/db_xref="GI:4007992"/translation="MGARNSVLRGRKADELERIRLRPGGKKKYQLKHIVWAANELDR FGLAESLLESKEGCQRILKVLEPLVPTGSENLKSLFNTVCVVWCVHAEEKVKD TEGAKQIIQRHLAAEIETAEKMPSTSRPTAPPSEQGGNFPVQQV AGNYTHVPLSPRTLDA WVKL VEEKKFGAEVVPGFQALSEGCTPYDINQMLNCVGDHQAAMQIIREIINEEAAD WDV AHPIPGPLPAGQLREPRGSDIAGTTSTVEEQIQWMFRPRNPVPVGNIYRRWIQIGL QKCVRMYNPTNILDIKQGPKEPFQSYVDRFYKSLRAEQTDPA VKNWMTQTLLVQNA NPDCKL VLKGLGMNPTLEEMLTACQGVGGPGQKARLMAEALKEAMTPAPIPFAAAQQ RRTIKCWNCGKEGHSARQCRAPRKQGCWKCGKPGHLMANCPERQAGFLGLGPWGKKP RNFPVTRV PQGLTPTAPPAEPAADLLEQYMQQGRKQREQRERPYKEVTEDLLHLEQGETP HKEVTEDLLHLNSLFGKDQ"gene <2319..5486/gene="pol"CDS <2319..5486/gene="pol"/note="encodes protease, reverse transcriptase andintegrase"/codon_start=1/product="pol polyprotein"/protein_id="AAC95341.1"/db_xref="GI:4007993"/translation="KTGLLEMWQARTSYGKLPRKTGWFFRAWPMGKEASQLPRNPSS AGINTNSTPSRASSGPAGA VYAAGEKAKRAEREAIQRGDGGLTAPRAGRDTTQR GDRGLAAPQFSLWKRPVVTAYIEGQPVEVLLDTGADDSIV AGIELGSNYTPKIVGGIGG FINTKEYEDVEIKVLNKRVKATIMTGDTPINIFGRNILTALGMSLNLPV AKIEPIEVRL KPGKDGPKLRQWPLTKEKIEALKEICEKTEREGQLEEAPPTNPYNTPTFAIKKKDK NKWRM LIDFRELNKVTQDFTEIQLGIPHPAGLAKKRRITVLDVGDAYFSIPLHESFRQYT AFTLPSVNNAEPGKRYIYKVLPQGWKGSPAIFQHTMRQILEPFRKANQDVILIQYM DDILI ASDRTDLEHDKVVLQLKELLNGLGFSTPDEKFQKDPPYKWMGYGLWPTKW KLQKIQLPQKEVWTVNDIQKHVGVLNWAAQIYPGIKTKHLCRLIRGKMTLTEGVQWTEL AEAELEE NRIILSQEQEGHYYQEEKELEATVQKDQDNQWTYKIHQGEKILKVEKYAKMK NTHTNGVRLLAQVVQKIGKEALVIWGRIPRFHLPVERETWEQWWDDYWQVTWIPDW DFVSTPPLVRLAFNLVKDPILGAETFYTDGPCNRQSKEGKAGYITDRGRDKVKVLEQTTN QQAELEAFALA VTDSGPKANIIVDSQYVMGIV AGQPTESENRIVNQIIEEMIKKEAIYV A WVPAHKGIGGNQEVDHLVSQGIRQVLFLEKIEPAQEEHEKYHSNVKELSHKFGLPNL V ARQIVNTCAQCQQKGEAIHGQVNAELGTWQMDCTHLEGKVIIIA VHV ASGFIEAEVI PQESGRQTALFLLKLASRWPITHLHTDSGVNFTSQEVKMV AWWVGIEQSFGVPYNPQ SQGVVEAMNHHLKNQISRIREQANTVETIVLMA VHCMNFKRRGGIGDMTPAERLINMIS TEQEIQFLQTKNLKFKNFPVYYREGRDQLWKGPGELLWKGDGA VIVKVGTDIKVVP RRKAKIIRDYGGRQELDSGPHLEGAREDGEV A"gene 5416..6063/gene="vif"CDS 5416..6063/gene="vif"/function="accessory protein"/codon_start=1/product="vif protein"/protein_id="AAC95342.1"/db_xref="GI:4007994"/translation="MEEGKSWIVVPTWRVPGRMEKWHSLVKYLKYRTKDLEKVCYV PH HKVGWAWWTCSRVIFPLQGRSHLEIQAYWNLTPEKGWLSSYA VRITWYTEKF WTDVTPDCADSLIHGTYFSCFTAGEVRRAIRGEKLLSCCNYPQAHKSQVPSLQFLALVV VQQNGKPQRNSTTRKQWRRDYRRGLRV ARQDSRGLKQRGGESPAPGAHFPGV AKVL EILA"gene 5891..6229/gene="vpx"CDS 5891..6229/gene="vpx"/function="accessory protein"/codon_start=1/product="vpx protein"/protein_id="AAC95343.1"/db_xref="GI:4007995"/translation="MANPRETVPPGNSGEETIGEAFEWLDRTVEALNREA VNHLPREL IFQVWQRSWRYWHDEQGMSQSYTKYRYLCLMQKAMYTHFMKGCTCLGGG HGPGGWRSGPPPPPPPGLV"gene 6229..6546/gene="vpr"CDS 6229..6546/gene="vpr"/note="accessory protein"/codon_start=1/product="vpr protein"/protein_id="AAC95344.1"/db_xref="GI:4007996"/translation="MTEAPTEFPPAGMGPHQGARDEWVIEVLREIKEEALRHFDPRML IALGGYIYTRHGDTLERARELINALQRALFMHFRAGCGRSRVGQTRGRNPLSA IPTPRNMQ"gene 6392..8959/gene="tat"CDS join(6392..6687,8845..8959)/gene="tat"/function="regulatory protein"/codon_start=1/product="tat protein"/protein_id="AAC95345.1"/db_xref="GI:4007997"/translation="METPLKEPGSSLMPYNEPSSCTSEQDV A VQELAKQGEEILSQLY RPLETCNNTCYCKECCYHCQLCFLNKGLGIWYDRKGRRRRSPKKIKAHSSSA SDKSISTRTRNSQPEEKQKKTLETTLGTDCGPGRSHIYIS"gene 6618..9098/gene="rev"CDS join(6618..6687,8845..9098)/gene="rev"/function="regulatory protein"/codon_start=1/product="rev protein"/protein_id="AAC95346.1"/db_xref="GI:4007998"/translation="MTERAGEEDLQRKLRLIRLLHQTNPYPQGPGTANQRRNRRRRW RQRWGQIV ALADRIFTFPDPPASSPLDRA VQHLQGLTIQDLPDPPTDLPESSESAD NNQGLAET"gene 6694..9282/gene="env"CDS 6694..9282/gene="env"/codon_start=1/product="envelope glycoprotein"/protein_id="AAC95347.1"/db_xref="GI:4007999"/translation="MMSSRNQLLVTILLASACLVYCKQYVTVFYGVPAWKNASIPLFCATKNRDTWGTIQCLPDNDDYQEIALNVTEAFDAWDNTVTEQA VEDVWRLFE TSIKPCVKLTPLCIAMKCSNISTESTTTSPSPGSTLKPLINESDPCIKADNCPRGLGDEEMV NCRFNMTGLQRDKPKQYNETWYSKDVVCEPFNTTTNQTRCYMNHCNTSVITESC DKHYWDAIRFRYCAPPGYALLRCDDINYSGFAPNCSKVV AATCTRMMETQTSTWFGFNGT RAENRTYIYWHGRDNRTIISLNKHYNLTMHCKRPGNKTVVPITLMSGLIFHSQPINKRP RQAWCWFKGEWRKAMQEVKETLVKHPRYKGTNDTNQINFTKPGRGSDAEVVYMW TNCRGEFLHCNMTWFLNWVENKTGQEQHNYAPCHIKQIINIWHKAGKNVYLPPREGELT CNSTVTSLIANIDTDGNQTNITFSAEV AELYRLELGDYKLVEITPIGFAPTSERRYSSTPRRN KRGVFVLGFLGFLATAGSAMGTAALTLSAQSRTLLAGIVQQQQQLLDVVKRQQE MLRLTVWGTKNLQARVTAIEKYLKDQARLNSWGCAFRQVCHTTVPWVNNSLKPDWD NMTWQEWE QQVRYLEANISEQLERAQIQQEKNTYELQKLNSWDVFTNWLDLTAWVKYIQY GVYIIVGIV ALRIVIYVVQMLSRLRKGYRPVFSSPPGYIQQIHIHKDQEQPTRGETEEDV GDNV GDRLWPWPIAYLHFLIHLLARLLIGLYSICRDLLSRISPILQPIFRSLQRALTTIRD WLRLKAAYLQYGCEWIQEAFRAFARIARETLTNTWRDLWGA VQWVGRRILA VP RRIRQGAEIALL"gene 9116..9904/gene="nef"CDS 9116..9904/gene="nef"/function="accessory protein"/codon_start=1/product="nef protein"/protein_id="AAC95348.1"/db_xref="GI:4008000"/translation="MGASGSKKRSGPLQGLRERLLQTPGETCGGQCSGSGGGYSQSQ GGSGRGQKLPSCEGQRYQQGDFMNTPWRTPA TEREKELYKQQNMDDVDLDDD DSLVGVS VTPRVQLRTMTYKLAVDMSHLIKERGGLEGMFYSERRHRILDIYLEKEEGIIPD WQNYTHGPGIRYPMFFGWLWKLVPVDVPQEGEDTETHCLLHPVQTSRHDDTHGETL VWRFDP KLAHDYKAFILHPEEFGYKSGLPEDEWKARLKARGIPFSKNRNS"repeat_region 9504..10353/note="3' long terminal repeat"/rpt_type=long_terminal_repeatORIGIN1 tggaagggat gttttacagt gagagaagac atagaatctt agacatatac ttagaaaagg61 aagaagggat aattccagat tggcagaact atactcatgg gccaggaata aggtacccga121 tgttctttgg gtggctgtgg aagctagtac cagtagatgt cccacaagaa ggggaggaca181 ctgagactca ctgcctgcta cacccagtac aaacaagcag gcatgatgac acgcatgggg241 agacattagt ttggagattt gaccctaagc tggctcatga ttacaaagcc tttattctac301 acccagagga atttgggtac aagtcaggcc tgccagaaga tgagtggaag gcaagactga361 aagcaagagg gataccattt agtaagaaca ggaacagctg atttggtcag ggcaggaagt421 aactactgaa aacagctgag actgcaggga ctttccagaa ggggctgtaa ccaggggaag481 gacatgggag gagctggtgg ggaacgccct catactcctg tataaatgta cccgctgctt541 gcattgtatt cagtcgctct gcggagaggc tggcagattg agccctggga ggttctctcc601 agcactagca ggtagagcct gggtgttccc tgctagactc tcaccagtgc ttggccggca661 ctgggcagac ggctccacgc ttgcttgctt aaagacctct taataaagct gccaattaga721 agcaggttaa aggtgtgttc ccatctctcc tagtcgccgc ctggtcattc ggtgttcacc781 tgagtaacaa gaccctggtc tgttaggacc ctttctgctt tgggaaacgg aggcaggaaa841 atccctagca ggttggcgcc cgaacaggga cttgaagaag actgagaagt ctaggaacac901 ggctgagtga aggcagtaag ggcggcagga acaaaccacg acggagtgct cctagaaagg961 cgcaggccaa ggtaccaaag gccggcgtgt ggagcgggag tgaagaggcc tccgggtgaa1021 ggtaagtacc tacaccaaaa ttgtagccga aagggcttgt tatcctacct ttagacaggt1081 agaagattgt gggagatggg cgcgagaaac tccgtcttga gagggagaaa agcagacgaa1141 ttagaaagaa ttaggttacg gcccggcgga aagaaaaaat atcagctaaa acatattgtg1201 tgggcagcga atgaattgga cagattcgga ttggcagaaa gcctgttgga gtcaaaagaa1261 ggttgccaaa gaattcttaa agttttagaa ccattagtgc caacaggatc agaaaattta1321 aaaagccttt ttaatactgt ctgcgtagtt tggtgcgtgc acgcagaaga gaaagtgaaa1381 gatactgaag gagcaaaaca aataatacag agacatctag cggcagaaat agaaacagca1441 gagaaaatgc caagcacaag tagaccaaca gcaccaccta gtgaacaggg gggaaacttc1501 cccgtacaac aagtagccgg caactacacc catgtgccgc tgagcccccg aaccttagat1561 gcttgggtaa aattagtaga agaaaagaag ttcggggcag aagtagtgcc aggatttcag1621 gcactctcag aaggctgcac gccctatgat attaatcaaa tgcttaattg tgtgggcgac1681 catcaagcag ccatgcaaat aatcagggag attatcaatg aagaagcagc agactgggat1741 gttgcacatc ccataccagg ccccttacca gcagggcagc ttagagaacc aagagggtct1801 gacatagcag gaacaacaag cacagtagaa gaacagatcc agtggatgtt caggccacgg1861 aatcctgtgc cagtagggaa catctataga agatggatcc agatagggct acagaagtgt1921 gtcaggatgt acaacccaac caacatccta gacataaaac aaggaccaaa ggagccattc1981 caaagctatg tagatagatt ctacaaaagc ttaagggcag aacaaacaga tccagcagta2041 aagaattgga tgactcaaac actgctggta cagaatgcca acccagactg caaattagtg2101 ctgaaaggat tagggatgaa tcctacctta gaagagatgc taaccgcctg tcagggagta2161 gggggaccag gccagaaagc cagattaatg gcagaagcct taaaggaggc catgacacca 2221 gctcctatcc catttgcggc agcccaacaa agaaggacaa ttaagtgctg gaattgtgga 2281 aaggaagggc actcggcaag acaatgccga gcacccagaa aacagggctg ctggaaatgt 2341 ggcaagccag gacatcttat ggcaaactgc ccagaaagac aggctggttt tttagggctt 2401 ggcccatggg gaaagaagcc tcgcaacttc cccgtaaccc gagttccgca gggattaaca 2461 ccaacagcac ccccagcaga gccagcagcg gacctgctgg agcagtatat gcagcagggg 2521 agaaagcaaa gagagcagag agagaggcca tacaaagagg tgacggagga cttactgcac 2581 ctcgagcagg gagagacacc acacaaagag gtgacagagg acttgctgca cctcaattct 2641 ctctttggaa aagaccagta gtcacagcct acattgaggg ccagccagtg gaagttttac 2701 tagacacagg ggctgacgac tcaatagtag caggaataga gttagggagc aactataccc 2761 caaaaatagt agggggaata gggggattca taaataccaa agaatatgaa gatgtagaaa 2821 taaaagtact aaataaaaga gtaaaagcca ccataatgac aggtgacacc ccaatcaata 2881 tttttggcag aaacattttg acagccttag gcatgtcatt aaacctacca gttgccaaga 2941 tagagccaat agaggtaaga ttaaagccag gaaaagacgg gccaaaatta agacaatggc 3001 ccttaacaaa agaaaaaata gaggcactaa aagaaatctg tgaaaaaacg gaaagagaag 3061 gccaattaga ggaggcacct ccaactaacc cttataatac ccccacattt gcaataaaga 3121 agaaggacaa aaacaaatgg agaatgctaa tagattttag agaattaaac aaggtaactc 3181 aagatttcac agagattcag ttagggattc cacatccagc aggattagcc aagaaaagaa 3241 gaatcactgt gctggatgta ggggatgctt acttttccat accactgcat gagagcttta 3301 gacagtatac tgcatttact ctaccatcag taaacaatgc agaaccagga aaaagatata 3361 tatataaagt cttaccgcag ggatggaagg gatcaccagc aatttttcaa cacacaatga 3421 gacagatctt agagccattc agaaaggcaa accaggatgt cattctcatt caatacatgg 3481 atgatatctt aatagctagt gacaggacag atttagaaca tgacaaggtg gtcctgcagt 3541 taaaggaact cctaaatggc ctaggatttt ccaccccaga tgagaagttc caaaaagacc 3601 ctccatacaa atggatgggc tatggactgt ggccaactaa atggaagctg caaaaaatac 3661 aattgcccca gaaagaagta tggacagtca atgacatcca aaaacatgtg ggtgtcctaa 3721 attgggcagc acaaatctac ccaggaataa agaccaaaca cttatgtaga ctaattagag 3781 gaaaaatgac actcacagaa ggagtgcagt ggacagaact agcagaagca gaactagagg 3841 agaacagaat tatcttaagt caggaacaag aggggcacta ttaccaagaa gaaaaggagt 3901 tagaagcaac agtccaaaaa gatcaagaca atcaatggac atataaaata caccagggag 3961 aaaaaattct aaaagtggaa aagtatgcaa aaatgaaaaa tacccatacc aacggggtca 4021 gattgttagc acaggtagtt caaaaaatag gaaaagaagc actggtcatt tggggacgaa 4081 taccaagatt tcacctacca gtagaaagag aaacctggga acagtggtgg gatgactact 4141 ggcaagtgac atggatccca gactgggact ttgtatctac cccaccactg gtcaggctag 4201 catttaacct agtaaaagat cctatactag gcgcagagac cttctacaca gacgggccct 4261 gtaataggca atcaaaagaa ggaaaagcag gatatataac agatagaggg agagacaagg 4321 tgaaggtact agaacaaact accaatcagc aagcagaatt agaagccttc gcgctggcag 4381 taacagactc aggtccaaaa gccaatatta tagtagattc acagtatgta atgggaatag 4441 tagcaggcca gccaacagaa tcagaaaata gaatagtaaa tcaaatcata gaagaaatga 4501 taaaaaagga agccatctat gttgcgtggg tcccagccca caaaggcata gggggaaatc 4561 aggaagtaga ccatttagta agtcagggca tcagacaagt attgtttcta gaaaaaatag 4621 agccagctca ggaagaacat gaaaagtatc atagcaatgt gaaagaacta tcccataaat 4681 ttggattacc caatctggtg gcaagacaga tagtaaacac atgtgcccaa tgtcagcaga 4741 agggagaggc tatacatggg caagtgaatg cagaactagg cacttggcaa atggactgca4801 cacacttaga aggaaaagtc atcataatag cagtgcatgt tgccagtgga ttcatagaag 4861 cagaggtcat cccgcaggaa tcaggaagac aaacagcact cttcctatta aaactggcta 4921 gtagatggcc aataacacac ttgcacacag atagtggtgt caacttcacc tcacaggaag 4981 taaagatggt agcatggtgg gttggtatag agcaatcctt tggagtacct tacaatccac 5041 aaagccaagg agtagtagaa gcaatgaatc accacctaaa aaatcagata agcagaatta 5101 gagagcaggc aaatacagtg gaaacaatag tactaatggc agttcattgc atgaatttta 5161 aaagaagggg aggaataggg gatatgaccc cagcagaaag actcatcaat atgatctcca 5221 cagaacaaga aatacaattc ctccaaacaa aaaatttgaa atttaaaaat ttcccggtct 5281 attacaggga aggcagagat cagctgtgga aaggacctgg ggagctactg tggaaagggg 5341 acggagcagt catagttaag gtagggacag acataaaagt agtaccaaga aggaaggcca 5401 agatcatcag agactatgga ggaaggcaag agctggatag tggtccccac ttggagggtg 5461 ccagggagga tggagaagtg gcatagcctt gtcaagtacc taaagtacag aacaaaagat 5521 ctagaaaagg tgtgctatgt tccccaccat aaggtgggat gggcatggtg gacttgcagc 5581 agggtaatat tcccattaca aggaagaagt catctagaga tacaggcata ttggaaccta 5641 acaccagaaa aaggatggct ctcctcttat gcagtaagaa taacttggta tacagaaaag 5701 ttctggacag atgttacccc agactgtgca gactccctaa tacatggcac ttatttctct5761 tgctttacgg caggtgaagt aagaagagcc atcagagggg aaaagttatt gtcctgctgc 5821 aattatcccc aggcccataa gtcacaggta ccgtcactcc aatttctggc cttagtggta 5881 gtgcaacaaa atggcaaacc ccagagaaac agtaccacca ggaaacagtg gcgaagagac 5941 tatcggagag gccttcgagt ggctagacag gacagtagag gccttaaaca gagaggcggt 6001 gaatcacctg ccccgggagc tcattttcca ggtgtggcaa aggtcctgga gatactggca 6061 tgatgaacaa ggaatgtcac aaagttacac aaaatataga tacttgtgct taatgcagaa 6121 agctatgtac acacatttca tgaaagggtg cacctgcctg gggggagggc atgggccagg 6181 aggatggaga tcaggacctc cccctcctcc ccctccaggt ctagtctaat gactgaagca 6241 ccaacagagt ttcccccggc cggaatggga ccccaccagg gagccaggga tgagtgggta 6301 atagaagtcc tgagagaaat aaaagaagaa gctttaaggc attttgaccc tcgcatgcta 6361 attgctcttg gcggctatat ctatactaga catggagaca cccttgaaag agccagggag 6421 ctcattaatg ccctacaacg agccctcttc atgcacttca gagcaggatg tggccgttca 6481 agagttggcc aaacaagggg aagaaatcct ctctcagcta taccgacccc tagaaacatg 6541 caataacaca tgctattgta aggaatgctg ctaccattgc cagctgtgtt ttttaaataa6601 gggactcggg atatggtatg accgaaaggg caggcgaaga agatctccaa agaaaattaa 6661 ggctcattcg tcttctgcat cagacaagtg agtatgatgt ctagtagaaa tcagctgctt 6721 gttactatct tactagctag tgcttgctta gtatattgta aacaatatgt gactgttttt6781 tatggcgtgc cagcatggaa aaatgcatcc attcccctct tttgtgcaac caaaaataga 6841 gatacttggg gaaccataca gtgcttacca gacaatgatg attatcagga aatagctttg 6901 aatgtgacag aggctttcga tgcatgggat aatacagtaa cagaacaagc agtagaagat 6961 gtctggagac tatttgagac atcaataaaa ccatgtgtca agttaacacc tttatgtata7021 gcaatgaagt gtagcaacat aagcacagag agcacaacca catccccgag cccagggagc 7081 acactcaaac ccctgataaa tgagagcgat ccatgcataa aggcagacaa ctgccccagg 7141 ggactagggg atgaagagat ggtcaattgt cggttcaaca tgacaggatt acagagagat 7201 aagccaaaac agtataatga aacatggtac tcaaaagatg tggtttgtga accatttaac 7261 accaccacaa accagaccag gtgttacatg aaccattgca acacatcagt catcacagag 7321 tcatgtgata agcactattg ggatgctata aggtttagat actgtgcacc acctggttac 7381 gccctactaa gatgcgatga tatcaattat tcaggctttg cacccaattg ctctaaagta7441 gtagctgcta catgcacaag gatgatggag acgcaaactt ctacttggtt tggctttaat 7501 ggcactaggg cagaaaatag aacatatatc tattggcatg gtagagataa tagaactatc 7561 atcagcttaa acaaacatta taatcttact atgcattgta agaggccagg aaataagaca 7621 gttgtaccaa taacacttat gtcagggtta atatttcact cccagccaat caataaaaga 7681 cccagacaag catggtgctg gttcaaaggc gaatggagga aagccatgca ggaggtgaag 7741 gaaacccttg taaaacatcc caggtataaa ggaaccaatg acacaaacca aattaacttt 7801 acaaaaccag gaagaggctc agatgcagaa gtggtatata tgtggactaa ctgcagagga 7861 gaatttctcc attgcaacat gacttggttc ctcaattggg tggaaaacaa aacgggtcag 7921 gaacagcaca attatgcacc gtgccatata aagcaaataa ttaatatctg gcacaaagca 7981 gggaaaaatg tatatttgcc tcctagggaa ggagagttga cctgcaactc aacagtaacc 8041 agcttgattg ctaacattga cacggatggc aaccagacaa atattacctt tagtgcagag 8101 gtggcagaac tataccgatt agaattgggg gattataaat tagtagagat aacaccaatt 8161 ggcttcgcac ctacatcaga aaggagatac tcctctactc caaggaggaa taaaagaggt 8221 gtgttcgtgc tagggttctt aggttttctc gcgacagcag gttctgcaat gggcacggca 8281 gctttaacgc tgtctgctca gtctcggact ttattggccg ggatagtgca gcaacagcaa 8341 cagctgttgg acgtggtcaa gagacaacag gaaatgttgc gactgaccgt ctggggaacg 8401 aaaaatctcc aggcaagagt cactgctatc gagaaatact taaaggacca ggcgcggcta 8461 aattcatggg gatgtgcatt tagacaagtc tgccacacta ctgtaccatg ggtaaataac 8521 tccttaaaac ctgattggga caacatgacg tggcaagagt gggaacaaca agtccgttac 8581 ctagaggcaa atatcagtga acagttagaa cgggcacaaa ttcagcaaga aaagaatacg 8641 tatgaactac aaaaattaaa tagctgggat gtttttacca actggcttga cttaaccgcc 8701 tgggtcaagt atattcaata tggagtttat ataatagtag gaatagtagc tcttagaata8761 gtaatatatg tagtgcaaat gttaagtaga ctcaggaagg gctataggcc tgttttctcc 8821 tcccctcccg gttacatcca acagatccat atccacaagg accaggaaca gccaaccaga 8881 ggagaaacag aagaagacgt tggagacaac gttggggaca gattgtggcc ctggccgatc 8941 gcatatttac atttcctgat ccacctgcta gctcgcctct tgatcgggct gtacagcatc 9001 tgcagggact tactatccag gatctccccg atcctccaac cgatcttccg gagtcttcag 9061 agagcgctga caacaatcag ggactggctg agacttaaag cagcctacct gcagtatggg 9121 tgcgagtgga tccaagaagc gttccgggcc tttgcaagga ttgcgagaga gactcttaca 9181 aacacctgga gagacttgtg gggggcagtg cagtgggtcg ggaggaggat actcgcagtc 9241 ccaaggagga tcaggcaggg ggcagaaatt gccctcctgt gaaggacagc ggtatcagca 9301 gggagatttt atgaataccc catggagaac cccagcaaca gaaagagaga aagaattgta 9361 caagcaacag aatatggatg atgtagattt agatgatgat gatagcctag taggggtctc 9421 tgtcacacca agagtacaat taagaacaat gacatacaaa ttggcagtag atatgtcaca 9481 tttaataaaa gaaagggggg gactggaagg gatgttttac agtgagagaa gacatagaat 9541 cttagacata tacttagaaa aggaagaagg gataattcca gattggcaga actatactca 9601 tgggccagga ataaggtacc cgatgttctt tgggtggctg tggaagctag taccagtaga 9661 tgtcccacaa gaaggggagg acactgagac tcactgcctg ctacacccag tacaaacaag 9721 caggcatgat gacacgcatg gggagacatt agtttggaga tttgacccta agctggctca 9781 tgattacaaa gcctttattc tacacccaga ggaatttggg tacaagtcag gcctgccaga 9841 agatgagtgg aaggcaagac tgaaagcaag agggatacca tttagtaaga acaggaacag 9901 ctgatttggt cagggcagga agtaactact gaaaacagct gagactgcag ggactttcca 9961 gaaggggctg taaccagggg aaggacatgg gaggagctgg tggggaacgc cctcatactc 10021 ctgtataaat gtacccgctg cttgcattgt attcagtcgc tctgcggaga ggctggcaga10081 ttgagccctg ggaggttctc tccagcacta gcaggtagag cctgggtgtt ccctgctaga 10141 ctctcaccag tgcttggccg gcactgggca gacggctcca cgcttgcttg cttaaagacc 10201 tcttaataaa gctgccaatt agaagcaggt taaaggtgtg ttcccatctc tcctagtcgc 10261 cgcctggtca ttcggtgttc acctgagtaa caagaccctg gtctgttagg accctttctg 10321 ctttgggaaa cggaggcagg aaaatcccta gca。