单核苷酸多态性在复杂疾病研究中的作用
- 格式:pdf
- 大小:356.08 KB
- 文档页数:6
基因突变和SNP对人类疾病的影响随着科技的不断进步,我们对人类基因的探索也在不断深入。
现在我们已经发现了很多与人类疾病相关的基因突变和SNP,这些发现不仅对疾病的治疗和预防有着重要的意义,还让我们更加深入地认识了人类基因和生命的奥秘。
基因突变是指基因序列的改变,可能是发生于DNA分子中单个基础对或更多的基础对的变化,可能是插入、删除或替换了一个或多个基础对。
基因突变可以是自然发生的,也可以是受到环境因素影响的后天变异。
而SNP是单核苷酸多态性的简称,是指DNA序列中出现的单个核苷酸的差异。
SNP是人类基因组中最常见的变异形式。
有很多研究表明,基因突变和SNP是导致人类疾病发生的原因之一。
例如,致病基因突变会严重影响蛋白质的功能,导致疾病的发生。
这些基因突变可以引起遗传病,如囊性纤维化、鸟嘌呤尿症、先天性免疫缺陷病等等。
另外,SNP也会影响人类疾病的发生。
例如,我们发现有些SNP与青光眼、哮喘、心血管疾病、糖尿病等疾病有关联。
这些SNP的出现可能会影响蛋白质的结构和功能,从而导致疾病的发生。
除了致病基因突变和SNP,还有许多种类型的基因突变和SNP可能与人类疾病有关。
例如,一些突变后的基因可能会导致疾病的发生,如肿瘤抑制基因的突变会导致肿瘤的发生。
另外,还有一些SNP可能和药物代谢、酒精耐受性、咖啡因摄入量等因素有关,这些因素在一定程度上也会影响人类疾病的发生。
基因突变和SNP对人类疾病的影响是非常复杂的,同时也是非常重要的。
现在,科学家们正努力研究如何利用这些基因信息来治疗和预防人类疾病。
例如,我们可以通过基因检测和遗传咨询来识别某些基因突变和SNP,从而帮助人们进行更加有效的疾病预防和治疗。
而在基因治疗方面,科学家们正致力于研发一些新的单基因疾病治疗方法,例如,CRISPR-Cas9技术可以通过基因编辑来矫正单基因疾病引起的基因突变。
总之,基因突变和SNP是导致人类疾病发生的原因之一,对于理解和治疗人类疾病有着重要作用。
文章编号:100028020(2009)022*******・综述・单核苷酸多态性、环境因素与肝细胞肝癌遗传易感性的关系纪龙综述 余红平审校广西医科大学公共卫生学院,南宁 530021摘要:肝细胞肝癌(HCC )的发生和演进是一个多基因、多因素的复杂过程,是遗传与环境因素相互作用的结果。
单核苷酸多态性(S NP )作为第三代遗传标记,充分反映了个体间的遗传差异,决定了个体对疾病的易感性,正成为肝癌遗传易感性研究的重要工具。
关键词:单核苷酸多态性 环境因素 肝细胞肝癌 遗传易感性 肝肿瘤中图分类号:R73517R73011 文献标识码:AR elationship of single nucleotide polymorphism ,environmental factors and the hereditary susceptibility of hepatocellular carcinomaJI Long ,YU H ongpingSchool of Public Health ,G uangxi Medical University ,Nanning 530021,ChinaAbstract :Resulting by the interaction between the hereditary factor and the environmental factor ,the occurrence anddevelopment of hepatocellular carcinoma (HCC )is a com plicated course with multi 2genes and multi 2factors.As the third genetic marker ,the single nucleotide polym orphism reflects the hereditary difference am ong individuals ,decides the susceptibility to disease and becomes an im portant tool to study the hereditary susceptibility of HCC.K ey w ords :single nucleotide polym orphism ,environmental factor ,hereditary susceptibility ,hepatocellular carcinoma基金项目:国家自然科学基金资助项目(N o.30660162);广西自然科学基金资助项目(N o.桂科攻0592007221);广西研究生教育创新计划资助项目(N o.2008105981004M189);广西大型仪器协作网测试补助(N o.529220072108)作者简介:纪龙,男,硕士研究生,助教,研究方向:慢性病流行病学,E 2mail :tsmcjl @ 肝细胞肝癌(HCC )是我国最常见的恶性肿瘤之一,死亡率为2014Π10万,严重威胁人们的生命健康。
单核苷酸多态SNP人类基因组计划研究成果表明,不同个体的基因都是一样的但在序列上有极小的遗传差异,即遗传多态(genetic polymorphism),其中最主要的是单核苷酸多态(single nucleotide polymorphism, SNP)。
所谓单核苷酸多态是指特定的核苷酸遗传变异在人群中出现频率大于1%,它与“种系突变(germline mutation)”在概念上的区别在于种系突变在人群中出现的频率远远<1%。
一般来说,种系突变存在于引起稀有遗传性疾病的基因编码序列,而SNP存在于整个基因组且出现的频率约为每600个碱基对左右就有1个SNP。
人类基因组中至少有300万个SNP。
研究表明,基因编码序列的SNP往往引起基因产物氨基酸的改变;非编码序列的SNP可影响基因表达水平。
所以,这些功能性SNP可造成不同个体对疾病特别是慢性复杂性疾病易感性和对药物治疗反应性的差异。
近10年来,国内外学者在研究SNP与肿瘤易感性方面进行了大量的探索,并发现一些多态等位基因与常见肿瘤易感性相关。
概括而言,这些基因主要包括:(1)致癌物代谢酶基因,(2)DNA修复基因,(3)针对感染原的免疫反应相关基因,(4)细胞凋亡和周期调控基因。
最近,SNP尤其是药物通路基因的SNP与肿瘤化疗和放疗敏感性以及毒副作用的关系也成为研究的热点。
因为SNP是性质稳定的DNA水平的生物标志、可用外周血淋巴细胞检测而取材容易、检测方法相对简单经济,所以学者们正在积极探讨利用SNP作为预测肿瘤发生和发展以及疗效和预后的生物标志的可能性。
单核苷酸多态作为肿瘤易感性标志代谢酶基因多态与肿瘤易感性大多数环境致癌物需经过代谢激活后才有致癌作用,而代谢也可以使致癌物失去活性。
因此,个体对致癌物作用的敏感性取决于代谢激活和代谢解毒的平衡。
激活活性高而解毒活性低的人可能处于易感状态,相反则可能处于低风险状态。
参与代谢内源性和外源性化学物质的代谢酶在人群中分布呈多型性,即酶的活性有很大的个体差异。
snp 研究思路SNP(SingleNucleotidePolymorphism)是指单核苷酸多态性,是遗传学和分子生物学研究中的一个重要概念。
SNP 指的是基因组中某一个位点上存在的两种以上等位基因,每个等位基因只发生单个核苷酸的变异。
SNP 是遗传变异的一种形式,因此在人类疾病的研究中扮演着重要的角色。
SNP 研究的思路可以分为以下几个步骤:1. 确定研究对象和研究目的SNP 研究可以应用于不同的研究对象,包括人类、动物和植物等。
因此,在开始研究之前,需要明确研究对象和研究目的。
对于人类疾病的研究,研究目的可能是寻找和某种疾病相关的 SNP 位点,从而揭示疾病的发病机制。
2. 选择 SNP 位点在确定研究目的之后,需要从整个基因组中选择与研究对象相关的 SNP 位点。
选择 SNP 位点的方法有很多种,包括基于遗传关联的方法、基于功能预测的方法等。
在选择 SNP 位点时,需要考虑到 SNP 的遗传学特征、频率等因素。
3. 分析 SNP 的遗传学特征一旦选择了 SNP 位点,就需要对其进行遗传学特征的分析。
这些特征包括 SNP 的等位基因频率、遗传距离、连锁不平衡等。
这些信息有助于确定 SNP 在研究中的作用和意义。
4. 确定 SNP 的功能和作用SNP 的作用可以是直接影响某个基因的表达,也可以是通过调节基因之间的相互作用来影响生物学过程。
因此,确定 SNP 的功能和作用对于理解其在疾病发生机制中的作用至关重要。
5. 分析 SNP 与疾病的关联性最后一步是分析 SNP 与疾病的关联性。
这可以通过基于人群的关联研究或基于家系的遗传研究等方法来实现。
这些研究可以揭示SNP 对疾病的风险贡献、相互作用等信息。
综上所述,SNP 研究是一项复杂而重要的工作,需要综合运用遗传学、分子生物学和统计学等知识和技术。
通过对 SNP 的研究,可以深入理解疾病的发生机制,为疾病的预防、诊断和治疗提供重要的理论基础。
1定义:单核苷酸多态性( single nucleotide polymorphism,SNP),主若是指在基因组水平上由单个核苷酸的变异所惹起的 DNA 序列多态性。
它是人类可遗传的变异中最常有的一种。
占全部已知多态性的 90%以上。
SNP 在人类基因组中宽泛存在,平均每 500~1000 个碱基对中就有1 个,预计其总数可达 300 万个甚至更多。
SNP 所表现的多态性只波及到单个碱基的变异,这类变异可由单个碱基的变换(transition)或颠换(transversion)所惹起,也可由碱基的插入或缺失所致。
但平时所说的 SNP 其实不包括后两种情况。
单核苷酸多态性( SNP)是指在基因组上单个核苷酸的变异,包括置换、颠换、缺失和插入。
所谓变换是指同型碱基之间的变换 ,如嘌呤与嘌呤 ( G2A) 、嘧啶与嘧啶( T2C) 间的取代 ;所谓颠换是指发生在嘌呤与嘧啶 (A2T 、A2C 、C2G、G2T) 之间的取代。
从理论上来看每一个 SNP 位点都能够有 4 种不同的变异形式,但实质上发生的只有两种,即变换和颠换,两者之比为 2:1。
SNP 在 CG 序列上出现最为频频,而且多是C 变换为 T ,原因是 CG 中的 C 常为甲基化的,自觉地脱氨后即成为胸腺嘧啶。
一般而言, SNP 是指变异频率大于 1 %的单核苷酸变异。
在人类基因组中大体每 1000 个碱基就有一个 SNP ,人类基因组上的 SNP 总量大体是 3 ×106个。
依照排列组合原理 ,SNP 一共能够有 6 种取代情况,即 A/ G、 A/ T 、A/ C 、C/ G、C/ T 和 G/ T ,但事实上 ,变换的发生频率占多数 ,而且是 C2T 变换为主 ,其原因是 Cp G 的 C 是甲基化的 ,简单自觉脱氨基形成胸腺嘧啶T , Cp G 也所以变为突变热点。
理论上讲,SNP 既可能是二等位多态性,也可能是3 个或4 个等位多态性,但实质上,后两者特别少见,几乎能够忽略。
SNPs的发展与人类健康一、SNPs的由来及概念SNPs是英文Single nucleotide polymorphisms 的缩写,中文译为单核苷酸多态性。
通俗地讲,可以认为是人类DNA序列的差异。
具体地说,SNP指基因组序列中单核苷酸(A,T,C,G)改变时发生的DNA 序列的多态性变化,即指基因组内特定核苷酸位置上存在两种不同的碱基,其中最少一种在群体中的频率不小于1%。
人类基因组的30亿个碱基中,大约每300到500个碱基就有一个SNPs发生,整个人类基因组大约有2000万SNPs。
SNPs既能在编码基因又能在非编码基因中发生,在编码基因中出现称做cSNPs。
尽管多数SNPs不影响细胞功能,但是科学家认为SNPs确实可以使人易患病或影响对药物的敏感性。
尽管遗传密码由4种碱基组成,但SNP通常只是1种二等位基因(biallelic),或二态的遗传变异。
例如一个SNP可能把DNA的序列AAGGCTAA改变为TAGGCTAA。
SNP作为一种碱基的替换,大多数为转换,而颠换较少,转换与颠换之比大约2∶1。
SNP在CG序列上出现最为频繁,而且多是C→T,原因是CG 中C即胞嘧啶常为甲基化的、自发地脱氨后即成为胸腺嘧啶。
二、SNPs的研究意义SNPs是伴随着人类基因组计划(HGP)发展起来的,HGP下一阶段的另一任务是尽快鉴定人类DNA序列的差异,即单核苷酸多态性(SNPs)。
虽然人类99%以上的DNA序列是相同的,但是DNA序列的变化对人类对疾病、环境攻击(比如细菌,病毒,毒素和化学物质)、药物和治疗的反应产生重大影响。
这就使得SNPs对生物医学研究、药物开发、医学诊断和法医学发展有重要意义。
除了基因制药、诊断、生物医学研究方面的应用,SNP图谱还有望被用来识别基因组上成千上万个附加标记,以简化HGP研究者绘制的很大的基因组图谱。
(一)SNPs与疾病的关系为什么有人容易得糖尿病,有人容易得癌症,有人易肥胖,基因在这里起了主要作用。
snps名词解释SNP是一个缩写,全称是Single Nucleotide Polymorphism,意思是单核苷酸多态性。
在基因组中,我们经常会发现不同个体拥有相同的基因,但基因的一些部分却存在微小的变异。
这些变异通常是由一个单核苷酸发生不同的替换导致的,这种现象就叫做SNP。
SNP是基因多态性的常见形式,也是人类遗传研究、基因组学和遗传类疾病研究等领域中的热门研究方向。
目前已经鉴定出了几百万个SNP,它们散布在人类基因组的各个角落,涉及生命体物质构建和功能的方方面面,可以说SNP是基因多样性研究的重要组成部分。
SNP在遗传研究和医学领域中具有广泛的应用。
在基因组学中,SNP可以用来鉴定人类群体的遗传起源和进化历程。
同时,SNP还是复杂疾病发生的重要遗传因素。
研究发现,SNP与一系列疾病如癌症、心血管、自身免疫疾病、神经系统疾病等存在关联。
通过研究SNP在这些疾病中的作用,可以为疾病的预防、诊断和治疗提供新的思路和方法。
除此之外,SNP还可以用于个体定位和个性化医疗。
通过分析个体的SNP,可以确定其遗传信息和风险,为个体的医疗管理和治疗方案提供指导。
SNP的研究和应用给人们带来了巨大的益处,但是也面临着一些挑战。
首先,SNP分布广泛且数量众多,分析起来十分复杂。
其次,不同的生活环境和风险因素可能会对SNP产生影响,造成结果的误判。
此外,对SNP涉及的生物学、遗传学和医学等多学科知识的综合应用也是一个挑战。
总的来说,SNP是遗传学、基因组学和医学领域的热门研究方向,具有重要的理论和应用价值。
随着科技的发展和研究的深入,相信SNP 的研究和应用将为人类医学和健康事业带来越来越多的惊喜。
遗传学中的人类基因组多态性人类的基因组是指人类细胞中所有基因的总和,也是遗传学中研究的重要对象。
基因组中有许多基因是不同的,而这些基因的变异就是多态性。
人类基因组多态性主要表现为人群之间和个体之间的差异。
这些差异包括单核苷酸多态性(SNP)、插入/缺失多态性(indel)、结构变异、单倍型和等位基因频率等。
单核苷酸多态性(SNP)单核苷酸多态性是指基因组中存在的单个核苷酸差异。
SNP是导致性状变异的主要因素,因而是遗传研究中最常见的多态性形式。
人类SNP的数量约为3000万个,其中大多数没有表型效应。
不过,仍有相当一部分SNP与疾病的发生相关,如胚胎发育中的基因多态性、心血管疾病等。
插入/缺失多态性(indel)插入/缺失多态性是指在基因组中存在的核苷酸插入或缺失。
这种多态性通常和基因功能紧密相关,因为插入/缺失会改变基因开放阅读框架的长度。
插入/缺失多态性在人类基因组中的数量很大,且许多插入/缺失具有遗传影响,特别是在复杂疾病的发生中起到了重要的作用。
结构变异结构变异是指在DNA分子中发生的大段基因重排。
这种多态性可以导致基因组中的某些区域的缺失或重复出现,导致基因功能变异、基因表达差异,甚至与某些疾病相关。
在人类基因组中,结构变异占据了基因组多态性的重要组成部分,是引起人类常见遗传疾病的主要原因之一。
单倍型和等位基因频率单倍型是指在某一基因型中不同等位基因组成的组合形式。
单倍型的变异表现为在人群中等位基因组成的频率差异。
同一单倍型中的等位基因组合具有共同的起源和进化路径,是基因演化和人类迁移历史的重要信息来源。
总的来说,人类基因组多态性是基因遗传学研究中的非常重要的研究对象,与人类疾病发生、个体特征和适应性等紧密相关,同时也涉及到人类的起源、演化和迁移历史。
随着高通量测序技术的不断进步,人类基因组多态性的研究将会更加深入和全面。
使用GWAS数据进行基因组关联分析的技巧基因组关联分析(GWAS)是一种用于研究基因与疾病之间关联的方法,通过分析大规模的单核苷酸多态性(SNP)数据,可以帮助我们了解特定基因与疾病之间的关系。
在本文中,我们将介绍一些使用GWAS数据进行基因组关联分析的技巧。
1. 数据预处理在进行GWAS之前,首先需要对原始数据进行预处理。
这包括对基因型数据进行质量控制,去除低质量的SNP和样本,以减少误差。
此外,还需要进行人口结构和亲缘关系的校正,以避免由此引起的假阳性结果。
常用的方法包括主成分分析和混合模型。
2. 建立疾病模型在进行基因组关联分析之前,需要建立一个适当的疾病模型。
这涉及到确定疾病的遗传模式,例如是否为常见变异的多基因疾病,还是由罕见变异引起的单基因疾病。
对于复杂疾病,可能需要考虑多个基因和环境因素之间的相互作用。
3. 关联分析方法GWAS数据的分析方法有很多种,常用的包括单点关联分析和基因型-表型关联分析。
单点关联分析用于研究单个SNP与疾病之间的关联,常用的统计方法包括卡方检验和Fisher精确检验。
基因型-表型关联分析则用于研究基因型与表型之间的关联,常用的方法包括线性回归和logistic回归。
4. 多位点关联分析除了单点关联分析,多位点关联分析也是一种常用的方法。
它可以帮助我们发现多个SNP之间的相互作用,以及它们与疾病之间的关系。
常用的多位点关联分析方法包括单倍型分析和基因型分析。
这些方法可以帮助我们更好地理解基因之间的相互作用和复杂疾病的遗传机制。
5. 基因功能注释在进行基因组关联分析时,了解SNP的功能和其在基因组中的位置非常重要。
基因功能注释可以帮助我们确定SNP是否在编码区域、调控区域或非编码区域,以及其可能对基因功能的影响。
常用的基因功能注释工具包括ANNOVAR和Ensembl。
6. GWAS结果的解读分析完GWAS数据后,我们需要解读结果并确定是否存在显著的关联。
这通常涉及到进行多重检验校正,以控制假阳性率。
gwas 遗传概念【原创版】目录1.GWAS 的定义和背景2.GWAS 的应用领域3.GWAS 的优缺点4.我国在 GWAS 方面的研究和进展正文一、GWAS 的定义和背景GWAS,全称为 Genome-Wide Association Study,即全基因组关联研究,是一种通过研究个体基因组中的单核苷酸多态性(SNPs)与特定性状或疾病之间的关联,进而寻找相关基因的研究方法。
GWAS 在遗传学领域具有重要的意义,它为我们提供了一个全面、高效的寻找关联基因的途径。
二、GWAS 的应用领域1.复杂疾病的研究:通过 GWAS,可以找到与复杂疾病相关的基因,从而为疾病的预防和治疗提供新的思路。
2.药物研发:GWAS 可用于寻找特定药物作用靶点,从而加速新药的研发进程。
3.基因功能研究:GWAS 可为研究者提供大量与特定性状相关的基因信息,有助于深入研究基因功能。
4.农业育种:在农业领域,GWAS 可用于研究作物的产量、抗病性等重要性状,为农业育种提供重要依据。
三、GWAS 的优缺点优点:1.高效性:GWAS 可以在短时间内对大量个体进行研究,提高研究效率。
2.全面性:GWAS 可同时研究基因组中的所有 SNPs,具有较高的全面性。
3.可重复性:由于 GWAS 基于客观数据进行研究,因此具有较高的可重复性。
缺点:1.关联性不等于因果性:GWAS 只能找到关联性,而不能确定因果性,因此需要进一步验证和研究。
2.样本质量要求高:GWAS 对样本质量要求较高,若样本质量不佳,可能导致研究结果的偏差。
3.多态性影响:由于人类基因组中存在大量的多态性,可能影响研究结果的准确性。
四、我国在 GWAS 方面的研究和进展我国在 GWAS 方面取得了一系列重要成果。
例如,我国科学家通过对大量人群进行 GWAS 研究,发现了与高血压、糖尿病等疾病相关的多个基因。
此外,我国还在农业领域利用 GWAS 技术进行了大量作物育种研究,取得了显著的成果。
SNP位点数据分析和人类遗传学研究SNP (Single Nucleotide Polymorphism) 位点数据分析和人类遗传学研究随着现代技术的快速发展,生物信息学领域的研究变得越来越重要。
其中,单核苷酸多态性(SNP)位点数据分析在人类遗传学研究中起着关键作用。
本文将讨论SNP位点的概念、分析方法以及其在人类遗传学研究中的应用。
首先,SNP位点是人类基因组中最常见的突变形式。
它是DNA序列中的单个核苷酸发生变异的地方,包括碱基的替换、插入和删除。
SNP位点通常在基因和表达调控区域中,对个体间的遗传差异和基因功能起着重要作用。
因此,研究SNP位点对于理解人类遗传学和疾病的发生机制至关重要。
在SNP位点数据的分析中,最常见的方法是基因型和等位基因频率分析。
基因型分析涉及确定每个个体的等位基因组合,包括纯合子(两个等位基因相同)和杂合子(两个等位基因不同)。
等位基因频率分析则是研究一个等位基因在某个群体中的频率。
通过这些分析方法,我们可以了解SNP位点的遗传多样性及其在人群间的分布情况。
此外,SNP位点数据还可以通过关联分析来研究基因与特定性状或疾病之间的联系。
关联分析(Association Analysis)是将SNP位点与某个性状或疾病之间的关联关系联系起来。
这种方法被广泛应用于复杂性疾病的研究,如肿瘤、心血管疾病和神经退行性疾病等。
通过关联分析,我们可以发现与某个特定性状或疾病相关的SNP位点,进一步了解其遗传机制,发现相关基因以及相关通路,为疾病的预测、诊断和治疗提供重要的线索。
SNP位点数据的分析离不开高通量测序技术的支持,如基因芯片和下一代测序。
这些技术的发展使得大规模SNP位点分析成为可能,相对应的数据处理和分析方法也在不断更新和改进。
然而,SNP位点数据分析中也存在一些挑战和限制,如缺乏样本数量和SNP位点的不均匀分布,这些问题需要继续研究和解决。
总结起来,SNP位点数据分析在人类遗传学研究中具有重要作用。
DNA多态性分析基础详解DNA多态性是指细胞或个体间在DNA序列上的差异。
这种差异可以是单核苷酸多态性(Single Nucleotide Polymorphism, SNP)、插入缺失多态性(Insertion/Deletion Polymorphism, Indel)、重复序列多态性(Tandem Repeat Polymorphism, TRP)等,是生物学中一个重要的遗传变异现象。
对DNA多态性的分析可以帮助我们了解基因间的差异、对个体间遗传关系的研究、对疾病易感性的预测等,因此在医学、生物学、法医学等领域有着重要的应用价值。
在进行DNA多态性分析时,首先需要从个体样本中提取DNA,并经过一系列的处理步骤进行扩增和测序,最终得到目标DNA序列。
接下来我们将详细介绍DNA多态性分析的基本原理及常用的技术方法。
1.DNA多态性的基本原理DNA多态性是由基因上的变异所致。
人类有大约3亿个碱基对,而这些基因组都是类似的。
然而,在这些基因组中却存在一些微小的差异,也就是DNA多态性。
这种多态性可以是单个碱基对的差异,也可以是较大的插入/删除(Indel)或者重复序列的差异。
其中最常见的是单核苷酸多态性(SNP),即在基因组中一些位置上的碱基对发生了变异。
例如,在一些位置上,有的个体的DNA序列是"A",而另外一些个体的DNA序列却是"G",这种变异就构成了一个SNP。
SNP是最基础也是最常见的DNA多态性,因此在大部分DNA多态性分析中都会对SNP进行检测。
2.DNA多态性分析的技术方法(1)PCR-SSPPCR-SSP(Polymerase Chain Reaction-Sequence Specific Primers)是一种常用的DNA多态性分析方法。
它通过使用特异性引物扩增出目标DNA片段,然后进行电泳检测,根据不同的片段长度判断样本中的多态性。
PCR-SSP方法简单高效,广泛应用于HLA基因型分析、疾病易感性研究等领域。
中南大学学报(医学版)J Cent South Univ (Med Sci)2014, 39(9) http://www.csumed.org
969
单核苷酸多态性在复杂疾病研究中的重要作用朱作斌,黄石(中南大学医学遗传学国家重点实验室,长沙 410078)
[摘要] 人类基因组测序工作完成以来,单核苷酸多态(single nucleotide polymorphisms,SNPs)作为一个强有力的工具在复杂疾病或性状的研究中得到了非常广泛的应用。以往SNPs常作为一种遗传标志来进行研究, 但从“DNA元件百科全书计划”之后,更多的遗传学家开始关注SNPs与复杂疾病或性状的直接关系。SNPs能单独起到调控作用,而基因组中SNPs的大量聚合能够更加显著地影响到生物学性状和疾病的发生。[关键词] 单核苷酸多态性;次要位点;复杂性状;非编码区
Important role of single nucleotide polymorphisms in the study of complex diseases
ZHU Zuobin, HUANG Shi(State Key Laboratory of Medical Genetics, Central South University, Changsha 410078, China)
ABSTRACT Single nucleotide polymorphisms (SNPs) have been very widely used in the study of diseases and characters since the completion of the Human Genome Project. SNPs are mostly used as mere genetic markers in studying complex disease. Geneticists began to focus on the direct relationship between SNPs and complex diseases after the “Encyclopedia Of DNA Elements Project”. SNPs can pay a regulative role alone, while the collected SNPs in genome can significantly affect the biological characters and disease development.
KEY WORDS single nucleotide polymorphism; minor allele; complex traits; non coding region
收稿日期(Date of reception):2013-03-20作者简介(Biography):朱作斌,博士,主要从事医学遗传学相关研究。通信作者(Corresponding author):黄石,Email: huangshi@sklmg.edu.cn基金项目(Foundation item):国家重点基础研究发展计划(973计划)项目(2011CB51001);国家自然科学基金(81171880)。This work were supported by the National Basic Research Program (973 Program) of China (2011CB51001) and the National Natural Science Foundation of China (81171880).
DOI:10.11817/j.issn.1672-7347.2014.09.018www.csumed.org/xbwk/fileup/PDF/201409969.pdf
生物复杂性状通常受多种基因调控,这类性状在群体中的不同个体之间具有数量程度的差异,又被称为数量性状。数量性状指在一个群体中的不同个体之间呈现的连续性变异的性状,如人的身高和体质量等。这种数量差异通常与DNA遗传多态有关,最常见的遗传多态是单核苷酸多态(single 中南大学学报(医学版), 2014, 39(9) http://www.csumed.org970
nucleotide polymorphisms,SNPs)。SNPs与数量性状的关系是目前一个较为广泛重视的研究领域,已经取得了一定进展,但很多复杂性状的遗传因素还有待深入研究。人类很多慢性病都是复杂疾病,本文将从SNPs与复杂性状的关系的角度入手,综述SNPs在复杂疾病研究中的重要作用。1 基因组遗传变异与生物复杂性状的关系1.1 生物复杂性状与表观遗传编程的关联DNA是生物体最主要的建筑材料,而表观遗传代表着对DNA建材的不同使用方式。一个多细胞生物具有成千上万种不同种类的细胞,每一种类细胞都有一套与细胞功能相适应的表观遗传学调控程序;另外,不同生物个体间DNA序列是不完全相同的,不同的DNA序列对应着不同的调控机制,以此调控生物个体的生长发育状态和对不同外界环境的适应机制,这套调控程序即表观遗传编程。将多种细胞整合成一个统一的具有复杂功能的生物体,是一个高度复杂有序的过程。每一个基因组都有与之相适应的表观遗传编程,基因发生变异,表观遗传编程会随之发生变化,当基因组中某些位点发生变化,为了保持整个编程网络的稳定性,其他一些基因会相应地调控表达量来促进生物体内的生理平衡并与环境相适应。复杂性状受多种基因调控,同时也是表观遗传编程的结果。1.2 表观遗传编程与基因组遗传变异的关联遗传变异通过表观遗传编程的改变调控复杂性状。复杂性状在群体中的不同个体内,具有数量程度的差异,被称之为数量性状。这种数量差异通常与DNA遗传多态有关,这类多态位点被称为数量性状位点(quantitative trait locis,QTLs),QTLs即控制数量性状的基因在基因组中的位置。可以用DNA分子标记技术对这些区域进行定位,其与连续变异的数量性状有很好的相关性。2001年由Jansen等[1]提出基因组遗传学概念:将全基因组中的每个基因mRNA的表达量作为数量性状对其QTLs进行定位分析,即表达数量性状基因座(expression quantitative trait loci,eQTLs)。QTLs影响复杂性状是通过调控基因表达完成的,基因表达是一个复杂的网络,很多基因的mRNA表达受到大量eQTLs调控而影响到表型[2-4]。这个调控网络,即表观遗传编程是以基因组的遗传变异为基础建立起来的,可以遗传给后代。1.3 基因组遗传变异与SNPs数目的关联基因组中最常见的遗传多态是SNPs,人与人之间的遗传差异主要是由SNPs造成的。SNPs与数量性状的关系是目前一个受到广泛重视的研究领域,已经取得了一定进展[5-12]。如找到了一些改变基因蛋白顺序的SNPs,以及它们与某些性状和疾病的直接关系。但是,通常这些单个SNP只是解释了性状数量变异的一部分,说明还有很多SNPs的作用有待阐明,很多复杂性状的遗传因素还有待深入研究,并且缺乏一个高效率的研究方法。SNPs或DNA遗传变异可以起到适应环境和其他一些有益的作用,但同时由于其来自随机突变或复制错误,具有无序性,故具备对有序复杂系统的破坏性。因此,一个个体的SNPs的数目多少,应该有个最佳值,过少会降低适应环境的能力(如某些免疫功能),过多则会导致DNA序列的混乱无章和某些精密有序的生化反应的破坏。大部分SNPs单独的作用也许确实很微弱,但可以将这些大量的SNPs作为一个整体集中起来,观察它们的集体效应。特别是微弱随机事件或小错误的破坏力,基本上与事件的数量积累有关,而数量积累有个阙值,超出阙值就会造成系统功能受损。所以,可以将基因组中SNPs整体数量的多少作为衡量基因组遗传变异水平、无序性或熵的一个指标。
2 基因组水平遗传变异的研究方法任一SNPs通常只有两个位点,按在群体中的分布频率可分为主要位点(频率大于0.5)和次要位点(频率小于0.5)。决定主次位点的因素可能有两种,一种是随机偶然性,一种是自然选择。有些SNPs受到自然选择,主要位点可能受到正选择,次要位点可能受到负选择(特别是频率极低的)。有些SNPs则没有功能,不会受到自然选择。有些次要位点,特别是频率较高的次要位点(大于0.1),可能受到正负两种选择,只是负选择稍微强一点。已经明确证明为无功能的SNPs只是极少数,同样,明确证明为有功能的SNPs也是极少数,并且大多数与疾病相关的SNPs都是次要位点。对于大部分常见的高频的SNPs来说(指次要位点的频率),它们是否具有功能性,是否受到自然选择,目前仍未解决。近年来的遗传学研究为解决这一问题提供了一个有效方法,即计算一个群体中的不同个体具有不同的次要位点含量(minor allele content,MAC)。MAC的计算方法如下:首先扫描一个群体中每个个体的一定数量的SNPs,然后针对每个单核苷酸多态性在复杂疾病研究中的重要作用 朱作斌,等971
SNPs位点的两个等位基因,计算其在这个群体中的频率,频率小于0.5者即是次要位点,最后计算这个个体中携带次要位点的多少即MAC值。可以随机选择一些性状进行测试,然后进行关联分析,看MAC的多少与性状数量差异有无关联。如果MAC与表型有关,则可以看到很强的关联。反之,没有关联。如果有关联,则MAC多少必然会受到自然选择,因为绝大部分性状表型是受到自然选择的。所以,可以以生物个体的MAC表示个体基因组整体遗传变异的水平。生物体是一个高度复杂的有机体,DNA是生物最重要的建筑材料。最大遗传变异假说认为越复杂的物种基因组遗传变异水平越小。简单生物突变速度大大高于复杂生物[13]。很多造成人类遗传病的基因突变在相对简单的生物(如猿猴)中属于正常变异[14]。进化时间相同但复杂性不同的生物物种,具有不同的种内遗传距离,且简单物种的种内遗传距离大于复杂物种。开花类植物与哺乳动物相比为简单生物,进化时间大致相同,但开花植物之间的最大遗传距离大大高于哺乳动物之间的最大遗传距离[15]。人与猿类分开后进化时间一样长,但人类的遗传变异多样性显著低于猿类的遗传多样性。也就是说生物由低级向高级进化,基因组的精密程度也在进化。生物体越复杂,基因网络就越有序,生物体所容忍的遗传变异就越小。人类的基因组是如同宇宙飞船一样精密的系统,对原本有序的基因序列来说,大量次要位点的聚集就是对基因组整体有序性的破坏,必然导致生物性状的改变和疾病的发生。模式生物(如酵母和线虫等)已经被广泛用于SNPs的遗传研究[16-21]。建立一系列能够稳定遗传的自交品系在生物的复杂性状及相关基因的研究中具有非常重要的意义,自交品系在生物学上的应用已经有多年的历史了。以秀丽隐杆线虫(Caenorhabditis elegans)为例,目前获得具有不同遗传背景品系的最好方法是重组自交系(recombinant inbred advanced intercross lines,RIAILs)。该方法简述如下:分别将实验室野生型线虫N2和夏威夷野生型线虫相互杂交,将后代按照雄虫和雌雄同体分为两类,每类再随机分为四组,每一组的雄虫分别随机和另外四组的雌雄同体的线虫杂交,然后再将其产生的后代分为雌雄同体组和雄性线虫组,重复操作至第三代得到512个品系的线虫,然后将这些线虫完全随机地自由组合交配直至第十代,在此过程中每个培养盘里面都只含有一只雄虫和一只雌雄同体线虫杂交,排除雌雄同体线虫自交的盘子。十代之后随机挑取一定数量品系的线虫,连续自交十代获得能够稳定遗传的自交品系。然后对这这些线虫品系的SNPs标志进行鉴定。所有SNPs源自两个亲本。这些杂交后代具备较广泛的SNPs随机组合。因此,利用这些简单的模式生物可以较方便地研究基因组遗传变异与复杂性状的关系。