当前位置:文档之家› 桃基因组及全基因组关_联分析研究进展 - 副本 - 副本

桃基因组及全基因组关_联分析研究进展 - 副本 - 副本

桃基因组及全基因组关_联分析研究进展 - 副本 - 副本
桃基因组及全基因组关_联分析研究进展 - 副本 - 副本

全基因组选择及其在奶牛育种中的应用

发表于《中国奶牛》,2011 全基因组选择育种技术及在奶牛育种中应用进展 范翌鹏1孙东晓1* 张勤1张胜利1张沅1刘林2 (1.中国农业大学动物科技学院,北京,100193; 2.北京奶牛中心. 北京. 100085) 摘要:全基因组选择是指基于基因组育种值(GEBV)的选择方法,指通过检测覆盖全基因组的分子标记,利用基因组水平的遗传信息对个体进行遗传评估,以期获得更高的育种值估计准确度。由于可显著缩短世代间隔,全基因组选择作为一种育种新技术在奶牛育种中具有广阔的应用前景,目前已经成为各国的研究热点。不同国家的试验结果表明,在奶牛育种工作,基于GEBV 的遗传评估可靠性在20-67%之间,如果代替常规后裔测定体系,可节省92%的育种成本。本文综述了全基因组选择的基本原理及其在各国奶牛育种中的应用现状和所面临的问题。 关键词:全基因组选择,奶牛育种 Genome-Wide Selection and its Application in Dairy Cattle FAN YiPeng, SUN Dongxiao, ZHANG Qin, ZHANG Shangli, ZHANG Yuan, LIU Lin (College of Animal Science Technology, China Agricultural University, Beijing, 100193) Abstract: Genomic selection refers to selection decisions based on genomic breeding values (GEBV). The GEBV are calculated as the sum of the effects of dense genetic markers, or haplotypes of these markers, across the entire genome, thereby potentially capturing all the quantitative trait loci (QTL) that contribute to variation in a trait. Genomic selection has become a focus of study in many countries as the new breeding method. Reliabilities of GEBV for young bulls without progeny test results in the reference population were between 20 and 67%. By avoiding progeny testing, bull breeding companies could save up to 92% of their costs [1]. In this paper, we first review the progress of genomic selection, including the principle, methods, accuracy and advantages of genomic selection. We then review the application of genomic selection in dairy cattle. Key words: Genomic Selection, Dairy Breeding 全基因组选择(Genomic Selection,GS),即全基因组范围的标记辅助选择(Marker Assisted Selection, MAS),指通过检测覆盖全基因组的分子标记,利用基因组水平的遗传信息对个体进行遗传评估,以期获得更高的育种值估计准确度。研究已表明,标记辅助选择可提高奶牛育种遗传进展[2][3],但是在目前奶牛育种工作中却无法大规模推广应用标记辅助选择。因为奶牛的生产性状和健康性状均受大量基因座位共同影响,通过有限数量的已知标记无法大幅度加快遗传进展;其次,通过精细定位策略鉴定主效基因需花费大量人力物力和时间;而且利用标记信息估计育种值的计算方法也很复杂。全基因组选择基于基因组育种值(Genomic Estimated Breeding Value, GEBV)进行选择,其实施包括两个步骤:首先在参考群体中使用基因型数据和表型数据估计每个染色体片段的效应;然后在候选群体中使用个体基因型数据估计基因组育种值(genomic breeding value,GEBV)[4],模拟研究证明,仅仅通过标记预测育种值的准确性可以达到0.85(指真实育种值与估计育种值之间的相关,而可靠性则指其平方)。如果在犊牛刚出生时即可达到如此高的准确性,对奶牛育种工作则具有深远意义。模拟研究表明:对于一头刚出生的公犊牛而言,如果其GEBV的估计准确性可以达到经过后

全基因组关联分析的原理和方法

全基因组关联分析(Genome-wide association study;GWAS)是应用基因组中 数以百万计的单核苷酸多态性(single nucleotide ploymorphism ,SNP)为分子 遗传标记,进行全基因组水平上的对照分析或相关性分析,通过比较发现影响复杂性状的基因变异的一种新策略。 随着基因组学研究以及基因芯片技术的发展,人们已通过GWAS方法发现并鉴定了大量与复杂性状相关联的遗传变异。近年来,这种方法在农业动物重要经济性状主效基因的筛查和鉴定中得到了应用。 全基因组关联方法首先在人类医学领域的研究中得到了极大的重视和应用,尤其是其在复杂疾病研究领域中的应用,使许多重要的复杂疾病的研究取得了突破性进展,因而,全基因组关联分析研究方法的设计原理得到重视。 人类的疾病分为单基因疾病和复杂性疾病。单基因疾病是指由于单个基因的突变导致的疾病,通过家系连锁分析的定位克隆方法,人们已发现了囊性纤维化、亨廷顿病等大量单基因疾病的致病基因,这些单基因的突变改变了相应的编码蛋白氨基酸序列或者产量,从而产生了符合孟德尔遗传方式的疾病表型。复杂性疾病是指由于遗传和环境因素的共同作用引起的疾病。目前已经鉴定出的与人类复杂性疾病相关联的SNP位点有439 个。全基因组关联分析技术的重大革新及其应用,极大地推动了基因组医学的发展。(2005年, Science 杂志首次报道了年龄相关性视网膜黄斑变性GWAS结果,在医学界和遗传学界引起了极大的轰动, 此后一系列GWAS陆续展开。2006 年, 波士顿大学医学院联合哈佛大学等多个研究机构报道了基于佛明翰心脏研究样本关于肥胖的GWAS结果(Herbert 等. 2006);2007 年, Saxena 等多个研究组联合报道了与2 型糖尿病( T2D ) 关联的多个位点, Samani 等则发表了冠心病GWAS结果( Samani 等. 2007); 2008 年, Barrett 等通过GWAS发现了30 个与克罗恩病( Crohns ' disrease) 相关的易感位点; 2009 年, W e is s 等通过GWAS发现了与具有高度遗传性的神经发育疾病——自闭症关联的染色体区域。我国学者则通过对12 000 多名汉族系统性红斑狼疮患者以及健康对照者的GWAS发现了5 个红斑狼疮易感基因, 并确定了4 个新的易感位点( Han 等. 2009) 。截至2009 年10 月, 已经陆续报道了关于人类身高、体重、 血压等主要性状, 以及视网膜黄斑、乳腺癌、前列腺癌、白血病、冠心病、肥胖症、糖尿病、精神分 裂症、风湿性关节炎等几十种威胁人类健康的常见疾病的GWAS结果, 累计发表了近万篇 论文, 确定了一系列疾病发病的致病基因、相关基因、易感区域和SNP变异。) 标记基因的选择: 1)Hap Map是展示人类常见遗传变异的一个图谱, 第1 阶段完成后提供了 4 个人类种族[ Yoruban ,Northern and Western European , and Asian ( Chinese and Japanese) ] 共269 个个体基因组, 超过100 万个SNP( 约1

全基因组选择育种策略及在水产动物育种中的应用前景(精)

中国水产科学 2011年7月, 18(4: 936?943 Journal of Fishery Sciences of China 综述 收稿日期: 2011?03?14; 修订日期: 2011?04?10. 基金项目: 国家自然基金资助项目(30730071; 30972245; 农业科技成果转化资金项目(2010GB24910700. 作者简介: 于洋(1987?, 硕士研究生. E-mail: yuy8866@https://www.doczj.com/doc/b018542973.html, 通信作者: 张晓军, 副研究员. E-mail: xjzhang@https://www.doczj.com/doc/b018542973.html, DOI: 10.3724/SP.J.1118.2011.00935 全基因组选择育种策略及在水产动物育种中的应用前景 于洋1,2 , 张晓军1 , 李富花1 , 相建海1 1. 中国科学院海洋研究所实验海洋生物学重点实验室, 山东青岛266071; 2. 中国科学院研究生院, 北京 100049 摘要: 全基因组选择的概念自2001年由Meuwissen 等提出后便引起了动物育种工作者的广泛关注。目前, 澳大利亚、新西兰、荷兰、美国的研究小组已经应用该方法进行了优质种牛的选择育种, 并取得了很好的效果。此外在鸡和猪的选择育种中也有该方法的应用, 但在水产动物选育中尚未见该方法使用的报道。本文对“全基因组选择育种”的概念和提出背景进行了归纳, 对全基因组选择育种的优势进行了阐述, 并详细介绍了其具体的策略, 总结了目前全基因组育种所广泛采用的方法以及取得的成果, 旨在为该方法在水产动物育种方面的应用研究提供科学参考。 关键词: 全基因组选择; 水产动物育种; SNP; QTL; 全基因组育种值估计 中图分类号: S96 文献标志码: A 文章编号: 1005?8737?(201104?0935?08 人类对于动物的选择育种由来已久, 最初所进行的只是简单的人工驯化。随着遗传学研究的发展, 尤其是“数量遗传学理论”的提出, 动物育种技术进入快速发展时

基因组学(复习)

王前飞: (1)为什么要研究表观遗传学? 答: 表观遗传学主要通过DNA 的甲基化、组蛋白修饰、染色质重塑和非编码RNA 调控等方式控制基因表达。表观遗传学是近几年兴起的而且发展迅速的一个研究遗传的分支学科,其研究和应用不仅对基因表达、调控、遗传有重要作用,而且在肿瘤、免疫等许多疾病的发生和防治以及干细胞定向分化研究、基因芯片中亦具有十分重要的意义。表观遗传学补充了“中心法则”忽略的两个问题,即哪些因素决定了基因的正常转录和翻译以及核酸并不是存储遗传信息的唯一载体;在分子水平上,表观遗传学解释了DNA序列所不能解释的诸多奇怪的现象。如: 同一等位基因可因亲源性别不同而产生不同的基因印记疾病,疾病严重程度也可因亲源性别而异。表观遗传学信息还可直接与药物、饮食、生活习惯和环境因素等联系起来,营养状态能够通过改变表观遗传以导致癌症发生,尤其是维生素和必需氨基酸。 此外,表观遗传学信息的改变,对包括人体在内的哺乳动物基因组有广泛而重要的效应,如转录抑制、基因组印记、细胞凋亡、染色体灭活等。DNA 甲基化模式的改变,尤其是某些抑癌基因局部甲基化水平的异常增加,在肿瘤的发生和发展过程中起到了不容忽视的作用。研究发现,肿瘤细胞DNA 存在广泛的低甲基化和局部区域的高甲基化共存现象,以及总的甲基化能力增高,这3个特征各以不同的机制共同参与甲基化在肿瘤发生、发展中的作用。如胃癌、结肠癌、乳腺癌、肺癌、胰腺癌等众多恶性肿瘤都不同程度地存在一个或多个肿瘤抑制基因CpG 岛甲基化。而表观遗传学改变在本质上的可逆性,又为肿瘤的防治提供了新的策略。所以,随着表观遗传学研究的深入,肯定会对人类生长发育、肿瘤发生以及遗传病的发病机制及其防治做出新的贡献,也必将在其他领域中展示其不可估量的作用和广阔的前景。 (2)表观遗传学涉及到哪些方面? 答: 表观遗传学的研究内容主要包括:DNA甲基化、组蛋白的末端修饰和变异体、DNAaseⅠ高敏感位点、非编码RNA、转录因子及其辅助因子、顺式调控元件和基因组印记等。 (3)什么因素会影响基因表达水平? 答: 基因选择性转录表达的调控( DNA甲基化,基因印记,组蛋白共价修饰,染色质重塑) 基因转录后的调控(基因组中非编码RNA,微小RNA(miRNA),反义RNA、内含子、核糖开关等) 1.转录水平的调控:包括DNA转录成RNA时的是否转录及转录频率的调控,DNA 的序列决定了DNA的空间构型,DNA的空间构型决定了转录因子是否可以顺利的结合到DNA的调控序列上,比如结合到TATA等序列上。 2.翻译水平的调控:翻译水平的调控又可以分成翻译前的调控和翻译后的调控。 a、翻译前的调控主要是RNA编辑修饰。 b、翻译后调控主要是蛋白的修饰,蛋白修饰后可以成为有功能的蛋白或者有隐藏功能的蛋白。 在真核和原核细胞中,从基因表达到蛋白质合成,其间有许多地方受到调控,这

全基因组关联分析(GWAS)解决方案

全基因组关联分析(GWAS)解决方案 ※ 概述 全基因组关联研究(Genome-wide association study,GWAS)是用来检测全基因组范围的遗传变异与 可观测的性状之间的遗传关联的一种策略。2005年,Science杂志报道了第一篇GWAS研究——年龄相关性黄 斑变性,之后陆续出现了有关冠心病、肥胖、2型糖尿病、甘油三酯、精神分裂症等的研究报道。截至2010年 底,单是在人类上就有1212篇GWAS文章被发表,涉及210个性状。GWAS主要基于共变法的思想,该方法是 人类进行科学思维和实践的最重要工具之一;统计学研究也表明,GWAS很长时期内都将处于蓬勃发展期(如 下图所示)。 基因型数据和表型数据的获得,随着诸多新技术的发展变得日益海量、廉价、快捷、准确和全面:如 Affymetrix和Illumina公司的SNP基因分型芯片已经可以达到2M的标记密度;便携式电子器械将产生海量的表型 数据;新一代测序技术的迅猛发展,将催生更高通量、更多类别的基因型,以及不同类别的高通量表型。基于 此,我们推出GWAS的完整解决方案,协助您一起探索生物奥秘。 ※ 实验技术流程 ※ 基于芯片的GWAS Affymetrix公司针对人类全基因组SNP检测推出多个版本检测芯片,2007年5月份,Affymetrix公司发布了 人全基因组SNP 6.0芯片,包含90多万个用于单核苷酸多态性(SNP)检测探针和更多数量的用于拷贝数变化(CNV)检测的非多态性探针。因此这种芯片可检测超过180万个位点基因组序列变异,即可用于全基因组 SNP分析,又可用于CNV分析,真正实现了一种芯片两种用途,方便研究者挖掘基因组序列变异信息。 Illumina激光共聚焦微珠芯片平台为全世界的科研用户提供了最为先进的SNP(单核苷酸多态性)研究平 台。Illumina的SNP芯片有两类,一类是基于infinium技术的全基因组SNP检测芯片(Infinium? Whole Genome Genotyping),适用于全基因组SNP分型研究及基因拷贝数变化研究,一张芯片检测几十万标签SNP位点,提 供大规模疾病基因扫描(Hap660,1M)。另一类是基于GoldenGate?特定SNP位点检测芯片,根据研究需要挑选SNP位点制作成芯片(48-1536位点),是复杂疾病基因定位的最佳工具。 罗氏NimbleGen根据人类基因组序列信息设计的2.1M超高密度CGH芯片,可以在1.1Kb分辨率下完成全基 因组检测,可有效检测人基因组中低至约5kb大小的拷贝数变异。

全基因组选择在猪育种上的研究进展

全基因组选择在猪育种上的研究进展 自野生动物被驯化以来,科学家一直致力于提高畜禽育种值的研究。近半个世纪来,畜禽育种值估计的方法主要经历了综合选择指数法、同期群体比较法、最佳线性无偏预测法(Best LinearUnbiased Prediction,BLUP)、分子标记辅助选择育种(MAS)以及近几年快速发展的GS 法。同时,随着高密度基因芯片的出现和高通量测序技术的快速发展,单核苷酸多态性(SingleNucleotide Polymorphism,SNP)分型成本快速下降,GS 才逐渐引起畜禽界的关注。特别是Schaeffer发现,在奶牛育种中利用GS比后裔测定可节约成本97%,且遗传进展可提高3~4倍后,全球掀起了一股研究GS的热潮。 全基因组选择(GS) 什么是GS 2001年,Meuwissen等人最先提出GS,实质为全基因组范围的标记辅助选择。其理论基础是应用整个基因组的标记信息和各性状值来估计每个标记或染色体片段的效应值,然后将效应值加和即得到基因组育种值(GenomicEstimated Breeding Value,GEBV)。GS在某种程度上是MAS的延伸,弥补了在MAS 中标记数量只能解释一部分遗传方差以及数量性状位点(QuantitativeTrait Locus,QTL) 定位困难的缺点。其中心任务是提高GEBV值的准确性,并尽可能准确地估计每个标记的效应。而估计标记效应的方法在实际运用中以BLUP法为主;Bayes法虽其准确性高于BLUP,但因其计算复杂,需在超级计算机上运行而限制其应用。不过随着快速算法的开发和计算机硬件的改进,Bayes法的运算效率有望提高。 为什么选用GS GS的优势 与MAS相比,GS的优势主要表现在: 1)能对所有的遗传和变异效应做出准确的估计。而MAS 只能对部分遗传变异进行检测,且容易高估其遗传效应。 2)缩短世代间隔、提高畜禽年遗传进展、降低生产成本等,这在需要后裔测定的家畜中尤为明显。如GS给奶牛育种带来了巨大经济效益。 3)早期选择准确率高。 4)对于较难实施选择的性状具有重大影响。如低遗传力性状、难以测定的性状等。 5)GS在提高种群的遗传进展前提下,还能降低群体的近交增量。 GS的可靠性

全基因组关联分析

全基因组关联分析(Genome-wide association study,GWAS) 是一种对全基因组范围内的常见遗传变异: 单核苷酸多态性(Single nucleotide polymorphism , SNP) 进行总体关联分析的方法, 即在全基因组范围内选择遗传变异进行基因分型, 比较病例和对照间每个变异频率的异差, 计算变异与疾病的关联强度, 选出最相关的变异进行验证并最终确认与疾病相关。 单核苷酸多态性(英语:Single Nucleotide Polymorphism,简称SNP,读作/snip/)指的是由单个核苷酸—A,T,C或G的改变而引起的DNA序列的改变,造成包括人类在内的物种之间染色体基因组的多样性。 在后GWAS时代,利用已有的GWAS数据在多个人群间进行meta分析已经成为一种常用的分析手 段,这不仅可以进一步扩大样本量,更重要的是提高了统计效能。GWAS meta分 析已经成功应该用在多种复杂疾病的遗传学研究,发现一批新的易感基因。 全基因组关联水平(P_meta < 5.0×10-8)罕见等位基因(MAF < 5%), 基因型填补(imputation):依据已分型位点的基因型对数据缺失位点或未分型位点进行基因型预测的方法。可用于精细定位(fine-mapping),填补已确认的关联位点附近的位点,以便评价相邻SNP位点的关联证据。加快复杂性疾病易感基因的定位。 连锁与连锁不平衡(linkage disequilibrium,LD): 连锁:如果同一条染色体上2个位点的位置比较近,则这2个位点上的等位基因倾向于一起传递给下一代。 连锁不平衡:又称等位基因关联,是指同一条染色体上,两个等位基因间的非随机相关。即当位于同一条染色体上的两个等位基因同时存在的概率大于人群中因随机分布而同时出现的概率时,就称这两个位点处于LD状态。所谓的连锁不平衡是一种遗传标记的非随机性组合。比如,一个基因有两个位点,一个位点有两种基因型,那么子代应该有2的2次方,即4种基因型。但是发现子代的基因型往往会少于4种,这就是连锁不平衡现象。这是由于两个位点距离较近引起的两个位点上的等位基因经常同时出现在同一染色体上。

基于全基因组关联分析的基因(环境)交互作用统计学方法进展

万方数据

万方数据

708 图lMDR基本步骤示意图 划分为不同的分类,也就是图中的单元格。单元格中左侧直方图表示病例,右侧直方图表示对照。 第4步:在n维的每个多因子分类(单元格)中,计算病例数和对照数的比值,若病例数与对照数之比达到或超过某个阈值(例如≥1),则标为高危,反之则为低危。这样就把n维的结构降低到一维两水平。 第5步:多因子分类的集合中包含了MDR模型中各因子的组合。在所有的两因子组合中,选择错分最小的那个MDR模型,该两位点模型在所有模型中将具有最小的预测误差。 第6步:通过十重交叉验证评估模型的预测误差,一以及单元格分配时的相对误差。也就是说,模型拟合9/10的数据(训练样本),其预测误差将通过剩下1/10的数据(检验样本)来衡量。选择预测误差最小的模型作为最终的模型,取lO次检验的预测误差平均值,作为模型相对预测误差的无偏估计。由于数据分组的方式对交叉验证的结果影响较大,因此,十重交叉验证过程将重复进行10次,对n个因子可能的集合将重复进行10×10次的交叉验证。 通过十重交叉验证,在一定程度上可以避免因数据转换的偶然性,使I类错误增大而产生假阳性结果的影响。预测误差是衡量MDR模型在独立检验的亚组中预测危险状态的指标,通过十重交叉验证的亚组中每一个的预测误差的平均值来计算。根据交叉验证的预测误差的平均值,选择最佳的Tl因子模型,并根据不同的因子数重复以上过程。最终筛选出最有可能存在交互作用的基因。 MDR的优势在于不需要考虑疾病的遗传模型,它利用计算机运算速度快的优势,对多个基因进行随机组合,按照上述方法找出存在交互作用的基因位点。但当主效应存在时,用MDR方法很难得到最终模型,且同样受遗传异质性的影响;它只是一种数据挖掘方法,不是严格意义上的统计方法,还无法判断它的I类错误和检验功效。 MDR分析软件包可在http://www.epistasis.org/mdr.html免费下载。 4基于复合LD的交互作用分析法 吴学森等Ⅲ’提出基于复合LD的交互作用的分析法。该方法以病例一对照试验设计为基础,基于LD计算方法,构建完全有别于以上方法的一种新型基因间交互作用的统计分析方法:(1)用两个位点(基因)单倍型的外显率(只。)与等位基因的边际外显率的乘积(Pa?P。)的偏差(6.口=PA。一只?P8),分别定义病例组和对照组两个位点交互作用的度量.进而综合两组交互作用度量构造检验交互作用的统计量;(2)对于基因一环境交互作用模型的构建,则将环境(分类型变量)变量视为“虚拟位点”(例如E=l表示环境暴露。E=0表示即非暴露),则同样依据上述方法构建其模型。4.1基因型数据的联合概率分布及其表达对于基因之间、基因与环境之间的交互作用统计量的构建,无论是二阶或高阶情形,均至少涉及两个变量。在本研究中,均以病例一对照试验设计为基础,个体的基因数据一律用其基因型表示。无论是病例组还是对照组,均设两个位点的等位基因分别为A,a;B,b,则它们的联合基因型分布可表述为表3的形式: 则.配子的LD系数为:6.。=%一PAP。;非配子的LD系数为:乳口=九日一只-匕,其中,P.e=尸竺+PAB舳+碟+P竺;JD∥。=P竺+P竺+P::+形:。但是,当计算病例组或对照组的6.。时,需要知道双杂合子的概率P苫、P::。然而。当它们的相未知时,则无法确定其值,只能进行单倍型推断。由于单倍型推断总是存在误差,这给后面构造的检验交互作 用的统计量带来很多不确  万方数据

关于内参基因的选择

关于内参基因的选择 实验内参,即是在检测细胞内分子表达变化时选择的参照物,其在细胞内的表达相对恒定,在处理因素作用条件下不会发生表达改变的基因。内参同样可以校正上样量、上样过程中存在的实验误差,保证实验结果的准确性。 1、管家基因 最普通的内参是内源性参照基因,也就是管家基因(持家基因,house keeping gene)。 管家基因是一类始终保持着低水平的甲基化并且一直处于活性转录状态的基因,高度保守并且在大多数情况下持续表达。其表达水平受环境因素影响较小,而且是在个体各个生长阶段的大多数,或几乎全部组织中持续表达,或变化很小,因此常存在于生物细胞核的常染色质中。它的表达只受启动序列或启动子与RNA 聚合酶相互作用的影响,而不受其他机制调节。 管家基因维持细胞最低限度功能所不可少的基因, 如编码组蛋白基因、编码核糖体蛋白基因、线粒体蛋白基因、糖酵解酶的基因等。这类基因在所有类型的细胞中都进行表达,因为这些基因的产物对于维持细胞的基本结构和代谢功能是必不可少的。

2、内参基因选择的条件 1、不存在假基因,以免基因组DNA的扩增; 2、高度或中度表达,避免太高或太低的丰度; 3、稳定表达于不同类型的细胞和组织中,表达量无明显差异; 4、表达水平与细胞周期、活化等无关; 5、不受外源性或内源性因素的影响。 3、不同管家基因 在选择管家基因作为内参时,首先要按不同类型的分子选择正确的内参。曾看到有人用检测miRNA时选择了GAPDH作为内参呢。 a、检测mRNA时的内参 通常使用的是GAPDH、beta-actin、tubulin GAPHD

GAPDH GAPDH是糖酵解反应中的一个酶,由4个30-40kDa的亚基组成,分子量 146kDa。该酶基因为管家(house keeping)基因,几乎在所有组织中都高水平表达,在同种细胞或者组织中的蛋白质表达量一般是恒定的,且不受含有的部分识别位点、佛波脂等的诱导物质的影响而保持恒定,故被广泛用作抽提total RNA,poly(A)+ RNA,Western blot等实验操作的标准化的内参。 beta-actin β-Actin是PCR常用的内参,β-Actin抗体是Western Blot很好的内参指数。β-Actin是横纹肌肌纤维中的一种主要蛋白质成分,也是肌肉细丝及细胞骨架微丝 的主要成分,具有收缩功能,分布广泛。

基因组水平的选择信号及其检测方法研究进展

第40卷第5期2019年5月 家畜生态学报Vol.40No.5 Acta Ecologiae Animalis Domastici May2019 o学科动态氥 因组水平的选择信号及其检测方法研究进展 王宇占,赵毅强 (中国农业大学生物学院,北京100193) [摘要]在进化过程中,自然或人工选择在基因组上留下了各种选择信号的印迹。探究不同物种或同一物种不同种群之间的选择信号有助于我们研究物种的进化历史,筛选优势等位基因并应用于遗传育种之中。本文详细介绍了各种经典的选择信号检测方法及其适用场景,并讨论了各自的优缺r和未来的发展方向。 [关键词]选择信号;单核{酸多态性;生物进化 [中图分类号]S811.5[文献标识码]A[文章编号]1005-5228(2019)05-0001-06 doi:10.3969/j.issn.1673-1182.2019.05.001 19世纪中叶,英国生物学家达尔文提出了生物进化论学说,认为选择可以改变个体之间的适应性和繁殖力匚1〕,十年后,孟德尔发现了遗传定律,随后摩尔根揭示了染色体的遗传机制,20世纪中叶,沃森和克里克发现了DNA双螺旋结构。基于达尔文等人的进化学、遗传定律等学说,科学家结合数理统计等数学知识提出了现代综合进化论,认为自然选择的作用单位是群体,强调渐进式的进化。 化物化中了、物体自然选择,强烈的人工选择。随着二代测序技术的成熟和快速发展,累积了越来越多的测序数据,可大范围检测基因组上留下的选择印记,这些印记称为选择信号(sig-nature of selection)[2]。通过分析基因组上的选择信号了解种群的进化历史,并对研究生物进化以及遗传育种等问题提供帮助。比如检测选择信号可以帮助我们确定基因组上哪些优势等位基因受到了选择的青睐,哪些在进化过程中被逐渐淘汰,一些研究选择信号知名的例子如人类不同族群的乳糖耐受性变化3、水稻稻芒的选择等⑷。 1选择作用于DNA变异 在DNA序列水平上可检测到的遗传变异主要包括染色体结构变异(structural variants,SVs)、小片段序列的插入缺失(indel)和单核@酸多态(sin-gle nucleotide polymorphism,SNP)[5]。单核@酸多态主要指基因组在单个核昔酸水平上的变异。相比于染色体结构变异,单核@酸多态性在基因组上数量更多,分布更广泛,且易于进行分型,目前分析大多基于单核@酸多态 选择主要包括正选择,负选择,平衡选择几个类型。正选择(positive selection)指适应性高的等位基因受到选择,频率增大[7\负选择(negative se-lection)又称纯化选择,是指突变的等位基因适应性较低,在选择中处于劣势,因此该等位基因在群体中会被淘汰8。平衡选择(balanced selection)是指杂合子相比于纯合子具有更高的适应性,选择压力有助于维持等位基因在群体中的平衡⑼。 研究结果表明,大部分的新发突变是有害的,只有很少一部分是有益的。有害的突变经自然或人工选择下其频率逐渐在群体中降低直到消失,有益的突变频率则会在群体中上升,甚至达到固定。由于 突变位点与周围的位点存在连锁不平衡(linkage disequilibrium,LD),位点被选择后该位点周围多态性下降,这种现象称为选择性清除(selection sweep)10〕。 由于正选择是生物适应性进化的主要机制,且往往在基因组上留下明显的选择信号,目前大多数研究都集中在寻找正选择信号上。故本文主要介绍正选择信号的检测方法。 [收稿日期]2018-07-19修改日期;2019-01-08 [基金项目]国家自然科学基金(U1704233) [作者简介]王宇占(1994—),男,山西长治人,硕士,主要从事生物信息学研究。E-mail:yuzhanwang@https://www.doczj.com/doc/b018542973.html, 头[通讯作者]赵毅强(1980—),男,湖南常德人,副教授,博士生导师,主要从事生物信息学研究。E-mail:yiqiangz@https://www.doczj.com/doc/b018542973.html,

基因工程选择题试题库,很全

2.第一个作为重组DNA载体的质粒是( ) (a)pBR322 (b)ColEl (c)pSCl01 (d)pUCl8 3.关于宿主控制的限制修饰现象的本质,下列描述中只有( )不太恰当。 (a)由作用于同一DNA序列的两种酶构成 (b)这一系统中的核酸酶都是Ⅱ类限制性内切核酸酶 (c)这一系统中的修饰酶主要是通过甲基化作用对DNA进行修饰 (d)不同的宿主系统具有不同的限制-修饰系统 4.Ⅱ型限制性内切核酸酶:( ) (a)有内切核酸酶和甲基化酶活性且经常识别回文序列 (b)仅有内切核酸酶活性,甲基化酶活性由另外一种酶提供 (c)限制性识别非甲基化的核苷酸序列(d)有外切核酸酶和甲基化酶活性(e)仅有外切核酸酶活性,甲基化酶活性由另外一种酶提供 5.下面有关限制酶的叙述哪些是正确的?( ) (a)限制酶是外切酶而不是内切酶 (b)限制酶在特异序列(识别位点)对DNA进行切割 (c)同一种限制酶切割DNA时留下的末端序列总是相同的 (d)一些限制酶在识别位点内稍有不同的点切割双链DNA,产生黏末端 (e)一些限制酶在识别位点内相同的位臵切割双链DNA,产生平末端6.第一个被分离的Ⅱ类酶是:( ) (a)EcoK (b)HindⅢ(c)HindⅡ(d)EcoB 7.在下列进行DNA部分酶切的条件中,控制那一项最好?( ) (a)反应时间(b)酶量(c)反应体积(d)酶反应的温度

8.在下列试剂中,那一种可以螯合Ca2+离子?( ) (a)EDTA (b)柠檬酸钠(c)SDS (d)EGTA 9.在下列工具酶中,那一种可以被EGTA抑制活性?( ) (a)S1单链核酸酶(b)末端转移酶(c)碱性磷酸酶(d)Bal 31核酸酶10.限制性内切核酸酶可以特异性地识别:( ) (a)双链DNA的特定碱基对(b)双链DNA的特定碱基序列 (c)特定的三联密码(d)以上都正确 11.下列关于限制性内切核酸酶的表示方法中,正确一项的是( )。(a)Sau3A I (b)E.coRI (c)hind III (d)Sau 3A1 12.限制性内切核酸酶的星号活性是指:( ) (a)在非常规条件下,识别和切割序列发生变化的活性。(b)活性大大提高(c)切割速度大大加快(d)识别序列与原来的完全不同 13.下面哪一种不是产生星号活性的主要原因?( ) (a)甘油含量过高(b)反应体系中含有有机溶剂 (c)含有非Mg2+的二价阳离子(d)酶切反应时酶浓度过低 14.关于宿主控制的限制修饰现象的本质,下列描述中只有( )不太恰当 (a)由作用于同一DNA序列的两种酶构成 (b)这一系统中的核酸酶都是Ⅱ类限制性内切核酸酶 (c)这一系统中的修饰酶主要是通过甲基化作用对DNA进行修饰 (d)不同的宿主系统具有不同的限制-修饰系统 15.在长模板链的指导下引物延伸合成长的DNA互补链时应选用( ) (a)T4DNA聚合酶(b)Klenow酶. (c)大肠杆菌DNA聚合酶I (d)T7DNA聚合酶 16.末端转移酶是合成酶类,( ) (a)作用时不需要模板

GWAS原理剖析资料

全基因组关联分析(Genome-wide Association Study)是利用高通量基因分型技术,分析数以万计的单核苷酸多态性(SNPs)以及这些SNPs与临床表型和可测性状的相关性。简单地理解全基因组关联分析,GW AS就是标记辅助选择在全基因组范围上的应用,在全基因组层面上开展大样本的、多中心的、重复验证的技术,并对相关基因与复杂性状进行关联研究,从而全面地揭示出不同复杂性状的遗传机制和基础。GW AS是一项开创性的研究方法,因为它可以在以前很难达到的分辨率水平上对成千上万无关样本的全基因组进行研究,且不受与疾病有关的先验性假设的限制,GWAS在全基因组范围、零假设性较候选基因研究都迈出了重要的一步,而且随着高通量测序成本的降低,GW AS在人类疾病以及畜禽经济性状的研究上都表现出巨大的优势。 GW AS的优势除了可以一次性检测到数以万计的SNPs信息,从而提高试验效率以及检验功效以外,其还有其他两个显著的优势,主要表现在:(1)对未知信息的基因进行定位探索。传统的QTL定位仅仅限于对已知的候选基因进行分析探索,而GW AS是对全基因组的范围内的所有位点进行关联分析,因此其拥有更广泛的关联信息,相比候选基因分析GW AS 更有可能找到与性状真正关联的候选基因,因此不再受到预先假设的候选基因的限制。(2)对于GWAS在研究不同的复杂性状之前,不需要像以往的研究一样“盲目地”预设一些假定条件,而是通过在病理和对照组中,有目的地比较全基因组范围内所有SNPs的等位基因频率或者通过家系进行传递不平衡检验(TDT,Transmission disequilibrium test),从而找出与复杂性状显著相关的序列变异。到目前为止,利用全基因组关联分析研究已经挖掘出众多与各种复杂性状相关联的基因和染色体区域,在这些被新鉴定出的位点和区域中,只有小部分结果位于以前对这些性状研究的区域之中或者附近,绝大多数位于以前从未被研究过的区域,GW AS的研究结果表明以前没有被纳入研究的未知区域有可能对于复杂性状也是十分

重测序-全基因组选择(GS)

首页 科技服务 测序指南 基因课堂 市场活动与进展 文章成果 关于我们 全基因组选择1. Meuwissen T H, Hayes B J, Goddard M E.Prediction of total genetic value using genome-wide dense marker maps[J]. Genetics, 2001, 157(4): 1819 1829. 阅读原文>> 2. Haberland A M, Pimentel E C G, Ytournel F, et al. Interplay between heritability, genetic correlation and economic weighting in a selection index with and without genomic information[J]. Journal of Animal Breeding and Genetics, 2013, 130(6): 456-467. 阅读原文>> 3. Wu X, Lund M S, Sun D, et al. Impact of relationships between test and training animals and among training animals on reliability of genomic prediction[J]. Journal of Animal Breeding and Genetics, 2015, 132(5): 366-375. 阅读原文>> 4. Goddard M E ,Hayes BJ. Genomic selection [J]. Journal of Animal Breeding and Genetics,2007,124:323:330. 阅读原文>> 5. Heffner E L, Sorrells M E, Jannink J L. Genomic selection for crop improvement [J]. Crop Science, 2009, 49(1): 1-12. 阅读原文>> 参考文献 全基因组选择简介 Meuwissen等[1]在2001年首次提出了基因组选择理论(Genomic selection , GS),即利用具有表型和基因型的个体来预测只具有基因型不具有表型值动植物的基因组育种值(GEBV)。 例如,提高奶牛的产奶量一直是奶牛研究者的研究重点,传统育种的方法需要牛生长至成年后,才能进行产奶量的测定,再进行后续的育种进程。如果在犊牛刚出生时就可以通过某种技术预测出其产奶量,就可以大大的减少育种时间,节省大量的育种成本。 全基因组选择(GS)利用覆盖全基因组的高密度分子遗传标记进行标记辅助选择,可以在奶牛的幼年时期就预测出其生产性状和营养性状,快速筛选出具有优良性状的奶牛或者种公牛,加速育种的进程。 全基因组选择技术参数 提供领先的基因组学解决方案 Leading Edge Genomic Services & Solutions 动植物重测序变异检测BSA性状定位遗传图谱群体进化全基因组关联分析Hi-C测序 人类基因组测序全基因组测序外显子测序目标区域测序单细胞基因组测序 动植物基因组测序全基因组survey 全基因组 de novo 测序泛基因组测序组装变异检测 微生物基因组测序16S/18S/ITS等扩增子测序细菌基因组 de novo 测序真菌基因组 de novo 测序微生物重测序宏基因组测序 建库测序建库测序 诺禾致源微信文章精彩阅读 >> 版权所有:北京诺禾致源科技股份有限公司 转录调控测序 真核有参转录组测序医学转录组测序真核无参转录组测序比较转录组与泛转录组测序原核转录组测序宏转录组测序单细胞转录组测序LncRNA测序circRNA测序small RNA测序ChiP-seq RIP-seq 全基因组甲基化测序 GS 重测序新产品发布 群体大小 参考群体的选择十分重要,表型信息及固定效应信息记录需要准确完整。此外,选择出 的参考群体要满足内部亲缘关系比较远,数量达到1000个以上[2]。候选群体最好与参考群体的亲缘关系较近,这样可以保证育种值预测的准确性[3]。 测序策略 测序深度:平均每个样本≥10×;测序平台:Illumina HiSeq PE150测序; 全基因组选择技术优势 全基因组选择与传统的分子标记辅助选择相比,具有很多优势[5]: 能够在得到物种个体DNA的时候即对其进行育种值评估,可以缩短世代间隔,加快遗传进展并且降低经济投入。 全基因组范围内的标记能够解释尽可能多的遗传变异,可以对遗传效应进行较为准确的检测和估计。 能够较准确的评估遗传力较低、难测定的性状或测定费用较高的性状。 通过基因组选择的方式,即使单个标记的效应很微小,导致遗传变异的所有遗传效应也都能够被SNP标记捕获, 所以比传统的基于系谱和表型数据的最佳线性无偏模型得到更高的可靠性。 a b c d

基因组选择及其应用

HEREDITAS (Beijing) 2011年12月, 33(12): 1308―1316 ISSN 0253-9772 https://www.doczj.com/doc/b018542973.html, 综 述 收稿日期: 2011?04?18; 修回日期: 2011?06?25 基金项目:国家高技术研究发展计划(863计划)项目(编号:SS2012AA100816)资助。 作者简介:李恒德, 博士, 副研究员, 研究方向:统计遗传学。E-mail: hengde.li@https://www.doczj.com/doc/b018542973.html, 通讯作者:孙效文, 研究员, 研究方向:水产生物技术。E-mail: sunxw2002@https://www.doczj.com/doc/b018542973.html, 网络出版时间: 2011-10-18 15:34:41 URL: https://www.doczj.com/doc/b018542973.html,/kcms/detail/11.1913.R.20111018.1534.007.html DOI: 10.3724/SP.J.1005.2011.01308 基因组选择及其应用 李恒德1, 包振民2 , 孙效文1, 3 1. 中国水产科学研究院生物技术研究中心, 北京 100141; 2. 中国海洋大学海洋生命学院, 青岛 266003; 3. 中国水产科学研究院黑龙江水产研究所, 哈尔滨 150001 摘要: 品种选育在农业生产中占有十分重要的地位, 育种值估计是品种选育的核心。随着遗传标记的发展, 尤 其是高通量的基因分型技术, 使得从基因组水平估计育种值成为可能, 即基因组选择。文章将基因组选择的方法分为两类:一是基于估计等位基因效应来预测基因组估计育种值(GEBV), 如最小二乘法, 随机回归-最佳线性无偏预测(RR-BLUP)、Bayes 、主成分分析等方法; 二是基于遗传关系矩阵来预测GEBV, 通过采用高通量标记构建个体间的遗传关系矩阵, 然后用线性混合模型来预测育种值, 即GBLUP 法, 并以这两种分类简要介绍了基因组选择各种方法的大致原理。影响基因组选择准确性的因素主要有标记类型和密度、单倍型长度、参考群体大小和标记-数量性状基因座(QTL)连锁不平衡(LD)大小等; 在基因组选择的各种方法中, 一般说来Bayes 方法和GBLUP 方法具有较高的准确性, 最小二乘法最差; GBLUP 计算速度快, 能够将标记和系谱结合起来, 因而比其他方法更具优势。尽管基因组选择取得了很大进展, 但在理论方面还面临着一些挑战, 如联合育种、长期选择的遗传进展及如何解析与性状有关和无关的标记等。基因组选择在一些动植物育种上已经开始应用, 在人类遗传倾向预测和进化动力学研究中也有潜在的应用前景。基因组选择在个体间亲缘关系的量化上有了突破, 比传统方法更加精确, 因此, 基因组选择将会是动植物育种史上革命性的事件。 关键词: 基因组选择; 高通量遗传标记; 育种值估计 Genomic selection and its application LI Heng-De 1, BAO Zhen-Min 2, SUN Xiao-Wen 1,3 1. The Centre for Applied Aquatic Genomics , Chinese Academy of Fishery Sciences , Beijing 100141, China ; 2. College of Marine Life Sciences, Ocean University of China , Qingdao 266003, China ; 3. Heilongjiang River Fishery Research Institute , Chinese Academy of Fishery Sciences , Harbin 150001, China Abstract: Selective breeding is very important in agricultural production and breeding value estimation is the core of selective breeding. With the development of genetic markers, especially high throughput genotyping technology, it becomes available to estimate breeding value at genome level, i.e. genomic selection (GS). In this review, the methods of GS was categorized into two groups: one is to predict genomic estimated breeding value (GEBV) based on the allele effect, such as

相关主题
文本预览
相关文档 最新文档