当前位置:文档之家› 基因组选择及其应用

基因组选择及其应用

基因组选择及其应用
基因组选择及其应用

HEREDITAS (Beijing) 2011年12月, 33(12): 1308―1316 ISSN 0253-9772 https://www.doczj.com/doc/e410984307.html,

综 述

收稿日期: 2011?04?18; 修回日期: 2011?06?25

基金项目:国家高技术研究发展计划(863计划)项目(编号:SS2012AA100816)资助。

作者简介:李恒德, 博士, 副研究员, 研究方向:统计遗传学。E-mail: hengde.li@https://www.doczj.com/doc/e410984307.html,

通讯作者:孙效文, 研究员, 研究方向:水产生物技术。E-mail: sunxw2002@https://www.doczj.com/doc/e410984307.html,

网络出版时间: 2011-10-18 15:34:41

URL: https://www.doczj.com/doc/e410984307.html,/kcms/detail/11.1913.R.20111018.1534.007.html

DOI: 10.3724/SP.J.1005.2011.01308

基因组选择及其应用

李恒德1, 包振民2 , 孙效文1, 3

1. 中国水产科学研究院生物技术研究中心, 北京 100141;

2. 中国海洋大学海洋生命学院, 青岛 266003;

3. 中国水产科学研究院黑龙江水产研究所, 哈尔滨 150001

摘要: 品种选育在农业生产中占有十分重要的地位, 育种值估计是品种选育的核心。随着遗传标记的发展, 尤

其是高通量的基因分型技术, 使得从基因组水平估计育种值成为可能, 即基因组选择。文章将基因组选择的方法分为两类:一是基于估计等位基因效应来预测基因组估计育种值(GEBV), 如最小二乘法, 随机回归-最佳线性无偏预测(RR-BLUP)、Bayes 、主成分分析等方法; 二是基于遗传关系矩阵来预测GEBV, 通过采用高通量标记构建个体间的遗传关系矩阵, 然后用线性混合模型来预测育种值, 即GBLUP 法, 并以这两种分类简要介绍了基因组选择各种方法的大致原理。影响基因组选择准确性的因素主要有标记类型和密度、单倍型长度、参考群体大小和标记-数量性状基因座(QTL)连锁不平衡(LD)大小等; 在基因组选择的各种方法中, 一般说来Bayes 方法和GBLUP 方法具有较高的准确性, 最小二乘法最差; GBLUP 计算速度快, 能够将标记和系谱结合起来, 因而比其他方法更具优势。尽管基因组选择取得了很大进展, 但在理论方面还面临着一些挑战, 如联合育种、长期选择的遗传进展及如何解析与性状有关和无关的标记等。基因组选择在一些动植物育种上已经开始应用, 在人类遗传倾向预测和进化动力学研究中也有潜在的应用前景。基因组选择在个体间亲缘关系的量化上有了突破, 比传统方法更加精确, 因此, 基因组选择将会是动植物育种史上革命性的事件。

关键词: 基因组选择; 高通量遗传标记; 育种值估计

Genomic selection and its application

LI Heng-De 1, BAO Zhen-Min 2, SUN Xiao-Wen 1,3

1. The Centre for Applied Aquatic Genomics , Chinese Academy of Fishery Sciences , Beijing 100141, China ;

2. College of Marine Life Sciences, Ocean University of China , Qingdao 266003, China ;

3. Heilongjiang River Fishery Research Institute , Chinese Academy of Fishery Sciences , Harbin 150001, China

Abstract: Selective breeding is very important in agricultural production and breeding value estimation is the core of selective breeding. With the development of genetic markers, especially high throughput genotyping technology, it becomes available to estimate breeding value at genome level, i.e. genomic selection (GS). In this review, the methods of GS was categorized into two groups: one is to predict genomic estimated breeding value (GEBV) based on the allele effect, such as

第12期李恒德等:基因组选择及其应用 1309

least squares, random regression - best linear unbiased prediction (RR-BLUP), Bayes and principle component analysis, etc;

the other is to predict GEBV with genetic relationship matrix, which constructs genetic relationship matrix via high throughput genetic markers and then predicts GEBV through linear mixed model, i.e. GBLUP. The basic principles of these methods were also introduced according to the above two classifications. Factors affecting GS accuracy include markers of

type and density, length of haplotype, the size of reference population, the extent between marker-QTL and so on. Among

the methods of GS, Bayes and GBLUP are usually more accurate than the others and least squares is the worst. GBLUP is

time-efficient and can combine pedigree with genotypic information, hence it is superior to other methods. Although pro-

gress was made in GS, there are still some challenges, for examples, united breeding, long-term genetic gain with GS, and disentangling markers with and without contribution to the traits. GS has been applied in animal and plant breeding practice

and also has the potential to predict genetic predisposition in humans and study evolutionary dynamics. GS, which is more precise than the traditional method, is a breakthrough at measuring genetic relationship. Therefore, GS will be a revolution-

ary event in the history of animal and plant breeding.

Keywords:genomic selection; high throughput genetic marker; breeding value estimation

在农业生物(作物、畜禽和水产生物)的产业链中, 品种培育占有十分重要的地位。20世纪70年代, 美国前国务卿基辛格曾说过:“谁控制了石油, 谁就控制了所有国家; 谁控制了粮食, 谁就控制了所有的人”。世界上与农业生产有关的著名公司, 如泰国正大集团、美国孟山都公司、瑞士先正达公司等之所以能够影响全球某个产业就是因为这些公司有优秀的品种出售, 占有着全球市场的最大份额。所以毫不夸张地讲“农业生产中, 谁控制了品种, 谁就控制了产业”。

通过选择进行品种(系)培育是进行育种的重要手段, 选择育种的核心是育种值估计, 即选择依据。传统的育种值估计方法是从Hazel的选择指数法[1]到Henderson提出的基于性状和系谱的最佳线性无偏预测(Best linear unbiased prediction, BLUP)[2] , 记为TP-BLUP, TP- BLUP法通过系谱构建分子亲缘相关矩阵(Numerator relationship matrix)(通常记为A)将个体间的遗传联系用矩阵形式表示出来, 利用线性混合模型(Linear mixed model)计算个体的估计育种值(Estimated breeding value, EBV)。这一方法已经得到广泛应用, 并为动植物的遗传改良做出了重大贡献。

随着微卫星(Microsatellite)、单核苷酸多态(Single nucleotide polymorphisms, SNP)等遗传标记的发现, 将遗传标记与表型信息关联起来, 通过连锁分析找到与性状有关的标记或数量性状基因座(Quantitative trait loci, QTL), 与TP-BLUP结合起来进行遗传评定, 这样不仅可以提高育种值估计的精确性, 而且可以在能够获得DNA时进行早期选择, 缩短世代间隔, 提高遗传进展, 即标记辅助选择(Marker assisted selection, MAS)[3,4]。标记辅助选择中育种值估计的准确性随所用标记数目的增加而增高。

农业动植物基因组信息的公布和高通量基因型分型技术的实用化, 使得我们可以得到高通量标记如SNP, 通过整个基因组SNP信息估计出单个SNP或者不同染色体片段的效应值, 然后再将这些效应值相加最终得到个体全基因组估计育种值(Genomic estimated breeding value, GEBV), 由于同时利用这些高通量的SNP标记来进行育种值估计, 大大提高了育种值估计的准确性, 即基因组选择(Genomic selection)[5]。研究表明应用基因组选择可以节省大量成本, 成倍提高遗传进展[6]。目前农业生物中已经开展了基因组选择研究[7~9]。

基因组选择实质上是全基因组水平的标记辅助选择, 从育种值估计的思路上大致分为两种:一是通过参考群体(Reference population)估计出每个SNP 等位基因或者不同染色体片段的效应值, 然后利用这些效应值来计算候选群体(Candidate population)的GEBV。可以看出以参考群体估计标记效应计算GEBV的方法只能够对具有基因型的个体估计GEBV, 目前在大的育种群体中往往很难对全部或大部个体做到基因型检测, 另外参考群体和育种群体的遗传结构也不尽相同, 随着选育进展差别会越来越大, 所以需经常构建参考群体并进行标记效应

1310 HEREDITAS

(Beijing)2011第33卷

测定加以校正, 同时这种方法也不能利用长期育种过程中积累的丰富翔实的系谱和育种记录。二是通过已测定的基因型计算个体间的相关关系, 利用已测定基因型的个体计算的G矩阵和根据系谱计算的A矩阵合并成一个矩阵(记为H), 采用类似TP- BLUP方法进行育种值估计的方法, 以提高基因组选择的准确性, 这种基于遗传关系矩阵估计GEBV 的方法可以将系谱和基因型信息结合起来, 充分利用育种过程中积累的资料。

1 基于估计等位基因效应的基因组选择方法

基于估计等位基因效应的主要方法有最小二乘法(Least squares)[5]、随机回归BLUP法(Random re-gression BLUP, RR-BLUP)[5]、主成分分析法(Principal component analysis)[10,11]和Bayes法[5,12~14]等。

高通量的遗传标记数目往往多于用于基因型测定的个体数目, 难以直接采用多元回归的方法同时估计每个单倍型(Haplotype)或等位基因(Allele)的效应, 因为误差自由度将耗尽, 所以通常的做法是, 先对单个染色体片段或标记进行回归分析, 将对数似然值比(Log-likelihood ratio)依每个片段或标记进行作图, 根据合适的阈值, 确定哪些片段或标记对性状有影响, 然后用多元回归估计这些片段或标记的效应, 将个体每个基因型相应的效应相加就是其估计育种值, 这种方法即最小二乘法。其实质上就是先通过全基因组关联分析(Genome-wide associa-tion studies, GWAS)[15]筛选与性状有关的染色体片段或标记, 然后同时估计这些片段或标记的效应, 计算个体育种值。RR-BLUP方法则将染色体片段或标记的效应是作为随机效应处理, 用线性混合模型估计其效应, 每个个体相应染色体片段或标记效应的和即为其估计育种值[5]。主成分分析法则是将基因型编码, 两种纯合基因型分别编码为1和-1, 杂合基因型编码为0, 然后对所有标记所构成的矩阵进行标准化处理; 对矩阵进行分解获得特征根最大的若干主成分; 将这些主成分得分与表型建立回归关系, 求解每个基因型的效应; 根据这些基因型效应估计个体的育种值[10,16]。Bayes方法结合了标记(或染色体片段)效应方差的先验分布(Prior distribution)和数据资料两方面的信息, 这些效应方差的先验分布和后验分布(Posterior distribution)均为逆卡方分布(Inverted chi-square distribution), 采用Gibbs抽样方法进行上万次的循环, 去掉burn in阶段的循环后, 将其它循环的样本取均值作为这些效应的估计值。目前常用的Bayes方法主要是BayesA和BayesB[5], 主要的区别是BayesA允许不同标记有不同的方差且服从一定的分布, 而BayesB允许一些标记的方差为零。

2基于遗传关系矩阵的基因组选择方法

基因组选择的另一种思路是通过已测定的基因型计算个体间的相关关系, 记为G矩阵, 从而按照TP-BLUP的思路用G矩阵代替TP-BLUP中的A矩阵来估计育种值, 即GBLUP法[17]。

VanRaden[17]提出了G矩阵的构建方法, 将SNP 标记进行编码, 纯合基因型分别编码为1和-1, 杂合基因型为0, 令p i为位点i的第二个等位基因的频率, 则每个基因型编码后的值减去相应的处于哈代-温伯平衡(Hardy-Weinberg Equilibrium)时的均值2(p i?0.5), 得到Z矩阵, 则可以计算得, 这样G矩阵与分子血缘矩阵A类似。

'/(2(1))

i i

G ZZ p p

=?

可以看出GBLUP和这些以参考群体估计标记效应然后计算GEBV的方法只能够对具有基因型的个体估计GEBV。而大多数育种群体具有丰富翔实的系谱和育种记录, 在大的育种群体中由于经费、人力、时间等因素的限制, 难以对全部个体进行基因型测定, 一些有育种记录但死亡的个体也无法再进行基因型测定。如果能将这些资料和基因型测定的个体等信息结合起来, 将利用已测定基因型的个体计算的G矩阵和根据系谱计算的A矩阵合并成一个矩阵(记为H), 采用类似TP-BLUP方法进行育种值估计[18,19], 无疑会提高基因组选择的准确性, 在育种实践上也具有重要的应用价值。

利用H矩阵采用TP-BLUP方法进行育种值估计是GBLUP方法的推广。在一个大的育种资料中, 可以根据系谱建立分子血缘矩阵A, 这是进行TP-BLUP育种值估计的基础。对于已经测定基因型的个体, 可以计算由这些个体组成的G矩阵, 然后将G矩阵中的元素替换A矩阵中相对应的元素, 从而形成矩阵A g, A g是比A更为准确的对个体间相关关系的衡量。对于一些未经基因型测定的后代, 可以通过已经测定基因型的个体, 根据系谱对这些后代

第12期李恒德等:基因组选择及其应用 1311

的相关关系进行修正, 进而得到矩阵A p, A p比A g更为合理, 因为所有对公畜进行育种估计的绝大多数信息是包含在后代中的, 而不是祖先。A p还可以根据整个系谱对祖先之间的相关关系进行修正, 进而得到矩阵H, H矩阵是由已经测定基因型的个体对整个A矩阵中的未经基因型测定的个体与其他个体之间相关关系的修正[18]。传统的利用线性混合模型进行育种值估计需要H矩阵的逆阵, 由于H矩阵是G矩阵与系谱结合而成, 对大的系谱来说H矩阵的求逆将变的困难, Misztal等[19]详尽描述了利用如何利用H矩阵进行遗传估计的计算过程。

3影响基因组选择的因素

影响基因组选择的因素有很多, 如标记类型和密度、单倍型长度、参考群体大小和标记-QTL连锁不平衡(Linkage disequilibrium, LD)大小等。不同类型的标记具有不同的多态信息含量(Polymorphism information content, PIC), 一定长度基因组上标记的多少也直接影响遗传标记所能提供的总信息量, 同时标记数量越多, 越容易得到与QTL连锁不平衡的标记。基因组选择的准确性随标记密度的增加而增加, 微卫星标记密度从0.25Ne/morgan(Ne为群体有效大小, effective population size)增加到2Ne/morgan 可使选择的准确性从0.63提高到0.83; SNP标记密度从1Ne/morgan增加到8Ne/morgan, 可使选择的准确性从0.69提高到0.86。要达到相似准确性所需的SNP标记数量大约是微卫星标记的2~3倍[12]。

在一定的标记密度下, 由于标记间的距离和群体中LD的大小, 采用不同数目标记构成的单倍型进行基因组选择得到的准确性会有差异, Claus等[21]模拟了标记密度约10Ne/morgan时单倍型长度对基因组选择的准确性的影响, 发现当采用10个SNP标记作为单倍型时在各种标记密度下均可获得最高的准确性。Villumsen等[14]在标记密度10Ne/morgan时模拟了不同遗传力条件下单倍型长度对基因组选择准确性的影响, 同样得到采用10个SNP标记作为单倍型时育种估计的可靠性最高。

具有记录数的个体和进行基因型测定的个体数越多, 基因组选择的准确性越高[5], 因为参考群体的扩大可以使单倍型或等位基因效应估计的准确性提高; 有时尽管有的个体没有基因型测定记录, 但可以由系谱, 通过上下代之间的关系推断出一些个体的基因型, 进而还可以通过已推断出基因的个体推出其它一些个体的基因型, 将这些个体包括进参考群体也可以提高参考群体的数量, 进而提高基因组选择的准确性。将未经基因型测定的个体包含在参考群体内有助于提高低遗传力性状的育种值估计准确性, 提高程度与预测基因型的准确度有关[22]。

标记-QTL间的LD可以增加基因组选择的准确性[23], 随着世代的增加, 标记-QTL间的LD会逐渐降低, 进而引起基因组选择准确性的降低, 因此标记或单倍型效应经过若干世代就需要重新估计。Meuwissen等[5]发现在基因型测定后的前两个世代基因组选择的准确性下降较快, 约为5%, 其他世代则下降速度减慢。遗传力较高的性状随世代增加其基因组选择的准确性降低较慢[14]。要想保证基因组选择较高的准确性, 每隔2~3个世代需要对标记或单倍型效应进行重新估计[5]。不同交配设计也会显著影响标记-QTL之间的LD在每个世代的下降程度, 进而影响基因组选择的准确性[24]。

基因组选择的准确性也受性状的影响, 不同性状采用同样的方法其准确性会有差异[11], 这主要是因为不同性状的遗传力不同所造成的; 同一性状在不同环境条件下, 估计的标记效应不同, 显示基因型和环境的互作是遗传变异的重要组分[11]。基因组选择很适合于世代间隔较长、繁殖力较低的物种, 如奶牛[6], 由于不同物种的世代间隔和繁殖力不同, 因而基因组选择在不同物种中效果可能会有差异。

4各种方法的比较

模拟研究发现在最小二乘法、RR-BLUP和Bayes 方法中, 最小二乘法估计的准确性最低, 而Bayes方法估计的准确性最高, 其中BayesB估计的准确性要优于BayesA, 而RR-BLUP估计的准确性要略低于BayesA[5,20]。从真实育种值对估计育种值的回归系数b来看, BayesB比BLUP和BayesA更接近1, 尽管BayesA的准确性略高于RR-BLUP, 但RR-BLUP比BayesA的b值更接近1[5]; Lund等[20]发现真实育种值对由RR-BLUP方法得到的GEBV的b值有时会比BayesB更接近1。从计算的角度看, RR-BLUP法比Bayes方法更具吸引力, 而降低的效率却很少。

Zhong等[24]用多个大麦近交系的基因型进行了

1312 HEREDITAS

(Beijing)2011第33卷

交配设计的模拟, 发现基因组选择各种方法的准确性受不同模拟条件的影响, 当QTL数目增加或性状的遗传力较高时, RR-BLUP法的准确性变得更高; 大多数情况下, GBLUP比直接估计标记效应的方法更准确; 当标记与大效应的QTL与标记存在强的连锁不平衡时, RR-BLUP方法的准确性最低。模型中包括标记信息要比TP-BLUP具有更高的准确性[11]。

当标记-QTL间没有LD存在时, TP-BLUP具有最高的准确性, RR-BLUP法准确性接近于TP-BLUP, 其次是BayesB, 最小二乘法最差[23]; 当标记-QTL间有LD存在时, BayesB和RR-BLUP的准确性最好, 随着在世代数增加LD下降时, BayesB优于RR-BLUP和最小二乘法[23]。尽管标记密度对基因组选择的准确性有影响, 但对各种方法相对好坏影响不大[24]。

从计算速度来讲, 基于等位基因效应的育种值估计的方法有一些比较快, 如主成分分析法, 但比较常用的Bayes方法来讲则速度较慢。由于这些方法只能对已经基因型测定的个体进行育种值估计, 无法利用过去的只有系谱而没有基因型测定的个体资料, 而这一部分资料具有更多的记录信息。相比较而言, GBLUP方法与TP-BLUP方法类似, 直观明了, 更重要的是可以利用任何时候的系谱信息, 然后将系谱资料与G矩阵结合起来, 充分利用了育种资料所能提供的信息; 由于GBLUP与TP-BLUP类似, 只是提供给线性混合模型的矩阵元素上的差异, 因而在计算速度上更具有优势。基因组选择的这两种思路在育种值估计的准确性上几乎没有差别[7,20], 因此, 相对而言GBLUP更具优势。

由于GBLUP法相对于Bayes等其他方法, 可以更好地充分利用系谱信息, 不仅是系谱和基因型数据的完美融合, 也是TP-BLUP方法在基因组时代的拓展, 因而引起了育种者的极大兴趣, 成为近几年来的研究热点。

5 基因组选择面临的挑战

尽管基因组选择从提出到现在已经10年, 而且实践中也发现比传统的遗传评估方式要具有更高的准确性, 但目前仍然存在着一些挑战, 如联合育种、品种间的基因组选择、长期进行基因组选择的准确性问题、如何区分与性状有关的标记和用于追踪个体间遗传关系的标记等问题。

进行联合育种时最主要的困难是测定基因型的个体数目相对于育种数据库中个体的数目要小很多, 虽然对于已经测定基因型的个体间可以准确地估计出他们的遗传关系, 但是这些信息在整个育种资料中所占的比重可能是有限的。Goddard和Hayes[46]指出最现实的办法就是采用选择指数将用系谱资料估计得到的EBV和用遗传标记估计得到的GEBV进行加权。另一种办法是根据系谱和已经测定基因型的个体推断未经测定基因型的个体的基因型, 这样可以避免不同育种群体使用不同遗传标记进行基因型测定所带来的问题, 推断基因型也可以使得具有基因型个体的数目增加, 更能准确衡量个体间的遗传关系, 这个策略很诱人但在计算上是个很大的挑战[46]。

长期进行基因组选择的遗传进展可能比表型选择和基于系谱选择的遗传进展小[47,48,9], 除非不断地加入新的遗传标记来预测育种值。可能的原因是GEBV是根据与QTL处于连锁不平衡的标记来估计的, 如果不是完全连锁, 固定标记并不能固定QTL, 因此标记固定后, 基因组选择将不能捕获部分QTL 方差[47]; 表型选择是同时利用所有的QTL, 基因组选择只利用了能够检测到的QTL[48]。Muir[47]建议将多基因组分包含进GEBV中, Goddard[48]和Jannink[9]提出采用加权的基因组选择方法, 对有利等位基因频率较低的标记给予较大的权重, 防止低频率有利等位基因的丢失, 以便维持遗传方差, 使得长期的遗传进展最大化。

基因组选择在构建G矩阵时通常使用全部的遗传标记, 其中有些标记与QTL处于连锁不平衡, 因而这些标记可以用来估计GEBV; 但是其他更多的标记可能与QTL并不处于连锁不平衡, 由于这些标记可以描述个体间的部分遗传关系, 因而可以估计到这些标记的效应。可能的解决方案是在模型中通过拟合多基因效应去除这些与QTL并不处于连锁不平衡的标记的影响, 或者采用多个世代的个体做参考群体可以使GEBV的准确性维持更多世代[47], 也可以采用多个品种的个体做参考群体, 因为如果一个标记在各个品种中均与性状有关, 则这个标记与相应的QTL可能非常接近[49]。Zhang等[50]在构建G矩阵时采用方差对各个标记进行加权, 避免了与性状无关的标记参与G矩阵的构建, 但对于各个标记效应方差的估计仍然采用Bayes方法进行, 在计算上仍

第12期李恒德等:基因组选择及其应用 1313

然不划算, 也没有彻底将与性状有关和无关的标记分离开来。

基因组选择依赖于候选群体与参考群体中标记与QTL处于相同的连锁相, 不同品种由于选择或进化的原因, 标记与QTL的连锁相可能不同[51], 使用多个品种的个体作为参考群体可以显著提高GEBV 估计的准确性[49,51]。各个品种在参考群体中的组成仍然是需要研究的内容。在估计GEBV时只考虑了加性效应, 上位效应(Epistasis)对模型中每个方差组分有中要影响[52], 如果模型中考虑非加性效应不仅可以增加GEBV估计的准确性, 也增加了表型值预测的准确性, 这对于制定选配方案有重要作用。Hu等[53]利用80个标记对126个大豆重组近交系的研究表明, 模型中考虑上位效应预测表型值能力由单纯的加性模型的0.33提高到了0.78。Gianola等[54]提出了基因组选择的半参数方法, 可以估计数十万个标记间的互作。

目前高密度标记的基因型测定成本依然很高, 对一些物种来讲, 因其分布范围的局限或繁殖力低等原因, 开发高密度的遗传标记从经济上来说更不可行, 使用低密度标记比高密度标记可能更为现实, 因此采用低密度标记进行基因组选择可以降低基因型测定的成本。相对于高密度标记, 采用均匀分布的低密度标记引起基因组选择的准确性下降程度几乎不受QTL数目和方法的影响, 当选择与表型关联的低密度标记时, 则随QTL数目的增多, 基因组选择准确性下降越大[55]。当选择相同数目的低密度标记时, 采用与表型关联的低密度标记并采用Bayes方法可以将准确性的损失降到最低[55]。

此外, 目前的基因组选择研究仅局限于采用微卫星或SNP标记来估计GEBV, 对于其它一些可以引起遗传变异的因素还没有考虑, 如拷贝数变异(Copy number variation, CNV)和甲基化等, 考虑这些变异或许能够找回一些缺失的遗传力(Missing heritability)[30]。高通量的SNP芯片检测技术可以用来估计CNV[56], 因此, 采用高通量SNP检测技术, 将CNV等其它标记引入基因组选择模型不仅是可行的, 而且可能是必要的。6基因组选择的应用

基因组选择的最早应用实例是由荷兰Euribrid 公司在2006年底开始的鸡的基因组选择(http://www. https://www.doczj.com/doc/e410984307.html,/news/euribrid-makes-use-of-genomic- selection-883.html), 采用20000个SNP标记的芯片对育种群进行基因型测定, 然后进行育种值估计。加拿大、德国、美国、新西兰、以色列、法国、爱尔兰、西班牙、澳大利亚、奥地利、波兰和丹麦等国也陆续开始了牛和猪的基因组选择研究。日本和墨西哥也开始了水稻和玉米的基因组选择研究。美国、新西兰和澳大利亚采用GBLUP方法估计的可靠性和较复杂的方法相比几乎一样高, 可靠性的增加使得一些育种公司已经开始商业运作, 这些公司的遗传进展至少提高了一倍[7]。Su等[25]对3 330头丹麦荷斯坦公牛18个性状的GEBV与EBV进行了比较, 发现18个性状的GEBV可靠性平均比EVB高出0.13。Chen等[26]对两个肉鸡品系共348 030只鸡采用GBLUP方法进行了育种值估计, 发现对高遗传力性状一步法GBLUP(one-step GBLUP)和BayesA方法的估计育种值准确性相似, 比传统的TP-BLUP方法提高50%; 对低遗传力性状, GBLUP要比BayesA好4~6倍, 比TP-BLUP好50%。Crossa等[11]对玉米和小麦的研究表明, 由于标记的引入, 基因组选择比TP-BLUP预测能力提高7.7~35.7%。Long等[27]利用先筛选相关标记然后用Bayes方法对肉鸡死亡率的分类准确性可以提高至90%。

利用全基因组标记在人类遗传倾向(Genetic predisposition)中也有潜在的应用前景[28]。在复杂性状的GWAS中, 与性状相关的标记只能解释部分遗传方差[29,30], 未能解释的部分称为缺失的遗传力(Missing heritability)。例如, 人类身高的遗传力高达约0.8[31,32], GWAS检测到的50个与身高有关的标记仅能解释总表型方差的约5%[33~36], 当借用GBLUP 的思路, 同时采用全部标记时, 解释表型方差的比例可以达到约45%, 通过对最小等位基因频率(Minor allele frequency)和LD的校正, 这一比例还会提高[37]。同样的方法也被应用于阈性状, 如Crohn 病、躁郁症(Bipolar disorder)和I型糖尿病(type I diabetes)缺失遗传力的估计[38]。

生物进化过程的衡量难度和其生态动力学

1314 HEREDITAS

(Beijing)2011第33卷

(Ecological dynamics)的遗传基础是研究基因如何影响表型、适应和群体动力学的主要困难, 由动物育种所借鉴来的遗传方差-协方差矩阵(Genetic vari-ance-covariance matrix)为进化学家研究宏观进化(Macroevolution)[39~41]提供了方便。近年来, 以混合线性模型和遗传方差-协方差矩阵为主的传统数量遗传学方法已经在研究现实生态条件下进化动力学的复杂性和限制性方面开始应用[42~44], 为进化生态学的研究带来了新的启示[45]。由于GBLUP法相对于传统TP-BLUP法的优势, 相信在不久的时间内会被进化学家所借鉴, 从而为进化生态学带来新的活力。

基因组选择的模拟研究结果十分诱人, 但我们必须看到, 基因组选择在理论上还有不完善的地方需要突破; 无可否认, 基因组选择在传统选择理论的基础上, 结合了全基因组水平的信息, 在量化个体间遗传关系方面有了突破, 由高通量的遗传标记取代了传统的系谱, 遗传关系的描述更加精确。因此, 基因组选择将成为育种史上革命性的事件。

参考文献(References):

[1] Hazel LN. The genetic basis for constructing selection in-

dexes. Genetics, 1943, 28(6): 476–490. DOI

[2] Hendersen CR. Best linear unbiased estimation and pre-

diction under a selection model. Biometrics, 1975, 31(2): 423–447. DOI

[3] Fernando RL, Grossman M. Marker assisted selection us-

ing best linear unbiased prediction. Genet Sel Evol, 1989, 21(4): 467–477. DOI

[4] Lander ES, Botstein D. Mapping mendelian factors un-

derlying quantitative traits using RFLP linkage maps. Ge-

netics, 1989, 121(1): 185–199. DOI

[5] Meuwissen TH, Hayes BJ, Goddard ME. Prediction of to-

tal genetic value using genome-wide dense marker maps.

Genetics, 2001, 157(4): 1819–1829. DOI

[6] Schaeffer LR. Strategy for applying genome-wide selec-

tion in dairy cattle. J Anim Breed Genet, 2006, 123(4): 218–223. DOI

[7] Hayes BJ, Bowman PJ, Chamberlain AJ, Goddard ME.

Invited review: Genomic selection in dairy cattle: progress and challenges. J Dairy Sci, 2009, 92(2): 433–443. DOI [8] Sonesson AK, Meuwissen TH. Testing strategies for ge-

nomic selection in aquaculture breeding programs. Genet Sel Evol, 2009, 41: 37. DOI

[9] Jannink JL. Dynamics of long-term genomic selection.

Genet Sel Evol, 2010, 42(1): 35. DOI [10] Solberg TR, Sonesson AK, Woolliams JA, Meuwissen

THE. Reducing dimensionality for prediction of genome- wide breeding values. Genet Sel Evol, 2009, 41(1): 29.

DOI

[11] Crossa J, de los Campos G, Pérez P, Gianola D, Burgueno

J, Araus JL, Makumbi D, Singh RP, Dreisigacker S, Yan JB, Arief V, Banziger M, Braun HJ. Prediction of genetic values of quantitative traits in plant breeding using pedi-

gree and molecular markers. Genetics, 2010, 186(2): 713–

724. DOI

[12] Solberg TR, Sonesson AK, Woolliams JA, Meuwissen

THE. Genomic selection using different marker types and densities. J Anim Sci, 2008, 86(10): 2447–2454. DOI

[13] Meuwissen THE, Solberg TR, Shepherd R, Woolliams JA.

A fast algorithm for Bayes

B type of prediction of ge-

nome-wide estimates of genetic value. Genet Sel Evol,

2009, 41: 2. DOI

[14] Villumsen TM, Janss L, Lund MS. The importance of

haplotype length and heritability using genomic selection in dairy cattle. J Anim Breed Genet, 2009, 126(1): 3–13.

DOI

[15] Wang WYS, Barratt BJ, Clayton DG, Todd JA. Ge-

nome-wide association studies: theoretical and practical concerns. Nat Rev Genet, 2005, 6(2): 109–118. DOI

[16] Long N, Gianola D, Rosa GJM, Weigel KA. Dimension

reduction and variable selection for genomic selection: application to predicting milk yield in Holsteins. J Anim Breed Genet, 2011, 128(4): 247–257. DOI

[17] VanRaden PM. Efficient methods to compute genomic

predictions. J Dairy Sci, 2008, 91(11): 4414–4423. DOI [18] Legarra A, Aguilar I, Misztal I. A relationship matrix in-

cluding full pedigree and genomic information. J Dairy Sci, 2009, 92(9): 4656–4663. DOI

[19] Misztal I, Legarra A, Aguilar I. Computing procedures for

genetic evaluation including phenotypic, full pedigree, and

genomic information. J Dairy Sci, 2009, 92(9): 4648–4655.

DOI

[20] Lund MS, Sahana G, de Koning DJ, Su G S, Carlborg ?.

Comparison of analyses of the QTLMAS XII common dataset. I: Genomic selection. BMC Proc, 2009, 3(Suppl. 1):

S1. DOI

[21] Calus MPL, Meuwissen THE, de Roos APW, Veerkamp

RF. Accuracy of genomic selection using different meth-

ods to define haplotypes. Genetics, 2008, 178(1): 553–561.

DOI

[22] Pszczola MJ, Mulder HA, Calus MPL. The Accuracy of

genomic selection using(un)genotyped animals to enlarge the reference population. paper presented at 9th world congress on genetics applied to livestock production.

Leipzig, Germany, 2010 August. DOI

第12期李恒德等:基因组选择及其应用 1315

[23] Habier D, Fernando RL, Dekkers JCM. The impact of ge-

netic relationship information on genome-assisted breed-

ing values. Genetics, 2007, 177(4): 2389–2397. DOI

[24] Zhong SQ, Dekkers JCM, Fernando RL, Jannink JL. Fac-

tors affecting accuracy from genomic selection in popula-

tions derived from multiple inbred lines: a barley case

study. Genetics, 2009, 182(1): 355–364. DOI

[25] Su G, Guldbrandtsen B, Gregersen VR, Lund MS. Pre-

liminary investigation on reliability of genomic estimated

breeding values in the Danish Holstein population. J Dairy

Sci, 2010, 93(3): 1175–1183. DOI

[26] Chen CY, Misztal I, Aguilar I, Tsuruta S, Meuwissen THE,

Aggrey SE, Wing T, Muir WM. Genome-wide marker- assisted selection combining all pedigree phenotypic in-

formation with genotypic data in one step: an example

using broiler chickens. J Anim Sci, 2011, 89(1): 23–28.

DOI

[27] Long N, Gianola D, Rosa GJM, Weigel KA, Avenda?o S.

Machine learning classification procedure for selecting

SNPs in genomic selection: application to early mortality

in broilers. J Anim Breed Genet, 2007, 124(6): 377–389.

DOI

[28] de los Campos G, Gianola D, Allison DB. Predicting ge-

netic predisposition in humans: the promise of whole- genome markers. Nat Rev Genet, 11(12): 880–886. DOI [29] Maher B. Personal genomes: The case of the missing

heritability. Nature, 2008, 456(7218): 18–21. DOI

[30] Manolio TA, Collins FS, Cox NJ, Goldstein DB, Hindorff

LA, Hunter DJ, McCarthy MI, Ramos EM, Cardon LR,

Chakravarti A, Cho JH, Guttmacher AE, Kong A, Kruglyak L, Mardis E, Rotimi CN, Slatkin M, Valle D,

Whittemore AS, Boehnke M, Clark AG, Eichler EE, Gib-

son G, Haines JL, Mackay TFC, McCarroll SA, Visscher

PM. Finding the missing heritability of complex diseases.

Nature, 2009, 461(7265): 747–753. DOI

[31] Silventoinen K, Sammalisto S, Perola M, Boomsma DI,

Cornes BK, Davis C, Dunkel L, De Lange M, Harris JR,

Hjelmborg JVB, Luciano M, Martin NG, Mortensen J,

Nisticò L, Pedersen NL, Skytthe A, Spector TD, Stazi MA,

Willemsen G, Kaprio J. Heritability of adult body height: a

comparative study of twin cohorts in eight countries. Twin

Res, 2003, 6(5): 399–408. DOI

[32] Macgregor S, Cornes BK, Martin NG, Visscher PM. Bias,

precision and heritability of self-reported and clinically

measured height in Australian twins. Hum Genet, 2006,

120(4): 571–580. DOI

[33] Gudbjartsson DF, Walters GB, Thorleifsson G, Stefansson

H, Halldorsson BV, Zusmanovich P, Sulem P, Thorlacius S,

Gylfason A, Steinberg S, Helgadottir A, Ingason A, Stein-

thorsdottir V, Olafsdottir EJ, Olafsdottir GH, Jonsson T,

Borch-Johnsen K, Hansen T, Andersen G, Jorgensen T,

Pedersen O, Aben KK, Witjes JA, Swinkels DW, den Hei-

jer M, Franke B, Verbeek AL, Becker DM, Yanek LR,

Becker LC, Tryggvadottir L, Rafnar T, Gulcher J, Kieme-

ney LA, Kong A, Thorsteinsdottir U, Stefansson K. Many

sequence variants affecting diversity of adult human height. Nat Genet, 2008, 40(5): 609–615. DOI

[34] Lettre G, Jackson AU, Gieger C, Schumacher FR, Berndt

SI, Sanna S, Eyheramendy S, Voight BF, Butler JL, Guiducci C, Illig T, Hackett R, Heid IM, Jacobs KB, Lyssenko V, Uda M, Diabetes Genetics Initiative;

FUSION; KORA; Prostate, Lung Colorectal and Ovarian

Cancer Screening Trial; Nurses' Health Study; SardiNIA,

Boehnke M, Chanock SJ, Groop LC, Hu FB, Isomaa B,

Kraft P, Peltonen L, Salomaa V, Schlessinger D, Hunter DJ,

Hayes RB, Abecasis GR, Wichmann HE, Mohlke KL, Hirschhorn JN. Identification of ten loci associated with

height highlights new biological pathways in human growth. Nat Genet, 2008, 40(5): 584–591. DOI

[35] Melzer D, Perry JR, Hernandez D, Corsi AM, Stevens K,

Rafferty I, Lauretani F, Murray A, Gibbs JR, Paolisso G,

Rafiq S, Simon-Sanchez J, Lango H, Scholz S, Weedon

MN, Arepalli S, Rice N, Washecka N, Hurst A, Britton A,

Henley W, van de Leemput J, Li R, Newman AB, Tranah G, Harris T, Panicker V, Dayan C, Bennett A, McCarthy MI,

Ruokonen A, Jarvelin MR, Guralnik J, Bandinelli S, Fray-

ling TM, Singleton A, Ferrucci L. A genome-wide asso-

ciation study identifies protein quantitative trait loci (pQTLs). PLoS Genet, 2008, 4(5): e1000072. DOI

[36] Visscher PM. Sizing up human height variation. Nat Genet,

2008, 40(5): 489–490. DOI

[37] Yang J, Benyamin B, McEvoy BP, Gordon S, Henders AK,

Nyholt DR, Madden PA, Heath AC, Martin NG, Mont-

gomery GW, Goddard ME, Visscher PM. Common SNPs

explain a large proportion of the heritability for human

height. Nat Genet, 42(7): 565–569. DOI

[38] Lee SH, Wray NR, Goddard ME, Visscher PM. Estimating

missing heritability for disease from genome-wide asso-

ciation studies. Am J Hum Genet, 2011, 88(3): 294–305.

DOI

[39] Shaw FH, Shaw RG, Wilkinson GS, Turelli M. Changes in

genetic variances and covariances: G whiz! Evolution,

1995, 49(6): 1260–1267. DOI

[40] Paulsen SM. Quantitative genetics of the wing color pat-

tern in the buckeye butterfly(Precis coenia and Precis evarete): evidence against the constancy of G. Evolution,

1996, 50(4): 1585–1597. DOI

[41] Steppan SJ, Phillips PC, Houle D. Comparative quantita-

tive genetics: evolution of the G matrix. Trends Ecol Evol,

2002, 17(7): 320–327. DOI

1316 HEREDITAS

(Beijing)2011第33卷

[42] Kruuk LEB. Estimating genetic parameters in natural

populations using the "animal model". Philos Trans R Soc

Lond B Biol Sci, 2004, 359(1446): 873–890. DOI

[43] Ellegren H, Sheldon BC. Genetic basis of fitness differences

in natural populations. Nature, 2008, 452(7184): 169–175.

DOI

[44] Kruuk LEB, Slate J, Wilson AJ. New answers for old

questions: the evolutionary quantitative genetics of wild

animal populations. Annu Rev Ecol Evol Syat, 2008, 39(1):

525–548. DOI

[45] Wilson AJ, Réale D, Clements MN, Morrissey MM,

Postma E, Walling CA, Kruuk LEB, Nussey DH. An ecologist's guide to the animal model. J Anim Ecol, 79(1):

13–26. DOI

[46] Goddard ME, Hayes BJ. Genomic selection. J Anim Breed

Genet, 2007, 124(6): 323–330. DOI

[47] Muir WM. Comparison of genomic and traditional

BLUP-estimated breeding value accuracy and selection response under alternative trait and genomic parameters. J

Anim Breed Genet, 2007, 124(6): 342–355. DOI

[48] Goddard M. Genomic selection: prediction of accuracy

and maximisation of long term response. Genetica, 2009,

136(2): 245–257. DOI

[49] De Roos APW, Hayes BJ, Spelman RJ, Goddard ME.

Linkage disequilibrium and persistence of phase in Hol-

stein-Friesian, Jersey and Angus cattle. Genetics, 2008,

179(3): 1503–1512. DOI

[50] Zhang Z, Liu J, Ding X, Bijma P, de Koning DJ, Zhang Q.

Best linear unbiased prediction of genomic breeding val-

ues using a trait-specific marker-derived relationship ma-

trix. PLoS One, 2010, 5(9): e12648 DOI

[51] Harris BL, Johnson DL, Spelman RJ. Genomic selection

in New Zealand and the implications for national genetic evaluation. paper presented at Proc Interbull meeting. Ni-

agara falls, Canada, 2008. DOI

[52] Cheverud JM, Routman EJ. Epistasis and its contribution

to genetic variance components. Genetics, 1995, 139(3): 1455–1461. DOI

[53] Hu Z, Li Y, Song X, Han Y, Cai X, Xu S, Li W. Genomic

value prediction for quantitative traits under the epistatic model. BMC Genetics, 2011, 12(1): 15. DOI

[54] Gianola D, Fernando RL, Stella A. Genomic-assisted pre-

diction of genetic value with semiparametric procedures.

Genetics, 2006, 173(3): 1761–1776. DOI

[55] Habier D, Fernando RL, Dekkers JCM. Genomic selection

using low-density marker panels. Genetics, 2009, 182(1): 343–353. DOI

[56] Wang K, Li M, Hadley D, Liu R, Glessner J, Grant SF,

Hakonarson H, Bucan M. PennCNV: an integrated hidden Markov model designed for high-resolution copy number variation detection in whole-genome SNP genotyping data.

Genome Res, 2007, 17(11): 1665–1674. DOI

?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?ˇ?综合信息?

《遗传》被评选为2011年度中国精品科技期刊

2011年12月2日, 中国科学技术信息研究所在北京召开“中国科技论文统计结果发布会”, 300种期刊被评选为2011年度中国精品科技期刊, 《遗传》杂志榜上有名。

第12期李恒德等:基因组选择及其应用 1317

这次获得2011年度中国精品科技期刊证书的生命科学类期刊有:

Molecular Plant, 昆虫学报, 生理学报, 生态学报, 生态学杂志, 生物多样性, 生物化学与生物物理进展, 水生生物学报, 西北植物学报, 遗传, 应用生态学报, 植物病理学报, 植物生态学报, 植物学报, 中国科学生命科学等。

第八章分子生物学常用技术的原理及其应用及人类基因组学

第八章分子生物学常用技术的原理及其应用及人类基因组学 测试题 一、名词解释 1.分子杂交 2.Southernblotting 3.Northernblotting 4.Westernblotting 5.dotblotting 6.DNA芯片技术 7.PCR 8.功能性克隆 9.转基因技术 二、填空题 1.Southernblotting用于研究、Northernblotting用于研究,Westernblotting用于研究。 2.PCR的基本反应步骤包括、和三步。 3.在PCR反应体系中,除了DNA模板外,还需加入、、和。 4.Sange法测序的基本步骤包括、、和。 5.目前克隆致病相关基因的主要策略有、、。 6.血友病第Ⅷ因子基因的首次克隆成功所采用的克隆策略是,而DMD致病基因的克隆所采用的克隆策略是。 三、选择题 A型题 1.经电泳分离后将RNA转移到硝酸纤维素(NC)膜上的技术是: A.SouthernblottingB.Northernblotting

C.WesternblottingD.dotblotting E.insituhybridization 2.不经电泳分离直接将样品点在NC膜上的技术是 A.SouthernblottingB.Northernblotting C.WesternblottingD.Dotblotting E.insituhybridization 3.经电泳分离后将蛋白质转移到NC膜上的技术是 A.SouthernblottingB.Northernblotting C.WesternblottingD.dotblotting E.insituhybridization 4.经电泳后将DNA转移至NC膜上的技术是A.SouthernblottingB.Northernblotting C.WesternblottingD.Easternblotting E.insituhybridization 5.PCR的特点不包括 A.时间短,只需数小时B.扩增产物量大 C.只需微量模板D.用途非常广泛 E.底物必须标记 6.用于PCR的DNA聚合酶必须 A.耐热B.耐高压C.耐酸D.耐碱E.耐低温7.PCR反应过程中,模板DNA变性所需温度一般是A.95?CB.85?CC.75?CD.65?CE.55?C 8.PCR反应过程中,退火温度一般是 A.72?CB.85?CC.75?CD.65?CE.55?C 9.PCR反应过程中,引物延伸所需温度一般是A.95?CB.82?CC.72?CD.62?CE.55?C

全基因组选择及其在奶牛育种中的应用

发表于《中国奶牛》,2011 全基因组选择育种技术及在奶牛育种中应用进展 范翌鹏1孙东晓1* 张勤1张胜利1张沅1刘林2 (1.中国农业大学动物科技学院,北京,100193; 2.北京奶牛中心. 北京. 100085) 摘要:全基因组选择是指基于基因组育种值(GEBV)的选择方法,指通过检测覆盖全基因组的分子标记,利用基因组水平的遗传信息对个体进行遗传评估,以期获得更高的育种值估计准确度。由于可显著缩短世代间隔,全基因组选择作为一种育种新技术在奶牛育种中具有广阔的应用前景,目前已经成为各国的研究热点。不同国家的试验结果表明,在奶牛育种工作,基于GEBV 的遗传评估可靠性在20-67%之间,如果代替常规后裔测定体系,可节省92%的育种成本。本文综述了全基因组选择的基本原理及其在各国奶牛育种中的应用现状和所面临的问题。 关键词:全基因组选择,奶牛育种 Genome-Wide Selection and its Application in Dairy Cattle FAN YiPeng, SUN Dongxiao, ZHANG Qin, ZHANG Shangli, ZHANG Yuan, LIU Lin (College of Animal Science Technology, China Agricultural University, Beijing, 100193) Abstract: Genomic selection refers to selection decisions based on genomic breeding values (GEBV). The GEBV are calculated as the sum of the effects of dense genetic markers, or haplotypes of these markers, across the entire genome, thereby potentially capturing all the quantitative trait loci (QTL) that contribute to variation in a trait. Genomic selection has become a focus of study in many countries as the new breeding method. Reliabilities of GEBV for young bulls without progeny test results in the reference population were between 20 and 67%. By avoiding progeny testing, bull breeding companies could save up to 92% of their costs [1]. In this paper, we first review the progress of genomic selection, including the principle, methods, accuracy and advantages of genomic selection. We then review the application of genomic selection in dairy cattle. Key words: Genomic Selection, Dairy Breeding 全基因组选择(Genomic Selection,GS),即全基因组范围的标记辅助选择(Marker Assisted Selection, MAS),指通过检测覆盖全基因组的分子标记,利用基因组水平的遗传信息对个体进行遗传评估,以期获得更高的育种值估计准确度。研究已表明,标记辅助选择可提高奶牛育种遗传进展[2][3],但是在目前奶牛育种工作中却无法大规模推广应用标记辅助选择。因为奶牛的生产性状和健康性状均受大量基因座位共同影响,通过有限数量的已知标记无法大幅度加快遗传进展;其次,通过精细定位策略鉴定主效基因需花费大量人力物力和时间;而且利用标记信息估计育种值的计算方法也很复杂。全基因组选择基于基因组育种值(Genomic Estimated Breeding Value, GEBV)进行选择,其实施包括两个步骤:首先在参考群体中使用基因型数据和表型数据估计每个染色体片段的效应;然后在候选群体中使用个体基因型数据估计基因组育种值(genomic breeding value,GEBV)[4],模拟研究证明,仅仅通过标记预测育种值的准确性可以达到0.85(指真实育种值与估计育种值之间的相关,而可靠性则指其平方)。如果在犊牛刚出生时即可达到如此高的准确性,对奶牛育种工作则具有深远意义。模拟研究表明:对于一头刚出生的公犊牛而言,如果其GEBV的估计准确性可以达到经过后

作物基因组学前沿与应用

作物基因组学前沿与应用 Crop genomics: advances and applications 摘要:一些重要作物模式基因组测序的完成和进行高通量重测序的能力为提高对植物驯化历史的理解以及加快作物改良提供机遇。而这些数据以及新一代实验和计算方法正在改变作物比较基因组学。作物改良的未来将集中在个体植物基因组的比较,最好的手段可能在于结合运用新的遗传图谱构建策略与进化分析方法来指导和完善遗传变异的发掘与利用。这里我们回顾这些已然出现的策略与深刻见解。 一些重要作物和模式植物模式基因组测序的完成可能有助于实现长期存在的大大加快作物改良的植物基因组学研究要求(fig.1)。早在上世纪60年代末期,就已实现了对一个植物基因组分子标记的开发,但是最近几十年较易检测的分子标记数目存在分辨率较低的限制,而这些问题可以通过实验遗传学方法或者比较遗传学方法解决。仅仅几年前,高密度的遗传图谱需要对几千个标记进行费时费力地检测。实验群体通常会受限于两个亲本间的简单杂交;更详尽的研究设计可能提供对农学上重要突变遗传分布的评定,但相关种质中突变频率受到标记技术和用于区分多亲本分布的分析方法所限制。对群体间分子标记频率的分析,从而鉴定重要功能突变的比对方法已经提出,但是由于群体间预期的等位基因较高变异频率的存在,使得发掘研究的大量位点间重要功能突变显得相当的困难。 目前,已经报道了一些作物的模式基因组,并且在那些具有较大基因组的作物中引用取得进展。此外,已经报道了其他一些模式植物系统的模式基因组,包括拟南芥和短柄草。比较基因组学——传统上被认为是相关物种间同线性(基因顺序)的分析和序列的比对,目前由于报道的模式基因组数目的急速增加,源于高通量重测序的序列多样性的估计,大量缺失插入以及拷贝数变异(CNVs)基因组分布的鉴别,以及新一代实验和比较方法的出现而被重新定义。从遗传图谱的构建到进化分析,作物改良的未来将主要围绕着个体植物基因组间的比较。如果我们要继续提高作物产量,同时最低程度地减少农业生产对环境的影响,以面对不断增长的人口和变化的气候,那么最大限度地利用这些基因组数据对作物改良就显得至关重要了。 在这篇综述里,首先指出作物比较基因组学的挑战,这些挑战包括植物基因组的复杂结构以及在一些作物品种中发现的高水平核苷酸和结构的多样性。然后讨论了解驯化的重要性,因为一个作物的起源和种群分布影响着农艺性状的遗传基础和全基因组核苷酸多样性的方式。我们对农艺性状遗传学的理解由于基因组数据而发生根本性的变化。高密度的遗传标记正在被用于全基因组关联分析(GWASs),也可以应用到基因组选择中。对农艺性状的了解同样因为新一代的多亲本遗传图谱构建群体而得到提高。正如我们所讨论的那样,更高通量的重测序技术和标记基因型分析将会使新的作物改良方法成为可能,比如对有害突变的鉴别与选择性剔除。 植物基因组学的挑战 应用在植物中的基因组学研究工具通常会开发和测试其在哺乳动物或者其他模式生物中数据,比如果蝇和小鼠,但是植物基因组的规模和动态性增加或者加剧在其他模式生物中面临的挑战。相对于哺乳动物来说,植物倾向于拥有大量

合成生物学与生物燃料

济南大学研究生课程考查试卷 课程编号:QZ283001课程名称:信息与文献检索学时16 学分 1 学号:20172120470 姓名牛浩学科、领域生物工程 学生类别:全日制专业学位成绩:任课教师(签名) 1、考核形式(采用大作业、论文、调研报告、实验报告等): 课程论文 2、考查(内容、目的等)具体要求: 写一篇与所从事专业相关的综述性论文 字数在3000字左右 书写格式规范,论述清晰,层次分明 3、成绩评定说明(含平时成绩、考核成绩): 平时成绩主要包括考勤和平时作业,考勤共计10分,平时作业共计20分,占总成绩的30%。 期末课程论文共计70分,占总成绩的70%。 总成绩为平时成绩与课程论文成绩的加和,即100分。

合成生物学在生物燃料领域的研究 摘要:本文简要介绍了合成生物学的概念,生物燃料的研究现状、研究前景以及未来可能会遇到的一些挑战。探讨了合成生物学在生物燃料研究中的应用进展包括提高生物质原料的转化特性、开发绿色高效生物催化剂、构建微生物细胞工厂以及设计合成多种生物燃料产品。最后对合成生物学在生物燃料领域的研究做出了展望。 关键词:合成生物学;生物燃料;研究现状;前景;挑战;应用进展 1 合成生物学概述 合成生物学(synthetic biology) 是综合了科学与工程的一个崭新的生物学研究领域。它既是由分子生物学、基因组学、信息技术和工程学交叉融合而产生的一系列新的工具和方法,又通过按照人为需求( 科研和应用目标),人工合成有生命功能的生物分子( 元件、模块或器件)、系统乃至细胞,并自系统生物学采用的“自上而下”全面整合分析的研究策略之后,为生物学研究提供了一种采用“自下而上”合成策略的正向工程学方法[1]。它不同于对天然基因克隆改造的基因工程和对代谢途径模拟加工的代谢工程,而是在以基因组解析和生物分子化学合成为核心的现代生物技术基础上,以系统生物学思想和知识为指导,综合生物化学、生物物理和生物信息技术与知识,建立基于基因和基因组、蛋白质和蛋白质组的基本要素( 模块) 及其组合的工程化的资源库和技术平台,旨在设计、改造、重建或制造生物分子、生物部件、生物系统、代谢途径与发育分化过程,以及具有生命活动能力的生物部件、体系以及人造细胞和生物个体。 2 生物燃料研究现状与挑战 2.1 生物燃料的研究现状 生物燃料主要包括纤维素生物燃料(乙醇、丁醇等)、微藻生物燃料(生物柴油、航空生物燃料等),以及最近两年研究较热的新型优质生物液体燃料(高级醇、脂肪醇、脂肪烃等)和利用新技术路线合成的生物乙醇与生物柴油(蓝藻乙醇、微生物直接利用纤维素水解糖体内合成生物柴油等)等。“可持续性”是生物燃料的核

《基因组学与应用生物学》

《基因组学与应用生物学》 论文编写指南 一、栏目设置与文体风格 本刊设置固定栏目和随机栏目。固定栏目常设研究论文(Articles)和研究报告(Research Report),发表最新的原始研究成果。随机栏目根据稿源可能设研究资源(Resources)、数据分析(Analysis)、技术主题(Technology feature)和评述与展望(Reviews and Progress)等栏目,还可能设置刊登有关科学新闻、科技简讯、专利、短评和书评等方面的栏目。本刊在栏目设置和文体格式上参照国际著名周刊《自然》及《自然生物技术》的刊发形式。以下就研究论文(Articles)、研究报告(Research Report)、评述与展望(Reviews and Progress)和研究资源(Resources)的文体格式做出说明,其它类型的详细的文体格式及其定义请向编辑部索取或从本刊网站下载。 1研究论文(An Article) 报道相对比较完整、全面的原始研究工作,其结论代表着一个重要问题的认识上有了实质性进展,并且具有及时而深远的影响。论文篇幅要求在8个印刷页面以上,由作者自由投稿,同行评审。 2研究报告(Research Report) 简洁报道有重要结果的原始研究工作,其重要性意味着本研究结果使其它领域的科学家也有兴趣。论文篇幅要求在6个印刷页面左右,由作者自由投稿,同行评审。 3评述与展望(Review and Progress) 对某一研究领域中最新研究进展进行权威的、公平的、学术上的回顾、鉴定和评述。论文篇幅要求在8个印刷页面以上,由作者自由投稿,同行评审。 4研究资源(A Resource) 对现有数据(如由各种阵列技术或者高通量研究平台所提供的基因组学, 转录组学或蛋白质组学的数据包)进行新分析,或描述由比较分析技术得出引起广大读者注意的重要新结论而获得的新数据。论文篇幅要求在6个印刷页面左右,由作者自由投稿,同行评审。 二、论文写作的基本要求 1题目与标题 论文题目要紧扣主题。务求简明、新颖,有足够的信息,能引起读者的兴趣,不用副标题,一般不超过25个汉字或英文单词。中英文题目应对应一致,顶格书写。避免在题目中使用不常用的缩写词。 2作者与单位 署名应限于参加本工作并能解答论文中有关问题者,必须注明通讯作者及其电子邮箱。中国作者英文名用汉语拼音,姓和名的首字母大写,双名不用连字号隔开;外国作者按其习惯书写,名用缩写,字母间加缩略点。作者下面一行书写作者的工作单位、城市名及邮政编码。工作单位的英文翻译应按照所在单位官方公布的为准。

全基因组选择育种策略及在水产动物育种中的应用前景(精)

中国水产科学 2011年7月, 18(4: 936?943 Journal of Fishery Sciences of China 综述 收稿日期: 2011?03?14; 修订日期: 2011?04?10. 基金项目: 国家自然基金资助项目(30730071; 30972245; 农业科技成果转化资金项目(2010GB24910700. 作者简介: 于洋(1987?, 硕士研究生. E-mail: yuy8866@https://www.doczj.com/doc/e410984307.html, 通信作者: 张晓军, 副研究员. E-mail: xjzhang@https://www.doczj.com/doc/e410984307.html, DOI: 10.3724/SP.J.1118.2011.00935 全基因组选择育种策略及在水产动物育种中的应用前景 于洋1,2 , 张晓军1 , 李富花1 , 相建海1 1. 中国科学院海洋研究所实验海洋生物学重点实验室, 山东青岛266071; 2. 中国科学院研究生院, 北京 100049 摘要: 全基因组选择的概念自2001年由Meuwissen 等提出后便引起了动物育种工作者的广泛关注。目前, 澳大利亚、新西兰、荷兰、美国的研究小组已经应用该方法进行了优质种牛的选择育种, 并取得了很好的效果。此外在鸡和猪的选择育种中也有该方法的应用, 但在水产动物选育中尚未见该方法使用的报道。本文对“全基因组选择育种”的概念和提出背景进行了归纳, 对全基因组选择育种的优势进行了阐述, 并详细介绍了其具体的策略, 总结了目前全基因组育种所广泛采用的方法以及取得的成果, 旨在为该方法在水产动物育种方面的应用研究提供科学参考。 关键词: 全基因组选择; 水产动物育种; SNP; QTL; 全基因组育种值估计 中图分类号: S96 文献标志码: A 文章编号: 1005?8737?(201104?0935?08 人类对于动物的选择育种由来已久, 最初所进行的只是简单的人工驯化。随着遗传学研究的发展, 尤其是“数量遗传学理论”的提出, 动物育种技术进入快速发展时

基因组学重点整理

生物五界:动物、植物、真菌、原生生物和原核生物;生物三界:真细菌、古细菌、真核生物 具有催化活性的RNA分子称为核酶(ribozyme)核酶催化的生化反应有:自我剪接、催化切断其它RNA、合成多肽键、催化核苷酸的合成 新基因的产生:基因与基因组加倍1)整个基因组加倍;2)单条或部分染色体加倍;3)单个或成群基因加倍。DNA水平转移:原核生物中的DNA水平转移可通过接合转移,噬菌体转染,外源DNA的摄取等不同途径发生,水平转移的基因大多为非必须基因。动物中由于种间隔离不易进行种间杂交,但其主要来源于真核细胞与原核细胞的内共生。动物种间基因转移主要集中在逆转录病毒及其转座成分。 外显子洗牌与蛋白质创新:产生全新功能蛋白质的方式有二种:功能域加倍,功能域或外显子洗牌 基因冗余:一条染色体上出现一个基因的很多复份(复本)当人们分离到某一新基因时,为了鉴定其生物学功能,常常使其失活,然后观察它们对表型的影响。许多场合,由于第二个重复的功能基因可取代失活的基因而使突变型表型保持正常。这意味着,基因组中有冗余基因存在。看家基因很少重复,它们之间必需保持剂量平衡,因此重复的拷贝很快被淘汰。与个体发育调控相关的基因表达为转录因子,具有多功能域的结构。这类基因重复拷贝变异可使其获得不同的表达控制模式,促使细胞的分化与多样性的产生,并导致复杂形态的建成,具有许多冗余基因。 非编码序列扩张方式:滑序复制、转座因子 模式生物海胆、果蝇、斑马鱼、线虫、蟾蜍、小鼠、酵母、水稻、拟南芥等。模式生物基因组中G+C%含量高, 同时CpG 岛的比例也高。进化程度越高, G+C 含量和CpG 岛的比例就比较低 如果基因之间不存在重叠顺序,也无基因内基因(gene-within-gene),那么ORF阅读出现差错的可能只会发生在非编码区。细菌基因组中缺少内含子,非编码序列仅占11%, 对阅读框的排查干扰较少。细菌基因组的ORF阅读相对比较简单,错误的机率较少。高等真核生物DNA的ORF阅读比较复杂:基因间存在大量非编码序列(人类占70%);绝大多数基因内含有非编码的内含子。高等真核生物多数外显子的长度少于100个密码子 内含子和外显子序列上的差异:内含子的碱基代换很少受自然选择的压力,保留了较多突变。由于碱基突变趋势大多为C-T,故A/T的含量内含子高于外显子。由于终止密码子为TAA\TAG\TGA,如果以内含子作为编码序列,3种读码框有很高比例的终止密码子。 基因注释程序编写的依据:1)信号指令,包括起始密码子,终止密码子,终止信号,剪接受体位和供体位,多聚嘧啶序列,分支点保守序列2)内容指令,密码子偏好,内含子和外显子长短 基因功能的检测:基因失活、基因过表达、RNAi干涉 双链DNA的测序可从一端开始,亦可从两端进行,前者称单向测序,后者称双向测序。 要获得大于50 kb的DNA限制性片段必需采用稀有切点限制酶。 酵母人工染色体(YAC)1)着丝粒在细胞分裂时负责染色体均等分配。2)端粒位于染色体端部的特异DNA序列,保持人工染色体的稳定性3)自主复制起始点(ARS)在细胞中启动染色体的复制 合格的STS要满足2个条件:它应是一段序列已知的片段,可据此设计PCR反应来检测不同的DNA片段中是否存在这一顺序;STS必需在染色体上有独一无二的位置。如果某一STS在基因组中多个位点出现,那么由此得出的作图数据将是含混不清的。 遗传图绘制主要依据由孟德尔描述的遗传学原理,第一条定律为等位基因随机分离,第二条定律为非等位基因自由组合,显隐性规律/不完全显性、共显性、连锁 衡量遗传图谱的水平覆盖程度饱和程度 基因类型:transcribed, translatable gene (蛋白基因) ;transcribed but non-translatable gene ( RNA基因)Non- transcribed, non-translatablegene ( promoter, operator ) rRNA基因,tRNA基因, scRNA基因, snRNA基因, snoRNA基因, microRNA基因 基因组(genome):生物所具有的携带遗传信息的遗传物质总和。 基因组学(genomic):用于概括涉及基因作图、测序和整个基因功能分析的遗传学分支。 染色体组(chromosome set):不同真核生物核基因组均由一定数目的染色体组成,单倍体细胞所含有的全套染色体。 比较基因组学(comparative genomics):比较基因组学是基因组学与生物信息学的一个重要分支。通过模式生物基因组与人类基因组之间的比较与鉴别,为分离重要的候选基因,预测新的基因功能,研究生物进化提供依据。(目标)

基因组学研究的应用前景

基因组学研究的应用前景摘要:基因组学是一门研究基因组的结构,功能及表达产物的学科,基因组的结构不仅是蛋白质,还有许多复杂功能的RNA,包括三个不同的亚领域,及结构基因组学,功能基因组学和比较基因组学。近几年,基因组学在微生物药物,细菌,病毒基因,营养基因方面都有进展,其前景是光明的。 关键词:基因研究未来结构 一、微生物药物产生菌功能基因组学研究进展 微生物药物是一类化学结构和生物活性多样的次级代谢产物,近年来多个产生菌基因组序列已经被测定完成,在此基础上开展的功能基因组研究方兴未艾,并在抗生素生物合成,形态分化,调控,发育与进化及此生代谢产物挖掘等方面有着新的发现,展现出广阔的研究前景,青霉素及其衍生的《》内酰胺类抗生素极大地改善了人类的卫生保健和生活质量,并促进研究人员不断对其工业生产菌株类黄青霉进行遗传改良和提高其产量,从而降低生产成本。经过60年的随机诱变筛选,当前青霉素产量至少提高了三个数量级,同时,青霉素的生物合成机理也得到了较为清晰的阐述,其pcbAB编码的非核糖体肽合酶ACVS~DPcbc编码的异青霉素N合成酶IPNS位于细胞质中,而苯乙酸COA连接酶PenDE编码的IPN酰基转移酶位于特殊细胞器一微体中。 研究发现,青霉素合成基因区域串联扩增,产黄青细霉胞中微体含量增加都可显著提高青霉素产量。然而随机诱变筛选得到的黄青霉工业菌株高产的分子机制尚不明确。为此,2008年荷兰研究人员联合国美国venter基因组研究所对黄青霉wisconsin54—1225进行了基因组测试和分析,并进一步利用DNA芯片技术研究了wisconsin54—1255及其高产菌株DS17690在培养基中是否添加侧链前体苯乙酸情况下的转录组变化,四组数据的比较分析发现,有2470个基因至少在其中一个条件下是差异表达的,根据更为严格的筛选标准,在PPA存在的条件下,高产菌相比测序菌株有307个基因转录是上调的,和生长代谢,青霉素前体合成及其初级代谢和转运等功能相关,另有271个基因显著下调,主要是与生长代谢及发育分化相关的功能基因。 二、乳酸菌基因组学的研究进展

基因组学(复习)

王前飞: (1)为什么要研究表观遗传学? 答: 表观遗传学主要通过DNA 的甲基化、组蛋白修饰、染色质重塑和非编码RNA 调控等方式控制基因表达。表观遗传学是近几年兴起的而且发展迅速的一个研究遗传的分支学科,其研究和应用不仅对基因表达、调控、遗传有重要作用,而且在肿瘤、免疫等许多疾病的发生和防治以及干细胞定向分化研究、基因芯片中亦具有十分重要的意义。表观遗传学补充了“中心法则”忽略的两个问题,即哪些因素决定了基因的正常转录和翻译以及核酸并不是存储遗传信息的唯一载体;在分子水平上,表观遗传学解释了DNA序列所不能解释的诸多奇怪的现象。如: 同一等位基因可因亲源性别不同而产生不同的基因印记疾病,疾病严重程度也可因亲源性别而异。表观遗传学信息还可直接与药物、饮食、生活习惯和环境因素等联系起来,营养状态能够通过改变表观遗传以导致癌症发生,尤其是维生素和必需氨基酸。 此外,表观遗传学信息的改变,对包括人体在内的哺乳动物基因组有广泛而重要的效应,如转录抑制、基因组印记、细胞凋亡、染色体灭活等。DNA 甲基化模式的改变,尤其是某些抑癌基因局部甲基化水平的异常增加,在肿瘤的发生和发展过程中起到了不容忽视的作用。研究发现,肿瘤细胞DNA 存在广泛的低甲基化和局部区域的高甲基化共存现象,以及总的甲基化能力增高,这3个特征各以不同的机制共同参与甲基化在肿瘤发生、发展中的作用。如胃癌、结肠癌、乳腺癌、肺癌、胰腺癌等众多恶性肿瘤都不同程度地存在一个或多个肿瘤抑制基因CpG 岛甲基化。而表观遗传学改变在本质上的可逆性,又为肿瘤的防治提供了新的策略。所以,随着表观遗传学研究的深入,肯定会对人类生长发育、肿瘤发生以及遗传病的发病机制及其防治做出新的贡献,也必将在其他领域中展示其不可估量的作用和广阔的前景。 (2)表观遗传学涉及到哪些方面? 答: 表观遗传学的研究内容主要包括:DNA甲基化、组蛋白的末端修饰和变异体、DNAaseⅠ高敏感位点、非编码RNA、转录因子及其辅助因子、顺式调控元件和基因组印记等。 (3)什么因素会影响基因表达水平? 答: 基因选择性转录表达的调控( DNA甲基化,基因印记,组蛋白共价修饰,染色质重塑) 基因转录后的调控(基因组中非编码RNA,微小RNA(miRNA),反义RNA、内含子、核糖开关等) 1.转录水平的调控:包括DNA转录成RNA时的是否转录及转录频率的调控,DNA 的序列决定了DNA的空间构型,DNA的空间构型决定了转录因子是否可以顺利的结合到DNA的调控序列上,比如结合到TATA等序列上。 2.翻译水平的调控:翻译水平的调控又可以分成翻译前的调控和翻译后的调控。 a、翻译前的调控主要是RNA编辑修饰。 b、翻译后调控主要是蛋白的修饰,蛋白修饰后可以成为有功能的蛋白或者有隐藏功能的蛋白。 在真核和原核细胞中,从基因表达到蛋白质合成,其间有许多地方受到调控,这

合成生物学在工业微生物菌种优势最小基因组改造中的应用

合成生物学在工业微生物菌种优势最小基因组改造中的应用 随着许多生物体全基因组测序的完成,兴起了最小基因组的研究,即一个能独立生活的生物体最少需要多少个基因。对最小基因组的研究将深入了解生命起源、生物进化和生物代谢调控;并在此基础上,以人类的意愿合成自然界不可能产生的生命体。依据核糖体RNA 序列,现存的生命形式被分为3个域,即真细菌、古细菌和真核生物。这些生物的遗传物质都是核酸,其基因组大小变化很大,从数十万碱基对到几十亿碱基对不等;所含基因数目则为数百乃至数万。而原核生物的基因组较小,基因结构和基因调控网络相对简单。因此最小基因组的研究主要以原核生物为研究对象。 细胞是生命活动的基本单位,细胞生命的3大特征是维持正常代谢平衡、进行繁殖(自我复制)以及进化。所谓最小基因组就是维持细胞三大特征的必需基因数,尽管不同物种间总基因数目变动很大,但维持自由生活细胞的必需基因数目大约为300个左右,相应的基因组大小约为300~400 kb。随着技术的进步,以大规模高通量分析为特征的各种组学应运而生,包括基因组学、转录组学、蛋白组学和代谢组学等,这些新生的研究体系将基因组复制、基因转录、翻译和基因调控网络、蛋白质相互作用和物质能量代谢等不同层次的的信息相互关联,以揭示错综复杂的生命活动。生物信息学、计算生物学和系统生物学就是为整合和诠释这些海量的数据而产生的,其重要性也日益突出。在人类基因组测序完成的后基因组时代,最小基因组的确切大小仍是未解之谜。与此同时,人工建立最小基因组的工作已经开始进行,其中最为突出的成果是“人造细胞”的诞生。 1 鉴定必需基因和最小基因组的方法 在一个生物体包含的全部基因中,有一部分是必需基因,必需基因是现代生物学研究的重中之重。必需基因是指在一定环境条件下,维持某种生物体的生命活动所必不可少的基因。这些基因所编码蛋白质的功能被认为是生命的基础,其突变通常是致死性的。由于细菌自身的特性,细菌特定基因的必要性还取决于环境条件。因为寄主细胞内环境条件稳定,营养供应充足,由此使得细胞内共(寄)生细菌细胞结构和代谢途径通常极度简化,细胞壁退化乃至消失。目前发现细菌Carsonellaruddii的基因组最小,仅为160 kb,基因分布非常致密,有182 个开放阅读框,90%的相邻开放阅读框间有所重叠。总体而言,细菌的必需基因是合成细胞结构成分、信息传递和加工不可或缺的基因。确定必需基因和最小基因组的方法主要有比较基因组学和系统性基因失活法。 1.1 比较基因组学方法 相对而言,原核生物基因组简单,重复序列较少,因此短枪测序法适合于微生物基因组测序。其基本思路是必需基因应该是在细菌基因组中非常保守的基因,而非必需基因则不会在所有基因组中出现。美国国家生物技术信息中心(NCBI)的Mushegian和Koonin通过对流感嗜血杆菌和生殖支原体基因组的比较分析,发现大约256个基因为两者所共有的保守基

分子与合成生物学知识点总结

1.(生命的起源)三界的分类:古细菌、细菌、真核生物 2.小分子:氨基酸、糖类、核苷酸 77% 3.大分子:核酸、蛋白质、脂质 23% 4.古细菌更类似于真核细胞,原核细菌是真正的细菌 5.合成生物学的定义:设计和构建自然界中没有发现的生物功能和生物系统。构造生物零件装置和能量,药物以及科技系统中应用工程原则和数学模型。 组装各领域专业知识的研究领域为了理解,构建,修饰生物系统。 合成生物学的目标:①操纵基因元件,将基础生物分子整合到基因线路上,来创造新性状,表达复杂的生物功能。②从稳定、标准、已经改良好的基因模块来构建生物体系。 合成生物学的目的:改造系统、系统化构建 .合成生物学与其他学科的不同:抽象性、模块性、标准化、设计和模型 6.根据进化树,古细菌和真核生物都来自细菌。 7.生物膜的作用:隔离、储存能量、物质传递、信号传导、阻断毒性 8.内共生学说:古细菌的真核细胞吞噬异样细菌,成为它的线粒体。 吞噬自养细菌,成为它的叶绿体。 9.基因的概念:基因是生物有机体遗传的分子单元 基因在染色体上 是有机体中可以编码多肽和RNA的DNA序列 10.DNA的结构和功能: 遗传信息在DNA链的核苷酸序列中 遗传信息指导合成蛋白质 基因两条链碱基配对以氢键链接 一条链模板、半保留复制5-3、3端游离羟基、糖在外,碱基在内 11.染色体结构与基因表达: 染色质的基本组成单位是核小体 核小体是组蛋白八聚体2H2A 2H2B 2H3 2H4 H1与核小体间DNA链接 染色质改造:连接DNA长度可变,结合DNA结构可变 12.三个重要的DNA序列:端粒、复制起始区、着丝点 13.核小体的N端修饰(共价修饰): DNA甲基化和组蛋白去乙酰化协同作用共同参与转录阻遏。 磷酸化使生物学过程发生 14.转录抑制与异染色质有关 15.第三章总结:间期染色质解旋很难看见 基因表达loop结构处 常染色质结构疏松表达活跃,能编码蛋白质。 异染色质粘稠不编码。如端粒、中心粒、着丝粒 有丝分裂染色体是压缩的,有序的,染色体在细胞核中的存放时空间有序的 16.分子机器:调节DNA的蛋白质 DNA:连接酶、解旋酶(95℃)、拓扑异构酶 钳蛋白、结合蛋白

环境基因组学的研究进展及其应用

环境基因组学的研究进展及其应用 贾海鹰 张徐祥 孙石磊 赵大勇 程树培* (南京大学,环境学院,南京,210093) E-mail(jhy194@https://www.doczj.com/doc/e410984307.html,) 摘 要:本文系统地介绍了环境基因组学的基本概念、研究的主流技术平台及其在环境污染控制、健康风险检测与评价等方面地应用,并阐明了环境基因组学与生物信息学两者之间的关系。环境基因组学在分子水平上揭示了环境污染物与生物之间的相互作用,为检测、控制环境污染维护环境健康注入了新的活力。 关键词:环境基因组学 生物信息学 健康风险评价 环境污染 环境健康 1.引言 2003年4月14日,人类基因组计划(Human Genome Project)顺利完成。HGP成功地绘制出了遗传图谱、物理图谱、序列图谱和转录图谱4张图谱。这标志着人类基因组计划的所有目标全部实现。至此,HGP的研究发生了翻天覆地的变化,已从结构基因组学研究时代进入了功能基因组(后基因组)时代[1-2],因此也就有了“人类后基因组计划”。HGP正朝着生物信息科学、计算机生物技术、数据处理、知识产权及社会伦理学研究等多方面发展,对生命科学、环境科学、医疗卫生、食品制药、人文科学各领域产生了广泛而深远的影响。环境基因组学(environmental genomics)是在人类基因组基础上发展的功能基因组内容之一,由基因组学和环境科学交叉融合而成,是一个近期发展起来的新型边缘学科,是基因组学技术和成果在环境污染保护与控制和生态风险评价中的应用,在其发展的短短的几年时间内已渗透到环境科学研究的各个研究领域并发挥着日益重要的作用。 2.环境基因组学的概念与定义 至今,国内外学者对环境基因组学还没有统一明确的定义。但是,大多数学者认为,环境基因组学(environmental genomics)的概念与毒理基因组学(toxicogenomics)密切相关。自从1999年Nuwaysir等[3]首次提出毒理基因组学概念至今,在短短的八年的时间里这一概念不断地发展和完善着。目前人们普遍采纳的定义有两种,一种是美国国家毒理学规划机构给出的定义[3]:毒物基因组学是研究外来化学物对基因活性和基因产物的影响及相互作用的科学;另一种是由世界卫生组织给出的定义[3],认为毒物基因组学是一门与遗传学、基因组水平上RNA表达(转录组学) 、细胞和组织范围的蛋白表达(蛋白质组学)、代谢谱(代谢组学) 、生物信息学和常规毒理学结合,以阐明化学物作用模式和基因-环境相互作用的潜在意义的科学。1998年4月4日,美国国会顾问环境卫生科学委员会正式投资专项基金进行环境基因组计划研究,其目的是专门研究与环境相关疾病的遗传易感性,寻找对化学损伤易感的基因,鉴定对环境发生反应基因中有重要功能的多态性,并确定它们在环境暴露引起疾病的危险度方面的差异;在疾病流行病学中研究基因与环境的相互作用,从而改善遗传分析技术,优化研究设计,建立样品资源库,把公用的多态性应用于社会、法律和伦理学[4-7]。2001年,Miller 提出环境基因组(Environmental Genomics)是在人类基因组(HGP)基础上发展起来的后 - 1 -

全基因组选择在猪育种上的研究进展

全基因组选择在猪育种上的研究进展 自野生动物被驯化以来,科学家一直致力于提高畜禽育种值的研究。近半个世纪来,畜禽育种值估计的方法主要经历了综合选择指数法、同期群体比较法、最佳线性无偏预测法(Best LinearUnbiased Prediction,BLUP)、分子标记辅助选择育种(MAS)以及近几年快速发展的GS 法。同时,随着高密度基因芯片的出现和高通量测序技术的快速发展,单核苷酸多态性(SingleNucleotide Polymorphism,SNP)分型成本快速下降,GS 才逐渐引起畜禽界的关注。特别是Schaeffer发现,在奶牛育种中利用GS比后裔测定可节约成本97%,且遗传进展可提高3~4倍后,全球掀起了一股研究GS的热潮。 全基因组选择(GS) 什么是GS 2001年,Meuwissen等人最先提出GS,实质为全基因组范围的标记辅助选择。其理论基础是应用整个基因组的标记信息和各性状值来估计每个标记或染色体片段的效应值,然后将效应值加和即得到基因组育种值(GenomicEstimated Breeding Value,GEBV)。GS在某种程度上是MAS的延伸,弥补了在MAS 中标记数量只能解释一部分遗传方差以及数量性状位点(QuantitativeTrait Locus,QTL) 定位困难的缺点。其中心任务是提高GEBV值的准确性,并尽可能准确地估计每个标记的效应。而估计标记效应的方法在实际运用中以BLUP法为主;Bayes法虽其准确性高于BLUP,但因其计算复杂,需在超级计算机上运行而限制其应用。不过随着快速算法的开发和计算机硬件的改进,Bayes法的运算效率有望提高。 为什么选用GS GS的优势 与MAS相比,GS的优势主要表现在: 1)能对所有的遗传和变异效应做出准确的估计。而MAS 只能对部分遗传变异进行检测,且容易高估其遗传效应。 2)缩短世代间隔、提高畜禽年遗传进展、降低生产成本等,这在需要后裔测定的家畜中尤为明显。如GS给奶牛育种带来了巨大经济效益。 3)早期选择准确率高。 4)对于较难实施选择的性状具有重大影响。如低遗传力性状、难以测定的性状等。 5)GS在提高种群的遗传进展前提下,还能降低群体的近交增量。 GS的可靠性

基因组学在人类健康与疾病中的应用

基因组学在人类健康与疾病中的应用 ————094班 2090611412 王国东摘要:在发现DNA双螺旋结构50周年之际,高质量的人类基因组全序列测序工作的完成具有划时代的意义,基因组的新纪元已经到来。 关键词:DNA双螺旋、人类基因组、新纪元 前言:现在广泛公布的人类以及一系列其他生物体的基因组序列为我们描绘出了最基础的生物学以及生物医学信息。这些仍然很难破译的密码包含了细胞的结构和功能的的全部遗传指令信息,而这一信息又是揭开生物系统复杂性所必需的。阐明基因组的结构以及确定大量编码元素的功能可以建立基因组学与生物学的联系,从而加速我们对所有生命科学领域的探索。因此,我们需要新的概念和技术用来发展一种全面的、易于理解的人类基因组的编码目录明确基因编码的产物如何共同作用行使细胞和组织功能理解基因组如何改变和承担新功能。本文主要从以下几个方面来阐述基因组学在人类健康与疾病中的应用。 1.人类基因组的可遗传变异的详细理解 遗传学的主要内容之一是寻找表型的不同(性状)与DNA序列的变异之间的关联。人类遗传学的最大进步是把性状和单个基因联系起来。但是大部分的表型,包括普通疾病和对药物的不同反应,都是由更加复杂的原因所致,包括多种遗传因素(基因及其产物)以及非遗传因素(环境因素)的交互作用。揭示这一复杂体系不仅需要对人类基因组可遗传的变异进行全面描述,还需要开发出一系列用这些信息了解遗传疾病基础的分析方法。 早在几年前,人们已经急于开始建立一套人类基因常见差异的细目,包括单核苷酸多态性(SNPs),小的缺失和插入,以及其他结构上的不同。已经发现了许多SNPs,而且大部分结果已经公开(https://www.doczj.com/doc/e410984307.html,/SNP)。2002年,一个公共协作项目--国际HapMap计划(https://www.doczj.com/doc/e410984307.html, /Pages/Research/ HapMap)启动,它的目的是建立人类基因组的不均衡联接模式和单体型,用来鉴定携带大量这些模式的遗传变异信息的SNPs,从而使更广泛的遗传关联性的研究成为可能。这些研究要想成功,就需要用这种新的人类单体型框架来进行更充分的实验以及发展更多的计算方法。对人和其他模式生物遗传变异的全面了解可以推动基因型和生物功能相关性的研究。对特定变异的研究以及研究这些变异对特定蛋白的功能和途径的影响,将为我们认识和理解正常或病理状态下的生理过程提供重要新思路。把基因变异的信息结合到人类遗传学研究中的能力的提高,将为基因水平上的人类疾病的研究开启新的纪元。 2基因组学与人类健康与疾病的应用 2.1把基于基因组的知识转化为人类健康的福祉 人类基因组测序,以及基因组学其他最近及预期的研究成果,极大地有助于我们了解遗传因素在人类健康和疾病中的角色,精确确定非遗传因素,并迅速将新发现用于疾病的预防、诊

基因组学

课程名称基因组学 硕士课程论文 题目:基因枪技术在植物学研究中的应用 学科专业: 植物学 年级: 2012 学号: 2012210632 研究生:侯敏指导教师:查笑君 论文提交时间: 2012 年 12 月 11 日 基因枪技术在植物学研究中的应用

摘要基因枪是当今研究中一种重要的基因转移方法,在各个应用领域都显示出了其独特的优越性,因而广受重视;与此同时,基因枪技术本身也在实践中不断发展和完善。本文在回顾和总结基因枪技术使用原理的基础上,综述了基因枪在植物学研究中的应用。 关键词基因枪;植物学;基因转移;应用 Appl ication of Particle Bombardment in the Research of Botany Abstract As an important means of gene delivery , gene gun technology has showed its superiority in many application fields of gene engineering , and so has gained wide attention. At the same time , gene gun technology is also evolving in practice. Upon the retrospection and of the gene gun principles , the application of the gene gun in the Botanical Research was summaried. Key words Gene gun ; botany ; gene delivery ;application 1 基因枪技术的转化原理与发展 近年来转基因技术以前所未有的速度进步人们已经不再满足于单个基因成功插入原有生物的基因组中而是把目光放在插入基因的成功表达和产。然而自然界的生物体是十分复杂的有机整体许多的功能性状并不是单个基因可简单调控的即使像海藻一样简单的双糖在酵母中的代谢途径也需要个基因产物的直接参与。目前进行多基因转化研究的主要技术手段有两种一种是单质粒载体的转化即几个目的基因和标记基因在同一载体质粒上另一种是目的基因和标记基因位于不同的载体上的共转化研究后者的主要优点在于能在分离的世代中把在生产中没有意义的基因分离同时也可以转入更多的外源基因基因枪转化方法则是实现其转化的主要途径。 基因枪技术( Particle gun) ,又称生物弹或生物发射法(Biolistic process) 、粒子轰击技术( Particle bombardment) 和高速微粒子发射技术( High - velocity microprojectile) 。其原理是利用高速飞行的微米或亚微米级惰性粒子(钨或金粉) ,将包被其外的目的基因直接导入受体细胞,并释放出外源DNA ,使DNA 在受体细胞中整合表达,从而实现对受体细胞的转化。根据动力来源不同,基因枪可大体分为火药式( Gunpowder )、放电式( Elect ric discharge) 和气动式(Pneumatic) 3 种类型。1987 年美国康乃尔大学的J . C. Santord 等设计制造的火药式基因枪是最初的基因枪。到目前为止还有以化学推进剂为动力(弹药枪) 和以放电为动力(电子枪) 用于粒子轰击细胞的新工具,特点是能转化有细胞壁的植物细胞,并能直接向细胞器中输入DNA ,或用来转化花粉以避开组织培养的操作。在全面推广粒子枪之前还要进行开发和改良,更有效的电子枪会取代弹药枪。 2 基因枪法在禾谷类作物遗传转化中的应用 2.1 转化目的基因改良作物性状在用基因枪法转化禾谷类作物的研究中,转化的目的基因主要有抗除草剂基因、抗虫基因、抗病基因、雄性不育基因等。 2.1.1 转化抗除草剂基因 抗除草剂基因既可用作选择标记基因建立遗传转化系统,又能作为目的基因,使转基因作物在生长期间可使用除草剂除草,从而免去人工除草工作,节省了大量劳力。常用的抗除草剂基因是PPT 乙酰转移酶基因(又称bar 基因) ,抗除草剂bialaphos。用基因枪法将bar 基因转化小麦[、水稻、玉米、高粱,均获得了抗除草剂植株。 2.1.2 转化抗虫基因 在禾谷类作物中,用基因枪法转化的抗虫基因主要是苏云金芽孢杆菌的晶体蛋白基因(Bt 基因) ,而且在玉米中报道得较多,王国英等用基因枪法将Bt 基因转化玉米胚性愈伤组织,获得了转Bt 基因的植株,对一个转Bt 基因植株的杂交后代进行了玉米螟抗性的田间鉴定,抗虫和感虫植株的比例接近1∶1 ,符合孟德尔单显性基因的遗传规律。在水稻中,用改良的苏云金杆菌δ—内毒素[cryIA(b) ]基因经基因枪法转化,获得了能育的抗黄茎钻蛀虫转基因粳稻植株。 2.1.3 转化抗病基因 简玉瑜等用基因枪法将抗菌肽B(cecropin B) 基因导入水稻得到了转基因植株,对T3 代抗白叶枯

相关主题
文本预览
相关文档 最新文档