当前位置:文档之家› 线粒体基因组全序列及 系统发育地位研究

线粒体基因组全序列及 系统发育地位研究

线粒体基因组全序列及 系统发育地位研究
线粒体基因组全序列及 系统发育地位研究

2009年 第54卷 第9期: 1250 ~ 1261

https://www.doczj.com/doc/646202928.html, https://www.doczj.com/doc/646202928.html,

《中国科学》杂志社

SCIENCE IN CHINA PRESS

论 文

美姑脊蛇Achalinus meiguensis 线粒体基因组全序列及系统发育地位研究

王广力①, 何舜平②, 黄松③, 何苗①, 赵尔宓①④*

① 四川大学生命科学学院, 成都 610064; ② 中国科学院水生生物研究所, 武汉 430072; ③ 黄山学院生命与环境科学学院, 黄山 245041; ④ 中国科学院成都生物研究所, 成都 610041 * 联系人, E-mail: zem006@https://www.doczj.com/doc/646202928.html, 2008-10-21收稿, 2009-03-13接受

摘要 报道了美姑脊蛇Achalinus meiguensis 线粒体基因组全序列. 美姑脊蛇线粒体全序列长17239 bp, 由22个tRNA, 2个rRNA 和13个蛋白质基因及2个非编码的控制区或D-loop 组成, 存在着基因重排现象. 对已报道蛇类线粒体基因组全序列进行比对分析后, 发现一些蛇类线粒体基因组进化规律: 双控制区现象在爬行动物进化历史中独立地发生, 有不同的演化历史; tRNA 假基因是在真蛇下目(Caenophidia)中进化形成的; T ΨC 臂的相对较短(一般少于 5 bp)和缺失“DHU”臂造成蛇类tRNA 较短. 通过MP 和BI 分析确定美姑脊蛇系统发育位置应该位于瘰鳞蛇Acrochordus granulatus 和其他真蛇下目蛇类之间, 而不应该属于游蛇科Colubridae 或者眼镜蛇科Elapidae. 由于美姑脊蛇与真蛇下目中蝰科Viperidae 、游蛇科以及眼镜蛇科之间的单系性都被统计检验拒绝(P < 0.01), 由此认为美姑脊蛇所在的闪皮蛇亚科(Subfamily, Xenodermatinae)应该提升到科或者更高的分类阶元. 依据系统发育统计检验结果, 我们选择Bayesian 树来进行分歧时间的估算. 原蛇下目与真蛇下目的分化时间为109.50 Mya; 而瘰鳞蛇与其他真蛇下目种类的分化时间为106.18 Mya; 美姑脊蛇的分化时间在103 Mya; 蝰科与眼镜蛇科和游蛇科构成的单系群的分化时间发生在96.06 Mya.

关键词 美姑脊蛇 线粒体全序列系统发育 分化时间

在不同动物类群中, 线粒体基因组在基因结构和基因排列方式等方面均显示了极大的多样性, 这种多样性可能反映了真核细胞不同的进化路线[1]. 就目前的研究而言, 线粒体基因组是一个能够从基因组水平上来分析动物系统发生的分子标记, 可以从线粒体基因组序列信息、基因组成及基因排列方式等进行多方位的分子进化研究. 因而线粒体基因组全序列成为研究动物分子系统发生最有力的证据之一[1]

. 蛇的线粒体基因组大体构造与其他脊椎动物相似, 2个rRNA, 22个左右的tRNA 和13个左右的蛋白编码基因, 至少一个非编码区(control region), 但是蛇类线粒体全序列在其组成、结构与功能等方面又有着一

些与众不同的特点, 如紧凑的基因结构、双控制区、

缩短的tRNA 以及较快的进化速度等[2~5].

脊蛇属Genus Achalinus Peters, 1869在分类上隶属于游蛇科Family Colubridae, 闪皮蛇亚科Subfamily Xenodermatinae [6,7]. 该属的模式种是黑脊蛇(Acha- linus spinalis ). 脊蛇属蛇类已知有9种, 除1种外, 在中国均有分布, 其中5种是中国特有种. 美姑脊蛇(Achalinus meiguensis Hu and Zhao, 1966)是中国的特产蛇类, 区别于其他脊蛇的主要形态特征是具鼻间鳞和一枚极小的眶后鳞[8]. 目前仅见于四川的美姑、安县、洪雅、峨眉、宝兴、汶川、卧龙、屏山等以及云南省水富县, 已报道的分布海拔在1500~3000 m 之

论文

间[7,9]. 由于分布的局限性及生境的特殊性, 关于美姑脊蛇研究的文献很少, 而且这些研究大多为形态描述, 对其生态学或者分子生物学研究尚未见报道.

本文首次报道美姑脊蛇的线粒体基因组全序列, 并通过与蛇类已有的线粒体基因组全序列比较, 探讨蛇类线粒体基因组全序列的结构及进化等特点. 闪皮蛇亚科及脊蛇属的系统发生研究中存在基因少、支持率低等问题, 本文使用线粒体基因组全序列来进行系统分析, 试图更好地解决它们的系统关系.

1 材料与方法

(ⅰ) 基因组DNA的提取. 美姑脊蛇采自四川省安县千佛山自然保护区, 实验材料用95%的酒精保存, 标本用6%福尔马林溶液固定, 并保存于四川大学. DNA的提取参照标准酚-氯仿法进行[10], 所提取的DNA置于?20℃保存备用.

(ⅱ) 引物设计. 首先, 使用蛇类编码基因通用引物[11~15]扩增出美姑脊蛇的ND1, ND2, ND4和Cyt b片段. 然后与从GenBank中下载的阿尔卡链蛇(Dinodon semi-carinatus, NC_001945)、冲绳烙铁头(Ovophis oki-navensis, NC_007397)、瘰鳞蛇(Acrochordus granula- tus, NC_007400)和球蟒(Python regius, NC_007399)等线粒体基因组全序列进行排列比对, 选取保守性较高的区域, 设计了可以覆盖美姑脊蛇线粒体基因组全序列的11对PCR 引物(表1).

(ⅲ) PCR扩增和序列测序. PCR反应体系大概含有约50 ng的模板DNA, 10×缓冲液5 μL, 2.5 mmol/L dNTP各2 μL, 引物(10 pmol/L)各2.5 μL, Taq聚合酶2.0 U, 最后补足灭菌双蒸水至终体积. PCR反应条件为: 95℃预变性3 min; 94℃变性30 s, 48~58℃退火30 s, 72℃延伸90 s, 35个循环; 最后72℃延伸8 min. 为防止污染, 所有PCR反应都设立空白对照组; 扩增产物使用0.8%的琼脂糖凝胶电泳检测, 用BioStar Glass-milk DNA纯化试剂盒(加拿大)回收, 纯化后的线粒体基因使用ABI3730测序仪(美国)测序. 为保证所测序列的可靠性, 每一样品均进行双向测序.

(ⅳ) 序列分析. 获得的序列用Blast软件与GeneBank数据库的序列比对, 以及用Clustal X 1.83软件[16]与已发表的近缘物种的线粒体基因组全序列进行比对, 编码蛋白序列的准确起止位置根据脊椎动物线粒体基因组起止密码子确定, 并使用Sequin (Version5135)软件确定了13个蛋白质基因的位置和DAMBE软件来计算序列的碱基组成和密码子使用频率. 通过tRNA Scan-SE软件[17]定位了21个tRNA基因, 通过Clustal X 1.83软件与4种蛇线粒体基因组全序列进行比对, 定位了剩余的一个tRNA-Ser (AGC)和2个rRNA基因, 并且对其余的基因位置进行了修正和确定. tRNA的二级结构用RNAstructure4.5 (https://www.doczj.com/doc/646202928.html,/rnastructure.htmLmL)软件推测.

(ⅴ) 系统发育分析. 从GenBank 上下载16种蛇的线粒体基因组全序列(表2), 在13个编码基因中, 由于ND6在轻链编码, 在核苷酸和氨基酸组成上与其他12个编码基因差异明显, 因而在构建系统发生序列矩阵时该基因被排除[20,22,28,29]. 为了考察蛇亚目的单系性, 我们分别选择两栖类、龟类、鳄鱼类、鸟类、蜥蜴等类群的代表种作外类群(表2).

系统发育分析分别采用最大简约法(maximum

表1 美姑脊蛇线粒体基因组全序列测定所使用的引物

引物编号上游序列(5′→3′) 下游序列(5′→3′) 退火温度/℃测序长度/bp

E39734/E39735 TAATCTCCGTGCCAGCGAC CTTCACAGGGTCTTCTGGTCTT 58 1776

E45266/E45267 GCCTGCCCAGTGAACATT GCGTTCTAGGAGGGTGAGG 55 779

E46268/E45269 TCCGCTACGACCAACTCAT TGCTCAGGCTATTAGTCAGTG 52 1654

E40978/E40979 CTTCTACAGTAAGGTCAGC TTAGTCAGTTGCCAAAGCC 50 1847

E40980/E40981 TGGACATTGACAGACGAGC TATGCGGTGGTCTACTTC 49 1260

E54599/E54600 CGATCCCTCTACCTAATAGAAGAAGT GGAGTAGGAGGATGATTTCTAGGTCAA 48 2393

E42227/E42228 ACCCACGCCCTAATACTCA ATGTGGCTGATAGAGGAG 52 1919

E42229/E42230 CATCTCTGACTACCAAAAGC GTCCAATGTCTCCGATACG 51 1435

E42046/E42047 CAACGAACAAGACATCCG TCCACCAGGTTGAGATGTT 52 1398

E42231/E45098 CATCCTACGCTCTATCCC ATGGTAGTCAGGTGAAAGG 48

995

E45099/E42232 CCACTGGTTACACTCTCAAG GTGATTAGTTTGGCTTATGG 50 1020

1251

2009年5月第54卷第9期

表2 本研究所用的线粒体基因组序列

物种名称 GenBank登录号来源及出处

[18]

Agkistrodon piscivorus NC_009768 [5]

Boa constrictor NC_007398 [18]

Cylindrophis ruffus NC_007401 [18]

Deinagkistrodon acutus NC_010223 Yan J, et al. 未发表

Dinodon semicarinatus NC_001945 [3] Enhydris plumbea NC_010200 Yan J, et al. 未发表

Eunectes notaeus AM236347 [19]

Leptotyphlops dulcis NC_005961 [20]

Naja naja NC_010225 Yan J, et al. 未发表

Ovophis okinavensis NC_007397 [18]

Pantherophis guttatus guttatus AM236349 [19]

Pantherophis slowinskii NC_009769 [5]

Python regius NC_007399 [18]

Ramphotyphlops braminus NC_010196 Yan J, et al. 未发表

Xenopeltis unicolor NC_007402 [18]

Pelomedusa subrufa NC_001947 [21]

Dogania subplana NC_002780 Farajallah A, et al.未发表Iguana iguana NC_002793 [22]

Sceloporus occidentalis NC_005960 [20]

Rhineura floridana NC_006282 [23]

Geocalamus acutus NC_006285 [23]

Corvus frugilegus NC_002069 [24]

Vidua chalybeata NC_000880 [25]

Smithornis sharpei NC_000879 [25]

Acanthisitta chloris NC_003128 [26]

Alligator sinensis NC_004448 Wu X, et al.未发表

Gavialis gangeticus NC_008241 已投稿

Xenopus laevis NC_001573 [27]

Achalinus meiguensis 本研究

parsimony, MP)和贝叶斯法(Bayesian inference, BI)进行分析. MP分析在PAUP*4b10软件[30]中完成. 分析选择启发式搜索(heuristic search)、树二等分再连接选项(tree-bisection reconnection, TBR)和100次随机加入序列(addition sequence replicates)等参数进行搜索最大简约树. 所有位点均作无序特征处理, 分析前排除所有无信息位点. 检验MP 树中各节点可信度采用非参数自展法(non-parametric bootstrap)重复检测, 参数设定: nreps = 1000, search = heuristic, conlevel = 50, addseq = random, swap = TBR.

贝叶斯分析采用MrBayes3.1.2软件[31], 以后验概率(posterior probability, PP)来表示各分支的可信度. 替代模型根据MODELTEST v.3.7软件[32]中等级似然率(hLRT)和AIC检验标准来选择替代模型. 起始树设为随机树, 马尔科夫链的蒙特卡洛方法设置为4条链同时运行3×106代, 3条热链1条冷链. 每100代对系统树进行抽样, 最终得到30001棵系统发育树, 重复一次以确保MCMC的收敛. 将运行过程中所得的冷链对数似然值(log-1ikelihood scores)与相应的代数进行作图, 找到对数似然值达到饱和的位置, 到达饱和前的数据被作为老化样本(burnin samples)而舍弃. 在舍弃老化样本后, 根据剩余的样本构建一致树(consensus tree)并计算相关参数.

(ⅵ) 系统发育树检测. 系统发育树构建完毕后, 采用Shimodaira-Hasegawa (SH)检测[33]判断不同构树方法所构成的系统发育树之间是否收敛; 而从一系列相互竞争的拓扑树或系统育假设中选择最优的系统发育树时, Shimodaira-Hasegawa检测和approximately unbi-ased (AU)检测[34]两种统计检验同时被采用, 前者包含在PAUP*4.0b10软件中, 后者则通过CONSEL 0.1f 软件[35]完成, 并且所有统计检验都是基于同一核苷酸替代模型, 即GTR + G + I模型(根据等级似然率和

1252

论 文

AIC 选择标准选择最适合的替代模型).

(ⅶ) 美姑脊蛇分化时间. 为了检验是否偏离分子钟, 将有分子钟约束的ML 树与不受分子钟约束的ML 树的似然对数值进行比较[36]; 如果两者差异显著, 则分子钟被拒绝. 对数似然比检验表明, 不同谱系联合线粒体蛋白编码基因数据(χ2 = 1443.035, d f = 28, P < 0.001)序列的分子钟假设被拒绝, 不宜采用全局分子钟(global clock)来估算分支时间.

因此本研究采用松散分子钟约束的Bayesian 方法

[37]

和罚分似然法[38]估算分支之间的分歧时间. 这两种

方法都放宽了对严格分子钟中系统发育类群间相同的、稳定的替代速率的约束, 而是允许数个分子钟及分化时间校正. Bayesian 方法在MULTIDISTRIBUTE 软

件[39]中执行, 并将不同基因、

不同进化谱系的进化速率的差异进行整合. 这一分子钟估算方法的运算过程可以分为两步: 第一步, 从数据和基于F84+G 进化

替代模型获得的稳定拓扑结构的系统树中, 运行ESTBRANCHES 来估计分支的枝长. 这一过程允许位点进化速率按照分散的γ 分布而变异, 这一分布依照4种替代形式速率的方差-协方差数据矩阵计算[40,41]

. F84+G 进化替代模型中的参数用PAML 软件的BASEML 程序[42]来估计. 第二步, 用MULTI- DIV-TIME [39]估算分化事件的时间及标准差, 并且通过Markov chain Monte Carlo 方法来估算95%水平的置信区间. Markov 链运行100000代, 在舍弃初始的300000次循环的代数后, 每100代抽样一次. 在运行MCMC 之前, 我们先对根节(tree root)年龄、根节速率以及分支自主相关速率的平均值及标准误等参数进行预设: 以300 Mya 前(标准误SD = 50 Mya)作为根节到顶端分化时间的期望值(rttm = 300), 但不对节点分化时间进行限定; 每位点每百万年0.002655的替换(SD = 0.002655)作为tree root 节点的进化速率(rtrate = 0.002655; rtratesd=0.002655); 系统树上沿着衍生枝, 控制每百万年速率与分支自主相关程度尺度的参数设置为.0361 (brownmean = 0.0361, brownsd = 0.0361). 根节到顶端的分化时间最大可能值设置为350 Mya (bigtime = 350). 为检测Markov chain Monte Carlo 的收敛性, 这一过程以不同的起始树至少运行2次.

0MULTIDIVTIME 程序允许对标定点进行最大、最小时间尺度的限定. 本研究采用两个校正点:

(1) 蛇类和蜥蜴类分化时间大约在130~150 Mya [43];

(2) Acanthisitta chloris , Corvus frugilegus 和Vidua cha-lybeata 的分化时间最少82 Mya [44].

罚分似然法在R8S 软件[45]中执行, 该种方法通过最优树的枝长来推算分支之间的分化时间, 采用 Powell 和TN 方法进行优化, 最佳平滑值由交叉验证法(Cross-validation)获得. 同时, 分子钟的分化时间校正也采用以上两个标定点.

2 结果与分析

2.1 美姑脊蛇mtDNA 结构

美姑脊蛇线粒体基因组序列全长为17239 bp, 为一环形的双链DNA (图1). 与大多数蛇类的基因组成及顺序相同[3], 美姑脊蛇线粒体基因组由13个蛋白编码基因, 22个tRNA 基因和2个rRNA 基因(16S rRNA 和12S rRNA)组成. 其中主链(majority-strand), 即H-链编码了29个基因, 而次链(minority-strand), L-链包含了8个基因. 另外将在tRNA-Ile 和tRNA-leu 间以及tRNA-Pro 和tRNA-Phe 间区域的1062和1063 bp 确定为两个非编码区(non-coding region), 即控制区(control region, CR).

(ⅰ) 蛋白编码基因. 在13个蛋白质编码基因

图1 美姑脊蛇(Achalinus meiguensis )线粒体基因组基因

构成

tRNA 基因以相应氨基酸的单个大写字母表示. 其他基因的缩写分别为: ND1~6为NADH 脱氢酶亚基1~6; CO Ⅰ~Ⅲ为细胞色素氧

化酶亚基Ⅰ~Ⅲ; ATP6~8为腺苷三磷酸酶亚基6~8; Cyt b 为细胞 色素b. O H 和O L 分别表示重链和轻链的复制起点

1253

2009年5月 第54卷 第9期

1254

中, 除ND6定位在轻链外, 其他均定位在重链上. 这些基因都没有内含子, 有些与其他基因有少许重叠(表3). 细胞色素氧化酶亚基Ⅱ和Ⅲ(CO Ⅱ, CO Ⅲ), ND4, ND4L, ND5, ATPase 6和Cyt b 等蛋白编码基因以ATG 为起始密码子, CO Ⅰ和ATPase 8以GTG 为起始密码子, ND1, ND2, ND6和ND3则分别以ATA 和ATT 为起始密码子, 这与其他蛇亚目种类对起始密码子的选择无显著差异. 终止密码子包括4个TAA 和4个AGG, 某些蛋白编码基因如ND1, ND2, CO Ⅲ, ND3, Cyt b 等则使用了非标准终止密码子, 即不完全终止密码子T.

美姑脊蛇线粒体基因组13个蛋白编码基因的密码子使用情况如表 4. 对于氨基酸四重简并的位点, 碱基C 出现的频率最高, 其次是T 或A. 而两重简并的位点, 碱基C 出现的频率稍高于T. 除了氨基酸Arg 密码子外, 碱基G 在其他密码子第三位上都是最

少的, 这种低G 偏倚现象在脊椎动物中很普遍. 在美姑脊蛇蛋白编码基因中, C 的含量最高, 平均为32.8%; G 的含量最低, 平均仅为13.7%, 蛋白质编码基因密码子的第一、第二和第三位点的A + T 的平均百分含量(50.7%, 57.8%, 52.2%)均高于G + C 含量, 其中第二位点占的比例最高(57.8%). 这一点与线粒体基因组有高AT 偏向性的特征是吻合的. (ⅱ) RNA 基因. 美姑脊蛇含有的22个tRNA 基因, 可以满足线粒体蛋白质翻译中所有密码子的需要, 其长度为49 bp (tRNA-Cys)~73 bp (tRNA-Leu, tRNA-Asn). 其中tRNA-Glu, Ala, Asn, Cys, Tyr, Ser, Gln, Pro 由L-链编码, 其余由H-链编码. H-链编码的tRNA 基因散布于蛋白质基因和rRNA 基因之间, 相邻基因间隔1~30个碱基或紧密相连, 甚至也发生重叠. 一般说来, 脊椎动物的线粒体tRNA-Met, His, Leu(CUN)等序列保守性最高, 可达80%以上, 而

表3 美姑脊蛇线粒体蛋白编码基因

基因/区域

起始位置

终止位置

间隔(+)/重叠(?)

起始密码子

终止密码子

序列长/bp

氨基酸(aa)

编码链a)

ND1 2545 3493 ATA T++ 949 318 H ND2 4826 5849 ATA T++ 1024 341 H COI 6210 7810 +1 GTG AGG 1601 533 H COII 7936 8622 +4 ATG AGG 687 229 H ATPase 8 8686 8853 GTG TAA 168 56

H

ATPase 6 8844 9518 ?10 ATG TAA 675 225 H COIII 9518 10301 ?1

ATG T++ 783 261 H ND3 10362 10704 ATT T++ 343 114 H ND4L 10769 11059 ATG TAA 291 97 H ND4 11059 12411 ?1

ATG AGG 1353 451 H ND5 12604 14352 +1 ATG TAA 1749 583 H ND6 14348 14851 ?5

ATA AGG 504 167 L CYT b 14924 16040 +1 ATG T++ 1117 372

H

a) H, 重链; L, 轻链

表4 美姑脊蛇蛋白质编码基因碱基使用a)

物种

基因 T% C% A% G% (A+T)1% (A+T)2% (A+T)3% ND1 25.4 32.0 29.1 13.5 52.4 55.8 55.3 ND2 22.0 35.6 29.7 12.7 57.1 51.3 46.6 CO1 25.7 30.0 25.3 18.9 49.8 55.3 48.2 CO2 22.2 32.7 28.3 16.7 41.7 59.9 50.2 ATP8 19.6 31.0 35.1 14.3 50.0 53.6 60.7 ATP6 25.2 35.5 27.4 11.9 48.5 59.2 50.4 CO3 25.4 31.8 24.7 18.1 45.8 59.7 44.8 ND3 23.0 35.6 26.2 15.2 42.6 48.2 57.1 ND4L 24.8 32.1 28.3 14.8 52.6 62.9 43.8 ND4 23.1 34.8 29.1 12.9 46.1 51.9 58.7 ND5 24.0 33.4 30.7 11.9 57.9 58.0 48.0 ND6 17.0 28.1 51.3 3.7 61.3 76.5 67.1 美姑脊蛇Achalinus meiguensis

Cyt b

26.4 33.8 26.8 13.1 52.9 58.7 47.9 平均

23.4 32.8 30.2 13.7 50.7 57.8 52.2

a) (A + T) 1%, (A + T) 2%, (A + T) 3%分别指蛋白质编码基因密码子的第一、第二和第三位点的A +T 的百分含量

论文

tRNA-Ser (AGY)的变异最大, 同源性只有54%~64%. Mt-tRNA可形成典型的三叶草形二级结构, 一般含有7个碱基的氨基酸接受臂, 5个碱基的TΨC臂, 反密码子臂及4个碱基的双氢尿嘧啶(DHU)臂, 各臂碱基对存在高比例的错配.

美姑脊蛇线粒体基因组包含了两条rRNA基因, 分别是16S rRNA和12S rRNA. 其位置与其他蛇类相同. 16S rRNA和12S rRNA基因序列分别为1486和933 bp, 这两个基因A + T含量分别为56.6%和51.1%, 均高于各自G + C含量(43.4%和48.9%).

(ⅲ) 非编码区. 至今为止, 蛇亚目中已测的mtDNA全序列, 除Leptotyphlops dulcis, Ramphotyph- lops braminus和Typhlops murius有一个控制区外, 其余种类都有两个完全复制的控制区[5]. 美姑脊蛇也有两个控制区, 占全序列的12.4%, 这个区域富含AT (A + T为62.5%). 由于缺少编码序列所具有的碱基约束性, 控制区被认为是线粒体基因组中变异最大的部分[46]. 但是在所有脊椎动物线粒体控制区也存在若干共同的保守区, 如重链复制起点以及重链和轻链转录的驱动子[47]. 控制区通常分为3个区域: 终止序列区、中央序列区和保守序列区[48]. 这3个区域中, 碱基T 的含量变化不大, 保持在35.4%~37.8%之间; 碱基A 的平均含量在终止序列区(30.2%)和保守序列区(28.9%)稍高于中央保守区(27.2%); 而碱基G的含量最低, 在7.6%~11.8%之间, 这与整个线粒体基因组序列相似.

2.2 系统发育关系

最大简约分析产生了1个最简约的系统发育树, 树长为52912, CI = 0.3203, RI = 0.4361. 图2显示了50%主要合意树. 简约分析支持蛇亚目为一个单系群, 支持率为100%. 钩盲蛇和细盲蛇形成姊妹群, 支持率为100%, 处于基部. 其他蛇类可以分为两个主要分支: 分支Ⅰ包括美姑脊蛇(Achalinus meiguensis)、瘰鳞蛇(Acrochordus granulatus)、黄水蚺(Eunectes notaeus)、球蟒(Python regius)、闪鳞蛇(Xenopeltis unicolor)、红尾筒蛇(Cylindrophis ruffus)和巨蚺(Boa constrictor), 支持率仅为43%; 分支Ⅱ包括玉米蛇(Pantherophis guttatus)、Pantherophis slowinskii、半棱链蛇(Dinodon semicarinatus)、冲绳烙铁头(Ovophis okinavensis)、铅色水蛇(Enhydris plumbea)、印度眼镜蛇(Naja naja)、尖吻蝮(Deinagkistrodon acutus)和食鱼蝮(Agkistrodon piscivorus), 支持率为100%. 在分支Ⅰ中, 黄水蚺和巨蚺有最近共同祖先(BP = 100%),

它们与由闪鳞蛇、球蟒和红尾筒蛇组成的单系群(BP

= 80%)构成姊妹群, 支持率为98%. 这个类群再和由

美姑脊蛇与瘰鳞蛇组成的亚枝互为姊妹群关系. 在

分支Ⅱ中, 蝰科形成一单系群, 与由眼镜蛇科和游蛇

科的种类构成姊妹群. 游蛇科铅色水蛇与眼镜蛇科

的印度眼镜蛇有最近的共同祖先, 但支持率仅为

49%.

Bayesian分析方法所揭示的蛇类系统发育关系

与最大简约分析结果相似(图3). 蛇亚目构成一个单

系群, 得到高的后验概率支持(PP = 1.00). 不同于最

大简约树, 基于形态学划分的盲蛇下目 (Scoleco-

phidia)、原蛇下目(Henophidia)和真蛇下目(Caeno-

phidia)[49,50]各自形成单系群, 瘰鳞蛇处于真蛇下目的

基部, 其次是美姑脊蛇, 它与蝰科、眼镜蛇科和游蛇

科组成的单系群互为姊妹群, 后验概率为1.00. 无论

是最大简约分析, 还是Bayesian分析, 两种系统发育

分析方法都较好地解决了蛇类下目间的系统发育关

系.

2.3 分子钟估算

依据系统发育统计检验结果(表5), 我们选择

Bayesian树来进行分歧时间的估算. 如材料和方法中

所阐述, 树中分支节点的分歧时间的估算是在松散

分子钟约束下, 采用Bayesian方法分析完成的. 估算

出蛇亚目的分化时间在128.03 Mya, 其95%置信区

间为124.32~131.60 (C2, 表6, 图4). 原蛇下目与真

蛇下目的分化时间为109.50 Mya, 其95%置信区间

为106.07~113.71 (C3, 表6, 图4); 而瘰鳞蛇与其他

真蛇下目种类的分化时间为106.18 Mya, 其95%置

信区间为103.17~110.22 (C4, 表6, 图4); 美姑脊蛇

的分化时间在103 Mya (C5, 表6, 图4); 蝰科与眼镜

蛇科和游蛇科构成的单系群的分化时间发生在96.06

Mya (C6, 表6, 图4), 这与蝰科的化石记录一致.

3 讨论

3.1 蛇类线粒体基因组进化特点

在已测出全序的17种蛇中, 除了属于盲蛇下目

Leptotyphlops dulcis, Ramphotyphlops braminus和

Typhlops murius有单一的控制区, 其他种类都具有双

控制区, 并且控制区加倍事件发生约为128 Mya

(95%置信区间: 124.32~131.60). 这与Dong等人[18]的

观点不一致. 由于控制区加倍事件不仅仅在蛇亚目

1255

2009

年5

第54卷 第9期

图2 采用PAUP*4.0b10软件的最大简约法所构建的最大简约一致树

基于13个线粒体蛋白编码基因序列的联合数据. Tree length = 52912, CI = 0.3203, RI = 0.4361. 节点处的数值代表1000次重

复抽样所得的自展支持率

种类存在, 而且在蜥蜴和龟等其他爬行动物也出现过[51~53]. 因此, 这个事件在爬行动物进化历史中独立地发生, 有不同的演化历史.

在有些蛇类的第二个控制区(CR Ⅱ)侧翼含有一个Apro (tRNA-pseudo)假基因[2,3,5,18,19]. 通过序列比较发现, 假基因仅出现在大多数的真蛇下目种类中, 在盲蛇下目、原蛇下目以及真蛇下目中较原始的类群如瘰鳞蛇中未发现这个假基因. 据此推测, tRNA 假基因是在真蛇下目中进化形成的, 这个事件发生在96 Mya (95%置信区间: 95.03~98.91), 在游蛇科和蝰

科分化之前. 美姑脊蛇没有发现Apro 假基因, 因此可以进一步说明美姑脊蛇可能是真蛇下目中较原始的类群, 可能与瘰鳞蛇有更近的系统发育关系.

典型的脊椎动物线粒体t R N A 基因的长度为59~75 bp [54], 本研究中美姑脊蛇tRNA 最短的49 bp (tRNA-Cys), 最长的73 bp (tRNA-Leu, tRNA-Asn), 明显短于一般脊椎动物. Kumazawa 等人[2,3]认为, T ΨC 臂的缩短和缺失是造成该现象的主要原因, 我们通过研究发现, 除了T ΨC 臂的相对较短(一般少于 5 bp)外, 与其他脊椎动物一样, 缺失“DHU”臂[48,55], 从而

1256

论文

图3 采用GTR+G+I进化模型进行Bayesian分析所得的50%多数一致树

基于13个线粒体蛋白编码基因序列的联合数据. 节点处的数值为该节点的后验概率

表5 基于联合数据矩阵的蛇亚目各种系统发育假设的统计检验结果a)

?ln LΔln L SH AU wSH KH

1.0

0.98

0.94

best

Bayesian 206092.92554

0.06

0.218

0.062

ML 206098.11317

5.16

0.80

0.049*

0.018*

0.02*

0.12

34.411

MP 206127.33654

Acrochordus granulatus, A. meiguensis 206113.35875 20.433 0.27 0.08 0.10 0.06

A. meiguensis, Caenophidia 206204.73579 111.81 0.00* <0.01* 0* 0*

A. meiguensis, Henophidia 206142.72538 49.799 0.01* <0.01* <0.01* 0*

A. meiguensis, Scolecophidia 206178.70643 85.781 0.00* <0.01* <0.01* 0*

A. meiguensis, Naja naja206130.47735 37.552 0.10 <0.01* 0.035* 0.01*

a) *, 数据比较差异显著(P < 0.05)

1257

2009年5月第54卷第9期

表6 基于联合数据矩阵的Bayesian松散分子钟估算的分歧时间以及95%置信区间

后验分歧时间

节点

PL

时间/Mya SD 95%CI

136.60

131.59667) C2 128.02298 1.84106

(124.32289,

133.70649)

110.89

(106.07292,

C3 109.49212 1.94583

110.22145)

105.52

(103.16504,

C4 106.17837 1.79985

106.87422)

100.88

(100.17461,

C5 102.99953 1.70577

98.24

98.91085)

(95.03028,

C6 96.05575

1.05125

93.06151)

(84.08853,

95.00

2.23792

C7 88.93544

75.50340)

(53.01370,

67.61

5.75942

C8 65.78173

30.36626)

27.29

(9.76417,

5.41546

C9 20.07852

82.00

88.28126)

C10 82.74693 3.28289

(75.46274,

74.51996)

62.11

(50.63093,

C11 64.00465 6.09093

62.62928)

56.63

(37.69466,

C12 51.56585 6.39901

99.46

107.82987) C13 102.62786 2.72198 (97.16197,

77.19

88.80835)

C14 78.53894 6.09655

(64.99476,

99.46

102.42330) C15 96.13243 3.54611

(88.54137,

83.37

93.96931)

C16 86.70014 4.28593

(76.95398,

129.03

127.61041) C17 123.80419 1.94522

(119.94754,

图4 采用Bayesian分析基于松散分子钟方法估算蛇亚目种类的分化时间

表示用于分子钟校正的标定信息

1258

论文

形成二叶草结构, 也是造成蛇类tRNA短的重要原因. 类似现象还出现在鳄类等爬行动物中[56~58].

3.2 系统发育分析

基于传统形态学研究, 蛇类被划分为3类: 盲蛇下目(Scolecophidia)、原蛇下目(Henophidia)和真蛇下目 (Caenophidia)[49,50]. 我们的BI分析结果有力支持了这3个类群的单系性, 并且支持盲蛇下目最先分化出来, 原蛇下目和真蛇下目互为姊妹群.

在真蛇下目中, 瘰鳞蛇(Acrochordus granulatus)是一种分化较早的蛇类, 这一点已经得到普遍的认可[59~63]. 有关脊蛇的系统发育位置却存在很大的争议, 脊蛇最初被归类到游蛇科(Colubridae)闪皮蛇亚科(Xenodermatinae)脊蛇属(Achalinus). 近年来, 闪皮蛇亚科被认为是真蛇下目(Caenophidia)中较原始的种类, 分化时间仅次于瘰鳞蛇类[62,64,65]. Kraus等人[59]根据闪皮蛇亚科形态学特征以及与瘰鳞蛇类之间的关系, 建议将其归入瘰鳞蛇超科(“Acrochordoidea”). Vidal 等[65]则把闪皮蛇亚科提升为闪皮蛇超科(“Xenoderma- toidea”). Lawson等人[66]基于Oxyrhabdium leporinum的Cyt b和C-mos基因片段, 认为闪皮蛇亚科(Xenoder- matinae)应归于眼镜蛇科(Elapidae). 从我们的系统发育关系来看, 不支持美姑脊蛇归属于游蛇(Achalinus rufescens)科或者眼镜蛇科(表5, P<0.01); 也不支持与瘰鳞蛇有更近的系统发育关系, 但是所有统计检验都不拒绝美姑脊蛇和瘰鳞蛇构成姊妹群(表5, P > 0.05). 基于ND4基因序列分析, Vidal等人[62]认为瘰鳞蛇、棕脊蛇Achalinus rufescens和Xenodermus javanicus聚类在一起, 但节点并没有得到强烈支持. 由于测全序的蛇种类有限, 目前的研究无法准确判断瘰鳞蛇和美姑脊蛇之间的系统发育关系. 最后, 由于美姑脊蛇与真蛇下目中蝰科、游蛇科以及眼镜蛇科之间的单系性都被统计检验拒绝(表5, P<0.01), 因此, 我们认为美姑脊蛇所在的闪皮蛇亚科应该提升到科或者更高的分类阶元.

参考文献

1Saccone C, Lanave C, Pesole G, et al. Influence of base composition on quantitative estimates of gene evolution. Methods Enzymol,

1999, 183: 570—583[DOI]

2Kumazawa Y, Ota H, Nishida M, et al. Gene rearrangements in snake mitochondrial genomes: Highly concerted evolution of con-

trol-region-like sequences duplicated and inserted into a tRNA gene cluster. Mol Biol Evol, 1996, 13(9): 1242—1254

3Kumazawa Y, Ota H, Nishida M, et al. The complete nucleotide sequence of a snake (Dinodon semicarinatus) mitochondrial genome

with two identical control regions. Genetics, 1998, 150(1): 313—329

4Jiang Z J. Evolutionary patterns in snake mitochondrial genomes. Doctor dissertation. Baton Rouge: Louisiana State University, 2006

5Jiang Z J, Castoe T A, Austin C C, et al. Comparative mitochondrial genomics of snakes: Extraordinary substitution rate dynamics and

functionality of the duplicate control region. BMC Evol Biol, 2007, 7(1): 123[DOI]

6Peters W C H. über neue Gattungen und neue oder weniger bekannte Arten von Amphibien (Eremias, Dicrodon, Euprepes, Ly-

gosoma, Typhlops, Eryx, Rhynchonyx, Elapomorphus, Achalinus, Coronella, Dromicus, Xenopholis, Anoplodipsas, Spilotes, Tropi-

donotus). Berlin: Monatsber. K. Preuss. Akad. Wiss., 1869. 432—447

7赵尔宓, 黄美华, 宗愉, 等. 中国动物志, 爬行纲 (第3卷 蛇亚目). 北京: 科学出版社, 1998

8胡淑琴, 赵尔宓. 四川爬行动物三新种. 动物分类学报, 1996, 3(2): 158—164

9寇治通, 王晓佳. 云南省蛇类一新记录——美姑脊蛇. 四川动物, 2003, 22(4): 263, 267

10Sambrook J, Frisch E F, Maniatis T E. Molecular Cloning, A Laboratory Manual, 2nd ed. Cold Spring Harbour: Cold Spring Harbour

Laboratory Press, 1989

11Palumbi S R. Nucleic acids II: The polymerase chain reaction. In: Hillis D M, Moritz C, Mable B K, eds. Molecular Systematics. Mas-

sachusetts: Sinauer Associates, 1996. 205—320

12Queiroz A, Lawson R, Lemos-Espinal J A. Phylogenetic relationships of North American garter snakes (Thamnophis) based on four

mitochondrial genes: How much DNA sequence is enough? Mol Phylogenet Evol, 2002, 22(2): 315—329[DOI]

13谢佳蓉. 台湾产标蛇属之亲缘地理. 硕士学位论文. 台北: 中山大学, 2006

14Arévalo E, Davis S K, Sites J W. Mitochondrial DNA sequence divergence and phylogenetic relationships among eight chromosome

races of the Sceloporus grammicus complex (Phrynosomatidae) in Central Mexico. Syst Biol, 1994, 43:387—418

15Burbrink F T, Lawson R, Slowinski J B. Mitochondrial DNA phylogeography of the polytypic North American rat snake (Elaphe ob-

soleta): A critique of the subspecies concept. Evolution, 2000, 54(6): 2107—2118

1259

2009年5月第54卷第9期

16Thompson J D, Gibson T J, Plewniak F, et al. The CLUSTAL_X windows interface: Flexible strategies for multiple sequence alignment aided by quality analysis tools. Nucleic Acids Res, 1997, 25(24): 4876—4882[DOI]

17Lowe T, Eddy S R. tRNAscan-SE: A program for improved detection of transfer RNA genes in genomic sequence. Nucleic Acids Res, 1997, 25(5): 955—964[DOI]

18Dong S, Kumazawa Y. Complete mitochondrial DNA sequences of six snakes: Phylogenetic relationships and molecular evolution of genomic features. J Mol Evol, 2005, 61(1): 12—22[DOI]

19Douglas D A, Janke A, Arnason U. A mitogenomic study on the phylogenetic position of snakes. Zool Scr, 2006, 35(6): 545—558[DOI]

20Kumazawa Y. Mitochondrial DNA sequences of five Squamates: Phylogenetic affiliation of snakes. DNA Res, 2004, 11(2): 137—144[DOI]

21Zardoya R, Meyer A. Complete mitochondrial genome suggests diapsid affinities of turtles. Proc Natl Acad Sci USA, 1998, 95(24): 14226—14231[DOI]

22Janke A, Erpenbeck D, Nilsson M, et al. The mitochondrial genomes of the iguana (Iguana iguana) and the caiman (Caiman crocody-lus): Implications for amniote phylogeny. Proc Biol Sci, 2001, 268(1467): 623—631[DOI]

23Macey J R, Papenfuss T J, Kuehl J V, et al. Phylogenetic relationships among amphisbaenian reptiles based on complete mitochondrial genomic sequences. Mol Phylogenet Evol, 2004, 33(1): 22—31[DOI]

24Harlid A, Arnason U. Analyses of mitochondrial DNA nest ratite birds within the Neognathae: supporting a neotenous origin of ratite morphological characters. Proc Biol Sci, 1999, 266(1416): 305—309[DOI]

25Mindell D P, Sorenson M D, Dimcheff D E, et al. Interordinal relationships of birds and other reptiles based on whole mitochondrial genomes. Syst Biol, 1999, 48(1): 138—152[DOI]

26Haring E, Kruckenhauser L, Gamauf A, et al. The complete sequence of the mitochondrial genome of Buteo buteo (Aves, Accipitri-dae) indicates an early split in the phylogeny of raptors. Mol Biol Evol, 2001, 18(10): 1892—1904

27Roe B A, Ma D P, Wilson R K, et al. The complete nucleotide sequence of the Xenopus laevis mitochondrial genome. J Biol Chem, 1985, 260(17): 9759—9774

28Asakawa S, Kumazawa Y, Araki T, et al. Strand-specific nucleotide composition bias in echinoderm and vertebrate mitochondrial ge-nomes. J Mol Evol, 1991, 32(6): 511—520[DOI]

29Zardoya R, Meyer A. Mitochondrial evidence on the phylogenetic position of caecilians (Amphibia: Gymnophiona). Genetics, 2000,155(2): 765—775

30Swofford D L. PAUP*: Phylogenetic analysis using parsimony (* and Other Methods), version 4.0b10. SinauerAssociates, Sunderland, MA. 2002

31Huelsenbeck J P, Ronquist F. MRBAYES: Bayesian inference of phylogenetic trees. Bioinformatics, 2001, 17(8): 754—755[DOI]

32Posada D, Crandall K A.Modeltest: Testing the model of DNA substitution. Bioinformatics, 1998, 14(9): 817—818[DOI]

33Shimodaira H, Hasegawa M. Multiple comparisons of log-likelihoods with applications to phylogenetic inference. Mol Biol Evol, 1999, 16(8): 1114—1116

34Shimodaira H. An approximately unbiased test of phylogenetic tree selection. Syst Biol, 2002, 51(3): 492—508[DOI]

35Shimodaira H, Hasegawa M.CONSEL: For assessing the confidence of phylogenetic tree selection. Bioinformatics, 2001, 17(12): 1246—1247[DOI]

36Huelsenbeck J P, Rannala B. Phylogenetic methods come of age: Testing hypotheses in an evolutionary context. Science, 1997, 276(5310): 227—232[DOI]

37Kishino H, Thorne J L,Bruno W J. Performance of a divergence time estimation method under a probabilistic model of rate evolu-tion. Mol Biol Evol, 2001, 18(3): 352—361

38Sanderson M J. Estimating absolute rates of molecular evolution and divergence times: A penalized likelihood approach. Mol Biol Evol, 2002, 19(1): 101—109

39Thorne J L, Kishino H. Divergence time and evolutionary rate estimation with multilocus data. Syst Biol, 2002, 51(5): 689—702[DOI] 40Yang Z. Maximum likelihood phylogenetic estimation from DNA sequences with variable rates over sites: approximate methods. J Mol Evol, 1994, 39(3): 306—314[DOI]

41Rannala B, Yang Z. Probability distribution of molecular evolutionary trees: A new method of phylogenetic inference. J Mol Evol, 1996, 43(3): 304—311[DOI]

42Yang Z. Complexity of the simplest phylogenetic estimation problem. Proc Biol Sci, 2000, 267(1439): 109—116[DOI]

43Carroll, Vertebrate paleontology and evolution. New York: W. H. Freeman and Company, 1988

1260

论文

44Cracraft J. Avian evolution, Gondwana biogeography and the Cretaceous-Tertiary mass extinction event. Proc Biol Sci, 2001,

268(1466): 459—469[DOI]

45Sanderson M J. r8s: Inferring absolute rates of molecular evolution and divergence times in the absence of a molecular clock. Bioin-

formatics, 2003, 19(2): 301—302[DOI]

46Saccone C, Lanave C, Pesole G.Time and biosequences. J Mol Evol, 1993, 37(2): 154—159[DOI]

47Clayton D A. Transcription and replication of animal mitochondrial DNAs. Int Rev Cytol, 1992, 141: 217—232[DOI]

48Anderson S, Bankier A T, Barrell B G, et al. Sequence and organization of the human mitochondrial genome. Nature, 1981, 290(5806):

457—465[DOI]

49Hoffstetter. Squamates de type moderne. In: Piveteau J, ed. Traité de Paléontologie. Paris: Masson et Cie, 1955. 606—662

50Underwood G A. A contribution to the classification of snakes. London: British Museum (Nature History),1967

51Kumazawa Y, Endo H. Mitochondrial genome of the Komodo dragon: efficient sequencing method with reptile-oriented primers and

novel gene rearrangements. DNA Res, 2004, 11(2): 115—125[DOI]

52Qiao L P, Liu W N, You G P. Complete mitochondrial genome of Chinese big-headed turtle, Platysternon megacephalum, with a

novel gene organization in vertebrate mtDNA. Gene, 2006, 380(1): 14—20

53Parham J F, Feldman C R, Boore J L. The complete mitochondrial genome of the enigmatic bigheaded turtle (Platysternon): Descrip-

tion of unusual genomic features and the reconciliation of phylogenetic hypotheses based on mitochondrial and nuclear DNA. BMC

Evol Biol, 2006, 6: 11[DOI]

54郑涛. 云豹线粒体DNA全序列及中国13种猫科动物的系统发生关系研究. 硕士学位论文. 芜湖: 安徽师范大学, 2006

55Frazer-Abel A A, Hagerman P J. Determination of the angle between the acceptor and anticodon stems of a truncated mitochondrial

tRNA. J Mol Biol, 1999, 285(2): 581—593[DOI]

56Kumazawa Y, Nishida M. Variations in mitochondrial tRNA gene organization of reptiles as phylogenetic markers. Mol Biol Evol,

1995, 112(5): 759—772

57吴孝兵. 扬子鳄保护遗传学及线粒体基因组全序列研究. 博士学位论文. 南京: 南京师范大学, 2001

58吴孝兵, 王义权, 周开亚, 等. 扬子鳄的线粒体全基因组与鳄类系统发生. 科学通报, 2003, 48(18): 1954—1958

59Kraus F, Brown W M. Phylogenetic relationships of colubroid snakes based on mitochondrial DNA sequences. Zoolog J Linn Soc,

1998, 122(3):455—487[DOI]

60Vidal N. Colubroid systematics: Evidence for an early appearance of the venom apparatus followed by extensive evolutionary tinker-

ing. J Toxicol Toxin Rev, 2002, 21: 21—41

61Vidal N, Hedges S B. Molecular evidence for a terrestrial origin of snakes.Proc R Soc Lond B (Suppl 4), 2004, 271: S226—S229[DOI]

62Vidal N, Hedges S B. Higher-level relationships of caenophidian snakes inferred from four nuclear and mitochondrial genes. C R Biol,

2002, 325(9): 987—995[DOI]

63Kelly C M R, Barker N P, Villet M H. Phylogenetics of advanced snakes (Caenophidia) based on four mitochondrial genes. Syst Biol,

2003,52(4): 439—459[DOI]

64Vidal N, David P. New insights into the early history of snakes inferred from two nuclear genes. Mol Phylogene Evol, 2004, 31(2):

783—787[DOI]

65Vidal N, Delmas A, David P, et al. The phylogeny and classification of caenophidian snakes inferred from seven nuclear pro-

tein-coding genes. C R Biol, 2007, 330(2): 182—187[DOI]

66Lawson R, Slowinski J B, Crother B I, et al. Phylogeny of the Colubroidea (Serpentes): New evidence from mitochondrial and nuclear

genes. Mol Phylogenet Evol, 2005, 37(2): 581—601[DOI]

1261

人类线粒体基因组与疾病

人类线粒体基因组与疾病 1、线粒体基因及基因组介绍 人类线粒体DNA(mtDNA),共包含37个基因,这37个基因中有22个编码转移核糖核酸(tRNA)、2个编码核糖体核糖核酸(12S和16S rRNA),13个编码多肽。 2、线粒体基因及基因组分析的现状和临床意义 对于可疑线粒体病的患者来说,理想的遗传学诊断方法是发现导致线粒体结构和功能缺陷的相关基因突变。这些基因突变可能在mtDNA上,也可能发生在核基因上,线粒体的遗传方式可能为常染色体隐形遗传、X-连锁遗传、母系遗传,有些还是新突变。由于线粒体病涉及基因众多,目前临床只能选择少数常见的线粒体基因位点进行突变和缺失筛查,阳性率很低,大多数患者难以获得准确的病因诊断。 3、线粒体基因及基因组分析测定 (1)13个编码多肽的基因 编码产物基因分 析 基因变异对应的常见线粒体病种 类 NADH dehydrogenase (complex I)MT-ND1Leber遗传性视神经病 MT-ND2心肌线粒体病,Leber遗传性视神经病 MT-ND3进肌阵挛,癫痫,视神经萎缩MT-ND4 Leber遗传性视神经病,线粒体肌 病,Leber遗传性视神经病,张力 障碍 MT-

ND4L Leber遗传性视神经病 MT-ND5Leigh综合征,线粒体脑肌病伴乳酸中毒及中风样发作综合症 MT-ND6Leber遗传性视神经病,线粒体脑肌病伴乳酸中毒及中风样发作综合症,糖尿病,肌张力障碍 coenzyme Q-cytochrome c reductase/Cytochrome b(complex III)MT-Cytb 慢性游走性红斑,Leber遗传性视 神经病,线粒体肌病,心肌线粒 体病,线粒体脑肌病伴乳酸中毒 及中风样发作综合症,帕金森病 cytochrome c oxidase(complex IV)MT- COX1 肌红蛋白尿运动神经元疾病,铁 粒幼细胞贫血 MT- COX2 线粒体肌病,线粒体多系统疾 病,线粒体脑肌病 MT- COX3 Leigh综合征,慢性游走性红斑, 骨骼肌溶解症 ATP synthase MT- ATP6 共济失调并发色素性视网膜炎, 母系遗传Leigh综合征,家族性双 侧纹状体坏死 MT- ATP8 共济失调并发色素性视网膜炎, 母系遗传Leigh综合征,家族性双 侧纹状体坏死 (2)22个编码tRNA的基因 Alanine MT-TA进行性眼外肌麻痹Arginine MT-TR

全基因组选择及其在奶牛育种中的应用

发表于《中国奶牛》,2011 全基因组选择育种技术及在奶牛育种中应用进展 范翌鹏1孙东晓1* 张勤1张胜利1张沅1刘林2 (1.中国农业大学动物科技学院,北京,100193; 2.北京奶牛中心. 北京. 100085) 摘要:全基因组选择是指基于基因组育种值(GEBV)的选择方法,指通过检测覆盖全基因组的分子标记,利用基因组水平的遗传信息对个体进行遗传评估,以期获得更高的育种值估计准确度。由于可显著缩短世代间隔,全基因组选择作为一种育种新技术在奶牛育种中具有广阔的应用前景,目前已经成为各国的研究热点。不同国家的试验结果表明,在奶牛育种工作,基于GEBV 的遗传评估可靠性在20-67%之间,如果代替常规后裔测定体系,可节省92%的育种成本。本文综述了全基因组选择的基本原理及其在各国奶牛育种中的应用现状和所面临的问题。 关键词:全基因组选择,奶牛育种 Genome-Wide Selection and its Application in Dairy Cattle FAN YiPeng, SUN Dongxiao, ZHANG Qin, ZHANG Shangli, ZHANG Yuan, LIU Lin (College of Animal Science Technology, China Agricultural University, Beijing, 100193) Abstract: Genomic selection refers to selection decisions based on genomic breeding values (GEBV). The GEBV are calculated as the sum of the effects of dense genetic markers, or haplotypes of these markers, across the entire genome, thereby potentially capturing all the quantitative trait loci (QTL) that contribute to variation in a trait. Genomic selection has become a focus of study in many countries as the new breeding method. Reliabilities of GEBV for young bulls without progeny test results in the reference population were between 20 and 67%. By avoiding progeny testing, bull breeding companies could save up to 92% of their costs [1]. In this paper, we first review the progress of genomic selection, including the principle, methods, accuracy and advantages of genomic selection. We then review the application of genomic selection in dairy cattle. Key words: Genomic Selection, Dairy Breeding 全基因组选择(Genomic Selection,GS),即全基因组范围的标记辅助选择(Marker Assisted Selection, MAS),指通过检测覆盖全基因组的分子标记,利用基因组水平的遗传信息对个体进行遗传评估,以期获得更高的育种值估计准确度。研究已表明,标记辅助选择可提高奶牛育种遗传进展[2][3],但是在目前奶牛育种工作中却无法大规模推广应用标记辅助选择。因为奶牛的生产性状和健康性状均受大量基因座位共同影响,通过有限数量的已知标记无法大幅度加快遗传进展;其次,通过精细定位策略鉴定主效基因需花费大量人力物力和时间;而且利用标记信息估计育种值的计算方法也很复杂。全基因组选择基于基因组育种值(Genomic Estimated Breeding Value, GEBV)进行选择,其实施包括两个步骤:首先在参考群体中使用基因型数据和表型数据估计每个染色体片段的效应;然后在候选群体中使用个体基因型数据估计基因组育种值(genomic breeding value,GEBV)[4],模拟研究证明,仅仅通过标记预测育种值的准确性可以达到0.85(指真实育种值与估计育种值之间的相关,而可靠性则指其平方)。如果在犊牛刚出生时即可达到如此高的准确性,对奶牛育种工作则具有深远意义。模拟研究表明:对于一头刚出生的公犊牛而言,如果其GEBV的估计准确性可以达到经过后

全基因组重测序数据分析

全基因组重测序数据分析 1. 简介(Introduction) 通过高通量测序识别发现de novo的somatic和germ line 突变,结构变异-SNV,包括重排 突变(deletioin, duplication 以及copy number variation)以及SNP的座位;针对重排突变和SNP的功能性进行综合分析;我们将分析基因功能(包括miRNA),重组率(Recombination)情况,杂合性缺失(LOH)以及进化选择与mutation之间的关系;以及这些关系将怎样使 得在disease(cancer)genome中的mutation产生对应的易感机制和功能。我们将在基因组 学以及比较基因组学,群体遗传学综合层面上深入探索疾病基因组和癌症基因组。 实验设计与样本 (1)Case-Control 对照组设计; (2)家庭成员组设计:父母-子女组(4人、3人组或多人); 初级数据分析 1.数据量产出:总碱基数量、Total Mapping Reads、Uniquely Mapping Reads统计,测序深度分析。 2.一致性序列组装:与参考基因组序列(Reference genome sequence)的比对分析,利用贝叶斯统计模型检测出每个碱基位点的最大可能性基因型,并组装出该个体基因组的一致序列。3.SNP检测及在基因组中的分布:提取全基因组中所有多态性位点,结合质量值、测序深度、重复性等因素作进一步的过滤筛选,最终得到可信度高的SNP数据集。并根据参考基 因组信息对检测到的变异进行注释。 4.InDel检测及在基因组的分布: 在进行mapping的过程中,进行容gap的比对并检测可信的short InDel。在检测过程中,gap的长度为1~5个碱基。对于每个InDel的检测,至少需 要3个Paired-End序列的支持。 5.Structure Variation检测及在基因组中的分布: 能够检测到的结构变异类型主要有:插入、缺失、复制、倒位、易位等。根据测序个体序列与参考基因组序列比对分析结果,检测全基因组水平的结构变异并对检测到的变异进行注释。

进化基因组学研究进展

研究进化基因组学进展 摘要:进化基因组学是利用基因组数据研究差异基因功能、生物系统演化、从基因在水平探索生物进化的学科。随着近年来基因组数据的不断增加,进化基因组学得到了长足的发展。进化基因组学主要包括从基因组水平理解和诠释生物进化和新基因分析研究探索两方面的内容。本文介绍了进化基因组学研究的主要内容和较为常用的方法,以及近年来在细菌、酵母、果蝇进化基因组学方面的研究进展。 关键词:进化基因组学系统进化比较基因组学新基因 正文 随着基因测序技术的不断进步以及基因组学的飞速的发展,人们积累了大量的基因组学数据,利用所得的大量的基因组数据与进化生物学相结合,在基因组水平研究生物进化机制,随即产生了进化基因组学。 近年来进化基因组学取得了长足的进展,在研究差异基因功能、生物系统演化、从基因在水平探索生物进化的终极方式等方面有重大突破,对人类理解生命现象和过程有重要作用。 研究系统进化学通常包括两个关键步骤:一方面,在不同物种中鉴定同源性特佂,另一方面利用构建系统进化树的方法比较这些特征,进而重新构建这些物种的进化历史[1]。针对这两个关键步骤,传统系统进化学,常采用基于形态学数据和单个基因研究的同源性状鉴定和重建系统进化树(常包括距离法、最大简约法、概率法)[1]的方法来研究。在目前拥有丰富基因组数据的条件下,我们可以分析基因组数据,利用进化基因组学研究系统进化。 一、目前进化基因组学的研究内容主要集中于两个方面:(1)在比较不同生物的基因数据的基础上,从基因组水平理解和诠释生物进化;(2)通过对新基因的分析研究探索基因进化过程的规律两个方面。在进行全基因组进化分析方面,进化基因组学主要集中于构建系统进化树、研究基因组进化策略、研究生物功能变化和进化机制、进化和生态功能基因组学、基因注释的等方面;在新基因方面

全基因组关联分析的原理和方法

全基因组关联分析(Genome-wide association study;GWAS)是应用基因组中 数以百万计的单核苷酸多态性(single nucleotide ploymorphism ,SNP)为分子 遗传标记,进行全基因组水平上的对照分析或相关性分析,通过比较发现影响复杂性状的基因变异的一种新策略。 随着基因组学研究以及基因芯片技术的发展,人们已通过GWAS方法发现并鉴定了大量与复杂性状相关联的遗传变异。近年来,这种方法在农业动物重要经济性状主效基因的筛查和鉴定中得到了应用。 全基因组关联方法首先在人类医学领域的研究中得到了极大的重视和应用,尤其是其在复杂疾病研究领域中的应用,使许多重要的复杂疾病的研究取得了突破性进展,因而,全基因组关联分析研究方法的设计原理得到重视。 人类的疾病分为单基因疾病和复杂性疾病。单基因疾病是指由于单个基因的突变导致的疾病,通过家系连锁分析的定位克隆方法,人们已发现了囊性纤维化、亨廷顿病等大量单基因疾病的致病基因,这些单基因的突变改变了相应的编码蛋白氨基酸序列或者产量,从而产生了符合孟德尔遗传方式的疾病表型。复杂性疾病是指由于遗传和环境因素的共同作用引起的疾病。目前已经鉴定出的与人类复杂性疾病相关联的SNP位点有439 个。全基因组关联分析技术的重大革新及其应用,极大地推动了基因组医学的发展。(2005年, Science 杂志首次报道了年龄相关性视网膜黄斑变性GWAS结果,在医学界和遗传学界引起了极大的轰动, 此后一系列GWAS陆续展开。2006 年, 波士顿大学医学院联合哈佛大学等多个研究机构报道了基于佛明翰心脏研究样本关于肥胖的GWAS结果(Herbert 等. 2006);2007 年, Saxena 等多个研究组联合报道了与2 型糖尿病( T2D ) 关联的多个位点, Samani 等则发表了冠心病GWAS结果( Samani 等. 2007); 2008 年, Barrett 等通过GWAS发现了30 个与克罗恩病( Crohns ' disrease) 相关的易感位点; 2009 年, W e is s 等通过GWAS发现了与具有高度遗传性的神经发育疾病——自闭症关联的染色体区域。我国学者则通过对12 000 多名汉族系统性红斑狼疮患者以及健康对照者的GWAS发现了5 个红斑狼疮易感基因, 并确定了4 个新的易感位点( Han 等. 2009) 。截至2009 年10 月, 已经陆续报道了关于人类身高、体重、 血压等主要性状, 以及视网膜黄斑、乳腺癌、前列腺癌、白血病、冠心病、肥胖症、糖尿病、精神分 裂症、风湿性关节炎等几十种威胁人类健康的常见疾病的GWAS结果, 累计发表了近万篇 论文, 确定了一系列疾病发病的致病基因、相关基因、易感区域和SNP变异。) 标记基因的选择: 1)Hap Map是展示人类常见遗传变异的一个图谱, 第1 阶段完成后提供了 4 个人类种族[ Yoruban ,Northern and Western European , and Asian ( Chinese and Japanese) ] 共269 个个体基因组, 超过100 万个SNP( 约1

全基因组选择育种策略及在水产动物育种中的应用前景(精)

中国水产科学 2011年7月, 18(4: 936?943 Journal of Fishery Sciences of China 综述 收稿日期: 2011?03?14; 修订日期: 2011?04?10. 基金项目: 国家自然基金资助项目(30730071; 30972245; 农业科技成果转化资金项目(2010GB24910700. 作者简介: 于洋(1987?, 硕士研究生. E-mail: yuy8866@https://www.doczj.com/doc/646202928.html, 通信作者: 张晓军, 副研究员. E-mail: xjzhang@https://www.doczj.com/doc/646202928.html, DOI: 10.3724/SP.J.1118.2011.00935 全基因组选择育种策略及在水产动物育种中的应用前景 于洋1,2 , 张晓军1 , 李富花1 , 相建海1 1. 中国科学院海洋研究所实验海洋生物学重点实验室, 山东青岛266071; 2. 中国科学院研究生院, 北京 100049 摘要: 全基因组选择的概念自2001年由Meuwissen 等提出后便引起了动物育种工作者的广泛关注。目前, 澳大利亚、新西兰、荷兰、美国的研究小组已经应用该方法进行了优质种牛的选择育种, 并取得了很好的效果。此外在鸡和猪的选择育种中也有该方法的应用, 但在水产动物选育中尚未见该方法使用的报道。本文对“全基因组选择育种”的概念和提出背景进行了归纳, 对全基因组选择育种的优势进行了阐述, 并详细介绍了其具体的策略, 总结了目前全基因组育种所广泛采用的方法以及取得的成果, 旨在为该方法在水产动物育种方面的应用研究提供科学参考。 关键词: 全基因组选择; 水产动物育种; SNP; QTL; 全基因组育种值估计 中图分类号: S96 文献标志码: A 文章编号: 1005?8737?(201104?0935?08 人类对于动物的选择育种由来已久, 最初所进行的只是简单的人工驯化。随着遗传学研究的发展, 尤其是“数量遗传学理论”的提出, 动物育种技术进入快速发展时

基因组学重点整理

生物五界:动物、植物、真菌、原生生物和原核生物;生物三界:真细菌、古细菌、真核生物 具有催化活性的RNA分子称为核酶(ribozyme)核酶催化的生化反应有:自我剪接、催化切断其它RNA、合成多肽键、催化核苷酸的合成 新基因的产生:基因与基因组加倍1)整个基因组加倍;2)单条或部分染色体加倍;3)单个或成群基因加倍。DNA水平转移:原核生物中的DNA水平转移可通过接合转移,噬菌体转染,外源DNA的摄取等不同途径发生,水平转移的基因大多为非必须基因。动物中由于种间隔离不易进行种间杂交,但其主要来源于真核细胞与原核细胞的内共生。动物种间基因转移主要集中在逆转录病毒及其转座成分。 外显子洗牌与蛋白质创新:产生全新功能蛋白质的方式有二种:功能域加倍,功能域或外显子洗牌 基因冗余:一条染色体上出现一个基因的很多复份(复本)当人们分离到某一新基因时,为了鉴定其生物学功能,常常使其失活,然后观察它们对表型的影响。许多场合,由于第二个重复的功能基因可取代失活的基因而使突变型表型保持正常。这意味着,基因组中有冗余基因存在。看家基因很少重复,它们之间必需保持剂量平衡,因此重复的拷贝很快被淘汰。与个体发育调控相关的基因表达为转录因子,具有多功能域的结构。这类基因重复拷贝变异可使其获得不同的表达控制模式,促使细胞的分化与多样性的产生,并导致复杂形态的建成,具有许多冗余基因。 非编码序列扩张方式:滑序复制、转座因子 模式生物海胆、果蝇、斑马鱼、线虫、蟾蜍、小鼠、酵母、水稻、拟南芥等。模式生物基因组中G+C%含量高, 同时CpG 岛的比例也高。进化程度越高, G+C 含量和CpG 岛的比例就比较低 如果基因之间不存在重叠顺序,也无基因内基因(gene-within-gene),那么ORF阅读出现差错的可能只会发生在非编码区。细菌基因组中缺少内含子,非编码序列仅占11%, 对阅读框的排查干扰较少。细菌基因组的ORF阅读相对比较简单,错误的机率较少。高等真核生物DNA的ORF阅读比较复杂:基因间存在大量非编码序列(人类占70%);绝大多数基因内含有非编码的内含子。高等真核生物多数外显子的长度少于100个密码子 内含子和外显子序列上的差异:内含子的碱基代换很少受自然选择的压力,保留了较多突变。由于碱基突变趋势大多为C-T,故A/T的含量内含子高于外显子。由于终止密码子为TAA\TAG\TGA,如果以内含子作为编码序列,3种读码框有很高比例的终止密码子。 基因注释程序编写的依据:1)信号指令,包括起始密码子,终止密码子,终止信号,剪接受体位和供体位,多聚嘧啶序列,分支点保守序列2)内容指令,密码子偏好,内含子和外显子长短 基因功能的检测:基因失活、基因过表达、RNAi干涉 双链DNA的测序可从一端开始,亦可从两端进行,前者称单向测序,后者称双向测序。 要获得大于50 kb的DNA限制性片段必需采用稀有切点限制酶。 酵母人工染色体(YAC)1)着丝粒在细胞分裂时负责染色体均等分配。2)端粒位于染色体端部的特异DNA序列,保持人工染色体的稳定性3)自主复制起始点(ARS)在细胞中启动染色体的复制 合格的STS要满足2个条件:它应是一段序列已知的片段,可据此设计PCR反应来检测不同的DNA片段中是否存在这一顺序;STS必需在染色体上有独一无二的位置。如果某一STS在基因组中多个位点出现,那么由此得出的作图数据将是含混不清的。 遗传图绘制主要依据由孟德尔描述的遗传学原理,第一条定律为等位基因随机分离,第二条定律为非等位基因自由组合,显隐性规律/不完全显性、共显性、连锁 衡量遗传图谱的水平覆盖程度饱和程度 基因类型:transcribed, translatable gene (蛋白基因) ;transcribed but non-translatable gene ( RNA基因)Non- transcribed, non-translatablegene ( promoter, operator ) rRNA基因,tRNA基因, scRNA基因, snRNA基因, snoRNA基因, microRNA基因 基因组(genome):生物所具有的携带遗传信息的遗传物质总和。 基因组学(genomic):用于概括涉及基因作图、测序和整个基因功能分析的遗传学分支。 染色体组(chromosome set):不同真核生物核基因组均由一定数目的染色体组成,单倍体细胞所含有的全套染色体。 比较基因组学(comparative genomics):比较基因组学是基因组学与生物信息学的一个重要分支。通过模式生物基因组与人类基因组之间的比较与鉴别,为分离重要的候选基因,预测新的基因功能,研究生物进化提供依据。(目标)

如何查找基因的序列(全)

如何查找基因序列?(转载) (2010-08-01 11:47:41) 如何查找基因序列? ——在Genbank中寻找目的基因的实例 ——献给受类似问题困扰的广大酷友,以及给我动力和信心发表原创帖的基因酷的朋友们。 酷友感言:网络的世界很精彩,网络的查询很无奈。为了我们的科学研究事业,为了我们能够顺利毕业,我们的广大酷友们在网络的海洋里遨游…遨游…咋就找不到彼岸呢?今天要设计这个基因的PCR引物,明天又要查那个基因的信息,那么大一张网,唉想起来就郁闷……鉴此,我们推出了利用Genbank查找基因序列的帖子,希望对大家有所帮助,并请大家多多指教!当然,如果您已经是此中高手,那就权当我是班门弄斧了,呵呵。 1. 根据文献 搞reasearch肯定要读文献的,如果你曾经在文献中看到过你感兴趣的基因,而且文中还提到了该基因在Genbank中的ID号,那就好办了,直接打开https://www.doczj.com/doc/646202928.html,,在Search后的下拉框中选择Nucleotide,把Genbank ID号输入GO前面的文本框中,点“GO”,就可以找到他了。 举例说明,例如:在2003年JBC的文章(Conditional Knock-out of

Integrin-linked Kinase Demonstrates an Essential Role in Protein Kinase B/Akt Activation)中出现了“calreticulin (GenBank accession number gi 16151096)”,那么把“16151096”输入GO前面的文本框中,点“GO”,就可以找到该基因了(当然包括基因序列等相关信息)。 在出现了检索结果界面(下图)后,直接点击红箭头所指的 AY047586就可以看到基因的相关信息了...(呵呵,是不是有点太......easy 了) 这里需要指出一下,在显示基因的页面右侧有一个Link,点击后出现一个小菜单,里面是与该基因相关的链接,很有用的,值得一个一个地去看看,这里我就不多说了。点击 AY047586后出现的界面如下:如果你只想获得序列(例如去设计PCR引物的时候),那就可以选择FASTA,这样就得到了FASTA格式的序列文件,没有其他数字和格式的干扰。 (缩略图,点击图片链接看原图)这就是FASTA格式的序列: (缩略图,点击图片链接看原图)2. 根据已经获得的基因的相关信息进行查找(待续......) 鼓励一下吧,累坏了正如路漫漫所说,如果只是知道基因的名字,怎么查序列呢?还是举例说明,比如我想做的基因名称是人的VEGF基因,那么怎么在Genbank中找到它呢?还是一步一步来...打开https://www.doczj.com/doc/646202928.html,/ 在search后面的下拉框中选择Gene,然后在中间的文本框中输入基

系统发育分析

实习四: 系统发育分析-PHYLIP, MEGA, MrBayes 实习目的 1. 学会使用PHYLIP,MEGA和MrBayes构建进化树 2. 学会分析建树结果,体会各种方法差异 实习内容: 一、PHYLIP PHYLIP网址: https://www.doczj.com/doc/646202928.html,/PHYLIP.html PHYLIP是一个免费的系统发育树构建软件,它的功能比较全面,可用距离法、最大简约法和最大似然法分别进行建树,还可以对进化树可靠性进行检验。PHYLIP没有多序列比对功能,所以先要用其它序列比对软件完成序列比对,并保存为phy格式后,才可提交给PHYLIP 进行分析。 1.1 比对序列的准备 1.将教学材料里demo sequence.zip文件解压到D盘根目录下,分别用其中的mRNA和protein序列学习进化树构建。首先我们用实习2学过的多序列比对软件对序列进行比对。 这里以CLUSTAX为例来说明。 强烈建议:将你的所有同源核酸(或蛋白质)序列存到一个文本文档里,将”>”之后那行只保留物种名称,或物种名称_蛋白(或基因)名称,方便后面分析比较。 2.用CLUSTALX进行多条序列比对,在Alignment - output format option选中PHYLIP 格式,对序列进行比对(Alignment - Do complete alignment)。将生成的phy文件保存,此文件可以用写字板打开浏览,里面内容是多条序列比对结果。(Figure 1.1)

Figure 1.1 用clustalx进行多条序列比对及生成的phy文件 3.双击解压PHYLIP-3.69.zip文件,得到三个文件夹,其中doc文件夹里是关于所有PHYLIP 子程序的使用说明,exe文件夹里是直接可以使用的可执行程序,src文件夹里是所有程序的源代码。 4.打开PHYLIP的exe文件夹,将上步保存的phy文件复制到exe文件夹中。 5.上课时我们是先将序列用某种方法建树后,然后做bootstrap检验,看树的可靠性。但

人类全基因组测序

1 技术优势 全基因组测序(Whole Genome Sequencing,WGS)是利用高通量测序平台对人类不同个体或群体进行全基因组测序,并在个体或群体水平上进行生物信息分析。可全面挖掘DNA 水平的遗传变异,为筛选疾病的致病及易感基因,研究发病及遗传机制提供重要信息。 全基因组测序 平台优势 HiSeq X 测序平台 读长:PE150 通量:1.8T/run 测序周期:3 天 专为人全基因组测序准备、测序周期短、通量高

生物信息分析 技术路线 技术参数 样品要求 样本类型:DNA 样品 样本总量:≥1.0 μg DNA (提取自新鲜及冻存样本) ≥1.5 μg DNA (提取自FFPE 样本)样品浓度:≥ 20 ng/μl 测序平台及策略HiSeq X PE150 测序深度 肿瘤:癌组织(50X),癌旁组织/血液样本(30X)遗传病:30~50 X 项目周期37天

3 案例解析 该研究选取3个家系中6个患者和1个正常个体,首先使用基因芯片寻找纯合突变位点,然后对其中无亲缘关系的2例患者采用全基因组测序研究,在2例患者非编码区域均发现相同的变异,10号染色体PTF1A 末端发生一个点突变(chr10:23508437 A>G),且变异在患病人群和细胞试验中均得到了验证。研究解释了生长发育启动子隐性变异是罕见孟德尔遗传病的常见致病原因,同时说明许多疾病的致病突变也可能位于非编码区。 图1 检出的变异信息 智力障碍是影响新生儿心智发育的一类疾病。这项研究选取50个经过基因芯片和全外显子测序未确诊致病因子的trio 家系,全基因组测序检出84个de novo SNVs 和8个de novo CNVs,及一些结构变异(如VPS13B、STAG1、IQSEC2-TENM3),检出率为42%。揭示编码区的de novo SNVs 和de novo CNVs 是导致智力障碍的主要因素,全基因组测序可以作为可靠的遗传性检测应用工具。 案例一 单基因病研究——全基因组测序鉴定PTF1A末端增强子常染色体隐性突变导致胰腺 发育不全[1] 案例二 复杂疾病研究——全基因组测序解析智力障碍的主要致病因素[2] 图2 PTF1A 的家系图谱

基因组学(复习)

王前飞: (1)为什么要研究表观遗传学? 答: 表观遗传学主要通过DNA 的甲基化、组蛋白修饰、染色质重塑和非编码RNA 调控等方式控制基因表达。表观遗传学是近几年兴起的而且发展迅速的一个研究遗传的分支学科,其研究和应用不仅对基因表达、调控、遗传有重要作用,而且在肿瘤、免疫等许多疾病的发生和防治以及干细胞定向分化研究、基因芯片中亦具有十分重要的意义。表观遗传学补充了“中心法则”忽略的两个问题,即哪些因素决定了基因的正常转录和翻译以及核酸并不是存储遗传信息的唯一载体;在分子水平上,表观遗传学解释了DNA序列所不能解释的诸多奇怪的现象。如: 同一等位基因可因亲源性别不同而产生不同的基因印记疾病,疾病严重程度也可因亲源性别而异。表观遗传学信息还可直接与药物、饮食、生活习惯和环境因素等联系起来,营养状态能够通过改变表观遗传以导致癌症发生,尤其是维生素和必需氨基酸。 此外,表观遗传学信息的改变,对包括人体在内的哺乳动物基因组有广泛而重要的效应,如转录抑制、基因组印记、细胞凋亡、染色体灭活等。DNA 甲基化模式的改变,尤其是某些抑癌基因局部甲基化水平的异常增加,在肿瘤的发生和发展过程中起到了不容忽视的作用。研究发现,肿瘤细胞DNA 存在广泛的低甲基化和局部区域的高甲基化共存现象,以及总的甲基化能力增高,这3个特征各以不同的机制共同参与甲基化在肿瘤发生、发展中的作用。如胃癌、结肠癌、乳腺癌、肺癌、胰腺癌等众多恶性肿瘤都不同程度地存在一个或多个肿瘤抑制基因CpG 岛甲基化。而表观遗传学改变在本质上的可逆性,又为肿瘤的防治提供了新的策略。所以,随着表观遗传学研究的深入,肯定会对人类生长发育、肿瘤发生以及遗传病的发病机制及其防治做出新的贡献,也必将在其他领域中展示其不可估量的作用和广阔的前景。 (2)表观遗传学涉及到哪些方面? 答: 表观遗传学的研究内容主要包括:DNA甲基化、组蛋白的末端修饰和变异体、DNAaseⅠ高敏感位点、非编码RNA、转录因子及其辅助因子、顺式调控元件和基因组印记等。 (3)什么因素会影响基因表达水平? 答: 基因选择性转录表达的调控( DNA甲基化,基因印记,组蛋白共价修饰,染色质重塑) 基因转录后的调控(基因组中非编码RNA,微小RNA(miRNA),反义RNA、内含子、核糖开关等) 1.转录水平的调控:包括DNA转录成RNA时的是否转录及转录频率的调控,DNA 的序列决定了DNA的空间构型,DNA的空间构型决定了转录因子是否可以顺利的结合到DNA的调控序列上,比如结合到TATA等序列上。 2.翻译水平的调控:翻译水平的调控又可以分成翻译前的调控和翻译后的调控。 a、翻译前的调控主要是RNA编辑修饰。 b、翻译后调控主要是蛋白的修饰,蛋白修饰后可以成为有功能的蛋白或者有隐藏功能的蛋白。 在真核和原核细胞中,从基因表达到蛋白质合成,其间有许多地方受到调控,这

基因组学(结构基因组学和功能基因组学).

问:基因组学、转录组学、蛋白质组学、结构基因组学、功能基因组学、比较基因组学研究有哪些特点? 答:人类基因组计划完成后生物科学进入了人类后基因组时代,即大规模开展基因组生物学功能研究和应用研究的时代。在这个时代,生命科学的主要研究对象是功能基因组学,包括结构基因组研究和蛋白质组研究等。以功能基因组学为代表的后基因组时代主要为利用基因组学提供的信息。 基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学(struc tural genomics和以基因功能鉴定为目标的功能基因组学(functional genomics。结构基因组学代表基因组分析的早期阶段,以建立生物体高分辨率遗传、物理和转录图谱为主。功能基因组学代表基因分析的新阶段,是利用结构基因组学提供的信息系统地研究基因功能,它以高通量、大规模实验方法以及统计与计算机分析为特征。 功能基因组学(functional genomics又往往被称为后基因组学(postgenomics,它利用结构基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质的研究转向多个基因或蛋白质同时进行系统的研究。这是在基因组静态的碱基序列弄清楚之后转入基因组动态的生物学功能学研究。研究内容包括基因功能发现、基因表达分析及突变检测。 基因的功能包括:生物学功能,如作为蛋白质激酶对特异蛋白质进行磷酸化修饰;细胞学功能,如参与细胞间和细胞内信号传递途径;发育上功能,如参与形态建成等采用的手段包括经典的减法杂交,差示筛选,cDNA代表差异分析以及mRNA差异显示等,但这些技术不能对基因进行全面系统的分析。新的技术应运而生,包括基因表达的系统分析,cDNA微阵列,DNA芯片等。鉴定基因功能最有效的方法是观察基因表达被阻断或增加后在细胞和整体水平所产生的表型变异,因此需要建立模式生物体。 功能基因组学

全球首次完成杨树全基因组测序

全球首次完成杨树全基因组测序 由美国能源部启动并实施的杨树全基因组测序计划已圆满完成,并于2004年9月21日对公众开放了全序列数据库。南京林业大学科研人员尹佟明副教授参与了此项研究。杨树基因组的新闻发布及庆祝会定于12月6日在美国加州举行。该项研究可望使杨树这一重要树种的品种改良时间大大缩短,用区区几十年跨越千年关。 研究的完成,使杨树成为继拟南芥和水稻之后,第三个测定全序列的植物,并且是第一个测定全基因组序列的多年生木本植物。杨树因此被广泛接受为研究多年生植物基因组的模式物种,这使该项工作具有重大的科学意义。杨树同时又是一种重要的工业用材树种,杨树全基因组计划实施,将为生物能源的开发提供知识贮备,具有重要的实际应用价值。目前,杨树的改良还处在一种半野生的初级改良阶段,在基因组研究的基础上,通过群体和数量遗传学的手段在杨树属不同树种间开发有用等位基因,并通过遗传工程的手段进行基因重组,可望在几十年的时间里完成一般作物几千年的改良历程。 杨树全基因组全序列用“鸟枪法测定”,序列库中共含有7,649,993个序列片段,去除叶绿体基因组的污染,测得的序列大约为8×基因组长度。目前对序列拼接的组装已完成了483Mb,占杨树基因组物理全长的90%以上,基本上覆盖了杨树基因组常染色体的大部分。基于基因芯片和单核苷酸多态性检测技术,对小的序列拼接及序列间隙的填充工作正在进行中,预期这部分工作将于明年完成。南京林业大学尹佟明副教授自2001年以来一直参与此项研究,对杨树基因组的注释工作将于今年12月初完成。 国际杨树基因组计划协作组的总负责人杰瑞先生认为,从世界范围来看,杨树在中国的林业生产中占有的比重是最大的,因此在杨树基因组信息的应用方面,中国在未来的研究中可能会居于世界前列。杨树全基因组计划的完成对我国从事林业及生物技术的科学家而言,提供了前所未有的机遇和挑战。 Science 15 September 2006: Vol. 313. no. 5793, pp. 1596 - 1604 DOI: 10.1126/science.1128691 RESEARCH ARTICLES The Genome of Black Cottonwood, Populus trichocarpa (Torr. & Gray) G. A. Tuskan,1,3* S. DiFazio,1,4S. Jansson,5J. Bohlmann,6I. Grigoriev,9U. Hellsten,9N. Putnam,9S. Ralph,6S. Rombauts,10 A. Salamov,9J. Schein,11L. Sterck,10 A. Aerts,9 R. R. Bhalerao,5 R. P. Bhalerao,12 D. Blaudez,13 W. Boerjan,10 A. Brun,13 A. Brunner,14 V. Busov,15 M. Campbell,16 J. Carlson,17 M. Chalot,13 J. Chapman,9 G.-L. Chen,2 D. Cooper,6 P. M. Coutinho,19 J. Couturier,13 S. Covert,20 Q. Cronk,7 R. Cunningham,1 J. Davis,22 S. Degroeve,10 A. Déjardin,23 C. dePamphilis,18 J. Detter,9 B. Dirks,24 I. Dubchak,9,25 S. Duplessis,13 J. Ehlting,7 B. Ellis,6 K. Gendler,26 D. Goodstein,9 M. Gribskov,27 J. Grimwood,28 A. Groover,29 L. Gunter,1 B. Hamberger,7 B. Heinze,30 Y. Helariutta,12,31,33 B. Henrissat,19 D. Holligan,21 R. Holt,11 W. Huang,9 N. Islam-Faridi,34 S. Jones,11 M. Jones-Rhoades,35 R. Jorgensen,26 C. Joshi,15 J. Kangasj?rvi,32 J. Karlsson,5 C. Kelleher,6 R. Kirkpatrick,11 M. Kirst,22 A.

真菌生命树的系统发生和系统基因组学

真菌生命树的系统发生和系统基因组学 近二三十年来,分子系统发生学从最初的建立到不断发展,已成为真菌的比较生物学的重要研究手段。曾经仅局限于分类学的系统树如今已广泛地应用到真菌生物学中并为了解主要生命形式的进化、描述复杂的生物群落以及实验生物学的预测提供了广泛的进化进化理论基础。在基因组领域这一趋势愈发显著,系统发生学和基因组学逐渐结合到一起并孕育出了一门崭新的学科—系统基因组学。虽然这是一门年轻的学科,但它已经应用到通过进化关系来预测同源性和不规则基因,以及基于基因组范围的对离散同源序列数据基因组的最大量—至少是大量—的采样对比分析。下面,让我们来了解一些目前这一领域的相关进展:(i)基于多基因系统发育的真菌系统发生学目前的地位;(ii)目前在分类真菌界里的进化关系中的进化假说;(iii)通过基因组采样来推断进化关系的应用。 真菌分子系统学 作为真菌分子系统发育的第一个领域,rRNA在鉴定推断这一界的系统发生关系时发挥了极其重要的关系。rRNA以各种形态广泛分布在自然界中,含有核苷酸保守区域,并以此为基础促进了宇宙原初物种的进化。既而,rRNA核苷酸数据的收集和排序也因此变得浅显易懂并使真菌分子系统发生的研究从上世纪90年代开始呈指数级增长。虽然这些分析仅是基于少量的数据,但是针对真菌和类真菌的系统发生的研究已取得了大量的里程碑式的发现。这些发现包括异鞭毛水霉菌和黏液菌的胞外替换,动物界和真菌界间的封闭进化关系识别,壶菌,结合菌,担子菌,子囊菌的单元菌物鉴定,子囊菌和担子菌的单源支持及他们间的姊妹组关系。 ??尽管取得了这些进展,由于rRNA数据仅限于与之相关的功能,要不断地了解真菌世界的进化过程还需要掌握更多相似不同源基因,特别是蛋白质编码的基因。由于在真菌系统中最大的两个RNA聚合酶(RPB1 RPB2)和翻译延伸因子TEF广泛地得到应用,PCR技术和测序引物也随之得到极大发展。这些基因提供了对rRNA系统发育的测评支持,并提供了更多形态学和生物学上的稳定性测试,他们还提供了起始多基因系统发生产生的未加工数据,致使真菌系统发生从基因树形式过渡到物种树。 ??为使多基因系统发生得到进一步发展,真菌系统协会创办了Research Coordination Network Deep Hypha.该协会的主要宗旨在于加快收集真菌系统生命树的多基因序列数据采集。这也是AFTOL工程的贡献之一。该工程推动了以下六方面的核苷酸序列采集:细胞核小亚基rRNA,细胞核大亚基rRNA,线粒体小亚基rRNA,RPB1,RPB2和TEF---真菌中目和科的分类单元目标集(Lutzoni et al., 2004)。AFTOL筹集了2000多个分类单元的5000多条公开可用序列并发展了真菌中额外引物的数据采集(更多完整序列及引物请登录WASABI研办的网站:https://www.doczj.com/doc/646202928.html, Kauffet al.,2007])。在多基因数据集的采集日趋完善的同时,基于模型的复杂核苷酸序列数据集系统发生分析算法也在不断发展。由于电脑处理器愈发强大以及相关计算分析软件的支撑(如:RAxML [Stamatakis,2006] GARLI [Zwickl,2008] MRBAYES[Ronquist and Huelsenbeck, 2003] and PhyloBayes [Lartillot and Philippe,2004] ),对大型多基因数据集的最大似然估计和贝叶斯计算如今也得到广泛应用。今年来对多基因编码数据的强化分析也提高了系统发生的分辨率测算(Matheny et.al.,2007; Hofstetter et.al.,2007),并且证明了蛋白质编码的基因RPB1,RPB2和TEF比rRNA基因拥有更高层次的系统发生信息量(Townsend,2007; schoch et.al.,2009)。当我们把筹集相对大的多基因序列以及分析他们的能力有机地结合在一起时,我们就获得了目前对于真菌进化的最精确的了解。 真菌生命树 这里提到的真菌生命树,我们是指单源种的真菌界以及其下的各个亚门中所包含的。简明起见,这里不再讨论真菌以外的其它门类(例如:卵菌门),尽管他们很重要并且很多学者也在研究。我们的讨论将集中在更高级的分类学中,侧重于真菌进化中主要的真菌进化枝。

已基因组测序物种

已完成植物基因组测序情况(更新至2014年11月) 中文名拉丁名发表时间刊物科、属基因组大小拟南芥Arabidopsis thaliana 2000.12 Nature 十字花科、鼠耳芥属125M 水稻Oryza sativa. ssp. indica 2002.04 Science 禾本科、稻属466M 水稻Oryza sativa. ssp. japonica 2002.04 Science 禾本科、稻属466M 杨树Populus trichocarpa 2006.09 Science 杨柳科、杨属480M 葡萄Vitis vinifera 2007.09 Nature 葡萄科、葡萄属490M 衣藻Chlamydomonas reinhardtii 2007.01 Science 衣藻科、衣藻属130 M 小立碗藓Physcomitrella pattens 2008.01 Science 葫芦藓科、小立碗藓属480M 番木瓜Carica papaya 2008.04 Nature 番木瓜科、番木瓜属370M 百脉根Lotus japonicus 2008.05 DNA Res. 豆科472 Mb 三角褐指藻Phaeodactylum tricornutum 2008.11 Nature 褐指藻属27.4M 高粱Sorghum bicolor 2009.01 Nature 禾本科、高粱属730M 玉米Zea mays ssp. mays 2009.11 Science 禾本科、玉米属2300M 黄瓜Cucumis sativus 2009.11 Nature Genetics 葫芦科、黄瓜属350M 大豆Glycine max 2010.01 Nature 豆科、大豆属1100M 二穗短柄草Brachypodium distachyon 2010.02 Nature 禾本科、短柄草属260M 褐藻Ectocarpus 2010.06 Nature 水云属196M 团藻Volvox carteri 2010.07 Science 团藻属138M 蓖麻Ricinus communis 2010.08 Nature Biotechnology 大戟科、蓖麻属350M 小球藻Chlorella variabilis 2010.09 Plant Cell 小球藻科46M 苹果Malus × domestica 2010.09 Nature Genetics 蔷薇科、苹果属742M 森林草莓Fragaria vesca 2010.12 Nature Genetics 蔷薇科、草莓属240M 可可树Theobroma cacao 2010.12 Nature Genetics 梧桐科、可可属430-Mb 野生大豆Glycine soja 2010.12 PNAS 豆科、大豆属915.4 Mb 褐潮藻类Aureococcus anophagefferens 2011.02 PNAS 57M 麻风树Jatropha curcas 2010.12 DNA Res. 大戟科、麻风树属410M 卷柏Selaginella moellendorffii 2011.05 Science 卷柏属212M 枣椰树Phoenix dactylifera 2011.05 Nature biotechnology 棕榈科685M 琴叶拟南 芥 Arabidopsis lyrata 2011.05 Nature Genetics 十字花科、鼠耳芥属206.7 Mb 马铃薯Solanum tuberosum 2011.07 Nature 茄目、茄科、茄属844M 条叶蓝芥Thellugiella parvula 2011.08 Nature Genetics 盐芥属140M

相关主题
文本预览
相关文档 最新文档