当前位置:文档之家› 基因组学课件整理

基因组学课件整理

基因组学课件整理
基因组学课件整理

1.什么是SNP和SSLP?

SNP:即单核苷酸多态性,是由于基因组中等位位点上单个核苷酸改变而导致的核酸序列多态性(Polymorphism)。

SSLP:简单序列长度多态性,是一系列不同长度的重复序列,包括卫星DNA,小卫星,微卫星(STR)。

2.知识整理:

一.基因组介绍

1,Gene: A DNA segment containing biological information and hence coding for an RNA and/or polypeptide molecule.

Genome: The entire genetic complement of a living organism.

?Prokaryocyte

?Eukaryocyte: nuclear genome + organelle(chloroplast, mitochondrion) genome

2,Transcriptome: Coding RNA; the product of genome expression

3,Proteome: The proteome comprises all the proteins present in a cell at a particular time.

The proteome means all the proteins being made by the transcriptome

4,基因组学的发展和研究现状

二基因组作图

绘制遗传图谱的实验基础是什么?即连锁分析。

1,基因组做图的目的:利用鸟枪法测定含有重复序列的DNA大分子方面存在困难:①利用鸟枪法需要将DNA打成片段,进行测序后再进行拼接;这对于较大的基因组尤其是人的基因组来说是困难的,因为随着片段数的增加,所需要分析的数据越来越复杂;②鸟枪法存在的第二个问题是当分析基因组的重复区域时会发生错误,导致部分重复区域被遗遗漏或是将同一染色体或是不同染色体的两个片段错误的连接在一起。总而言之,在测序时需要首先建立一个图谱,通过标明基因和其他显著特征的位置,为测序提供引导。

2,基因组做图的类型:遗传图谱和物理图谱

3,遗传图谱的含义:应用遗传学技术构建的能在基因组上显示基因和其他序列特征位置的图谱。遗传学技术包括杂交育种技术实验。连锁分析是遗传做图的基础。

4,物理图谱的含义:

5,遗传图谱与物理图谱的比较:

遗传作图(Genetic mapping)也称连锁图谱(linkage map)

作图方法:“连锁分析(linkage analysis)”包括杂交实验(cross-breeding experiments),家系(pedigrees)分析等。根据遗传实验计算标记间的相对距离。

标记:性状、基因或DNA分子标记。

图距单位:厘摩(centi-Morgan, cM), 每单位厘摩定义为1%交换率。

物理作图(Physical mapping)

作图方法:采用分子生物学技术测定标记间的绝对距离,直接将DNA分子标记、基因或克隆标定在基因组实际位置。

图距单位:物理图的距离依作图方法而异,如辐射杂种(radiation hybrid)作图的计算单位为厘镭(cR), 限制性片段作图与克隆作图的图距为DNA的分子长度,即碱基对(base pair)。

6,用于遗传学做图的DNA标记:

①限制片段长度多态性(RFLP):利用Southern 杂交和PCR方法;

②简单序列长度多态性(SSLP):包括卫星DNA,小卫星DNA和微卫星DNA(又称为STR)。

微卫星比小卫星更适宜做标记,一是因为小卫星不是均匀分布,长分布在染色体末端的端粒区;二是因为PCR方法更适宜于对微卫星DNA的分型,微卫星的多态性更高。

常用PCR技术结合毛细电泳技术;

③单核苷酸多态性(SNP):最紧密的DNA标记。多数SNP是双等位基因。研究SNP多用寡

核苷酸杂交分析。筛选策略有:DNA芯片和液相杂交技术(荧光淬灭技术)。

7,卫星DNA:(satellite DNA) 是一类高度重复序列。DNA在介质氯化铯中作密度梯度离心,离心速度可以高达每分钟几万转;此时DNA分子将按其大小分布在离心管内不同密度的氯化铯介质中,小的分子处于上层,大的分子处于下层;从离心管外看,不同层面的DNA形成了不同的条带。根据荧光强度的分析,可以看到在一条主带以外还有一个或多个小的卫星带。这些在卫星带中的DNA即被称为卫星DNA,这种DNA的GC含量一般少于主带中的DNA,浮力密度也低。

小卫星DNA:(minisatellite),有时又称可变串连重复(variable number of tandem repeats, VNTR),其重复单位的长度为数十个核苷酸,常位于端粒和近端粒区。

微卫星DNA(microsatellite)或简单串联重复(simple tandem repeats, STR ),其重复单位为1-4个核苷酸,由10-50个重复单位串联组成,散布在整个基因组。

8,不同模式生物的连锁分析:

对果蝇和小鼠等物种:通过有计划的育种试验;

对人类,通过家系分析;

对不发生简述分裂的细菌的连锁分析:结合,转导和转化。

9, Deficiencies of genetic maps:

●Limited resolution(分辨率)

●Limited accuracy (精确度)

Recombination hot spot(重组热点)

Exchange frequency differences between genders(性别差异)

Numerous exchanges between two locus(两位置之间多次改变)

三物理图谱

问题:限制性做图与RFLP有什么区别?FISH在物理图谱中起什么作用?

限制性作图是物理作图法,可以得到两酶切位点之间的物理间隔距离(kb);RFLP 是一种个体基因组中的多态性标记,由酶切位点碱基变异引起的酶切长度多态性,由连锁分析这些多态性标记在亲代和子代间的重组频率来得到RFLPs之间的遗传图距。FISH是将荧光标记的DNA片段通过杂交定位到染色体上,观察不同DNA片段在染色体上的位置和物理距离。

1,物理图谱的含义: Physical maps - identify exact location of DNA sequence in the genome

2,物理做图的原理(种类):

Principles for physical mapping (p88):

●The earliest physical map——cytogenetic map (10Mb)

●Restriction mapping——restriction map (Kb) 其规模受限于限制片段的大小;方法有电泳

和光学作图(包括凝胶拉伸和分子梳理);

●STS mapping任何一个唯一的DNA序列均可以作为STS。

获得STS 的方法,有表达序列标签(EST)、SSLP和随机基因组序列?Clone-based mapping --------可用细胞流速仪进行检测

?RH (Radiation hybrid)——辐射杂种(1Mb)

●FISH (Fluorescent in situ hybridization)——荧光原位杂交

3,物理图谱中大片段的克隆载体:

●Plasmid (质粒) 10kb

●λ噬菌体15kb

●粘粒Cosmid 50kb

●P1噬菌体可达125kb

●PAC(P1人工染色体)可达300kb

●YAC(酵母人工染色体)200~2000kb 如含1Mb插入片段的32,000个

克隆的人基因组Y AC库。

●BAC (细菌人工染色体)100~300kb 如含300kb插入片段的30万个克

隆,覆盖人基因组30倍。

BAC是HGP通用的标准大片段克隆载体。

4,限制性做图的方法:提取DNA——稀有的限制性内切酶切割——DNA片段分离鉴定

(光学方法有凝胶伸展和分子梳理技术)

5,荧光原位杂交:(P94)

The position at which the probe hybridizes to the chromosomal DNA is visualized by detecting the fluorescent signal emitted by the labeled DNA.

Flow of FISH:

①Probe:

●~100kb (from BAC clone of human genome)

●be tagged directly with fluorophores, with targets for antibodies or with biotin (By nick

translation or PCR using tagged nucleotides).

②Interphase(间期)or metaphase(中期)chromosome attached to glass

③Blocking the repetitive DNA

④Hybridizing

⑤Detection by fluorescent microscope

Development of FISH:

radioactively labeled in situ hybridization

●sensitivity

●Resolution

Fluorescence In Situ Hybridization

●repetitive DNA sequences

●Mechanically stretched chromosomes (resolution reaches 200~300 kb)

●Non-metaphase chromosomes (Resolution down to 25 kb)

Application of FISH:

Medical application

●Discover cytogenetic variation: deletion, translocation on chromosomes.

●Detection pathogen from the samples of patient's tissue.

Academic research

●Genome mapping

●Genome comparison

6,STS序列标签做图的原理:

STS are short sequences that are operationally unique in the genome and are used to generate mapping reagents.

Principle for STS mapping (p96):

Collection of overlapping DNA fragments;Checking for the breaking frequency of two STSs The most common sources of STSs:(P98)

ESTs (expressed sequence tags)

SSLP

Random genomic sequeces

7,放射杂交做图(RH):Radiation hybrid (RH) map: A genome map in which STSs are positioned relative to one another on the basis of the frequency with which they are separated by radiation-induced breaks. The frequency is assayed by analysing a panel of human–hamster hybrid cell lines, each produced by lethally irradiating human cells and fusing them with recipient hamster cells such that each carries a collection of human chromosomal fragments. The unit of distance is centirays (cR), denoting a 1% chance of a break occuring between two loci. (p98)

辐射杂交制图流程:

辐射杂种细胞系(嵌板,panel)产生→确定STSs →PCR 体系及反应条件→对PCR 结果数据处理→构建RH 图谱

作图单位:厘镭(CentiRay)——DNA分子暴露在N拉德(rad)X射线剂量下两个分子标记之间发生1%断裂的频率。

四基因组做图和数据挖掘

1,基因组做图的策略:

重叠群法(clone contigs method)——up to down

鸟枪法(whole-genome shotgun method)——bottom to up

2,全基因组鸟枪法测序使用物种:小基因组,包括原核生物,病毒等;

限制因素:

3,基因组测序的难点:①Repeats:Tandem repests;Genome-wide repeats;②Gaps

4, DNA测序方法学:

①Chain termination DNA sequencing (Sanger et al, 1977): the sequence of a single-stranded

DNA molecule is determined by enzymatic synthesis of complementary polynucleotide chains, these chains terminating at specific nucleotide positions;聚丙烯酰胺凝胶电泳检测

②Chemical degradation method (Maxam and Gilbert, 1977): the sequence of a

double-stranded DNA molecule is determined by treatment with chemicals that cut the molecule at specific nucleotide positions. 聚丙烯酰胺凝胶电泳检测

③焦磷酸测序:可以用来快速去顶很短的序列;无需电泳

5, 连续DNA序列的组装:

①通过全基因组鸟枪法拼接序列:

优点是测序速度快,能够在遗传或是物理图谱不存在的情况下工作;(主要特征为:最少利用了两个不同类型载体构建的克隆文库;确保其中一个克隆文库中所包含的片段长于所研究基因组中最长的重复序列)

②用克隆重叠群法组装序列:

可以通过染色体步查方法建立克隆重叠群(该法费时费力);另一种方法是使用克隆指纹图谱技术:限制性图谱;重复DNA指纹图谱;重复DNA的PCR;STS含量做图

6,Clone contigs: A collection of clones whose DNA fragments overlap.

How to sorting clone contigs:

a)Chromosome walking: A technique that can be used to construct a clone contig by

identifying overlapping fragments of cloned DNA.

b)Clone fingerprinting: Any one of several techniques that compare cloned DNA

fragments in order to identify ones that overlap.

7,A scaffold(骨架)is a portion of the genome sequence reconstructed from end-sequenced whole-genome shotgun clones. Scaffolds are composed of contigs and gaps.

A contig (克隆重叠群)is a contiguous length of genomic sequence in which the order of bases is known to a high confidence level.

8, 序列间隙和物理间隙:P118;如何填补

9,大规模自动测序方法的改进:

thermal cycle sequencing (热循环测序)

Fluorescent primers are the basis of automated sequence reading

Capillary Electrophoresis (毛细管电泳, CE) instead of Polyacrylamide Gel Electrophoresis (聚丙烯酰胺凝胶电泳, PAGE):

新的非常规测序方法:

Pyrosequencing (p115)焦磷酸测序方法

●Sequencing-By-Synthesis

●ultra high throughput sequencing

原理:第一步——测序引物和PCR扩增的、单链的DNA模板杂交,与酶—DNA

聚合酶(DNA polymerase)、ATP硫酸化酶(ATP sulfurylase)、荧光素酶

(luciferase)、三磷酸腺苷双磷酸酶(apyrase)—和底物—adenosine 5′

phosphosulfate (APS)、荧光素(luciferin)孵育。

第二步——四种dNTP(dATPS,dTTP,dCTP,dGTP)之一被加入反应体系,

如与模扳配对(A—T,C—G),此dNTP与引物的末端形成共价键,dNTP的焦

磷酸基团(PPi)释放出来。

第三步——ATP硫酸化酶在APS存在的情况下催化焦磷酸形成ATP,ATP驱动

荧光素酶介导的荧光素向氧化荧光素(oxyluciferin)的转化,氧化荧光素发出与

ATP量成正比的可见光信号。

第四步——ATP和未掺入的dNTP由三磷酸腺苷双磷酸酶降解,淬灭光信号,

并再生反应体系。

第五步——然后加入下一种dNTP。

DNA chip——based on DNA hybridization

Solexa and GS20

五.不同模式生物的基因组介绍:

【1】微生物基因组介绍

1.1病毒基因组介绍

1,病毒种类:真病毒,朊病毒和亚病毒(拟病毒和类病毒);

2, 病毒起源假说:

逆向假说:病毒可能曾经是一些寄生在较大细胞内的小细胞。随着时间的推移,那些在寄生生活中非必需的基因逐渐丢失。

细胞起源假说:一些病毒可能是从较大生物体的基因中“逃离”出来的DNA或RNA 进化而来的。

共进化假说:病毒可能进化自蛋白质和核酸复合物,与细胞同时出现在远古地球,并且一直依赖细胞生命生存至今。

4,病毒基因组的特点:

One kind of nucleic acid—DNA (commonly double strand) or RNA (commonly single strand)

The size of virus genomes varies greatly (3×103编码4个蛋白质~1.2 ×106bp编码100个蛋白质). Genome of dsDNA virus is generally bigger than that of RNA virus.

Overlapping gene

Generally genes of virus have single copy.

Most of the genome are coding sequences. Genome of phage is continuous, while genome of eukaryotic virus is discontinuous (gene with intron).

DNA病毒的基因组特点:

Size:

●dsDNA genome (herpesvirus, poxvirus etc.) is bigger (120~280kb);

●ssDNA genome (parvovirus) is smaller (5kb);

High coding efficiency in small DNA virus:

●Overlapping gene

●Utilize both strands for coding.

Inverse terminal repeat (ITR) in genome of DNA virus is important for replication initiation by formation of hairpin.

End replication problem for linear DNA genome:

●Terminal protein priming (adenovirus)

●site-specific nicking priming (poxvirus)

RNA病毒的基因组特点:

dsRNA genome is segmented (such as reovirus).

Many positive ssRNA viruses (for example SARS coronavirus) genomes have 5’-Cap and 3’-Poly(A).

Most ssRNA genome is a single molecule, but there still have some exceptions (for example influenza virus).

Overlapping gene, variable splicing, frameshift are common in RNA viruses.

Overlapping genes (OGs)are defined as adjacent genes whose coding sequences partially or entirely overlap. Many OGs have been identified in the genomes of prokaryotes, viruses, and mitochondria. Overlapping gene pairs can be divided into three types: unidirectional, convergent, and divergent .

5,病毒基因组复制中的问题与多样性对策:

复制模型

①circle dsDNA virus: θreplication;σreplication

②Circular ssDNA virus

③Linear dsDNA virus

引物与引发

5…末端的完整性

6,Variation of virus genome:

Genetic drift: SNP

Antigenic shift

Rearrangement of segmented genome

Genetic recombination

7,Diversity of expression strategies

Timing control—病毒感染的级联调节

Protein biosynthesis of eukaryotic RNA virus

●segmented gene

●Splicing and assembly of peptide

●IRES序列:细小核糖核酸病毒基因组存在内部核糖体进入位点(Inner

Ribosomal Enter Site)

●Nesting subgenome RNAs

●Discontinuous mRNA

1.2原核生物基因组介绍

1.基因组特点:

①Size: generally less than 5Mb; but also have exceptions, e.g. 30Mb for Bacillus megatherium (巨大芽孢杆菌).

②Most prokaryotic genome is circle, but some is linear.

③Compact genome organizaiton. Less non-coding sequences. Both strands have coding sequences.

④Operon is the representative structure of prokaryotic genome.

⑤Structure gene is generally single copy, but there are also some exceptions e.g. rrn coding for rRNA.

⑥The genome of E. coli is replicated bidirectionally from a single origin, identified as the genetic locus oriC.

⑦Lateral gene transfer(基因横向转移):Transfer of a gene from one species to another

2,大肠杆菌基因组物理结构:环状;基因可以双向复制;含有操纵子;基因连续,不含有内含子;

3,最小基因组:至少需要265~350个基因。至少包含能维持生命活动所必须的功能基因和调控基因,以及繁殖所用的基因。

4,原核基因组序列的破译使得菌种分类的概念变得更复杂了:因为原核生物间能通过多种方法进行基因交换,但根据其生物化学和生理学特性,这些原核生物属于不同的物种。基因流是物种概念的核心,但并不适于原核生物。单个物种的不同品系可以有完全不同的基因组序列,甚至有个别品系特异性的基因。

【2】真核生物基因组介绍

2.1 核基因组

1,核基因组的特点:

1. Size:变化范围大,107~1011bp

2. Ploid level (倍数性):generally diploid (二倍体)

3. Each eukaryotic chromosome contains many replicons

4. monocistronic mRNA

5. repeat sequences

6. Discontinuous gene: exon, intron, splicing and alternative splicing

7. Non-coding region:90%

8. Gene density: gene dessert vs. gene island

9. Rare overlapping gene, gene within gene

2,假基因Pseudogene:

已经失活的无功能的基因拷贝,常用ψ表示。

类型及形成的原因:

①常规假基因(conventional pseudogene):DNA复制和突变引起,常位于同源基因有功能拷贝的附近。

a,无意突变:基因内部出现终止密码子;b, 启动子突变失活;c, 剪接信号缺陷;d, 偶尔也可能通过一个有利突变而激活

②加工的假基因(processed pseudogene):功能基因的mRNA经过逆转录产生cDNA插入基因组形成。

a,无内含子。

b,无启动子。来源于RNA聚合酶III转录物的假基因除外,因为它们的启动子位于

mRNA序列内部,如Alu序列。

3, 为什么染色体带型和等容线模型暗示了基因并非平均分布于真核生物染色体上?P207 4,真核生物中的重复序列:P219

形成原因:Replication slippage 复制滑移;Accumulation of mutations(突变累积) in saltatory replications(跳跃复制)

6,DNA 转座的两种机制:Replicative transoposition ;Nonreplicative transoposition 7,DNA transposons of prokaryotes :

插入序列(inserted sequence)

复合转座子(composite transposons ) 在DNA 转座子的两端有一对IS 成分,内

含1个或多个基因,常为抗生素抗性基因。复合转座子借助其它IS 转座酶以保守方式转座。

Tn3-型转座子(Tn-type transposons ) 具有自己的转座酶基因,无须IS 顺序转座,

Tn3因子为复制型转座。

可转座的噬菌体(transposable phage ) 这是一类细菌病毒,复制转座是其正常生

活史中一个内容。插入后可以切离。 8,LTR 元件: Retrovirus

Endogenous retroviruses ( ERVs,内源逆转录病毒)are retroviral genomes integrated into

vertebrate chromosomes. Some are still active, but most are decayed relics.

Retrotransposons (逆转录转座子)have sequences similar to ERVs but are features of

non-vertebrate eukaryotic genomes 9,LTR 元件的形成机制:

散布重复序列: (转座子)

逆转录元件:

只存在于真核生物中 RNA 转座子

LTR 元件:逆转录病毒, 逆转座

缺乏LTR 的RNA 转座子: 逆转座子

自主逆转座子:LINE (长散在重复元件)

非自主逆转座子:SINE ,加工的假基因

串联重复序列

串联重复序列:卫星,小卫星,微卫星

DNA 转座子:普遍存在于基因组中

LTR (long terminal repeats) contains transcriptional promoter and enhancer sequences: U3(含强启动子)-R(正向重复序列)-U5(与转录终止和加polyA有关) Formation of cDNA with directed LTR during retrotransposition

4-nt direct repeat formed in the integration site in genome

10,Retroposons(逆转座子,返座元)

LINE (long interspersed nuclear elements,长分散核因子): contains reverse transcriptase.

Example of LINE in human genome—L1

SINE(short interspersed nuclear element,短分散核因子): its transposition depends on reverse transcriptase provided by other autonomous retroelements.

Example of SINE in human genome—Alu:

11,Transposition mechanisms of LINE and SINE:

LINE:LINE with full length contains DNA endonuclease and reverse transcriptase gene.

●通过切开靶位点双链,提供了引物末端。

●反转录转座子作为模板合成cDNA

SINE:transposed by “borrowing”enzymes from other autonomous retroelements

12. C值悖论:在大的真核生物基因组中、有较多的重复序列、更多的间接序列和更大的基因;(p211)

13.CpG island:

CpG islands are stretches (>200bp) of unmethylated DNA with a higher frequency of CpG dinucleotides (>50%) when compared with the entire genome.

most housekeeping genes have CpG islands at the 5' end of the transcript.

Estimated over 30000 CpG island in human genome.

CpG island methylation is correlated with gene inactivation and has been shown to be important during gene imprinting and tissue-specific gene expression

2.2. organelle genomes器官基因组

1.物理特性:

Organelle genome is usually circular, but there is a great deal of variability in different organisms.

Copy number:

●人类:800×10=8000

●酵母:65×100=6500

Mitochondrial genome sizes are variable and are unrelated to the complexity of the organism

2.两类线粒体基因组的特点: 人类

基因组较小(16.6kb)

结构紧凑,间隔序列很少, 含有个别重叠基因 酵母(低等真核生物和高等植物)

基因组较大(75kb)

有较长的间隔序列和较多内含子

有的内含子中包含基因,功能为RNA剪接

高等植物线粒体基因组中散布有许多短重复序列,常导致重排,使线粒体基因组变化很大(200~2500 kb),并在同一个体中不均一分布。

3.叶绿体基因组的特点

大小:物种间变化不大,组成相似,大小相近(100~200kb),包含约200个基因,如rRNA、tRNA、核糖体蛋白质基因、光合作用有关基因。

数目

●绿藻中约1000个拷贝

●高等植物中每个细胞约200个拷贝

特征:有两段较大的反向重复序列(IR区),编码rRNA,可以防止分子内重组,保持稳定的组成。

4,The origins of organelle genomes

endosymbiont theory (内共生假说)

Animation

六基因获取和功能研究

1,基因表达受那些环节的调控:

2,ESTs(Expressed Sequence tags )是从已建好的cDNA库中随机取出一个克隆,从5?末端或3?末端对插入的cDNA片段进行一轮单向自动测序,所获得的约60-500bp的一段cDNA 序列。

3,Transcription map的含义:

Marker: EST and complementary DNA

Total transcribed sequences is less than 3% of whole genome. Most sequences including most repeats, introns, pseudogenes and intergenic spaces don’t express.

Static vs. dynamic transcription map.

Transcription map is the bridge between structural genome and functional genome.

Disadvantages: the function of regulation sequences cannot be discovered by cDNA. 4,转录图谱的制作方法(Flow chart of large scale EST sequencing):

1)cDNA文库的构建

2)随机单轮测序

3)文库与序列质量检验

4)聚类和重叠群分析

5)ORF的寻找

6)功能分类和注释(Gene Ontology)

7)表达谱分析

8)可变剪接分析

5,转录图谱的意义(Significance of ESTs research):

Construction of gene map (gene expression profile)

Separation and identification of new gene

Comparative analysis of gene expression

Discovery of new SNP

e-hybridization and e-PCR

Alternative splicing

6, 5?和3?EST的特点:

5’-EST:

●Short 5’UTR (~300bp), high conservation in coding region and convenient for

searching ORF and new gene

●More regulation information

●Convenient for clustering and assembling of ESTs

3’-EST

●20~200bp poly(A) tail in mRNA is convenient for the synthesis of the first cDNA

chain using oligo(dT) primer

●3‘UTR has long specific non-coding sequences (~770bp in average) with low

conservation

●10%mRNAs have repeats in 3’-end which can be SSR marker;

●High specificity between organisms and high polymorphism between individuals 7,从EST获得全长cDNA的方法(RACE的原理):From EST to full length cDNA(P194)Rapid amplification of cDNA ends: a PCR-based technique for mapping the end of a mRNA molecule.

3‘-RACE for 5’-EST(P145)

5’-RACE for 3’-EST

8,基因表达差异研究方法:

Large scale analysis of gene expression differences

●SSH(Suppression subtractive hybridization,抑制性减法杂交技术)流程要求掌握!

●cDNA microarray (p172)

●SAGE (serial analysis of gene expression,基因表达系列分析) (P171)

9,From tradition to large scale techniques:

Based on hybridization: gene chip/ cDNA microarray

SSH + cDNA microarray

Based on direct sequencing of small fragment of representative cDNA: SAGE (Serial analysis of gene expression )

用专门识别4 bp碱基的锚定酶(anchoring enzyme, AE),如NIaⅢ(识别位点为CATG) 消化合成的双链cDNA释放5?序列,而生物素酰化的3?端仍被吸附在链(霉)亲和素蛋白磁珠(streptavidin-coatedbeads)上;

②分离与磁珠结合的具3…端poly(A)尾巴的cDNA片段,与标签酶(tagging enzyme, TE, 含有ⅡS类限制酶位点)的接头(A和B)连接,酶切位点一般位于识别位点下游约20 bp处,再用锚定酶(anchoring enzyme, AE ,如NIaIII酶)处理样品,释放带有接头的SAGE标签;

③带有接头的SAGE标签经DNA聚合酶(Klenow)补平后,由连接酶产生带有两个接头的双标签(ditag),对双标签PCR扩增后,再用锚定酶消化,得到了尾尾相连的SAGE双标签,双标签的两端含有锚定酶的酶切位点;

④去除接头的SAGE双标签彼此连接形成长短不一的多联体,电泳分离后收集大小适中的片段克隆到高拷贝的质粒载体,由此组成SAGE库(SAGE library)。

10,基因芯片:固相载体上的寡核苷酸阵列

原理:

方法:Spotted Microarrays

In Situ Oligo Synthesis

Microfluidics

Integrated Chips

应用:基因表达分析;SNP检测分析;筛选/鉴定特殊序列等

问题:基因芯片与Microarray是一样的吗?有什么区别?

广义的基因芯片泛指寡核苷酸的微阵列,而狭义的基因芯片指原位合成的寡核苷酸的微阵列,主要用于检测SNP;而microarray一般指cDNA的微阵列,由点样制成,用于检测基因表达谱。

七Gene Cloning and Function Research

1,克隆目的基因的策略及代表方法:

①Functional cloning:Using information about the function of a known protein that could be involved in a genetic disease. This approach has very limited application.

②Phenotype cloning:Large scale mutation by transposon tagging (转座子标签法)

Gene expression differences analysis

③Positional cloning:Using only information about the gene's approximate chromosomal location obtained from gene mapping

④Positional candidate cloning:Using information from map position and the gene's possible function, homology, and expression pattern. This approach has been quite successful and will dominate other strategies.

2, What is positional cloning?

The core problem for positional cloning—gene localization.

Expression of gene?s position on chromosome:

?Cytogenetic location—describe the rough position on chromosome.

?Molecular location—A gene’s molecular address pinpoints the location of that gene in terms of base pairs.

Methods to localization gene

Cytogenetic analysis(细胞遗传学分析);Genome scan using molecular markers

定位克隆的流程:

4, 如何对基因定位:

Cytogenetic abnormality

Genome scanning (全基因组扫描) : Looking for the markers closest to the disease gene.

(采用DNA分子多态性标记,以较大间距在大量样本、家系或同胞对中进行全基因组扫描,通过连锁分析或关联分析将相关基因定位到某些染色体区域;在这些区域再选择高密度的遗传标记,做精细分析,进一步缩小定位区域;查找该定位区域内的所有基因,从中选择可能的候选基因进行基因变异检测。)

3 factors in gene location by genome scan:

Sample

Genetic DNA polymorphism markers

?RFLP markers

?Microsatellite or STR markers

?Single nucleotide polymorphism (SNP)

Statistic methods

?Linkage analysis (连锁分析)

?Association analysis (关联分析)

5, 连锁不平衡(linkage disequilibrium):Linkage disequilibrium is a term used in the study of population genetics for the non-random association of alleles at two or more loci, not necessarily on the same chromosome.

P(disease & M) ≠ P(disease) x P(M)

连锁分析(linkage analysis):利用家系遗传信息中的重组率计算两位点之间的染色体图距。根据疾病有无合适的遗传模式,可分别进行参数分析和非参数分析。

参数分析:需要设定遗传模式,基因频率和外显率,计算优势对数分数(LOD)值。可高效发现疾病基因的连锁标记,但如果模型设定错误,可能导致结论错误。主要适用于已知遗传模式的单基因遗传病基因定位。

非参数分析:对患病家系中的成对患病成员,比较其基因组同一座位上获得来自共同祖先的同一等位基因的频率,如果与孟德尔独立分离预期频率差异显著,则认为该等位标记与致病基因之间存在连锁不平衡。可适用于多基因疾病,可发现多个连锁不平衡位点,但不能得到其与疾病基因之间的图距。

6, 全基因组关联分析:基于观察标记位点等位基因和疾病基因之间的是否存在连锁不平衡(linkage disequilibrium, LD)的分析法。标记位点与致病基因之间越近、突变率越低、杂合率越高,用标记检出致病基因位点的几率就越高。

7,连锁分析与关联分析的区别:

关联分析通过比较样本间标记位点等位基因频率与疾病相关基因频率的相关性来判断他们之间连锁不平衡现象存在与否以及相关性强弱。

连锁分析通过检测家系中等位基因与疾病基因的遗传特性来判断是否他们之间是否连锁以及连锁程度(图距)。

8,Lod值:

Lod得分是在一定重组率下两个位点相连锁的似然性与两个位点不连锁的似然性比值的对数值L(θ<0.5)

Lod Score=log10

L(θ=0.5)

Statistical Significance of the Lod Score:

?lod score > 3: evidence of linkage

? 2 < lod score < 3: suggestive evidence of linkage

?-2 < lod score < 2: uninformative of linkage

?lod score < -2: exclusion of linkage

9,Transcript identification (p188~195)

ORF scanning scan—computer methods;

Hybridization test;——Northern blotting;Zoo blotting

cDNA sequencing(P192);

Exon trapping(P195);

10,Two types of homologous sequences:Paralogs(旁系同源) and orthologs(直系同源)

Homologous genes are ones that share a common evolutionary ancestor, revealed by sequence similarities between the genes.

Orthologous genes are those homologs that are present in different organisms and whose common ancestor predates the split between the species.

Paralogous genes are present in the same organism, often members of a recognized multigene family, their common ancestor possibly or possibly not predating the species in which the genes are now found.

11, 通过实验研究验证基因的功能有哪些策略及方法:

?Expression patterns

RNA expression assayed by Northern blot or PCR amplification of cDNA with primers specific to candidate transcript

?Look for misexpression (no expression, underexpression, overexpression)

?Sequence differences

?Missense mutations identified by sequencing coding region of candidate gene from normal and abnormal individuals

?Artificial interfering the expression of the gene*

12, Assigning gene function by experimental analysis:

Gene knock-out;RNAi;Gene trap;Gene over expression

13,RNAi是指在生物体细胞内,dsRNA引起同源mRNA的特异性降解,因而抑制相应基

因表达的过程。

一种转录后水平的基因沉默

生物体内普遍存在的机制,抑制外源性进入机体内的有害RNA

?Virus RNA

?Retroelement

?Transgenic dsRNA

14,Gene transfer methodology :

1)physical methods

?Microinjection

?Electroporation

?Particle bombardment (gene gun)

?Electrofusion

2)biological methods

?Retroviral mediated gene transfer

3)chemical methods

?Lipofection

TransMessenger, RNAifFect, HiperfFect (Qiagen for siRNA)

?Non-liposomal lipids: FuGENE 6 (Roche)

?Diethylaminoethyl (DEAE)-dextran (DEAE-葡聚糖)

?Calcium phosphate coprecipitation methods (磷酸钙共沉淀转染)

4)other methods

?Nuclear transplantation for embryo cell or ES cell

15,Gene targeting and transgenic mice

?Mechanism: homologous recombination

?Steps

?Selection markers

?Conditional knock-out: Cre-loxP/specific promoter

八Comparative Genomics and Genome Evolution (2h)

1,The basic mechanisms in population evolution:

?Variation (变异)

?Selection (选择)

?Natural selection (自然选择)

?Neutral drift/random drift (中性/随机漂变)

?Reproductive isolation (生殖隔离)

2,中性学说的要点:

(1)对每种生物大分子而言,只要分子的三级结构与功能基本不变,那么各进化路线,以突变替代表示的进化速率大致保持每年在每个位置上恒定。

(2)机能较次要的分子或分子片段的进化速率,高于机能较重要的分子或分子片段的进化速率。

(3)在分子进化进程中,使分子现存结构和功能破坏较小的突变比破坏较大的突变有更高的替换率。

(4)基因重复通常发生在一个具有新功能的基因出现之前。

(5)明显有害的选择清除和选择上呈中性的或稍有害的突变随机固定,比明显有利突变的正达尔文选择更为频繁。

3,遗传漂变(genetic drift):

群体遗传学的哈迪-温伯格定律(Hardy-Weinberg Law):在一个不发生突变、迁移和选择的无限大的相互交配的群体中,基因频率和基因型频率将逐代保持不变。(1908)由于中性突变对生物的生存和繁殖没有影响。自然选择对他们不起作用,它们在种群中的保存、扩散、消失完全随机,并导致种群中某一等位基因在不同世代中传递时,其频率有较大的波动。

4,The molecular basis for variation and evolution:

DNA duplication (p465~473)

?By duplication of the entire genome;

?By duplication of a single chromosome or part of a chromosome;

?By duplication of a single gene or group of genes.

Mutation (DNA复制错误导致的突变)

Recombination (重组)

?Homologous recombination

?Translocation (转座)

Horizontal gene transfer

5,基因同线性(synteny ):

含义

?不同基因组中基因排列顺序的一致性

?可以出现在不同基因组的对应区段

?也可以出现在同一基因组内部的不同染色体位置

意义:两个物种之间的同线性程度可以作为衡量它们之间进化距离的尺度。但分析时要注意避免高保守和高变异区段

6,人类基因组计划的五大模式生物:

大肠杆菌(Esherichi coli)

酿酒酵母(Saccharomyces cevevisiae)

黑腹果蝇(Drosophila melanogaster)

秀丽线虫(Caenorhabditis elegans)

小鼠(Mus musculus)

拟南芥(Arabidopsis thaliana)

第八章分子生物学常用技术的原理及其应用及人类基因组学

第八章分子生物学常用技术的原理及其应用及人类基因组学 测试题 一、名词解释 1.分子杂交 2.Southernblotting 3.Northernblotting 4.Westernblotting 5.dotblotting 6.DNA芯片技术 7.PCR 8.功能性克隆 9.转基因技术 二、填空题 1.Southernblotting用于研究、Northernblotting用于研究,Westernblotting用于研究。 2.PCR的基本反应步骤包括、和三步。 3.在PCR反应体系中,除了DNA模板外,还需加入、、和。 4.Sange法测序的基本步骤包括、、和。 5.目前克隆致病相关基因的主要策略有、、。 6.血友病第Ⅷ因子基因的首次克隆成功所采用的克隆策略是,而DMD致病基因的克隆所采用的克隆策略是。 三、选择题 A型题 1.经电泳分离后将RNA转移到硝酸纤维素(NC)膜上的技术是: A.SouthernblottingB.Northernblotting

C.WesternblottingD.dotblotting E.insituhybridization 2.不经电泳分离直接将样品点在NC膜上的技术是 A.SouthernblottingB.Northernblotting C.WesternblottingD.Dotblotting E.insituhybridization 3.经电泳分离后将蛋白质转移到NC膜上的技术是 A.SouthernblottingB.Northernblotting C.WesternblottingD.dotblotting E.insituhybridization 4.经电泳后将DNA转移至NC膜上的技术是A.SouthernblottingB.Northernblotting C.WesternblottingD.Easternblotting E.insituhybridization 5.PCR的特点不包括 A.时间短,只需数小时B.扩增产物量大 C.只需微量模板D.用途非常广泛 E.底物必须标记 6.用于PCR的DNA聚合酶必须 A.耐热B.耐高压C.耐酸D.耐碱E.耐低温7.PCR反应过程中,模板DNA变性所需温度一般是A.95?CB.85?CC.75?CD.65?CE.55?C 8.PCR反应过程中,退火温度一般是 A.72?CB.85?CC.75?CD.65?CE.55?C 9.PCR反应过程中,引物延伸所需温度一般是A.95?CB.82?CC.72?CD.62?CE.55?C

基因组学复习题

基因组学复习题 Prepared on 22 November 2020

第1章 1)什么是C-值悖理什么是N-值悖理 C-值悖理:生物基因组的大小同生物进化所处地位的高低无关的现象。 N-值悖理:基因数目与进化程度或生物复杂性的不对应性,称之为N值悖理 2)什么是序列复杂性 基因组中不同序列的DNA总长,用bp 表示。 3)RNA分子有哪些种类 mRNA tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 4)不编码蛋白质的RNA包括哪些类型 tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 5)什么是假基因假基因是如何形成的 来源于功能基因但已失去活性的DNA序列,有沉默的假基因,也有可转录的假基因。 产生假基因的原因有很多,如编码序列出现终止密码子突变,或者插入和缺失某些核苷酸使mRNA移码,造成翻译中途停止或者异常延伸,合成无活性的蛋白质。 6)假基因能否表达为什么 能,假基因相对于原来的基因已经失去功能但是可能产生新的功能。 最初人们认为, 假基因是不能转录的基因, 随着基因组数据的积累, 现在已知有不少假基因仍然保持转录的活性, 特别是起源于重复基因的假基因和获得启动子加工的假基因,但假基因的转录产物已失去原有的功能, 如产生残缺蛋白质。 7)如何划分基因家族什么是超基因家族 基因家族:将来自共同的祖先,因基因加倍或变异产生了许多在DNA序列组成上基本一致而略有不同的成员划分为一个基因家族。 超基因家族:起源于共同祖先,由相似DNA序列组成的许多基因亚家族或相似的基因成员构成的群体,它们具有相似的功能。 8)低等生物与高等生物基因组组成有何差别为什么会产生这些差别 低等生物:1)结构紧凑,一般不存在内含子(古细菌除外); 2)大小在5 Mb以下; 3)缺少重复序列; 4)很少非编码序列。

生物信息学试题整理

UTR的含义是(B ) A.编码区 B. 非编码区 C. motif的含义是(D )。 A.基序 B. 跨叠克隆群 C. algorithm 的含义是(B )。 A.登录号 B. 算法 C. RGR^ (D )。 A.在线人类孟德尔遗传数据 D.水稻基因组计划 下列Fasta格式正确的是(B) 低复杂度区域 D. 幵放阅读框 碱基对 D. 结构域 比对 D. 类推 B. 国家核酸数据库 C. 人类基因组计划 A. seql: agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta B. >seq1 agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta C. seq1:agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta D. >seq1agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta 如果我们试图做蛋白质亚细胞定位分析,应使用(D) A. NDB 数据库 B. PDB 数据库 C. GenBank 数据库 D. SWISS-PROT 数

据库 Bioinformatics 的含义是(A )。 A. 生物信息学 B. 基因组学 C. 蛋白质组学 D. 表观遗传学 Gen Bank中分类码PLN表示是(D )。 A.哺乳类序列 B. 细菌序列 C.噬菌体序列 D. 植物、真菌和藻类序列 ortholog 的含义是(A)0 A.直系同源 B.旁系同源 C.直接进化 D.间接进化 从cDNA文库中获得的短序列是(D )o A. STS B. UTR C. CDS D. EST con tig的含义是(B )o A.基序 B. 跨叠克隆群 C. 碱基对 D. 结构域 TAIR (AtDB)数据库是(C)o A.线虫基因组 B. 果蝇基因组 C. 拟南芥数据库 D. 大肠杆菌基因组ORF的含义是(D )o A.调控区 B. 非编码区 C.低复杂度区域 D. 幵放阅读框

基因组学重点整理

生物五界:动物、植物、真菌、原生生物和原核生物;生物三界:真细菌、古细菌、真核生物 具有催化活性的RNA分子称为核酶(ribozyme)核酶催化的生化反应有:自我剪接、催化切断其它RNA、合成多肽键、催化核苷酸的合成 新基因的产生:基因与基因组加倍1)整个基因组加倍;2)单条或部分染色体加倍;3)单个或成群基因加倍。DNA水平转移:原核生物中的DNA水平转移可通过接合转移,噬菌体转染,外源DNA的摄取等不同途径发生,水平转移的基因大多为非必须基因。动物中由于种间隔离不易进行种间杂交,但其主要来源于真核细胞与原核细胞的内共生。动物种间基因转移主要集中在逆转录病毒及其转座成分。 外显子洗牌与蛋白质创新:产生全新功能蛋白质的方式有二种:功能域加倍,功能域或外显子洗牌 基因冗余:一条染色体上出现一个基因的很多复份(复本)当人们分离到某一新基因时,为了鉴定其生物学功能,常常使其失活,然后观察它们对表型的影响。许多场合,由于第二个重复的功能基因可取代失活的基因而使突变型表型保持正常。这意味着,基因组中有冗余基因存在。看家基因很少重复,它们之间必需保持剂量平衡,因此重复的拷贝很快被淘汰。与个体发育调控相关的基因表达为转录因子,具有多功能域的结构。这类基因重复拷贝变异可使其获得不同的表达控制模式,促使细胞的分化与多样性的产生,并导致复杂形态的建成,具有许多冗余基因。 非编码序列扩张方式:滑序复制、转座因子 模式生物海胆、果蝇、斑马鱼、线虫、蟾蜍、小鼠、酵母、水稻、拟南芥等。模式生物基因组中G+C%含量高, 同时CpG 岛的比例也高。进化程度越高, G+C 含量和CpG 岛的比例就比较低 如果基因之间不存在重叠顺序,也无基因内基因(gene-within-gene),那么ORF阅读出现差错的可能只会发生在非编码区。细菌基因组中缺少内含子,非编码序列仅占11%, 对阅读框的排查干扰较少。细菌基因组的ORF阅读相对比较简单,错误的机率较少。高等真核生物DNA的ORF阅读比较复杂:基因间存在大量非编码序列(人类占70%);绝大多数基因内含有非编码的内含子。高等真核生物多数外显子的长度少于100个密码子 内含子和外显子序列上的差异:内含子的碱基代换很少受自然选择的压力,保留了较多突变。由于碱基突变趋势大多为C-T,故A/T的含量内含子高于外显子。由于终止密码子为TAA\TAG\TGA,如果以内含子作为编码序列,3种读码框有很高比例的终止密码子。 基因注释程序编写的依据:1)信号指令,包括起始密码子,终止密码子,终止信号,剪接受体位和供体位,多聚嘧啶序列,分支点保守序列2)内容指令,密码子偏好,内含子和外显子长短 基因功能的检测:基因失活、基因过表达、RNAi干涉 双链DNA的测序可从一端开始,亦可从两端进行,前者称单向测序,后者称双向测序。 要获得大于50 kb的DNA限制性片段必需采用稀有切点限制酶。 酵母人工染色体(YAC)1)着丝粒在细胞分裂时负责染色体均等分配。2)端粒位于染色体端部的特异DNA序列,保持人工染色体的稳定性3)自主复制起始点(ARS)在细胞中启动染色体的复制 合格的STS要满足2个条件:它应是一段序列已知的片段,可据此设计PCR反应来检测不同的DNA片段中是否存在这一顺序;STS必需在染色体上有独一无二的位置。如果某一STS在基因组中多个位点出现,那么由此得出的作图数据将是含混不清的。 遗传图绘制主要依据由孟德尔描述的遗传学原理,第一条定律为等位基因随机分离,第二条定律为非等位基因自由组合,显隐性规律/不完全显性、共显性、连锁 衡量遗传图谱的水平覆盖程度饱和程度 基因类型:transcribed, translatable gene (蛋白基因) ;transcribed but non-translatable gene ( RNA基因)Non- transcribed, non-translatablegene ( promoter, operator ) rRNA基因,tRNA基因, scRNA基因, snRNA基因, snoRNA基因, microRNA基因 基因组(genome):生物所具有的携带遗传信息的遗传物质总和。 基因组学(genomic):用于概括涉及基因作图、测序和整个基因功能分析的遗传学分支。 染色体组(chromosome set):不同真核生物核基因组均由一定数目的染色体组成,单倍体细胞所含有的全套染色体。 比较基因组学(comparative genomics):比较基因组学是基因组学与生物信息学的一个重要分支。通过模式生物基因组与人类基因组之间的比较与鉴别,为分离重要的候选基因,预测新的基因功能,研究生物进化提供依据。(目标)

基因组学试题

基因组学试题 1、什么是基因组(5分)?什么是转录组(5份)?说明基因组 合的关系和异同(10分)基因组是生物体(细胞或病毒)中所有的DNA的总和, 包括所有的基因和基因间区域,包 括染色体之外的遗传物质,如线粒体、叶绿体、质粒等。 基因组:物种内恒定(♀/♂),生物体或细胞内恒定,没有时空变化(?)。事实上有特例,1、盲鳗(Hugfish) ,性细胞和体细胞DNA 量差异; 2、部分昆虫,性细胞和体细胞染色体数目差异; 3、动物雌雄个体差异 转录组: ?生物体、组织、细胞不同生长发育阶段的转录产物不同。 ?生物体不同组织、同一组织不同细胞的转录产物不同。 ?生物体、组织、细胞不同环境、不同生理状态下的转录产物 不同。 ?转录产物中包含大量不翻译蛋白的RNA,如rRNA; sRNA 2、简述原核生物基因组和真核生物基因组的特点和差异(10分)原核生物基因组 ?一条环状DNA; ?只有一个复制起始点; ?有操纵子(Operon)结构

1.结构基因为多顺反子,若干个功能相关的功能基因串联在一起, 手统一调控区调控。 2.数个操纵子还可以受同一个调节基因(regulaterygene),即调节 子(regulon)调控。 ?结构基因无重叠现象,基因组中任何一段DNA不会用于编码2种蛋白质 ?基因是连续的,无内含子,转录后不剪接; ?重复序列少,蛋白质基因一般为单拷贝基因,但编码rRNA的基因一般为多拷贝,有利于核糖体快速组装。 真核生物基因组 ?复杂的染色体结构,一般有多条染色体 ?每条染色体上有多个复制起始点; ?基因组中有大量的重复序列(轻度、中度、高度重复); ?基因是不连续的,有内含子,转录后经过剪接加工成成熟RNA;?有许多来源相同、结构相似、功能相关的基因组成的单一基因簇,或基因家族 ?有细胞器基因,真核生物除具有核基因外,还有存在于线粒体和叶绿体中基因,编码同功酶等。 3、什么是遗传图谱(5分)?遗传图谱在基因组研究中的意义 何在(15分)?采用遗传学分析方法将基因或其它DNA标记

基因组考研试题及答案解析(华东师范大学)

第一章基因组学 1、学习基因组学所面临的挑战和意义? 全面鉴定人类基因组所编码的结构和功能成分;发展对人类基因组的可遗传变异的详细理解;发展基于基因组学的方法来预测疾病的敏感性和药物反应,疾病的早期检验,以及疾病的分子分类;应用新的基因和代谢通路的知识开发有效的、新的疾病治疗方法发展;理解物种间的进化变异及其机制;关键农作物基因的克隆和功能验证;基于基因组的工具来提高农作物产量,解决世界粮食危机及全球温饱问题。 2、DNA作为遗传物质的优点? 信息量大,集成度高;碱基互补配对,保证精确复制;核糖2’碳位脱氧,在水溶液中稳定 性好;以T取代U,没有C脱氨变U的危险。 3、证明DNA双螺旋的证据? 各种生物物理证据;X射线衍射图谱;碱基比例;模型构建。 4、DNA、RNA的两个重要化学差异有哪些? 碱基组成;链数。 5、原核、真核生物基因组的不同点? 原核生物:基因组为环状双链DNA分子;只有一个复制起始点;具有操纵子结构:指数个功能上相关的基因串联在一起,连同上游的调控区和下游的转录终止信号构成基因的表达单位:一般无重叠基因;基因是连续的,无内含子;编码区在基因组中的比例;基因组中重复 序列很少;具有编码同工酶的基因(isogene):同工酶是指具有相同催化功能而化学结构不 同的酶,它受一个或几个基因座等位基因;分子中有多功能识别区域复制、转录起始区复制、转录终止区 真核生物:体细胞: 两套基因组(二倍体细胞)性细胞: 一套基因组(单倍体细胞);基因组结构复杂,数目庞大, 多个复制起始点;mRNA为单顺反子:真核基因转录产物为单顺反子,即一种基因编码一种多肽链或RNA链,每个基因转录有各自的调节元件;含大量重复 序列;非编码序列占90%以上;基因间有间隔区(spacer DNA),基因为断裂基因(split gene) 即内含子,外显子;功能相关的基因串联在一起形成基因家族 7、真核生物染色体三大要素及功能? 着丝粒:控制细胞分裂时染色体的取向和移动;端粒:防止染色体末端粘连,保证DNA长度稳定;复制原点:起始DNA复制。 8、染色体末端的端粒为什么很重要? 维持染色体结构的完整性,防止染色体被核酸酶降解及染色体间相互融和;防止染色体结构基因在复制时丢失,解决了末端复制的难题。 9、人类基因组中存在哪些类型的重复DNA? 串联重复基因: 6、简述DNA组成基因的两个重要实验? 第二章基因组的复制 1、在Meselson-Stahl的实验前,我们不知道DNA复制是“弥散型”“半保留型”或“全保留型”,描述经几种不同方式复制,子代分子DNA中DNA的区别? 2、什么是半不连续复制模型? 前导链(leading strand):以5’-3’方向连续合成的DNA 链 滞后链(lagging strand):总体上沿着3’到5’方向延伸,但以小片段形式(5¢-3¢)不连续合成,最后共价连接起来 3、为什么需要RNA引物来引发DNA复制呢? (1)RNA引物可以提供3’-OH末端作合成新DNA链起点。

分子生物学试题_完整版(Felisa)

05级分子生物学真题 一、选择题 1、激活子的两个功能域,一个是转录激活结构域,另一个是(DNA结合域) 2、转录因子包括通用转录因子和(基因特异转录因子) 3、G-protein激活needs(GTP)as energy. 4、Promoters and(enhancers)are cis-acting elements. 5、噬菌体通过(位点专一重组)整合到宿主中 6、在细菌中,色氨酸操纵子的前导区转录后,(翻译)就开始 7、mRNA的剪切跟(II)类内含子相似 8、UCE是(I)类启动子的识别序列 9、TATA box binding protein在下列哪个启动子里面存在(三类都有) 10、(5S rRNA)是基因内部启动子转录的 11、人体全基因组大小(3200000000bp) 12、与分枝位点周围序列碱基配对的剪接体(U2snRNP) 13、tRNA基因是RNA聚合酶(III)启动的 14、在细菌中,色氨酸操纵子的前导区转录后,(翻译)就开始 15、乳糖操纵子与阻遏蛋白结合的物质是(异构乳糖)。 16、核mRNA的内含子剪接和(II类内含子剪接)的过程相似 17、基因在转录时的特点(启动子上无核小体) 18、RNA干涉又叫(转录后的基因沉默,PTGS) 19、内含子主要存在于(真核生物) 20、snRNA在下列哪种反应中起催化酶的作用(mRNA的剪接) 二、判断题 1、原核生物有三种RNA聚合酶。 2、抗终止转录蛋白的机制是使RNA聚合酶忽略终止子。 3、RNA聚合酶II结合到启动子上时,其亚基的羧基末端域(CTD)是磷酸化的。 4、Operon is a group of contiguous,coordinately controlled genes. 5、RNA聚合酶全酶这个概念只应用于原核生物。 6、聚腺苷酸尾是在mRNA剪接作用前发生的。 7、σ在转录起始复合复合物中使得open到closed状态(closed转变成open) 8、剪接复合体作用的机制:组装、作用、去组装,是一个循环 三、简答题 1、原核生物转录终止的两种方式。 2、组蛋白乙酰化对基因转录的影响。 3、G蛋白在翻译中的作用有哪些? 4、什么是转座?转座子有哪些类型? 5、简述增强子的作用机制。 04级分子生物学期末题目 一、选择题(20题) 1、tRNA的5端剪切所需的酶(RNase P) 2、人体全基因组大小(3,200,000,000bp) 3、(5S rRNA)是基因内部启动子转录的 4、线虫反式剪接所占比例(10%-20%) 5、与分枝位点周围序列碱基配对的剪接体(U2snRNP)

基因组学复习题

第1章 1)什么是C-值悖理?什么是N-值悖理? C-值悖理:生物基因组的大小同生物进化所处地位的高低无关的现象。 N-值悖理:基因数目与进化程度或生物复杂性的不对应性,称之为N值悖理 2)什么是序列复杂性? 基因组中不同序列的DNA总长,用bp 表示。 3)RNA分子有哪些种类? mRNA tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 4)不编码蛋白质的RNA包括哪些类型? tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 5)什么是假基因?假基因是如何形成的? 来源于功能基因但已失去活性的DNA序列,有沉默的假基因,也有可转录的假基因。 产生假基因的原因有很多,如编码序列出现终止密码子突变,或者插入和缺失某些核苷酸使mRNA移码,造成翻译中途停止或者异常延伸,合成无活性的蛋白质。 6)假基因能否表达? 为什么? 能,假基因相对于原来的基因已经失去功能但是可能产生新的功能。 最初人们认为, 假基因是不能转录的基因, 随着基因组数据的积累, 现在已知有不少假基因仍然保持转录的活性, 特别是起源于重复基因的假基因和获得启动子加工的假基因,但假基因的转录产物已失去原有的功能, 如产生残缺蛋白质。 7)如何划分基因家族? 什么是超基因家族? 基因家族:将来自共同的祖先,因基因加倍或变异产生了许多在DNA序列组成上基本一致而略有不同的成员划分为一个基因家族。 超基因家族:起源于共同祖先,由相似DNA序列组成的许多基因亚家族或相似的基因成员构成的群体,它们具有相似的功能。 8)低等生物与高等生物基因组组成有何差别?为什么会产生这些差别? 低等生物:1)结构紧凑,一般不存在内含子(古细菌除外); 2)大小在5 Mb以下; 3)缺少重复序列; 4)很少非编码序列。

基因组学复习资料整理

基因组学 1. 简述基因组的概念和其对生命科学的影响。 基因组:指一个物种的全套染色体和基因。广义的基因组:核基因组,线粒体基因组,叶绿体基因组等。 基因组计划对生命科学的影响: ①研究策略的高通量,彻底认识生命规律:基因组研究高通量,研究手段和 研究策略的更新,加强了生命科学研究的分工与协作,从不同层次深入研究生命现象。 ②促进了相关学科的发展:分子生物学遗传学生物信息学生物化学细胞生 物学生理学表观遗传学等 ③物种的起源与进化: Ⅰ.重要基因的发掘、分离和利用:遗传疾病相关基因,控制衰老的基因,工业价值的细菌基因,重要农艺性状基因等。 Ⅱ.充分认识生命现象:基因的表达、调控,基因间的相互作用,不同物种基因组的比较研究,揭示基因组序列的共性,探讨物种的起源和进化。 ④伦理学法律问题:伦理问题,知识产权问题,法律问题,社会保险问题。 2. Ac/Ds转座因子 Ac因子有4563bp,它的大部分序列编码了一个由5个外显子组成的转座酶基因,成熟的mRNA有3500bp。该因子本身的两边为11bp的反向重复末端(IR),发生错位酶切的靶序列长度8bp。Ds因子较Ac因子短,它是由Ac因子转座酶基因发生缺失而形成的。不同的Ds因子的长度差异由Ac因子发生不同缺失所致。 Ac/Ds因子转座引起的插入突变方式:玉米Bz基因是使糊粉层表现古铜色的基因,当Ac/Ds转座插入到Bz基因座后,糊粉层无色。当Ac/Ds因子在籽粒发育过程,部分细胞发生转座,使Bz靶基因发生回复突变,从而形成斑点。 Ac/Ds两因子系统遗传特点: 1)Ac具有活化周期效应,有活性的Ac+因子被甲基化修饰后会形成无活性的ac-因子,反之无活性的ac-因子去甲基化成有活性的Ac+因子。 2)Ac与Ds因子有时表现连锁遗传但更多表现独立遗传。 3)Ac对Ds的控制具有负剂量效应。 4)Ac/Ds可引发靶基因表现为插入钝化、活性改变、表达水平改变和缺失突变等。 5)Ds的结构不同,插入同一靶基因的位点可能不同,形成的易变基因的表型也不同。(分子生物学79-81) 3. 正向遗传与反向遗传 正向遗传学研究指从突变体开始的遗传学研究,关心的问题是突变体表型的变化是由哪一个基因功能丧失后引起。 反向遗传学研究指从基因序列开始的遗传学研究,关心的问题是基因功能丧失后会使植物的表型产生什么样的变化。

基因组学复习题

第1章1)什么是C-值悖理什么是N-值悖理 C-值悖理:生物基因组的大小同生物进化所处地位的高低无关的现象。 N-值悖理:基因数目与进化程度或生物复杂性的不对应性,称之为N值悖理 2)什么是序列复杂性? 基因组中不同序列的DNA总长,用bp 表示。 3)RNA分子有哪些种类 mRNA tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 4)不编码蛋白质的RNA包括哪些类型 tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 5)什么是假基因假基因是如何形成的 来源于功能基因但已失去活性的DNA序列,有沉默的假基因,也有可转录的假基因。 产生假基因的原因有很多,如编码序列出现终止密码子突变,或者插入和缺失某些核苷酸使mRNA移码,造成翻译中途停止或者异常延伸,合成无活性的蛋白质。 6)假基因能否表达?为什么 能,假基因相对于原来的基因已经失去功能但是可能产生新的功能。 最初人们认为, 假基因是不能转录的基因, 随着基因组数据的积累, 现在已知有不少假基因仍然保持转录的活性, 特别是起源于重复基因的假基因和获得启动子加工的假基因,但假基因的转录产物已失去原有的功能, 如产生残缺蛋白质。 7)如何划分基因家族?什么是超基因家族 基因家族:将来自共同的祖先,因基因加倍或变异产生了许多在DNA序列组成上基本一致而略有不同的成员划分为一个基因家族。 超基因家族:起源于共同祖先,由相似DNA序列组成的许多基因亚家族或相似的基因成员构成的群体,它们具有相似的功能。 8)低等生物与高等生物基因组组成有何差别为什么会产生这些差别 低等生物:1)结构紧凑,一般不存在内含子(古细菌除外); 2)大小在 5 Mb以下; 3)缺少重复序列;

基因组学考试资料-整理版

第一章 一、基因组 1、基因组(genome):生物所具有的携带遗传信息的遗传物质的总和,是指生物细胞中所有的DNA,包括所有的基因和基因间区域。 2、基因组学:指以分子生物学技术、计算机技术和信息网络技术为研究手段,以生物体全部基因为研究对象,在全基因背景下和整体水平上探索生命活动的在规律及其外环境影响机制的科学。 基因组学包括3个不同的亚领域 结构基因组学(structural genomics) :以全基因组测序为目标 功能基因组学(functional genomics):以基因功能鉴定为目标 比较基因组学(comparative genomics) 二、基因组序列复杂性 1、C值是指一个单倍体基因组中DNA的总量,以基因组的碱基对来表示。每个细胞中以皮克(pg,10-12g)水平表示。 C 值悖理(矛盾)(C-value paradox):在结构、功能很相似的同一类生物中,甚至在亲缘关系十分接 近的物种之间,它们的C值可以相差数10倍乃至上百倍。 C值反映了总体趋势上,随着生物结构和功能的复杂性的增加,各分类单元中最小基因组的大小随分类地位的提高而递增。 2、序列复杂性 单一顺序:基因组中单拷贝的DNA序列 重复顺序:基因组中多拷贝的基因序列 真核生物基因组DNA组分为非均一性,可分为3种类型:快速复性组分、居间复性组分、缓慢复兴组分 三、基因与基因家族 1、基因家族:是真核基因组的共同特征,他们来自一个共同的祖先,因基因加倍和趋异,产生了许多在DNA序列上基本一致而略有不同的成员。 包括编码RNA的基因和编码蛋白质的基因 2、隔裂基因(split gene):指基因部被一个或更多不翻译的编码顺序即含子所隔裂。 3、异常结构基因分类 重叠基因:编码序列彼此重叠的基因,含有不同蛋白质的编码序列。 基因基因:一个基因的含子中包含其他基因。 反义基因: 与已知基因编码序列互补的的负链编码基因,参与基因的表达调控,可以干扰靶基因mRNA转录与翻译。 4、假基因:来源于功能基因但已失去活性或者改变原来活性功能的DNA序列. 四、基因组特征比较 真核生物基因组的特征:复杂性较高的生物基因组结构松弛,在整个基因组围分布大量重复顺序(小基因组重复序列较少,大基因组重复序列急剧扩增);含有大量数目不等的线性DNA分子,并且,每个长 链DNA都与蛋白质组成染色体结构;含有细胞器基因组(所有真核生物都具有环状的线粒体DNA,植物细胞还含有环状的叶绿体DNA。) 原核生物基因组的特征 :原核生物基因数目比真核生物少,大小在5 Mb以下; 原核生物基因组结构更紧凑;(极少重复序列;重复基因的数量远远低于真核生物;不存在含子,基本都是编码序列,无断裂基因。)

(整理)621植物学真题.

一、名词解释 无限维管束 同源器官 颈卵器 心皮 聚合果 无融合生殖 核型胚乳 花程式 孢蒴 内始式 二、蕨类植物比苔藓植物在那些方面更能适应陆生环境。 三、试比较裸子植物与被子植物的主要异同点。 四、何谓木材的三切面?它们的概念怎样?以双子叶禾本植物为例,写出三切面的特征。 五、以水稻为例,叙述禾本科植物花序及花的详细组成。 六、试述被子植物由小孢子母细胞发育为花粉粒的全过程。 七、写出图中数字所指花序类型和胎座类型的名称。……(图略)

一、名词解释 有丝分裂 次生结构 形成层 侵填体 花程式和花图解 真核生物 颈卵器 世代交替 孢子和种子 C3和C4植物 二、试举例说明高等植物根的变态及其主要功能。 三、何谓光合作用,简述提高光合作用的几种途径。 四、试比较单子叶植物与双子叶植物茎的特点。 五、试比较裸子植物与被子植物的生活史

一、名词解释 管胞 凯氏带 居间生长 合轴分枝 孢子、合子与种子 平行进化 景天酸代谢 双名法 石松类植物 单性结实 二、简述植物细胞中各类细胞器的形态特征与主要特征与主要功能。 三、何谓次生生长?分别以根和茎为例简要说明之。 四、试说明苔藓植物的主要进化特征。 五、白果(银杏)和苹果两种“果”的用法各指什么,试分辨之。 六、请写出下列植物拉丁文的中文属名及所在的科 betula eucalyptus ficus ginkgo mangnolia populus quercus rhododendron salix ulmus

一、名词解释 细胞器 减数分裂 心皮 管胞 有限花序 子实体 世代交替 地衣 楔叶植物 通道细胞 二、植物有哪些主要的组织,简要说明它们的功能。 三、简述茎尖的结构及其进一把发育形成的结构或组织。 四、简述花在自然演化过程中的主要进化方向。 五、试以海带为例,说明褐藻类植物的生活史。 六、请写出下列拉丁文的中文属名及其所在的科名。Vitex stipa eucalypms syringe carex poa quercus ligustcum camellia pinu

基因组学考试题目

从请下面十七道中,任选七道作答。 一、在一牛群中,外观正常的双亲产生一头矮生的雄犊。请你提出可能导致这种矮生的各种原因,并根据每种原因提出相应的调查研究的提纲(注意整个调查研究工作必须在两个月内完成)。 二、对于突变体的诱导有许多种方法,请分别列举一种化学的、物理的以及生物的突变体诱变方法。对于表型相同的一组突变体,请设计一遗传试验,验证这些突变属于相同位点(alleles)突变还是不同位点(non-alleles)的突变。 三、简述你所从事过的一项最主要研究工作。如果给你以足够的研究条件,以及3-4年的时间,你将如何进一步深化你的研究工作? 四、试述有丝分裂和减数分裂对于保持物种稳定以及遗传多样性的意义。 五、基因组学研究是近年来生命科学领域的热点之一。简述结构基因组学与功能基因组学的概念,以及利用模式物种进行基因组学研究的意义。 六:请从遗传与变异的角度,论述世界上先有鸡,还是先有鸡蛋? 七:请生理生化和DNA复制的机制角度论述“核酸营养”的合理性或荒谬性。 八、下述是一个虚拟的分子遗传学问题。 表皮毛具有重要的生物学意义。典型的表皮毛结构包括一根主干(main stem) 以及 主干顶端的三个分枝(branches) 组成。形态学研究表明如果主干生

长过长,通常导致顶 端分枝减少至两个或更少。相反,如果主干生长过短导致分枝增加。因此主干的长度与 顶端的分枝数目成负相关。 为了研究表皮毛发育的机制,某研究生筛选到一个表皮毛发育异常的突变体。该突 变体的表皮毛主干较野生型长,且只有两个分枝。该突变体被命名为abnormal branching (abc)。遗传分析表明abc 是一个核基因隐性突变。之后,该研究生克隆了ABC 基因,发现ABC基因编码一个转录因子。DNA测序分析发现在abc突变体中,一个单碱基的突变导致了在一个富含碱性氨基酸的区段(5 个连续的赖氨酸或精氨酸)中的一个赖氨酸突变为甘氨酸。 该研究生制备了抗ABC 蛋白的多克隆抗体。通过原位免疫荧光技术,该研究生发现在野生型中ABC 蛋白完全定位在细胞核中,而在abc 突变体中ABC 蛋白同时定位在细胞质和细胞核中。 为了更深入的研究表皮毛发育的机制,该研究生又筛选了abc 突变的抑制子突变(suppressors of abc; sab)。sab 突变能够抑制abc 突变体的表型(即abc/sab 双突变体的表型为正常)。但在野生型背景下(即sab 单突变),表皮毛变短,分枝增多(4-6 个分枝)。分子遗传学实验证明SAB 基因编码一个F-box 蛋白(F-box protein)。该研究生证明在体外和体内(both in vitro and in vivo) ABC 均与SAB 互作(interaction)。Westernblot 表明ABC 蛋白在sab 突变体细胞中高水平富集。 根据上述结果,简要回答下述问题(第1-4 小题,答案请勿超过50 个字;第5 小题请勿超过200 字): (1)该研究生可能通过什么方法制备了抗原(即用于制作抗体用的ABC 蛋白)?

基因组学整理试题

基因组学整理试题 填空题: 1.位置效应的两种类型:稳定型,花斑型 2.细胞器基因组:线粒体基因组,叶绿体基因组 3.基因组进化的分子基础:突变,重组,转座 聚合酶的三种类型:pol1(RNA聚合酶1),pol2(RNA聚合酶2),pol3(RNA聚合酶3) 5.转座子分类:DNA转座子,逆转录转座子 6.克隆载体的几种类型:YAC,BAC,HAC,MAC 7.重叠群组建的方法:步移法,指纹法 名词解释: 值:是指一个单倍体基因组中DNA的总量,一个特定的种属具有特征的C值。 值悖理:生物种属所具有的基因数目与其生物结构的复杂性不成比例的现象. 值悖理:基因数目与进化程度或生物复杂性的不对应性,称之为N值悖理(N所表示的是基因数目)。 4.基因家族:来自一个共同的祖先, 因基因加倍和趋异产生许多在DNA序列上基本一致而略有不同的成员。 1)大部分担负类似的生物学功能. 2)比较各个成员间的序列差异,可追踪基因的演变轨迹。 5.假基因:来源于功能基因但已失去原来功能的DNA序列.包括重复假基因、加工假基因、残缺假基因。 6. DNA标记 ->限制性片段长度多态性( RFLP) 同一物种的亚种、品系或个体间基因组DNA 受到同一种限制性内切酶作用而形成不同的酶切图谱的现象 ->简单序列长度多态性(SSLP) 可变排列的简单重复序列, 即重复次数不一,在染色体的同一座位重复序列拷贝数不同; 包括俩种类型:小卫星序列(VNTR)、微卫星序列(SSR) ->单核苷酸多态性(SNP) SNP是指同一物种不同个体基因组DNA的等位序列上单个核苷酸存在差异的现象。其中最少一种在群体中的频率不小于1%;如果出现频率低于1%,则视作点突变。 7.序列间隙:因覆盖率的原因而留下的未能测序的序列,仍存在于克隆文库中, 这类间隙称为序列间隙。 物理间隙:因克隆载体自身的限制或DNA顺序特殊的组成等原因造成某些序列丢失或未能克隆, 这类间隙称为物理间隙。 8.表达序列标签(EST):基因转录产物的一段cDNA序列。 9.转座因子:原核生物与真核生物基因组中广泛存在的一类可以移动位置的遗传因子。 10.CpG岛:基因组中富含GC碱基的DNA区段。 满足CpG岛的条件为:

基因组学复习参考

基因组学复习参考(个人见解) 1、原核与真核生物基因组在结构与进化上的异同(古细菌也要留意) 2、遗传图、物理图的绘制方法 3、什么是重复序列?重复序列的种类有哪些(包括原核与真核生物)? 4、DNA测序的基本方法有酶法(桑格法)、化学法两种,描述其原理,解释两种方法的化学反应原理。(可绘图) 5、全基因组序列的测定方法有两种:散弹法和逐个克隆测定法。以细菌基因组(水稻基因组等)为例,解释测定全基因组DNA序列的基本过程和基本原理。 6、近年来蛋白质组学有哪些主要研究方法?它们的基本原理是什么? 7、表观遗传学的定义、包括哪些内容、研究方法 8、转录组的定义、研究的基本方法和实验原理 9、列举第二代测序仪的种类及基本测序原理? 10、全基因组关联性研究和研究的基本方法?(GW AS) 这些是基因组学中比较重要的十大问题。 其余还有 1、列举几种已经测定序列的生物基因组(如人类、小鼠、鸡、水稻、家蚕和果蝇等) 2、SNP、EST、LGT、VGT、RNA-Seq、酵母双杂交、SAGE、RT-PCR\GC含量、宏基因组、泛基因组等概念 3、分子生物学相关问题:RNA的剪切的几种形式,生物获得新基因的基本途径,非编码RNA的种类与功能,DNA的修复,组蛋白修饰等 4、细胞生物学相关问题:肿瘤细胞特征及肿瘤发生关键因素,线粒体、叶绿体特点及起源 5、生物信息学相关问题:常用的生物信息学数据库及序列比对常用的软件和其特点,基因识别的常用软件和原理 6、基因工程相关问题:基因组文库构建与常见载体等 下面是咱们所基因组学的考试大纲还有历年基因组学试题,大家可以参考一下,希望对大家复习有所帮助。 中国科学院北京基因组研究所研究生入学考试 《基因组学》考试大纲 一、考试内容 1.基因组导论 考试内容 ●基因组学的研究对象和发展历程 ●基因在DNA水平、RNA和蛋白质水平的定义 ●基因组的定义和基因组的分类 ●基因学研究的基本内容 ●基因组学研究的基本技术与方法 考试要求 ●了解基因组研究的基本对象、内涵和最新进展

基因组学试题

基因组学与生物信息学闭卷考试I:笔试题 1、请介绍用于遗传图谱构建的至少三种DNA分子标记,包括其名称(中英文)、基本原理及优缺点。(15分) 4 SSR(SSLP) 简单序列重复标记(Simple sequence repeat, 简称SSR标记)或简单序列长度多态性(Simple sequence length polymorphism, 简称SSLP标记) 由Moore等于1991年创立。SSR即微卫星DNA,是一类由几个(多为1-5个)碱基组成的基序(motif)串联重复而成的DNA序列,其长度一般较短,广泛分布于基因组的不同位置,如(CA)n、(AT)n、(GGC)n等重复。不同遗传材料重复次数的可变性,导致了SSR长度的高度变异性,这一变异性正是SSR标记产生的基础。尽管微卫星DNA分布于整个基因组的不同位置,但其两端序列多是保守的单拷贝序列,因此可以根据这两端的序列设计一对特异引物,通过PCR技术将其间的核心微卫星DNA序列扩增出来,利用电泳分析技术就可获得其长度多态性,即SSR标记。 SSR标记的主要特点有:(1)数量丰富,广泛分布于整个基因组;(2)具有较多的等位性变异;(3)共显性标记,可鉴别出杂合子和纯合子;(4)实验重复性好,结果可靠;(5)由于创建新的标记时需知道重复序列两端的序列信息,因此其开发有一定困难,费用也较高。 5STS 序标位(Sequence tagged sites, 简称STS标记) 由Olson于1989年开发成功。STS是指基因组中长度为200-500bp,且核苷酸顺序已知的单拷贝序列,通过PCR可将其专一扩增出来。其基本原理是,依据单拷贝的RFLP探针、微卫星序列、Alu因子等两端序列,设计合适的引物,进行PCR扩增,电泳显示扩增产物多态性。有时扩增产物还需要特定的限制性内切酶酶解后才能表现出多态性。目前用于STS引物设计的主要是RFLP探针。 STS标记的主要特点有:(1)标记来源广,数量多;(2)共显性遗传,可区分纯合子和杂合子;(3)技术简便,检测方便;(4)与SSR标记一样,开发依赖于序列分析及引物合成,成本较高;(5)多态性常常低于相应的RFLP标记,这是因为STS仅仅检测该引物所分布区域的片段差异或酶切位置差异,而RFLP标记的多态性往往可能是探针以外区域的差异,这一部分差异无法转化成STS标记的多态性。

2013基因组学试题

2013基因组学试题

2013基因组学试题 1. 什么是基因组(5分)?真核生物基因组有什么特点(15分)? 基因组是指一种微生物(包括细菌和病毒)或其它生物体细胞中的总DNA或RNA(是指逆转录病毒),包括核DNA,细胞器DNA(动植物线粒体DNA和植物叶绿体DNA)和染色体外遗传成分(如细菌的质粒DNA)。 结构:真核生物基因组结构特点: 真核基因组远远大于原核生物的基因组。 真核基因具有许多复制起点,每个复制子大小不一。每一种真核生物都有一定的染色体数目,除了配子为单倍体外,体细胞一般为双倍体,即含两份同源的基因组。 真核基因都出一个结构基因与相关的调控区组成,转录产物的单顺反子,即一分子mRNA只能翻译成一种蛋白质。 真核生物基因组中含有大量重复顺序。 真核生物基因组内非编码的顺序(NCS)占90%以上。编码序列占5%。 真核基因产断列基因,即编码序列被非编码序列分隔开来,基因与基因内非编码序列为间隔DNA,基因内非编码序列为内含子,被内含子隔开的编码序列则为外显子。 真核生物基因组功能相关的基因构成各种基因家族,它们可串联在一起,亦可相距很远,但即使串联在一起成族的基因也是分别转录的。 真核生物基因组中也存在一些可移动的遗传因素,这些DNA顺序并无明显生物学功能,似科为自己的目的而级织,故有自私DNA之称,其移动多被RNA介导,也有被DNA介导的。 功能: (一)真核基因表达调控的环节更多 基因表达是基因经过转录、翻译、产生有生物活性的蛋白质的整个过程。同原核生物一样,转录依然是真核生物基因表达调控的主要环节。但真核基因转录发生在细胞核(线粒体基因的转录在线粒体内),翻译则多在胞浆,两个过程是分开的,因此其调控增加了更多的环节和复杂性,转录后的调控占有了更多的分量。此外,真核细胞中还会发生基因扩增(gene amplification),基因的扩增无疑能够大幅度提高基因表达产物的量,但这种调控机理至今还不清楚。 (二)真核基因的转录与染色质的结构变化相关 真核基因组DNA绝大部分都在细胞核内与组蛋白等结合成染色质,染色质的结构、染色质中NA和组蛋白的结构状态都影响转录,至少有以下现象:1.染色质结构影响基因转录2.组蛋白的作用 3.转录活跃区域对核酸酶作用敏感度增加 4.DNA拓扑结构变化 5.DNA碱基修饰变化 (三)真核基因表达以正性调控为主 真核RNA聚合酶对启动子的亲和力很低,要依赖多种激活蛋白的协同作用。真核基因调控中有负性调控元件,但并不普遍;真核基因转录表达的调控蛋白是以激活蛋白的作用为主。真核基因组蛋白质编码的基因绝大多数是不连续的,采取逐个基因调控表达的形式。真核基因表达调控的环节多,录后调控的方式也很多 1.真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因的基因组是双份的(即双倍体,diploid),即有两份同源的基因组。 2.真核细胞基因转录产物为单顺反子。一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链。

2013基因组学试题

2013基因组学试题 1. 什么是基因组(5分)?真核生物基因组有什么特点(15分)? 基因组是指一种微生物(包括细菌和病毒)或其它生物体细胞中的总DNA或RNA(是指逆转录病毒),包括核DNA,细胞器DNA(动植物线粒体DNA和植物叶绿体DNA)和染色体外遗传成分(如细菌的质粒DNA)。 结构:真核生物基因组结构特点: 真核基因组远远大于原核生物的基因组。 真核基因具有许多复制起点,每个复制子大小不一。每一种真核生物都有一定的染色体数目,除了配子为单倍体外,体细胞一般为双倍体,即含两份同源的基因组。 真核基因都出一个结构基因与相关的调控区组成,转录产物的单顺反子,即一分子mRNA只能翻译成一种蛋白质。 真核生物基因组中含有大量重复顺序。 真核生物基因组内非编码的顺序(NCS)占90%以上。编码序列占5%。 真核基因产断列基因,即编码序列被非编码序列分隔开来,基因与基因内非编码序列为间隔DNA,基因内非编码序列为内含子,被内含子隔开的编码序列则为外显子。 真核生物基因组功能相关的基因构成各种基因家族,它们可串联在一起,亦可相距很远,但即使串联在一起成族的基因也是分别转录的。 真核生物基因组中也存在一些可移动的遗传因素,这些DNA顺序并无明显生物学功能,似科为自己的目的而级织,故有自私DNA之称,其移动多被RNA介导,也有被DNA介导的。 功能: (一)真核基因表达调控的环节更多 基因表达是基因经过转录、翻译、产生有生物活性的蛋白质的整个过程。同原核生物一样,转录依然是真核生物基因表达调控的主要环节。但真核基因转录发生在细胞核(线粒体基因的转录在线粒体内),翻译则多在胞浆,两个过程是分开的,因此其调控增加了更多的环节和复杂性,转录后的调控占有了更多的分量。此外,真核细胞中还会发生基因扩增(gene amplification),基因的扩增无疑能够大幅度提高基因表达产物的量,但这种调控机理至今还不清楚。 (二)真核基因的转录与染色质的结构变化相关 真核基因组DNA绝大部分都在细胞核内与组蛋白等结合成染色质,染色质的结构、染色质中NA和组蛋白的结构状态都影响转录,至少有以下现象:1.染色质结构影响基因转录2.组蛋白的作用 3.转录活跃区域对核酸酶作用敏感度增加 4.DNA拓扑结构变化 5.DNA碱基修饰变化 (三)真核基因表达以正性调控为主 真核RNA聚合酶对启动子的亲和力很低,要依赖多种激活蛋白的协同作用。真核基因调控中有负性调控元件,但并不普遍;真核基因转录表达的调控蛋白是以激活蛋白的作用为主。真核基因组蛋白质编码的基因绝大多数是不连续的,采取逐个基因调控表达的形式。真核基因表达调控的环节多,录后调控的方式也很多 1.真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因的基因组是双份的(即双倍体,diploid),即有两份同源的基因组。 2.真核细胞基因转录产物为单顺反子。一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链。

相关主题
文本预览
相关文档 最新文档