全基因组重测序

  • 格式:pdf
  • 大小:1.98 MB
  • 文档页数:36

下载文档原格式

  / 36
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
23558742
比对原理
将基因组拆分为若干个具有互相overlap的片段—index Reads与已经拆分好的片段进行比对,找到最优的比对位置 DNA 使用BWA RNA或chip-seq使用Bowtie 比对效率:比对到基因组上的reads/所有参与比对分析的reads
变异检测
碱基平均测序深度 基因组未覆盖率 基因组覆盖率
1
3.68E-01
63.21%
2
1.35E-01
86.47%
3
4.98E-02
95.02%
4
1.83E-02
98.17%
5
6.74E-03
99.33%
10
4.54E-05
100%
15
3.06E-07
100%
双端测序
对于一个DNA片段的两侧同时进行测序,完成测序reads的测序 优点:
分子标记 • 核苷酸序列的差异
多态性(Polymorphism)——-群体内同一DNA序列的 两种或多种变异形式,统计表明:群体内任何两个生物 个体平均每1000~10000个碱基对有一对有差别,这种差 别就是多态性。
突变(Mutation)——指DNA水平的可遗传的变异,不 管这种DNA变异能不能导致可检测的表型或生化改变。 突变产生的变异是自然选择的基础。可遗传的突变在群 体中扩散从而产生多态性。
基因组重测序
1. 什么是基因组重测序
• 基因组重测序是对已知基因组序列的物种进行不同个体的基因组测序,并在此 基础上对个体或群体进行差异性分析。
2. 重测序原理
• 基于测序序列与参考基因组间的比对,发现样品与参考基因组间的变异位点, 如SNP、InDel、SV等
3. 重测序必要条件
• 已知物种基因组 • 待测物种与参考序列物种足够接近
同义/非同义突变
同义突变(synonymous mutation):
由于生物的遗传密码子存在简并现象,密码子的核苷酸发生改 变后,所编码的氨基酸种类保持不变。
非同义突变(non来自百度文库ynonymous mutation):
密码子的核苷酸发生改变后导致编码的氨基酸改变。
SNP功能
INTERGENIC INTRAGENIC INTRON UPSTREAM DOWNSTREAM UTR_5_PRIME UTR_3_PRIME SPLICE_SITE_ACCEPTOR SPLICE_SITE_DONOR START_GAINED START_LOST NON_SYNONYMOUS_START SYNONYMOUS_CODING NON_SYNONYMOUS_CODING SYNONYMOUS_STOP STOP_GAINED STOP_LOST
实验部分
随机 打断
片段 选择
上机 测序
加入 接头
桥式 PCR
关键参数
PE测序,测序读长151bp 插入片段大小:360bp 下机数据格式:Fastq格式 测序深度:对基因组每个碱基
的次数 测序覆盖度:基因组上深度不
为0的碱基比例
测序深度与覆盖度
根据1988年提出的Lander-Waterman 模型:测序深度 达到5X即可达到99%以上的覆盖度。
比对情况:
双端序列比对到一条染色体上
双端序列比对到不同染色体上
单端序列比对上,另一端未比对上
软件 SOAP Maq BWA Bowtie NovoAlign Subread
发表年代 2008 2008 2009 2009 2009 2013
双端序列均未比对上
PMID 18227114 18714091 19451168 19261174
对隐性农艺性状的选择十分便利 5. 表现为中性,不影响目标性状的表达,与不良性状无连锁 6. 检测手段简单、迅速 7. 差异发生于同源染色单体之间
构建遗传连锁图谱 分子标记辅助选择育种 基因定位 基因克隆 植物遗传多样性分析 品种和品质纯度鉴定及遗传纯度的测定 疾病检测
双端 信息:能够跨越一段序列 插入片段信息:无法预知具体序列信息,可以预知长度大小
read1
read2
全基因组重测序——分析
序列比对 SNP检测 INDEL检测 SV检测 CNV检测 功能注释
序列比对
根据reads与参考基因组的相似性将reads定位到染色体上的过程
比对软件
比对特点:短序列局部比对,遇到重复比对随机输出一个位置
SNP INDEL SV CNV
SNP
由于单个核苷酸变异导致的序列碱基差异 两种类型:
转换:同型碱基的置换(嘌呤↔嘌呤、嘧啶↔嘧啶) (A↔G、T↔C);
颠换:异型碱基的置换(嘌呤↔嘧啶) (AT↔TA/CG,GC↔CG/TA)
SNP检测
结合基因组同一碱基位置的A/T/G/C的出现次数和测序错误率,判断单一位点是为纯合/杂合 Step1:reads比对到基因组上 Step2:统计每个碱基上reads的ATGC出现的次数 Step3:结合突变率和测序错误率对纯和和杂合进行判断 Step4:确定高质量的SNP位点
两个基本特征:可遗传性和可识别性 某种生物的任何有差异表型的基因突变型均可作为遗传标记。
形态标记
• 株高、穗形、粒色或芒毛等外部形态特征的 相对差异。
细胞学标记 • 染色体核型(染色体数目、结构、随体有无、 着丝粒位置等)和带型(C带、N带、G带等) 的变化。
生化标记 • 基因表达产物——同工酶、等位酶等的差异。
• RFLP • RAPD、ISSR、 SSR、SCAR、SRAP • AFLP、CAPS • SNP
DNA变异基本类型
SNP
• 单核苷酸多态性
INDEL
• 小片段的插入缺失
SV
• 大片段的基因组结构变异
CNV
• 基因组片段的拷贝数变异
目录
分子标记 全基因组重测序—实验 全基因组重测序—分析 全基因组重测序—应用
以个体间核苷酸序列变异为基础的遗传标记 是 DNA 水平遗传多态性的直接反映 能直接反映生物个体或种群间基因组DNA间的差异
1. 直接以DNA的形式表现,不受组织、发育阶段、季节、环境等 因素的限制,不存在表达与否等问题,表现稳定
2. 数量极多,遍布整个基因组 3. 多态性高,自然界存在许多等位变异 4. 许多标记表现为共显性的特点,能区别显性纯合体和杂合体,
WGS原理
目录
分子标记与DNA变异 全基因组重测序—实验 全基因组重测序—分析 全基因组重测序—应用
遗传标记
遗传标记是指在遗传分析上用作标记的基因,也称为标记基因。
形态学标记 细胞学标记 生物化学标记 免疫学标记 分子标记
遗传标记(genetic marker)概念: 指可追踪染色体、染色体某一节段、某个基因座在家系中传递的任何一种遗传 特性。