聚类分析方法

  • 格式:doc
  • 大小:855.00 KB
  • 文档页数:48

下载文档原格式

  / 48
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章Microarray 介绍

1.1 生物信息处理

基于对生物体“硬件”和“软件”的认识 ,提出暂时地撇开生物的物理属性 ,着重研究其信息属性 ,从而进入到生物信息处理 (关于生命硬件的信息和软件的信息 ,即生理信息和生命信息 )的一个分支 ,生物信息学。于是 ,为揭开生命之秘、揭示与生命现象相关的复杂系统的运作机制打开一条新的途径。

什么是生物信息处理

生物信息处理的英文是Bioinformatics。 1994年初 ,诺贝尔医学奖获得者美国教授M·罗德贝尔发表一篇评论 ,题为《生物信息处理 :评估环境卫生的新方法》。他认为生物信息处理是在基因数据库基础上 ,计算机驱动的能快速获得表达基因部分序列的方法。通过MEDLINE数据库 ,可以查阅到很多与生物信息处理 (Bioinformatics)有关的记录,其中JFAiton认为生物信息处理是基于计算机的数据库和信息服务;RPMurray认为生物信息处理包括两方面:第一是大量现存数据的自动化处理 ,第二是新的信息资源的生成;DBenton在题为《生物信息处理———一个新的多学科工具的原理和潜力》的文章中说 ,生物信息处理的材料是生物学数据 ,其方法来自广泛的各种各样的计算机技术。其方法来自广泛的各种各样的计算机技术。近年来 ,生物学数据在爆炸式增长 ,新的计算机方法在不断产生。这些方法在结构生物学、遗传学、结构化药品和分子演变学中是研究工作进展的基础。如果生物医学工程要在各个领域都从研究进展中获取最大好处 ,那么生物学数据健全的基础设施的开发与维护是同等重要的。尽管生物信息处理已经作出重要贡献 ,但是在它成熟时就会面临更大的需求在爆炸式增长 ,新的计算机方法在不断产生。这些方法在结构生物学、遗传学、结构化药品和分子演变学中是研究工作进展的基础。如果生物医学工程要在各个领域都从研究进展中获取最大好处 ,那么生物学数据健全的基础设施的开发与维护是同等重要的。尽管生物信息处理已经作出重要贡献 ,但是在它成熟时就会面临更大的需求。

在整体上可以看出 ,生物信息处理的两个基本内容是生物数据库建立和计算机信息服务 ,也就是生物数据处理的计算机数据库化和程序化。当前这种数据库的内容主要是目录、期刊、遗传基因和细胞三维结构学。服务程序主要用于信息检索和基因序列分析。

所以 ,严格地说 ,当前生物信息处理远未形成独立的学科 ,它同计算机生物学应用并无重大区别。在1998年第九届世界医药信息学大会上 ,它才作为一个讨论题目被列出来。可以说,生物信息处理技术是一项年轻的研究领域。

1.2 Microarray 技术

1.2.1 Microarray 技术原理

微阵列技术是利用分子杂交的原理,用自动化仪器arrayer把不同的,数以百计、千计、万计已知部分序列的DNA探针“印”在玻璃片或者尼龙膜上面成阵列。为了比较两份标本中核酸表达的丰度,两份标本中核酸用同位素或者荧光素(红和绿两种)标记,再于微阵列杂交,然后检测杂交信号的强度,通过一定的数据处理系统,把它们转化成两份不同标本中特异基因的丰度,最后对这些数据进行分析。

根据微阵列技术原理,微阵列技术的处理流程如下:

1. 实验设计

2. 样品制备(指mRNA或总RNA样品,包括对照组和实验组)

3. 芯片制备(包括PCR,纯化,点样等步骤)

4. 芯片杂交(将mRNA或总RNA分别进行逆转录生成cDNA,在此步骤中

将对照组和实验组cDNA分别标记CY3和CY5荧光信号)

5. 芯片扫描(采用激光扫描仪,分别用532nm和635nm波长激光扫描芯片,

对于每张芯片,得到CY3和CY5通道两幅图象)

6. 图象处理(采用专门软件,对图象进行分析,提取每个点上的数字信号),

得到原始数据表。

7. 数据校正和筛选(对cy5或cy3信号进行校正,消除实验或扫描等各环节

因素对数据的影响,同时利用筛选规则对数据中的“坏点”,“小点”,“低信号点”进行筛选,并作标记。)

8. 差异表达基因的确定(采用ratio值对差异基因进行判断,或采用统计方

法如线性回归、主成分分析、调整P值算法等对差异基因进行统计推断)

9. 生物信息学分析(如cluster 算法、差异基因的同源性比对,差异基因的

相关文献检索等)

一个最简单的配置应包括微阵列制作系统 (arrayer) ,信号收集系统(scanner) ,计算机和软件 (操作系统和微阵列技术处理的相关软件 )。

1.2.2 Microarray 技术应用领域

Microarray 技术是近几年兴起的新技术,但短短几年中,该技术已经被分子生物学的很多领域接受,并广泛应用于以下领域:

1、基因表达分析和检测

微阵列技术已经被许多研究小组应用于与基因表达有关的工作中,如对细菌、动植物和人类的研究。包括:特异性相关的基因、差异表达的基因、基因功能研究、健康状况的检测、毒理学研究、药物作用机制的研究、定位克隆。

2、功能分析

检测到基因表达差异之后 ,下一步是寻找这些差异的生物学功能。

最近Davis等人[1 7]发明了一种新的方法。主要是应用插入一个独特序列或标记的突变酵母链。分子标记在特殊的的生长条件下从生存链中扩增 ,并与高密度微阵列进行杂交。这样不仅可以确定这条链的相对丰度 ,而且可以在不同时间点反复进行 ,同时还可以精确比较每条缺失链的适应性。

3、基因作图

微阵列技术的应用补充了基因表达研究的方法 ,加强了对疾病易感性和疾病本质的研究。这种方法无论是在速度上还是在准确性上都远胜于传统方法 ,它将会改变基因制图的方法。

1.2.3 Microarray 技术发展现状

DNA微阵列技术(DNA microarray technology)是近几年发展起来的应用DNA 微阵列进行基因功能研究的新的生物技术。微阵列自1995年在《Science》上报道后 ,被认为是该年度《Science》上发表的最有影响的文章之一。微阵列是新出现的分子生物学技术 ,是本世纪重要的科学进展 ,它能够高效率、大规模地获取相关生物信息 ,是现代生物技术、微电子技术、机械制造技术、计算机技术的结合。其对科学的深远影响将远胜过DNA测序和PCR等,使人们更大规模