差异表达基因识别算法性能比较与分析
- 格式:doc
- 大小:15.50 KB
- 文档页数:3
转录组数据分析中的差异表达基因确定方法转录组数据分析是研究生物体内转录过程的全基因表达情况的一个重要手段。
通过分析转录组数据,我们可以确定哪些基因在不同条件下表达水平发生了显著变化。
这些差异表达的基因被认为与不同条件下生物体功能的变化密切相关。
因此,确定差异表达基因是理解生物体适应和响应各种条件变化的关键。
在转录组数据中确定差异表达基因,一般需要经历如下几个步骤:1. 数据预处理:首先,需要对原始的转录组数据进行质量控制和过滤。
通过质量控制,我们可以评估数据的准确性和可靠性。
而通过过滤掉低质量的数据,可以提高后续分析的可靠性和准确性。
常用的预处理方法包括去除低质量的读段、去除低质量的碱基、去除接头序列及低质量的5'和3'端。
2. 对齐与定量:第二步是将预处理后的转录组数据与参考基因组对齐,将reads与参考基因组相匹配。
目前常用的对齐工具包括Tophat、STAR等。
通过对齐,可以获得每个基因在样本中的表达量。
常见的定量软件包括HTSeq和Cufflinks等。
3. 差异表达分析:差异表达分析是转录组数据分析的核心步骤。
根据不同的实验设计和假设,可以选择不同的差异表达分析方法。
常见的差异表达基因分析方法包括DESeq2、edgeR、limma等。
这些方法在统计学模型的基础上,使用不同的假设检验方法来寻找表达差异显著的基因。
通常会计算差异倍数(Fold Change)和调整的p值。
4. 功能注释与富集分析:确定差异表达基因后,将这些基因进行进一步的功能注释和富集分析是继续研究的重要一步。
功能注释通过查询数据库(如Gene Ontology和KEGG)来了解差异基因的功能和通路信息。
富集分析则通过比较差异表达基因与全基因组之间的差异,找出在特定功能和通路上显著富集的基因。
这些注释和富集结果能够帮助我们了解差异表达基因的生物学意义。
除了上述的常见分析步骤,根据具体的研究问题,还可以采用其他附加分析方法,如构建共表达网络、进行重要转录因子的分析等,来进一步挖掘差异表达基因的潜在功能。
生物大数据技术中的差异表达基因分析方法生物大数据的快速发展为生物学研究提供了前所未有的机遇。
其中,差异表达基因分析方法是生物大数据技术中的重要研究内容。
差异表达基因分析是比较两个或多个样本中基因表达差异的研究。
它的目的是找出在不同条件或状态下表达水平发生显著变化的基因,从而深入研究与生物学过程相关的机制和调控网络。
在生物大数据技术中,有多种差异表达基因分析方法可供选择。
下面将介绍其中的几种主要方法。
首先,最为常用的方法之一是差异表达分析的统计学方法。
这种方法通过对比两个或多个不同条件下的基因表达数据,运用统计学模型进行分析。
常见的统计学方法包括t检验、方差分析 (ANOVA)、贝叶斯统计学等。
它们在差异检验、基因表达水平的显著性评估等方面有着广泛的应用。
此外,不同的统计学方法还可以结合其他技术,如机器学习等,来提高分析的准确性和可信度。
其次,基因差异表达的模式识别算法也是研究生物大数据技术中常用的方法。
模式识别算法可以通过对基因表达数据进行聚类分析、主成分分析 (PCA)、自组织映射 (SOM) 等,来寻找潜在的基因表达模式或特征。
其中,基于聚类分析的模式识别算法可以将样本或基因分成不同的簇,从而发现不同基因表达的模式。
这种方法有助于理解基因与生物学过程之间的关系,为后续的功能注释和生物学机制研究提供重要参考。
此外,基因表达的差异分析还可以采用机器学习方法。
机器学习通过构建模型来进行预测和分类,可以将基因表达数据作为输入,利用已知的类别标签进行训练,进而对未知样本进行分类或预测。
常用的机器学习算法包括支持向量机 (SVM)、随机森林 (Random Forest)、人工神经网络 (Artificial Neural Network) 等。
这些算法可以挖掘出隐藏在基因表达数据中的模式和规律,从而对差异表达基因进行分类和预测。
最后,差异表达基因分析方法还可以结合到功能注释和通路分析中。
功能注释可以通过对差异表达基因进行GO (Gene Ontology)、KEGG (Kyoto Encyclopedia of Genes and Genomes)、Reactome等数据库的富集分析,来探索差异基因与生物学功能之间的关联。
生物信息学中的基因表达数据分析方法在生物学研究中,基因表达数据的分析对于理解生物体内基因调控的机制和功能至关重要。
随着高通量测序技术的发展,基因表达数据的获取和分析变得更加容易和准确。
生物信息学中的基因表达数据分析方法主要包括差异表达分析、基因共表达网络分析以及功能富集分析等。
差异表达分析是基因表达数据分析的关键技术之一。
它可以识别不同基因在不同组织或条件下的表达量差异,从而帮助我们深入了解基因的功能和调控。
常用的差异表达分析方法包括基于计数数据的DESeq2和edgeR,以及基于表达量的limma等。
这些方法能够通过统计学模型和假设检验来识别不同基因的显著差异表达,并且考虑了多重比较校正和批次效应等因素的影响。
另外,基因共表达网络分析也是生物信息学中常用的方法之一。
它可以根据基因表达模式的相似性将基因划分为不同的共表达模块,从而发现基因之间的相互作用关系。
基因共表达网络分析能够帮助我们预测基因功能、发现新的基因调控模块以及揭示基因调控网络的结构和功能。
常用的基因共表达网络分析方法包括WGCNA和STRING等。
这些方法能够通过计算基因之间的相关性来构建基因共表达网络,并利用网络拓扑结构和模块发现算法来鉴定关键的共表达模块和核心基因。
此外,功能富集分析也是基因表达数据分析中重要的方法之一。
它可以识别差异表达基因集合中富集的生物学功能和通路,从而揭示基因集合在特定生物过程中的功能角色。
功能富集分析常用的方法包括基于基因本体论(Gene Ontology)的GO分析和基于KEGG通路的富集分析。
这些方法能够通过统计学假设检验来判断差异表达基因集合是否富集于特定的功能分类或通路,帮助我们深入了解基因的功能和生物学过程的调控机制。
此外,在基因表达数据的分析中,还有许多其他的方法可以用于发现和解释基因表达的模式和调控机制,比如聚类分析、GO/KEGG富集分析、差异表达基因的功能注释和生物学网络分析等。
这些方法的应用丰富了我们对基因表达数据的理解,并且为生物学研究提供了重要的信息。
生物信息学中的基因表达数据分析方法比较随着高通量测序技术的快速发展,大量的生物信息学数据被积累下来,其中基因表达数据是其中一类最为重要的数据类型。
基因表达数据可以帮助我们了解基因在细胞或组织中的活动水平,进而洞察基因调控网络的运作机制。
在生物信息学研究中,比较不同的基因表达数据分析方法对于揭示生物学过程的关键因素、特定基因的表达模式以及发现新的生物学知识至关重要。
本文将会介绍几种常见的基因表达数据分析方法,并比较它们之间的优缺点。
1. 基因差异分析(Differential Gene Expression Analysis)基因差异分析是一种常见的基因表达数据分析方法,它用于比较两个或多个实验组之间的基因表达水平的差异。
通过基因差异分析,我们可以识别出在不同情况下表达量显著变化的基因。
这些基因可能与生物学过程的调节、疾病的发生等密切相关。
在基因差异分析中,常用的方法包括:差异表达基因分析(Differential gene expression analysis)和差异表达基因富集分析(Differential gene expression enrichment analysis)。
差异表达基因分析使用统计学方法来比较基因在两个或多个组之间的表达量差异,并验证这些差异是否显著。
而差异表达基因富集分析则通过对差异表达基因进行功能富集分析来发现差异表达基因在特定生物学过程中的富集情况。
2. 基因聚类分析(Gene Clustering Analysis)基因聚类分析是一种将基因根据它们的表达模式进行分组的方法。
通过基因聚类分析,我们可以发现具有相似表达模式的基因群,从而推测它们在生物学过程中可能具有相似的功能或相互作用。
基因聚类分析有多种方法,包括层次聚类分析(Hierarchical clustering analysis)、k-均值聚类分析(k-means clustering analysis)、模糊C-均值聚类分析(Fuzzy C-means clustering analysis)等。
生物信息学中的差异表达基因分析方法研究随着高通量测序技术的发展,基因表达谱数据量急剧增加。
为了研究生物体在不同生理状态下基因表达的变化,需要对这些数据进行差异表达基因分析。
差异表达基因分析方法是生物信息学领域的一个研究热点,它可以帮助研究人员深入了解基因表达与功能的关系,探究生物学中的各种生理和病理过程的机理。
差异表达基因分析方法的基本流程差异表达基因分析方法的基本流程包含以下几个步骤。
首先是原始数据的预处理,这一步包括质控、去除低质量序列、去除序列的适配序列和低复杂度序列以及对基因组进行比对等。
接下来就是差异表达基因的鉴定,这一步需要对不同条件下的基因表达进行比较、统计和分析,寻找在不同条件下表达量发生变化的基因。
最后就是差异表达基因的生物信息学分析,如富集分析、通路分析等,用以揭示差异表达基因的生物学功能与代谢通路,为之后的实验设计和结果验证提供思路。
差异表达基因分析方法的主流技术目前差异表达基因分析方法的主流技术有两种:微阵列技术和RNA测序技术。
微阵列技术适用于高通量检测大量基因表达谱情况下的差异表达,但其优缺点并存。
其中由于存储的基因表达谱缺乏深度信息,高度仰赖于探针的准确性,所以其数据分析结果易产生偏差。
因此,相对于微阵列技术,RNA测序技术有着更为准确和精细的差异表达分析。
差异表达基因分析方法的建模差异表达基因分析方法的建模是差异表达分析的重要环节。
目前应用最为广泛的方法是一元线性模型,可以计算每个基因在两个条件下的平均表达量和差异表达的似然比测试。
此外,在数据量小的情况下,二项式模型比一元线性模型更适用于差异表达分析,不同的模型虽然结构不同,但训练结果都可以作为筛选基因的依据。
差异表达基因分析方法的优化为了获得更为准确、细致和可靠的差异表达基因预测结果,需要对于差异表达基因分析方法进行优化。
其中优化方法与技术的选择、算法的运用和评估标准等,都有着深入而细致的研究。
例如,预测差异表达基因的DESeq2算法就是考虑了基因之间的不同,通过多组分组比较实现差异表达基因的筛选,因此DESeq2算法是RNA测序研究中目前最为流行的DE工具之一。
差异表达基因分析
差异表达基因分析(DifferentialExpressionGeneAnalysis,DEGA)是生物学中常用的一种技术,用于检测和确定不同生物样本或环境条件下的基因表达的差异。
本文旨在介绍差异表达基因分析技术,它的原理及其研究应用。
第一部分,定义差异表达基因分析。
差异表达基因分析是一种基因表达谱分析方法,旨在检测出样本在不同条件下有显著不同表达水平的基因。
它通过分析一系列相关的样本,明确哪些基因在不同条件下发生了显著表达差异。
第二部分,介绍差异表达基因分析的原理。
差异表达基因分析的基础是分析样本的RNA产物,即能够表达的基因的cDNA,以确定不
同条件下某些基因的表达差异。
通过使用一种叫做聚合酶链反应(PCR)的技术,可以比较多个样本的cDNA的表达水平,以确定哪些基因在
不同环境下有明显的表达差异。
第三部分,介绍差异表达基因分析的研究应用。
差异表达基因分析技术可以用于检测基因在不同环境、疾病和药物作用下的表达情况。
例如,可以检测癌症发生中不同细胞类型的基因表达差异。
此外,它还可以用于研究不同物种之间基因表达的差异,以及对特定疾病的病因及其预后等方面的研究。
本文综述了差异表达基因分析的定义、原理以及研究应用。
它是一项重要的技术,可用于生物学和疾病研究中的定量分析,为研究者提供重要的细胞和分子级数据,从而极大地推进了生物学研究。
RNA测序数据中的差异表达基因分析方法研究随着高通量测序技术的快速发展,RNA测序成为了研究基因表达和转录组的重要方法之一。
通过RNA测序,我们可以获取到细胞或组织中全部转录本的信息,进而揭示出与疾病发生、发展以及生物学过程相关的差异表达基因。
差异表达基因分析是RNA测序数据分析的重要组成部分,它可以帮助我们识别出在不同样本中表达量有显著差异的基因,从而研究这些基因在生物学过程中的功能和调控机制。
在进行差异表达基因分析时,我们首先需要对RNA测序数据进行质量控制和预处理。
这包括去除低质量的reads、去除接头序列、去除rRNA和tRNA序列等。
接下来,我们需要将清洗后的reads进行比对,将其与参考基因组或转录组进行比对,以确定每个read的来源。
常用的比对工具包括Bowtie、STAR等。
比对完成后,我们需要对reads进行计数,统计每个基因的表达量。
这一步骤可以使用HTSeq、FeatureCounts 等软件实现。
在得到基因的表达矩阵后,接下来可以进行差异表达分析了。
差异表达分析的目的是找出在不同条件下表达显著差异的基因。
常用的差异表达分析方法包括DESeq2、edgeR、limma 等。
这些方法都基于数学模型,通过对基因表达矩阵进行统计学分析,找出在不同样本间表达水平差异显著的基因。
这些方法在差异分析中会考虑到基因间的离散和基因长度的偏差,并进行合适的统计假设检验。
通过设置合适的统计显著性阈值,我们可以筛选出差异表达显著的基因。
在差异表达基因分析中,我们通常会根据富集分析对差异表达基因进行功能注释,以了解其在生物学过程中的功能。
富集分析可以帮助我们发现差异表达基因富集在哪些生物学通路、功能模块以及进化树上。
常用的富集分析方法包括基于基因本体论的GO分析和基于生物通路的KEGG分析。
这些分析方法能够帮助我们从大量的差异表达基因中挖掘出具有重要生物学意义的基因。
此外,差异表达基因分析还可以进行聚类分析和可视化分析。
差异表达基因识别之芯片分析展开全文小伙伴们,今天给大家介绍的是生物信息学分析中最基础的差异表达基因的筛选。
筛选差异表达基因作为分析中最基础也是非常重要的一个环节,自然而然有多种筛选方法啦。
1 1、倍数法用倍数分析基因表达水平差异。
S1和S2是基因在两类样本中的表达值。
FC>1,表示基因上调FC<>对于倍数法确定阈值比较困难,分析中通常以2倍差异为阈值。
倍数法通常用于初步筛选差异表达基因。
1 2、t检验法t检验法可以判断基因在两种不同条件下的表达差异是否具有显著性。
零假设为基因在两种不同条件下的平均表达水平相等,与之对应的备择假设是不相等。
例如a是某基因在所有正常样本中的表达值,b是某基因在所有癌症样本中的表达值,在R中使用t.test(a,b)可以得到某基因在两类样本中是否有差异的P值,函数p.adjust()选择FDR或Benjamini & Hochberg等多种方法中的一个矫正P值,最后保留矫正后P值显著的基因即为差异表达基因。
1 3、方差分析方差分析可用于基因在两种或多种条件间的表达量的比较,它将基因在样本之间的总变异分解为组间变异和组内变异两部分。
组间变异体现了不同条件带来的基因表达的差异,组内变异体现了随机误差。
通过方差分析的假设检验判断组间变异是否存在,存在则表明基因在不同条件下的表达有差异。
R语言中使用函数aov()计算方差分析,summary()提取方差分析的信息。
1 4、SAM法进行统计学假设检验时,最后得出的推断结论不管是拒绝H0或是不拒绝H0,均可能发生错误,即I型错误或II型错误。
I型错误是无差异表达的基因判断为差异表达。
II型错误是差异表达的基因判断为无差异表达。
运用t检验和方差分析进行差异基因筛选时,存在多重假设检验的问题,或导致假阳性率(型错误)增大。
SAM方法纠正多重假设检验中的假阳性率。
计算相对差异统计量d:计算所有基因的d值,这些d值的分布应该独立于基因的表达水平。
生物大数据分析中的差异表达分析方法与技巧在生物大数据分析领域,差异表达分析是一项重要的研究方法,用于寻找基因在不同条件下的表达水平差异。
差异表达分析可帮助我们理解基因的功能和调控机制,识别与特定疾病相关的生物标志物,以及发现潜在的治疗靶点。
本文将介绍差异表达分析的常用方法与技巧。
1. 数据预处理在进行差异表达分析之前,首先需要对原始数据进行预处理。
这包括数据的质量控制、去除低质量的读段和过滤掉可能引入偏差的序列,如接头序列和低质量的碱基。
常用的质量控制工具包括FastQC和Trimmomatic等。
2. 数据对齐与比对差异表达分析通常涉及对测序数据进行对齐或比对。
对于转录组数据,将测序数据比对到参考基因组或转录组可以帮助我们确定基因的表达水平。
常用的对齐工具有Bowtie、HISAT2和STAR等。
3. 基因表达量估计对齐后,我们需要估计每个基因的表达量。
这可以通过从比对结果中计算测序reads在每个基因上的覆盖度,并根据测序深度和基因长度进行归一化。
常用的基因表达量估计工具有HTSeq、featureCounts和Salmon等。
4. 差异表达分析方法差异表达分析的目标是识别在不同条件下基因表达差异显著的基因。
常用的差异表达分析方法包括:- 无假设测试:如t检验和Wilcoxon秩和检验等。
这些方法假设基因在不同条件下的表达是相互独立的,适用于样本数较小的情况。
- 基于负二项分布的模型:如DESeq2和edgeR等。
这些方法能够考虑到数据的离散性和样本之间的相关性,适用于样本数较多的情况。
- 基于机器学习的方法:如随机森林和支持向量机等。
这些方法可以通过构建分类模型来识别差异表达的基因,适用于大规模的数据集。
5. 多重检验校正由于进行多个假设检验时存在假阳性的问题,所以在差异表达分析中需要进行多重检验校正。
常用的多重检验校正方法有Bonferroni校正、False Discovery Rate (FDR)校正等。
基因差异表达及其功能分析研究基因是生物体内的遗传物质,可以决定生物体的遗传特征和表现型。
而基因的表达则是指基因转录成mRNA并通过翻译作用产生蛋白质的过程,这个过程决定了细胞的生物化学特性和功能。
随着分子生物学的快速发展,我们发现,不同的生物体之间,甚至同一生物体不同的细胞间存在着基因表达的差异,这些差异可能对生物体的形态、功能和健康等方面产生深远影响。
因此,研究基因差异表达及其功能分析,将给人类生物医学科学带来重大突破和进展。
首先,基因差异表达研究的重要性在于它可以对不同组织、不同器官、不同细胞类型的基因表达模式进行比较,找出其中的规律和特点。
这可以为分子病理学、组织学和解剖学等科学研究提供突破口,比如可以发现疾病的发生和发展过程中哪些基因发生了异常表达,从而开发新的药物、诊断方法和预防策略,具有非常重要的应用价值。
其次,在基因差异表达研究中,我们可以通过引入外源基因或通过刻意引发特定的生理或环境刺激来模拟现实情况下的基因调控机制。
这一方法可称为“比较实验”,比如将正常细胞和癌症细胞进行比较,通过对其RNA序列分析,可以发现哪些基因在癌症细胞中过度表达或失活,从而确定疾病的发病机制和关键节点以及治疗靶点。
同时,我们还可以利用不同的基因表达技术手段,比如RNA测序、微阵列技术、蛋白质芯片等,对大量基因进行扫描,找到与疾病相关的基因,并进一步验证和分析其归因机制和生物学功能。
更为重要的是,基因差异表达研究不仅可以分析基因本身在生物学和生理学方面的功能,也可以进一步探究细胞调控机制的动态变化和适应性调整。
即相同细胞或组织,在不同的生理或病理环境下,基因表达和调节方式可能会发生变化,产生不同的表型和生物学行为。
比如,当人体面对营养不良、感染、药物毒性等环境压力时,基因表达和蛋白质产生的规律和数量都会发生改变,这些改变对人体的免疫、代谢和生理学功能都会产生影响。
为此,研究基因的表达差异,有助于深入理解生物体的适应性和生存机理,为生物医学科学提供精准和有效的工具。
差异表达基因识别算法性能比较与分析
作者:夏雪飞邱石
来源:《电子技术与软件工程》2013年第20期
摘要生物信息学研究的一项重要课题就是对芯片上成千上万个基因点的杂交信息进行解读,从而揭示生命特征及规律。
不同的数据分析处理方法会得到截然不同的分析结果。
本文简述了三种不同类型的差异表达基因识别算法,并采用Java语言进行实现,最后结合模拟基因表达数据计算结果,对三种算法计算准确度和运算速度进行了详细的比较与分析。
【关键词】基因芯片差异表达基因算法
1 引言
Microarray技术,亦称生物芯片技术。
作为一种高通量检测技术,它可以同时检测几十万个大分子生物表达水平,大规模的提高了检测效率,是生物信息学领域具有里程碑式意义的一项重大技术革新。
生物信息学研究的一项重要课题就是对芯片上成千上万个基因点的杂交信息进行解读,从而揭示生命特征及规律[1]。
差异表达基因识别是一项重要的基因芯片数据的分析方法。
通过该技术可以找到疾病中表达水平发生显著变化的基因,进而对疾病的预后有着极为重要的意义。
2 差异表达基因分析算法
在研究中,我们需要在两种完全不同的实验条件下(例如癌症与非癌症患者)处理生物样本,主要目的就是要得到不同条件下的基因表达值。
其中,处理后的样本被称为实验组样本;未被处理的样本被称为对照组样本。
下面我们简述SAM、t-test和RSDM三种不同类型的差异表达基因识别算法。
2.1 SAM算法
2001年由Tusher提出的基因芯片显著性分析算法SAM是一种基于统计分析理论的差异表达基因识别算法。
检验统计量如公式2.1所示:
……………(2.1)
式中代表实验组基因样本均值,代表对照组基因样本均值,为标准差,是的调整常量。
估算的期望,如公式2.2所示:
……………(2.2)
SAM算法流程如下:构造检验统计量并排序;计算期望值;识别差异表达基因(统计量与其期望的差别超过门限值);计算错误发现率FDR(即在多重检验中,错误的拒绝原假设数与拒绝原假设总数的比值的期望)。
2.2 T-test算法
T-test算法主要用于计算样本量小的正态分布数据。
该算法是一种简单的、基于统计分析理论的差异表达基因识别方法。
Global T检验统计量如公式2.3所示:
…………(2.3)
Gene-specific T检验统计量如公式2.4所示:
…………(2.4)
上式中,代表基因表达值平均对数比,代表合并数据集的标准误差,代表标准误差对数比。
Gene-specific方法的主要特点是不受异质性数据的影响。
2.3 RSDM算法
RSDM是一种具备标准差过滤技术的元分析差异表达基因识别算法。
该算法可以处理异质性数据集,通过对多组同质芯片数据进行整合分析,计算差异表达基因,并通过标准差分析,滤除计算结果中存在的部分伪差异表达基因[3]。
算法流程如下:计算实验组与对照组数据的差异度量值;形成差异度矩阵,并对矩阵数据排序;使用统计量判断差异表达基因;计算每个基因的标准差,进行B次随机扰动,计算P-value。
3 差异表达基因识别系统
为了比较三种算法的性能,我们采用Java语言设计并实现了一款集成了三种差异基因识别算法的软件系统。
软件主要具备数据导入、算法选择、差异表达基因识别以及结果读取等主要功能。
软件功能流程如图3.1所示。
4 实验与分析
采用上述系统对包含3000个基因的模拟数据集进行实验与分析。
模拟数据中预置了30个差异表达基因,其中上调基因20个,下调基因10个。
对原始数据进行标准化处理,然后分别采用三种差异表达基因识别算法SAM、T-test和RSDM进行计算,最终得到三组不同的数据,我们对其进行比较与分析,结果如表4.1所示。
上表中,伪差异表达基因代表算法所识别的结果中所包含的非差异表达基因个数,识别率代表算法发现的正确的差异表达基因占总差异表达基因数量的比率。
SAM算法共发现24个差异表达基因,其中伪差异表达基因5个,识别率为63%;T-test 算法共发现26个差异表达基因,其中伪差异表达基因3个,识别率为77%;RSDM算法共发现了全部30个差异表达基因,其中伪差异表达基因为0,识别率为100%。
通过实验结果可以发现,RSDM算法的准确度最高,其次是T-test,SAM的准确度相对最低;对于算法运算处理速度,SAM最快,其次是T-test,RSDM相对较慢。
5 结论
差异表达基因的识别是微阵列基因表达谱数据分析的一项重要任务。
通过比较正常和非正常状态下基因表达的差异,对于生物疾病的发生机理及预后预测都有极为重要意义。
我们对SAM、T-test、RSDM三种不同类型的差异表达基因识别算法进行了简要的描述,并结合实验数据对三种算法计算准确度和运算速度进行比较与分析。
希望本文的工作能为从事生物数据分析的科研工作者提供一定的帮助。
参考文献
[1]CandesEJ,etl. An Introduction to Compressive Sampling [J].Signal Processing Magazine. 2008.
[2]Cui X, etl. Statistical tests for differential expression in cDNA microarray
experiments[J].Genome Biol,2003.
[3]吴佳楠,周春光.基于元分析的差异表达基因识别[J].吉林大学学报,2012(5).
作者单位
1.吉林交通职业技术学院吉林省长春市 130012
2.吉林农业工程职业技术学院吉林省四平市 136001。