差异表达分析
(用R语言和Matlab)
1、首次安装要打红色两行的命令
首次安装要选“a”
2、以后再用时只需从以下命令开始打:
3、在Excel中,将Mapping后的两组分析数据的read count留下,rpkm等删去,制成三列
的表格,然后将read count设置为大于等于10,复制粘贴成文本文档(.txt,用记事本),保存。在R语言中调入txt文件:
4、分组
如果是有生物学重复,则group<-factor(c(1,1,1,2,2,2)) 5、计算归一化参数
6、输入散步值
须实验做得很精确才是0.4.(原核0.1,真核0.4)
7、计算P值
Log正数是上调,负数是下调,PValue是要的P值8、输出命令
到相应文件夹找到文件。.csv文件可用Excel打开,打开文件后将P值升序排序9、将logFC和PValue输入到Matlab中:
logfc=[。。。。。];
p=[。。。。。];
出现表格如图
10、做火山图
先算logP:
再作图:
得图:
如若两基因差异小,则点多数集中在U的下面。