20
例2: 将序列进行无冗余化:字典的应用 将/home下的nr_seq.seq拷贝到你的目录下。
redundant
unique
21
例2: 将序列进行无冗余化:字典的应用 将/home下的nr_seq.seq拷贝到你的目录下。
nr.py
22
例3 从fasta文件中(基因组数据中)下载部分序列 (已知染色体号和序列位置)
比如: #cat 1.txt | grep ^123A –i> 2.txt #cat 1.fa | grep ^ATCGTGATG –B 1 -i # sed –i ‘s/U/T/g’ miBA.fa # awk ‘{print $1,$2}’ 1.txt
\t 表示制表符 \n 表示换行符
11
Biopython Biopython计划是一个使用python来开发计算分子生物学工具的国际社团。 该网址提供一个在线的基于python的生命科学研究的模块,脚本和网络链接。 基本来说,我们喜欢使用python来编程,并且希望对生物信息学来说尽量容 易的使用python创建高质量,可重用的模块和脚本。 包括高通量测序数据分析,基因表达聚类,染色体作图,BLAST结果解析, 进化分析等。
2
由于Python语言的简洁、易读以及可扩展性,在国外用Python做科学计算的研究机 构日益增多,一些知名大学已经采用Python教授程序设计课程。例如卡耐基梅隆大 学的编程基础和麻省理工学院的计算机科学及编程导论就使用Python语言讲授。众 多开源的科学计算软件包都提供了Python的调用接口,例如著名的计算机视觉库 OpenCV、三维可视化库VTK、医学图像处理库ITK。而Python专用的科学计算扩 展库就更多了,例如如下3个十分经典的科学计算扩展库:NumPy、SciPy和 matplotlib,它们分别为Python提供了快速数组处理、数值运算以及绘图功能。因 此Python语言及其众多的扩展库所构成的开发环境十分适合工程技术、科研人员处 理实验数据、制作图表,甚至开发科学计算应用程序。