5 第五章 系统发生分析
- 格式:ppt
- 大小:4.96 MB
- 文档页数:140
第五章一、问答题1、简述页式虚拟存储管理的基本原理。
2、交换扩充了内存,因此,交换也实现了虚拟存储器。
这句话对吗?不对。
交换是把各个进程完整地调入内存,运行一段时间,再放回磁盘上。
虚拟存储器是使进程在只有一部分在内存的情况下也能运行。
交换是把整个进程换入换出主存。
而虚拟存储器的基本思想是程序的大小可以超过物理内存的大小,操作系统把程序的一部分调入主存来运行,而把其他部分保留在磁盘上。
故交换并未实现虚拟存储器。
3、简述虚拟存储器的实现原理。
4、简述快表的作用。
5、什么是紧凑?什么时候紧凑?6、比较存储管理中的连续分配和离散分配方式。
7、当系统中的地址空间非常大时(例如32位),会给页表的设计带来什么问题?请给出一个方案并分析其优缺点。
答:会导致页表过长从而很难找到一块连续的存储空间存放页表,此外如果页表中的行不连续也会加大访问页表的查找时间。
可以用多级页表解决这个问题,将页表分页,离散地存储在不同区域,同时建立另一张页表映射原来页表的每一页。
优点是不需要大块的连续空间,但并没有减少页表的空间,同时也增加了访存次数。
8、缺页中断和一般中断有什么区别?9、简述分页存储管理的基本思想和页表的作用。
10、交换扩充了内存,因此,交换也实现了虚拟存储器。
这句话对吗?11、叙述简单Clock置换算法的实现方案。
12、解释静态重定位与动态重定位。
13、什么叫紧凑,什么时候紧凑?14、为了实现虚拟页式存储管理,页表应该包含哪些内容?15、页和段有哪些区别?16、覆盖技术和交换技术的特点是什么?17、简述分页和分段的区别。
18、什么是紧凑?什么时候紧凑?19、简述虚拟存储器的定义。
20、简述分页和分段的区别21什么叫可重入代码?22、局部性原理可以体现在哪两个方面,其具体含义是什么?23、分页和分段的主要区别是什么?二、计算题1、现有一分页虚拟存取管理系统,其页表保存在寄存器中。
若有一个可用的空页或被替换的页未被修改,则它处理一个缺页中断需要8ms。
博士生入学专业基础课考试大纲考试科目:生物信息学考试代码:[2285]一、考试要求要求考生全面系统地生物信息学的基本概念、基本原理、典型方法和实用技术,并且能灵活运用所学知识解决生物信息中的具体问题。
二、考试内容1)生物信息学引论●人类基因组计划与基因组信息学●蛋白质结构与功能关系研究●生物信息学的主要研究内容:生物分子数据的收集与管理,数据库搜索及序列比较,基因组序列分析,基因表达数据的分析与处理,蛋白质结构预测●生物信息学所用的方法与技术:数学统计方法,动态规划方法,机器学习与模式识别技术,数据库技术及数据挖掘,人工神经网络技术,专家系统,分子模型化技术,量子力学和分子力学计算,生物分子的计算机模拟,因特网(Internet)技术2)生物信息学的生物学基础●蛋白质的结构和功能●遗传信息载体-DNA与分子生物学中心法则●基因组结构●基因表达调控●新生肽链的折叠●生物大分子结构的测定3)序列比较●序列的相似性:字母表和序列,编辑距离,通过点矩阵分析两条序列的相似之处,序列的两两比对,用于序列相似性的打分矩阵●两两比对算法:序列两两比对基本算法,子序列与完整序列的比对,寻找最大的相似子序列,准全局序列比对●序列多重比对:SP模型,多重比对的动态规划算法,优化计算方法,星形比对,树形比对,其他多重序列比对算法,统计特征分析●DNA片段组装:片段组装问题,序列片段组装模型,序列片段覆盖图,贪婪算法,非循环图拓扑排序法4)基因组信息分析●原核与真核基因组特点●基因组序列分析:基因组序列分析步骤和分析结果评价,核苷酸关联分析●基因识别方法:最长ORFs法,基于密码子出现频率的预测方法,同源性方法,神经网络方法,隐马尔可夫模型法,模式判别分析法,基于动态规划的基因结构预测方法,基于剪切比对的基因识别,其他基因识别方法●非编码区域分析和调控元件识别:调控元件的建模,调控元件模式的得分函数,模式驱动的调控元件识别,序列驱动的调控元件识别5)系统发生分析●分子系统发生与系统发生树●基于距离的系统发生树构建方法●基于特征的系统发生树构建方法●最大似然法、系统发生树的可靠性●全基因组系统发生分析6)蛋白质结构预测●蛋白质二级结构预测算法●RNA二级结构的预测算法●蛋白质空间结构预测算法7)基因表达数据分析●基因表达数据的获取●基因表达数据预处理●基因表达差异的显著性分析:倍数分析,t检验,贝叶斯分析●基因表达谱聚类分析:相似性度量函数,聚类方法,基于模型的聚类方法,支持向量机,聚类结果的可视化,聚类结果的定量评价●基因表达数据的分类分析:朴素贝叶斯分类法,k-近邻法,其他分类法●主成分分析PCA●基于基因表达谱的基因调控网络研究:布尔网络模型,线性组合模型,加权矩阵模型,数据整合分析三、试卷结构考试时间180时分钟,满分100分1)题型结构●概念题(10分)●简答题(25分)●求解题(30分)●计算题(35分)2)内容结构●生物信息学引论(10分)●生物信息学的生物学基础(10分)●序列比较(15分)●基因组信息分析(20分)●系统发生分析(15分)●蛋白质结构预测(10分)●基因表达数据分析(20分)四、参考书目见招生简章1.孙啸、陆祖宏、谢建明,《生物信息学基础》,清华大学出版社。
⽣物信息学(1)⽣物信息学是⼀门新的学科,⽤来处理基因组相关的各个⽅⾯,包括基因组信息的获取、处理、存储、分配、分析和解释。
序列数据存储格式:FASTA格式(>开头)主要的数据库资源:核酸序列数据库:GenBank、EMBL、DDBJ蛋⽩质序列数据库:Uniport(美)蛋⽩质结构数据库:PDB(美)GenBank数据库是由美国国⽴⽣物技术信息中⼼(NCBI)维护的⼀级核酸序列数据库,注释收集所有公开发布的DNA序列。
数据记录格式:GenBank条⽬包含对序列的简要描述,它的科学命名,物种分类名称,参考⽂献,序列特征表,及序列本⾝。
数据库检索,是指对序列、结构以及各种⼆次数据库中的注释信息进⾏关键词匹配查找。
综合检索系统:Entrez系统(NCBI所提供的在线资源检索器。
该资源将GenBank序列与其原始⽂献出处链接在⼀起。
);SRS系统第三章序列⽐对与⽐对搜索⽐对搜索是指通过特定的序列相似性⽐对算法,找出核酸或蛋⽩质序列中与检测序列具有⼀定程度相似性的序列。
序列⽐对:将两条或多条(核苷酸或氨基酸)序列排列在⼀起,通过⼀定的算法找出序列之间最⼤相似性匹配的过程。
序列⽐对的主要⽬的在于阐明序列之间的同源性关系,以及从已知序列预测新序列的结构和功能。
序列⽐对基于⼀种⽣物学推断(进化论)相似性→同源性→相似的结构和功能⼀致性(identity):指同源DNA顺序的同⼀碱基位置的相同的碱基成员, 或者蛋⽩质的同⼀氨基酸位置的相同的氨基酸成员, 可⽤百分⽐表⽰.相似性(similarity):指同源蛋⽩质的氨基酸序列中⼀致性氨基酸和可取代氨基酸所占的⽐例。
可取代氨基酸系指具有相同性质如极性氨基酸或⾮极性氨基酸的成员, 它们之间的代换不影响蛋⽩质(或酶)的⽣物学功能。
同源性( homology ):是指两个序列具有共同的祖先,属于质的判断。
就是说A和B的关系上,只有是同源序列,或者⾮同源序列两种关系。
《管理信息系统》名词解释第一章管理信息系统概论1.信息:指加工以后对人们的活动产生影响的数据。
2.数据:是对客观事物的性质、状态以及相互关系等进行记载的符号。
3.物流:物品从供给地向接受地的实体流动过程。
4.资金流:是以货币的形式反映企业经营状况的主要形式。
5.事物流:是指企业在处理内部或外部活动中产生各种经营管理行为,这些行为的过程构成了事物流。
6.信息流:是指除去物流、资金流和事物流的物理内容外的信息的流动过程。
7.管理信息:是对企业生产经营活动中的原始数据经过加工处理、分析解释、明确意义后所产生的对管理决策产生影响的信息。
8.企业外部信息:又称外源信息,是从企业外部环境传输到企业的各种信息。
9.企业内部信息:又称内源信息,是企业生产经营活动中产生的各种信息。
10.常规性信息:又称固定信息,指反映企业正常的生产经营活动状况,在一定时期内按统一程序或格式重复出现和使用,而不发生根本性变化的信息。
11.偶然性信息:又称突发性信息,是反映企业非正常事件的无统一规定或格式的非定期信息。
12.信息化:是指国民经济各部门和社会活动各领域普遍采用信息技术,利用信息资源,使得人们能在任何时间、任何地点,通过各种媒体,使用和传递所需信息,以提高工作效率、促进现代化的发展、提高人民生活质量、增强国力的过程。
13.企业信息化:是指企业利用现代的信息技术,通过对信息资源的深度开发和广泛利用,不断提高生产、经营、管理、决策的效率和水平,提高企业经济效益和企业竞争力的过程。
14.系统:是由相互作用和相互依赖的若干组成部分,为了某些目标结合而成的有机整体。
15.分解方法:把被研究的对象和问题分解成许多人们可以容易处理和理解的细小部分,并通过对这些被分解的部分进行研究来获得对整体的了解和把握,这种处理方法就是分解方法。
16.系统方法:考虑系统的整体性,考虑系统组成部分的内部关系和协同关系,这样的方法叫系统方法。
17.信息系统:是以计算机、网络及其它信息技术为核心,为实现某些系统目标,对信息资源进行处理的信息。