美国材料基因组计划 简介
- 格式:docx
- 大小:15.12 KB
- 文档页数:3
⼈类基因组计划(HumanGenomeProject)⼈类基因组计划(Human Genome Project,HGP)1.什么是⼈类基因组计划:⼈类基因组计划是由美国能源部和NIH联合做出的,⾃1990年开始,争取在15年内完成的⽬标。
即:鉴定⼈体DNA估计约8万个基因,测序构成⼈DNA的30亿个碱基,贮存这些信息于databases(数据库)并发展data analysis的⼯具。
(1)实际包括两部分⼯作,⼀是mapping,⼀是sequencing,故先前叫做“Mapping and Sequencing the human genome”.⽽Mapping⼜分为遗传连锁图谱和物理图谱。
(2)HGP是第⼀个庞⼤的科学事业,会引起⼀些由此计划暴发出来的伦理、法律、社会学上的诸多争论。
(DOE熟悉⼤科学模式;⽣物学家习惯⼩科学模式,应完美结合。
该计划会引发出许多商业和法律,社会学和论理学⽅⾯的问题。
)(3)为了有助于这些⽬标的实现,还要研究⼀些⾮⼈⽣物体的遗传图谱。
(包括E.coli、酵母、秀丽隐杆线⾍、果蝇、实验⽤⼩⿏等模式⽣物。
)(4)在植物⽅⾯,美国农业部集中研究⽟⽶和南芥菜(Arabidopsis)基因组,我国科学家提出了⽔稻基因组计划。
2.背景:早在1984年Utah州Alta城的专业会议(DOE环境与健康研究办公室,OHER 和国际环境诱变剂和致癌物防护委员会,ICPEMC协办)。
开始讨论HG DNA全序列测定的前景。
1985年5⽉由Sinsheimer组织专门会议提出测定HG全序的动议。
DOE为何操办:(1)DOE承担低⽔平辐射和其它环境因素引起的遗传性损伤的监测,即需要在108bp的DNA中检测出⼀个碱基的改变,此项任务与HG全序列测定有关并且任务同等艰巨;(2)DOE已在两个国家实验室对复杂基因开展了⼯作,即1988年的国家基因⽂库计划(NG Library Project),在Laurence Livermore国家实验室(LLNL)中纯化单种染⾊体并构建单个染⾊体⽂库。
什么是人类基因组计划人类基因组计划(Human Genome Project,简称 HGP)是一项大型全球科学技术合作计划,采用最先进的技术和设备,立足人类生活和发展之实际需求,致力于深入研究人类基因组的结构与功能以及其相关的基因学研究,全面推进人类遗传资源的运用及基因科技的发展,着重研究如何利用技术和基础生物研究来诊断和治疗遗传性疾病,为推进人类健康的发展做出重大贡献。
本文将就人类基因组计划的基本情况、计划的目标与意义、关键技术以及计划的影响作一综述:(一)基本情况人类基因组计划是一个涉及全球七十多个国家共同投入的大型科学研究计划,由美国国家卫生研究院负责统筹,牵头单位为美国的基因组研究所(National Institute of Genome Research),简称NIH。
计划于1990年在美国和英国启动,一直持续到2003年底,主要由20余家机构及其国际合作伙伴组成,总财政投入约9800万美元。
(二)计划目标与意义人类基因组计划的目标是通过分子生物学方法解密人类基因组,鉴定出基因在人类身上的位置和功能,推动基因科学的发展,为人类健康和可持续发展提供基础和根据;探索基因的功能,使人们的基因知识更加完善,打开基因治疗新的前景;促进各国、各学科之间的知识交流,有助于正确理解和应用基因科学,保护人类的生活环境;普及基因科学的知识,提高人民的科学素养。
(三)关键技术牵头机构通过实施基因组分析法,确定出大约三万七千个基因数量,作出全面释放和序列定义情况,识别出基因在人类基因组分布的情况,并将人类基因组大小估算在了3.3亿。
该研究同时也发现了人类和其它哺乳动物之间基因组相似性很高,并发现了更多物种演化关系,构建出了这些物种基因组的系统发育学关系图。
(四)计划的影响成功完成人类基因组计划对科学知识的探索,技术创新及临床实践应用有重大影响,以致社会应用等也大有裨益。
它推动了科学研究方向的改变,大大推动了基因技术及生物信息学的发展,推动了基因检测技术和基因疗法的进一步发展,促进了精准医学的进步,为发现新的疾病基因和治疗他们提供了前因性研究线索;同时,计划的实施也改变了社会文化及生活方式,推动生物科技的社会应用,令受益者的健康水平得到更大的提升。
癌症和肿瘤基因图谱(TCGA)计划简介据统计,全球每年新增癌症患者达700万人,死于癌症的病人达500万人,60%的患者确诊后只能存活5年。
目前已知的癌症有200多种,但是,无论什么癌症,在肿瘤的特殊类别(分型)或发展的不同分期方面都发现有基因组的特异变化,而正是基因组的改变(突变)导致了细胞分化、发育和生长通路的不正常,从而引发细胞不正常地失控增殖、生长。
美国政府发起的癌症和肿瘤基因图谱(Cancer Genome Atlas,TCGA)计划,试图通过应用基因组分析技术,特别是采用大规模的基因组测序,将人类全部癌症(近期目标为50种包括亚型在内的肿瘤)的基因组变异图谱绘制出来,并进行系统分析,旨在找到所有致癌和抑癌基因的微小变异,了解癌细胞发生、发展的机制,在此基础上取得新的诊断和治疗方法,最后可以勾画出整个新型“预防癌症的策略”。
2005年12月13日,这一项目由美国国家癌症和肿瘤研究所(NCI)和国家人类基因组研究所(NHGRI)联合进行,预计耗资1亿美元。
和人类基因组计划(HGP)相似,TCGA是另一项以基因组为基础的大科学研究计划,它以人类基因组计划的成果为基础,研究癌症中基因组的变化。
与HGP专注于疾病的遗传因素(与生俱来)不同,TCGA更关心人类出生后细胞中的基因变化(后天变异)。
大部分癌症在威胁到健康之前都会产生几种体细胞突变(somatic mutations),而这些所谓的体细胞或获得性突变是不可遗传的。
TCGA 是迄今为止世界上所进行的最大一项基因工程,差不多能抵上100多个HGP,在3年探索初期就要绘制出比HGP更多的基因图谱。
绘制癌症基因图谱有助于把研究人员从目前逐个追踪基因的大量劳动中解放出来,便于迅速设计和找到针对性抗癌药物。
美国国家癌症研究所副所长安娜•巴克认为,这项计划“是生物医学研究中的一大转折点,也是药物治疗的一大转折点”。
国立卫生院主管John E. Niederhube医学博士说道“今天我们得到一种新的观点去审视遗传改变在一生当中的蓄积与恶性肿瘤的联系。
人类基因组计划内容
人类基因组计划(HUGO)是由美国国家科学基金(NSF)领衔组成的一个多学
科国际合作组织,旨在对人类基因组实现全面解码,推动人类基因组研究,全面揭示和探索人类基因组的结构、组成、功能、进化以及和疾病有关的关系。
自2003
年创建以来,HUGO组织由国际专家成员组成,专注于进行人类基因组的研究及专
业领域的教育和培训工作,协助全球基因组研究及练习技术。
HUGO致力于探索和明确人类基因组细节,总体收集和是由组织中数百名研究
人员分别在多个国家和地区研究基因组,其目的是有效应用现有知识、发现潜在的遗传基础、开发定向的诊断和治疗方案、全面解决疾病临床治疗和预防。
HUGO通过建立和深化合作伙伴关系,协助其他机构和组织的人类基因组研究
与实践,推动人类基因组科研的发展。
HUGO也发布大量资源来预测和模拟人类基
因组,以帮助明确基因组现实与模拟之间的差异,帮助研究中可能发生的不同变异,以及开发可信度较高的疾病治疗方案。
HUGO项目下的研究人员也直接影响了社会,追求人类基因组教育、推动研究、结果转化为临床疾病领域的研究及治疗并展开相关的政策对话,强调建立科学的研究氛围,掌握病理病因及进行治疗。
未来,基于人类基因组上的趋势,HUGO将一如既往大力改善和促进人类基因
组和研究的成果,努力推动研究的可持续发展和创新,以帮助更多人获得更好的健康和生活水平,并最终提升世界健康水平。
人类基因组计划及其目标人类基因组计划是一个耗费巨资、跨领域合作的世界级研究项目,旨在阐明人类基因组的构成和功能。
它最初由美国国家卫生研究院、美国能源部和美国国防部联合发起,后来逐渐成为世界各国联合开展的一个大规模的科学研究计划。
该计划于2003年6月宣告完成,迎来了人类基因组研究的里程碑。
人类基因组的概念很简单,就是指构成人体基因的所有DNA分子的组合,包括全部基因的类似于一个“指南针”的遗传蓝图和调控DNA表达的元件。
人类基因组的解析对于医学科学和健康保护尤为重要,因为人类基因组的变异和突变是多种疾病的根源,研究人类基因组将有助于对这些疾病的防治和治疗。
人类基因组计划的目标有哪些呢?首先,它致力于找到所有的基因序列,包括基因的结构和位置,掌握人类基因的组成和大小;其次,它研究基因之间、基因与其他DNA序列之间的相互作用,以便于理解DNA调控基因表达的机制,从而预测基因所控制的生理和病理过程;最后,它研究人类基因组和其他真核生物的基因组比较分析,以发现共同、适应性和起源的生物信息学特点。
人类基因组计划的完成不但带来了重大的科学成果和深层次的生物学思维,还启发了迄今为止未想到的生物信息学应用和前景。
其中之一就是遗传检测。
基因检测可以检测人类基因组中的突变,进而为疾病的预防提供有效的策略。
比如:基因检测可以对乳腺癌、卵巢癌、大肠癌等疾病的风险进行评估,使人们更早地采取预防措施或进行治疗。
基因检测还可以用来帮助人们了解自身的病理习性,从而制定一些更为科学的生活方式和饮食习惯。
有些检测甚至可以预测受检人的身体状况和寿命。
另外,基因检测还可以在个性化定制疗法和医疗设备方面起到重要的作用。
个性化定制疗法是将病人的基因和临床数据相结合,在保证安全和效果的前提下,对药物、剂量、疗周期等进行个性化调整,从而使疗效更加好。
在医疗设备方面,通过基因检测来确定人体组织器官的结构和功能状态,以便于制造适合人体的器官移植器械,能够更好地适应患者的身体状况。
美国的先进制造伙伴关系介绍2011年6月24日,美国总统奥巴马启动“先进制造伙伴关系”(AMP)计划。
AMP将聚合工业界、高校和联邦政府为可创造高品质制造业工作机会以及提高美国全球竞争力的新兴技术进行投资,这些技术(如信息技术、生物技术、纳米技术)将帮助美国的制造商降低成本、提高品质、加快产品研发速度,从而提供良好的就业机会。
该计划利用了目前现有项目和议案,将投资5亿多美元推动这项工作。
投资将涉及以下关键领域:打造关键国家安全工业的国内制造能力;缩短研制先进材料(用于制造产品)所需的时间;确立美国在下一代机器人技术领域的领导地位;提高生产过程中的能源效率;研发可大幅度缩短产品设计、制造与试验所需时间的新技术。
AMP计划是基于美国总统科技顾问委员会(PCAST)建议提出的。
PCAST 在6月24日发布了一份名为《确保先进制造业的领先地位》(Ensuring Leadership in Advanced Manufacturing)的报告。
报告呼吁政府、工业界与学术界进行合作,确定最紧迫的挑战与最具转化性(transformative)的机遇,以改进涉及多个制造产业的技术、工艺与产品。
美国政府与企业、大学在新技术的研发和商业化方面有着悠久的合作历史。
从电话、微波到喷气发动机、因特网等,这些新技术为经济发展奠定了基础。
未来十年,AMP计划通过制定一个先进制造技术的路线图,加快“将创意转化为产品”的速度,相应增加原创技术,研发可为中小型企业提供创新与竞争力的基础设施和共享设施,而为企业界和学界提供一个突破性的平台。
为启动AMP计划,奥巴马在6月24日公布联邦政府将要采取的一些关键步骤:打造关键国家安全工业的国内制造能力:从2011年夏天开始,美国国防部、国土安全部、能源部、农业部、商务部及其它机构将协同政府范围内的力量,利用其现有资金和未来预算资金(初步总计3亿美元),联合工业界资金投入到创新技术研发中。
摘 要:本文通过对美国材料基因组计划出台、实施情况进行梳理分析,发现人工智能在美国材料基因组技术中的应用正在成为研究热点,其中机器学习、深度学习等算法是关键。
人工智能在解决材料基因组计划发展瓶颈问题方面非常有效,有可能会推动材料基因组技术研究加速发展,但也面临不少挑战。
在此基础上,提出加快推动我国材料基因组技术研究的有关建议。
关键词:美国;材料基因组计划;人工智能;机器学习;深度学习中图分类号:F062.9 文献标识码:A DOI :10.3772/j.issn.1009-8623.2019.11-12.008人工智能将推动材料基因组技术加速发展黄 河,陈宏生(中国科学技术部,北京 100862)材料是所有产业的基础和先导,材料从研发到投入市场的时间跨度很长,其关键在于长期以来材料研发过度依赖科学直觉与试错式的实验经验积累,且制备过程漫长和充满变数。
传统的材料研发模式主要是以实验为主的“试错法”,效率低,从新材料的最初发现到最终工业化应用一般需要10~20年。
如目前移动电子设备所用的锂电池,从20世纪70年代中期的实验室原型到90年代实现应用,前后花了近20年时间[1],但是至今还不能完全、充分地应用到电动汽车上。
变革材料的研究与开发方式、提高材料从发现到应用的速度成为世界各国共同的追求[2]。
为了加快材料的研发, 2011年6月美国设立“材料基因组计划(Material Genome Initiative,MGI)”,借鉴生物基因组的理念,利用先进的计算手段和数据方法,以集成化的“多尺度计算-高通量实验-数据库技术”为核心,旨在达到新材料研发周期缩短一半、研发成本降低一半的目的,最终支撑先进制造和高新技术的发展[1]。
自从美国率先启动材料基因组计划以来,中国、欧洲和日本等也先后开展了类似的研究计划,争取在新一轮的材料革命性发展中抢占先机[3]。
近来,美国标准技术研究所、能源部先后组织多场研讨会,材料基因组计划执行秘书、美国标准技术研究所材料测量实验室材料基因组计划主任詹姆斯·A.沃伦(James A. Warren,作为美国国家科技委员会委员参与制定《具有全球竞争力的材料基因组计划》白皮书)等发表文章和演讲,围绕人工智能(AI)在材料基因组技术中的应用进行讨论,提出了很多前瞻性观点,值得我国关注和借鉴。
美国材料基因组计划简介
东北大学秦高梧
2012年11月1日
一、项目背景
自上个世纪八十年代起,技术的革新和经济的发展越来越依赖新材料的进步。
目前,从新材料的最初发现到最终工业化应用一般需要10~20年的时间。
例如,作为目前移动电子设备所用的Li电池,从上世纪70年代中期实验室原型到90年代晚期应用,前后花了近20年时间,但是至今还没能应用到电动汽车上,很明显,新材料的研发步伐严重滞后于产品的设计。
当前,面对竞争激励的制造业和快速的经济发展,材料科学家和工程师必须缩短新材料从发现到应用的研发周期,以期来解决21世纪的巨大挑战。
然而,当前的新材料研发主要依据研究者的科学直觉和大量重复的“尝试法”实验。
其实,有些实验是可以借助现有高效、准确的计算工具,然而,这种计算模拟的准确性依然很弱。
制约材料研发周期(图1)的另一因素是从发现、发展、性能优化、系统设计与集成、产品论证及推广过程中涉及的研究团队间彼此独立,缺少合作和相互数据的共享以及材料设计的技术有待大幅度提升。
图1 新材料研发周期示意图
二、项目的目标
最近在工程领域出现的集成材料计算与计算机技术相结合范例表明,可以把现有的材料研发周期20~30年缩短到2~3年。
《材料基因组计划》拟通过新材料研制周期内各个阶段的团队相互协作,加强“官产学研用”相结合,注重实验技术、计算技术和数据库之间的协作和共享(利益通过学习标识以解决知识产权问题),目标是把新材料研发周期减半,成本降低到现有的几分之一,以期加速美国在清洁能源、国家安全、人类健康与福祉以及下一代劳动力培养等方面的进步,加强美国的国际竞争力。
《材料基因组计划》项目在2012年已投入1亿美元。
整个目标和具体内容如图2所示。
图2 美国《材料基因组计划》的整个目标和具体内容
三、主要内容
3.1 材料计算手段
目前,从电子到宏观层面都有各自的材料计算软件,但是还不能做到高效跨尺度计算以达到材料性能预测的目的;各个软件之间彼此不兼容;由于知识产权问题,彼此不能共享计算工具的源代码。
在这方面未来的工作主要集中在以下几个方面:
(1)建立准确的材料性能预测模型,并依据理论和经验数据修正模型预测;
(2)建立开放的平台实现所有源代码共享;
(3)开发的软件界面友好,以便进一步拓展到更多的用户团体。
3.2 实验手段
(1)实验为弥补理论计算模型的不足和构架不同尺度计算间的联系;
(2)补充非常基础的材料物理,化学和材料学的数据,涉及材料的电子,力学,光学等性能数据,构建材料性能相关的成分,组织和工艺间内在联系,并建立庞大的数据库;
(3)利用实验数据修正计算模型,加速新材料的筛选及高效确定。
3.3 数字化数据库建立
(1)构建不同材料的基础数据库、数据的标准化以及它们的共享系统;
(2)拓展云计算技术在材料研发中的作用,包括远程数据存储与共享;
(3)通过数字化数据库建设,联系科学家与工程师共同高效开发新材料。
四、研究重点
4.1 面向国家安全的新材料
(1)轻质防护材料
(2)电子材料
(3)能源存储
(4)生物替换材料
(5)密切注重与能源及电子行业相关的矿物(Pt,Te,RE等)
(6)积极开展能够替代稀少元素的相关新材料研发
4.2 面向人类健康与福祉新材料
(1)生物相容性材料(假肢,植入材料与器件,人工器官等);
(2)防护人体受伤的防护材料
例如,关于防护脑损伤材料,在伊拉克和阿富汗战争中有36万人游创伤性脑损伤,普通民众平时的运动及车祸等美国每年达170万人,相应的医疗费用达600亿美元/年。
4.3 面向清洁能源新材料
(1)生物质能源转化用催化剂
(2)人工光合作用材料
(3)光伏电池材料
(4)能源存储材料
(5)汽车轻量化材料(10%重量下降可以节省能耗6-8%的能耗)
(6)混合动力、电动汽车及氢能汽车
4.4下一代劳动力培养
(1)改变单兵作战,强化“官产学研用”之间的协作与共享机制
(2)在材料开发领域,强化实验学家、理论学家、计算机人才和工程师之间的密切合作(3)数字化数据的共享与计算平台的开放
(4)加强在高校的本科生和研究生中的交叉学科课程设置
(5)企业员工针对材料设计与模拟软件和相关程序的再教育
五、具体分工
计算材料与设计化学计划(美国能源部,美国国家自然科学基金委员会)1)高质量软件工具包,新算法、与已有工具包的兼容性
2)发展新的标征技术改善算法与软件
先进材料设计计划(美国标准化科学与技术研究所)
1)建立标准的基础设施、参考数据库和卓越计算中心
2)可靠的计算机建模与仿真材料的优化发展
3)密切协调与DOE和NSF的软件和设计的实验工具
能源效率和可再生能源下一代材料计划(美国能源部)
1)利用计算工具,以加速能源技术相关新材料的制造和表征。
2)制造过程中用新材料,具备新性能的复合材料系统和更低的制造成本,用于预测新材料空间和时间变化的建模和仿真工具
国家安全与防御能力提升的基础/应用计算材料研究(美国国防部)
下一代劳动力(美国国家自然科学基金委员会,美国国防部)
协调“官产学研用”之间的合作,人员的培训与教育。