百度百科合作网络的分形生长机制研究
- 格式:pdf
- 大小:383.51 KB
- 文档页数:4
网络组织的复杂性研究摘要网络组织是一种适应知识社会、信息经济和组织创新要求的新型的组织模式,是一个伴随环境演进的复杂系统。
本文在分析网络组织含义与类别的基础上,从网络组织环境的复杂性、不确定性,网络组织结构的复杂性,网络组织的动态性、自相似性、自组织性、自学习性等方面研究网络组织的复杂性特征。
关键词网络组织复杂系统复杂性组织科学1 引言我们生活在一个复杂性不断加剧,制度秩序正在消散的世界里。
无穷的变化在我们身边发生,我们必须面对混沌的场景,组织科学也要面对混沌的冲击。
“将充满交互作用的客观世界描述为一个线性的模式,每个词语仅有一个含义,预测、控制是极其重要的概念”,这样的管理理念正面临挑战。
复杂性科学提供了一个新的研究视角:复杂性理论对传统管理假设提出了挑战,人类活动要考虑突现行为的可能性。
在对突现行为的研究中,复杂性科学和组织科学走到了一起[1]。
复杂性研究学者、组织科学家对复杂科学在管理、组织的中的研究颇感兴趣,这方面的研究方兴未艾,仅1998年就有十几个会议和论坛以复杂性与管理为主题,1999年,关于复杂性与组织管理的电子刊物出版,并组织了几次相关学术会议。
SFI也将组织管理复杂性研究作为主要方向之一。
Hatch and Tsoukas指出:解释性的组织研究方法经常向传统组织观点提出挑战,并与复杂理论的研究新发现相互呼应[2]。
其他一些专家[3][4][5]也指出:复杂系统与组织系统都具有如下的共同特征:A原因与结果之间没有固定联系;B 分形特征:度量结果与所选取刻度有关,概念含义具有不确定性;C 复杂系统在不同的度量尺度间存在循环或递归性质,容易产生迷惑;D 对初值敏感:系统具有不稳定性和易变性;E 系统充满反馈环,具有潜在的分叉点,并遵循突现行为规律。
社会、经济、技术的发展变化使组织面临一个复杂、多变、混沌、不确定的环境,从而要求组织对来自环境的变化作出反应。
若把组织定义为:具有不同偏好、信息、利益和知识的个体与团体的协调行为构成的系统[6],则组织管理者的中心任务为促进冲突向合作的平滑转换,而这些组织成员具有的共同的语言(协议)和共同的观点(目标、价值观、文化)会使转换有益,并通过合作取得更好的效果。
自组织特征映射网络隐含的分形机制
周金峰;柴立和
【期刊名称】《天津理工大学学报》
【年(卷),期】2007(023)005
【摘要】自组织特征映射网络(Self-organizing map,SOM)在聚类分析中具有广泛的应用,和其他神经网络一样,SOM网络具有黑箱性质,缺乏严格的理论基础,无法对聚类过程进行分析.结合复杂系统分形生长的最大流原理,本文从统计物理角度对SOM网络的自组织过程进行分析,将SOM网络隐含的分形机制挖掘出来,并以城市模式为例展示了建立在统计物理基础上的SOM网络的新的应用.
【总页数】5页(P4-8)
【作者】周金峰;柴立和
【作者单位】天津大学,环境科学与工程学院,天津,300072;天津大学,环境科学与工程学院,天津,300072
【正文语种】中文
【中图分类】TP183;F290
【相关文献】
1.分形法在发动机隐含故障诊断中的应用 [J], 王朝晖;张来斌
2.空主语的隐含现象与认知机制——试析一种特殊连谓句的空主语隐含原因 [J], 曾静涵
3.一个基于自组织特征映射网络的混合神经网络结构 [J], 戴群;陈松灿;王喆
4.全球贸易隐含能源网络形成机制及其地位测度 [J], 李怀政;汪宇
5.中国与“一带一路”沿线国家能源贸易隐含水足迹分形特征分析 [J], 孙才志;高春阳
因版权原因,仅展示原文概要,查看原文内容请购买。
多元细胞生物发育过程中细胞间互作网络研究多元细胞生物发育过程中,细胞间的相互作用和通讯是维持组织和器官正常发育的关键因素之一。
细胞间互作网络是一种复杂而精确的调控系统,它通过细胞与细胞之间的相互通讯和信号传递,协调细胞的分化和组织的形成。
了解和研究这种细胞间互作网络对于深入理解生物发育过程的机制具有重要的意义。
在多元细胞生物的发育过程中,细胞间通讯通过细胞外信号分子和细胞表面受体的相互作用来实现。
这些信号分子可以是蛋白质、多肽、小分子化合物等,它们通过与细胞表面的受体结合,触发一系列的信号传导途径,最终改变细胞的生理状态。
细胞外信号的传递可以通过直接细胞间的物质交换,例如细胞间的黏附分子、细胞外基质的分泌等。
此外,细胞间通讯还可以通过细胞外囊泡的形成和释放来实现。
这些囊泡可以携带各种信号分子,通过与目标细胞融合来传递信号。
细胞间的互作网络在动物和植物的发育过程中起着重要的调控作用。
在动物发育中,胚胎形成和器官发育的过程中,细胞间的信号传递起到了重要的作用。
例如,胚胎发育中的细胞迁移、细胞分化和组织形成等过程都需要细胞间的互作网络的调控。
而在植物中,细胞间的互作网络同样发挥着重要的调控作用。
例如,植物的根发育、花的形成和果实的发育等过程也依赖于细胞间互作网络的调控。
近年来,对于细胞间互作网络的研究取得了重要进展。
通过开发各种新的实验技术和研究方法,科学家们成功地揭示了细胞间互作网络的一些基本机制。
例如,通过蛋白质和基因的相互作用图谱,我们可以了解到不同蛋白质和基因之间的相互关系,从而揭示了细胞间互作网络的拓扑结构和动力学特征。
此外,通过单细胞转录组学和蛋白质组学等技术的发展,我们可以研究单个细胞内分子的变化和细胞间信号的传递,从而揭示了细胞间互作网络的功能和调控机制。
细胞间互作网络的研究对于人类健康和疾病治疗具有重要的意义。
许多疾病的发生和发展都与细胞间互作网络的异常有关。
例如,肿瘤的发生和转移过程中,细胞间的信号传递和细胞迁移等过程受到了严重的紊乱。
双层网、群落、级联事件等研究(申请扬州大学理学博士学位论文)邹盛荣导师:何大韧教授培养单位:扬州大学专业名称:基础数学研究方向:复杂网络的理论与应用2010年11月Research of Bi-layer Network、Community andCascade Event(Applying for the Degree of Doctor of Science)BySheng-Rong ZouUnder the guidance and supervision ofProfessor Da-Ren HeThesis Submitted toYangzhou UniversityYangzhou University, Yangzhou, P. R. China,November, 2010摘要I摘要以还原论方法论为基础的近代物理学取得了极大的成功,并且导致了一系列现代科学技术的产生与发展。
然而,典型的复杂系统,例如生命系统和社会系统,由于存在自组织和自适应的特点,全体不等于部分的简单组合,从根本上不适用于还原论。
如何建立复杂系统的定量科学系统,是整个科学界长期以来的关注热点之一。
近二十年来,复杂系统研究受到了分外的重视。
上世纪末作为复杂系统描述工具出现的复杂网络的研究热潮对此也起了推动作用。
我们课题组也从事了复杂系统和复杂网络的研究。
本论文的前两部分报告我们对复杂网络中的两个热点问题,即关联双层网和群落划分的研究;后两部分分别报告我们对一类复杂系统中的重要现象——雪崩,以及一个重要复杂系统——科研论文发表系统的研究。
典型的复杂系统可以被划分为许多层次和子系统,每个层次和子系统中存在许多种互相作用的基本单元,这些层次和子系统之间又存在复杂的关联。
这使得对系统整体的研究具有很大困难。
人们自然地首先研究一种基本单元及其相互作用,暂时抛开它们与其它基本单元的相互作用。
这就是为什么到目前为止大多数研究的复杂网络都仅包括一种节点及其相互作用。
生命科学中的分形及其应用随着科技的不断进步,人们对于生命科学的研究也越发深入。
而在这一领域中,分形逐渐成为了一个备受关注的课题。
那么,分形是什么?它在生命科学中有着怎样的应用呢?一、什么是分形?分形,英文名Fractal,意为“分形几何学”,是一种几何形态及其特征的研究。
分形的最突出的一点,是它能够形成自相似的结构和规律。
也就是说,这些结构和规律在各种不同的尺度下都是相似的,它们具有高度的重复性和自相似性。
分形通常由重复基本单位构成,这些基本单位与它们的下一个尺度状态很相似。
举个例子,生物界中的植物叶片就是分形结构的一个典型例子。
二、分形在生命科学中的应用分形在生物学中的应用较为广泛,特别是在植物学和动物学中。
它可以用来研究许多生物结构的形态和特征,从微观到宏观,从单细胞到群体,从分子到器官,从清晰到模糊。
分形不仅可以精确测量复杂生物结构的形态特征,还可以分析生物系统的内在规律和组织结构,研究生态系统稳定性和可持续性。
下面我们就来看看分形在不同领域的应用。
1. 生物遗传学生物遗传学是研究生物体传递经过遗传改变形成的遗传信息的分支学科。
DNA的复杂性使得我们在研究过程中难以直接理解它的结构和功能。
而分形能够帮助我们将这些复杂的结构抽象成数学模型,加深我们对它们的理解。
分形也可以用于DNA序列的比对和分类,这对于分析人类和其他生物体间的相似性具有重要的意义。
2. 生态学生态学是研究生物体之间相互作用和与环境之间相互作用的分支学科。
分形在生态学领域中被广泛应用,可以分析生态系统的稳定性和复杂性,并对生态系统的进化、协同和相互依存进行研究。
此外,分形还可以通过对森林的结构和树木分布的分析来预测火灾风险,并制定相应的防火计划。
3. 植物生长植物是分形结构的典型例子,因此分形可以用于研究植物生长和发育。
生物学家发现,许多植物的结构和生长方式符合分形几何原理,比如植物根系和叶片结构,这使得我们可以用分形来描述植物的生长状况和特征。
分形理论及其在水处理工程中的应用凝聚和絮凝是混凝过程的两个重要阶段, 絮凝过程的完善程度直接影响后续处理(沉淀和过滤)的处理效果。
但絮凝体结构具有复杂、易碎和不规则的特性,以往对絮凝的研究中由于缺乏适用的研究方法,通常只考虑混凝剂的投入和出水的混凝效果, 而把混凝体系当作一个―黑箱‖, 不做深入研究。
即使考虑微观过程, 也只是将所有的胶粒抽象为球形, 用已有的胶体化学理论及化学动力学理论去加以解释[1],得出的结论与实验中实际观察到的胶体和絮凝体的特性有较大的差别。
尽管有的研究者在理论推导和形成最终的数学表达式时引入了颗粒系数加以修正, 但理论与实验结果仍难以一致。
而分形理论的提出,填补了絮凝体研究方法的空白。
作为一种新兴的絮凝研究手段, ,分形理论启发了研究人员对絮凝体结构、混凝机理和动力学模型作进一步的认识。
1 分形理论的概述1.1 分形理论的产生1975年[2],美籍法国数学家曼德布罗特(B. B. Mandelbrot)提出了一种可以用于描绘和计算粗糙、破碎或不规则客体性质的新方法,并创造了分形(fractal) 一词来描述。
分形是指一类无规则、混乱而复杂, 但其局部与整体有相似性的体系, 自相似性和标度不变性是其重要特征。
体系的形成过程具有随机性,体系的维数可以不是整数而是分数[3]。
它的外表特征一般是极易破碎、无规则和复杂的,而其内部特征则是具有自相似性和自仿射性。
自相似性是分形理论的核心,指局部的形态和整体的形态相似,即把考察对象的部分沿各个方向以相同比例放大后,其形态与整体相同或相似。
自仿射性是指分形的局部与整体虽然不同, 但经过拉伸、压缩等操作后, 两者不仅相似, 而且可以重叠。
分形理论给部分与整体、无序与有序、有限与无限、简单与复杂、确定性与随机性等概念注入了新的内容,使人们能够以新的观念和手段探索这些复杂现象背后的本质联系。
1.2 絮凝体的分形特性絮凝体的成长是一个随机过程, 具有非线性的特征。
推荐333条数学专业博士论文题目选题参考数学源自于古希腊语,是研究数量、结构、变化以及空间模型等概念的一门学科。
本文主要向大家提供了数学专业博士论文题目,供大家参考。
1、基于情景分析与CBR的非常规突发事件应急决策关键技术研究 2、港口综合竞争力评价模型与方法及其实证研究 3、基于岗位胜任力的石油企业中层管理者人岗匹配模型研究 4、基于复杂网络理论的电网结构复杂性和脆弱性研究 5、中国典型城市旅游气候舒适度及其与客流量相关性分析 6、用于区间参数多目标优化问题的遗传算法 7、营销策略对品牌资产的影响机理研究 8、大规模网络最短路径的分层优化算法研究 9、异质性企业国际生产组织模式选择研究 10、基于演化博弈论的群体疏散行为研究 11、农业巨灾风险评估模型研究 12、几类常用非线性回归分析中最优模型的构建与SAS智能化实现 13、模糊Domain与模糊Quantale中若干问题的研究 14、基于历史数据的偏最小二乘建模方法研究与应用 15、陕西省农业生产潜力与粮食安全实证研究 16、电网投资效益后评价理论及决策支持系统的研究 17、考虑分布式能源的电力系统优化运营模型研究 18、智能配电网自愈功能及其效益评价模型研究 19、中国制度变迁与区域经济增长的空间计量经济分析 20、基于行为分析的货物运输方式选择模型研究 21、基于灾情信息特征的应急物资分配决策模型研究 22、我国农村金融排除研究 23、现代农业产业技术体系运行绩效及提升策略研究 24、湖北省粮食生产效率研究 25、灰色预测建模技术研究 26、社交网络模型的研究 27、改进蚁群算法及在路径规划问题的应用研究 28、非线性自抗扰控制的收敛性 29、鲜活农产品流通模式与流通效率研究 30、数学师范生整合技术的学科教学知识(TPACK)发展研究 31、几类投资组合优化模型及其算法 32、两类组合预测方法的研究及应用 33、个人信用评分组合模型研究与应用 34、基于案例推理的应急决策方法研究 35、分形维数特性分析及故障诊断分形方法研究 36、订单式生产人工作业系统组织与计划决策 37、蒙特卡洛方法及在一些统计模型中的应用 38、突发性灾害事件下应急物资分配决策优化过程研究 39、现货价格波动下原材料最优采购决策研究 40、基于Copula理论和GPD模型的金融市场风险测度研究 41、电网企业资产管理模型及应用研究 42、基于差分进化算法的多目标优化方法研究及其应用 43、基于博弈理论的多目标生产调度问题研究 44、代理模型近似技术研究及其在结构可靠度分析中的应用 45、家电产业绿色供应链定价的博弈模型研究 46、不同状态下脑功能网络特性研究 47、复杂网络中若干模型上的传播特性研究 48、数学文化与人类文明 49、基于复杂网络的图像目标识别方法研究 50、基于BSDE的期权定价并行算法研究 51、河川径流时间序列的非线性特征识别与分析 52、不确定性需求下供应链的最优决策与契约协调 53、基于模糊多属性的决策方法研究 54、非负矩阵分解方法及其在选票图像识别中的应用 55、一元微积分概念教学的设计研究 56、结构与系统的动态可靠性研究 57、时间序列的非平稳性度量及其应用 58、结构-热耦合问题及结构疲劳的可靠性分析方法研究 59、路径依赖型期权定价模型和方法研究 60、基于贝叶斯统计的金融市场若干风险测度分析 61、几类分数阶微分方程的数值方法研究 62、空间计量模型的理论和应用研究 63、线性模型参数估计的若干性质研究 64、几类随机延迟微分方程的数值分析 65、复杂网络基于节点重要性的社团探测及社团演化模型研究 66、时间序列数据挖掘若干关键问题研究 67、复杂网络中的社团结构划分及分析应用 68、支持向量机若干问题及应用研究 69、经济增长理论的成长 70、电力可计算一般均衡模型的构建及应用研究 71、驱动桥疲劳可靠性分析与试验方法研究 72、商业银行顾客满意度研究 73、精益供应物流整合优化研究 74、基于质量安全的农产品供应链管理及其信息平台研究 75、工程项目进度管理方法与应用研究 76、基于模糊分析法的商业银行信贷风险内控体系评价研究 77、灰色系统建模技术研究 78、粒子群优化算法在柔性作业车间调度中的应用研究 79、中国私募股权投资中的估值问题研究 80、废旧汽车资源化逆向物流运作管理研究 81、基于区域经济的区域物流需求分析及实证研究 82、消费者感知风险及上网购物行为研究 83、配送中心拣货作业优化设计与控制研究 84、绿色供应链核心企业决策机制研究 85、基于博弈分析的城市公共交通定价及补贴的理论与方法研究 86、房地产投资项目风险管理方法研究 87、数据挖掘中的聚类方法及其应用 88、中国商业银行效率实证研究 89、物流配送车辆路径优化方法研究 90、基于利益相关者的品牌危机管理研究 91、供应链金融服务体系设计与优化 92、中国上市公司财务报表舞弊现状分析及甄别模型研究 93、中国上市公司多元化的动因和绩效研究 94、基于复杂网络的交通网络复杂性研究 95、动态供应链绩效评价方法研究 96、基于区间的不确定性优化理论与算法 97、企业全面风险管理体系构建研究 98、中国能源效率问题研究 99、房地产税对房价的影响机理与实证分析 100、公共交通乘客满意度测评理论及实证研究 101、技术创新机制的系统分析 102、区域创新能力与区域创新效率关联性分析及测度研究 103、中国金融风险指标体系构建与预警研究 104、物流业对中国经济增长的影响研究 105、上市公司财务危机预警模型研究 106、城市综合承载力理论与实证研究 107、中国能源与经济之间关系的模型及实证分析 108、动态面板数据模型估计及其内生结构突变检验理论与应用 109、房地产价格波动对宏观经济影响的一般均衡分析 110、基于Copula函数的金融风险度量研究 111、主观幸福感的经济学理论与实证研究 112、美国货币政策对中国产出溢出效应的实证研究 113、基于优化理论的支持向量机学习算法研究 114、基于博弈论的城市公共交通系统建模与算法研究 115、基于粗糙集的指标体系构建及综合评价方法研究 116、基于DSGE模型的中国货币政策传导机制研究 117、高校教师薪酬激励效应研究 118、平台型电子商务生态系统及其自组织机理研究 119、港口物流绩效评价体系研究 120、中国区域建筑产业竞争力形成机理研究 121、中国消费者网上购物风险及消费行为模型研究 122、金融集聚与区域经济增长的理论及实证研究 123、不确定性疲劳寿命预测方法研究 124、公共服务接受者满意度指数模型研究 125、基于PLS路径模型的顾客满意度测评研究 126、基于认知的企业信息化绩效评价模型研究 127、柔性作业车间调度方法研究 128、大规模突发事件应急物资调度基本模型研究 129、中国建筑能耗影响因素分析模型与实证研究 130、多指标综合评价理论与方法问题研究 131、小波理论及其在图像、信号处理中的算法研究 132、多分辨希尔伯特-黄(Hilbert-Huang)变换方法的研究 133、非随机不确定结构的可靠性方法和优化设计研究 134、平面信号交叉口延误分析 135、经济管理复杂适应系统理论与仿真研究 136、基于支持向量机的经济预警方法研究 137、关于蒙特卡罗及拟蒙特卡罗方法的若干研究 138、个体差异与消费者接受网上购物--基于杭州样本的实证研究 139、企业联盟及联盟竞争的博弈分析 140、网络环境下制造企业组织创新的机理与模式研究 141、浙江省中小企业集群化成长影响因素实证研究 142、多目标模糊识别优化决策理论与应用研究 143、高等教育服务质量管理的理论与应用研究 144、CSI模型构建及其参数的GME的综合估计研究 145、中小企业信用担保风险管理研究 146、中国经济增长与收入分配差异的空间统计分析 147、基于随机Petri网的企业业务流程重组的理论与优化方法研究 148、时间序列数据挖掘中相似性和趋势预测的研究 149、冲突分析与合作理论研究 150、技术创新与产业系统的自组织演化及演化混沌 151、突发公共卫生事件危机管理体系构建与评测研究 152、支持向量机分类与回归方法研究 153、企业战略风险理论研究及实证分析 154、资产价格波动与宏观经济稳定 155、概率安全评价中人因可靠性分析技术研究 156、求解约束矩阵方程及其最佳逼近的迭代法的研究 157、网络系统中可靠性问题的研究 158、数学形态学及其应用 159、连续体结构拓扑优化理论与应用研究 160、基于响应时间的供应链协同决策与优化模型研究 161、中国省级区域可计算一般均衡建模与应用研究 162、支持向量机若干问题的研究 163、科技进步与经济增长互动影响研究 164、突破性创新动因与组织模式研究 165、基于SCOR模型的供应链风险识别、评估与一体化管理研究 166、支持向量回归机及其应用研究 167、中国R&D与经济增长的空间统计分析 168、基于复杂适应系统理论的经济仿真研究 169、用户信息技术接受的影响因素模型与实证研究 170、上市公司估值模型的创新与实证研究 171、数学金融的分数次Black-Scholes模型及应用 172、基于价值创造与分配的产业价值链研究 173、基于循环经济的生态工业理论研究与实证分析 174、高维数据的降维理论及应用 175、Bass模型及其两种扩展型的应用研究 176、支持向量机分类方法及其在文本分类中的应用研究 177、基于收益管理的集装箱班轮舱位分配随机模型研究 178、不确定性条件下供应链管理优化模型及算法研究 179、基于博弈论的国家竞争力评价体系研究 180、供应链中的应急管理 181、企业核心利益相关者利益要求与利益取向研究 182、网络选址中基于时间满意的覆盖问题研究 183、我国大中型工业企业生产率与技术效率的随机前沿模型分析 184、基于企业网络的组织间知识转移研究 185、企业内部沟通中信息传递问题研究 186、居民健康与医疗服务需求及利用的理论与实证研究 187、基于产业技术创新的FDI溢出机制研究 188、投资者情绪与中国证券市场的实证研究 189、促进我国电子信息产业集群创新研究与实证分析 190、区域竞争力的理论研究与实证分析 191、转型期中国居民消费的不确定性分析 192、基于民众满意度的社会发展评价研究 193、中国能源供求预测模型及发展对策研究 194、ERP实施知识转移影响因素实证研究 195、企业战略采购机理及其应用研究 196、基于知识图谱的科学计量学进展研究 197、中国税收对居民收入分配调控研究 198、中国区域经济发展水平与差距的实证研究 199、流形学习的理论与方法研究 200、基于供应链一体化的物流敏捷化实现机制研究 201、工程项目风险分析与BT模式风险管理实证研究 202、农业风险管理理论方法及其应用研究 203、高等教育与区域经济互动发展研究 204、分工、产业集聚与区域经济增长研究 205、非对称信息下房地产市场博弈问题研究 206、净资产倍率和市盈率的投资决策有用性 207、中国农业生产率测算及实证研究 208、独立董事制度与会计透明度相关性的实证研究 209、科技型中小企业融资的理论与实证研究 210、金融市场风险的度量-基于极值理论和Copula的应用研究 211、建设供应链协调及其支撑平台研究 212、农业产业组织行为主体博弈分析 213、正交表的数据分析及其构造 214、复杂网络的演化模型研究 215、面向知识管理的知识流程建模与改进方法研究 216、供应链环境下供应商选择方法及其应用研究 217、面向现代制造的协同物流多要素模型与应用研究 218、基础设施投资与城市化进程的关系研究 219、城市住宅价格变动的影响因素研究 220、装配线平衡的最优化模型与算法研究 221、供应链环境下库存控制的系统动力学仿真研究 222、基于共生理论的船舶产业集群形成机理与发展演变研究 223、基于Hedonic模型的上海住宅特征价格研究 224、电子化供应链管理协同机制研究 225、城乡居民收入差距变动及其影响因素的实证研究 226、我国中小企业融资行为研究 227、基于DEA-AHP-FCE方法的民营企业上市公司绩效综合评价研究 228、基于循环经济的区域产业结构优化 229、粗糙集理论及其应用研究 230、知识溢出及其对我国区域经济增长作用的实证研究 231、上市公司现金持有动机与投融资行为的实证分析 232、中国煤炭产业竞争力评价模型及提升路径研究 233、VaR与CVaR的估计方法以及在风险管理中的应用 234、配送中心选址模型与算法研究 235、基于非线性动力学的金融时间序列预测技术研究 236、个人信用评分与信用卡风险控制研究 237、区域旅游产业竞争力模型及区域旅游产业“竞合”模式研究 238、企业联盟内的组织间学习研究 239、中国企业社会责任理论与实证研究 240、面向顾客满意度改进决策的结构方程和影响图结合研究 241、基于行为金融学的中国证券分析师行为研究 242、区域发展脆弱性研究与评估 243、基于协同论的冶金企业技术创新整合机制研究 244、管理者的情绪智力及其与工作绩效的关系研究 245、我国上市公司独立董事制度有效性研究 246、我国商业银行操作风险度量与资本金分配研究 247、我国捐赠的公共经济学分析 248、中国商业银行效率研究 249、基于VaR的商业银行风险管理研究 250、基于混凝土耐久性的建筑工程项目全寿命经济分析 251、国际工程承包项目风险预警研究 252、中国货币政策的股票市场传导机制研究 253、复杂产品系统创新的风险管理研究 254、基于系统动力学的企业成长研究 255、基于个体的绩效管理体系研究 256、求解资源受限项目调度问题算法的研究 257、师范生数学教学信念的发展研究 258、DEA理论及应用研究 259、复杂网络上动力系统同步现象的研究 260、有限元方法及其在高速碰撞中的应用 261、区域经济一体化的经济增长效应及模式选择研究 262、商业银行信用卡业务信用风险管理研究 263、基于延期支付的供应链库存协调策略研究 264、基于商务智能的客户流失预测模型与算法研究 265、供应网络弹性研究 266、中国金融发展与经济增长关系的理论和实证分析 267、产业融合的内在机制研究 268、中国商业银行流动性风险:计量与管理框架 269、数学史与数学教育整合的研究 270、数学建模的认知机制及其教学策略研究 271、支持向量回归的模型选择及应用研究 272、中国商业银行X效率问题研究 273、状态空间模型理论与算法及其在金融计量中的应用 274、基于极值理论的VaR及其在中国股票市场风险管理中的应用 275、分数阶微分方程的理论分析与数值计算 276、高可靠长寿命产品可靠性技术研究 277、汽车产业集群的机理与实证研究 278、车辆路径问题模型及算法研究 279、关于我国证券分析师盈利预测的实证研究 280、连锁经营企业物流配送系统集成规划模型及算法研究 281、信用风险传染模型和信用衍生品的定价 282、矿产资源开发环境代价及实证研究 283、企业战略风险识别、评估与动态预警研究 284、中国国债市场利率期限结构研究 285、物流系统着色Petri网模型研究 286、顾客满意度指数模型及其测评方法研究 287、商品住宅特征价格模型与指数的应用研究 288、基于动态随机一般均衡模型的中国经济波动数量分析 289、基于排队网络理论的集装箱码头设备配置优化研究 290、电子商务用户信任影响因素建模及实证研究 291、数学建模教育的素质培养内涵与文化特征 292、自然资源禀赋与经济增长的悖论研究 293、企业信息资源利用与竞争力提升的相关研究 294、基于多因素扰动的供应链应急协调研究 295、基于系统动力学的江西电子信息产业发展模式研究 296、面向大规模定制产品设计的客户需求处理关键技术研究 297、模糊多属性决策方法研究 298、数学多元表征学习的认知模型及教学研究 299、物流配送车辆路径问题模型及算法研究 300、地方政府性债务危机预警及控制研究 301、中国区域经济增长中的金融集聚因素研究 302、基于MCMC的贝叶斯生存分析理论及其在可靠性评估中的应用 303、高速公路项目运营效益评价研究 304、基于金融效率的金融监管研究 305、土地资源对中国经济的“增长阻尼”研究 306、供应商管理库存及其协调研究 307、基于冷藏链的生鲜农产品物流网络优化及其安全风险评价研究 308、废旧电子产品逆向物流网络优化设计研究 309、口碑沟通对购买决策的影响研究 310、基于遗传算法的多目标优化问题的研究与应用 311、模糊层次综合评价法及其应用 312、基于主成分分析的综合评价研究 313、复杂网络分形性质及应用研究 314、常数波动率和随机波动率下美式期权定价问题的数值解法 315、基于区间法的结构非概率可靠性研究 316、复杂网络社团结构发现方法研究 317、复杂网络拓扑结构的鲁棒性与动力学过程研究 318、复杂网络中社区发现关键技术研究 319、基于SCI引文网络的知识扩散研究 320、软集与犹豫模糊集理论及其在决策中的应用 321、M-矩阵(张量)最小特征值估计及其相关问题研究 322、非线性分数阶动力系统的控制研究 323、时间序列相似性与预测算法研究及其应用 324、复杂网络社区发现若干问题研究 325、最优化及最优控制计算研究:精确罚函数途径 326、时间序列数据挖掘中的维数约简与预测方法研究 327、几类不确定性期权定价模型及相关问题研究 328、网络拓扑结构与传播动力学分析 329、社会网络中社团发现及网络演化分析 330、时间序列的相关性及复杂性研究 331、时间序列数据分类、检索方法及应用研究 332、多媒体事件检测中的关键技术研究 333、模糊数学法结合层次分析法用于清洁生产潜力评估研究。
复杂网络中的分形形态分析随着信息时代的到来,复杂网络逐渐成为研究的热点话题。
复杂网络可以包括社交网络、生物网络、交通网络等,这些网络中的节点和边缘都具有一定的规律性和复杂性。
为了更好地研究复杂网络,科学家们引入了分形这个概念,利用分形形态分析方法来揭示复杂网络的内在规律。
一、分形的概念分形是一种自相似的几何形态,即某一图形的一部分可以看成是整个图形的缩小版。
分形的特征在于无论看多少次,都能看到相似的形态。
分形在自然界中经常出现,如树枝、云朵、海岸线等,而这些现象又常常被描述为“自然的美”。
二、复杂网络中的分形复杂网络中的节点和边缘形态各异,这里所说的形态包括了节点的排列和边缘的走势等,其中存在一些具有自相似特征的形态。
这就意味着,复杂网络就像一个巨大的分形一样,它的一部分也可以看成整个网络的缩小版。
实际上,分形形态分析早在上个世纪70年代就已经引起了许多科学家的关注。
例如,曼德勃罗集和朱利亚集等数学模型,它们的自相似特征能帮助我们更好地理解分形这个概念。
这些数学模型不仅有助于我们理解分形,同时也能为研究复杂网络提供一定启示。
三、分形形态分析方法分形形态分析可以理解为,将一个大小为N的分形对象,分成若干个大小为n的小分形对象,并将小分形对象放大到与原分形对象一样的大小,然后可以比较放大后的小分形对象与原分形对象的差异程度,此时,我们可以得到一个分形维度的概念,表示某个图形的自相似的程度。
分形维度越大,说明图形的自相似程度越高,复杂网络中也是如此。
由于复杂网络的自相似特征,可以将其看成一个分形系统,利用分形形态分析方法,可以计算出网络的分形维度,从而更好地探究其内在规律。
四、应用实例分形形态分析在各个领域中都有应用。
在复杂网络的研究中,通过计算网络的分形维度,可以了解网络的自相似特征,同时还可以用于网络的分类和聚类等方面。
例如,在社交网络中,可以利用分形形态分析方法,计算每个用户的网络分形维度,从而获取某个用户的社交活跃程度和社交影响力等信息。
2018年19期博士论坛高教学刊基于网络结构的大学生合作学习模式研究*郑巍,彭雨松,潘浩,刘成斌(南昌航空大学软件学院,江西南昌330063)一、概述20世纪70年代合作学习兴起于美国,很快引起了世界各国的关注并逐步运用与发展,是当代主流的教学理念与策略。
合作学习通过群体合作的形式组织学生进行学习的一种教学形式[1],该学习模式能系统利用教学动态因素之间的互动,促进学生的学习,这一学习模式目前在高校大学生自主学习中广泛应用[2-5]。
合作学习的核心是学生之间的交互,它为学生之间的沟通、补充、合作提供了交互机会,有利于学生解决自己遇到的一些问题,并且增加了知识的流动性。
相对于独立学习而言,合作学习能够在学生之间建立更积极的伙伴关系[2]。
互联网的发展使得合作学习突破了时间、空间的限制,更加突出了合作学习反馈及时、学习便捷和灵活等优势,推动了现代教育的发展[3]。
合作学习可以培养学生实践能力,合作能力,是教学过程中的重要环节,是理论联系实践的桥梁。
合作学习经过多年的研究,取得了一些成果,学生合作学习模式的本质是加强学生之间的交流学习,提升学生之间的知识传播,提高学生的自主学习能力,提升团结合作精神。
所有的学生加上他们之间的合作交互关系就构成了一个交互网络。
合作学习的目的是鼓励学生之间产生更多的交互,促进知识在学生之间进行传播。
目前,合作学习在组织结构设计和组织管理方面存在着以下问题:大多数的合作学习模式是以项目为驱动,采用划分小组的形式,小组的划分策略主要是“组内异质,组间同质”,再选择相应比例的不同知识水平的学生在同一组中。
目前国内合作学习中,不同学生小组之间没有直接的沟通,这是一种局部交互网络(即知识在网络的局部进行传播),从网络的角度而言,这是不利于知识传播的。
对小组成员的挑选策略只是简单考虑了知识水平,没有考虑成员的学习特征,而学习特征差异较大的学生分在同一组内交互的效果并不好。
组织学生进行合作学习大多是以项目为驱动的,在项目驱动的情况下,小组成员之间交互的动力较强,将合作交互关系扩展到日常的学习当中,可以提高学生的学习效果。
㊀㊀㊀㊀㊀㊀㊀㊀㊀2024年4月第39卷第2期JOURNAL OF LIGHT INDUSTRY㊀Vol.39No.2Apr.2024㊀收稿日期:2023-10-19;修回日期:2024-01-25;出版日期:2024-04-15基金项目:国家自然科学基金青年科学基金项目(32101976,61906175);河南省科技攻关项目(232102210020,20210221014);河南省高等学校重点科研项目(22A520013,23B520004)作者简介:王晓(1982 ),男,河南省卫辉市人,郑州轻工业大学副教授,博士,主要研究方向为人工智能㊁生物信息学和食品信息学㊂E-mail :wangxiao@.cn王晓,吴洲,王宏伟,等.基于深度学习和蛋白质语言模型的抗菌肽预测模型研究[J].轻工学报,2024,39(2):12-18.WANG X,WU Z,WANG H W,et al.Research on antimicrobial peptide prediction model based on deep learning and protein language model[J].Journal of Light Industry,2024,39(2):12-18.DOI:10.12187/2024.02.002基于深度学习和蛋白质语言模型的抗菌肽预测模型研究王晓1,2,吴洲1,王宏伟3,王榕4,陈浩然11.郑州轻工业大学计算机科学与技术学院,河南郑州450001;2.河南省食品安全数据智能重点实验室,河南郑州450001;3.郑州轻工业大学食品与生物工程学院,河南郑州450001;4.郑州轻工业大学电子信息学院,河南郑州450001摘要:针对目前已有抗菌肽(Antimicrobial Peptides ,AMPs )预测模型的准确度(ACC )仍有待提高的问题,提出一种新的基于深度学习和蛋白质语言模型的抗菌肽预测模型DeepGlap ,该模型分别采用两个蛋白质语言模型对抗菌肽序列进行特征提取,将提取的特征向量融合后输入由多层双向长短记忆网络(mBi-LSTM )㊁一维卷积神经网络(1D-CNN )和注意力机制组成的深度学习网络中,并进行性能评估与优化㊂结果表明:该模型的ACC ㊁皮尔逊相关系数(MCC )和曲线下的面积(AUC )分别为0.739㊁0.489和0.81,优于已有抗菌肽预测模型的预测效果㊂关键词:抗菌肽;预测模型;食源性病原体;蛋白质语言模型;深度学习网络中图分类号:TS201.2;TP399㊀㊀文献标识码:A㊀㊀文章编号:2096-1553(2024)02-0012-070 引言食源性病原体是导致食品安全问题的重要来源之一,研究[1]表明,在畜禽养殖过程中使用抗生素会产生具有耐药性的人畜共患食源性病原体㊂抗菌肽(Antimicrobial Peptides,AMPs)作为抗生素的一种潜在替代品,是一类广泛存在于动植物体内的具有抗菌活性的小分子蛋白质或多肽,通过破坏细胞膜㊁干扰蛋白质合成㊁促使微生物发生自我毁灭等方式杀灭细菌㊁真菌㊁病毒等微生物或抑制这些微生物生长繁殖[2]㊂抗菌肽的鉴别有助于减轻抗生素依赖,降低因畜禽养殖过度使用抗生素而带来的耐药性病原体风险,对于研发新型抗菌剂㊁有效保障食品安全和维护公共健康具有重要意义㊂然而,通过湿实验来鉴别抗菌肽操作复杂,且耗费大量的时间与资源[3],因此有必要借助现代计算科学手段开发更高效的抗菌肽预测模型㊂目前,预测抗菌肽的计算方法主要有:1)传统的机器学习方法㊂其中,支持向量机㊁随机森林㊁XGBOOST 及集成学习都得到了广泛应用,如㊃21㊃㊀王晓,等:基于深度学习和蛋白质语言模型的抗菌肽预测模型研究ClassAMP使用随机森林和支持向量机实现了抗菌肽的预测[4];iAMPpred引入蛋白质序列的结构特征和理化性质,并与传统手工特征合并后输入支持向量机以进行抗菌肽的分类预测,可进一步提高抗菌肽的预测精度[5];IAMPE利用氨基酸的CNMR光谱提取特征向量,并与蛋白质的传统手工特征向量融合后输入支持向量机和随机森林来实现抗菌肽的分类预测,该方法获得了较好的预测精度[6];AMPfun 则通过提取序列的n-gram特征㊁AAC特征㊁理化性质等特征向量,并输入支持向量机中以实现抗菌肽的分类预测,进一步提高了抗菌肽的预测精度[7]㊂2)新型的机器学习方法㊂如iAMPCN通过不同的卷积神经网络(CNN)提取4种不同编码方法的特征向量,在实现抗菌肽分类预测的基础上,首次实现了抗菌肽的功能预测[8];sAMPpred-GAT使用图注意力机制,将结构特征引入深度学习网络中,进一步提高了抗菌肽的预测精度[9]㊂大语言模型是能够基于原有文本来预测下一个字符或词汇的一类神经网络,而蛋白质语言模型是大语言模型在生化领域的迁移应用,在输入蛋白质序列并学习序列中隐含的生化性质㊁结构信息等内在规律后,生成蛋白质的特征向量,这些特征向量可用于预测多种蛋白质属性㊂研究[10]表明,多种下游任务使用蛋白质语言模型进行预测,均取得了较好的效果㊂基于此,本文拟设计一种新的基于深度学习和蛋白质语言模型的抗菌肽预测模型DeepGlap,将两个蛋白质语言模型所生成的特征向量融合后,输入由多层双向长短记忆网络(mBi-LSTM)㊁一维卷积神经网络(1D-CNN)和注意力机制所组成的深度学习网络中,并对该模型的准确性进行验证,以期获得更好的抗菌肽预测效果㊂1㊀数据集与数据预处理迄今为止,已建立了大量的抗菌肽数据库,其中APD(Antimicrobial Peptide Database)作为早期建立的抗菌肽数据库之一,包含不同生物界(细菌㊁真菌㊁动物等)的抗菌肽数据,以及这些抗菌肽的分类㊁结构㊁活性等信息[11];LAMP(Linking Antimicro-bial Peptide)提供了各种生物体内外来源的抗菌肽序列信息,以及相关的文献引用和其他注释数据[12];CAMP(Collection of Anti-Microbial Peptides)汇集了来自不同物种的抗菌肽信息,包含各种结构分类信息[13];DBAASP(Database of Antimicrobial Activity and Structure of Peptides)是一个用于存储和提供抗菌肽信息的数据库,包括抗菌肽的序列㊁结构㊁抗菌活性㊁相关文献引用等信息[14];DRAMP (Data Repository of Antimicrobial Peptides)是一个综合的抗菌肽数据库,包含抗菌肽的结构数据㊁注释条目等[15];SATPdb(Database of Structurally Annotated Therapeutic Peptides)可提供大量的抗菌肽结构数据,其主要部分是通过计算工具预测获取的[16]㊂这些数据库的建立为研究人员提供了便利,有助于推动抗菌肽领域的深入研究㊂为了消除不同数据库数据分布不同所带来的影响,本文将一个综合基准评测数据集用于模型的训练和验证,该数据集包含了来自APD㊁LAMP㊁CAMP㊁DBAASP㊁DRAMP和SATPdb这6个数据库的抗菌肽和非抗菌肽数据㊂由于新数据库可能参考了较早数据库的数据,不同数据库之间的数据可能有重叠,因此本文采用CD-HIT工具[17]消除冗余数据,即当来自不同数据库的肽序列之间的相似度高于90%时,将其中一条数据删除㊂根据Y.Zhang 等[18]和K.Yan等[9]的研究,肽链过长可能会产生更复杂的结构,导致蛋白质难以合成,而肽链过短又可能无法包含足够的功能性位点或结构域,且在环境中易发生降解[19],故本文选择长度为10~100个氨基酸的序列,并删除包含非标准氨基酸(B,J,O, U)的序列,最终获得包含4550条抗菌肽和4550条非抗菌肽的基准评测数据集㊂本文采用CD-HIT工具删除独立测试集XUA-MP(包含1536条抗菌肽和1536条非抗菌肽)[19]与基准评测数据集中相似度高于90%的肽序列,确保数据的独立性,从而更客观地评价预测模型的泛化能力㊂2㊀特征提取传统手工特征提取方法通常依赖专家知识提取蛋白质序列的生化统计信息,无法全面准确地反映㊃31㊃㊀2024年4月第39卷第2期㊀蛋白质序列的复杂模式特征;而蛋白质语言模型通过无监督深度学习技术,学习数亿条蛋白质序列的复杂依赖关系和结构信息,可以全面准确地提取蛋白质序列的特征㊂因此,本文使用蛋白质语言模型Unirep和Protbert对抗菌肽序列分别进行特征提取,并将提取的特征向量进行融合,从而获得更全面的抗菌肽特征向量㊂2.1㊀Unirep蛋白质语言模型Unirep蛋白质语言模型采用长短时记忆网络(Long Short Memory Network,LSTM)作为基础架构,通过预测序列中下一个氨基酸值是否与真实氨基酸值相同,不断优化LSTM,最终使用多个LSTM的隐藏层单元平均值作为序列的特征向量㊂Unirep蛋白质语言模型使用多个图形处理器(Graphics Process-ing Unit,GPU),在UniRef50蛋白质数据库中约2400万条蛋白质序列上进行为期3周的训练[20],最终将不同长度的蛋白质序列映射为统一长度的1900维特征向量,通过这种方式可有效将具有较低统一性的蛋白质序列划分为结构相似性较高的类别㊂2.2㊀ProtBert蛋白质语言模型ProtBert蛋白质语言模型作为Transformer/ BERT架构的创新模型,使用来自BDF蛋白质数据库和UniRef50蛋白质数据库中超过2ˑ108条蛋白质序列进行广泛的训练,最终实现将不同长度的蛋白质序列映射为统一长度的1024维特征向量㊂该模型汲取了Transformer架构中的多头注意力机制,在较高水平全局特征的基础上能更加突出蛋白质序列的局部特征[21]㊂3㊀深度学习网络模型抗菌肽预测模型的预测流程为:首先,将抗菌肽序列分别输入蛋白质语言模型Unirep和ProtBert中,得到对应的1900维特征向量和1024维特征向量,并将这两个特征向量进行特征融合;随后,将融合的特征向量依次输入由mBi-LSTM㊁1D-CNN和注意力机制组成的深度学习网络中;最后,输入由Flatten操作㊁批归一化(Batch-Normalize)和Sigmoid 激活函数组成的输出层中,完成抗菌肽的分类预测㊂本文所提出的模型采用ReduceLROnPlateau动态学习率算法,该算法是深度学习框架PyTorch中的学习率调度器之一,可在训练过程中根据验证集上的性能指标动态调整学习率,如在验证集性能停止提升时降低学习率,以帮助模型更好地收敛㊂具体而言,当测试集的准确度(ACC)连续两个epoch 保持不变时,ReduceLROnPlateau动态学习率算法会将学习率调整为原学习率的0.7倍,直到达到最大epoch值为止㊂本文在模型训练过程中采用二分类交叉熵损失函数,损失(Loss)的计算方法如式①㊁式②所示㊂Loss=1NðN n=1l n①l n=y n㊃log x n+(1-y n)㊃log(1-x n)②式中,l n是单个样本的损失值,n是当前样本标号, N是样本数量,x n是模型输出,y n是真实标签㊂本文利用ADAM算法优化模型,批量大小为64,初始学习率为0.001,并采用十折交叉验证,每一折包含20个epoch㊂3.1㊀mBi-LSTM循环神经网络(Rerrent Neural Network,RNN)已广泛应用于处理时间序列和文本数据,但在处理较长序列数据时,存在无法提取序列的长期依赖的限制㊂为了解决这个问题,学者们将LSTM作为RNN的一种变体㊂LSTM引入细胞状态的概念,以保持前后时刻之间的信息流动,并通过遗忘门㊁输入门和输出门这3个门结构对输入信息和隐藏状态进行调控㊂然而,传统RNN和LSTM在信息传递方面都是单向的,无法获取未来状态的信息㊂蛋白质序列可类比为生物学上的一种语言:肽段相当于句子,而氨基酸残基则类似于单词㊂因此,氨基酸残基之间的上下文关系对预测结果至关重要㊂为了弥补LSTM 的局限性,本文采用mBi-LSTM从相反的方向学习传统特征向量的输入,在不同方向上捕捉序列中的关键模式和信息,从而更全面地表征蛋白质序列,更好地学习和捕获更复杂序列数据中的依赖关系㊂3.2㊀1D-CNN1D-CNN作为深度学习中提取一维数据的网络㊃41㊃㊀王晓,等:基于深度学习和蛋白质语言模型的抗菌肽预测模型研究架构,可用于序列数据的特征提取㊂1D-CNN能接收来自mBi-LSTM层的输出向量,捕捉序列中的局部特征,并通过堆叠多个卷积层,学习更高级㊁更抽象的特征向量㊂3.3㊀注意力机制注意力机制最初是为了解决机器翻译任务而提出的,在自然语言处理领域有着广泛的应用㊂随着研究的不断深入,注意力机制在计算机视觉领域和图像处理领域均取得了突出的成果,其善于从输入数据中挖掘重要信息,并有效地集成多视图特征[22]㊂此外,注意力机制常与RNN相结合用于生物信息学,且在生物序列分析问题中取得了较高的性能得分[23]㊂3.4㊀输出层输出层的作用是将神经网络处理后的特征向量进行变形㊁加工,最终输出Flatten操作㊁批归一化㊁Sigmoid激活函数等分类结果㊂其中,Flatten是神经网络中的一种操作,通常用于从多维输入数据中拉平数据维度,以便将其作为全连接层的输入㊂在本文中,由1D-CNN输出的向量维度为3维,通过Flat-ten可将其变成2维,以便于输入全连接层进行后续分类处理㊂批归一化的主要思想是在每个训练批次的数据上进行归一化,以确保输入数据的分布稳定性㊂具体操作为:计算每个批次数据的平均值和标准差,然后对数据进行归一化,使其平均值为0,标准差为1㊂计算方法如式③所示㊂x i+1=x i-μBσBα+β③式中,x i+1是批归一化后的数据,μB是数据样本的平均值,σB是数据样本的标准差,α和β分别是对数据样本进行的拉伸和偏移,i是x的时间步㊂对特征向量进行所有处理后,通过线性层对其进行分类,验证是否为抗菌肽㊂线性层有较高的分辨能力,如式④所示㊂x t=W t l x(t-1)+b t④式中,x t和x(t-1)分别是输出向量和输入向量,W t l是权重矩阵,b t是线性层的偏差,t㊁l是时间步序号㊂除第一层和最后一层外,将批归一化用于每个线性层的输出;将Sigmoid激活函数用于最后一层的输出㊂Sigmoid激活函数可将输出转化为0~1,并以此作为概率,认为ȡ0.5的输出为抗菌肽,<0.5的输出为非抗菌肽㊂Sigmoid激活函数如式⑤所示㊂S(x)=11+e-x⑤式中,x为最后一层的输出㊂4㊀模型性能评估与优化4.1㊀性能评估通过对模型性能进行评估,可在众多参数的组合中选出最适合该预测模型的参数组合,从而有效预测抗菌肽㊂在本文中利用5个指标来评估模型性能,其计算公式如式⑥所示㊂ACC=TP+TNTP+TN+FN+FPMCC=TPˑTN-FNˑFP(TP+FN)(TP+FP)(TN+FP)(TN+FN)Sn=TPTP+TNSp=TNFP+TNìîíïïïïïïïïïïï⑥式中,TP㊁FP㊁TN和FN分别是真阳性㊁假阳性㊁真阴性和假阴性;当ACC=1时,说明所有的抗菌肽预测正确,当ACC=0时,说明所有的抗菌肽预测错误;MCC是皮尔逊相关系数,MCC越接近1,则表示模型综合性能越高,MCC越接近0,则表示模型性能越接近随机分类器,MCC越接近-1,则表示模型的综合性能越差;Sp是模型的特指度,Sn是模型的灵敏度,二者分别代表模型预测抗菌肽和非抗菌肽的能力㊂4.2㊀模型优化为了使融合向量能更好地反映抗菌肽特征,本文在使用基准评测数据集进行训练和验证时,尝试不同的特征向量融合方法,包括自注意力机制融合特征向量㊁交叉注意力机制融合特征向量和向量拼接,并采用十折交叉验证来保证实验结果的可靠性㊂不同特征向量融合方法的效果见表1㊂由表1可知,向量拼接法对应的ACC最高,模型预测效果最好㊂4.3㊀参数优化4.3.1㊀mBi-LSTM层参数优化㊀为了使mBi-LSTM㊃51㊃㊀2024年4月第39卷第2期㊀达到最优效果,训练过程中在基准数据集上进行mBi-LSTM层参数优化,并采用十折交叉验证来保证实验结果的可靠性㊂mBi-LSTM的层数分别设置为1~7层,不同mBi-LSTM层参数优化的效果见表2㊂由表2可知,当mBi-LSTM层数设置为2层时, ACC最高,模型预测效果最好㊂4.3.2㊀1D-CNN层参数优化㊀为了使1D-CNN层能更好地处理mBi-LSTM层的输出向量,训练过程中在基准评测数据集上进行1D-CNN层的参数优化,并使用十折交叉验证来保证实验结果的可靠性㊂1D-CNN层的输入通道数分别设置为2个㊁4个㊁6个㊁8个和10个,卷积核感受野大小分别设置为1600㊁1800㊁2000㊁2200和2400,不同通道数模型及不同卷积核感受野大小模型的效果分别见表3和表4㊂由表3和表4可知,输入通道为2个㊁卷积核感受野大小为2000的模型ACC最高,模型预测效果最好㊂表1㊀不同特征向量融合方法的效果Table1㊀Effect of different teature vectorfusion methods方法ACC MCC Sp Sn自注意力机制0.640.300.750.54交叉注意力机制0.500.00 1.000.00向量拼接0.740.480.630.84表2㊀不同mBi-LSTM层参数优化的效果Table2㊀Effect of optimizing parametersof different mBi-LSTM layers层数/层ACC MCC Sp Sn 10.700.410.830.56 20.740.490.840.64 30.680.380.610.75 40.700.410.670.74 50.710.440.850.56 60.710.430.740.67 70.720.440.790.63表3㊀不同通道数模型的效果Table3㊀Effect of models with differentchannel number通道数/个ACC MCC Sp Sn20.730.490.840.6440.690.430.900.4960.700.420.800.6080.700.410.730.67100.710.420.750.665㊀实验结果分析本文将所提出的模型DeepGlap与10种较先进的预测模型(包括amPEPpy㊁AMPfun㊁AMPEP㊁ADAM-HMM㊁AMPIR㊁AMPScannerV2㊁AMPGram㊁Deep-AMPEP30㊁CAMP-ANN㊁sAMPpred-GAT)在独立测试集XUAMP上进行比较,结果见表5㊂由表5可知,本文所提出的模型DeepGlap在ACC㊁MCC和Sn方面均有较好的性能,表明模型的准确率和泛化能力均达到了较高水平㊂而模型Deep-AMPEP30的Sp虽达到了1.000,但Sn非常小,说明该模型大幅度偏向于预测正样本,综合预测精度较差㊂为了进一步验证模型的优劣性,本文采用ROC (Receiver Operating Characteristic)曲线下的面积(Area Under the Curve,AUC)来评估模型的性能, AUC越大,表示模型的性能越好,误报率越低,反之模型性能越差,误报率越高㊂不同模型的AUC如图1所示㊂由图1可知,本文所提出的模型DeepGlap 的AUC最大(为0.81),表明该模型拥有更好的预测能力,且误报率较低㊂表4㊀不同卷积核感受野大小模型的效果Table4㊀Effect of models with different convolutionkernel receptive field sizes卷积核感受野大小ACC MCC Sp Sn 16000.660.390.690.7018000.660.400.940.3920000.700.490.840.6322000.710.430.790.6224000.700.420.840.56表5㊀不同模型在独立测试集XUAMP上的效果Table5㊀Effect of different models on theindependent test set XUAMP模型ACC MCC Sn SpamPEPpy0.6790.4310.4000.958AMPfun0.6740.4140.4060.943AMPEP0.6610.4290.3300.992 ADAM-HMM0.6840.3900.5210.847AMPIR0.5630.1560.2660.859 AMPScannerV20.5680.1370.5230.613 AMPGram0.5640.1310.4450.682 Deep-AMPEP300.5330.1830.065 1.000 CAMP-ANN0.5840.1820.3850.782 sAMPpred-GAT0.7150.4640.5300.900DeepGlap0.7390.4890.6350.843㊃61㊃㊀王晓,等:基于深度学习和蛋白质语言模型的抗菌肽预测模型研究图1㊀不同模型的AUCFig.1㊀The AUC of different models6㊀结论本文针对抗菌肽的精准鉴别问题,提出了一种新的基于深度学习和蛋白质语言模型的抗菌肽预测模型DeepGlap,该模型使用蛋白质语言模型Unirep 和ProtBert 提取抗菌肽的特征,再使用包含mBi-LSTM㊁1D-CNN 和注意力机制的深度学习网络进行堆叠,并对模型参数进行优化,得到如下结论:相较于已有抗菌肽预测模型,该抗菌肽预测模型的预测效果更佳,有望成为一个有前景的抗菌肽预测工具,以辅助新型抗菌剂的研发,降低耐药性病原体的感染风险㊂参考文献:[1]㊀WHITE D G ,ZHAO S H ,SIMJEE S ,et al.Antimicrobialresistance of foodborne pathogens [J ].Microbes and Infection ,2002,4(4):405-412.[2]㊀KUMAR P ,KIZHAKKEDATHU J N ,STRAUS S K.Anti-microbial peptides :Diversity ,mechanism of action and strategies to improve the activity and biocompatibility in vivo[J ].Biomolecules ,2018,8(1):4.[3]㊀ZHANG R N ,WU D ,GAO Y T.Progress on the designand optimization of antimicrobial peptides [J ].Journal of Biomedical Engineering ,2022,39(6):1247-1253.[4]㊀JOSEPH S ,KARNIK S ,NILAWE P ,et al.ClassAMP :Aprediction tool for classification of antimicrobial peptides[J ].IEEE-ACM Transactions on Computational Biology and Bioinformatics ,2012,9(5):1535-1538.[5]㊀SHARMA R ,SHRIVASTAVA S ,SINGH S K ,et al.Ani-AMPpred :Artificial intelligence guided discovery of novelantimicrobial peptides in animal kingdom [J ].Briefings inBioinformatics ,2021,22(6):bbab242.[6]㊀KAVOUSI K ,BAGHERI M ,BEHROUZI S ,et al.IAMPE :NMR-assisted computational prediction of antimicrobialpeptides [J ].Journal of Chemical Information and Model-ing ,2020,60(10):4691-4701.[7]㊀CHUNG C R ,KUO T R ,WU L C ,et al.Characterizationand identification of antimicrobial peptides with differentfunctional activities [J ].Briefings in Bioinformatics ,2020,21(3):1098-1114.[8]㊀XU J ,LI F Y ,LI C ,et al.iAMPCN :A deep-learningapproach for identifying antimicrobial peptides and theirfunctional activities [J ].Briefings in Bioinformatics ,2023,24(4):bbad240.[9]㊀YAN K ,LYU H W ,GUO Y C ,et al.sAMPpred-GAT :Prediction of antimicrobial peptide by graph attention net-work and predicted peptide structure [J ].Bioinformatics ,2023,39(1):btac715.[10]FERRUZ N ,HÖCKER B.Controllable protein design withlanguage models [J ].Nature Machine Intelligence ,2022,4(6):521-532.[11]WANG G S ,LI X ,WANG Z.APD3:The antimicrobialpeptide database as a tool for research and education [J ].Nucleic Acids Research ,2016,44:D1087-D1093.[12]ZHAO X W ,WU H Y ,LU H R ,et MP :A databaselinking antimicrobial peptides [J ].PLoS ONE ,2013,8(6):e66557.[13]THOMAS S ,KARNIK S ,BARAI R S ,et al.CAMP :Auseful resource for research on antimicrobial peptides [J ].Nucleic Acids Research ,2010,38:D774-D780.[14]GOGOLADZE G ,GRIGOLAVA M ,VISHNEPOLSKY B ,et al.DBAASP :Database of antimicrobial activity andstructure of peptides [J ].FEMS Microbiology Letters ,2014,357(1):63-68.[15]KANG X Y ,DONG F Y ,SHI C ,et al.DRAMP 2.0,anupdated data repository of antimicrobial peptides [J ].Sci-entific Data ,2019,6:148.[16]JHONG J H ,CHI Y H ,LI W C ,et al.dbAMP :An inte-grated resource for exploring antimicrobial peptides with functional activities and physicochemical properties on transcriptome and proteome data [J ].Nucleic Acids Research ,2019,47:D285-D297.[17]FU L M ,NIU B F ,ZHU Z W ,et al.CD-HIT :Accelerated for clustering the next-generation sequencing data [J ].Bioinformatics ,2012,28(23):3150-3152.[18]ZHANG Y ,LIN J Y ,ZHAO L M ,et al.A novel antibacte-rial peptide recognition algorithm based on BERT [J ].Briefings in Bioinformatics ,2021,22(6):bbab200.[19]XU J ,LI F Y ,LEIER A ,et prehensive assessmentof machine learning-based methods for predicting antimi-crobial peptides [J ].Briefings in Bioinformatics ,2021,22㊃71㊃㊀2024年4月第39卷第2期㊀(5):bbab083.[20]ALLEY E C ,KHIMULYA G ,BISWAS S ,et al.Unifiedrational protein engineering with sequence-based deeprepresentation learning [J ].Nature Methods ,2019,16(12):1315-1322.[21]BRANDES N ,OFER D ,PELEG Y ,et al.ProteinBERT :Auniversal deep-learning model of protein sequence and function [J ].Bioinformatics ,2022,38(8):2102-2110.[22]HOCHREITER S ,SCHMIDHUBER J.Long short-termmemory [J ].Neural Computation ,1997,9(8):1735-1780.[23]YU Z X ,HUANG F ,ZHAO X H ,et al.Predicting drug-disease associations through layer attention graph convolu-tional network [J ].Briefings in Bioinformatics ,2021,22(4):bbaa243.Research on antimicrobial peptide prediction model based on deep learningand protein language modelWANG Xiao 1,2,WU Zhou 1,WANG Hongwei 3,WANG Rong 4,CHEN Haoran 11.College of Computer Science and Technology ,Zhengzhou University of Light Industry ,Zhengzhou 450001,China ;2.Henan Key Laboratory of Data Intelligence for Food Safety ,Zhengzhou 450001,China ;3.College of Food and Bioengineering ,Zhengzhou University of Light Industry ,Zhengzhou 450001,China ;4.College of Electronic Information ,Zhengzhou University of Light Industry ,Zhengzhou 450001,ChinaAbstract :In response to the need for improving prediction accuracy (ACC )in existing models for AntimicrobialPeptides (AMPs),a novel AMP prediction model called DeepGlap was proposed.This model utilized two proteinlanguage models for feature extraction from AMP sequences,followed by fusion of feature vectors.These fusedvectors were then input into a deep learning network composed of multiple layers of bidirectional long short-term memory networks (mBi-LSTM ),one-dimensional convolutional neural networks (1D-CNN ),and attentionmechanisms.The model underwent performance evaluation and optimization.Results indicated that the model achieved ACC ,the Pearson correlation coefficient (MCC ),and the area urder the curve (AUC )values of 0.739,0.489,and 0.81,respectively,demonstrating superior predictive performance compared to existing AMPprediction models.Key words :antimicrobial peptide;prediction model;foodborne pathogen;protein language model;deep learningnetwork㊀[责任编辑:杨晓娟]本刊数字网络传播声明本刊已许可中国知网,万方数据资源系统,维普网,国家科技学术期刊开放平台,博看网,超星,中国科技论文在线,中教数据库,长江文库,CABI,CA,AJ.VINITI,EBSCO host ,Ulrichs,FSTA 等在其系列数据库产品中以数字化方式复制㊁汇编㊁发行㊁信息网络传播本刊全文㊂其相关著作权使用费与本刊稿酬一并支付㊂作者向本刊提交文章发表的行为即视为同意我刊上述声明㊂㊃81㊃。
多孔介质孔隙结构的分形特征和网络模型研究共3篇多孔介质孔隙结构的分形特征和网络模型研究1多孔介质孔隙结构的分形特征和网络模型研究多孔介质在工业生产和天然资源开发中都扮演着极为重要的角色。
多孔介质内部的孔隙结构对于流体和固体之间的传递,吸附和反应等作用有着至关重要的影响。
因此,了解和研究孔隙结构的特性,从而提高多孔介质的应用效率具有重要意义。
本文主要介绍了多孔介质孔隙结构的分形特征以及基于网络模型的研究方法。
首先,让我们了解什么是多孔介质的分形特征。
分形是一种连续不光滑的几何形态,具有足够的自相似性质,其宏观形态与局部结构相似。
而多孔介质内部孔隙分布的复杂性和分形性质恰恰相符。
分形是描述多孔介质孔隙结构的一个有效方法。
孔隙大小分布,连接性和形态是影响多孔介质特性的主要因素。
多孔介质中孔隙的大小和形态具有分形特征,即孔隙大小的变化程度在统计意义下符合一定的分形规律。
分形维数可以用来描述不同孔隙大小在不同尺度上的分布情况,通常使用盒计数法或者是几何方法来计算。
其次,基于网络模型的研究方法为研究多孔介质的孔隙结构提供了新思路。
基于网络理论的多孔介质表示法是一种投射方法,可使用可重叠格孔隙网络来表示多孔介质的孔隙结构。
其中,节点表示孔隙,边表示孔隙之间的连通性。
节点和边的各种属性可以用来表示孔隙的大小、形态、连通性或者其他一些物理特性。
此外,基于网络模型的多孔介质表示法还可以用于计算多孔介质内流体的输运性质,并进行孔隙充填和增透等领域的研究。
通过分形分析和网络模型的研究方法,我们可以更好地认识多孔介质的孔隙结构特征。
这些特征与多孔介质的应用联系密切。
例如,在油藏勘探中,孔隙结构的分形维数可以用来计算孔隙的置换和剩余油的分布情况。
在环境污染调查方面,孔隙结构的分形特征可以用来分析污染物在土壤中分布的情况以及如何选择土壤修复的最佳方法。
在工业生产方面,利用网络模型的多孔介质表示法,可以对多孔材料的物理性质进行准确的预测和设计,从而优化生产流程,提高生产效率。
多智能体系统下的协作机制及其应用随着科技的不断发展和智能化的加速推进,人们对多智能体系统的研究越来越深入。
多智能体系统是指由多个具有智能的实体组成的系统,它们在不同的时间和空间内相互作用和协作,完成一定的任务或达成某些目标。
多智能体系统的活跃在实际生产和社会生活中广泛应用,如制造商业、物流管理、无人机等领域。
本文将详细介绍多智能体系统下的协作机制及其应用。
1. 多智能体系统下的协作机制在多智能体系统中,各个智能体之间的协作关系是机制的核心,它们的合作能力将直接影响整个系统的性能和效率。
常见的多智能体系统协作机制包括:协作竞争、协作训练、信息共享、分工合作等。
以下将逐一介绍。
协作竞争:这种机制是指让多个智能体之间进行竞争,以达到系统的最优性能,适用于多智能体系统中的资源共享和分配问题。
其中,非合作博弈和合作博弈是协作竞争的两种形式。
非合作博弈是指每个智能体都只考虑自身的利益,而不考虑其他智能体的利益,互相之间可能存在敌对行为。
而合作博弈则强调多个智能体之间的合作与协调,以达到共同最优解。
协作训练:这种机制是指将多个智能体的智能行为通过协作学习的方式相互提高,从而达到更好的系统性能。
这种机制适用于需要人工干预设计和手动调整参数的任务,例如强化学习和神经网络。
信息共享:这种机制是指多个智能体之间交换信息,以提高各自的知识储备和理解,从而达到更好的行动协调。
这种机制适用于需要共同决策的任务,例如决策网络和智能社会。
分工合作:这种机制是指各个智能体根据自身的能力和身份分工合作,互相协助完成任务。
这种机制适用于分形任务或需要协同工作的任务,例如拥挤环境下的机器人控制和多智能体的协同搜索。
2. 多智能体系统下的应用案例多智能体系统在许多领域中都有广泛的应用,尤其是在制造业、商业物流和航空物流中,它为实现高效自动化提供了新的可能。
以下将介绍几个多智能体系统的应用案例。
制造业:多智能体系统在制造业的应用中主要包括生产线的自动化和智能化。
网络拓扑知识:分形网络拓扑的应用网络拓扑知识在当今计算机领域中非常重要,其为构建高效、稳定和可扩展的网络提供了重要的帮助。
在多年的发展过程中,网络拓扑结构也出现了不同的类型,其中分形网络拓扑成为近年来备受关注的网络拓扑结构之一。
分形是一种特殊的几何形状,它具有自相似性和无限性等特点,因此在网络拓扑中应用分形结构,可以为网络的设计和优化提供更多的思路与灵感,从而实现更高效、可靠的数据传输。
在此基础上,本文将详细讨论分形网络拓扑的应用以及其中涉及的一些关键技术。
一、分形网络拓扑的基本概念分形网络拓扑是指将分形的构造思想应用于网络拓扑结构,以实现更高效、可靠的数据传输。
在分形网络拓扑中,网络节点和连接线采用类似分形的自相似性特点,在整个网络结构上迭代和扩展,形成一种分形特有的网络结构。
由于其自相似性和很好的可扩展性,分形网络拓扑适用于多种应用场景,如数据中心网络、互联网等。
分形网络拓扑中,节点和连接线的构造过程有以下三个关键阶段:1.初始阶段:从一个中央节点开始,并在周围不断添加新的节点;2.分裂阶段:节点会不断分裂出新的子节点,并建立相应的连接;3.再生阶段:每个子节点都会按照同样的方式重新进行分裂,并继续扩展网络规模。
通过这种分裂和再生的过程,最终形成具有自相似性和无限性的分形网络结构。
二、分形网络拓扑的应用分形网络拓扑被广泛应用于数据中心网络和互联网等领域,主要原因是其具有以下几个特点:1.自相似性:分形网络具有自相似性,即整个网络结构可以分为若干个相似的子结构,在扩展网络规模时,可以重复使用相同的设计模式,从而使整个网络结构更加简单和易于部署。
2.压缩性和负载平衡性:分形网络在网络规模不断扩大的过程中,连接线的数量会不断减少,从而使其具有更好的压缩性和负载平衡性,能够应付高峰时期的数据传输需求。
3.可扩展性:分形网络能够根据需求进行适当的扩展,从而满足对网络带宽、延迟等方面的需求,同时还能够实现更加高效的数据传输。
分形理论及其在生命科学中的应用摘要:从微观到宏观,生命现象在各个层次都呈现出分形的现象。
分形理论已经广泛应有于生命科学的领域中。
本文主要对分形、及其维数的概念进行介绍,对生物学中分形理论的应用进行综述,同时对在生命科学领域中应用分析理论的前景进行分析和展望。
关键词:生命科学;分形理论;分形维数生物系统以及其过程是非常典型的复杂系统,有随机性、自相似性、自组织性、突变性、多尺度性、非平衡性、非线性等多种属性,因而就需要使用专门进行定量非线性研究的方法来对其特有的规律进行认识。
分形理论被称为大自然的几何学,是现代数学中的新的一个分支,属于三大非线性科学其中之一的内容,在非线性问题的解决中有着重要的作用。
在分形理论提出以来,已经广泛的探索并应用于很多的领域中,在生物学领域的应用已经有近三十年的历史,对定量分析和理解生物系统的机制和机理有着重要的帮助,为研究生物学的过程中加入了更多的活力,对生物学新分支的——生物分形学的诞生具有促进作用。
一、分形理论1.概念分形的概念是在海岸线测量的研究中最早出现的,针对不规则的海岸线图形,如果测量尺度选择的不同,就会导致测量结果相差很大,而且细小的位置也不能得到测量。
这类不规则的形状具有大尺度和小尺度相似的特点,同时在进行无限细分之后还是有这样的自相似性,就被称为分形。
分形有无规分形以及有规分形两各类别。
同时其具有标度不变以及自相似性两个基本性质。
标度不变是指任选分形上的一个局域,将它放大,能够得到和原图形相同的特征形态。
自相似性是指某种过程或者结构在不同的时间尺度或者空间尺度来看都是相似的,或者某种结构或系统的局部结构或者局部的性质是相似的,同时,部分和部分之间或者整体和整体之间也具有自相似的特性。
2.分形維数分形维数是对分形进行定量描述的一个重要参数,其能够实现分形体复杂程度的表征。
分形维数能够是整数值,也能够是分数值,同时其有多种的计算以及定义的方法,例如广义维数、信息维数、相似维数、关联维数、盒维数等。
复杂网络研究及其意义*吴彤近年来,学界关于复杂网络的研究正方兴未艾。
特别是, 国际上有两项开创性工作掀起了一股不小的研究复杂网络的热潮。
一是1998 年Watts 和Strogatz在Nature杂志上发表文章,引入了小世界(Small-World) 网络模型,以描述从完全规则网络到完全随机网络的转变。
小世界网络既具有与规则网络类似的聚类特性, 又具有与随机网络类似的较小的平均路径长度。
(Watts & Strogatz,p.440-442)二是1999 年Barabasi 和Albert 在Science上发表文章指出,许多实际的复杂网络的连接度分布具有幂律形式。
由于幂律分布没有明显的特征长度, 该类网络又被称为无标度(Scale-Free) 网络。
(Barabasi & Albert,p.509-512)而后科学家们又研究了各种复杂网络的各种特性。
(Strogatz,p.268-276) 国内学界也已经注意到了这种趋势,并且也开始展开研究。
(吴金闪、狄增如,第18-46页)加入复杂网络研究的学者主要来自图论、统计物理学、计算机网络研究、生态学、社会学以及经济学等领域,研究所涉及的网络主要有:生命科学领域的各种网络(如细胞网络、蛋白质-蛋白质作用网络、蛋白质折叠网络、神经网络、生态网络)、Internet/WWW网络、社会网络,包括流行性疾病的传播网络、科学家合作网络、人类性关系网络、语言学网络,等等;所使用的主要方法是数学上的图论、物理学中的统计物理学方法和社会网络分析方法。
本文首先介绍这一研究的发展,并在此基础上论述这类研究的重要的科学和哲学意义。
一、复杂网络研究:小世界、无标度和幂律现象在当前的复杂网络研究中,研究者提出的最主要概念就是“网络”(networks)。
实际上早在1922年,社会学家斯梅尔(G. Simmel)就曾不经意地创造了该词汇,未曾料想到这个词汇会在社会学领域中使用极为频繁,并且成为社会网络分析方法的主导词汇;更没有想到的是,在今天的自然科学中,网络研究也成为重要课题;今天的社会已经成为网络社会。