二型糖尿病肾病风险预测模型的比较
- 格式:pdf
- 大小:884.35 KB
- 文档页数:5
基于人工智能预测糖尿病肾病预后模型的建立摘要:糖尿病肾病是糖尿病并发症的一种。
由于其发病率高、复杂、多样化,糖尿病肾病的病人数量快速增长。
传统的临床预后评估方法已经不能满足现代医学需求,亟需一种新的方法来预测糖尿病肾病患者的预后状况。
本文提出一种基于人工智能的预测模型,利用机器学习算法来建立预测模型,并在临床实践中进行验证。
结果表明,该模型能够高度准确地预测糖尿病肾病的预后,并为医生提供决策支持。
关键词:糖尿病肾病;预后;人工智能;机器学习;预测模型一、引言糖尿病是全球范围内最常见的慢性代谢疾病之一,其患病率和死亡率一直处于高位,直接损害人体的各个组织和器官,导致许多并发症。
糖尿病肾病就是其中的一种常见并发症之一,是由于糖尿病导致肾功能异常所引起的一系列疾病。
随着糖尿病患病人数的迅速增长,糖尿病肾病的患者数量也在快速增加,给临床医生带来了很大的挑战。
传统的糖尿病肾病预后评估方法主要是基于病人的临床资料和医生的经验,缺乏科学性和客观性,且存在人为因素干扰,导致结果不够准确。
因此,开发一种新的、能够全面评估糖尿病肾病患者预后情况的方法尤为重要。
二、相关研究在糖尿病肾病的预后评估方面,一些研究者已经开发了一些基于人工智能的方法。
比如,Pugia et al.使用逻辑回归模型来预测肾脏替代治疗的比例;Kim et al.则开发了一个基于神经网络的模型来预测糖尿病肾病的预后,并证明其预测能力优于传统的临床评估方法。
然而,这些研究中的方法和模型存在一些局限性,有些只考虑了少数预测因素,而有些则只采用了传统的机器学习算法。
三、本文方法基于上述研究,本研究提出了一种新的方法来预测糖尿病肾病的预后,该方法基于人工智能和机器学习算法,并结合大量的临床资料。
具体地说,本研究采用了支持向量机算法(SVM)来建立预测模型,并利用大量的数据集来验证该模型。
数据集采用了美国国家医疗信息技术研究所提供的大规模糖尿病肾病数据库。
肾小管脂滴包被蛋白2在预测糖尿病肾脏病进展中的作用及机制沈蕊;于心;石彩凤;秦松言;方奕;何爱琴;吴小梅;杨俊伟;周阳【期刊名称】《中国病理生理杂志》【年(卷),期】2024(40)5【摘要】目的:探讨肾小管上皮细胞中脂滴包被蛋白2(PLIN2)的表达变化能否预测糖尿病肾脏病(DKD)肾功能的减退,以及PLIN2促进DKD肾小管上皮细胞损伤的机制。
方法:采用回顾性队列研究,选择12例非糖尿病患者(作为对照)和51例DKD 患者为研究对象,收集人口学及实验室检查等资料。
采用简化线性混合效应模型获得估算的肾小球滤过率(eGFR)斜率,Spearsman相关分析和广义线性模型预测PLIN2与DKD患者肾功能减退的关系。
体内实验采用BKS-db/db小鼠和链脲佐菌素构建的糖尿病小鼠模型。
体外实验采用葡萄糖处理原代肾小管上皮细胞,转染PLIN2 siRNA或过表达质粒。
蛋白免疫印迹和免疫荧光染色检测PLIN2表达,油红染色检测脂滴蓄积,细胞实时能量代谢分析仪检测线粒体氧消耗率(OCR)。
结果:DKD患者肾小管中的PLIN2表达水平较对照显著升高。
随访24 (12,39)个月,DKD患者的eGFR斜率为-7.42(-19.77,-2.09) mL/(min·1.73 m^(2)·year)。
基线时肾小管PLIN2阳性面积百分比的增大与随访期内eGFR斜率的变化显著相关[风险比(HR)=1.90,95%置信区间(CI):1.00~3.58],提示肾小管PLIN2预测DKD肾功能减退的价值。
糖尿病小鼠模型肾小管中的脂滴和PLIN2表达均较对照组显著增多,葡萄糖处理造成肾小管上皮细胞中脂滴蓄积和PLIN2表达增多。
干扰PLIN2显著缓解葡萄糖引起的脂滴蓄积;反之,过表达PLIN2加重葡萄糖引起的脂滴蓄积。
葡萄糖处理造成肾小管上皮细胞线粒体OCR的下降在干扰PLIN2后得到缓解;然而,过表达PLIN2直接造成线粒体OCR降低。
文章编号:1673-8640(2021)03-0281-04 中图分类号:R446.1 文献标志码:A DOI:10.3969/j.issn.1673-8640.2021.03.010血清NGAL和Cys C联合检测在诊断2型糖尿病早期肾损伤中的价值朱庆华,王伟伟,邹广慧,董志武(上海市第六人民医院金山分院检验科,上海 201599)摘要:目的探讨血清中性粒细胞明胶酶相关脂质运载蛋白(NGAL)与胱抑素C(Cys C)联合检测在诊断2型糖尿病早期肾损伤中的作用。
方法选取2型糖尿病患者95例,根据24 h尿蛋白排泄率(UAER)分为正常白蛋白尿(NA)组(29例,UAER<30 mg/24 h)、微量白蛋白尿(MA)组(33例,UAER为30~<300 mg/24 h)和临床白蛋白尿(CA)组(33例,UAER>300 mg/24 h)。
以78名体检健康者作为正常对照组。
检测所有对象的血清尿素、肌酐(Cr)、尿酸(UA)、NGAL、Cys C水平及尿α1-微球蛋白(α1-MG)水平,采用受试者工作特征(ROC)曲线评价各项指标诊断2型糖尿病早期肾损伤的价值。
结果 MA组和CA组血清尿素、Cr、UA、NGAL、Cys C水平及尿α1-MG水平均高于NA组和正常对照组(P<0.05)。
MA组与CA组之间、NA组与正常对照组之间各项指标差异均无统计学意义(P>0.05)。
ROC曲线分析结果显示,血清尿素、Cr、UA、NGAL、Cys C及尿α1-MG单项检测诊断2型糖尿病早期肾损伤的曲线下面积(AUC)分别为0.649、0.713、0.632、0.795、0.869和0.660,NGAL与Cys C联合检测诊断2型糖尿病早期肾损伤的AUC为0.881。
NGAL与Cys C联合检测的AUC高于各项指标单项检测的AUC(P<0.000 1)。
结论血清NGAL和CysC在2型糖尿病早期肾损伤的诊断中有重要价值,是理想的筛查指标。
TNF-α、IL-1β、HOMA-IR水平变化与2型糖尿病发病相关性分析及作用机制研究迟鹏威【摘要】目的观察2型糖尿病患者的TNF-α、IL-1β、HOMA-IR水平变化,并分析其临床意义.方法选取2016年2月-2017年5月在我院接受治疗的2型糖尿病患者为研究对象,同时选取同期在我院接受体检的健康成年人作为对照.观察两组研究对象TNF-α、IL-1β、HOMA-IR水平、血糖、血脂、氧化应激指标的差异,分析2型糖尿病患者TNF-α、IL-1β、HOMA-IR水平变化与血糖、血脂、氧化应激指标的相关性.结果观察组患者的血清TNF-α、IL-1β、HOMA-IR水平均高于对照组(t=-14.101、-14.747、-6.878,P<0.001);观察组患者的TC、LDL-C、TG和空腹血糖水平均高于对照组,HDL-C水平低于对照组;观察组患者的NO、NOS、SOD水平低于对照组,MDA水平高于对照组;2型糖尿病患者的TNF-α、IL-1β、HOMA-IR水平与TC、LDL-C、TG、空腹血糖、MDA水平正相关,与HDL-C、NO、NOS、SOD水平负相关.结论 2型糖尿病患者的TNF-α、IL-1β、HOMA-IR 水平较高,且与患者的血糖、血脂和氧化应激指标密切相关,可作为患者临床监测的重要指标.【期刊名称】《实验与检验医学》【年(卷),期】2018(036)004【总页数】4页(P596-598,608)【关键词】糖尿病;炎症因子;氧化应激;血脂【作者】迟鹏威【作者单位】许昌市人民医院,河南许昌 461000【正文语种】中文【中图分类】R446.11+2;R587.12 型糖尿病 (type 2 diabetes mellitus,T2DM)的病情持续性进展,可以导致患者心血管系统、肝肾功能等组织器官的功能衰竭,促进病死率及致残率的上升。
流行病学研究显示,T2DM的发病率可达223~345/1万人左右,在具有肥胖症或者高血压等基础性疾病的人群中,T2DM的发病率可进一步上升[1,2]。
DOI:10.16658/ki.1672-4062.2023.23.0242型糖尿病患者对疾病进展的恐惧状况探讨及影响因素分析姚春红1,2,王敏1,杨丽11.青岛大学护理学院,山东青岛266000;2.康复大学青岛医院(青岛市市立医院)内分泌科,山东青岛266000[摘要]目的调查2型糖尿病患者对疾病进展的恐惧(fear of progression, FoP)状况并探讨其影响因素。
方法采用方便抽样,选取2021年9月—2023年3月青岛市市立医院内分泌科住院的375例2型糖尿病患者为研究对象,应用一般资料调查表、社会支持量表、恐惧疾病进展简化量表、简易疾病感知量表进行调查。
结果2型糖尿病患者恐惧疾病进展简化量表得分为(32.73±9.77)分,处于中度水平,心理失调(FoP≥34分)的患者比例为46.1%。
多重线性回归分析结果表明,疾病感知、医疗负担情况、治疗方式种类、健康信息来源、客观支持、并发症数量是2型糖尿病患者恐惧疾病进展的影响因素(P<0.05),能解释2型糖尿病患者疾病进展恐惧心理35.7%的变异度。
结论对于2型糖尿病患者,临床医护人员应重视患者的恐惧心理状态,通过关注患者疾病感知等预测因子,适度调控患者对疾病进展的恐惧状况,更大发挥其心理内驱力作用,降低产生心理失调患者的恐惧水平。
[关键词] 2型糖尿病;恐惧疾病进展;影响因素[中图分类号] R59 [文献标识码] A [文章编号] 1672-4062(2023)12(a)-0024-05Exploration of Fear of Disease Progression in Type 2 Diabetes Mellitus Pa⁃tients and Analysis of Influencing FactorsYAO Chunhong1,2, WANG Min1, YANG Li11.College of Nursing, Qingdao University, Qingdao, Shandong Province, 266000 China;2.Department of Endocrinol‐ogy, Qingdao Hospital, University of Health and Rehabilitation Sciences (Qingdao Municipal Hospital), Qingdao, Shan‐dong Province, 266000 China[Abstract] Objective To investigate the Fear of Progression (FoP) status of type 2 diabetes mellitus patients and ex‐plore its influencing factors. Methods Using convenience sampling, 375 cases of type 2 diabetes mellitus patients hos‐pitalized in the Department of Endocrinology of Qingdao Municipal Hospital were investigated from September 2021 to March 2023 as the research object with the application of the General Information Questionnaire, Social Support Scale, Fear of Progression Simplified Scale, and Simple Disease Perception Scale. Results The FoP-Q-SF score of type 2 diabetes mellitus patients was (32.73±9.77) points, which was at a moderate level, and the proportion of pa‐tients with psychological disorders (FoP≥34) was 46.1%. The results of multiple linear regression analysis showed that disease perception, healthcare burden situation, type of treatment, source of health information, objective support, and number of complications were the factors influencing the fear of disease progression in patients with type 2 diabetes mellitus (P<0.05), which explains 35.7% of the variation in the fear of disease progression in patients with type 2 dia‐betes mellitus.Conclusion For patients with type 2 diabetes mellitus, clinical staff should pay attention to the pa‐tients' fear psychological state, by paying attention to the patients' disease perception and other predictive factors, moderately regulate the patients' fear of disease progression, play a greater role in their psychological internal drive, and reduce the level of fear in patients with psychological disorders.[Key words] Type 2 diabetes mellitus; Fear of disease progression; Influencing factors[作者简介]姚春红(1981-),女,硕士在读,副主任护师,研究方向为糖尿病健康管理。
outcomes of two randomized controlled trials. Scand J Med Sci Sports, 2020, 30(2): 339-348.[32] Korzeniowska-Kubacka I, Bilińska M,Piotrowska D, et al. Impact of exercise-based cardiac rehabilitation on attitude to the therapy, aims in life and professional work in patients after myocardial infarction. Med Pr, 2019,70(1):1-7.[33] O' Brien L, Wallace S, Romero L. Effect ofPsychosocial and vocational interventions on return-to-work rates post-acute myocardial infarction: a systematic review. J Cardiopulm Rehabil Prev, 2018,38(4):215-223.[34] Muschalla B, Linden M, Jöbges M. Work-anxiety and sickness absence after a short inpatient cognitive behavioral group intervention in comparison to a recreational group meeting. J Occup Environ Med, 2016, 58(4):398-406.[35] Petrie KJ, Cameron LD, Ellis CJ, et al.Changing illness perceptions after myocardial infarction: an early intervention randomized controlled trial. Psychosom Med, 2002,64(4):580-586.[36] 张蒙,杨辉,王易欣,等.首发急性心肌梗死病人疾病知识掌握现状及影响因素分析.护理研究,2020,34(13):2375-2379.[37] 杜若飞,王盼盼,陈长英.重返工作后心肌梗死患者健康需求及影响因素研究. 中国全科医学,2019,22(5):586-590.[38] Broadbent E, Ellis CJ, Thomas J, et al. Further development of an illness perceptionintervention for myocardial infarction patients: a randomized controlled trial. J Psychosom Res, 2009, 67(1):17-23.[39] Figueiras MJ, Maroco J, Monteiro R, et al.Randomized controlled trial of anintervention to change cardiac misconce-ptions in myocardial infarction patients.Psychol Health Med, 2017,22(3):255-265.[40] Bitsch BL, Nielsen CV , Stapelfeldt CM, et al.Effect of the patient education-learning and coping strategies-in cardiac rehabilitation on return to work at one year: a randomised controlled trial show (LC-REHAB). BMC Cardiovasc Disord, 2018,18(1):1-9.[41] Dennis C, Houston-Miller N, SchwartzRG, et al. Early return to work after uncomplicated myocardial infarction. Results of a randomized trial. JAMA, 1988, 260(2):214-220.[42] Hegewald J, Wegewitz UE, Euler U, et al.Interventions to support return to work for people with coronary heart disease. Cochrane Database Syst Rev, 2019, 3(3): CD010748.[收稿日期:2020-10-29][修回日期:2021-01-17](编辑:郑中燕 英文编辑:邵文利)基金项目:2019年度重庆市技术创新与应用发展专项面上项目(cstc2019jscx-msxmX0201)作者单位:重庆医科大学附属第二医院内分泌科,400010 重庆市(左丹,赵锡丽,刘莉,代旭丽);护理部(杨睿琦)作者简介:左丹,本科,护师通信作者:赵锡丽,本科,副主任护师,护士长,E-mail:*****************[摘 要] 本文从国内外2型糖尿病患者低血糖风险预测模型的研究现状及进展等方面展开综述,旨在为我国后期构建本土化、实用型低血糖风险预测模型提供理论依据。
林 鑫,李 晋,刘 蕾,等.二型糖尿病肾病风险预测模型的比较[J].中华医学图书情报杂志,2019,28(4):41-45.DOI:10.3969/j.issn.1671-3982.2019.04.007㊃情报研究与方法㊃二型糖尿病肾病风险预测模型的比较林 鑫1,李 晋2,刘 蕾3,梁 晨1,任慧玲1[摘要]目的:选择相应的机器学习算法构建二型糖尿病肾病风险预测模型,为疾病的早期预防提供科学依据㊂方法:基于解放军总医院提供的糖尿病数据集,通过对缺失值㊁异常值等进行一系列预处理,得到894条二型糖尿病患者数据㊂利用单因素逻辑回归筛选出24个有效检查指标作为特征,并基于随机森林㊁BP 神经网络㊁支持向量机分别构建二型糖尿病肾病风险预测模型,同时对其查准率㊁召回率进行对比,以验证其应用性能㊂结果:随机森林预测模型的总体性能最优,3种算法的训练效果均较好㊂结论:二型糖尿病肾病风险预测模型能为疾病早期预防控制提供参考依据㊂[关键词]二型糖尿病肾病;风险预测模型;随机森林;BP 神经网络;支持向量机[中图分类号]R587.2 [文献标志码]A [文章编号]1671-3982(2019)04-0041-05Risk prediction models of type 2diabetic nephropathyLIN Xin 1,LI Jin 2,LIU Lei 3,LIANG Chen 1,REN Hui -ling 1(1.Institute of Medical Information,Chinese Academy of Medical Sciences /Beijing Union Medical College,Beijing100020,China;2.Qinghua University,Beijing 100086,China;3.Affiliated Dongzhimen Hospital of Beijing Uni⁃versity of Traditional Chinese Medicine,Beijing 100700,China)Corresponding author:REN Hui-ling[基金项目]中国医学科学院医学与健康科技创新工程项目中文临床医学术语系统构建研究”(2017-I2M-3-014);国家自然科学基金项目 基于自然语言处理的内分泌常用药物不良反应监测数据库的构建”(NSFC91846106)[作者单位]1.中国医学科学院/北京协和医学院医学信息研究所,北京 100020;2.清华大学,北京 100086;3.北京中医药大学东直门医院,北京 100700[作者简介]林 鑫(1995-),女,山东烟台人,在读硕士研究生,研究方向为情报学㊂[通讯作者]任慧玲(1971-),女,河南周口人,硕士,研究馆员,研究生导师,研究方向为知识组织㊂E-mail:ren.huiling@[Abstract ]Objective To provide the scientific evidence for the risk prediction models of type 2diabetic nephropathy established by different machine learning algorithms for the early prevention of diseases.Methods Eight hundred and ninety-four data of type 2diabetic patients were obtained by preprocessing the missing and abnormal valuesbased on the diabetic data set provided by the Chinese PLA General Hospital.Twenty-four effective examination indicators screened from the 894data by univariate logistic regression analysis were used as the characteristic indi⁃cators.Three risk prediction models of type 2diabetic nephropathy were established using the random forest algo⁃rithm,BP neural network algorithm and support vector machine algorithm respectively.Their precision ratio and re⁃call ratio were compared to verify their applicability.Results The overall performance of the risk prediction model of type 2diabetic nephropathy established by random forest algorithm was the better than that of those established by BPneural network algorithm and support vector machine algo⁃rithm.The training effect of the three algorithms was good.Conclusion The three risk prediction models of type 2dia⁃betic nephropathy can provide reference and evidence for the early prevention of diseases.[Key words ]Type 2diabetic nephropathy;Risk prediction model;Random forest;BP neural network;Support vectormachine 随着人口老龄化和人们生活方式的转变,糖尿病患病率呈直线上升趋势,目前我国已成为全球糖尿病第一大国[1-2]㊂其中,二型糖尿病患者作为我国糖尿病人群的主体,其临床发病率呈逐步上升趋势,其并发症发生率也相对较高㊂目前我国大约有20%~40%二型糖尿病患者并发肾病,现已成为慢性肾脏病和终末期肾病的重要原因[3]㊂二型糖尿病肾病的临床特征主要以蛋白尿排泄异常为主,严重时常合并肾功能衰竭,一旦发展至终末期,将会比其他肾脏疾病的治疗更加棘手[4]㊂因此有效的早期预测及相关的风险预测模型研究对于二型糖尿病肾病的早期预防和降低并发率具有重要的意义㊂目前临床上对糖尿病肾病进行诊断的依据主要包括实验室检查㊁病理学诊断㊁糖尿病视网膜病变等,诊断过程繁琐且耗时[5]㊂本文以二型糖尿病肾病风险预测为目的,对解放军总医院提供的糖尿病数据集进行预处理后,依据数据集中已有的各项临床检查指标,选用随机森林㊁BP神经网络㊁支持向量机3种较为成熟的算法建立风险预测模型,并利用查准率㊁召回率等指标对三种模型的性能进行比较,以选出在二型糖尿病肾病风险预测方面更具优势的算法,实现对二型糖尿病肾病的发生风险进行简便快捷的预测㊂1 数据与方法1.1 数据来源本文数据来自国家人口与健康科学数据共享服务平台临床医学科学数据中心(中国人民解放军总医院)提供的2009-2010年糖尿病数据集[6]㊂该数据集包含诊断表㊁尿常规检查表㊁生化检查表等记录了患者的ID号㊁诊断结果㊁各项身体指征,以及包括尿白细胞㊁直接胆红素㊁血清白蛋白等在内的多项检查结果㊂每个表通过患者的唯一ID号进行关联,并对检查表中各项检查的正常值进行了说明㊂1.2 数据预处理由于原始数据被分为多个表格,且存在缺失值㊁异常值等噪声数据,故需要对原始数据进行预处理,以控制数据的完整性和准确性,保证结果的准确性㊂本文所做预处理步骤如下㊂数据整合:由于原始数据被划分为诊断㊁尿常规和生化等多个表格,故首先依据诊断表中的信息筛选出单纯二型糖尿病及二型糖尿病并发肾病的记录,依据这些记录对应的患者ID以及诊断时间从诊断㊁尿常规㊁生化检查等表格中提取距离诊断时间最近的一次患者检查信息,利用Excel的lookup和min 函数对诊断㊁尿常规和生化等多个表格中的检查数据进行整合㊂缺失值处理:数据的缺失会增加分析过程的难度,造成分析结果的偏倚,降低结果的准确性㊂由于均值插补法计算量相对较小,可高效快速地对缺失值进行处理[7],对整合后的数据进行整理,然后分别求各列数据平均值后对空缺数据进行填补㊂异常值处理:在处理异常值时,利用拉依达准则[8],即以给定的置信概率99.7%为标准,以3倍数据列标准差为依据,凡大于3倍标准差的误差则认为是粗大误差,即异常值,删除筛选出的异常值㊂经过对数据集的预处理,共得到472条二型糖尿病并发肾病数据和422条单纯二型糖尿病数据㊂经过预处理后得到的数据集部分截图如图1所示㊂图1 预处理后的数据截图(部分)2 风险预测模型构建2.1 单因素逻辑回归分析将整合各检查表得到38个检查指标,赋值后,利用SPSS19.0进行单因素逻辑回归分析㊂部分赋值情况见表1㊂最终筛选出24个具有统计学意义的指标(P<0.05),分别为年龄㊁尿比重㊁尿胆原㊁尿红细胞㊁尿糖㊁尿液结晶㊁尿液颜色㊁尿蛋白㊁总蛋白㊁血清白蛋白㊁总胆红素㊁直接胆红素㊁尿素㊁谷氨酰基转移酶㊁肌酐㊁葡萄糖㊁血清尿酸㊁总胆固醇㊁肌酸激酶㊁乳酸脱氢酶㊁钙㊁钾㊁氯化物以及无机磷㊂表1 数据集字段赋值对应表(部分)数据集字段名变量名 赋值详情诊断结果Diagnose单纯二型糖尿病=0;二型糖尿病并发肾病=1性别Sex女=0;男=1年龄Age18~40=1;41~65=2;≥66=3尿浊度UT清亮=1;微混=2;微浊=3;混浊=4尿酮体试验UABT阴性=0;阳性=1尿白细胞NWBC正常(0~40)=0;异常(≥40)=1尿比重测定SG正常(1.015~1.025)=0;异常(≥1.025or<1.025)=1尿蛋白定性试验PRO阴性=0;阳性=1肌酸激酶CK正常(2~200)=0;异常(≥200or<2)=1乳酸脱氢酶LDH正常(40~250)=0;异常(≥250or<40)=12.2 模型算法选择及参数设置在明确具有统计学意义的检查指标后,运用机器学习中的监督学习方法构建疾病风险预测模型㊂其中,随机选择数据集的70%(共626条)作为训练集,30%(共268条)作为测试集㊂结合不同算法特点选择的机器学习算法及相应的参数设置如下㊂随机森林(Random Forest,RF)是一种基于集成学习的思想将多棵决策树进行组合从而对数据进行分类的机器学习算法[9]㊂最后的分类结果是由所有决策树进行投票来决定的,其分类结果比C5.0决策树模型更加精确,且具有更少的过拟合倾向[10]㊂本文利用R语言中的RandomForest函数进行模型构建,由于随机森林对参数并不敏感,因此使用默认参数㊂BP神经网络是一种按照误差逆传播算法训练的多层前馈网络,由输入层㊁隐藏层和输出层组成,是目前应用最为广泛的神经网络模型之一[11]㊂该模型对自变量的要求比较低,可以是离散型,也可以是连续型㊂在BP神经网络模型的构建中,加载R 语言中的nnet包,利用nnet建立BP神经网络模型㊂设定神经网络的输入节点数为24,输出节点数为1,权值的衰减参数为0.05,通过不断试验改变隐藏节点个数,不断优化神经网络模型,最终在中间隐藏节点数为10时,模型效果达到最优㊂支持向量机(Support Vector Machine,SVM)是基于统计学习理论㊁VC维理论以及结构风险最小化原理的一种机器学习方法[12],在小样本㊁非线性以及高维模式下具有很大优势[13]㊂运用SVM算法对数据进行处理时,利用R语言中的ksvm函数和高斯RBF核函数,对数据进行训练和预测㊂2.3 模型预测结果利用R语言中相关函数包分别建立随机森林㊁BP神经网络和支持向量机3种风险预测模型,并依据7:3的比例将数据集随机划分为训练集和测试集,分别用于训练和对二型糖尿病并发肾病的预测㊂3种模型对于二型糖尿病并发肾病及单纯二型糖尿病的预测结果如表2至表4所示㊂表2 随机森林预测结果结果类型 二型糖尿病并发肾病/例单纯二型糖尿病/例实际结果 152116正确预测结果136108全部预测结果144124表3 BP神经网络预测结果结果类型 二型糖尿病并发肾病/例单纯二型糖尿病/例实际结果 166102正确预测结果12878全部预测结果152116表4 支持向量机预测结果结果类型 二型糖尿病并发肾病/例单纯二型糖尿病/例实际结果 140128正确预测结果104124全部预测结果1081603 模型性能评价与比较3.1 模型评价指标本文选择查准率(Precision)㊁召回率(Recall)㊁正确率以及F1值等4个度量值对各个模型的性能进行评价,以检测模型预测结果与真实结果之间的差异,为模型的选择提供依据㊂其中,查准率越高,算法的敏感性就越高;召回率越高,算法的特异性就越高;正确率越高,算法的精确度越好;而F1度量值越高则可确保召回率和查准率都越高,算法的总体性能越好[14-15]㊂这4个度量值的公式如下㊂查准率=算法正确预测的患者数量预测为此类别的患者数量召回率=算法正确预测的患者数量实际为此类别的患者数量正确率=算法正确预测的患者数量测试样本中患者总数F1=2×查准率×召回率查准率+召回率除此之外,本文还引入ROC曲线对模型进行评估㊂在ROC曲线中,横轴为假阳性率,纵轴为真阳性率[16],ROC曲线下面积在0.5~0.7之间的准确度较低,在0.7~0.9之间的准确度一般,在0.9以上的准确度较高,小于0.5则不符合真实情况[17]㊂3.2 模型比较结果依据预测结果及R语言的ROCR包,分别计算这3种算法的查准率㊁召回率㊁正确率㊁F1及ROC 曲线下面积㊂结果如表5所示㊂由表5可知,对于ROC曲线下面积,随机森林效果最优;对于正确率,随机森林效果最优;对于查准率,支持向量机效果最优;对于召回率,随机森林效果最优㊂但由于查准率和召回率是一组此消彼长的评价指标,仅用单个指标无法对算法的效果进行总体评价[14]㊂因此可以用F1值对这3种算法的综合性能进行评价,其结果为:随机森林>支持向量机>BP神经网络㊂综合上述指标来看,随机森林性能最优,这3种算法的训练效果均较好㊂表5 3种算法的结果 算法查准率/%召回率/%F1正确率/%ROC曲线下面积随机森林94.4489.470.918991.040.9129 BP神经网络84.2177.110.805076.860.8949支持向量机96.2974.290.838785.070.85584 讨论由于糖尿病肾病是二型糖尿病患者常见的并发症,目前国内外针对二型糖尿病肾病风险预测模型的建模已有相关尝试,常用的建模方法主要包括逻辑回归㊁分类与决策树模型㊁支持向量机㊁神经网络模型等[18]㊂本文在综合前人研究成果的基础上,结合不同算法的特点及优缺点,充分考虑所选数据集的实际记录情况,最终选取随机森林㊁BP神经网络以及支持向量机这3种机器学习算法,并综合多种指标验证其应用于二型糖尿病肾病风险预测时的性能,为算法的选择提供依据㊂本文结合单因素逻辑回归进行指标筛选,再选择相关算法建立预测模型的方法具有普适性,其不仅可用于对二型糖尿病其他并发症进行预测,也可用于其他疾病的风险预测㊂本文也存在局限性㊂考虑到数据集的数量和质量对模型的可靠性和可扩展性具有重要影响[19],本文采用的数据共894例,这些数据对于建模来说还相对较少,会直接影响到模型的效果㊂未来将进一步扩大数据量并对相关算法进行改进,使模型综合性能得以提高㊂5 结语二型糖尿病肾病由于存在复杂的代谢紊乱,一旦发展至终末期,其治疗将会更加棘手,因此早期对二型糖尿病肾病进行风险预测具有十分重要的意义㊂本文利用解放军总医院提供的2009-2010年度糖尿病数据集,采用均值插补法及拉依达准则对原始数据进行预处理,得到894条数据㊂利用单因素逻辑回归从原数据集的38个检查指标中筛选出24个有效指标并构建训练数据集和测试数据集,同时基于随机森林㊁BP神经网络㊁支持向量机3种算法分别构建二型糖尿病肾病风险预测模型㊂通过利用查准率㊁查全率㊁正确率㊁F1值以及ROC曲线下面积等5个度量值分别对这3种模型的性能进行比较,发现基于随机森林算法构建的风险预测模型性能最佳㊂本文结果可为二型糖尿病肾病的早期筛查及相关风险预测模型的算法选择提供参考及帮助㊂【参考文献】[1] Yang W,Lu J,Weng J,et al.Prevalence of diabetes among menand women in China[J].New England Journal of Medicine, 2010,362(12):1090-1101.[2] 赵海燕,隋树杰,徐龙猛.2型糖尿病患者自我管理行为与心理一致感的相关性[J].现代临床护理,2015,14(2):13-16. [3] 中华医学会糖尿病学分会.中国2型糖尿病防治指南(2017年版)[J].中国糖尿病杂志,2018,10(1):4-67.[4] 罗加凯,李志红,尹 飞,等.糖尿病肾病的临床特征及其危险因素研究[J].临床荟萃,2017,32(9):763-766. [5] 中华医学会内分泌学分会.中国成人糖尿病肾脏病临床诊断的专家共识[J].糖尿病天地(临床),2016,10(6):243-253.[6] 国家人口与健康科学数据共享服务平台.糖尿病数据集[EB/OL].[2019-03-23]./info/lcyx_jb/ 13815.[7] 李 杰,张晓玲.随机试验设计中缺失值插补方法研究[J].大理学院学报,2013,12(10):1-5.[8] 张 敏,袁 辉.拉依达(PauTa)准则与异常值剔除[J].郑州工业大学学报,1997,18(1):84-88.[9] 汪桂金.随机森林算法的优化改进及其并行化研究[D].南昌:南昌大学,2019.[10] Piccinini G.The First Computational Theory of Mind and Brain:A Close Look at McCulloch and Pitts's"Logical Calculus of IdeasImmanent in Nervous Activity"[J].Synthese,2004,141(2):175-215.[11] 刘天舒.BP神经网络的改进研究及应用[D].哈尔滨:东北农业大学,2011.[12] 丁世飞,齐丙娟,谭红艳.支持向量机理论与算法研究综述[J].电子科技大学学报,2011,40(1):2-10. [13] 张丽娜,李国春,周学平,等.基于支持向量机的急性出血性脑卒中早期预后模型的建立与评价[J].南京医科大学学报:自然科学版,2016,36(1):80-84.[14] 牟冬梅,任 珂.三种数据挖掘算法在电子病历知识发现中的比较[J].现代图书情报技术,2016,32(6):102-109. [15] Manning C D,Schutze H,Raghavan P.信息检索导论[M].王斌,译.北京:人民邮电出版社,2010:105-107,196-200.[16] Hanley J A,Mcneil B J.The Meaning and Use of the Area undera Receiver Operating(ROC)Curve[J].Radiology,1982,143(1):29-36.[17] 李 星.基于复杂网络的症状基因预测方法研究[D].北京:北京交通大学,2014.[18] 李 攀.基于神经网络的2型糖尿病并发症预测模型的研究[D].广州:广州中医药大学,2016.[19] 王 萍.基于电子病历数据的疾病预测模型构建研究[D].长春:吉林大学,2017.[收稿日期:2019-03-30][本文编辑:孙伟娟]。