基于粗糙集重要度和因子载荷对“滋水涵木法”古代医案的数据分析
- 格式:pdf
- 大小:251.85 KB
- 文档页数:3
滋水涵木汤治疗绝经后骨质疏松30例临床观察作者:陈水昌傅娇来源:《云南中医中药杂志》2016年第12期摘要:目的观察滋水涵木汤对绝经后骨质疏松症(PMOP)患者骨保护素(OPG)、雌激素(E2)及骨密度(BMD)的影响。
方法PMOP 患者60例,随机分为治疗组及对照组,每组30例,对照组给予钙尔奇D和阿法迪三治疗,治疗组在此基础上加用滋水涵木方,分别于治疗前后进行骨密度测定,血清骨保护素、血清 E2的测定。
结果治疗半年,治疗组OPG水平显著降低,BMD及E2水平显著升高,与治疗前比较均有显著性差异(P0.05),治疗半年时,治疗组与对照组比较,有显著性差异(P关键词:滋水涵木汤;绝经后骨质疏松症;临床观察中图分类号:R271.11+6文献标志码:B文章编号:1007-2349(2016)12-0060-02绝经后骨质疏松症(postmenopausal osteoporosis,PMOP)是一种进行发展的慢性疾病,其特点是女性绝经后卵巢功能减退,体内雌激素水平逐渐降低,从而导致骨吸收程度超过骨形成水平,从而导致骨量减少,进一步导致骨强度降低,骨折风险增加[1]。
本文旨在观察补肾健脾汤对 PMOP 患者的血清雌激素水平、血清骨保护素(OPG)及骨密度的影响。
1临床资料1.1一般资料纳入研究的60例女性患者均来源于广东省中西医结合医院骨科,年龄55~70岁,纳入的患者均为绝经至少1年的女性,所有患者均接受股骨近端密度(bone mineral density,BMD)测量。
将患者随机分治疗组和对照组。
治疗组30例,年龄(60.13±8.37)岁;停经年限(11.45±5.64)a。
对照组30例,年龄(61.54±9.12)岁,停经年限(12.19±6.35)a。
各组在年龄、停经年限上均无显著性差异(P>0.05)。
1.2诊断标准根据中国老年学学会骨质疏松委员会(1999)制定的诊断标准[2]。
基于数据挖掘技术探讨《清宫医案集成》治疗不寐的用药规律吴弦宇;闫龙美;邢雅璇;许志杰;陈益多;高慧容;张京春
【期刊名称】《中西医结合心脑血管病杂志》
【年(卷),期】2024(22)2
【摘要】目的:以数据挖掘技术为基础,探讨《清宫医案集成》中治疗不寐的用药和配伍规律。
方法:将《清宫医案集成》中治疗不寐的处方进行整理,在古今医案云平
台提供的Excel 2010软件模板上建立处方数据库,通过古今医案云平台对数据进行频数统计、关联规则分析、聚类分析及复杂网络分析。
结果:共筛选出345首处方、275味药物;经关联规则分析,对纳入的中药数据进行中药配伍关联分析,筛选出共现频次≥40次的中药,同时设置置信度≥0.6、支持度≥0.2,最终得到13条关联规则数据。
高频药物间生成5组聚类组合,核心处方包括白术、白芍、茯神、当归、甘草。
结论:《清宫医案集成》中清代宫廷御医治疗不寐,具有气血同治、调心安神、重视
肝脾的用药特点。
【总页数】5页(P239-243)
【作者】吴弦宇;闫龙美;邢雅璇;许志杰;陈益多;高慧容;张京春
【作者单位】北京中医药大学研究生院;中国中医科学院西苑医院
【正文语种】中文
【中图分类】R24
【相关文献】
1.数据挖掘《王任之医案》中治疗不寐的用药规律
2.基于数据挖掘技术探讨陈可冀《清宫配方集成》中治疗骨关节炎组方的用药规律
3.基于数据挖掘名老中医陆曙治疗不寐的用药规律
4.基于数据挖掘的李智杰教授运用加味菖蒲郁金汤治疗不寐用药规律研究
5.基于数据挖掘的张星平治疗肝不藏魂型不寐用药规律研究
因版权原因,仅展示原文概要,查看原文内容请购买。
邻域粗糙集和Fisher判别法结合的转子故障决策规则提取方法赵荣珍;何敬举【摘要】针对旋转机械故障诊断知识获取困难的问题,将邻域粗糙集和Fisher(费舍)判别法相结合,对从故障数据库中提取决策规则的方法进行了研究.首先基于邻域粗糙集理论对转子故障的时域特征属性集进行属性约简,据此达到消除冗余属性的目的,然后再依据费舍判别法对故障数据集进行故障模式识别.通过处理转子实验台数据来对该方法进行的验证以及与传统方法进行的对比情况表明:本方法在节省数据存储空间的同时还具有能够获得较准确的故障分类决策规则能力.【期刊名称】《兰州理工大学学报》【年(卷),期】2019(045)001【总页数】6页(P43-48)【关键词】故障诊断;决策规则;邻域粗糙集;Fisher判别法【作者】赵荣珍;何敬举【作者单位】兰州理工大学机电工程学院,甘肃兰州 730050;兰州理工大学机电工程学院,甘肃兰州 730050【正文语种】中文【中图分类】TH165;TP18传统的故障诊断概念正在向智能机械信息技术方向发展.作为一种保障设备安全可靠运行的重要措施,与故障诊断技术密切相关的研究大致可分为定性分析和定量分析两大类,后者又进一步可分为基于解析模型的方法和基于数据驱动的方法[1].基于数据驱动的方法又包括信号处理、多元统计分析和粗糙集理论等方法[1-2].其中在数据驱动方法中,研究和应用最多的是多元统计分析方法[3],而近年来粗糙集理论在处理模糊和不确定性信息上的优越性使其已被广泛引入到复杂系统的故障诊断中[4],其为决策知识发现指明了一条新途径[5].故障诊断方法各有优缺点,如能够将几种性能互补的方法进行适当组合、优势互补,则解决问题的能力将有可能得到显著提高[6].Chebrolu等[7]将LMS结合贝叶斯损耗函数用在决策粗糙集的属性约减上,大大提高了分类的准确性.Adamczyk提出了结合PSO和RST进行特征提取的方法,有效地简化了约简步骤,提高了计算效率[8].王江荣等[9]将粗糙集理论用在Logistic回归分析模型的数据降维上,克服了线性回归问题解决二分类问题存在的不足,有效地消除了因素间的耦合影响作用对识别结果的影响,为模式识别提供了一种新思路.张小海等[10]利用粗糙集理论对数据进行一般约简,去除冗余信息,再进行偏最小二乘回归分析,通过建立回归模型达到了提高建模精度的目的.陈毅波等[11]在多元统计回归模型的建立中利用粗糙集理论进行影响因子的重要性排序,有效提高了多元回归算法在中长期负荷预测中的准确性和适应性.瞿金秀等[12]在旋转机械故障诊断领域首次提出了一种将振动信号时域分析和邻域粗糙集结合起来的故障诊断模型,该模型充分利用了邻域粗糙集处理数值型数据集的优势,删除了冗余和耦合信息.上述这些研究表明:粗糙集理论与其他数据挖掘方法进行结合,有望在混合故障诊断的诊断效果方面有所突破,因此对邻域粗糙集与费舍判别法进行结合进而达到提高诊断效率的问题进行探讨,具有一定的基础问题研究意义.本文拟对邻域粗糙集和Fisher判别法相结合的转子故障决策规则提取方法进行探讨,欲为借助数据挖掘和数据驱动解决智能决策技术的知识获取难题,提供基础理论参考依据.1 基本原理介绍1.1 邻域决策系统的基本概念1982年波兰数学家Pawlak提出了粗糙集理论.该理论将研究对象的全体称为论域,利用不可分辨关系将论域粒化为若干互斥的等价类,作为描述论域中任意概念的基本信息粒子[13].Lin在1988年提出了邻域模型这一概念,将邻域理解为基本信息粒子,通过空间中点的邻域来粒化论域空间[14].胡清华等[15]利用拓扑空间中球形邻域的概念给出了邻域决策系统的定义并构造了基于邻域粗糙集模型的数值特征属性选择算法.关于邻域决策系统[15]的基本概念如下:对于很多模式识别问题,给定的样本由一系列数值型特征描述,样本被分成少数的几个类别,分类学习就是从这样的样本集合中学习一个函数实现从特征空间到决策的映射.给定样本集合U={x1,x2,…,xn},A是描述U的实数型特征集合,D是决策属性,如果A生成论域上的一族邻域关系,则称NDS=(U,A∪D,N)为一邻域决策系统,A也被称为条件属性,N 为D将U划分的等价类.举例:U={x1,x2,x3,x4,x5},a是U的一个条件属性,f(x,a)表示样本x在属性a上的值,f(x1,a)=1.1,f(x2,a)=1.2,f(x3,a)=1.6,f(x4,a)=1.8,f(x5,a)=1.9.当指定邻域δ大小为0.2时,由于度量Δ(x1,x2)=|f(x1,a)-f(x2,a)│≤0.2,则x2∈δ(x1),x1∈δ(x2).对于∀B⊆A,则定义决策属性D关于B的上、下近似分别为(1)(2)通过类比,可得到邻域决策系统的边界域、正域和负域:决策属性D对子集条件属性B的属性依赖度:(6)若ai∈B(i表示第i个条件属性),则条件属性ai对决策属性D的重要度为Si g(ai,B,D)=γB(D)-γB-{ai}(D)(7)1.2 Fisher判别法费舍判别法(FDA)是1936年由Fisher提出来的,该方法对总体分布未提出特定的要求.其基本思想是通过投影达到降维的效果,使得投影后类与类之间尽可能分开[16].设分别从k个总体G1,G2,…,Gk中抽出的样本数量分别为n1,n2,…,nk(n1+n2+…+nk=n),每个样本观测p个变量数据,则总体G1,G2,…,Gk 的样本观测数据可分别用p维列向量x的转置表示:令a=(a1,a2,…,ap)′为任意一个p维向量,则对上述数据作形如y=a′x=a1x1+a2x2+…+apxp(8)的线性组合(从几何上讲,就是向量x以向量a为法线的投影),使得原本p维的数据集转化为一维数据集,刚好构成符合一元方差分析的数据基础.设组间平方和为u,组内平方和为v,则统计量:按照方差分析的思想,如果k组均值有显著性差异,则统计量F应该充分大.由于样本数量n和分类数k都已给定,因此问题可转化为(9)应该充分大.根据式(8)x和y的转化关系可得式中:为Gi原始观测数据样本的均值;为各类原始观测数据的总样本均值.将u和v带入式(9),求费舍判别函数的问题就是求向量a,使得(10)达到极大.将式(8)结合拉格朗日乘子法可知,求解判别系数,实际上就是求矩阵B关于矩阵A的广义特征向量,每个广义特征向量对应一个特征根和一个判别函数.需要说明的是在有些问题中,仅用一个判别函数不能很好地区分k个总体,对每个函数的判别能力指标pl被定义为(11)式中:λ为特征根;m为特征向量的个数.前m0个判别函数的累积判别能力定义为(12)2 邻域粗糙集与Fisher判别法结合的分类方法设计2.1 设计的数据处理流程为能够有效地删除数据集中的冗余信息,提高诊断系统的精确性,获得更准确的决策规则,节省数据存储空间,将无需先验知识能够有效处理不完备数据集的粗糙集理论和具有较高模式识别准确率的多元统计方法相结合,依据邻域粗糙集能有效处理连续数值型属性及Fisher判别法能有效去除耦合进行模式识别的作用,设计了邻域粗糙集与Fisher判别法结合的故障诊断模型,探讨两种同时具有约简功能的方法结合的有效性.首先对采集到的振动信号消噪后提取出原始故障数据集的时域特性,建立邻域粗糙集决策表,经前向贪心算法约简后再依据Fisher判别法进行模式识别,数据集的整体处理流程如图1所示.图1 数据集处理流程Fig.1 Flow-chart of data set processing设k为旋转机械的故障类别数,{G1,G2,…,Gk}分别为k类故障对应的样本总集;n1,n2,…,nk(n1+n2+…+nk=n)分别为从每类样本集中抽取的样本个数.依照图1数据处理流程,首先提取出表征旋转机械故障信息的p个时域特征,建立一个n(p+1)维的决策数据表,其中最后一列为类标签属性,n为样本总数.把每类的样本看作观测数据,利用式(8~12)求解Fisher判别函数,对故障类别进行识别.如令整个测试样本集为论域U,p个时域特征构成条件属性A,故障类别标签为决策属性,则可以利用邻域粗糙集式(1~7)对数据集进行处理.本文所提出的方法是首先利用前向贪心算法[15]进行属性约简,删除冗余和耦合信息,然后再依据费舍判别法求解判别系数进行模式识别,最后利用式(11)和式(12)获得判别能力最大的函数并得到决策规则.2.2 采用前向贪心算法的属性约简方法设Std(Ap)表示条件属性每一列的标准差,参考文献[15]推荐的选取原则,在本研究中采用的计算邻域半径集合δ的公式为(13)式中:p为条件属性的个数;t为可以根据样本数量改变大小的常数,以此来调整邻域粗糙集中邻域半径的大小,进而达到最优的属性约简[15].本实验的约简结果见表1. 表1 约简剩余属性及对应重要度Tab.1 Simplification of residual attributes and corresponding significance degree剩余属性a2a3a4a6a7对应重要度0.2500.0500.2000.0250.175采用的前向贪心算法属性约简步骤如下:Step 1:输入决策系统NDS=(U,A∪D)、邻域半径δ集合和重要度下限.其中U为整个粗糙集决策表论域,A为条件属性p,D为决策属性G;Step 2:初始化约简集合red=∅,样本smp=U;Step 3:对任意ai∈(A-red)(i=1,2,…,p),利用式(4)计算正域Po(D);Step 4:选择ak使正域Posak(D)最大(ak为能使正域最大的条件属性);Step 5:利用式(7)计算属性重要度Sig(ak,red,D);Step 6:如果Sig(ak,red,D)大于设定的下限值,输出约简结果red;否则,记录k值,令red=red+ak;S=S-Posak;返回步骤3.3 实验结果与讨论分析3.1 实验情况本文采用双跨转子实验台采集的振动信号集合作为数据实验对象[17],采集信号的传感器为电涡流位移传感器,实验台如图2所示.在本实验台上共模拟了四种常见故障:{转子不平衡、转子不对中、碰磨、松动}和{正常状况},并在2 800 r/min的转速下分别对不同状态信号进行采集足够多的次数以此构成故障样本集合,采样频率为5000Hz,信号截取长度为1 024.每种状态选取10个样本共50个样本,40个作为训练样本,10个作为测试样本.由于时频域特征容易获得并蕴含丰富的状态特征[18],因此首先提取出7个时域特征建立数据集,结果见表2.最左列为元素序号,最右列为故障类别,中间元素为每个观测变量下对应的时域特征值.为了以后程序的方便运算,令条件属性(时域特征):{峰值、最小值、最大值、均值、方差、偏度、峰度}分别为:{a1、a2、a3、a4、a5、a6、a7},令决策属性(故障类别):{不对中、不平衡、碰磨、松动、正常}分别为:{C1、C2、C3、C4、C5}.本实验数据处理平台为Win7系统下的Matlab、SPSS和WEKA软件.表1为在Matlab下利用前向贪心算法选取合适参数,依据式(13)求邻域半径δ的参数t设为2.5,重要度下限设为0.001,约简得到的最佳剩余属性及其对应重要度.之后将约简后的数据输入SPSS软件中,并和单纯的Fisher判别法作比较,得到表3实验样本和测试样本的判别结果(10个测试样本,共5类,每类2个样本).将约简前的数据按单纯的邻域决策表处理输入WEKA 中,得到表4实验和测试结果.在SPSS软件中得到约简后数据的Fisher判别函数的累积判别能力和各个判别函数,分别见表5和表6,由表6可得5种故障类型的4个判别函数分别为图2 双跨转子实验台Fig.2 Test-bed of double-span rotor表2 原始故障数据Tab.2 Original fault data set论域U(样本x)条件属性A(自变量p)a1a2a3a4a5a6a7决策属性D(类G)x10.782-0.3650.416-0.0550.0640.101-1.475C1x20.831-0.3660.4640.0090.0760.124-1.492C1x30.800-0.3760.424-0.0120.0720.163-1.490C1x40.782-0.3960.3860.0070.067-0.080-1.480C1x50.782-0.3980.3840.0120.063-0.175-1.440C1x60.859-0.3780.481-0.0150.0780.323-1.350C1………………………x380.866-0.3830.482-0.0030.0780.237-1.380C5x390.853-0.3880.4650.0050.0750.176-1.360C5x400.876-0.3770.4990.0120.0760.173-1.350C5表3 训练和测试样本判别结果Tab.3 Discrimination result of training and testing samples训练样本实际故障类别单纯费舍回判结果费舍加粗糙集回判结果x6C1C5C5测试样本实际故障类别单纯费舍预测结果费舍加粗糙集预测结果x41C1C1C1x42C1C1C1x43C2C2C2x44C2C5C5x45C3C3C3x46C3C3C3x47C4 C4C4x48C4C4C4x49C5C5C5x50C5C5C5表4 单纯粗糙集训练和测试结果Tab.4 Discrimination result of training and test result with RST only统计量训练结果测试结果正确分类实例389错误分类实例21Kappa统计量0.9370.875绝对平均误差0.1860.204均方根误差0.2430.272相对绝对误差%58.29363.888相对平方根误差%60.91968.094实例总数4010y2=102.140a2+28.894a3-0.027a4-5.290a6+3.285a7+30.817y3=9.803a2-0.735a3+27.057a4+5.686a6-6.620a7-6.523y4=-5.316a2-0.278a3+67.956a4+1.014a6+3.182a7+2.633由表5可得4个判别函数分别对应的特征值为:λ1=438.155、λ2=255.909、λ3=0.299、λ4=0.134,代入式(11)和式(12)得y1和y2这两个函数的累积判别能力为99.9%.因此只用这两个判别函数就能把5种故障状态完全分开,这也是所要求的决策规则.把40个样本的条件属性:{a2、a3、a4、a6、a7}的值分别代入y1和y2中,得40个样本以y1和y2为维度的二维识别图如图3所示.为了和其他几种方法作比较,将40个约简后的数据分别带入其他几种识别方法中,得到的对比结果见表7.表5 各函数累积判别能力Tab.5 Accumulative discrimination ability of every several function函数特征值方差/%累积判别能力/%正则相关性1438.15563.10063.1000.9992255.90936.80099.9000.99830.2990100.0000.4 8040.1340100.0000.344表6 Fisher判别函数Tab.6 Fisher discrimination function自变量(条件属性)函数系数1234a2-83.150102.1409.803-5.316a345.49128.894-0.735-0.278a4-11.7240.02727.05767.956a61.746-5.2905.6861.014a7-1.3263.285-6.6203.182常量-37.78630.817-6.5232.633图3 故障二维识别图Fig.3 Fault recognition in 2-D space表7 本文方法与其他几种方法的对比结果Tab.7 Contrast result of proposed method in this article with some other methods分类方法识别正确率/%FDA97.5RBF Network95.0SMO62.5Logistic90.0Simple Logistic97.5Multilayer Perceptron92.53.2 邻域半径大小对实验结果的影响由2.2节前向贪心算法可知,重要度下限通常设定为接近于0的数,对约简结果影响不大,而邻域半径的大小对约简结果则影响较大[15].由式(13)可得邻域半径大小和t 值成反比关系,取t=1.5~4.5,步长为0.5,重要度下限设定为0.001,分别对40个故障样本属性集进行约简,约简后经Fisher判别法判别得出识别正确率,实验结果见表8.表8 不同邻域半径实验结果Tab.8 Result of test within neighborhood with different radiust值约简剩余属性识别正确率/%1.5{a3, a4, a6}72.52.0{a3, a4, a6, a7}92.52.5{a2, a3, a4, a6, a7}97.53.0{a2, a6, a7}80.03.5{a6, a7}77.54.0{a7}65.04.5{a7}65.0 3.3 讨论与分析由表1和表2可知,经过邻域粗糙集约简后,删除了峰值和方差这两个属性.由表3可知,约简前后费舍判别分析的回判结果和测试结果是一样的,即在特征属性数目少的情况下达到了相同的判别效果.由此可见本文提出的邻域粗糙集结合费舍判别的方法,删除掉了冗余信息,能够增加计算效率,节省数据存储空间.由表3还可知,40个训练样本回判过程中仅第6个不对中样本误判为正常状态,回判正确率为97.5%,10个测试样本中仅第44个碰磨样本误判为正常状态,测试正确率为90%.由表5可知,在单纯的邻域粗糙集决策表模型中,回判正确率为95%,测试正确率为10%.由此可见本文提出的两者结合的方法提高了回判正确率,增加了模型精度.进一步分析,由表4可得前两个判别函数的累积判别能力为99.9%,结合图3可得原本具有7个属性的数据集,经过邻域粗糙集理论和Fisher判别法两次约简后,就完全可以通过y1和y2这两个属性把5种状态给识别出来,而且具有较好的分类效果,较高的识别准确性.由表7可得在和其他几种模式识别方法对比中,本文所提出的方法具有较好的故障识别正确率.由此可见,本文提出的旋转机械故障模式分类识别方法是可靠的.由表8可知,当t=2.5时约简剩余属性的个数是最多的,但故障识别正确率也是最高的.当t≠2.5时约减剩余属性的个数都小于5,识别正确率也小于97.5%,可见t=2.5时的邻域半径是最优邻域半径.总体来说,随着t值的增大,邻域半径减小,使得约简剩余属性个数越来越少,中间出现震荡,在震荡的时候会出现最优属性约简效果.本实验除了受邻域半径大小的影响之外还受样本数量大小的影响,尤其是海量数据下的分类效果有待进一步探讨.4 结论提出了一种邻域粗糙集结合Fisher判别法的旋转机械故障模式识别方法.该方法证明了经过邻域粗糙集属性约简和Fisher判别法约简去耦合二次降维后,原始故障数据集的维数明显降低,冗余信息被有效剔除,从而起到了降低数据规模,节省存储空间,提高运算效率的作用.实验还证明该方法在特征维数低的同时和单纯的Fisher判别分析法相比具有相同的准确率,比单纯的邻域粗糙集模型具有更高的确率.该方法具有较好的模式识别效果,同时与其他方法对比的情况说明该方法具有较高的识别正确率,值得推广.参考文献:【相关文献】[1] 周东华,李钢,李元.数据驱动的工业过程故障诊断技术:基于主元分析与偏最小二乘的方法 [M].北京:科学出版社,2011.[2] 李晗,萧德云.基于数据驱动的故障诊断方法综述 [J].控制与决策,2011,26(1):1-9.[3] 阳宪惠.多变量统计过程控制 [M].北京:化学工业出版社,2000.[4] 张腾飞,王锡淮,叶银忠,等.粗糙集理论在故障诊断中的应用综述 [J].上海海事大学学报,2005,26(4):20-25.[5] 赵荣珍,黄义仿,张力,等.旋转机械智能故障诊断技术的发展趋势 [J].兰州理工大学学报,2008,34(5):36-40.[6] 王国彪,何正嘉,陈雪峰,等.机械故障诊断基础研究“何去何从” [J].机械工程学报,2013,49(1):63-72.[7] CHEBROLU S,SANJEEVI S G.Attribute reduction in decision-theoretic rough set model using particle swarm optimization with the threshold parameters determined using LMS training rule [J].Procedia Computer Science,2015,57:527-536.[8] ADAMCZYK M.Parallel feature selection algorithm based on rough sets and particle swarm optimization [C]// Computer Science and Information Systems.Serbia:IEEE,2014:43-50.[9] 王江荣,罗资琴,文晖,等.基于粗糙集的多项logistic回归模型在油层识别中的应用 [J].工业仪表与自动化装置,2015(3):28-32.[10] 张小海,金家善,耿俊豹,等.基于粗糙集的偏最小二乘回归方法 [J].上海交通大学学报,2010,44(12):1678-1681.[11] 陈毅波,郑玲,姚建刚.基于粗糙集理论与D-S证据理论改进的多元回归负荷预测方法研究 [J].电力系统保护与控制,2016(6):62-67.[12] 瞿金秀,张周锁,何正嘉.基于多小波包和邻域粗糙集的故障诊断模型 [J].振动、测试与诊断,2013,33(s1):137-140.[13] PAWLAK Z.Theoretical aspect of reasoning about data [M].Wolters Kluwer:Kluwer Academic Publishers,1991.[14] LIN T Y.Granular computing on binary relations I:data mining and neighborhood systems [J].Rough Sets in Knowledge Discovery,1998,2:165-166.[15] 胡清华,于达仁,谢宗霞.基于邻域粒化和粗糙逼近的数值属性约简 [J].软件学报,2008,19(3):640-649.[16] 韩明.应用多元统计分析 [M].上海:同济大学出版社,2013.[17] 霍天龙,赵荣珍,胡宝权.基于熵带法与PSO优化的SVM转子故障诊断 [J].振动、测试与诊断,2011,31(3):279-284.[18] 吴胜强,姜万录,刘思远.基于小波包和KPCA的时频域故障检测方法 [J].沈阳工业大学学报,2011,33(2):172-176.。
粗糙集理论的属性重要性评估方法及其实际应用引言:粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它在数据挖掘、模式识别和决策分析等领域中得到了广泛的应用。
在粗糙集理论中,属性重要性评估是一个重要的问题,它能够帮助我们识别出对决策结果具有重要影响的属性,从而提高决策的准确性和可靠性。
本文将介绍一种基于粗糙集理论的属性重要性评估方法,并探讨其在实际应用中的价值。
一、粗糙集理论概述粗糙集理论是由波兰学者Pawlak于1982年提出的,它是一种处理不确定性和模糊性问题的数学工具。
粗糙集理论通过将对象的属性进行划分,将属性值之间的差异进行模糊化处理,从而实现对不完备和不精确数据的分析和决策。
粗糙集理论的核心思想是近似和约简,即通过近似的方法对数据进行简化和压缩,从而提取出最重要的信息。
二、属性重要性评估方法在粗糙集理论中,属性重要性评估是一个关键问题。
属性重要性评估的目标是确定哪些属性对决策结果的影响最大,从而帮助我们进行决策和分析。
常用的属性重要性评估方法有正域、核和约简等方法。
1. 正域方法正域方法是一种基于粗糙集的属性重要性评估方法。
它通过计算属性在正域中的覆盖度来评估属性的重要性。
正域是指在给定条件下能够唯一确定决策结果的属性取值,它反映了属性对决策结果的贡献程度。
正域方法的优点是简单直观,容易理解和计算,但它没有考虑属性之间的依赖关系。
2. 核方法核方法是一种基于粗糙集的属性重要性评估方法。
它通过计算属性在核中的约简度来评估属性的重要性。
核是指在给定条件下能够唯一确定决策结果的最小属性集合,它反映了属性对决策结果的决定性影响。
核方法考虑了属性之间的依赖关系,能够更准确地评估属性的重要性,但计算复杂度较高。
3. 约简方法约简方法是一种基于粗糙集的属性重要性评估方法。
它通过对属性集合进行约简,得到一个最小的属性子集,从而实现对属性的重要性评估。
约简方法的优点是能够同时考虑属性之间的依赖关系和决策结果的覆盖度,能够更全面地评估属性的重要性。
滋水涵木法治疗甲状腺功能亢进症的理论溯源与研究进展
王丽娜;田硕;王芙蓉
【期刊名称】《中国中医基础医学杂志》
【年(卷),期】2024(30)5
【摘要】中医认为肝肾阴虚是甲状腺功能亢进症(以下简称甲亢)甲亢发生发展的重要病机,根源于“肝肾同源”理论学说的滋水涵木法是甲亢的主要治疗法则。
临床
应用滋水涵木法治疗甲亢在提高有效率,降低复发率及减少不良反应,改善并发症方
面优势显著,进一步探究其机制可能与调整代谢紊乱、降低炎症水平,提高免疫功能、减轻氧化应激和抑制细胞增殖、促进细胞凋亡等有关。
本文旨在通过梳理滋水涵木法治疗甲亢的理论依据、临床优势及可能的作用机制,以期继承传统,守正出新,从而促进甲亢治疗效果的提升和中医药的发扬光大。
【总页数】4页(P884-887)
【作者】王丽娜;田硕;王芙蓉
【作者单位】山东中医药大学中医学院
【正文语种】中文
【中图分类】R581.1
【相关文献】
1.试述滋水涵木法治疗围绝经期综合征的理论基础
2.滋水涵木法治疗高血压的临床疗效及对动态动脉硬化指数、肾功能的影响
3.滋水涵木法针刺结合常规康复训练
对卒中后患者上肢运动功能恢复的影响4.滋水涵木法联合髓芯减压对股骨头坏死
患者血液流变学、髋关节功能度的影响5.“滋水涵木”针刺法结合毫火针治疗中风后痉挛性偏瘫临床研究
因版权原因,仅展示原文概要,查看原文内容请购买。
基于粗糙集技术的乙肝中医临床症候关联规则挖掘研究
孙继佳;王鲲
【期刊名称】《数理医药学杂志》
【年(卷),期】2017(030)010
【摘要】目的:采用粗糙集技术与关联规则结合的数据挖掘方法对乙肝中医临床症候规律进行研究.方法:根据所收集到的883例乙肝患者中医临床资料,采用粗糙集方法建立中医证候决策信息表,提取与乙肝证型有密切关联的症状、体征,然后利用关联规则找出不同证型下的中医临床指标的相关性.结果:通过对临床数据的挖掘分析,发现口苦、舌苔薄和脉弦等对肝胆湿热证判定以及舌胖、舌荣等对肝郁脾虚证的诊断分析具有很高的参考价值.结论:提出的方法能够有效地揭示中医临床症状之间的内在规律,对于乙肝中医临床研究工作具有一定的参考价值,并且对其他疾病的中医临床研究具有一定的参考和借鉴意义.
【总页数】3页(P1423-1425)
【作者】孙继佳;王鲲
【作者单位】上海中医药大学中药学院数理教研室上海 201203;上海中医药大学药物临床研究中心
【正文语种】中文
【中图分类】R259
【相关文献】
1.基于粗糙集的感性知识关联规则挖掘研究 [J], 石夫乾;孙守迁;徐江
2.基于粗糙集的分类关联规则挖掘算法研究 [J], 尹世群;余建桥;葛继科;邱玉辉
3.基于粗糙集关联规则挖掘的入侵检测研究 [J], 马洪江
4.基于关联规则挖掘的粗糙集属性值约简算法研究 [J], 杜跃;王治和;景永霞
5.基于粗糙集的关联规则挖掘方法的研究与应用 [J], 吴陈;李丹丹
因版权原因,仅展示原文概要,查看原文内容请购买。
基于粗糙集理论的中医方证系统模型的建立
于润桥;杨琳瑜;王建红;罗来成
【期刊名称】《辽宁中医药大学学报》
【年(卷),期】2007(9)1
【摘要】中医方剂在机体的作用复杂,将其视作一系统,即中医方证系统。
将粗糙集理论与方法应用于中医方证系统,挖掘证候指标与方剂各药物之间的相关关系,建立证候指标与方剂各药物之间的数学模型,以期对方剂进行优化,又获得更多证候的信息,为中医方证研究提供一种新方法。
【总页数】3页(P5-7)
【关键词】粗糙集;系统模型;中医方证
【作者】于润桥;杨琳瑜;王建红;罗来成
【作者单位】南昌航空工业学院测控系;广东药学院
【正文语种】中文
【中图分类】R2-03
【相关文献】
1.基于粗糙集理论的中医方证相关性分析模型的研究 [J], 吴昊;李书琴;董记华
2.基于粗糙集和遗传算法的中医方证相关性研究 [J], 陈建国;李四海;赵磊
3.基于粗糙集的蒙药方证相关性分析模型 [J], 王彪;段禅伦;赵俊岚
4.基于层次分析法建立中医方证耦合模型:以《伤寒论》桂枝汤类方证辨证规律为
例(英文) [J], 潘大为;陈利国
5.基于粗糙集理论的中医方证相关性算法的研究 [J], 云炜;段禅伦
因版权原因,仅展示原文概要,查看原文内容请购买。
Hadoop下基于粗糙集与贝叶斯的气象数据挖掘研究张晨阳;马志强;刘利民;常骏;李永利【摘要】的重点。
气象数据具有维度高、依赖性强等特点,这就对气象数据挖掘提出了更高的要求。
经典数据挖掘算法在处理海量气象数据时在性能与准确率方面无法获得较好的结果。
在分析了MapReduce计算模型与粗糙集、贝叶斯分类的基础上,给出了基于MapRe-duce的计算等价类的数据约简算法与朴素贝叶斯分类算法。
最后在Hadoop平台上进行了相关实验。
实验结果表明,该并行数据挖掘方案可以有效处理海量气象数据,并具有良好的扩展性。
%With the continuous development of meteorological informatisation level,massive meteorological data has been piled up in meteorological departments,how to extract useful knowledge from massive data becomes the focus of attention.Meteorological data has the features of high dimensions and strong dependence,which puts forward higher requirements to meteorological data mining.Classic data mining algorithms cannot achieve better results in performance and accuracy when processing massive meteorological data.On the basis of analysing MapReduce calculation model,rough set theory and Bayesian classification,we propose a MapReduce-based data reduction algorithm and native Bayesian classification algorithm for computing equivalence class.Finally,on Hadoop platform we carry out the correlated experiment. It is demonstrated by the experimental results that this paralleled data mining scheme can efficiently process massive meteorological data and has good scalability.【期刊名称】《计算机应用与软件》【年(卷),期】2015(000)004【总页数】6页(P72-76,90)【关键词】粗糙集;朴素贝叶斯;MapReduce;气象数据【作者】张晨阳;马志强;刘利民;常骏;李永利【作者单位】内蒙古工业大学信息工程学院内蒙古呼和浩特010080;内蒙古工业大学信息工程学院内蒙古呼和浩特010080;内蒙古工业大学信息工程学院内蒙古呼和浩特010080;内蒙古气象信息中心内蒙古呼和浩特010050;内蒙古气象信息中心内蒙古呼和浩特010050【正文语种】中文【中图分类】TP311随着数据库技术和计算机网络的高速发展,气象部门在日常科研和管理活动中收集积累了海量的气象信息资料。