形式概念分析中的对象概念与属性概念
- 格式:docx
- 大小:42.41 KB
- 文档页数:9
10 .填空:软件资源包括系统软件和应用软件两大部分。
11 .数据资源是信息系统的核心内容,是系统运行的物质基础。
12 .在信息系统运行过程中,人始终处于中心地位,计算机只要是辅助工具。
13 .简答:信息系统的六个功能(1)信息的收集(2)信息的存储(3)信息的处理(4)信息的传输(5)信息的输出(6)系统运行的控制14 .存储介质主要是指计算机的存储设备,如磁带、磁盘、光盘等。
磁带只能顺序存取,磁盘和光盘可直接存取。
15 .信息传输的指标是传输速度和误码率。
16 .信息系统的建立它的作用表现为三个方面:(1)支持组织的运作(2)支持组织的管理决策(3)支持组织获取战略竞争优势。
17 .信息系统的物理结构按照其在空间上的拓扑结构分为集中式和分布式两大类。
分布式又可分为一般分布式与客户机服务器模式。
18 .信息系统的层次结构可以分为物理层、系统层、支撑层、数据层、功能层和用户层六个层次。
19 .信息系统发展的三个阶段(1)电子数据处理系统(2)管理信息系统(3)决策支持系统。
决策支持系统是一种以计算机为工具,应用决策科学及有关学科的理论与方法,以人机交互方式辅助决策者解决“非结构化”与“半结构化”决策问题的信息系统。
20 .简答:信息系统的新的发展,四个方向:(1)智能决策支持系统(2)群体决策支持系统(3)主管信息系统EIS(4)计算机集成制造系统21 .EIS主管信息系统五个功能:(1)信息挖掘(2)信息交流(3)组织管理(4)决策支持(5)办公助理22 .计算机集成系统三个方面:计算机继承制造系统是将CAD(计算机辅助设计卜CAM(计算机辅助制造)、MIS等不同类型的子系统注意连接起来一起工作。
23 .信息系统的开发方法和技术很多:生命周期法、原型法、结构化技术、面向对象方法等。
24 .生命周期法五个方面:系统规划、系统分析、系统设计、系统实施、系统运行和系统维护等五个阶段。
25 .原型法将系统调查、分析、设计、实施等融为一体。
基于三支决策的形式概念分析、粗糙集与粒计算姚一豫;祁建军;魏玲【摘要】三支决策是一种用"三"来思考、解决问题和处理信息的方法,即把待解决的问题分解为三个元素或者三个部分,进而再行处理.形式概念分析、粗糙集以及粒计算是当今知识发现领域中三个重要的理论.我们用三支决策的观点解释和分析形式概念分析、粗糙集以及粒计算中的基本概念、理论,并剖析它们之间的联系.【期刊名称】《西北大学学报(自然科学版)》【年(卷),期】2018(048)004【总页数】11页(P477-487)【关键词】三支决策;形式概念分析;粗糙集;粒计算【作者】姚一豫;祁建军;魏玲【作者单位】加拿大里贾那大学计算机系,里贾那,S4S0A2;西安电子科技大学计算机学院,陕西西安 710071;西北大学数学学院,陕西西安 710127【正文语种】中文【中图分类】O29;TP18在知识发现研究领域,近年来产生了很多有效的理论与方法,无论是理论研究还是应用研究,都有很多好的成果。
比较热门的几个理论当属三支决策、粗糙集、形式概念分析与粒计算。
其中,三支决策与粒计算更强调方法性与思想性,而粗糙集与形式概念分析则研究较为具体的工具。
在大家所熟知的二支决策模型中,一般仅考虑接受与拒绝两种选择:不接受等同于拒绝,不拒绝等同于接受。
但在实际应用中往往并非如此。
Yao提出的三支决策理论(Three-way decisions,3WD)为此种情况提供了一个不同于接受与拒绝的第三种选择:不承诺[1-3]。
三支决策最初的思想是一种基于接受、拒绝和不承诺的三分类。
其目标是将一个论域分为两两互不相交的3个部分,这3个区域在一个具体的决策问题中可以分别被看作是接受域、拒绝域和不承诺域。
相应于这3个区域,可以建立三支决策规则。
进一步研究表明,三支决策有更广义的解释和理解。
三支决策是三元或三值思维,采用3个选项,从而走出了经典的二值、二元或两极思维的圈子和制约,使我们能将对/错、好/坏、黑/白、左/右、上/下、过去/将来等扩展为对/中/错、好/中/坏、黑/灰/白、左/中/右、上/中/下、过去/现在/将来等。
2020,56(10)1引言形式概念分析[1]是一种进行数据分析的有效数学工具,其核心概念为形式背景、形式概念与概念格。
通过概念格所展现出的概念之间的特化与泛化关系,揭示了数据表的内在结构,刻画了对象与属性之间的依赖关系。
近年来,一个有趣的研究方向是将多粒度计算的思想融入到形式概念分析之中,由此产生了不同的多粒度形式概念分析模型[2-16]。
形式概念分析的粒计算方法包括形式背景的对象粒化[2]、属性粒化[3-8]、关系粒化[9-11]等,这些方法除了可以缓解庞大的概念个数之外,还可以获两种多粒度形式概念分析模型的比较研究折延宏1,胡梦婷2,贺晓丽1,曾望林21.西安石油大学理学院,西安7100652.西安石油大学计算机学院,西安710065摘要:多粒度形式概念分析是近年来形式概念分析领域的一个热点方向。
基于属性聚类与属性粒化是两种典型的方法。
围绕Wille形式概念分析模型以及面向对象概念分析模型对这两种方法进行了深入的对比研究。
首先引入了基于属性聚类的Wille概念分析模型,证明了已有的基于属性粒化的形式概念分析模型是该模型的一种特殊情形。
将已有的基于属性粒化的面向对象概念分析模型拓展至基于属性聚类的情形,研究了聚类前后外延集的变化规律,证明了聚类前后外延集仍然保持不变的充分必要条件,所得结果进一步推广了已有文献中的结论。
关键词:属性粒化;属性聚类;Wille概念格;面向对象概念格文献标志码:A中图分类号:TP18doi:10.3778/j.issn.1002-8331.1905-0089折延宏,胡梦婷,贺晓丽,等.两种多粒度形式概念分析模型的比较研究.计算机工程与应用,2020,56(10):51-55. SHE Yanhong,HU Mengting,HE Xiaoli,et parative study between two multigranulation formal concept analysis puter Engineering and Applications,2020,56(10):51-55.Comparative Study Between Two Multigranulation Formal Concept Analysis ModelsSHE Yanhong1,HU Mengting2,HE Xiaoli1,ZENG Wanglin21.College of Science,Xi’an Shiyou University,Xi’an710065,China2.College of Computer Science,Xi’an Shiyou University,Xi’an710065,ChinaAbstract:Multigranulation formal concept analysis is one hot topic in the research area of formal concept analysis, among others,attribute clustering and attribute granulation are two representative methods.This paper performs a compar-ative study between these two methods based on Wille formal concept analysis.A type of Wille concept analysis model has been introduced based on attribute clustering,and then it has been shown that the model based on attribute granulation is a particular case based on attribute clustering.Furthermore,this paper extends object-oriented formal concept analysis model based on attribute granulation to that based on attribute clustering,and studies the changing law of extents and pro-vides a necessary and sufficient condition for the fact that the extents remain unchanged after clustering,the obtained results further generalize the existing results.Key words:attribute granulation;attribute clustering;Wille concept lattice;object-oriented concept lattice基金项目:国家自然科学基金(No.61976244,No.61472471);陕西省创新人才推进计划-青年科技新星项目(No.2017KJXX60);陕西省教育厅科研计划项目(No.18JK0625)。
⦾大数据与云计算⦾随着数据挖掘领域的发展,关联规则的可视化作为一种重要的知识发现和模式识别方法,已经成为一个重要的研究方向。
现有的机器学习方法虽然能够从大量的原始数据中提炼出关键信息,但是这些信息只有在经过人们的理解并产生最后的决策的时候才能真正体现它们的价值,而可视化恰恰能帮人们完成这最重要的一点。
数据可视化是通过可视化技术把原始数据之间不容易被人发现的数据关系给表示出让人易于发现的模式,关联规则作为一种重要的规则,表现数据之间的相关关系,帮助用户进行数据分析。
概念格是一种在海量数据中提取关联信息的工具,概念格的生成过程其实就是概念聚类的过程,通过生成Hasse图能够直观表示出以概念格为背景的关联规则可视化杨葛英1,2,沈夏炯1,2,史先进1,张磊1,21.河南大学计算机与信息工程学院,河南开封4750042.河南大学河南省大数据分析与处理重点实验室,河南开封475004摘要:传统的关联规则表示方法无法展示概念之间的本质关系,缺少对概念层面的认识,忽略了知识发现结果的共享等问题,而概念格作为一种能够生动简洁地体现概念之间泛化和例化关系的数据结构,在对关联规则可视化和发现潜在知识方面也有着独特的优势。
提出了以概念格为背景的关联规则可视化方法,以概念为查找单元,在概念格中寻找需要展示的关联规则路径,将属性之间的关联关系扩展到概念层面,并给出了相对应的多模式规则的可视化的策略与算法。
结合某校图书馆借书记录数据,进行关联规则分析与可视化实现。
实验结果表明,该可视化方法在知识发现和共享方面具有良好的效果。
关键词:概念格;关联规则;泛化和例化;知识发现;可视化文献标志码:A中图分类号:TP391doi:10.3778/j.issn.1002-8331.2002-0368Visualization of Association Rules in Context of Concept LatticesYANG Geying1,2,SHEN Xiajiong1,2,SHI Xianjin1,ZHANG Lei1,21.School of Computer and Information Engineering,Henan University,Kaifeng,Henan475004,China2.Henan Key Laboratory of Big Data Analysis and Processing,Kaifeng,Henan475004,ChinaAbstract:Traditional rule representation methods cannot show the nature of the relationship between concepts,the lack of understanding of the concept hierarchy,ignoring the problem such as sharing the results of knowledge discovery,and concept lattice as a data structure can succinctly vivid embodiment of generalization and instantiated in the relationship between the concepts,in terms of knowledge visualization and association rules found potential also has a unique advantage. This paper proposes an association rule visualization method with concept lattice as the background,takes concept lattice as the search unit,looks for the association rule path to be displayed in concept lattice,extends the association relation between attributes to the conceptual level,and gives the corresponding visualization strategy and algorithm of multi-pattern rules.Finally,the association rules are analyzed and visualized based on the library data.Experimental results show that the visualization method is effective in knowledge discovery and sharing.Key words:concept lattice;association rules;generalization and instantiated;knowledge discovery;visualization基金项目:国家自然科学基金(61402149);河南省科技厅科技攻关计划基金(182102110065,182102210238);河南省高等学校青骨干教师培养计划(2019GGJS040)。
形式概念分析中的对象概念与属性概念智慧来;智东杰【摘要】为了进一步提高数据表示和数据挖掘的效率,对两类特殊概念即对象概念和属性概念进行了研究。
分析了对象概念和属性概念与不可约元的关系,提出了对象概念和属性概念的识别算法;提出了以属性概念为递归终止条件的计算内涵缩减递归算法;研究了属性排序以及属性序列在规则提取中的应用。
%In order to further facilitate data representation and improve the efficiency of data mining, two kinds of special con-cepts, namely object concept and attribute concept are studied. This paper analyzes relationship between object concepts(or attri-bute concepts)and irreducible elements, and recognition algorithms of object concepts and attribute concepts are put forward. A recursive algorithm for intent reduction which has attribute concepts as termination condition is given. Attributes sequence as well as its application in association rule extraction is studied.【期刊名称】《计算机工程与应用》【年(卷),期】2013(000)018【总页数】4页(P112-115)【关键词】形式概念分析;对象概念;属性概念;关联规则【作者】智慧来;智东杰【作者单位】河南理工大学计算机科学与技术学院,河南焦作,454150;河南理工大学计算机科学与技术学院,河南焦作,454150【正文语种】中文【中图分类】TP18形式概念分析[1]是Ganter B和Wille R提出的,以序理论和完备格理论为基础,依据数据库中提供的基本信息建立起的一种刻画对象与属性之间关系的数学结构。
形式概念分析强调以人的认知为中心,提供了一种与传统的、统计的数据分析和知识表示完全不同的方法。
由于它便于概念结构的开发和讨论,在某种意义上,概念格已经变成了一种外部认知的手段[2]。
概念格已经有许多比较成功的应用,例如:姜峰等利用扩展概念格在Web上进行服务关系的自动挖掘和维护[3],丁卫平等利用形式概念分析的理论对不完备电子病历系统进行数据挖掘[4]。
为了进一步提高数据表示和数据挖掘的效率,有必要对其中的特殊概念进行更深入的研究。
以下的定义来源于Ganter B和Wille R的著作“Formal Concept Analysis:Ma thematical Foundation”[1]。
为了本文写作的需要,使用的符号和论述方式可能有所不同。
定义1设K=(G,Μ,I)是一个形式背景,A⊆G,B⊆Μ。
如果A、B满足条件f (A)=B、g(B)=A,则称序对(A,B)为形式背景K的一个概念。
A称为概念(A,B)的外延,B称为概念(A,B)的内涵。
L(G,Μ,I)或L(K)表示K中所有概念全体构成的集合,即:L(G,Μ,I)={(A×B)∈G×Μ,f(A)=B,g(B)=A}。
其中,f(A)={m∈Μ|∀g∈A,gIm},g(B)={g∈G|∀m∈B,gIm}。
定义2设K=(G,Μ,I)是一个形式背景,(A1,B1)、(A2,B2)∈L(K),如果A1⊆A2或B1⊇B2,称(A1,B1)是(A2,B2)的子概念,记为(A1,B1)≤(A2,B2)。
显然L(K)关于“≤”构成一个格,称为概念格。
定义3在一个概念格中,如果一个概念具有形式(g(f(g)),f(g))且g∈G,则称(g(f(g)),f(g))是一个对象概念;如果一个概念具有形式(g(m),f(g(m)))且m∈Μ,则称(g(m),f(g(m)))是一个属性概念。
定义4集合Μ与N之间的二元关系R是有序二元组(m,n)的集合,其中m∈Μ,n∈N,即R⊆Μ×N,这里的×是笛卡儿积,(m,n)∈R,也常记做mRn,如果Μ=N,则称R是Μ上的二元关系。
R的逆关系用R-1表示,即nR-1m⇔mRn。
定义5集合Μ上的二元关系R称为一个偏序关系,如果对所有的x,y,z∈Μ 都有:①xRx;②xRy和x≠y⇒不是yRx;③xRy和yRz⇒xRz。
偏序关系R常用≤来表示,当x≤y且x≠y时,写做x<y。
一个集合Μ及其上的序≤形成的有序二元组(Μ,≤)称为半序集。
定义6令(Μ,≤)是一个半序集,A是Μ的子集,Μ中的元素s满足∀a∈A都有s≤a,则称s是A的一个下界。
对偶地,若Μ中的元素s满足∀a∈A都有s≥a,则称s是A的一个上界。
如果A的所有下界组成的集合中有最大元素,则称这个元素为A的下确界,记inf A或∧A。
对偶地,上界集合的最小元素称为上确界,记sup A或∨A。
定义7一个半序集(V,≤),如果V中任意两个元素x,y的上确界及下确界都存在,则称V是一个格。
如果V的任何子集X的上确界及下确界都存在,则称V 是一个完全格。
定义8对于完全格V的一个元素v,定义vl=∨{x∈V|x<v},vu=∨{x∈V|x<v},如果v≠vl即v不是严格小于它的那些元素的上确界,则称v是上确界不可约的,或者称v是上确界不可约元;如果v≠vu,即v不是严格大于它的那些元素的下确界,则称v是下确界不可约的,或者称v是下确界不可约元。
在不区分上确界不可约元和下确界不可约元的情况下,它们统称为不可约元。
定义9 a称为b的下近邻,当a<b,且没有c满足a<c<b,这时也称b是a的上近邻,并且记做a≺b。
命题1有限格的一个元素是上确界不可约的,当且仅当它有且仅有一个下近邻;一个元素是下确界不可约的,当且仅当它有且仅有一个上近邻。
在概念格中,一个概念的下近邻是它的子概念,一个概念的上近邻是它的父概念。
定理1 对象概念是上确界不可约元,上确界不可约元一定是对象概念;对偶的,属性概念是下确界不可约元,下确界不可约元一定是属性概念。
证明如果一个概念有两个或两个以上的下近邻,则这个概念的外延缩减的势大于等于2,因此不存在唯一一个对象g∈G使得(g(f(g)),f(g))成立;如果一个概念只有一个下近邻,则这个概念的对象标签为这个概念的外延减去下近邻概念的外延。
根据概念格的对偶原理,可知定理的后半部分成立。
根据定理1可以得到概念格中对象概念的识别算法,同时为对象概念贴上对象标签。
算法1概念格中对象概念的识别算法步骤1 访问概念格中的最小概念,如果其外延非空,那么这个概念是一个对象概念,标签为外延中的对象。
步骤2 访问最小概念的所有父概念,若访问的概念只有最小概念作为其下近邻,那么这个概念是一个对象概念,标签为概念外延减去最小概念的概念外延。
步骤3 访问步骤2中已经访问的所有概念的父概念,直到最大概念为止,若访问的概念只有一个子概念,那么这个概念是一个对象概念,标签为概念外延减去其子概念的概念外延。
对偶地,可以得到概念格中属性概念的识别算法。
定义10对于任意的g1∈G,g2∈G,如果 f(g1)⊂f(g2)或者 f(g2)⊂f(g1)成立,则称g1和g2是可比的,并记做g1<g2或者g2<g1;否则称g1和g2是不可比的,并记做g1||g2。
对偶地,对于任意的m1∈Μ ,m2∈Μ ,如果 g(m1)⊂g(m2)或者g(m2)⊂g(m1)成立,则称m1和m2是可比的,并记做m1<m2或者m2<m1;否则称m1和m2是不可比的,并记做m1||m2。
定理2 对于一个概念,如果概念(A,B)是一个属性概念,并且属性标签是m,那么g(m)=A,并且对于∀m′∈{B-m}有g(m)⊂g(m′);对偶地,如果概念(A,B)是一个对象概念,并且对象标签是g,那么f(g)=B,并且对于∀g′∈{A-g}有f(g)⊂f(g′)。
证明(反证法)假设∃m′∈{B-m}有g(m′)⊂g(m),那么g({m,m′})=g(m′)⊂g(m)=B,可知g(m)⊆g({m,m′})⊂A,产生矛盾。
因此,假设不成立,定理成立。
根据概念格的对偶原理,可知定理的后半部分成立。
性质1在概念格中,如果存在两个可比的对象(属性)概念,那么它们标签中的对象(属性)也是可比的。
定义11在一个对象(属性)集合中,若存在若干对象(属性)是可比的,则删除所有大于最小的对象(属性)的对象(属性),这个操作称为集合的纯化操作,记做purify。
例1 一个形式背景如表1,对应的概念格如图1。
在概念格L(K)中,对象概念有:(1)(123,127),对象标签为1;(2)(23,1278),对象标签为2;(3)(3,12378),对象标签为3;(4)(4,13789),对象标签为4;(5)(56,1246),对象标签为5;(6)(6,12346),对象标签为6。
属性概念有:(1)(123456,1),属性标签为1;(2)(12356,12),属性标签为2;(3)(346,13),属性标签为3;(4)(56,1246),属性标签为4、6;(5)({},Μ),属性标签为5;(6)(1234, 17),属性标签为7;(7)(234,178),属性标签为8;(8)(4,13789),属性标签为9。
根据概念格的结构,对象排序为:(1<2<3)||4||(5<6)。
属性排序为:5<((4,6)<2)||(9<(8<7||3))<1。
对于上面的属性序列,一个纯化操作的例子为:purify(8<7||3)={8,3}。
内涵缩减的应用主要集中在关联规则提取[5]和概念的稳定性分析[6]这两个方面,下面来论述属性概念在计算内涵缩减中的应用。
定义12对于给定的概念C=(A,B),如果属性集合R满足g(R)=g(B)=A,且对于任意的R1⊂R有g(R1)⊃g(R),则称R是C的一个内涵缩减。
内涵缩减的意义在于利用最少的属性识别概念,因此内涵缩减的定义包括两重内容:(1)缩减后的内涵仍然能识别这个对象;(2)缩减后的内涵包括的属性是最少的。
对偶地,可以定义外延缩减:对于给定的概念C=(A,B),如果属性集合S满足下述两个条件:(1)f(S)=f(A)=B;(2)对于任意的S1⊂S有 f(S1)⊃f(S);则称R是C的一个外延缩减。
利用内涵缩减,可以得到关联规则。