基于区间型符号数据的群组推荐算法研究郭均鹏
- 格式:pdf
- 大小:293.57 KB
- 文档页数:5
基于数据场的改进LOF算法MENG Haidong;SUN Xinjun;SONG Yuchen【摘要】LOF(Local Outlier Factor)是一种经典基于密度的局部离群点检测算法,为提高算法的精确度,以便更精准挖掘出局部离群点,在LOF算法的基础上,提出了一种基于数据场的改进LOF离群点检测算法.通过对数据集每一维的属性值应用数据场理论,计算势值,进而引入平均势差的概念,针对每一维度中大于平均势差的任意两点在计算距离时加入一个权值,从而提高离群点检测的精确度,实验结果表明该算法是可行的,并且拥有更高的精确度.【期刊名称】《计算机工程与应用》【年(卷),期】2019(055)003【总页数】5页(P154-158)【关键词】数据挖掘;局部可达密度;数据场;平均势差;局部离群因子【作者】MENG Haidong;SUN Xinjun;SONG Yuchen【作者单位】【正文语种】中文【中图分类】TP311;TP181 引言在数据挖掘领域中,离群点检测是一个非常重要的研究方向,关注的数据对象是不同于正常情况的异常数据,这些数据不同于预期对象,只在数据集中占有极其稀少的比重。
离群点检测最早的定义由Hawkins提出:“异常是在数据集中与众不同的数据,使人们怀疑这些数据并非随机产生的,而是产生于完全不同的机制”。
在实际应用中,离群点检测已经在多个领域中取得了成功,如欺诈检测、公共安全、图像处理、工业损毁检测等[1]。
离群点检测大致可以分为以下几类[2-12]:基于统计的方法、基于距离的方法、基于密度的方法、基于聚类的方法、基于分类的方法。
文献[5]提出了一种基于多重聚类的方法;文献[6]提出了基于K-means的数据流方法;文献[7]提出了基于粗约简和网格的方法;文献[8]提出了基于混合式聚类算法的方法。
LOF(Local Outlier Factor)算法[9-12]是一种基于密度的方法,该方法将一个表征数据离群程度的局部离群因子赋予每个数据对象,根据局部离群因子的数值来确定离群点。
改进的基于符号数据的协同过滤推荐算法郭均鹏;陈莹莹【期刊名称】《计算机应用》【年(卷),期】2011(031)011【摘要】With the continuing increase of users and kinds of resources, the problem of rating matrix's sparsity is becoming more and more prominent, which seriously affects the quality of the recommendation system. Singular Value Decomposition (SVD) is a dimension reduction method, and Symbolic Data Analysis (SDA) is a new analytical approach to processing mass data. This paper proposed a new collaborative filtering recommendation algorithm which combines SVD with SDA. The experimental results based on EachMovie database set indicate that the proposed method is significantly better than traditional general recommendation algorithm when the data is particularly sparse.%随着用户和资源种类的不断增加,评价矩阵的稀疏性问题越来越突出,严重影响了推荐系统的推荐质量.奇异值分解(SVD)是一种对数据进行降维处理的方法,符号数据分析(SDA)是一种处理海量数据的全新数据分析思路.提出一种改进的基于符号数据的协同过滤推荐算法,即将奇异值分解和符号数据分析方法结合起来运用到推荐系统中.在EachMovie数据库集上的实验结果表明该算法在数据稀疏时的推荐质量明显优于传统的推荐算法.【总页数】4页(P3060-3062,3067)【作者】郭均鹏;陈莹莹【作者单位】天津大学管理与经济学部,天津300072;天津大学管理与经济学部,天津300072【正文语种】中文【中图分类】TP301.6;TP391.3【相关文献】1.社交网络下非结构化数据协同过滤推荐算法改进 [J], 王腾飞;孙华2.改进的面向数据稀疏的协同过滤推荐算法 [J], 高倩;何聚厚3.一种改进的缺失数据协同过滤推荐算法 [J], 周明升;韩冬梅4.基于数据稀疏性的协同过滤推荐算法改进研究 [J], 岳希; 唐聃; 舒红平; 安义文5.基于数据稀疏性的协同过滤推荐算法改进研究 [J], 岳希; 唐聃; 舒红平; 安义文因版权原因,仅展示原文概要,查看原文内容请购买。
基于区间数的多级模糊优选模型
段宝彬
【期刊名称】《河海大学学报(自然科学版)》
【年(卷),期】2004(032)004
【摘要】以区间数表示模糊集的相对隶属度,引入相对优势度对区间数的大小进行比较,建立一个多级模糊优选模型,解决了由于相对隶属度求解方法不同而导致方案优选中评价结果不一致的问题.
【总页数】3页(P478-480)
【作者】段宝彬
【作者单位】河海大学理学院,江苏,南京,210098
【正文语种】中文
【中图分类】O159
【相关文献】
1.改进层次分析-多级模糊评判的给水处理工艺优选模型 [J], 王圃;张晋;华佩
2.基于熵权的多级模糊优选模型在软基处理中的应用 [J], 李海龙
3.基于多目标模糊优选模型的水资源优化调度——以山西东山供水工程区为例 [J], 邓安利;王帅;王敏黛;郭清海
4.权监督多级模糊优选模型 [J], 王建明;陈守煜
5.基于区间数的企业科技报告质量评价与优选模型研究 [J], 王宏;周育忠;石嘉豪因版权原因,仅展示原文概要,查看原文内容请购买。
Research on Obtaining the Weights of Index Group Based on Modified Interval Number Density
Aggregation Operator
作者: 贺芳
作者机构: 天津大学理学院,天津300072
出版物刊名: 运筹与管理
页码: 133-138页
年卷期: 2013年 第4期
主题词: 群决策 区间数 改进的区间数密度集结算子 模糊聚类 群组权重
摘要:针对指标数据已知,而权重数据未知的群组赋权问题,给出了一种基于改进的区间数密度集结算子来进行指标群组赋权的决策方法。
首先给出了区间数和区间数密度集结算子(IDM)的定义及性质,改进了以前区间数聚类的方法,应用直接法对一维区间数据组进行聚类,并定义了模糊统计量,以确定最为合理的一种聚类方式。
然后基于改进的区间数密度集结
算子这种数学模型,来解决指标值数据已知,而权重未知的群组赋权问题。
最后举例说明该方
法的可行性和实用性。
一种区间PCA的效度分析方法
郭均鹏;李汶华
【期刊名称】《系统工程学报》
【年(卷),期】2009(024)002
【摘要】关于区间数据的主成分分析(PCA)方法已取得了较丰富的研究成果,但少见对这些方法效度的评价研究.针对该问题,基于Hausdorff距离用于定义两个紧集之间距离的考虑,将区间数视为一个紧集,定义了区间数之间的距离,并研究了区间矩阵的距离.在此基础上,根据PCA方法的原理,建立了一个区间PCA方法的效度评价指标.该指标取值在0与1之间,其取值越大,说明区间PCA方法效度越高,反之则效度越小.最后,采用模拟的方法,分别选取均匀分布和正态分布两种类型的区间数据样本,对目前最常用的两种区间PCA方法--顶点法和中点法进行了效度分析,验证了文中所提的效度指标的正确性.
【总页数】5页(P226-230)
【作者】郭均鹏;李汶华
【作者单位】天津大学管理学院,天津,300072;天津大学管理学院,天津,300072【正文语种】中文
【中图分类】O212.4
【相关文献】
1.一种区间不确定性参数的敏感度与可靠性分析方法 [J], 唐忠;李文强;李彦
2.一种耦合区间-随机混合可靠性分析方法 [J], 谢少军;潘柏松;罗路平;项涌涌
3.一种基于区间过程模型的时变可靠性分析方法 [J], 李金武;李金洋;姜潮;倪冰雨;杨刚
4.一种考虑模糊不确定性的概率-区间混合结构可靠性分析方法 [J], 吴钰龙;姜潮
5.一种基于支持向量机的PCA分析方法 [J], 卢正鼎;赵萍
因版权原因,仅展示原文概要,查看原文内容请购买。
Hierarchical Clustering of Generally Distributed
Interval Symbolic Data
作者: 李汶华 戴晖 郭均鹏 高飒 邓登
作者机构: 天津大学管理与经济学部,天津300072
出版物刊名: 数理统计与管理
页码: 1071-1078页
年卷期: 2013年 第6期
主题词: 符号数据 系统聚类 Hausdorff距离 区间数
摘要:现有的区间型符号数据的研究大多假定个体在区间内服从均匀分布,实际上往往并非如此。
针对该问题,研究了一般分布条件下区间型符号数据的系统聚类方法。
阐述了一般分布区间型符号数据的定义,在一般分布的区间型符号数据的描述统计基础上,给出了基于Hausdorff距离的一般分布的区间型符号数据系统聚类算法,并通过随机模拟对聚类有效性进行评价。
结果表明:与个体服从均匀分布的假设相比,一般分布的区间型符号数据的系统聚类分析有效性更好。
最后将文中方法应用于电子商务客户价值的评价,进行了应用研究。
高校科研绩效的区间数综合评判方法
郭志林;郭东林
【期刊名称】《湖北民族学院学报(自然科学版)》
【年(卷),期】2011(029)001
【摘要】建立了高校科研成果绩效评价的指标体系,在基于可信度的区间数排序方法的基础上,提出了一种基于粗糙集理论的区间数综合评判方法,克服了权重确定的主观性,使评判结果更加科学、客观.
【总页数】5页(P75-79)
【作者】郭志林;郭东林
【作者单位】商丘师范学院数学系,河南,商丘,476000;商丘师范学院数学系,河南,商丘,476000
【正文语种】中文
【中图分类】O159
【相关文献】
1.基于区间数灰色模糊综合评判的继电保护维修决策方法研究 [J], 张媛;覃剑;王谦;陈伟;张海兵
2.基于三元区间数的模糊综合评判方法及应用 [J], 刘国锋;郭丽;包玉娥
3.区间数模糊综合评判在高校微课\r评价中的应用 [J], 苏钰淳;徐洪香;常帅
4.区间数模糊综合评判方法在桥梁评估中的应用 [J], 魏召兰;黄显彬;刘国军;蒲黔辉
5.灾害损失评估的区间数模糊综合评判方法 [J], 吴红华;李正农
因版权原因,仅展示原文概要,查看原文内容请购买。
一种基于符号数据的群体推荐算法
郭均鹏;高成菊;赵旻昊
【期刊名称】《系统工程学报》
【年(卷),期】2015(030)001
【摘要】基于符号数据分析所具有的能够有效地对海量数据进行降维并从整体上把握样本属性的优势,设计了基于区间型和分布式符号数据的模型建立方法,分别建立符号数据描述的目标群体用户模型和目标项目模型,并将目标项目模型分解为积极子模型和消极子模型来表示.进而计算目标群体模型与目标项目积极子模型、消极子模型之间的相似度,最终产生推荐.选取为群体用户推荐美食作为实例,通过大众点评网收集用户评分数据,对文中算法进行评价,结果表明该算法能取得良好的推荐精度,且在群体较小及数据稀疏时,推荐质量明显优于传统基于点数据描述群体用户模型的协同过滤算法.
【总页数】8页(P127-134)
【作者】郭均鹏;高成菊;赵旻昊
【作者单位】天津大学管理与经济学部,天津300072;天津大学管理与经济学部,天津300072;天津大学软件学院,天津300072
【正文语种】中文
【中图分类】TP311
【相关文献】
1.改进的基于符号数据的协同过滤推荐算法 [J], 郭均鹏;陈莹莹
2.基于区间型符号数据的群组推荐算法研究 [J], 郭均鹏;宁静;史志奇
3.一种基于符号关系图的快速符号数据聚类算法 [J], 张岩金;白亮
4.基于分布式符号数据的混合推荐算法研究 [J], 钟乾;王仲君
5.基于符号数据与非负矩阵分解法的混合推荐算法 [J], 郭均鹏;王启鹏;宁静;李嫒嫒
因版权原因,仅展示原文概要,查看原文内容请购买。
区间信度环境下基于偏好熵的随机格序排列方法郭春香;龚浩;郭耀煌【期刊名称】《运筹与管理》【年(卷),期】2013(000)003【摘要】针对偏好优劣关系的信度为区间值的决策偏好系统,运用熵理论提出了一种基于区间值分布偏好向量的决策分析方法。
首先,将决策者对方案的偏好描述由:优于、劣于、等价和不可比这四种关系拓广为优于、劣于、等价、无法比较但有上确界、无法比较但有下确界、无法比较且有上确界又下确界、不可比七种偏好关系,并结合区间证据的概念和性质给出了决策偏好系统的区间值分布偏好向量与相对熵的概念、性质。
然后,构建了基于偏好熵的证据推理非线性优化模型,通过求解模型,并结合优先原则和集结规则将个人偏好集结成群体偏好,给出了该决策方法的具体步骤,举例说明了方法的可行性。
% A method of random lattice order decision analysis based on interval-valued distribution preference vec-tor by entropy theory is proposed, focused on decision preference system with preference relations ’ belief degree described by interval-value.First, the preference characterization of decision makers is extended from four varie-ty relations to seven variety preference relations , combined with the concept and property of interval evidence , the concept and property of interval-valued distribution preference vector and relative entropy on the lattice order preference system are given.Then the ER nonlinear optimization model based on preference entropy is estab-lished, the individual preferences are aggregated by applying the priority rulesand intersection rule , and the spe-cific steps of the decision making are qiven .The feasibility and effectiveness of the approach proposed in this paper are illustrated with a numerical example .【总页数】9页(P21-29)【作者】郭春香;龚浩;郭耀煌【作者单位】四川大学工商管理学院,四川成都 610064;四川大学工商管理学院,四川成都 610064;西南交通大学经济管理学院,四川成都 610031【正文语种】中文【中图分类】C934【相关文献】1.基于区间概率偏好的随机格序群决策方法 [J], 郭春香;郭强;郭耀煌2.基于决策者偏好的区间型属性熵权确定方法 [J], 周荣喜;何大义;徐建荣3.一种基于序区间偏好信息的群决策分析方法 [J], 陈侠;樊治平4.基于格序偏好距离的群决策方法 [J], 郭强;郭春香;郭耀煌5.基于区间二型犹豫熵与风险偏好的多属性决策方法 [J], 吴涛;李燕飞;郭海艳因版权原因,仅展示原文概要,查看原文内容请购买。