基于区间型符号数据的群组推荐算法研究郭均鹏
- 格式:pdf
- 大小:293.57 KB
- 文档页数:5
基于数据场的改进LOF算法MENG Haidong;SUN Xinjun;SONG Yuchen【摘要】LOF(Local Outlier Factor)是一种经典基于密度的局部离群点检测算法,为提高算法的精确度,以便更精准挖掘出局部离群点,在LOF算法的基础上,提出了一种基于数据场的改进LOF离群点检测算法.通过对数据集每一维的属性值应用数据场理论,计算势值,进而引入平均势差的概念,针对每一维度中大于平均势差的任意两点在计算距离时加入一个权值,从而提高离群点检测的精确度,实验结果表明该算法是可行的,并且拥有更高的精确度.【期刊名称】《计算机工程与应用》【年(卷),期】2019(055)003【总页数】5页(P154-158)【关键词】数据挖掘;局部可达密度;数据场;平均势差;局部离群因子【作者】MENG Haidong;SUN Xinjun;SONG Yuchen【作者单位】【正文语种】中文【中图分类】TP311;TP181 引言在数据挖掘领域中,离群点检测是一个非常重要的研究方向,关注的数据对象是不同于正常情况的异常数据,这些数据不同于预期对象,只在数据集中占有极其稀少的比重。
离群点检测最早的定义由Hawkins提出:“异常是在数据集中与众不同的数据,使人们怀疑这些数据并非随机产生的,而是产生于完全不同的机制”。
在实际应用中,离群点检测已经在多个领域中取得了成功,如欺诈检测、公共安全、图像处理、工业损毁检测等[1]。
离群点检测大致可以分为以下几类[2-12]:基于统计的方法、基于距离的方法、基于密度的方法、基于聚类的方法、基于分类的方法。
文献[5]提出了一种基于多重聚类的方法;文献[6]提出了基于K-means的数据流方法;文献[7]提出了基于粗约简和网格的方法;文献[8]提出了基于混合式聚类算法的方法。
LOF(Local Outlier Factor)算法[9-12]是一种基于密度的方法,该方法将一个表征数据离群程度的局部离群因子赋予每个数据对象,根据局部离群因子的数值来确定离群点。
改进的基于符号数据的协同过滤推荐算法郭均鹏;陈莹莹【期刊名称】《计算机应用》【年(卷),期】2011(031)011【摘要】With the continuing increase of users and kinds of resources, the problem of rating matrix's sparsity is becoming more and more prominent, which seriously affects the quality of the recommendation system. Singular Value Decomposition (SVD) is a dimension reduction method, and Symbolic Data Analysis (SDA) is a new analytical approach to processing mass data. This paper proposed a new collaborative filtering recommendation algorithm which combines SVD with SDA. The experimental results based on EachMovie database set indicate that the proposed method is significantly better than traditional general recommendation algorithm when the data is particularly sparse.%随着用户和资源种类的不断增加,评价矩阵的稀疏性问题越来越突出,严重影响了推荐系统的推荐质量.奇异值分解(SVD)是一种对数据进行降维处理的方法,符号数据分析(SDA)是一种处理海量数据的全新数据分析思路.提出一种改进的基于符号数据的协同过滤推荐算法,即将奇异值分解和符号数据分析方法结合起来运用到推荐系统中.在EachMovie数据库集上的实验结果表明该算法在数据稀疏时的推荐质量明显优于传统的推荐算法.【总页数】4页(P3060-3062,3067)【作者】郭均鹏;陈莹莹【作者单位】天津大学管理与经济学部,天津300072;天津大学管理与经济学部,天津300072【正文语种】中文【中图分类】TP301.6;TP391.3【相关文献】1.社交网络下非结构化数据协同过滤推荐算法改进 [J], 王腾飞;孙华2.改进的面向数据稀疏的协同过滤推荐算法 [J], 高倩;何聚厚3.一种改进的缺失数据协同过滤推荐算法 [J], 周明升;韩冬梅4.基于数据稀疏性的协同过滤推荐算法改进研究 [J], 岳希; 唐聃; 舒红平; 安义文5.基于数据稀疏性的协同过滤推荐算法改进研究 [J], 岳希; 唐聃; 舒红平; 安义文因版权原因,仅展示原文概要,查看原文内容请购买。
基于区间数的多级模糊优选模型
段宝彬
【期刊名称】《河海大学学报(自然科学版)》
【年(卷),期】2004(032)004
【摘要】以区间数表示模糊集的相对隶属度,引入相对优势度对区间数的大小进行比较,建立一个多级模糊优选模型,解决了由于相对隶属度求解方法不同而导致方案优选中评价结果不一致的问题.
【总页数】3页(P478-480)
【作者】段宝彬
【作者单位】河海大学理学院,江苏,南京,210098
【正文语种】中文
【中图分类】O159
【相关文献】
1.改进层次分析-多级模糊评判的给水处理工艺优选模型 [J], 王圃;张晋;华佩
2.基于熵权的多级模糊优选模型在软基处理中的应用 [J], 李海龙
3.基于多目标模糊优选模型的水资源优化调度——以山西东山供水工程区为例 [J], 邓安利;王帅;王敏黛;郭清海
4.权监督多级模糊优选模型 [J], 王建明;陈守煜
5.基于区间数的企业科技报告质量评价与优选模型研究 [J], 王宏;周育忠;石嘉豪因版权原因,仅展示原文概要,查看原文内容请购买。
Research on Obtaining the Weights of Index Group Based on Modified Interval Number Density
Aggregation Operator
作者: 贺芳
作者机构: 天津大学理学院,天津300072
出版物刊名: 运筹与管理
页码: 133-138页
年卷期: 2013年 第4期
主题词: 群决策 区间数 改进的区间数密度集结算子 模糊聚类 群组权重
摘要:针对指标数据已知,而权重数据未知的群组赋权问题,给出了一种基于改进的区间数密度集结算子来进行指标群组赋权的决策方法。
首先给出了区间数和区间数密度集结算子(IDM)的定义及性质,改进了以前区间数聚类的方法,应用直接法对一维区间数据组进行聚类,并定义了模糊统计量,以确定最为合理的一种聚类方式。
然后基于改进的区间数密度集结
算子这种数学模型,来解决指标值数据已知,而权重未知的群组赋权问题。
最后举例说明该方
法的可行性和实用性。
一种区间PCA的效度分析方法
郭均鹏;李汶华
【期刊名称】《系统工程学报》
【年(卷),期】2009(024)002
【摘要】关于区间数据的主成分分析(PCA)方法已取得了较丰富的研究成果,但少见对这些方法效度的评价研究.针对该问题,基于Hausdorff距离用于定义两个紧集之间距离的考虑,将区间数视为一个紧集,定义了区间数之间的距离,并研究了区间矩阵的距离.在此基础上,根据PCA方法的原理,建立了一个区间PCA方法的效度评价指标.该指标取值在0与1之间,其取值越大,说明区间PCA方法效度越高,反之则效度越小.最后,采用模拟的方法,分别选取均匀分布和正态分布两种类型的区间数据样本,对目前最常用的两种区间PCA方法--顶点法和中点法进行了效度分析,验证了文中所提的效度指标的正确性.
【总页数】5页(P226-230)
【作者】郭均鹏;李汶华
【作者单位】天津大学管理学院,天津,300072;天津大学管理学院,天津,300072【正文语种】中文
【中图分类】O212.4
【相关文献】
1.一种区间不确定性参数的敏感度与可靠性分析方法 [J], 唐忠;李文强;李彦
2.一种耦合区间-随机混合可靠性分析方法 [J], 谢少军;潘柏松;罗路平;项涌涌
3.一种基于区间过程模型的时变可靠性分析方法 [J], 李金武;李金洋;姜潮;倪冰雨;杨刚
4.一种考虑模糊不确定性的概率-区间混合结构可靠性分析方法 [J], 吴钰龙;姜潮
5.一种基于支持向量机的PCA分析方法 [J], 卢正鼎;赵萍
因版权原因,仅展示原文概要,查看原文内容请购买。