当前位置：文档之家› 数据挖掘顶级期刊简介

数据挖掘顶级期刊简介

顶级会议第一KDD 第二SIAM ICDM

中国计算机学会推荐国际学术刊物

(数据库、数据挖掘与内容检索)

序号刊物简称刊物全称出版社网址

1 TODS ACM Transactions on Database Systems ACM https://www.doczj.com/doc/fb14255517.html,/tods/

2 TOIS ACM Transactions on Information and

Systems ACM https://www.doczj.com/doc/fb14255517.html,/pubs/tois/

3 TKDE IEEE Transactions on Knowledge and Data Engineering IEEE Computer Society https://www.doczj.com/doc/fb14255517.html,/tkde/

4 VLDBJ VLDB Journal S pringer-Verlag

https://www.doczj.com/doc/fb14255517.html,/dblp/db/journals/vldb/index.html

二、B类

序号刊物简称刊物全称出版社网址

1 TKDD ACM Transactions on Knowledge Discovery from Data ACM

https://www.doczj.com/doc/fb14255517.html,/pubs/tkdd/

2 AEI Advanced Engineering Informatics Elsevier

https://www.doczj.com/doc/fb14255517.html,/wps/find/journaldescription.

cws_home/622240/

3 DKE Data and Knowledge Engineering Elsevier

https://www.doczj.com/doc/fb14255517.html,/science/journal/

0169023X

4 DMKD Data Mining and Knowledge DiscoverySpringer

https://www.doczj.com/doc/fb14255517.html,/content/100254/

5 EJIS European Journal of Information Systems The OR Society

https://www.doczj.com/doc/fb14255517.html,/ejis/

6 GeoInformatica Springer https://www.doczj.com/doc/fb14255517.html,/content/1573-7624/

7 IPM Information Processing and Management Elsevier

https://www.doczj.com/doc/fb14255517.html,/locate/infoproman

8 Information Sciences Elsevier https://www.doczj.com/doc/fb14255517.html,/locate/issn/00200255

9 IS Information Systems Elsevier

https://www.doczj.com/doc/fb14255517.html,/information-systems/

10 JASIST Journal of the American Society for Information Science and Technology

American Society for Information Science and Technology https://www.doczj.com/doc/fb14255517.html,/Publications/JASIS/jasis.html

11 JWS Journal of Web Semantics Elsevier https://www.doczj.com/doc/fb14255517.html,/locate/inca/671322

12 KIS Knowledge and Information Systems Springer https://www.doczj.com/doc/fb14255517.html,/journal/10115

13 TWEB ACM Transactions on the Web ACM https://www.doczj.com/doc/fb14255517.html,/

三、C类

序号刊物简称刊物全称出版社网址

1 DPD Distributed and Parallel Databases Springer

https://www.doczj.com/doc/fb14255517.html,/content/1573-7578/

2 I&M Information and Management E lsevier https://www.doczj.com/doc/fb14255517.html,/locate/im/

3 IPL Information Processing Letters Elsevier https://www.doczj.com/doc/fb14255517.html,/locate/ipl

4 Information Retrieval Springer https://www.doczj.com/doc/fb14255517.html,/issn/1386-4564

5 IJCIS International Journal of Cooperative Information Systems World Scientific

https://www.doczj.com/doc/fb14255517.html,/ijcis

6 IJGIS International Journal of Geographical Information Science Taylor & Francis

https://www.doczj.com/doc/fb14255517.html,/journals/tf/13658816.html

7 IJIS International Journal of Intelligent Systems Wiley

https://www.doczj.com/doc/fb14255517.html,/jpages/0884-8173/

8 IJKM International Journal of Knowledge Management IGI

https://www.doczj.com/doc/fb14255517.html,/journals/details.asp?id=4288

9 IJSWIS International Journal on Semantic Web and Information Systems IGI

https://www.doczj.com/doc/fb14255517.html,/

10 JCIS J ournal of Computer Information Systems IACIS

https://www.doczj.com/doc/fb14255517.html,/web/journal.htm

11 JDM Journal of Database Management IGI-Global

https://www.doczj.com/doc/fb14255517.html,/journals/details.asp?id=198

12 JGITM Journal of Global Information Technology Management Ivy League Publishing

https://www.doczj.com/doc/fb14255517.html,/bae/jgitm/

13 JIIS Journal of Intelligent Information Systems Springer

https://www.doczj.com/doc/fb14255517.html,/content/1573-7675/

14 JSIS Journal of Strategic Information Systems Elsevier

https://www.doczj.com/doc/fb14255517.html,/locate/jsis

中国计算机学会推荐国际学术刊物

(数据库、数据挖掘与内容检索)

一、A类

序号刊物简称刊物全称出版社网址

1 TODS ACM Transactions on Database Systems ACM https://www.doczj.com/doc/fb14255517.html,/tods/

2 TOIS ACM Transactions on Information and

Systems ACM https://www.doczj.com/doc/fb14255517.html,/pubs/tois/

3 TKDE IEEE Transactions on Knowledge and Data Engineering IEEE Computer Society https://www.doczj.com/doc/fb14255517.html,/tkde/

4 VLDBJ VLDB Journal S pringer-Verlag

https://www.doczj.com/doc/fb14255517.html,/dblp/db/journals/vldb/index.html

二、B类

序号刊物简称刊物全称出版社网址

1 TKDD ACM Transactions on Knowledge Discovery from Data ACM

https://www.doczj.com/doc/fb14255517.html,/pubs/tkdd/

2 AEI Advanced Engineering Informatics Elsevier

https://www.doczj.com/doc/fb14255517.html,/wps/find/journaldescription.

cws_home/622240/

3 DKE Data and Knowledge Engineering Elsevier

https://www.doczj.com/doc/fb14255517.html,/science/journal/

0169023X

4 DMKD Data Mining and Knowledge DiscoverySpringer

https://www.doczj.com/doc/fb14255517.html,/content/100254/

5 EJIS European Journal of Information Systems The OR Society

https://www.doczj.com/doc/fb14255517.html,/ejis/

6 GeoInformatica Springer https://www.doczj.com/doc/fb14255517.html,/content/1573-7624/

7 IPM Information Processing and Management Elsevier

https://www.doczj.com/doc/fb14255517.html,/locate/infoproman

8 Information Sciences Elsevier https://www.doczj.com/doc/fb14255517.html,/locate/issn/00200255

9 IS Information Systems Elsevier

https://www.doczj.com/doc/fb14255517.html,/information-systems/

10 JASIST Journal of the American Society for Information Science and Technology

American Society for Information Science and Technology https://www.doczj.com/doc/fb14255517.html,/Publications/JASIS/jasis.html

11 JWS Journal of Web Semantics Elsevier https://www.doczj.com/doc/fb14255517.html,/locate/inca/671322

12 KIS Knowledge and Information Systems Springer https://www.doczj.com/doc/fb14255517.html,/journal/10115

13 TWEB ACM Transactions on the Web ACM https://www.doczj.com/doc/fb14255517.html,/

三、C类

序号刊物简称刊物全称出版社网址

1 DPD Distributed and Parallel Databases Springer

https://www.doczj.com/doc/fb14255517.html,/content/1573-7578/

2 I&M Information and Management E lsevier https://www.doczj.com/doc/fb14255517.html,/locate/im/

3 IPL Information Processing Letters Elsevier https://www.doczj.com/doc/fb14255517.html,/locate/ipl

4 Information Retrieval Springer https://www.doczj.com/doc/fb14255517.html,/issn/1386-4564

5 IJCIS International Journal of Cooperative Information Systems World Scientific

https://www.doczj.com/doc/fb14255517.html,/ijcis

6 IJGIS International Journal of Geographical Information Science Taylor & Francis

https://www.doczj.com/doc/fb14255517.html,/journals/tf/13658816.html

7 IJIS International Journal of Intelligent Systems Wiley

https://www.doczj.com/doc/fb14255517.html,/jpages/0884-8173/

8 IJKM International Journal of Knowledge Management IGI

https://www.doczj.com/doc/fb14255517.html,/journals/details.asp?id=4288

9 IJSWIS International Journal on Semantic Web and Information Systems IGI

https://www.doczj.com/doc/fb14255517.html,/

10 JCIS J ournal of Computer Information Systems IACIS

https://www.doczj.com/doc/fb14255517.html,/web/journal.htm

11 JDM Journal of Database Management IGI-Global

https://www.doczj.com/doc/fb14255517.html,/journals/details.asp?id=198

12 JGITM Journal of Global Information Technology Management Ivy League Publishing

https://www.doczj.com/doc/fb14255517.html,/bae/jgitm/

13 JIIS Journal of Intelligent Information Systems Springer

https://www.doczj.com/doc/fb14255517.html,/content/1573-7675/

14 JSIS Journal of Strategic Information Systems Elsevier

https://www.doczj.com/doc/fb14255517.html,/locate/jsis

一、以下是一些数据挖掘领域专家牛人的网站，有很多精华，能开阔研究者的思路，在此共享：

1.Rakesh Agrawal

主页：https://www.doczj.com/doc/fb14255517.html,/en-us/people/rakesha/ 数据挖掘领域唯一独有的关联规则研究的创始人，其主要的Apriori算法开启了这一伟大的领域。之前他在IBM研究院工作，目前在微软研究院从事搜索的相关工作。除了关联规则外，他还在Hippocratic Database, Sovereign Information Sharing, and Privacy-Preserving Data Mining等方面做出了开创性的工作。

2.Jiawei Han（韩家炜）

美国伊利诺伊大学香槟分校计算机系正教授，IEEE和ACM院士，美国信息网络学术研究中心主任。曾担任KDD、SDM和ICDM等国际知名会议的程序委员会主席，创办了ACM TKDD学报并任主编。在数据挖掘、数据库和信息网络领域发表论文600余篇，并获得2004 ACM SIGKDD创新奖、2005 IEEE计算机分会技术成就奖、2009 IEEE计算机分会WAllace McDowell Award和2011 Daniel C. Drucker Eminent Faculty Award at UIUC。

主页：https://www.doczj.com/doc/fb14255517.html,/~hanj/

著名数据挖掘书籍，《数据挖掘概念和技术》作者，在DM界久负盛名。他的个人主页里面有很多他的papers，都非常经典；还有他所教授的课程，可以下载课件学习。他的一些杰出的工作集中在关联规则挖掘FP树，异构网络挖掘等。

3.Jon Kleinberg

主页：https://www.doczj.com/doc/fb14255517.html,/home/kleinber/ 康奈尔大学计算机科学家，著名牛掰的HITS

算法的发明人（这里，顺带插一个传说，一次讲座中，有人问Jon的老师HITS（该算法的相关研究工作启发了Google的PageRank算法的诞生）和PAGERANK哪个先提出的？老师炫耀地讲：当然是我们HITS先提出来，而且比PAGERANK要早很多呢。最后有人又问那么早多长时间呢，老师回答：一个星期。呵呵）。目前其主要研究兴趣集中在社区分析上面。

4.Philip S. Yu

主页：https://www.doczj.com/doc/fb14255517.html,/PSYu/ 数据库和数据挖掘领域的重要影响力人物，是为数不多的在工业界（watson research center）和学术界都有绝对影响的。。。更多参见链接https://www.doczj.com/doc/fb14255517.html,/?p=131

5.Jian Pei

http://www.cs.sfu.ca/~jpei/

数据挖掘牛人，经常来中国讲授数据挖掘课程。个人主页上有他发表的数据挖掘相关论文，课程信息，还有一些推荐书籍和源代码。

6.Mohammed J. Zaki

https://www.doczj.com/doc/fb14255517.html,/~zaki/index.php

数据挖掘牛人，个人主页里面有很多精辟的papers，还有课程，相关的源代码，非常的经典。偶像啊O(∩_∩)O~

7.Qiang Yang

https://www.doczj.com/doc/fb14255517.html,t.hk/~qyang/

杨强教授主要研究领域为机器学习、数据挖掘和自动规划。

教授是包括IEEE Intelligent Systems, IEEE Transactions on Knowledge and Data Engineering, Journal of Web Intelligence and Journal of Knowledge and Information Systems在内的多个国际知名期刊的编委。

华为诺亚方舟实验室主任。香港科技大学计算机与工程系教授, IEEE Fellow，IAPR Fellow, AAAS Fellow 和ACM杰出科学家。

8.Wei Wang

https://www.doczj.com/doc/fb14255517.html,/~weiwang/

数据挖掘牛人，个人主页里面有papers，还有教授的数据挖掘课程，生物信息学课程课件。课件非常好，很适合学习，喜欢看她的课件。

9.周志华

https://www.doczj.com/doc/fb14255517.html,/zhouzh/

南京大学数据挖掘牛人，个人主页里面有数据挖掘相关很多资源，收集了国外很多大学的数据挖掘课程。

周志华，南京大学教授，计算机科学与技术系副主任，软件新技术国家重点实验室常务副主任，机器学习与数据挖掘研究所(LAMDA)所长，校、系学术委员会委员;ACM杰出科学家，IEEE Fellow，IAPR Fellow，中国计算机学会会士;长江学者特聘教授，国家杰出青年基金获

得者。

二、一些学习资源/主要是网站

1.Statistical Learning Theory from Berkeley

This course will provide an introduction to probabilistic and computational methods for the statistical modeling of complex, multivariate data. It will concentrate on graphical models, a flexible and powerful approach to capturing statistical dependencies in complex, multivariate data. In particular, the course will focus on the key theoretical and methodological issues of representation, estimation, and inference.

2.Data Mining from Stanford

This will also be helpful.

3.The Lasso Page（略有点old）

The Lasso is a shrinkage and selection method for linear regression. It minimizes the usual sum of squared errors, with a bound on the sum of the absolute values of the coefficients. It has connections to soft-thresholding of wavelet coefficients, forward stagewise regression, and boosting methods.

4.Data Mining Tutorials

This is a really informative website with tutorials on statistical data mining. They were written by Andrew Moore an employee at Google. He covers the foundation of data analysis, including decision trees, Bayesian classifiers and many other techniques we've been learning in class. I great website to check out if you're having trouble with any topics or simply would just like to learn more.

5.Data Mining Research

This is a comprehensive blog about the latest developments in data mining research. Provides a great overview of what scholars and professionals are talking about with regards to the discipline. The individual who started this blog is a working professional in the field, working for FinScore, a Swiss provider of software and professional services focusing in data mining and customer intelligence. A couple very interesting and insightful posts from the blog include: “10 Very Interesting People in Data Mining,”“Data Mining: A New Weapon in the Fight Against Medicaid Fraud,”and “Worst practices in Data Mining.”Stephanie Santoso

6.Statistical Learning Article

An article on the elements on statistical learning, how data mining is used to give predictions. Azai Ighadaro

https://www.doczj.com/doc/fb14255517.html,

This page is devoted to learning methods building on kernels, such as the support vector machine. It grew out of earlier pages at the Max Planck Institute for Biological Cybernetics and at GMD FIRST, snapshots of which can be found here and here. In those days, information about kernel methods was sparse and nontrivial to find, and the kernel machines web site acted as a central

repository for the field. It included a list of people working in the field, and online preprints of most publications.

8.Welcome to https://www.doczj.com/doc/fb14255517.html,

We are pleased to announce a new website on Boosting and related ensemble learning methods, e.g. Boosting, Arcing, Bagging, the connection to mathematical programming and large margin classifiers, and model selection. The aim is to serve as a central information source by providing links to papers, upcoming events, datasets, code, etc.

9.Perfectly Random Sampling with Markov Chains

Random sampling has found numerous applications in physics, statistics, and computer science. Perhaps the most versatile method of generating random samples from a probability space is to run a Markov chain. This site provides a comprehensive collection of this area!

10.Independent Component Analysis

A Tutorial

11.Self Organizing Maps

An excellent short introduction

12.Reversible Markov Chains and Random Walks on Graphs

Early drafts of chapters are available as PDF files

13.A Brief Introduction to Graphical Models and Bayesian Networks

"Graphical models are a marriage between probability theory and graph theory. They provide a natural tool for dealing with two problems that occur throughout applied mathematics and engineering -- uncertainty and complexity -- and in particular they are playing an increasingly important role in the design and analysis of machine learning algorithms. Fundamental to the idea of a graphical model is the notion of modularity -- a complex system is built by combining simpler parts. Probability theory provides the glue whereby the parts are combined, ensuring that the system as a whole is consistent, and providing ways to interface models to data. The graph theoretic side of graphical models provides both an intuitively appealing interface by which humans can model highly-interacting sets of variables as well as a data structure that lends itself naturally to the design of efficient general-purpose algorithms.

14.Gaussian Processes for Machine Learning

The bayesian approach for data mining.

国内主要团队：中国科学院大数据挖掘与知识管理重点实验室

周志华机器学习与数据挖掘研究所(LAMDA)

国外韩家炜领导的伊利诺伊大学的数据挖掘研究室(Data Mining Research Group)

麻省理工学院robotics and artificial intelligence机器人与人工智能

全国核心期刊分类统计表

一）道路与桥梁类序号刊名ISSN CN 期刊主办单位主管单位 1 国外公路1003-6521 43-1131/U 双长沙交通学院 2 公路交通科技1002-0268 11-2279/U 月交通部公路科学研究院交通部 3 公路0451-0712 11-1668/U 月中交公路规划设计院交通部 4 国外桥梁1003-4714 42-1190/U 季铁道部大桥工程局桥梁科学研究院 5 桥梁建设1003-4722 42-1191/U 双中铁大桥工程局集团有限公司铁道部 6 世界桥梁1671-776 7 42-1681/U 季中铁大大桥局集团有限公司中国铁路工程总公司 7 中外公路1671-2579 43-1363/U 双长沙理工大学交通部 8 中国公路1006-3897 11-3597/F 半中国公路学会交通部 9 东北公路1004-7689 21-1114/U 季辽宁省交通厅辽宁省科技厅 10 公路运输文摘：现代高速1002-512X 11-2341/U 季交通部科学研究院 11 广西交通科技1004-051X 45-1119U 双广西壮族自治区交通厅科学技术情报站广西壮族自治区交通厅 12 广东公路交通1671-7619 44-1275/U 季广东交通集团广东省交通厅 13 公路交通技术1009-6477 50-1135/U 双重庆交通科研设计院重庆市交通委员会 14 公路与汽运1671-2668 43-1362/U 双交通部长沙交通学院交通部

15 华东公路1001-7291 34-1097/U 双安徽省交通厅安徽省科学技术协会 16 内蒙古公路与运输1005-0574 15-1157/U 季内蒙古自治区交通科学情报站等内蒙古公路协会 17 上海公路1007-0109 31-1712/U 季上海公路学会上海市科委 18 中南公路工程1002-1205 43-1102/U 季湖南省交通科技信息中心湖南省交通厅 19 交通科技1671-7570 42-1611/U 双武汉理工大学交通部 20 辽宁交通科技1672-3864 21-1113/U 双辽宁省交通科学研究所辽宁省交通厅 21 山东交通科技37-1276/U 季山东省交通科学研究所山东省交通厅 22 山西交通科技1006-3528 14-1198/U 双山西交通科技信息中心站山西省交通厅 23 福建交通科技35-1099U 季福建省交通科学技术研究所福建省交通厅 24 江西交通1007-256X 36-1056U 双江西省交通厅 25 黑龙江交通科技1008-3383 23-1207U 月黑龙江省科学研究所黑龙江省科技协会 26 湖南交通科技1008-844X 43-1193/U 季交通科技信息中心湖南省交通厅 27 云南交通科技1008-8040 53-1110/U 双云南省交通厅 28 道路交通与安全1008-2522 11-3911/U 双北京交通工程协会 29 交通运输系统工程与信息1009-6744 11-4520/U 双中国系统工程学会 30 交通与社会1671-1149 41-1307U 半河南省交通厅

数据挖掘简介

数据挖掘综述

数据挖掘综述摘要：数据挖掘是一项较新的数据库技术，它基于由日常积累的大量数据所构成的数据库，从中发现潜在的、有价值的信息——称为知识，用于支持决策。数据挖掘是一项数据库应用技术，本文首先对数据挖掘进行概述，阐明数据挖掘产生的背景，数据挖掘的步骤和基本技术是什么，然后介绍数据挖掘的算法和主要应用领域、国内外发展现状以及发展趋势。关键词：数据挖掘，算法，数据库 ABSTRACT：Data mining is a relatively new database technology, it is based on database, which is constituted by a large number of data coming from daily accumulation, and find potential, valuable information - called knowledge from it, used to support decision-making. Data mining is a database application technology, this article first outlines, expounds the background of data mining , the steps and basic technology, then data mining algorithm and main application fields, the domestic and foreign development status and development trend. KEY WORDS: data mining ,algorithm, database 数据挖掘产生的背景上世纪九十年代．随着数据库系统的广泛应用和网络技术的高速发展，数据库技术也进入一个全新的阶段，即从过去仅管理一些简单数据发展到管理由各种计算机所产生的图形、图像、音频、视频、电子档案、Web页面等多种类型的复杂数据，并且数据量也越来越大。在给我们提供丰富信息的同时，也体现出明显的海量信息特征。信息爆炸时代．海量信息给人们带来许多负面影响，最主要的就是有效信息难以提炼。过多无用的信息必然会产生信息距离(the Distance of Information-state Transition，信息状态转移距离，是对一个事物信息状态转移所遇到障碍的测度。简称DIST或DIT)和有用知识的丢失。这也就是约翰·内斯伯特(John Nalsbert)称为的“信息丰富而知识贫乏”窘境。因此，人们迫切希望能对海量数据进行深入分析，发现并提取隐藏在其中的信息．以更好地利用这些数据。但仅以数据库系统的录入、查询、统计等功能，无法发现数据中存在的关系和规则，无法根据现有的数据预测未来的发展趋势。更缺乏挖掘数据背后隐藏知识的手段。正是在这样的条件下，数据挖掘技术应运而生。数据挖掘的步骤在实施数据挖掘之前，先制定采取什么样的步骤，每一步都做什么，达到什么样的目标是必要的，有了好的计划才能保证数据挖掘有条不紊的实施并取得成功。很多软件供应商和数据挖掘顾问公司投提供了一些数据挖掘过程模型，来指导他们的用户一步步的进行数据挖掘工作。比如SPSS公司的5A和SAS公司的SEMMA。数据挖掘过程模型步骤主要包括：1定义商业问题；2建立数据挖掘模型；3分析数据；4准备数据；5建立模型；6评价模型；7实施。 1定义商业问题。在开始知识发现之前最先的同时也是最重要的要求就是了

数据挖掘试题与答案

一、解答题（满分30分，每小题5分） 1. 怎样理解数据挖掘和知识发现的关系？请详细阐述之首先从数据源中抽取感兴趣的数据，并把它组织成适合挖掘的数据组织形式；然后，调用相应的算法生成所需的知识；最后对生成的知识模式进行评估，并把有价值的知识集成到企业的智能系统中。知识发现是一个指出数据中有效、崭新、潜在的、有价值的、一个不可忽视的流程，其最终目标是掌握数据的模式。流程步骤：先理解要应用的领域、熟悉相关知识，接着建立目标数据集，并专注所选择的数据子集；再作数据预处理，剔除错误或不一致的数据；然后进行数据简化与转换工作；再通过数据挖掘的技术程序成为模式、做回归分析或找出分类模型；最后经过解释和评价成为有用的信息。 2. 时间序列数据挖掘的方法有哪些，请详细阐述之时间序列数据挖掘的方法有： 1）、确定性时间序列预测方法:对于平稳变化特征的时间序列来说，假设未来行为与现在的行为有关，利用属性现在的值预测将来的值是可行的。例如，要预测下周某种商品的销售额，可以用最近一段时间的实际销售量来建立预测模型。 2）、随机时间序列预测方法:通过建立随机模型，对随机时间序列进行分析，可以预测未来值。若时间序列是平稳的，可以用自回归(Auto Regressive，简称AR)模型、移动回归模型(Moving Average，简称MA)或自回归移动平均(Auto Regressive Moving Average，简称ARMA)模型进行分析预测。 3）、其他方法:可用于时间序列预测的方法很多，其中比较成功的是神经网络。由于大量的时间序列是非平稳的，因此特征参数和数据分布随着时间的推移而变化。假如通过对某段历史数据的训练，通过数学统计模型估计神经网络的各层权重参数初值，就可能建立神经网络预测模型，用于时间序列的预测。

2008年北大版《中文核心期刊要目总览》

2008年北大版《中文核心期刊要目总览》《中文核心期刊要目总览》2008年印刷版（即第五版）于2008年1月1日正式发行.该书已于1992、1996、2000、2004年出版过四版，在社会上引起了较大反响，图书情报界、学术界、出版界和科研管理部门对该项研究成果都给予了较高评价，普遍认为它适应了社会需要，为国内外图书情报部门对中文学术期刊的评估和选购提供了参考依据，促进了中文期刊编辑和出版质量的提高，已成为具有一定权威性的参考工具书。为了及时反映中文期刊发展变化的新情况，我们开展了新一版核心期刊的研究工作。课题组认真总结了前三版的研究经验，对核心期刊评价的基础理论、评价方法（定量评价指标体系、核心期刊表的学科划分、核心期刊数量）、评价软件、核心期刊的作用与影响等问题进行了深入研究，在此基础上，进一步改进评价方法，使之更加科学合理，力求使评价结果能更准确地揭示中文期刊的实际情况。本版核心期刊定量评价，采用了被索量、被摘量、被引量、它引量、被摘率、影响因子、获国家奖或被国内外重要检索工具收录等7个评价指标，选作评价指标统计源的数据库达51种，统计文献量达到943万余篇次（1999至2001年），涉及期刊1万2千种。本版还加大了专家评审力度，1873位学科专家参加了核心期刊评审工作。经过定量评价和定性评审，从我国正在出版的中文期刊中评选出1800种核心期刊，分属七大编75个学科类目。该书由各学科核心期刊表、核心期刊简介、专业期刊一览表等几部分组成，不仅可以查询学科核心期刊，还可以检索正在出版的学科专业期刊，是图书情报、新闻出版、科研成果管理等部门和期刊读者的不可或缺的参考工具书。该书由北京大学图书馆和北京高校图书馆期刊工作研究会合编，北大图书馆戴龙基馆长和蔡蓉华研究馆员任主编，北京高校图书馆期刊工作研究会成员馆、中国科学院文献中心、中国社会科学院文献中心、中国人民大学书报资料中心等相关单位的百余名专家和期刊工作者参加了研究。全书约1900千字，16开本，精装，每册定价220元。北京大学出版社2007年12月出版。

数据挖掘复习章节知识点整理

数据挖掘：是从大量数据中发现有趣（非平凡的、隐含的、先前未知、潜在有用）模式，这些数据可以存放在数据库，数据仓库或其他信息存储中。挖掘流程： 1.学习应用域 2.目标数据创建集 3.数据清洗和预处理 4.数据规约和转换 5.选择数据挖掘函数（总结、分类、回归、关联、分类） 6.选择挖掘算法 7.找寻兴趣度模式 8.模式评估和知识展示 9.使用挖掘的知识概念/类描述：一种数据泛化形式，用汇总的、简洁的和精确的方法描述各个类和概念，通过（1）数据特征化：目标类数据的一般特性或特征的汇总；（2）数据区分：将目标类数据的一般特性与一个或多个可比较类进行比较；（3）数据特征化和比较来得到。关联分析：发现关联规则，这些规则展示属性-值频繁地在给定数据集中一起出现的条件，通常要满足最小支持度阈值和最小置信度阈值。分类：找出能够描述和区分数据类或概念的模型，以便能够使用模型预测类标号未知的对象类，导出的模型是基于训练集的分析。导出模型的算法：决策树、神经网络、贝叶斯、（遗传、粗糙集、模糊集）。预测：建立连续值函数模型，预测空缺的或不知道的数值数据集。孤立点：与数据的一般行为或模型不一致的数据对象。聚类：分析数据对象，而不考虑已知的类标记。训练数据中不提供类标记，对象根据最大化类内的相似性和最小化类间的原则进行聚类或分组，从而产生类标号。第二章数据仓库数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合，支持管理部门的决策过程。从一个或多个数据源收集信息，存放在一个一致的模式下，并且通常驻留在单个站点。数据仓库通过数据清理、变换、继承、装入和定期刷新过程来构造。面向主题：排除无用数据，提供特定主题的简明视图。集成的：多个异构数据源。时变的：从历史角度提供信息，隐含时间信息。非易失的：和操作数据的分离，只提供初始装入和访问。联机事务处理OLTP：主要任务是执行联机事务和查询处理。联系分析处理OLAP：数据仓库系统在数据分析和决策方面为用户或‘知识工人’提供服务。这种系统可以用不同的格式和组织提供数据。OLAP是一种分析技术，具有汇总、合并和聚集功能，以及从不同的角度观察信息的能力。

国外核心期刊简介

国外核心期刊简介 AIDS research and human retroviruses 18 times a year ISSN 0889-2229 631B0029 https://www.doczj.com/doc/fb14255517.html,/aid E-mail:info@https://www.doczj.com/doc/fb14255517.html, 《艾滋病研究和体逆转酶病毒》刊载有关转录酶病毒和与之相关的后在免疫缺乏综合症方面多学科的研究论文。注重有关癌、变性病和普通免疫系统的新病毒的研究。 AJR，American journal of roentgenology Monthly ISSN 0361-803X 635B0001 https://www.doczj.com/doc/fb14255517.html,/scriptcontent/ajr/index.cfm E-mail:subscribe@https://www.doczj.com/doc/fb14255517.html, 《美国X射线学杂志》由美国伦琴射线学会（American Roentgen Ray Society）和美国镭学会（American Radium Society）合办。刊载有关普通放射学和诊断放射学各个方面的高水平原创论文，包括磁共振成像技术等。

American journal of botany Monthly ISSN 0002-9122 588B0001 https://www.doczj.com/doc/fb14255517.html,/ E-mail:orders@https://www.doczj.com/doc/fb14255517.html, 《美国植物学杂志》由美国植物学会（Botanical Society of America）主办。刊载植物学各领域的研究论文和评论。 American journal of cardiology Semimonthly ISSN 0002-9149 638B0010 https://www.doczj.com/doc/fb14255517.html,/locate/amjcard 《美国心脏病学杂志》由美国心脏病学会（American College of Cardiology）主办。刊载内分泌学与新代谢及其临床应用研究的论文和病例报告。 American journal of clinical pathology Monthly ISSN 0002-9173 631B0002

数据挖掘

一、数据挖掘概述 1、数据挖掘定义：通过自动或半自动化的工具对大量的数据进行探索和分析的过程，其目的是发现其中有意义的模式和规律。 ——数据挖掘是一门技能，不是一种现成的产品。 2、数据挖掘能做什么 6种方法：分类（classification）、估计（estimation）、预测（prediction）、组合或关联法则（affinity grouping or association rules）、聚类（clustering）、描述与可视化（description and visualization）前三种方法属于直接的数据挖掘，目标是应用可得到的数据建立模型，用其他可得到的数据来描述我们感兴趣某一变量。后三种方法属于间接的数据挖掘，没有单一的目标变量，目标是在所有变量中发现某些联系。 1）分类：其特点是先对不同的类别加以定义，并由预先分类的样本构成训练集。任务是建立一个模型并应用这一模型对未分类数据进行分类。分类处理的是离散的结果。 2）估计处理的是连续的结果。 3）组合法的任务是确认哪些事物会一起出现。 4）聚类的任务是将相似的事物分成一类，差异较大的事物分在不同的类中。聚类与分类的区别是聚类并不依赖于事先确定好的组别。 3、技术层面的数据挖掘 1）算法与技巧 2）数据 3）建模实践二、数据挖掘方法论：互动循环系统 1、数据挖掘的两种类型一种是自上而下的方法，称之为有监督的数据挖掘方法，当明确知道要搜索的目标时，可以是用这种方法。一种是自下而上的方法，称之为无监督的数据挖掘方法，实际就是让数据解释自己。此方法是在数据中寻找模式，然后把产生的结果留给使用者去判断其中哪些模式重要。数据挖掘的结果通常是这两种方法的结合。 1）有监督的数据挖掘黑匣子模型：使用一个或多个输入值产生一个输出的模型。我们并不关心模型如何运作，那只是黑盒子，我们只关心可能的最优结果。我们根据已知事例，分析其相关资料，将分析结果用在从未联络的潜在客户，这样的模型称之为预测模型。预测模型使用历史记录来计算某些相应结果中的得分。成功预测的要领之一是拥有足够支持结果的数据来训练模型。 2）无监督的数据挖掘半透明模型：有时需要使用模型能够得到与数据相关的重要信息，我们也需要了解模型的运作细节，这就好比一组半透明的盒子。 2、数据挖掘的互动循环过程数据挖掘的互动过程是一种高层次的流程，由四个重要的业务过程所构成：理解业务问题；将数据转换成可执行的结果；

《数据挖掘》试题与标准答案

一、解答题（满分3０分，每小题5分) 1. 怎样理解数据挖掘和知识发现的关系?请详细阐述之首先从数据源中抽取感兴趣的数据，并把它组织成适合挖掘的数据组织形式;然后,调用相应的算法生成所需的知识;最后对生成的知识模式进行评估，并把有价值的知识集成到企业的智能系统中。知识发现是一个指出数据中有效、崭新、潜在的、有价值的、一个不可忽视的流程，其最终目标是掌握数据的模式。流程步骤:先理解要应用的领域、熟悉相关知识，接着建立目标数据集，并专注所选择的数据子集;再作数据预处理，剔除错误或不一致的数据；然后进行数据简化与转换工作；再通过数据挖掘的技术程序成为模式、做回归分析或找出分类模型；最后经过解释和评价成为有用的信息。 2.时间序列数据挖掘的方法有哪些，请详细阐述之时间序列数据挖掘的方法有: １)、确定性时间序列预测方法:对于平稳变化特征的时间序列来说，假设未来行为与现在的行为有关，利用属性现在的值预测将来的值是可行的。例如，要预测下周某种商品的销售额，可以用最近一段时间的实际销售量来建立预测模型。２）、随机时间序列预测方法：通过建立随机模型,对随机时间序列进行分析,可以预测未来值。若时间序列是平稳的,可以用自回归(Auto Ｒegressiｖe，简称AR)模型、移动回归模型(Ｍovｉng Ａveｒage,简称ＭＡ）或自回归移动平均(Aｕto Regrｅssive Moｖiｎg Aｖeraｇe，简称AＲMＡ)模型进行分析预测。 3)、其他方法:可用于时间序列预测的方法很多,其中比较成功的是神经网络。由于大量的时间序列是非平稳的,因此特征参数和数据分布随着时间的推移而变化。假如通过对某段历史数据的训练，通过数学统计模型估计神经网络的各层权重参数初值，就可能建立神经网络预测模型,用于时间序列的预测。

数据挖掘研究现状及发展趋势

数据挖掘研究现状及发展趋势摘要：从数据挖掘的定义出发，介绍了数据挖掘的神经网络法、决策树法、遗传算法、粗糙集法、模糊集法和关联规则法等概念及其各自的优缺点；详细总结了国内外数据挖掘的研究现状及研究热点，指出了数据挖掘的发展趋势。关键词：数据挖掘；挖掘算法；神经网络；决策树；粗糙集；模糊集；研究现状；发展趋势 Abstract：From the definition of data mining，the paper introduced concepts and advantages and disadvantages of neural network algorithm，decision tree algorithm，genetic algorithm，rough set method，fuzzy set method and association rule method of data mining，summarized domestic and international research situation and focus of data mining in details，and pointed out the development trend of data mining. Key words：data mining，algorithm of data mining，neural network，decision tree，rough set，fuzzy set，research situation，development tendency 1引言随着信息技术的迅猛发展，许多行业如商业、企业、科研机构和政府部门等都积累了海量的、不同形式存储的数据资料[1]。这些海量数据中往往隐含着各种各样有用的信息，仅仅依靠数据库的查询检索机制和统计学方法很难获得这些信息，迫切需要能自动地、智能地将待处理的数据转化为有价值的信息，从而达到为决策服务的目的。在这种情况下，一个新的技术———数据挖掘(Data Mining，DM)技术应运而生[2]。数据挖掘是一个多学科领域，它融合了数据库技术、人工智能、机器学习、统计学、知识工程、信息检索等最新技术的研究成果，其应用非常广泛。只要是有分析价值的数据库，都可以利用数据挖掘工具来挖掘有用的信息。数据挖掘典型的应用领域包括市场、工业生产、金融、医学、科学研究、工程诊断等。本文主要介绍数据挖掘的主要算法及其各自的优缺点，并对国内外的研究现状及研究热点进行了详细的总结，最后指出其发展趋势及问题所在。江西理工大学

中文核心期刊等级分类2011

中文核心期刊等级分类一、A级学术期刊 1《经济研究》2《管理世界》3《中国社会科学》4《经济学动态》 5《中国工业经济》6《数量经济技术经济研究》7《经济学季刊》8《金融研究》9《财政研究》10《统计研究》11《世界经济》12《中国农村经济》 13《管理科学学报》14《中国管理科学》15《系统工程理论与实践》 16《会计研究》17《南开管理评论》二、B级学术期刊 1《经济科学》2《国际经济评论》3《财经研究》4《国际金融研究》 5《财贸经济》6《中国人口和科学》7《南开经济研究》8《经济学家》 9《经济社会体制比较》10《经济评论》11《经济理论与经济管理》 12《国际贸易问题》13《当代经济科学》14《财经科学》15《世界经济研究》16《财经问题研究》17《宏观经济研究》18《当代经济研究》19《经济地理》20《财经理论与实践》21《中国经济问题》22《金融论坛》23《农业经济问题》24《中国软科学》25《系统管理学报》26《系统工程学报》27《科学学研究》28《审计研究》29《管理工程学报》30《科研管理》31《科学学与科学技术管理》32《管理评论》33《预测》34《研究与发展管理》35《管理科学》36《系统工程》37《管理学报》38《宏观经济管理》39《数理统计和管理》40《外国经济与管理》41《运筹与管理》42《城市问题》43《统计与信息论坛》44《经济体制改革》45《产业经济研究》46《经济管理》47《中国社会经济史研究》 48《经济与管理研究》49《学术研究》50《学术月刊》51《税务研究》 52《国际贸易》53《当代财经》54《教育研究》55《高等教育研究》 56《人民日报》《光明日报》《经济日报》（理论版，字数在2000字以上） 57《高校综合性学报》（14所：北京大学学报、武汉大学学报、吉林大学学报、中国人民大学学报、南京大学学报、复旦大学报、厦门大学学报、浙江大学学报、南开大学报、清华大学学报、中山大学学报、上海财经大学学报、中央财经大学学报、中南财经政法大学学报）三、C级学术期刊： 1《现代经济探讨》2《科学管理研究》3《中国行政管理》4 《软科学》 5《公共管理学报》6《科技进步与对策》 7《管理现代化》8《科技管理研究》 9《中国人力资源开发》10《中国金融》11《宏观经济管理》12《现代管理科学》13《华东经济管理》14 《中国农村观察》15《世界经济文汇》16《改革》 17《证券市场导报》18《商业经济与管理》19《经济纵横》20《国际经贸探索》21《国际经济合作》22《消费经济》23《经济问题》24《城市发展研究》

四大中文核心期刊评价体系

四种中文核心期刊评价体系资料介绍对中国内地出版的期刊中核心期刊的认定，目前国内比较权威的有以下几种版本：第一种是中国科技信息研究所（简称中信所）每年出一次的《中国科技期刊引证报告》（限理工科期刊，以下简称《引证报告》）。中信所每年第四季度面向全国大专院校和科研院所发布上一年的科研论文排名。排名包括SCI、Ei、ISTP 分别收录的论文量和中国期刊发表论文量等项指标。《引证报告》以1300多种中、外文科技类期刊作为统计源，报告的内容是对这些期刊进行多项指标的统计与分析，其中最重要的是按类进行“影响因子”排名。第二种是北京大学图书馆与北京高校图书馆期刊工作研究会联合编辑出版的《中文核心期刊要目总览》（以下简称《要目总览》）。《要目总览》不定期出版，1996年出版了第一版，2000年出了第二版。《要目总览》收编包括社会科学和自然科学等各种学科类别的中文期刊。其中对核心期刊的认定通过五项指标综合评估。《引证报告》统计源期刊的选取原则和《要目总览》核心期刊的认定各依据了不同的方法体系，所以二者界定的核心期刊（指科技类）不完全一致。在《引证报告》和《要目总览》中每次都被评为核心期刊的期刊在其刊名前面加注了“#”，共597种。被《要目总览》1996年版，2000年版都定为核心期刊的社科类期刊，加注“=”，共434种。此外，被1999年EI和SCI收录的期刊，分别注以“+”(71种)或“ &”(28种)。第三种是中国科学引文数据库(http://159.226.100.178/html/lyqkb.htm，限于理工科期刊)。它是由中国科学院文献情报中心建立的, 分为核心库和扩展库。核心库的来源期刊经过严格的评选,是各学科领域中具有权威性和代表性的核心期刊。我校在科研成果认定中把中国科学引文数据库核心库中的刊物均认定为核心期刊。第四种是《中国人文社会科学核心期刊要览》。它是由中国社会科学院文献信息中心和社科文献计量评价中心共同建立的核心期刊库，我校在科研成果认定中均认定为核心期刊。国内核心期刊，我院以最新版（目前以2004版）《中文核心期刊要目总览》为基础，在此基础上将核心期刊分为A、B、C、D四类。国际国内重要检索系统简介

通信类核心期刊汇总

通信类核心期刊 2007-06-14 17:51:27| 分类：论文相关| 标签：|字号大中小订阅 2002年中国科技期刊影响因子统计表(电子通信、计算机类)名次期刊名称影响因子电子通讯类 1 机器人 2 自动化学报 3 光电子·激光 4 电子学报 5 半导体学报 6 电子显微学报 7 西安电子科技大学学报 8 制造业自动化 9 中国激光A 10 通信学报 11 电子技术应用 12 压电与声光 13 电子元件与材料 14 电子科技大学学报 15 探测与控制学报 16 微波学报 17 电子测量与仪器学报 18 电子与信息学报 19 电路与系统学报 20 系统工程与电子技术 21 应用激光 22 光电子技术 22 激光技术

24 电波科学学报 25 光电工程 26 信号处理 27 激光杂志 28 数据采集与处理 29 红外与激光工程 30 红外技术 31 半导体光电 32 电子产品世界 33 北京邮电大学学报 34 移动通信 35 光通信技术 36 微电子学 37 光纤与电缆及其应用技术 38 电子测量技术 39 微电子学与计算机 40 无线通信技术 41 电声技术 42 半导体技术 43 武汉理工大学学报信息管理版 44 真空电子技术 45 电视技术 46 弹箭与制导学报 47 微处理机 48 通信技术 49 现代雷达 50 遥测遥控 5l 信息安全与通信保密 52 固体电子学研究与进展 53 南京邮电学院学报

计算技术类 l 计算机学报 2 中国图象图形学报 3 计算机研究与发展 4 计算机测量与控制 5 软件学报 6 计算机集成制造系统-CIMS 7 计算机辅助设计与图形学学报 8 模式识别与人工智能 9 物探化探计算技术 10 计算机科学 11 计算机与应用化学 12 计算机应用( 13 计算机应用研究 14 中文信息学报 15 计算机工程与应用( 16 计算机工程与科学 17 计算机仿真 18 计算机工程 19 微型电脑应用 20 数值计算与计算机应用 21 计算机工程与设计( 22 J COMPUT SCI & TECH 23 微型机与应用 24 计算机辅助工程 25 微计算机应用 26 计算机应用与软件 27 小型微型计算机系统二、计算机、电子、通信类核心期刊目录（2004版）

数据挖掘与数据仓库知识点总结

1、数据仓库定义：数据仓库是一种新的数据处理体系结构，它与组织机构的操作数据库分别维护，允许将各种应用系统一起，为统一的历史数据分析提供坚实的平台，对信息处理提供支持。数据仓库是面向主题的、集成的、相对稳定的、反映历史变化的数据集合，为企业决策支持系统提供所需的集成信息。设计和构造步骤：1）选取待建模的商务处理；2）选取商务处理的粒变；3）选取用于每个事实表记录的维；4）选取事实表中每条记录的变量系统结构：（1）底层是仓库数据服务器，总是关系数据库系统。（2）中间层是OLAP服务器，有ROLAP 和MOLAP，它将对多维数据的操作映射为标准的关系操作（3）顶层是前端客户端，它包括查询和报表工具、分析工具和数据挖掘工具 2、数据仓库的多维数据模型：（1）星形模式：在此模型下，数据仓库包括一个大的包含大批数据并且不含冗余的中心表，一组小的附属表，维表围绕中心事实表显示的射线上。特征：星型模型四周的实体是维度实体，其作用是限制和过滤用户的查询结果，缩小访问围。每个维表都有自己的属性，维表和事实表通过关键字相关联。【例子：sales数据仓库的星形模式，此模式包含一个中心事实表sales，它包含四个维time, item, branch和location。（2）雪花型模式：它是星形模式的变种，其中某些维表是规化的，因而把数据进一步分解到附加的表中。特征：雪花模型通过最大限度地减少数据存储量和联合较小的维表来改善查询性能，增加了用户必须处理的表数量和某些查询的复杂性，但同时提高了处理的灵活性，可以回答更多的商业问题，特别适合系统的逐步建设要求。【例子同上，只不过把其中的某些维给扩展了。（3）事实星座形：复杂的应用可能需要多个事实表共享维表，这种模式可看作星形模式的汇集。特征：事实星座模型能对多个相关的主题建模。例子：有两个事实表sales和shipping，它们可以共享维表time, item和location。 3、OLAP：即联机分析处理，是在OLTP基础上发展起来的、以数据仓库基础上的、面向高层管理人员和专业分析人员、为企业决策支持服务。特点：1.实时性要求不是很高。2.数据量大。3.因为重点在于决策支持，所以查询一般是动态的，也就是说允许用户随机提出查询要求。 OLAP操作：上卷：通过沿一个维的概念分层向上攀登，或者通过维归约，对数据立方体进行类聚。下钻：是上卷的逆操作，它由不太详细的数据得到更详细的数据，下钻可以通过沿维的概念分层向下或引入附加的维来实现。切片：对给定方体的一个维进行进行选择，导致一个子立方体。切块：通过对两个或多个维执行选择，定义子立方体。转轴：是一种可视化操作，它转动数据的视角，提供数据的替代表示。 OLTP：即联机事务处理，是以传统数据库为基础、面向操作人员和低层管理人员、对基本数据进行查询和增、删、改等的日常事务处理。OLTP的特点有：a.实时性要求高；b.数据量不是很大。C.交易一般是确定的，是对确定性数据进行存取。d.并发性要求高且严格的要求事务的完整性，安全性。 OLTP和OLAP的区别：1）用户和系统的面向性:OLTP面向顾客，而OLAP面向市场；2）数据容：OLTP 系统管理当前数据，而OLAP管理历史的数据；3）数据库设计：OLTP系统采用实体-联系（ER)模型和面向应用的数据库设计，而OLAP系统通常采用星形和雪花模型；4）视图：OLTP系统主要关注一个企业或部门部的当前数据，而OLAP 系统主要关注汇总的统一的数据；5）访问模式：OLTP访问主要有短的原子事务组成，而OLAP系统的访问大部分是只读操作，尽管许多可能是复杂的查询。 7、PageRank算法原理：1）在初始阶段：构建Web图，每个页面初始设置相同的PageRank 值，通过迭代计算，会得到每个页面所获得的最终PageRank值。2）在一轮中更新页面 PageRank得分的计算方法：每个页面将其当前的PageRank值平均分配到本页面包含的出链上。每个页面将所有指向本页面的入链所传入的权值求和，即可得到新的PageRank得分。优点：是一个与查询无关的静态算法，所有网页的PageRank值通过离线计算获得；有效减少在线查询时的计算量，极大降低了查询响应时间。缺点：1）人们的查询具有主题特征，PageRank忽略了主题相关性，导致结果的相关性和主题性降低。2）旧的页面等级会比新页面高。因为即使是非常好的新页面也不会有很多上游，除非它是某个站点的子站点。

中国人民大学核心期刊分类指导意见

中国人民大学核心期刊分类指导意见（征求意见稿）第一条按照学校科研综合改革方案，为配合学校人事制度改革及薪酬体系改革，同时为规范学校科研评价活动，进一步推动学校科研事业发展，鼓励创新、提高质量，特制定本指导意见。第二条遵循科研规律，尊重学科特点，管理重心下移。学校学术委员会审议确定核心期刊的范围与分类原则。学院在征求全体教师意见的基础上，由学院学术委员会根据本指导意见遴选确定核心期刊的分类目录，并经学校学术委员会审核通过后公布使用。第三条学院学术委员会遴选推荐的核心期刊分类目录不符合本指导意见的，不同学院相同学科核心期刊分类目录有分歧的，由学校学术委员会分学部审核并提出审核意见，必要时可组织校外专家进行评审提出评审意见，学校学术委员会根据审核意见及评审意见审议。第四条在中国大陆出版的核心期刊范围是: （一）中国社会科学引文索引（CSSC D来源期刊（不含扩展版）及其收录来源集刊（南京大学中国社会科学研究评价中心发布）。（二）中国科学引文数据库（CSCD）源期刊（不含扩展库）（中国科学院文献情报中心发布）。（三）部分重要文摘

《中国社会科学文摘》、《新华文摘》、中国人民大学“复印报刊资料”学术专题期刊。（四）部分重要报纸理论版、学术版《人民日报》、《光明日报》、《经济日报》、《法制日报》、《中国教育报》、《中国社会科学报》。（五）学科评估中认可的其他期刊目录或索引等。（六）在中国出版的部分英文期刊： 1. 《中国社会科学》英文版、《经济与政治研究》 2. 高校文科学科前沿系列期刊： Frontiers of Business Research in China Frontiers of Economics in China Frontiers of Education in China Frontiers of History in China Frontiers of Law in China Frontiers of Literary Studies in China Frontiers of Philosophy in China 第五条在中国大陆出版的核心期刊一般分为A、B、C 三类，其中A、B 类核心期刊的遴选原则如下：（一） A 类期刊 1、A类期刊应为国内相应研究领域最优秀的学术期刊，原则上一个一级学科推选1个A类期刊；

数据挖掘主要工具软件简介

数据挖掘主要工具软件简介 Dataminning指一种透过数理模式来分析企业内储存的大量资料，以找出不同的客户或市场划分，分析出消费者喜好和行为的方法。前面介绍了报表软件选购指南，本篇介绍数据挖掘常用工具。市场上的数据挖掘工具一般分为三个组成部分： a、通用型工具； b、综合／DSS／OLAP数据挖掘工具； c、快速发展的面向特定应用的工具。通用型工具占有最大和最成熟的那部分市场。通用的数据挖掘工具不区分具体数据的含义，采用通用的挖掘算法，处理常见的数据类型，其中包括的主要工具有IBM 公司Almaden 研究中心开发的QUEST 系统，SGI 公司开发的MineSet 系统，加拿大Simon Fraser 大学开发的DBMiner 系统、SAS Enterprise Miner、IBM Intelligent Miner、Oracle Darwin、SPSS Clementine、Unica PRW等软件。通用的数据挖掘工具可以做多种模式的挖掘，挖掘什么、用什么来挖掘都由用户根据自己的应用来选择。综合数据挖掘工具这一部分市场反映了商业对具有多功能的决策支持工具的真实和迫切的需求。商业要求该工具能提供管理报告、在线分析处理和普通结构中的数据挖掘能力。这些综合工具包括Cognos Scenario和Business Objects等。面向特定应用工具这一部分工具正在快速发展，在这一领域的厂商设法通过提供商业方案而不是寻求方案的一种技术来区分自己和别的领域的厂商。这些工

具是纵向的、贯穿这一领域的方方面面，其常用工具有重点应用在零售业的KD1、主要应用在保险业的Option＆Choices和针对欺诈行为探查开发的HNC软件。下面简单介绍几种常用的数据挖掘工具： 1. QUEST QUEST 是IBM 公司Almaden 研究中心开发的一个多任务数据挖掘系统，目的是为新一代决策支持系统的应用开发提供高效的数据开采基本构件。系统具有如下特点： (1)提供了专门在大型数据库上进行各种开采的功能：关联规则发现、序列模式发现、时间序列聚类、决策树分类、递增式主动开采等。 (2)各种开采算法具有近似线性（O(n)）计算复杂度，可适用于任意大小的数据库。 (3)算法具有找全性，即能将所有满足指定类型的模式全部寻找出来。 (4)为各种发现功能设计了相应的并行算法。 2. MineSet MineSet 是由SGI 公司和美国Standford 大学联合开发的多任务数据挖掘系统。MineSet 集成多种数据挖掘算法和可视化工具，帮助用户直观地、实时地发掘、理解大量数据背后的知识。MineSet 2.6 有如下特点：（1）MineSet 以先进的可视化显示方法闻名于世。MineSet 2.6 中使用了6 种可视化工具来表现数据和知识。对同一个挖掘结果可以用不同的可视化工具以各种形式表示，用户也可以按照个人的喜好调整最终效果, 以便更好地理解。MineSet 2.6 中的可视化工具有Splat Visualize、Scatter Visualize、Map

数据挖掘复习知识点整理超详细

必考知识点：信息增益算法/ ID3决策树(计算) (详细见教材) 使用朴素贝叶斯分类预测类标号(计算) FP-TREE(问答) (详细见教材) 数据仓库的设计(详见第二章)(问答) (见PPT) 数值规约Equi-depth、equi-width、v-optimal、maxdiff(问答) (详细见教材) BUC (这个也要考，但不记得怎么考的了) 后向传播神经网络(名词解释) K-平均，K-中心点，DBSCAN 解析特征化(这个也要考) 总论数据挖掘：是从大量数据中发现有趣（非平凡的、隐含的、先前未知、潜在有用）模式，这些数据可以存放在数据库，数据仓库或其他信息存储中。挖掘流程： (1)学习应用域（2）目标数据创建集（3）数据清洗和预处理（4）数据规约和转换（5）选择数据挖掘函数（总结、分类、回归、关联、分类）（6）选择挖掘算法（7）找寻兴趣度模式（8）模式评估和知识展示（9）使用挖掘的知识概念/类描述：一种数据泛化形式，用汇总的、简洁的和精确的方法描述各个类和概念，通过（1）数据特征化：目标类数据的一般特性或特征的汇总；（2）数据区分：将目标类数据的一般特性与一个或多个可比较类进行比较；（3）数据特征化和比较来得到。关联分析：发现关联规则，这些规则展示属性-值频繁地在给定数据集中一起出现的条件，通常要满足最小支持度阈值和最小置信度阈值。分类：找出能够描述和区分数据类或概念的模型，以便能够使用模型预测类标号未知的对象类，导出的模型是基于训练集的分析。导出模型的算法：决策树、神经网络、贝叶斯、（遗传、粗糙集、模糊集）。预测：建立连续值函数模型，预测空缺的或不知道的数值数据集。孤立点：与数据的一般行为或模型不一致的数据对象。聚类：分析数据对象，而不考虑已知的类标记。训练数据中不提供类标记，对象根据最大化类内的相似性和最小化类间的原则进行聚类或分组，从而产生类标号。第二章数据仓库数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合，支持管理部门的决策过程。从一个或多个数据源收集信息，存放在一个一致的模式下，并且通常驻留在单个站点。数据仓库通过数据清理、变换、继承、装入和定期刷新过程来构造。面向主题：排除无用数据，提供特定主题的简明视图。集成的：多个异构数据源。时变的：从历史角度提供信息，隐含时间信息。非易失的：和操作数据的分离，只提供初始装入和访问。联机事务处理OLTP：主要任务是执行联机事务和查询处理。联系分析处理OLAP：数据仓库系统在数据分析和决策方面为用户或‘知识工人’提供服务。这种系统可以用不同的格式和组织提供数据。OLAP是一种分析技术，具有汇总、合并和聚集功能，以及从不同的角度观察信息的能力。

中国科技核心期刊简介

中国科技核心期刊 The key magazine of China technology 中国科学技术信息研究所出版的“中国科技论文统计源期刊”，又称“中国科技核心期刊”，学科范畴主要为自然科学领域，是目前国内比较公认的科技统计源期刊目录。因其受科技部委托，带有官方色彩，权威性名列国内首位。目录 1.评价统计源期刊即中国科技信息研究所统计用期刊。从1980年起，中国科技信息研究所（简称中信所），受国家科委委托每年对SCI、EI、ISTP收录的中国论文、对被选作统计用的中国科技期刊上的论文情况进行统计分析，统计结果作为国家正式统计数字向社会发布。被中信所选作统计用的中国科技期刊简称为统计源刊或统计源。统计源每年约1200种左右，而且每年有所变动，统计源期刊的选择确定因照顾了学科及地区平衡，学术水平要求不如学科核心刊。 2.选刊

2.1选刊标准源期刊的选刊标准有17项，它们是:（1）总被引频次;（2）影响因子;（3）年指标;（4）自引率;（5）他引率;（6）普赖斯指数;（7）引用半衰期;（8）被引半衰期;（9）老化系数;（10）来源文献量;（11）参考文献量;（12）平均引用率;（13）平均作者数;（14）地区分布数;（15）机构数;（16）国际论文比;（17）基金论文比.影响因子是指某一刊物前两年发表的论文在统计当年被引用的总次数与该刊前两年发表论文总数的比值.通常，期刊影响因子越大，说明它的学术影响力和作用也越大. 2.2遴选原则（1）科技“核心期刊”实行三年动态管理:三年评定一次,一次评定三年有效。这对所有科技期刊都是一个动态激励机制。也给科技“核心期刊”管理和评定办法的进一步改进留有一定空间。（2）严格科技“核心期刊”学科领域总量指标限制:同一学科领域最多一两种“核心期刊”,宁缺勿滥,使评定出来的“核心期刊”真正起到该学科领域的风向标作用。（3）确保学术专家对科技“核心期刊”评定的权威性:在期刊管理部门的组织下成立科技“核心期刊”评定动态专家委员会,某个学科领域的科技期刊的学术水平如何,一定要是科学学术专家说了算,不能由期刊管理部门独家评定。每次期刊评定,专家委员会人员应该有所调整,不能固定,以免走“后门”,以保证科技“核心期刊”的学术质量。 2.3遴选办法（1）遴选范围。创刊5 年以上的公开发行的科技期刊;按国家有关规定,期刊社必须满足采编人员数量和质量规定的科技期刊;优先考虑我国优势学科和特色学科的科技期刊,优先考虑具备集约化发展趋势、由全国性学术社团或科研机构主办的优秀科技期刊。