当前位置：文档之家› 数据挖掘词汇索引(全部)

数据挖掘词汇索引(全部)

Accurancy

Bagging，366-367

Boosting，367-370

Classification，288，290

classifier measures，360-362

CrossMine，580

Evaluation，363-366

Increasing，366-370

predicator measures，362-364

prediction，290

Adaboost，368-369

Adaptive Probabilistic Networks，318

ad hoc data mining，37

agglomerative hierarchical clustering，408-411 aggregate measures，474

aggregation

complex data types and，198-199

data cube，73-75

defined，70

multiway array，164

on-line，145

simultaneous，165

spatial，594

tilted time frame slots，478

AGM algorithm，538

algebraic measure，51-52，120

algorithms

associative classification，322

distributed，38

genetic，351，374

incremental，38

parallel，38

partitioning，401

randomized，472-473

alignment

biological sequence，514-518

defined，514

multiple sequence，514，517-518

pairwise，514，515-516

alternative hypotheses，452

alternative substructure patterns，547-548 amino acids，654

analytical processing，146 准确率

装袋

提升

分类

分类器度量

评估

提高

预测器度量

预测

自适应概率网络特定的数据挖掘凝聚层次聚类聚集度量

聚集

复杂的数据类型数据立方体

定义

多路数组

联机

同时的

空间的

倾斜时间框架槽AGM算法

代数度量

算法

关联分类

分布的

遗传的

增量的

并行的

划分的

随机的

比对

生物学序列

定义

多序列

逐对

备择假设

其他子结构模式氨基酸

分析处理

anomaly detection，659

anonymous databases，680

ANOV A，666-667

antiminitinic constrains，，164，269-270 apex cuboids，1，74-75，114，138 applications，649-660

biological data analysis，654-657

domain-specific，684

exploration，681

financial data analysis，649-651

intrusion detection，658-660

retail industry，651-652

scientific，657-658

telecommunications industry，652-653 approximate frequent substructures，549 approximate query answering，474 approximation，594

Apriori，273

algorithm illustration，239

defined，234-235

dynamic itemset counting，242

efficiency，240-242

improving，240-242

example，236-238

in frequent itemset mining，234-239

hash-based technique，240-241

join step，235，238

level-wise search，235

partitioning，241

property，235，253

prune step，235-236，238

pruning method，163

sampling，241-242

transaction reduction technique，241 Apriori-based subgraph mining，537-539 AGM algorithm，538

AprioriGraph，537，538

BFS strategy，539

edge-disjoint path，539

framework，537

FSG algorithm，538-539

Overhead，539

AprioriGraph，537，538

architectures 异常检测

匿名数据库

单因素方差分析

反单调约束

顶点方体

应用

生物学数据分析

特定领域的

探测

金融数据分析

入侵检测

零售业

科学的

电讯业

近似的频繁子结构

近似的查询回答

近似

算法说明

定义

动态项集计数

有效性

提高/改进

例子

频繁项集挖掘

基于散列的技术

连接步

逐层搜索

划分

性质

剪枝步

剪枝方法

抽样

事物归约技术

基于Apriori的子图挖掘AGM算法

BFS策略

边不相交路径

框架

FSG算法

开销

系统结构

data warehouse，127-137

defined，39

OLAM，148-150

OLE DB for Data Mining，692

three-tier，130-133，151

ARIMA，493，667

arithmetic means

association analysis，23-24

association-based classification，627 association rules

Boolean，233

classification by analysis，344-347

clustering，258-259

confidence，229

correlation，233

defined，229

generating，239-240

from frequence itemsets，239-240

hybrid-dimensional，255

interdimensional，255

interestingness，229

intradimensional，254

metarule-guided mining，266-267

mining，250-259，272

multidimensional，24，233，254-257

multilevel，233，250-254，273

multimedia data，612-613

periodic，513

quantitative，233，250，257-259，274

single-dimensional，23，233，254

spatial，605-606

strong，231，260，272

support，229

support-confidence framework，259

visualization，671

associative classification，344-347，374 algorithms，322

CBA，345-346

CMAR，346-347

CPAR，347

frequent itemset mining versus，345 asymmetric binary dissmilarity，390-391 asymmetric binary similarity，391

atomic matching，497 数据仓库

定义

用于数据挖掘的OLE DB 三层

自动回归的综合移动平均算术均值

关联分析

基于关联的分类

关联规则

布尔的

分析的分类

聚类

置信度

相关

定义

产生

由频繁项集

混合维的

维间的

兴趣度

维内的

元规则制导挖掘

挖掘

多维

多层

多媒体数据

周期的

量化的

单维的

空间的

强的

支持度

支持度-置信度框架

可视化

关联分类

算法

频繁项集挖掘与

非对称的二元相异度

非对称的二元相似度

原子匹配

attribute-oriented induction，198-218，219 algorithm，205

concept，199

for data characterization，199-204

defined，199

example，203-204

implementation，205-206

techniques，219

attributes

categorical，94

class label，286

complex structure-valued，593

construction，71，72

continuous-valued，302

defined，10

evaluation measures，75-76

generalization，202

grouping，193

list-valued，593

multirelational，580

partial ordering，94

partial set，96

predicted，288

quantitative，255，256-257

redundancy，68-69

removal，201

sets，95

set-valued，592-593

attribute selection measures，296-304

CHAID，304

defined，296

gain ratio，301

Gini index，302-304

Information gain，297-300

MDL，304，306

multivariate splits，304

attribute subset selection，75-76，289

decision tree induction，76，77

defined，49，73，75

forward selection / backward elimination combination，76

greedy methods，75，76

stepwise backward elimination，76

stepwise forward selection，76 面向属性的归纳

算法

概念

数据特征化

定义

例子

实现

技术

属性

分类的

类标号

复杂结构值的

构造

连续值的

定义

评估度量

泛化

分组

列表值的

多关系的

偏序

部分集合

预测

定量的

冗余

删除

集合

集合值的

属性选择度量

定义

增益率

Gini指标

信息增益

多元分裂

属性子集选择

决策树归纳

定义

向前选择和向后删除的结合贪心方法

逐步向后删除

逐步向前选择

audio data mining，613-614，670 authoritative Web pages，631-637

analysis，20-21

authority weight，633

block-level link analysis，636

block-to-age relationship，636

defined，631

HITS，633，634

identifying，631-637

page-to-block relationships，636 autocorrelation analysis，491

automated Web page clustering and classification，21

A VC-groups，309

A VC-sets，309

average，183，184，474

background knowledge，31，37 backpropagation，327-336，374

algorithm illustration，330-331

case updating，333

defined，328

epoch updating，333

error，332

functioning，329-330

hidden layers，328，331

input layers，328

interpretability and，334-336

learning rates，332

logistic function，332

multilayer feed-forward neural network，328-329

network pruning，335

output layers，328，331

sample learning calculations，333-334

sensitivity analysis，336

sigmoid function，332

terminating conditions，333 bagging，366-367，374

balanced binary trees，471

bar charts，22，207，208

base cuboids，74，114，138

base fact tables，121 音频数据挖掘

权威Web页面

分析

权威权重

块级链接分析

块到页关系

定义

识别

页到块关系

自相关分析

自动Web页面聚类和分类A VC组

A VC集

背景知识

后向传播

算法解释

实例更新

定义

周期更新

误差

机能

隐藏层

输入层

可解释性

学习率

逻辑斯谛函数

多层前馈神经网络

网络修剪

输出层

样本学习计算

灵敏度分析

S形函数

终止条件

装袋

平衡二叉树

条形图

基本方体

基本事实表

Baum-Welch algorithm，526-527

Bayesian belief networks，315-317，373-374 components，315

conditional probability tables，315

CPTs，316

defined，310

directed acyclic graphics，315

gradient descent strategy，，317-318

illustrated，316

training，317-318

Bayesian classification，310-318

Bayesian belief networks，315-318，373-374

Bayes’ theorem，311-315

class conditional independence，312

class label prediction，313-314

in document analysis，626

Laplace correction，314-315

Naive，311-315，373

simple Bayesian classifier，311 Bayes’ theorem，310-311

belief networks

BFS(breadth-first search)，539 biclustering，442-443

BIDE algorithm，509

binary variables，389-392

asymmetric，390

defined，390

dissimilarity between，390-391

symmetric，390

binning，63

clustering-based，258

defined，258

equal-frequency，88，258

equal-width，88，258 bioinformatics，513

biological data analysis，654-657

amino acids，654

DNA sequences，654-655

genes，654

genomes，654

mining，655-657

nucleotides，654

proteomes，654 Baum-Welch算法

贝叶斯信念网络

成分

条件概率表

定义

有向无环图

梯度下降策略

解释

训练

贝叶斯分类

贝叶斯信念网络

贝叶斯定理

类条件独立性

类标号预测

文档分析

拉普拉斯校准

朴素的

简单贝叶斯分类法贝叶斯定理

信念网络

宽度优先搜索

双聚类

BIDE算法

二元变量

非对称的

定义

二元变量间的相异度对称的

分箱

基于聚类的

定义

等频

等宽

生物信息学

生物学数据分析

氨基酸

DNA序列

基因

基因组

挖掘

核苷

蛋白质组

biological data mining，682

biological sequences，528

alignment，514-518

analysis，518-527

Baum-Welch algorithm，526-527

BLAST，516-517

Feng-Doolittle alignment method，518

forward algorithm，523-524

HMMs，521-523

homologous，514

mining，513-527

multiple alignment，514，517-518

nucleotides，514

pairwise alignment，514，515-516

phylogenetic trees，514

Viterbi algorithm，524-525 biometric encryption，680

BIRCH，412-414

clustering feature，412-413

clustering feature tree，413-414

defined，412

bitmap indexing，141-142，144，151 bitmapped join indexing，143，151

BLAST algorithm，516-517

defined，516

functionality，517

versions/extensions，517 Blockbuster，678

block-level link analysis，636，637

BOA T，309-310

Boolean association rules，233

Boolean retrieval，617

boosting，368-370，374

Adaboost，368-370

Defined，368

bootstrap method，365

bottom-up design approach，129

bottom-up discretization，87

boxplots，54-55

defined，54

illustrated，55

BUC，168-172

algorithm，169-170

construction of iceberg cube，171 生物学数据挖掘

生物学序列

对比

分析

Baum-Welch算法

Feng-Doolittle对比方法前向算法

同源的

挖掘

多比对

核苷酸

逐对比对

种系发生树

维特比算法

生物特征加密

聚类特征

聚类特征树

定义

位图索引

位图连接索引

BLAST算法

定义

功能

版本/扩展

块级链接分析

树构造的自助的乐观算法布尔关联规则

布尔检索

提升

定义

自助法

自底向上的设计方法

自底向上离散化

盒图

定义

解释

算法

冰山立方体构造

Define，168

partitioning，172

performance，172

procedding order，169 buckets，88

business processes，129-130

business query view，128

C4.5，76，292，373

class-based ordering scheme，322

defined，292

gain ratio，301

pessimistic pruning，306

C5.0，664

Cardinality，139-140

Function，459

link，estimation，562

CART，76，292，359，373

commercial version，664

defined，292，664

Gini index，302-304

cases，693

case updating，333

categorical variables，392-393

CBA，345-346

CBR，350

cell-based algorithm，455

cells

aggregate，159

ancestor，159

base，159

brightness，207

defined，13

descendant，159

gradient，196

m-dimensional，159

probe，196

center-defined clusters，423-424 central tendency measures，51-53

algebraic，51-52

distributive，51

holistic，52-53

centroid distance，83 定义

划分

性能

处理次序

桶

商务处理

商务查询视图

基于类的排序方案定义

增益率

悲观剪枝

基数

函数

链，估计

商品化版本

定义

Gini 指标

案例

实例更新

分类变量

基于分类的关联基于案例的推理基于单元的算法单元

聚集

祖先

基本

亮度

定义

子孙，后代

梯度

m维

探测

中心定义的簇

中心趋势度量

代数的

分布的

整体的

质心距离

CF，412-413

CF trees，412，413-414

CHAID，304

Chameleon，416-418

defined，416

illustrated，417

relative closeness，417-418

relative interconnectivity，417 characteristic rules，22

Chebyshev’inequality，472

Chernoff bounds，473，482

ChiMerge，90-91

chi-square test，68

chunking，164

chunk memory，165

CLARANS，407-408，583

class-based ordering，320，322

class comparisons，210-215

crosstab，215-216

data collection，211

dimension relevance analysis，211

mining，210-215

presentation，211

quantitative discriminant rule，215

synchronous generalization，211 class composition hierarchies，595-596 class/concept descriptions，

classes

conditional independence，310

description，215-218

discrimination，210-215

equivalent，351

instances，16，563

target，21-22，211 classification，29-31

accuracy，288

accuracy evaluation，363-366

accuracy measures，360-362

applications adapted，30

association-based，627

by association rule analysis，344-347

associative，322，344-347，374

backpropagation，327-336

bagging，366-367，374 聚类特征

CF树

定义

解释

相对接近度

相对互连度

特征规则

切比雪夫不等式切尔诺夫界

卡方检验

分块

块内存

基于类的序

类比较

交叉表

数据收集

维相关分析

挖掘

表示

量化区分规则

同步泛化

类复合层次

类/概念描述

类

条件独立性

描述

区分

等价

实例

目标

分类

准确率

准确率估计

准确率度量

应用适应的

基于关联的

基于关联规则分析关联的

后向传播

装袋

Bayesian，310-318

boosting，367-370，374

bootstrap method，365

collective，563-564

confusion matrix，360

cross-validation，364-365

data preparation for，289-290

by decision tree induction，291-310

defined，24，40，285，286

error rate，360

fuzzy set approaches，352-354

genetic algorithms，351，374

with graph patterns，555

holdout method，364

IF-THEN rules，319-321

interpretability，291

kinds of databases，30

kinds of knowledge，30

kinds of techniques，30

k-nearest-neighbor，348-350

link-based object，561

with Markov chain，521

model，25

model selection，370-373

multimedia data，611-612

meltirelational，573-583

prediction versus，288-289，290-291

random subsampling，364

robustness，291

rough set approach，351-352

rule-based，318-327，374

scalability，291，306-310

spatial，606-607

speed，291

stream data，485

SVM，337-344，374

tree pruning，304-306

trees，431-432

as two-step process，481

Web documents，638-640 classification rules，33-34

exhaustive，321

extraction，321-322

induction，322-327 贝叶斯

提升

自助法

集体

混淆矩阵

交叉确认

数据预处理

决策树归纳

定义

错误率

模糊集方法

遗传算法

图模式

保持方法

IF-THEN规则可解释性

数据库类型

知识类型

技术类型

k最近邻

基于链接的对象马尔可夫链

模型

模型选择

多媒体数据

多关系

分析与预测

随机二次抽样鲁棒性

粗糙集方法

基于规则

可伸缩性

空间的

速度

流数据

支持向量机

树剪枝

树

作为两步过程Web文档

分类规则

穷举的

提取

归纳

mutually exclusive，321

pruning，326-327

quality measures，325-326

unordered，321

CLASSIT，433

class label attributes，286

cleaning，

Clementine，664，673，678

CLIQUE，436-439

defined，436

effectiveness，437-439

ideas，437

steps，437

CloseCut，551

closed cubes，161-162

closed frequent graphs，546-547

closed frequent itemsets，231，232，273 defined，231

item merging，248-249

item skipping，249

mining，248-250

sub-itemset pruning，249

subset checking，249

superset checking，249

CloSpan，508-509

CLTree，449-451

cluster analysis，25-26，383-461

agglomerative hierarchical clustering，408-411

binary variables，389-392

BIRCH，412-414

categorical variables，392-393

Chameleon，416-418

CLARANS，407-408

CLIQUE，436-439

CLTree，449-451

conceptual clustering，431-433

constraint-based，386，401，444-451

COWEB，431-433

data matrices，386

data types，386-398

DBSCAN，418-420

defined，25，383-386

DENCLUE，422-424 互斥的

剪枝

质量度量

无序的

类标号属性

清理

定义

有效性

思想

步骤

闭立方体

闭频繁图

闭频繁项集

定义

项合并

项跳过

挖掘

子项集剪枝

子集检查

超集检查

聚类分析

凝聚的层次聚类二元变量

分类变量

概念聚类

基于约束的

数据矩阵

数据类型

定义

density-based methods，399-400，418-424，460

as discretizaion method，91

dissmilarity matrices，386-387

distance-based，384

divisive hierarchical clustering，409-411

EM，404，429-431

example，26

frequent pattern-based methods，440-444

graph patterns，555

grid-based methods，400，434-439，460-461

hierarchical methods，399，408-418，460

high-dimensional data clustering，400-401，434-444，461

importance，384

incremental，385，386

interpretability，386

interval-scaled variables，387-389

iterative relocation techniques，398-399

k-means algorithm，402-404

k-medoids algorithm，404-407

k-modes method，404

methods，398-401

mixed-type variables，395-397

model-based methods，400，429-434，461

multirelational，580-583

neural network approach，433-434

noisy data，385

with obstacle objects，446-448

one-mode matrics，387

OPTICS，420-422

ordinal variables，393-394

outlier detection，451-459，461

partitioning methods，398-399，401-408，460

by pattern similarity，441

PROCLUS，439-440

p variables，386 基于密度的方法

作为离散化方法

相异度矩阵

基于距离的

分裂的层次聚类

期望极大化算法

例子

基于频繁模式的方法

图模式

基于网格的方法

层次的方法

高维数据聚类

重要性

增量的

可解释性

区间标度变量

迭代重定位技术

k均值算法

k 中心点算法

k 众数方法

方法

混合类型变量

基于模型的方法

多关系的

神经网络方法

噪声数据

具有障碍对象的

单模矩阵

序数型变量

离群点检测

划分方法

根据模式相似度

P个变量

ratio-scaled variables，394-395

requirements，385-386

ROCK，414-416

scalability，385

semi-supervised，449-451

spatial，606

STING，425-427

taxonomy formation，26

tools，384

two-mode matrices，387

user-constrained，448-449

vector objects，397-398

WaveCluster，427-429 cluster evolving data streams，486-489 CluStream，487-489

methodologies，486

STREAM，487

clustering

clustering-based bining，258 clusters

center-defined，423-424

defined，83，383，460

density-based，419

discovery，385

distance measurement，410

macroclusters，471

microclusters，447，471，487

quality measures，83

samples，86

visualization，672 CluSteam，487-489

cluster evolution analysis，489

defined，487

microclusters，488

time horizon，488

CMAR，346

coherent substructures，550 collaborative filtering，670-675

defined，670-672

example，672-673

collective classification，563-564

co-location patterns，606

color histogram-based signatures，608 column scalable systems，662 比例标度变量

需求

可伸缩性

半监督的

空间的

分类法组织形式

工具

二模矩阵

用户约束的

向量对象

聚类演变数据流

方法论

聚类

基于聚类的分箱

簇

中心定义的

定义

基于密度的

发现

距离度量

宏簇

微簇

质量度量

样本

可视化

簇演变分析

定义

微簇

时间范围

基于多关联规则的分类聚凝子结构

协同过滤

定义

例子

集体分类

并置模式

基于颜色直方图的特征列可伸缩的系统

community mining

defined，564

from multirelational networks，568-571

comparisons

complete-linkage algorithm,411 completeness，28

compound association，624

compute cube，137-139，160

concept characterization，219

concept description，198-210

defined，198，219

elements，219

concept hierarchies，121-123

defined，8，121，151

illustrated，122，123

implicit，121

manual difinition，87

use，87

concept hierarchy generation，97

bining，88

for categorical data，94-96

cluster analysis，91

defined，73

entropy-based discretization，89-90

histogram analysis，88

interval merging，90-91

intuitive partitioning，91-94

for numerical data，88-94 conceptual clustering，431-433

CLASSIT，433

COWEB，431-433

defined，431

confidence

association rules，229

interval estimation，370-371

minimum threshold，24，229 confusion matrix，360

connectionist learning，327

consecutive rules，65

constrained gradient analysis，195-198，219 example，196-198

gradient constraints，196

probe constraints，196 社团挖掘

定义

从多关系网络

比较

全链接算法

完全性

复合关联

计算立方体

概念特征化

概念描述

定义

元素

概念分层

定义

解释

蕴涵的

人工定义

使用

概念分层产生分箱

分类数据

聚类分析

定义

基于熵的离散化直方图分析

区间合并

直观划分

数值数据

概念类聚

定义

置信度

关联规则

区间估计

最小阈值

混淆矩阵

连接者学习

连续性规则

约束的梯度分析例子

梯度约束

探测约束

significance constraints，196 constraint-based association mining，265-272，274

antimonotonic rule constraints，269-270

convertible rule constraints，271-272

data constraints，266

defined，266

dimension/level constraints，266

inconvertible rule constraints，272

interestingness constraints，266

knowledge-type constraints，266

metarule-based，266-267

monotonic rule constraints，270

rule constraints，266，267-272

succinct rule constraints，270-271 constraint-based clustering，386，444-451，461

defined，401

on distance/similarity functions，445

with obstacle objects，446-448

semi-supervised，449-451

user-constrained，448-449 constraint-based sequential pattern mining，509-512，528

defined，510

event folding windows，510

gaps，511

parallel episodes，511

with regular expression constraint，511-512

serial episodes，511

constraint-based substructure mining，548-549 constraints

antimonotonic，164，269-270，510，549

on clustering parameters，445

data，266

dimension/level，266

gradient，196

on individual objects，444-445

interestingness，266

kenowledge-type，266

monotonic，510，549 显著性约束

基于约束的关联挖掘

反单调规则约束

可转变的规则约束

数据约束

定义.

维/层次约束

不可转变的规则约束

兴趣度约束

知识类型约束

基于元规则的

单调的规则约束

规则约束

简洁的规则约束

基于约束的聚类

定义

距离/相似度函数

具有障碍对象

半监督的

用户约束的

基于约束的序列模式挖掘

定义

事件折叠窗口

间隙

并行场景

正则表达式约束

串行场景

基于约束的子结构挖掘约束

反单调的

聚类参数

数据

维/层

梯度

个体对象

兴趣度

知识类型

单调的

probe，196

rule，266，267-272

significance，196

SQL-based，271

user-specified，445 contingency tables，68 continuous-media data，19 continuous ordinal variables，393 continuous quries，20，473 convertible rule constraints，271-272 correlation analysis，261-265，289 with #，262-263

defined，67

example，69

with lift，261-262 correlation measures，263-265

comparison，263-265

null-invariant，264，274 correlation rules，261，272，274 correlations，24

coefficients，67

relationshios，264

coount()，51，52，119，120 counterterrorism，680，685 coupling，662

loose，35，662

no，35，662

semitight，35，662

tught，35-36，662 COWEB，431-433

classfication trees，431-433

CLASSIT，433

functionality，432-433

merging operation，433

splitting operation，433

Cox proportional hazards，667 CPAR，347

CpG islands，518，519，521 CPTs，315，316

critical layers，477-478

CRM，676

CrossClus，580-583，586

clustering results，583

defined，580 探索

规则

显著性

基于SQL的

用户指定的

相依表

连续媒体数据

连续序数变量

连续查询

可转变的规则约束相关分析

定义

例子

提升度