当前位置:文档之家› 数据挖掘词汇索引(全部)

数据挖掘词汇索引(全部)

A

Accurancy

Bagging,366-367

Boosting,367-370

Classification,288,290

classifier measures,360-362

CrossMine,580

Evaluation,363-366

Increasing,366-370

predicator measures,362-364

prediction,290

Adaboost,368-369

Adaptive Probabilistic Networks,318

ad hoc data mining,37

agglomerative hierarchical clustering,408-411 aggregate measures,474

aggregation

complex data types and,198-199

data cube,73-75

defined,70

multiway array,164

on-line,145

simultaneous,165

spatial,594

tilted time frame slots,478

AGM algorithm,538

algebraic measure,51-52,120

algorithms

associative classification,322

distributed,38

genetic,351,374

incremental,38

parallel,38

partitioning,401

randomized,472-473

alignment

biological sequence,514-518

defined,514

multiple sequence,514,517-518

pairwise,514,515-516

alternative hypotheses,452

alternative substructure patterns,547-548 amino acids,654

analytical processing,146 准确率

装袋

提升

分类

分类器度量

评估

提高

预测器度量

预测

自适应概率网络特定的数据挖掘凝聚层次聚类聚集度量

聚集

复杂的数据类型数据立方体

定义

多路数组

联机

同时的

空间的

倾斜时间框架槽AGM算法

代数度量

算法

关联分类

分布的

遗传的

增量的

并行的

划分的

随机的

比对

生物学序列

定义

多序列

逐对

备择假设

其他子结构模式氨基酸

分析处理

anomaly detection,659

anonymous databases,680

ANOV A,666-667

antiminitinic constrains,,164,269-270 apex cuboids,1,74-75,114,138 applications,649-660

biological data analysis,654-657

domain-specific,684

exploration,681

financial data analysis,649-651

intrusion detection,658-660

retail industry,651-652

scientific,657-658

telecommunications industry,652-653 approximate frequent substructures,549 approximate query answering,474 approximation,594

Apriori,273

algorithm illustration,239

defined,234-235

dynamic itemset counting,242

efficiency,240-242

improving,240-242

example,236-238

in frequent itemset mining,234-239

hash-based technique,240-241

join step,235,238

level-wise search,235

partitioning,241

property,235,253

prune step,235-236,238

pruning method,163

sampling,241-242

transaction reduction technique,241 Apriori-based subgraph mining,537-539 AGM algorithm,538

AprioriGraph,537,538

BFS strategy,539

edge-disjoint path,539

framework,537

FSG algorithm,538-539

Overhead,539

AprioriGraph,537,538

architectures 异常检测

匿名数据库

单因素方差分析

反单调约束

顶点方体

应用

生物学数据分析

特定领域的

探测

金融数据分析

入侵检测

零售业

科学的

电讯业

近似的频繁子结构

近似的查询回答

近似

算法说明

定义

动态项集计数

有效性

提高/改进

例子

频繁项集挖掘

基于散列的技术

连接步

逐层搜索

划分

性质

剪枝步

剪枝方法

抽样

事物归约技术

基于Apriori的子图挖掘AGM算法

BFS策略

边不相交路径

框架

FSG算法

开销

系统结构

data warehouse,127-137

defined,39

OLAM,148-150

OLE DB for Data Mining,692

three-tier,130-133,151

ARIMA,493,667

arithmetic means

association analysis,23-24

association-based classification,627 association rules

Boolean,233

classification by analysis,344-347

clustering,258-259

confidence,229

correlation,233

defined,229

generating,239-240

from frequence itemsets,239-240

hybrid-dimensional,255

interdimensional,255

interestingness,229

intradimensional,254

metarule-guided mining,266-267

mining,250-259,272

multidimensional,24,233,254-257

multilevel,233,250-254,273

multimedia data,612-613

periodic,513

quantitative,233,250,257-259,274

single-dimensional,23,233,254

spatial,605-606

strong,231,260,272

support,229

support-confidence framework,259

visualization,671

associative classification,344-347,374 algorithms,322

CBA,345-346

CMAR,346-347

CPAR,347

frequent itemset mining versus,345 asymmetric binary dissmilarity,390-391 asymmetric binary similarity,391

atomic matching,497 数据仓库

定义

用于数据挖掘的OLE DB 三层

自动回归的综合移动平均算术均值

关联分析

基于关联的分类

关联规则

布尔的

分析的分类

聚类

置信度

相关

定义

产生

由频繁项集

混合维的

维间的

兴趣度

维内的

元规则制导挖掘

挖掘

多维

多层

多媒体数据

周期的

量化的

单维的

空间的

强的

支持度

支持度-置信度框架

可视化

关联分类

算法

频繁项集挖掘与

非对称的二元相异度

非对称的二元相似度

原子匹配

attribute-oriented induction,198-218,219 algorithm,205

concept,199

for data characterization,199-204

defined,199

example,203-204

implementation,205-206

techniques,219

attributes

categorical,94

class label,286

complex structure-valued,593

construction,71,72

continuous-valued,302

defined,10

evaluation measures,75-76

generalization,202

grouping,193

list-valued,593

multirelational,580

partial ordering,94

partial set,96

predicted,288

quantitative,255,256-257

redundancy,68-69

removal,201

sets,95

set-valued,592-593

attribute selection measures,296-304

CHAID,304

defined,296

gain ratio,301

Gini index,302-304

Information gain,297-300

MDL,304,306

multivariate splits,304

attribute subset selection,75-76,289

decision tree induction,76,77

defined,49,73,75

forward selection / backward elimination combination,76

greedy methods,75,76

stepwise backward elimination,76

stepwise forward selection,76 面向属性的归纳

算法

概念

数据特征化

定义

例子

实现

技术

属性

分类的

类标号

复杂结构值的

构造

连续值的

定义

评估度量

泛化

分组

列表值的

多关系的

偏序

部分集合

预测

定量的

冗余

删除

集合

集合值的

属性选择度量

定义

增益率

Gini指标

信息增益

多元分裂

属性子集选择

决策树归纳

定义

向前选择和向后删除的结合贪心方法

逐步向后删除

逐步向前选择

audio data mining,613-614,670 authoritative Web pages,631-637

analysis,20-21

authority weight,633

block-level link analysis,636

block-to-age relationship,636

defined,631

HITS,633,634

identifying,631-637

page-to-block relationships,636 autocorrelation analysis,491

automated Web page clustering and classification,21

A VC-groups,309

A VC-sets,309

average,183,184,474

B

background knowledge,31,37 backpropagation,327-336,374

algorithm illustration,330-331

case updating,333

defined,328

epoch updating,333

error,332

functioning,329-330

hidden layers,328,331

input layers,328

interpretability and,334-336

learning rates,332

logistic function,332

multilayer feed-forward neural network,328-329

network pruning,335

output layers,328,331

sample learning calculations,333-334

sensitivity analysis,336

sigmoid function,332

terminating conditions,333 bagging,366-367,374

balanced binary trees,471

bar charts,22,207,208

base cuboids,74,114,138

base fact tables,121 音频数据挖掘

权威Web页面

分析

权威权重

块级链接分析

块到页关系

定义

识别

页到块关系

自相关分析

自动Web页面聚类和分类A VC组

A VC集

背景知识

后向传播

算法解释

实例更新

定义

周期更新

误差

机能

隐藏层

输入层

可解释性

学习率

逻辑斯谛函数

多层前馈神经网络

网络修剪

输出层

样本学习计算

灵敏度分析

S形函数

终止条件

装袋

平衡二叉树

条形图

基本方体

基本事实表

Baum-Welch algorithm,526-527

Bayesian belief networks,315-317,373-374 components,315

conditional probability tables,315

CPTs,316

defined,310

directed acyclic graphics,315

gradient descent strategy,,317-318

illustrated,316

training,317-318

Bayesian classification,310-318

Bayesian belief networks,315-318,373-374

Bayes’ theorem,311-315

class conditional independence,312

class label prediction,313-314

in document analysis,626

Laplace correction,314-315

Naive,311-315,373

simple Bayesian classifier,311 Bayes’ theorem,310-311

belief networks

BFS(breadth-first search),539 biclustering,442-443

BIDE algorithm,509

binary variables,389-392

asymmetric,390

defined,390

dissimilarity between,390-391

symmetric,390

binning,63

clustering-based,258

defined,258

equal-frequency,88,258

equal-width,88,258 bioinformatics,513

biological data analysis,654-657

amino acids,654

DNA sequences,654-655

genes,654

genomes,654

mining,655-657

nucleotides,654

proteomes,654 Baum-Welch算法

贝叶斯信念网络

成分

条件概率表

定义

有向无环图

梯度下降策略

解释

训练

贝叶斯分类

贝叶斯信念网络

贝叶斯定理

类条件独立性

类标号预测

文档分析

拉普拉斯校准

朴素的

简单贝叶斯分类法贝叶斯定理

信念网络

宽度优先搜索

双聚类

BIDE算法

二元变量

非对称的

定义

二元变量间的相异度对称的

分箱

基于聚类的

定义

等频

等宽

生物信息学

生物学数据分析

氨基酸

DNA序列

基因

基因组

挖掘

核苷

蛋白质组

biological data mining,682

biological sequences,528

alignment,514-518

analysis,518-527

Baum-Welch algorithm,526-527

BLAST,516-517

Feng-Doolittle alignment method,518

forward algorithm,523-524

HMMs,521-523

homologous,514

mining,513-527

multiple alignment,514,517-518

nucleotides,514

pairwise alignment,514,515-516

phylogenetic trees,514

Viterbi algorithm,524-525 biometric encryption,680

BIRCH,412-414

clustering feature,412-413

clustering feature tree,413-414

defined,412

bitmap indexing,141-142,144,151 bitmapped join indexing,143,151

BLAST algorithm,516-517

defined,516

functionality,517

versions/extensions,517 Blockbuster,678

block-level link analysis,636,637

BOA T,309-310

Boolean association rules,233

Boolean retrieval,617

boosting,368-370,374

Adaboost,368-370

Defined,368

bootstrap method,365

bottom-up design approach,129

bottom-up discretization,87

boxplots,54-55

defined,54

illustrated,55

BUC,168-172

algorithm,169-170

construction of iceberg cube,171 生物学数据挖掘

生物学序列

对比

分析

Baum-Welch算法

Feng-Doolittle对比方法前向算法

同源的

挖掘

多比对

核苷酸

逐对比对

种系发生树

维特比算法

生物特征加密

聚类特征

聚类特征树

定义

位图索引

位图连接索引

BLAST算法

定义

功能

版本/扩展

块级链接分析

树构造的自助的乐观算法布尔关联规则

布尔检索

提升

定义

自助法

自底向上的设计方法

自底向上离散化

盒图

定义

解释

算法

冰山立方体构造

Define,168

partitioning,172

performance,172

procedding order,169 buckets,88

business processes,129-130

business query view,128

C

C4.5,76,292,373

class-based ordering scheme,322

defined,292

gain ratio,301

pessimistic pruning,306

C5.0,664

Cardinality,139-140

Function,459

link,estimation,562

CART,76,292,359,373

commercial version,664

defined,292,664

Gini index,302-304

cases,693

case updating,333

categorical variables,392-393

CBA,345-346

CBR,350

cell-based algorithm,455

cells

aggregate,159

ancestor,159

base,159

brightness,207

defined,13

descendant,159

gradient,196

m-dimensional,159

probe,196

center-defined clusters,423-424 central tendency measures,51-53

algebraic,51-52

distributive,51

holistic,52-53

centroid distance,83 定义

划分

性能

处理次序

商务处理

商务查询视图

基于类的排序方案定义

增益率

悲观剪枝

基数

函数

链,估计

商品化版本

定义

Gini 指标

案例

实例更新

分类变量

基于分类的关联基于案例的推理基于单元的算法单元

聚集

祖先

基本

亮度

定义

子孙,后代

梯度

m维

探测

中心定义的簇

中心趋势度量

代数的

分布的

整体的

质心距离

CF,412-413

CF trees,412,413-414

CHAID,304

Chameleon,416-418

defined,416

illustrated,417

relative closeness,417-418

relative interconnectivity,417 characteristic rules,22

Chebyshev’inequality,472

Chernoff bounds,473,482

ChiMerge,90-91

chi-square test,68

chunking,164

chunk memory,165

CLARANS,407-408,583

class-based ordering,320,322

class comparisons,210-215

crosstab,215-216

data collection,211

dimension relevance analysis,211

mining,210-215

presentation,211

quantitative discriminant rule,215

synchronous generalization,211 class composition hierarchies,595-596 class/concept descriptions,

classes

conditional independence,310

description,215-218

discrimination,210-215

equivalent,351

instances,16,563

target,21-22,211 classification,29-31

accuracy,288

accuracy evaluation,363-366

accuracy measures,360-362

applications adapted,30

association-based,627

by association rule analysis,344-347

associative,322,344-347,374

backpropagation,327-336

bagging,366-367,374 聚类特征

CF树

定义

解释

相对接近度

相对互连度

特征规则

切比雪夫不等式切尔诺夫界

卡方检验

分块

块内存

基于类的序

类比较

交叉表

数据收集

维相关分析

挖掘

表示

量化区分规则

同步泛化

类复合层次

类/概念描述

条件独立性

描述

区分

等价

实例

目标

分类

准确率

准确率估计

准确率度量

应用适应的

基于关联的

基于关联规则分析关联的

后向传播

装袋

Bayesian,310-318

boosting,367-370,374

bootstrap method,365

collective,563-564

confusion matrix,360

cross-validation,364-365

data preparation for,289-290

by decision tree induction,291-310

defined,24,40,285,286

error rate,360

fuzzy set approaches,352-354

genetic algorithms,351,374

with graph patterns,555

holdout method,364

IF-THEN rules,319-321

interpretability,291

kinds of databases,30

kinds of knowledge,30

kinds of techniques,30

k-nearest-neighbor,348-350

link-based object,561

with Markov chain,521

model,25

model selection,370-373

multimedia data,611-612

meltirelational,573-583

prediction versus,288-289,290-291

random subsampling,364

robustness,291

rough set approach,351-352

rule-based,318-327,374

scalability,291,306-310

spatial,606-607

speed,291

stream data,485

SVM,337-344,374

tree pruning,304-306

trees,431-432

as two-step process,481

Web documents,638-640 classification rules,33-34

exhaustive,321

extraction,321-322

induction,322-327 贝叶斯

提升

自助法

集体

混淆矩阵

交叉确认

数据预处理

决策树归纳

定义

错误率

模糊集方法

遗传算法

图模式

保持方法

IF-THEN规则可解释性

数据库类型

知识类型

技术类型

k最近邻

基于链接的对象马尔可夫链

模型

模型选择

多媒体数据

多关系

分析与预测

随机二次抽样鲁棒性

粗糙集方法

基于规则

可伸缩性

空间的

速度

流数据

支持向量机

树剪枝

作为两步过程Web文档

分类规则

穷举的

提取

归纳

mutually exclusive,321

pruning,326-327

quality measures,325-326

unordered,321

CLASSIT,433

class label attributes,286

cleaning,

Clementine,664,673,678

CLIQUE,436-439

defined,436

effectiveness,437-439

ideas,437

steps,437

CloseCut,551

closed cubes,161-162

closed frequent graphs,546-547

closed frequent itemsets,231,232,273 defined,231

item merging,248-249

item skipping,249

mining,248-250

sub-itemset pruning,249

subset checking,249

superset checking,249

CloSpan,508-509

CLTree,449-451

cluster analysis,25-26,383-461

agglomerative hierarchical clustering,408-411

binary variables,389-392

BIRCH,412-414

categorical variables,392-393

Chameleon,416-418

CLARANS,407-408

CLIQUE,436-439

CLTree,449-451

conceptual clustering,431-433

constraint-based,386,401,444-451

COWEB,431-433

data matrices,386

data types,386-398

DBSCAN,418-420

defined,25,383-386

DENCLUE,422-424 互斥的

剪枝

质量度量

无序的

类标号属性

清理

定义

有效性

思想

步骤

闭立方体

闭频繁图

闭频繁项集

定义

项合并

项跳过

挖掘

子项集剪枝

子集检查

超集检查

聚类分析

凝聚的层次聚类二元变量

分类变量

概念聚类

基于约束的

数据矩阵

数据类型

定义

density-based methods,399-400,418-424,460

as discretizaion method,91

dissmilarity matrices,386-387

distance-based,384

divisive hierarchical clustering,409-411

EM,404,429-431

example,26

frequent pattern-based methods,440-444

graph patterns,555

grid-based methods,400,434-439,460-461

hierarchical methods,399,408-418,460

high-dimensional data clustering,400-401,434-444,461

importance,384

incremental,385,386

interpretability,386

interval-scaled variables,387-389

iterative relocation techniques,398-399

k-means algorithm,402-404

k-medoids algorithm,404-407

k-modes method,404

methods,398-401

mixed-type variables,395-397

model-based methods,400,429-434,461

multirelational,580-583

neural network approach,433-434

noisy data,385

with obstacle objects,446-448

one-mode matrics,387

OPTICS,420-422

ordinal variables,393-394

outlier detection,451-459,461

partitioning methods,398-399,401-408,460

by pattern similarity,441

PROCLUS,439-440

p variables,386 基于密度的方法

作为离散化方法

相异度矩阵

基于距离的

分裂的层次聚类

期望极大化算法

例子

基于频繁模式的方法

图模式

基于网格的方法

层次的方法

高维数据聚类

重要性

增量的

可解释性

区间标度变量

迭代重定位技术

k均值算法

k 中心点算法

k 众数方法

方法

混合类型变量

基于模型的方法

多关系的

神经网络方法

噪声数据

具有障碍对象的

单模矩阵

序数型变量

离群点检测

划分方法

根据模式相似度

P个变量

ratio-scaled variables,394-395

requirements,385-386

ROCK,414-416

scalability,385

semi-supervised,449-451

spatial,606

STING,425-427

taxonomy formation,26

tools,384

two-mode matrices,387

user-constrained,448-449

vector objects,397-398

WaveCluster,427-429 cluster evolving data streams,486-489 CluStream,487-489

methodologies,486

STREAM,487

clustering

clustering-based bining,258 clusters

center-defined,423-424

defined,83,383,460

density-based,419

discovery,385

distance measurement,410

macroclusters,471

microclusters,447,471,487

quality measures,83

samples,86

visualization,672 CluSteam,487-489

cluster evolution analysis,489

defined,487

microclusters,488

time horizon,488

CMAR,346

coherent substructures,550 collaborative filtering,670-675

defined,670-672

example,672-673

collective classification,563-564

co-location patterns,606

color histogram-based signatures,608 column scalable systems,662 比例标度变量

需求

可伸缩性

半监督的

空间的

分类法组织形式

工具

二模矩阵

用户约束的

向量对象

聚类演变数据流

方法论

聚类

基于聚类的分箱

中心定义的

定义

基于密度的

发现

距离度量

宏簇

微簇

质量度量

样本

可视化

簇演变分析

定义

微簇

时间范围

基于多关联规则的分类聚凝子结构

协同过滤

定义

例子

集体分类

并置模式

基于颜色直方图的特征列可伸缩的系统

community mining

defined,564

from multirelational networks,568-571

comparisons

complete-linkage algorithm,411 completeness,28

compound association,624

compute cube,137-139,160

concept characterization,219

concept description,198-210

defined,198,219

elements,219

concept hierarchies,121-123

defined,8,121,151

illustrated,122,123

implicit,121

manual difinition,87

use,87

concept hierarchy generation,97

bining,88

for categorical data,94-96

cluster analysis,91

defined,73

entropy-based discretization,89-90

histogram analysis,88

interval merging,90-91

intuitive partitioning,91-94

for numerical data,88-94 conceptual clustering,431-433

CLASSIT,433

COWEB,431-433

defined,431

confidence

association rules,229

interval estimation,370-371

minimum threshold,24,229 confusion matrix,360

connectionist learning,327

consecutive rules,65

constrained gradient analysis,195-198,219 example,196-198

gradient constraints,196

probe constraints,196 社团挖掘

定义

从多关系网络

比较

全链接算法

完全性

复合关联

计算立方体

概念特征化

概念描述

定义

元素

概念分层

定义

解释

蕴涵的

人工定义

使用

概念分层产生分箱

分类数据

聚类分析

定义

基于熵的离散化直方图分析

区间合并

直观划分

数值数据

概念类聚

定义

置信度

关联规则

区间估计

最小阈值

混淆矩阵

连接者学习

连续性规则

约束的梯度分析例子

梯度约束

探测约束

significance constraints,196 constraint-based association mining,265-272,274

antimonotonic rule constraints,269-270

convertible rule constraints,271-272

data constraints,266

defined,266

dimension/level constraints,266

inconvertible rule constraints,272

interestingness constraints,266

knowledge-type constraints,266

metarule-based,266-267

monotonic rule constraints,270

rule constraints,266,267-272

succinct rule constraints,270-271 constraint-based clustering,386,444-451,461

defined,401

on distance/similarity functions,445

with obstacle objects,446-448

semi-supervised,449-451

user-constrained,448-449 constraint-based sequential pattern mining,509-512,528

defined,510

event folding windows,510

gaps,511

parallel episodes,511

with regular expression constraint,511-512

serial episodes,511

constraint-based substructure mining,548-549 constraints

antimonotonic,164,269-270,510,549

on clustering parameters,445

data,266

dimension/level,266

gradient,196

on individual objects,444-445

interestingness,266

kenowledge-type,266

monotonic,510,549 显著性约束

基于约束的关联挖掘

反单调规则约束

可转变的规则约束

数据约束

定义.

维/层次约束

不可转变的规则约束

兴趣度约束

知识类型约束

基于元规则的

单调的规则约束

规则约束

简洁的规则约束

基于约束的聚类

定义

距离/相似度函数

具有障碍对象

半监督的

用户约束的

基于约束的序列模式挖掘

定义

事件折叠窗口

间隙

并行场景

正则表达式约束

串行场景

基于约束的子结构挖掘约束

反单调的

聚类参数

数据

维/层

梯度

个体对象

兴趣度

知识类型

单调的

probe,196

rule,266,267-272

significance,196

SQL-based,271

user-specified,445 contingency tables,68 continuous-media data,19 continuous ordinal variables,393 continuous quries,20,473 convertible rule constraints,271-272 correlation analysis,261-265,289 with #,262-263

defined,67

example,69

with lift,261-262 correlation measures,263-265

comparison,263-265

null-invariant,264,274 correlation rules,261,272,274 correlations,24

coefficients,67

relationshios,264

coount(),51,52,119,120 counterterrorism,680,685 coupling,662

loose,35,662

no,35,662

semitight,35,662

tught,35-36,662 COWEB,431-433

classfication trees,431-433

CLASSIT,433

functionality,432-433

merging operation,433

splitting operation,433

Cox proportional hazards,667 CPAR,347

CpG islands,518,519,521 CPTs,315,316

critical layers,477-478

CRM,676

CrossClus,580-583,586

clustering results,583

defined,580 探索

规则

显著性

基于SQL的

用户指定的

相依表

连续媒体数据

连续序数变量

连续查询

可转变的规则约束相关分析

定义

例子

提升度

相关度量

比较

零不变性

相关规则

相关

系数

联系

反恐

耦合

松散的

不耦合

半紧密的

紧密的

分类树

功能

合并操作

分裂操作

Cox比例风险

CpG岛

条件概率表

关键层

顾客关系管理

聚类结果

定义

rule building,578-579

scalability,580

cross-tabulations,206-207

cross-validation,364-365,374

defined,364

leave-one-out,365

stratified,365

cube by,160,193

cube gradient analysis,279

cubes

cuboids

apex,74-75,114,138

base,74,114,138

cardinality and,139-140

defined,75,113

full materialization,140,151

individual,159

lattice of,75,113,150,158,218,256

partial materialization,140,151

sparse,160

total number of,138,139

trees,174

curse of dimensionality,139,151,195 curves,22

loess,60-61

ROC,372-373

cusum charts,667

CVFDT,485

cyclic indexes,493

D

data

archaeology,5

categorical,94-96

in cluster analysis,386-398

complex,682

constraints,266

continuous-media,19

discrimination,22-23

dispersion,53-56

dredging,5

engineering design,16

extraction,134 规则构建

可伸缩性

交叉表

交叉确认

定义

留一

分层

立方体梯度分析

立方体

方体

顶点

基本

定义

完全物化

个体的

部分物化

稀疏的

总数

维灾难

曲线

局部回归曲线

cusum图表

概念自适应的快速决策树算法周期指标

数据

考古

分类的

聚类分析

复杂的

约束

连续媒体

区分

散布

捕捞

工程设计

提取

focusing,200

generalizing,127

incomplete,37,48

inconsistent,48

labeled,564

linearly inseparable,342-344

linearly separable,337-342

multimedia,16,607-614,637-638

noisy,37,48,62-64,385

numerical,88-94,121

obscuration,681

relational,10

selection,7

semistructured,615

spatial,16,593

structured,592

task-relevant,31,34

“tombs”,4

training,24

unlabeled,564

variance,53-56

data aggregation,49

data auditing tools,66

database queries

databases

advanced,15-21

anonymous,680

data mining integration,34-36

defined,10

graph,553-555

heterogeneous,19

inductive,666

legacy,19

multimedia,18-19,594,607

object-oriented,16,641

plan,596-600,641

raster,607

relational

sequence,17,468,498-513,527

server,7

spatial,17-18,600

spatiotemporal,18

statistical,126

technology evolution,2,39 聚焦

泛化

不完全的,不完整的不一致的

标记的

线性不可分的

线性可分的

多媒体

噪声

数值的

模糊

关系的

选择

半结构化的

空间的

结构化的

任务相关的

“坟墓”

训练

无标记的

方差

数据聚类

数据审计工具

数据库查询

数据库

高级的

匿名的

数据挖掘集成

定义

异构的

归纳的

遗产

多媒体的

面向对象的

规划

光栅

关系的

序列

服务器

空间的

时间空间的

统计学的

技术演变

temporal,17

text,18,614

time-series,17,467-468,489-497,527

transactional,14-15

data characterization

attribute-oriented induction for,199-204

data mining query for,200

defined,22,198

example,22

output,22

data cleaning,61-67,289

binning,63

clustering,64

defined,7,48,61,97,134

interactivity,66-67

missing values,61-62

noisy data,62-64

as process,65-67

regression,63

data compression,665

data cube aggregation,73-75

data cube computation,137-141,218-219 BUC,168-172

with complex iceberg conditions,187-188

full,164-168,178

general strategies,162-164

materialization,158-164

methods,157-188

multiway array aggregation,164-168

optimization techniques,162-164

Star-Cubing,173-178

data cubes

3-D,112,113

apex cuboid,74-75

base cuboid,74

closed,161-162

compute cube operator,137-139,160

constrained gradient analysis,195-198,219

cube by operator,160,193

discovery-driven exploration,189-192 时态的

文本

时间序列

事务的

数据特征化

面向属性的归纳

数据挖掘查询

定义

例子

输出

数据清理

分箱

聚类

定义

交互性

丢失值

噪声数据

作为过程

回归

数据压缩

数据立方体聚集

数据立方体计算

具有复杂冰山条件

完全

一般策略

物化

方法

多路数组聚集

优化技术

数据立方体

顶点方体

基本方体

闭的

compute cube操作符约束的梯度分析

cube by操作符

发现驱动的探查

example,13

group by operator,113,138,193

iceberg,151,160,171,218

illustrated,74

lattice of cuboids,75,113,150,158,218

materialization,140-141,151

measures,119

measures interpretation,120-121

multidimensional,13-14,22

multifeature,192-195,219

multimedia,609

partial materialization,140,151,160

queries,193

shell fragments,162,178-187,218

sparse,160

spatial,601-605

stream,474-479

DataDetective,678

data generalization

data integration,67-70

correlation analysis,67,69

defined,7,49,97

object matching,67

redundancy and,67-68

schema,67

value conflict,detection/resolution,70

data marts

defined,116,132

dependent,132

independent,132

data matrices,386

data migration tools,66

data mining

ad hoc,37

applications,649-660

audio,670

biological,682

for counterterrorism,680,685

data streams,20

for data warehouse perspective,9

defined,5-9,39

descriptive,218 例子

group by操作符

冰山

解释

方体的格

物化

度量

度量的解释

多维

多特征

多媒体

部分物化

查询

壳片段

稀疏的

空间的

数据泛化

数据集成

相关分析

定义

对象匹配

冗余

模式

值冲突,检测/解决

数据集市

定义

依赖的

独立的

数据矩阵

数据迁移工具

数据挖掘

特别

应用

音频

生物学的

反恐

数据流

数据仓库观点

定义

描述性

相关主题
文本预览
相关文档 最新文档