当前位置：文档之家› 客户关系管理中的数据挖掘技术【外文翻译】

客户关系管理中的数据挖掘技术【外文翻译】

客户关系管理中的数据挖掘技术【外文翻译】外文原文

Data mining techniques for customerrelationship management

Chris Rygielski , Jyun-Cheng Wang , David C. Yen

Abstract

Advancements in technology have made relationship marketing a

reality in recent years. Technologies such as data warehousing, data mining, and campaign management software have made customer relationship management a new area where firms can gain a competitive advantage. Particularly through data mining—the extraction of hidden predictive information from

large databases—organizations can identify valuable customers, predict future behaviors, and enable firms to make proactive, knowledge-driven decisions. The automated, future-oriented analyses made possible by data mining move beyond the analyses of past events typically provided by history-oriented tools such as decision support systems. Data mining tools answer business questions that in the past were too time-consuming to pursue. Yet, it is the answers to these questions make customer relationship management possible. Various techniques exist among data mining software, each with their own advantages and challenges for different types of applications. A particular dichotomy exists between neural networks and chi-square automated interaction detection (CHAID). While differing approaches abound in the realm of

data mining, the use of some type of data mining is necessary to accomplish the goals of 'today’s customer relationship management philosophy.

Keywords: Customer relationship management (CRM); Relationship marketing; Data mining; Neural networks;Chi-square automated interaction detection (CHAID); Privacy rights 1. Introduction

A new business culture is developing today. Within it, the economics of customer relationships are changing in fundamental ways, and companies are facing the need to implement new solutions and strategies that address these changes. The concepts of mass production and mass marketing,

first created during the Industrial Revolution, are being supplanted by new ideas in which customer relationships are the central business issue. Firms today are concerned with increasing customer value through analysis of the customer lifecycle. The tools and technologies of data warehousing, data mining, and other customer relationship management (CRM) techniques afford new opportunities for businesses to act on the concepts of relationship marketing.The old model of ―design-build-

sell‖ (a product-oriented view) is being replaced by ―sell-build-redesign‖ (a

customer-oriented view). The traditional process of massmarketing is being challenged by the new approach of one-to-one marketing. In the traditional process, the marketing goal is to reach more customers and

expand the customer base. But given the high cost of acquiring new customers, it makes better sense to conduct business with current customers. In so doing, the marketing focus shifts away from the breadth of customer base to the depth of each customer’s needs.The performance metric changes from market share to so-called ―wallet share‖. Businesses do not just

deal with customers in order to make transactions; they turn the opportunity to sell products into a service experience and endeavor to establish a long-term relationship with each customer. The advent of the Internet has undoubtedly contributed to the shift of marketing focus. As on-line information becomes more accessible and abundant, consumers become more informed and sophisticated. They are aware of all that is being offered, and they demand the best. To cope with this condition, businesses have to distinguish their products or services in a way that avoids the undesired result of becoming mere commodities. One effective way to distinguish themselves is with systems that can interact

precisely and consistently with customers. Collecting customer demographics and behavior data makes precision targeting possible. This kind of targeting also helps when devising an effective promotion plan to meet tough competition or identifying prospective customers when new products appear. Interacting with customers consistently means businesses must store transaction records and responses in an online system that is available to knowledgeable staff members who know how to

interact with it. The importance of establishing close customer relationships is recognized, and CRM is called for.

It may seem that CRM is applicable only for managing relationships between businesses and consumers. A closer examination reveals that it is even more crucial for business customers. In business-to-business

(B2B) environments, a tremendous amount of information is exchanged on a regular basis. For example, transactions are more numerous, custom contracts are more diverse,

and pricing schemes are more complicated. CRM helps smooth the process when various representatives of seller and buyer companies communicate and collaborate. Customized catalogues,personalized business portals, and targeted product offers can simplify the procurement process and improve efficiencies for both companies. E-mail alerts and new product information tailored to different roles in the buyer company can help increase the effectiveness of the sales pitch. Trust and authority are enhanced if targeted academic reports or industry news are delivered to the relevant individuals. All of these can be considered among the benefits of CRM.

Cap Gemini conducted a study to gauge company awareness and preparation of a CRM strategy [1]. Of the firms surveyed, 65% were aware of CRM technology and methods; 28% had CRM projects under study or in the implementation phase; 12% were in the operational phase. In 45% of the companies surveyed, implementation and monitoring of the CRM project had been initiated and controlled by top management. Thus, it is

apparent that this is a new and emerging concept that is seen as a key strategic initiative.

This article examines the concepts of customer relationship management and one of its components, data mining. It begins with an overview of the concepts of data mining and CRM, followed by a discussion of evolution, characteristics, techniques, and applications of both concepts. Next, it integrates the two concepts and illustrates the relationship, benefits, and approaches to implementation, and the limitations of the technologies. Through two studies, we offer a closer look at two data mining techniques: Chi-square Automatic Interaction Detection (CHAID) and Neural Networks. Based on those case studies, CHAID and neural networks are compared and contrasted on the basis of their strengths and weaknesses. Finally, we draw conclusions based on the discussion.

2.1. Definition

“Data mining‖ is defined as a sophisticated data search capability that uses statistical algorithms to discover patterns and correlations in data [2]. The term is an analogy to gold or coal mining; data mining finds and extracts knowledge (―data nuggets‖) buried in corporate data warehouses, or information that visitors have dropped on a website, most of which can lead to improvements in the understanding and use of the data. The data mining approach is complementary to other data analysis techniques such as statistics, on-line analytical processing (OLAP),

spreadsheets, and basic data access. In simple terms, data mining is another way to find

meaning in data.

Data mining discovers patterns and relationships hidden in data [3], and is actually part of a larger process called ―knowledge discovery‖ which describes the steps that must be taken to ensure meaningful results. Data mining software does not, however, eliminate the need to know the business, understand the data, or be aware of general

statistical methods. Data mining does not find patterns and knowledge

that can be trusted automatically without verification. Data mining

helps business analysts to generate hypotheses, but it does not validate the hypotheses. 2.2. The evolution of data mining

Data mining techniques are the result of a long research and product development process. The origin of data mining lies with the first storage of data on computers, continues with improvements in data access, until today technology allows users to navigate through data in real time. In the evolution from business data to useful information, each step is built on the previous ones. Table 1 shows the evolutionary

stages from the perspective of the user.

In the first stage, Data Collection, individual sites collected data used to make simple calculations such as summations or averages. Information generated at this step answered business questions related

to figures derived from data collection sites,such as total revenue or

average total revenue over a period of time. Specific application programs were created for collecting data and calculations.

The second step, Data Access, used databases to store data in a structured format. At this stage, company-wide policies for data collection and reporting of management information were established. Because every business unit conformed to specific requirements or formats, businesses could query the information system regarding branch sales during any specified time period.

Once individual figures were known, questions that probed the performance of aggregated sites could be asked. For example, regional sales for a specified period could be calculated. Thanks to multi-dimensional databases, a business could obtain either a global view or drill down to a particular site for comparisons with its peers (Data Navigation). Finally, on-line analytic tools provided real-time feedback and information exchange with collaborating business units (Data Mining). This capability is useful when sales representatives or customer service persons need to retrieve customer information on-line and respond to questions on a real-time basis.

Information systems can query past data up to and including the current level of business. Often businesses need to make strategic decisions or implement new policies that better serve their customers. For example, grocery stores redesign their layout to promote more

impulse purchasing. Telephone companies establish new price structures

to entice customers into placing more calls. Both tasks require an understanding of past customer consumption behavior data in order to identify patterns for making those strategic decisions—and data mining is particularly suited to

this purpose. With the application of advanced algorithms, data

mining uncovers knowledge in a vast amount of data and points out possible relationships among the data. Data mining help businesses address questions such as, ―What is likely to happen to Bos ton unit sales next month, and why?‖ Each of the four stages were revolutionary because they allowed new business questions to be answered accurately

and quickly [4].

The core components of data mining technology have been developing

for decades in research areas such as statistics, artificial intelligence, and machine learning. Today, these technologies are mature, and when coupled with relational database systems and a culture of data integration, they create a business environment that can capitalize on knowledge formerly buried within the systems.

2.3. Applications of data mining

Data mining tools take data and construct a representation of

reality in the form of a model. The resulting model describes patterns and relationships present in the data. From a process orientation, data mining activities fall into three general categories(see Fig. 1):

Discovery—the process of looking in a database to find hidden patterns without a predetermined idea or hypothesis about what the patterns may be.

Predictive Modeling—the process of taking patterns discovered from the database and using them to predict the future.

Forensic Analysis—the process of applying the extracted patterns to find anomalous or unusual data elements.

Data mining is used to construct six types of models aimed at solving business problems: classification, regression, time series, clustering, association analysis, and sequence discovery [3]. The first two, classification and regression, are used to make predictions, while association and sequence discovery are used to describe behavior. Clustering can be used for either forecasting or description.

Companies in various industries can gain a competitive edge by

mining their expanding databases for valuable, detailed transaction information. Examples of such uses are provided below.

Each of the four applications below makes use of the first two activities of data mining: discovery and predictive modeling. The discovery process, while not mentioned explicitly in the examples (except in the retail description), is used to identify customer segments. This is done through conditional logic, analysis of affinities and associations, and trends and variations. Each of the application categories described below describes some sort of predictive modeling. Each business is interested in predicting the behavior of its customers through the knowledge gained in

data mining [5].

2.3.1. Retail

Through the use of store-branded credit cards and point-of-sale systems, retailers can keep detailed records of every shopping transaction. This enables them to better understand their various customer segments. Some retail applications include [5]: Performing basket analysis—Also known as affinity analysis, basket analysis reveals which items customers tend to purchase together. This knowledge can improve stocking, store layout strategies, and promotions. Sales forecasting—Examining time-based patterns helps retailers make stocking decisions. If a customer purchases an item today, when are they likely to purchase a complementary item?

Database marketing—Retailers can develop profiles of customers with certain behaviors, for example, those who purchase designer labels clothing or those who attend sales. This information can be used to focus cost–effective promotions.

Merchandise planning and allocation—When retailers add new stores, they can improve

merchandise planning and allocation by examining patterns in stores with similar demographic characteristics. Retailers can also use data mining to determine the ideal layout for a specific store. 2.3.2. Banking

Banks can utilize knowledge discovery for various applications, including [5]: Card marketing—By identifying customer segments, card issuers and acquirers can improve profitability with more effective acquisition and retention programs, targeted product development, and customized pricing.

Cardholder pricing and profitability—Card issuers can take advantage of data mining technology

to price their products so as to maximize profit and minimize loss of customers. Includes risk-based pricing.

Fraud detection—Fraud is enormously costly. By analyzing past transactions that were later determined to be fraudulent, banks can identify patterns.

Predictive life-cycle management—Data mining helps banks predict each custo mer’s lifetime

value and to service each segment appropriately (for example, offering special deals and discounts).

译文:

客户关系管理中的数据挖掘技术

Chris Rygielski , Jyun-Cheng Wang , David C. Yen

摘要

近年来，技术的进步让关系营销成为一个现实。如数据仓库，数据挖掘和一系列管理软件等技术已经取得了客户关系管理的新领域，在那里公司可以赢得竞争优势。特别是通过数据挖掘中从大型数据库隐藏的预测信息的提取，企业可以识别有价值的客户，预测客户未来的行为，并使企业积极进取，做出知识驱动的决策。通过数据挖掘移动可能超越过去的事件的分析，自动化是适应于未来的分析，通常用历史为导向的工具，提供了诸如决策支持系统。数据挖掘工具回答了在过去太费时追求的业务问题。然而，这些问题的答案使客户关系管理成为可能。各种技术在数据挖掘软件存在，不同类型的应用程序都拥有自身的优势和挑战。在神经网络和卡方自动交互检测(CHAID)中存在一个特殊的二分法。虽然不同的方法于大量的境界数据挖掘，一些数据挖掘类型用于要完成的各项目标的使用，对当今的客户关系管理理念来说是很必要的。

关键词:客户关系管理(CRM) 关系营销数据挖掘神经网络卡方自动交互检测(CHAID) 私隐权

1.简介

今天，一个新的商业文化正在发展。因此，客户关系经济学在根本途径中不断变化，与此同时企业都面临处理这些变化要实施新的解决方案和战略的需要。大规模生产和大规模营销的概念，最先是在工业革命时被创造，现在正在被新的观念所

取代，其中客户关系是中央企业的问题。今天的企业越来越通过对客户生命周期分析关注客户价值。这些工具和数据仓库技术，数据挖掘和其他客户关系管理(CRM)技术在关系营销的概念上提供了新的商业机遇。―卖出—建造—重新设计‖(以客为本的观点)正在取代由―设计—建造—销售‖(以产品为导向的观点)的旧模式。传统大规模营销的过程在一对一营销的新方法上被质疑。在传统的过程中，营销的目标是吸引更多客户，扩大客户群。不过，考虑到获取新客户的成本，它可以更好地进行与现有客户的业务。在这样做时，营销重点从客户群的宽度转移到每个客户的深度需求。该性能指标从市场份额到所谓的―钱包份额‖变化。企业不只是为了进行交易而应付客户，他们把握了运用服务体验销售产品，并努力与每一位客户建立长期合作关系的

机会。

互联网的出现，无疑有助于市场重点的转变。由于网上信息变得更方便和丰富，消费者变得更加明智和成熟。他们从所有正在提供的信息中知道，他们要求最好的。为了应付这种情况，企业必须分清他们的产品或服务的方式，避免成为单纯的商品这令人失望的结果。一个有效的方法来区分使用恰当始终的与客户进行互动的系统。收集客户的人口统计和行为的数据，使精确定位成为可能。这定位有助于在什么时候制定一个有效的推广计划，以满足激烈的竞争或当新产品出现时识别潜在客户标识。坚持与客户交互，意味着企业必须在一个网上系统中存储交易记录和反应，这样可用使有知道如何交互知识的工作人员利用。建立密切的客户关系的重要性是公认的和被客户关系管理(CRM)呼吁的。

适用于企业和消费者之间的管理关系。仔细观察发现，这是对商这可能好像CRM是只

业客户更加重要的。在企业对企业(B2B)的环境中，巨大的信息量在定期交换。例如，交易是多不胜数，合同定制更加多样化，定价计划是更为复杂。 CRM

可帮助各代表卖方和买方公司沟通和协作的过程顺利。定制目录，个性化的商业门户网站，并提供针对性的产品可以简化采购进程，提高两家公司的效率。电子邮件警报和新产品信息在买方量身定做不同的角色可以帮助公司增加推销的有效性。信任和权威是否有针对性的学术报告或行业消息被传递到有关人士的加强。这些全可被视为在客户关系管理的好处。凯捷安进行了一项研究，以了解公司认识和一个CRM战略[1]的准备。在接受调查的公司中，65,意识到CRM技术和方法，28,有对CRM项目有所研究或在实施阶段; 12,是在实际运作阶段。 45,的受访公司，对CRM 项目的实施和已开展由最高控制管理层的监测。因此，很明显，这是一个看作是一个关键的战略举措的新兴概念。

本文探讨了客户关系管理理念和其一组成部分，数据挖掘。它始于一个数据挖掘和客户关系管理的概念的概述，接着讨论演化、特点、技术中的应用,并阐述了两个概念。接下来，它集成了两个概念，并说明的关系，利益，以及实现方法，以及局限性的技术。经过两年的研究，我们提供了两个数据挖掘细看技巧:卡方自动交互检测(CHAID)和神经网络。在这些案例研究的基础上，CHAID和神经网络在各自的长处和短处的基础上进行了比较和对比。最后，我们根据讨论得出了的结论。

2.数据挖掘:概述

2.1.定义

―数据挖掘‖被定义为一个使用统计算法来发现数据模式和相关性[2]复杂的数据搜索

功能。这个词是一个黄金和煤炭开采类比;数据挖掘发现和提取埋葬在企业数据仓库里的知识(―数据掘金―)，或游客从网站上下载的信息，其中大部分可能导致在理解和使用的数据上有所改进。数据挖掘方法与其他数据分析是相辅相成的，如统计技术，在线分析处理(OLAP)，电子表格，和基础数据的访问。简单来说，数据挖掘是另一种方式在数据中找到意义。

数据挖掘发现数据中隐藏的模式和关系[3]，其实是一部分所谓的―知识发现‖的更大过程，用来描述一个必须采取确保有意义的结果的步骤。数据挖掘软件也不具备，但是，消除

业务，理解数据，或者是普遍知道统计方法的需要。数据挖掘没有找到模式和可信任的了解

情况下自动验证的知识。数据挖掘帮助业务分析师产生假设，但它不验证这假说。 2.2.数据挖掘的演化

术是一个长期的研究和产品发展过程的结果。数据挖掘根源在于第一个存储数据挖掘技

数据的计算机上，继续与数据访问的改进，直到今天的技术允许用户浏览实时数据。在从业务数据到有用的信息进化中，每一步都是建立在之前的每一步。表1从用户的角度上显示了进化的阶段。在第一阶段，数据收集，个别网站采用数据收集用来如求和或平均值的简单计算。在此阶段产生的信息回答了有关数据来源于数据采集地点的商业问题，如总收入或在一段时间内总收入的平均值。具体应用方案是用来收集数据和计算的建立。

第二步，数据访问，使用数据库在一个结构化的格式上存储数据。在这个阶段，全公司的数据收集政策和管理信息报告建立了。因为每一个业务单位遵照特定的要求或格式，企业可以在任何特定时间内查询信息系统对于分公司的销售。一旦个别数字被知道，探讨了聚合网站可以被请求的性能的问题。例如，在一个指定的期间内地区销售可以被计算出来。到多维数据库支持下，一个企业可以获取无论是一个全球性的观点或深入到与同行比较一个特定的网站(数据导航)。最后，在线分析工具提供实时反馈和与合作的业务单位的信息交流(数据挖掘)。这性能是非常有用的，在销售代表或客户服务人员需要在线找回客户信息和回应有关实时问题。

表1

数据挖掘演化的各阶段

阶段商业问题促成技术产品供应商特征

IBM,CDC 数据收集在过去的5年电脑，录音带，可追溯的，静态(20世纪60

年里，我的平均总磁盘的数据交付代) 收入是多少,

数据访问上个三月份在新关系数据库甲骨文，赛贝斯可追溯的，在记(20世纪80年英格兰的单位销(RDBMS)，有公司，英孚美，录水平上动态的代) 售额是多少, 结构的查询语言IBM，微软公司数据交付

(SQL),ODBC

IRI, 数据导航上个三月份在新在线分析处理可追溯的，在多(20世纪90年英

格兰的单位销(OLAP)，多科研开发等级别水平上动态代) 售额是多少,对维数据库，数据的数据交付

波士顿深入探栈

讨。

数据挖掘在下个月，什么高等算法，多重洛克西德马丁公预期的，主动的(21

世纪) 是波士顿可能发处理器计算机，司，IBM，SGI,信息交付

生的销售额，为巨大的数据库许多的新创公司

什么,

信息系统可以查询到过去的数据更新和包括到目前的水平业务。为了更好的为

客户服务，企业往往需要作出的战略决策或实施新政策。例如，食品杂货店重新设计自己的布局，以促进更多的冲动购买。电话公司建立新的价格结构，以吸引更多的客户配售电话。这两项任务需要一个对过去的客户消费行为数据的了解，以便识别使用这些战略决策和数据挖掘的模式——数据挖掘特别适合于这一目的。随着先进算法的应用，数据挖掘揭露大量数据的认识和指出可能有关系的数据。数据挖掘帮助企业解答问题，如―在下个月，什么是波士顿可能发生的销售额，为什么,―

四个阶段的每一阶段都是革命性的，因为他们允许新的业务问题被回答得准确并迅速[4]。在诸如统计，人工智能，机器学习等研究领域里，数据挖掘技术的核心组件已经发展了几十年。今天，这些技术已经成熟，在与关系数据库系统和数据集成的文化结合后，他们创造了可以在系统内利用以前埋葬的知识的一个商业环境。2.3.数据挖掘的应用

数据挖掘工具，取出数据并构建一个现实为代表形式的模型。由此产生的模型描述模式和目前的数据关系。从一个进程的方向看，数据挖掘活动分为三大类 (见图1): 发现——在没有一个预定想法或什么模式假设下，在一个数据库中找到隐藏模式的过程。预测模型——从数据库中发现取出模式并利用他们来预测未来的过程。法医分析——在应用所提取的模式，找到异常或不寻常的数据元素。

图1. 过程取向下的数据挖掘故障。来源:信息发现。

数据挖掘是用来建造六个模型，旨在于解决业务类型问题:分类，回归，时间序列，聚类，关联分析，发现序列 [3]。前两个，分类和回归，是用来做出预测的，而关联分析和发现序列是用来描述行为的。聚类可用于任何预测或描述。

在各个行业的公司可以通过挖掘扩大有价值的数据库和详细的交易信息来获得竞争优势。如下提供了这样的例子。

在下面四个应用中每一个都利用了数据挖掘的前两个活动:发现和预测模型。发现过程，而没有在例子(除了在零售描述)中明确提及，是用来鉴定客户群。这是通过有条件的逻辑，密切分析和关联分析，和趋势和变化得出来的。每一个应用程

序类介绍了某种预测模型的描述。每个企业都有兴趣通过数据挖掘中获得的知识来预测客户行为。[5]。 2.3.1(零售

通过对品牌商店的信用卡和销售点系统的使用，零售商可以记下每一个购物交易的详细记录。这使他们能够更好地了解他们不同的客户群。一些零售应用包括[5]: 表演篮分析——又称为亲和分析，购物篮分析揭示了哪些项目的客户倾向于在一起购买。这种知识可以提高办货，店面布局策略，促销活动。

销售预测——检测需求模式，帮助零售商做出办货决定。如果今天一个客户购买令了一个项目，那什么时候他们可能购买补充项目,

数据库营销——零售商可以开展客户明确行为的档案。例如，那些谁购买名牌服装或谁参加了销售。这些信息可用于集中成本效益的促销活动。

商品规划和分配——当零售商增加新的商店，他们可以通过检查存储的类似人口统计特征

模式改善商店规划和分配。零售商还可以使用数据挖掘，以确定一个特定商铺的理想布局。 2.3.2(银行

银行可以利用不同应用的知识发现，包括[5]:

信用卡营销——通过识别客户群，发卡和收单可以用跟多有效地获取去来提高盈利能力和挽留计划，有针对性的产品开发，个性化的定价。

持卡人定价和盈利能力——发卡机构可以利用数据挖掘技术的优势用于其产品价格，以达到利润最大化和客户流失最小化。包括以风险为基础的定价。

欺诈侦测——欺诈是非常昂贵的。通过分析后来被确定为伪造的过去的交易，银行可识别模式。

预测生命周期管理——数据挖掘有助于银行预测每个客户的终身价值，并适当地服务每个客户群(例如，提供特别优惠和折扣)。

《大数据时代下的数据挖掘》试题及答案要点

《海量数据挖掘技术及工程实践》题目一、单选题（共80题） 1)( D )的目的缩小数据的取值范围，使其更适合于数据挖掘算法的需要，并且能够得到和原始数据相同的分析结果。 A.数据清洗 B.数据集成 C.数据变换 D.数据归约 2)某超市研究销售纪录数据后发现，买啤酒的人很大概率也会购买尿布，这种属于数据挖掘的哪类问题？(A) A. 关联规则发现 B. 聚类 C. 分类 D. 自然语言处理 3)以下两种描述分别对应哪两种对分类算法的评价标准？ (A) (a)警察抓小偷，描述警察抓的人中有多少个是小偷的标准。 (b)描述有多少比例的小偷给警察抓了的标准。 A. Precision,Recall B. Recall,Precision A. Precision,ROC D. Recall,ROC 4)将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务？(C) A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据流挖掘 5)当不知道数据所带标签时，可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离？(B) A. 分类 B. 聚类 C. 关联分析 D. 隐马尔可夫链 6)建立一个模型，通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务？(C) A. 根据内容检索 B. 建模描述 C. 预测建模 D. 寻找模式和规则 7)下面哪种不属于数据预处理的方法？ (D) A.变量代换 B.离散化

C.聚集 D.估计遗漏值 8)假设12个销售价格记录组已经排序如下：5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频（等深）划分时，15在第几个箱子内？ (B) A.第一个 B.第二个 C.第三个 D.第四个 9)下面哪个不属于数据的属性类型：(D) A.标称 B.序数 C.区间 D.相异 10)只有非零值才重要的二元属性被称作：( C ) A.计数属性 B.离散属性 C.非对称的二元属性 D.对称属性 11)以下哪种方法不属于特征选择的标准方法： (D) A.嵌入 B.过滤 C.包装 D.抽样 12)下面不属于创建新属性的相关方法的是： (B) A.特征提取 B.特征修改 C.映射数据到新的空间 D.特征构造 13)下面哪个属于映射数据到新的空间的方法？ (A) A.傅立叶变换 B.特征加权 C.渐进抽样 D.维归约 14)假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为：(D) A.0.821 B.1.224 C.1.458 D.0.716 15)一所大学内的各年纪人数分别为：一年级200人，二年级160人，三年级130人，四年级110人。则年级属性的众数是： (A) A.一年级 B.二年级 C.三年级 D.四年级

市场营销_外文翻译_外文文献_英文文献_顾客满意策略与顾客满意

顾客满意策略与顾客满意营销原文来源：《Marketing Customer Satisfaction 》自20世纪八十年代末以来, 顾客满意战略已日益成为各国企业占有更多的顾客份额, 获得竞争优势的整体经营手段。一、顾客满意策略是现代企业获得顾客“货币选票”的法宝随着时代的变迁, 社会物质财富的极大充裕, 顾客中的主体———消费者的需求也先后跨越了物质缺乏的时代、追求数量的时代、追求品质的时代, 到了20世纪八十年代末进入了情感消费时代。在我国, 随着经济的高速发展,我们也已迅速跨越了物质缺乏时代、追求数量的时代乃至追求品质的时代, 到今天也逐步迈进情感消费时代。在情感消费时代, 各企业的同类产品早已达到同时、同质、同能、同价, 消费者追求的已不再是质量、功能和价格, 而是舒适、便利、安全、安心、速度、跃动、环保、清洁、愉快、有趣等,消费者日益关注的是产品能否为自己的生活带来活力、充实、舒适、美感和精神文化品位, 以及超越消费者期望值的售前、售中、售后服务和咨询。也就是说, 今天人们所追求的是具有“心的满足感和充实感”的商品, 是高附加值的商品和服务,追求价值观和意识多元化、个性化和无形的满足感的时代已经来临。与消费者价值追求变化相适应的企业间的竞争, 也由产品竞争、价格竞争、技术竞争、广告竞争、品牌竞争发展到现今的形象竞争、信誉竞争、文化竞争和服务竞争, 即顾客满意竞争。这种竞争是企业在广角度、宽领域的时空范围内展开的高层次、体现综合实力的竞争。它包括组织创新力、技术创新力、管理创新力、产业预见力、产品研发力、员工向心力、服务顾客力、顾客亲和力、同行认同力、社会贡献力、公关传播沟通力、企业文化推动力、环境适应力等等。这些综合形象力和如何合成综合持久的竞争力, 这就是CSft略所要解决的问题。CS寸代,企业不再以“自己为中心”,而是以“顾客为中心”；“顾客为尊”、“顾客满意”不再是流于形式的口号, 而是以实实在在的行动为基础的企业经营的一门新哲学。企业不再以质量达标, 自己满意为经营理念, 而是以顾客满意, 赢得顾客高忠诚度为经营理念。企业经营策略的焦点不再以争取或保持市场占有率为主, 而是以争取顾客满意为经营理念。因此, 营销策略的重心不再放在竞争对手身上而是放在顾客身上, 放在顾客现实的、潜在的需求上。当企业提供的产品和服务达到了顾客事先的期望值, 顾客就基本满意；如果远远超越顾客的期望值, 且远远高于其他同行, 顾客才真正满意；如果企业能不断地或长久地令顾客满意, 顾客就会忠诚。忠诚的顾客不仅会经常性地重复购买, 还会购买企业其它相关的产品或服务；忠诚的顾客不仅会积极向别人推荐他所买的产品, 而且对企业竞争者的促销活动具有免疫能力一个不满意的顾客会将不满意告诉16-20个人, 而每一个被告知者会再传播给12-15个人。这样, 一个不满意者会影响到二、三百人。在互联网普及的今天, 其影响则更大。据美国汽车业的调查, 一个满意者会引发8笔潜在的生意, 其中至少有一笔会成交。而另一项调查表明, 企业每增加5%的忠诚顾客, 利润就会增长25%-95%。一个企业的80%的利润来自20%的忠诚顾客；而获取一个新顾客的成本是维持一个老顾客成本的6倍。所以,美国著名学者唐?佩珀斯指出: 决定一个企业成功与否的关键不是市场份额, 而是在于顾客份额。于是, 企业纷纷通过广泛细致的市场调研、与消费者直接接触、顾客信息反馈等方式来了解顾客在各方面的现实需求和潜在需求。依靠对企业满意忠诚的销售、服务人员, 定期、定量地对顾客满意度进行综合测定, 以便准确地把握企业经营中与“顾客满意” 目标的差距及其重点领域, 从而进一步改善企业的经营活动。依靠高亲和力的企业文化、高效率的人文管理和全员共同努力, 不断地向顾客提供高附加值的产品, 高水准的亲情般的服

ZigBee技术外文翻译

ZigBee：无线技术，低功耗传感器网络加里莱格美国东部时间2004年5月6日上午12:00 技师（工程师）们在发掘无线传感器的潜在应用方面从未感到任何困难。例如，在家庭安全系统方面，无线传感器相对于有线传感器更易安装。而在有线传感器的装置通常占无线传感器安装的费用80%的工业环境方面同样正确（适用）。而且相比于有线传感器的不切实际甚至是不肯能而言，无线传感器更具应用性。虽然，无线传感器需要消耗更多能量，也就是说所需电池的数量会随之增加或改变过于频繁。再加上对无线传感器由空气传送的数据可靠性的怀疑论，所以无线传感器看起来并不是那么吸引人。一个低功率无线技术被称为ZigBee，它是无线传感器方程重写，但是。一个安全的网络技术，对最近通过的IEEE 802.15.4无线标准（图1）的顶部游戏机，ZigBee的承诺，把无线传感器的一切从工厂自动化系统到家庭安全系统，消费电子产品。与802.15.4的合作下，ZigBee提供具有电池寿命可比普通小型电池的长几年。ZigBee设备预计也便宜，有人估计销售价格最终不到3美元每节点，。由于价格低，他们应该是一个自然适应于在光线如无线交换机，无线自动调温器，烟雾探测器和家用产品。（图1）

虽然还没有正式的规范的ZigBee存在（由ZigBee联盟是一个贸易集团，批准应该在今年年底），但ZigBee的前景似乎一片光明。技术研究公司 In-Stat/MDR在它所谓的“谨慎进取”的预测中预测，802.15.4节点和芯片销售将从今天基本上为零，增加到2010年的165万台。不是所有这些单位都将与ZigBee结合，但大多数可能会。世界研究公司预测的到2010年射频模块无线传感器出货量4.65亿美量，其中77％是ZigBee的相关。从某种意义上说，ZigBee的光明前途在很大程度上是由于其较低的数据速率20 kbps到250 kbps的，用于取决于频段频率（图2），比标称1 Mbps的蓝牙和54的802.11g Mbps的Wi - Fi的技术。但ZigBee的不能发送电子邮件和大型文件，如Wi - Fi功能，或文件和音频，蓝牙一样。对于发送传感器的读数，这是典型的数万字节数，高带宽是没有必要，ZigBee的低带宽有助于它实现其目标和鲁棒性的低功耗，低成本。由于ZigBee应用的是低带宽要求，ZigBee节点大部分时间可以睡眠模式，从而节省电池电源，然后醒来，快速发送数据，回去睡眠模式。而且，由于ZigBee 可以从睡眠模式过渡到15毫秒或更少主动模式下，即使是睡眠节点也可以达到适当的低延迟。有人扳动支持ZigBee的无线光开关，例如，将不会是一个唤醒延迟知道前灯亮起。与此相反，支持蓝牙唤醒延迟通常大约三秒钟。一个ZigBee的功耗节省很大一部分来自802.15.4无线电技术，它本身是为低功耗设计的。 802.15.4采用DSSS（直接序列扩频）技术，例如，因为（跳频扩频）另类医疗及社会科学院将在保持一样使用它的频率过大的权力同步。 ZigBee节点，使用802.15.4，是几个不同的沟通方式之一，然而，某些方面比别人拥有更多的使用权力。因此，ZigBee的用户不一定能够实现传感器网络上的任何方式选择和他们仍然期望多年的电池寿命是ZigBee的标志。事实

大数据时代下的数据挖掘试题和答案及解析

A. 变量代换 B. 离散化海量数据挖掘技术及工程实践》题目、单选题(共 80 题) 1) ( D ) 的目的缩小数据的取值范围，使其更适合于数据挖掘算法的需要，并且能够得到和原始数据相同的分析结果。 A. 数据清洗 B. 数据集成 C. 数据变换 D. 数据归约 2) 某超市研究销售纪录数据后发现，买啤酒的人很大概率也会购买尿布，这种属于数据挖掘的哪类问题 (A) A. 关联规则发现 B. 聚类 C. 分类 D. 自然语言处理 3) 以下两种描述分别对应哪两种对分类算法的评价标准 (A) (a) 警察抓小偷，描述警察抓的人中有多少个是小偷的标准。 (b) 描述有多少比例的小偷给警察抓了的标准。据相分离 (B) 哪一类任务 (C) A. 根据内容检索 B. 建模描述 7) 下面哪种不属于数据预处理的方法 (D) A. Precision,Recall B. Recall,Precision A. Precision,ROC D. Recall,ROC 4) 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务 (C) 5) A. 频繁模式挖掘 C. 数据预处理 B. D. 当不知道数据所带标签时，分类和预测数据流挖掘可以使用哪种技术促使带同类标签的数据与带其他标签的数 6) A. 分类 C. 关联分析建立一个模型， B. D. 聚类隐马尔可夫链通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的 C. 预测建模 D. 寻找模式和规则

C.聚集 D. 估计遗漏值 8) 假设12 个销售价格记录组已经排序如下：5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时，15 在第几个箱子内(B) A. 第一个 B. 第二个 C. 第三个 D. 第四个 9) 下面哪个不属于数据的属性类型：(D) A. 标称 B. 序数 C.区间 D. 相异 10) 只有非零值才重要的二元属性被称作：( C ) A. 计数属性 B. 离散属性 C.非对称的二元属性 D. 对称属性 11) 以下哪种方法不属于特征选择的标准方法：(D) A. 嵌入 B. 过滤 C.包装 D. 抽样 12) 下面不属于创建新属性的相关方法的是：(B) A. 特征提取 B. 特征修改 C. 映射数据到新的空间 D. 特征构造 13) 下面哪个属于映射数据到新的空间的方法(A) A. 傅立叶变换 B. 特征加权 C. 渐进抽样 D. 维归约 14) 假设属性income 的最大最小值分别是12000元和98000 元。利用最大最小规范化的方法将属性的值映射到0 至 1 的范围内。对属性income 的73600 元将被转化为：(D) 15) 一所大学内的各年纪人数分别为：一年级200人，二年级160人，三年级130 人，四年级110 人。则年级属性的众数是：(A) A. 一年级 B. 二年级 C. 三年级 D. 四年级 16) 下列哪个不是专门用于可视化时间空间数据的技术：(B) A. 等高线图 B. 饼图

客户盈利能力分析中英文对照外文翻译文献

客户盈利能力分析中英文对照外文翻译文献客户盈利能力分析中英文对照外文翻译文献(文档含英文原文和中文翻译)

客户盈利能力分析的实施：案例研究摘要：通过使用客户盈利能力分析（CPA），企业可以决定客户群和/或个人客户的利润贡献。本文介绍了CPA的实施办法。执行过程中使用的是公司产的案例研究和销售的专业清洁产品说明。这个案例研究突出了工业环境与CPA的具体问题，并把结果提供了实施定期CPA过程中可能带来的好处的例子。关键词：客户盈利;客户关系管理（CRM）;实施;案例分析。 1.介绍：在任何给定的客户群，将有客户产生的公司，并在公司有承担，以确保这些收入成本收入差异。虽然大多数公司将了解客户的收入，很多企业并不知道与客户关系有关的所有费用。在一般情况下，产品成本将被称为为每一个客户，但销售和市场营销，服务和支持成本大多视为开销。客户盈利能力分析（CPA）是指收入和成本分配到细分客户或个人客户，这样，这些段和/或单个客户的盈利能力可以计算出来。 CPA日益关注的动力是双重的。首先，不同产品作业成本法在上世纪90年代兴起（ABC）导致了不同程度的提高认识到制造业使用公司的资源。当使用ABC，公司首先确定成本库：组织内进行的活动类别。其次，信息技术使得有可能记录和分析更多的客户的数据在类型和量中。随着数据如订单数量，销售访问次数，服务电话号码等存储在各个客户的水平，有可能去实际计算客户盈利。它被认为是良好的行业营销实践建立和培养与客户的利益关系。为了能够做到这一点，企业应该懂得目前的客户关系不同的盈利能力，以及什么客户群提供更高的潜力，未来盈利的客户关系。 2.CPA的潜在效益 CPA的直接好处在于它提供了在成本和收入超过客户分布不均的情况。在成本中的客户传播的信息将是特别有价值的，因为收入分配一般是已知的公司。这种认识在何种程度上特定客户消费公司的资源产生了公司在三个领域的新机遇：成本管理，收入管理和战略营销管理。首先，CPA揭示了有针对性的成本管理和利润改善计划的机会。公布的数据显示例子，其中20％的客户创造利润225％，其中一半以上的客户是盈利或者对客户的损失可能会高达2.5倍的销售收入。CPA，作为ABC的一个具体应用，揭示活动和资源消耗之间的联

信息技术英文缩写与解释

AVI 影音文件Audio Video Interleaved 声音图象交叉存取。AVI是一种微软媒体文件格式，类似于MPEG和QuickTime。在AVI中，声音和图象是交叉的存取在一个文件中的每个段的。 ADSL 非对称数字用户线路非对称数字用户线路。这种DSL叫做非对称DSL，将成为广大家庭和小型商业客户最熟悉的一种DSL。ADSL之所以叫做非对称是因为它的两个双工通道都用来向用户传输数据。仅有很小一部分带宽用来回送用户的信息。然而，大部Internet 特别是富于图形和多媒体Web 数据需要很大的下传带宽，同时用户信息相对比较少，上传的带宽也不要很大。使用ADSL时，下传的速率可以达到6.1 Mbps，而上传速率也可以达到640 Kbps。高的下传速率意味着您的电话可以传输动画，声音和立体图形。另外，一小部分的带宽可以用来传输语音信号，您可以同时打电话而不用再使用第二条电话线。不象电视线路提供的相同的服务，使用ADSL，您不需要和您的邻居争用带宽。有时候，现有的电话线可以使用ADSL，而有时候却要升级，除非电话公司提供了无分离器的ADSL，您就必须安装一个DSL调制解调器。 ASP (Application Services Provider) 应用服务提供商是指配置、租赁、管理应用解决方案，它是随着外包趋势、软件应用服务和相关业务的发展而逐渐形成的。ASP具有三大特点：首先，ASP向用户提供的服务应用系统本身的所有权属ASP，用户租用服务之后对应用系统拥有使用权；并且，应用系统被集中放置在ASP的IDC（Internet数据服务中心）中，具有充足的带宽、电力和空间保证以及具有专业质量的系统维护服务；ASP定期向用户收取服务费。应用服务提供商将以全新的方式推动应用服务产业的巨大发展。ATM (Asynchronous Transmission Mode) 异步传输模式这是为满足宽带综合业务数据通信，在分组交换技术的基础上迅速发展起来的通信新技术。可以实现语音、数据、图像、视频等信号的高速传输。 AI (Artificial Intelligent) 人工智能是计算机科学的一门研究领域。它试图赋予计算机以人类智慧的某些特点，用计算机来模拟人的推理、记忆、学习、创造等智能特征，主要方法是依靠有关知识进行逻辑推理，特别是利用经验性知识对不完全确定的事实进行的精确性推理。 AD 网上广告指一则按规定象素尺寸或字节数设定的标语或图像，通常是以动画表现的。 Baseband 基带在该方式中，电压脉冲直接加到电缆，并且使用电缆的整个信号频率范围。基带与宽带传输相比较，宽带传输中，来自多条信道的无线信号调制到不同的“载波”频率上，带宽被划分为不同信道，每信道上的频率范围一定。LocalTalk及以太网都是基带网络，一次仅传输一个信号，电缆上信号电平的改变表示数字值0或者1。使用电缆的整个带宽建立起两个系统间的通信对话，然后两个系统轮流传送。在此期间，共享电缆的其它系统不能传送。基带传输系统中的直流信号往往由于电阻、电容等因素而衰减。另外马达、荧光灯等电子设备产生的外部电磁干扰也会加快信号的衰减。传输率越高，信号就越容易被衰减。为此，以太网等建网标准规定了网络电缆类型、电缆屏蔽、电缆距离、传输率以及在大部分环境中提供相对无差错服务的有关细节。 BBS (Bulletin Board System) 电子公告板这是因特网提供的一种信息服务，为用户提供一个公用环境，以使寄存函件，读取通告，参与讨论和交流信息。Bluetooth 蓝牙(一种无线通信的标准) 蓝牙技术涉及一系列软硬件技术、方法和理论，包括：无线通信与网络技术，软件工程、软件可靠性理论，协议的正确性验证、形式化描述和一致性与互联测试技术，嵌入式实时操作系统（Embedded RTOS），跨平台开发和用户界面图形化技术，软/硬件接口技术（如RS232，UART，USB等)，高集成、低功耗芯片技术等。蓝牙的目标是要提供一种通用的无线接口标准，用微波取代传统网络中错综复杂的电缆，在蓝牙设备间实现方便快捷、灵活安全、低成本低功耗的数据和话音通信。因此，其载频选用在全球都可用的2.45GHz ISM（工业、科学、医学）频带。 CA (Certificate Authority）认证中心是在线交易的监督者和担保人，主要进行电子证书管理、电子贸易伙伴关系建立和确认、密钥管理、为支付系统中的各参与方提供身份认证等。CA类似于现实生活中公证人的角色，具有权威性，是一个普遍可信的第三方。

大数据外文翻译参考文献综述

大数据外文翻译参考文献综述 (文档含中英文对照即英文原文和中文翻译) 原文： Data Mining and Data Publishing Data mining is the extraction of vast interesting patterns or knowledge from huge amount of data. The initial idea of privacy-preserving data mining PPDM was to extend traditional data mining techniques to work with the data modified to mask sensitive information. The key issues were how to modify the data and how to recover the data mining result from the modified data. Privacy-preserving data mining considers the problem of running data mining algorithms on confidential data that is not supposed to be revealed even to the party

running the algorithm. In contrast, privacy-preserving data publishing (PPDP) may not necessarily be tied to a specific data mining task, and the data mining task may be unknown at the time of data publishing. PPDP studies how to transform raw data into a version that is immunized against privacy attacks but that still supports effective data mining tasks. Privacy-preserving for both data mining (PPDM) and data publishing (PPDP) has become increasingly popular because it allows sharing of privacy sensitive data for analysis purposes. One well studied approach is the k-anonymity model [1] which in turn led to other models such as confidence bounding, l-diversity, t-closeness, (α,k)-anonymity, etc. In particular, all known mechanisms try to minimize information loss and such an attempt provides a loophole for attacks. The aim of this paper is to present a survey for most of the common attacks techniques for anonymization-based PPDM & PPDP and explain their effects on Data Privacy. Although data mining is potentially useful, many data holders are reluctant to provide their data for data mining for the fear of violating individual privacy. In recent years, study has been made to ensure that the sensitive information of individuals cannot be identified easily. Anonymity Models, k-anonymization techniques have been the focus of intense research in the last few years. In order to ensure anonymization of data while at the same time minimizing the information

文献综述_数据挖掘

数据挖掘简介数据挖掘的任务数据挖掘的任务就是从实例集合中找出容易理解的规则和关系。这些规则可以用于预测未来趋势、评价顾客、评估风险或简单地描述和解释给定的数据。通常数据挖掘的任务包括以下几个部分: 数据总结目的是对数据进行浓缩，给出它的紧凑描述。传统的也是最简单的数据总结方法是计算出数据库的各个字段上的求和值、平均值、方差值等统计值，或者用直方图、饼图等图形方式表示。数据挖掘主要关心从数据泛化的角度来讨论数据总结。数据泛化是一种把数据库中的有关数据从低层次抽象到高层次上的过程。数据泛化目前主要有两种技术:多维数据分析方法和面向属性的归纳方法。多维数据分析方法是一种数据仓库技术，也称作联机分析处理(OLAP，onLineAnalysisProeess)。数据仓库是面向决策支持的、集成的、稳定的、不同时间的历史数据集合。决策的前提是数据分析。在数据分析中经常要用到诸如求和、总计、平均、最大、最小等汇集操作，这类操作的计算量特别大。因此一种很自然的想法是，把汇集操作结果预先计算并存储起来，以便于决策支持系统使用。存储汇集操作结果的地方称作多维数据库。多维数据分析技术已经在决策支持系统中获得了成功的应用，如著名的SAS数据分析软件包、Businessobject公司的决策支持系统Businessobjeet，以及IBM公司的决策分析工具都使用了多维数据分析技术。采用多维数据分析方法进行数据总结，它针对的是数据仓库，数据仓库存储的是脱机的历史数据。为了处理联机数据，研究人员提出了一种面向属性的归纳方法。它的思路是，直接对用户感兴趣的数据视图(用一般的SQL查询语言即可获得)进行泛化，而不是像多维数据分析方法那样预先就存储好了泛化数据。方法的提出者对这种数据泛化技术称之为面向属性的归纳方法。原始关系经过泛化操作后得到的是一个泛化关系，它从较高的层次上总结了在低层次上的原始关系。有了泛化关系后，就可以对它进行各种深入的操作而生成满足用户需要的知识，如在泛化关系基础上生成特性规则、判别规则、分类规则，以及关联规则等。数据挖掘的分类数据挖掘所能发现的知识有如下几种: .广义型知识，反映同类事物共同性质的知识; .特征型知识，反映事物各方面的特征知识; .差异型知识，反映不同事物之间属性差别的知识; .关联型知识，反映事物之间依赖或关联的知识; .预测型知识，根据历史的和当前的数据推测未来数据; .偏离型知识。揭示事物偏离常规的异常现象。所有这些知识都可以在不同的概念层次上被发现，随着概念树的提升，从微观到中观再到宏观，以满足不同用户、不同层次决策的需要。例如，从一家超市的数据仓库中，可以发现的一条典型关联规则可能是“买面包和黄油的顾客十有八九也买牛奶”，也可能是“买食品的顾客几乎都用信用卡”，这种规则对于商家开发和实施客户化的销售计划和策略是非常有用的。数据挖掘的方法数据挖掘并非一个完全自动化的过程。整个过程需要考虑数据的所有因素和其预定的效用，然后应用最佳的数据挖掘方法。数据挖掘的方法很重要。在数据挖掘的领域里.有一点已经被广泛地接受，即不管你选择哪种方法，总存在着某种协定。因此对实际情况，应该具体分析，根据累积的经验和优秀的范例选择最佳的方法。数据挖掘中没有免费的午餐，也没

大数据背景下数据挖掘技术的应用

《计算机科学与技术前沿》课程论文大数据背景下数据挖掘技术的应用 2016年1月7日题目学院学号姓名指导老师日期

大数据背景下数据挖掘技术的应用摘要当今社会是一个信息化社会的时代，同时又是一个大数据时代。随着互联网、物联网、云计算和人工智能等信息技术和计算机产业的不断发展和进步，使得数据的处理成为一个亟待解决的问题。因此在大数据的背景下,如何高效地从大量包含有用数据的库获得有用信息已成为企业和科研工作重点关注的点，而这一工作涉及的关键技术就是数据挖掘技术。总得说，数据处理的需要既给数据挖掘技术带来了机遇，于此同时带来了一系列的挑战。本文分别从企业、图书管理和情报学领域三个方面阐述数据挖掘技术的应用，同时对它的发展现状、存在的问题和未来的发展趋势进行了一些阐述，从而加深了对数据挖掘技术的理解，以便更好地了解数据挖掘在各个领域的应用，最后对数据挖掘技术的应用进行一个整体的总结。【关键字】：大数据；数据挖掘；数据挖掘的应用

Application of data mining technology in the context of data Abstract Today is the age of information society,but it is also an age of big data．With development and progress of information technology and the computer industry which include the Internet, the Internet of things, cloud computing and artificial intelligence, data processing has become an urgent problem．Therefore,in the context of big data,how to get useful information from a large library of useful data have become focuses of enterprises and scientific and research work．The work involved is the key technology of data mining．In General spedking, data processing needs for data mining technology, and at the same time poses a series of challenges． The paper aims to account the development present situation,existing problems,and developmenttrend in the future based on companies,library management and the field of information science development,so as to enhance understanding of the data mining technology ,to better understand data mining applications in various fields,and to draw an overall summary of the application of data mining technology．【Key words】：Large amounts of data；Data mining；Application of data mining

客户关系管理外文文献翻译(2017)

XXX学院毕业设计(论文)外文资料翻译学院：计算机与软件工程学院专业：计算机科学技术(软件工程方向) 姓名：学号：外文出处：GoyKakus.THE RESEARCH OFCUSTOMER RELATIONSHIP MANAGEMENT STRATEGY [J]. International Journal of Management Research & Review, 2017, 1(9): 624-635. 附件： 1.外文资料翻译译文；2.外文原文。注：请将该封面与附件装订成册。

附件1：外文资料翻译译文客户关系管理战略研究 Goy Kakus 摘要客户关系管理解决方案，通过为你提供客户业务数据来帮助你提供客户想要的服务或产品,提供更好的客户服务、交叉销售和更有效的销售,达成交易,保留现有客户并更好地理解你的客户是谁。本文探讨了客户关系管理模型在获得、保持与发展策略方面的优势。然而,我们对其定义和意义还存在一些困惑。本文通过考察关系营销和其他学科方面的相关文献，解释了客户关系管理的概念基础,从而对客户关系管理的知识作出了贡献。关键词:客户关系管理模型, 客户关系管理的博弈改变者与关键策略引言 CRM 是客户关系管理的简称。它的特征在于公司与客户的沟通,无论是销售还是服务相关的。客户关系管理这一术语经常用来解释企业客户关系,客户关系管理系统也以同样的方式被用来处理商业联系, 赢得客户,达成合同和赢得销售。客户关系管理通常被考虑作为一个业务策略，从而使企业能够: *了解客户 *通过更好的客户体验留住客户 *吸引新客户 *赢得新客户和达成合同 *提高盈利 *减少客户管理成本 *通过服务台等工具软件,电子邮件组织者和不同类型的企业应用程序，企业业务经常寻求个性化的在线体验。设计精良的客户关系管理包括以下特征: 1．客户关系管理是一种以顾客为中心并以客户投入为基础的服务响应，一对一的解决客户的必需品, 买家和卖家服务中心直接在线互动,帮助客户解决他

通信工程外文翻译---一点多址扩频通信系统的应用

【附录】英文文献 The Application of one point Multiple Access Spread Spectrum Communication System Liu Jiangang, Nanyang City, HenanProvince Electric Power Industry Bureau 【ABSTRACT】Spread Spectrum Digital Microwave communication as a communication, because their excellent performance have been widely used. The article in Nanyang City Power Industry Bureau one point Multiple Access Spread Spectrum Communication System as an example.briefed the spread spectrum communications, the basic concept and characteristics of the power system communication applications .KEYWORDS：one point multiple access; Spread-spectrum communication; Attenuation Nanyang City in the outskirts of Central cloth 35 to 11 kv substation farm terminals, their operation management rights belong to the Council East, Rural Power Company west (the eastern suburb of agricultural management companies -- four, the western suburbs of Rural Power Company Management 7), Scheduling of the various stations of the means of communication to the original M-150 radio and telephone posts. 2002 With the transformation of rural network, the remote station equipment into operation and communication channels to put a higher demand .As PUC Dispatch Communication Building to the east and west of farmers -- the difference between a company linked to fiber, Therefore, if 11 substations and the establishment of a transfer Link Building links Point may be the data and voice were sent to two rural power companies dispatch room, Rural Network scheduling for the implementation of automation to create the necessary conditions. Given the status and power grid substation level, nature, taking into account the carrier and optical-fiber communications to conduct multiple forwarding, increasing the instability factor, considering the cost and conditions of the urban construction, Finally decided to adopt wireless spread-spectrum technology to establish that 11

数据挖掘及其应用

数据挖掘及其应用 Revised by Jack on December 14,2020

《数据挖掘论文》数据挖掘分类方法及其应用课程名称：数据挖掘概念与技术姓名学号：指导教师：数据挖掘分类方法及其应用作者：来煜摘要：社会的发展进入了网络信息时代，各种形式的数据海量产生，在这些数据的背后隐藏这许多重要的信息，如何从这些数据中找出某种规律，发现有用信息，越来越受到关注。为了适应信息处理新需求和社会发展各方面的迫切需要而发展起来一种新的信息分析技术，这种局势称为数据挖掘。分类技术是数据挖掘中应用领域极其广泛的重要技术之一。各种分类算法有其自身的优劣，适合于不同的领域。目前随着新技术和新领域的不断出现，对分类方法提出了新的要求。。关键字：数据挖掘；分类方法；数据分析引言数据是知识的源泉。但是，拥有大量的数据与拥有许多有用的知识完全是两回事。过去几年中，从数据库中发现知识这一领域发展的很快。广阔的市场和研究利益促使这一领域的飞速发展。计算机技术和数据收集技术的进步使人们可以从更加广泛的范围和几年前不可想象的速度收集和存储信息。收集数据是为了得到信息，然而大量的数据本身并不意味信息。尽管现代的数据库技术使我们很容易存储大量的数据流，但现在还没有一种成熟的技术帮助我们分析、理解并使数据以可理解的信息表示出来。在过去，我

们常用的知识获取方法是由知识工程师把专家经验知识经过分析、筛选、比较、综合、再提取出知识和规则。然而，由于知识工程师所拥有知识的有局限性，所以对于获得知识的可信度就应该打个折扣。目前，传统的知识获取技术面对巨型数据仓库无能为力，数据挖掘技术就应运而生。数据的迅速增加与数据分析方法的滞后之间的矛盾越来越突出，人们希望在对已有的大量数据分析的基础上进行科学研究、商业决策或者企业管理，但是目前所拥有的数据分析工具很难对数据进行深层次的处理，使得人们只能望“数”兴叹。数据挖掘正是为了解决传统分析方法的不足，并针对大规模数据的分析处理而出现的。数据挖掘通过在大量数据的基础上对各种学习算法的训练，得到数据对象间的关系模式，这些模式反映了数据的内在特性，是对数据包含信息的更高层次的抽象。目前，在需要处理大数据量的科研领域中，数据挖掘受到越来越多的关注，同时，在实际问题中，大量成功运用数据挖掘的实例说明了数据挖掘对科学研究具有很大的促进作用。数据挖掘可以帮助人们对大规模数据进行高效的分析处理，以节约时间，将更多的精力投入到更高层的研究中，从而提高科研工作的效率。分类技术是数据挖掘中应用领域极其广泛的重要技术之一。至今已提出了多种分类算法，主要有决策树、关联规则、神经网络、支持向量机和贝叶斯、k－临近法、遗传算法、粗糙集以及模糊逻辑技术等。大部分技术都是使用学习算法确定分类模型，拟合输入数据中样本类别和属性集之间的联系，预测未知样本的类别。训练算法的主要目标是建立具有好的泛化能力的模型，该模型能够准确地预测未知样本的类别。 1．数据挖掘概述数据挖掘又称库中的知识发现，是目前人工智能和领域研究的热点问题，所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平

外文翻译-不确定性数据挖掘：一种新的研究方向

毕业设计（论文）外文资料翻译系部：计算机科学与技术系专业：计算机科学与技术姓名：学号：外文出处：Proceeding of Workshop on the （用外文写） of Artificial,Hualien,TaiWan,2005

不确定性数据挖掘：一种新的研究方向 Michael Chau1, Reynold Cheng2, and Ben Kao3 1：商学院，香港大学，薄扶林，香港 2：计算机系，香港理工大学九龙湖校区，香港 3：计算机科学系，香港大学，薄扶林，香港摘要由于不精确测量、过时的来源或抽样误差等原因，数据不确定性常常出现在真实世界应用中。目前，在数据库数据不确定性处理领域中，很多研究结果已经被发表。我们认为，当不确定性数据被执行数据挖掘时，数据不确定性不得不被考虑在内，才能获得高质量的数据挖掘结果。我们称之为“不确定性数据挖掘”问题。在本文中，我们为这个领域可能的研究方向提出一个框架。同时，我们以UK-means 聚类算法为例来阐明传统K-means算法怎么被改进来处理数据挖掘中的数据不确定性。 1.引言由于测量不精确、抽样误差、过时数据来源或其他等原因，数据往往带有不确定性性质。特别在需要与物理环境交互的应用中，如：移动定位服务[15]和传感器监测[3]。例如：在追踪移动目标（如车辆或人）的情境中，数据库是不可能完全追踪到所有目标在所有瞬间的准确位置。因此，每个目标的位置的变化过程是伴有不确定性的。为了提供准确地查询和挖掘结果，这些导致数据不确定性的多方面来源不得不被考虑。在最近几年里，已有在数据库中不确定性数据管理方面的大量研究，如：数据库中不确定性的表现和不确定性数据查询。然而，很少有研究成果能够解决不确定性数据挖掘的问题。我们注意到，不确定性使数据值不再具有原子性。对于使用传统数据挖掘技术，不确定性数据不得不被归纳为原子性数值。再以追踪移动目标应用为例，一个目标的位置可以通过它最后的记录位置或通过一个预期位置（如果这个目标位置概率分布被考虑到）归纳得到。不幸地是，归纳得到的记录与真实记录之间的误差可能会严重也影响挖掘结果。图1阐明了当一种聚类算法被应用追踪带有不确定性位置的移动目标时所发生的问题。