当前位置:文档之家› 外文翻译--数据挖掘在CRM中运用

外文翻译--数据挖掘在CRM中运用

外文翻译--数据挖掘在CRM中运用
外文翻译--数据挖掘在CRM中运用

附录一

调研报告

数据挖掘在CRM中运用

(1)通过数据挖掘获得新的客户。

在CRM中首先应识别潜在客户,然后将他们转化为客户。Big Bank and Credit Card(BB&CC)公司每年通过邮递的方式开展25 次促销活动,每次给一百万人提供申请信用卡的机会,BB&CC 公司会将信用高的申请者接受为服务对象,最终只有1%的申请者成为用户。

BB&CC公司所面临的挑战是如何让邮递促销活动更加有效。首先,BB&CC公司抽取了一个50,000人的样本,做了一个测试。在样本测试结果分析的基础上建立了两个模型,一个用来预测谁将填写申请表(使用决策树方法),另一个是信用评估模型(使用神经网络方法)。从剩下的950,000 个人中再次抽取700,000个样本,使用模型找出哪些人会对促销活动做出反应,并且具有良好的信用。结果如下:包括建模型时用的50,000 共抽取了750,000个样本,其中9,000 个申请者被接受,接受率从1%上升到了1.2%。

数据挖掘虽然不能准确的识别哪10,000个申请者最终会成为用户,但是可以促使营销活动更加有效。

(2)通过数据挖掘使用交叉销售提高现有客户的价值。

Guns and Rouses(G&R)公司销售的产品是:仿迫击炮与大炮的室外花盆和仿大口径手枪与长枪的室内花盆。产品表被发往12,000,000个家庭。当客户电话定购某个产品时,(G&R)公司会积极的推销其它的产品——交叉销售。但是,(G&R)公司发现只有1/3的客户允许他们提出建议,最终的交叉销售率不足1%,并招致了一片抱怨声。为此B&R公司想确定到底是哪些人在定购某个产品的同时需要其他的产品。

G&R公司建立了两个数据挖掘模型,一个是用来预测某个客户是否会被建

议触怒,另一个用来预测什么样的建议会被很好的接受。数据挖掘模型使用客户信息数据库中客户的信息和新的客户信息,告诉销售代表哪种人可以采用交叉销售的方式以及建议什么产品。交叉销售的成功率上升到了2%,而且很少有抱怨。

数据挖掘帮助B&R公司更好的了解了客户的需求。当把数据挖掘模型与典型的CRM交叉销售活动结合起来时,B&R 公司的景况完全改变了。

(3)通过数据挖掘提高现有客户的价值

Big Sam’s Clothing 是一家制衣公司,它建立了一个网站,提供了友好的用户登陆界面;进行在线销售。一旦你定购了某件商品或注册为成员后,公司将会通过电子邮件的方式向你推荐一些你可能感兴趣的新产品F当你在网站上查阅

一件产品时,网站会向你推荐一些与该产品有关的你可能感兴趣的产品。

当公司最初建立这个网站时,根本没有考虑个性化,仅仅将它作为一个产品目录的在线版。借助数据挖掘工具公司改善了网站的结构,使用聚类方法将以往按产品类型分类替换成按互补原则分类。当客户寻找某个商品时便可以使用这些分组提供建议,然后建立客户数据,识别哪些客户可能对产品目录中添加的新产品感兴趣。同时,Big Sam’s 公司用数据挖掘预测那些会引起客户兴趣的新产品,并通过电子邮件传递给客户,客户可以选择是否接收。

Big Sam’s 公司确定了个性化战略,通过提供主动性客户服务指导客户挑选商品,不仅增加了销售额而且加强了与客户之间的联系。客户已经将它看作购物时忠实的顾问。

(4)通过数据挖掘保留忠实客户。

Know Service公司是一家网络服务公司,像其它的公司一样也在不停地流失客户。流失率每月8%,这意味着现有的一百万个客户中每个月会有80,000个客户流失。Know Service公司重新寻找一个客户的成本是$200,每个月公司要在寻找新客户上投资$16,000,000,因此Know Service公司需要数据挖掘的帮助。

Know Service公司掌握了客户的大量上网信息和客户的个人信息,构建了客户信息数据库。Know Service公司做的第一件事就是从客户数据库中选择、转变数据。接下来所作的就是根据客户支出、生命周期对客户进行划分,并判定客户的持久性,识别哪些客户在将来会成为忠实的客户然后在忠实的客户中识别哪些有可能流失。第三步,确定最优服务、保持客户忠实。例如对上网支出大的客户可以提供包月的服务而不是提供更加大的主页空间。

结果客户流失率从原来的8%下降到7.5%,每个月节省了$1,000,000。

Research Report

The data mining is using in the CRM

(1)Acquire the new customers through data mining.

Should identify the latent customer first in the CRM, and then convert them as the customer. Annually the Big Bank and Credit Card (BB& CC) company opens the exhibition in the way of postal delivery to promote sales the activity 25 times, the every time gives 1,000,000 people the opportunity that provides to apply for the credit card, the BB& CC company meeting accept high applicant of reputation for the service object, end only have 1% applicant to become the customer.

How the challenge that the BB& CC company face is let the postal delivery promotes sales the activity more valid. First, the BB& CC Company sampled the sample of a 50,000 people, doing a test. Test the analytical foundation of result in the sample up built up two models, a uses to predict who will fill in the application form (usage the decision tree method), the is the reputation valuation model. (Usage the nerve network method)From leave of 950,000 personal medium samples 700,000 samples again, use the model to find out which persons will make a reaction towards promoting sales the activity, and have the good reputation. Result is as follows: Include setting up the model use of 50,000 sampled 750,000 samples totally; an applicant is accepting, accepting the rate to rise 1.2% from 1%.

The data mining although can't identify accurately which 10,000 applicants end will become the customer, can urge the marketing activity more valid.

(2) Cross the value that the sale raises the existing customer through data mining.

The product of the Guns and Rouses (G& R) Company sale is: Imitate the outdoors flower pot of the trench mortar and big gun and imitate the big calibe r revolver with indoor flower pot of the long gun. The product watch is disheveled hair to go toward 12,000,000 families. When customer's telephone orders a certain product, (G& R) the company will promote other products actively- cross the sale.

But,( G& R) the company detection only have 1/3 of customer allow they put forward the suggestion, at last cross the sale rate not enough 1%, and invited the one to complain the voice. Think to be certain for this B& R Company exactly is which persons need other products at the time of ordering a certain product.

The G& R Company built up two types model of data mining, the one is used to predict whether a certain customer will is suggest to infuriate or not, the another is used to predict what kind of suggestion would accept well. The data mining model uses the customer the information database in the customer's information and new customer's information, tell the sales representative which grow the person to can adopt way and suggestions of cross the sale what product. The success rate that crosses the sale rose 2%, and little complaint.

Data mining is to help the B& R Company better understood the customer's need. When cross the sales activity knot to the CRM that data mining model and typical model to put together, completely change of the general condition of the B& R Company.

(3) Improve the value of customer through data mining.

The Big Sam's Clothing is a dress company, which built up a website, providing the customer debarkation interface of the amity; carry on the on-line sale. Once you ordered a certain merchandise or register for the member, the company will recommend some your possible interested in new product Fs to be you toward you in the way of E-mail to check a product on the website, the website will recommend some your possible interested in product for having something to do with that products toward you.

When the company builds up this website at the beginning, it did not consider all characteristics, and to be an on-line version of catalogue only. Ask the data mining tool for help the company improved the structure of the website, use gather a method and will press the product type classification to substitute before press to repair the principle classification with each other. When the customer looks for certain merchandise can use the set of these cents to provide the suggestion then, then build up customer's data, identify which customers the possibility is interested

in knowing new product increase in the catalogue. At the same time, the Big Sam' the company of s predicts those new products that would cause the interest in the customer with the data excavation, and deliver through an E-mail to the customer, the customer can choose whether receive.

The Big Sam's company made sure the characteristic strategy, passing to provide active sex customer the service guides the customer to choose the merchandise, not only increasing to sell the sum but also strengthening with the contact between customer. The customer has already seen it to adviser of make the allegiance of shopping.

(4) Reserve the faithful customer through data mining.

The company of Know Service is a network service company, which being like other companies also is at run off the customer without intermission. The rate of running off is monthly 8%, this means that 1,000,000 existing customers win to there will be monthly 80,000 customers run off. The cost that the company of Know Service re- looks for a customer is$200, the company want to invest in looking for the new customer monthly$16,000,000, therefore the company of Know Service demand the data mining for help.

The company of Know Service controlled the customer in great quantities get to the Internet personal information of information and customer, set u p customer's information database. The first matter that the Know Service Company does is from customer's database to win election to choose, change data. Connect down make according to the customer to expend, the life cycle carries on the demarcation to t he customer, and judge the customer's last long, identify which customers will become the faithful customer then identify in faithful customer in future which run off probably. The third step, certain superior service, keeps the customer faithful. For example to get to the Internet to expend the service that big customer can provide to hire by the month but is not to provide more and greatly main page space.

At result, the rate of running off of the customer is descending to 7.5% from original 8%, saving monthly$1,000,000.

附录二

操作手册

(1)首先,进入登入界面,根据不同的部门,输入相应的用户名与密码,进入相应的权限限制。

a)进入用户信息管理模块,可以对用户信息进行浏览,可以增加或

删除用户,修改密码。

b)进入客户资料模块,可以选择查看客户基本信息、判断客户属性

资料(粗糙集数据)、发掘潜在客户资料(关联规则数据)和分析客

户流失资料(决策树数据)。

c)若选择查看“客户基本信息”

d)可以对客户信息进行浏览,可以增加、修改、删除,还可以按不

同的方式进行查询。

e)若选择查看判断客户属性资料、发掘潜在客户资料和分析客户流

失资料,可以查看各个对应的数据表,进行增加或删除。

(2)进入客户分析模块,可以选择判断客户价值(粗糙集)、发掘潜在客户(关联规则)、分析客户流失(决策树)和客户价值优化(遗传算法)。

1)若选择“判断客户价值”

a)在弹出的对话框中单击“属性约简”,在下面的列表框中会输出约

简后的核属性和相对约简簇

b)然后单击“值约简”,在下面的列表框中也会输出经过值约简后的

信息表。

c)选择一组属性,就能判断这个客户是高价值的还是低价值的。

d)“显示信息”可以将信息显示到列表框中,同时我们还可以对列表

框中的信息进行“删除信息”和“删除所有信息”等操作。

2)若选择“发掘潜在客户”

a)首先,选择单击“参数设置”,弹出参数设置对话框,其中“产

品总数”表示公司的产品个数,是一个大于0的数,“支持度”

是一个大于等于0小于等于1的数,表示产品被购买的频率,“置

信度”也是一个从0到1的数。设置好后点击OK。

b)单击“频繁项目集”,输出频繁项目

c)单击“输出强关联规则”,输出强关联规则到下面的列表框

d)点击“输出潜在客户”得到我们所需要的客户

e)如果想进一步了解潜在客户信息,可以按客户ID查询客户信息。

3)若选择客户流失分析

a)在弹出的对话框中选择单击“决策树导出”在下面的列表框中会

输出决策树流失模型,单击属性前面的“+”可以打开树的分支

b)这样我们选择下面下拉框中的一组属性,单击“判断是否流失”

就能判断这个客户是否存在流失的可能或是无法根据属性判断。

c)“添加用户信息”可以将选择属性信息显示到列表框中,同时我

们还可以对列表框中的信息进行“删除用户信息”和“清空用户

信息”的操作。

4)若选择客户价值优化

a)由于需要优化的函数和各参数已经经过默认输入,所以只要在弹

出的对话框中单击确定即可。

b)单击后,会弹出另一对话框,表示要输入的染色体长度和变量的

上下限。

c)输入后,单击,开始计算程序就会在下一个自动弹出的对话框中

显示结果,其中结果中的“染色体 0”表示客户关怀频率,“染

色体 1”表示商业交往频率。

《大数据时代下的数据挖掘》试题及答案要点

《海量数据挖掘技术及工程实践》题目 一、单选题(共80题) 1)( D )的目的缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到 和原始数据相同的分析结果。 A.数据清洗 B.数据集成 C.数据变换 D.数据归约 2)某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖 掘的哪类问题?(A) A. 关联规则发现 B. 聚类 C. 分类 D. 自然语言处理 3)以下两种描述分别对应哪两种对分类算法的评价标准? (A) (a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。 (b)描述有多少比例的小偷给警察抓了的标准。 A. Precision,Recall B. Recall,Precision A. Precision,ROC D. Recall,ROC 4)将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C) A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据流挖掘 5)当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数 据相分离?(B) A. 分类 B. 聚类 C. 关联分析 D. 隐马尔可夫链 6)建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的 哪一类任务?(C) A. 根据内容检索 B. 建模描述 C. 预测建模 D. 寻找模式和规则 7)下面哪种不属于数据预处理的方法? (D) A.变量代换 B.离散化

C.聚集 D.估计遗漏值 8)假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内? (B) A.第一个 B.第二个 C.第三个 D.第四个 9)下面哪个不属于数据的属性类型:(D) A.标称 B.序数 C.区间 D.相异 10)只有非零值才重要的二元属性被称作:( C ) A.计数属性 B.离散属性 C.非对称的二元属性 D.对称属性 11)以下哪种方法不属于特征选择的标准方法: (D) A.嵌入 B.过滤 C.包装 D.抽样 12)下面不属于创建新属性的相关方法的是: (B) A.特征提取 B.特征修改 C.映射数据到新的空间 D.特征构造 13)下面哪个属于映射数据到新的空间的方法? (A) A.傅立叶变换 B.特征加权 C.渐进抽样 D.维归约 14)假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方 法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:(D) A.0.821 B.1.224 C.1.458 D.0.716 15)一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年 级110人。则年级属性的众数是: (A) A.一年级 B.二年级 C.三年级 D.四年级

市场营销_外文翻译_外文文献_英文文献_顾客满意策略与顾客满意

顾客满意策略与顾客满意营销 原文来源:《Marketing Customer Satisfaction 》自20世纪八十年代末以来, 顾客满意战略已日益成为各国企业占有更多的顾客份额, 获得竞争优势的整体经营手段。 一、顾客满意策略是现代企业获得顾客“货币选票”的法宝随着时代的变迁, 社会物质财富的极大充裕, 顾客中的主体———消费者的需求也先后跨越了物质缺乏的时代、追求数量的时代、追求品质的时代, 到了20世纪八十年代末进入了情感消费时代。在我国, 随着经济的高速发展,我们也已迅速跨越了物质缺乏时代、追求数量的时代乃至追求品质的时代, 到今天也逐步迈进情感消费时代。在情感消费时代, 各企业的同类产品早已达到同时、同质、同能、同价, 消费者追求的已不再是质量、功能和价格, 而是舒适、便利、安全、安心、速度、跃动、环保、清洁、愉快、有趣等,消费者日益关注的是产品能否为自己的生活带来活力、充实、舒适、美感和精神文化品位, 以及超越消费者期望值的售前、售中、售后服务和咨询。也就是说, 今天人们所追求的是具有“心的满足感和充实感”的商品, 是高附加值的商品和服务,追求价值观和意识多元化、个性化和无形的满足感的时代已经来临。 与消费者价值追求变化相适应的企业间的竞争, 也由产品竞争、价格竞争、技术竞争、广告竞争、品牌竞争发展到现今的形象竞争、信誉竞争、文化竞争和服务竞争, 即顾客满意竞争。这种竞争是企业在广角度、宽领域的时空范围内展开的高层次、体现综合实力的竞争。它包括组织创新力、技术创新力、管理创新力、产业预见力、产品研发力、员工向心力、服务顾客力、顾客亲和力、同行认同力、社会贡献力、公关传播沟通力、企业文化推动力、环境适应力等等。这些综合形象力和如何合成综合持久的竞争力, 这就是CSft略所要解决的问题。CS寸代,企业不再以“自己为中心”,而是以“顾客为中心”;“顾客为尊”、“顾客满意”不再是流于形式的口号, 而是以实实在在的行动为基础的企业经营的一门新哲学。企业不再以质量达标, 自己满意为经营理念, 而是以顾客满意, 赢得顾客高忠诚度为经营理念。企业经营策略的焦点不再以争取或保持市场占有率为主, 而是以争取顾客满意为经营理念。因此, 营销策略的重心不再放在竞争对手身上而是放在顾客身上, 放在顾客现实的、潜在的需求上。当企业提供的产品和服务达到了顾客事先的期望值, 顾客就基本满意;如果远远超越顾客的期望值, 且远远高于其他同行, 顾客才真正满意;如果企业能不断地或长久地令顾客满意, 顾客就会忠诚。忠诚的顾客不仅会经常性地重复购买, 还会购买企业其它相关的产品或服务;忠诚的顾客不仅会积极向别人推荐他所买的产品, 而且对企业竞争者的促销活动具有免疫能力一个不满意的顾客会将不满意告诉16-20个人, 而每一个被告知者会再传播给12-15个人。这样, 一个不满意者会影响到二、三百人。在互联网普及的今天, 其影响则更大。据美国汽车业的调查, 一个满意者会引发8笔潜在的生意, 其中至少有一笔会成交。而另一项调查表明, 企业每增加5%的忠诚顾客, 利润就会增长25%-95%。一个企业的80%的利润来自20%的忠诚顾客;而获取一个新顾客的成本是维持一个老顾客成本的6倍。所以,美国著名学者唐?佩 珀斯指出: 决定一个企业成功与否的关键不是市场份额, 而是在于顾客份额。 于是, 企业纷纷通过广泛细致的市场调研、与消费者直接接触、顾客信息反馈等方式来了解顾客在各方面的现实需求和潜在需求。依靠对企业满意忠诚的销售、服务人员, 定期、定量地对顾客满意度进行综合测定, 以便准确地把握企业经营中与“顾客满意” 目标的差距及其重点领域, 从而进一步改善企业的经营活动。依靠高亲和力的企业文化、高效率的人文管理和全员共同努力, 不断地向顾客提供高附加值的产品, 高水准的亲情般的服

ZigBee技术外文翻译

ZigBee:无线技术,低功耗传感器网络 加里莱格 美国东部时间2004年5月6日上午12:00 技师(工程师)们在发掘无线传感器的潜在应用方面从未感到任何困难。例如,在家庭安全系统方面,无线传感器相对于有线传感器更易安装。而在有线传感器的装置通常占无线传感器安装的费用80%的工业环境方面同样正确(适用)。而且相比于有线传感器的不切实际甚至是不肯能而言,无线传感器更具应用性。虽然,无线传感器需要消耗更多能量,也就是说所需电池的数量会随之增加或改变过于频繁。再加上对无线传感器由空气传送的数据可靠性的怀疑论,所以无线传感器看起来并不是那么吸引人。 一个低功率无线技术被称为ZigBee,它是无线传感器方程重写,但是。一个安全的网络技术,对最近通过的IEEE 802.15.4无线标准(图1)的顶部游戏机,ZigBee的承诺,把无线传感器的一切从工厂自动化系统到家庭安全系统,消费电子产品。与802.15.4的合作下,ZigBee提供具有电池寿命可比普通小型电池的长几年。ZigBee设备预计也便宜,有人估计销售价格最终不到3美元每节点,。由于价格低,他们应该是一个自然适应于在光线如无线交换机,无线自动调温器,烟雾探测器和家用产品。 (图1)

虽然还没有正式的规范的ZigBee存在(由ZigBee联盟是一个贸易集团,批准应该在今年年底),但ZigBee的前景似乎一片光明。技术研究公司 In-Stat/MDR在它所谓的“谨慎进取”的预测中预测,802.15.4节点和芯片销售将从今天基本上为零,增加到2010年的165万台。不是所有这些单位都将与ZigBee结合,但大多数可能会。世界研究公司预测的到2010年射频模块无线传感器出货量4.65亿美量,其中77%是ZigBee的相关。 从某种意义上说,ZigBee的光明前途在很大程度上是由于其较低的数据速率20 kbps到250 kbps的,用于取决于频段频率(图2),比标称1 Mbps的蓝牙和54的802.11g Mbps的Wi - Fi的技术。但ZigBee的不能发送电子邮件和大型文件,如Wi - Fi功能,或文件和音频,蓝牙一样。对于发送传感器的读数,这是典型的数万字节数,高带宽是没有必要,ZigBee的低带宽有助于它实现其目标和鲁棒性的低功耗,低成本。 由于ZigBee应用的是低带宽要求,ZigBee节点大部分时间可以睡眠模式,从而节省电池电源,然后醒来,快速发送数据,回去睡眠模式。而且,由于ZigBee 可以从睡眠模式过渡到15毫秒或更少主动模式下,即使是睡眠节点也可以达到适当的低延迟。有人扳动支持ZigBee的无线光开关,例如,将不会是一个唤醒延迟知道前灯亮起。与此相反,支持蓝牙唤醒延迟通常大约三秒钟。 一个ZigBee的功耗节省很大一部分来自802.15.4无线电技术,它本身是为低功耗设计的。 802.15.4采用DSSS(直接序列扩频)技术,例如,因为(跳频扩频)另类医疗及社会科学院将在保持一样使用它的频率过大的权力同步。 ZigBee节点,使用802.15.4,是几个不同的沟通方式之一,然而,某些方面比别人拥有更多的使用权力。因此,ZigBee的用户不一定能够实现传感器网络上的任何方式选择和他们仍然期望多年的电池寿命是ZigBee的标志。事实

大数据时代下的数据挖掘试题和答案及解析

A. 变量代换 B. 离散化 海量数据挖掘技术及工程实践》题目 、单选题(共 80 题) 1) ( D ) 的目的缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得 到 和原始数据相同的分析结果。 A. 数据清洗 B. 数据集成 C. 数据变换 D. 数据归约 2) 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数 据挖 掘的哪类问题 (A) A. 关联规则发现 B. 聚类 C. 分类 D. 自然语言处理 3) 以下两种描述分别对应哪两种对分类算法的评价标准 (A) (a) 警察抓小偷,描述警察抓的人中有多少个是小偷的标准。 (b) 描述有多少比例的小偷给警察抓了的标准。 据相分离 (B) 哪一类任务 (C) A. 根据内容检索 B. 建模描述 7) 下面哪种不属于数据预处理的方法 (D) A. Precision,Recall B. Recall,Precision A. Precision,ROC D. Recall,ROC 4) 将原始数据进行集成、 变换、维度规约、数值规约是在以下哪个步骤的任务 (C) 5) A. 频繁模式挖掘 C. 数据预处理 B. D. 当不知道数据所带标签时, 分类和预测 数据流挖掘 可以使用哪种技术促使带同类标签的数据与带其他标签的数 6) A. 分类 C. 关联分析 建立一个模型, B. D. 聚类 隐马尔可夫链 通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的 C. 预测建模 D. 寻找模式和规则

C.聚集 D. 估计遗漏值 8) 假设12 个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15 在第几个箱子内(B) A. 第一个 B. 第二个 C. 第三个 D. 第四个 9) 下面哪个不属于数据的属性类型:(D) A. 标称 B. 序数 C.区间 D. 相异 10) 只有非零值才重要的二元属性被称作:( C ) A. 计数属性 B. 离散属性 C.非对称的二元属性 D. 对称属性 11) 以下哪种方法不属于特征选择的标准方法:(D) A. 嵌入 B. 过滤 C.包装 D. 抽样 12) 下面不属于创建新属性的相关方法的是:(B) A. 特征提取 B. 特征修改 C. 映射数据到新的空间 D. 特征构造 13) 下面哪个属于映射数据到新的空间的方法(A) A. 傅立叶变换 B. 特征加权 C. 渐进抽样 D. 维归约 14) 假设属性income 的最大最小值分别是12000元和98000 元。利用最大最小规范化的方 法将属性的值映射到0 至 1 的范围内。对属性income 的73600 元将被转化为:(D) 15) 一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130 人,四年 级110 人。则年级属性的众数是:(A) A. 一年级 B. 二年级 C. 三年级 D. 四年级 16) 下列哪个不是专门用于可视化时间空间数据的技术:(B) A. 等高线图 B. 饼图

客户盈利能力分析中英文对照外文翻译文献

客户盈利能力分析中英文对照外文翻译文献 客户盈利能力分析中英文对照外文翻译文献(文档含英文原文和中文翻译)

客户盈利能力分析的实施:案例研究 摘要:通过使用客户盈利能力分析(CPA),企业可以决定客户群和/或个人客户的利润贡献。本文介绍了CPA的实施办法。执行过程中使用的是公司产的案例研究和销售的专业清洁产品说明。这个案例研究突出了工业环境与CPA的具体问题,并把结果提供了实施定期CPA过程中可能带来的好处的例子。 关键词:客户盈利;客户关系管理(CRM);实施;案例分析。 1.介绍: 在任何给定的客户群,将有客户产生的公司,并在公司有承担,以确保这些收入成本收入差异。虽然大多数公司将了解客户的收入,很多企业并不知道与客户关系有关的所有费用。在一般情况下,产品成本将被称为为每一个客户,但销售和市场营销,服务和支持成本大多视为开销。客户盈利能力分析(CPA)是指收入和成本分配到细分客户或个人客户,这样,这些段和/或单个客户的盈利能力可以计算出来。 CPA日益关注的动力是双重的。首先,不同产品作业成本法在上世纪90年代兴起(ABC)导致了不同程度的提高认识到制造业使用公司的资源。当使用ABC,公司首先确定成本库:组织内进行的活动类别。其次,信息技术使得有可能记录和分析更多的客户的数据在类型和量中。随着数据如订单数量,销售访问次数,服务电话号码等存储在各个客户的水平,有可能去实际计算客户盈利。它被认为是良好的行业营销实践建立和培养与客户的利益关系。为了能够做到这一点,企业应该懂得目前的客户关系不同的盈利能力,以及什么客户群提供更高的潜力,未来盈利的客户关系。 2.CPA的潜在效益 CPA的直接好处在于它提供了在成本和收入超过客户分布不均的情况。在成本中的客户传播的信息将是特别有价值的,因为收入分配一般是已知的公司。这种认识在何种程度上特定客户消费公司的资源产生了公司在三个领域的新机遇:成本管理,收入管理和战略营销管理。 首先,CPA揭示了有针对性的成本管理和利润改善计划的机会。公布的数据显示例子,其中20%的客户创造利润225%,其中一半以上的客户是盈利或者对客户的损失可能会高达2.5倍的销售收入。CPA,作为ABC的一个具体应用,揭示活动和资源消耗之间的联

信息技术英文缩写与解释

AVI 影音文件Audio Video Interleaved 声音图象交叉存取。AVI是一种微软媒体文件格式,类似于MPEG和QuickTime。在AVI中,声音和图象是交叉的存取在一个文件中的每个段的。 ADSL 非对称数字用户线路 非对称数字用户线路。这种DSL叫做非对称DSL,将成为广大家庭和小型商业客户最熟悉的一种DSL。ADSL之所以叫做非对称是因为它的两个双工通道都用来向用户传输数据。仅有很小一部分带宽用来回送用户的信息。然而,大部Internet 特别是富于图形和多媒体Web 数据需要很大的下传带宽,同时用户信息相对比较少,上传的带宽也不要很大。使用ADSL时,下传的速率可以达到6.1 Mbps,而上传速率也可以达到640 Kbps。高的下传速率意味着您的电话可以传输动画,声音和立体图形。另外,一小部分的带宽可以用来传输语音信号,您可以同时打电话而不用再使用第二条电话线。不象电视线路提供的相同的服务,使用ADSL,您不需要和您的邻居争用带宽。有时候,现有的电话线可以使用ADSL,而有时候却要升级,除非电话公司提供了无分离器的ADSL,您就必须安装一个DSL调制解调器。 ASP (Application Services Provider) 应用服务提供商 是指配置、租赁、管理应用解决方案,它是随着外包趋势、软件应用服务和相关业务的发展而逐渐形成的。ASP具有三大特点:首先,ASP向用户提供的服务应用系统本身的所有权属ASP,用户租用服务之后对应用系统拥有使用权;并且,应用系统被集中放置在ASP的IDC(Internet数据服务中心)中,具有充足的带宽、电力和空间保证以及具有专业质量的系统维护服务;ASP定期向用户收取服务费。应用服务提供商将以全新的方式推动应用服务产业的巨大发展。ATM (Asynchronous Transmission Mode) 异步传输模式 这是为满足宽带综合业务数据通信,在分组交换技术的基础上迅速发展起来的通信新技术。可以实现语音、数据、图像、视频等信号的高速传输。 AI (Artificial Intelligent) 人工智能 是计算机科学的一门研究领域。它试图赋予计算机以人类智慧的某些特点,用计算机来模拟人的推理、记忆、学习、创造等智能特征,主要方法是依靠有关知识进行逻辑推理,特别是利用经验性知识对不完全确定的事实进行的精确性推理。 AD 网上广告 指一则按规定象素尺寸或字节数设定的标语或图像,通常是以动画表现的。 Baseband 基带 在该方式中,电压脉冲直接加到电缆,并且使用电缆的整个信号频率范围。基带与宽带传输相比较,宽带传输中,来自多条信道的无线信号调制到不同的“载波”频率上,带宽被划分为不同信道,每信道上的频率范围一定。LocalTalk及以太网都是基带网络,一次仅传输一个信号,电缆上信号电平的改变表示数字值0或者1。使用电缆的整个带宽建立起两个系统间的通信对话,然后两个系统轮流传送。在此期间,共享电缆的其它系统不能传送。基带传输系统中的直流信号往往由于电阻、电容等因素而衰减。另外马达、荧光灯等电子设备产生的外部电磁干扰也会加快信号的衰减。传输率越高,信号就越容易被衰减。为此,以太网等建网标准规定了网络电缆类型、电缆屏蔽、电缆距离、传输率以及在大部分环境中提供相对无差错服务的有关细节。 BBS (Bulletin Board System) 电子公告板 这是因特网提供的一种信息服务,为用户提供一个公用环境,以使寄存函件,读取通告,参与讨论和交流信息。Bluetooth 蓝牙(一种无线通信的标准) 蓝牙技术涉及一系列软硬件技术、方法和理论,包括:无线通信与网络技术,软件工程、软件可靠性理论,协议的正确性验证、形式化描述和一致性与互联测试技术,嵌入式实时操作系统(Embedded RTOS),跨平台开发和用户界面图形化技术,软/硬件接口技术(如RS232,UART,USB等),高集成、低功耗芯片技术等。蓝牙的目标是要提供一种通用的无线接口标准,用微波取代传统网络中错综复杂的电缆,在蓝牙设备间实现方便快捷、灵活安全、低成本低功耗的数据和话音通信。因此,其载频选用在全球都可用的2.45GHz ISM(工业、科学、医学)频带。 CA (Certificate Authority)认证中心 是在线交易的监督者和担保人,主要进行电子证书管理、电子贸易伙伴关系建立和确认、密钥管理、为支付系统中的各参与方提供身份认证等。CA类似于现实生活中公证人的角色,具有权威性,是一个普遍可信的第三方。

大数据外文翻译参考文献综述

大数据外文翻译参考文献综述 (文档含中英文对照即英文原文和中文翻译) 原文: Data Mining and Data Publishing Data mining is the extraction of vast interesting patterns or knowledge from huge amount of data. The initial idea of privacy-preserving data mining PPDM was to extend traditional data mining techniques to work with the data modified to mask sensitive information. The key issues were how to modify the data and how to recover the data mining result from the modified data. Privacy-preserving data mining considers the problem of running data mining algorithms on confidential data that is not supposed to be revealed even to the party

running the algorithm. In contrast, privacy-preserving data publishing (PPDP) may not necessarily be tied to a specific data mining task, and the data mining task may be unknown at the time of data publishing. PPDP studies how to transform raw data into a version that is immunized against privacy attacks but that still supports effective data mining tasks. Privacy-preserving for both data mining (PPDM) and data publishing (PPDP) has become increasingly popular because it allows sharing of privacy sensitive data for analysis purposes. One well studied approach is the k-anonymity model [1] which in turn led to other models such as confidence bounding, l-diversity, t-closeness, (α,k)-anonymity, etc. In particular, all known mechanisms try to minimize information loss and such an attempt provides a loophole for attacks. The aim of this paper is to present a survey for most of the common attacks techniques for anonymization-based PPDM & PPDP and explain their effects on Data Privacy. Although data mining is potentially useful, many data holders are reluctant to provide their data for data mining for the fear of violating individual privacy. In recent years, study has been made to ensure that the sensitive information of individuals cannot be identified easily. Anonymity Models, k-anonymization techniques have been the focus of intense research in the last few years. In order to ensure anonymization of data while at the same time minimizing the information

文献综述_数据挖掘

数据挖掘简介 数据挖掘的任务 数据挖掘的任务就是从实例集合中找出容易理解的规则和关系。这些规则可以用于预测未来趋势、评价顾客、评估风险或简单地描述和解释给定的数据。通常数据挖掘的任务包括以下几个部分: 数据总结目的是对数据进行浓缩,给出它的紧凑描述。传统的也是最简单的数据总结方法是计算出数据库的各个字段上的求和值、平均值、方差值等统计值,或者用直方图、饼图等图形方式表示。数据挖掘主要关心从数据泛化的角度来讨论数据总结。数据泛化是一种把数据库中的有关数据从低层次抽象到高层次上的过程。数据泛化目前主要有两种技术:多维数据分析方法和面向属性的归纳方法。 多维数据分析方法是一种数据仓库技术,也称作联机分析处理(OLAP,onLineAnalysisProeess)。数据仓库是面向决策支持的、集成的、稳定的、不同时间的历史数据集合。决策的前提是数据分析。在数据分析中经常要用到诸如求和、总计、平均、最大、最小等汇集操作,这类操作的计算量特别大。因此一种很自然的想法是,把汇集操作结果预先计算并存储起来,以便于决策支持系统使用。存储汇集操作结果的地方称作多维数据库。多维数据分析技术已经在决策支持系统中获得了成功的应用,如著名的SAS数据分析软件包、Businessobject公司的决策支持系统Businessobjeet,以及IBM公司的决策分析工具都使用了多维数据分析技术。 采用多维数据分析方法进行数据总结,它针对的是数据仓库,数据仓库存储的是脱机的历史数据。为了处理联机数据,研究人员提出了一种面向属性的归纳方法。它的思路是,直接对用户感兴趣的数据视图(用一般的SQL查询语言即可获得)进行泛化,而不是像多维数据分析方法那样预先就存储好了泛化数据。方法的提出者对这种数据泛化技术称之为面向属性的归纳方法。原始关系经过泛化操作后得到的是一个泛化关系,它从较高的层次上总结了在低层次上的原始关系。有了泛化关系后,就可以对它进行各种深入的操作而生成满足用户需要的知识,如在泛化关系基础上生成特性规则、判别规则、分类规则,以及关联规则等。数据挖掘的分类 数据挖掘所能发现的知识有如下几种: .广义型知识,反映同类事物共同性质的知识; .特征型知识,反映事物各方面的特征知识; .差异型知识,反映不同事物之间属性差别的知识; .关联型知识,反映事物之间依赖或关联的知识; .预测型知识,根据历史的和当前的数据推测未来数据; .偏离型知识。揭示事物偏离常规的异常现象。 所有这些知识都可以在不同的概念层次上被发现,随着概念树的提升,从微观到中观再到宏观,以满足不同用户、不同层次决策的需要。例如,从一家超市的数据仓库中,可以发现的一条典型关联规则可能是“买面包和黄油的顾客十有八九也买牛奶”,也可能是“买食品的顾客几乎都用信用卡”,这种规则对于商家开发和实施客户化的销售计划和策略是非常有用的。 数据挖掘的方法 数据挖掘并非一个完全自动化的过程。整个过程需要考虑数据的所有因素和其预定的效用,然后应用最佳的数据挖掘方法。数据挖掘的方法很重要。在数据挖掘的领域里.有一点已经被广泛地接受,即不管你选择哪种方法,总存在着某种协定。因此对实际情况,应该具体分析,根据累积的经验和优秀的范例选择最佳的方法。数据挖掘中没有免费的午餐,也没

大数据背景下数据挖掘技术的应用

《计算机科学与技术前沿》 课程论文 大数据背景下数据挖掘技术的应用 2016年1月7日 题目 学院 学号 姓名 指导老师 日期

大数据背景下数据挖掘技术的应用 摘要 当今社会是一个信息化社会的时代,同时又是一个大数据时代。随着互联网、物联网、云计算和人工智能等信息技术和计算机产业的不断发展和进步,使得数据的处理成为一个亟待解决的问题。因此在大数据的背景下,如何高效地从大量包含有用数据的库获得有用信息已成为企业和科研工作重点关注的点,而这一工作涉及的关键技术就是数据挖掘技术。总得说,数据处理的需要既给数据挖掘技术带来了机遇,于此同时带来了一系列的挑战。 本文分别从企业、图书管理和情报学领域三个方面阐述数据挖掘技术的应用,同时对它的发展现状、存在的问题和未来的发展趋势进行了一些阐述,从而加深了对数据挖掘技术的理解,以便更好地了解数据挖掘在各个领域的应用,最后对数据挖掘技术的应用进行一个整体的总结。 【关键字】:大数据;数据挖掘;数据挖掘的应用

Application of data mining technology in the context of data Abstract Today is the age of information society,but it is also an age of big data.With development and progress of information technology and the computer industry which include the Internet, the Internet of things, cloud computing and artificial intelligence, data processing has become an urgent problem.Therefore,in the context of big data,how to get useful information from a large library of useful data have become focuses of enterprises and scientific and research work.The work involved is the key technology of data mining.In General spedking, data processing needs for data mining technology, and at the same time poses a series of challenges. The paper aims to account the development present situation,existing problems,and developmenttrend in the future based on companies,library management and the field of information science development,so as to enhance understanding of the data mining technology ,to better understand data mining applications in various fields,and to draw an overall summary of the application of data mining technology. 【Key words】:Large amounts of data;Data mining;Application of data mining

客户关系管理外文文献翻译(2017)

XXX学院 毕业设计(论文)外文资料翻译 学院:计算机与软件工程学院 专业:计算机科学技术(软件工程方向) 姓名: 学号: 外文出处:GoyKakus.THE RESEARCH OFCUSTOMER RELATIONSHIP MANAGEMENT STRATEGY [J]. International Journal of Management Research & Review, 2017, 1(9): 624-635. 附件: 1.外文资料翻译译文;2.外文原文。 注:请将该封面与附件装订成册。

附件1:外文资料翻译译文 客户关系管理战略研究 Goy Kakus 摘要 客户关系管理解决方案,通过为你提供客户业务数据来帮助你提供客户想要的服务或产品,提供更好的客户服务、交叉销售和更有效的销售,达成交易,保留现有客户并更好地理解你的客户是谁。本文探讨了客户关系管理模型在获得、保持与发展策略方面的优势。然而,我们对其定义和意义还存在一些困惑。本文通过考察关系营销和其他学科方面的相关文献,解释了客户关系管理的概念基础,从而对客户关系管理的知识作出了贡献。 关键词:客户关系管理模型, 客户关系管理的博弈改变者与关键策略 引言 CRM 是客户关系管理的简称。它的特征在于公司与客户的沟通,无论是销售还是服务相关的。客户关系管理这一术语经常用来解释企业客户关系,客户关系管理系统也以同样的方式被用来处理商业联系, 赢得客户,达成合同和赢得销售。 客户关系管理通常被考虑作为一个业务策略,从而使企业能够: *了解客户 *通过更好的客户体验留住客户 *吸引新客户 *赢得新客户和达成合同 *提高盈利 *减少客户管理成本 *通过服务台等工具软件,电子邮件组织者和不同类型的企业应用程序,企业业务经常寻求个性化的在线体验。 设计精良的客户关系管理包括以下特征: 1.客户关系管理是一种以顾客为中心并以客户投入为基础的服务响应,一对一的解决客户的必需品, 买家和卖家服务中心直接在线互动,帮助客户解决他

通信工程外文翻译---一点多址扩频通信系统的应用

【附录】 英文文献 The Application of one point Multiple Access Spread Spectrum Communication System Liu Jiangang, Nanyang City, HenanProvince Electric Power Industry Bureau 【ABSTRACT】Spread Spectrum Digital Microwave communication as a communication, because their excellent performance have been widely used. The article in Nanyang City Power Industry Bureau one point Multiple Access Spread Spectrum Communication System as an example.briefed the spread spectrum communications, the basic concept and characteristics of the power system communication applications .KEYWORDS:one point multiple access; Spread-spectrum communication; Attenuation Nanyang City in the outskirts of Central cloth 35 to 11 kv substation farm terminals, their operation management rights belong to the Council East, Rural Power Company west (the eastern suburb of agricultural management companies -- four, the western suburbs of Rural Power Company Management 7), Scheduling of the various stations of the means of communication to the original M-150 radio and telephone posts. 2002 With the transformation of rural network, the remote station equipment into operation and communication channels to put a higher demand .As PUC Dispatch Communication Building to the east and west of farmers -- the difference between a company linked to fiber, Therefore, if 11 substations and the establishment of a transfer Link Building links Point may be the data and voice were sent to two rural power companies dispatch room, Rural Network scheduling for the implementation of automation to create the necessary conditions. Given the status and power grid substation level, nature, taking into account the carrier and optical-fiber communications to conduct multiple forwarding, increasing the instability factor, considering the cost and conditions of the urban construction, Finally decided to adopt wireless spread-spectrum technology to establish that 11

数据挖掘及其应用

数据挖掘及其应用 Revised by Jack on December 14,2020

《数据挖掘论文》 数据挖掘分类方法及其应用 课程名称:数据挖掘概念与技术 姓名 学号: 指导教师: 数据挖掘分类方法及其应用 作者:来煜 摘要:社会的发展进入了网络信息时代,各种形式的数据海量产生,在这些数据的背后隐藏这许多重要的信息,如何从这些数据中找出某种规律,发现有用信息,越来越受到关注。为了适应信息处理新需求和社会发展各方面的迫切需要而发展起来一种新的信息分析技术,这种局势称为数据挖掘。分类技术是数据挖掘中应用领域极其广泛的重要技术之一。各种分类算法有其自身的优劣,适合于不同的领域。目前随着新技术和新领域的不断出现,对分类方法提出了新的要求。 。 关键字:数据挖掘;分类方法;数据分析 引言 数据是知识的源泉。但是,拥有大量的数据与拥有许多有用的知识完全是两回事。过去几年中,从数据库中发现知识这一领域发展的很快。广阔的市场和研究利益促使这一领域的飞速发展。计算机技术和数据收集技术的进步使人们可以从更加广泛的范围和几年前不可想象的速度收集和存储信息。收集数据是为了得到信息,然而大量的数据本身并不意味信息。尽管现代的数据库技术使我们很容易存储大量的数据流,但现在还没有一种成熟的技术帮助我们分析、理解并使数据以可理解的信息表示出来。在过去,我

们常用的知识获取方法是由知识工程师把专家经验知识经过分析、筛选、比较、综合、再提取出知识和规则。然而,由于知识工程师所拥有知识的有局限性,所以对于获得知识的可信度就应该打个折扣。目前,传统的知识获取技术面对巨型数据仓库无能为力,数据挖掘技术就应运而生。 数据的迅速增加与数据分析方法的滞后之间的矛盾越来越突出,人们希望在对已有的大量数据分析的基础上进行科学研究、商业决策或者企业管理,但是目前所拥有的数据分析工具很难对数据进行深层次的处理,使得人们只能望“数”兴叹。数据挖掘正是为了解决传统分析方法的不足,并针对大规模数据的分析处理而出现的。数据挖掘通过在大量数据的基础上对各种学习算法的训练,得到数据对象间的关系模式,这些模式反映了数据的内在特性,是对数据包含信息的更高层次的抽象。目前,在需要处理大数据量的科研领域中,数据挖掘受到越来越多的关注,同时,在实际问题中,大量成功运用数据挖掘的实例说明了数据挖掘对科学研究具有很大的促进作用。数据挖掘可以帮助人们对大规模数据进行高效的分析处理,以节约时间,将更多的精力投入到更高层的研究中,从而提高科研工作的效率。 分类技术是数据挖掘中应用领域极其广泛的重要技术之一。至今已提出了多种分类算法,主要有决策树、关联规则、神经网络、支持向量机和贝叶斯、k-临近法、遗传算法、粗糙集以及模糊逻辑技术等。大部分技术都是使用学习算法确定分类模型,拟合输入数据中样本类别和属性集之间的联系,预测未知样本的类别。训练算法的主要目标是建立具有好的泛化能力的模型,该模型能够准确地预测未知样本的类别。 1.数据挖掘概述 数据挖掘又称库中的知识发现,是目前人工智能和领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平

外文翻译-不确定性数据挖掘:一种新的研究方向

毕业设计(论文)外文资料翻译 系部:计算机科学与技术系 专业:计算机科学与技术 姓名: 学号: 外文出处:Proceeding of Workshop on the (用外文写) of Artificial,Hualien,TaiWan,2005

不确定性数据挖掘:一种新的研究方向 Michael Chau1, Reynold Cheng2, and Ben Kao3 1:商学院,香港大学,薄扶林,香港 2:计算机系,香港理工大学九龙湖校区,香港 3:计算机科学系,香港大学,薄扶林,香港 摘要 由于不精确测量、过时的来源或抽样误差等原因,数据不确定性常常出现在真实世界应用中。目前,在数据库数据不确定性处理领域中,很多研究结果已经被发表。我们认为,当不确定性数据被执行数据挖掘时,数据不确定性不得不被考虑在内,才能获得高质量的数据挖掘结果。我们称之为“不确定性数据挖掘”问题。在本文中,我们为这个领域可能的研究方向提出一个框架。同时,我们以UK-means 聚类算法为例来阐明传统K-means算法怎么被改进来处理数据挖掘中的数据不确定性。 1.引言 由于测量不精确、抽样误差、过时数据来源或其他等原因,数据往往带有不确定性性质。特别在需要与物理环境交互的应用中,如:移动定位服务[15]和传感器监测[3]。例如:在追踪移动目标(如车辆或人)的情境中,数据库是不可能完全追踪到所有目标在所有瞬间的准确位置。因此,每个目标的位置的变化过程是伴有不确定性的。为了提供准确地查询和挖掘结果,这些导致数据不确定性的多方面来源不得不被考虑。 在最近几年里,已有在数据库中不确定性数据管理方面的大量研究,如:数据库中不确定性的表现和不确定性数据查询。然而,很少有研究成果能够解决不确定性数据挖掘的问题。我们注意到,不确定性使数据值不再具有原子性。对于使用传统数据挖掘技术,不确定性数据不得不被归纳为原子性数值。再以追踪移动目标应用为例,一个目标的位置可以通过它最后的记录位置或通过一个预期位置(如果这个目标位置概率分布被考虑到)归纳得到。不幸地是,归纳得到的记录与真实记录之间的误差可能会严重也影响挖掘结果。图1阐明了当一种聚类算法被应用追踪带有不确定性位置的移动目标时所发生的问题。

相关主题
文本预览
相关文档 最新文档