当前位置:文档之家› 零售营销——数据仓库建模

零售营销——数据仓库建模

零售营销——数据仓库建模
零售营销——数据仓库建模

第2章零售营销

理解维度建模原理的最佳途径,是通过一系列切实的例子去进行实践。通过观察实际的实例,就能使设计方面的挑战与解决办法了然于心,这比仅仅通过抽象的表述进行学习要有效得多。本书中采用了大量取自诸多行业方面的实例,目的在于使读者不要为自己的业务细节所困扰而得到恰当的设计。

如果打算学习维度建模方面的知识,请不妨通读本书各章,即使不从事零售业务或者不在一个电信公司工作也要这样做。本书并不打算成为向某具体产业或者业务提供全面的解决办法的手册,各章以几乎在每种业务的维度建模中都会遇到的典型问题集的比喻形式进行内容的叙述。大学、保险公司、银行以及航空业等都几乎无一例外地需要本章所述的零售方面所使用的技能。此外,可以设想一下,如果一个人的业务总在随时间发生变化,那么会需要什么呢?当处理从自己公司获得的数据时,很容易受过去经历的复杂性影响而使事情变糟。通过走出去,然后带一两个经过充分考虑的设计原理回来,就能做到在进入纷繁的业务细节处理时,仍然能够记住设计原理的宗旨。 本章概念:

?设计维度模型的四步过程

?事务级事实表

?可加性与非可加性事实

?样本维度表属性

?诸如促销这样的因果维度

?诸如交易票据编号这样的合并维度

?维度模型的扩展

?“使用过多维度”陷阱的避免

?代理关键字

?市场容量分析

第2章零售营销◣ 2.1 四步维度设计过程

整本书考虑一致地按照具有一定顺序的四个步骤的方式进行维度数据库的设计。这四个步骤的含义会随着各种不同设计的进行逐渐变得更加清晰起来,不过首先还是给出一些初始说明。

(1)选取要建模的业务处理过程。

业务处理过程是机构中进行的一般都由源数据收集系统提供支持的自然业务活动。听取用户的意见是选取业务处理过程的效率最高的方式。用户叫嚷着要在数据仓库中进行分析的性能度量值是从业务评测处理过程得来的。典型的业务处理过程包括原材料购买、订货、运输、开票、库存与账目管理等。要记住的重要一点是,这里谈到的业务处理过程并不是指业务部门或者职能。比如,可以建立一个用来处理订单数据的单一维度模型,而不应为要存取订单数据的销售与市场部门建立单独的模型。通过将注意力集中放在业务处理过程方面,而不是业务部门方面,就能在机构范围内更加经济地提交一致的数据。如果建立的维度模型是同部门捆绑在一起的,就无法避免出现具有不同标记与术语的数据拷贝的可能性。多重数据流向单独的维度模型,会使用户在应付不一致性的问题方面显得很脆弱。确保一致性的最佳办法是对数据进行一次性地发布。单一的发布过程还能减少ETL的开发量,以及后续数据管理与磁盘存储方面的负担。

(2)定义业务处理的粒度。

粒度定义意味着对各事实表行实际代表的内容给出明确的说明。粒度传递了同事实表度量值相联系的细节所达到的程度方面的信息。它给出了后面这个问题的答案:“如何描述事实表的单个行?”。

典型的粒度定义包括:

?顾客购物券上扫描设备一次拾取的分列项内容

?医生开出的单据项目内容

?个人登机通行证内容

?仓库中每种产品库存水平的日快照

?每个银行账号的月快照

数据仓库团队经常将这个看起来似乎不必要的步骤绕了过去。请不要这样做!对于设计团队的每个人来说,能够在事实表粒度上做到一致是很重要的。没有粒度的定义实际上是不可能达到下面第3步中提出的要求的。需要

27

数据仓库工具箱 28

引起注意的是,一个不合适的粒度定义会使数据仓库的实现令人摸不着头脑。粒度定义是不容轻视的至关重要的步骤。说到这里,你应该能够发现在第3步或第4步中给出的粒度说明是错误的。好了,还是先回到第2步重新给出粒度的正确定义,而后再看第3步或第4步的内容。

(3)选定用于每个事实表行的维度。

维度所引出的问题是,“业务人员将如何描述从业务处理过程得到的数据?”应该用一组在每个度量上下文中取单一值而代表了所有可能情况的丰富描述,将事实表装扮起来。如果对粒度方面的内容很清楚,那么维度的确定一般是非常容易的。通过维度的选定,可以列出那些使每个维度表丰满起来的离散的文本属性。常见维度的例子包括日期、产品、顾客、事务类型和状况等。

(4)确定用于形成每个事实表行的数字型事实。

事实的确定可以通过回答“要对什么内容进行评测”这个问题来进行。业务用户在这些业务处理性能度量值的分析方面具有浓厚的兴趣。设计中所有供选取的信息必须满足在第2步中定义的粒度要求。明显属于不同粒度的事实必须放在单独的事实表中。典型的事实是诸如订货量或者支出额这样的可加性数字数据。 整本书在开发各个实例研究时,都将按这样的四个步骤来展开,并以用户对业务的理解作为确定维度模型所需维度与事实的内容的依据。很显然,在按照如图2.1所示的四个步骤确定相关内容时,需要同时考虑业务用户需求和源数据本身。千万要克服只看看源数据文件就对数据进行建模的偏向。虽然说,一头扎进文件设计图与复写簿中去搜集数据比采访业务人员具有少得多的风险,但这不能代替用户的介入。遗憾的是,许

多机构仍然企图使用这种受数据驱动的最省力的

方法去建模,结果是很少有成功的。 ◣ 2.2 零售实例的研究

这里先对在本实例研究中要使用的零售业务进行简要的描述,以使建立 业务需求

维度模型

1.业务处理

2.粒度

3.维度

4.事实

数据实际 图2.1 四步骤维度设计 过程的关键输入内容

第2章零售营销

的维度与事实表更容易理解。之所以从这个行业入手,是因为它与大家都是密切相关的。设想一下在一家大型杂货连锁店总部工作的情形,其业务涵盖分布在5个州范围内的100多家杂货店。每个商店都有完整的配套部门,包括杂货、冷冻食品、奶制品、肉制品、农产品、面包店、花卉门市以及卫生/美术方面的辅助人员等,并有大致6万多个品种的产品放在货架上。每个品种的产品被称做库存储藏单位(SKUs,Stock Keeping Units)。大约55 000个SKUs来自外部的生产厂家,并在包装上印有条形码。这些条形码被叫做统一产品编码(UPCs,Universal Product Codes)。UPCs具有与单个SKUs相同的粒度。一个产品的不同包装类型具有一个单独的UPC,因而也有一个单独的SKU。

剩下的5 000个SKUs从诸如肉制品、农产品、面包店或者花卉门市等部门获取。虽然这些产品具有举国一致的可识别UPCs,杂货连锁店仍旧可以给它们分配SKU编号。既然杂货店是高度自动化的,那么完全可以为这些从其他部门取来的许多项目贴上扫描标记。尽管条形码不是UPCs,但它是确定无疑的SKU编号。

数据是从杂货店中多个令人感兴趣的地方收集得到的,其中一些最有用途的数据是在顾客购买产品时从收银机那里收集的。现代杂货店直接将条形码扫描到销售点(POS,Point-Of-Sale)系统中去,POS系统放在杂货店中对顾客外卖食品进行检测的出口处。厂家发货的后门是另外一个令人感兴趣的数据收集点。

在杂货店,管理方面所关注的是如何使产品的订购、储存与销售运作能最大限度地实现利润而开展后勤工作。利润最终要靠尽可能施加到每种产品上的管理职责、产品采购成本与额外开销的降低、以及在竞争激烈的价格战环境中吸引尽可能多的顾客等方面的一系列工作来获取。最重要的管理决策应该是关于定价与促销工作方面的。产品促销包括临时降价、在报纸与报纸夹页中加入广告内容、杂货店的陈设(包括廊端展销)和优惠券发行等工作。掀起产品销售量浪潮的最直接与最有效的方式是大幅度地降低产品的价格。

将纸巾降价一半,并为此打出配套广告和召开展销会,就可以使纸巾的销售量一下子提升10个点。遗憾的是,如此大规模的降价通常是经受不住的,因为这样的纸巾销售很可能是亏本的。这些问题说明,如何使各种形式的促销活动所产生的效能清晰可见是杂货店运营情况分析的重要部分。

在对业务实例研究进行描述之后,现在就可以开始维度建模的设计工作了。

29

数据仓库工具箱

2.2.1 第一步:选取业务处理

设计工作的第一步是,通过将对业务需求的理解与对可用数据的理解组合起来而确定建模的业务处理内容。

建立的第一个维度模型应该是一个最有影响的模型——它应该对最紧迫的业务问题做出回答,并且对数据的抽取来说是容易访问的。

在这个零售实例研究中,管理方面要做的事情就是更好地理解像POS系统记录的顾客购买情况。于是,建模所提供的业务处理就相应成为一个POS 零售业务。这类数据可以用来分析出什么促销条件下的什么日子里,在什么商店正在销售什么样的产品等方面的内容。

2.2.2 第二步:定义粒度

一旦将业务处理确定下来,数据仓库团队下一个就面临关于粒度确定的严肃课题。应该在维度模型中给出何种详细程度的细节内容?这就引出了关于设计的一个重要提示。

应优先考虑为业务处理获取最有原子性的信息而开发维度模型。原子型数据是所收集的最详细的信息,这样的数据不能再做更进一步的细分。

通过在最低层面上装配数据,大多原子粒度在具有多个前端的应用场合显示出其价值所在。原子型数据是高度维结构化的。事实度量值越细微并具有原子性,就越能够确切地知道更多的事情,所有那些确切知道的事情都转换为维度。在这点上,原子型数据可以说是维度方法的一个极佳匹配。

原子型数据可为分析方面提供最大限度的灵活性,因为它可以接受任何可能形式的约束,并可以以任何可能的形式出现。维度模型的细节性数据是安如泰山的,并随时准备接受业务用户的特殊攻击。

当然,可以总是给业务处理定义较高层面的粒度,这种粒度表示最具有原子性的数据的聚集。不过,只要选取较高层面的粒度,就意味着将自己限制到更少或者细节性可能更小的维度上了。具有较少粒度性的模型容易直接遭到深入到细节内容的不可预见的用户请求的攻击。如果不让用户存取原子型数据,则他将不可避免地在分析方面撞上南墙。就如将在第16章所见到的那样,聚集概要性数据作为调整性能的一种手段起着非常重要的作用,但它

30

第2章零售营销

绝对不能作为用户存取最低层面的细节内容的替代品。遗憾的是,有些实业界的权威人士在这方面一直显得含糊不清。他们宣称维度模型只适合于总结性数据,并批评那些认为维度建模方法可以满足预测业务需求的看法。这样的误解会随着细节性的原子型数据在维度模型中的出现而慢慢地消逝。

在该实例研究中,最佳粒度的数据是POS事务的单个分列项。为了确保得到最大限度的维度性和灵活性,所有讨论都将在这个粒度上展开。将这个粒度的定义针对第一版的原文做出修改是毫无价值的。以前,我们也将注意力集中在POS数据上,但不是考虑如何在维度模型中对事务分列项目细节进行表示,而是注重提供一天中某个商场所堆积的产品与促销方面的数据。在当时,这些每日产品总量反映了辛迪加零售数据库的技术状况。指望当时的硬件与软件能够有效地处理与各个POS事务分列项相关的数据海量的想法,是很不合时宜的。

通过访问POS事务信息,能够得出一个关于商场销售非常详细的概况。虽然用户或许对与特定POS事务相联系的单个项目的分析并不是很感兴趣,但数据库团队仍然无法预知出他们抽取数据的各种可能方式。例如,他们可能想弄清星期一相对于星期日在销售上的不同情况,或者想评估一下是否值得为诸如谷物一类的物品准备那么多不同大小的商标,或者想了解有多少购物者会对优惠50%的洗发精促销活动特别有兴趣,或者想确定如果对一个竞争很激烈的饮用苏打产品在经过了大力的促销宣传以后进行降价销售会造成什么样的影响等。虽然这些查询没有一个只对来自某单个特定事务的数据存在要求,但它们都是些需要精确切割的细节性数据的涉及面很广的问题。如果用户只能存取总结性数据,则不能回答其中的任何一个问题。

数据仓库几乎总是要求在每个维度可能得到的最低粒度上对数据进行表示的原因,并不是因为查询想看到每个低层面的行,而是因为查询希望以很精确的方式对细节知识进行抽取。

2.2.3 第三步:选定维度

一旦事实表的粒度被选定,则时期、产品与商店方面的维度就应该随之被确定下来。可以假定,日历日期是由POS系统提供的日期值。后面可以看到,随日期给出针对每一天的时间其情形又是怎么样的。在基本维度框架范围内,可能需要知道其他诸如针对某种产品的促销这样的维度是否可以分配

31

数据仓库工具箱 32

数据。这个内容可表示为另外的一个设计原则。

一个经过仔细考虑的粒度定义确定了事实表的基本维度特性。同时,经常也可能向事实表的基本粒度加入更多的维度,而这些附加的维度会在基本维度的每个组合值方面自然地取得惟一的值。如果附加的维度因为导致生成另外的事实行而违背了这个基本的粒度定义,那么必须对粒度定义进行修改以适应这个维度的情形。

在实例研究中,已经选定的描述性维度有:日期、产品、商店与促销等。此外,还会将POS 事务票据编号作为一个特殊的维度包括进来。这方面更多的内容将在本章的后面进行介绍。

现在可以开始考察如图2.2所示的初步方案了。在着手利用描述属性填充维度表之前,还是先完成设计过程的最后一步吧!特别希望你确实能够对完整的四步过程感到舒心——而不想使你在“游戏”的这个阶段只见树木而不见森林。

图2.2 零售营销初步方案

2.2.4 第四步:确定事实

设计过程的第四步同时也是最后一步,在于仔细确定哪些事实要在事实表中出现。粒度定义在这里再次成为考虑问题的支点。只是需要指出,事实对于粒度必须是真实的:这里的粒度就是POS 事务的各个分列项。当考虑潜在的事实时,你可能会再次发现,对早先的粒度设想或者维度选取做出调整是非常必要的。POS 系统收集的事实包括销售量(比如,鸡精面汤的罐数)、日期维度

日期关键字(PK )

待定日期属性 商场维度

商场关键字(PK )

待定商场属性 POS 零售营销事务事实 日期关键字(FK ) 产品关键字(FK )

商场关键字(FK )

促销关键字(FK )

POS 事务编号

待定事实

产品维度 产品关键字(PK ) 待定产品属性

促销维度 促销关键字(PK ) 待定促销属性

第2章 零售营销

33

单价与销售额等,其中销售额等于销售量与单价的乘积。更为复杂的POS 系统也提供产品标准出厂价。假定这个价格事实容易得到,而不需要以采取一些英雄行为作为代价进行获取,就应该将它放在事实表中。到现在为止,所设计的事实表就开始显得与图2.3显示的情形相似了。

销售量、销售额与成本价这三个事实在所有维度中都具有良好的可加性。完全可以自如地对事实表进行切割,并且这三个事实的每种合计值也总是有效的、正确的。

图2.3 零售营销方案的度量事实

可以通过从销售额或者营业额中减去成本花销而计算出毛利润。尽管毛利润是经过计算得到的值,但它在各个维度中同样具有极好的可加性——完全可以针对任何时期内在任意数量的商场中销售的任意产品组合,计算出其毛利润。维度建模人员不时在问,通过计算得到的事实是否应该物理地存放在数据库中?我们的意思是,应该将它物理地存放起来。在本实例中,毛利润的计算是直接进行的,但将它存储起来可以消除用户出错的可能性。用户因不当地表示毛利润所付出的代价,将远远超出增加少量存储而需要的花费。同时,将毛利润存储起来也能够确保所有的用户及其报表生成应用能够一致地引用它。既然毛利润能够通过事实表行中相邻的数据计算得到,有人可能觉得,应该在一种同表没有什么区别的视图中执行这种计算。如果所有用户都通过这样的视图去存取数据,并且没有用户使用特殊的存取工具绕开这个视图而进入物理事实表的话,这样的方法是很合乎情理的。想在节省存储空间的同时,最大限度地减少用户可能出现的错误,视图当然是一种合乎逻辑的途径,但问题是DBA 一定要能够保证不会在这种视图下出现数据存取的例

日期维度 日期关键字(PK )

待定日期属性 商场维度 商场关键字(PK ) 待定商场属性 POS 零售营销事务事实 日期关键字(FK )

产品关键字(FK )

商场关键字(FK )

促销关键字(FK )

POS 事务编号

销售量

销售额

成本额

毛利润金额 产品维度

产品关键字(PK ) 待定产品属性 促销维度 促销关键字(PK ) 待定促销属性

数据仓库工具箱

外情形。同样,有的机构想在查询工具中执行这类计算。不过,这只是在所有用户都使用共同的工具存取数据的情况下才有效(经验表明,这样的情形是很少出现的)。

毛利润率可以用毛利润除以营业额而计算出来。毛利润率是非加型事实,因为它不能依照任何维度进行求和运算。只要在做除法之前不忘记加入营业额和成本花销,就可以算出任何产品组、任意数量的商店或者任何日期的毛利润率。这也可以表示为如下的设计原则:

诸如百分比和比率这类毛利润率都是非加性的。分子与分母都应该存放在事实表中。可以用数据存取工具求出事实表任何数据形式的比率,只是要记住求取的是合计值的比率,而不是比率的求和。

单价也是非加型事实。试图在任何维度范围内对单价进行求和,都会导致出现一些毫无意义的甚至显得荒谬的数值结果。要针对一系列商店或者一个时间跨度分析某种产品的平均售价,就必须在用销售总量去除销售总额之前,将相关销售额与销售量加起来。虽然数据仓库市场方面的报表生成器或者查询工具都应该自动地正确完成这个功能,但是很遗憾,其中一部分工具仍旧不能很圆满地做到这一点。

在设计的早期阶段,经常对可能需要的最大表即最大事实表的行数做出估计是很有益处的。在所给出的实例研究中,这一般不过是找源系统的头头们谈一谈,从而弄清一个时间区段内将生成多少POS事务项目的问题。零售流量在一天天地剧烈波动着,因此,需要选定一个对事务活动进行了解的合理时间周期。作为选择,还可以通过用项目平均售价去除连锁店的年毛营业额,而估算出一年要加入到事实表的行数。假设每年的毛营业额为40亿美元,并假定每张顾客票据上各分列项的平均售价为2美元,那么就可以算出每年大约有20亿个事务分列项。工程师通常都要进行的这个典型评估,差点使我们惊讶得从扶手椅上跳起来去重新考虑是否将设计进行下去。但作为设计人员,总是应该不断地进行评估以确定计算是否合乎情理。

◣ 2.3 维度表属性

在对四步过程走了一遍以后,现在可以回到维度表上面来,并致力于用丰富的属性将它们填充起来。

34

第2章零售营销2.3.1 日期维度

这里首先从日期维度入手进行介绍。日期维度是几乎每个数据中心都必须提供的一个维度,因为实际上,每个数据中心都是时间系列的。事实上,日期通常是数据库进行潜在分类排序的首选维度,这样做的目的是,使按时间间隔连续加载的数据能够顺次存放到磁盘上的空白存储区中。

需要提请阅读过《数据仓库工具箱》(The Data Warehouse Toolkit)第一版(1996年Wiley出版)的读者注意的是,该书将这个维度称做时间维度。不是揪住那个更显得模棱两可的术语不放,作者在本书中用日期维度指称按日期进行粒度定义的维度表。这有助于对时期维度和每天的时间维度进行区分,相关内容将在本章后面讨论。

与其他多数维度不一样,日期维度表可以事先建立。这样的表可存放以日期表示的5到10年的历史数据行,同样,也可以将未来几年的数据行放入其中。即使针对10年的每一天都进行存储,也只不过要3650行,这是一个相当小的维度表。对于零售环境中日常的日期维度表来说,可以采用图2.4中所推荐的部分列表项。

日期维度表的每列由行所代表的特定日期进行定义。“星期”一列含有每天像“星期一”这样的名称内容,该列可用于创建比较“星期一”与“星期日”的业务的报表。日历表中“月”所在列的日编号从每个月的1开始取值,然后根据月份的情况取到28、29、30或者31,这一列对于每月的同一天进行比较的情况很有好处。按照类似的方式,可给出一年中每月的编号(1,…,12)。纪元表示法采用一种称为恺撒日编号(即从某纪元开始连续对日期进行计数)来有效地给出日编号。当然也可以在表中给出“星期”与“月份”的绝对编号列。所有这些整数都支持跨年度跨月份的简单数据运算。在生成报表时,常常要给出像“一月”这样的月份名称。此外,为报表给定一个“年月”(YYYY-MM)列标题也是很有用途的。同样,报表中很可能需要季度编号(Q1,…,Q4)或者诸如2001-Q4这样的年季度编号列。如果财政年度与日历表在周期上不一致,则可以为财政年度给出类似的列。

在“节假日”指示列中给出“节假日”或者“非节假日”这样的内容。要记住,维度表属性是做报表标记之用的,因此,简单地在“节假日”指示列中给出“Y”或者“N”是没有多大作用。关于这个问题,考虑一下要对某产品的节假日与非节假日的销售情况进行比较的报表应用就可以弄清楚。显然,列中给出“节假日”或者“非节假日”这样富有意义的值比一个“Y”或

35

数据仓库工具箱 36

者“N ” 之类的编码,要有用得多。还要注意,不应该在报表生成器中执行将编码标记翻译成易理解的标记这种操作,而应该将翻译内容存放在数据库中,以便使各种用户不受其报表生成工具的限制而得到一致的翻译内容。

图2.4 零售营销方案的日期维度

日期维度 日期关键字(PK ) 日期完全描述 星期 纪元日编号 纪元周编号 纪元月编号 日历日期编号

日历周编号

日历月编号

财政月日编号

周末指示符

月末指示符

日历周结束日期

年度日历周数

日历月名

年度日历月数

日历年月(YYYY-MM )

日历季度

日历年季度

日历半年度

日历年

财政周

年度财政周数

财政月

年度财政月数

财政年月

财政季度

财政年季度

财政半年度

财政年

节假日指示符

星期指示符

销售旺季

重大事件

SQL 日期标记

……及其他 POS 零售事务事实

日期关键字(FK )

产品关键字(FK )

商场关键字(FK )

促销关键字(FK )

POS 事务编号

销售量

销售额

成本额 毛利润金额 产品维度 商场维度 促销维度

第2章零售营销

对于取值为“平日”与“周末”的“星期”指示列,理应做类似处理。不用说,“星期六”与“星期日”要归入“周末”之列。当然,可以对多个日期表属性进行共同约束,从而容易地实现诸如针对平日假期与周末假期进行比较这样的应用。

“销售时令”列应设置为零售时节的名称,比如以美国的情形为例,这些名称可以是圣诞节、感恩节、复活节、情人节、独立日,或者标为“不是”。“重大事件”列与“销售时令”列情形类似,可以标记为诸如“超级饭碗周日”或者“劳动者罢工”这样的特殊外部事件。一般性的促销活动通常不放在日期表中处理,而以促销维度表的形式进行更加完整的描述。这样做的主要原因在于,促销事件并不是仅仅由日期来定义,而通常是由日期、产品与商店的组合形式进行定义的。

有些设计人员可能在此处停下来询问为什么需要一个明确的日期维度表的原因。他们说,如果事实表的日期关键字是日期类型的字段,则任何SQL 查询可以直接针对事实表日期关键字进行约束,并使用一般的SQL日期语法对月份或者年度进行过滤而避免进行想像起来开销显得很大的连接操作。有多个原因可以用来说明这个推断是站不住脚的。首先,如果关系数据库不能处理与日期维度表的高效率连接,则确实会遇到很大的麻烦。问题是,绝大多数数据库优化机制在处理维度查询方面具有非常高的效率,从而没有必要像对待瘟疫一样地对连接操作避之而惟恐不及。还有,在性能方面,绝大多数数据库不对SQL日期运算进行索引,因而由SQL运算字段进行约束的查询不会用到索引。

从可用性角度讲,典型的业务用户并不精通SQL日期语法,因此他或者她不能去直接利用与日期数据类型相关的内在功效。SQL日期函数不支持通过诸如周末、节假日、财务盘点、时令或者重大事件与平日这样的属性而施加的过滤操作。假如说业务上存在比照这些非标准日期属性进行数据切割的需要,那么一个明确的日期维度表就显得很必要了。说到底,日历逻辑要归入维度表而不是应用代码中去。最后,建议你将日期关键字指定为整数类型而不是任何形式的日期数据。一个基于SQL的日期关键字在典型情况下是8字节的,因而事实表各行的每个日期关键字要浪费4个字节。本章后面将就这方面的内容进行更多的介绍。

图2.5给出了取自部分日期维度表的几行数据。

数据仓库总需要一个明确的维度表。有许多日期属性不能由SQL函数提供支持,这包

37

数据仓库工具箱 38

括财务盘点、时令、节假日与周末等。与企图在查询中给定这些非标准日历运算的做法不同,而更应该在一个日期维度表中去检索它们。

如果用户要存取可以针对一天的情况进行分析(例如,在下班高峰的傍晚区间或者商场的第三班时间段内)的事务时间,就应该通过与事实表相连接的一个单独日历维度表来处理它。日期与时间几乎是完全不相关的。如果将这两个维度组合在一起,日期维度表就会增大许多。于是,假如在同一个表(或者支架)中按分钟对时间进行处理的话,那么一个只有3 650行就可以对10年的数据进行处理的简洁维度,一下子将扩展到5 256 000行。比较起来,显然更应该创建一个3 650行的日期维度表和一个分开的按分钟为每天记录1 440行的维度表。

第5章将讨论在单个方案中处理多个日期的情形,在第11章与第14章中还将讨论跨国际的日期与时间考虑因素。 日期关

键字

日期

日期完整描述 星期 日历月 日历年 财政年月 节假日指示符 周日指

示符 1 01/01/2002

2002年1月1日

星期二 1月 2002年 F2002-01 节日 平日 2 01/02/2002

2002年1

月2日

星期三 1月 2002年 F2002-01 非节日 平日 3 01/03/2002

2002年1

月3日

星期四 1月 2002年 F2002-01 非节日 平日 4 01/04/2002

2002年1

月4日

星期五 1月 2002年 F2002-01 非节日 平日 5 01/05/2002

2002年1

月5日

星期六 1月 2002年 F2002-01 非节日 周日 6 01/06/2002

2002年1

月6日

星期日 1月 2002年 F2002-01 非节日 周日 7 01/07/2002

2002年1

月7日

星期一 1月 2002年 F2002-01 非节日 平日 8 01/08/2002

2002年1

月8日 星期二 1月 2002年 F2002-01 非节日 平日 图2.5 日期维度表的细节

第2章零售营销2.3.2 产品维度

产品维度描述杂货店的每个SKU。虽然典型的连锁店可能存储60 000个SKUs,但在考虑跨连锁店与涵盖不再销售的历史产品的不同商品规划方案时,产品维度可能至少需要150 000行乃至多达百万行。产品维度几乎总是起源于操作型产品主文件。大多数零售商在总部对其产品主文件进行管理,并经常不间断地将文件的一部分下载到各商店的POS系统中。总部负责为每个由货物包装商创建的新UPC定义合适的产品主记录(以及具有惟一性的SKU),同时还负责定义将SKUs分配给诸如面包类食品、肉食品与农产品这些项目的规则。在产品主文件发生改变的任何时候,都要从产品主文件抽取数据并存入产品维度表中。

产品主文件的一个重要作用,就是维护每个SKU的许多描述属性。商品体系就是一组重要的属性。通常,各类SKUs堆积形成商标,商标堆积形成分类,而分类则堆积形成部门,其中的每个关系都是多对一的。这个商品体系与其他属性的详细情况如图2.6给出的部分产品所示。

产品关键字产品描述商标描述分类描述部门描述含脂量

1 低碱烤肉包烧烤面包面包房低脂

2 松脆全麦切片松脆面包面包房一般

3 松淡全麦切片松脆面包面包房低脂

4 脱脂小桂卷松软甜面包面包房无脂

5 2加仑装美食香料冷裹品冷冻点心冷冻食品部无脂

6 1品脱装黄油软奶桃鲜类冷冻点心冷冻食品部低脂

7 1/2加仑装巧克力美食冷冻冷冻点心冷冻食品部一般

8 1品脱装草莓冰淇淋冰冻冷冻点心冷冻食品部一般

9 冰淇淋三明治冰冻冷冻点心冷冻食品部一般

图2.6 产品维度表的细节

对于每个SKU而言,所有层次的商品体系都是经过良好定义的,并且像SKU描述之类的一些属性还具有惟一性。在这种情况下,SKU描述项至少有150 000个不同的取值。在另一个极端,可能出现部门属性只有50个不同取值的情况。于是平均下来,部门属性的每个惟一值会有3 000个重复项。不过没什么关系!没有必要考虑将这些重复值分成另一个规范化表而节省一点空

39

数据仓库工具箱 40

间。须知,维度表的空间需求同事实表的空间考量相比显得多么不起眼。

产品维度表的许多属性并不是商品体系的组成部分。例如,包装类型属性就极可能有瓶装、袋装、盒装或者其他类型。任何部门的任何产品都可能取这些值中的一个。将这类属性的约束和商品体系属性方面的约束进行组合,具有非常积极的意义。作为例子,可以看一下袋装谷物分类中的所有SKUs 。换个角度来考虑这个问题,可以对维度属性进行顺次浏览看它们是否属于商品体系,或者可以使用属性进行向上或者向下探查而看它们是否属于商品体系。另外,甚至可以在产品维度表中明确地包含一个以上的体系。

推荐用于零售杂货数据中心的部分产品维度看起来同图 2.7中的情形类似。

图2.7 零售营销方案的产品维度

一个合理的产品维度表可以拥有50或者更多的描述属性。每个属性都是约束和构造行标题的丰富来源。从这个意义上讲,如此费心劳神除了得到能够提供更多信息的行标题之外,别无所求。还是看看已经按部门针对销售额和销售量进行了汇总的简单报表吧:

产品维度表

产品关键字(PK )

产品描述

SKU 编号(自然关键字)

商标描述

分类描述

部门描述

包装类型描述

包装尺寸

含脂量

食物类型

重量

重量单位

储藏类型

货架期类型

货架宽度

货架高度

货架深度

……其他 POS 零售事务事实 日期关键字(FK ) 产品关键字(FK ) 商场关键字(FK ) 促销关键字(FK ) POS 事务编号 销售量 销售额 成本额 毛利润金额 日期维度

商场维度 促销维度

第2章零售营销

部门描述销售额销售量

面包店$12 331 5 088

冷冻食品部$31 776 15 565

如果进行向下探查,实际上可以从产品维度将诸如商标这样的任何其他属性拖入紧接部门的下一级报表,并且能够自动探查到次一级的细节层次。在商品体系内,一个典型的向下探查结果与如下情形非常类似:

部门描述商标描述销售额销售量

面包点炸油条$3 009 1 138

面包点脆饼$3 024 1 476

面包点软糕点$6 298 2 474

冷冻食品部雪糕$5 321 2 640

冷冻食品部鲜货$10 476 5 234

冷冻食品部冷狗$7 328 3 092

冷冻食品部冰糕$2 184 1 437

冷冻食品部速冻$6 467 3 162

或者可以按脂肪含量属性向下探查,即使它不在商品堆积体系之列也是如此。

部门描述脂肪含量销售额销售量

面包点无脂$6 29 2 474

面包点低脂$5 027 2 086

面包点一般$1 006 528

冷冻食品部无脂$5 321 2 640

冷冻食品部低脂$10 476 5 234

冷冻食品部一般$15 979 7 691

前面煞费苦心地给出探查例子的目的是为了得出作为设计原则来表述的观点。

41

数据仓库工具箱 42 在数据中心进行的向下探查操作不过是通过维度表添加一些行标题,而向上探查就是删除行标题。可以通过来自多个显式体系的属性而进行向上或者向下探查操作,也可以按非体系部分的属性进行同样的操作。

产品维度是几乎每个数据中心都拥有的两到三个基本维度之一。用尽可能多的描述属性对这个维度进行填充时,应该特别小心。一组丰富而完整的维度属性会转化为丰富而完整的用户数据分析能力。第4章将进一步研究产品维度,同时在那里还将讨论处理产品属性变化方面的内容。

2.3.3 商场维度

商场维度描述杂货连锁店的每个商场。与每个大型杂货店业务中基本上都能够得到的产品主文件不同,并不能保证存在可用的商场综合主文件。每当有新的或者变化的产品出现时,就需要将产品主文件下载到各个商场。不过,单个POS 系统并不需要一个商场主文件。IT 人员必须经常性地对来自总部多个操作源的商场维度必要分量进行装配。

在实例研究中,商场维度是基本的地理维度,每个商场可被看成一个位置。据此,可以将商场堆积成诸如美国的ZIP 编码、县与州这样的任意地理属性。商场通常也堆积成商场的一些行政区或者地区。这两种不同的维度都很容易在商场维度中表示出来,因为地理体系与商场地区体系对每个商场行来说,都是经过良好定义的。

在维度表中表示多个体系是不常见的。在理想情况下,属性名与值在跨多个体系的范围内应该是惟一的。

推荐在杂货店业务方面使用如图2.8所示的商场维度表。

建筑平面图的类型、影印处理类型以及财务服务类型等都是描述特定商场的短文本描述内容。这些内容不应该是单个字符的编码,而应该是出现在下拉列表或者报表行标题中,显得意义明确,并经过标准化处理的10到20个字符大小的描述内容。

描述销售面积的列应该是数字型的,并且在理论上是跨商场可相加的。虽然有人可能试图将它放到事实表中,不过很明显,它是商场的一个不变属性,并且作为报表约束或者行标题使用的情况比用做求和的可加分量要多得多。因为这些原因,可以确信,销售面积属于商场维度表。

POS 零售事务事实 日期关键字(FK ) 产品关键字(FK ) 商场关键字(FK ) 促销关键字(FK ) POS 事务编号 销售量 销售额 成本额

日期维度 产品维度 促销维度

商场维度

商场关键字(PK )

商场名称

商场编号(自然关键字)

商场所在街道地址

商场所在城市

商场所在县

商场所在州

商场所在邮政编码

第2章零售营销

图2.8 零售营销方案的商场维度

首度开业日期与最新重修日期一般都是连接到日期维度表拷贝的关键字。这些日期维度拷贝通过VIEW结构在SQL中进行定义,并在语义上同基本日期维度相区别。VIEW定义的形式如下:

CREATE VIEW FIRST_OPEN_DATE (FIRST_OPEN_NUMBER,

FIRST_OPEN_MONTH,…)

AS SELECT DAY_NUMBER, MONTH,…

FROM DATE

这样,系统运作起来就好像存在一个称做FIRST_OPEN_DA TE的日期维度表拷贝。针对这个新日期表的约束不会对基本日期维度表上的约束产生任何影响。第一个开放日期视图是对商场维度来说可以允许的一个支架。要注意的是,视图的所有列都重新进行了仔细的标记,以便使它们不与基本维度表的列互相混淆。第6章还会对支架做进一步的讨论。

2.3.4 促销维度

促销维度是方案中可能最令人感兴趣的维度。促销维度描述产品销售的促销情形。促销情形包括临时降价、廊端展销、报纸广告与优惠券等。因为

43

数据仓库工具箱 44 这个维度用来描述被认定会使产品销售发生变化的因素而通常被叫做因果维度(与偶然维度相对)。

总部与商场的经理都对确定一个促销活动是否有效感兴趣。促销由下列一至多个因素进行评判:

? 促销产品的销售是否在促销区间出现增长。这叫做上扬(lift )。上扬

只有当商场能够就什么是在没有促销的情况下促销产品可以达到的销售底线而取得一致意见时,才能进行评测。底线值可以从以前的销售历史,以及在某种场合下借助于复杂的数学模型而计算出来。

? 除去促销区间(过渡时间)内销售方面的增长以外,促销产品的销售

是否就在促销进行之前或者随后表现出减少的情形。换句话说,销售人员实施过从正常定价产品到临时减价产品方面的销售转移吗?

? 是否发生促销产品的销售出现增长,而临近货架上的其他产品销售却

呈现出相应的降低情况(发生同类相食)?

? 在考虑了促销之前、区间与其后的时间段因素(市场生长)的情况下,促销类别中所有产品的销售是否都经历了一个实际的总体增长?

?

促销是否赢利。在通常情况下,促销利润要按促销类别的利润增量与考虑了时间过渡、同类调剂以及销售底线的比值而计算出来。其中,底线应该考虑了包括临时降价、广告、展示和优惠券在内的促销花费等因素。 对销售产生潜在影响的因果情形,并不需要由POS 系统进行直接的跟踪。这种事务系统要保持对降价与削价的跟踪。通常优惠券的使用也由该事务进行捕获,因为顾客在购买商品时要么出示优惠券,要么不这么做。广告与商场的展示可能需要与其他源头进行连结,各种可能的因果情形都是高度相关的。临时降价会通常与广告或者廊端展销联系在一起,优惠券通常也与广告相关联。因为这个原因,在促销维度为促销出现的每种组合都创建一行显得很有意义。在一年的进程中,可能出现1 000个广告,5 000次临时降价和1 000次廊端展销,但可能只有10 000个这三种手段的组合能够影响任何特定的产品。例如,在某给定维度中,大多数商场都会同时运作所有三种机制,而只有少数几个商场不进行廊端展销。在这种情况下,就需要两个单独的促销情形行,一个用于通常的降价并外加广告与展示,而一个用于降价并外加单纯的广告。推荐使用的一个促销维度表显示在图2.9中。

POS 零售事务事实 日期关键字(FK ) 产品关键字(FK ) 商场关键字(FK ) 促销关键字(FK ) POS 事务编号 销售量 销售额 成本额 毛利润金额 日期维度

产品维度 商场维度 促销维度 促销关键字(PK )

促销名称

减价类型

促销媒体类型

广告类型

展览类型

优惠券类型

广告媒体名称

展览提供者

第2章零售营销

图2.9 零售营销方案的促销维度

从单纯的逻辑角度看,通过将四个主要的因果维度机制(价格降低、广告、展示与优惠券)分开形成单独的维度,而不是将它们组合成一个维度,就能够记录维度方面非常相似的信息。究竟使用哪种方式,最后的选择权掌握在设计人员手中。赞成将四个维度揉合在一起,基于包括如下两个方面的考虑:

?既然四个因果机制是高度相关的,那么组合起来的单个维度就不会比分开的任何一个大许多。

?组合起来的单个维度能够高效地进行浏览,以弄清各种不同的价格降低、广告、展销与优惠券是如何在一起进行应用的。当然,这样的浏

览仅仅显示了可能的组合。在维度表中所进行的浏览,并不能揭示促

销对哪家商场和哪种产品产生了影响。这类信息放在事实表中。

倾向于将四个因果机制分开而形成不同维度表的想法是基于对如下两个

因素的权衡而产生的:

?在用户分开考虑这些机制时,分开的维度对业务群体来说更容易理解。这一点在业务需求调研区间就会显露出来。

?独立维度的管理相对组合维度的管理,表现得更加直截了当。

记住,在数据仓库的信息内容方面,这两种选择之间并不存在什么不同。

在典型情况下,许多销售事务分列项目会涉及到并不在促销之列的产品。

因此,需要在促销维度中包括以其惟一关键字来标识“不在促销之列”的一

行,从而避免在事实表中出现空促销关键字的情况。如果在作为引用维度表

的外关键字而进行定义的事实表列中放置一个空值,引用完整性就会遭到破

坏。除了出现引用完整性方面的警告外,空关键字还是用户疑惑不解的根源,

45

数据仓库模型的设计

2.5数据仓库模型的设计 数据仓库模型的设计大体上可以分为以下三个层面的设计151: .概念模型设计; .逻辑模型设计; .物理模型设计; 下面就从这三个层面分别介绍数据仓库模型的设计。 2.5.1概念模型设计 进行概念模型设计所要完成的工作是: <1>界定系统边界 <2>确定主要的主题域及其内容 概念模型设计的成果是,在原有的数据库的基础上建立了一个较为稳固的概念模型。因为数据仓库是对原有数据库系统中的数据进行集成和重组而形成的数据集合,所以数据仓库的概念模型设计,首先要对原有数据库系统加以分析理解,看在原有的数据库系统中“有什么”、“怎样组织的”和“如何分布的”等,然后再来考虑应当如何建立数据仓库系统的概念模型。一方面,通过原有的数据库的设计文档以及在数据字典中的数据库关系模式,可以对企业现有的数据库中的内容有一个完整而清晰的认识;另一方面,数据仓库的概念模型是面向企业全局建立的,它为集成来自各个面向应用的数据库的数据提供了统一的概念视图。 概念模型的设计是在较高的抽象层次上的设计,因此建立概念模型时不用考虑具体技术条件的限制。 1.界定系统的边界 数据仓库是面向决策分析的数据库,我们无法在数据仓库设计的最初就得到详细而明确的需求,但是一些基本的方向性的需求还是摆在了设计人员的面前: . 要做的决策类型有哪些? . 决策者感兴趣的是什么问题? . 这些问题需要什么样的信息? . 要得到这些信息需要包含原有数据库系统的哪些部分的数据? 这样,我们可以划定一个当前的大致的系统边界,集中精力进行最需要的部分的开发。因而,从某种意义上讲,界定系统边界的工作也可以看作是数据仓库系统设计的需求分析,因为它将决策者的数据分析的需求用系统边界的定义形式反映出来。 2,确定主要的主题域 在这一步中,要确定系统所包含的主题域,然后对每个主题域的内

数据仓库实例

计算机
王莹

本例采用的是SQl Server2005所提供的商业智能服务和工 具,主要包括Analysis Services(分析服务), Integration Services(集成服务),Reporting Services(集成服务)和Bussiness Intelligence Developer Studio(BIDS)。

分析服务(Analysis Services) SQL Server 分析服务(SSAS)是一个用于分析数据仓库中数据的工 具,它包括了OLAP和数据挖掘工具。在SQL Server 2005数据库系统 中,Analysis Services工具以服务器的方式为用户提供管理多维数 据立方体的服务。Analysis Services可以把数据仓库中的数据组织 起来,经过预先的聚集运算,加入到多维立方体中(即建立立方 体),然后对复杂的分析型访问做出迅速的回答。

集成服务(Integration Services) SQL Server 集成服务(SSIS)被定位成一个能生成高性能数据集成解决 方案(包括数据仓库中数据的提取、转换和加载(ETL))的平台。其集 成的含义主要就是指把ETL集成在一起。SSIS通过一个统一的环境向用户 提供了数据转换服务(DTS)所能提供的所有功能,并且大大减少了用户 花在编写程序和脚本上的精力和时间。 SSIS的基本功能包括:
? ? ? ? ? ? 合并来自异类数据源中的数据 填充数据仓库和数据集市 整理数据和将数据标准化 精确和模糊的查找功能 将商业智能置入数据转换过程 使管理功能和数据加载自动化

电力公司怎样构建企业数据仓库

电力公司怎样构建企业数据仓库? 引言 在之前的文章中我们论述到构建以在线经营管理为核心的数据决策平台的重要性,并给出了发电公司经营管理数据决策平台的总体框架以及构建思路。每个企业想提高竞争力,都要从管理的细微处做起,而研究数据价值,是其中非常重要一点。 要研究数据价值,就必须要先做好数据的治理、管理工作,因为数据挖掘、OLAP等数据分析技术都是建立在数据仓库的基础上的。本文结合帆软在电力行业数据应用领域的多年合作经验,就从电厂的角度出发,讨论下电力企业的数仓价值及其搭建思路,以作参考。 关键词:数据仓库、大数据、可视化、发电公司; 一、发电公司数仓的价值 1、先看一个场景 某发电集团的A电厂厂长月中突然想要了解近几个月的环保节能情况,却被告知该环保节能月报需要三天以上才能制作出来。运营部反映说,该报告既需要从省环保厅网站可以获取部分数据,还需要从电厂环保word报告、值长台等其它各部门汇报上来的excel表格中获取数据进行整合,而各部门整理汇报数据比较慢,无法迅速完成。A电厂厂长为此很头疼,运营部、信息部也很无奈。 2、场景问题解析 上述问题出现的根源是缺乏数据管理机制和保障。导致数据质量参差不齐,基础数据分散、不统一、数据不一致。 以目前五大发电集团公司的信息系统现状为例,大多数集团公司所属电厂的现有信息系统千差万别,各电厂内部原有财务信息化系统、生产管理系统、ERP系统等相对独立,内部信息系统之间缺乏统一的平台对数据进行关联、整合及联通,无法从统一视角去衡量全企业业务概貌,难以完全释放数据的真正价值,呈现出“数据一大堆,现用现找谁”的局面。 而数仓的一大作用就是数据的整合与治理,因此数仓的搭建可以很好的解决这一问题。 3、数据仓库的价值 数仓最大的价值是提供给决策者一种全新的方式,从宏观或微观的角度来观察多年累积的数据,从而使决策者可以迅速的掌握自己企业的经营运作状况、运营成本、发展趋势等对企业发展和决策有重要意义的信息,以利于做出更加及时、准确、科学的决策。 二、发电公司数仓的概念及参考架构

数据仓库建设的几点建议.doc

北京甲骨文软件有限公司咨询经理鲁百年博士 一、国内信息化的现状 1、信息化建设的发展历史:在国内信息化建设过程中,基本上是按照当时业务系统的需求进行建设,例如:在一个企业中,财务部门为了减少工资发放的差错,提高发放的效率,先建设一个工资发放和管理程序;为了报账和核对的需求,建设一个财务管理程序;在银行首先为了业务处理的方便,将最基本的手工记帐和处理的业务建成一个系统,过一段时间,如果有新的业务推出,就再建设一个新的系统,或在原系统的基础上增加新的业务处理。这样的结果使每个系统和系统之间缺少真正的信息沟通和信息交换。 2、为何要建立数据仓库:前面我们讲过,业务系统各自为政,相互独立。当很多业务系统建立后,由于领导的要求和决策的需求,需要一些指标的分析,在相应的业务系统基础上再增加分析和相应的报表功能,这样每个系统就增加了报表和分析功能。但是,由于数据源不统一导致了对同一个指标分析的结果不相同。为了解决该问题,Bell Inman提出了数据仓库的概念,其目的是为了分析和决策的需要,将相互分离的业务系统的数据源整合在一起,可以为领导和决策层提供分析和辅助决策。 3、国内企业对数据仓库建设认识的误区: 大家对数据仓库的认识是将业务系统的数据进行数据抽取、迁移和加载(ETL),将这些数据进行整合存放在一起,统一管理,需要什么样的分析就可提供什么样的分析,这就是数据仓库。这样做的结果是花了一年到两年的时间都无法将整个企业业务系统的数据整合在一起,花钱多、见效慢、风险大。一年后领导问起数据仓库项目时,回答往往是资金不足,人力不够,再投入一些资源、或者再延长半年的时间就会见到效果,但是往往半年过后还是仅仅可以看到十几张或者几十张报表。领导不满意,项目负责人压力也很大,无法交待。这时,项目经理或者项目负责人才意识到,项目有问题,但是谁也不敢说项目有问题,因为这样显然是自己当时的决策失误。怎么办?寻找咨询公司或者一些大的厂商,答案往往是数据仓库缺乏数据模型,应该考虑数据模型。如果建设时考虑到整个企业的数据模型,就可以建设成企业级的数据仓库(EDW。什么是数据模型,就是满足整 个企业分析要求的所有数据源。结果会如何,我个人认为:这样做企业级数据仓

浅谈电力市场营销策略

浅谈电力市场营销策略 从目前我国电力市场的发展现状上可以看出,电力行业越来越成为国民经济的重要组成部分,成为人们日常生活中不可缺少的因素。但是现如今我国电力行业在发展的过程中,由于受到传统经济发展模式的制约,还会存在着一定的滞后性。我国的电力市场中也有很多不确定因素,也是卖方市场的一部分。主要是根据用于的用电量来决定使用量,供电效率和供电质量并不是很高。另外,随着时代的发展和变迁,现代电力市场的发展模式也在不断变化,电力市场的发展趋势也在不断改变。因此,在现如今市场发展的过程中,需要以电力营销理念和生产模式的发展为主,以提升电力优质服务水平为前提,对电力市场的未来发展趋势进行分析。 市场营销,顾名思义就是通过市场这一平台,个人或者是集体、组织在不断创造产品价值的基础上,和别人进行产品和价值的交换,进而获得一定的附加价值。从这一过程中可见,市场营销主要是对商品价值的导向性为基础。另外,在不同的电力市场中,时间、地点等因素对电力营销工作的影响也比较突出。从目前我国电力市场的发展上可以看出,卖方市场组件朝着买方市场进行转型,这一转型不仅加强了两者之间的交流,同时也吸收了更多更有价值的营销经验。进而以提升我国电力优质服务水平为依据,不断扩大电力企业的高效发展。具体来说,电力市场的电力优质服务水平的

特点主要表现在以下几个方面的内容:第一,在经济体制转型的背景下,电力市场虽然存在着较大的发展潜力,但是从现如今电力资源本身来看,电力产品并不是一种产期使用的资源,并且也无法进行永久保存。所以说,要想实现电力企业的高效发展,就需要不断对电力资源进行扩展,以拓展供电量。第二,由于电力产品和其他的产品相比具有较大的差别性和特殊性,因此,需要电力用户对其进行严格地要求,尽量减少电力资源运行的危险性。无论是电力资源本身还是用电设备都需要实现设备和系统运行的高效性和安全性。尽量减少电力事故的出现。第三,从我国的国情上看,对电力资源进行消费是我国国民经济发展的重要内容,所以说,只有提高电力消费水平,才能不断提升我国经济的高速发展。现如今,多数的电力企业都会意识到电力营销的重要性,在具体的实践中也建立健全相应的营销机制,以提升电力营销的基本水平。但是,其中仍然存在着较大的弊病,其中比较重要的就是电力营销意识薄弱,管理体制缺乏以及营销模式不科学等等。因此,只有不断提升优质电力资源,才能够减少电力产品供不应求的状态。另外,设置专门的电力营销管理部门是促进电力营销工作长足发展的重要因素。 在电力资源的市场营销工作中,要从电力产品本身入手,形成一种相对比较统一化的产品类型,并且将涉及到的差异性来进行明确。如果营销的电能处于同网状态下,那么企业

数据仓库物理模型设计

数据仓库物理模型设计 数据仓库的物理模型就是数据仓库逻辑模型在物理系统中的实现模式。其中包括了逻辑模型中各种实体表的具体化,例如表的数据结构类型、索引策略、数据存放位置和数据存储分配等。在进行物理模型的设计实现时,所考虑的因素有:I/O存取时间、空间利用率及维护的代价。 为确定数据仓库的物理模型,设计人员必须做这样几方面工作:首先要全面了解所选用的数据库管理系统,特别是存储结构和存取方法;其次了解数据环境、数据的使用频率、使用方式、数据规模及响应时间要求等,这些都是对时间和空间效率进行平衡和优化的重要依据;最后还需要了解外部存储设备的特征。只有这样才能在数据的存储需求与外部存储设备条件两者之间获得平衡。 1 设计存储结构 在物理设计时,常常要按数据的重要性、使用频率及对反应时间的要求进行分类,并将不同类型的数据分别存储在不同的存储设备中。重要性高、经常存取并对反应时间要求高的数据存放在高速存储设备上;存取频率低或对存取响应时间要求低的数据则可以存放在低速存储设备上。另外,在设计时还要考虑数据在特定存储介质上的布局。在设计数据的布局时要注意遵循以下原则。 l 不要把经常需要连接的几张表放在同一存储设备上,这样可以利用存储设备的并行操作功能加快数据查询的速度。 l 如果几台服务器之间的连接会造成严重的网络业务量的问题,则要考虑服务器复制表格,因为不同服务器之间的数据连接会给网络带来沉重的数据传输负担。 l 考虑把整个企业共享的细节数据放在主机或其他集中式服务器上,提高这些共享数据的使用速度。 l 不要把表格和它们的索引放在同一设备上。一般可以将索引存放在高速存储设备上,而表格则存放在一般存储设备上,以加快数据的查询速度。 在对服务器进行处理时往往要进行大量的等待磁盘数据的工作,此时,可以在系统中使用RAID(Redundant Array of Inexpensive Disk,廉价冗余磁盘阵列)。 2 设计索引策略 数据仓库的数据量很大,因而需要对数据的存取路径进行仔细地设计和选择。由于数据仓库的数据一般很少更新,所以可以设计索引结构来提高数据存取效率。在数据仓库中,设计人员可以考虑对各个数据存储建立专用的索引和复杂的索引,以获取较高的存取效率,虽然建立它们需要付出一定的代价,但建立后一般不需要过多的维护。 数据仓库中的表通常要比联机事务处理系统(OLTP)中的表建立更多的索引,表中应用的最大索引数应与表格的规模成正比。数据仓库是个只读的环境,建立索引可以取得灵活性,对性能极为有利。但是表若有很多索引,那么数据加载时间就会延长,因此索引的建立需要进行综合的考虑。在建立索引时,可以按照索引使用的频率由高到低逐步添加,直到某一索引加入后,使数据加载或重组表的时间过长时,就结束索引的添加。 最初,一般都是按主关键字和大多数外部关键字建立索引,通常不要添加很多的其他索引。在表建立大量的索引后,对表进行分析等具体使用时,可能需要许多索引,这会导致表的维护时间也随之增加。如果从主关键字和外部关键字着手建立索引,并按照需要添加其他索引,就会避免首先建立大量的索引带来的后果。如果表格过大,而且需要另外增加索引,那么可以将表进行分割处理。如果一个表中所有用到的列都在索引文件中,就不必访问事实表,只要访问索引就可以达到访问数据的目的,以此来减少I/O操作。如果表太大,并且经常要对它进行长时间的扫描,那么就要考虑添加一张概括表以减少数据的扫描任务。 3 设计存储策略

建设数据仓库7个步骤

成功实施数据仓库项目的七个步骤 建立一个数据仓库并不是一个简单的任务,不应该由一个人单独完成。由于数据仓库最佳结合了业务惯例和信息系统技术,因此,一个成功的数据仓库实施需要这两方面的不断协调,以均衡其所有的需要,要求,任务和成果。我很乐意与大家分享我在规划和管理任何数据库项目时采用的方法,这些数据库包括交易数据库,数据仓库,和混合型数据库。由于我生活在关系数据库和数据仓库以及用以支撑它们的数据提取,转换和加载(ETL )过程中,所以我会集中在这些领域讨论我的方法。然而,您可以将这些方法扩展到整个栈--OLAP立方体和如报告,特征分析(ad-hoc analysis),记分卡和仪表盘展示之类的信息传递应用。 我不是吃撑了要告诉一个真正的项目经理( PM )如何做他或她的工作,相反,我写的这些是为那些数据库管理员和开发者,他们没有好运气能与有经验的项目经理一起工作;同样也适合这样的IT专业人员,他们被突然要求:“建立一个数据仓库“,并且需要自己扮演项目经理的角色。我的讨论不会是完整的,但我希望这会给您足够的信息来让您的项目球滚起来。 如图1所示,数据仓库项目有3个轨道(tracks):数据轨道,技术轨道和应用层轨道。当您在整理任何数据库项目计划时,我建议您以这三个轨道为模板来管理和同步您的活动。当您向技术决策者( TDMs ) ,商业决策者( BDMs ) ,和所有其他该数据仓库项目参与者讲解您的计划时,您也可以把图1当作一个高级的概要图来使用。 使用一种生命周期管理方法 我鼓励您利用您的组织可以提供的资源,比如设计,开发和部署系统和软件的技术和方法。如果贵公司对于这些工作没有采用任何正式的方法,继续前进吧,您可采用我为我自己的数据库项目开发的7D数据库生

电力营销市场特点及营销解决方法

电力营销市场特点及营 销解决方法 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

电力营销市场特点及营销解决方法摘要:近年来我??经济取得了快速发展和人民的生活水平显着提升,人民对电力的需求也越来越大,因此深化改革电力营销才能满足当前市场需求。本文针对电力营销市场基本情况和主要特征进行分析,并提出有效的解决办法,共同推进电力企业可持续发展。 关键词:电力;营销市场;营销方案 当前的电力营销方案已经不能满足时代的要求,因此,建立新型营销模式对电网的发展极其重要。 1.电力营销市场的重要性及特点 电力营销市场的重要性 电力行业随着市场经济的发展而不断变化,电力行业也不得不进行电力营销。在市场营销的浪潮中电力营销占据电力行业的重要地位,并取得了长足发展与进步,在整个的供电企业的业务流程中时刻都在。通过一整套的营销策略,供电公司必须满足用电客户需求,实现电力企业供电任务,做到为用户提供高质电能。目前,市场营销在电力企业的的作用已越来越重要,体现在:1)电力企业生存与发展离不开市场营销。电力企业的营销部门的职能是负责销售电能,销售电价需要按照一定标准执行,因此营销工作好坏决定着公司收益高低。2)市场营销对电力企业规划方向的影响。电力营销部门是电力企业服务社会的窗口,

并在电力企业中担负着重要职责,引导企业的经营规划。3)市场营销反映供电企业形象。市场营销面向的是千家万户用电客户,是电力企业门户。 电力营销市场的特点 1)差异性。电力企业的营销市场存在差异性,面对不同的客户用和用电的需求量的差异,电力市场也有比较显着的差异性特征,消费者对电能的需求不同,用户的供应方式不同时间不同导致计划安排也会不同。用户用电的时间不同导致存在差异性。不同的用户无论是用电量,还是用电时间和用电种类不同,都会给用电安排带来影响。不同的客户对电能有不同的要求具有不同的要求。有的保持长期供电,有的则需要间歇供电。不同规模的消费者对电力功率要求不一样。大型企业的电力消费数十亿千瓦时。小的用户往往只有几十千瓦时。根据不同的差异安排发电是一个重要课题,研究电力目标市场的总体特征、变化规律和发展趋势有助于对电力目标市场的规划。 2)整体性。电力营销市场的整体性特征也很显然,电网为电力交换提供了支撑,电力市场整体的范围也就是电网的覆盖区域,因此电力营销市场具有整体性。电网将电力市场统一成一个整体,电力销售的部门进行整体销售服务,对一个或者多个区域看作一个整体,所以将不同的电力目标市场连接成一个整体。电力企业要满足电力目标市场和电力营销市场是由电网的整体性决

基于数据仓库的电力信息系统应用规划

基于数据仓库的电力信息系统应用规划 发表时间:2018-09-03T15:50:43.917Z 来源:《防护工程》2018年第9期作者:柳青[导读] 电力营销管理信息系统所面临的挑战也逐渐增大。它要求电力营销系统紧追时代的步伐,能迅速地处理大量数据,并根据电力营销市场的价值规律,掌握市场的供需关系,制定可行的营销战略,以期得到最大的经济效益。柳青 国网西藏电力有限公司西藏拉萨 850000摘要:随着经济的高速发展,人们对电力的需求也在不断地增长。在整个电力事业发展的同时,电力营销管理信息系统所面临的挑战也逐渐增大。它要求电力营销系统紧追时代的步伐,能迅速地处理大量数据,并根据电力营销市场的价值规律,掌握市场的供需关系,制定可行的营销战略,以期得到最大的经济效益。关键词:数据仓库;电力营销;数据管理引言:近年来,一些新技术(数据仓库技术、联机分析处理、数据挖掘技术等)的提出和发展,为进一步开发新的电力营销决策支持系统提供了技术支持。一些新的数据仓库技术得到发展,这是开发新的电力营销决策支持系统的基础,能够解答一些不好实现的问题。而对实用化的电力营销决策支持系统的开发需要对电力营销的过程和内容进行分析,在现在已经开发并应用的电力业务信息系统的基础上确定开发系统的步骤。实用数据仓库技术作为基础,结合联机分析处理技术和数据挖掘技术对数据仓库中的数据进行分析,可以为决策者提供良好的分析环境,并将数据仓库作为决策的信息供应链。 一、当前电力营销信息系统存在的问题 1.安全风险 安全问题是检验一个系统优劣的首要因素。电力营销信息系统的安全问题直接关系着电力企业的生存与发展,但是安全风险在任何系统环境中都是存在的。系统存在的安全风险主要体现在营销数据上。在信息技术高速发展的今天,导致数据错误的原因是多方面的:一方面是系统硬件方面的问题,比如突发的意外状况导致系统不能正常工作;另一方面是软件方面的问题,如计算机病毒或者黑客的入侵等外来因素导致的系统不能正常工作;还有就是直接操控系统的工作人员,可能出于自身利益的考虑,泄露或者篡改信息系统,也增加了系统的安全风险。 2.信息系统的薄弱 随着电网企业信息化的发展,经过长时间的积累,数据库出现了巨量的业务数据。数据库规模之庞大给统计和查询工作带来了很大的困难,也导致了这些数据过于零散、独立而实现不了应有的价值。因此在客观上就要求系统管理人员运用现代化的技术对这些数据进行管理,去粗去精,去伪存真,通过深加工不断挖掘和选择出被掩盖的对电力营销信息系统具有极大意义的信息。 3.营销系统性能的缺陷 随着科学技术的发展,我国彻底摆脱了全国性缺电的局面。居民用电数量急剧增加,在带动电力占领居民市场的同时,也出现了计费难、电费回收压力大等问题,同时数据的庞大化也使抄表、变更表计等工作日益复杂化。传统的营销系统虽在网络化时代能进行远程计费、用电量统计等日常工作,但却解决不了已限定范围内的一些特殊情况。只有营销系统的性能要求在深度和广度上都得到不断地提高,才能适应迅猛发展的市场经济的变化。 二、数据仓库技术 数据仓库是为适应信息系统业务发展的需要,在数据库系统技术的基础之上发展而来的一系列新的应用技术。网络的出现使现代人进入了信息化的时代,需要采用科学的方法来管理巨量的信息和数据。数据仓库技术的种类繁多,比较常见的有决策支持系统、数据挖掘系统、经营分析系统等。 1.数据仓库的特点 (1)对象性。数据仓库的数据是面向主题的,这与传统的针对应用是相对应的,数据仓库根据数据的不同类型,将同类型的数据收集在一起组成一个特定的分析领域。 (2)集成性。数据仓库对数据的进入设置了一定的关卡,零散而独立的数据是无法进入数据仓库的,必须经过抽取,检查出各数据之间是否有彼此矛盾之处,然后对数据的结构重新调整,对数据重新分类,再经过一系列深加工后才能进入数据仓库。 (3)稳定性。数据仓库里的数据并不是只有最新的、专有的、在日常生活中常常使用的数据,数据仓库中还存放着各个历史时期、各个专题的数据。而且一旦进入数据仓库,在没有意外的情况下,经过加工和集成后的数据是很少被修改的。 2.数据仓库的系统结构 数据仓库是全数据的集合,由三个部分组成,即管理部分、存储部分和应用部分。管理部分的工作主要是对来自不同数据库中的数据的格式、语言等进行抽取和转换,重新建立一个新的数据模型,以适应数据仓库的设计。 存储部分是数据仓库的主体部分,其主要工作是利用数据库管理系统把数据归档、备份、维护,以确保数据的安全性。数据仓库里的数据具有历史性,包括元数据、综合数据、当前数据以及历史数据。应用部分也就是数据仓库系统的分析工具,分析工具包括查询检索工具、多维数据的OLAP分析工具、数据开采DM工具等,主要用于完成实际决策问题,以满足决策支持系统的不同需求。 三、基于数据仓库的电力营销系统设计 数据仓库中数据存储的结构有两种:星形和雪花形。在一个星形模型中,位于中心的是事实表,发散出来的是维度表,事实表与每个维度表都相互连接,但是每个维度表彼此之间并不关联。雪花形是指有一个或多个维度表通过其他维度表连接到事实表上,因其像多个雪花连接在一起,故称雪花模型。雪花模型通过规范维度表来减少冗余度,可以节省空间。 1.售电量

数据仓库建设方案详细

第1章数据仓库建设 1.1数据仓库总体架构 专家系统接收增购项目车辆TCMS或其他子系统通过车地通信传输的实时或离线数据,经过一系列综合诊断分析,以各种报表图形或信息推送的形式向用户展示分析结果。针对诊断出的车辆故障将给出专家建议处理措施,为车辆的故障根因修复提供必要的支持。 根据专家系统数据仓库建设目标,结合系统数据业务规,包括数据采集频率、数据采集量等相关因素,设计专家系统数据仓库架构如下: 数据仓库架构从层次结构上分为数据采集、数据存、数据分析、数据服务等几个方面的容: 数据采集:负责从各业务自系统中汇集信息数据,系统支撑Kafka、Storm、Flume

及传统的ETL采集工具。 数据存储:本系统提供Hdfs、Hbase及RDBMS相结合的存储模式,支持海量数据的分布式存储。 数据分析:数据仓库体系支持传统的OLAP分析及基于Spark常规机器学习算法。 数据服务总线:数据系统提供数据服务总线服务,实现对数据资源的统一管理和调度,并对外提供数据服务。 1.2数据采集 专家系统数据仓库数据采集包括两个部分容:外部数据汇集、部各层数据的提取与加载。外部数据汇集是指从TCMS、车载子系统等外部信息系统汇集数据到专家数据仓库的操作型存储层(ODS);部各层数据的提取与加载是指数据仓库各存储层间的数据提取、转换与加载。 1.2.1外部数据汇集 专家数据仓库数据源包括列车监控与检测系统(TCMS)、车载子系统等相关子系统,数据采集的容分为实时数据采集和定时数据采集两大类,实时数据采集主要对于各项检测指标数据;非实时采集包括日检修数据等。 根据项目信息汇集要求,列车指标信息采集具有采集数据量大,采集频率高的特点,考虑到系统后期的扩展,因此在数据数据采集方面,要求采集体系支持高吞吐量、高频率、海量数据采集,同时系统应该灵活可配置,可根据业务的需要进行灵活配置横向扩展。 本方案在数据采集架构采用Flume+Kafka+Storm的组合架构,采用Flume和ETL 工具作为Kafka的Producer,采用Storm作为Kafka的Consumer,Storm可实现对海量数据的实时处理,及时对问题指标进行预警。具体采集系统技术结构图如下:

关于精细化电力营销服务管理措施的研究 张建华

关于精细化电力营销服务管理措施的研究张建华 发表时间:2018-01-10T11:15:26.010Z 来源:《电力设备》2017年第27期作者:张建华[导读] 摘要:精细化电力营销服务管理,促进了优质化、标准化、规范化营销服务体系的建立,不断增强电力企业的市场竞争力。 (国网山东省电力公司济阳县供电公司山东济南 251400)摘要:精细化电力营销服务管理,促进了优质化、标准化、规范化营销服务体系的建立,不断增强电力企业的市场竞争力。通过进行精细化的营销服务管理,电力企业收到了明显的成效。近几年来,我国的电网公司的供电服务质量有很明显的提高,但是很多机制并没有完善,服务工作的阶段性较强,因此精细化管理在电力营销服务中的实施占重要地位。 关键词:精细化管理;电力营销;服务管理;电力企业 1 精细化电力营销服务管理简述 1.1 电力营销精细化管理的基本涵义 电力营销的精细化管理,指的是在现有的电力企业的管理基础上,对营销理念和营销服务进行的管理改革,不仅要实现对自身经营模式的调整,还要转变营销观念,实现更加经济化和科学化的管理。由此可见,精细化管理不意味着深刻现有管理,而是要对现有管理方式做调整,而精细化的主要内容集中于对态度、服务的精细化上面。精细化管理并不是现代管理采用的概念,精细化管理理念的“五个精度”,就是精英管理者、精品产品、精致的客户关系、精细的配合。而四个细度,指的是市场的细分、市场的细微变化、细分职责、细分任务。 1.2 电力企业的精细化管理的主要特征 一般来说,精细化管理需要做到以下几点:一是要重视电力营销服务过程中的管理细节,所谓细节决定成败,指的就是在实际的管理活动中,不能够放任和忽视一些细小的管理问题;二是要重视管理的过程,也就是要认真对待管理的每一个过程;三是要重视在管理过程中的落实和执行,也就是要在管理的过程中要认真的落实和执行各种管理理念;四是要重视在电力营销服务管理过程中,要对效果进行中药评估和评价。 2 精细化电力营销服务管理的重要性 精细化管理对于电力企业有着非常重要的积极意义,因为精细化管理是现代工业化企业的一个的管理的概念,在电力营销服务中,对于管理工作更加制度化、格式化、程式化,更加强调实际执行的能力。而传统的管理方式是无法实现这些管理目的的,因此,在未来的电力企业发展过程中,精细化管理才是电力营销服务的核心,只有改进了服务,才能实现电力企业的更好更快发展,维护更好的客户关系。电力营销服务要想做到更好,就需要有效的运用文化、技术、智慧等精华来促进其发展。精细化管理能让电力营销服务有效贯彻到每个环节,并发挥每个环节的作用,它是提升电力营销服务整体执行力的一个重要的途径。 3 精细化管理在电力营销服务中的实施优势 建立了专业性强的岗位的职责系统。在电力营销服务中,组织的结构、岗位职责方面有些混乱,因此导致工作效率的降低,组建适合电力营销服务发展的岗位职责系统是十分重要的。只有明确各个岗位上的工作人员的具体职责,才能做到有效的管理,形成责任负责制。 (2)建立了目标管理的系统即运营管理系统。电力营销服务通过战略目标管理体系,将目标落实到各个服务人员的身上,实行及时的战略调整和经营规划,通过周、季度、年度等总结,使电力营销服务人员及时掌握与自己相关的信息,并提前做好下一项工作的安排。 (3)建立了科学化的考评制度。对电力营销服务人员进行“公平、公正、公开”这一点,保证电力营销服务人员的业绩提高。规范化的管理评价,可以为每一次的管理服务进行有效的效果反馈,从而分析和改进管理方式。 (4)加强了企业内部的控制,即提高电力营销服务人员的教育。优质服务作为是一切企业生存与发展的前提,是国家电网的重要核心。每一位电力营销服务人员都要树立良好的服务态度,要把服务做到精、细、实,贯穿在服务前、服务中、服务后,树立电力企业的良好形象。企业形象对于电力企业的未来发展是非常重要的,尤其是对于需要维护客户关系的电力生产和营销过程中来说,就显得更加重要。 (5)在现阶段电力营销服务中,以客户为中心,满足客户的需求是最基本的措施。建立一个安全可靠的客户服务系统,通过其电话热线,将服务推广之外,使客户更加方便的通过电话呼叫来接受服务。 (6)健全了重要客户、社区、和社会弱势群体的客服机制,实行免费服务等,对贫困学生、下岗工人等进行支持以及上门服务。 (7)更新了市场的观念,所有电力营销服务工作人员都必须认清当前的市场环境,对电力营销服务有更加新颖的认识,使其电力营销服务更加的人性化,方便化。 4 精细化电力营销服务管理策略 精细化电力营销服务管理,是电力企业可持续发展的生命线,是优质高效电力服务的保障。下面将具体介绍一下精细化电力营销服务管理策略的内容。 4.1 管理制度 严格完善、科学合理的电力营销服务管理制度是进行精细化管理的前提和保障,电力企业要结合自身的实际情况,通过构建信息互享和政企双向沟通的管理机制,有效的夯实营销服务的管理体系,促进精细化服务贯穿在整个营销服务中,不断完善营销服务的管理标准体系,从而保证电力企业营销服务精细化管理的稳定运行。 4.2 服务流程 根据电力监管部门的管理技术标准和用电客户的实际需求,利用流程化任务驱动和精细化管理模式,对营销过程中的操作程序和服务功能进行系统的功能整合,因而可以构建出信息高度集成共享、操作科学规范、流程简单明晰的职能服务平台,从而实现对营销服务的流程化、统一化、智能化和规范化的动态监督管理。 4.3 数据平台 规划和建设营销服务的数据集成信息平台,是精细化管理重要的技术支持。数据平台的设计既要结合电力企业的实际情况和既有的自动化系统运行状况,更要考虑用户对容量、用电等级、电压等级差异化的需求,通过数据仓库、智能分析运算、联机数据信息挖掘等技术,把各种智能化功能引入精细化管理的各个环节,增强数据信息的透明性和实时性,从而有效提高营销服务的效率,提高电力企业的经济效益。

电力市场开拓及电力企业营销管理策略 田一焜

电力市场开拓及电力企业营销管理策略田一焜 发表时间:2018-12-17T10:09:36.197Z 来源:《电力设备》2018年第21期作者:李玲红田一焜杨芳宜宋丹周航杜佳 [导读] 摘要:电力企业在长期的发展过程中,为了获得更多的经济效益,需要走向市场化,在市场体制的约束下扩大自身的业务范围。 (国网辽宁省电力有限公司阜新供电公司) 摘要:电力企业在长期的发展过程中,为了获得更多的经济效益,需要走向市场化,在市场体制的约束下扩大自身的业务范围。实现这样的发展目标,需要做好市场开拓的相关工作,明确企业的发展方向,在可靠的措施支持下保证各种工作计划的顺利完成。同时,在走向市场化的过程中,电力企业需要构建出可靠的营销管理策略,在科学的营销管理思路支持下开展相关的工作,为企业市场份额的提高提供可靠地保障。基于此,本文将对电力市场开拓及电力企业营销管理策略进行必要的阐述。 关键词:电力市场;开拓;电力营销;营销策略 我国市场经济的逐步发展和规范,任何垄断行业的格局都将会被打破,最初人们也一致认为电力企业经营不会遇到市场竞争问题,但事实并非如此。电力流通于市场依然是一种商品,电力市场逐步由卖方市场转为买方市场,电力市场营销就是电力企业在变化的电力市场环境中,以满足群众和社会生活生产的电力需求为目的,通过电力企业一系列与市场有关的经营活动,提供满足消费需要的电力产品和相应的服务,从而实现电力企业开拓市场、占领市场的目标。 在我国电力体制改革的不断深入的环境下,电力供电企业的市场化步伐将会加快,实现供电企业管理的专业化、优质化及高效化,以科学的方式、方法来为人民服务,制定适应电力市场的企业营销策略也就显得十分重要。 1.电力市场营销管理思想定位 电力营销必须采取市场导向管理模式。电力企业的生产经营活动必须服从和服务于电力营销的需要。电力市场营销的开展需要立足于“以电网为基础,技术为支撑,管理和服务是保障”的原则。充分利用目前“两网”改造的有利时机,逐步解决供配电网络“瓶颈”,可以解决广大用户的用电需求,大力推广和应用新产品、新技术,实现集抄管理和远程监测,提高工效和计量准确性。 对于买方市场的需求构建出新型电力营销理念。将来我国的电力营销市场是一个买方市场,电力企业应该改变过去建立在卖方市场的基础上旧的电力管理模式,从新建立一个能够适应目前电力市场需求的模式,让电力市场获得新的活力,电力市场营销体系和机制得到发展。 进行法制化管理、商业化运营。电力企业是一个能够接受政府监管的企业,因此,在实现商业化运作的同时注重市场占有和长远战略目标,还要严格按照上级规定的市场营销政策和业务范围,从事电力市场的营销工作。 2.电力企业市场开拓策略 2.1节能环保 环境问题已经成为全球关注的问题,对于电力企业来说,只有以环保这一主题为核心才能够拓展其市场。首先,应提高企业员工的环保意识,在产品研发、能源利用等方面严格控制对环境的影响。同时,电力企业应响应政府的号召,与当地政府部门合作,加大环保宣传力度,实现环保全民化从企业做起,倡导人们追求和使用更加环保的电力产品。只有这样,电力企业才能主导市场方向,拓宽电力产品的营销渠道。电力设备在人们日常生活中应用广泛,其环保作用更加明显,如暖气、空调等。电力企业应逐渐提高产品的使用性能以及性价比,使居民愿意将电力产品作为重点。目前,一些电力企业采取家电下乡活动,使普通群众更深刻地感受到电力产品的作用,如“美的”的家电下乡活动就取得了很好的效果。 2.2技术创新 科学技术的不断更新,对于供电企业产业规模的扩大具有重要的现实参考意义。企业需要结合自身实际的发展状况,加大科技方面的研究与应用,提高实际的电力生产和管理水平,为现代化电力企业服务功能的完善提供可靠地保障。在业务范围扩大的过程中,电力企业需要注重技术创新能力的有效培养,推动产业转型和产业升级的步伐,满足可持续发展战略的具体要求。 在对电力技术改造的过程中,电力企业应该充分地利用国家的各种优惠政策,增强电力产品推广过程中的生态环保工作质量,实现电力企业双达标过程中的更多环保目标。同时,面对有利的发展机遇,电力企业应该在可靠的技术手段支持下,加快城乡电网的改造步伐,完善各种基础配套设施,全面提高企业的综合管理能力,做好电力技术攻关的各种工作。与此同时,企业需要增强电网一次系统与二次系统的改造效果,促使系统可以长期处于稳定、高效的工作状态,增强电力企业各项业务开展中的现代化综合管理能力。 2.3服务策略与促销策略 结合目前电力企业的整体发展现状,可知企业在降低自身生产成本的同时提高服务水平,有利于扩大业务范围,增强企业的综合市场竞争力。因此,在电力市场开拓的过程中,企业应该建立以用户为核心的服务宗旨,强化以人为本的服务意识,满足用户多元化的用电需求,树立符合时代发展要求的服务理念,将经营活动开展中的服务质量有效地融入到电力企业品牌创建的过程中。同时,作为电力销售企业的常用的产品销售手段,企业应该注重自身电力促销方式的适用性。在提高电力产品质量的过程中,电力企业应该采取有效的方式激发用户的消费潜能,丰富电力产品促销信息的传递效率,增强企业的社会影响力。 3.电力企业营销管理策略 3.1完善营销管理结构 完善电力营销管理结构主要是指在电力企业内部实现生产、营销及服务一体化管理。可建立电力客服中心,将企业电网调度、管理、电力产品营销,企业整体服务等串联起来,实现以客户为中心,各个部门和谐统一发展。另外,确定各个部门的职责或功能,督促其完成分内之事,提高营销管理策略,避免工作程序混乱,并在统一发展的同时实现个性化服务。从细节上,应确保电力企业相关资料的完整,其中包括电力设备性能介绍、电费收费单以及会计其他相关资料等。提高电力会计的管理能力,确保其对电力相关资料进行统一正确的管理。 3.2做到事权统一,责任明确 努力营造电费回收大环境,建立电费回收常态运行机制。加强内部管理和计量工作,减少电能表自身损耗,大力推广应用全电子式电能表。认真清理专变用户计量点设置不合理的现象,安装的计量表计准确计量无功电量,确保电费利率收取的标准性,积极创造条件,实施计量改造,加强对计量电能表轮换工作。从管理方式和管理手段上采取必要的强化措施,层层落实电费回收责任制,分片包干,责任到

电力营销系统中数据挖掘技术优秀论文

电力营销系统中数据挖掘技术优秀论文 1、数据挖掘技术的应用及特点 数据挖掘技术是一种新型的技术,在现代数据存储以及测量技术的迅猛发展过程中,人们可以进行信息的大量测量并进行存储。但是,在大量的信息背后却没有一种有效的手段和技术进行直观的表达和分析。而数据挖掘技术的出现,是对目前大数据时代的一种应急手段,使得有关计算机数据处理技术得到加快发展。数据挖掘技术最早是从机器学习的概念中而产生的,在对机器的学习过程中,一般不采用归纳或者较少使用这种方法,这是一种非常机械的操作办法。而没有指导性学习的办法一般不从这些环境得出反馈,而是通过没有干预的情况下进行归纳和学习,并建立一种理论模型。数据挖掘技术是属于例子归纳学习的一种方式,这种从例子中进行归纳学习的方式是介于上述无指导性学习以及较少使用归纳学习这两种方式之间的一种方式。因此,可以说,数据挖掘技术的特征在出自于机器学习的背景下,与其相比机器主要关心的是如何才能有效提高机器的学习能力,但数据挖掘技术主要关心如何才能找到有用、有价值的信息。其第二个特征是,与机器学习特点相比较而言,机器关心的是小数据,而数据挖掘技术所面临的对象则是现实中海量规模的数据库,其作用主要是用来处理一些异常现象,特别是处理残缺的、有噪音以及维数很高的数据项,甚至是一些不同类型数据。以往的数据处理方法和现代的数据挖掘技术相比较而言,其不同点是以往的传统数据处理方法前提是把理论作为一种指导数据来进行处理,在现代数据挖掘技术的出发角度不同,主要运用启发式的归纳学习进行理论以及假设来处理的。 2、数据挖掘技术主要步骤 数据挖掘技术首先要建立数据仓库,要根据实际情况而定,在易出现问题的有关领域建立有效的数据库。主要是用来把数据库中的所有的存储数据进行分析,而目前的一些数据库虽然可以进行大量的存储数据,同时也进行了一系列的技术发展。比如,系统中的在线分析处理,主要是为用户查询,但是却没有查询结果的分析能力,而查询的结果仍旧由人工进行操作,依赖于对手工方式进行数据测试并建模。其次,在数据库中存储的数据选一数据集,作为对数据挖掘算法原始输入。此数据集所涉及到数据的时变性以及统一性等情况。然后,再进行数据的预处理,在处理中主要对一些缺损数据进行补齐,并消除噪声,此外还应对数据进行标准化的处理。随后,再对数据进行降维和变换。如果数据的维数比较高,还应找出维分量高的数据,对高维数数据空间能够容易转化为检点的低维数数据空间进行处理。下一步骤就是确定任务,要根据现实的需要,对数据挖掘目标进行确定,并建立预测性的模型、数据的摘要等。随后再决定数据挖掘的算法,这一步骤中,主要是对当前的数据类型选择有效的处理方法,此过程非常重要,在所有数据挖掘技术中起到较大作用。随后再对数据挖掘进行具体的处理和结果检验,在处理过程中,要按照不同的目的,选择不同的算法,是运用决策树还是分类等的算法,是运用聚类算法还是使用回归算法,都要认真处理,得出科学的结论。在数据挖掘结果检验时,要注意几个问题,要充分利用结论对照其他的信息进行校核,可对图表等一些直观的信息和手段进行辅助分析,使结论能够更加科学合理。需要注意的是要根据用户

电力市场营销策略创新

电力市场营销策略创新摘要随着电力企业全面走向市场, 营销工作在电力企业的经营和管理中占有越来越重要的地位,犹如企业经营管理的晴雨表,营销业绩直接影响着电力企业的生存和发展。要建立能适应现代市场经济需要的有中国特色的电力市场营销体系,必须进行营销策划创新,主要包括:一是电力企业形象营销创新策略;二是电力市场开发的营销创新策略;三是电力价格调整的营销创新策略;四是电力企业服务营销创新策略。关键词电力市场营销企业经营理念现状和制约创新一、电力市场营销理念的含义电力企业营销管理的思想定位首先应当明确的是电力营销必须采取市场导向的管理模式把电力营销定位为供电企业的核心业务电力的生产经营活动应服从和服务于电力营销的需要。其次电力营销的开展应立足于“电网是基础技术是支撑服务和管理是保障”的原则。应当充分利用目前“两网”改造的有利时机逐步解决供配电网络“瓶颈”满足广大用户的用电需求运用先进的通信、网络、计算机技术为客户提供高效的、全方位的优质服务以严格规范的管理对各项业务进行监控才能实现企业的营销目标。第三基于买方市场的要求建立起新型电力营销理念。未来的电力营销市场是一个买方市场这是一个不争的事实。供电企业应当改变过去建立在卖方市场基础上的旧的供电管理模式建立一个能适应市场需求充满市场活力的市场营销体系和机制。第四进行商业化运营、法制化管理。政企分开后电力企业仍然是一个接受政府监管的企业因此在实现商业化运作的同时还要严格按照上级规定的市场营销政策和业务范围从事电力市场的营销工作。二、我国电力市场现状与制约因素(一)农村电网用电量和电力市场现状随着经济的发展使广大人民生活水平已经达到了小康能源的消耗量也随之高速增长。据农电公司数据统计1995 2010年十五年来农村用电量正以平均10%的速度增长。城乡农民第三产业发展很快特别是商业、服务业、高科技行业用电主要特点是行业间用电量差距较大。第三产业中各行业、事业机关单位、居民用电量大约占总量的90%其中事、比用电量和居民用电量加起来占到总量的70%。城乡经过产业调整后以第三产业特别是高科技产业为主的产业结构逐渐形成在能源的使用上也多集中于这些行业。同时农村电网普遍存在着管理层次多,电价混乱且过高的现象,一般农户不敢放开手脚用电,制约了售电量的增长。河北有些偏远农村地区人均用电仅为35千瓦?时月。农村电网特别是配电网非常薄弱,电网建设不配套且设备陈旧,导致线损大,电压低,供电可靠性差。由于农村电网可靠性差,导致一些用户不敢购买电器,从而制约了电力市场的进一步拓展,出现了有电用不上的局面。 (二)电价机制不合理由于目前的电价管理带有浓厚的计划经济色彩,电网经营企业只能按国家规定的电价严格执行,不能针对市场特点及自身资源利用特征在国家规定价格的基础上向下微调,很难适应电力买方市场。用户多用电在电价上不能明显受益,制约了电力市场的拓展。工业、农业、民用电价分类制定未能体现出各类用户公平合理分担电能成本、费用的功能,也未能充分考虑能源的利用效益,鼓励合理利用能源,这样就制约了这些用户的用电积极性。用户承担的电价高于国家目录电价。由于近年来为缓解新投产发电厂还本付息压力而对新建电厂实行新厂新价,在电价中并入了大量均摊加价,这样就把办电企业的投资负担转嫁到了所有电力用户。供电企业内部的管理体制和营销手段不能适应电力市场有效运作的要求。供电企业内部机构设置不合理。用电机构沿用计划经济的模式,人员少、素质差、管理弱,显然不能适应开拓电力市场的要求。营销手段落后。抄、核、收及业扩报装、报表分析、计量管理全靠人工去完成。 (三)我国电力市场营销存在的问题由于电力行业由的特殊性在我国计划经济体制下长期的缺电局面和“以产定销”的做法形成了电力销售部门的服务观念淡漠、僵化市场营销在电力企业管理中没有摆到应有的位置。目前我国电力市场营销存在以下问题1传统的电力经营观念根深蒂固电力工业是国民经济的重要基础产业其自然的、法定的垄断地位使电力企业多年来享受着皇帝女儿不愁嫁的特殊待遇。电力经营思想没有真正以市场为导向仍然习惯于“靠国家、靠政策、靠行政手段”的方法去处

相关主题
文本预览
相关文档 最新文档