烟草-行业数据综合分析应用解决方案
- 格式:docx
- 大小:866.25 KB
- 文档页数:27
大数据在烟草企业营销工作中的应用措施摘要:随着互联网和移动通信技术的快速发展,大数据已经成为当今经济社会发展的重要支撑。
在烟草企业营销领域,利用大数据分析和挖掘技术可以帮助企业深入了解消费者需求,提升市场竞争力。
关键词:大数据;烟草企业营销;应用措施引言随着信息技术的发展和数据资源的不断积累,烟草企业可以利用大数据分析和挖掘技术来提升营销效果和市场竞争力。
烟草企业可以更好地了解消费者需求,精准定位目标市场,并及时调整和优化营销策略,提高市场反应速度和销售业绩。
1、营销数据的采集与整合1.1数据来源的多样化为了实现全面、多样化的数据采集,烟草企业可以整合不同渠道的数据源。
这包括社交媒体、电子商务平台、销售终端等渠道。
通过收集来自不同渠道的数据,企业可以获取更全面的市场信息和消费者行为数据,从而更好地理解消费者需求和市场趋势。
1.2数据质量保障为了确保采集到的数据准确可靠,烟草企业需要建立数据采集和清洗的标准和流程。
这包括确保数据采集工具和系统的准确性和稳定性,确保数据的一致性和完整性。
此外,还需要对采集到的数据进行清洗和校验,剔除无效数据,以提高数据质量。
1.3数据平台的建设为了实现数据集中存储和共享,烟草企业需要搭建适应其特点的数据存储和管理平台。
该平台应具备强大的存储和计算能力,能够处理大规模的数据量。
同时,该平台还应具备数据安全和隐私保护的机制,确保敏感数据的安全性。
通过建立这样的数据平台,烟草企业能够更好地整合和管理营销数据,提高数据的利用价值。
2、消费者行为的分析与预测2.1用户画像构建通过对采集到的数据进行统计和分析,烟草企业可以建立消费者的基础画像。
这包括性别、年龄、地区等基本信息。
通过构建用户画像,企业可以更好地了解消费者的特征和需求,为后续的个性化营销提供依据。
例如,根据不同的用户画像,企业可以制定针对不同消费群体的营销策略和推广活动。
2.2消费者需求分析通过结合消费者的购买历史、行为轨迹等数据,烟草企业可以深度挖掘和分析消费者的需求。
烟草行业应用解决方案行业背景烟草行业信息化不断的发展,全国普遍城市的烟草专卖销售公司都陆续采用烟草移动营销稽查系统。
整个系统涉及到订单采集,信息分析预测,组织卷烟生产,组织物流,分配调拨,运输配送,批发零售,稽查人员稽查情况上报。
通过这套系统为烟草公司提供一个简单易用的综合信息移动平台,有效的管理客户基础信息、营销资料和市场动态,及时、准确的采集客户需求信息、库存、卷烟信息和调查资料,改善客户的购烟体验,提升服务质量和客户满意度,从而提高企业竞争力和形象。
适用人员:1.零售商户:为零售商户提供手机订烟、到货确认、销售上报、信息查询、业务投诉、VIP信息等服务。
2.业务人员:收集和上报零售商户的库存和销售情况,发送新品信息等。
可采用短信或GPRS上网方式。
3.稽查人员:烟品信息查询(根据卷烟上的喷码,查询产品和物流信息,如香烟生产日期、批次、卷烟零售户订购等信息,并据此辨别产品真伪、防止串货等);专卖证号稽查(查询专卖证号的合法性);专卖稽查上报(在稽查过程中,发现问题即时反馈、上报)。
4.配送人员:配送指令(随时接收烟草公司的配送指令短信,了解最新的配送目的地和配送路线);配送上传(配送到零售户后,上传配送信息和确认短信)。
专卖市场巡查平台专卖手持管理系统为专卖稽查人员提供了一个先进的工具,同时结合手机定位技术提高了烟草内部管理的效率。
专卖稽查工作人员日常走访市场时,可应用智能手持平台进行日常业务处理,日常处理的数据如:巡查的记录、登记保存单、勘验笔录等等数据可以实时保存到后台数据库中,而且对于专卖稽查人员在现场的执法的过程中提供详实的资料支持,比如:该零售户的销售记录、历史案件记录、历史巡查记录等等。
而后台管理人员可以通过后台系统实时的看到市场的巡查的结果,巡查的内容以及相关巡查人员的历史轨迹。
平台组成1、具备GPS定位功能的智能手机系统(windows mobile 6.0)2、成熟稳定的无线网络系统3、后台应用系统4、便携式票据打印机功能界面1、系统登陆系统通过每一个巡查员工的数据登录系统,使用各个功能模块2、市场巡查系统可以通过许可证号码或者店名地址等信息实现模糊查询,查询出当前巡查客户的详细业务、专卖等相关资料信息,为市场巡查人员稽查提供数据上的支持。
烟草-行业数据综合分析应用解决方案第一篇:烟草-行业数据综合分析应用解决方案烟草专卖管理局数据综合分析应用解决方案xxxx电子科技有限公司2013年7月目录一、建设背景 (3)二、建设思路 (3)三、建设目标 (3)四、总体设计 (4)4.1、设计原则...................................................4 4.2、设计思路...................................................5 4.3、总体架构 (6)五、系统实现 (6)5.1、整合内容...................................................6 5.2、采集处理方式.. (7)5.2.1、数据采集..............................................7 5.2.2、数据整合..............................................9 5.3、数据应用..................................................15 5.3.1、应用定制.............................................15 5.3.2、数据展现.............................................21 5.3.3、应用主题数据.........................................21 5.4、主要功能..................................................22 5.4.1、数据来源管理.........................................22 5.4.2、主题和指标管理.......................................22 5.4.3、报表定制.............................................23 5.4.4、图表定制.............................................23 5.4.5、热点定制.............................................23 5.4.6、连接资源管理.........................................23 5.4.7、页面定制.............................................23 5.4.8、用户及角色管理 (24)六、系统价值.......................................................24 5.1、企业报表..................................................24 5.2、主题分析..................................................25 5.3、运营监控.. (25)七、成功案例.......................................错误!未定义书签。
护航烟草行业数字化转型——中孚数据安全一体化解决方案烟草行业作为国民经济体系中重要的组成部分之一,加快推进行业数字化转型,充分发挥数据价值对行业发展的叠加作用,是烟草行业实现高质量发展,有力支撑国民经济的重要举措。
当前,烟草行业已经形成了业务横线联通、上下级纵向贯通的基础现状。
但随着数字化转型的深入推进,数据交换共享需求激增,进一步加大了行业敏感数据及个人隐私数据泄露的安全风险。
因此,在安全合规的前提下,推进数据治理与应用,已成为烟草行业的重要任务。
2023年初,“全国烟草行业网络安全和信息化工作会议”在湖南长沙召开,会议指出“要切实筑牢行业大安全屏障,增强平台安全防控,突出数据安全保护,注重信创技术应用,强化网络意识形态安全,实现行业高质量发展和高水平安全的良性互动”,再次强调了确保数据安全的重要性。
全维度、全周期、全场景的数据安全设计思路()以国家监管要求、行业标准规范、行业业务特性为基础,以满足合规监管要求及切实提升数据安全能力为目标,针对业务开发、业务测试、业务运维、业务应用、共享交换、要素流通等业务场景,综合考虑组织、制度、技术、人员等多维度影响因素,覆盖数据采集、存储、传输、处理、交换、销毁全生命周期,通过管理体系保障、数据安全评估、安全策略规划、数据安全防护、数据安全运营5个关键步骤的实施,体系化完善数据安全建设并形成持续优化的安全能力。
“1+4+X”数据安全总体框架中孚信息“1+4+X”数据安全架构:从数据安全治理角度出发,以业务系统的重要数据资产为核心,通过厘清数据资产,研判数据及其在流动过程中的风险问题,优化数据安全组织体系和管理体系,建立“端管边云脑”数据安全体系,实施全生命周期防护,并以防护与监管一体化为目标,打造数据安全态势感知平台,叠加数据安全运营服务,对数据安全态势全面监控、安全威胁实时预警、安全事件及时处置,最终建成自适应的数据安全体系,达到数据可见、风险可控、安全可护、资产可管的安全效果。
烟草行业烟草数字化解决方案第一章数字化战略规划 (2)1.1 数字化背景分析 (2)1.1.1 国际形势 (2)1.1.2 国内形势 (2)1.2 数字化发展目标 (3)1.2.1 提高生产效率 (3)1.2.2 提升产品质量 (3)1.2.3 优化营销策略 (3)1.2.4 提高创新能力 (3)1.3 数字化战略制定 (3)1.3.1 组织架构调整 (3)1.3.2 技术研发投入 (3)1.3.3 产业链协同 (3)1.3.4 数字化基础设施建设 (3)1.3.5 人才培养与培训 (3)1.3.6 政策支持 (3)第二章烟草种植数字化 (4)2.1 种植基地数字化建设 (4)2.2 农业物联网技术应用 (4)2.3 农业大数据分析 (4)第三章烟草生产数字化 (4)3.1 生产流程自动化改造 (4)3.2 设备管理与维护数字化 (5)3.3 质量管理与追溯系统 (5)第四章烟草销售数字化 (5)4.1 渠道管理与优化 (6)4.2 电商平台构建 (6)4.3 销售数据分析与预测 (6)第五章烟草供应链数字化 (7)5.1 供应链协同管理 (7)5.2 物流与仓储数字化 (7)5.3 供应链金融解决方案 (7)第六章烟草品牌数字化 (8)6.1 品牌形象数字化推广 (8)6.2 社交媒体营销 (8)6.3 数字化品牌体验 (9)第七章烟草行业数据治理 (9)7.1 数据资源整合 (9)7.1.1 资源整合背景 (9)7.1.2 整合策略 (9)7.1.3 整合效果 (10)7.2 数据质量管理 (10)7.2.1 质量管理意义 (10)7.2.2 管理方法 (10)7.2.3 管理效果 (10)7.3 数据安全与合规 (10)7.3.1 安全与合规背景 (10)7.3.2 安全与合规措施 (10)7.3.3 安全与合规效果 (11)第八章烟草行业数字化人才建设 (11)8.1 人才培养与引进 (11)8.2 数字化团队建设 (11)8.3 数字化素养提升 (12)第九章烟草行业数字化创新 (12)9.1 新技术应用摸索 (12)9.2 创新模式实践 (13)9.3 创新成果转化 (13)第十章烟草行业数字化监管与合规 (13)10.1 监管政策与法规 (13)10.2 数字化监管体系建设 (14)10.3 合规风险防控 (14)第一章数字化战略规划1.1 数字化背景分析信息技术的飞速发展,数字化转型已成为推动企业创新与发展的关键驱动力。
档编号:001版本号:密级:数据中心及决策支持系统解决方案xxxxxx有限公司目录第1部分前言 (4)1.1 背景 (4)1.2 文档目的 (4)1.3 文档主要内容 (4)第2部分中烟业务分析与系统目标 (6)2.1 中烟现状分析 (6)2.2 中烟数据中心及决策支持系统目标分析 (6)第3部分中烟数据中心及决策支持系统规划 (8)3.1 系统平台建设原则分析 (8)3.2 系统建设步骤 (9)第4部分中烟数据中心及决策支持系统整体解决方案 (10)4.1 系统总体架构图 (10)4.2 系统总体架构说明 (11)4.3 系统体系结构特点 (12)4.4 系统技术重点 (13)4.4.1数据抽取 (13)4.4.2数据存储与管理 (13)4.4.3数据的分析与表现 (14)4.4.4元数据管理 (14)4.5 业务内容 (15)4.5.1存货分析主题 (17)4.5.2采购分析主题 (18)4.5.3主界面规划 (18)4.5.4业务界面规划 (18)4.5.5详细界面规划 (19)4.5.6高级分析规划 (20)4.5.7实现方式 (21)4.6 产品配置说明 (22)4.6.1数据整合(ETL) (22)4.6.2数据存储 (23)4.6.3数据分析与表现 (23)4.6.4权限控制 (23)4.6.5系统操作界面 (24)4.6.6报告样例 (25)第5部分中烟数据中心及决策支持系统项目实施管理方案 (27)5.1 实施框架及规范参考 (27)5.1.1项目管理 (27)5.1.2数据仓库建设方法论 (28)5.1.3项目实施框架 (29)5.2 项目进度 (29)5.3 项目管理方法 (31)5.3.1成立项目组 (31)5.3.2项目实施计划的制定方法 (33)5.3.3项目进度检查流程 (34)5.3.4质量管理 (34)5.3.5风险管理 (35)5.3.6项目变更管理 (36)5.3.7工程移交 (37)5.4 验收和测试 (38)5.4.1系统功能测试内容 (38)6.5.2系统性能测试内容 (39)5.5 售后服务 (40)5.5.1技术支持计划 (40)5.5.2技术支持方式 (41)5.5.3设备技术文档 (42)5.6 培训计划 (44)5.7 机房场地及环境准备 (44)6.5.1设备工艺要求 (44)6.5.2机房环境要求 (46)第6部分附录 (48)6.1 公司介绍 (48)6.2 成功案例 (48)第1部分前言1.1背景随着国家烟草专卖局行业改革发展战略的稳步推进,烟草企业通过联合、重组和兼并等方式逐步做大做强,行业组织体制构架呈现出明显的整体化和集中化趋势。
烟草行业数字化转型的主要问题与解决方法摘要:烟草行业作为国民经济的重要组成部分,也在积极推进行业数字化转型,并以行业数字化转型战略为主线,进一步明确“新动能、新手段、新支撑”工作定位和“转思维观念、转驱动方式、转技术架构、转工作模式”基本思路,大力推动数字技术与烟草产业深度融合,加快产业数字化,激活数据要素潜能,助力畅通烟草经济循环,推动构建现代化烟草经济体系。
关键词:烟草行业;数字化转型;主要问题;解决方法1烟草商业企业推动数字化转型的重大意义近年来,互联网、大数据、云计算、人工智能、区块链等技术加速创新,日益融入经济社会发展各领域全过程,数字经济发展速度之快、辐射范围之广、影响程度之深前所未有,数字经济已成为第四次工业革命最重要的特征,成为世界各国重组全球要素资源、重塑全球经济结构、改变全球竞争格局的关键力量。
习近平总书记强调,要站在统筹中华民族伟大复兴战略全局和世界百年未有之大变局的高度,统筹国内国际两个大局、发展安全两件大事,充分发挥海量数据和丰富应用场景优势,促进数字技术与实体经济深度融合,赋能传统产业转型升级,催生新产业新业态新模式,不断做强做优做大我国数字经济。
烟草行业深刻认识发展数字经济的重大意义,提出了要认清数字经济发展新趋势,找准数字经济发展新机遇,推进实施数字化转型战略,以全国烟草生产经营管理一体化平台建设为抓手,通过数字化推动产业升级,开拓行业发展新局面,既符合中央战略要求,也是行业把握新一轮科技革命和产业变革的主动选择。
烟草商业企业是烟草产业链中的重要一环,上承工业企业,下接零售客户和消费者,是烟草经济最为活跃的部分,在当今数字经济时代,抢抓数字经济发展机遇,加快构建现代烟草经济体系,已成为行业发展的必然要求,烟草商业推动全面数字化转型已势在必行、时不我待。
2烟草行业数字化转型的主要问题从目前烟草行业数字化、信息化水平来看,大部分企业的信息化技术仍然主要停留在文字处理、财务管理、人力资源、物资采购以及办公自动化层面,而对于前沿的大数据、云计算、区块链等数字化技术了解程度、应用程度偏低。
烟草行业解决方案篇一:烟草行业运营方案烟草行业解决方案目前国内卷烟市场总体是一个生产能力饱和的市场,掌握企业的内部动态的生产、财务和管理等信息,是企业做出正确决策的关键。
国内各烟草企业的原材料类型基本相似,加工机械设备水平基本相近,烟草加工工艺也基本一致。
虽然质量保证活动贯穿于卷烟企业的整个生产过程,但仍停留在对成品检验、对结果控制与回馈的阶段,对制品质量管理和过程控制的水平能力较低,对设立的质量目标要求不高,通常出了问题才着手解决,绝大部分质量问题由质量管理的专业人员来处理,而且损失比较严重而无法挽回。
因此利用信息技术进行辅助提高加工的自动化和控制水平是各烟草企业面临的一个重大问题。
一、烟草企业实施MES管理的必要性和可行性MES是美国管理界90年代提出的,全称为Manufacturing Execution System,译成制造执行系统。
制造执行系统协会给出定义:MES能通过信息传递,对从订单下达到产品完成整个生产过程进行优化管理。
当工厂里面有实时事件发生,能对此及时做出反应,MES能够减少企业内部没有附加值的活动,有效知道工厂的生产运作过程,从而使其既提高工厂及时交货能力、改善物料的流通性能,又提高生产刨报率。
MES还通过双向的直接通讯在企业内部和整个产品供应链中提供有关产品行为的关键任务信息。
1、烟草企业实施MES的必要性。
随着外国烟草进入中国市场,国内烟草行业面临国外大型烟草集团的竞争日趋激烈。
国产烟不能再以垄断利润取胜,国内烟草企业的规模和行业市场集中度与国际卷烟品牌相比差距较大,而且由于地方保护普遍对省内市场依赖度过高,在境外的销售量很小,在这种情况下,烟草食业如何加强对产品质量的控制,最大程度上降低成本、扩大市场是立于不败之地的重点。
实现异地加工、多点生产是绝大部分卷烟品牌规模扩张的必由之路,但如何处理好品牌输出与输入方的利益关系、保证产品质量的稳定、防止出现大的市场波动,当前在技术、管理和政策方面都有许多需要继续探索和改进的地方。
烟草专卖管理局数据综合分析应用解决方案xxxx电子科技有限公司2013年7月目录一、建设背景 (3)二、建设思路 (3)三、建设目标 (3)四、总体设计 (4)4.1、设计原则 (4)4.2、设计思路 (5)4.3、总体架构 (6)五、系统实现 (6)5.1、整合内容 (6)5.2、采集处理方式 (7)5.2.1、数据采集 (7)5.2.2、数据整合 (9)5.3、数据应用 (15)5.3.1、应用定制 (15)5.3.2、数据展现 (21)5.3.3、应用主题数据 (21)5.4、主要功能 (22)5.4.1、数据来源管理 (22)5.4.2、主题和指标管理 (22)5.4.3、报表定制 (23)5.4.4、图表定制 (23)5.4.5、热点定制 (23)5.4.6、连接资源管理 (23)5.4.7、页面定制 (23)5.4.8、用户及角色管理 (24)六、系统价值 (24)5.1、企业报表 (24)5.2、主题分析 (25)5.3、运营监控 (25)七、成功案例........................................ 错误!未定义书签。
7.1、河北省省级卫生数据整合共享和综合信息管理平台错误!未定义书签。
7.2、国药乐仁堂信息采集整合展现管理平台......... 错误!未定义书签。
八、公司及产品优势.................................. 错误!未定义书签。
8.1、公司优势................................... 错误!未定义书签。
8.2、产品特色................................... 错误!未定义书签。
一、建设背景近几年,中国烟草行业信息化飞速发展,各个企业目前己经基本完成了基础设施建设和业务系统建设,如营销系统、专卖系统、物流系统、财务系统、0A系统等。
这些信息系统之间相对独立,缺乏有机联系,形成了信息孤岛,无法做到信息资源的共享,进而影响了许多正常业务的效率。
由于各单位前期在实施信息系统过程中分别采用了各自的系统标准,因而导致了现有各信息系统之间很难做到“无缝连接”,并且在各系统间存在大量的“手工连接”,进而造成大量的信息失真和信息延时,这种情况还对信息管理部门增加了很多工作量,每天为数据而忙碌。
同时各业务系统侧重于业务处理,不能进行充分的价值挖掘,缺乏为企业领导或业务处室的综合分析、宏观决策提供有力支持。
因此,在烟草企业数据综合分析应用系统的建设与完善就显得尤为重要。
二、建设思路三、建设目标通过建立烟草数据综合分析应用系统,实现收集目前的营销系统、专卖系统、物流系统、财务系统、0A系统等以及其他业务系统的相关数据,并对数据进行整合,加工形成涵盖管理、采购、客服、物流、质管、运营、财务七大领域的信息域,并对信息进行多维度的综合展现,提供各业务所需的综合报表,从而充分挖掘利用现有信息资源,为领导提供决策支持,并更好的为各业务科室和一线业务人员服务。
四、总体设计4.1、设计原则本项目在系统设计、软硬件采购、应用开发、系统集成和服务过程中应采用已有的国家标准、行业标准和主流国际标准,遵循但不仅限于下列标准体系和要求:《烟草行业信息化标准体系》及其有关标准《烟草行业信息化建设统一技术平台要求》《烟草行业数字证书应用接口规范》《烟草行业信息系统安全等级保护定级指南》国家《SOA标准体系》除了遵循上述标准,在整个项目设计开发过程中,需要遵守下面的5项原则。
1. 技术的先进性➢系统应采用先进成熟的技术,以保证投资的有效性和延续性。
➢支持常用的操作系统平台、常用的数据库系统、常用的应用服务器平台和常用的开发工具,与XX烟草现有系统互联互通,以保证系统的兼容性。
2. 系统的稳定性➢保证系统能够正常运作, 系统应能够7×24小时连续稳定工作。
➢软件版本升级或改进应在不影响业务的情况下进行,保证系统可以稳定、平滑过渡。
3. 系统可维护性➢系统应能使系统管理员集中方便地配置、监视、控制、诊断整个系统,并且能够监视和控制用户情况、提高效率、消除隐患。
➢对于系统各功能模块的配置、控制、监视、诊断等工作能够通过专用的系统管理工具方便的进行,无须进行专门的编码工作。
➢数据中心系统将按照集中的模式进行部署,因此对系统处理并发任务的能力提出了很高的要求,投标方需要提供大规模并发流量的处理机制以及发生性能问题时的解决方案;并提供实时交易量(并发交易量及其硬件配置)和并发用户量(并发用户数及硬件配置)的相关测试报告和案例说明;4. 系统安全性➢系统应保证信息的安全性,即保证此系统中的信息能够安全存储,并有良好的数据备份和快速恢复方案;➢采用分级的安全体系,保证数据在处理和传输全过程的安全性。
系统支持对关键的信息(如:用户密码)进行加密保存,同时支持对一些比较重要的业务数据在传送和存储过程中进行加密保护;➢保证系统中的信息不被非授权用户访问,按组织结构划分操作人员的操作权限,使用烟草办公自动化系统的用户身份认证系统,且各种使用权限所能调用的应用软件模块可按要求灵活配置;➢系统在身份认证方面支持多种的认证手段,如:口令认证、数字证书认证等;➢系统支持基于角色和基于资源的授权方式,支持用户到角色的映射,并采用角色的身份来控制对特定操作的访问权,支持层次化,结构化和区域化的角色设定;➢系统需要有对系统数据的关键操作(如授权操作、流程环节变更)进行追踪和回溯的能力;4.2、设计思路1、模块化的系统结构系统结构采用三层(3-tier)或多层(N-tier)设计模型;设计模式为B/S 模式。
由合理分划、边界清晰的子系统和模块组成,形成组装式、插件式的体系结构,以利于系统的升级、扩充和发展。
支持业务流程的可调整性;支持业务信息的可调整性和延续性。
2、面向服务的整体架构(SOA)系统模块都是向系统内部和外部提供服务的逻辑单元;采用标准的协议提供服务。
采用松耦合的机制与外部系统进行信息交换和系统之间的互操作。
3、无缝集成的应用提供与其他相关信息系统的数据接口、支持开放的XML 标准接口规范。
不同的异构系统之间可以无缝地实现数据集成,也可以无缝地实现业务流程的集成。
4.3、总体架构系统基于SOA设计理念,架构信息采集、整合、展现信息系统,为增值服务管理奠定总体架构基础,并以“服务”方式,扩展将来主题业务数据分析、服务系统。
五、系统实现5.1、整合内容数据来源主要为营销系统、专卖系统、物流系统、财务系统、0A系统以及其他业务系统。
5.2、采集处理方式5.2.1、数据采集5.2.1.1、功能设计通过整合完善数据采集系统,更加高效的接收和处理来自各系统的数据,实现数据采集工作的灵活设置和快速部署,使数据采集工作更专业化和规范化,减轻数据提供单位的负担,提高数据采集效率和质量。
支持基于事件发生时接收数据消息、支持数据库改变时数据同步、支持定时提取数据、支持外部文件导入、支持异地全局数据库。
并且支持基于消息的数据传输,在前置机感知数据改变后,通过WebService机制项服务器传递消息;支持通过各类数据传输中间件进行消息的传递。
数据采集方式包括:自动采集、定时采集。
自动采集是指通过系统接口,自动实时从数据源采集数据,适用于实时性要求较高的数据信息。
定时采集是指在设定好的时间点对数据源数据进行采集,适用于数据源有规范的数据传输技术架构。
数据审核:在数据加载到数据库前对采集的数据的格式及数据内容进行校验和审核,保证数据采集平台采集的数据质量。
自动采集:支持自动采集和定时采集方式,实现采集系统自动获取数据源数据的功能。
数据加工处理:包括数据信息清洗、信息转换、信息加载等功能,将从数据源获取过来的数据进行规范化处理,实现多源数据组合、冲突数据处理、数据格式检查等功能。
并将其转换成数据仓库需要的格式。
数据加载功能是将经过规范化处理后的数据存放到数据仓库中。
需要定义数据的加载频率和加载方式。
数据的加载频率根据数据的产生频率和数据仓库对数据的分析粒度决定,可以根据需要来定义加载的间隔。
采集平台系统功能结构如下图:5.2.1.2、技术实现1、技术架构通过各种采集方式把现有各部门、企业的诸多系统通过数据交换平台抓取进入数据中心,并可以通过业务报表填报的功能补充信息,支持暴扣文档、多媒体、XML、文件以及数据库等多种方式的数据采集。
2、数据接口本系统采集通过建立数据口的方式与现有的营销系统、专卖系统、物流系统、财务系统、0A系统以及其他业务系统进行数据采集,并将采集数据进行审核与加工处理。
与此同时考虑到与新系统的整合,系统将预留数据交互模块并建立数据交换机制,为新业务系统的接入提供准备。
5.2.2、数据整合利用完善的ETL工具,通过节点控制库、信息共享与管理库把采集来的数据按照业务内在关联形成能够表述完整业务链信息的整合信息,并为下一步的数据应用打定基础。
5.2.2.1、技术架构1、ETL工具介绍ETL负责将分散的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。
ETL是数据仓库中的非常重要的一环。
它是承前启后的必要的一步。
相对于关系数据库,数据仓库技术没有严格的数学理论基础,它更面向实际项目应用。
所以从项目应用的角度来考虑,按着物理数据模型的要求加载数据并对数据进行一些系列处理,处理过程与经验直接相关,同时这部分的工作直接关系数据仓库中数据的质量,从而影响到联机分析处理和数据挖掘的结果的质量。
ETL的质量问题具体表现为正确性、完整性、一致性、完备性、有效性、时效性和可获取性等几个特性。
而影响质量问题的原因有很多,由系统集成和历史数据造成的原因主要包括:业务系统不同时期系统之间数据模型不一致;业务系统不同时期业务过程有变化;旧系统模块在运营、人事、财务、办公系统等相关信息的不一致;遗留系统和新业务、管理系统数据集成不完备带来的不一致性。
实现ETL,首先要实现ETL转换的过程。
它可以集中地体现为以下几个方面:空值处理:可捕获字段空值,进行加载或替换为其他含义数据,并可根据字段空值实现分流加载到不同目标库。
规范化数据格式可实现字段格式约束定义,对于数据源中时间、数值、字符等数据,可自定义加载格式。
拆分数据:依据业务需求对字段可进行分解。
验证数据正确性:可利用Lookup及拆分功能进行数据验证。
数据替换:对于因业务因素,可实现无效数据、缺失数据的替换。
Lookup 查获丢失数据 Lookup实现子查询,并返回用其他手段获取的缺失字段,保证字段完整性。
建立ETL过程的主外键约束对无依赖性的非法数据,可替换或导出到错误数据文件中,保证主键唯一记录的加载。