阿里云大数据产品服务及解决方案66页PPT
- 格式:ppt
- 大小:6.51 MB
- 文档页数:5
阿里云大数据解决方案阿里云“数加平台”提供了大量的大数据产品,包括大数据基础服务、数据分析及展现、数据应用、人工智能等产品与服务。
这些产品均依托于阿里云生态,在阿里内部经历过锤炼和业务验证,可以帮助组织迅速搭建自己的大数据应用及平台。
奥远电子作为阿里云辽宁区授权服务中心,可为用户提供专业、高效和本地化的服务,包括运维、产品咨询、备案咨询、解决方案和架构搭建等一体化等,同时旨在帮助本地政府部门和企事业单位、个人了解云计算,使用阿里云服务,为用户提供网络、服务和计算资源等,从而减轻用户因业务量骤增而带来的IT压力,助力轻松上云。
基础产品:大数据计算服务(MaxCompute,原名ODPS)是一种快速、完全托管的GB/TB/PB级数据仓库解决方案。
MaxCompute为您提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决海量数据计算问题,有效降低企业成本,并保障数据安全。
分析性数据库(AnalyticDB)是阿里巴巴自主研发的海量数据实时高并发在线分析(Realtime OLAP)云计算服务,使得您可以在毫秒级针对千亿级数据进行即时的多维分析透视和业务探索。
分析型数据库对海量数据的自由计算和极速响应能力,能让用户在瞬息之间进行灵活的数据探索,快速发现数据价值,并可直接嵌入业务系统为终端客户提供分析服务。
数据集成(Data Integration)是阿里集团对外提供的可跨异构数据存储系统的、可靠、安全、低成本、可弹性扩展的数据同步平台,为20+种数据源提供不同网络环境下的离线(全量/增量)数据进出通道。
核心解决方案介绍:(一)个性化推荐根据用户的兴趣特点和购买行为,推荐用户感兴趣的信息和商品。
建立在海量数据挖掘基础之上,为用户提供完全个性化的决策支持和信息服务。
业务需求:1.研发成本高:对于一些中小企业,想做自己的个性化推荐业务,但是不知道如何收集数据,而且搭建和使用算法的成本较高,需要算法团队、算法框架等。
目录大数据产品框架数据计算平台数据加工与分析服务与应用引擎大数据应用场景记录 统计大规模计算GB计算复杂程度数据量TBPB网站独立数据 集市论坛小型电商小型EDW BI/DWMPP淘宝支付宝 CRMERPHPC语言识别影音识别图像识别关系网络图像比对 行为DNA刷脸精准广告大数仓消费预测征信搜索排序EB深度学习大数据产品框架应用加速器分析引擎 推荐引擎 兴趣画像分类预测规则引擎 标签管理ID-Mapping计算引擎数据加工和分析工具离线计算 流计算 数据开发 ETL 开发调度系统机器学习分析型数据库数据可视化工具数据采集CDP (离线)数据服务和应用引擎数据管理数据 地图数据 质量智能 监控阿里云大数据集成服务平台是阿里巴巴集团统一的大数据平台,提供一站式的大数据开发、管理、分析挖掘、共享交换解决方案,可用于构建PB 级别的数据仓库,实现超大规模数据集成,对数据进行资产化管理,通过对数据价值的深度挖掘,实现业务的数据化运营。
目录大数据产品框架数据计算平台数据加工与分析服务与应用引擎大数据离线计算服务 MaxCompute离线计算流计算分析型数据库大数据计算服务(MaxCompute ,原ODPS)是由阿里巴巴自主研发的大数据产品,支持针对海量数据(结构化、非结构化)的离线存储和计算、分布式数据流处理服务,并可以提供海量数据仓库的解决方案以及针对大数据的分析建模服务,应用于数据分析、挖掘、商业智能等领域。
存储易用安全计算●支持TB 、PB 级别数据存储 ●支持结构化、非结构化数据存储●集群规模可灵活扩展,支持同城、异地多数据中心模式●支持海量数据离线计算●支持分布式数据流式处理服务 ●支持SQL 、MR 、Graph(BSP)、StreamSQL 、MPI 编程框架 ●提供丰富的机器学习算法库●支持以RESTful API 、SDK 、CLT 等方式提供服务●不必关心文件存储格式以及分布式技术细节●经受了阿里巴巴实践检验●数据存储多份拷贝 ●所有计算在沙箱中运行MaxCompute 的优势和能力高效处理海量数据1、跨集群技术突破,集群规模可以根据需要灵活扩展,支持同城、异地多数据中心模式2、单一集群规模可以达到10000+服务器(保持80%线性扩展)3、不保证线性增长的情况下,单个集群部署可以支持100万服务器以上4、对用户数、应用数无限制,多租户支持500+部门5、100万以上作业及2万以上并发作业安全性1、所有计算在沙箱中运行2、多种权限管理方式、灵活数据访问控制策略3、数据存储多份拷贝易用性1、开箱即用2、支持SQL、MR、Graph、流计算等多种计算框架3、提供丰富的机器学习算法库4、ODPS支持完善的多租户机制,多用户可分享集群资源自主可控经过实践验证1、阿里巴巴自主研发2、整套平台经受了阿里巴巴超大规模数据应用的实践验证离线计算流计算分析型数据库离线计算流计算分析型数据库自主可控•使用Hadoop组件开发受制于开源社区,最多只能维护一个分支•开源社区组件太多,版本问题,打包问题,升级维护成本太高Hadoop核心技术架构发展缓慢•一些技术阿里要比开源社区更早实现(如分布式文件系统多master实现等)没有一个Hadoop发行版可以满足阿里巴巴的业务场景•如异地多数据中心、数据安全性等要求Hadoop社区分化严重,发展状况有隐忧当前Yahoo、Facebook等公司使用的都是自己的私有版本流计算 StreamCompute离线计算流计算分析型数据库●阿里云流计算(StreamCompute)是一个通用的流式计算平台,提供实时的流式数据分析及计算服务●整个数据处理链路是进行压缩的,链路是即时的,完全以业务为中心,数据驱动解决用户实际问题实时ETL 监控预警实时报表实时在线系统对用户行为或相关事件进行实时监测和分析,基于风控规则进行预警用户行为预警、app crash预警、服务器攻击预警数据的实时清洗、归并、结构化数仓的补充和优化实时计算相关指标反馈及时调整决策内容投放、无线智能推送、实时个性化推荐等双11、双12等活动直播大屏对外数据产品:数据魔方、生意参谋等低延时高效流数据处理,根据不同业务场景的时效性需要,从数据写入到计算出结果秒级别的延迟高可靠●底层的体系架构充分考虑了单节点失效后的故障恢复等问题,可以保证数据在处理过程中的不重不丢, Exactly-Once 语义保证●通过定期记录的checkpoint数据,自动恢复当前计算状态,保证数据计算结果的准确性可扩展计算能力和集群能力具有良好的可扩展性,用户可以通过简单的增加Worker节点数量的方式进行水平扩展,可以支持每天PB级别的数据流量开发方便●SQL支持度高:标准SQL,语义明确,门槛低,只需要关心计算逻辑,开发维护成本低●完善的元数据管理:SQL天然对元数据友好,SQL优化支持离线计算流计算分析型数据库功能特性BI分析的发展方向离线计算流计算分析型数据库分析型数据库概述离线计算流计算分析型数据库分析型数据库(Analytic DB),是一套实时OLAP(Realtime-OLAP)系统。