BW知识点1
- 格式:docx
- 大小:28.98 KB
- 文档页数:8
1基本概念1.1 BExShort for Business Explorer. It includes following tools to present the reports to end user: Analyzer / Web Application Designer / Report Designer / Web Analyzer.1.2InfoProviderInfoProvider,信息提供者。
在创建qury之前,我们需要指定一个InfoProvider。
这个InfoProvider主要是为当前所要创建的报表提供数据来源。
在query中,一般作为的InfoProvider的对象为:InfoCubes、DataStore Objects、InfoObject(这里仅仅指的是特征)。
除了这些物理存储对象外,它还可以为:InfoSets、Virtual Providers、Multiproviders等逻辑视图物理存储类型的存储对象。
然而,在wad的创建中,提供数据的InfoProvider为我们创建的query。
在wad中,可以将多个query作为提供者。
例如:对于报表,我可以将query A1作为提供者,然而对于图表我可以把query B1作为提供者。
但是query的提供者有且仅有一个。
1.3INFOOBJECT信息对象/CHARACTERISTICS特征/KEYFIGURE关键值infoobject特征跟关键值合并起来称之为信息对象。
在BI中,项目定义、工作分解结构(WBS要素)、计量单位、日期等都称之为特征(characteristic);例如电压等级、承建单位等都称之为属性(当然,这些也是特征);每个项目产生的各种金额,如:可研估算、初设概算、下达预算、实际成本等都称之为:关键值(key figure)。
1.4INFO OBJECT的命名规则SAP在BCT(BUSINESS CONTENT)中自带一些InfoObjects,这些标准INFOOBJECTS的技术名称则是以’0’开头,如果自定义的,技术名称则必须以’A~Z’开头,长度3~9个字符。
BW知识点总结及⾯试要点1.如何理解数据仓库?数据仓库是⼀个⾯向主题的,集成的,相对稳定的,反应历史变化的数据集合,⽤于⽀持管理决策。
2.OLAP 和 OLTP的基本概念和区别?Oltp 联机事务处理,就是我们通常所说的关系型数据库,记录了实时的增删改查数据。
Olap 联机分析处理,是数据仓库的核⼼,是对oltp的历史数据进⾏加⼯,分析处理,⽤于处理商业智能,决策⽀持等重要的决策信息。
区别:1.oltp 是明细的数据,olap 是汇总数据2.oltp 记录实时的数据,olap 包含2-3年历史数据3.oltp 可以进⾏增删改查操作,olap 只⽀持查询。
3.Bw中数据存储的最⼩单位是什么?他分为哪⼏种。
哪⼀个⽤来存放主数据,主数据分类?最⼩单位:infoobject分类:特征和关键值,特征存放主数据,分为属性,⽂本和层级。
4.什么是bw星形结构,与传统星形结构有什么区别?Bw星形结构:中间⼀张事实表,周围连接维度表,维度表中存放了主数据sid,通过主数据sid连接到主数据的属性表,⽂本表和层级表。
区别:传统星形结构维度表中存放了维度键值属性,bw星形结构中维度表中存放了主数据的sid,通过sid连接到主数据的属性,⽂本和层级,通过sid,可以实现多语⾔⽀持,主数据共享。
5.如何理解bw etl的过程?Bw的etl数据抽取,就是把从r3和外部系统或者⽂件中的数据通过⼀定的转换关系抽取到我们bw端所建的信息⽴⽅体中进⾏分析。
6.ETL的基本操作步骤。
1)创建datatarget(infoobject,dso,infocube)2)创建数据源3)建⽴转换关系4)建infoobject,数据抽取到psa5)建dtp,从psa抽取数据到datatarget7.DSO 与 cube 的区别。
1).从结构上,dso 是⼀张⼆维表,cube 是多维的星形结构2).从数据上,dso存放的明细数据,cube存放汇总的数据dso⽀持覆盖和累加,cube只⽀持累加。
一.Delta增量1.什么是DELTA机制?答:DELTA就是说在第一次load (加载)数据之后,允许下次在load数据的时候只load 还没有load过的数据。
2.不同模块事务数据DELTA加载的操作过程一样吗?答:不一样,MM有MM的DELTA機制,FI有FI的機制。
FI用的处理机制是时间戳,AIE,PULL。
LO用的处理机制是DELTA queue,ABR,PUSH。
3.通用提取的数据来源有哪几种,是否可以DELTA加载?答:TABLE/VIEW,INFOSET,FUNCTION MODULE,可以DELTA加载。
4.什么是增量队列?(delta queue)答:增量队列是新建或已更改数据记录的数据储存形式(上次数据请求以来出现的数据记录)。
从系统收到数据请求时,会使用源系统中的更新流程或录入自动写入增量队列。
package几种更新模式?答:1完全更新2初始化增量流程3增量更新(F,I,D)6.什么是增量更新?答:增量更新仅为源系统中的请求上次加载以来已创建或已更改(或已删除)的数据记录。
7.各个增量流程都支持哪些记录类型?答:后像前像倒象新象。
8.平面文件的增量流程原理是怎么样的?答:如果增量流程使用平面文件,数据不会通过增量队列传输到BI ,而是直接从DATASOURSE 加载到PSA。
平面文件肯定不会用到DELTA queue,因为这是数据源的增量原理。
9.0RECORDMODE 是什么?答:数据状态RECORDMODE:有以下几个值' '在更改记录或添加数据后传输记录状态。
只有在请求相应的前像时,才会将记录直接更新到InfoCube(稍后解释)。
'X' 前像在更改或删除记录前传输记录状态。
所有可以汇总(关键值)的记录属性必须用加/减冲销符号进行传输。
冲销加/减符号由提取器(缺省)或服务 Service API 负责。
这些记录在DataStore 对象的非附加(覆盖)更新中予以忽略。
BW整理Bw简答题:1.业务需求分为三部分:·在bw系统中建⽴相应的模型·在bw系统中完成数据的加载·在bex⼯具中建⽴查询和报表,显⽰数据2.特性,⾃由的区别:·特性放在⾏中和⾃由特性中,没有本质区别·特性放在⾏中,则在报表打开时就会显⽰,是报表的“⾸发阵容”·特性放在⾃由特性中,需要报表⽤户将其拖⼊报表中,才能显⽰3.什么叫处理链?创建运⾏有哪些注意?处理链能⾃动完成数据的加载,为前⾯建⽴的第⼀个模型建⽴处理链注意:在BW7.3版本中,可以输⼊T-code:RSPC后进⼊4.对象的版本有有⼏种,分别是?·D版本,交付版本。
系统刚装好时⾃带都为D版本·A版本,活动版本。
D版本激活后为A版本,只有A版本可存储数据·M版本,修改版本。
激活的业务内容对象被修改,保存但未激活,为M版本。
M版本只是过渡版本5.DSO分为⼏类?·标准DSO;写优化DSO;直接更新DSO6.DSO与InfoCube的⽐较(主键,关键值设置有什么不同)·主键就是所有关键字段的组合·DSO中,主键是Key Field中所有特性的组合在InfoCube中,主键是所有特性的组合·关键值设置⽅⾯DSO默认是覆盖,但可以改为汇总InfoCube只能汇总/doc/8816640942.htmlSet的特点:·只能链接InfoCube,DSO和InfoObject这三种由物理数据存储的InfoProvider ·连接⽅式为Join ·InfoSet可以有内连接,左连接和时间相关数据的临时连接8.虚拟⽴⽅体创建的⽅式:·基于直接访问的DTP·基于BAPI·基于Function Module9.什么时候使⽤虚拟提供者?·需要从SAP源系统获取最新数据·仅偶尔访问少量数据·仅少数⽤户同时使⽤数据库查询10.开放集成器提供什么功能?·提供了从BW系统向其它SAP和Non-SAP系统发送数据的功能。
1.系统内部常用变量:SY-UZEIT: 当前系统时间;SY-INDEX: 当前LOOP循环过的次数SY-TABIX: 当前处理的是internal table 的第几笔SY-TMAXL: Internal table的总笔数2.Tables关键字用来声明 Table Work Area 的数据TABLES: SPFL.SELECT * FROM SPFL.WRITE: SPFL-MANDT, SPFL-CARRID,SPFL-CONNECTION.ENDSELECT.3. Internal Table 的声明3.1 内表格式1TYPES|DATA itab {TYPE|LIKE} tabkind OF {linetype|lineobj}[WITH key] [INITIAL SIZE n].Example:DATA Itab_Company LIKE HASHED TABLE OF Company WITH UNIQUE KEY Name. 3.2 内表格式2DATA: BEGIN OF <internal table> OCCURS <n>,<field 1> TYPE <type1>,[<field 2> TYPE <type 2>,<field 3> TYPE <type 3>,END OF <internal table>.3.3 内表格式3DATA <f> <type> OCCURS <n> [WITH HEADER LINE].4.工作区及内表转换1. 工作区.程序对内表的操作不能直接进行,必须通过一种接口来传输,这个接口就是工作区(Work Area).如果程序需要从关系数据库中取数据到内表各行中,必须先将数据读入工作区,然后把工作区中的数据赋给内表的行.工作区必须具有和内表的行一致或者可相互转换的数据结构.2. 表行头.在创建内表对象的同时可以隐式地定义一个同名工作区.创建了带表头的内表之后,可以认为程序中存在两个数据对象,一个是内表,另一个与内表结构相同的结构体.如果一个语句中,该名称同时代表内表或同名表的工作区,则需要在内表名称之后加“[]”。
.Info Object是BW中最小的存储单位.2.BW中的数据对象有Info Object,Cube,DSO,Info set,Multi-provider,visual provider. 其中IO,Cube,DSO是实际的物理存储对象,Info set和 Multi-provider可以理解成为建立在其他物理存储对象上的视图,是不存储数据滴~~3.接上一点,那为什么要用到Info set和Multi-Provider呢?那要从BEx报表的展现机制来说了.在BEx报表设计中,你只能选取一个Info provider作为数据池来构建你的报表,如果你所需要的数据放在多个Cube或者DSO里面的话,那么你就需要一个工具把这些info provider集合在一起变成一个info provider,这个工具就是info set 或者是 Multi-provider4.还是接着上一点,说得这里别人面你的时候就肯定顺水推舟的问你Info set 和Multi-provider 的区别是什么(俺被面到了~~汗~~),教科书的答案是两者中各info provider的连接方式不一样,info set貌似是内连接~~~~还是不好理解...俺想了一个晚上,得到一个想法 set 连接方式取的是数据的交集,而Multi-provider取的是数据的并集,关于交集和并集是什么,你们去问你们的数学老师~~5.如果没有做过实际的Multi-provider的模型的,如果被问到,其实可以拿个业务来举例,最典型的就是销售计划与实际对比,计划数据放在一个info provider,实际数据放在一个provider,用一个Multi-provider把他们组合起来,其中可以按销售部门key连接,销售员key连接,Item key来连接.6.DSO key figure的转换分为覆盖与合计2种,点detail,双击key figure可以选择7.那么一定要记下DSO与Cube的区别(基本上都会被问到)...Cube的key figure是累加的...而DSO是可以覆盖或者累加的~~8.在构建DSO的时候,如果数据表中有日期类型的字段存在的话,那么你就最好把会计年度变量(0fiscvarnt)的特征放在Key file里面...如果你没有放的话,系统会给你黄色的警告...当然你可以忽略...但是如果忽略了,后果就是在DSO激活数据的时候你会发现激活有错误~~~9.Cube,最大维度16个,去掉系统预先定义的Time,Unit,Request,可以用的有13个.最大key figur数--233,最大Characteristic—24813.有关Cube的优化,可以聚集,分区,压缩. ?(14.流程链的T-code是RSPC15.每一个流程链必须有一个开始流程.没有变式的开始流程没有任何的价值.2 m4 a$ Y! o0 F16.流程链的类别包括加载流程与后续处理,数据目标管理,自动报告代理,常规服务,其他BI流程和自定义流程.6 J( X) n# V/ P6 b: D/ | 7 b& i- Y" W& c% y2 A1 D! L17.收集器流程....管理输入到相同的后继流程的多个流程...相当于交通警察的作用.可以判断替代流程是否满足条件而触发后继流程. ! b' N" `! K6 ~$ a/ p 18.流程链必须激活.19.流程链中的颜色,红,黄,绿.....应该都明白各自的含义.20.与进程,或进程,或异进程都属于收集器流程21.DSO分为标准DSO,写优化DSO,直接更新的DSO. U5 ^0 J. ]+ v' O# M1 s8 |8 v' R5 q22.标准DSO中有一个选项叫做"生成主数据标识"...这是啥玩意呢?他的用法取决于你的DSO 是要拿来干什么的.如果你的DSO是拿来做报表的,那么勾上他是可以提高报表的查询速度.如果你的DSO是拿来存储数据的,那么建议不要勾上,因为系统会自动分配SID给你........貌似是设计用来做报表查询的index吗?/ O" S8 O; ^8 Y2 u% j23.实际的项目大多数喜欢用3层的数据模型,底层是写优化的DSO,记录delta和保证数据与PSA的一致,第二层用标准DSO,第三层用Cube...用level 1的DSO更新level 2的DSO的时候,一般都用SUM的方式.2 S X z8 J$ b3 X' n6 |$ A$ U% ^24.BW做初始化的时候要注意什么呢?业务系统要全面停止,禁止输入任何数据.这个好理解吧今天来说说标准数据源的Delta机制25.所有的Delta数据,在传到BW之前,都会先到Delta Q里面,再从DeltaQ到BW.Delta Q可以用RSA7查看.26.Delta数据从原始表到Delta Q, 有两种方式:对于LO的数据源,是系统将Delta数据push 到Delta Q的,然后在InfoPackage执行的时候,再把数据从Delta Q搬到BW.这就是PUSH 的方式. 对于非LO的数据源,大部分采用time stamp的方式,在InfoPackage执行的时候,系统根据time stamp去源数据表获得delta数据,这些数据被送往Delta Q之后,紧接着就被搬到BW了.这就是所谓的PULL的方式.; c9 n# G) x; Z2 H" X5 R9 s / a9 \" J t6 F) u27.所以总结一下:/ W1 N* [5 W3 K% y8 l0 L: { PULL:当BW端请求数据时,R3端才做出回应,执行相关Function Module,把数据写入delta queuePUSH:数据自动写入delta queue,当BW端请求数据时,直接去delta queue中抽取28.RSA7是查看Delta Q的,但是真实数据不是存在这里的.SMQ1(Out bound Queue)才是存储数据的地方~。
SAP BW 学习笔记版本:V1.3本文是笔者在SAP学习SAP BW期间对所学知识旳整顿但愿对大家学习BW有协助IndexNew Questions ..................................................................................................错误!未定义书签。
Tcode..................................................................................................................错误!未定义书签。
Tcode Collection .....................................................................................错误!未定义书签。
SE16 数据浏览器 ....................................................................................错误!未定义书签。
RSA5与RSA6旳区别? ..........................................................................错误!未定义书签。
InfoObject..........................................................................................................错误!未定义书签。
创立IO旳三种方式 ................................................................................错误!未定义书签。
PM面试分为BW、BO两部分,根据顾问的简历和应聘的岗位所侧重的问题不同。
BW包括基础知识、增量、增强、LO抽取、数据源。
BO包括CR、CR、WEBI、UNI。
一、基础知识技术面试1、BW中的数据对象有Info Object,Cube,DSO,Info set,Multi-provider,visual provider. 其中IO,Cube,DSO是实际的物理存储对象,Info set和Multi-provider可以理解成为建立在其他物理存储对象上的视图,是不存储数据滴2、接上一点,那为什么要用到Info set和Multi-Provider呢?那要从BEx报表的展现机制来说了.在BEx报表设计中,你只能选取一个Info provider作为数据池来构建你的报表,如果你所需要的数据放在多个Cube或者DSO里面的话,那么你就需要一个工具把这些info provider集合在一起变成一个info provider,这个工具就是info set 或者是Multi-provider3、还是接着上一点,说得这里别人面你的时候就肯定顺水推舟的问你Info set 和Multi-provider的区别是什么:info set 连接方式取的是数据的交集,而Multi-provider取的是数据的并集。
4、Info Object是BW中最小的存储单位.5、DSO分为标准DSO,写优化DSO,直接更新的DSO.6、实际的项目大多数喜欢用3层的数据模型,底层是写优化的DSO,记录delta和保证数据与PSA的一致,第二层用标准DSO,第三层用Cube…用level 1的DSO更新level 2的DSO的时候,一般都用SUM的方式.27、建立模型时的导航属性具体含义是什么? 是在做查询的时候用的,过程是这样的,首先在主数据的导航属性里面选择某一个字段,例如物料主数据的物料组设置成了导航属性,然后在INFOCUBE里面还有一个设置导航属性的地方,这里就是该INFOCUBE里面全部特性的导航属性的和(如果在特性里面没有选择导航属性,在INFOCUBE里面也找不到),在INFOCUBE也选中该属性为导航属性后,物料组就可以作为物料的一个导航属性存在了,在做查询的时候,物料组(在特性里面物料的下拉菜单中就会出现)就可以成为一个查询条件了或者做其他限制了。
8、导航属性如何操作?导航属性3步,1,首先不是仅属性,2,打开导航属性开关,并写描述,3,在cube中打钩。
9、DSO中生成sid选项有何作用?DSO用于BEx报表时速度更快。
10、如果DSO的key不够用怎么办?dso的key最多是16个,如果一个表中的key超过16个了,可以把key合并,比如:key1(10)、key2(6),可以建一个长度是16的key,把两个字段上述到一个字段里。
一般dso中很少用到,在cube中最多有13个维度,在cube 中可以把两个dimension id合并成一个dimension id;11、SET UP表放什么数据?信息包中什么用到SET UP表?SET UP表里放Init(初始化)之前的所有数据。
因此FULL和Init(初始化)都要经过SET UP表。
所以信息包里,的F 和I用到SET UP表。
12、两个数据源一个全量、一个增量,上层怎样架构?13、你是怎么理解性能调优的?CUBE优化包括压缩,分区,聚集和查询优化。
14、INFOCUBE中的压缩原理及优缺点?优点:合并请求号,把数据合并在一起,这样,运行速度快,节省空间。
缺点:无法按照请求号删除数据,因为合并后,请求号就没有了。
15、CUBE压缩后有几张表。
(cube有几张表)?两张表,一个是F表,一个是E表。
压缩后的数据放在E表中。
激活后CUBE就会有很多表了,维表啊,SID表啊等等。
16、多立方体虚拟立方体信息集3者区别?17、RSA5, RSA 6, RSA 7各代表什么意思?RSA 5:显示Delivery版本的BI CONTENT,可以激活BI CONTENT。
RSA 6:显示Active版本的BI CONTENT。
后台处理数据源事务码。
RSA 7:用来查看Delta Queque中的内容。
18、请求号怎么收集?选择需要收集的对象,右键—-更改—-点小车—-打包,SE09检查是否收集全。
请求号收集是实施顾问来做,打一个包释放出去;传是IT部门来传(BASIS)。
19、你们项目上的开发环境是怎么样的?是否有测试机?我们项目上没有测试机,在开发机上开发完后直接在开发机上测试,测试后没问题后直接传到生产机。
开发机—-生产机。
或者我们项目上有测试机,开发机上开发完后传到测试机测试,没问题后再传到生产机。
20、常用的T-CODE。
RSA1:建模 RSA3:数据抽取,数据源提取检验 RSDS:查看数据源RSRV:数据库的统计,可以得到维度表和事实表的大小。
Debug测试。
SM59:测试RFC连接 SM37:看后台数据 SM12:解锁(解开被锁定目标)SE11,SE16,SE16N:数据库表查询和创建SE09:看传输请求号,释放。
SBIW:数据源后处理 STMS:传输(basis做的)RZ11:设定gateway的连接数SU01:创建用户(权限) PFCG:把ROLE分配到用户名下(权限)VF03:显示发票 VA03:看销售订单XD03:销售主数据VL03:交货单MM03:物料LBWE:定制事务码 KNA1:客户主数据CMOD:数据源和BW增强 SMOD:查CMOD使用组件的名字RSPC:处理链SPRO:加载时无字符串时查看用的RSRT:query 监控器事务码。
二、增量1、什么是DELTA机制?所有的Delta数据,在传到BW之前,都会先到Delta Q里面,再从DeltaQ到BW.Delta Q可以用RSA7查看.2、Delta数据从原始表到Delta Q, 有两种方式:对于LO的数据源,是系统将Delta数据push 到Delta Q的,然后在InfoPackage执行的时候,再把数据从Delta Q搬到BW.这就是PUSH 的方式. 对于非LO的数据源,大部分采用time stamp的方式,在InfoPackage执行的时候,系统根据time stamp去源数据表获得delta数据,这些数据被送往Delta Q之后,紧接着就被搬到BW了.这就是所谓的PULL的方式.;3、总结一下:/ W1 N* [5 W3 K% y8 l0 L: {PULL:当BW端请求数据时,R3端才做出回应,执行相关Function Module,把数据写入delta queuePUSH:数据自动写入delta queue,当BW端请求数据时,直接去delta queue中抽取4、什么是增量队列?(delta queue)增量队列是新建或已更改数据记录的数据储存形式(上次数据请求以来出现的数据记录)。
从系统收到数据请求时,会使用源系统中的更新流程或录入自动写入增量队列。
5、增量机制:ODS增量机制最重要的信息对象ORECORDOMODE该信息对象实在ODS中会自动添加,手工无法添加,在转换中,需要通过点选技术组进行转换链接,也可以编写结束流程进行赋值几个重要的值:余像:(在对原数据进行覆盖时,新的数据在更改日志中显示为空)X 前像(在对源数据进行覆盖时,会有一条源数据反向数据产生在更改日志中,显示为X)A 加(在对源数据进行累加时,会在更改日志中显示为A)N 新图像(在第一次加载数据时,会在更改日志中显示N)R反转像(在对源数据进行删除时,会在更改日志中显示为R)6、一般数据源的delta怎么实现的?一般数据源(自建数据源)的delta的类型默认都是aie,就是支持后像的,所以必须先到dso中然后再到cube。
7、Delta Process增量方式?R3通过SE11查看表ROOSOURCE,BW通过SE11查看表RSOLTPSOURCE,可以查看数据源的抽取机制。
如ABR(after before reverve),是前,后,反转镜像更新模式,支持覆盖也支持累加,所以适用于所有的增量方式,可以更新到DSO或者CUBE。
如AIE(after image),是后镜像,只支持覆盖,不支持累加,所以不能直接加载到CUBE,只能加载到DSO。
FI中此种增量处理方式应用较多。
如ADD,只支持累加,用附加镜像的更新方式,所以既可以更新到DSO,也可以更新到CUBE。
三、增强1、什么是数据源增强?DATASOURSE的增强其实就是在标准DATASOURSE上面,修改结构,然后在EXTRACT数据的时候通过写ABAP命令取到自己要的数据放到DATASOURSE中2、项目上增强的步骤。
结构增强——增强字段(RSA6更改数据源)功能增强——往字段中填数,CMOD选项目-选增强出口-写例程。
也可以简化说:分为两步:结构增强和功能增强结构增强是给数据源增加字段,功能增强是利用abap代码给增加的字段填数。
3、LO做增强以后和FI-CO做增强后的区别?FI-CO就是不用删除setup表,而LO做初始化后腰删除setup表4、数据源增强怎么做?bw这边增强做过哪些?cmod做增强,数据源增强的话,就是维护提取结构append structure(增强),标准数据源的话,增强可以用pull,把右边移到左边,增加字段。
bw这边做增强就是做些报表的用户出口变量。
5、项目开始后,用户需要增加字段,该怎么办?数据源做增强,增加字段维护结构,删除SETUP表,重新复制数据源删除CUBE里的数据,然后重新上数据6、增强项,增强出口?数据源增强:RSAP0001,报表变量增强:RSR00001.四、LO抽取1、R3目前有哪几种常见的数据提取方法? LO提取,通用提取,CO-PA提取。
2、LO的增量更新有哪几种,大概描述一下?主要用的就是abr,它支持前像,后像,反像,新像,所以可以支持dso或者cube都可以,并且是用push的方式到delta queue中的。
3、LO提取的UPDATE MODE有哪几种?Direct Delta:直接更新; Unserilized V3 update:无序的V3job, Queued Delta:队列增量, Serialized V3 Update。
4、LO抽取的步骤先进源系统传数据源,维护提取结构,维护生成数据源然后在BW系统复制元数据,建模最后上数,删除设置表,提取设置表,初始化数据,增量数据。
也可以说下图的13个步骤:(1:传输datasource .2:维护提取结构。
3:维护/生产datasource 。
)4:复制和激活sap bi 中的datasource 。