【CN109977151B】一种数据分析方法及系统【专利】
- 格式:pdf
- 大小:777.12 KB
- 文档页数:30
(19)中华人民共和国国家知识产权局
(12)发明专利
(10)授权公告号 (45)授权公告日 (21)申请号 201910245141.2(22)申请日 2019.03.28(65)同一申请的已公布的文献号
申请公布号 CN 109977151 A (43)申请公布日 2019.07.05
(73)专利权人 北京九章云极科技有限公司
地址 100085 北京市海淀区上地西路41号
院1号楼4层E-002(72)发明人 张帆 路明奎
(74)专利代理机构 北京银龙知识产权代理有限
公司 11243
代理人 许静 安利霞(51)Int.Cl.
G06F 16/2458(2019.01)
(56)对比文件
CN 107609147 A ,2018.01.19,说明书第[0021]段-[0089]段.
CN 107609147 A ,2018.01.19,全文.CN 107609147 A ,2018.01.19,说明书第[0021]段-[0089]段.
CN 105302911 A ,2016.02.03,全文.无.“特征工程:特征抽象、特征衍生”.《布布扣-http://www.bubuko/com/infodetail-2964388.html》.2019,文章第1-6页.
审查员 范双燕
(54)发明名称
一种数据分析方法及系统(57)摘要
本发明提供了一种数据分析方法及系统,涉及数据分析领域。该数据分析方法,包括:基于待分析的业务数据和/或业务场景获取基本特征,并确定特征衍生方式;根据确定的特征衍生方式对所述基本特征进行衍生,得到衍生特征;根据所述衍生特征创建业务模型,以执行分析处理操作。上述方案,可以提高业务模型与业务场景和业务需求的契合度,
提高数据分析的准确度。
权利要求书6页 说明书20页 附图3页
CN 109977151 B 2020.02.07
C N 109977151
B
权 利 要 求 书1/6页CN 109977151 B
1.一种数据分析方法,其特征在于,包括:
基于待分析的业务数据和/或业务场景获取基本特征,并确定特征衍生方式;
根据确定的特征衍生方式对所述基本特征进行衍生,得到衍生特征;
根据所述衍生特征创建业务模型,以执行分析处理操作;
其中,所述特征衍生方式包括下述至少之一:基于业务目标衍生、基于深度学习衍生、基于特征组合衍生、基于时间变量衍生、基于决策树模型衍生及基于数值转换衍生;
所述根据确定的特征衍生方式对所述基本特征进行衍生,得到衍生特征,包括:
基于所述基本特征之间的关联关系,对一个基本特征衍生多层深度变量,得到衍生特征;或者,基于所述基本特征的兴趣指标利用深度特征合成的方式,生成衍生特征;
其中,所述基于所述基本特征之间的关联关系,对一个基本特征衍生多层深度变量,得到衍生特征,具体包括:基于所述基本特征之间的关联关系,组合使用多种特征衍生方式,对一个基本特征衍生多层深度变量,得到衍生特征;
所述基于所述基本特征的兴趣指标利用深度特征合成的方式,生成衍生特征,具体包括:基于所述基本特征的兴趣指标利用深度特征合成的方式,组合使用多种特征衍生方式,生成衍生特征;
组合使用的多种特征衍生方式的个数基于业务数据和业务场景确定;
其中,业务场景的业务特点包括业务特征和属性特点。
2.根据权利要求1所述的数据分析方法,其特征在于,所述根据确定的特征衍生方式对所述基本特征进行衍生,得到衍生特征,包括:
基于业务场景和业务目标,获取与所述业务场景对应的业务经验数据;
根据所述业务经验数据,通过所述基本特征构造与所述业务目标相关的特征,得到衍生特征。
3.根据权利要求1所述的数据分析方法,其特征在于,所述根据确定的特征衍生方式对所述基本特征进行衍生,得到衍生特征,包括:
通过稀疏自编码算法、因子分解机算法和深度交叉神经网络算法中的至少之一,对所述基本特征进行深度学习,获取衍生特征。
4.根据权利要求3所述的数据分析方法,其特征在于,当通过所述稀疏自编码算法对所述基本特征进行深度学习时,所述获取衍生特征,包括:
将所述基本特征输入到稀疏自编码神经网络中,获取所述稀疏自编码神经网络的隐藏层的各单元的激活值组成的向量,将所述向量作为衍生特征。
5.根据权利要求3所述的数据分析方法,其特征在于,当通过所述因子分解机算法对所述基本特征进行深度学习时,所述获取衍生特征,包括:
获取基于运行所述因子分解机算法模型引入的交叉特征,将所述交叉特征确定为衍生特征。
6.根据权利要求3所述的数据分析方法,其特征在于,当通过所述深度交叉神经网络算法对所述基本特征进行深度学习时,所述获取衍生特征,包括:
将所述基本特征输入深度交叉神经网络,分别通过交叉网络和深度网络得到第一输入结果和第二输入结果,将所述第一输入结果和第二输入结果进行组合,得到衍生特征。
7.根据权利要求1所述的数据分析方法,其特征在于,所述根据确定的特征衍生方式对
2