投资研究中的大数据分析趋势及应用
- 格式:pdf
- 大小:684.72 KB
- 文档页数:10
大数据对金融行业的影响与应用前景随着互联网和移动互联网的发展,数据成为了各行各业非常重要的资源。
对于金融行业来说,数据也是非常重要的资源,而随着信息技术的快速发展,大数据也成为了金融行业研究和决策的重要手段。
一、大数据对金融行业的影响1.提升风险管理水平对于金融行业来说,风险控制是非常重要的一项工作。
大数据能够通过对海量的数据进行挖掘和分析,快速识别和预测风险,提高风险管理水平。
例如,利用大数据分析来提取客户信息、交易历史等数据对金融机构的风险评估、存款增长、贷款风险等问题进行精准决策和预警。
这样就能有效避免不良贷款和投资失利等风险。
2.提高金融机构的运营效率传统金融机构的业务流程繁琐、服务效率低下,大数据则能够通过分析海量数据,从中提取有用信息,发现问题并及时优化业务流程,从而提高业务运营效率。
例如,金融机构可以利用大数据分析客户的交易行为,从中找出客户最喜欢的产品,并快速推广和营销,提高客户黏性和满意度。
3.改变金融服务方式,提升服务质量大数据还能够通过提供智能化、预测性的金融服务,为客户提供更优质的服务体验。
例如,通过大数据技术可以对用户进行个性化的商品推广、投资组合定制等服务,快速满足不同客户群的需求,提高服务质量。
二、大数据在金融行业的应用前景1.支付行业支付行业一直是金融行业中重点发展的领域之一,随着移动支付的不断发展,支付领域对大数据的需求也越来越高。
可以利用大数据技术分析消费者的购买行为和情况,从中挖掘出用户需求,提高支付体验和安全等方面的优化。
2.信贷行业信贷行业是银行业务的重要组成部分之一,大数据技术可以利用客户的贷款历史、个人信息、消费习惯等数据,从而帮助银行判断客户的还款能力和信用等级,提高信贷业务的风险控制能力。
3.资产管理随着金融市场的不断发展,资产管理的重要性也日益凸显。
大数据技术可以通过对不同金融产品的表现、市场波动、客户需求等方面的分析,为资产管理提供科学决策支持,从而托管和管理更多的资产,提高反应速度、减少损失。
大数据在商业领域的应用和前景随着科技的不断发展和走向成熟,大数据已经成为当下商业领域的一大热门话题。
可以说,借助于大数据分析技术,企业在竞争激烈的市场环境中能够更快更准地掌握市场趋势、把握消费者需求、提高生产效率和增加企业利润率等。
本文将结合相关数据分析案例和已有研究成果,阐述大数据在商业领域的应用和前景。
一、大数据的概念和意义大数据是指具有大体量、高速度、多层次和多样性的数据。
它包括了人类社会活动中所产生的所有数据,而这些数据分散在各个领域。
大数据的产生源源不断且呈几何级数增加的态势,如何有效地管理、分析和利用大数据成为了商业领域亟待解决的问题。
以依靠传统方法进行分析的数据处理为基础,大数据处理可以使企业从可用的大数据中获得更深入的理解,从而能够更快更准地预测、识别、理解和决策。
大数据具有很强的应用前景。
它可以帮助企业更全面、更快速地了解客户需求,从而更好地满足客户的需求。
此外,大数据还可以帮助企业更好地跟踪产品的生命周期,以便在产品变动和市场需求变化时作出更贴切的调整。
同时,大数据还可以帮助企业更好地控制风险和做出更好的商业决策,以便企业更有效地保持竞争力和提高企业利润率。
二、大数据在商业领域的应用1、市场营销大数据在市场营销领域是一个非常重要的应用范围。
借助大数据分析技术,企业可以更好地把握消费者的需求。
例如在社交媒体上进行大数据分析,可以迅速发现消费者的收购行为和兴趣点,预测消费者的需求变化,从而更好地满足消费者的需求。
此外,在品牌营销方面,可以在社会媒体上跟踪品牌和产品的印象,以便企业更好地了解其市场口碑和消费者满意度。
还有,通过大数据分析,企业可以发现不同的市场分割,例如购买力、性别、年龄和人口统计数据。
在市场营销方面,大数据的应用将会更加普遍。
2、风险控制在现代企业中,风险控制是企业日常经营的重要问题之一。
传统的风险控制方法主要是基于经验和丰富的数据整合得出。
这种方法通常不够准确、效率不高并且很耗时间。
洛阳市工业大数据产业发展趋势及投资可行性研究报告一、简介随着大数据时代的到来,全国各个城市都在探索大数据产业的发展,洛阳市作为河南省的重点城市,也在不断加强大数据产业的建设,逐渐形成了很好的发展态势。
本文将从洛阳市工业大数据产业的现状入手,探讨其产业发展趋势及投资可行性,希望能够为投资者提供一些参考意见。
二、洛阳市工业大数据产业的现状(一)政策环境洛阳市作为重点城市,政府高度关注大数据产业的发展,出台了一系列的政策文件。
比如,市委市政府关于加快推进大数据产业发展的若干意见、洛阳市人民政府办公厅关于印发《关于加快推进大数据与人工智能产业发展的实施意见》等文件,对于大数据产业的发展提供了有力的政策支持。
(二)发展现状洛阳市已形成了一定规模的大数据产业集群,涉及领域广泛,包括智慧城市、智能制造、大数据服务、人工智能等多个领域。
洛阳市工业大数据产业主要涉及电子信息、计算机软件及服务、文化创意等产业,其中,电子信息产业是洛阳市最重要的产业之一,而大数据产业则是电子信息产业的重要组成部分。
洛阳市目前拥有一批知名的大数据企业,包括天地图、金山云、京信等,这些企业的建设和发展对于推动洛阳市大数据产业的健康发展起到了积极的推动作用。
此外,洛阳市还拥有多个企业孵化器和创新创业基地,为创新创业者提供了很好的发展环境和条件,在推动大数据产业的发展上发挥了积极的作用。
(三)发展瓶颈目前洛阳市工业大数据产业尚处于发展初期,面临一些瓶颈。
首先,人才短缺是大数据产业发展的首要问题,虽然洛阳市拥有多所大学,但是对于人才的培养和引进还需加强;其次,技术水平还需提高,洛阳市的大数据企业技术含量和竞争力需要进一步提升;此外,融资难、资金不足等问题也给大数据产业的发展带来了一定困难。
三、洛阳市大数据产业的发展趋势(一)数据中心建设随着云计算、大数据和人工智能等技术的不断发展,数据中心越来越成为大数据产业的核心发展点。
洛阳市应积极加强数据中心的建设,提高数据中心的安全性、可靠性和可扩展性,为大数据的存储和处理提供更好的条件。
基于大数据技术的股票市场预测与交易策略研究随着科技的发展,大数据技术已经逐渐渗入到各个领域,包括股票市场的预测和交易策略研究中。
如今,越来越多的投资者开始喜欢利用大数据技术来辅助自己做出投资决策,今天我们就来探讨一下基于大数据技术的股票市场预测与交易策略研究。
一、大数据技术在股票市场预测中的应用1、数据采集在大数据技术的帮助下,我们可以通过抓取互联网上的海量数据,从中挖掘出潜在的投资机会和风险。
比如,我们可以收集相关公司的财务报告、新闻报道、行业分析等数据,并通过数据挖掘和机器学习算法进行分析,得出一些关键词和指标,预测股票价格的走势。
2、情感分析股市的波动不仅受到经济因素的影响,还受到社会政治、自然灾害等因素的影响,而这些因素的变化往往能够引起不同人群的情感波动,所以我们可以利用情感分析技术,分析投资者的情绪和心理状态,从而预测股票市场的变化趋势。
3、模型构建基于大数据技术,我们还可以构建预测模型,比如ARIMA模型、VAR模型、神经网络模型等,来进行市场预测。
这些模型可以利用历史数据进行训练,然后根据已有的模型对未来市场做出预测。
二、大数据技术在股票市场交易策略研究中的应用1、风险评估在股市交易过程中,风险评估是必不可少的一环。
大数据技术可以利用历史数据,生成风险等级、风险系数和风险概率分布等数据,为投资者提供投资建议。
2、智能交易大数据技术可以协助投资者进行自动化交易,比如通过机器学习算法自动化执行买卖策略、根据市场变化智能调整股票组合等,让投资者不必时刻盯着股票市场,更加省心省力。
3、组合指标分析基于大数据技术的股票市场交易策略研究中,组合指标分析是必不可少的一项。
投资者可以通过收集众多指标数据,结合专业分析师的研究,构建出综合指标体系,从而得出更加科学合理的交易策略。
三、基于大数据技术的股票市场预测与交易策略研究的未来基于大数据技术的股票市场预测与交易策略研究已经初见端倪,未来股票市场的发展将会更加依赖大数据技术。
大数据分析在金融行业中的应用有哪些在当今数字化的时代,大数据分析已经成为金融行业中不可或缺的一部分。
它正在深刻地改变着金融机构的运营方式、风险管理策略以及客户服务模式。
那么,大数据分析在金融行业中到底有哪些具体的应用呢?首先,大数据分析在风险管理方面发挥着至关重要的作用。
金融机构面临着各种各样的风险,如信用风险、市场风险和操作风险等。
通过对大量的交易数据、客户信息和市场动态进行分析,金融机构可以更准确地评估借款人的信用状况。
传统的信用评估方法往往依赖于有限的财务数据和信用记录,但大数据分析能够纳入更多的非传统数据,比如社交媒体活动、消费行为、网络浏览习惯等。
这些数据可以提供更全面、更实时的信用画像,帮助金融机构识别潜在的违约风险,从而做出更明智的信贷决策。
在市场风险管理方面,大数据分析可以帮助金融机构实时监测市场波动,预测市场趋势。
通过整合来自全球市场的海量数据,包括新闻资讯、宏观经济指标、政治局势等,金融机构能够及时调整投资组合,降低市场风险带来的损失。
其次,大数据分析在客户关系管理中也具有重要意义。
金融机构可以利用大数据分析来深入了解客户的需求和行为偏好。
通过分析客户的交易历史、账户活动和与金融机构的互动记录,金融机构能够对客户进行细分,为不同类型的客户提供个性化的产品和服务。
例如,对于风险偏好较低的客户,可以推荐稳健型的投资产品;对于年轻且活跃的客户,可以推出具有创新性的金融服务。
此外,大数据分析还能够帮助金融机构发现潜在的客户。
通过对市场数据和第三方数据的挖掘,金融机构可以识别出具有特定需求和特征的潜在客户群体,并针对性地开展营销活动,提高客户获取的效率和效果。
再者,大数据分析在欺诈检测中也表现出色。
金融欺诈行为日益复杂和多样化,给金融机构带来了巨大的损失。
利用大数据分析技术,金融机构可以实时监测交易活动,识别异常模式和可疑行为。
例如,突然的大额交易、频繁的异地交易或者与客户历史行为不符的交易等都可能被视为潜在的欺诈信号。
基于大数据的股票量化分析及趋势研究作者:余怀娄必伟余廷忠来源:《今日财富》2022年第31期针对股市常规基本面和技术面分析的局限性,基于大数据的股市预测及投资分析越加凸显其投资收益的科学性和可靠性。
文章从大数据技术视角,对神经网络和机器学习等算法、以及对投资情绪和量化投资等问题进行研究综述。
股票投资是高收益与高风险并存的,自股市诞生以来,股票波动及走势一直是每个投资者高度关注和研究的话题。
投资者希望通过股市研究,揭示大盘及个股走势规律,从而对个股行情及走势进行预判。
但由于股票投资市场存在非线性、不平稳性及高度复杂性等特征,使得投资者对股票走势预测研判具有很多不确定性。
但随着大数据技术在各个行列的应用不断普及和深入,特别对股票走势预测及研判的指导作用必将越来越凸显其重要性。
一、股市行情分析概述(一)常规股市行情分析方法人们通常对股市行情分析主要包括基本面和技术面两方面。
1.基本面分析基本面分析有广义和狭义之分:广义的基本面分析,是指以经济学中的供求关系为研究基础,通过分析历史经济数据和政治环境,主要对利率水平及通货膨胀等为主要指标的宏观经济运行状况、企业素质等为主导的微观经济情况和政治环境等进行分析,以便对金融市场趋势进行预测;狭义的基本面分析,主要针对企业财务报表中的机构管理成员素质、财务指标、所属行业发展及主打产品竞争强度等进行分析,着重对公司的经营管理分析、市场状况和行业地位等方面的分析,主要分析公司主营业务成长性和宏观经济运行态势,对公司价值及股价走势的影响进行预测及研判。
基本面分析将为中长线投资者提供投资决策的主要依据。
2.技术面分析技术面分析是通过对市场行为研究来预判市场运作趋势,通过市场运作趋势的变化周期来进行股票交易的决策。
技术分析者认为股票市场行为具有重复性,市场交易的历史必会重演。
技术面分析着重以供求关系为基础对股市行情进行分析研究。
主要研究股票价格动向、换手率、交易量、交易趋势等技术指标(包括持股人对未来的希望、担心及恐惧等,都将直接反映在股票价格和交易量上),使用这些指标,以便对该股票的未来价格进行预判,从而进行投资决策。
大数据应用在金融领域的研究进展与成就随着信息技术的快速发展和互联网的普及,大数据成为当今社会的热门话题。
大数据的出现为各行各业带来了巨大的机遇和挑战,尤其在金融领域,大数据的应用已经取得了显著的研究进展和实际成就。
首先,大数据在金融风险管理中的应用已经取得了重要的成果。
传统的金融风险管理方法主要依靠统计学模型和历史数据进行分析和预测,但是由于金融市场的复杂性和不确定性,传统方法往往难以满足实际需求。
而大数据技术可以帮助金融机构从庞大的数据中提取有价值的信息,发现潜在的风险因素,提高风险管理的准确性和及时性。
例如,通过对大量的交易数据进行分析,金融机构可以发现异常交易和欺诈行为,及时采取相应的措施,降低风险损失。
其次,大数据在金融市场预测和投资决策中的应用也取得了重要的突破。
金融市场的波动性和复杂性使得投资决策变得异常困难,但是大数据技术可以帮助投资者从庞大的数据中发现市场的规律和趋势,提高投资决策的准确性和效果。
例如,通过对大量的市场数据进行分析,投资者可以发现股票价格的波动规律和相关因素,从而做出更加准确的买卖决策。
此外,大数据技术还可以帮助投资者识别潜在的投资机会,提高投资回报率。
另外,大数据在金融服务创新中的应用也有了重要的突破。
传统的金融服务模式主要以银行为中心,但是随着互联网金融的兴起,金融服务模式正在发生深刻的变革。
大数据技术为金融机构提供了更多的数据来源和分析手段,使得金融服务可以更加个性化和精准。
例如,通过对客户的消费行为和偏好进行分析,金融机构可以为客户提供个性化的金融产品和服务,提高客户满意度和忠诚度。
此外,大数据技术还可以帮助金融机构进行风险评估和信用评级,提高金融服务的安全性和可靠性。
然而,大数据在金融领域的应用也面临一些挑战和问题。
首先,大数据的处理和分析需要强大的计算和存储能力,金融机构需要投入大量的资源和技术支持。
其次,大数据的隐私和安全问题也需要引起重视,金融机构需要加强数据保护和风险控制,避免数据泄露和滥用。
大数据分析及其对经济学的应用研究大数据分析是一项快速发展的技术,它的应用领域不止于商业领域,在经济学领域,大数据分析也有着广泛的应用。
在这篇文章中,我们将从大数据概念、数据采集、数据存储和数据分析等角度,探讨大数据分析如何对经济学的应用产生影响。
一、大数据概念大数据是指具有高速、多样性和大容量特征的数据集合。
具体来说,大数据的特性包括四个方面,即数据量大、数据来源多、数据种类广、数据速度快。
这些特点使得大数据分析较传统统计分析方法更加高效和精准。
二、数据采集数据采集是指收集和获取数据的过程。
在传统的经济研究中,数据主要来自于调查、实验或样本观察等传统方法。
然而,在大数据时代,数据的获得已经变得更加普遍和容易。
例如,社交媒体、移动设备、物联网、云计算等技术的普及,使得大量的数据被不断采集和存储下来。
同时,也涌现出了许多第三方机构,他们致力于为企业和个人提供各种类型的数据。
这些数据的开放共享,为研究者和决策者提供了更多的数据选择和更准确的数据基础。
三、数据存储数据存储是指数据的保存和管理过程,它是大数据分析过程中的关键环节。
随着数据产生速度的提升,如何高效地管理和存储数据成为数据分析的首要问题。
在经济学中,数据存储可分为单一数据源和多数据源存储。
单一数据源主要指对于某一特定的经济状况或者某eenomicsystems业关键指标的统一管理。
多数据源存储,则是将各种多数据类型存储在一起。
多数据源存储的优势在于能够更全面的反映经济状况,更好的综合数据分析,从而提供更精准的数据决策支持。
四、数据分析数据分析是大数据应用最为核心的方法之一。
数据分析可以帮助经济学家观察、描述、解释、预测和评价各种经济现象和政策的效果。
大数据分析主要有两个方向,一是数据挖掘,二是信息化管理。
其中数据挖掘更侧重于从海量的数据中挖掘有价值的信息,用于经济预测、市场营销、资产评估等;而信息化管理则主要用于企业和政府信息化管理,包括人力资源管理、企业竞争力分析、政府治理等方面的应用。
第1篇一、引言随着信息技术的飞速发展,大数据已经成为当今社会的一个重要特征。
大数据不仅改变了我们的生活方式,也为各行各业带来了前所未有的机遇和挑战。
本报告旨在通过对大数据分析领域的调研,探讨大数据分析的基本概念、应用领域、技术发展趋势以及面临的挑战,为我国大数据分析行业的发展提供参考。
二、大数据分析的基本概念1. 大数据的定义:大数据是指无法用常规软件工具进行捕捉、管理和处理的数据集合,其特征可以用“4V”来概括:Volume(大量)、Velocity(高速)、Variety(多样)和Value(价值)。
2. 大数据分析的定义:大数据分析是指利用先进的分析技术和工具,对海量数据进行分析,从中挖掘有价值的信息和知识,为决策提供支持。
3. 大数据分析的特点:- 数据量大:需要处理的数据规模庞大,通常达到PB级别。
- 速度快:数据产生和处理的速率极高,需要实时或近实时分析。
- 多样性:数据来源广泛,包括结构化、半结构化和非结构化数据。
- 价值密度低:在大量数据中,有价值的信息所占比例较低。
三、大数据分析的应用领域1. 金融领域:大数据分析在金融领域具有广泛的应用,如风险评估、欺诈检测、客户关系管理等。
2. 医疗健康领域:通过分析医疗数据,可以实现疾病预测、个性化诊疗、药物研发等。
3. 电商领域:大数据分析可以帮助电商平台进行精准营销、用户画像分析、供应链优化等。
4. 政府决策:大数据分析可以为政府提供政策制定、城市管理、公共安全等方面的支持。
5. 交通领域:通过分析交通数据,可以实现交通流量预测、交通信号控制优化、交通事故预防等。
6. 能源领域:大数据分析可以帮助优化能源生产、分配和消费,提高能源利用效率。
四、大数据分析技术发展趋势1. 云计算:云计算为大数据分析提供了强大的计算和存储能力,使得大规模数据处理成为可能。
2. 分布式计算:分布式计算技术可以将数据分散存储和处理,提高数据处理速度和效率。
3. 机器学习:机器学习技术可以帮助分析算法从数据中自动学习,提高分析结果的准确性。
大数据分析的基本算法和应用随着互联网时代的到来和智能技术的不断发展,数据量大幅度增长,大数据的应用也随之迅速发展。
大数据分析作为当今最为热门的技术,已经被广泛应用于商业智能、社交网络、用户行为分析、金融风险管理等领域,成为企业决策的重要依据。
本文将对大数据分析的基本算法和应用进行探讨。
一、大数据分析的基本算法1. 聚类分析聚类分析是将一组数据的观测值区分为若干簇,满足同一簇内数据相似度高,不同簇之间数据相似度低的分析方法。
这种方法常被用于对用户画像、目标客户、产品分类等方面的分析。
常用的聚类算法有K-means算法、层次聚类、DBSCAN算法、GMM 算法。
2. 关联分析关联分析是一种基于频繁项集和关联规则的分析方法,能够从一系列交易记录或者其他数据集中找出频繁出现的项集并从中发现元素之间的关联规则。
这种方法常应用于商品推荐、用户行为分析等领域。
常用的关联算法包括Apriori算法、FP-growth算法、ECLAT算法等。
3. 分类算法分类算法是通过训练数据集和已知的分类标签确定预测结果的方法。
它常用于对客户分类、信用评估等方面的分析。
常见的分类算法有决策树、朴素贝叶斯、最大熵、SVM等。
4. 回归分析回归分析是一种用于研究自变量和因变量之间关系的统计分析方法,用于预测数据中一个变量的状态。
它常用于对用户行为、销售趋势等方面的分析。
常见的回归算法有线性回归、多项式回归、逻辑回归等。
二、大数据分析的应用1. 商业智能商业智能是在大数据背景下对企业数据进行分析和挖掘,以帮助企业有效地管理、决策和计划的技术。
通过商业智能方法,企业可以清晰地识别问题所在,洞察趋势,发现机会并制定正确的预测和决策。
2. 社交网络社交网络是一种在线社交平台,能够记录用户之间的互动信息和行为,这些信息累积起来就构成了用户的社交网络。
通过大数据分析,可以从这些数据中提取信息,分析用户行为和互动模式,帮助企业深入了解用户特征以及市场动态,并以此为基础制定营销策略。
1 投资研究中的大数据分析趋势及应用 规划研究部 李芮
宏观研究通常被视作大类资产配置的起点:以美林时钟和风险平价为代表的资产配置模型,建立了宏观经济状态和各类资产表现的理论和逻辑关联,从而奠定了当前投资研究中“自上而下”分析的基础。然而,对于投资者而言,即便明确了宏观经济走势和大类资产表现之间的关系,也并不意味着能够轻松完成资产配置的工作,因为现代经济具有高度复杂性,其趋势和拐点均难以直观呈现在某一特定表征上。尤其在近些年来,随着技术革新和产业演进,新模式、新业态层出不穷,导致传统统计方法所搜集的信息量正在逐步缩减和偏离。如此一来,投资者如果希望更加精准及时地判断宏观经济的未来走势,就必须修正传统的统计方法,加入新的统计参数和变量,建立更加完整的分析框架及相应数据库。在这一方面,近年来蓬勃发展的大数据分析无疑值得关注。 一、传统宏观经济分析与大数据分析 传统宏观经济分析建立在凯恩斯提出的总需求框架上,一般以GDP增长核算为基础,通过将总需求分解到消费、投资、出口等多个驱动因素上,并区分代表“量”的实际产出2
和代表“价”的货币指标,来对经济活动做出整体性的刻画和分析。这一分析框架在逻辑体系上似乎无懈可击,但具体到统计手段上却存在几个较为明显的缺陷:一是受制于人力物力条件限制,传统统计方法几乎完全建立在抽样基础上,尽管在中心极限定理假设下,大样本群体的参数会无限接近总体,但由于现实中许多变量的并不完全为正态分布,抽样统计必定会牺牲掉总体的部分信息;二是传统指标的涵盖范围越来越难以适应当前经济结构和形态的快速变化,例如随着网络线上消费的兴起,传统的商贸零售销售等指标可能无法准确描述居民整体消费情况;三是数据的时效性较低,传统经济指标一般采取问卷和自愿填报的方式经自下而上汇总而来,过程存在较长时滞,一些指标发布延时多达数月之久;四是传统经济统计存在明显的激励不相容问题,上级统计部门严重依赖下级统计部门的统计结果,却无法完全控制下级统计部门或经济主体报送数据的质量,导致数据失真情况时有发生。上述缺陷汇聚到一起,使得当前传统经济统计的结果出现不全面、不准确、不及时的问题。 值得庆幸的是,大数据分析的兴起可以有效克服上述传统经济统计的缺陷。关于大数据的界定目前尚没有一致观点,但一般公认,大数据的特点可以用“4V”即大量化(Volume)、高速化(Velocity)、多样化(Va riety)和价值化(Value)来3
概括①;换而言之,大数据的特点绝不仅仅限于“量大”,还包括高频、非结构化和高关联度等等。与之相应,大数据分析则着眼于将过去的抽样分析变为总体分析、让过去事后汇总信息变为实时传送信息、将过去非标准化、非结构化信息变为标准化、结构化数据,从而大大提高数据分析的全面性、准确性和及时性。更重要的是,大数据分析承认现实世界的高度复杂性和混杂性,不再尝试建立不同指标间的因果联系,而是更注重考察指标间的相关关系,这种观念更符合现代经济活动的本质。与此同时,以互联网为代表的新经济快速崛起,一方面让大数据分析具备更多的应用场景,另一方面也为大数据分析的应用提供了更多的技术和工具支持。因此,从任何角度来讲,大数据分析都应该成为未来投资研究的重点关注领域之一②。 二、宏观大数据分析的主要内容和发展现状 大数据概念出现的时间虽然不长,但在近些年经历了突飞猛进的进步发展,在宏观经济分析领域也得到了较为广泛的应用。从目前情况来看,宏观领域应用比较成熟的大数据指标主要源自以下几个类别:③ (一)网络消费数据。网上购物被戏称为中国的新“四
① 参见 [英] 维克托·迈尔-舍恩伯格,[英] 肯尼思·库克耶 著,盛杨燕,周涛 译,大数据时代,浙江人民
出版社,2013. ② 大数据分析在投资领域的另一重要应用领域是分析微观层面上的客户偏好和行为,继而进行相应的产品
开发和咨询服务,该领域的应用本文不做探讨。 ③ 需要特别指出的是,一些研究将过去几年在宏观经济中已经得到广泛应用的用电量、货运量、高炉开工
率等指标视为大数据,但我们认为这些指标虽然具有高频的特征,但仍为标准的结构化数据,且统计方式仍基于抽样和自下而上汇总,因此并不符合真正意义上的“大数据”分析。 4
大发明”,正深刻改变着中国居民的生活。从现有的社会消费品零售总额数据来看,网上零售额占零售总额的比例已经达到20%以上,并且趋势上占比还在快速提升。网络消费领域的大数据分析,既可以在宏观层面了解总需求中的消费以及物价的变化情况;也可以在微观层面用于消费者的行为分析和相应品牌公司的研究。由于网络消费数据的巨大分析价值,以阿里巴巴、京东等为代表的网络零售巨头,在多年的运营中已经积累了大量销售数据,发展出了大数据分析的成熟技术手段,并定期发布关于网络消费的若干代表性指标,如阿里巴巴的“新消费指数系列”、京东的“中国线上消费指数”和“新华▪京东中国线上消费平衡指数”等等。 图1 阿里品质消费指数(2012-2017)
数据来源:国家统计局、阿里研究院 上述大数据分析指标对于深化关于消费的理解具有极
大帮助,以阿里巴巴发布的“阿里品质消费指数”为例,可以鲜明地体现出从2012年到2017年出现的“消费升级”趋势,这无疑能够很好地解释股票市场中消费龙头的优异表现(图5
1)。同样由阿里巴巴发布的“阿里巴巴消费价格指数”,则能够比国家统计局的CPI数据更加及时和高频地反映出消费价格变化的情况,从而能够佐证研究者对物价变动的判断。 图2 阿里巴巴消费价格指数(2013-2016)
数据来源:Bloomberg 除了社会零售品消费之外,近年来房屋和二手车辆等资
产也越来越倾向于采取线上交易的模式,目前相关公司也开始尝试编制和发布相应的大数据分析数据,这无疑将进一步完善我们对于消费活动的监测。 (二)互联网搜索信息。除了网络消费以外,互联网的影响已经渗入现代经济活动的方方面面。互联网搜索引擎作为当前网络用户寻求信息的起点,可以折射出大量关于经济活动的潜在信息。国际上已经有一些学者研究了谷歌趋势( Google Trends) 如何可以用来为预测当前经济变量服务,发现失业和相关福利的搜索可以提高对于失业救济首次申请时间的预测④。而在国内,随着网络使用频次的提高,不少
④ 参见 N. Askitas, K. F. Zimmermann, “Google Econometrics and Unemployment Forecasting”, Applied 6
公司已经根据网络搜索情况编制了相应的大数据分析指数,其中比较具有代表性的包括智联招聘发布的“智联招聘就业指数”和百度公司的“百度就业指数”(图3和图4)。 图3 智联招聘就业指数(2016-2018)
数据来源:Bloomberg 图4 百度就业指数(2015-2017)
数据来源:Bloomberg (三)卫星数据。众所周知,卫星图像在地理勘探、气
候预测和军事侦查等领域已经具有不可取代的作用。不过近
Economics Quarterly, 55 ( 2) , 2009, pp. 20-107. 7
些年来,研究者却逐渐发掘出卫星图像中包含的另外一些信息——譬如夜间灯光、工业企业排放、交通运输等等——的经济价值。譬如,不少研究都发现,基于夜间灯光对经济增长的估算可以显著提高GDP测算的准确性⑤。在投资领域,以贝莱德(Blackrock)为代表的国际大型资产管理机构已经开始使用卫星图像中包含的建筑、交通等信息来分析判断行业和公司经营情况并直接为股票投资提供参考。 (四)社交媒体信息。随着社交媒体成为个人表达意见和观点的主要渠道,社交媒体信息对于大众主观情绪的分析具有愈发重要的意义。传统的媒体分析早已在政治学和公共政策研究中大量应用,例如通过分析官媒对某一话题发表的文章数量和关键词频率进行统计,来判断政策意图和走向。然而,网络社交媒体的规模和联结性远远超出了传统媒体分析的能力范围,大量高频和非结构化信息只能通过大数据的提取和处理方法才能转化为可以量化分析的数据。由于社交媒体数据的分析需要综合运用网络爬虫、社会网络分析和文本分析等多种技术手段,掌握起来难度极高,因此目前其前沿应用还主要局限在学术研究中⑥。但可以肯定的是,社交媒体信息在揭示投资者情绪和行为上的应用潜力巨大,未来还需要开发更有效的方法去收集和处理相关数据。
⑤ 徐康宁,陈丰龙,刘修岩.中国经济增长的真实性:基于全球夜间灯光数据的检验.经济研究,2015,50(9):17-29
⑥ 对于中国社交媒体数据分析的范例可以参见 King G , Pan J , Roberts M . How Censorship in China Allows
Government Criticism but Silences Collective Expression[J]. American Political Science Review, 2013, 107(2):326-343. 8
综上所述,目前宏观经济领域的大数据分析仍处于萌芽阶段,但已经形成了一些成果,如果按照宏观经济的维度对现有指标进行重新排列,可以形成一个简单的指标体系: 表1 大数据分析指标体系 维度 指标 来源 备注 总需求 消费 阿里消费指数 阿里研究院 未公开 京东中国消费指数 京东研究院 Bloomberg
价格 零售品价格 阿里巴巴消费价格指数 阿里研究院 房地产价格 房产交易数据指数 贝壳研究院 实体经济活动 就业 智联招聘就业指数 Bloomberg 百度就业指数 Bloomberg 城市灯光 卫星数据 美国海洋与气象局(NOAA)、 谷歌地图 需自行加工处理 物流 卫星数据
工业排放 卫星数据 情绪 投资者情绪 社交媒体信息 网络社交媒体 需自行加工处理 分析师预测 社交媒体信息 网络社交媒体 需自行加工处理 资料来源:作者总结
从上表可以看出,目前在宏观经济各个维度大数据分析
的发展进程不尽相同。由于网络购物的高度发达和互联网巨头企业的巨额投入,互联网消费和价格领域的大数据分析已经比较成熟,亦形成了不少相应指数。相比之下,刻画实体经济活动卫星图像数据和反映情绪的相应大数据分析还主要停留在学术研究阶段,或者仅由少数拥有强大信息技术能力的资产管理机构使用,关于这方面的大数据分析还处于起步阶段。