热线电话:13121318867

登录
首页大数据量化投资研究之一:巧借东风,研报文本挖掘选股策略
大数据量化投资研究之一:巧借东风,研报文本挖掘选股策略
2014-12-24
收藏

大数据量化投资研究之一:巧借东风,研报文本挖掘选股策略


借力研报,打造开放的量化选股模型.

传统的多因子量化选股模型是封闭的,缺乏捕捉市场热点的能力,通过大数据技术,从财经媒体和分析师研报中捕捉热点和政策的变化,可以打造开放的量化选股模型。

分析师个股类研报每年大约5 万份,相比财经媒体,分析师研报在专业度、可信度、规范度、实时度等方面有明显优势,是大数据量化投资的重要数据来源之一。

热词库建设是构建量化选股模型的关键.

通过对历史研报的统计,我们建立了基本面类、情绪面类、概念主题类三大热词库,其中基本面类和情绪类细分为正面词库和负面词库。

我们统计了单个热词在近4 年的选股效果,总体胜率比较高,相对沪深300 有明显超额收益。

“基本面+情绪面”热词库选股策略表现稳定.

2011-2014 年,策略相对沪深300、中证500 的年化超额收益为21.29%、14.84%,月度胜率大约70%。

“概念主题”热词库选股策略令人惊喜.

以“油价下跌”和“一带一路”为例,截止12 月19 日,“油价下跌”热词概念股平均超额收益27.78%,“一带一路”热词概念股平均超额收益21.48%,其中表现最好的是中国交建,超额收益达93.28%、绝对收益达101.55%。

“银河大数据量化投资”体系.

我们将逐步建立起“银河大数据量化投资”体系,数据来源包括财经媒体、分析师研报、行情财务三大部分。我们认为,通过对投资者情绪、行业政策舆论、概念主题舆论和个股舆论进行大数据分析,可以构建择时、行业配置、选股和组合管理等量化投资模型。

数据分析咨询请扫描二维码

若不方便扫码,搜微信号:CDAshujufenxi

上一篇
下一篇
最新资讯
更多
客服在线
立即咨询