新浪博客

(资料)深度学习和长期投资

2019-02-18 17:19阅读:

深度学习和长期投资

财富通云 2018-06-06 05:25
第一部分:深度学习和长期投资
75年前,安全分析之父本杰明•格雷厄姆(Benjamin Graham)写道,从短期来看,市场就像一台投票机,但从长期来看,它更像是一台称量机。格雷厄姆的观点是,恐惧、贪婪和其他情绪(投票机)可以驱动短期市场波动,进而导致公司股票的价格和真实价值之间的脱节。然而,在很长一段时间内,称重机开始发挥作用,因为一家公司的基本面因素最终导致其股票的价值和市场价格趋于一致。
传统上,投资者通过研究公司的损益表、资产负债表和其他有关公司运营的公开信息进行长期基本面分析。然后,他们在公司的市场价值的背景下利用这些信息,对公司的长期投资前景做出明智的决定。
这一过程的自动化,系统的价值投资,已经成为可能,随着高质量数据的出现,公司的基本原理和不断增加的计算能力可供研究人员使用。自动化方法的吸引力在于,严格的统计技术可以应用于对数千个机会的评估,一个系统化的过程可以保护投资者不受有记录的行为偏差的影响,而这些偏差往往会影响投资业绩。
在最近的一封投资者信中,我们描述了为什么深度学习,尤其是周期性神经网络,可能非常适合于长期系统价值投资的应用。
背景
最近深度学习和周期性神经网络的应用使得计算机在许多领域的性能都优于人类。然而,在将这些技术应用于投资管理方面几乎没有什么工作。尽管如此,当应用于长期投资时,深度学习可能比传统的统计方法或非深度机器学习方法取得更好的结果,有几个原因。这些原因包括:
机器学习方法的结构通常是这样的:目标是从固定数量的输入中预测一些东西。然而,在投资领域中,输入数据通常是以序列形式出现的(例如,一家公司的运营结果是如何随时间变化的),而投资结果的分布取决于这些序列的演化。近年来已取得许多成功的递归神经网络,正是为这种排序数据而设计的。
在定量投资领域,大量的工作被投入到“因素工程”中——确定一个公司的哪些特征对预测其未来股价最有价值的过程。深度学习提供了一个潜在的机会,让算法发现基于原始财务数
据的特性。也就是说,深度学习中的“深度”意味着模型的连续层能够以一种分层的方式从“在野外”发现的数据中梳理出重要的关系,而且这些关系可能比传统的因子工程方法中发现的关系更强。
(资料)深度学习和长期投资
在深度学习中一些最大的进步是在文本处理领域。这种能力为利用与公司相关的大量非结构化、定性文本数据打开了大门,这些数据可以在SEC的文件、新闻报道、博客文章、社交媒体和盈利记录中找到。
在我们的研究中,我们正在探索通过深度学习创造的机会。
为什么长期投资?
在应用数学和技术进行投资时,有一种趋势是想要建立和利用短期交易机会。那么,我们为什么要把重点放在长期投资上呢?虽然短期交易机会让研究人员能够更频繁地测试一个模型的成功与否,但股票交易策略面临的挑战是,许多外部因素可能会在一天、一周甚至四分之一的时间内对股票价格造成严重破坏。另一方面,有充分的统计证据表明,从长期来看,公司不断变化的基本面因素在决定其市值方面起着重要作用。诺贝尔奖得主罗伯特•希勒(Robert Shiller)给出了一个突出的例子。他指出,股票市场价格在短期内极度波动,但从长期市盈率来看,这在某种程度上是可以预测的。
设置
(资料)深度学习和长期投资
在这个项目中,我们使用了深度神经网络(我们将用来指代包括多层感知器和递归神经网络的一类神经网络)来预测一个股票在一年的时间内将如何相对于市场表现。选择时间间隔是在拥有足够的数据和足够长的时间间隔之间找到最佳平衡的过程。
一个人目前能从大市场公司基本面中获得的高质量数据跨度约为55年(从1960年到2015年)。如果我们试图在5年内预测股票表现,那么我们的学习过程将只有11个独立的时间段。另一方面,如果我们的时间跨度是一个月,我们会有660个独立的时间段。虽然更独立的周期有助于学习,但我们有理由相信,在非常短的时间内,价格太容易受到基于基本面的模型的外生因素的影响,因而无法具有足够的预测能力。因此,我们寻求一个时间范围,在这个时间范围内,成功的学习是可以实现的。我们选定了一年的时间。
在此设置中,我们以间隔一个月的时间间隔为时间步长向模型提供数据。月是1983年以前股票质量定价数据的最高粒度,因此它是我们使用的基本时间间隔。隐含的意思是,在每个时间步骤(月),模型被要求对未来12个时间步骤(一年)的股票价格会发生什么做出预测。从视觉上看,它是这样的:
即使对于经常使用的神经网络,这种设置也有些不寻常。通常情况下,我们试图预测下一次的结果,或者我们试图预测最终结果。尽管如此,为这种方法构建数据模型并不困难。具体地说,我们想构造一组序列,其中每个序列表示公司随时间的演变,而序列中的每个元素表示公司/月的组合。此外,每个公司月都有一个结果,结果与公司接下来一年的股价表现有关。
在这项研究中,我们用一种非常简单的方式对结果进行建模。具体来说,如果某只股票的价格变化大于所有股票的价格变化中值,我们将其赋值为 1。否则,结果是-1。
这个模型可以直观地描述为一个表,其中每行是公司月:
(资料)深度学习和长期投资
对简单的双类预测的一个明显的批评是,我们并没有教模型去预测股票可能达到的超额业绩程度。这是事实,但我们主张:(1)这种“低门槛”方法使学习长期基础数据变得更容易(可实现);而且(2)我们仍然可以取得很好的投资业绩。通过训练一个模型来预测某只股票在 1类中的概率(表现优于中值的股票),我们可以用产出概率作为信心的衡量标准,然后构建由对表现良好的公司组成的投资组合。此外,这个简单的设置为更精细的方法创建了一个起点。

我的更多文章

下载客户端阅读体验更佳

APP专享