Aberdeen Asset Management 在云环境中实现基于机器学习的投资组合分配模型
挑战
使用机器学习技术创建投资组合模型,改进资产分配策略
解决方案
使用 MATLAB 开发分类树、神经网络和支持向量机模型,使用 MATLAB Parallel Server 在云中运行模型
结果
- 实现投资组合绩效目标
- 处理时间从 24 小时减少至 3 小时
- 使用多种机器学习技术确认成果
仅供专业投资者使用 - 不适用于散户投资者或顾问
Aberdeen Asset Management(安本资产管理公司)是全球管理资产规模最大的独立资产管理公司之一。公司业务遍布全球 25 个国家和地区,设有 37 个办事处,拥有 750 多名投资专家和约 2,800 名员工。截至 2016 年 6 月 30 日,管理资产达 3013.9 亿英镑。
Aberdeen 借助自己的专家和专业资产级团队,开创了一项解决方案业务,就投资策略和投资组合构建提供咨询和管理服务,针对特定的客户需求帮助其实现投资结果。Aberdeen 解决方案根据投资组合模型确定贸易决策和多资产类别的要求。其中部分模型使用 MATLAB® 开发的高级机器学习算法生成,并使用 Microsoft® Azure 云中的 MATLAB Parallel Server™ 进行了回测。它们为投资决策提供了重要的信息。
Aberdeen 高级投资策略师 Emilio Llorente-Cano 表示:“借助 MATLAB,我们可以开发原型来快速测试新的机器学习技术。在我们改进这些技术并将它们整合到我们的资产分配算法中以后,MATLAB Parallel Server 就可以通过在分布式计算集群上运行具有大量财务数据集的算法,使我们能够得到快速、可靠的结果。”
挑战
为优化其投资组合分配策略,Aberdeen 需要创建投资组合模型,且其中的单个资产类别(如股票、商品、债券和房地产)与基准相比会超重或减持。这些决策部分基于复杂的关系模式,此类模式会将市场影响因素的行为与其对未来资产表现的影响相关联。Aberdeen 希望应用机器学习算法来表征这些关系,理解它们的模式,并据此制定交易决策。
Aberdeen 分析师需要利用现有的市场数据对机器学习算法进行训练和回测。该团队意识到,拥有的数据越多,支持其结果的证据也会越多,于是他们希望能够使用超过 15 年的市场数据。对于本地 PC 来说,在多维问题上,用如此多的数据进行回测太慢了,他们需要使用计算集群来加速处理过程。
解决方案
Abderdeen 使用 MATLAB、Parallel Computing Toolbox™ 和 MATLAB Parallel Server 为资产分配实现机器学习算法,然后在 Microsoft Azure 云上运行这些算法。
Llorente-Cano 和他的团队使用 MATLAB 开发了一套分类模型。每个模型都基于 Statistics and Machine Learning Toolbox™ 和 Deep Learning Toolbox™ 的不同机器学习算法,包括神经网络、决策树和支持向量机 (SVM)。
他们使用货币政策、企业利润、利率和隐含波动率等因素来训练模型。他使用 Datafeed Toolbox™ 访问市场数据。
团队用超过 15 年的历史数据对经过训练的模型进行了回测。随着新方法的探索和新数据的出现,这些测试被重复执行,需要一整天才能完成。
为了加快这一进程,Aberdeen 的解决方案架构师 James Mann 使用 Parallel Computing Toolbox 在桌面上构建了一个并行实现的原型,然后使用 MATLAB Parallel Server 在一个有 80 个 worker 的现场计算机集群上运行并行执行。
之后,Mann 将这些模型重新部署到 Microsoft Azure 虚拟机 (VM) 上运行的相同数量的 worker 上。他编写了一个脚本,允许 MATLAB 用户在云中启动虚拟机,MATLAB Parallel Server 可以在该虚拟机上为 worker 提供机器学习算法的访问权限。完成后,用户运行另一个脚本来关闭虚拟机。
Llorente-Cano 不断完善针对资产分配的机器学习模型。他目前正在使用 MATLAB 基于受经济物理学启发的变点分析方法和 Global Optimization Toolbox 中的全局优化方法开发交易策略。
结果
- 实现投资组合绩效目标。Llorente-Cano 表示:“我们的很多投资组合基于利用 MATLAB 机器学习算法开发的资产分配流程。这些算法帮助我们确定,与基准相比,我们的投资组合是超重还是减持。”
- 处理时间从 24 小时减少至 3 小时。Mann 指出:“当我们开始在 Azure 云上运行 MATLAB Parallel Server 后,我们的处理时间从 24 小时缩短到了 3 小时。由于作业调度程序已集成到 MATLAB 中,因此只需打开池并使用 parfor 循环即可轻松利用并行计算。”
- 使用多种机器学习技术确认成果。Llorente-Cano 表示:“我们相信不同的学习方法会带来不同类型的知识。通过 MATLAB,我们向神经网络、支持向量机和分类树提供了相同的数据,当这些不同的模型得出相同的交易决策时,我们有了很大的信心。”
重要信息
仅供专业投资者使用 - 不适用于散户投资者或顾问
上述营销文件仅供参考之用,不应视为交易本文件所述任何投资或基金的要约、投资建议或招揽,亦不构成欧盟指令 2003/125/EC 所界定的投资研究。Aberdeen Asset Managers Limited(下称“Aberdeen”)不保证本文件所载信息及资料的准确性、充分性或完整性,并明确声明对该等信息及资料的错误或遗漏不负任何责任。本文件编制过程中所使用的任何研究或分析均由 Aberdeen 购买供其自身使用,并可为其自身目的而采取行动。由此获得的结果仅为巧合,不能保证其准确性。本文件中的某些信息可能包含有关国家/地区、市场或公司未来事件或未来财务业绩的预测或其他前瞻性声明。这些声明仅为预测,实际事件或结果可能存在重大差异。读者必须自行评估本文件所载信息的相关性、准确性及充分性,并进行他们认为有必要或适当的独立调查,以便作出评估。本文件所载的任何意见或估计均基于一般依据,读者不可将其视为可依赖的建议。Aberdeen 及其任何员工、关联集团公司或代理均未考虑或调查读者、任何特定人士或团体的投资目标、财务状况或特殊需要。因此,对于读者、任何个人或团体因本文件所载的任何信息、意见或估计而直接或间接遭受的任何损失,概不作出任何保证,亦不承担任何责任。Aberdeen 保留随时更改和更正本文件内任何信息的权利,恕不另行通知。由 Aberdeen Asset Managers Limited 发行。由英国金融市场行为监管局授权和监管。