论文题目:Learning equilibrium mean-variance strategy
论文作者:Min Dai, Yuchao Dong and Yanwei Jia
发表刊物:Mathematical Finance
成果介绍:利用强化学习理论解决金融投资问题是当前金融数学发展的一个热点之一。我们在强化学习框架下研究了一个动态均值方差投资组合优化问题,在此过程中引入了熵正则化项以促进探索。由于均值方差准则涉及到时间上的不一致性,我们的目标是学习一个均衡策略。在不完全市场条件下,我们获得了一个半解析的、探索性的、均衡的均值方差策略,结果证明其遵循高斯分布。然后,我们专注于一个高斯均值回报模型,并提出了一个强化学习算法来寻找均衡策略。尽管动态规划原理和通常的策略改进定理不适用于均衡策略,对于文章中的策略迭代过程,我们证明了在温和条件下算法的收敛性。我们进行了数值实验来演示我们的算法。我们的强化学习算法的设计和实现适用于一般市场设。自文章完成以来已经引起了国内外专家的关注,累计引用近二十多次。
所属学科:运筹学与控制论
论文地址://onlinelibrary.wiley.com/doi/abs/10.1111/mafi.12402