Continuous-Time Mean--Variance Portfolio Selection: A Reinforcement Learning Framework

发布时间:2020-01-03 浏览次数:267

报告人:周迅宇教授,哥伦比亚大学工业工程及运筹学系刘氏家族金融工程讲席教授以及FDT智能资产管理中心主任

  间:2020.1.11(周六) 14:00-15:00

  点:金融工程研究中心105学术报告厅

  要:We approach the continuous-time mean--variance (MV) portfolio selection with reinforcement learning (RL). The problem is 

to achieve the best tradeoff between exploration and exploitation, and is

 formulated as an entropy-regularized, relaxed stochastic control problem. We prove that the optimal

feedback policy for this problem must be Gaussian, with time-decaying variance. We then establish connections between the entropy-regularized MV and the classical MV, including the solvability equivalence 

and the convergence as exploration weighting parameter decays to zero. Finally,

we prove a policy improvement theorem, based on which we devise an implementable

RL algorithm. We find that our algorithm  outperforms both an adaptive control 

based method and a deep neural networks based algorithm by a large margin in our

simulations. This is a joint work with Haoran Wang.

报告人简介:

周迅宇,哥伦比亚大学工业工程及运筹学系刘氏家族金融工程讲席教授以及FDT智能资产管理中心主任。1984年获得复旦大学数学学士学位,1989年获得复旦大学运筹学与控制论博士,时年24岁。 19891991以及19911993年间分别于日本神户大学以及多伦多大学担任博士后研究员。从1993年起至2014年,在香港中文大学系统工程与工程管理系历任助理教授,副教授,教授,讲席教授,以及李卓敏金融工程讲席教授。2007年至2016年间,在牛津大学数学研究所任野村数理金融讲席教授,野村数理金融中心主任,以及数学和计算金融组主任。2014年至2016年间,担任牛津-聂氏金融大数据实验室主任。2016年至今,担任哥伦比亚大学工业工程及运筹学系刘氏家族金融工程讲席教授以及FDT智能资产管理中心主任。


 
地址:苏州大学十梓街1号
版权所有 Copyright © 2012 苏州大学金融工程研究中心. 访问次数: