Policy Iteration Reinforcement Learning Method for Continuous-time Mean-Field Linear-Quadratic Optimal Problem
时间: 2024-04-07  作者:   浏览次数: 542

报 告 人: 李娜 教授, 山东财经大学

报告时间202448日下午2: 30 - 3: 30

报告地点:苏州大学本部览秀楼105学术报告厅

报告摘要This work employs a policy iteration reinforcement learning (RL) method to investigate continuous-time mean-field linear quadratic problems over an infinite horizon. The drift and diffusion terms in the dynamics involve the state as well as the control. The stability and convergence of the RL algorithm are examined using a Lyapunov Recursion. Instead of solving a pair of coupled Riccati equations, the RL technique focuses on strengthening an auxiliary function and the cost functional as the objective functions and updating the new policy to compute the optimal control via state trajectories. A numerical example sheds light on the established theoretical results. 

报告人简介李娜,二级教授,博士生导师,青年长江学者,首届山东省科学技术青年奖获得者、首届山东数学会青年数学奖获得者,山东财经大学统计与数学学院副院长;兼任山东省科协第十届委员会委员、中国自动化学会TCCT随机系统控制委员会委员、山东省大数据研究会理事、《Math Review》评论员等。近年来,在控制论领域国际三大顶级期刊《SIAM Journal on Control and Optimization》、《Automatica》、《IEEE Transactions on Automatic Control》等国际著名学术期刊发表高水平论文20余篇;先后主持国家自然科学基金项目3项、山东省自然科学基金项目2项、山东省高等学校科技项目2项;曾获山东省高等学校科学技术奖二等奖1项、山东省省级教学成果二等奖3项;主持教育部供需对接就业育人项目1项、产学合作协同育人项目2项、山东省研究生教育优质课程建设项目1项、山东省本科教学改革研究重点项目1项。