报告题目: 基于因果推理的强化学习算法
报 告 人: 郭尚岐 清华大学精密仪器系助理研究员
所在单位:清华大学精密仪器系
报告时间:2023年5月22日 星期一 10:00-11:00
报告地点:数学楼第二报告厅
校内联系人:孙维鹏 sunwp@jlu.edu.cn
报告摘要:在面对实际复杂问题时,强化学习通常面临部分观测的问题。为此,目前研究通常将历史观测序列引入到强化学习算法中,然而这导致状态空间随着历史长度增加而指数级增大。因果学习可以挖掘历史观测中的重要观测状态,讲历史序列进行压缩,从而降低历史观测空间的复杂度,提高基于历史观测的强化学习算法的效率。
报告人简介:
2011年9月-2015年6月,电子科技大学数理基础科学班,本科
2015年9月-2021年6月,清华大学自动化系,博士;
2021年12月至今,清华大学精密仪器系,博士后;