2022年7月16日,正值美高梅4688集团am60周年院庆之际,美高梅4688集团am副院长李世华教授邀请杰出校友和院友南京大学数学系刘克勤博士作了主题为“High-Dimensional Reinforcement Learning by Multi-Armed Bandits”的学术报告。
图1刘克勤教授作报告
多臂强盗理论是应用数学的一个重要分支,在强化学习、随机优化和运筹学等领域有着广泛的应用。在这次演讲中,刘克勤博士分别介绍MAB的两种公式,即贝叶斯和频率主义者,以及一些解决这两类问题的最新研究成果。最后,刘克勤博士对未来做出展望,围绕“多臂强盗理论”和与会师生进行了热烈交流。
报告人经历:
刘克勤博士于2005年6月获得学士学位时,在大礼堂旁边的吴健雄纪念馆前留影纪念(图2)。在东大奋斗的大学生活收获颇丰,同年因修习李世华老师的智能控制概论等精彩课程,对机器学习产生了浓烈兴趣,至今依然在相关科研领域工作。刘克勤博士认为,所有的成果都离不开在东大8系积累的坚实知识基础与培养的“止于至善”的精神品格。
图2 刘克勤博士本科毕业照
报告人简介:
刘克勤博士于2005年毕业于美高梅4688集团am自动化专业,获得学士学位以及同年美高梅4688集团am优秀本科毕业设计和优秀毕业生。2006-2010年在美国加州大学戴维斯分校电子电气与计算机工程系进行硕博连读,分别于2008年和2010年获得硕士(M.S.)和博士(Ph.D.)学位。在2012年获得评审周期为2年的年度工程学院最优博⼠论文(Zuhair A. Munir Award for Best Doctoral Dissertation)。此奖项颁给工程学院八个系的所有博士毕业论文里选出的最终胜出者 (工程学院现包括生物与农业工程系,生物医学系,化学工程系,土木与环境工程系,计算机科学系,电子电气与计算机工程系,材料科学与工程系,机械与航空航天工程系)。刘克勤于2010-2012年在加州大学戴维斯分校任职于博士后,2012年-2020年在美国硅谷包括 MOOG, KLA, ASML等高科技公司任职于(高级/主任)软件工程师。其科研领域主要包括四块:1.优化,动态规划,多臂机,运筹学;2.概率,统计,信息论,信号处理,随机控制;3.自动化系统,大数据网络,深度/强化学习,人工智能;4.实/泛函/复分析代数学,拓扩学,几何学,数论。其在201年与英国剑桥大学数学系前系主任Richard Weber (现荣誉退休教授)合作发表论文,解决了运筹学中的难题,并在2012年获得美国特殊人才荣誉。目前在国际顶级学术期刊会议发表论文30余篇,被全世界学者引用达2000次以上。此外还担任IEEE多个期刊会议审稿委员会委员和工业界的人工智能研讨会的特邀讲员。