近日,我校统计与数学学院初晨副教授分别以第一作者和通讯作者完成的两篇论文被International Joint Conference on Artificial Intelligence (IJCAI 2022)录用。IJCAI是人工智能领域的顶级国际学术会议,被中国计算机学会(CCF)推荐国际学术会议列表认定为A类会议(A类指国际上极少数的顶级刊物和会议,鼓励我国学者去突破),在该领域具有极大的影响,代表人工智能领域的最高水平和发展方向。据悉本届IJCAI大会收到投稿4535篇,录用率仅为15%。这是我校首次在IJCAI上以第一单位发表论文,这标志着我校在人工智能领域研究取得突破性进展,得到了国际同行的认可。
论文 “A Formal Model for Multi agent Q-Learning Dynamics on Regular Graphs”被录用为Long oral presentation(占所有录用论文的25%)。该论文研究了图结构上的多智能体强化学习的动力学建模问题,利用概率密度函数描述多智能体在重复对称博弈中Q值分布的异质性。该论文利用多项分布刻画了图结构上多智能体交互的复杂性,推导出Q值密度函数动态变化的加权福克-普朗克(Fokker-Planck)方程组,仅利用4个方程即可描述了整个系统的Q值分布的演化规律。该论文揭示了多智能体强化学习与统计物理间的奇妙联系,有助于加深对人工智能算法可解释性的理解。
论文“Modelling the Dynamics of Regret Minimization in Large Agent Populations: a Master Equation Approach”研究了多智能体学习过程的动力学建模,首次表明无限多个代理在重复对称博弈中应用遗憾值最小化(Regret Minimization)算法的学习过程可以被数学方程描述。基于统计物理的方法,该论文推导出描述该学习过程的福克-普朗克方程组,描述了遗憾值的概率分布如何随时间演化。通过实验,表明该理论模型能够完全描述多智能体的学习过程。该成果有助于加深对多智能体学习过程的理解。