新澳门免费原料网大全-全年资料免费大全

深度强化学习与图神经网络（GNN）研究

2022-01-19

项目背景：

近年来，人工智能数据科学技术不断突破与发展。卷积神经网络CNN开启了深度学习新篇章，推动计算机视觉落地自动化驾驶等诸多领域；循环神经网络RNN推动了自然语言处理，使得机器翻译、智能语音技术日趋成熟；深度学习之上，强化学习图神经网络GNN的崛起正在深度赋能数据挖掘，将成为企业场景拓展、数据整合、行业效率飞跃的关键。项目将聚焦强化学习，特别是图神经网络GNN这一构筑未来数字生态的核心数据科学技术。

项目介绍：

项目内容涉及强化学习核心理论和技能，具体包括遗传算法、强化学习框架、Q-learning、行动者-批评（actor-critic；AC）模型、马尔可夫决策过程、优化控制、图神经网络（graph neural networks; GNN）、自动机器学习（Auto ML）等。学生通过项目了解如何开发基于强化学习的生产力软件，在结束时提交项目个性化研究课题报告，进行成果展示。

课题参考：

1)强化学习在博弈论中的应用：类alpha算法开发

2)利用经验留存解决强化学习所需样本太多问题的可行性分析

3)强化学习中的机器奖励设置方法迭代

4)为强化学习过拟合的特定场景重新建模的自动过程研究

5)具有精确尺度估计的动作-评价网络结构与强化学习优势函数

适合人群：

计算机科学、人工智能、数据科学、电子与计算机工程等专业，软件工程、自动化等相关专业或者希望掌握强化学习的学生；

对人工智能、大数据以及交叉学科和方向感兴趣的学生；

学生需要具备线性代数及概率论与数理统计基础，至少会使用一门编程语言实现神经网络，有过强化学习开发经验的申请者优先。

导师介绍Pietro

导师现任剑桥大学计算机科学与技术终身正教授

持有欧洲学习和智能系统实验室席位、剑桥大学大数据研究指导委员会席位

在国际知名学术期刊发表论文多篇

曾荣获欧盟委员会未来与新兴技术会展三等奖

项目大纲：

（1）第一周：聚焦遗传算法和强化学习框架。

（2）第二周：探讨离策略、无模型强化学习算法 Q-learning、行动者-批评（actor-critic；AC）模型、马尔可夫决策过程等。

（3）第三周：深入学习强化学习与优化控制。

（4）第四周：集成与控制 Integration and Control。

（5）第五周：进一步探讨图神经网络（graph neural networks; GNN）、自动机器学习（Auto ML）等。

（6）第六周：项目回顾与成果展示 Program Review and Presentation。

（7）第七周：论文辅导 Project Deliverables Tutoring。

项目收获：

1)7周在线小组科研学习+5周论文指导学习，共125课时+不限时论文指导

2)学术报告、结业证书、成绩单

3)优秀学员获主导师Reference Letter

4)EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等级别索引国际会议全文投递与发表指导（可用于申请）

上一篇：无

下一篇：MIS信息系统管理专题：企业数据模型搭建与分析