4月21日上午,清华大学计算机系副教授东昱晓应学院邀请,在翡翠科教楼A座706会议室带来题为《基础大模型的智能体能力提升探索》的学术盛宴。本次报告由学院院长洪日昌教授主持。
东昱晓副教授曾工作于脸书人工智能及微软总部研究院,研究聚焦基础大模型、数据挖掘、图机器学习等方向,学术成果丰硕,相关成果广泛应用于多个大模型系列产品和系统。他荣获2022 ACM SIGKDD 新星奖,并入选 2024 年清华大学“清韵烛光—我最喜爱的教师”(每两年评选 10 位),在科研与教学方面成绩斐然。
报告中,东昱晓指出,基础大模型在意图感知、指令跟随、目标规划等方面展现出强大泛化能力,为智能体研究和应用奠定了通用模型基础。然而,大模型GUI 智能体在跨模态信息融合与跨域泛化能力构建上仍面临挑战。他详细分享了团队的前沿探索成果:一是构建了针对自主智能体的统一训练与评测框架 AndroidLab 和 AgentBench,通过建立标准化操作环境,支持文本输入及基于屏幕截图的多模态模式,实现点击、滑动等基础动作,为智能体研发提供标准参照;二是设计自进化在线课程强化学习框架 WebRL,有效解决 GUI 智能体训练中任务稀缺、反馈稀疏和策略漂移等关键问题,在多个智能体基准任务上显著提升效果;三是相关模型和技术成功应用于智谱 AutoGLM 智能体产品,彰显了产学研深度融合的潜力。
报告结束后,现场互动热烈,学院师生围绕报告内容踊跃提问,与东教授就技术细节、应用前景等展开深入探讨。师生们纷纷表示,报告内容前沿且贴合实际,为自身科研和学习带来诸多新思路与启发。未来,学院将继续秉持开放办学理念,举办更多高水平学术交流活动,助力师生拓宽学术视野,提升科研创新能力。


计算机与信息学院(人工智能学院)
2025年4月21日