在计算机科学领域,有这样一位学者,她深耕多模态AI领域,用科研智慧搭建技术与产业的桥梁,以育人理念点亮青年学子的学术之路。她,就是合工大杰出校友鲍秉坤教授。近日,我们有幸邀请到鲍教授分享她的学术经历、科研感悟与未来展望。
思维启蒙:数据结构课上的科研方法论奠基
回溯学术起点,鲍秉坤教授对本科阶段胡学钢老师的数据结构课程记忆犹新。她表示,本科阶段胡老师的课程训练对她科研思维的塑造远超知识本身,且是她学术生涯中至关重要的思维启蒙。胡老师以“数据结构是算法的逻辑骨架”为核心教学理念,始终强调“结构设计需与问题本质深度适配”。他的课堂不局限于链表、树、图等具体结构的代码实现,而是通过“问题驱动式”教学,引导学生们从“为何选择此结构”“如何通过结构特性解决问题”的维度展开思考。在讲解堆栈结构时,他会系统分析“后进先出”特性与特定问题场景的匹配逻辑,而非仅演示入栈出栈操作。这种“结构-问题”的对应式思维训练,为鲍教授后续学术研究奠定了“先拆解问题本质,再匹配解决工具”的底层思维框架。
科研攻坚:跨越“实验室”与“真实场景”的鸿沟
科研之路并非坦途,“实验室模型”与“真实场景”的鸿沟是鲍教授团队常面临的挑战。以跨模态图像生成平台“即绘”为例,团队通过广泛的用户测试,针对图像生成依赖海量数据和大算力的痛点,创新的提出具有细粒度解耦能力的跨模态深度融合思想,在仅用4.8%的训练数据和0.6%的算力的条件,实现与国外大模型相当的性能,同时大幅提高了图片的生成速度。在工业应用领域,团队与集成电路测试厂商合作,深入晶圆制造一线,研发面向复杂工业场景的无监督晶圆缺陷检测技术,为提升晶圆良率提供了关键技术支持,大幅减少了半导体制造过程中的返工率和废品率。从跨模态图像生成平台 “即绘” 的优化升级,到为集成电路测试厂商研发晶圆缺陷图案匹配技术,她用实践诠释科研的价值在于落地应用,让技术切实解决产业难题,为行业发展注入强劲动力。

育人理念:聚焦三大能力,培养复合型人才
谈及青年科技人才培养,鲍教授强调三个核心能力维度:问题洞察力、技术创新力、落地转化力。
青年科技工作者要具有问题洞察力,要能从用户抱怨中捕捉需求缺口,从技术演进的缝隙里嗅出矛盾。这种能力体现为"将现象转化为问题,再将问题转化为可攻关的技术课题"的系统思维。比如,广告企业引入并应用AI生成模型的意愿强烈,但实际使用反馈往往不能满足期望。其表面现象是“生成图像好看但不匹配产品特色”,但背后的技术问题则是“需求语义和生成图像语义对齐不精准”。又比如社交媒体行业常陷入重大舆情预警滞后、日常小事件频繁触发的困境。其背后涵盖了舆情要素建模不全面,社交多媒体内容理解不深刻等多种问题。青年科技工作者要构建这种"思维雷达",才能找好创新的大方向。
其次是技术创新力,科研不是“为创新而创新”。青年科技工作者在研究中,要在某一方向具备扎实的知识地基,增大知识半径。像手术刀一样精准剖开问题肌理,在抓住真问题的基础上具有破局勇气,提出“前人没做过、做得更好”的方法。鲍教授团队做跨模态生成研究时,学生通过熟练学习掌握各类生成模型的框架,总结贯通,跳出多步迭代的一般生成框架,直接用单步架构提高模型生成速度,这种“从0到1”的方法创新,是科研的核心竞争力。
最后是落地转化力,论文里的模型是实验室的工艺品,要把它变成企业能用、用户会用的工具,远不是把代码打包成软件那么简单。科研工作者要与企业和用户多沟通多交流,把握模型在真实场景中可能"水土不服"的每一步,从而走通技术落地的道路。在研发无监督晶圆缺陷检测技术时,鲍教授要求团队与企业随时沟通,并派出师生驻扎企业一线,精准把握真实生产场景数据的每个细节,这才跳出了实验室理想环境数据分析的惯性,设计出能真正用于生产场景提高生产效率的模型。她认为,这种“从1到100”的转化能力,比发顶会论文更重要。

学术箴言:三条“生存法则”指引科研方向
面向有志于学术道路的学弟学妹,鲍教授倾囊相授三条“生存法则”:
第一条,永远保持打破砂锅问到底的好奇心,让学术成为追根究底的旅程,而非按部就班的任务。许多学生容易困在“解决问题”的惯性里,却淡忘了最初那个叩问本质的“为什么“。鲍教授回忆早期学术生涯,正是这种好奇心帮助她产出科研成果。她在围绕基于稀疏表示的图像分析开展研究时,发现量化视觉特征上的稀疏表示效果恶化幅度异常,这引起了她的好奇。她没有放过这一反常现象,仔细研究、深入探索,终于找出了原因,那就是量化过程带来的小概率但关键的直方图异常。基于这样的发现,鲍教授提出用L0范数正则化“揪出”异常,最终实现了精准且鲁棒的量化视觉特征分析。学术创新的灵光,就是诞生于这种对“为什么”的执着追问里,沿着问题的纹路深挖下去,那些隐藏在现象背后的“暗礁”,终将成为撬动新发现的支点。
第二条,把研究做成会生长的树,而非建好的墙。鲍教授总爱用这个生动的比喻和学生们聊学术观。她说,树的生命力在于根系不断向下扎根、枝叶持续向外延展,而墙砌好后就成了封闭的边界,看似稳固,实则困住了更多可能。可现在很多学生总容易陷入“为发论文而研究”的误区:实验数据刚达标就急着整理成论文投稿,课题结题报告一交便觉得任务完成,像园丁刚种下树苗就忙着收工具,根本不去想这棵“苗”未来能不能抽新枝、开新花。为此,鲍教授给团队立了条铁规:每个课题必须留生长接口。所谓接口,就是在研究过程中主动埋下问题种子。比如在低质数据治理研究中,不仅要解决“怎么过滤噪声”,还要思考“这些噪声模式是否随环境变化?”“能不能迁移到实际应用场景?”。“就像给树搭支架时预先留出绑新枝的位置,”她打比方说,“这些问号不是麻烦,是研究的‘生长点’。当你的研究能像树一样自我迭代——旧问题长出新问题,老方法催生新方法——它才真正活了,能走得比你想象的更远。”
第三条,学会站着做学术——既尊重前人,也敢于超越。鲍教授常和学生说:“读文献不是为了‘致敬’,是为了‘超越’,这不是对前人成果的轻慢,而是在尊重学术脉络的基础上保持思想的主动性。”读论文时,她会让他们在页边写批注:“这个结论的前提是什么?”“如果换个场景,哪里会失效?”。这些批注不是形式化的挑刺,而是帮学生走出学术研究的舒适区,在她看来,真正的学术传承从来不是“站在巨人的影子里不敢抬头”——若只是重复前人的结论、附和已有的框架,知识就会失去流动性;只有“踩着巨人的肩膀看得更远”,用新问题挑战旧结论、用新方法验证老假设,才能让学术真正“活”起来。
这三条法则,是鲍教授从自己的学术道路中总结的——保持好奇让你有动力,生长思维让你有后劲,独立判断让你有底气。学术这条路,难在坚持,但更美的风景,也永远在坚持之后。

未来展望:硬核创新与精准落地双轮驱动
未来的学术研究,鲍教授聚焦两个关键词展开:硬核创新和精准落地。
首先是硬核创新,要解决跨模态生成的“卡脖子”难题。当前生成模型由于高算力依赖存在应用瓶颈。鲍教授团队计划对底层架构和基线模型进行全链路优化,以千万级参数规模的模型实现十亿级参数模型的生成质量。这一创新既需要打破传统参数堆砌的路径依赖,又要攻克底层架构优化的技术难关,最终通过降低模型算力门槛,为生成模型的规模化应用提供关键技术支撑,是科研该啃的“硬骨头”。
然后是精准落地,要让技术“长”在具体场景里。接下来她会带领团队重点攻关工业和公共安全领域:在工业领域,推动“即绘”智能生成技术落地,依托工业知识图谱与生成式AI的协同能力,自动完成从芯片引脚拓扑布局、高速信号走线规划的全链条设计生成;在公共安全领域,开发“舆情预测大模型”,致力于破解社交媒体舆情管理中面临的热点发现滞后、传播规律黑箱、生态治理低效三大核心难题,构建多模态感知-动态推演-智能治理的一体化系统。她希望未来的研究,不是躺在论文里“被引用”,而是在工业生产现场的设备里运行、公共安全管理的指挥屏上闪烁、社会治理实践的工具箱中待用。
母校建言:深耕优势,激活“智能+传统工科”新动能
作为合工大的校友,每次回到屯溪路校区,看到斛兵塘边的老教学楼,鲍教授总想起本科时在实验室敲代码的日子。对于母校的学术发展,她有两个“接地气”的建议:
首先,把“智能+”的文章写在传统工科的“长板”上。合工大的机械、电气、车辆工程这些学科是“老树根”,根基深、底蕴足。她建议推动“计算机+传统工科”的深度交叉,从而发挥母校的传统优势,又能激活人工智能的“新枝”,让学术研究真正“长”在产业需要的地方。
其次,把“产教融合”的课堂搬到企业的“生产线上”。安徽有汽车、家电、新能源等产业集群,这是母校的“天然实验室”。她建议依托这些产业,让学生在真实的生产场景里“带着问题做研究”,既能解决企业的“卡脖子”难题,又能培养“懂技术、懂产业”的复合型人才。
最后,她表示母校的学术发展,不需要“追热点”,而是要“把优势做深、把交叉做活、把产学研做透”。她希望未来的合工大,既能守住“工程师摇篮”的底色,又能成为“智能+时代”的创新引擎——这是她作为一个老校友最真诚的期待。
鲍秉坤教授以学术为舟,载着对知识的热爱与对母校的眷恋,在多模态人工智能领域破浪前行。她的故事激励着每一位学子,勇敢追逐学术梦想,为母校争光添彩,在时代的浪潮中书写属于自己的华章。

图:鲍秉坤校友(右1)大学阶段和父亲在斛兵塘边合影
鲍秉坤教授个人简介
鲍秉坤教授个人简介:鲍秉坤,南京邮电大学计算机学院、软件学院、网络空间安全学院院长,二级教授、国家杰出青年基金获得者、江苏省杰青、江苏省双创人才。主要从事多媒体计算、社交多媒体、计算机视觉、生成式人工智能等方向研究。发表高水平论文120余篇,包括TPAMI/CVPR/MM/TIP/TMM等。 主持国家科技创新2030-人工智能重大专项、国家自然科学基金重点项目、江苏省重点研发计划等国家级、省部级项目10余项。荣获2018年度电子学会科学技术(自然科学类)一等奖、ACM TOMM 2016年度最佳论文奖、IEEE MM2017年度最佳论文奖、Multimedia Modeling 2019年度最佳论文Runner Up奖等多项学术奖励。担任国际期刊IEEE Trans. On Multimedia、IEE Trans. on Circuits and Systems for Video Technology、Multimedia Systems编委。