最新信息


PromptDepth 论文展示
Feb. 2026

博士生王显赟论文 PromptDepth 被 CVPR 2026 接收

实验室在具身三维感知领域取得重要进展。针对低算力平台实时 3D 理解与多任务统一建模需求,博士生王显赟俞俊教授苗嘉旭教授指导下提出了 PromptDepth 框架。 该方法通过级联 two-way transformer构建轻量化提示交互单元,并以单一解码器统一几何感知与语义识别,在单目深度、立体深度、目标追踪、提示分割等任务上取得 SOTA 效果。
论文: PromptDepth: Efficient and Promptable Geometric 3D Vision Model for Embodied Intelligence
作者: Xianyun Wang, Jiaxu Miao, Tian Xu, Siyuan Wang, Yuehao Li, Haoyang Hu, Jun Xiao, Yonghong Tian, Jun Yu
OctMem-Agent 论文展示
Feb. 2026

博士生周佳聪论文 OctMem-Agent 被 CVPR 2026 接收

实验室在空中目标导航(Aerial Object-Goal Navigation)领域取得重要进展。针对大规模场景下探索效率低、缺乏长期记忆等挑战,博士生周佳聪俞俊教授苗嘉旭教授指导下提出了 OctMem-Agent 框架。 该架构通过自适应八叉树(Adaptive Octree)构建层次化三维记忆,并利用语言指令引导查询提取关键空间信息。 在 UAV-ON 基准测试中,该方法成功率相比现有 SOTA 提升了 7.5%,为无人机在复杂环境下的具身导航提供了新方案。
论文: Memory-Augmented Scene Understanding and Exploration for Open-World Aerial Object-Goal Navigation
作者: Jiacong Zhou, Jiaxu Miao, Yourun Lin, Xianyun Wange, Jun Xiao, Jun Yu
CoE 论文展示
Feb. 2026

博士生尤晓兴论文 CoE 被 CVPR 2026 接收

实验室在多模态视频摘要领域取得突破。针对传统方法对标注数据依赖强、长视频事件演化建模不足等问题,博士生尤晓兴俞俊教授黄强教授指导下提出了 CoE(Chain-of-Events) 框架。 该方法通过构建层次化事件图(HEG),显式组织全局事件与实体关系,实现了训练自由(Training-free)的跨模态空间定位与事件演化推理。 实验表明,CoE 在 VIEWS、SoccerNet 等 8 个基准上性能稳定领先,平均取得 +3.04 ROUGE+9.51 CIDEr 的显著提升。
论文: Cut to the Chase: Training-free Multimodal Summarization via Chain-of-Events
作者: Xiaoxing You, Qiang Huang, Lingyu Li, Xiaojun Chang, Jun Yu
ICLR 论文展示
Jan. 2026

博士生郝继泰论文 Uni-X 被 ICLR 2026 接收

实验室在统一多模态大模型(UMMs)领域取得突破。针对视觉与文本模态间的梯度冲突,博士生郝继泰俞俊教授黄强教授指导下提出了 Uni-X 架构。 该架构采用“两端分离,中间共享”的 X 型物理设计,通过隔离底层分布差异,将自注意力计算复杂度从 $O((a+b)^2)$ 优化至 $O(a^2+b^2)$。 实验表明,Uni-X-3B 在图像生成与理解任务上展现出极强的 Scaling 能力,性能匹配甚至超越了 7B 规模的 SOTA 模型。
论文: Uni-X: Resolving Gradient Conflict in Unified Multimodal Models via Two-End-Separated Architecture
作者: Jitai Hao, Hao Liu, Xinyan Xiao, Qiang Huang, Jun Yu
Dec. 2025

欢迎苗嘉旭副教授加入实验室!

在加入哈尔滨工业大学(深圳)之前,苗嘉旭副教授于中山大学网络空间安全学院担任副教授。 2021年9月至2024年2月,他在浙江大学计算机科学与技术学院从事博士后研究工作。 他于2021年在悉尼科技大学(UTS)获得博士学位。 现研究方向为视觉智能感知、跨模态视频分析视觉隐私安全
会议合影
Nov. 15-16, 2025

实验室成功承办2025生成式人工智能技术研讨会

2025年11月15日至16日,由中国电子学会主办,中国电子学会虚拟现实分会、哈尔滨工业大学(深圳)、中国数字经济百人会共同承办,蚂蚁集团、百度集团协办,《信息前沿》学术支持的2025生成式人工智能技术研讨会在广东深圳成功召开。
本次研讨会由中国电子学会虚拟现实分会主任委员、浙江大学周昆教授,以及虚拟现实分会副主任委员、哈尔滨工业大学(深圳)俞俊教授共同担任大会主席;哈尔滨工业大学(深圳)黄强教授和浙江大学邵天甲教授担任大会秘书。中国电子学会副秘书长王天虹,哈尔滨工业大学(深圳)副校长李兵,中国电子学会虚拟现实分会主任委员、浙江大学教授周昆出席研讨会并致辞。
论文照片
Nov. 2025

博士生尤晓兴、硕士生赵德龙论文分别获AAAI 2026录用

2025年11月,实验室在多模态学习与可解释人工智能领域取得重要进展。博士生尤晓兴的论文《Knowledge Completes the Vision: A Multimodal Entity-aware Retrieval-Augmented Generation Framework for News Image Captioning》被录用为 Oral;硕士生赵德龙的论文《Partially Shared Concept Bottleneck Models》被录用为 PosterAAAI 是人工智能领域最具影响力的顶级国际会议之一,被中国计算机学会(CCF)列为A类国际学术会议。
作者: Xiaoxing You, Qiang Huang, Lingyu Li, Chi Zhang, Xiaopeng Liu, Min Zhang, Jun Yu
作者: Delong Zhao, Qiang Huang, Di Yan, Yiqun Sun, Jun Yu
论文照片
Oct. 2025

博士生郝继泰论文获NeurIPS 2025 spotlight

2025年10月,博士生郝继泰的论文《A Token is Worth over 1,000 Tokens: Efficient Knowledge Distillation through Low-Rank Clone》 成功被 NeurIPS 2025(The 39th Annual Conference on Neural Information Processing Systems) 录用。 NeurIPS 是人工智能与机器学习领域最具影响力的顶级国际会议之一,与 ICML(International Conference on Machine Learning) ICLR(International Conference on Learning Representations)并称为三大机器学习顶会。
作者: Jitai Hao, Qiang Huang, Hao Liu, Xinyan Xiao, Zhaochun Ren, Jun Yu
Feb. 2025

欢迎徐洋洋博士加入实验室!

在加入哈尔滨工业大学(深圳)之前,徐洋洋博士于 2024 年至 2025 年在牛津大学科学工程系CHI Lab担任博士后研究员,指导老师为Tingting Zhu教授。 2021年至2024年,他在香港大学计算机系MMLab担任博士后职位,指导老师为罗平教授。 他于2021年从华南理工大学获得博士学位,师从何盛烽教授和徐雪妙教授。 现研究方向为计算机视觉、图像/视频处理和视觉生成模型
会议照片
Jan. 2025

团队协助举办国家自然科学基金委员会信息科学部2024年度优秀青年科学基金结题验收会议

本次会议由国家自然科学基金委员会主办,哈尔滨工业大学(深圳)协办。 在俞俊老师的指导下,实验室团队在会议筹备和组织过程中发挥了重要作用,为会议的成功举办提供了有力保障。
Jan. 2025

欢迎黄强博士加入实验室!

在加入哈尔滨工业大学(深圳)之前,黄强博士在新加坡国立大学(NUS)计算机学院担任高级研究员,合作导师为Anthony K. H. Tung教授。 他于2017年在中山大学获得博士学位,师从冯剑琳教授。 现研究方向为多模态检索增强生成、语义理解与嵌入和大数据挖掘
会议照片
Nov. 2024

实验室团队在2024届“挑战杯”全国大学生课外学术科技作品竞赛中荣获国家级三等奖

2024届“挑战杯”全国大学生课外学术科技作品竞赛在北京成功举办。实验室的阙若豪、郭昱辰等同学在包俊老师刘卜瑜老师的悉心指导下,凭借项目《视护先锋》脱颖而出,荣获国家级三等奖。
Aug. 2024

博士生张艺骞论文获NeurIPS 2024录用

2024年11月,博士生张艺骞的论文《Learnability Matters: Active Learning for Video Captioning》 成功被 NeurIPS 2024(The 38th Annual Conference on Neural Information Processing Systems) 录用。 NeurIPS 是人工智能与机器学习领域最具影响力的顶级国际会议之一,与 ICML(International Conference on Machine Learning) ICLR(International Conference on Learning Representations)并称为三大机器学习顶会。 NeurIPS 2024 竞争异常激烈,共收到 15,671 篇投稿,最终录用率仅为 25.8%。 本届大会将于2024年12月9日至12月15日加拿大温哥华举办,期待团队在即将召开的会议上展示更多创新成果,并与全球同行展开深度交流。
作者:Yiqian Zhang, Buyu Liu, Jun Bao, Qiang Huang, Min Zhang, Jun Yu