武奥迪计算机 · 博士在读

微信18937531481
邮箱wuaodi20@mails.ucas.ac.cn
主页https://wuaodi.github.io/
GitHubhttps://github.com/wuaodi
方向具身智能体、多模态感知、太空机器人
位置北京 / 中国科学院大学
武奥迪

关于我

我是中国科学院大学计算机应用技术博士生,导师为万雪研究员,在中科院空间应用工程与技术中心开展研究。

我的研究面向空间具身智能,关注具身智能体、视觉感知与导航、仿真到真机验证。过去的工作把 VLM Agent、多模态感知、相对导航和真实机器人/在轨平台连接起来,形成从数据构建、模型训练推理、算法部署到闭环验证的完整链条。

教育经历

中国科学院大学 2023年09月 - 至今(预计2026年12月毕业)
计算机应用技术 博士 · 中科院空间应用工程与技术中心 · 导师:万雪 研究员 北京

研究方向:LVM具身智能体、多模态视觉感知、太空机器人。

中国科学院大学 2020年09月 - 2023年06月
计算机应用技术 硕士 · 中科院空间应用工程与技术中心 · 导师:万雪 研究员 北京

研究方向:空间在轨服务、跨域目标感知、相对导航、空间相机智能曝光对焦调节;GPA:3.78/4.0。

南京航空航天大学 2016年09月 - 2020年06月
探测制导与控制技术 本科 · 自动化学院 南京

GPA:4.0/5.0,平均分 90,排名前 10%;获研究生推免资格,担任班级团支书;获江苏省电赛二等奖(无线充电小车爬坡)、南航校电赛一等奖(单片机编程)。

代表性工作

SpaceMind:面向太空机器人的模块化自进化具身 VLM 智能体 2025年 - 2026年
  • 提出面向空间机器人的 embodied VLM agent framework,将 LVM 大脑、MCP 工具库、专用小模型与技能模块解耦,支持 Standard / ReAct / Prospective 三种推理模式。
  • 构建技能自进化机制,使智能体能够将失败经验沉淀为可复用技能;在 5 颗卫星、3 类任务、2 个环境下完成 192 次闭环运行。
  • UE5 仿真与真实机器人实验室使用同一份代码完成迁移验证,物理平台迁移成功率 100%。该工作对应机器人任务规划、工具调用、技能沉淀和 sim-to-real 闭环验证能力;会议论文被 IAA-SPAICE 2025 接收,期刊扩展版投稿 Acta Astronautica。
SpaceSense-Bench:航天器感知与位姿估计大规模多模态基准 2025年 - 2026年
  • 构建包含 136 颗卫星、约 70 GB 时间同步 RGB 图像、深度图、256 线 LiDAR 点云的数据集,提供部件语义标注与高精度 6-DoF 位姿真值。
  • 支持 2D/3D 检测、2D/3D 分割、点云分割、深度估计、6-DoF 位姿估计和多模态融合等任务;数据集、代码和工具箱已开源。
  • 论文投稿 IROS 2026;项目在 arXiv、HuggingFace 与项目主页发布,HuggingFace 下载量 2700+。
基于动态路由与空间推理的自动驾驶 VLM 增强方案 2025年
  • 作为队长参加 IROS 2025 RoboSense Challenge,提出动态路由模块,将不同问题分发给对应专家提示,并结合显式多视图坐标系建模,缓解任务间提示干扰和后视相机方位混淆。
  • 基于 Qwen2.5-VL-72B,Phase-1 干净数据 70.87%,Phase-2 受扰数据 72.85%,最终获得亚军与创新解决方案奖,可迁移到机器人多视角感知、空间关系理解和 VLM 决策评估。
CVPR 2024 SPARK 挑战赛:非合作航天器感知 2024年
  • 面向仿真与真实卫星图像的航天器位姿估计与部件分割任务,参与集成多分割算法、深度估计、绝对定位与相对定位方法。
  • 位姿估计赛道获得冠军(队员),部件分割赛道获得第 4 名(队长)。
硕士期间代表工作:达芬奇在轨服务卫星视觉感知与单目导航 2020年 - 2023年
  • 围绕达芬奇空间在轨服务卫星,开展相机控制、视觉感知与单目相对导航研究,工作从算法研发、软硬件集成推进到在轨任务验证,已完成工程落地。
  • 提出空间相机智能曝光与对焦控制方法,相关发明专利 CN 2023102948012 已授权;非合作航天器单目相对导航算法完成在轨验证,论文发表于 ICoSR 2022。
  • 研究跨域航天器部件分割,提出边缘一致性训练策略,在下游分割任务中提升精度 5.1%,相关论文被 ICDIP 2025 接收;整体工作体现了视觉感知算法从训练、部署到真实任务验证的工程闭环能力。

项目经历

中科院创新十六号卫星空间视觉导航演示验证(已发射) 2021年09月 - 2022年12月
  • 负责在轨目标检测、相对导航与相机控制算法部署,并参与软硬件调试、数据/载荷在回路验证、发射前测试和发射后遥测判读。
  • 算法部署于 NVIDIA TX2 边缘计算设备,支撑在轨服务演示验证,并将实验室算法适配到受算力、时延与可靠性约束的工程环境。
月球车原型系统自主导航算法地面验证 2023年05月 - 2023年10月
  • 负责自主导航坐标系统建立,参与建图、定位、规划与控制一体化架构讨论,并完成导航相机验收、内参标定和地面联调。
  • 参与地面导航算法部署验证,支撑月面自主导航原型系统的闭环测试。
中科院在轨服务地面验证任务 2024年02月 - 2024年09月
  • 提出目标检测与跟踪融合方法,负责感知模块工程化与地面测试,使用 Docker 隔离算法模块并完成抵近测试。
  • 在无人机悬挂目标星由远及近飞行场景下验证感知输出稳定性,为控制模块提供平滑目标中心点。

竞赛获奖

中国科学院大学研究生论坛“航空宇航分论坛”第一名
2025年11月
IROS 2025 RoboSense Challenge 亚军 + 创新解决方案奖(队长)
2025年10月
CVPR 2024 SPARK 航天器位姿估计冠军(队员)
2024年03月
CVPR 2024 SPARK 航天器部件语义分割第四名(队长)
2024年03月
江苏省电子电路设计竞赛二等奖、南航校电赛一等奖
本科阶段

专业技能

编程语言:Python、C++、MATLAB,熟悉 PyTorch 模型训练与实验分析。

视觉感知:目标检测/分割、深度估计、6-DoF 位姿估计、相对导航、多模态融合。

具身智能:VLM Agent、MCP 工具调用、ReAct / Prospective 推理、技能自进化、任务闭环验证。

仿真验证:UE5/Airsim 空间环境搭建,多传感器数据采集,仿真到真实迁移,真实机器人闭环实验。

平台工具:Blender、ROS、Docker、Redis、GitHub、Jetson TX2 / Orin、空间相机、激光雷达。

语言能力:CET-6。

研究兴趣

具身智能体:面向可泛化场景的感知、推理、工具调用与行动闭环。

多模态感知:RGB / 深度 / LiDAR 航天器感知、部件理解、位姿估计与跨域泛化。

系统验证:从 UE5/Airsim 仿真、多源数据构建到真实机器人平台迁移验证。