武奥迪计算机 · 博士在读

微信18937531481

邮箱wuaodi20@mails.ucas.ac.cn

主页https://wuaodi.github.io/

GitHubhttps://github.com/wuaodi

方向具身智能体、多模态感知、太空机器人

位置北京 / 中国科学院大学

关于我

我是中国科学院大学计算机应用技术博士生，导师为万雪研究员，在中科院空间应用工程与技术中心开展研究。

我的研究面向空间具身智能，关注具身智能体、视觉感知与导航、仿真到真机验证。过去的工作把 VLM Agent、多模态感知、相对导航和真实机器人/在轨平台连接起来，形成从数据构建、模型训练推理、算法部署到闭环验证的完整链条。

教育经历

中国科学院大学 2023年09月 - 至今（预计2026年12月毕业）

计算机应用技术博士 · 中科院空间应用工程与技术中心 · 导师：万雪研究员北京

研究方向：LVM具身智能体、多模态视觉感知、太空机器人。

中国科学院大学 2020年09月 - 2023年06月

计算机应用技术硕士 · 中科院空间应用工程与技术中心 · 导师：万雪研究员北京

研究方向：空间在轨服务、跨域目标感知、相对导航、空间相机智能曝光对焦调节；GPA：3.78/4.0。

南京航空航天大学 2016年09月 - 2020年06月

探测制导与控制技术本科 · 自动化学院南京

GPA：4.0/5.0，平均分 90，排名前 10%；获研究生推免资格，担任班级团支书；获江苏省电赛二等奖（无线充电小车爬坡）、南航校电赛一等奖（单片机编程）。

代表性工作

SpaceMind：面向太空机器人的模块化自进化具身 VLM 智能体 2025年 - 2026年

提出面向空间机器人的 embodied VLM agent framework，将 LVM 大脑、MCP 工具库、专用小模型与技能模块解耦，支持 Standard / ReAct / Prospective 三种推理模式。
构建技能自进化机制，使智能体能够将失败经验沉淀为可复用技能；在 5 颗卫星、3 类任务、2 个环境下完成 192 次闭环运行。
UE5 仿真与真实机器人实验室使用同一份代码完成迁移验证，物理平台迁移成功率 100%。该工作对应机器人任务规划、工具调用、技能沉淀和 sim-to-real 闭环验证能力；会议论文被 IAA-SPAICE 2025 接收，期刊扩展版投稿 Acta Astronautica。

SpaceSense-Bench：航天器感知与位姿估计大规模多模态基准 2025年 - 2026年

构建包含 136 颗卫星、约 70 GB 时间同步 RGB 图像、深度图、256 线 LiDAR 点云的数据集，提供部件语义标注与高精度 6-DoF 位姿真值。
支持 2D/3D 检测、2D/3D 分割、点云分割、深度估计、6-DoF 位姿估计和多模态融合等任务；数据集、代码和工具箱已开源。
论文投稿 IROS 2026；项目在 arXiv、HuggingFace 与项目主页发布，HuggingFace 下载量 2700+。

基于动态路由与空间推理的自动驾驶 VLM 增强方案 2025年

作为队长参加 IROS 2025 RoboSense Challenge，提出动态路由模块，将不同问题分发给对应专家提示，并结合显式多视图坐标系建模，缓解任务间提示干扰和后视相机方位混淆。
基于 Qwen2.5-VL-72B，Phase-1 干净数据 70.87%，Phase-2 受扰数据 72.85%，最终获得亚军与创新解决方案奖，可迁移到机器人多视角感知、空间关系理解和 VLM 决策评估。

CVPR 2024 SPARK 挑战赛：非合作航天器感知 2024年

面向仿真与真实卫星图像的航天器位姿估计与部件分割任务，参与集成多分割算法、深度估计、绝对定位与相对定位方法。
位姿估计赛道获得冠军（队员），部件分割赛道获得第 4 名（队长）。

硕士期间代表工作：达芬奇在轨服务卫星视觉感知与单目导航 2020年 - 2023年

围绕达芬奇空间在轨服务卫星，开展相机控制、视觉感知与单目相对导航研究，工作从算法研发、软硬件集成推进到在轨任务验证，已完成工程落地。
提出空间相机智能曝光与对焦控制方法，相关发明专利 CN 2023102948012 已授权；非合作航天器单目相对导航算法完成在轨验证，论文发表于 ICoSR 2022。
研究跨域航天器部件分割，提出边缘一致性训练策略，在下游分割任务中提升精度 5.1%，相关论文被 ICDIP 2025 接收；整体工作体现了视觉感知算法从训练、部署到真实任务验证的工程闭环能力。

项目经历

中科院创新十六号卫星空间视觉导航演示验证（已发射） 2021年09月 - 2022年12月

负责在轨目标检测、相对导航与相机控制算法部署，并参与软硬件调试、数据/载荷在回路验证、发射前测试和发射后遥测判读。
算法部署于 NVIDIA TX2 边缘计算设备，支撑在轨服务演示验证，并将实验室算法适配到受算力、时延与可靠性约束的工程环境。

月球车原型系统自主导航算法地面验证 2023年05月 - 2023年10月

负责自主导航坐标系统建立，参与建图、定位、规划与控制一体化架构讨论，并完成导航相机验收、内参标定和地面联调。
参与地面导航算法部署验证，支撑月面自主导航原型系统的闭环测试。

中科院在轨服务地面验证任务 2024年02月 - 2024年09月

提出目标检测与跟踪融合方法，负责感知模块工程化与地面测试，使用 Docker 隔离算法模块并完成抵近测试。
在无人机悬挂目标星由远及近飞行场景下验证感知输出稳定性，为控制模块提供平滑目标中心点。

竞赛获奖

中国科学院大学研究生论坛“航空宇航分论坛”第一名

2025年11月

IROS 2025 RoboSense Challenge 亚军 + 创新解决方案奖（队长）

2025年10月

CVPR 2024 SPARK 航天器位姿估计冠军（队员）

2024年03月

CVPR 2024 SPARK 航天器部件语义分割第四名（队长）

2024年03月

江苏省电子电路设计竞赛二等奖、南航校电赛一等奖

本科阶段

专业技能

编程语言：Python、C++、MATLAB，熟悉 PyTorch 模型训练与实验分析。

视觉感知：目标检测/分割、深度估计、6-DoF 位姿估计、相对导航、多模态融合。

具身智能：VLM Agent、MCP 工具调用、ReAct / Prospective 推理、技能自进化、任务闭环验证。

仿真验证：UE5/Airsim 空间环境搭建，多传感器数据采集，仿真到真实迁移，真实机器人闭环实验。

平台工具：Blender、ROS、Docker、Redis、GitHub、Jetson TX2 / Orin、空间相机、激光雷达。

语言能力：CET-6。

研究兴趣

具身智能体：面向可泛化场景的感知、推理、工具调用与行动闭环。

多模态感知：RGB / 深度 / LiDAR 航天器感知、部件理解、位姿估计与跨域泛化。

系统验证：从 UE5/Airsim 仿真、多源数据构建到真实机器人平台迁移验证。