武奥迪计算机 · 博士在读
微信18937531481
邮箱wuaodi20@mails.ucas.ac.cn
方向具身智能体、多模态感知、太空机器人
位置北京 / 中国科学院大学
关于我
我是中国科学院大学计算机应用技术博士生,导师为万雪研究员,在中科院空间应用工程与技术中心开展研究。
我的研究面向空间具身智能,关注具身智能体、视觉感知与导航、仿真到真机验证。过去的工作把 VLM Agent、多模态感知、相对导航和真实机器人/在轨平台连接起来,形成从数据构建、模型训练推理、算法部署到闭环验证的完整链条。
教育经历
中国科学院大学
2023年09月 - 至今(预计2026年12月毕业)
计算机应用技术 博士 · 中科院空间应用工程与技术中心 · 导师:万雪 研究员
北京
研究方向:LVM具身智能体、多模态视觉感知、太空机器人。
中国科学院大学
2020年09月 - 2023年06月
计算机应用技术 硕士 · 中科院空间应用工程与技术中心 · 导师:万雪 研究员
北京
研究方向:空间在轨服务、跨域目标感知、相对导航、空间相机智能曝光对焦调节;GPA:3.78/4.0。
南京航空航天大学
2016年09月 - 2020年06月
探测制导与控制技术 本科 · 自动化学院
南京
GPA:4.0/5.0,平均分 90,排名前 10%;获研究生推免资格,担任班级团支书;获江苏省电赛二等奖(无线充电小车爬坡)、南航校电赛一等奖(单片机编程)。
代表性工作
SpaceMind:面向太空机器人的模块化自进化具身 VLM 智能体
2025年 - 2026年
- 提出面向空间机器人的 embodied VLM agent framework,将 LVM 大脑、MCP 工具库、专用小模型与技能模块解耦,支持 Standard / ReAct / Prospective 三种推理模式。
- 构建技能自进化机制,使智能体能够将失败经验沉淀为可复用技能;在 5 颗卫星、3 类任务、2 个环境下完成 192 次闭环运行。
- UE5 仿真与真实机器人实验室使用同一份代码完成迁移验证,物理平台迁移成功率 100%。该工作对应机器人任务规划、工具调用、技能沉淀和 sim-to-real 闭环验证能力;会议论文被 IAA-SPAICE 2025 接收,期刊扩展版投稿 Acta Astronautica。
SpaceSense-Bench:航天器感知与位姿估计大规模多模态基准
2025年 - 2026年
- 构建包含 136 颗卫星、约 70 GB 时间同步 RGB 图像、深度图、256 线 LiDAR 点云的数据集,提供部件语义标注与高精度 6-DoF 位姿真值。
- 支持 2D/3D 检测、2D/3D 分割、点云分割、深度估计、6-DoF 位姿估计和多模态融合等任务;数据集、代码和工具箱已开源。
- 论文投稿 IROS 2026;项目在 arXiv、HuggingFace 与项目主页发布,HuggingFace 下载量 2700+。
基于动态路由与空间推理的自动驾驶 VLM 增强方案
2025年
- 作为队长参加 IROS 2025 RoboSense Challenge,提出动态路由模块,将不同问题分发给对应专家提示,并结合显式多视图坐标系建模,缓解任务间提示干扰和后视相机方位混淆。
- 基于 Qwen2.5-VL-72B,Phase-1 干净数据 70.87%,Phase-2 受扰数据 72.85%,最终获得亚军与创新解决方案奖,可迁移到机器人多视角感知、空间关系理解和 VLM 决策评估。
CVPR 2024 SPARK 挑战赛:非合作航天器感知
2024年
- 面向仿真与真实卫星图像的航天器位姿估计与部件分割任务,参与集成多分割算法、深度估计、绝对定位与相对定位方法。
- 位姿估计赛道获得冠军(队员),部件分割赛道获得第 4 名(队长)。
硕士期间代表工作:达芬奇在轨服务卫星视觉感知与单目导航
2020年 - 2023年
- 围绕达芬奇空间在轨服务卫星,开展相机控制、视觉感知与单目相对导航研究,工作从算法研发、软硬件集成推进到在轨任务验证,已完成工程落地。
- 提出空间相机智能曝光与对焦控制方法,相关发明专利 CN 2023102948012 已授权;非合作航天器单目相对导航算法完成在轨验证,论文发表于 ICoSR 2022。
- 研究跨域航天器部件分割,提出边缘一致性训练策略,在下游分割任务中提升精度 5.1%,相关论文被 ICDIP 2025 接收;整体工作体现了视觉感知算法从训练、部署到真实任务验证的工程闭环能力。