1.多模态感知与SLAM:开发与优化基于多传感器(相机、LiDAR、IMU等)的SLAM、目标检测、分割、3D场景重建技术,为机器人构建精确、鲁棒的环境认知能力。
2.视觉语言交互与任务规划:探索并实现Visual Language Action (VLA) 与Visual Language Navigation (VLN) 等前沿技术,使机器人能理解自然语言指令,并分解为可执行的动作序列。
3.大模型与决策系统:研究并将多模态大模型技术应用于机器人任务规划、场景问答与人机交互,提升机器人的认知与决策智能。
4.系统集成与验证:在ROS 2系统中集成感知与决策模块,并与控制、运动团队协同,在仿真(Isaac Gym, Gazebo)和真实机器人平台上进行端到端的测试与部署。
联系我时,就说是在 中智聚才网 上看到的