Homepage

Biography

I am a Member of Technical Staff at Amazon FAR (Frontier AI & Robotics).

I received my Master’s degree from the Robotics Institute at Carnegie Mellon University advised by Guanya Shi, and Bachelor’s degree from Shanghai Jiao Tong University advised by Hesheng Wang and Zhongqiang Ren. I also interned at Tsinghua University (IIIS) advised by Huazhe Xu. During my undergraduate career, I led the programming group at SJTU VEX Robotics Club.

Current Focus: Scalable learning systems for robots to perceive, reason, and act reliably in the real world.

Robots: I have worked on many types of robots, including humanoids, mobile manipulators, and aerial robots.

News

[2026.01.22] FALCON is accepted to L4DC 2026 and selected as an Oral!
[2025.08.01] Hold My Beer is accepted to CoRL 2025.
[2025.04.11] ASAP and Flying Hand are accepted to RSS 2025.
[2025.01.29] Catch It! is accepted to ICRA 2025.

Experience

Applied Scientist Intern May 2025 - Feb. 2026 Amazon Frontier AI & Robotics Team Advisor: Prof. Pieter Abbeel and Dr. Rocky Duan

Research Assistant Oct. 2024 - May 2026 LeCAR Lab, CMU RI Advisor: Prof. Guanya Shi

Research Assistant Jan. 2024 - Jul. 2024 Tsinghua Embodied AI Lab (TEA Lab) Advisor: Prof. Huazhe Xu

Education

Carnegie Mellon University Aug. 2024 - May 2026 M.S. in Robotic Systems Development

Shanghai Jiao Tong University Sep. 2019 - Jun. 2023 B.Eng. in Automation

Research

Humanoids Mobile Manipulation Aerial Manipulation / Drones Multi-Agent Path Planning

(^* denotes equal contributions, ^† indicates equal advising)

Humanoids

RPL: Learning Robust Humanoid Perceptive Locomotion over Challenging Terrains
Yuanhang Zhang, Younggyo Seo, Juyue Chen, Yifu Yuan, Koushil Sreenath, Pieter Abbeel^†, Carmelo Sferrazza^†, Karen Liu^†, Rocky Duan^†, Guanya Shi^†

In Submission

Links: [arXiv][Website][Twitter]

▶ TL;DR

RPL enables robust humanoid perceptive locomotion through a unified multi-depth policy that handles challenging terrains (slopes, stairs, stepping stones), multi-directional movements, payloads.

RPL: Learning Robust Humanoid Perceptive Locomotion over Challenging Terrains

LadderMan: Learning Humanoid Perceptive Ladder Climbing
Siheng Zhao, Yuanhang Zhang, Ziqi Lu, Pieter Abbeel, Rocky Duan, Koushil Sreenath, Yue Wang, C. Karen Liu^†, Guanya Shi^†

In Submission

Links: [arXiv][Website][Twitter]

▶ TL;DR

LadderMan enables humanoids to robustly climb diverse ladders and perform manipulation tasks using a depth-based visuomotor climbing policy and an on-ladder manipulation policy.

LadderMan: Learning Humanoid Perceptive Ladder Climbing

Perceptive Humanoid Parkour: Chaining Dynamic Human Skills via Motion Matching
Zhen Wu, Xiaoyu Huang, Lujie Yang*, Yuanhang Zhang, Koushil Sreenath, Xi Chen, Pieter Abbeel^†, Rocky Duan^†, Angjoo Kanazawa^†, Carmelo Sferrazza^†, Guanya Shi^†, Karen Liu^†

Links: [arXiv][Website][Twitter]

▶ TL;DR

PHP enables agile and long-horizon humanoid parkour with depth perception and motion matching for chaining skills.

Perceptive Humanoid Parkour: Chaining Dynamic Human Skills via Motion Matching

FALCON: Learning Force-Adaptive Humanoid Loco-Manipulation
Yuanhang Zhang, Yifu Yuan, Prajwal Gurunath, Ishita Gupta, Shayegan Omidshafiei, Ali-akbar Agha-mohammadi, Marcell Vazquez-Chanlatte, Liam Pedersen, Tairan He, Guanya Shi

Links: [arXiv][Website][Code][Twitter]

▶ TL;DR

FALCON empowers humanoids with robust locomotion and precise manipulation under significant, unknown 3D end-effector forces, via a novel dual-agent force-adaptive RL framework.

FALCON: Learning Force-Adaptive Humanoid Loco-Manipulation

ASAP: Aligning Simulation and Real-World Physics for Learning Agile Humanoid Whole-Body Skills
Tairan He, Jiawei Gao, Wenli Xiao, Yuanhang Zhang, Zi Wang, Jiashun Wang, Zhengyi Luo, Guanqi He, Nikhil Sobanbab, Chaoyi Pan, Zeji Yi, Guannan Qu, Kris Kitani, Jessica Hodgins, Linxi "Jim" Fan, Yuke Zhu, Changliu Liu, Guanya Shi

Links: [arXiv][Website][Code][Twitter]

▶ TL;DR

ASAP learns agile whole-body humanoid motions via learning a residual action model from the real world to align sim-to-real physics and achieve athletic motions.

Hold My Beer: Learning Gentle Humanoid Locomotion and End-Effector Stabilization Control
Yitang Li, Yuanhang Zhang, Wenli Xiao, Chaoyi Pan, Haoyang Weng, Guanqi He, Tairan He, Guanya Shi

Links: [arXiv][Website][Code]

▶ TL;DR

A slow-fast dual-agent RL framework achieving human-level end-effector stability for humanoids.

Mobile Manipulation

Catch It! Learning to Catch in Flight with Mobile Dexterous Hands
Yuanhang Zhang, Tianhai Liang, Zhenyang Chen, Yanjie Ze, Huazhe Xu

ICRA 2025CoRL 2024 Workshop (Best Paper Nomination)

Links: [arXiv][Website][Code][Twitter]

▶ TL;DR

We build a mobile manipulator with a dexterous hand, and leverage reinforcement learning to train a whole-body control policy for the robot to catch diverse objects randomly thrown by humans.

Catch It! Learning to Catch in Flight with Mobile Dexterous Hands

ViTaS: Visual Tactile Soft Fusion Contrastive Learning for Reinforcement Learning
Yufeng Tian, Shuiqi Cheng, Tianming Wei, Tianxing Zhou, Yuanhang Zhang, Zixian Liu,
Zhecheng Yuan, Huazhe Xu

Introduced ViTaS, a framework using using Soft Fusion Contrastive Learning and a CVAE module to fuse visual and tactile information, achieving state-of-the-art performance with high sample efficiency and low parameter count in robotic manipulation.

Aerial Manipulation / Drones

Flying Hand: End-Effector-Centric Framework for Versatile Aerial Manipulation Teleoperation and Policy Learning
Guanqi He, Xiaofeng Guo, Luyi Tang, Yuanhang Zhang, Mohammadreza Mousaei, Jiahe Xu, Junyi Geng, Sebastian Scherer, Guanya Shi

RSS 2025

Links: [Paper][Website]

▶ TL;DR

A unified aerial manipulation framework that enhances precision and versatility through an end-effector-centric interface.

Perception-constrained Visual Servoing Based NMPC for Quadrotor Flight

Undergraduate Thesis

Links: [Code][Video]

▶ TL;DR

Incorporated quadrotor dynamics and visual feature dynamics into NMPC to enable the quadrotor to flight purely based on visual information without localization.

Perception-constrained Visual Servoing Based NMPC for Quadrotor Flight

Multi-Agent Path Planning

Multi-Agent Combinatorial Path Finding with Heterogeneous Task Duration
Yuanhang Zhang, Xuemian Wu, Hesheng Wang, Zhongqiang Ren

SoCS 2024

Links: [arXiv][Code][Video]

▶ TL;DR

Proposed two conflict-based search methods--CBSS-TPG (conflict-free) and CBSS-D (conflict-free and minimal cost) to solve the multi-agent combinatorial path finding problem with target duration.

Multi-Agent Combinatorial Path Finding with Heterogeneous Task Duration

Competitions

Leadership

Awards

Outstanding Paper Nomination in LFDM Workshop at CoRL 2024
SJTU Outstanding Graduate (top 3%)
SJTU Merit Student (top 3%)
SJTU Academic Progress Scholarship

Reviewer Service

IROS 2026 IEEE/RSJ International Conference on Intelligent Robots and Systems

CoRL 2025 Conference on Robot Learning

ICRA 2025 IEEE International Conference on Robotics and Automation

IROS 2025 IEEE/RSJ International Conference on Intelligent Robots and Systems

Biography

News

Experience

Education

Research

Humanoids

RPL: Learning Robust Humanoid Perceptive Locomotion over Challenging Terrains Yuanhang Zhang, Younggyo Seo, Juyue Chen, Yifu Yuan, Koushil Sreenath, Pieter Abbeel†, Carmelo Sferrazza†, Karen Liu†, Rocky Duan†, Guanya Shi†

In Submission

Links: [arXiv][Website][Twitter]

▶ TL;DR

LadderMan: Learning Humanoid Perceptive Ladder Climbing Siheng Zhao, Yuanhang Zhang, Ziqi Lu, Pieter Abbeel, Rocky Duan, Koushil Sreenath, Yue Wang, C. Karen Liu†, Guanya Shi†

In Submission

Links: [arXiv][Website][Twitter]

▶ TL;DR

Perceptive Humanoid Parkour: Chaining Dynamic Human Skills via Motion Matching Zhen Wu*, Xiaoyu Huang*, Lujie Yang*, Yuanhang Zhang, Koushil Sreenath, Xi Chen, Pieter Abbeel†, Rocky Duan†, Angjoo Kanazawa†, Carmelo Sferrazza†, Guanya Shi†, Karen Liu†

Links: [arXiv][Website][Twitter]

▶ TL;DR

FALCON: Learning Force-Adaptive Humanoid Loco-Manipulation Yuanhang Zhang, Yifu Yuan, Prajwal Gurunath, Ishita Gupta, Shayegan Omidshafiei, Ali-akbar Agha-mohammadi, Marcell Vazquez-Chanlatte, Liam Pedersen, Tairan He, Guanya Shi

Links: [arXiv][Website][Code][Twitter]

▶ TL;DR

Links: [arXiv][Website][Code][Twitter]

▶ TL;DR

Hold My Beer: Learning Gentle Humanoid Locomotion and End-Effector Stabilization Control Yitang Li, Yuanhang Zhang, Wenli Xiao, Chaoyi Pan, Haoyang Weng, Guanqi He, Tairan He, Guanya Shi

Links: [arXiv][Website][Code]

▶ TL;DR

Mobile Manipulation

Catch It! Learning to Catch in Flight with Mobile Dexterous Hands Yuanhang Zhang*, Tianhai Liang*, Zhenyang Chen, Yanjie Ze, Huazhe Xu

Links: [arXiv][Website][Code][Twitter]

▶ TL;DR

ViTaS: Visual Tactile Soft Fusion Contrastive Learning for Reinforcement Learning Yufeng Tian*, Shuiqi Cheng*, Tianming Wei, Tianxing Zhou, Yuanhang Zhang, Zixian Liu,Zhecheng Yuan, Huazhe Xu

▶ TL;DR

Aerial Manipulation / Drones

Flying Hand: End-Effector-Centric Framework for Versatile Aerial Manipulation Teleoperation and Policy Learning Guanqi He*, Xiaofeng Guo*, Luyi Tang, Yuanhang Zhang, Mohammadreza Mousaei, Jiahe Xu, Junyi Geng, Sebastian Scherer, Guanya Shi

Links: [Paper][Website]

▶ TL;DR

Perception-constrained Visual Servoing Based NMPC for Quadrotor Flight

Undergraduate Thesis

Links: [Code][Video]

▶ TL;DR

Multi-Agent Path Planning

Multi-Agent Combinatorial Path Finding with Heterogeneous Task Duration Yuanhang Zhang, Xuemian Wu, Hesheng Wang, Zhongqiang Ren

Links: [arXiv][Code][Video]

▶ TL;DR

Competitions

Leadership

Awards

Reviewer Service

Templates (for web app):

Error

RPL: Learning Robust Humanoid Perceptive Locomotion over Challenging Terrains
Yuanhang Zhang, Younggyo Seo, Juyue Chen, Yifu Yuan, Koushil Sreenath, Pieter Abbeel^†, Carmelo Sferrazza^†, Karen Liu^†, Rocky Duan^†, Guanya Shi^†

LadderMan: Learning Humanoid Perceptive Ladder Climbing
Siheng Zhao, Yuanhang Zhang, Ziqi Lu, Pieter Abbeel, Rocky Duan, Koushil Sreenath, Yue Wang, C. Karen Liu^†, Guanya Shi^†

Perceptive Humanoid Parkour: Chaining Dynamic Human Skills via Motion Matching
Zhen Wu, Xiaoyu Huang, Lujie Yang*, Yuanhang Zhang, Koushil Sreenath, Xi Chen, Pieter Abbeel^†, Rocky Duan^†, Angjoo Kanazawa^†, Carmelo Sferrazza^†, Guanya Shi^†, Karen Liu^†

FALCON: Learning Force-Adaptive Humanoid Loco-Manipulation
Yuanhang Zhang, Yifu Yuan, Prajwal Gurunath, Ishita Gupta, Shayegan Omidshafiei, Ali-akbar Agha-mohammadi, Marcell Vazquez-Chanlatte, Liam Pedersen, Tairan He, Guanya Shi

Hold My Beer: Learning Gentle Humanoid Locomotion and End-Effector Stabilization Control
Yitang Li, Yuanhang Zhang, Wenli Xiao, Chaoyi Pan, Haoyang Weng, Guanqi He, Tairan He, Guanya Shi

Catch It! Learning to Catch in Flight with Mobile Dexterous Hands
Yuanhang Zhang, Tianhai Liang, Zhenyang Chen, Yanjie Ze, Huazhe Xu

ViTaS: Visual Tactile Soft Fusion Contrastive Learning for Reinforcement Learning
Yufeng Tian, Shuiqi Cheng, Tianming Wei, Tianxing Zhou, Yuanhang Zhang, Zixian Liu,
Zhecheng Yuan, Huazhe Xu

Flying Hand: End-Effector-Centric Framework for Versatile Aerial Manipulation Teleoperation and Policy Learning
Guanqi He, Xiaofeng Guo, Luyi Tang, Yuanhang Zhang, Mohammadreza Mousaei, Jiahe Xu, Junyi Geng, Sebastian Scherer, Guanya Shi

Multi-Agent Combinatorial Path Finding with Heterogeneous Task Duration
Yuanhang Zhang, Xuemian Wu, Hesheng Wang, Zhongqiang Ren