Cheng Chi

Diffusion Policy 제1저자, UMI 개발자

Cheng Chi (迟成)

Home > People > Cheng Chi


Profile

항목내용
현직Stanford University PhD
이전Columbia University
지도교수Shuran Song

핵심 기여

  • Diffusion Policy 제1저자: 로봇 액션 생성에 diffusion 적용
  • UMI (Universal Manipulation Interface): 범용 조작 데이터 수집 인터페이스
  • 3D Diffusion Policy: 3D 표현 + diffusion 결합

Research Timeline

Columbia → Stanford PhD

Shuran Song 지도

YearWorkImpact
2022연구 시작Columbia CAIR Lab
2023Diffusion Policy로봇 diffusion 선구적 연구
2024UMI범용 조작 인터페이스
20243D Diffusion Policy3D + diffusion
2024Stanford 이동Shuran Song과 함께

Major Publications

Diffusion Policy (RSS 2023, IJRR 2024)

“Diffusion Policy: Visuomotor Policy Learning via Action Diffusion”

핵심 기여:

  • 로봇 액션 생성에 diffusion 최초 적용
  • Multimodal action distribution 처리
  • 4개 벤치마크 평균 46.9% 성능 향상

UMI (2024)

“Universal Manipulation Interface: In-The-Wild Robot Teaching Without In-The-Wild Robots”

핵심 기여:

  • 로봇 없이 인간 손으로 데이터 수집
  • 다양한 로봇에 전이 가능
  • 실제 환경(in-the-wild) 데이터 수집

3D Diffusion Policy (2024)

  • 3D point cloud 입력
  • Diffusion policy + 3D representation

Key Ideas

Diffusion Policy (2023)

핵심: 로봇 액션을 denoising diffusion으로 생성

p(a|o) = ∫ p(aK) ∏ p(ak-1|ak, o) dak:K

과정:
1. 순수 노이즈에서 시작
2. 관측(o) 조건부로 점진적 denoising
3. 최종 액션 시퀀스 생성

vs ACT:

항목Diffusion PolicyACT
생성 방식Iterative denoisingSingle forward pass
Multimodality자연스러운 처리Style variable (z)
학습 안정성매우 높음높음

UMI (2024)

핵심: 로봇 없이 인간 손으로 데이터 수집 후 로봇에 전이

[인간 손 시연] → [UMI 인터페이스] → [로봇 정책 학습]

장점:
- 로봇 하드웨어 없이 데이터 수집
- 실제 환경에서 수집 가능
- 다양한 로봇에 전이

Impact

Diffusion Policy의 영향

  • π0: Flow matching (diffusion의 변형) 채택
  • Octo: Diffusion decoder 사용
  • SmolVLA: Flow matching 사용
  • LeRobot: 기본 지원 모델

UMI의 영향

  • 데이터 수집 비용 대폭 절감
  • Sunday Robotics 등 유사 접근법에 영향

Philosophy

연구 철학

“좋은 표현(representation)과 좋은 생성 모델의 결합이 핵심”

연구 방향

  1. 2022-2023: Diffusion for robot learning
  2. 2024-현재: Data collection interfaces, 3D representations


See Also