Cheng Chi (迟成)
Home > People > Cheng Chi
Profile
| 항목 | 내용 |
|---|---|
| 현직 | Stanford University PhD |
| 이전 | Columbia University |
| 지도교수 | Shuran Song |
핵심 기여
- Diffusion Policy 제1저자: 로봇 액션 생성에 diffusion 적용
- UMI (Universal Manipulation Interface): 범용 조작 데이터 수집 인터페이스
- 3D Diffusion Policy: 3D 표현 + diffusion 결합
Research Timeline
Columbia → Stanford PhD
Shuran Song 지도
| Year | Work | Impact |
|---|---|---|
| 2022 | 연구 시작 | Columbia CAIR Lab |
| 2023 | Diffusion Policy | 로봇 diffusion 선구적 연구 |
| 2024 | UMI | 범용 조작 인터페이스 |
| 2024 | 3D Diffusion Policy | 3D + diffusion |
| 2024 | Stanford 이동 | Shuran Song과 함께 |
Major Publications
Diffusion Policy (RSS 2023, IJRR 2024)
“Diffusion Policy: Visuomotor Policy Learning via Action Diffusion”
핵심 기여:
- 로봇 액션 생성에 diffusion 최초 적용
- Multimodal action distribution 처리
- 4개 벤치마크 평균 46.9% 성능 향상
UMI (2024)
“Universal Manipulation Interface: In-The-Wild Robot Teaching Without In-The-Wild Robots”
핵심 기여:
- 로봇 없이 인간 손으로 데이터 수집
- 다양한 로봇에 전이 가능
- 실제 환경(in-the-wild) 데이터 수집
3D Diffusion Policy (2024)
- 3D point cloud 입력
- Diffusion policy + 3D representation
Key Ideas
Diffusion Policy (2023)
핵심: 로봇 액션을 denoising diffusion으로 생성
p(a|o) = ∫ p(aK) ∏ p(ak-1|ak, o) dak:K
과정:
1. 순수 노이즈에서 시작
2. 관측(o) 조건부로 점진적 denoising
3. 최종 액션 시퀀스 생성
vs ACT:
| 항목 | Diffusion Policy | ACT |
|---|---|---|
| 생성 방식 | Iterative denoising | Single forward pass |
| Multimodality | 자연스러운 처리 | Style variable (z) |
| 학습 안정성 | 매우 높음 | 높음 |
UMI (2024)
핵심: 로봇 없이 인간 손으로 데이터 수집 후 로봇에 전이
[인간 손 시연] → [UMI 인터페이스] → [로봇 정책 학습]
장점:
- 로봇 하드웨어 없이 데이터 수집
- 실제 환경에서 수집 가능
- 다양한 로봇에 전이
Impact
Diffusion Policy의 영향
- π0: Flow matching (diffusion의 변형) 채택
- Octo: Diffusion decoder 사용
- SmolVLA: Flow matching 사용
- LeRobot: 기본 지원 모델
UMI의 영향
- 데이터 수집 비용 대폭 절감
- Sunday Robotics 등 유사 접근법에 영향
Philosophy
연구 철학
“좋은 표현(representation)과 좋은 생성 모델의 결합이 핵심”
연구 방향
- 2022-2023: Diffusion for robot learning
- 2024-현재: Data collection interfaces, 3D representations