Shuran Song

Stanford 교수, Diffusion Policy 창시자

Profile

항목내용
현직Stanford University 조교수 (전기공학, 컴퓨터과학 겸임)
이전Columbia University 조교수 (2019-2023)
PhDPrinceton University (2018)
학사Hong Kong University of Science and Technology (2013)
연구실REAL@Stanford (Robotics and Embodied AI Lab)

핵심 기여

  • Diffusion Policy: 로봇 액션 생성에 diffusion 적용, VLA 액션 생성의 새 패러다임
  • 3D Perception: 로봇을 위한 3D 인식 연구
  • UMI (Universal Manipulation Interface): 범용 데이터 수집 인터페이스
  • Columbia -> Stanford 이직 (2023): 로봇 학습 연구 강화

Research Timeline

PhD & Postdoc (2013-2019)

Princeton → Postdoc

YearWorkImpact
20153D ShapeNets3D 딥러닝 초기 연구
2017Semantic Scene Completion3D 장면 이해
2018PhD 졸업

Columbia University (2019-2023)

CAIR Lab 설립

YearWorkImpact
2019Columbia 교수 부임CAIR Lab 설립
2022Sloan Research Fellowship 수상
2023Diffusion Policy로봇 diffusion 선구적 연구

Stanford University (2023-present)

REAL@Stanford 설립

YearWorkImpact
2023Stanford 교수 이직REAL Lab 설립
2024UMI범용 조작 인터페이스 (RSS Outstanding System Paper Finalist)
2024MIT Technology Review Innovators Under 35
2025IEEE RAS Early Academic Career Award

Major Publications

Diffusion for Robotics

  • Diffusion Policy (RSS 2023, IJRR 2024) - 로봇 diffusion 선구적 연구
  • 3D Diffusion Policy (2024)

3D Perception

  • 3D ShapeNets (CVPR 2015) - Zhirong Wu, Shuran Song 외
  • Semantic Scene Completion (CVPR 2017) - Shuran Song, Fisher Yu 외

Robot Manipulation

  • UMI (Universal Manipulation Interface, RSS 2024) - Outstanding System Paper Finalist
  • TidyBot (Autonomous Robots 2023) - Andy Zeng 외 공동연구

Key Ideas

Diffusion Policy (2023)

핵심: 로봇 액션 생성을 denoising diffusion process로 모델링

노이즈 → ... → 액션 시퀀스
(점진적 denoising)

장점:
- Multimodal action distribution 처리
- 높은 학습 안정성
- 고차원 액션 공간에 적합

영향:

  • 이후 π0 (flow matching), Octo (diffusion decoder) 등에 영향
  • LeRobot 기본 지원 모델
  • 로봇 액션 생성의 새 패러다임

UMI (Universal Manipulation Interface, 2024)

핵심: 범용적인 로봇 데이터 수집 인터페이스

특징:
- 다양한 로봇 플랫폼에 적용 가능
- 저비용 데이터 수집
- 표준화된 인터페이스

Philosophy & Direction

연구 철학

“3D 세계 이해와 로봇 조작은 밀접하게 연결되어 있다”

연구 방향 변화

  1. 2013-2018: 3D deep learning, scene understanding
  2. 2019-2022: 3D perception for robotics
  3. 2023-현재: Diffusion for robot learning, manipulation interfaces

Key Collaborations

  • Cheng Chi: Diffusion Policy 제1저자, UMI 공동연구
  • Toyota Research Institute: Diffusion Policy 공동연구 (Benjamin Burchfiel)
  • MIT: Diffusion Policy 공동연구 (Russ Tedrake)
  • Andy Zeng: TidyBot 등 다수 공동연구

Awards & Recognition

  • IEEE Robotics and Automation Society Early Academic Career Award (2025)
  • MIT Technology Review Innovators Under 35 (2024)
  • Samsung AI Researcher of the Year Award (2024)
  • Sloan Research Fellowship (2022)
  • NSF CAREER Award
  • Best Paper Awards: RSS 2022, T-RO 2020
  • Best System Paper Awards: CoRL 2021, RSS 2019
  • Research Awards: Microsoft, Toyota Research, Google, Amazon, JP Morgan


See Also