Galbot

Synthetic Data First 전략으로 대규모 상용 배포를 달성한 중국 로보틱스 유니콘

Overview

Galbot(银河通用机器人, Galaxy General Robotics)은 중국 기반의 full-stack 로보틱스 유니콘으로, “Synthetic First, Real Data as a Complement” 철학으로 VLA 분야 최초의 대규모 상용 배포를 달성했습니다. 99% synthetic + <1% real data로 production-ready 시스템을 구축합니다.

항목내용
설립2023년 5월
본사Beijing, China (Haidian District)
R&D 센터Beijing, Shenzhen, Suzhou, Hong Kong
공동 창업자He Wang (왕허, CTO), TengZhou Yao (야오텅저우)
연계 기관Beijing Academy of AI (BAAI), PKU EPIC Lab
펀딩총 $800M+ (2025년 12월 기준)
기업가치$3B (2025년 12월 기준)
미션”Make robots for every industry and every home”

He Wang (왕허): 1992년생, Tsinghua University 졸업 후 Stanford University에서 박사학위 취득(2021, 지도교수: Leonidas J. Guibas). 현재 Peking University CFCS 조교수이자 PKU EPIC Lab 설립자.


주요 제품

Galbot G1

세미 휴머노이드 모바일 매니퓰레이터:

항목사양
높이173cm
무게85kg
팔 span190cm
최대 도달 높이240cm
Payload5kg (단일 팔)
배터리10시간 연속 작동
처리 가능 품목5,000+ 종류

Galbot S1

산업용 중량급 로봇 (2025년 출시):

항목사양
Payload50kg (양팔 연속)
용도제조업, 중공업

핵심 성과

상용 배포

항목수치
Galbot Store30+ 중국 도시
스마트 약국/창고30+ 완전 무인
창고 내 인력0명
MTBF1개월+
연속 작업10시간/충전

주요 파트너십

  • 제조업: CATL, Bosch, Toyota, Hyundai
  • 헬스케어: Xuanwu Hospital (환자실, 약국, 안내 시스템)

GraspVLA 성능 (LIBERO Zero-shot)

모델LongGoalObject조건
OpenVLA33.7%56.6%65.4%fine-tuned
π062.7%79.4%93.8%fine-tuned
GraspVLA82.0%91.2%94.1%zero-shot

Fine-tuning 없이 fine-tuned 모델들을 능가


기술 아키텍처

Cerebrum-Cerebellum 구조

인간의 뇌 구조를 모방한 이중 시스템:

구성요소역할구현
Cerebrum (대뇌)High-level policy - 무엇을 할지VLA (Imitation + Web Grounding)
Cerebellum (소뇌)Low-level motor - 어떻게 할지RL 기반 100Hz control

GraspVLA

컴포넌트사양
Vision EncoderDINO-v2 + SigLIP
LLM BackboneInternLM2 1.8B
Action ExpertFlow Matching
학습 데이터1B synthetic + 100M+ web grounding
학습 비용~$5,000 (160×RTX 4090, 10일)

데이터 전략

Synthetic Data Pipeline

Scene Synthesis

Trajectory Generation
  ├─ Physics-based Energy Optimization (DexGraspNet)
  ├─ Human Videos → Synthetic (GenHOI)
  └─ Large-Scale RL (UniDexGrasp++)

Validation & Rendering
  ├─ MuJoCo physics validation
  └─ Isaac Sim ray-tracing

Sim2Real Transfer (1B frames 수렴)

Scaling Law 발견

  • 1B frames에서 sim/real 성능 커브 수렴
  • 데이터 규모 증가 시 sim2real gap 감소
  • Teleoperation으로는 불가능한 규모

데이터 규모

데이터 유형규모
Synthetic trajectoriesBillion-scale
DexGraspNet 2.0 grasps426M
Web grounding (GRIT)100M+ bboxes
Real data 비중<1%

연구 포트폴리오

Grasping

연구학회핵심
DexGraspNetICRA 2023 FinalistMillion-scale dexterous grasp
UniDexGrasp++ICCV 2023 FinalistLarge-scale RL, policy distillation
DexGraspNet 2.0CoRL 20247 embodiments, 426M grasps
DexonomyRSS 2025100+ grasp taxonomy
GraspVLA2025Billion-scale synthetic VLA

Sim2Real 해결

연구핵심
DexNDMWorld model로 sim2real gap 보정

DexNDM 접근법:

  1. 시뮬레이터에서 generalist policy 학습
  2. 소량의 real data로 neural dynamics model 학습
  3. Back-propagation으로 sim2real gap 수정 (미분 가능)
연구핵심
NavFoMCross-embodiment navigation foundation model
TrackVLA30분+ human tracking

6대 역량 평가

평가근거
Long-horizonCloth folding 등 deformable manipulation sim2real
PrecisionDexNDM으로 드라이버, 망치 등 정밀 in-hand manipulation
Deployment RobustnessMTBF 1개월+, 30+ 무인 창고 운영
Multi-taskGraspVLA zero-shot 82% (LIBERO)
Cross-embodiment7 hand embodiment 지원
Zero-shotπ0 fine-tuned 능가

한계점

명시적 한계 (발표에서 인정)

한계설명
Task ScopeGrasping 특화, generalist는 아직
Dexterous Sim2Real초기에 실패 → DexNDM으로 해결
Specialist vs GeneralistMotion control은 아직 specialist policy

분석적 한계

한계설명
Pure Sim2Real 아님Web grounding (100M+ real images) 포함
원리 설명 부족왜 1B frames에서 수렴하는지 이론적 설명 없음
Embodiment 일반화Franka Panda 중심, cross-robot transfer 제한적

vs 경쟁사

항목GalbotPhysical IntelligenceFigure
배포 규모30+ 도시 + 30+ 창고연구 데모연구 데모
데이터 전략99% syntheticCross-embodiment realVLA (Helix)
강점상용 배포 유일범용성 추구산업용 최적화
한계Grasping 특화Zero-shot 약함가정용 미지원

References


See Also