Generalist AI

Generalist AI - GEN-0와 로보틱스 스케일링 법칙

Generalist AI

Home > Companies > Generalist AI


Overview

Generalist AI는 OpenAI, Google DeepMind, Boston Dynamics 출신 팀이 설립한 스타트업입니다 (회사 발표 기반). 270,000시간의 실제 물리 상호작용 데이터로 로보틱스 분야 최초의 스케일링 법칙을 발견했다고 주장합니다.

항목내용
발표2025년 11월 4일
핵심 모델GEN-0
핵심 주장로보틱스 스케일링 법칙 발견
데이터270,000+ 시간 실제 데이터
블로그generalistai.com/blog

창업팀

배경

출신기여
OpenAIChatGPT, GPT-4 스케일링
Google DeepMindPaLM-E, RT-2 개발
Boston DynamicsAtlas, Spot, Stretch
기타자율주행 기반 기술

GEN-0 모델

핵심 특징

항목내용
학습 데이터270,000+ 시간
데이터 소스실제 물리적 상호작용
환경가정, 베이커리, 세탁소, 창고, 공장
태스크감자 깎기부터 볼트 조이기까지

아키텍처: Harmonic Reasoning

System 1-System 2에 의존하지 않는 새로운 접근:

┌────────────────────────────────────────┐
│           Harmonic Reasoning           │
│                                        │
│  [Sensing Stream] ←→ [Acting Stream]   │
│         (연속적, 비동기적)              │
│                                        │
│  "조화로운 상호작용"                    │
└────────────────────────────────────────┘
특징설명
핵심감지와 행동의 연속 스트림 조화
장점매우 큰 모델 크기로 스케일 가능
지원 로봇6, 7, 16+ 자유도

로보틱스 스케일링 법칙

핵심 발견 (회사 주장)

LLM처럼 로보틱스에서도 예측 가능한 스케일링:

L(D) ∝ D^(-0.5)

L = 다운스트림 태스크 오류
D = 사전학습 데이터 양

→ 데이터 2배 → 오류 ~30% 감소

관찰 결과

요소효과
사전학습 데이터 ↑성능 ↑
컴퓨트 ↑성능 ↑
예측 가능성일관되고 예측 가능한 향상

지능 임계점 (Phase Transition)

7B 파라미터 임계점

모델 크기현상
< 1B복잡한 데이터 흡수 실패, “경직화” (ossification)
7B+데이터 내재화, 지속적 개선

의미

< 7B: 데이터를 더 줘도 개선 한계
≥ 7B: 더 많은 데이터 → 계속 개선
      + 적은 후속 학습으로 새 태스크 적응

→ 7B가 로보틱스의 **“GPT-3 모멘트”**일 수 있음


데이터 수집

규모

항목수치
총 데이터270,000+ 시간
수집 환경1,000+ 장소
주간 증가10,000+ 시간
타입실제 물리적 상호작용만

철학: 실제 데이터 우위

시뮬레이션: 물리적 정확도 한계
인간 비디오: 액션 추출 어려움
텔레옵: 느리고 비쌈

Generalist 관점: "실제 물리 상호작용만이 진짜"
→ 270K 시간 실제 데이터로 입증

Cross-Embodiment

다양한 로봇 지원

설계 단계부터 다양한 로봇 형태 지원:

자유도테스트
6 DoF
7 DoF
16+ DoF

의의

GEN-0의 주장이 사실이라면:

영향설명
스케일링로보틱스도 LLM처럼 스케일링 가능 증명
경제적 정당성대규모 투자에 대한 ROI 예측 가능
데이터 논쟁실제 데이터 우위 주장 강화
업계 반응”로보틱스의 ChatGPT 모멘트”

References


See Also