Chapter 1: 월드 모델 소개 (00:00-00:54)
- [00:19] NEO는 이제 어떤 프롬프트(음성/텍스트)든 자율적으로 행동 가능
- [00:24] 월드 모델을 통해 인터넷 규모 데이터에서 학습한 내용을 현실 세계에 적용
- [00:29] 물리 법칙 기반 비디오 모델로 “미래 행동”을 시각화해 처음 보는 작업에도 일반화 가능
- [00:38] 스스로 생성한 데이터로 학습하는 새로운 경로 제시
- [00:44] 빠르게 발전하는 비디오 모델과 함께 AI 역량 확장
“[00:19] NEO는 이제 어떤 프롬프트든 자율적으로 행동할 수 있습니다.”
Chapter 2: 학습 파이프라인 (00:55-01:44)
- [00:55] 학습 파이프라인: 인간 상호작용 비디오(인터넷 규모)로 사전학습 → 로봇 데이터로 파인튜닝
- [01:03] 현실 물리 법칙과 NEO의 휴머노이드 몸체에 대한 이해를 “정착(grounding)”
- [01:10] 미래 행동 시각화 + 내장된 역동학 역모델(inverse dynamics model)로 실제 움직임 변환
- [01:17] 월드 모델을 NEO의 인지 코어로 사용해 수 초 길이 자율 행동 시퀀스 실행
- [01:24] 프롬프트는 음성 또는 텍스트로 제공
- [01:34] 데모 예시: 오렌지를 도시락통에 담기
Chapter 3: 실시간 작업 수행 (01:45-02:52)
- [01:45] 프롬프트 입력 시 NEO는 현재 시각 정보를 바탕으로 “요청 완료 방법의 시각화” 생성
- [01:52] 화면에서 월드 모델이 작업 수행 방법을 시각화하는 과정이 보임
- [01:58] 생성 결과 자동 실행 또는 여러 병렬 생성 중 최적안 선택 실행 가능
- [02:10] “데이터셋에 유사 예시가 있어서”가 아님을 강조
- [02:22] 월드 모델로 어떤 작업이든, 어떤 물체든 수행 가능 (기존 데이터 유무 무관)
- [02:34] 변기/변기 시트 사례: 본 적 없고 유사 작업도 없었지만 수행 — “인간 지식의 전이”가 명확히 드러남
“[02:22] 월드 모델을 통해 NEO는 어떤 작업이든 어떤 물체로도 수행할 수 있으며, 기존 데이터가 있든 없든 상관없습니다.”
Chapter 4: 환경 변화 대응 (02:53-03:34)
- [02:53] 예측 불가능한 환경에서의 강점
- [02:58] 전통적 로봇 AI는 조명 변화, 주변 물체 등 환경 변화에 과도하게 민감
- [03:07] NEO의 월드 모델은 인간 지식을 적용해 극단적 환경 변화까지 처리
- [03:24] 월드 모델이 “상상할 수 있는 무엇이든” 생성 가능, 한계 없이 자율 실행
Chapter 5: 자가 학습과 미래 (03:35-04:28)
- [03:35] 월드 모델은 신뢰할 수 있으며, 활동 중 지속적으로 학습하며 성공 여부 관찰
- [03:58] 남은 과제: 생성된 능력의 지속 시간과 성공률 향상
- [04:07] 월드 모델로 NEO는 현실 세계 작업 수행 데이터를 무제한으로 생성 가능
- [04:13] NEO가 스스로를 가르치는 플라이휠(flywheel) 구축 → “스스로 무엇이든 해낼 수 있게” 됨
- [04:19] AI와 로보틱스 분야의 진정한 패러다임 전환
“[04:19] 진정한 패러다임 전환을 의미합니다.”