영상으로 돌아가기

1X 2026-01-18 04:28

NEO가 스스로 학습하기 시작합니다: 1X 월드 모델

요약

1X의 NEO는 월드 모델을 통해 어떤 프롬프트(음성/텍스트)든 자율적으로 행동 가능
인터넷 규모 비디오로 사전학습 후 로봇 데이터로 파인튜닝, 물리 법칙 기반으로 미래 행동을 시각화
기존 데이터 유무와 무관하게 새로운 작업에 일반화 가능, 스스로 데이터를 생성하며 학습하는 플라이휠 구축

Physical AIHumanoidWorld Model1XNEOSelf-Learning

원본 영상 보기

Chapter 1: 월드 모델 소개 (00:00-00:54)

[00:19] NEO는 이제 어떤 프롬프트(음성/텍스트)든 자율적으로 행동 가능
[00:24] 월드 모델을 통해 인터넷 규모 데이터에서 학습한 내용을 현실 세계에 적용
[00:29] 물리 법칙 기반 비디오 모델로 “미래 행동”을 시각화해 처음 보는 작업에도 일반화 가능
[00:38] 스스로 생성한 데이터로 학습하는 새로운 경로 제시
[00:44] 빠르게 발전하는 비디오 모델과 함께 AI 역량 확장

“[00:19] NEO는 이제 어떤 프롬프트든 자율적으로 행동할 수 있습니다.”

Chapter 2: 학습 파이프라인 (00:55-01:44)

[00:55] 학습 파이프라인: 인간 상호작용 비디오(인터넷 규모)로 사전학습 → 로봇 데이터로 파인튜닝
[01:03] 현실 물리 법칙과 NEO의 휴머노이드 몸체에 대한 이해를 “정착(grounding)”
[01:10] 미래 행동 시각화 + 내장된 역동학 역모델(inverse dynamics model)로 실제 움직임 변환
[01:17] 월드 모델을 NEO의 인지 코어로 사용해 수 초 길이 자율 행동 시퀀스 실행
[01:24] 프롬프트는 음성 또는 텍스트로 제공
[01:34] 데모 예시: 오렌지를 도시락통에 담기

Chapter 3: 실시간 작업 수행 (01:45-02:52)

[01:45] 프롬프트 입력 시 NEO는 현재 시각 정보를 바탕으로 “요청 완료 방법의 시각화” 생성
[01:52] 화면에서 월드 모델이 작업 수행 방법을 시각화하는 과정이 보임
[01:58] 생성 결과 자동 실행 또는 여러 병렬 생성 중 최적안 선택 실행 가능
[02:10] “데이터셋에 유사 예시가 있어서”가 아님을 강조
[02:22] 월드 모델로 어떤 작업이든, 어떤 물체든 수행 가능 (기존 데이터 유무 무관)
[02:34] 변기/변기 시트 사례: 본 적 없고 유사 작업도 없었지만 수행 — “인간 지식의 전이”가 명확히 드러남

“[02:22] 월드 모델을 통해 NEO는 어떤 작업이든 어떤 물체로도 수행할 수 있으며, 기존 데이터가 있든 없든 상관없습니다.”

Chapter 4: 환경 변화 대응 (02:53-03:34)

[02:53] 예측 불가능한 환경에서의 강점
[02:58] 전통적 로봇 AI는 조명 변화, 주변 물체 등 환경 변화에 과도하게 민감
[03:07] NEO의 월드 모델은 인간 지식을 적용해 극단적 환경 변화까지 처리
[03:24] 월드 모델이 “상상할 수 있는 무엇이든” 생성 가능, 한계 없이 자율 실행

Chapter 5: 자가 학습과 미래 (03:35-04:28)

[03:35] 월드 모델은 신뢰할 수 있으며, 활동 중 지속적으로 학습하며 성공 여부 관찰
[03:58] 남은 과제: 생성된 능력의 지속 시간과 성공률 향상
[04:07] 월드 모델로 NEO는 현실 세계 작업 수행 데이터를 무제한으로 생성 가능
[04:13] NEO가 스스로를 가르치는 플라이휠(flywheel) 구축 → “스스로 무엇이든 해낼 수 있게” 됨
[04:19] AI와 로보틱스 분야의 진정한 패러다임 전환

“[04:19] 진정한 패러다임 전환을 의미합니다.”