Kimi K2.5: 에이전트 룸과 멀티모달 코딩의 진화

요약

  1. Moonshot AI 창립자 즈힐린 양이 1조 파라미터 오픈소스 모델 Kimi K2.5를 공개한다.
  2. 에이전트/코딩/비전 역량을 통합하고, 화면 녹화만으로 코드를 재구축하는 기능을 선보인다.
  3. 단일 에이전트에서 "에이전트 룸"으로 전환해 전문화된 에이전트들이 병렬 작업하는 아키텍처를 소개한다.

Kimi K2.5 개요

Moonshot AI 창립자 즈힐린 양이 최신 모델 Kimi K2.5를 공개했다. 6개월 전 출시한 K2에 이어, 에이전트·코딩·비전·전반 역량을 모두 갖춘 오픈소스 모델이다.

  • [00:06] K2는 오픈 모델 최초로 1조 파라미터까지 확장된 모델
  • [00:15] K2 Thinking은 도구 호출과 사고를 최대 300단계까지 스스로 수행
  • [00:37] K2.5는 Humanities Last Exam, Browse Comp, Deep Search QA에서 새 기록 달성

코딩과 디자인의 결합

K2.5는 단순한 코딩 모델이 아니라 디자인 감각까지 갖춘 모델이다.

  • [00:53] 단순히 코딩만이 아니라 디자이너급 웹사이트를 만들어냄
  • [01:07] 화면 녹화 업로드만 하면 처음부터 깔끔하고 전문적인 코드로 재구축
  • [01:22] Kimi Code는 이미지와 비디오 입력을 지원하고 기존 스킬을 자동으로 통합

“좋은 흐름/감각을 만들며, ‘시각적 시(visual poem)‘를 만들어낸다.”

오피스 스위트와 생산성

K2.5는 일상 워크플로에서도 강력하다.

  • [01:41] 복잡한 재무 모델 생성, 전문 PDF 서식 처리, 컨설팅 수준 덱 제작 가능
  • [01:53] 과거에는 50개 부서 보고서 통합이 며칠 걸렸지만 이제는 더 빨라짐
  • [01:59] 3만 단어 문서를 정확한 피치 덱으로 10분 만에 변환

에이전트 룸: 단일 에이전트에서 스웜으로

K2.5의 핵심 혁신은 “에이전트 룸(Agent Room)” 아키텍처다.

  • [02:08] 한 에이전트에게 모두 시키는 대신, K2.5가 룸을 만들고 조율
  • [02:18] 전문화 에이전트들은 K2.5의 복사본이지만 역할과 하위 과제가 다름
  • [02:24] 역할과 하위 과제는 미리 정의되지 않고 즉석에서 K2.5가 생성
  • [02:32] 병렬 실행이 복잡한 작업에 필요한 시간을 크게 단축

실제 활용 사례:

  • [02:34] 100개 기업 시장 조사: 10여 명 규모 분석가 스웜으로 몇 분 만에 수행
  • [02:44] 300페이지 번역 프로젝트: 언어학자 팀 동원해 빠르고 정확하게 납품
  • [02:51] 50편 논문 문헌 종합: 시니어 연구원 10명이 병렬 분석 후 서베이 보고서 작성

기술적 도전과 해결

  • [03:01] 대규모 에이전트 스웜 훈련을 위해 강화학습(RL) 인프라를 재구축
  • [03:06] 훈련 알고리즘을 최적화해 효율과 성능을 보장
  • [03:27] K2.5는 앱과 API를 통해 오늘부터 이용 가능

“[01:59] 3만 단어짜리 작업 문서를 정확한 피치 덱으로 바꾸는 일도 이제는 10분 만에 이루어집니다.”