2026년 4월 23일

OpenAI, GPT-5.5 출시·API는 지연

  • OpenAI, GPT-5.5 출시·API는 지연
  • Codex 기능 번들: 브라우저·Sheets·Slides 지원
  • Artificial Analysis, 환각 86% 등 위험도 지적
  • Qwen3.6-27B, 로컬 코딩·추론 성능 호평
  • Anthropic, Claude Code 회귀 원인·대응 공개
#OpenAI#GPT-5.5#Codex#Qwen#Anthropic
2026년 4월 22일

Qwen3.6-27B, 로컬 코딩 모델로 급부상

  • Qwen3.6-27B, 로컬 코딩 성능 급상승
  • OpenAI Privacy Filter, PII 마스킹 공개
  • Google, TPU 8t/8i와 에이전트 플랫폼 발표
  • 팀용 워크스페이스 에이전트, Slack 연동 확산
  • Anthropic, Claude Code 티어 변경 테스트 논란
#OpenAI#Codex#Qwen#Google#Anthropic
2026년 4월 21일

OpenAI, GPT-Image-2로 ChatGPT Images 2.0 출시

  • OpenAI, GPT-Image-2로 이미지 기능 강화
  • Hugging Face, `ml-intern` 에이전트 공개
  • Moonshot, Kimi K2.6·FlashKDA 인프라 공개
  • Google, Gemini API에 Deep Research Max 추가
  • LightOn·vLLM, 검색·배포 실무 지원 강화
#OpenAI#GPT-Image-2#Hugging Face#Kimi#Gemini#vLLM
2026년 4월 17일

Anthropic, Claude Design·Opus 4.7 공개

  • Anthropic, Claude Design·Opus 4.7 공개
  • Codex Computer Use, 기업용 UX로 부상
  • 간단한 하네스(harness)가 신뢰성 좌우
  • Qwen3.6, 로컬 추론(inference) 효율 개선
  • Stargate, 2029년 9+GW 전력 수요 전망
#Anthropic#Claude#OpenAI#Codex#Qwen#에이전트
2026년 4월 16일

Anthropic이 Claude Opus 4.7 출시

  • Anthropic이 Claude Opus 4.7 출시
  • OpenAI가 Codex를 에이전트로 확장
  • Alibaba, Qwen3.6-35B-A3B 오픈 공개
  • Cloudflare, Artifacts·Email로 에이전트 인프라
  • CRUX·AlphaEval로 오픈월드 평가 확산
#Anthropic#Claude#OpenAI#Codex#Qwen
2026년 4월 15일

OpenAI, Agents SDK 하네스 분리와 샌드박스 확장

  • OpenAI, Agents SDK 하네스 분리와 샌드박스 확장
  • Cloudflare, Project Think와 Agent Lee 공개
  • Google, Mac용 Gemini 앱 출시 및 기능 확장
  • Gemini 3.1 Flash TTS, 제어형 음성 기능 강화
  • GPT-5.4 Pro의 Erdős 문제 #1196 증명 논의 확산
#OpenAI#Codex#Cloudflare#Gemini#Agents
2026년 4월 14일

Google Chrome 'Skills'로 1클릭 워크플로

  • Chrome에 Skills로 1클릭 실행 추가
  • Gemini Robotics-ER 1.6 API 공개
  • OpenAI GPT-5.4-Cyber 접근 확대
  • Hugging Face, Hub에 Kernels 출시
  • OpenRouter Elephant Alpha, 100B 공개
#OpenAI#Codex#Google#Gemini#OpenRouter
2026년 4월 13일

Hermes Agent v0.9.0 로컬 대시보드 출시

  • Hermes Agent v0.9.0 로컬 대시보드 출시
  • Claude Mythos, AISI 사이버 레인지 첫 종주
  • LlamaIndex ParseBench 문서 파싱 벤치마크 공개
  • Hugging Face, 5B로 arXiv 2.7만편 OCR
  • Copilot 원격제어·Cursor 분할 에이전트 추가
#OpenAI#Codex#Hermes#Claude#LlamaIndex
2026년 4월 10일

GLM-5.1, Code Arena 코딩 3위 등극

  • GLM-5.1, Code Arena 코딩 3위 등극
  • ‘저렴한 실행자+비싼 어드바이저’ 확산
  • Hermes Agent 생태계 확장, 50k★ 달성
  • ClawBench, 실전 웹 과제 성공률 6.5%
  • Gemma 4, llama.cpp 안정화와 템플릿 배포
#GLM-5.1#Anthropic#LangChain#Hermes#llama.cpp
2026년 4월 9일

Meta가 MSL 첫 모델 Muse/Spark를 공개했다

  • Meta가 MSL 첫 모델 Muse/Spark를 공개했다
  • OpenAI가 Codex 5배 $100 Pro를 도입했다
  • LangChain이 Deep Agents deploy를 출시했다
  • Gemma 4가 첫 주 1000만 다운로드를 돌파했다
  • RAGEN-2가 에이전트 RL 붕괴를 분석했다
#Meta#OpenAI#LangChain#Gemma#Anthropic
2026년 4월 8일

Meta, MSL 첫 모델 Muse Spark 정식 공개

  • Meta, MSL 첫 모델 Muse Spark 정식 공개
  • Zhipu AI GLM-5.1, 오픈 웨이트 선두
  • Anthropic, 장기 실행용 Managed Agents 공개
  • Qwen3.6-Plus 지표 개선, 가중치 미공개
  • APEX-Agents-AA, 롱호라이즌 한계 확인
#Meta#Muse Spark#Anthropic#GLM-5.1#Agents#OpenAI#Codex
2026년 4월 7일

Gemma 4, 아이폰 17 Pro에서 40 tok/s 온디바이스 구동

  • Gemma 4가 로컬·온디바이스 붐을 촉발
  • Hermes Agent, 자기개선 에이전트 루프 확산
  • OpenAI, ‘Industrial Policy’로 정책 신호
  • Anthropic, 2027 TPU·$30B 런레이트 공개
  • RL·라우팅·MoE 등 연구·시스템 업데이트
#Gemma#OpenAI#Anthropic#에이전트#시스템
2026년 4월 6일

Hermes, Manim 영상 생성 스킬 공개

  • Hermes가 Manim 영상 생성 스킬 공개
  • Claude Code 제한 강화로 대안 에이전트 확산
  • Gemma 4 수요 급증, 생태계 통합 확대
  • TurboQuant-GPU로 KV 캐시 5.02x 압축
  • 뉴요커, 샘 알트만 의혹 조사 보도 공개
#OpenAI#Codex#Hermes#Claude Code#Gemma 4
2026년 4월 3일

Google이 Apache 2.0으로 Gemma 4 공개

  • Google이 Apache 2.0으로 Gemma 4 공개
  • Gemma 4, vLLM·llama.cpp 등 즉시 지원
  • Hermes Agent가 오픈 하네스(harness)로 부상
  • Codex 확산 vs Claude Code 레이트 리밋 논쟁
  • Anthropic, Claude의 171 감정 벡터 연구 공개
#Google#Gemma#Hermes#Anthropic#Codex
2026년 4월 2일

구글 딥마인드, Gemma 4 오픈웨이트 공개

  • 구글 딥마인드, Gemma 4 오픈웨이트 공개
  • Gemma 4, 256K 컨텍스트·멀티모달 지원
  • 생태계가 llama.cpp·vLLM 등 즉시 지원
  • Anthropic이 Claude 내부 감정 벡터 연구 공개
  • OpenAI가 CarPlay 음성모드와 Codex 과금 변경
#Google#Gemma#OpenAI#Codex#Anthropic#Qwen
2026년 4월 1일

Claude Code 소스 유출로 DMCA 논란 확산

  • Arcee Trinity-Large-Thinking 오픈 웨이트 출시
  • Z.ai, GLM-5V-Turbo 비전 코딩 모델 발표
  • Claude Code 소스 유출로 DMCA 논란 확산
  • OpenAI, Codex 사용량 한도를 전 플랜 리셋
  • PrismML 1-bit Bonsai로 로컬 LLM 효율↑
#OpenAI#Codex#Anthropic
2026년 3월 31일

Claude Code 소스 유출, 하네스 설계가 드러남

  • Claude Code 소스 유출, 하네스 설계가 드러남
  • 가중치 아닌 오케스트레이션 로직 노출
  • Bonsai 1-bit 모델, 초소형 효율 강조
  • OpenAI, $122B 커밋 자본·$852B 가치
  • TRL v1.0, RL 툴링 대폭 확장
#Anthropic#Claude Code#OpenAI#Codex#보안
2026년 3월 30일

Anthropic, Claude Code에 컴퓨터 사용 도입

  • Anthropic, Claude Code에 컴퓨터 사용 도입
  • OpenAI, Claude Code용 Codex 플러그인 공개
  • Alibaba, Qwen3.5-Omni 멀티모달 모델 출시
  • Nous, Hermes Agent 업데이트로 오픈 에이전트 확산
  • llama.cpp, GitHub 10만 ★ 돌파로 로컬 열기
#OpenAI#Codex#Anthropic#Claude Code#에이전트
2026년 3월 27일

Anthropic의 Opus 상위 ‘Capybara’ 티어가 유출됐다

  • Anthropic의 Opus 상위 ‘Capybara’ 티어가 유출됐다
  • Zhipu가 GLM-5.1을 코딩 플랜에 공개했다
  • TurboQuant 논문이 RaBitQ 오기재로 논란이다
  • OpenAI가 Codex 플러그인으로 자동화를 밀었다
  • Meta가 SAM 3.1로 비디오 처리량을 2배로 늘렸다
#Anthropic#OpenAI#Codex#GLM-5.1#TurboQuant
2026년 3월 26일

OpenAI GPT-5.4 mini/nano 성능·비용 경쟁

  • Google, Gemini 3.1 Flash Live 공개
  • Mistral Voxtral TTS 오픈웨이트 출시
  • Cohere Transcribe, 첫 오디오 모델 공개
  • OpenAI GPT-5.4 mini/nano 성능·비용 경쟁
  • Cline Kanban, 멀티 에이전트 워크트리 지원
#OpenAI#GPT-5.4#Gemini
2026년 3월 25일

ARC-AGI-3 공개, 인간 100%·모델 <1%

  • ARC-AGI-3 벤치마크 공개, 인간 100%·모델 <1%
  • LangChain, Fleet 공유 스킬 레지스트리 출시
  • Google, Lyria 3 Pro로 3분 음악 생성 확장
  • LiteLLM PyPI 1.82.7/1.82.8 공급망 공격 경고
  • Intel Arc Pro B70 32GB, $949 로컬 추론 주목
#OpenAI#Codex#ARC-AGI-3#에이전트#LangChain#Claude Code#하드웨어
2026년 3월 24일

LiteLLM PyPI 공급망 공격, 자격증명 유출 우려

  • LiteLLM PyPI 공급망 공격, 자격증명 유출 우려
  • Figma MCP 오픈 베타로 캔버스 직접 편집
  • Hermes Agent v0.4.0, 개인 에이전트 런타임 강화
  • vLLM·Transformers, 추론 성능 격차 빠르게 축소
  • OpenAI, 재단 10억달러 집행과 Spud 개발 소문
#OpenAI#Codex#LiteLLM#Anthropic#Figma
2026년 3월 23일

Claude, macOS 컴퓨터 사용(Computer Use) 공개

  • Claude, macOS 컴퓨터 사용(Computer Use) 공개
  • Cursor, Instant Grep로 초고속 검색 공개
  • Sakana AI, 일본용 Sakana Chat 출시
  • WebArena-Infinity, 환경 생성 비용 절감
  • LeWorldModel, 1 GPU JEPA 레시피 주목
#OpenAI#Codex#Anthropic
2026년 3월 20일

Cursor Composer 2, Kimi K2.5 기반 논란

  • Cursor Composer 2, Kimi K2.5 기반 논란
  • NVIDIA Nemotron-Cascade 2 공개, 30B MoE
  • OpenAI, Codex for Students로 $100 크레딧
  • Mistral Small 4, 멀티모달·추론 모드 추가
  • FAIR V-JEPA 2.1, 비디오 이해 성능 강화
#Cursor#Kimi#NVIDIA#OpenAI#Codex#LangChain
2026년 3월 19일

Cursor가 Composer 2 코딩 모델 공개

  • Cursor가 Composer 2 코딩 모델 공개
  • OpenAI, Astral 팀을 Codex에 합류
  • LangChain, LangSmith Fleet 엔터프라이즈 출시
  • MiniMax M2.7, 에이전트 지향 모델 강조
  • Qwen 3.5 Max, late-interaction 검색 성과
#OpenAI#Cursor#Anthropic#LangChain#MiniMax
2026년 3월 18일 헤드라인

MiniMax, 효율·‘자기 진화’ 내세운 MiniMax 2.7 공개

  • MiniMax가 효율형 오픈 모델 2.7 공개
  • OpenAI, 16MB LM Parameter Golf 공개
  • Anthropic, 1주 8만명 Claude 인터뷰
  • Unsloth Studio, 로컬 LLM 학습·실행 UI
  • Runway, 100ms 이하 실시간 HD 영상 시연
#MiniMax#OpenAI#Anthropic#MCP#LLM
2026년 3월 17일

OpenAI, GPT-5.4 mini/nano 출시

  • OpenAI가 GPT-5.4 mini/nano를 출시
  • 미니 모델, 코딩·서브에이전트 최적화
  • LangChain, Sandboxes와 Open SWE 공개
  • Mamba-3·Attention Residuals 논의 확산
  • Unsloth Studio, 로컬 학습·추론 UI 출시
#OpenAI#Codex#에이전트#오픈소스#아키텍처
2026년 3월 16일

Perplexity, Android용 Computer 출시

  • Perplexity, Android용 Computer 출시
  • Google, Gemini Embedding 2 공개
  • Moonshot `Attention Residuals` 논문 화제
  • OpenAI Codex, 주간 활성 200만+ 언급
  • NVIDIA, Nemotron 라이선스 제약 완화
#OpenAI#Codex#Perplexity#Google#LangChain
2026년 3월 13일

Anthropic, Opus 4.6 1M 컨텍스트 기본 제공

  • Anthropic, Opus 4.6 1M 컨텍스트 기본 제공
  • Perplexity Computer, iOS 크로스디바이스 동기화
  • RandOpt, 가우시안 탐색으로 RL 성능 근접
  • OmniCoder-9B, 262K 컨텍스트 오픈 웨이트 공개
  • OpenFold3 preview 2, 학습셋·설정까지 공개
#OpenAI#Codex#Anthropic#MCP#Qwen
2026년 3월 12일 헤드라인

Google, Gemini 기반 'Ask Maps' 포함 Maps 대규모 업데이트

  • Google Maps가 Gemini로 10년 만에 대개편
  • Claude가 채팅에서 인터랙티브 차트 생성
  • CursorBench로 코딩 에이전트 평가가 고도화
  • Gemini Embedding 2로 멀티모달 검색 경쟁 격화
  • Nemotron 3 Super, 오픈웨이트 120B 모델 공개
#Google#OpenAI#Claude#MCP#NVIDIA
2026년 3월 11일

NVIDIA가 Nemotron 3 Super를 공개했다

  • NVIDIA가 Nemotron 3 Super를 공개했다
  • Perplexity가 Personal Computer를 출시했다
  • Anthropic이 The Anthropic Institute를 출범했다
  • Yann LeCun의 AMI Labs가 $1.03B를 유치했다
  • Fish Audio가 S2 TTS 모델을 공개했다
#NVIDIA#Nemotron#Perplexity#Anthropic#Agents
2026년 3월 9일 헤드라인

LLM이 더 작은 LLM을 완전 자율로 학습시키기 시작

  • LLM이 더 작은 LLM을 자율 학습하기 시작
  • Claude Code가 멀티에이전트 PR 리뷰를 공개했다
  • OpenAI가 Promptfoo 인수로 보안 eval을 강화했다
  • vLLM이 Jetson에서 로컬 어시스턴트를 시연했다
  • Figure Helix 02가 거실 정리 자율 데모를 공개했다
#OpenAI#Claude#에이전트#vLLM#로보틱스
2026년 3월 6일

OpenAI GPT‑5.4, AA 지수 공동 1위 복귀

  • OpenAI GPT‑5.4, AA 지수 공동 1위 복귀
  • Codex Security와 OSS 지원 프로그램 공개
  • Claude Opus 4.6, Firefox 고위험 취약점 다수 발견
  • vLLM v0.17과 Triton attention 백엔드 출시
  • KernelAgent·AMD 대회로 커널 최적화 경쟁 가속
#OpenAI#GPT-5.4#보안#Anthropic#vLLM
2026년 3월 5일 헤드라인

OpenAI, GPT-5.4 Thinking·Pro를 ChatGPT·API·Codex에 출시

  • OpenAI가 GPT-5.4 Thinking·Pro 출시
  • FlashAttention-4, Blackwell에서 가속
  • AI2, OLMo Hybrid 7B 오픈 공개
  • Databricks, RL 기반 에이전트 KARL 발표
  • 장문 컨텍스트, ‘context rot’ 경고 확산
#OpenAI#GPT-5.4#FlashAttention-4#OLMo#Cursor
2026년 3월 4일

OpenAI, Windows용 Codex 앱과 오픈소스 샌드박스 공개

  • OpenAI, Windows용 Codex 앱 공개
  • Alibaba Qwen, 조직 개편·컴퓨트 논란
  • Gemini 3.1 Flash-Lite, 속도·비용 강조
  • SSD 추론, vLLM/SGLang 대비 최대 2배
  • VS Code, 에이전트 기능 강화·주간 출시
#OpenAI#Anthropic#Google#Qwen#vLLM
2026년 3월 3일

OpenAI가 GPT‑5.3 Instant를 전면 배포

  • OpenAI가 GPT‑5.3 Instant를 전면 배포
  • Google이 Gemini 3.1 Flash‑Lite 공개
  • Alibaba Qwen 리더십 이탈로 OSS 불안
  • Together가 5M 컨텍스트 학습 메모리 87% 절감
  • Cursor가 MCP Apps로 대화형 UI를 채팅에 통합
#OpenAI#Codex#Gemini#Qwen#MCP
2026년 3월 2일

Alibaba가 Qwen 3.5 Small 오픈 모델 공개

  • Alibaba가 Qwen 3.5 Small 오픈 모델 공개
  • Claude 장애로 ‘가용성’ 논의 확산
  • Apple Neural Engine 역공학 학습 주목
  • ByteDance CUDA Agent, 커널 RL 성과
  • DoW 계약 수정안, 감시 금지 조항 논쟁
#Qwen#OpenAI#Codex#인프라#정책
2026년 2월 25일 헤드라인

Perplexity, 오케스트레이션 우선 에이전트 ‘Computer’ 출시

  • Perplexity, 에이전트 ‘Computer’ 출시
  • Karpathy, 코딩 에이전트 상전이 언급
  • OpenAI, GPT‑5.3‑Codex API 공개
  • Qwen3.5 Medium, 로컬 배포 속도전
  • Anthropic, Vercept 인수·RSP v3 전환
#Perplexity#OpenAI#Qwen#Anthropic#Agents
2026년 2월 24일 헤드라인

OpenAI, Responses API에 GPT-5.3-Codex 출시

  • OpenAI가 GPT-5.3-Codex를 출시
  • Qwen 3.5 Medium 시리즈 공개
  • Anthropic, Claude Code 원격 제어 도입
  • Cursor, “demos not diffs”로 전환
  • Mercury 2, ~1,000토큰/초 강조
#OpenAI#Qwen#Claude
2026년 2월 23일 헤드라인

Anthropic, DeepSeek·Moonshot·MiniMax의 Claude 대규모 distillation 공격 의혹 제기

  • Anthropic이 Claude 증류 공격을 주장
  • OpenAI가 SWE-Bench Verified를 폐기
  • Responses API에 WebSockets가 추가됨
  • LMArena에서 GPT-5.2-chat-latest 급상승
  • OpenAI가 BCG·McKinsey와 협력 확대
#Anthropic#OpenAI#Claude#SWE-Bench#WebSockets
2026년 2월 20일

ggml.ai/llama.cpp가 Hugging Face에 합류

  • ggml.ai/llama.cpp가 Hugging Face에 합류
  • Anthropic이 Claude Code Security를 공개
  • Taalas ASIC, 16k–17k tok/s 데모 주장
  • METR, Opus 4.6 time-horizon을 ~14.5h로 추정
  • Gemini 3.1 Pro의 비용·토큰 효율 논쟁
#HuggingFace#llama.cpp#Anthropic#Gemini#보안
2026년 2월 19일 헤드라인

구글, Gemini 3.1 Pro 공개...ARC-AGI-2 77.1%

  • 구글이 Gemini 3.1 Pro를 공개
  • ARC-AGI-2 77.1%로 추론 도약
  • AA·Arena서 상위권 성능 재확인
  • 에이전트 툴링·비용 논쟁이 커뮤니티로 확산
  • Discord선 OpenRouter 장애도 논의
#Google#Gemini#OpenRouter#Anthropic#OpenAI
2026년 2월 18일

OpenAI, EVMbench로 스마트컨트랙트 보안 평가

  • Claude 4.6, 지표 상승·토큰비용 급증
  • OpenAI, EVMbench 보안 벤치 공개
  • Google Lyria 3, Gemini에 음악 생성
  • Cursor, 과거 대화 컨텍스트(context) 추가
  • Qwen3.5 FP8 가중치 공개 확산
#OpenAI#Anthropic#Google#MCP#벤치마크
2026년 2월 16일 헤드라인

알리바바, Qwen3.5-397B-A17B 오픈 가중치 공개

  • Qwen3.5-397B-A17B 오픈가중치 발표
  • vLLM, Qwen3.5 Day-0 지원 공개
  • OpenAI, OpenClaw 인수 흐름 확산
  • ChatGPT Lockdown Mode로 공격면 축소
  • 중국 CNY 모델 러시·로보틱스 가속
#Qwen#OpenAI#Anthropic#vLLM#에이전트
2026년 2월 12일 헤드라인

Google DeepMind, Gemini 3 Deep Think V2 공개…ARC-AGI-2 84.6% 달성

  • Gemini 3 Deep Think V2, ARC-AGI-2 SOTA
  • OpenAI, GPT-5.3-Codex-Spark 프리뷰 공개
  • MiniMax M2.5·GLM-5, 오픈 코딩 경쟁 가속
  • A2A·KV-cache, 에이전트 인프라 논쟁 확대
  • QED-Nano·LeJEPA 등 연구 업데이트
#Google DeepMind#Gemini#OpenAI#Anthropic#Agents
2026년 2월 11일 헤드라인

Zhipu AI, MIT 라이선스 오픈 웨이트 GLM-5 공개

  • Zhipu AI가 MIT 라이선스 GLM-5 공개
  • DeepSeek 1M 컨텍스트 루머와 DPA 개선
  • SeeDance v2.0 품질·가격 논의 확산
  • 에이전트 워크플로우: Codex, MCP, DeepWiki
  • 오픈 벤치마크 $3M 지원과 에이전트 보안 논쟁
#GLM-5#Zhipu AI#DeepSeek#MiniMax#OpenAI
2026년 2월 10일 헤드라인

알리바바, Qwen‑Image‑2.0 공개… 7B 통합 생성·편집

  • 알리바바 Qwen‑Image‑2.0 7B 공개
  • ByteDance Seedance 2.0, T2V 도약
  • OpenAI Responses API 장기 작업 강화
  • Kimi Agent Swarm, 100 서브에이전트
  • Isomorphic Labs, IsoDDE 성능 향상 주장
#Qwen#Alibaba#ByteDance#OpenAI#Kimi#Isomorphic Labs
2026년 2월 6일

GPT-5.3-Codex·Claude Opus 4.6 A/B 확산

  • GPT-5.3-Codex·Claude Opus 4.6 A/B 확산
  • Waymo, Genie 3 기반 월드 모델 공개
  • Hugging Face, Community Evals 출시
  • InfMem·LatentMem, 장문 메모리 제어
  • 에이전트 스웜, ‘팀 설계’로 수렴
#OpenAI#Codex#Claude#Waymo#Hugging Face
2026년 2월 4일 헤드라인

Cerebras, $1B 투자 유치로 $23B 평가

  • Cerebras가 $1B 투자로 $23B 평가
  • VS Code가 Agent Sessions로 에이전트 통합
  • METR, GPT-5.2 High 6.6시간 성과 보고
  • Qwen3-Coder-Next 80B MoE 모델 공개
  • ACE-Step-1.5, MIT 오픈 음악 생성 모델 출시
#OpenAI#Cerebras#Gemini#VS Code#METR
2026년 2월 2일

OpenAI, macOS용 Codex 데스크톱 앱 출시

  • OpenAI, macOS용 Codex 데스크톱 앱 출시
  • Codex 앱, 워크트리·스킬·자동화 지원
  • StepFun Step-3.5-Flash 공개, 256K 컨텍스트
  • Kimi K2.5, Code Arena 오픈모델 1위
  • RAG 청킹, 쿼리별 최적화로 리콜 20–40%↑
#OpenAI#Codex#StepFun#Kimi#RAG
2026년 2월 2일

OpenAI, GPT‑5.2·GPT‑5.2‑Codex 40% 가속

  • OpenAI, GPT‑5.2·GPT‑5.2‑Codex 40% 가속
  • Alibaba, Qwen3‑Coder‑Next 80B@3B 공개
  • Zhipu, GLM‑OCR 0.9B 출시와 day‑0 지원
  • Anthropic, Claude Agent SDK의 Xcode 통합
  • LangChain, 에이전트 트레이스·평가 가이드 제시
#OpenAI#Codex#Qwen#vLLM#LangChain
2026년 1월 30일 헤드라인

Moltbook·OpenClaw, ‘에이전트-에이전트’ 소셜 네트워크 확산

  • Moltbook·OpenClaw 에이전트 포럼 급부상
  • Anthropic 연구: AI 코딩은 학습 저하 가능
  • Moonshot Kimi K2.5, Agent Swarm·PARL 공개
  • Google Genie 3 공개, 게임 vs 비디오 논쟁
  • Windsurf Arena Mode, IDE 내 모델 대결 도입
#Moltbook#OpenClaw#OpenAI#Anthropic#Kimi#Google
2026년 1월 29일 헤드라인

xAI, Grok Imagine 이미지·비디오 생성·편집 API 출시

  • xAI가 Grok Imagine API로 SOTA 출시
  • DeepMind가 Genie 3를 Ultra에 공개
  • Kimi K2.5가 오픈 모델 1위 주장
  • Qwen3-ASR 출시, vLLM day-0 지원
  • 에이전트 표준·샌드박스 논의 확산
#xAI#Grok#Google#Kimi#Qwen
2026년 1월 28일

DeepMind, AlphaGenome 모델·가중치 공개

  • DeepMind가 AlphaGenome 모델·가중치 공개
  • Kimi K2.5가 오픈 모델 화제로 부상
  • Chrome이 Gemini 3 Auto Browse 프리뷰 공개
  • NVIDIA가 NVFP4 Nemotron 3 Nano 발표
  • 에이전트 evals·하네스·추적 논의 확대
#OpenAI#Codex#DeepMind#Kimi#Gemini
2026년 1월 27일 헤드라인

MoonshotAI, Kimi K2.5 공개: 멀티모달 MoE와 Agent Swarm

  • MoonshotAI가 Kimi K2.5를 공개
  • K2.5 Agent Swarm이 100 서브에이전트 지원
  • Trinity Large(400B MoE) 프리뷰 공개
  • OpenAI Prism이 GPT-5.2로 무료 출시
  • DeepSeek-OCR 2, 토큰 압축과 읽기순서 학습
#MoonshotAI#Kimi#OpenAI#DeepSeek#HuggingFace
2026년 1월 26일 헤드라인

Anthropic, MCP Apps 스펙 발표 및 Claude.ai 공식 지원

  • Anthropic가 MCP Apps 스펙을 발표
  • Claude.ai, MCP Apps UI를 공식 지원
  • Qwen3-Max-Thinking 등 추론 모델 출시
  • vLLM, ‘day-0’ 지원 비용 논쟁
  • llama.cpp, GLM-4.7-Flash 최적화
#Anthropic#Claude#MCP#OpenAI#vLLM
2026년 1월 21일 헤드라인

OpenEvidence, 120억달러 가치로 투자 유치

  • OpenEvidence가 120억달러 투자 유치
  • Anthropic이 Claude 헌법을 CC0로 공개
  • Podium이 AI 에이전트 ARR 1억달러 주장
  • AirLLM이 8GB로 405B 추론(inference) 제시
  • Runpod이 $120M ARR로 GPU 클라우드 성장
#OpenEvidence#Anthropic#Claude#MCP#AirLLM
2026년 1월 20일

X가 ‘For You’ 추천 알고리즘을 오픈소스 공개

  • X가 ‘For You’ 추천 알고리즘을 오픈소스 공개
  • OpenAI가 ChatGPT 연령 예측을 전 세계 적용
  • GLM-4.7-Flash 로컬 추론(inference) 주목
  • Liquid AI가 900MB 온디바이스 추론 모델 공개
  • Microsoft가 내부 Claude Code 배포를 일시 중단
#X#OpenAI#GLM-4.7-Flash#Microsoft#MCP
2026년 1월 19일

Zhipu AI, GLM-4.7-Flash 공개

  • Zhipu AI가 GLM-4.7-Flash 공개
  • STEM·RePo로 메모리·컨텍스트 확장
  • DSPy에 `dspy.RLM`로 RLM 도입
  • DeepMind, Gemini 안전 프로브 운영
  • GPT-5.2 에이전트로 3M줄 브라우저
#OpenAI#Codex#GLM-4.7#DSPy#Gemini
2026년 1월 16일 헤드라인

OpenAI, ChatGPT Go($8/월) 출시 및 Free·Go 광고 테스트 발표

  • OpenAI가 Free·Go 티어 광고 테스트 시작
  • ChatGPT Go($8/월), 메시지 10배 제공
  • Sam Altman, ‘매우 빠른 Codex’ 예고
  • FLUX.2 [klein], vLLM-Omni day-0 지원
  • SWE-rebench 12월, Opus 4.5 63.3% 1위
#OpenAI#ChatGPT Go#광고#Codex#Claude
2025년 12월 24일 헤드라인

LeCun, AMI Labs 출범…세계 모델 위해 $1.03B 시드

  • AMI Labs, $1.03B 시드로 출범
  • LeCun, JEPA로 세계 모델 전략 강조
  • 에이전트=모델+하네스(harness) 확산
  • Gemini Embedding 2, 멀티모달 임베딩 공개
  • Hugging Face, $8/TB 스토리지 버킷 출시
#AMI Labs#World Models#JEPA