AI 데일리 뉴스
smol.ai AI 뉴스 한국어 번역
2026년 6월 26일
OpenAI가 GPT-5.6 Sol 제한 프리뷰 공개
- OpenAI가 GPT-5.6 Sol 제한 프리뷰 공개
- METR이 Sol의 높은 부정행위율 공개
- GLM-5.2와 vLLM 지원으로 오픈모델 부상
- 기업들은 라우팅과 캐싱으로 AI 비용 절감
- Claude Enterprise 1,400만 토큰 세션 화제
2026년 6월 25일
Google, Gemini 3.5 Flash에 컴퓨터 사용 내장
- Google, Gemini 3.5 Flash에 컴퓨터 사용 내장
- GLM-5.2가 코딩 벤치마크에서 약진
- Ornith-1.0 오픈 코딩 모델 출시
- Cursor가 공개 벤치마크 해킹을 지적
- Hugging Face가 ARR 1억 달러 돌파
2026년 6월 24일
OpenAI, 첫 맞춤형 추론 칩 Jalapeño 공개
- OpenAI가 Jalapeño 추론 칩 공개
- Claude Slack 에이전트 보안 논쟁 확산
- Qwen-AgentWorld 오픈소스 공개
- GLM-5.2가 오픈 모델 경쟁 주도
- Krea 2 이미지 모델 오픈소스 출시
2026년 6월 23일
Claude Tag, Slack 비동기 팀원 에이전트로 등장
- Claude Tag, Slack 비동기 팀원 에이전트로 등장
- Prime Intellect가 1T MoE RL 스택 공개
- GLM-5.2가 오픈 모델 대안으로 부상
- Mistral OCR 4와 Krea 2가 공개
- 중국 AI 가속기 생태계 논쟁 확산
2026년 6월 22일
OpenAI, Daybreak와 GPT-5.5-Cyber 확장
- OpenAI, Daybreak와 GPT-5.5-Cyber 확장
- Sakana Fugu가 오케스트레이션 API 출시
- GLM-5.2가 오픈 웨이트 에이전트로 부상
- Gemini Interactions API가 정식 출시
- Anthropic ID 인증 도입에 반발 확산
2026년 6월 19일
GLM-5.2가 프런티어급 코딩 모델로 부상
- GLM-5.2가 프런티어급 코딩 모델로 부상
- Hermes Agent v0.17.0이 공개됨
- Mythos/Fable 접근 제한 파장이 확산
- QUEST-35B 연구 에이전트가 공개됨
- OpenRouter에서 OSS 모델 점유율 역전
2026년 6월 17일
Midjourney가 의료용 스캐너를 공개
- Midjourney가 의료용 스캐너를 공개
- Noam Shazeer가 OpenAI에 합류
- GLM-5.2가 오픈 모델 벤치마크 선두
- Fable 5 커널이 브라우저 추론 가속
- Claude Code 사용량 최적화 팁 확산
2026년 6월 16일
Z.ai, GLM-5.2 오픈웨이트 모델 출시
- Z.ai가 GLM-5.2 오픈웨이트 모델 출시
- SpaceX가 Cursor를 600억 달러에 인수
- Cursor가 에이전트용 Origin을 공개
- Qwen-Robot Suite가 로봇 AI를 확장
- AI 구독 가격과 손실 논쟁이 확대
2026년 6월 15일
Fable/Mythos 수출통제 파장 확산
- Fable/Mythos 수출통제 파장 확산
- 모델 중립성과 라우팅 아키텍처 부상
- DFlash와 ReplaySSM 추론 최적화
- Sakana Marlin과 Cartesia 음성 모델 출시
- 구독 한도와 AI 컴퓨트 비용 논쟁 확대
2026년 6월 12일
Anthropic, Fable/Mythos 접근 중단
- Anthropic, Fable/Mythos 접근 중단
- Kimi-K2.7-Code 오픈소스 공개
- MiniMax M3, 1M 컨텍스트 공개
- AA-AgentPerf가 에이전트 추론 측정
- Fable 5, DOS 게임 역공학 화제
2026년 6월 11일
DiffusionGemma, 4배 빠른 텍스트 생성 공개
- DiffusionGemma, 4배 빠른 텍스트 생성 공개
- Anthropic, Fable 5 성능 저하 정책 철회
- Recursive SI, 최적화 벤치마크 SOTA 달성
- Macrodata Labs, 로보틱스 데이터 루프 공개
- Claude 관리형 에이전트에 예약 실행 추가
2026년 6월 10일
Claude Fable 5, 성능 논란 속 신뢰 위기
- Claude Fable 5 성능 논란 확산
- Google이 DiffusionGemma를 공개
- Cohere North Mini Code 출시
- Anthropic 데이터 보존 우려 증가
- Fable 5 코딩 성능 평가 엇갈림
2026년 6월 9일
Claude Fable 5와 Mythos 5 공개
- Anthropic이 Claude Fable 5를 공개
- Mythos 5 제한 접근 논란 확산
- Fable 5가 코딩 벤치마크 선도
- 숨은 성능 제한이 신뢰 논쟁 촉발
- Cohere가 North Mini Code 공개
2026년 6월 8일
FrontierCode가 병합 가능 코드 평가 공개
- FrontierCode가 병합 가능 코드 평가 공개
- Kimi Code와 Kimi Work가 동시 출시
- Gemma 4 QAT·MTP로 로컬 추론 강화
- Agent Arena가 실사용 세션으로 평가 시작
- Claude Code 보안·사용량 논란 확산
2026년 6월 5일
Gemma 4 QAT, 로컬 배포용 체크포인트 출시
- Google이 Gemma 4 QAT 체크포인트를 공개
- Ideogram 4가 오픈웨이트 이미지 모델 선두
- Sakana AI가 도쿄 RSI Lab을 출범
- Agents’ Last Exam이 장기 작업 평가를 제시
- Cloudflare가 AI Gateway 지출 제한을 출시
2026년 6월 4일
NVIDIA, Nemotron 3 Ultra 출시
- NVIDIA, Nemotron 3 Ultra 출시
- Anthropic, RSI 초기 신호 주장
- Cloudflare, VoidZero 팀 영입
- OpenAI, ChatGPT 메모리 강화
- Gemma 4 12B 벤치마크 논쟁 확산
2026년 6월 3일
Microsoft가 MAI-Thinking-1 보고서를 공개
- Microsoft가 MAI-Thinking-1 보고서를 공개
- Google이 Gemma 4 12B를 오픈 출시
- Ideogram 4.0이 오픈 가중치로 전환
- 에이전트 실행 계층 경쟁이 본격화됐다
- 하이브리드 라우팅 비용 논쟁이 확산됐다
2026년 6월 2일
Microsoft, Build에서 7개 MAI 모델 공개
- Microsoft가 7개 MAI 모델을 공개
- MAI-Thinking-1 109쪽 보고서 공개
- OpenAI가 Sites in Codex를 출시
- Holo 3.1 로컬 모델 패밀리 공개
- Harvey와 LangChain 검증 비용 절감
2026년 6월 1일
NVIDIA가 Cosmos 3와 Nemotron 3 Ultra 공개
- NVIDIA가 Cosmos 3와 Nemotron 3 Ultra 공개
- MiniMax M3가 1M 컨텍스트로 출시
- Qwen3.7-Plus가 에이전트 기능 확대
- OpenAI 모델과 Codex가 Bedrock에 출시
- Claude Code 버그로 사용량 제한 재설정
2026년 5월 29일
Claude Opus 4.8 출시 평가가 엇갈림
- Claude Opus 4.8 출시 평가가 엇갈림
- Codex가 Windows 컴퓨터 사용을 지원
- StepFun 3.7 Flash가 로컬 MoE로 부상
- Starlette BadHost 취약점이 LLM 도구에 영향
- Google Gemini Spark가 개인 에이전트로 출시
2026년 5월 26일
Qwen3.7-Max, Claude급 벤치마크 경쟁
- Qwen3.7-Max가 Claude급 성능 경쟁
- DeepSWE가 실제 코딩 경험 벤치 제시
- Claude Mythos가 Erdős 문제를 해결
- vLLM이 Rust 프론트엔드를 병합
- OpenRouter가 1.13억 달러 투자 유치
2026년 5월 21일
Codex가 잠긴 Mac 앱을 휴대폰에서 원격 사용
- Codex가 잠긴 Mac 앱을 휴대폰에서 원격 사용
- Qwen3.7 Max가 주요 벤치마크 상위권 기록
- Modal이 46.5억 달러 가치로 3.55억 달러 유치
- turbopuffer가 1억 달러 런레이트를 돌파
- Runway Aleph 2.0과 Edit Studio 공개
2026년 5월 19일 헤드라인
Google I/O 2026, Gemini 3.5 Flash와 Omni 및 에이전트 스택 공개
- Google이 Gemini 3.5 Flash를 공개
- Gemini Omni가 멀티모달 생성을 확대
- Antigravity가 에이전트 플랫폼으로 확장
- Karpathy가 Anthropic에 합류
- OpenAI가 Guaranteed Capacity 출시
2026년 5월 18일
Cursor, Composer 2.5 공개와 대형 모델 훈련
- Cursor가 Composer 2.5를 공개
- LangSmith Engine이 에이전트 CI/CD 제시
- llama.cpp가 Qwen3.6 MTP를 지원
- Qwen3.7 Preview가 Arena 순위 상승
- Anthropic이 Stainless를 인수
2026년 5월 15일
Cerebras IPO, OpenAI 5.4·5.5 서빙 주장
- Cerebras IPO가 인프라 논쟁 재점화
- CFO가 OpenAI 5.4·5.5 서빙 주장
- Codex 모바일이 에이전트 사용면 확대
- Claude 한도 초기화로 경쟁 압력 부각
- 로컬 LLM은 MTP와 고VRAM 실험 집중
2026년 5월 14일
ChatGPT 모바일 앱에 Codex 통합
- ChatGPT 모바일 앱에 Codex 통합
- GitHub Copilot App 미리보기 공개
- LangChain Engine·SmithDB 출시
- Claude Code 제한에 개발자 반발
- Figure 로봇 24시간 자율 작업
2026년 5월 13일
Figure, 휴머노이드 로봇 8시간 자율 근무 시연
- Figure가 8시간 로봇 근무 시연
- Cline SDK와 LangChain 플랫폼 출시
- Nous가 TST 2-3배 속도 향상 발표
- OpenAI가 Codex 전환 혜택 제공
- Anthropic 기업 채택률이 OpenAI 추월
2026년 5월 12일
Perceptron Mk1, 비디오·체화 추론 모델 출시
- Perceptron Mk1 비디오 추론 모델 출시
- Mini Shai-Hulud 공급망 공격 확산
- GB200 대형 MoE 서빙 벤치 공개
- Qwen 3.6 장문맥 로컬 평가 화제
- Isomorphic Labs가 21억 달러 조달
2026년 5월 11일
Thinking Machines가 상호작용 모델 공개
- Thinking Machines가 상호작용 모델 공개
- OpenAI가 Deployment Company 출범
- OpenAI Daybreak 보안 제품화 추진
- 코딩 에이전트 벤치마크가 하네스 평가
- Qwen 3.6 로컬 추론 기대감 확산
2026년 5월 8일
OpenAI가 GPT-5.5 제품군과 Codex 런타임을 확장
- OpenAI가 GPT-5.5 제품군을 확장
- Codex가 장기 실행 에이전트로 진화
- Zyphra가 ZAYA1 오픈 모델 공개
- Anthropic이 Claude 정렬 연구 발표
- DeepMind 공동 수학자가 신기록 달성
2026년 5월 7일
GPT-Realtime-2, OpenAI API에 출시
- OpenAI가 GPT-Realtime-2를 API에 출시
- Codex가 Chrome 브라우저 제어 지원
- Anthropic이 Natural Language Autoencoders 공개
- Qwen3.6 27B 로컬 추론 속도 2.5배 향상
- Claude Code 사용 한도가 SpaceX 컴퓨트로 확대
2026년 5월 6일
Anthropic, SpaceX 컴퓨트 제휴로 Claude 한도 확대
- Anthropic이 SpaceX 컴퓨트 제휴 체결
- Claude Code 5시간 한도가 두 배로 증가
- OpenAI가 MRC 네트워크 프로토콜 공개
- Gemma 4 MTP 체크포인트 출시
- 로컬 Qwen 3.6 코딩 활용 확산
2026년 5월 5일
GPT-5.5 Instant, ChatGPT 기본 모델로 출시
- GPT-5.5 Instant가 기본 모델로 출시
- OpenAI Agents SDK TypeScript 공개
- Gemma 4 MTP로 디코딩 최대 3배 가속
- RadixArk가 1억 달러 시드 유치
- Anthropic과 Perplexity가 금융 AI 확장
2026년 5월 5일
OpenAI 모델, Erdős 단위거리 문제에서 수학적 돌파
- OpenAI 모델이 수학 난제를 반박
- Cohere가 Command A+를 공개
- Gemini 3.5 Flash가 확대 출시
- Qwen3.7 공개 모델 기대감 상승
- Karpathy가 Anthropic에 합류
2026년 5월 5일
DeepSeek, V4-Pro 75% 할인 영구화
- DeepSeek, V4-Pro 75% 할인 영구화
- Codex, Appshots 등 기능 대거 추가
- MCP, 무상태 프로토콜 RC 공개
- Google, Gemini Spark와 Omni 공개
- Anthropic, 취약점 1만 건 이상 발견
2026년 5월 4일
오픈 하네스가 에이전트 성능 격차를 키움
- 오픈 하네스가 에이전트 성능 격차를 키움
- Codex·Copilot 사용량 경제성이 흔들림
- HiL-Bench가 명확화 질문 능력을 평가
- Zyphra가 장문맥 병렬화 성능을 공개
- GPT-5.5가 사이버 시뮬레이션에서 선전
2026년 4월 30일
GPT-5.5, 장기 사이버 평가 상위권 진입
- GPT-5.5가 사이버 평가 상위권에 진입
- Codex가 범용 컴퓨터 작업으로 확장
- Qwen3.6 27B가 오픈 모델 선두
- Grok 4.3이 에이전트 성능을 개선
- 보안 스캐너가 AI 제품군으로 부상
2026년 4월 29일
Cursor SDK, 프로그래머블 에이전트 플랫폼으로 출시
- Cursor SDK가 에이전트 런타임 공개
- OpenAI Codex가 업무 플랫폼으로 확장
- Mistral Medium 3.5가 128B로 출시
- Qwen FlashQLA가 장문맥 속도 개선
- Claude가 Blender와 공식 연동 시작
2026년 4월 28일
NVIDIA Nemotron 3 Nano Omni 공개
- NVIDIA가 오픈 옴니 모델을 공개
- vLLM 0.20이 메모리 효율을 개선
- Poolside가 Laguna XS.2를 출시
- Mistral이 Workflows 프리뷰를 공개
- ChatGPT가 Erdős 문제 풀이에 기여
2026년 4월 24일
DeepSeek-V4, 1M 컨텍스트(context) 공개
- DeepSeek가 DeepSeek-V4 Pro·Flash 공개
- 1M 컨텍스트(context)·MIT 라이선스 적용
- V4 API 가격, Flash가 초저가로 주목
- OpenAI, GPT-5.5·Pro를 API에 통합
- Anthropic, Claude Code 저하 원인 공개
2026년 4월 23일
OpenAI, GPT-5.5 출시·API는 지연
- OpenAI, GPT-5.5 출시·API는 지연
- Codex 기능 번들: 브라우저·Sheets·Slides 지원
- Artificial Analysis, 환각 86% 등 위험도 지적
- Qwen3.6-27B, 로컬 코딩·추론 성능 호평
- Anthropic, Claude Code 회귀 원인·대응 공개
2026년 4월 22일
Qwen3.6-27B, 로컬 코딩 모델로 급부상
- Qwen3.6-27B, 로컬 코딩 성능 급상승
- OpenAI Privacy Filter, PII 마스킹 공개
- Google, TPU 8t/8i와 에이전트 플랫폼 발표
- 팀용 워크스페이스 에이전트, Slack 연동 확산
- Anthropic, Claude Code 티어 변경 테스트 논란
2026년 4월 21일
OpenAI, GPT-Image-2로 ChatGPT Images 2.0 출시
- OpenAI, GPT-Image-2로 이미지 기능 강화
- Hugging Face, `ml-intern` 에이전트 공개
- Moonshot, Kimi K2.6·FlashKDA 인프라 공개
- Google, Gemini API에 Deep Research Max 추가
- LightOn·vLLM, 검색·배포 실무 지원 강화
2026년 4월 17일
Anthropic, Claude Design·Opus 4.7 공개
- Anthropic, Claude Design·Opus 4.7 공개
- Codex Computer Use, 기업용 UX로 부상
- 간단한 하네스(harness)가 신뢰성 좌우
- Qwen3.6, 로컬 추론(inference) 효율 개선
- Stargate, 2029년 9+GW 전력 수요 전망
2026년 4월 16일
Anthropic이 Claude Opus 4.7 출시
- Anthropic이 Claude Opus 4.7 출시
- OpenAI가 Codex를 에이전트로 확장
- Alibaba, Qwen3.6-35B-A3B 오픈 공개
- Cloudflare, Artifacts·Email로 에이전트 인프라
- CRUX·AlphaEval로 오픈월드 평가 확산
2026년 4월 15일
OpenAI, Agents SDK 하네스 분리와 샌드박스 확장
- OpenAI, Agents SDK 하네스 분리와 샌드박스 확장
- Cloudflare, Project Think와 Agent Lee 공개
- Google, Mac용 Gemini 앱 출시 및 기능 확장
- Gemini 3.1 Flash TTS, 제어형 음성 기능 강화
- GPT-5.4 Pro의 Erdős 문제 #1196 증명 논의 확산
2026년 4월 14일
Google Chrome 'Skills'로 1클릭 워크플로
- Chrome에 Skills로 1클릭 실행 추가
- Gemini Robotics-ER 1.6 API 공개
- OpenAI GPT-5.4-Cyber 접근 확대
- Hugging Face, Hub에 Kernels 출시
- OpenRouter Elephant Alpha, 100B 공개
2026년 4월 13일
Hermes Agent v0.9.0 로컬 대시보드 출시
- Hermes Agent v0.9.0 로컬 대시보드 출시
- Claude Mythos, AISI 사이버 레인지 첫 종주
- LlamaIndex ParseBench 문서 파싱 벤치마크 공개
- Hugging Face, 5B로 arXiv 2.7만편 OCR
- Copilot 원격제어·Cursor 분할 에이전트 추가
2026년 4월 10일
GLM-5.1, Code Arena 코딩 3위 등극
- GLM-5.1, Code Arena 코딩 3위 등극
- ‘저렴한 실행자+비싼 어드바이저’ 확산
- Hermes Agent 생태계 확장, 50k★ 달성
- ClawBench, 실전 웹 과제 성공률 6.5%
- Gemma 4, llama.cpp 안정화와 템플릿 배포
2026년 4월 9일
Meta가 MSL 첫 모델 Muse/Spark를 공개했다
- Meta가 MSL 첫 모델 Muse/Spark를 공개했다
- OpenAI가 Codex 5배 $100 Pro를 도입했다
- LangChain이 Deep Agents deploy를 출시했다
- Gemma 4가 첫 주 1000만 다운로드를 돌파했다
- RAGEN-2가 에이전트 RL 붕괴를 분석했다
2026년 4월 8일
Meta, MSL 첫 모델 Muse Spark 정식 공개
- Meta, MSL 첫 모델 Muse Spark 정식 공개
- Zhipu AI GLM-5.1, 오픈 웨이트 선두
- Anthropic, 장기 실행용 Managed Agents 공개
- Qwen3.6-Plus 지표 개선, 가중치 미공개
- APEX-Agents-AA, 롱호라이즌 한계 확인
2026년 4월 7일
Gemma 4, 아이폰 17 Pro에서 40 tok/s 온디바이스 구동
- Gemma 4가 로컬·온디바이스 붐을 촉발
- Hermes Agent, 자기개선 에이전트 루프 확산
- OpenAI, ‘Industrial Policy’로 정책 신호
- Anthropic, 2027 TPU·$30B 런레이트 공개
- RL·라우팅·MoE 등 연구·시스템 업데이트
2026년 4월 6일
Hermes, Manim 영상 생성 스킬 공개
- Hermes가 Manim 영상 생성 스킬 공개
- Claude Code 제한 강화로 대안 에이전트 확산
- Gemma 4 수요 급증, 생태계 통합 확대
- TurboQuant-GPU로 KV 캐시 5.02x 압축
- 뉴요커, 샘 알트만 의혹 조사 보도 공개
2026년 4월 3일
Google이 Apache 2.0으로 Gemma 4 공개
- Google이 Apache 2.0으로 Gemma 4 공개
- Gemma 4, vLLM·llama.cpp 등 즉시 지원
- Hermes Agent가 오픈 하네스(harness)로 부상
- Codex 확산 vs Claude Code 레이트 리밋 논쟁
- Anthropic, Claude의 171 감정 벡터 연구 공개
2026년 4월 2일
구글 딥마인드, Gemma 4 오픈웨이트 공개
- 구글 딥마인드, Gemma 4 오픈웨이트 공개
- Gemma 4, 256K 컨텍스트·멀티모달 지원
- 생태계가 llama.cpp·vLLM 등 즉시 지원
- Anthropic이 Claude 내부 감정 벡터 연구 공개
- OpenAI가 CarPlay 음성모드와 Codex 과금 변경
2026년 4월 1일
Claude Code 소스 유출로 DMCA 논란 확산
- Arcee Trinity-Large-Thinking 오픈 웨이트 출시
- Z.ai, GLM-5V-Turbo 비전 코딩 모델 발표
- Claude Code 소스 유출로 DMCA 논란 확산
- OpenAI, Codex 사용량 한도를 전 플랜 리셋
- PrismML 1-bit Bonsai로 로컬 LLM 효율↑
2026년 3월 31일
Claude Code 소스 유출, 하네스 설계가 드러남
- Claude Code 소스 유출, 하네스 설계가 드러남
- 가중치 아닌 오케스트레이션 로직 노출
- Bonsai 1-bit 모델, 초소형 효율 강조
- OpenAI, $122B 커밋 자본·$852B 가치
- TRL v1.0, RL 툴링 대폭 확장
2026년 3월 30일
Anthropic, Claude Code에 컴퓨터 사용 도입
- Anthropic, Claude Code에 컴퓨터 사용 도입
- OpenAI, Claude Code용 Codex 플러그인 공개
- Alibaba, Qwen3.5-Omni 멀티모달 모델 출시
- Nous, Hermes Agent 업데이트로 오픈 에이전트 확산
- llama.cpp, GitHub 10만 ★ 돌파로 로컬 열기
2026년 3월 27일
Anthropic의 Opus 상위 ‘Capybara’ 티어가 유출됐다
- Anthropic의 Opus 상위 ‘Capybara’ 티어가 유출됐다
- Zhipu가 GLM-5.1을 코딩 플랜에 공개했다
- TurboQuant 논문이 RaBitQ 오기재로 논란이다
- OpenAI가 Codex 플러그인으로 자동화를 밀었다
- Meta가 SAM 3.1로 비디오 처리량을 2배로 늘렸다
2026년 3월 26일
OpenAI GPT-5.4 mini/nano 성능·비용 경쟁
- Google, Gemini 3.1 Flash Live 공개
- Mistral Voxtral TTS 오픈웨이트 출시
- Cohere Transcribe, 첫 오디오 모델 공개
- OpenAI GPT-5.4 mini/nano 성능·비용 경쟁
- Cline Kanban, 멀티 에이전트 워크트리 지원
2026년 3월 25일
ARC-AGI-3 공개, 인간 100%·모델 <1%
- ARC-AGI-3 벤치마크 공개, 인간 100%·모델 <1%
- LangChain, Fleet 공유 스킬 레지스트리 출시
- Google, Lyria 3 Pro로 3분 음악 생성 확장
- LiteLLM PyPI 1.82.7/1.82.8 공급망 공격 경고
- Intel Arc Pro B70 32GB, $949 로컬 추론 주목
2026년 3월 24일
LiteLLM PyPI 공급망 공격, 자격증명 유출 우려
- LiteLLM PyPI 공급망 공격, 자격증명 유출 우려
- Figma MCP 오픈 베타로 캔버스 직접 편집
- Hermes Agent v0.4.0, 개인 에이전트 런타임 강화
- vLLM·Transformers, 추론 성능 격차 빠르게 축소
- OpenAI, 재단 10억달러 집행과 Spud 개발 소문
2026년 3월 23일
Claude, macOS 컴퓨터 사용(Computer Use) 공개
- Claude, macOS 컴퓨터 사용(Computer Use) 공개
- Cursor, Instant Grep로 초고속 검색 공개
- Sakana AI, 일본용 Sakana Chat 출시
- WebArena-Infinity, 환경 생성 비용 절감
- LeWorldModel, 1 GPU JEPA 레시피 주목
2026년 3월 20일
Cursor Composer 2, Kimi K2.5 기반 논란
- Cursor Composer 2, Kimi K2.5 기반 논란
- NVIDIA Nemotron-Cascade 2 공개, 30B MoE
- OpenAI, Codex for Students로 $100 크레딧
- Mistral Small 4, 멀티모달·추론 모드 추가
- FAIR V-JEPA 2.1, 비디오 이해 성능 강화
2026년 3월 19일
Cursor가 Composer 2 코딩 모델 공개
- Cursor가 Composer 2 코딩 모델 공개
- OpenAI, Astral 팀을 Codex에 합류
- LangChain, LangSmith Fleet 엔터프라이즈 출시
- MiniMax M2.7, 에이전트 지향 모델 강조
- Qwen 3.5 Max, late-interaction 검색 성과
2026년 3월 18일 헤드라인
MiniMax, 효율·‘자기 진화’ 내세운 MiniMax 2.7 공개
- MiniMax가 효율형 오픈 모델 2.7 공개
- OpenAI, 16MB LM Parameter Golf 공개
- Anthropic, 1주 8만명 Claude 인터뷰
- Unsloth Studio, 로컬 LLM 학습·실행 UI
- Runway, 100ms 이하 실시간 HD 영상 시연
2026년 3월 17일
OpenAI, GPT-5.4 mini/nano 출시
- OpenAI가 GPT-5.4 mini/nano를 출시
- 미니 모델, 코딩·서브에이전트 최적화
- LangChain, Sandboxes와 Open SWE 공개
- Mamba-3·Attention Residuals 논의 확산
- Unsloth Studio, 로컬 학습·추론 UI 출시
2026년 3월 16일
Perplexity, Android용 Computer 출시
- Perplexity, Android용 Computer 출시
- Google, Gemini Embedding 2 공개
- Moonshot `Attention Residuals` 논문 화제
- OpenAI Codex, 주간 활성 200만+ 언급
- NVIDIA, Nemotron 라이선스 제약 완화
2026년 3월 13일
Anthropic, Opus 4.6 1M 컨텍스트 기본 제공
- Anthropic, Opus 4.6 1M 컨텍스트 기본 제공
- Perplexity Computer, iOS 크로스디바이스 동기화
- RandOpt, 가우시안 탐색으로 RL 성능 근접
- OmniCoder-9B, 262K 컨텍스트 오픈 웨이트 공개
- OpenFold3 preview 2, 학습셋·설정까지 공개
2026년 3월 12일 헤드라인
Google, Gemini 기반 'Ask Maps' 포함 Maps 대규모 업데이트
- Google Maps가 Gemini로 10년 만에 대개편
- Claude가 채팅에서 인터랙티브 차트 생성
- CursorBench로 코딩 에이전트 평가가 고도화
- Gemini Embedding 2로 멀티모달 검색 경쟁 격화
- Nemotron 3 Super, 오픈웨이트 120B 모델 공개
2026년 3월 11일
NVIDIA가 Nemotron 3 Super를 공개했다
- NVIDIA가 Nemotron 3 Super를 공개했다
- Perplexity가 Personal Computer를 출시했다
- Anthropic이 The Anthropic Institute를 출범했다
- Yann LeCun의 AMI Labs가 $1.03B를 유치했다
- Fish Audio가 S2 TTS 모델을 공개했다
2026년 3월 9일 헤드라인
LLM이 더 작은 LLM을 완전 자율로 학습시키기 시작
- LLM이 더 작은 LLM을 자율 학습하기 시작
- Claude Code가 멀티에이전트 PR 리뷰를 공개했다
- OpenAI가 Promptfoo 인수로 보안 eval을 강화했다
- vLLM이 Jetson에서 로컬 어시스턴트를 시연했다
- Figure Helix 02가 거실 정리 자율 데모를 공개했다
2026년 3월 6일
OpenAI GPT‑5.4, AA 지수 공동 1위 복귀
- OpenAI GPT‑5.4, AA 지수 공동 1위 복귀
- Codex Security와 OSS 지원 프로그램 공개
- Claude Opus 4.6, Firefox 고위험 취약점 다수 발견
- vLLM v0.17과 Triton attention 백엔드 출시
- KernelAgent·AMD 대회로 커널 최적화 경쟁 가속
2026년 3월 5일 헤드라인
OpenAI, GPT-5.4 Thinking·Pro를 ChatGPT·API·Codex에 출시
- OpenAI가 GPT-5.4 Thinking·Pro 출시
- FlashAttention-4, Blackwell에서 가속
- AI2, OLMo Hybrid 7B 오픈 공개
- Databricks, RL 기반 에이전트 KARL 발표
- 장문 컨텍스트, ‘context rot’ 경고 확산
2026년 3월 4일
OpenAI, Windows용 Codex 앱과 오픈소스 샌드박스 공개
- OpenAI, Windows용 Codex 앱 공개
- Alibaba Qwen, 조직 개편·컴퓨트 논란
- Gemini 3.1 Flash-Lite, 속도·비용 강조
- SSD 추론, vLLM/SGLang 대비 최대 2배
- VS Code, 에이전트 기능 강화·주간 출시
2026년 3월 3일
OpenAI가 GPT‑5.3 Instant를 전면 배포
- OpenAI가 GPT‑5.3 Instant를 전면 배포
- Google이 Gemini 3.1 Flash‑Lite 공개
- Alibaba Qwen 리더십 이탈로 OSS 불안
- Together가 5M 컨텍스트 학습 메모리 87% 절감
- Cursor가 MCP Apps로 대화형 UI를 채팅에 통합
2026년 3월 2일
Alibaba가 Qwen 3.5 Small 오픈 모델 공개
- Alibaba가 Qwen 3.5 Small 오픈 모델 공개
- Claude 장애로 ‘가용성’ 논의 확산
- Apple Neural Engine 역공학 학습 주목
- ByteDance CUDA Agent, 커널 RL 성과
- DoW 계약 수정안, 감시 금지 조항 논쟁
2026년 2월 25일 헤드라인
Perplexity, 오케스트레이션 우선 에이전트 ‘Computer’ 출시
- Perplexity, 에이전트 ‘Computer’ 출시
- Karpathy, 코딩 에이전트 상전이 언급
- OpenAI, GPT‑5.3‑Codex API 공개
- Qwen3.5 Medium, 로컬 배포 속도전
- Anthropic, Vercept 인수·RSP v3 전환
2026년 2월 24일 헤드라인
OpenAI, Responses API에 GPT-5.3-Codex 출시
- OpenAI가 GPT-5.3-Codex를 출시
- Qwen 3.5 Medium 시리즈 공개
- Anthropic, Claude Code 원격 제어 도입
- Cursor, “demos not diffs”로 전환
- Mercury 2, ~1,000토큰/초 강조
2026년 2월 23일 헤드라인
Anthropic, DeepSeek·Moonshot·MiniMax의 Claude 대규모 distillation 공격 의혹 제기
- Anthropic이 Claude 증류 공격을 주장
- OpenAI가 SWE-Bench Verified를 폐기
- Responses API에 WebSockets가 추가됨
- LMArena에서 GPT-5.2-chat-latest 급상승
- OpenAI가 BCG·McKinsey와 협력 확대
2026년 2월 20일
ggml.ai/llama.cpp가 Hugging Face에 합류
- ggml.ai/llama.cpp가 Hugging Face에 합류
- Anthropic이 Claude Code Security를 공개
- Taalas ASIC, 16k–17k tok/s 데모 주장
- METR, Opus 4.6 time-horizon을 ~14.5h로 추정
- Gemini 3.1 Pro의 비용·토큰 효율 논쟁
2026년 2월 19일 헤드라인
구글, Gemini 3.1 Pro 공개...ARC-AGI-2 77.1%
- 구글이 Gemini 3.1 Pro를 공개
- ARC-AGI-2 77.1%로 추론 도약
- AA·Arena서 상위권 성능 재확인
- 에이전트 툴링·비용 논쟁이 커뮤니티로 확산
- Discord선 OpenRouter 장애도 논의
2026년 2월 18일
OpenAI, EVMbench로 스마트컨트랙트 보안 평가
- Claude 4.6, 지표 상승·토큰비용 급증
- OpenAI, EVMbench 보안 벤치 공개
- Google Lyria 3, Gemini에 음악 생성
- Cursor, 과거 대화 컨텍스트(context) 추가
- Qwen3.5 FP8 가중치 공개 확산
2026년 2월 16일 헤드라인
알리바바, Qwen3.5-397B-A17B 오픈 가중치 공개
- Qwen3.5-397B-A17B 오픈가중치 발표
- vLLM, Qwen3.5 Day-0 지원 공개
- OpenAI, OpenClaw 인수 흐름 확산
- ChatGPT Lockdown Mode로 공격면 축소
- 중국 CNY 모델 러시·로보틱스 가속
2026년 2월 12일 헤드라인
Google DeepMind, Gemini 3 Deep Think V2 공개…ARC-AGI-2 84.6% 달성
- Gemini 3 Deep Think V2, ARC-AGI-2 SOTA
- OpenAI, GPT-5.3-Codex-Spark 프리뷰 공개
- MiniMax M2.5·GLM-5, 오픈 코딩 경쟁 가속
- A2A·KV-cache, 에이전트 인프라 논쟁 확대
- QED-Nano·LeJEPA 등 연구 업데이트
2026년 2월 11일 헤드라인
Zhipu AI, MIT 라이선스 오픈 웨이트 GLM-5 공개
- Zhipu AI가 MIT 라이선스 GLM-5 공개
- DeepSeek 1M 컨텍스트 루머와 DPA 개선
- SeeDance v2.0 품질·가격 논의 확산
- 에이전트 워크플로우: Codex, MCP, DeepWiki
- 오픈 벤치마크 $3M 지원과 에이전트 보안 논쟁
2026년 2월 10일 헤드라인
알리바바, Qwen‑Image‑2.0 공개… 7B 통합 생성·편집
- 알리바바 Qwen‑Image‑2.0 7B 공개
- ByteDance Seedance 2.0, T2V 도약
- OpenAI Responses API 장기 작업 강화
- Kimi Agent Swarm, 100 서브에이전트
- Isomorphic Labs, IsoDDE 성능 향상 주장
2026년 2월 6일
GPT-5.3-Codex·Claude Opus 4.6 A/B 확산
- GPT-5.3-Codex·Claude Opus 4.6 A/B 확산
- Waymo, Genie 3 기반 월드 모델 공개
- Hugging Face, Community Evals 출시
- InfMem·LatentMem, 장문 메모리 제어
- 에이전트 스웜, ‘팀 설계’로 수렴
2026년 2월 4일 헤드라인
Cerebras, $1B 투자 유치로 $23B 평가
- Cerebras가 $1B 투자로 $23B 평가
- VS Code가 Agent Sessions로 에이전트 통합
- METR, GPT-5.2 High 6.6시간 성과 보고
- Qwen3-Coder-Next 80B MoE 모델 공개
- ACE-Step-1.5, MIT 오픈 음악 생성 모델 출시
2026년 2월 2일
OpenAI, macOS용 Codex 데스크톱 앱 출시
- OpenAI, macOS용 Codex 데스크톱 앱 출시
- Codex 앱, 워크트리·스킬·자동화 지원
- StepFun Step-3.5-Flash 공개, 256K 컨텍스트
- Kimi K2.5, Code Arena 오픈모델 1위
- RAG 청킹, 쿼리별 최적화로 리콜 20–40%↑
2026년 2월 2일
OpenAI, GPT‑5.2·GPT‑5.2‑Codex 40% 가속
- OpenAI, GPT‑5.2·GPT‑5.2‑Codex 40% 가속
- Alibaba, Qwen3‑Coder‑Next 80B@3B 공개
- Zhipu, GLM‑OCR 0.9B 출시와 day‑0 지원
- Anthropic, Claude Agent SDK의 Xcode 통합
- LangChain, 에이전트 트레이스·평가 가이드 제시
2026년 1월 30일 헤드라인
Moltbook·OpenClaw, ‘에이전트-에이전트’ 소셜 네트워크 확산
- Moltbook·OpenClaw 에이전트 포럼 급부상
- Anthropic 연구: AI 코딩은 학습 저하 가능
- Moonshot Kimi K2.5, Agent Swarm·PARL 공개
- Google Genie 3 공개, 게임 vs 비디오 논쟁
- Windsurf Arena Mode, IDE 내 모델 대결 도입
2026년 1월 29일 헤드라인
xAI, Grok Imagine 이미지·비디오 생성·편집 API 출시
- xAI가 Grok Imagine API로 SOTA 출시
- DeepMind가 Genie 3를 Ultra에 공개
- Kimi K2.5가 오픈 모델 1위 주장
- Qwen3-ASR 출시, vLLM day-0 지원
- 에이전트 표준·샌드박스 논의 확산
2026년 1월 28일
DeepMind, AlphaGenome 모델·가중치 공개
- DeepMind가 AlphaGenome 모델·가중치 공개
- Kimi K2.5가 오픈 모델 화제로 부상
- Chrome이 Gemini 3 Auto Browse 프리뷰 공개
- NVIDIA가 NVFP4 Nemotron 3 Nano 발표
- 에이전트 evals·하네스·추적 논의 확대
2026년 1월 27일 헤드라인
MoonshotAI, Kimi K2.5 공개: 멀티모달 MoE와 Agent Swarm
- MoonshotAI가 Kimi K2.5를 공개
- K2.5 Agent Swarm이 100 서브에이전트 지원
- Trinity Large(400B MoE) 프리뷰 공개
- OpenAI Prism이 GPT-5.2로 무료 출시
- DeepSeek-OCR 2, 토큰 압축과 읽기순서 학습
2026년 1월 26일 헤드라인
Anthropic, MCP Apps 스펙 발표 및 Claude.ai 공식 지원
- Anthropic가 MCP Apps 스펙을 발표
- Claude.ai, MCP Apps UI를 공식 지원
- Qwen3-Max-Thinking 등 추론 모델 출시
- vLLM, ‘day-0’ 지원 비용 논쟁
- llama.cpp, GLM-4.7-Flash 최적화
2026년 1월 21일 헤드라인
OpenEvidence, 120억달러 가치로 투자 유치
- OpenEvidence가 120억달러 투자 유치
- Anthropic이 Claude 헌법을 CC0로 공개
- Podium이 AI 에이전트 ARR 1억달러 주장
- AirLLM이 8GB로 405B 추론(inference) 제시
- Runpod이 $120M ARR로 GPU 클라우드 성장
2026년 1월 20일
X가 ‘For You’ 추천 알고리즘을 오픈소스 공개
- X가 ‘For You’ 추천 알고리즘을 오픈소스 공개
- OpenAI가 ChatGPT 연령 예측을 전 세계 적용
- GLM-4.7-Flash 로컬 추론(inference) 주목
- Liquid AI가 900MB 온디바이스 추론 모델 공개
- Microsoft가 내부 Claude Code 배포를 일시 중단
2026년 1월 19일
Zhipu AI, GLM-4.7-Flash 공개
- Zhipu AI가 GLM-4.7-Flash 공개
- STEM·RePo로 메모리·컨텍스트 확장
- DSPy에 `dspy.RLM`로 RLM 도입
- DeepMind, Gemini 안전 프로브 운영
- GPT-5.2 에이전트로 3M줄 브라우저
2026년 1월 16일 헤드라인
OpenAI, ChatGPT Go($8/월) 출시 및 Free·Go 광고 테스트 발표
- OpenAI가 Free·Go 티어 광고 테스트 시작
- ChatGPT Go($8/월), 메시지 10배 제공
- Sam Altman, ‘매우 빠른 Codex’ 예고
- FLUX.2 [klein], vLLM-Omni day-0 지원
- SWE-rebench 12월, Opus 4.5 63.3% 1위
2025년 12월 24일 헤드라인
LeCun, AMI Labs 출범…세계 모델 위해 $1.03B 시드
- AMI Labs, $1.03B 시드로 출범
- LeCun, JEPA로 세계 모델 전략 강조
- 에이전트=모델+하네스(harness) 확산
- Gemini Embedding 2, 멀티모달 임베딩 공개
- Hugging Face, $8/TB 스토리지 버킷 출시