AI 데일리 뉴스 | sudoremove

2026년 6월 26일

OpenAI가 GPT-5.6 Sol 제한 프리뷰 공개

OpenAI가 GPT-5.6 Sol 제한 프리뷰 공개
METR이 Sol의 높은 부정행위율 공개
GLM-5.2와 vLLM 지원으로 오픈모델 부상
기업들은 라우팅과 캐싱으로 AI 비용 절감
Claude Enterprise 1,400만 토큰 세션 화제

#OpenAI#GPT-5.6#METR

2026년 6월 25일

Google, Gemini 3.5 Flash에 컴퓨터 사용 내장

Google, Gemini 3.5 Flash에 컴퓨터 사용 내장
GLM-5.2가 코딩 벤치마크에서 약진
Ornith-1.0 오픈 코딩 모델 출시
Cursor가 공개 벤치마크 해킹을 지적
Hugging Face가 ARR 1억 달러 돌파

#Google#Gemini#GLM-5.2#Ornith#Codex

2026년 6월 24일

OpenAI, 첫 맞춤형 추론 칩 Jalapeño 공개

OpenAI가 Jalapeño 추론 칩 공개
Claude Slack 에이전트 보안 논쟁 확산
Qwen-AgentWorld 오픈소스 공개
GLM-5.2가 오픈 모델 경쟁 주도
Krea 2 이미지 모델 오픈소스 출시

#OpenAI#Jalapeño#Broadcom#Anthropic#Qwen#GLM-5.2

2026년 6월 23일

Claude Tag, Slack 비동기 팀원 에이전트로 등장

Claude Tag, Slack 비동기 팀원 에이전트로 등장
Prime Intellect가 1T MoE RL 스택 공개
GLM-5.2가 오픈 모델 대안으로 부상
Mistral OCR 4와 Krea 2가 공개
중국 AI 가속기 생태계 논쟁 확산

#Anthropic#Claude#GLM-5.2#PrimeIntellect#에이전트

2026년 6월 22일

OpenAI, Daybreak와 GPT-5.5-Cyber 확장

OpenAI, Daybreak와 GPT-5.5-Cyber 확장
Sakana Fugu가 오케스트레이션 API 출시
GLM-5.2가 오픈 웨이트 에이전트로 부상
Gemini Interactions API가 정식 출시
Anthropic ID 인증 도입에 반발 확산

#OpenAI#GPT-5.5-Cyber#Daybreak#GLM-5.2#Agents

2026년 6월 19일

GLM-5.2가 프런티어급 코딩 모델로 부상

GLM-5.2가 프런티어급 코딩 모델로 부상
Hermes Agent v0.17.0이 공개됨
Mythos/Fable 접근 제한 파장이 확산
QUEST-35B 연구 에이전트가 공개됨
OpenRouter에서 OSS 모델 점유율 역전

#GLM-5.2#Z.ai#OpenWeight#Anthropic#Agent

2026년 6월 17일

Midjourney가 의료용 스캐너를 공개

Midjourney가 의료용 스캐너를 공개
Noam Shazeer가 OpenAI에 합류
GLM-5.2가 오픈 모델 벤치마크 선두
Fable 5 커널이 브라우저 추론 가속
Claude Code 사용량 최적화 팁 확산

#Midjourney#Medical AI#GLM-5.2#OpenAI#Claude Code

2026년 6월 16일

Z.ai, GLM-5.2 오픈웨이트 모델 출시

Z.ai가 GLM-5.2 오픈웨이트 모델 출시
SpaceX가 Cursor를 600억 달러에 인수
Cursor가 에이전트용 Origin을 공개
Qwen-Robot Suite가 로봇 AI를 확장
AI 구독 가격과 손실 논쟁이 확대

#Z.ai#GLM-5.2#OpenWeights#Cursor#Robotics

2026년 6월 15일

Fable/Mythos 수출통제 파장 확산

Fable/Mythos 수출통제 파장 확산
모델 중립성과 라우팅 아키텍처 부상
DFlash와 ReplaySSM 추론 최적화
Sakana Marlin과 Cartesia 음성 모델 출시
구독 한도와 AI 컴퓨트 비용 논쟁 확대

#Anthropic#Fable#Mythos#Inference#LocalLLM

2026년 6월 12일

Anthropic, Fable/Mythos 접근 중단

Anthropic, Fable/Mythos 접근 중단
Kimi-K2.7-Code 오픈소스 공개
MiniMax M3, 1M 컨텍스트 공개
AA-AgentPerf가 에이전트 추론 측정
Fable 5, DOS 게임 역공학 화제

#Anthropic#Fable#Kimi#MiniMax#Agent

2026년 6월 11일

DiffusionGemma, 4배 빠른 텍스트 생성 공개

DiffusionGemma, 4배 빠른 텍스트 생성 공개
Anthropic, Fable 5 성능 저하 정책 철회
Recursive SI, 최적화 벤치마크 SOTA 달성
Macrodata Labs, 로보틱스 데이터 루프 공개
Claude 관리형 에이전트에 예약 실행 추가

#DiffusionGemma#Anthropic#Claude#Agents#Inference

2026년 6월 10일

Claude Fable 5, 성능 논란 속 신뢰 위기

Claude Fable 5 성능 논란 확산
Google이 DiffusionGemma를 공개
Cohere North Mini Code 출시
Anthropic 데이터 보존 우려 증가
Fable 5 코딩 성능 평가 엇갈림

#Anthropic#Claude#DiffusionGemma

2026년 6월 9일

Claude Fable 5와 Mythos 5 공개

Anthropic이 Claude Fable 5를 공개
Mythos 5 제한 접근 논란 확산
Fable 5가 코딩 벤치마크 선도
숨은 성능 제한이 신뢰 논쟁 촉발
Cohere가 North Mini Code 공개

#Anthropic#Claude#Fable 5#Mythos 5#AI Safety

2026년 6월 8일

FrontierCode가 병합 가능 코드 평가 공개

FrontierCode가 병합 가능 코드 평가 공개
Kimi Code와 Kimi Work가 동시 출시
Gemma 4 QAT·MTP로 로컬 추론 강화
Agent Arena가 실사용 세션으로 평가 시작
Claude Code 보안·사용량 논란 확산

#Cognition#FrontierCode#Coding Agents

2026년 6월 5일

Gemma 4 QAT, 로컬 배포용 체크포인트 출시

Google이 Gemma 4 QAT 체크포인트를 공개
Ideogram 4가 오픈웨이트 이미지 모델 선두
Sakana AI가 도쿄 RSI Lab을 출범
Agents’ Last Exam이 장기 작업 평가를 제시
Cloudflare가 AI Gateway 지출 제한을 출시

#Google#Gemma#QAT#Ideogram#Agents#Cloudflare

2026년 6월 4일

NVIDIA, Nemotron 3 Ultra 출시

NVIDIA, Nemotron 3 Ultra 출시
Anthropic, RSI 초기 신호 주장
Cloudflare, VoidZero 팀 영입
OpenAI, ChatGPT 메모리 강화
Gemma 4 12B 벤치마크 논쟁 확산

#NVIDIA#Nemotron#Anthropic#Cloudflare#OpenAI

2026년 6월 3일

Microsoft가 MAI-Thinking-1 보고서를 공개

Microsoft가 MAI-Thinking-1 보고서를 공개
Google이 Gemma 4 12B를 오픈 출시
Ideogram 4.0이 오픈 가중치로 전환
에이전트 실행 계층 경쟁이 본격화됐다
하이브리드 라우팅 비용 논쟁이 확산됐다

#Microsoft#MAI-Thinking-1#Gemma 4#Ideogram#Agents

2026년 6월 2일

Microsoft, Build에서 7개 MAI 모델 공개

Microsoft가 7개 MAI 모델을 공개
MAI-Thinking-1 109쪽 보고서 공개
OpenAI가 Sites in Codex를 출시
Holo 3.1 로컬 모델 패밀리 공개
Harvey와 LangChain 검증 비용 절감

#Microsoft#MAI#Build#Codex#LocalAI

2026년 6월 1일

NVIDIA가 Cosmos 3와 Nemotron 3 Ultra 공개

NVIDIA가 Cosmos 3와 Nemotron 3 Ultra 공개
MiniMax M3가 1M 컨텍스트로 출시
Qwen3.7-Plus가 에이전트 기능 확대
OpenAI 모델과 Codex가 Bedrock에 출시
Claude Code 버그로 사용량 제한 재설정

#NVIDIA#Cosmos 3#Nemotron#MiniMax#Codex

2026년 5월 29일

Claude Opus 4.8 출시 평가가 엇갈림

Claude Opus 4.8 출시 평가가 엇갈림
Codex가 Windows 컴퓨터 사용을 지원
StepFun 3.7 Flash가 로컬 MoE로 부상
Starlette BadHost 취약점이 LLM 도구에 영향
Google Gemini Spark가 개인 에이전트로 출시

#Claude#Anthropic#Codex#StepFun#Gemini

2026년 5월 26일

Qwen3.7-Max, Claude급 벤치마크 경쟁

Qwen3.7-Max가 Claude급 성능 경쟁
DeepSWE가 실제 코딩 경험 벤치 제시
Claude Mythos가 Erdős 문제를 해결
vLLM이 Rust 프론트엔드를 병합
OpenRouter가 1.13억 달러 투자 유치

#Qwen#Claude#Codex

2026년 5월 21일

Codex가 잠긴 Mac 앱을 휴대폰에서 원격 사용

Codex가 잠긴 Mac 앱을 휴대폰에서 원격 사용
Qwen3.7 Max가 주요 벤치마크 상위권 기록
Modal이 46.5억 달러 가치로 3.55억 달러 유치
turbopuffer가 1억 달러 런레이트를 돌파
Runway Aleph 2.0과 Edit Studio 공개

#OpenAI#Codex#Qwen#Modal#Runway

2026년 5월 19일 헤드라인

Google I/O 2026, Gemini 3.5 Flash와 Omni 및 에이전트 스택 공개

Google이 Gemini 3.5 Flash를 공개
Gemini Omni가 멀티모달 생성을 확대
Antigravity가 에이전트 플랫폼으로 확장
Karpathy가 Anthropic에 합류
OpenAI가 Guaranteed Capacity 출시

#Google#Gemini#OpenAI#Anthropic#Claude

2026년 5월 18일

Cursor, Composer 2.5 공개와 대형 모델 훈련

Cursor가 Composer 2.5를 공개
LangSmith Engine이 에이전트 CI/CD 제시
llama.cpp가 Qwen3.6 MTP를 지원
Qwen3.7 Preview가 Arena 순위 상승
Anthropic이 Stainless를 인수

#Cursor#Composer#OpenAI#Claude#Qwen

2026년 5월 15일

Cerebras IPO, OpenAI 5.4·5.5 서빙 주장

Cerebras IPO가 인프라 논쟁 재점화
CFO가 OpenAI 5.4·5.5 서빙 주장
Codex 모바일이 에이전트 사용면 확대
Claude 한도 초기화로 경쟁 압력 부각
로컬 LLM은 MTP와 고VRAM 실험 집중

#Cerebras#OpenAI#Codex#Anthropic#LocalLLM

2026년 5월 14일

ChatGPT 모바일 앱에 Codex 통합

ChatGPT 모바일 앱에 Codex 통합
GitHub Copilot App 미리보기 공개
LangChain Engine·SmithDB 출시
Claude Code 제한에 개발자 반발
Figure 로봇 24시간 자율 작업

#OpenAI#Codex#GitHub#LangChain#Claude

2026년 5월 13일

Figure, 휴머노이드 로봇 8시간 자율 근무 시연

Figure가 8시간 로봇 근무 시연
Cline SDK와 LangChain 플랫폼 출시
Nous가 TST 2-3배 속도 향상 발표
OpenAI가 Codex 전환 혜택 제공
Anthropic 기업 채택률이 OpenAI 추월

#Figure#OpenAI#Codex

2026년 5월 12일

Perceptron Mk1, 비디오·체화 추론 모델 출시

Perceptron Mk1 비디오 추론 모델 출시
Mini Shai-Hulud 공급망 공격 확산
GB200 대형 MoE 서빙 벤치 공개
Qwen 3.6 장문맥 로컬 평가 화제
Isomorphic Labs가 21억 달러 조달

#Perceptron#Security#Qwen

2026년 5월 11일

Thinking Machines가 상호작용 모델 공개

Thinking Machines가 상호작용 모델 공개
OpenAI가 Deployment Company 출범
OpenAI Daybreak 보안 제품화 추진
코딩 에이전트 벤치마크가 하네스 평가
Qwen 3.6 로컬 추론 기대감 확산

#Thinking Machines#OpenAI#Agent

2026년 5월 8일

OpenAI가 GPT-5.5 제품군과 Codex 런타임을 확장

OpenAI가 GPT-5.5 제품군을 확장
Codex가 장기 실행 에이전트로 진화
Zyphra가 ZAYA1 오픈 모델 공개
Anthropic이 Claude 정렬 연구 발표
DeepMind 공동 수학자가 신기록 달성

#OpenAI#Codex#GPT-5.5

2026년 5월 7일

GPT-Realtime-2, OpenAI API에 출시

OpenAI가 GPT-Realtime-2를 API에 출시
Codex가 Chrome 브라우저 제어 지원
Anthropic이 Natural Language Autoencoders 공개
Qwen3.6 27B 로컬 추론 속도 2.5배 향상
Claude Code 사용 한도가 SpaceX 컴퓨트로 확대

#OpenAI#GPT-Realtime-2#Codex#Anthropic#Qwen

2026년 5월 6일

Anthropic, SpaceX 컴퓨트 제휴로 Claude 한도 확대

Anthropic이 SpaceX 컴퓨트 제휴 체결
Claude Code 5시간 한도가 두 배로 증가
OpenAI가 MRC 네트워크 프로토콜 공개
Gemma 4 MTP 체크포인트 출시
로컬 Qwen 3.6 코딩 활용 확산

#Anthropic#Claude#SpaceX

2026년 5월 5일

GPT-5.5 Instant, ChatGPT 기본 모델로 출시

GPT-5.5 Instant가 기본 모델로 출시
OpenAI Agents SDK TypeScript 공개
Gemma 4 MTP로 디코딩 최대 3배 가속
RadixArk가 1억 달러 시드 유치
Anthropic과 Perplexity가 금융 AI 확장

#OpenAI#GPT-5.5#Gemma#Agents#Anthropic

2026년 5월 5일

OpenAI 모델, Erdős 단위거리 문제에서 수학적 돌파

OpenAI 모델이 수학 난제를 반박
Cohere가 Command A+를 공개
Gemini 3.5 Flash가 확대 출시
Qwen3.7 공개 모델 기대감 상승
Karpathy가 Anthropic에 합류

#OpenAI#Cohere#Gemini

2026년 5월 5일

DeepSeek, V4-Pro 75% 할인 영구화

DeepSeek, V4-Pro 75% 할인 영구화
Codex, Appshots 등 기능 대거 추가
MCP, 무상태 프로토콜 RC 공개
Google, Gemini Spark와 Omni 공개
Anthropic, 취약점 1만 건 이상 발견

#DeepSeek#Qwen#Codex#MCP#Google#Anthropic

2026년 5월 4일

오픈 하네스가 에이전트 성능 격차를 키움

오픈 하네스가 에이전트 성능 격차를 키움
Codex·Copilot 사용량 경제성이 흔들림
HiL-Bench가 명확화 질문 능력을 평가
Zyphra가 장문맥 병렬화 성능을 공개
GPT-5.5가 사이버 시뮬레이션에서 선전

#AI Agents#OpenAI#Codex

2026년 4월 30일

GPT-5.5, 장기 사이버 평가 상위권 진입

GPT-5.5가 사이버 평가 상위권에 진입
Codex가 범용 컴퓨터 작업으로 확장
Qwen3.6 27B가 오픈 모델 선두
Grok 4.3이 에이전트 성능을 개선
보안 스캐너가 AI 제품군으로 부상

#OpenAI#GPT-5.5#Codex#Qwen#Security

2026년 4월 29일

Cursor SDK, 프로그래머블 에이전트 플랫폼으로 출시

Cursor SDK가 에이전트 런타임 공개
OpenAI Codex가 업무 플랫폼으로 확장
Mistral Medium 3.5가 128B로 출시
Qwen FlashQLA가 장문맥 속도 개선
Claude가 Blender와 공식 연동 시작

#Cursor#Codex#Mistral

2026년 4월 28일

NVIDIA Nemotron 3 Nano Omni 공개

NVIDIA가 오픈 옴니 모델을 공개
vLLM 0.20이 메모리 효율을 개선
Poolside가 Laguna XS.2를 출시
Mistral이 Workflows 프리뷰를 공개
ChatGPT가 Erdős 문제 풀이에 기여

#NVIDIA#vLLM#Poolside#Mistral#ChatGPT

2026년 4월 24일

DeepSeek-V4, 1M 컨텍스트(context) 공개

DeepSeek가 DeepSeek-V4 Pro·Flash 공개
1M 컨텍스트(context)·MIT 라이선스 적용
V4 API 가격, Flash가 초저가로 주목
OpenAI, GPT-5.5·Pro를 API에 통합
Anthropic, Claude Code 저하 원인 공개

#OpenAI#Codex#DeepSeek

2026년 4월 23일

OpenAI, GPT-5.5 출시·API는 지연

OpenAI, GPT-5.5 출시·API는 지연
Codex 기능 번들: 브라우저·Sheets·Slides 지원
Artificial Analysis, 환각 86% 등 위험도 지적
Qwen3.6-27B, 로컬 코딩·추론 성능 호평
Anthropic, Claude Code 회귀 원인·대응 공개

#OpenAI#GPT-5.5#Codex#Qwen#Anthropic

2026년 4월 22일

Qwen3.6-27B, 로컬 코딩 모델로 급부상

Qwen3.6-27B, 로컬 코딩 성능 급상승
OpenAI Privacy Filter, PII 마스킹 공개
Google, TPU 8t/8i와 에이전트 플랫폼 발표
팀용 워크스페이스 에이전트, Slack 연동 확산
Anthropic, Claude Code 티어 변경 테스트 논란

#OpenAI#Codex#Qwen#Google#Anthropic

2026년 4월 21일

OpenAI, GPT-Image-2로 ChatGPT Images 2.0 출시

OpenAI, GPT-Image-2로 이미지 기능 강화
Hugging Face, `ml-intern` 에이전트 공개
Moonshot, Kimi K2.6·FlashKDA 인프라 공개
Google, Gemini API에 Deep Research Max 추가
LightOn·vLLM, 검색·배포 실무 지원 강화

#OpenAI#GPT-Image-2#Hugging Face#Kimi#Gemini#vLLM

2026년 4월 17일

Anthropic, Claude Design·Opus 4.7 공개

Anthropic, Claude Design·Opus 4.7 공개
Codex Computer Use, 기업용 UX로 부상
간단한 하네스(harness)가 신뢰성 좌우
Qwen3.6, 로컬 추론(inference) 효율 개선
Stargate, 2029년 9+GW 전력 수요 전망

#Anthropic#Claude#OpenAI#Codex#Qwen#에이전트

2026년 4월 16일

Anthropic이 Claude Opus 4.7 출시

Anthropic이 Claude Opus 4.7 출시
OpenAI가 Codex를 에이전트로 확장
Alibaba, Qwen3.6-35B-A3B 오픈 공개
Cloudflare, Artifacts·Email로 에이전트 인프라
CRUX·AlphaEval로 오픈월드 평가 확산

#Anthropic#Claude#OpenAI#Codex#Qwen

2026년 4월 15일

OpenAI, Agents SDK 하네스 분리와 샌드박스 확장

OpenAI, Agents SDK 하네스 분리와 샌드박스 확장
Cloudflare, Project Think와 Agent Lee 공개
Google, Mac용 Gemini 앱 출시 및 기능 확장
Gemini 3.1 Flash TTS, 제어형 음성 기능 강화
GPT-5.4 Pro의 Erdős 문제 #1196 증명 논의 확산

#OpenAI#Codex#Cloudflare#Gemini#Agents

2026년 4월 14일

Google Chrome 'Skills'로 1클릭 워크플로

Chrome에 Skills로 1클릭 실행 추가
Gemini Robotics-ER 1.6 API 공개
OpenAI GPT-5.4-Cyber 접근 확대
Hugging Face, Hub에 Kernels 출시
OpenRouter Elephant Alpha, 100B 공개

#OpenAI#Codex#Google#Gemini#OpenRouter

2026년 4월 13일

Hermes Agent v0.9.0 로컬 대시보드 출시

Hermes Agent v0.9.0 로컬 대시보드 출시
Claude Mythos, AISI 사이버 레인지 첫 종주
LlamaIndex ParseBench 문서 파싱 벤치마크 공개
Hugging Face, 5B로 arXiv 2.7만편 OCR
Copilot 원격제어·Cursor 분할 에이전트 추가

#OpenAI#Codex#Hermes#Claude#LlamaIndex

2026년 4월 10일

GLM-5.1, Code Arena 코딩 3위 등극

GLM-5.1, Code Arena 코딩 3위 등극
‘저렴한 실행자+비싼 어드바이저’ 확산
Hermes Agent 생태계 확장, 50k★ 달성
ClawBench, 실전 웹 과제 성공률 6.5%
Gemma 4, llama.cpp 안정화와 템플릿 배포

#GLM-5.1#Anthropic#LangChain#Hermes#llama.cpp

2026년 4월 9일

Meta가 MSL 첫 모델 Muse/Spark를 공개했다

Meta가 MSL 첫 모델 Muse/Spark를 공개했다
OpenAI가 Codex 5배 $100 Pro를 도입했다
LangChain이 Deep Agents deploy를 출시했다
Gemma 4가 첫 주 1000만 다운로드를 돌파했다
RAGEN-2가 에이전트 RL 붕괴를 분석했다

#Meta#OpenAI#LangChain#Gemma#Anthropic

2026년 4월 8일

Meta, MSL 첫 모델 Muse Spark 정식 공개

Meta, MSL 첫 모델 Muse Spark 정식 공개
Zhipu AI GLM-5.1, 오픈 웨이트 선두
Anthropic, 장기 실행용 Managed Agents 공개
Qwen3.6-Plus 지표 개선, 가중치 미공개
APEX-Agents-AA, 롱호라이즌 한계 확인

#Meta#Muse Spark#Anthropic#GLM-5.1#Agents#OpenAI#Codex

2026년 4월 7일

Gemma 4, 아이폰 17 Pro에서 40 tok/s 온디바이스 구동

Gemma 4가 로컬·온디바이스 붐을 촉발
Hermes Agent, 자기개선 에이전트 루프 확산
OpenAI, ‘Industrial Policy’로 정책 신호
Anthropic, 2027 TPU·$30B 런레이트 공개
RL·라우팅·MoE 등 연구·시스템 업데이트

#Gemma#OpenAI#Anthropic#에이전트#시스템

2026년 4월 6일

Hermes, Manim 영상 생성 스킬 공개

Hermes가 Manim 영상 생성 스킬 공개
Claude Code 제한 강화로 대안 에이전트 확산
Gemma 4 수요 급증, 생태계 통합 확대
TurboQuant-GPU로 KV 캐시 5.02x 압축
뉴요커, 샘 알트만 의혹 조사 보도 공개

#OpenAI#Codex#Hermes#Claude Code#Gemma 4

2026년 4월 3일

Google이 Apache 2.0으로 Gemma 4 공개

Google이 Apache 2.0으로 Gemma 4 공개
Gemma 4, vLLM·llama.cpp 등 즉시 지원
Hermes Agent가 오픈 하네스(harness)로 부상
Codex 확산 vs Claude Code 레이트 리밋 논쟁
Anthropic, Claude의 171 감정 벡터 연구 공개

#Google#Gemma#Hermes#Anthropic#Codex

2026년 4월 2일

구글 딥마인드, Gemma 4 오픈웨이트 공개

구글 딥마인드, Gemma 4 오픈웨이트 공개
Gemma 4, 256K 컨텍스트·멀티모달 지원
생태계가 llama.cpp·vLLM 등 즉시 지원
Anthropic이 Claude 내부 감정 벡터 연구 공개
OpenAI가 CarPlay 음성모드와 Codex 과금 변경

#Google#Gemma#OpenAI#Codex#Anthropic#Qwen

2026년 4월 1일

Claude Code 소스 유출로 DMCA 논란 확산

Arcee Trinity-Large-Thinking 오픈 웨이트 출시
Z.ai, GLM-5V-Turbo 비전 코딩 모델 발표
Claude Code 소스 유출로 DMCA 논란 확산
OpenAI, Codex 사용량 한도를 전 플랜 리셋
PrismML 1-bit Bonsai로 로컬 LLM 효율↑

#OpenAI#Codex#Anthropic

2026년 3월 31일

Claude Code 소스 유출, 하네스 설계가 드러남

Claude Code 소스 유출, 하네스 설계가 드러남
가중치 아닌 오케스트레이션 로직 노출
Bonsai 1-bit 모델, 초소형 효율 강조
OpenAI, $122B 커밋 자본·$852B 가치
TRL v1.0, RL 툴링 대폭 확장

#Anthropic#Claude Code#OpenAI#Codex#보안

2026년 3월 30일

Anthropic, Claude Code에 컴퓨터 사용 도입

Anthropic, Claude Code에 컴퓨터 사용 도입
OpenAI, Claude Code용 Codex 플러그인 공개
Alibaba, Qwen3.5-Omni 멀티모달 모델 출시
Nous, Hermes Agent 업데이트로 오픈 에이전트 확산
llama.cpp, GitHub 10만 ★ 돌파로 로컬 열기

#OpenAI#Codex#Anthropic#Claude Code#에이전트

2026년 3월 27일

Anthropic의 Opus 상위 ‘Capybara’ 티어가 유출됐다

Anthropic의 Opus 상위 ‘Capybara’ 티어가 유출됐다
Zhipu가 GLM-5.1을 코딩 플랜에 공개했다
TurboQuant 논문이 RaBitQ 오기재로 논란이다
OpenAI가 Codex 플러그인으로 자동화를 밀었다
Meta가 SAM 3.1로 비디오 처리량을 2배로 늘렸다

#Anthropic#OpenAI#Codex#GLM-5.1#TurboQuant

2026년 3월 26일

OpenAI GPT-5.4 mini/nano 성능·비용 경쟁

Google, Gemini 3.1 Flash Live 공개
Mistral Voxtral TTS 오픈웨이트 출시
Cohere Transcribe, 첫 오디오 모델 공개
OpenAI GPT-5.4 mini/nano 성능·비용 경쟁
Cline Kanban, 멀티 에이전트 워크트리 지원

#OpenAI#GPT-5.4#Gemini

2026년 3월 25일

ARC-AGI-3 공개, 인간 100%·모델 <1%

ARC-AGI-3 벤치마크 공개, 인간 100%·모델 <1%
LangChain, Fleet 공유 스킬 레지스트리 출시
Google, Lyria 3 Pro로 3분 음악 생성 확장
LiteLLM PyPI 1.82.7/1.82.8 공급망 공격 경고
Intel Arc Pro B70 32GB, $949 로컬 추론 주목

#OpenAI#Codex#ARC-AGI-3#에이전트#LangChain#Claude Code#하드웨어

2026년 3월 24일

LiteLLM PyPI 공급망 공격, 자격증명 유출 우려

LiteLLM PyPI 공급망 공격, 자격증명 유출 우려
Figma MCP 오픈 베타로 캔버스 직접 편집
Hermes Agent v0.4.0, 개인 에이전트 런타임 강화
vLLM·Transformers, 추론 성능 격차 빠르게 축소
OpenAI, 재단 10억달러 집행과 Spud 개발 소문

#OpenAI#Codex#LiteLLM#Anthropic#Figma

2026년 3월 23일

Claude, macOS 컴퓨터 사용(Computer Use) 공개

Claude, macOS 컴퓨터 사용(Computer Use) 공개
Cursor, Instant Grep로 초고속 검색 공개
Sakana AI, 일본용 Sakana Chat 출시
WebArena-Infinity, 환경 생성 비용 절감
LeWorldModel, 1 GPU JEPA 레시피 주목

#OpenAI#Codex#Anthropic

2026년 3월 20일

Cursor Composer 2, Kimi K2.5 기반 논란

Cursor Composer 2, Kimi K2.5 기반 논란
NVIDIA Nemotron-Cascade 2 공개, 30B MoE
OpenAI, Codex for Students로 $100 크레딧
Mistral Small 4, 멀티모달·추론 모드 추가
FAIR V-JEPA 2.1, 비디오 이해 성능 강화

#Cursor#Kimi#NVIDIA#OpenAI#Codex#LangChain

2026년 3월 19일

Cursor가 Composer 2 코딩 모델 공개

Cursor가 Composer 2 코딩 모델 공개
OpenAI, Astral 팀을 Codex에 합류
LangChain, LangSmith Fleet 엔터프라이즈 출시
MiniMax M2.7, 에이전트 지향 모델 강조
Qwen 3.5 Max, late-interaction 검색 성과

#OpenAI#Cursor#Anthropic#LangChain#MiniMax

2026년 3월 18일 헤드라인

MiniMax, 효율·‘자기 진화’ 내세운 MiniMax 2.7 공개

MiniMax가 효율형 오픈 모델 2.7 공개
OpenAI, 16MB LM Parameter Golf 공개
Anthropic, 1주 8만명 Claude 인터뷰
Unsloth Studio, 로컬 LLM 학습·실행 UI
Runway, 100ms 이하 실시간 HD 영상 시연

#MiniMax#OpenAI#Anthropic#MCP#LLM

2026년 3월 17일

OpenAI, GPT-5.4 mini/nano 출시

OpenAI가 GPT-5.4 mini/nano를 출시
미니 모델, 코딩·서브에이전트 최적화
LangChain, Sandboxes와 Open SWE 공개
Mamba-3·Attention Residuals 논의 확산
Unsloth Studio, 로컬 학습·추론 UI 출시

#OpenAI#Codex#에이전트#오픈소스#아키텍처

2026년 3월 16일

Perplexity, Android용 Computer 출시

Perplexity, Android용 Computer 출시
Google, Gemini Embedding 2 공개
Moonshot `Attention Residuals` 논문 화제
OpenAI Codex, 주간 활성 200만+ 언급
NVIDIA, Nemotron 라이선스 제약 완화

#OpenAI#Codex#Perplexity#Google#LangChain

2026년 3월 13일

Anthropic, Opus 4.6 1M 컨텍스트 기본 제공

Anthropic, Opus 4.6 1M 컨텍스트 기본 제공
Perplexity Computer, iOS 크로스디바이스 동기화
RandOpt, 가우시안 탐색으로 RL 성능 근접
OmniCoder-9B, 262K 컨텍스트 오픈 웨이트 공개
OpenFold3 preview 2, 학습셋·설정까지 공개

#OpenAI#Codex#Anthropic#MCP#Qwen

2026년 3월 12일 헤드라인

Google, Gemini 기반 'Ask Maps' 포함 Maps 대규모 업데이트

Google Maps가 Gemini로 10년 만에 대개편
Claude가 채팅에서 인터랙티브 차트 생성
CursorBench로 코딩 에이전트 평가가 고도화
Gemini Embedding 2로 멀티모달 검색 경쟁 격화
Nemotron 3 Super, 오픈웨이트 120B 모델 공개

#Google#OpenAI#Claude#MCP#NVIDIA

2026년 3월 11일

NVIDIA가 Nemotron 3 Super를 공개했다

NVIDIA가 Nemotron 3 Super를 공개했다
Perplexity가 Personal Computer를 출시했다
Anthropic이 The Anthropic Institute를 출범했다
Yann LeCun의 AMI Labs가 $1.03B를 유치했다
Fish Audio가 S2 TTS 모델을 공개했다

#NVIDIA#Nemotron#Perplexity#Anthropic#Agents

2026년 3월 9일 헤드라인

LLM이 더 작은 LLM을 완전 자율로 학습시키기 시작

LLM이 더 작은 LLM을 자율 학습하기 시작
Claude Code가 멀티에이전트 PR 리뷰를 공개했다
OpenAI가 Promptfoo 인수로 보안 eval을 강화했다
vLLM이 Jetson에서 로컬 어시스턴트를 시연했다
Figure Helix 02가 거실 정리 자율 데모를 공개했다

#OpenAI#Claude#에이전트#vLLM#로보틱스

2026년 3월 6일

OpenAI GPT‑5.4, AA 지수 공동 1위 복귀

OpenAI GPT‑5.4, AA 지수 공동 1위 복귀
Codex Security와 OSS 지원 프로그램 공개
Claude Opus 4.6, Firefox 고위험 취약점 다수 발견
vLLM v0.17과 Triton attention 백엔드 출시
KernelAgent·AMD 대회로 커널 최적화 경쟁 가속

#OpenAI#GPT-5.4#보안#Anthropic#vLLM

2026년 3월 5일 헤드라인

OpenAI, GPT-5.4 Thinking·Pro를 ChatGPT·API·Codex에 출시

OpenAI가 GPT-5.4 Thinking·Pro 출시
FlashAttention-4, Blackwell에서 가속
AI2, OLMo Hybrid 7B 오픈 공개
Databricks, RL 기반 에이전트 KARL 발표
장문 컨텍스트, ‘context rot’ 경고 확산

#OpenAI#GPT-5.4#FlashAttention-4#OLMo#Cursor

2026년 3월 4일

OpenAI, Windows용 Codex 앱과 오픈소스 샌드박스 공개

OpenAI, Windows용 Codex 앱 공개
Alibaba Qwen, 조직 개편·컴퓨트 논란
Gemini 3.1 Flash-Lite, 속도·비용 강조
SSD 추론, vLLM/SGLang 대비 최대 2배
VS Code, 에이전트 기능 강화·주간 출시

#OpenAI#Anthropic#Google#Qwen#vLLM

2026년 3월 3일

OpenAI가 GPT‑5.3 Instant를 전면 배포

OpenAI가 GPT‑5.3 Instant를 전면 배포
Google이 Gemini 3.1 Flash‑Lite 공개
Alibaba Qwen 리더십 이탈로 OSS 불안
Together가 5M 컨텍스트 학습 메모리 87% 절감
Cursor가 MCP Apps로 대화형 UI를 채팅에 통합

#OpenAI#Codex#Gemini#Qwen#MCP

2026년 3월 2일

Alibaba가 Qwen 3.5 Small 오픈 모델 공개

Alibaba가 Qwen 3.5 Small 오픈 모델 공개
Claude 장애로 ‘가용성’ 논의 확산
Apple Neural Engine 역공학 학습 주목
ByteDance CUDA Agent, 커널 RL 성과
DoW 계약 수정안, 감시 금지 조항 논쟁

#Qwen#OpenAI#Codex#인프라#정책

2026년 2월 25일 헤드라인

Perplexity, 오케스트레이션 우선 에이전트 ‘Computer’ 출시

Perplexity, 에이전트 ‘Computer’ 출시
Karpathy, 코딩 에이전트 상전이 언급
OpenAI, GPT‑5.3‑Codex API 공개
Qwen3.5 Medium, 로컬 배포 속도전
Anthropic, Vercept 인수·RSP v3 전환

#Perplexity#OpenAI#Qwen#Anthropic#Agents

2026년 2월 24일 헤드라인

OpenAI, Responses API에 GPT-5.3-Codex 출시

OpenAI가 GPT-5.3-Codex를 출시
Qwen 3.5 Medium 시리즈 공개
Anthropic, Claude Code 원격 제어 도입
Cursor, “demos not diffs”로 전환
Mercury 2, ~1,000토큰/초 강조

#OpenAI#Qwen#Claude

2026년 2월 23일 헤드라인

Anthropic, DeepSeek·Moonshot·MiniMax의 Claude 대규모 distillation 공격 의혹 제기

Anthropic이 Claude 증류 공격을 주장
OpenAI가 SWE-Bench Verified를 폐기
Responses API에 WebSockets가 추가됨
LMArena에서 GPT-5.2-chat-latest 급상승
OpenAI가 BCG·McKinsey와 협력 확대

#Anthropic#OpenAI#Claude#SWE-Bench#WebSockets

2026년 2월 20일

ggml.ai/llama.cpp가 Hugging Face에 합류

ggml.ai/llama.cpp가 Hugging Face에 합류
Anthropic이 Claude Code Security를 공개
Taalas ASIC, 16k–17k tok/s 데모 주장
METR, Opus 4.6 time-horizon을 ~14.5h로 추정
Gemini 3.1 Pro의 비용·토큰 효율 논쟁

#HuggingFace#llama.cpp#Anthropic#Gemini#보안

2026년 2월 19일 헤드라인

구글, Gemini 3.1 Pro 공개...ARC-AGI-2 77.1%

구글이 Gemini 3.1 Pro를 공개
ARC-AGI-2 77.1%로 추론 도약
AA·Arena서 상위권 성능 재확인
에이전트 툴링·비용 논쟁이 커뮤니티로 확산
Discord선 OpenRouter 장애도 논의

#Google#Gemini#OpenRouter#Anthropic#OpenAI

2026년 2월 18일

OpenAI, EVMbench로 스마트컨트랙트 보안 평가

Claude 4.6, 지표 상승·토큰비용 급증
OpenAI, EVMbench 보안 벤치 공개
Google Lyria 3, Gemini에 음악 생성
Cursor, 과거 대화 컨텍스트(context) 추가
Qwen3.5 FP8 가중치 공개 확산

#OpenAI#Anthropic#Google#MCP#벤치마크

2026년 2월 16일 헤드라인

알리바바, Qwen3.5-397B-A17B 오픈 가중치 공개

Qwen3.5-397B-A17B 오픈가중치 발표
vLLM, Qwen3.5 Day-0 지원 공개
OpenAI, OpenClaw 인수 흐름 확산
ChatGPT Lockdown Mode로 공격면 축소
중국 CNY 모델 러시·로보틱스 가속

#Qwen#OpenAI#Anthropic#vLLM#에이전트

2026년 2월 12일 헤드라인

Google DeepMind, Gemini 3 Deep Think V2 공개…ARC-AGI-2 84.6% 달성

Gemini 3 Deep Think V2, ARC-AGI-2 SOTA
OpenAI, GPT-5.3-Codex-Spark 프리뷰 공개
MiniMax M2.5·GLM-5, 오픈 코딩 경쟁 가속
A2A·KV-cache, 에이전트 인프라 논쟁 확대
QED-Nano·LeJEPA 등 연구 업데이트

#Google DeepMind#Gemini#OpenAI#Anthropic#Agents

2026년 2월 11일 헤드라인

Zhipu AI, MIT 라이선스 오픈 웨이트 GLM-5 공개

Zhipu AI가 MIT 라이선스 GLM-5 공개
DeepSeek 1M 컨텍스트 루머와 DPA 개선
SeeDance v2.0 품질·가격 논의 확산
에이전트 워크플로우: Codex, MCP, DeepWiki
오픈 벤치마크 $3M 지원과 에이전트 보안 논쟁

#GLM-5#Zhipu AI#DeepSeek#MiniMax#OpenAI

2026년 2월 10일 헤드라인

알리바바, Qwen‑Image‑2.0 공개… 7B 통합 생성·편집

알리바바 Qwen‑Image‑2.0 7B 공개
ByteDance Seedance 2.0, T2V 도약
OpenAI Responses API 장기 작업 강화
Kimi Agent Swarm, 100 서브에이전트
Isomorphic Labs, IsoDDE 성능 향상 주장

#Qwen#Alibaba#ByteDance#OpenAI#Kimi#Isomorphic Labs

2026년 2월 6일

GPT-5.3-Codex·Claude Opus 4.6 A/B 확산

GPT-5.3-Codex·Claude Opus 4.6 A/B 확산
Waymo, Genie 3 기반 월드 모델 공개
Hugging Face, Community Evals 출시
InfMem·LatentMem, 장문 메모리 제어
에이전트 스웜, ‘팀 설계’로 수렴

#OpenAI#Codex#Claude#Waymo#Hugging Face

2026년 2월 4일 헤드라인

Cerebras, $1B 투자 유치로 $23B 평가

Cerebras가 $1B 투자로 $23B 평가
VS Code가 Agent Sessions로 에이전트 통합
METR, GPT-5.2 High 6.6시간 성과 보고
Qwen3-Coder-Next 80B MoE 모델 공개
ACE-Step-1.5, MIT 오픈 음악 생성 모델 출시

#OpenAI#Cerebras#Gemini#VS Code#METR

2026년 2월 2일

OpenAI, macOS용 Codex 데스크톱 앱 출시

OpenAI, macOS용 Codex 데스크톱 앱 출시
Codex 앱, 워크트리·스킬·자동화 지원
StepFun Step-3.5-Flash 공개, 256K 컨텍스트
Kimi K2.5, Code Arena 오픈모델 1위
RAG 청킹, 쿼리별 최적화로 리콜 20–40%↑

#OpenAI#Codex#StepFun#Kimi#RAG

2026년 2월 2일

OpenAI, GPT‑5.2·GPT‑5.2‑Codex 40% 가속

OpenAI, GPT‑5.2·GPT‑5.2‑Codex 40% 가속
Alibaba, Qwen3‑Coder‑Next 80B@3B 공개
Zhipu, GLM‑OCR 0.9B 출시와 day‑0 지원
Anthropic, Claude Agent SDK의 Xcode 통합
LangChain, 에이전트 트레이스·평가 가이드 제시

#OpenAI#Codex#Qwen#vLLM#LangChain

2026년 1월 30일 헤드라인

Moltbook·OpenClaw, ‘에이전트-에이전트’ 소셜 네트워크 확산

Moltbook·OpenClaw 에이전트 포럼 급부상
Anthropic 연구: AI 코딩은 학습 저하 가능
Moonshot Kimi K2.5, Agent Swarm·PARL 공개
Google Genie 3 공개, 게임 vs 비디오 논쟁
Windsurf Arena Mode, IDE 내 모델 대결 도입

#Moltbook#OpenClaw#OpenAI#Anthropic#Kimi#Google

2026년 1월 29일 헤드라인

xAI, Grok Imagine 이미지·비디오 생성·편집 API 출시

xAI가 Grok Imagine API로 SOTA 출시
DeepMind가 Genie 3를 Ultra에 공개
Kimi K2.5가 오픈 모델 1위 주장
Qwen3-ASR 출시, vLLM day-0 지원
에이전트 표준·샌드박스 논의 확산

#xAI#Grok#Google#Kimi#Qwen

2026년 1월 28일

DeepMind, AlphaGenome 모델·가중치 공개

DeepMind가 AlphaGenome 모델·가중치 공개
Kimi K2.5가 오픈 모델 화제로 부상
Chrome이 Gemini 3 Auto Browse 프리뷰 공개
NVIDIA가 NVFP4 Nemotron 3 Nano 발표
에이전트 evals·하네스·추적 논의 확대

#OpenAI#Codex#DeepMind#Kimi#Gemini

2026년 1월 27일 헤드라인

MoonshotAI, Kimi K2.5 공개: 멀티모달 MoE와 Agent Swarm

MoonshotAI가 Kimi K2.5를 공개
K2.5 Agent Swarm이 100 서브에이전트 지원
Trinity Large(400B MoE) 프리뷰 공개
OpenAI Prism이 GPT-5.2로 무료 출시
DeepSeek-OCR 2, 토큰 압축과 읽기순서 학습

#MoonshotAI#Kimi#OpenAI#DeepSeek#HuggingFace

2026년 1월 26일 헤드라인

Anthropic, MCP Apps 스펙 발표 및 Claude.ai 공식 지원

Anthropic가 MCP Apps 스펙을 발표
Claude.ai, MCP Apps UI를 공식 지원
Qwen3-Max-Thinking 등 추론 모델 출시
vLLM, ‘day-0’ 지원 비용 논쟁
llama.cpp, GLM-4.7-Flash 최적화

#Anthropic#Claude#MCP#OpenAI#vLLM

2026년 1월 21일 헤드라인

OpenEvidence, 120억달러 가치로 투자 유치

OpenEvidence가 120억달러 투자 유치
Anthropic이 Claude 헌법을 CC0로 공개
Podium이 AI 에이전트 ARR 1억달러 주장
AirLLM이 8GB로 405B 추론(inference) 제시
Runpod이 $120M ARR로 GPU 클라우드 성장

#OpenEvidence#Anthropic#Claude#MCP#AirLLM

2026년 1월 20일

X가 ‘For You’ 추천 알고리즘을 오픈소스 공개

X가 ‘For You’ 추천 알고리즘을 오픈소스 공개
OpenAI가 ChatGPT 연령 예측을 전 세계 적용
GLM-4.7-Flash 로컬 추론(inference) 주목
Liquid AI가 900MB 온디바이스 추론 모델 공개
Microsoft가 내부 Claude Code 배포를 일시 중단

#X#OpenAI#GLM-4.7-Flash#Microsoft#MCP

2026년 1월 19일

Zhipu AI, GLM-4.7-Flash 공개

Zhipu AI가 GLM-4.7-Flash 공개
STEM·RePo로 메모리·컨텍스트 확장
DSPy에 `dspy.RLM`로 RLM 도입
DeepMind, Gemini 안전 프로브 운영
GPT-5.2 에이전트로 3M줄 브라우저

#OpenAI#Codex#GLM-4.7#DSPy#Gemini

2026년 1월 16일 헤드라인

OpenAI, ChatGPT Go($8/월) 출시 및 Free·Go 광고 테스트 발표

OpenAI가 Free·Go 티어 광고 테스트 시작
ChatGPT Go($8/월), 메시지 10배 제공
Sam Altman, ‘매우 빠른 Codex’ 예고
FLUX.2 [klein], vLLM-Omni day-0 지원
SWE-rebench 12월, Opus 4.5 63.3% 1위

#OpenAI#ChatGPT Go#광고#Codex#Claude

2025년 12월 24일 헤드라인

LeCun, AMI Labs 출범…세계 모델 위해 $1.03B 시드

AMI Labs, $1.03B 시드로 출범
LeCun, JEPA로 세계 모델 전략 강조
에이전트=모델+하네스(harness) 확산
Gemini Embedding 2, 멀티모달 임베딩 공개
Hugging Face, $8/TB 스토리지 버킷 출시

#AMI Labs#World Models#JEPA