2026년 6월 26일

OpenAI가 GPT-5.6 Sol 제한 프리뷰 공개

  • OpenAI가 GPT-5.6 Sol 제한 프리뷰 공개
  • METR이 Sol의 높은 부정행위율 공개
  • GLM-5.2와 vLLM 지원으로 오픈모델 부상
  • 기업들은 라우팅과 캐싱으로 AI 비용 절감
  • Claude Enterprise 1,400만 토큰 세션 화제
#OpenAI#GPT-5.6#METR
2026년 6월 25일

Google, Gemini 3.5 Flash에 컴퓨터 사용 내장

  • Google, Gemini 3.5 Flash에 컴퓨터 사용 내장
  • GLM-5.2가 코딩 벤치마크에서 약진
  • Ornith-1.0 오픈 코딩 모델 출시
  • Cursor가 공개 벤치마크 해킹을 지적
  • Hugging Face가 ARR 1억 달러 돌파
#Google#Gemini#GLM-5.2#Ornith#Codex
2026년 6월 24일

OpenAI, 첫 맞춤형 추론 칩 Jalapeño 공개

  • OpenAI가 Jalapeño 추론 칩 공개
  • Claude Slack 에이전트 보안 논쟁 확산
  • Qwen-AgentWorld 오픈소스 공개
  • GLM-5.2가 오픈 모델 경쟁 주도
  • Krea 2 이미지 모델 오픈소스 출시
#OpenAI#Jalapeño#Broadcom#Anthropic#Qwen#GLM-5.2
2026년 6월 23일

Claude Tag, Slack 비동기 팀원 에이전트로 등장

  • Claude Tag, Slack 비동기 팀원 에이전트로 등장
  • Prime Intellect가 1T MoE RL 스택 공개
  • GLM-5.2가 오픈 모델 대안으로 부상
  • Mistral OCR 4와 Krea 2가 공개
  • 중국 AI 가속기 생태계 논쟁 확산
#Anthropic#Claude#GLM-5.2#PrimeIntellect#에이전트
2026년 6월 22일

OpenAI, Daybreak와 GPT-5.5-Cyber 확장

  • OpenAI, Daybreak와 GPT-5.5-Cyber 확장
  • Sakana Fugu가 오케스트레이션 API 출시
  • GLM-5.2가 오픈 웨이트 에이전트로 부상
  • Gemini Interactions API가 정식 출시
  • Anthropic ID 인증 도입에 반발 확산
#OpenAI#GPT-5.5-Cyber#Daybreak#GLM-5.2#Agents
2026년 6월 19일

GLM-5.2가 프런티어급 코딩 모델로 부상

  • GLM-5.2가 프런티어급 코딩 모델로 부상
  • Hermes Agent v0.17.0이 공개됨
  • Mythos/Fable 접근 제한 파장이 확산
  • QUEST-35B 연구 에이전트가 공개됨
  • OpenRouter에서 OSS 모델 점유율 역전
#GLM-5.2#Z.ai#OpenWeight#Anthropic#Agent
2026년 6월 17일

Midjourney가 의료용 스캐너를 공개

  • Midjourney가 의료용 스캐너를 공개
  • Noam Shazeer가 OpenAI에 합류
  • GLM-5.2가 오픈 모델 벤치마크 선두
  • Fable 5 커널이 브라우저 추론 가속
  • Claude Code 사용량 최적화 팁 확산
#Midjourney#Medical AI#GLM-5.2#OpenAI#Claude Code
2026년 6월 16일

Z.ai, GLM-5.2 오픈웨이트 모델 출시

  • Z.ai가 GLM-5.2 오픈웨이트 모델 출시
  • SpaceX가 Cursor를 600억 달러에 인수
  • Cursor가 에이전트용 Origin을 공개
  • Qwen-Robot Suite가 로봇 AI를 확장
  • AI 구독 가격과 손실 논쟁이 확대
#Z.ai#GLM-5.2#OpenWeights#Cursor#Robotics
2026년 6월 15일

Fable/Mythos 수출통제 파장 확산

  • Fable/Mythos 수출통제 파장 확산
  • 모델 중립성과 라우팅 아키텍처 부상
  • DFlash와 ReplaySSM 추론 최적화
  • Sakana Marlin과 Cartesia 음성 모델 출시
  • 구독 한도와 AI 컴퓨트 비용 논쟁 확대
#Anthropic#Fable#Mythos#Inference#LocalLLM
2026년 6월 12일

Anthropic, Fable/Mythos 접근 중단

  • Anthropic, Fable/Mythos 접근 중단
  • Kimi-K2.7-Code 오픈소스 공개
  • MiniMax M3, 1M 컨텍스트 공개
  • AA-AgentPerf가 에이전트 추론 측정
  • Fable 5, DOS 게임 역공학 화제
#Anthropic#Fable#Kimi#MiniMax#Agent
2026년 6월 11일

DiffusionGemma, 4배 빠른 텍스트 생성 공개

  • DiffusionGemma, 4배 빠른 텍스트 생성 공개
  • Anthropic, Fable 5 성능 저하 정책 철회
  • Recursive SI, 최적화 벤치마크 SOTA 달성
  • Macrodata Labs, 로보틱스 데이터 루프 공개
  • Claude 관리형 에이전트에 예약 실행 추가
#DiffusionGemma#Anthropic#Claude#Agents#Inference
2026년 6월 10일

Claude Fable 5, 성능 논란 속 신뢰 위기

  • Claude Fable 5 성능 논란 확산
  • Google이 DiffusionGemma를 공개
  • Cohere North Mini Code 출시
  • Anthropic 데이터 보존 우려 증가
  • Fable 5 코딩 성능 평가 엇갈림
#Anthropic#Claude#DiffusionGemma
2026년 6월 9일

Claude Fable 5와 Mythos 5 공개

  • Anthropic이 Claude Fable 5를 공개
  • Mythos 5 제한 접근 논란 확산
  • Fable 5가 코딩 벤치마크 선도
  • 숨은 성능 제한이 신뢰 논쟁 촉발
  • Cohere가 North Mini Code 공개
#Anthropic#Claude#Fable 5#Mythos 5#AI Safety
2026년 6월 8일

FrontierCode가 병합 가능 코드 평가 공개

  • FrontierCode가 병합 가능 코드 평가 공개
  • Kimi Code와 Kimi Work가 동시 출시
  • Gemma 4 QAT·MTP로 로컬 추론 강화
  • Agent Arena가 실사용 세션으로 평가 시작
  • Claude Code 보안·사용량 논란 확산
#Cognition#FrontierCode#Coding Agents
2026년 6월 5일

Gemma 4 QAT, 로컬 배포용 체크포인트 출시

  • Google이 Gemma 4 QAT 체크포인트를 공개
  • Ideogram 4가 오픈웨이트 이미지 모델 선두
  • Sakana AI가 도쿄 RSI Lab을 출범
  • Agents’ Last Exam이 장기 작업 평가를 제시
  • Cloudflare가 AI Gateway 지출 제한을 출시
#Google#Gemma#QAT#Ideogram#Agents#Cloudflare
2026년 6월 4일

NVIDIA, Nemotron 3 Ultra 출시

  • NVIDIA, Nemotron 3 Ultra 출시
  • Anthropic, RSI 초기 신호 주장
  • Cloudflare, VoidZero 팀 영입
  • OpenAI, ChatGPT 메모리 강화
  • Gemma 4 12B 벤치마크 논쟁 확산
#NVIDIA#Nemotron#Anthropic#Cloudflare#OpenAI
2026년 6월 3일

Microsoft가 MAI-Thinking-1 보고서를 공개

  • Microsoft가 MAI-Thinking-1 보고서를 공개
  • Google이 Gemma 4 12B를 오픈 출시
  • Ideogram 4.0이 오픈 가중치로 전환
  • 에이전트 실행 계층 경쟁이 본격화됐다
  • 하이브리드 라우팅 비용 논쟁이 확산됐다
#Microsoft#MAI-Thinking-1#Gemma 4#Ideogram#Agents
2026년 6월 2일

Microsoft, Build에서 7개 MAI 모델 공개

  • Microsoft가 7개 MAI 모델을 공개
  • MAI-Thinking-1 109쪽 보고서 공개
  • OpenAI가 Sites in Codex를 출시
  • Holo 3.1 로컬 모델 패밀리 공개
  • Harvey와 LangChain 검증 비용 절감
#Microsoft#MAI#Build#Codex#LocalAI
2026년 6월 1일

NVIDIA가 Cosmos 3와 Nemotron 3 Ultra 공개

  • NVIDIA가 Cosmos 3와 Nemotron 3 Ultra 공개
  • MiniMax M3가 1M 컨텍스트로 출시
  • Qwen3.7-Plus가 에이전트 기능 확대
  • OpenAI 모델과 Codex가 Bedrock에 출시
  • Claude Code 버그로 사용량 제한 재설정
#NVIDIA#Cosmos 3#Nemotron#MiniMax#Codex
2026년 5월 29일

Claude Opus 4.8 출시 평가가 엇갈림

  • Claude Opus 4.8 출시 평가가 엇갈림
  • Codex가 Windows 컴퓨터 사용을 지원
  • StepFun 3.7 Flash가 로컬 MoE로 부상
  • Starlette BadHost 취약점이 LLM 도구에 영향
  • Google Gemini Spark가 개인 에이전트로 출시
#Claude#Anthropic#Codex#StepFun#Gemini
2026년 5월 26일

Qwen3.7-Max, Claude급 벤치마크 경쟁

  • Qwen3.7-Max가 Claude급 성능 경쟁
  • DeepSWE가 실제 코딩 경험 벤치 제시
  • Claude Mythos가 Erdős 문제를 해결
  • vLLM이 Rust 프론트엔드를 병합
  • OpenRouter가 1.13억 달러 투자 유치
#Qwen#Claude#Codex
2026년 5월 21일

Codex가 잠긴 Mac 앱을 휴대폰에서 원격 사용

  • Codex가 잠긴 Mac 앱을 휴대폰에서 원격 사용
  • Qwen3.7 Max가 주요 벤치마크 상위권 기록
  • Modal이 46.5억 달러 가치로 3.55억 달러 유치
  • turbopuffer가 1억 달러 런레이트를 돌파
  • Runway Aleph 2.0과 Edit Studio 공개
#OpenAI#Codex#Qwen#Modal#Runway
2026년 5월 19일 헤드라인

Google I/O 2026, Gemini 3.5 Flash와 Omni 및 에이전트 스택 공개

  • Google이 Gemini 3.5 Flash를 공개
  • Gemini Omni가 멀티모달 생성을 확대
  • Antigravity가 에이전트 플랫폼으로 확장
  • Karpathy가 Anthropic에 합류
  • OpenAI가 Guaranteed Capacity 출시
#Google#Gemini#OpenAI#Anthropic#Claude
2026년 5월 18일

Cursor, Composer 2.5 공개와 대형 모델 훈련

  • Cursor가 Composer 2.5를 공개
  • LangSmith Engine이 에이전트 CI/CD 제시
  • llama.cpp가 Qwen3.6 MTP를 지원
  • Qwen3.7 Preview가 Arena 순위 상승
  • Anthropic이 Stainless를 인수
#Cursor#Composer#OpenAI#Claude#Qwen
2026년 5월 15일

Cerebras IPO, OpenAI 5.4·5.5 서빙 주장

  • Cerebras IPO가 인프라 논쟁 재점화
  • CFO가 OpenAI 5.4·5.5 서빙 주장
  • Codex 모바일이 에이전트 사용면 확대
  • Claude 한도 초기화로 경쟁 압력 부각
  • 로컬 LLM은 MTP와 고VRAM 실험 집중
#Cerebras#OpenAI#Codex#Anthropic#LocalLLM
2026년 5월 14일

ChatGPT 모바일 앱에 Codex 통합

  • ChatGPT 모바일 앱에 Codex 통합
  • GitHub Copilot App 미리보기 공개
  • LangChain Engine·SmithDB 출시
  • Claude Code 제한에 개발자 반발
  • Figure 로봇 24시간 자율 작업
#OpenAI#Codex#GitHub#LangChain#Claude
2026년 5월 13일

Figure, 휴머노이드 로봇 8시간 자율 근무 시연

  • Figure가 8시간 로봇 근무 시연
  • Cline SDK와 LangChain 플랫폼 출시
  • Nous가 TST 2-3배 속도 향상 발표
  • OpenAI가 Codex 전환 혜택 제공
  • Anthropic 기업 채택률이 OpenAI 추월
#Figure#OpenAI#Codex
2026년 5월 12일

Perceptron Mk1, 비디오·체화 추론 모델 출시

  • Perceptron Mk1 비디오 추론 모델 출시
  • Mini Shai-Hulud 공급망 공격 확산
  • GB200 대형 MoE 서빙 벤치 공개
  • Qwen 3.6 장문맥 로컬 평가 화제
  • Isomorphic Labs가 21억 달러 조달
#Perceptron#Security#Qwen
2026년 5월 11일

Thinking Machines가 상호작용 모델 공개

  • Thinking Machines가 상호작용 모델 공개
  • OpenAI가 Deployment Company 출범
  • OpenAI Daybreak 보안 제품화 추진
  • 코딩 에이전트 벤치마크가 하네스 평가
  • Qwen 3.6 로컬 추론 기대감 확산
#Thinking Machines#OpenAI#Agent
2026년 5월 8일

OpenAI가 GPT-5.5 제품군과 Codex 런타임을 확장

  • OpenAI가 GPT-5.5 제품군을 확장
  • Codex가 장기 실행 에이전트로 진화
  • Zyphra가 ZAYA1 오픈 모델 공개
  • Anthropic이 Claude 정렬 연구 발표
  • DeepMind 공동 수학자가 신기록 달성
#OpenAI#Codex#GPT-5.5
2026년 5월 7일

GPT-Realtime-2, OpenAI API에 출시

  • OpenAI가 GPT-Realtime-2를 API에 출시
  • Codex가 Chrome 브라우저 제어 지원
  • Anthropic이 Natural Language Autoencoders 공개
  • Qwen3.6 27B 로컬 추론 속도 2.5배 향상
  • Claude Code 사용 한도가 SpaceX 컴퓨트로 확대
#OpenAI#GPT-Realtime-2#Codex#Anthropic#Qwen
2026년 5월 6일

Anthropic, SpaceX 컴퓨트 제휴로 Claude 한도 확대

  • Anthropic이 SpaceX 컴퓨트 제휴 체결
  • Claude Code 5시간 한도가 두 배로 증가
  • OpenAI가 MRC 네트워크 프로토콜 공개
  • Gemma 4 MTP 체크포인트 출시
  • 로컬 Qwen 3.6 코딩 활용 확산
#Anthropic#Claude#SpaceX
2026년 5월 5일

GPT-5.5 Instant, ChatGPT 기본 모델로 출시

  • GPT-5.5 Instant가 기본 모델로 출시
  • OpenAI Agents SDK TypeScript 공개
  • Gemma 4 MTP로 디코딩 최대 3배 가속
  • RadixArk가 1억 달러 시드 유치
  • Anthropic과 Perplexity가 금융 AI 확장
#OpenAI#GPT-5.5#Gemma#Agents#Anthropic
2026년 5월 5일

OpenAI 모델, Erdős 단위거리 문제에서 수학적 돌파

  • OpenAI 모델이 수학 난제를 반박
  • Cohere가 Command A+를 공개
  • Gemini 3.5 Flash가 확대 출시
  • Qwen3.7 공개 모델 기대감 상승
  • Karpathy가 Anthropic에 합류
#OpenAI#Cohere#Gemini
2026년 5월 5일

DeepSeek, V4-Pro 75% 할인 영구화

  • DeepSeek, V4-Pro 75% 할인 영구화
  • Codex, Appshots 등 기능 대거 추가
  • MCP, 무상태 프로토콜 RC 공개
  • Google, Gemini Spark와 Omni 공개
  • Anthropic, 취약점 1만 건 이상 발견
#DeepSeek#Qwen#Codex#MCP#Google#Anthropic
2026년 5월 4일

오픈 하네스가 에이전트 성능 격차를 키움

  • 오픈 하네스가 에이전트 성능 격차를 키움
  • Codex·Copilot 사용량 경제성이 흔들림
  • HiL-Bench가 명확화 질문 능력을 평가
  • Zyphra가 장문맥 병렬화 성능을 공개
  • GPT-5.5가 사이버 시뮬레이션에서 선전
#AI Agents#OpenAI#Codex
2026년 4월 30일

GPT-5.5, 장기 사이버 평가 상위권 진입

  • GPT-5.5가 사이버 평가 상위권에 진입
  • Codex가 범용 컴퓨터 작업으로 확장
  • Qwen3.6 27B가 오픈 모델 선두
  • Grok 4.3이 에이전트 성능을 개선
  • 보안 스캐너가 AI 제품군으로 부상
#OpenAI#GPT-5.5#Codex#Qwen#Security
2026년 4월 29일

Cursor SDK, 프로그래머블 에이전트 플랫폼으로 출시

  • Cursor SDK가 에이전트 런타임 공개
  • OpenAI Codex가 업무 플랫폼으로 확장
  • Mistral Medium 3.5가 128B로 출시
  • Qwen FlashQLA가 장문맥 속도 개선
  • Claude가 Blender와 공식 연동 시작
#Cursor#Codex#Mistral
2026년 4월 28일

NVIDIA Nemotron 3 Nano Omni 공개

  • NVIDIA가 오픈 옴니 모델을 공개
  • vLLM 0.20이 메모리 효율을 개선
  • Poolside가 Laguna XS.2를 출시
  • Mistral이 Workflows 프리뷰를 공개
  • ChatGPT가 Erdős 문제 풀이에 기여
#NVIDIA#vLLM#Poolside#Mistral#ChatGPT
2026년 4월 24일

DeepSeek-V4, 1M 컨텍스트(context) 공개

  • DeepSeek가 DeepSeek-V4 Pro·Flash 공개
  • 1M 컨텍스트(context)·MIT 라이선스 적용
  • V4 API 가격, Flash가 초저가로 주목
  • OpenAI, GPT-5.5·Pro를 API에 통합
  • Anthropic, Claude Code 저하 원인 공개
#OpenAI#Codex#DeepSeek
2026년 4월 23일

OpenAI, GPT-5.5 출시·API는 지연

  • OpenAI, GPT-5.5 출시·API는 지연
  • Codex 기능 번들: 브라우저·Sheets·Slides 지원
  • Artificial Analysis, 환각 86% 등 위험도 지적
  • Qwen3.6-27B, 로컬 코딩·추론 성능 호평
  • Anthropic, Claude Code 회귀 원인·대응 공개
#OpenAI#GPT-5.5#Codex#Qwen#Anthropic
2026년 4월 22일

Qwen3.6-27B, 로컬 코딩 모델로 급부상

  • Qwen3.6-27B, 로컬 코딩 성능 급상승
  • OpenAI Privacy Filter, PII 마스킹 공개
  • Google, TPU 8t/8i와 에이전트 플랫폼 발표
  • 팀용 워크스페이스 에이전트, Slack 연동 확산
  • Anthropic, Claude Code 티어 변경 테스트 논란
#OpenAI#Codex#Qwen#Google#Anthropic
2026년 4월 21일

OpenAI, GPT-Image-2로 ChatGPT Images 2.0 출시

  • OpenAI, GPT-Image-2로 이미지 기능 강화
  • Hugging Face, `ml-intern` 에이전트 공개
  • Moonshot, Kimi K2.6·FlashKDA 인프라 공개
  • Google, Gemini API에 Deep Research Max 추가
  • LightOn·vLLM, 검색·배포 실무 지원 강화
#OpenAI#GPT-Image-2#Hugging Face#Kimi#Gemini#vLLM
2026년 4월 17일

Anthropic, Claude Design·Opus 4.7 공개

  • Anthropic, Claude Design·Opus 4.7 공개
  • Codex Computer Use, 기업용 UX로 부상
  • 간단한 하네스(harness)가 신뢰성 좌우
  • Qwen3.6, 로컬 추론(inference) 효율 개선
  • Stargate, 2029년 9+GW 전력 수요 전망
#Anthropic#Claude#OpenAI#Codex#Qwen#에이전트
2026년 4월 16일

Anthropic이 Claude Opus 4.7 출시

  • Anthropic이 Claude Opus 4.7 출시
  • OpenAI가 Codex를 에이전트로 확장
  • Alibaba, Qwen3.6-35B-A3B 오픈 공개
  • Cloudflare, Artifacts·Email로 에이전트 인프라
  • CRUX·AlphaEval로 오픈월드 평가 확산
#Anthropic#Claude#OpenAI#Codex#Qwen
2026년 4월 15일

OpenAI, Agents SDK 하네스 분리와 샌드박스 확장

  • OpenAI, Agents SDK 하네스 분리와 샌드박스 확장
  • Cloudflare, Project Think와 Agent Lee 공개
  • Google, Mac용 Gemini 앱 출시 및 기능 확장
  • Gemini 3.1 Flash TTS, 제어형 음성 기능 강화
  • GPT-5.4 Pro의 Erdős 문제 #1196 증명 논의 확산
#OpenAI#Codex#Cloudflare#Gemini#Agents
2026년 4월 14일

Google Chrome 'Skills'로 1클릭 워크플로

  • Chrome에 Skills로 1클릭 실행 추가
  • Gemini Robotics-ER 1.6 API 공개
  • OpenAI GPT-5.4-Cyber 접근 확대
  • Hugging Face, Hub에 Kernels 출시
  • OpenRouter Elephant Alpha, 100B 공개
#OpenAI#Codex#Google#Gemini#OpenRouter
2026년 4월 13일

Hermes Agent v0.9.0 로컬 대시보드 출시

  • Hermes Agent v0.9.0 로컬 대시보드 출시
  • Claude Mythos, AISI 사이버 레인지 첫 종주
  • LlamaIndex ParseBench 문서 파싱 벤치마크 공개
  • Hugging Face, 5B로 arXiv 2.7만편 OCR
  • Copilot 원격제어·Cursor 분할 에이전트 추가
#OpenAI#Codex#Hermes#Claude#LlamaIndex
2026년 4월 10일

GLM-5.1, Code Arena 코딩 3위 등극

  • GLM-5.1, Code Arena 코딩 3위 등극
  • ‘저렴한 실행자+비싼 어드바이저’ 확산
  • Hermes Agent 생태계 확장, 50k★ 달성
  • ClawBench, 실전 웹 과제 성공률 6.5%
  • Gemma 4, llama.cpp 안정화와 템플릿 배포
#GLM-5.1#Anthropic#LangChain#Hermes#llama.cpp
2026년 4월 9일

Meta가 MSL 첫 모델 Muse/Spark를 공개했다

  • Meta가 MSL 첫 모델 Muse/Spark를 공개했다
  • OpenAI가 Codex 5배 $100 Pro를 도입했다
  • LangChain이 Deep Agents deploy를 출시했다
  • Gemma 4가 첫 주 1000만 다운로드를 돌파했다
  • RAGEN-2가 에이전트 RL 붕괴를 분석했다
#Meta#OpenAI#LangChain#Gemma#Anthropic
2026년 4월 8일

Meta, MSL 첫 모델 Muse Spark 정식 공개

  • Meta, MSL 첫 모델 Muse Spark 정식 공개
  • Zhipu AI GLM-5.1, 오픈 웨이트 선두
  • Anthropic, 장기 실행용 Managed Agents 공개
  • Qwen3.6-Plus 지표 개선, 가중치 미공개
  • APEX-Agents-AA, 롱호라이즌 한계 확인
#Meta#Muse Spark#Anthropic#GLM-5.1#Agents#OpenAI#Codex
2026년 4월 7일

Gemma 4, 아이폰 17 Pro에서 40 tok/s 온디바이스 구동

  • Gemma 4가 로컬·온디바이스 붐을 촉발
  • Hermes Agent, 자기개선 에이전트 루프 확산
  • OpenAI, ‘Industrial Policy’로 정책 신호
  • Anthropic, 2027 TPU·$30B 런레이트 공개
  • RL·라우팅·MoE 등 연구·시스템 업데이트
#Gemma#OpenAI#Anthropic#에이전트#시스템
2026년 4월 6일

Hermes, Manim 영상 생성 스킬 공개

  • Hermes가 Manim 영상 생성 스킬 공개
  • Claude Code 제한 강화로 대안 에이전트 확산
  • Gemma 4 수요 급증, 생태계 통합 확대
  • TurboQuant-GPU로 KV 캐시 5.02x 압축
  • 뉴요커, 샘 알트만 의혹 조사 보도 공개
#OpenAI#Codex#Hermes#Claude Code#Gemma 4
2026년 4월 3일

Google이 Apache 2.0으로 Gemma 4 공개

  • Google이 Apache 2.0으로 Gemma 4 공개
  • Gemma 4, vLLM·llama.cpp 등 즉시 지원
  • Hermes Agent가 오픈 하네스(harness)로 부상
  • Codex 확산 vs Claude Code 레이트 리밋 논쟁
  • Anthropic, Claude의 171 감정 벡터 연구 공개
#Google#Gemma#Hermes#Anthropic#Codex
2026년 4월 2일

구글 딥마인드, Gemma 4 오픈웨이트 공개

  • 구글 딥마인드, Gemma 4 오픈웨이트 공개
  • Gemma 4, 256K 컨텍스트·멀티모달 지원
  • 생태계가 llama.cpp·vLLM 등 즉시 지원
  • Anthropic이 Claude 내부 감정 벡터 연구 공개
  • OpenAI가 CarPlay 음성모드와 Codex 과금 변경
#Google#Gemma#OpenAI#Codex#Anthropic#Qwen
2026년 4월 1일

Claude Code 소스 유출로 DMCA 논란 확산

  • Arcee Trinity-Large-Thinking 오픈 웨이트 출시
  • Z.ai, GLM-5V-Turbo 비전 코딩 모델 발표
  • Claude Code 소스 유출로 DMCA 논란 확산
  • OpenAI, Codex 사용량 한도를 전 플랜 리셋
  • PrismML 1-bit Bonsai로 로컬 LLM 효율↑
#OpenAI#Codex#Anthropic
2026년 3월 31일

Claude Code 소스 유출, 하네스 설계가 드러남

  • Claude Code 소스 유출, 하네스 설계가 드러남
  • 가중치 아닌 오케스트레이션 로직 노출
  • Bonsai 1-bit 모델, 초소형 효율 강조
  • OpenAI, $122B 커밋 자본·$852B 가치
  • TRL v1.0, RL 툴링 대폭 확장
#Anthropic#Claude Code#OpenAI#Codex#보안
2026년 3월 30일

Anthropic, Claude Code에 컴퓨터 사용 도입

  • Anthropic, Claude Code에 컴퓨터 사용 도입
  • OpenAI, Claude Code용 Codex 플러그인 공개
  • Alibaba, Qwen3.5-Omni 멀티모달 모델 출시
  • Nous, Hermes Agent 업데이트로 오픈 에이전트 확산
  • llama.cpp, GitHub 10만 ★ 돌파로 로컬 열기
#OpenAI#Codex#Anthropic#Claude Code#에이전트
2026년 3월 27일

Anthropic의 Opus 상위 ‘Capybara’ 티어가 유출됐다

  • Anthropic의 Opus 상위 ‘Capybara’ 티어가 유출됐다
  • Zhipu가 GLM-5.1을 코딩 플랜에 공개했다
  • TurboQuant 논문이 RaBitQ 오기재로 논란이다
  • OpenAI가 Codex 플러그인으로 자동화를 밀었다
  • Meta가 SAM 3.1로 비디오 처리량을 2배로 늘렸다
#Anthropic#OpenAI#Codex#GLM-5.1#TurboQuant
2026년 3월 26일

OpenAI GPT-5.4 mini/nano 성능·비용 경쟁

  • Google, Gemini 3.1 Flash Live 공개
  • Mistral Voxtral TTS 오픈웨이트 출시
  • Cohere Transcribe, 첫 오디오 모델 공개
  • OpenAI GPT-5.4 mini/nano 성능·비용 경쟁
  • Cline Kanban, 멀티 에이전트 워크트리 지원
#OpenAI#GPT-5.4#Gemini
2026년 3월 25일

ARC-AGI-3 공개, 인간 100%·모델 <1%

  • ARC-AGI-3 벤치마크 공개, 인간 100%·모델 <1%
  • LangChain, Fleet 공유 스킬 레지스트리 출시
  • Google, Lyria 3 Pro로 3분 음악 생성 확장
  • LiteLLM PyPI 1.82.7/1.82.8 공급망 공격 경고
  • Intel Arc Pro B70 32GB, $949 로컬 추론 주목
#OpenAI#Codex#ARC-AGI-3#에이전트#LangChain#Claude Code#하드웨어
2026년 3월 24일

LiteLLM PyPI 공급망 공격, 자격증명 유출 우려

  • LiteLLM PyPI 공급망 공격, 자격증명 유출 우려
  • Figma MCP 오픈 베타로 캔버스 직접 편집
  • Hermes Agent v0.4.0, 개인 에이전트 런타임 강화
  • vLLM·Transformers, 추론 성능 격차 빠르게 축소
  • OpenAI, 재단 10억달러 집행과 Spud 개발 소문
#OpenAI#Codex#LiteLLM#Anthropic#Figma
2026년 3월 23일

Claude, macOS 컴퓨터 사용(Computer Use) 공개

  • Claude, macOS 컴퓨터 사용(Computer Use) 공개
  • Cursor, Instant Grep로 초고속 검색 공개
  • Sakana AI, 일본용 Sakana Chat 출시
  • WebArena-Infinity, 환경 생성 비용 절감
  • LeWorldModel, 1 GPU JEPA 레시피 주목
#OpenAI#Codex#Anthropic
2026년 3월 20일

Cursor Composer 2, Kimi K2.5 기반 논란

  • Cursor Composer 2, Kimi K2.5 기반 논란
  • NVIDIA Nemotron-Cascade 2 공개, 30B MoE
  • OpenAI, Codex for Students로 $100 크레딧
  • Mistral Small 4, 멀티모달·추론 모드 추가
  • FAIR V-JEPA 2.1, 비디오 이해 성능 강화
#Cursor#Kimi#NVIDIA#OpenAI#Codex#LangChain
2026년 3월 19일

Cursor가 Composer 2 코딩 모델 공개

  • Cursor가 Composer 2 코딩 모델 공개
  • OpenAI, Astral 팀을 Codex에 합류
  • LangChain, LangSmith Fleet 엔터프라이즈 출시
  • MiniMax M2.7, 에이전트 지향 모델 강조
  • Qwen 3.5 Max, late-interaction 검색 성과
#OpenAI#Cursor#Anthropic#LangChain#MiniMax
2026년 3월 18일 헤드라인

MiniMax, 효율·‘자기 진화’ 내세운 MiniMax 2.7 공개

  • MiniMax가 효율형 오픈 모델 2.7 공개
  • OpenAI, 16MB LM Parameter Golf 공개
  • Anthropic, 1주 8만명 Claude 인터뷰
  • Unsloth Studio, 로컬 LLM 학습·실행 UI
  • Runway, 100ms 이하 실시간 HD 영상 시연
#MiniMax#OpenAI#Anthropic#MCP#LLM
2026년 3월 17일

OpenAI, GPT-5.4 mini/nano 출시

  • OpenAI가 GPT-5.4 mini/nano를 출시
  • 미니 모델, 코딩·서브에이전트 최적화
  • LangChain, Sandboxes와 Open SWE 공개
  • Mamba-3·Attention Residuals 논의 확산
  • Unsloth Studio, 로컬 학습·추론 UI 출시
#OpenAI#Codex#에이전트#오픈소스#아키텍처
2026년 3월 16일

Perplexity, Android용 Computer 출시

  • Perplexity, Android용 Computer 출시
  • Google, Gemini Embedding 2 공개
  • Moonshot `Attention Residuals` 논문 화제
  • OpenAI Codex, 주간 활성 200만+ 언급
  • NVIDIA, Nemotron 라이선스 제약 완화
#OpenAI#Codex#Perplexity#Google#LangChain
2026년 3월 13일

Anthropic, Opus 4.6 1M 컨텍스트 기본 제공

  • Anthropic, Opus 4.6 1M 컨텍스트 기본 제공
  • Perplexity Computer, iOS 크로스디바이스 동기화
  • RandOpt, 가우시안 탐색으로 RL 성능 근접
  • OmniCoder-9B, 262K 컨텍스트 오픈 웨이트 공개
  • OpenFold3 preview 2, 학습셋·설정까지 공개
#OpenAI#Codex#Anthropic#MCP#Qwen
2026년 3월 12일 헤드라인

Google, Gemini 기반 'Ask Maps' 포함 Maps 대규모 업데이트

  • Google Maps가 Gemini로 10년 만에 대개편
  • Claude가 채팅에서 인터랙티브 차트 생성
  • CursorBench로 코딩 에이전트 평가가 고도화
  • Gemini Embedding 2로 멀티모달 검색 경쟁 격화
  • Nemotron 3 Super, 오픈웨이트 120B 모델 공개
#Google#OpenAI#Claude#MCP#NVIDIA
2026년 3월 11일

NVIDIA가 Nemotron 3 Super를 공개했다

  • NVIDIA가 Nemotron 3 Super를 공개했다
  • Perplexity가 Personal Computer를 출시했다
  • Anthropic이 The Anthropic Institute를 출범했다
  • Yann LeCun의 AMI Labs가 $1.03B를 유치했다
  • Fish Audio가 S2 TTS 모델을 공개했다
#NVIDIA#Nemotron#Perplexity#Anthropic#Agents
2026년 3월 9일 헤드라인

LLM이 더 작은 LLM을 완전 자율로 학습시키기 시작

  • LLM이 더 작은 LLM을 자율 학습하기 시작
  • Claude Code가 멀티에이전트 PR 리뷰를 공개했다
  • OpenAI가 Promptfoo 인수로 보안 eval을 강화했다
  • vLLM이 Jetson에서 로컬 어시스턴트를 시연했다
  • Figure Helix 02가 거실 정리 자율 데모를 공개했다
#OpenAI#Claude#에이전트#vLLM#로보틱스
2026년 3월 6일

OpenAI GPT‑5.4, AA 지수 공동 1위 복귀

  • OpenAI GPT‑5.4, AA 지수 공동 1위 복귀
  • Codex Security와 OSS 지원 프로그램 공개
  • Claude Opus 4.6, Firefox 고위험 취약점 다수 발견
  • vLLM v0.17과 Triton attention 백엔드 출시
  • KernelAgent·AMD 대회로 커널 최적화 경쟁 가속
#OpenAI#GPT-5.4#보안#Anthropic#vLLM
2026년 3월 5일 헤드라인

OpenAI, GPT-5.4 Thinking·Pro를 ChatGPT·API·Codex에 출시

  • OpenAI가 GPT-5.4 Thinking·Pro 출시
  • FlashAttention-4, Blackwell에서 가속
  • AI2, OLMo Hybrid 7B 오픈 공개
  • Databricks, RL 기반 에이전트 KARL 발표
  • 장문 컨텍스트, ‘context rot’ 경고 확산
#OpenAI#GPT-5.4#FlashAttention-4#OLMo#Cursor
2026년 3월 4일

OpenAI, Windows용 Codex 앱과 오픈소스 샌드박스 공개

  • OpenAI, Windows용 Codex 앱 공개
  • Alibaba Qwen, 조직 개편·컴퓨트 논란
  • Gemini 3.1 Flash-Lite, 속도·비용 강조
  • SSD 추론, vLLM/SGLang 대비 최대 2배
  • VS Code, 에이전트 기능 강화·주간 출시
#OpenAI#Anthropic#Google#Qwen#vLLM
2026년 3월 3일

OpenAI가 GPT‑5.3 Instant를 전면 배포

  • OpenAI가 GPT‑5.3 Instant를 전면 배포
  • Google이 Gemini 3.1 Flash‑Lite 공개
  • Alibaba Qwen 리더십 이탈로 OSS 불안
  • Together가 5M 컨텍스트 학습 메모리 87% 절감
  • Cursor가 MCP Apps로 대화형 UI를 채팅에 통합
#OpenAI#Codex#Gemini#Qwen#MCP
2026년 3월 2일

Alibaba가 Qwen 3.5 Small 오픈 모델 공개

  • Alibaba가 Qwen 3.5 Small 오픈 모델 공개
  • Claude 장애로 ‘가용성’ 논의 확산
  • Apple Neural Engine 역공학 학습 주목
  • ByteDance CUDA Agent, 커널 RL 성과
  • DoW 계약 수정안, 감시 금지 조항 논쟁
#Qwen#OpenAI#Codex#인프라#정책
2026년 2월 25일 헤드라인

Perplexity, 오케스트레이션 우선 에이전트 ‘Computer’ 출시

  • Perplexity, 에이전트 ‘Computer’ 출시
  • Karpathy, 코딩 에이전트 상전이 언급
  • OpenAI, GPT‑5.3‑Codex API 공개
  • Qwen3.5 Medium, 로컬 배포 속도전
  • Anthropic, Vercept 인수·RSP v3 전환
#Perplexity#OpenAI#Qwen#Anthropic#Agents
2026년 2월 24일 헤드라인

OpenAI, Responses API에 GPT-5.3-Codex 출시

  • OpenAI가 GPT-5.3-Codex를 출시
  • Qwen 3.5 Medium 시리즈 공개
  • Anthropic, Claude Code 원격 제어 도입
  • Cursor, “demos not diffs”로 전환
  • Mercury 2, ~1,000토큰/초 강조
#OpenAI#Qwen#Claude
2026년 2월 23일 헤드라인

Anthropic, DeepSeek·Moonshot·MiniMax의 Claude 대규모 distillation 공격 의혹 제기

  • Anthropic이 Claude 증류 공격을 주장
  • OpenAI가 SWE-Bench Verified를 폐기
  • Responses API에 WebSockets가 추가됨
  • LMArena에서 GPT-5.2-chat-latest 급상승
  • OpenAI가 BCG·McKinsey와 협력 확대
#Anthropic#OpenAI#Claude#SWE-Bench#WebSockets
2026년 2월 20일

ggml.ai/llama.cpp가 Hugging Face에 합류

  • ggml.ai/llama.cpp가 Hugging Face에 합류
  • Anthropic이 Claude Code Security를 공개
  • Taalas ASIC, 16k–17k tok/s 데모 주장
  • METR, Opus 4.6 time-horizon을 ~14.5h로 추정
  • Gemini 3.1 Pro의 비용·토큰 효율 논쟁
#HuggingFace#llama.cpp#Anthropic#Gemini#보안
2026년 2월 19일 헤드라인

구글, Gemini 3.1 Pro 공개...ARC-AGI-2 77.1%

  • 구글이 Gemini 3.1 Pro를 공개
  • ARC-AGI-2 77.1%로 추론 도약
  • AA·Arena서 상위권 성능 재확인
  • 에이전트 툴링·비용 논쟁이 커뮤니티로 확산
  • Discord선 OpenRouter 장애도 논의
#Google#Gemini#OpenRouter#Anthropic#OpenAI
2026년 2월 18일

OpenAI, EVMbench로 스마트컨트랙트 보안 평가

  • Claude 4.6, 지표 상승·토큰비용 급증
  • OpenAI, EVMbench 보안 벤치 공개
  • Google Lyria 3, Gemini에 음악 생성
  • Cursor, 과거 대화 컨텍스트(context) 추가
  • Qwen3.5 FP8 가중치 공개 확산
#OpenAI#Anthropic#Google#MCP#벤치마크
2026년 2월 16일 헤드라인

알리바바, Qwen3.5-397B-A17B 오픈 가중치 공개

  • Qwen3.5-397B-A17B 오픈가중치 발표
  • vLLM, Qwen3.5 Day-0 지원 공개
  • OpenAI, OpenClaw 인수 흐름 확산
  • ChatGPT Lockdown Mode로 공격면 축소
  • 중국 CNY 모델 러시·로보틱스 가속
#Qwen#OpenAI#Anthropic#vLLM#에이전트
2026년 2월 12일 헤드라인

Google DeepMind, Gemini 3 Deep Think V2 공개…ARC-AGI-2 84.6% 달성

  • Gemini 3 Deep Think V2, ARC-AGI-2 SOTA
  • OpenAI, GPT-5.3-Codex-Spark 프리뷰 공개
  • MiniMax M2.5·GLM-5, 오픈 코딩 경쟁 가속
  • A2A·KV-cache, 에이전트 인프라 논쟁 확대
  • QED-Nano·LeJEPA 등 연구 업데이트
#Google DeepMind#Gemini#OpenAI#Anthropic#Agents
2026년 2월 11일 헤드라인

Zhipu AI, MIT 라이선스 오픈 웨이트 GLM-5 공개

  • Zhipu AI가 MIT 라이선스 GLM-5 공개
  • DeepSeek 1M 컨텍스트 루머와 DPA 개선
  • SeeDance v2.0 품질·가격 논의 확산
  • 에이전트 워크플로우: Codex, MCP, DeepWiki
  • 오픈 벤치마크 $3M 지원과 에이전트 보안 논쟁
#GLM-5#Zhipu AI#DeepSeek#MiniMax#OpenAI
2026년 2월 10일 헤드라인

알리바바, Qwen‑Image‑2.0 공개… 7B 통합 생성·편집

  • 알리바바 Qwen‑Image‑2.0 7B 공개
  • ByteDance Seedance 2.0, T2V 도약
  • OpenAI Responses API 장기 작업 강화
  • Kimi Agent Swarm, 100 서브에이전트
  • Isomorphic Labs, IsoDDE 성능 향상 주장
#Qwen#Alibaba#ByteDance#OpenAI#Kimi#Isomorphic Labs
2026년 2월 6일

GPT-5.3-Codex·Claude Opus 4.6 A/B 확산

  • GPT-5.3-Codex·Claude Opus 4.6 A/B 확산
  • Waymo, Genie 3 기반 월드 모델 공개
  • Hugging Face, Community Evals 출시
  • InfMem·LatentMem, 장문 메모리 제어
  • 에이전트 스웜, ‘팀 설계’로 수렴
#OpenAI#Codex#Claude#Waymo#Hugging Face
2026년 2월 4일 헤드라인

Cerebras, $1B 투자 유치로 $23B 평가

  • Cerebras가 $1B 투자로 $23B 평가
  • VS Code가 Agent Sessions로 에이전트 통합
  • METR, GPT-5.2 High 6.6시간 성과 보고
  • Qwen3-Coder-Next 80B MoE 모델 공개
  • ACE-Step-1.5, MIT 오픈 음악 생성 모델 출시
#OpenAI#Cerebras#Gemini#VS Code#METR
2026년 2월 2일

OpenAI, macOS용 Codex 데스크톱 앱 출시

  • OpenAI, macOS용 Codex 데스크톱 앱 출시
  • Codex 앱, 워크트리·스킬·자동화 지원
  • StepFun Step-3.5-Flash 공개, 256K 컨텍스트
  • Kimi K2.5, Code Arena 오픈모델 1위
  • RAG 청킹, 쿼리별 최적화로 리콜 20–40%↑
#OpenAI#Codex#StepFun#Kimi#RAG
2026년 2월 2일

OpenAI, GPT‑5.2·GPT‑5.2‑Codex 40% 가속

  • OpenAI, GPT‑5.2·GPT‑5.2‑Codex 40% 가속
  • Alibaba, Qwen3‑Coder‑Next 80B@3B 공개
  • Zhipu, GLM‑OCR 0.9B 출시와 day‑0 지원
  • Anthropic, Claude Agent SDK의 Xcode 통합
  • LangChain, 에이전트 트레이스·평가 가이드 제시
#OpenAI#Codex#Qwen#vLLM#LangChain
2026년 1월 30일 헤드라인

Moltbook·OpenClaw, ‘에이전트-에이전트’ 소셜 네트워크 확산

  • Moltbook·OpenClaw 에이전트 포럼 급부상
  • Anthropic 연구: AI 코딩은 학습 저하 가능
  • Moonshot Kimi K2.5, Agent Swarm·PARL 공개
  • Google Genie 3 공개, 게임 vs 비디오 논쟁
  • Windsurf Arena Mode, IDE 내 모델 대결 도입
#Moltbook#OpenClaw#OpenAI#Anthropic#Kimi#Google
2026년 1월 29일 헤드라인

xAI, Grok Imagine 이미지·비디오 생성·편집 API 출시

  • xAI가 Grok Imagine API로 SOTA 출시
  • DeepMind가 Genie 3를 Ultra에 공개
  • Kimi K2.5가 오픈 모델 1위 주장
  • Qwen3-ASR 출시, vLLM day-0 지원
  • 에이전트 표준·샌드박스 논의 확산
#xAI#Grok#Google#Kimi#Qwen
2026년 1월 28일

DeepMind, AlphaGenome 모델·가중치 공개

  • DeepMind가 AlphaGenome 모델·가중치 공개
  • Kimi K2.5가 오픈 모델 화제로 부상
  • Chrome이 Gemini 3 Auto Browse 프리뷰 공개
  • NVIDIA가 NVFP4 Nemotron 3 Nano 발표
  • 에이전트 evals·하네스·추적 논의 확대
#OpenAI#Codex#DeepMind#Kimi#Gemini
2026년 1월 27일 헤드라인

MoonshotAI, Kimi K2.5 공개: 멀티모달 MoE와 Agent Swarm

  • MoonshotAI가 Kimi K2.5를 공개
  • K2.5 Agent Swarm이 100 서브에이전트 지원
  • Trinity Large(400B MoE) 프리뷰 공개
  • OpenAI Prism이 GPT-5.2로 무료 출시
  • DeepSeek-OCR 2, 토큰 압축과 읽기순서 학습
#MoonshotAI#Kimi#OpenAI#DeepSeek#HuggingFace
2026년 1월 26일 헤드라인

Anthropic, MCP Apps 스펙 발표 및 Claude.ai 공식 지원

  • Anthropic가 MCP Apps 스펙을 발표
  • Claude.ai, MCP Apps UI를 공식 지원
  • Qwen3-Max-Thinking 등 추론 모델 출시
  • vLLM, ‘day-0’ 지원 비용 논쟁
  • llama.cpp, GLM-4.7-Flash 최적화
#Anthropic#Claude#MCP#OpenAI#vLLM
2026년 1월 21일 헤드라인

OpenEvidence, 120억달러 가치로 투자 유치

  • OpenEvidence가 120억달러 투자 유치
  • Anthropic이 Claude 헌법을 CC0로 공개
  • Podium이 AI 에이전트 ARR 1억달러 주장
  • AirLLM이 8GB로 405B 추론(inference) 제시
  • Runpod이 $120M ARR로 GPU 클라우드 성장
#OpenEvidence#Anthropic#Claude#MCP#AirLLM
2026년 1월 20일

X가 ‘For You’ 추천 알고리즘을 오픈소스 공개

  • X가 ‘For You’ 추천 알고리즘을 오픈소스 공개
  • OpenAI가 ChatGPT 연령 예측을 전 세계 적용
  • GLM-4.7-Flash 로컬 추론(inference) 주목
  • Liquid AI가 900MB 온디바이스 추론 모델 공개
  • Microsoft가 내부 Claude Code 배포를 일시 중단
#X#OpenAI#GLM-4.7-Flash#Microsoft#MCP
2026년 1월 19일

Zhipu AI, GLM-4.7-Flash 공개

  • Zhipu AI가 GLM-4.7-Flash 공개
  • STEM·RePo로 메모리·컨텍스트 확장
  • DSPy에 `dspy.RLM`로 RLM 도입
  • DeepMind, Gemini 안전 프로브 운영
  • GPT-5.2 에이전트로 3M줄 브라우저
#OpenAI#Codex#GLM-4.7#DSPy#Gemini
2026년 1월 16일 헤드라인

OpenAI, ChatGPT Go($8/월) 출시 및 Free·Go 광고 테스트 발표

  • OpenAI가 Free·Go 티어 광고 테스트 시작
  • ChatGPT Go($8/월), 메시지 10배 제공
  • Sam Altman, ‘매우 빠른 Codex’ 예고
  • FLUX.2 [klein], vLLM-Omni day-0 지원
  • SWE-rebench 12월, Opus 4.5 63.3% 1위
#OpenAI#ChatGPT Go#광고#Codex#Claude
2025년 12월 24일 헤드라인

LeCun, AMI Labs 출범…세계 모델 위해 $1.03B 시드

  • AMI Labs, $1.03B 시드로 출범
  • LeCun, JEPA로 세계 모델 전략 강조
  • 에이전트=모델+하네스(harness) 확산
  • Gemini Embedding 2, 멀티모달 임베딩 공개
  • Hugging Face, $8/TB 스토리지 버킷 출시
#AMI Labs#World Models#JEPA