2026년 3월 3일

OpenAI가 GPT‑5.3 Instant를 전면 배포

  • OpenAI가 GPT‑5.3 Instant를 전면 배포
  • Google이 Gemini 3.1 Flash‑Lite 공개
  • Alibaba Qwen 리더십 이탈로 OSS 불안
  • Together가 5M 컨텍스트 학습 메모리 87% 절감
  • Cursor가 MCP Apps로 대화형 UI를 채팅에 통합
#OpenAI#Codex#Gemini#Qwen#MCP
2026년 3월 2일

Alibaba가 Qwen 3.5 Small 오픈 모델 공개

  • Alibaba가 Qwen 3.5 Small 오픈 모델 공개
  • Claude 장애로 ‘가용성’ 논의 확산
  • Apple Neural Engine 역공학 학습 주목
  • ByteDance CUDA Agent, 커널 RL 성과
  • DoW 계약 수정안, 감시 금지 조항 논쟁
#Qwen#OpenAI#Codex#인프라#정책
2026년 2월 25일 헤드라인

Perplexity, 오케스트레이션 우선 에이전트 ‘Computer’ 출시

  • Perplexity, 에이전트 ‘Computer’ 출시
  • Karpathy, 코딩 에이전트 상전이 언급
  • OpenAI, GPT‑5.3‑Codex API 공개
  • Qwen3.5 Medium, 로컬 배포 속도전
  • Anthropic, Vercept 인수·RSP v3 전환
#Perplexity#OpenAI#Qwen#Anthropic#Agents
2026년 2월 24일 헤드라인

OpenAI, Responses API에 GPT-5.3-Codex 출시

  • OpenAI가 GPT-5.3-Codex를 출시
  • Qwen 3.5 Medium 시리즈 공개
  • Anthropic, Claude Code 원격 제어 도입
  • Cursor, “demos not diffs”로 전환
  • Mercury 2, ~1,000토큰/초 강조
#OpenAI#Qwen#Claude
2026년 2월 23일 헤드라인

Anthropic, DeepSeek·Moonshot·MiniMax의 Claude 대규모 distillation 공격 의혹 제기

  • Anthropic이 Claude 증류 공격을 주장
  • OpenAI가 SWE-Bench Verified를 폐기
  • Responses API에 WebSockets가 추가됨
  • LMArena에서 GPT-5.2-chat-latest 급상승
  • OpenAI가 BCG·McKinsey와 협력 확대
#Anthropic#OpenAI#Claude#SWE-Bench#WebSockets
2026년 2월 20일

ggml.ai/llama.cpp가 Hugging Face에 합류

  • ggml.ai/llama.cpp가 Hugging Face에 합류
  • Anthropic이 Claude Code Security를 공개
  • Taalas ASIC, 16k–17k tok/s 데모 주장
  • METR, Opus 4.6 time-horizon을 ~14.5h로 추정
  • Gemini 3.1 Pro의 비용·토큰 효율 논쟁
#HuggingFace#llama.cpp#Anthropic#Gemini#보안
2026년 2월 19일 헤드라인

구글, Gemini 3.1 Pro 공개...ARC-AGI-2 77.1%

  • 구글이 Gemini 3.1 Pro를 공개
  • ARC-AGI-2 77.1%로 추론 도약
  • AA·Arena서 상위권 성능 재확인
  • 에이전트 툴링·비용 논쟁이 커뮤니티로 확산
  • Discord선 OpenRouter 장애도 논의
#Google#Gemini#OpenRouter#Anthropic#OpenAI
2026년 2월 18일

OpenAI, EVMbench로 스마트컨트랙트 보안 평가

  • Claude 4.6, 지표 상승·토큰비용 급증
  • OpenAI, EVMbench 보안 벤치 공개
  • Google Lyria 3, Gemini에 음악 생성
  • Cursor, 과거 대화 컨텍스트(context) 추가
  • Qwen3.5 FP8 가중치 공개 확산
#OpenAI#Anthropic#Google#MCP#벤치마크
2026년 2월 16일 헤드라인

알리바바, Qwen3.5-397B-A17B 오픈 가중치 공개

  • Qwen3.5-397B-A17B 오픈가중치 발표
  • vLLM, Qwen3.5 Day-0 지원 공개
  • OpenAI, OpenClaw 인수 흐름 확산
  • ChatGPT Lockdown Mode로 공격면 축소
  • 중국 CNY 모델 러시·로보틱스 가속
#Qwen#OpenAI#Anthropic#vLLM#에이전트
2026년 2월 12일 헤드라인

Google DeepMind, Gemini 3 Deep Think V2 공개…ARC-AGI-2 84.6% 달성

  • Gemini 3 Deep Think V2, ARC-AGI-2 SOTA
  • OpenAI, GPT-5.3-Codex-Spark 프리뷰 공개
  • MiniMax M2.5·GLM-5, 오픈 코딩 경쟁 가속
  • A2A·KV-cache, 에이전트 인프라 논쟁 확대
  • QED-Nano·LeJEPA 등 연구 업데이트
#Google DeepMind#Gemini#OpenAI#Anthropic#Agents
2026년 2월 11일 헤드라인

Zhipu AI, MIT 라이선스 오픈 웨이트 GLM-5 공개

  • Zhipu AI가 MIT 라이선스 GLM-5 공개
  • DeepSeek 1M 컨텍스트 루머와 DPA 개선
  • SeeDance v2.0 품질·가격 논의 확산
  • 에이전트 워크플로우: Codex, MCP, DeepWiki
  • 오픈 벤치마크 $3M 지원과 에이전트 보안 논쟁
#GLM-5#Zhipu AI#DeepSeek#MiniMax#OpenAI
2026년 2월 10일 헤드라인

알리바바, Qwen‑Image‑2.0 공개… 7B 통합 생성·편집

  • 알리바바 Qwen‑Image‑2.0 7B 공개
  • ByteDance Seedance 2.0, T2V 도약
  • OpenAI Responses API 장기 작업 강화
  • Kimi Agent Swarm, 100 서브에이전트
  • Isomorphic Labs, IsoDDE 성능 향상 주장
#Qwen#Alibaba#ByteDance#OpenAI#Kimi#Isomorphic Labs
2026년 2월 6일

GPT-5.3-Codex·Claude Opus 4.6 A/B 확산

  • GPT-5.3-Codex·Claude Opus 4.6 A/B 확산
  • Waymo, Genie 3 기반 월드 모델 공개
  • Hugging Face, Community Evals 출시
  • InfMem·LatentMem, 장문 메모리 제어
  • 에이전트 스웜, ‘팀 설계’로 수렴
#OpenAI#Codex#Claude#Waymo#Hugging Face
2026년 2월 4일 헤드라인

Cerebras, $1B 투자 유치로 $23B 평가

  • Cerebras가 $1B 투자로 $23B 평가
  • VS Code가 Agent Sessions로 에이전트 통합
  • METR, GPT-5.2 High 6.6시간 성과 보고
  • Qwen3-Coder-Next 80B MoE 모델 공개
  • ACE-Step-1.5, MIT 오픈 음악 생성 모델 출시
#OpenAI#Cerebras#Gemini#VS Code#METR
2026년 2월 2일

OpenAI, macOS용 Codex 데스크톱 앱 출시

  • OpenAI, macOS용 Codex 데스크톱 앱 출시
  • Codex 앱, 워크트리·스킬·자동화 지원
  • StepFun Step-3.5-Flash 공개, 256K 컨텍스트
  • Kimi K2.5, Code Arena 오픈모델 1위
  • RAG 청킹, 쿼리별 최적화로 리콜 20–40%↑
#OpenAI#Codex#StepFun#Kimi#RAG
2026년 2월 2일

OpenAI, GPT‑5.2·GPT‑5.2‑Codex 40% 가속

  • OpenAI, GPT‑5.2·GPT‑5.2‑Codex 40% 가속
  • Alibaba, Qwen3‑Coder‑Next 80B@3B 공개
  • Zhipu, GLM‑OCR 0.9B 출시와 day‑0 지원
  • Anthropic, Claude Agent SDK의 Xcode 통합
  • LangChain, 에이전트 트레이스·평가 가이드 제시
#OpenAI#Codex#Qwen#vLLM#LangChain
2026년 1월 30일 헤드라인

Moltbook·OpenClaw, ‘에이전트-에이전트’ 소셜 네트워크 확산

  • Moltbook·OpenClaw 에이전트 포럼 급부상
  • Anthropic 연구: AI 코딩은 학습 저하 가능
  • Moonshot Kimi K2.5, Agent Swarm·PARL 공개
  • Google Genie 3 공개, 게임 vs 비디오 논쟁
  • Windsurf Arena Mode, IDE 내 모델 대결 도입
#Moltbook#OpenClaw#OpenAI#Anthropic#Kimi#Google
2026년 1월 29일 헤드라인

xAI, Grok Imagine 이미지·비디오 생성·편집 API 출시

  • xAI가 Grok Imagine API로 SOTA 출시
  • DeepMind가 Genie 3를 Ultra에 공개
  • Kimi K2.5가 오픈 모델 1위 주장
  • Qwen3-ASR 출시, vLLM day-0 지원
  • 에이전트 표준·샌드박스 논의 확산
#xAI#Grok#Google#Kimi#Qwen
2026년 1월 28일

DeepMind, AlphaGenome 모델·가중치 공개

  • DeepMind가 AlphaGenome 모델·가중치 공개
  • Kimi K2.5가 오픈 모델 화제로 부상
  • Chrome이 Gemini 3 Auto Browse 프리뷰 공개
  • NVIDIA가 NVFP4 Nemotron 3 Nano 발표
  • 에이전트 evals·하네스·추적 논의 확대
#OpenAI#Codex#DeepMind#Kimi#Gemini
2026년 1월 27일 헤드라인

MoonshotAI, Kimi K2.5 공개: 멀티모달 MoE와 Agent Swarm

  • MoonshotAI가 Kimi K2.5를 공개
  • K2.5 Agent Swarm이 100 서브에이전트 지원
  • Trinity Large(400B MoE) 프리뷰 공개
  • OpenAI Prism이 GPT-5.2로 무료 출시
  • DeepSeek-OCR 2, 토큰 압축과 읽기순서 학습
#MoonshotAI#Kimi#OpenAI#DeepSeek#HuggingFace
2026년 1월 26일 헤드라인

Anthropic, MCP Apps 스펙 발표 및 Claude.ai 공식 지원

  • Anthropic가 MCP Apps 스펙을 발표
  • Claude.ai, MCP Apps UI를 공식 지원
  • Qwen3-Max-Thinking 등 추론 모델 출시
  • vLLM, ‘day-0’ 지원 비용 논쟁
  • llama.cpp, GLM-4.7-Flash 최적화
#Anthropic#Claude#MCP#OpenAI#vLLM
2026년 1월 21일 헤드라인

OpenEvidence, 120억달러 가치로 투자 유치

  • OpenEvidence가 120억달러 투자 유치
  • Anthropic이 Claude 헌법을 CC0로 공개
  • Podium이 AI 에이전트 ARR 1억달러 주장
  • AirLLM이 8GB로 405B 추론(inference) 제시
  • Runpod이 $120M ARR로 GPU 클라우드 성장
#OpenEvidence#Anthropic#Claude#MCP#AirLLM
2026년 1월 20일

X가 ‘For You’ 추천 알고리즘을 오픈소스 공개

  • X가 ‘For You’ 추천 알고리즘을 오픈소스 공개
  • OpenAI가 ChatGPT 연령 예측을 전 세계 적용
  • GLM-4.7-Flash 로컬 추론(inference) 주목
  • Liquid AI가 900MB 온디바이스 추론 모델 공개
  • Microsoft가 내부 Claude Code 배포를 일시 중단
#X#OpenAI#GLM-4.7-Flash#Microsoft#MCP
2026년 1월 19일

Zhipu AI, GLM-4.7-Flash 공개

  • Zhipu AI가 GLM-4.7-Flash 공개
  • STEM·RePo로 메모리·컨텍스트 확장
  • DSPy에 `dspy.RLM`로 RLM 도입
  • DeepMind, Gemini 안전 프로브 운영
  • GPT-5.2 에이전트로 3M줄 브라우저
#OpenAI#Codex#GLM-4.7#DSPy#Gemini
2026년 1월 16일 헤드라인

OpenAI, ChatGPT Go($8/월) 출시 및 Free·Go 광고 테스트 발표

  • OpenAI가 Free·Go 티어 광고 테스트 시작
  • ChatGPT Go($8/월), 메시지 10배 제공
  • Sam Altman, ‘매우 빠른 Codex’ 예고
  • FLUX.2 [klein], vLLM-Omni day-0 지원
  • SWE-rebench 12월, Opus 4.5 63.3% 1위
#OpenAI#ChatGPT Go#광고#Codex#Claude