AI 데일리 뉴스
smol.ai AI 뉴스 한국어 번역
2026년 3월 3일
OpenAI가 GPT‑5.3 Instant를 전면 배포
- OpenAI가 GPT‑5.3 Instant를 전면 배포
- Google이 Gemini 3.1 Flash‑Lite 공개
- Alibaba Qwen 리더십 이탈로 OSS 불안
- Together가 5M 컨텍스트 학습 메모리 87% 절감
- Cursor가 MCP Apps로 대화형 UI를 채팅에 통합
2026년 3월 2일
Alibaba가 Qwen 3.5 Small 오픈 모델 공개
- Alibaba가 Qwen 3.5 Small 오픈 모델 공개
- Claude 장애로 ‘가용성’ 논의 확산
- Apple Neural Engine 역공학 학습 주목
- ByteDance CUDA Agent, 커널 RL 성과
- DoW 계약 수정안, 감시 금지 조항 논쟁
2026년 2월 25일 헤드라인
Perplexity, 오케스트레이션 우선 에이전트 ‘Computer’ 출시
- Perplexity, 에이전트 ‘Computer’ 출시
- Karpathy, 코딩 에이전트 상전이 언급
- OpenAI, GPT‑5.3‑Codex API 공개
- Qwen3.5 Medium, 로컬 배포 속도전
- Anthropic, Vercept 인수·RSP v3 전환
2026년 2월 24일 헤드라인
OpenAI, Responses API에 GPT-5.3-Codex 출시
- OpenAI가 GPT-5.3-Codex를 출시
- Qwen 3.5 Medium 시리즈 공개
- Anthropic, Claude Code 원격 제어 도입
- Cursor, “demos not diffs”로 전환
- Mercury 2, ~1,000토큰/초 강조
2026년 2월 23일 헤드라인
Anthropic, DeepSeek·Moonshot·MiniMax의 Claude 대규모 distillation 공격 의혹 제기
- Anthropic이 Claude 증류 공격을 주장
- OpenAI가 SWE-Bench Verified를 폐기
- Responses API에 WebSockets가 추가됨
- LMArena에서 GPT-5.2-chat-latest 급상승
- OpenAI가 BCG·McKinsey와 협력 확대
2026년 2월 20일
ggml.ai/llama.cpp가 Hugging Face에 합류
- ggml.ai/llama.cpp가 Hugging Face에 합류
- Anthropic이 Claude Code Security를 공개
- Taalas ASIC, 16k–17k tok/s 데모 주장
- METR, Opus 4.6 time-horizon을 ~14.5h로 추정
- Gemini 3.1 Pro의 비용·토큰 효율 논쟁
2026년 2월 19일 헤드라인
구글, Gemini 3.1 Pro 공개...ARC-AGI-2 77.1%
- 구글이 Gemini 3.1 Pro를 공개
- ARC-AGI-2 77.1%로 추론 도약
- AA·Arena서 상위권 성능 재확인
- 에이전트 툴링·비용 논쟁이 커뮤니티로 확산
- Discord선 OpenRouter 장애도 논의
2026년 2월 18일
OpenAI, EVMbench로 스마트컨트랙트 보안 평가
- Claude 4.6, 지표 상승·토큰비용 급증
- OpenAI, EVMbench 보안 벤치 공개
- Google Lyria 3, Gemini에 음악 생성
- Cursor, 과거 대화 컨텍스트(context) 추가
- Qwen3.5 FP8 가중치 공개 확산
2026년 2월 16일 헤드라인
알리바바, Qwen3.5-397B-A17B 오픈 가중치 공개
- Qwen3.5-397B-A17B 오픈가중치 발표
- vLLM, Qwen3.5 Day-0 지원 공개
- OpenAI, OpenClaw 인수 흐름 확산
- ChatGPT Lockdown Mode로 공격면 축소
- 중국 CNY 모델 러시·로보틱스 가속
2026년 2월 12일 헤드라인
Google DeepMind, Gemini 3 Deep Think V2 공개…ARC-AGI-2 84.6% 달성
- Gemini 3 Deep Think V2, ARC-AGI-2 SOTA
- OpenAI, GPT-5.3-Codex-Spark 프리뷰 공개
- MiniMax M2.5·GLM-5, 오픈 코딩 경쟁 가속
- A2A·KV-cache, 에이전트 인프라 논쟁 확대
- QED-Nano·LeJEPA 등 연구 업데이트
2026년 2월 11일 헤드라인
Zhipu AI, MIT 라이선스 오픈 웨이트 GLM-5 공개
- Zhipu AI가 MIT 라이선스 GLM-5 공개
- DeepSeek 1M 컨텍스트 루머와 DPA 개선
- SeeDance v2.0 품질·가격 논의 확산
- 에이전트 워크플로우: Codex, MCP, DeepWiki
- 오픈 벤치마크 $3M 지원과 에이전트 보안 논쟁
2026년 2월 10일 헤드라인
알리바바, Qwen‑Image‑2.0 공개… 7B 통합 생성·편집
- 알리바바 Qwen‑Image‑2.0 7B 공개
- ByteDance Seedance 2.0, T2V 도약
- OpenAI Responses API 장기 작업 강화
- Kimi Agent Swarm, 100 서브에이전트
- Isomorphic Labs, IsoDDE 성능 향상 주장
2026년 2월 6일
GPT-5.3-Codex·Claude Opus 4.6 A/B 확산
- GPT-5.3-Codex·Claude Opus 4.6 A/B 확산
- Waymo, Genie 3 기반 월드 모델 공개
- Hugging Face, Community Evals 출시
- InfMem·LatentMem, 장문 메모리 제어
- 에이전트 스웜, ‘팀 설계’로 수렴
2026년 2월 4일 헤드라인
Cerebras, $1B 투자 유치로 $23B 평가
- Cerebras가 $1B 투자로 $23B 평가
- VS Code가 Agent Sessions로 에이전트 통합
- METR, GPT-5.2 High 6.6시간 성과 보고
- Qwen3-Coder-Next 80B MoE 모델 공개
- ACE-Step-1.5, MIT 오픈 음악 생성 모델 출시
2026년 2월 2일
OpenAI, macOS용 Codex 데스크톱 앱 출시
- OpenAI, macOS용 Codex 데스크톱 앱 출시
- Codex 앱, 워크트리·스킬·자동화 지원
- StepFun Step-3.5-Flash 공개, 256K 컨텍스트
- Kimi K2.5, Code Arena 오픈모델 1위
- RAG 청킹, 쿼리별 최적화로 리콜 20–40%↑
2026년 2월 2일
OpenAI, GPT‑5.2·GPT‑5.2‑Codex 40% 가속
- OpenAI, GPT‑5.2·GPT‑5.2‑Codex 40% 가속
- Alibaba, Qwen3‑Coder‑Next 80B@3B 공개
- Zhipu, GLM‑OCR 0.9B 출시와 day‑0 지원
- Anthropic, Claude Agent SDK의 Xcode 통합
- LangChain, 에이전트 트레이스·평가 가이드 제시
2026년 1월 30일 헤드라인
Moltbook·OpenClaw, ‘에이전트-에이전트’ 소셜 네트워크 확산
- Moltbook·OpenClaw 에이전트 포럼 급부상
- Anthropic 연구: AI 코딩은 학습 저하 가능
- Moonshot Kimi K2.5, Agent Swarm·PARL 공개
- Google Genie 3 공개, 게임 vs 비디오 논쟁
- Windsurf Arena Mode, IDE 내 모델 대결 도입
2026년 1월 29일 헤드라인
xAI, Grok Imagine 이미지·비디오 생성·편집 API 출시
- xAI가 Grok Imagine API로 SOTA 출시
- DeepMind가 Genie 3를 Ultra에 공개
- Kimi K2.5가 오픈 모델 1위 주장
- Qwen3-ASR 출시, vLLM day-0 지원
- 에이전트 표준·샌드박스 논의 확산
2026년 1월 28일
DeepMind, AlphaGenome 모델·가중치 공개
- DeepMind가 AlphaGenome 모델·가중치 공개
- Kimi K2.5가 오픈 모델 화제로 부상
- Chrome이 Gemini 3 Auto Browse 프리뷰 공개
- NVIDIA가 NVFP4 Nemotron 3 Nano 발표
- 에이전트 evals·하네스·추적 논의 확대
2026년 1월 27일 헤드라인
MoonshotAI, Kimi K2.5 공개: 멀티모달 MoE와 Agent Swarm
- MoonshotAI가 Kimi K2.5를 공개
- K2.5 Agent Swarm이 100 서브에이전트 지원
- Trinity Large(400B MoE) 프리뷰 공개
- OpenAI Prism이 GPT-5.2로 무료 출시
- DeepSeek-OCR 2, 토큰 압축과 읽기순서 학습
2026년 1월 26일 헤드라인
Anthropic, MCP Apps 스펙 발표 및 Claude.ai 공식 지원
- Anthropic가 MCP Apps 스펙을 발표
- Claude.ai, MCP Apps UI를 공식 지원
- Qwen3-Max-Thinking 등 추론 모델 출시
- vLLM, ‘day-0’ 지원 비용 논쟁
- llama.cpp, GLM-4.7-Flash 최적화
2026년 1월 21일 헤드라인
OpenEvidence, 120억달러 가치로 투자 유치
- OpenEvidence가 120억달러 투자 유치
- Anthropic이 Claude 헌법을 CC0로 공개
- Podium이 AI 에이전트 ARR 1억달러 주장
- AirLLM이 8GB로 405B 추론(inference) 제시
- Runpod이 $120M ARR로 GPU 클라우드 성장
2026년 1월 20일
X가 ‘For You’ 추천 알고리즘을 오픈소스 공개
- X가 ‘For You’ 추천 알고리즘을 오픈소스 공개
- OpenAI가 ChatGPT 연령 예측을 전 세계 적용
- GLM-4.7-Flash 로컬 추론(inference) 주목
- Liquid AI가 900MB 온디바이스 추론 모델 공개
- Microsoft가 내부 Claude Code 배포를 일시 중단
2026년 1월 19일
Zhipu AI, GLM-4.7-Flash 공개
- Zhipu AI가 GLM-4.7-Flash 공개
- STEM·RePo로 메모리·컨텍스트 확장
- DSPy에 `dspy.RLM`로 RLM 도입
- DeepMind, Gemini 안전 프로브 운영
- GPT-5.2 에이전트로 3M줄 브라우저
2026년 1월 16일 헤드라인
OpenAI, ChatGPT Go($8/월) 출시 및 Free·Go 광고 테스트 발표
- OpenAI가 Free·Go 티어 광고 테스트 시작
- ChatGPT Go($8/월), 메시지 10배 제공
- Sam Altman, ‘매우 빠른 Codex’ 예고
- FLUX.2 [klein], vLLM-Omni day-0 지원
- SWE-rebench 12월, Opus 4.5 63.3% 1위