OpenAI, 첫 맞춤형 추론 칩 Jalapeño 공개

헤드라인: OpenAI, 첫 맞춤형 추론 칩 Jalapeño 공개

참고 링크: 544 Twitters, AINews’ website, AINews is now a section of Latent Space, opt in/out

OpenAI가 LLM 추론(inference)을 위한 첫 맞춤형 AI 칩 Jalapeño를 공개했다. Broadcom과 함께 만든 이 칩은 ChatGPT, Codex, API 트래픽, 향후 에이전트 제품을 겨냥하며, OpenAI가 칩부터 배포까지 더 많은 AI 인프라 스택을 직접 통제하려는 흐름을 보여준다.

AI Twitter Recap

OpenAI Jalapeño 칩과 풀스택 AI 인프라 경쟁

OpenAI의 하드웨어 심화: OpenAI가 LLM 추론(inference)을 위한 첫 맞춤형 AI 칩 Jalapeño를 발표했다. Broadcom과 함께 만들었으며 ChatGPT, Codex, API 트래픽, 미래 에이전트 제품을 겨냥한다. 전략적 메시지는 분명하다. 칩, 커널, 메모리, 네트워킹, 스케줄링, 배포까지 스택을 더 많이 소유해 컴퓨트 경제성과 제품 동작이 상용 GPU 공급에 덜 의존하게 하겠다는 것이다. @gdb는 강한 와트당 성능을 강조했고, @kimmonismus는 보고된 9개월 설계-테이프아웃 주기를 짚었다. 이는 고성능 ASIC으로서는 이례적으로 빠르며, OpenAI 자체 모델이 이를 가속한 것으로 알려졌다.
기술적 해석과 생태계 파급효과: 커뮤니티의 리버스 엔지니어링은 Jalapeño가 TPU와 비슷해 보인다고 본다. @scaling01는 근(近) 레티클 다이, 약 216GB HBM3E, ~7.1–7.4 TB/s 대역폭, ~10 PFLOPS FP4로 추정했다. 이 수치가 비공식이라고 해도, 프런티어 랩에는 하이퍼스케일러식 추론 실리콘이 이제 기본 조건이 됐다는 신호다. 같은 날 컴파일러/런타임 지형도 바뀌었다. Chris Lattner announced에 따르면 Qualcomm이 Modular를 인수하고, Modular said는 Mojo 오픈소스화가 예정대로 진행 중이라고 밝혔다. 이 조합은 NVIDIA/CUDA를 넘어 수직 통합 추론 스택 경쟁이 더 본격화되고 있음을 가리킨다.
서빙과 처리량도 계속 전선으로 남음: 인프라 측면에서 NVIDIA는 NeMo AutoModel이 Expert Parallelism, DeepEP, TransformerEngine 커널을 통해 MoE 모델의 학습 처리량을 3.4–3.7배 높인다고 밝혔다. SkyPilot은 보유 클러스터 전반의 통합 추론을 위한 Endpoints를 출시했고, Modal은 오픈소스 추론 구성이 지연시간에서 독점 제공업체를 앞선다고 주장했다. 로컬 최적화 쪽에서는 @jon_durbin이 맞춤형 DFLASH draft/speculator 모델 학습으로 실제 디코드가 30–50% 개선됐다고 보고했다.

에이전트 UX, “도구”에서 “동료”로 이동하며 보안·비용 질문 제기

Anthropic의 Slack 네이티브 에이전트 모델이 큰 UI 이야기: 여러 트윗이 Slack/팀 워크플로에 Claude가 내장되는 의미에 집중했다. @karpathy는 사람들이 이를 과소평가하고 있다며, 이는 “그저 기능 하나”나 Slack 봇이 아니라 조직 수준 하네스라고 주장했다. @gallabytes는 Claude Code가 “페어링 파트너”였던 경험에서 Tags가 “팀을 관리하는” 경험으로 뛰어넘었다고 설명했다. @dabit3는 더 나아가, 결국 에이전트를 명시적으로 태그할 필요조차 없어질 수 있다고 봤다.
어려운 부분은 신원, 권한, 락인: Anthropic은 this thread에서 에이전트 신원 모델을 자세히 설명했다. Claude는 자체 자격 증명을 가지며, 행동은 그 신원 아래 감사 가능하고, 접근 권한은 중앙에서 회수할 수 있다. 이 설계는 칭찬과 우려를 모두 불렀다. @KentonVarda는 에이전트별 명시적 권한 부여는 확장되지 않는다며, 세밀하고 작업 범위가 제한된 접근을 갖춘 **능력 기반 보안(capability-based security)**을 주장했다. @random_walker는 Claude Tag를 “모든 것을 기억하고 생각마다 과금하는 동료”로 표현하며, 하나의 공유 에이전트가 조직 워크플로에 깊게 박히면 암묵지 락인, 프롬프트 인젝션 위험, 예산 불투명성이 생긴다고 경고했다. @JubbaOnJeans도 쓰기 작업의 귀속 모호성과 깔끔한 Slack식 경계 밖에서 생길 미래 접근제어 복잡성을 지적했다.
오픈/DIY 대응은 즉각적: Hugging Face는 a blog tweet에서 내부 Slack 기반 코딩 에이전트 Moon Bot을 설명하며, 셀프호스팅, 맞춤형 도구, 감사 가능한 세션, 무(無) 락인을 강조했다. @calebfahlgren의 후속 글은 GitHub, Athena, analytics, MongoDB, Elasticsearch, HF Buckets에 걸친 프로덕션 통합을 열거했다. 더 큰 패턴은 분명하다. 팀들은 점점 에이전트 네이티브 UX를 원하지만, 조직 지능을 벤더에 외주화하기보다 하네스와 메모리 레이어를 직접 소유하고 싶어 한다.

Qwen-AgentWorld, OpenThoughts-Agent, 그리고 다음 에이전트 확장 축으로서의 메모리

Qwen-AgentWorld는 에이전트용 “언어 월드 모델”을 밀고 있음: Alibaba Qwen은 Qwen-AgentWorld를 소개하며, 이를 단일 모델 안에서 7개 환경인 MCP, Search, Terminal, SWE, Web, OS, Android를 시뮬레이션하는 네이티브 언어 월드 모델로 포지셔닝했다. Qwen은 두 경로를 제시한다. 시뮬레이터 자체를 만들고, 월드 모델링을 에이전트 사전학습에 쓰는 것이다. 이들은 35B MoE / 3B active, 256K 컨텍스트 모델인 Qwen-AgentWorld-35B-A3B and AgentWorldBench를 오픈소스화했다. 주목할 결과 하나는 단일 턴 환경 예측이 멀티턴 에이전트 작업으로 전이되며, 도메인 내부와 외부 벤치마크 모두에서 이득을 냈다는 점이다. 이는 this follow-up에 요약돼 있다.
OpenThoughts-Agent는 진지한 오픈 데이터 레시피를 제공: @iScienceLuvr와 @RichardZ412는 에이전트형 모델을 위한 오픈 큐레이션/학습 파이프라인 OpenThoughts-Agent를 강조했다. 여기에는 100개 이상의 통제된 ablation이 포함된다. 팀은 10만 예제 학습 세트를 만들고 Qwen3-32B를 미세조정(fine-tuning)해, 7개 에이전트형 벤치마크에서 **평균 정확도 44.8%**를 달성했다. 실무자에게 유용한 핵심 발견은 지시문 선택이 과도하게 중요하고, 가장 강한 벤치마크 교사가 곧 최고의 교사는 아니며, 더 긴 실행 추적이 도움이 되고, 규모가 커질수록 소스 다양성이 과반복보다 낫다는 것이다.
메모리는 1급 시스템 레이어가 되는 중: 신호가 강한 논의의 상당 부분은 에이전트에서 아직 풀리지 않은 문제인 메모리에 집중됐다. Weaviate’s Engram GA는 모든 것을 컨텍스트에 밀어 넣는 대신, 메모리를 추출·중복제거·조정·범위지정하는 비동기 인프라로 본다. @hwchase17는 추적을 오프라인으로 분석하고 다시 메모리로 기록하는 “sleep-time compute”용 LangSmith/Context Hub 워크플로를 보여줬다. @dair_ai는 에이전트 메모리가 최종 작업 성공만으로 평가되는 블랙박스가 아니라, 저장·검색·갱신·통합·수명주기를 포함한 완전한 데이터 관리 레이어로 평가돼야 한다는 논문을 가리켰다. 에이전트 차별화가 점점 이 지점으로 이동하는 모습이다.

중국 오픈 모델, 격차 축소 지속: GLM-5.2, Kimi 배포, 컴퓨트 규모

GLM-5.2가 오픈 모델 대화의 중심을 계속 장악: 여러 트윗은 GLM-5.2를 현재 가장 강한 오픈웨이트 경쟁자로 포지셔닝했다. CoreWeave는 GLM-5.2가 Artificial Analysis와 Agent Arena의 오픈 모델 순위에서 1위를 차지했다고 밝혔고, Baseten과 Cursor availability는 빠른 서빙/배포 채택을 보여줬다. @nutlope는 웹 작업에서 GLM 5.2와 Opus 4.8을 비교하며 비슷한 품질, 약 2배 토큰 출력, 그러나 여전히 더 빠르고 대략 3배 저렴하다고 보고했다. Arena도 GLM-5.2 Max가 강한 경쟁군을 상대로 Code Arena: Frontend를 이끌고 있다고 밝혔다.
벤치마크 뉘앙스가 중요: GLM-5.2는 ARC-AGI-2에도 등장했다. @fchollet는 이를 오픈소스 모델이 지금까지 낸 가장 강한 ARC-AGI-2 결과라고 불렀고, 다른 이들은 **22.8%**가 서구 프런티어 모델과 비교해 실제로 무엇을 뜻하는지 논쟁했다. 더 넓은 결론은 단일 벤치마크보다, 중국 오픈 모델들이 코딩, 에이전트, 지식 작업 전반에서 꾸준히 “대화의 장 안에” 들어오고 있다는 점이다.
상업화와 인프라 가속: Moonshot’s Kimi API는 이제 AWS Marketplace에 올라와 통합 청구와 EDP 차감으로 기업 조달을 쉽게 한다. 한편 중국 내수 컴퓨트도 큰 주제다. @teortaxesTex는 Huawei가 950 SuperPOD 규모 시스템을 시연할 수 있다는 보도를 짚었고, 이는 대형 국내 NPU 클러스터가 의미 있는 규모로 생산되고 있음을 시사한다. 사실이라면 중국 모델 서빙 생태계의 경제성과 회복탄력성을 실질적으로 개선할 것이다.

정책, 인재, 프런티어 랩 전략이 경쟁 구도를 재편

Anthropic은 정책 논쟁의 중심에 계속 있음: @kimmonismus는 Trump 시대 AI 수출 통제에 대한 첫 대형 법적 도전을 보도했다. Legion은 호스팅 모델 접근이 가중치나 기술 데이터 수출과 같지 않다고 주장한다. 동시에 많이 논의된 Mythos 이야기도 맥락이 추가됐다. Reuters/AP details summarized here에 따르면 Anthropic 모델은 제한된 테스트에서 민감한 미국 시스템의 취약점을 발견했지만, 일부 논평자들은 앞선 보도가 과장됐다고 경고했다.
증류와 접근 통제가 지정학 문제로 전환 중: @kimmonismus는 Alibaba와 연결된 운영자들이 약 25,000개 사기 계정과 2,880만 건의 Claude 교환을 이용해 프런티어 역량을 Qwen급 시스템으로 증류(distillation)했다는 Anthropic의 주장을 보도했다. 사실이라면 “적대적 증류” 논쟁은 소문을 넘어 집행과 국가 전략에 가까운 문제로 격상된다.
인재와 새 연구소: 이날은 인재 이동과 새 기관 형성도 있었다. 정렬(alignment) 측면에서는 Arthur Conmy joining Anthropic이 눈에 띈다. Mirendil AI launched는 과학을 위한 자기 가속 AI R&D라는 논지로 2억 달러 시드 라운드와 함께 출범했다. 영국에서는 BOLD Lab and SOFAIR가 두 개의 새 국가 기초 AI 연구소 전반에서 6천만 파운드의 시드 펀딩을 받았고, UCL DARK merging into BOLD도 있었다. 상업 측면에서는 Bloomberg-reported departures from Google DeepMind toward Anthropic이 스타트업의 업사이드가 계속 프런티어 인재를 끌어들이고 있음을 보여준다.

Top Tweets (engagement 기준)

OpenAI Jalapeño: OpenAI announces its first custom inference chip는 이 묶음에서 가장 중요한 제품/인프라 출시다.
GPT-5.5 Instant update: OpenAI rolls out a revised GPT-5.5 Instant는 의도 이해, 제약 처리, 대화 스타일을 개선했다.
Qwen-AgentWorld: Alibaba Qwen launches and open-sources language world models for agents.
Anthropic의 에이전트 신원 모델: Claude in Slack now uses its own credentials and audit trail는 가장 까다로운 기업용 에이전트 설계 문제 중 하나를 명확히 했다.
Cursor x Notion: Cursor tasks can now be delegated directly from Notion는 에이전트 워크플로가 독립형 채팅 앱이 아니라 기존 팀 소프트웨어 안으로 이동하고 있음을 보여주는 또 다른 신호다.

AI Reddit Recap

/r/LocalLlama + /r/localLLM Recap

중국 AI 칩 생태계와 통제

7 Chinese companies are already shipping H100/H200-class AI chips, most IPO’d in the last 6 months. I mapped all of them. (Activity: 1423): 이 글은 Huawei Ascend, Alibaba T-Head, Baidu Kunlunxin, MetaX, Moore Threads, Biren, Iluvatar CoreX 등 중국 AI 가속기 업체 7곳을 매핑하며, 현재 부품은 대체로 H100급, 차세대 부품은 H200급을 겨냥한다고 주장한다. 이는 주로 CHITEX/Dmitry Shilov 덱과 작성자의 X thread를 바탕으로 한다. 주요 사양으로는 국내 HBM을 포함한 Huawei Ascend 910C/910D/950 로드맵, 총 1.536TB VRAM의 Alibaba 16×96GB PG1 서버, 144GB HBM3e의 MetaX C600, 80GB와 1 PFLOPS의 Moore Threads S5000, FP8/FP4와 엣지 추론 모듈을 추가하는 Biren/Iluvatar 로드맵이 언급됐다. 더 큰 주장은 중국 AI 인프라가 NVIDIA/CUDA 의존에서 국내 스택으로 이동하고 있다는 것이다. OAM 유사 모듈, 독자 인터커넥트, SMIC 생산, 거의 100% 활용률, Qwen/DeepSeek/GLM 같은 중국 오픈웨이트 모델이 점점 비(非)NVIDIA 가속기에 먼저 맞춰 조정된다는 내용이다. 상위 댓글들은 실제 접근성과 배포 가능성에 회의적이었다. 유럽에서 쓸 수 있는지, 심지어 AliExpress에서 살 수 있는지 묻는 사용자도 있었고, 가장 실질적인 우려는 원시 하드웨어 사양과 무관하게 “the software stack” 즉 CUDA 호환성, 드라이버, 컴파일러/런타임 성숙도, 프레임워크 통합이 핵심 병목이 될 것이라는 점이었다. 기술적으로 자세한 비판은 이 글이 실제 배포 가능성을 과장한다고 봤다. 1,536 GB의 총 VRAM은 런타임 오버헤드, KV 캐시, 활성화값, 단편화, 분산 실행 요구사항을 고려하면 ~1,510 GB BF16 모델을 실행하기에 충분하지 않다는 것이다. 또한 Huawei Ascend 950PR이 128GB VRAM, 1.6TB/s, 1 PFLOPS FP8로 알려진 반면 NVIDIA H200은 144GB, 4.8TB/s, 2 PFLOPS dense FP8이므로, 벤더 주장에도 불구하고 메모리 대역폭과 연산 성능이 실질적으로 낮다고 지적했다. 여러 주장은 현재 출하가 아니라 “shipping soon”으로 지적됐다. 예를 들어 Kunlun M100은 메모리 크기, 대역폭, TFLOPS 같은 공개 핵심 사양을 찾기 어렵고, 기존 vLLM 지원은 M100이 아니라 이전 Kunlun 칩을 겨냥한 것으로 보인다는 설명이다. Moore Threads / C-series 주장도 의문을 받았다. 현재 출하는 덜 인상적인 C500/C550급 부품, 아마도 64GB GDDR6로 보이며, C600의 144GB HBM3e와 H200 포지셔닝은 아직 미래 양산 주장이라는 것이다. 댓글 작성자는 GDDR6 제품에서 HBM3e 대규모 생산으로 넘어가는 것은 아직 입증되지 않은 큰 제조·통합 도약이라고 강조했다.
Seems this community might have missed it: Bill that would mandate AI chip location tracking gains industry support | Half a dozen companies have come out in support of the Chip Security Act, which would require location-tracking mechanisms for America’s most advanced computing chips. (Activity: 440): 이 글은 며칠 전 보도된 내용, 그리고 r/politics와 r/LocalLLM에서도 논의된 내용을 가리킨다. 제안된 Chip Security Act는 미국의 가장 진보한 AI 가속기에 위치 추적 메커니즘을 요구한다는 내용이다. 기술적으로 이는 수출 통제 대상 컴퓨트 장치에 하드웨어/펌웨어 수준의 지리적 위치 확인, 증명(attestation), 보고 기능을 어떤 형태로든 추가한다는 뜻이며, 목표는 고급 AI 칩이 제한 관할권으로 전용되는 것을 막는 것이다. 상위 댓글은 대체로 적대적이었다. 이 의무가 중국 대비 미국 경쟁력을 약화하고 새로운 보안/프라이버시 위험을 만들 수 있다고 봤으며, 한 댓글은 이를 *“the best most secure location tracking mechanism”*이자 *“no security issues”*라고 비꼬았다.

OCR과 에이전트 시뮬레이션용 오픈 모델 출시

Unlimited-OCR is now on ModelScope! A 3.3B multilingual OCR model for one-shot parsing across single images, multi-page documents, and PDFs. License: MIT (Activity: 948): Baidu의 Unlimited-OCR가 ModelScope에 MIT 라이선스 3.3B 다국어 OCR/문서 파싱 모델로 발표됐다. 단일 이미지, 다중 페이지 문서, PDF를 원샷으로 파싱하며 긴 OCR 시퀀스를 위해 최대 32K 출력 토큰을 지원한다. GitHub repo는 Transformers 추론과 OpenAI 호환 스트리밍을 갖춘 SGLang 서빙, 그리고 base와 gundam 두 이미지/레이아웃 모드를 내세운다. 기술 댓글들은 PaddleOCR-VL-1.6과 비교해 어떤지, 32K 출력 한도 안에 몇 페이지가 들어가는지, gundam/“gundan” 모드가 무엇인지, Paddle 지원이 빠져 있는지 물었다. 댓글들은 특히 PaddleOCR-VL-1.6 대비 처리량/정확도 트레이드오프와 다중 페이지/PDF 파싱 중 모델의 32k 컨텍스트 한도에 몇 페이지가 들어가는지에 대한 구체적 비교 평가를 요구했다. 여러 사용자는 “gundam mode” 같은 불명확한 용어도 지적하며, ModelScope/Hugging Face 문서가 이 모드와 OCR 동작 또는 문서 파싱에 미치는 영향을 정의해야 한다고 했다. Hugging Face 모델 카드는 여기 링크됐다: https://huggingface.co/baidu/Unlimited-OCR
Qwen-AgentWorld-35B-A3B: a 3B-active MoE trained to simulate MCP, terminal, SWE, Android, web and OS environments (Activity: 292): Qwen은 Qwen-AgentWorld-35B-A3B를 공개했다. 이는 토큰당 약 3B 활성 파라미터를 쓰는 35B 파라미터 MoE로, 채팅/지시 모델이나 자율 에이전트가 아니라 언어 월드 모델로 포지셔닝된다. MCP/도구 호출, 검색, 터미널, SWE, Android, 웹, OS GUI 도메인 전반에서 에이전트 행동 이후의 환경 관측을 예측하도록 학습됐다. 이를 통해 실제 도구를 호출하지 않고도 오프라인 평가, 합성 궤적 생성, 도구 사용 워크플로 테스트, 샌드박스식 학습을 위한 모의/시뮬레이션 에이전트 루프가 가능하다. 댓글은 대체로 가벼웠지만, 한 기술적 반응은 ls -la의 터미널 출력을 예측하는 것처럼 행동을 모킹해 평가에 유용할 수 있다고 봤다. 다른 이들은 사용자/어시스턴트 역할을 바꾸거나 *“You are an MCP server now.”*라고 프롬프트하는 학습과 비슷할 수 있다고 농담하거나 회의적으로 말했다. 한 댓글은 사용자 명령 ls -la가 주어졌을 때 해당 터미널 출력을 생성하는 식으로 환경 반응을 예측하는 구체적 활용 사례를 들었다. 이는 실제 터미널이나 외부 도구를 호출하지 않고 에이전트 행동을 시뮬레이션하는 평가 하네스나 모의 환경에 유용할 수 있다. 또 다른 기술적으로 관련 있는 논의는 Qwen-AgentWorld-35B-A3B를 LLM 에이전트용 월드 모델 스타일 컴포넌트로 보고, Yann LeCun의 월드 모델 작업과 개념적으로 비교했다. MCP, SWE, Android, 웹, OS, 터미널 설정 전반에서 환경 시뮬레이션을 LLM 추론/학습에 직접 적용하면 벤치마크 이득이 일반화될 경우 에이전트 능력을 개선할 수 있다는 관점이다.

Less Technical AI Subreddit Recap

대상 서브레딧: /r/Singularity, /r/Oobabooga, /r/MachineLearning, /r/OpenAI, /r/ClaudeAI, /r/StableDiffusion, /r/ChatGPT, /r/ChatGPTCoding, /r/aivideo, /r/aivideo

Krea 2 오픈소스 이미지 모델과 생성형 AI 충실도

We are the team behind Krea 2. Ask us anything! (Activity: 1017): Krea는 사내 학습 오픈소스 텍스트-투-이미지 모델 Krea 2를 코드/가중치와 함께 krea.ai/krea-2-open-source, GitHub, 그리고 Krea-2-Raw와 Krea-2-Turbo용 Hugging Face 체크포인트로 제공한다고 발표했다. 연구 책임자는 이것이 Krea의 첫 완전 사내 학습 오픈소스 모델 릴리스라고 했고, 가이던스/스텝 증류 없는 Turbo 체크포인트, 5B 변형, 이미지 레퍼런스, 편집, 바운딩 박스, 더 나은 텍스트 렌더링, 사실성 같은 능력 중심 개선을 포함한 추가 아티팩트 공개를 검토 중이라고 밝혔다. 댓글은 로드맵/아키텍처 질문에 집중됐다. 이미지 편집 버전이 나올지, Krea가 Flux 2 VAE가 아니라 Qwen VAE를 선택한 이유가 무엇인지가 주요 질문이었다. Krea 2 연구자는 이것이 첫 완전 사내 학습 오픈소스 모델 릴리스이며 raw와 turbo 체크포인트가 모두 공개됐다고 말했다. 커뮤니티 피드백에 따라 가이던스/스텝 증류 없는 Turbo 체크포인트, 5B 체크포인트 변형, 이미지 레퍼런스, 편집, 바운딩 박스, 향상된 텍스트 렌더링, 사실성 같은 능력 중심 개선을 포함한 추가 공개를 검토 중이다. 여러 댓글은 모델 구성요소와 학습 선택의 투명성, 특히 Krea 2가 FLUX.2 VAE가 아니라 Qwen VAE를 쓰는 이유에 집중했다. 또 다른 기술적으로 관련 있는 요청은 Krea의 aesthetic reward model 공개였다. 댓글 작성자는 오픈소스 이미지 생성에는 현재 선호/미학 최적화를 위한 강한 보상 모델이 부족하다고 주장했다. 기능 요청은 다운스트림 제어 가능성에 집중됐다. 사용자들은 Krea 2가 이미지 편집 변형을 갖게 될지, style transfer를 지원할지 물었다. 이는 연구자가 언급한 이미지 레퍼런스와 편집 워크플로 중심의 미래 능력 확장과 맞닿아 있다.
I aged and restored a photo of myself (Activity: 3288): 이미지(link)는 ChatGPT 이미지 복원/채색에 대한 통제된 4패널 테스트다. 게시자는 알려진 원본 초상화에서 시작해 이를 인위적으로 노화/손상시킨 뒤 ChatGPT에 복원을 요청했다. 결과는 생성형 복원의 핵심 한계를 보여준다. 모델은 원래 얼굴을 회복하는 대신 그럴듯한 얼굴 디테일을 환각해, 피사체가 달라 보이고 더 나이 든 사람처럼 보이며 수염/얼굴 구조가 바뀌고 발명된 특징이 선명해진다. 댓글들은 대체로 이를 AI “복원”이 충실한 재구성이 아니라 열화된 입력에 조건화된 생성이라는 증거로 읽었다. 한 댓글은 이를 얼굴 인식/보안 시스템의 위험과 연결했고, 다른 이들은 복원된 버전이 Jack Black과 닮았다고 농담했다. 한 댓글 작성자는 이 결과가 AI 나이 변환/복원 워크플로의 핵심 한계, 즉 출력이 정체성을 보존하기보다 *“a completely different person”*이 될 수 있음을 보여준다고 주장했다. 그들은 이 정체성 드리프트를 AI 기반 얼굴 인식과 보안 시스템의 잠재적 실패 모드와 명시적으로 연결했다. 한 사용자는 “Aged by Gemini” 출력을 원래 프레이밍으로 다시 크롭한 뒤 NanoBananaPro에 넣어 복원 워크플로를 비교했고, *“still way better for restorations”*이며 첫 시도에서 더 나은 결과가 나왔다고 주장했다. Gemini로 노화된 이미지는 줌아웃된 것처럼 보였으므로 프레이밍/크롭이 복원 파이프라인에 실질적으로 영향을 미쳤고, 두 번째 이미지는 *“doing a LOT”*의 재구성을 하고 있었다고 덧붙였다.
Japanese animator using Seedance to render anime from simple 3D models (Activity: 2674): 한 Reddit 글은 일본 애니메이터가 단순한 3D 모델에서 애니메이션 영상을 생성/렌더링하기 위해 Seedance를 사용한다고 전한다. 이는 거친 3D 장면/블로킹이 AI 비디오 생성의 공간·시간 일관성을 제공하는 워크플로를 시사한다. 연결된 Reddit 비디오는 제공된 URL에서 HTTP 403 Forbidden 때문에 접근할 수 없지만, 댓글들은 이 애니메이터를 Tetsurou로 식별했다. 그는 TRIGUN STAMPEDE와 TRIGUN STARGAZE 크레딧을 가진 10년 이상 경력의 애니메이션 업계 베테랑으로 알려졌다. 댓글들은 이를 일관된 월드 모델을 갖춘 장편 AI 비디오로 가는 그럴듯한 경로로 봤고, 애니메이터의 3D 제어/입력이 예술로 인정받을 만큼 충분한 의도성을 제공하는지 논쟁했다. 한 댓글은 결과가 일반적인 애니메이션 CGI보다 좋아 보인다고 했고, 반AI 예술 반대는 게이트키핑이라고 일축했다. 댓글들은 이 워크플로를 장편 비디오 일관성을 위한 그럴듯한 경로로 식별했다. 단순 3D 모델/레이아웃을 안정적 장면·포즈·월드 표현으로 쓰고, Seedance가 최종 애니메이션 룩을 렌더링하는 방식이다. 한 사용자는 기반이 되는 연출된 동작과 구도를 유지하면서 프롬프트 변경으로 애니메이션에서 photoreal 또는 retro comic으로 스타일을 바꿀 수 있다고 언급했다. 기술적으로 관련 있는 제작 포인트는 AI가 키프레임 사이의 중간 프레임을 생성하는 inbetweening 같은 애니메이션 노동을 겨냥할 수 있다는 점이다. 한 댓글은 이것이 레이아웃, 연기, 키 애니메이션보다 지각되는 창의적 품질에는 덜 직접 기여하지만 비용의 큰 동인이라고 설명했다. 이는 Seedance식 파이프라인이 3D 블로킹과 프롬프트를 통한 인간의 연출을 유지하면서 제작 비용을 줄이는 데 유용할 수 있음을 보여준다. 제작자는 Tetsurou로 크레딧됐다. 그는 10 years 이상 경력의 애니메이션 업계 베테랑이며 최근 TRIGUN STAMPEDE와 TRIGUN STARGAZE 작업을 한 것으로 알려졌다. 이 맥락은 중요하다. 데모가 원시 텍스트-투-비디오 생성이라기보다, 숙련된 애니메이터가 의도적 3D 스테이징 위에 AI를 렌더러/컴포지터로 쓰는 것처럼 보이기 때문이다.

AI 데이터센터 반발과 방어

Data center noise irks Virginia neighbors: ‘You just want to curse’, Neighbors have put mattresses and plexiglass up in their windows to block the noise from this data center in Virginia. It’s a high pitched whine from the natural gas turbines that power it. The noise never stops 24/7. - NewsNation (Activity: 2474): Virginia의 한 데이터센터가 현장 천연가스 터빈에서 나오는 24/7 지속 고주파 소음을 내고 있는 것으로 알려졌다. 인근 주민들은 방음을 위해 창문에 매트리스와 플렉시글라스를 설치할 정도다. 댓글들은 기술/입지 문제에 집중했다. 시설이 전력망에 연결돼 있지 않고 주로 광섬유/네트워크 접근과 발전만 필요하다면, 터빈 기반 인프라를 주거 지역 근처에 배치한 것은 데이터센터의 본질적 요구가 아니라 조닝/허가 실패라는 것이다. 상위 댓글들은 이것이 미국 교외 조닝에서 어떻게 허가됐는지 의문을 제기했고, 더 많은 데이터센터는 필요하지만 주거 지역 안은 아니라고 주장했으며, 입지 선정이 변호 불가능하다고 폭넓게 평가했다. 댓글들은 이 문제를 데이터센터 소음 그 자체가 아니라 주로 발전 입지 문제로 봤다. 시설은 전력망 전력이 아니라 현장 천연가스 터빈을 쓰는 것으로 알려졌고, 주거 조닝 근처에는 보통 부적절한 지속적 고주파음을 낸다. 한 기술적 결론은 데이터센터가 주로 전력, 냉각, 네트워크 연결성을 필요로 하므로 비교적 유연하게 입지할 수 있고, 따라서 터빈 백업 인프라를 동네에 배치할 공학적 필요가 거의 없다는 것이다. 여러 댓글은 규제/계획 실패도 지적했다. 사용자들은 이 Virginia 사례를 EU/UK 계획 체계와 비교했는데, 가스 터빈 같은 산업 소음원은 보통 더 엄격한 허가, 환경 소음 검토, 주거 지역과의 분리를 요구받는다는 것이다. 논의는 더 강한 조닝이나 허가가 전력망 연결, 음향 완화, 이전을 요구할 수 있으며, 집 옆에서 24/7 터빈 운전을 허용해서는 안 된다는 점을 강조했다.
John Carmack weighs in on datacenters (Activity: 2034): 이미지는 screenshot of an X/Twitter exchange로, John Carmack이 데이터센터에 대한 대중 반대가 미국의 반핵 정서와 유사해져 AI 인프라 배치를 늦출 수 있다고 주장한다. 그는 데이터센터 수요를 주요 AI 주도 전환과 연결된 *“real value and progress”*의 증거로 본다. 반면 Markus “notch” Persson은 단순히 *“Why?”*라고 반문한다. 댓글들은 Carmack의 프레이밍에 반박하며 중간 지점을 주장했다. 데이터센터는 지역 민폐를 만들지 않는 곳에서는 허용돼야 하고, 자체 전력/물을 공급해야 한다는 것이다. 다른 이들은 반핵 정서가 일부 화석연료 이익의 영향을 받았으며, 같은 이익이 이제 AI 데이터센터 에너지 수요에서 이익을 볼 수 있다고 지적했다. 여러 댓글은 데이터센터 확장을 주로 인프라 입지와 자원 조달 문제로 봤다. 시설이 주거 민폐를 만들지 않는 곳에서는 자유롭게 짓되, 운영자가 지역 전력망이나 도시 유틸리티에 부담을 주지 않고 자체 전력과 물을 가져오거나 확보해야 한다는 것이다. 소음과 폐열은 특히 입지 제약으로 지목됐고, 냉각 배기와 음향 부하가 주민에게 영향을 주는 도시 근처 대형 시설 배치에는 반대했다. 반복된 기술·정책 주제는 대형 AI 데이터센터 성장이 더 확장되기 전에 새로운 안정적 발전, 특히 원자력과 결합돼야 한다는 점이었다. 댓글들은 “안전한 원자력”이 화석연료 기반 용량을 단순히 늘리는 것보다 데이터센터의 높고 지속적인 부하 프로필에 더 잘 맞는다고 주장했으며, 새 청정 기저전원이 구축되지 않으면 석유와 석탄 이익이 AI 부하 성장의 수혜자가 될 수 있다는 우려도 언급했다.

Gemini와 Fable 모델 출시 루머

3.5 pro Coming this week (Activity: 1211): 이미지는 **“Gemini 3.5 Pro”**가 “이번 주” 출시된다는 확인되지 않은 트윗의 스크린샷이다. 루머상 업그레이드는 더 강한 비전/멀티모달 추론, 향상된 메모리/컨텍스트 유지, 에이전트 워크플로, SVG/프론트엔드 생성, 네이티브 이미지 모델, “Gemini Super App”, 그리고 2.5M 토큰 컨텍스트 창을 포함한다(image). 기술적으로 이 글은 발표가 아니라 추측이다. 댓글들은 코딩 벤치마크 주장이 없다는 점을 지적했고, 기존 Gemini 3.x/2.5 Pro 프리뷰를 능가할지 또는 GPT/Claude/Fable급 코딩 모델과 경쟁할지 의문을 제기했다. 댓글들은 회의적이었다. 사용자들은 Google이 먼저 “출시부터 하라”고 했고 회귀를 피해야 한다고 말했다. 다른 이들은 2.5M 컨텍스트 창 주장이 가짜처럼 들리며 다시 1M일 것으로 예상했다. 댓글들은 3.5 Pro가 실제로 3.1 Pro Preview보다 개선될지 의문을 제기했다. 한 사용자는 유출이 신뢰할 만하고 모델이 강하다면 발표에서 선도적 코딩 벤치마크를 강조했을 것이라며, 그런 주장이 없다는 점은 현재 최고 코딩 모델을 이기지 못할 수 있다는 신호로 해석했다. 주장된 2.5M 컨텍스트 창은 회의적으로 받아들여졌다. 사용자들은 1M 토큰이 더 그럴듯하며, 부풀려진 컨텍스트 크기 주장이 유출을 가짜처럼 보이게 한다고 봤다. 기술적으로 관련 있는 또 다른 우려는 부하 상황에서의 모델 라우팅이었다. 사용자들은 유료 Pro 구독자도 “intense usage” 중에는 폴백 모델의 응답을 받을 수 있다고 농담하거나 불평했는데, 이는 광고된 모델 접근권이 있어도 실제 품질이 일관되지 않을 수 있음을 뜻한다.
Fable 5 return RUMORED with some hints in CC (Activity: 845): Claude Code v2.1.190 문자열 변경을 바탕으로 한 루머는 Anthropic이 Fable 5를 영구 구독 포함 대상으로 준비 중일 수 있다고 주장한다. 주간 할당량이 있을 수 있으며, 추가된 문자열 *“You’ve used your Fable 5 usage for this week”*와 “purchased separately from your plan” 삭제가 근거로 제시됐다(source). 정확하다면 이는 Fable 5 접근이 시간 제한/별도 구매 방식에서 구독 내 반복적 제한 사용으로 이동할 수 있음을 시사한다. 댓글은 대부분 기대/추측이었고, 유일하게 실질적인 선호는 낮은 주간 한도가 짧은 임시 구독 창보다 낫다는 것이었다. 계속 접근권을 보존하기 때문이다. 한 댓글 작성자는 구체적인 제품 접근 우려를 제기했다. Fable에 대해 two-week 기간에만 접근을 주는 구독 모델보다 낮은 주간 사용 한도가 낫다는 것이다. 제한적이더라도 지속 접근이 시간 제한 가용성보다 더 유용하다는 주장이다.

AI Discord Recap

Discord 접근 중단

접근 종료: 안타깝게도 Discord가 오늘 접근을 차단했다. 이 형태로는 다시 가져오지 않겠지만, 새로운 AINews를 곧 출시할 예정이다. 여기까지 읽어줘서 고맙고, 좋은 여정이었다.

오늘의 요약