AI 토큰의 수요와 공급 | 딜런 파텔 인터뷰

요약

  1. 토큰 지출이 연 700만 달러 수준으로 폭증하고 실행 비용이 급락하면서, "좋은 아이디어"가 자본 배분의 새 병목이 되고 있음을 실사례(리버스 엔지니어링 랩, Malcolm의 팬텀 GDP, 에너지 대시보드)로 보여준다.
  2. Mythos·Opus 4.7 등 프런티어 모델 수요가 공급(컴퓨트·메모리·TSMC·CPU)을 앞지르며, 마진 확대·선지급금·재계약·모델 사재기 같은 구조적 현상이 공급망 전반에서 관측된다.
  3. VLA 한계와 퓨샷 러닝 기반의 사전학습된 로보틱스 모델 전망, 토큰을 만들지 못하는 사람들이 "영구 하위계층"이 될 가능성, 그리고 3개월 내 반-AI 대중 시위 예측으로 마무리한다.

소개 (00:00-01:00)

  • [00:00] 예전에는 실행력이 정말 중요했고, 실행은 “매우, 매우 어려웠다”
  • [00:05] 그 시기에는 아이디어가 흔했고(공급 과잉) 상대적으로 가치가 낮았음 — 지금도 아이디어는 여전히 “싸고 넘쳐난다”
  • [00:10] 하지만 현재는 실행이 “매우 쉽다”는 전환점 — 좋은 아이디어만이 지출을 정당화한다
  • [00:40] 작년에는 “AI를 많이 쓰는 편”이라고 생각했고 회사 지출은 수만 달러 수준이었음
  • [00:53] 올해는 지출이 “그냥 급등” — 12월 말 Opus부터 시작됐다
  • [00:59] 사장 Doug O’Loughlin이 비기술 인력의 AI 코딩 도입을 “선두에서” 이끌었다

“[00:00] 예전에는 실행력이 정말 중요했습니다.”

AI 지출 급증 (01:00-10:27)

  • [01:21] Anthropic과 엔터프라이즈 계약 체결
  • [01:28] 이전 인터뷰 때 지출 속도는 연 500만 달러였음
  • [01:30] 지금은 연 700만 달러 속도(지난주 기준)
  • [01:37] 코딩을 해본 적 없는 사람들이 Claude Code로 하루 수천 달러씩 쓰기도 함
  • [01:48] 회사 인건비는 약 2,500만 달러 — Claude Code 지출이 이미 인건비의 25%를 넘음
  • [02:00] 이 추세면 연말에는 인건비 대비 100%를 넘길 수도 있음

“[01:30] 사실 지금은 지출 속도가 700만 달러입니다.”

  • [02:33] 오리건의 리버스 엔지니어링 랩 사례 — 고가 장비로 칩을 리버스 엔지니어링
  • [02:51] 한 팀원이 Claude 토큰 수천 달러어치로 CoreWeave GPU 기반 칩 소재 분석 앱을 만듦
  • [03:21] “Claude 몇천 달러어치”로 끝냈고, 과거엔 팀 하나가 유지하던 일
  • [03:32] 전직 대형 은행 이코노미스트 Malcolm 사례 — FRED·고용보고서·API 데이터 통합
  • [04:03] BLS의 약 2,000개 업무 집합을 평가, 현재 AI로 가능한 건 약 3%
  • [04:32] 비용 하락으로 GDP가 이론상 줄어드는 역설을 “Phantom GDP”로 명명
  • [04:38] 언어 모델 벤치마크 2,000개 평가까지 구축 — 혼자 다 했음
  • [04:48] “경제학자 200명짜리 팀이 1년 걸렸을 일”

“[04:47] 정말 혼자 다 했습니다.”

  • [05:15] 정보 비즈니스는 빠르게 상품화될 수밖에 없고, 기준을 끌어올리지 않으면 자신도 상품화됨
  • [05:52] AI는 소프트웨어를 상품화하듯 “모든 것을 상품화”한다
  • [06:15] 에너지 분야 사례 — 기존 100명·10년짜리 데이터 서비스를 SemiAnalysis Jeremy가 3주 만에 구축
  • [06:43] Jeremy는 하루 6,000달러씩 쓰며 미국 전 발전소·송전선을 스크레이핑해 미세 지역별 전력 수급 대시보드 제작
  • [07:29] XYZ 에너지 데이터 서비스 회사는 100명이 10년 동안 해온 일

“[06:11] 제가 AI를 도입하지 않으면, 누군가가 도입할 것이고, 그들이 저를 이길 겁니다.”

  • [09:26] 투자자들이 직접 데이터를 만들 거란 우려 — 정보는 1달러에 팔리지만 구매자는 그 이상을 벌기 때문에 계속 살 것
  • [10:15] Jane Street·Citadel 같은 곳도 자체 데이터가 촘촘하지만 “결정적인 한끗” 때문에 계속 산다

토큰 수요 (10:27-16:21)

  • [10:34] SemiAnalysis의 집중 분야는 AI 인프라와 토크노믹스 혁명
  • [11:02] 모든 대화가 결국 “토큰의 수요와 공급”으로 귀결

“[11:06] 지금 제게 세상에서 가장 흥미로운 건 바로 그거입니다.”

  • [11:19] Anthropic 매출/ARR이 90억 → 350400억 달러로, 방송 시점엔 400450억 달러 가능
  • [11:27] 그런데 컴퓨트는 같은 속도로 늘지 않았음 — Mythos·Opus 4.7 개발에 R&D 컴퓨트 투입 유지
  • [11:42] 추가 컴퓨트가 전부 추론으로 갔다고 가정해도 매출총이익률 최소 72%
  • [11:56] 초기 펀딩 라운드 유출 당시 마진은 30%대였음 — 수요가 워낙 높아 레이트 리밋/가격 조정이 가능
  • [12:16] 엔터프라이즈 계약을 통해서만 필요한 레이트 리밋을 확보 가능
  • [12:33] 400억 달러 ARR이 지불되지만, 토큰이 창출하는 가치는 그보다 훨씬 큼
  • [13:01] “샌프란시스코의 형편없는 SaaS 스타트업”은 토큰 가격 경쟁에서 밀려날 것

“[13:49] 제 친구 레오폴트가 무릎을 꿇고 앤트로픽 공동창업자 앞에서 Mythos 접근 권한을 달라고 빌었던 일입니다.”

  • [14:12] Mythos는 거의 2년 만에 가장 큰 모델 능력 도약
  • [14:24] 너무 좋아서 공개하지 않으려 하며, 사이버 용도로만 선택적 공개 — 토큰 비용이 5~10배 수준
  • [14:39] 공개 중인 Opus 4.7은 모델 카드에 “사이버 분야에서는 의도적으로 더 약하게 만들었다”고 명시
  • [14:50] 자본이 충분하면 토큰당 과금 엔터프라이즈 계약을 써라 — 정액제는 피할 것
  • [15:06] 1~2년 뒤엔 사업 자체가 “토큰 차익거래”가 될 수 있다
  • [15:21] 특정 역량 등급 도달 비용이 과거 대비 1/100~1/1000 — DeepSeek은 GPT-4 대비 1/600
  • [15:39] GPT-4급 모델엔 아무도 관심이 없고, 사람들이 원하는 건 프런티어
  • [15:51] 비용 하락은 빠르지만, 수요를 끌어올리는 건 “새로운 사용 사례들”
  • [15:59] 1년 뒤엔 같은 품질에 약 7만 달러, 100배 저렴해질 수 있지만 — 그때는 훨씬 좋은 모델이 훨씬 더 많은 일을 해낸다

아이디어는 싸고 실행은 쉬운 시대 (16:21-20:46)

  • [16:21] Mythos는 같은 작업에 훨씬 적은 토큰을 써 실제로는 Opus 4.6보다 저렴
  • [16:42] Anthropic의 2025년 목표는 “연말까지 모델 안에 L4급 소프트웨어 엔지니어” — 대체로 Opus 4.6으로 달성
  • [16:56] Mythos는 벤치마크상 L6급 엔지니어 수준 — 2월 내부 사용 시점부터 두 달 만에 L4 → L6
  • [17:22] Anthropic·OpenAI 출시 주기가 더 촘촘해짐
  • [17:29] 더 나은 모델의 3요소: 막대한 컴퓨트(단기 고정), 뛰어난 연구자(수천만 달러), 구현
  • [17:55] 이제는 아이디어가 있고 구현은 매우 쉬움 — 비싸긴 해도 쉽다

“[17:59] 비싸긴 하지만, 매우 쉽습니다.”

  • [18:14] 출시 주기가 이전 6개월에서 2개월로 단축
  • [18:19] 거대한 아이디어도 구현 가능 — 미국 모든 발전소·송전선 모델링 같은 것
  • [18:30] 핵심은 “어떤 아이디어가 토큰에 자본을 써야 할 가치가 있느냐”
  • [19:01] 예전엔 아이디어가 싸고 실행이 매우 어려웠지만, 이제는 아이디어는 싸고 실행은 매우 쉽다

“[19:06] 그래서 결국 좋은 아이디어만이 가치가 있고,”

  • [19:23] 사회가 스스로를 어떻게 재편해야 하는지 측면에서 두려움을 유발
  • [19:36] 올바른 아이디어를 선택하고, AI 산출물을 팔고, 자본을 끌어모으는 능력이 중요

“[19:49] 항상 최신 모델을 갖는 것이 매우 중요합니다.”

  • [19:53] Anthropic의 내부 프로젝트(놀리려고 “Earwig”로 부름)
  • [19:59] 특정 회사들에만 Mythos를 주는 식의 선택적 배포가 계속될 것
  • [20:20] 1조 달러 인프라 비용을 감당할 수 있는 사람들만 접근, 증류 방지를 위해 공개 제한
  • [20:34] Opus 가격을 두 배로 올려도 계속 낼 것

“[20:34] 그들이 Opus 가격을 두 배로 올려도 저는 계속 낼 것입니다.”

모델 사재기 (20:46-22:34)

  • [20:55] “저는 Mythos가 없습니다” — 현재 Mythos는 초대형 은행들만 보유
  • [20:59] 현재는 사이버보안에만 쓰이지만, 장기적으로는 계약/관계가 접근권을 좌우할 것
  • [21:08] 엔터프라이즈 계약으로 더 빠른 접근·더 높은 레이트 리밋을 받는 시나리오
  • [21:20] Citadel의 켄 그리핀 같은 인물이 OpenAI/Anthropic과 초대형 선구매 계약을 맺을 수 있다

“[21:32] 매년 첫 100억 달러어치의 토큰을 제가 사겠습니다.”

  • [21:51] 적용 범위가 너무 넓어 한계를 가늠하기 어려움

“[21:55] 아무도 이 모델들이 무엇을 할 수 있는지 모릅니다. 아무도요.”

  • [22:08] 현재 로보틱스의 토큰 소비는 다른 것에 비해 “거의 0”
  • [22:16] 로보틱스가 “두 번째 수요 곡선”처럼 수요를 만들기 시작할 가능성
  • [22:25] “소프트웨어 전용 특이점” — 특이점이 소프트웨어에서만 먼저 올 수 있다

로보틱스 (22:34-27:03)

  • [22:34] 세상의 대다수는 물리적 영역 — 하드웨어 중심 재편이 본질

“[22:34] 세상의 대다수는 물리적입니다.”

  • [22:46] 소프트웨어가 쉬워질수록 “로봇을 어렵게 만드는 것”이 무엇인지 질문
  • [22:56] 현재 AI의 흥미로운 점은 학습 효율이 매우 낮음에도 데이터 공급량으로 극복
  • [23:05] VLA(비전-언어-행동) 모델이 인기지만 데이터 효율 한계로 궁극의 해법은 아닐 수 있음
  • [23:21] 대안: “대규모로 사전학습된 로봇 모델” — 인간이 평생 데이터를 보듯이
  • [23:27] 인간이 잘하는 이유는 표본 효율이 높기 때문, 한두 번 예시로 잘해냄
  • [23:43] 향후 6~18개월 사이 로봇 분야에서 퓨샷 러닝 돌파구 예측
  • [23:53] 사전학습 모델 + 확보한 로봇 + 몇 가지 예시면 과업 수행 가능
  • [24:16] 현재는 광고용 로봇 회사 많지만, 실제 활용은 “정말 틈새”(칠판 닦기 같은 단일 과업)
  • [24:28] 표준 로봇에 다운로드하는 “모델 패키지”가 나올 것 — 사용 당 과금
  • [24:34] 물리 재화의 가속·디플레이션이 폭발할 것이고, 그 결과 토큰 수요는 계속 미친 듯 증가
  • [24:53] Mythos는 “훨씬 더 큰 모델”이라는 것이 스케일링 법칙의 증거

“[25:19] 스케일링 법칙이 여전히 작동한다는 증거입니다.”

  • [25:27] 더 많은 컴퓨트 + 컴퓨트 효율 향상이 함께 일어남 — 비용이 2~6개월마다 극적 감소
  • [26:00] OpenAI는 작은 단계 확장, Anthropic은 “정말 큰 도약”을 감행
  • [26:19] 2월에 Mythos가 있었음에도 출시하지 않음 — 이미 매진이라 그럴 필요 없다는 분위기
  • [26:41] Anthropic은 컴퓨트 제약이 있고, OpenAI는 그 비용을 완벽히 감당 가능

컴퓨트 병목 (27:03-30:26)

  • [27:03] OpenAI는 막대한 자금 조달 완료 — Oracle·CoreWeave·SoftBank·Microsoft·Amazon Trainium 전방위 확보
  • [27:32] 얼리어답터는 첫날부터 쓰지만, 다른 기업은 도입에 시간이 걸림

“[27:38] 그러니까 ‘젠장, 쿼드 사이코시스(quad psychosis)’ 같은 순간의 불꽃이 모두에게 동시에 찾아오지는 않습니다.”

  • [27:43] 연말쯤 경제 전체가 Opus 4.6 최상위 티어에 1,000억 달러를 쓸 것
  • [27:50] 현재 지출은 400억 달러 — “지수 함수”가 아니라 “선형 외삽”
  • [27:56] 지수 성장을 얻으려면 더 나은 모델이 필요
  • [28:00] OpenAI·Google은 곧 그 수준에 도달, Anthropic은 컴퓨트 부족 가능성
  • [28:18] Mythos + 충분한 컴퓨트였다면 매출 5,000억 달러도 가능했을 것
  • [28:31] H100 가격 급등, GPU 유효 수명 연장
  • [28:36] “2티어 랩조차 토큰이 매진될 것” — 1티어는 말할 것도 없음
  • [28:46] 최고 모델의 경제적 가치가 인프라로 토큰을 공급할 능력보다 빠르게 커짐 — 격차 확대

“[28:59] 왜 내가 그냥 내 마진을 확 올리지?”

AI 영구 하위계층 (30:26-31:39)

  • [30:27] 공급 측으로 화제 전환 — 수요 급등으로 공급 전체에서 가격 상승
  • [30:49] GPU 가격뿐 아니라 “유효 수명”도 늘고 있음 — H100 가격이 상승
  • [30:53] “GPU 수명이 5년 미만”이라는 일부 주장을 반박

“[30:57] 완전한 헛소리입니다.”

  • [30:59] 34년 된 Hopper 클러스터가 다시 34년 재계약, A100도 마찬가지

“[31:10] 어쩌면 7~8년일 수도 있다고도 말할 수 있습니다.”

  • [31:21] 결과적으로 클라우드 계층 매출총이익률은 35%보다 훨씬 높음
  • [31:33] 엔비디아 GM 75% 수준 유지, 하류 메모리 쪽 마진도 급등

공급망 현실 (31:39-37:47)

  • [31:47] 엔비디아 같은 회사들이 제조 쪽에 막대한 선지급금 — 매출총이익률이 안 올라도 ROIC는 상승
  • [32:00] ASML 완전 매진, Carl Zeiss 증설 요구
  • [32:05] 공급망 공통 패턴: 매진 → 마진 상승 → 선지급금
  • [32:19] PCB용 동박까지 매진이라 선지급금을 받는 상황
  • [34:20] 메모리 생산능력은 연 20~30%만 증설 가능 — NAND 낮고 DRAM 약간 높음
  • [34:42] 의미 있는 추가 공급은 2028년에야 도래(최대한 빨라도 2027년 말)
  • [34:59] DRAM은 여기서 또 2~3배 상승 전망

“[35:05] 아직 제대로 이해하지 못하셨다고 말하고 싶습니다.”

  • [35:16] 자본주의에서 생산능력을 재배분하는 유일한 길은 가격 인상으로 수요 파괴
  • [35:29] TSMC는 CAPEX를 계속 늘리지만, 가격 인상은 한 자릿수대(메모리처럼 세 자릿수 아님)
  • [35:51] TSMC가 훌륭한 회사지만 “모든 가치를 가져갈 수 있느냐”는 별개의 문제
  • [36:14] TSMC 올해 CAPEX 560억 → 574억 달러 상향(1월 이후 업데이트)

“[36:31] TSMC가 설비투자에 1,000억 달러를 쓸 것입니다.”

  • [36:42] 램리서치·어플라이드·ASML·MKSI 등 하류로 갈수록 불윕 효과 증폭
  • [37:46] CPU는 완전히 매진 상태이며 수요 폭발적 증가

CPU (37:47-42:54)

  • [37:52] CPU가 많이 필요한 두 가지 이유
  • [37:54] 첫째, **강화학습(RL)**에서 CPU가 매우 중요
  • [38:00] 과거: 인터넷 데이터를 모델에 학습 → 현재: 학습 후 “환경(environment)“에 넣어 과제 수행
  • [38:16] 환경은 각 시도의 성공 여부를 점수로 평가
  • [38:24] 환경 예시: 구조화 출력 검증, 파일 열어 편집해 제출, 지멘스 물리 시뮬레이션, CAD 편집
  • [38:44] 환경은 GPU/ASIC이 아니라 CPU에서 돌아감 — ASIC은 모델 실행만 담당
  • [38:56] 모델이 만든 궤적들을 평가·학습 업데이트 반복 — CPU가 매우 유용
  • [39:13] 둘째, 배포된 모델이 만든 출력은 GPU에서 바로 사람에게 가는 게 아님 — CPU 기반 앱이 필요
  • [39:29] CPU 수요도 “대규모로 완전 매진”
  • [39:47] 가장 어려운 건 토크노믹스(토큰의 경제) 이해 — 인프라·토큰·모델·마진은 잘 파악되지만 실제 사용량·채택은 모델링이 어려움
  • [40:11] 1월에 세운 2월 추정치를 Anthropic이 훨씬 뛰어넘음
  • [40:26] 핵심 질문: 누가 이 토큰을 쓰고, 왜 쓰며, 무엇을 만들어 경제에 어떤 가치가 확산되는가
  • [40:36] 그 가치는 어떤 GDP 통계로도 포착하기 어려움
  • [41:11] “유령 GDP”를 어떻게 추적할지가 과제 — 공식 GDP는 체감 가치보다 너무 작음
  • [41:54] 변화 속도가 빨라 “세 달마다” 이 대화를 하고 싶음

“[42:03] 대규모 시위입니다.”

  • [42:05] 향후 3개월 예측: “Anthropic에 반대하는 대규모 시위”가 시작돼 AI 전반으로 확산
  • [42:10] 사람들은 AI를 싫어하며, “ICE보다도, 정치인보다도 인기 없다”(Pew 조사 인용)
  • [42:22] Anthropic 매출 급증이 하류 사업 변화를 유발 → AI에 대한 공포·책임 전가 증가
  • [42:40] 정치인·인플루언서가 AI를 “무기화”해 대중을 상대로 활용할 수 있음
  • [42:49] 샘 올트먼의 집에 화염병이 던져진 뉴스 기사 댓글의 분위기를 예로 듦

전망: 대중의 반발 (42:54-45:33)

  • [42:54] 2주 사이에 비슷한 사건이 두 번 — 반AI 정서의 “시작에 불과”
  • [43:00] 3개월 내 반AI 대규모 시위 예측 — “균형추”가 필요하다는 문제 제기

“[43:00] 3개월 안에 AI에 반대하는 대규모 시위를 보게 될 것이라고 생각합니다.”

  • [43:08] 첫 대응: 샘 올트먼·다리오가 인터뷰에 덜 나와야 함 — 두 사람 모두 “카리스마가 전혀 없다”
  • [43:19] 샘의 터커 칼슨 출연이 공화당원의 OpenAI 반감을 키웠을 가능성
  • [43:26] 둘째, AI로 가능한 희망적·긍정적 사례를 보여줘야 함
  • [43:30] 셋째, “세상을 완전히 바꿀 것”이라는 메시지 반복 중단 — 능력과 자신을 연결하지 못해 두려움만 키움
  • [43:41] 평균적인 사람은 Anthropic·OpenAI 직원이 누군지도 모름 — “회사 안의 5,000명 은밀한 카르텔”로 인식
  • [43:59] 데이터센터·발전소로 “세상을 오염”시키는 집단이라는 인식도 존재
  • [44:06] “미래 이야기”를 줄이고 AI가 지금 사람들을 어떻게 돕는지에 집중해야 함

“[44:12] 저는 큰 조직 개편과 리브랜딩이 필요하다고 생각합니다.”