GPU 시장은 둔화되지 않고 있다 — 오히려 활짝 열리고 있다
사람들은 종종 AI 하드웨어 경쟁을 엔비디아와 구글 간의 단순한 결투로 묘사하곤 합니다. 이는 깔끔한 헤드라인을 만들지만, 2025년 후반에 실제로 벌어지고 있는 일을 놓치게 합니다. 이 시장은 단일 승자에게로 향하고 있지 않습니다. 오히려 수요가 진정되지 않아 새로운 디자인이 계속해서 착륙하는 혼잡한 활주로와 더 흡사합니다. 칩은 계속 부족하고, 돈은 계속 쏟아져 들어오며, 여러 주요 플레이어가 동시에 성장할 수 있는 충분한 공간이 있습니다.
여전히 공급 부족에 시달리는 시장
2025년 11월 GPU 시장의 내부를 들여다보면, 1년 전과 똑같은 현상, 즉 공급 제약을 발견할 수 있습니다. TSMC의 최첨단 공정 노드는 풀가동 중이며, 대형 고객사들은 수년 앞서 생산 능력을 확보하고 있습니다. 이처럼 빠듯한 공급망은 공급 부족, 극심한 가격 변동, 그리고 나타나는 재고에 대한 치열한 입찰 경쟁이라는 익숙한 순환을 부추깁니다. 새로운 공장이 가동되고 기존 공장이 확장되더라도, 생산량보다 빠르게 증가하는 수요의 물결을 따라잡지 못하고 있습니다.
전망은 이 점을 명확히 보여줍니다. 분석가들은 데이터센터 GPU 부문이 2025년 1,020억 달러에서 2030년 약 2,000억 달러로 성장할 것으로 예상하며, 이는 연간 약 14%의 성장률을 의미합니다. 더 넓은 GPU 인프라 시장은 훨씬 더 폭발적인 성장세를 보입니다. 2033년에는 약 5,920억 달러에 달할 것으로 예상되며, 이는 놀라운 28%의 복합 성장률입니다. 이는 포화된 시장의 움직임이 아닙니다. 포화된 시장은 식고, 가격은 하락하며, 성장률은 감소합니다. 여기서는 그 반대 현상이 나타납니다.
맞춤형 칩이 어떻게 전체 시장 파이를 키우는가
많은 사람들은 대형 클라우드 제공업체의 맞춤형 칩이 GPU 판매를 필연적으로 잠식할 것이라고 가정합니다. 구글, 아마존, 메타, 마이크로소프트와 같은 하이퍼스케일러(초거대 기업)들은 이제 자체 Arm 기반 실리콘을 기반으로 엄청난 양의 컴퓨팅을 제공하고 있습니다. 이론적으로는 직접적인 경쟁처럼 들립니다. 실제로는 더 복합적인 이야기입니다. 그들이 제공하는 컴퓨팅의 약 절반이 이러한 자체 설계 칩을 사용하지만, 이러한 변화는 대체라기보다는 오히려 추가에 가깝습니다. 가속기 전체 풀은 단순히 한 종류를 다른 종류로 바꾸는 대신 성장하고 있습니다.
이들 기업은 데이터센터 내에서 GPU 대규모 팜(Farm) 대신에 독점 칩을 배치하는 것이 아니라, GPU 팜과 함께 독점 칩을 도입하고 있습니다. 구글 클라우드는 자사의 TPU와 엔비디아 GPU "모두를 지원하겠다"고 공개적으로 밝히며, 동일한 랙(rack)에서 이들을 경쟁자가 아닌 파트너로 간주합니다. 구글의 TPU 사용에 대해 논의했던 메타는 여전히 엔비디아 H100을 대량으로 주문하는데, 이는 단일 공급업체에 모든 것을 거는 대신 이중화를 원하기 때문입니다. 엔비디아의 차세대 블랙웰(Blackwell) 칩 주문 내역에서도 이러한 이중 접근 방식을 확인할 수 있습니다. 미국 4대 하이퍼스케일러들은 내부 칩 프로그램을 추진하면서도 총 약 360만 개의 블랙웰 칩을 선주문했습니다. 논리적인 결론은 간단합니다. 시장은 여러 아키텍처가 공존하며 번성할 수 있을 만큼 빠르게 확장되고 있습니다.
다수의 승자를 사실상 보장하는 새로운 규칙
이 생태계의 권력은 하이퍼스케일러 쪽으로 기울었으며, 이러한 변화는 경쟁을 줄이는 대신 더 많은 경쟁을 자연스럽게 촉진하는 방식으로 규칙을 다시 쓰고 있습니다.
첫째, 맞춤형 칩은 마침내 가장 큰 구매자들에게 실질적인 영향력을 부여합니다. 클라우드 거대 기업이 자체 TPU 스타일 대안을 준비하면, 엔비디아와의 협상에 빈손으로 들어가지 않습니다. 한 분석에 따르면, 이들 기업은 단일 공급업체에 너무 의존하는 것에 대해 불안감을 느끼며 이제는 반격할 도구를 갖추고 있습니다. 이러한 압력은 양측이 자사 제품을 상호 보완적이라고 설명할 때조차 가격 협상에 나타납니다.
둘째, 공급망 다변화는 '있으면 좋은 것'에서 '생존 필수 조건'으로 바뀌었습니다. 메타의 이전 H100 GPU 35만 개 이상 구매 계획은 이제 집중 위험에 대한 경고로 보입니다. 이에 대응하여, 업계 전반은 다중 소싱(multi-sourcing)으로 기울고 있습니다. 이는 TPU 거래, 자체 개발 ASIC 노력, 그리고 기존 GPU 계약을 혼합하여 더 탄력적인 스택을 구축하는 것을 의미합니다. 하나의 경로가 막히더라도 다른 경로들이 계속 작동하도록 합니다.
셋째, 스타트업들은 더 이상 슬라이드 데모와 연구실 시연에서만 머무르지 않습니다. 일련의 전문 칩 회사들이 심각한 상업적 영역으로 진출했습니다. 11억 달러의 자금 조달을 막 완료한 세레브라스 시스템즈(Cerebras Systems)는 스타게이트 UAE AI 캠퍼스와 같은 주요 프로젝트에 웨이퍼 스케일 엔진을 배치하고 있습니다. 사우디아라비아와의 15억 달러 계약 및 IBM과의 파트너십을 통해 지원받는 그록(Groq)은 특정 워크로드에서 유사 GPU보다 3~4배 빠른 추론 속도를 주장합니다. 삼바노바(SambaNova)는 국립 연구소에 시스템을 설치하고 통합 하드웨어-소프트웨어 플랫폼을 계속 추진하고 있습니다. 이들 기업은 총 50억 달러 이상의 가치를 가지며, 더 중요한 것은 실제 배포를 이루어내고 있다는 점입니다. 경쟁은 더 이상 이론적인 것이 아닙니다. 실제 워크로드를 실행하고 있습니다.
다양성으로 이끄는 심층적인 힘
헤드라인 이면에는 AI 경제학이 다중 아키텍처 세계를 지지하는 방향으로 조용히 기울고 있습니다.
여기서 추론(Inference)이 핵심적인 역할을 합니다. 엔비디아는 거대 모델 훈련에 있어서 여전히 지배적인 위치를 차지합니다. 그러나 일단 모델이 존재하면, 이를 실행하는 일상적인 행위인 추론의 양은 훨씬 더 빠르게 증가하며, 수많은 사용 사례에 걸쳐 파편화됩니다. 모델이 안정화된 후에는 매우 특정한 요구에 맞춰 튜닝된 하드웨어에 배포할 수 있습니다. 세레브라스는 메모리 집약적인 작업에서 빛을 발할 수 있습니다. 그록은 초저지연 스트리밍을 목표로 합니다. 구글의 TPU는 구글 자체 클라우드 스택 내에서 가장 적합하게 사용됩니다. 이러한 종류의 전문화는 단일 칩 제품군이 모든 전투에서 승리할 가능성을 훨씬 낮춥니다.
에너지 효율성은 또 다른 강력한 동기를 부여합니다. 맞춤형 ASIC은 특정 워크로드에서 최대 60% 더 나은 전력 효율성을 제공할 수 있습니다. 전력이 하이퍼스케일 데이터센터 운영 비용의 30~40%를 차지할 때, 그 이점은 이사회에서 큰 영향력을 발휘합니다. 논리는 명확해집니다. 각 워크로드를 필요한 성능에 가장 적은 전력을 소모하는 칩에 맞춰야 합니다.
제조 제약 또한 같은 방향으로 작용합니다. TSMC의 최첨단 라인은 계속해서 초과 예약 상태이며, 경쟁업체들은 단순히 엔비디아와 똑같은 생산 능력을 더 많이 확보함으로써 엔비디아의 성공 방식을 복제할 수 없습니다. 이러한 병목 현상은 플레이어들을 대안적인 경로로 이끌어냅니다. 인텔은 가우디(Gaudi) 가속기를 홍보합니다. 세레브라스는 웨이퍼 스케일 통합 접근 방식을 미세 조정합니다. 그록은 자체적인 고유한 LPU 아키텍처를 확장하고 있습니다. 이러한 다양한 전략은 종종 서로 다른 파운드리, 공정 및 패키징 기술을 사용합니다. 이들은 모든 것을 하나의 좁은 파이프를 통해 공급하는 대신, 업계 전체의 총 생산량을 확대합니다.
요약: 진정한 다양성을 동반한 초고속 성장
이 모든 흐름을 종합해 보면 2025년 후반의 상황은 무시하기 어렵습니다. 가속기 시장은 단일 GPU 챔피언을 중심으로 통합되는 방향으로 나아가지 않습니다. 이 시장은 GPU 중심의 준독점 상태에서 벗어나 다양한 아키텍처를 기반으로 하는 활기찬 생태계로 전환되는 일종의 상변화(phase change)를 겪고 있습니다. 총 가용 시장이 연간 약 28~33% 확장됨에 따라, 기회는 막대하게 느껴집니다. 공급이 여전히 주요 제약 요인입니다. 수요는 문제가 아닙니다.
이러한 환경에서 기업들은 명확하게 정의된 문제에 대해 날카로운 아키텍처적 우위를 제공함으로써 승리합니다. 시장은 충분히 넓고 세분화되어 있어, 집중된 전략 각각이 수십억 달러 규모의 사업으로 성장할 수 있습니다. 일부 플레이어는 스트리밍 성능을 지배할 것입니다. 다른 플레이어들은 최대 컴퓨팅 밀도나 초고밀도 소프트웨어 통합을 추구할 것입니다. 단일 하드웨어 챔피언의 시대는 지났습니다. 전문가의 시대가 시작되었습니다.
투자 조언 아님
