브로드컴의 102.4테라비트 스위치, AI 네트워크의 새 시대 열다
데이터센터가 대규모 AI 학습 클러스터의 전력 및 안정성 문제로 고심하는 가운데, 이 거대 기술 기업은 최초의 코패키징 광학 이더넷 스위치를 선보였다.
팔로 알토 — 인공지능 경쟁은 단순히 더 빠른 칩이나 더 똑똑한 알고리즘에 관한 것만은 아니다. 이면에는 훨씬 더 큰 난제가 숨어 있었다. 바로 칩들 간의 연결이다. 매일 데이터센터는 불안정한 링크 때문에 수천 개의 프로세서가 서로 통신하는 데 어려움을 겪으면서 엄청난 양의 전력을 소모한다. 이 숨겨진 병목 현상은 이제 AI 자체의 경제성에 위협이 되고 있다.
브로드컴은 해답을 찾았다고 믿는다. 수요일, 이 회사는 초당 102.4테라비트의 이더넷 스위치인 토마호크 6 "대비슨"의 출하를 시작했다고 발표했다. 더 중요한 것은, 이 규모에서 코패키징 광학 기술을 사용하는 최초의 스위치라는 점이다. 하이퍼스케일 클라우드 운영자들이 제한된 전력 및 냉각 자원에서 최대한의 성능을 끌어내기 위해 분주히 움직이는 지금, 이 발표는 더할 나위 없이 중요한 시기에 나왔다.
수년간 엔지니어들은 광 트랜시버를 스위치 전면 패널에 직접 연결하는 방식에 의존했다. 이 방식은 AI 학습 작업이 수십만 개의 상호 연결된 프로세서로 폭발적으로 증가하기 전까지는 효과적이었다. 이러한 규모에서는 기존 하드웨어가 물리적으로나 경제적으로 한계에 부딪혔다.
실리콘과 빛의 결합
그렇다면 이 새로운 스위치는 무엇이 다를까? 광학 부품을 애드온 형태로 부착하는 대신, 브로드컴은 이를 동일한 칩 기판에 직접 통합했다. 긴 전기 경로, 추가 커넥터, 신호 컨디셔닝 하드웨어를 제거함으로써, 코패키징 광학 기술은 전력을 낭비하고 불안정성을 유발하는 중간 단계를 없앤다.
이를 길고 흔들리는 구동축으로 바퀴를 연결하는 대신, 엔진을 바퀴 안에 넣는 것에 비유할 수 있다. 그 결과는? 더 깨끗하고, 더 빠르고, 더 신뢰할 수 있는 움직임이다.
브로드컴에 따르면, 이 설계는 기존 플러그형 광학 부품에 비해 상호 연결 전력 소비를 최대 70%까지 절감한다. 수만 개의 네트워크 포트에 이 절감 효과를 곱하면, 단순히 비용뿐만 아니라 데이터센터가 제거해야 하는 열의 양에서도 엄청난 절감 효과를 볼 수 있다.
안정성 또한 크게 향상된다. 대규모 AI 학습 클러스터에서는 네트워크의 아주 작은 문제도 고가의 GPU를 유휴 상태로 만들고 하루에 수십만 달러가 드는 학습 실행을 지연시킬 수 있다. 통합을 강화함으로써 브로드컴은 이러한 값비싼 중단을 최소화하는 것을 목표로 한다.
800억 달러 규모의 질문
물론, 이것은 단순히 기술적 위업이 아니라 비즈니스적 이야기도 된다. 분석가들은 향후 5년간 AI 네트워크용 이더넷 스위치 지출이 800억 달러에서 1000억 달러 사이에 이를 것으로 예상한다. 클라우드 거대 기업과 기업 AI 업체들은 점점 더 야심찬 모델 학습을 처리할 수 있는 네트워크를 구축하기 위한 군비 경쟁에 돌입했다.
이 거대한 시장 내에서 코패키징 광학 기술은 작지만 중요한 한 부분을 차지한다. 이 기술은 복잡하고 공급망이 완전히 성숙하지 않아 채택이 더뎠다. 그러나 네트워크 속도가 초당 1.6테라비트를 넘어서면서, 기존 플러그형 부품은 전력 및 열 스트레스에 굴복하기 시작한다. 바로 이 지점에서 CPO가 빛을 발하기 시작한다.
한 네트워크 아키텍트의 말처럼, “이러한 속도에서는 단순히 성능을 구매하는 것이 아닙니다. 기존의 전력 및 냉각 한도 내에서 대역폭을 수용할 수 있는 능력을 구매하는 것입니다.”
대비슨 플랫폼이 광 채널당 속도를 200기가비트로 두 배(브로드컴의 지난 세대 CPO 스위치가 달성한 속도의 두 배)로 높이면서, 이 회사는 이러한 고위험 전환의 한가운데에 확고히 자리매김하고 있다.
경쟁자들의 맹추격
브로드컴만이 아니다. 시스코, 마벨, 엔비디아는 모두 미래의 AI 팩토리를 연결하는 자신들만의 비전을 가지고 있다. 여러 회사들이 이미 브로드컴의 순수 용량과 맞먹는 스위치를 발표했다. 그러나 브로드컴은 이 규모에서 실제로 출하를 시작한 첫 번째 회사라는 자랑거리를 가지고 있다.
이 선두는 중요할 수 있다. 대규모 클라우드 제공업체는 수년 앞서 인프라를 계획하며, 일단 특정 공급업체의 제품을 검증하면 종종 그 제품을 고수한다. 맨 먼저 나서는 것이 브로드컴에게 결정적인 우위를 제공할 수 있다.
그러나 엔비디아는 독특한 위협을 제기한다. 엔비디아는 지배적인 AI 가속기를 네트워킹 장비 및 소프트웨어와 함께 묶어 고객에게 원스톱 패키지를 제공한다. 이는 순수 네트워킹 공급업체가 대응하기 어렵다. 경쟁은 사용 사례에 따라 다르게 전개될 것으로 예상되며, 일부 시나리오에서는 엔비디아의 수직 통합 접근 방식이 유리하고 다른 시나리오에서는 브로드컴의 실리콘에 의존할 것이다.
아리스타 네트웍스와 같은 시스템 공급업체와 미카스 네트웍스와 같은 틈새 시장 플레이어들도 채택에 영향을 미칠 것이다. CPO 솔루션을 지지하려는 그들의 의지는 이 기술이 얼마나 빨리 확산될 것인지에 대한 초기 신호가 될 것이다.
운영자들을 위한 현실 점검
그럼에도 불구하고, 코패키징 광학 기술을 도입하는 것은 스위치를 켜는 것만큼 간단하지 않다. 이 기술을 효율적으로 만드는 바로 그 통합은 또한 서비스하기 어렵게 만든다. 패키지 내에서 결함 있는 광학 모듈을 교체하는 것은 새로운 플러그형 트랜시버를 끼워 넣는 것과는 매우 다르다.
브로드컴은 교체 가능한 레이저 모듈로 이러한 우려를 완화하려고 노력했지만, 운영자들은 이러한 시스템을 유지 관리하기 위해 새로운 기술과 절차를 필요로 할 것이다. 많은 이들이 위험을 분산하여 네트워크의 중요 계층에는 CPO를 배포하고 다른 곳에서는 더 익숙한 플러그형 광학 기술에 의존할 것이다.
공급망 신뢰성은 또 다른 난제를 추가한다. 광 엔진 제조에서 TSMC의 역할은 수요가 급증하는 시점에 생산량이 한계에 도달할 수 있음을 의미한다. 거기서의 어떠한 문제라도 배포를 지연시킬 수 있다.
앞으로의 전망
투자자와 업계 관계자들에게 브로드컴의 행보는 주요 트렌드를 강조한다. 선점자의 이점이 중요하며, 단순히 로드맵을 발표하는 것이 아니라 실제 제품을 출하하는 것이 신뢰를 얻는다. 분석가들은 브로드컴이 향후 1~2년 동안 특히 초기 버전을 테스트한 고객들 사이에서 디자인 승리(design wins)를 축적할 것으로 예상한다.
그러나 더 큰 그림은 AI 백엔드 네트워크에서 이더넷의 지배력 증가이다. CPO 채택이 미미하더라도, 더 풍부한 실리콘 및 광학 콘텐츠 덕분에 랙당 가치는 증가할 것이다. 시나리오는 선형 플러그형 부품이 대부분의 작업을 수행하는 보수적인 예측부터 2027년까지 CPO 채택이 AI 포트의 4분의 1에 달하는 공격적인 경우까지 다양하다.
브로드컴은 이미 초당 400기가비트 레인 속도를 지원하는 4세대 CPO 계획을 통해 미래를 내다보고 있다. 이 로드맵은 하이퍼스케일러의 장기 계획과 정확히 일치하며, 이것이 단발성 돌파구가 아니라 수년간의 변화의 시작임을 알린다.
투자 관점
항목 | 요약 및 저자 의견 |
---|---|
제품 및 중요성 | 최초의 102.4Tb/s 코패키징 광학(CPO) 이더넷 스위치 시장 출시. 단순한 사양 개선이 아닌, 진정한 이정표. 1.6T 속도에서 AI 패브릭의 핵심 문제점인 전력/열 및 링크 안정성을 직접 해결한다. 검증된 TH5/TSMC COUPE 기반 위에서 구축. |
주요 장점 | 1. 처리량: 102.4T 대역폭으로 10k-10만 개 이상의 GPU 클러스터에 1.6T 포트 지원. 2. 전력/열: CPO는 플러그형 대비 상호 연결 전력을 절감하여 시스템 수준에서 두 자릿수 %의 절감 효과 제공. 3. 안정성: 적은 부품 수로 링크 불안정을 줄여 고가의 GPU 유휴 시간 최소화. 4. 제조: TSMC COUPE 플랫폼으로 높은 수율로 대량 생산 가능. |
시장 기회 | 향후 5년간 AI 이더넷 스위치 지출 약 800억 달러. CPO가 모든 곳에서 승리할 필요는 없음. 2027년까지 5-15%의 침투율만으로도 GPU 스파인과 같은 고전력 영역에 집중된 수십억 달러 규모의 실리콘+광학 기회가 창출됨. |
경쟁 환경 | • 브로드컴: 선두 주자; 102.4T CPO 최초 출하, 강력한 머천트 생태계. • 엔비디아: 수직 통합(GPU+네트워킹+소프트웨어)이 강점. • 시스코: 서비스 용이성 측면에서 절충점이 적은 "충분히 좋은" 대안으로 LPO(선형 플러그형 광학)를 추진. • 마벨: 빠른 추격자; 대량 생산 시점이 중요. |
투자 관점 (AVGO) | 긍정적 요인: 카테고리 리더십, 구조적 이더넷 TAM(총 유효 시장) 성장, 광학/패키징 분야의 해자. 위험 요인: CPO 채택률, LPO 경쟁력, 운영/서비스 용이성 마찰, 광학 부품 공급망. |
채택 위험 및 완화책 | 1. 서비스 용이성: 플러그형보다 교체 어려움. 완화책: 현장 교체 가능한 레이저 모듈. 2. 열 밀도: 국부적인 열 흐름이 심각함. 완화책: 고급 시스템 설계 필요. 3. 공급망: 광학 부품 대량 생산은 쉽지 않음. 완화책: TSMC COUPE 표준 플랫폼. 4. 소프트웨어: 엔비디아의 엔드투엔드 최적화에 필적하도록 이더넷 스택이 성숙해야 함. |
시나리오 | 기본 시나리오 (가장 유력): 2027년까지 CPO 채택률 8-12%; AVGO가 대다수 점유율 확보. 낙관적 시나리오: CPO 채택률 15-25%; AVGO가 60% 이상 점유율 유지하며 매출 초과 달성. 비관적 시나리오: CPO 채택률 5% 미만; LPO 승리; AVGO는 여전히 102.4T ASIC 주기에서 이득을 보지만 CPO 상승세는 놓침. |
주요 추적 지표 | 1. OEM으로부터 102.4T CPO 시스템 출하 여부. 2. 독립적인 전력/안정성 데이터 (100G당 와트, 링크 플랩 MTBF). 3. 명시된 하이퍼스케일러 배포 및 LPO/CPO 계층 분할. 4. TSMC COUPE 생산 능력/수율 업데이트. 5. 경쟁사 102.4T/CPO 로드맵 시기. |
최종 평가 | 획기적인가? 예, 이더넷 CPO 분야에서. 긴급한 문제 해결? 예, 전력과 안정성을 실질적으로 향상. 시장 규모? CPO 혼합률과 무관하게 거대함. 선두 주자인가? 예, 오늘날 102.4T CPO 출하에서. |
결론: 데이터센터는 구시대적인 방식으로 성장할 여지가 고갈되고 있다. 브로드컴의 토마호크 6가 모든 문제를 하룻밤 사이에 해결하지는 못하겠지만, 이 제품은 업계가 AI 인프라의 근본을 어떻게 재고하고 있는지를 보여준다. 그리고 모든 와트, 모든 달러, 모든 초가 중요한 경쟁에서 이러한 변화는 결정적인 역할을 할 수 있다. 투자 조언 아님