엔비디아, 메타 및 오라클의 스펙트럼-X 이더넷 채택으로 차세대 AI 시스템 구동력 확보하며 영향력 확대

작성자
Jane Park
16 분 독서

실리콘밸리의 새로운 전장: 엔비디아가 AI 신경계를 재편하려는 대담한 전략

메타와 오라클이 스펙트럼-X 이더넷을 도입하며 인공지능 아키텍처의 재편 가능성과 한 기업의 영향력 한계를 시험하다

캘리포니아 새너제이 — 오늘날 인공지능 붐을 이끄는 데이터센터들이 한계에 부딪히고 있다. 신경망은 계속해서 커지고 있지만, 이들을 연결하는 디지털 "파이프"가 더 이상 속도를 따라가지 못하고 있는 것이다.

월요일, 엔비디아는 메타와 오라클이 자사의 스펙트럼-X 이더넷 스위치를 대규모 AI 인프라에 도입할 계획이라고 발표했다. 이는 엔비디아의 지배력을 칩을 넘어 머신러닝 시스템이 스스로 사고하고 소통하도록 돕는 '연결 조직'으로 확장하는 움직임이다.

[엔비디아 스펙트럼-X 네트워킹 플랫폼]

두 회사 모두에게 이는 중요한 의미를 갖지만, 그 이유는 다르다. 개방형 소스 및 다중 공급업체 접근 방식(멀티 벤더 접근 방식)으로 유명한 메타와 긴밀한 올인원 통합으로 알려진 오라클은 좀처럼 같은 길을 걷지 않는다. 엔비디아에 대한 이들의 공동 신뢰는 엔비디아 CEO 젠슨 황이 "AI 공장"이라고 부르는 것을 거대 기술 기업들이 구축하는 방식에 있어 전환점이 될 수 있음을 시사한다.

하지만 이러한 기대감 이면에는 업계 전반의 질문이 놓여 있다. AI의 미래는 단일 공급업체가 소유한, 엄격하게 통제되는 수직 통합 시스템을 통해 구현될 것인가, 아니면 시장 경쟁력을 유지하고 구매자에게 제어권을 부여하는 개방적이고 유연한 표준을 통해 구현될 것인가?


네트워크가 병목 현상을 일으킬 때

이 문제는 본질적으로 물리적 한계에 귀결된다. 오늘날의 언어 모델이 수조 개의 매개변수로 팽창하면서, 수천 개의 GPU가 그래디언트 업데이트, 모델 가중치 등 모든 종류의 데이터를 끊임없이 교환해야 한다. 이러한 끊임없는 상호작용은 막대한 양의 트래픽을 네트워크에 쏟아붓게 된다.

기존 이더넷 장비는 이러한 종류의 부하를 처리하도록 설계되지 않았다. 분석가들은 일반적인 데이터센터 네트워크가 AI 훈련 중 약 60%의 유효 처리량만을 달성한다고 추정한다. 나머지 처리량은 혼잡, 버퍼 지연, 트래픽 충돌로 인해 사라진다. 매 1%의 손실은 유휴 GPU, 즉 수백만 달러에 달하는 하드웨어가 디지털 엄지손가락을 꼼지락거리며 놀고 있음을 의미한다.

엔비디아는 자사의 스펙트럼-X 시스템이 이러한 계산을 바꾼다고 주장한다. 이 회사는 전용 스위치를 맞춤형 네트워크 카드 및 AI에 최적화된 소프트웨어와 결합함으로써 활용률을 95%까지 끌어올릴 수 있다고 말한다. 이 플랫폼은 혼잡이 발생할 지점을 예측하고 문제가 되기 전에 데이터를 재라우팅한다. 엔비디아는 이 수치들이 자사 슈퍼컴퓨터에서 나온 것이라고 밝히지만, 실제 다중 공급업체 환경에서의 외부 검증은 아직 제한적이다.


하이퍼스케일러 방정식

두 도입 기업 중 메타의 움직임이 더 많은 이목을 끈다. 이 회사는 사실상 개방형 네트워킹의 교본을 만들었으며, 브로드컴, 아리스타 등 여러 공급업체의 장비를 혼합하여 사용함으로써 특정 공급업체 종속을 피했다. 따라서 메타가 엔비디아 기술을 자사의 Minipack3N 스위치 및 Facebook 오픈 스위칭 시스템 소프트웨어에 통합하는 것은 중요한 의미를 시사한다. 이는 엔비디아의 하드웨어가 정말 그만큼 앞서 있거나, 메타가 더 이상 AI 성능과 네트워크 설계를 별개로 취급할 수 없다고 판단했음을 의미한다.

내부 관계자들은 메타가 기존 시스템을 완전히 버리는 것은 아니라고 귀띔한다. 대신, 메타는 기존 브로드컴 인프라와 함께 스펙트럼-X를 운영하며, 선택의 폭을 열어두는 동시에 위험을 분산할 것으로 보인다.

반면 오라클의 전략은 평소의 패턴과 일치한다. 이 회사는 엔비디아와의 긴밀한 협력을 중심으로 클라우드 전략을 구축해왔다. 스펙트럼-X 도입은 파트너사들이 "기가 스케일 AI 공장"이라고 부르는 곳에 수백만 개의 GPU를 연결하도록 설계된 차세대 "베라 루빈" 아키텍처와 맥을 같이 한다. 오라클에게는 논리가 간단하다. 속도와 신뢰성이 가장 중요할 때, 통합은 언제나 모듈성을 능가한다는 것이다.


상용 칩의 반격

엔비디아의 이러한 기세는 간과되지 않았다. 인터넷의 상당 부분을 지탱하는 칩을 만드는 브로드컴은 최근 자체 이더넷 최적화 설계를 기반으로 오픈AI와 대규모 AI 네트워킹 계약을 체결했다. 시스코는 마이크로소프트와 알리바바가 이미 도입한, 대륙 간 데이터센터를 연결하는 장거리 통신용 실리콘 원 P200 칩을 적극적으로 밀고 있다.

한편, AMD, 아리스타, 브로드컴, 시스코, 인텔, 메타, 마이크로소프트 등 주요 기업들이 참여하는 울트라 이더넷 컨소시엄은 1.0 사양을 발표했다. 이들의 목표는? 고객을 특정 공급업체에 종속시키지 않으면서 엔비디아의 성능에 필적하는 것이다. 다시 말해, 이는 독점 스택에 대한 조직적인 공세이다.

판돈은 이보다 더 클 수 없다. 분석가들은 AI 데이터센터 네트워킹이 향후 5년간 스위치 매출로 800억 달러에서 1000억 달러 사이를 벌어들일 것으로 예상한다. 이더넷 속도가 800Gbps에서 1.6Tbps로 향상됨에 따라 엔비디아의 과제는 명확하다. 즉, 나머지 산업이 따라잡기 위해 경쟁하는 동안 선두를 유지하는 것이다.


성능 주장 분석

95% 대 60%의 처리량 주장은 인상적이지만, 맥락이 중요하다. 엔비디아의 수치는 이상적인 조건과 자사 장비에 맞춰 조정된 워크로드 하에서 자체 테스트 랩에서 나온 것이다. 네트워크가 혼란스럽고, 이질적이며, 예측 불가능한 실제 환경에서는 결과가 매우 다를 수 있다.

경쟁사들도 이 주장을 전적으로 신뢰하지는 않는다. 브로드컴의 Jericho4 배포에 익숙한 엔지니어들은 시스템이 적절히 튜닝되면 80%대 후반의 효율성을 달성할 수 있다고 말한다. 그들은 남아있는 격차가 하드웨어보다는 네트워크가 어떻게 아키텍처화되고 최적화되는지에 더 관련이 있다고 주장한다.

그럼에도 불구하고 엔비디아의 통합 강점은 부인할 수 없다. 네트워크 카드, 스위치, 소프트웨어 라이브러리, 혼잡 제어 기능 등 모든 것이 하나의 응집력 있는 유기체처럼 작동한다. 여러 공급업체가 협력해야 하는 개방형 생태계에서는 이를 재현하기 어렵다. 고객이 성능 향상을 위해 유연성을 덜어낼 것인지는 속도보다 자유를 얼마나 중요하게 여기는지에 달려있다.


스케일-어크로스 전략

다음 개척지는 단순히 더 큰 모델이 아니라, 모델을 분산시키는 것이다. 엔비디아의 새로운 스펙트럼-XGS 기술은 전체 데이터센터를 통합된 글로벌 훈련 클러스터로 연결하는 것을 목표로 한다. 모델이 단일 사이트에 비해 너무 커지고, 전력 소모가 큰 GPU 팜이 지역별로 저렴한 에너지를 찾아 이동함에 따라, 대륙 간 훈련을 조정하는 능력은 매우 중요해진다.

여기서 엔비디아는 시스코와 정면으로 맞붙는다. 시스코의 딥 버퍼 실리콘은 장거리 AI 트래픽에 최적화되어 있다. 이 싸움은 단순한 사양으로 결정되는 것이 아니라, 각 플랫폼이 분산 훈련 작업에서 발생하는 지연 시간과 오류를 얼마나 잘 처리하는지에 따라 결정될 것이다. 수천 마일 떨어진 곳에서 GPU를 동기화할 때, 작은 문제 하나라도 전체 작업을 망칠 수 있다.


투자 관점과 미래 신호

투자자와 분석가들에게 사업적인 관점은 명확하다. 네트워킹은 엔비디아의 다음 대규모 수익 엔진이 될 수 있다. 스위치 자체 외에도 네트워크 카드, 광학 부품, 그리고 이 모든 것을 연결하는 소프트웨어에서도 수익을 창출할 수 있다. 분석가들은 엔비디아가 AI 이더넷 시장의 10~20%만 점유하더라도 2027년까지 연간 수십억 달러 초반의 매출을 올릴 수 있으며, 30%대 중반의 높은 마진을 기록할 것으로 예상한다.

그러나 경쟁은 빠르게 가열되고 있다. 브로드컴의 오픈AI 파트너십은 상용 칩이 여전히 중요함을 증명한다. 울트라 이더넷 컨소시엄의 개방형 표준 추진은 성능 동등성이 달성될 경우 향후 2~3년 내에 엔비디아의 가격 결정력을 압박할 수 있다. 역사적으로 메타와 같은 하이퍼스케일러들은 여러 공급원으로부터 구매하는 것을 선호하며, 이는 그들이 백업 계획 없이 엔비디아에 전권을 넘겨주지 않을 것임을 시사한다.

장비 제조업체들에게 미치는 파급 효과는 다양하다. 엔비디아 하드웨어가 아리스타 네트웍스의 영역과 겹치면서 아리스타 네트웍스는 가장 큰 위협에 직면해 있다. 시스코는 장거리 연결 분야에서 틈새시장을 찾을 수 있지만, 빠르게 움직여야 할 것이다. 브로드컴은 특정 AI 분야에서 점유율을 일부 잃더라도, 다양한 고객 기반 덕분에 여전히 회복력을 유지할 것이다.

주요 관전 포인트는 다음과 같다. 메타와 오라클의 실제 배포 성과, 1.6테라비트 광학 부품 수요 변화, 그리고 규제 당국이 엔비디아의 커지는 생태계 지배력에 의문을 제기하기 시작할지 여부이다.

그리고 항상 그렇듯이 투자자들은 과거 실적이 미래를 보장하지 않는다는 점을 기억해야 한다. 반도체 네트워킹 시장은 기술 도약, 경쟁적 변화, 표준 변화에 의해 빠르게 움직인다. 정보를 파악하고 분산 투자를 하는 것은 단지 현명한 것이 아니라 필수적이다.


열린 질문

결론적으로 핵심 딜레마는 여전히 남아있다. AI 인프라가 마지막 한 방울의 성능까지 추구하는 긴밀하게 통합된 플랫폼을 중심으로 통합될 것인가? 아니면 개방적이고 분산적이며 경쟁적인 상태를 유지할 것인가?

월요일의 발표는 추를 통합 쪽으로 밀어붙였지만, 동시에 개방형 표준 진영에 불을 지폈다. 양측 모두 이 경쟁이 단순히 속도에 관한 것이 아니라, AI 시대의 아키텍처 자체를 누가 통제하느냐에 달려 있음을 알고 있다.

메타와 오라클이 앞으로 무엇을 구축할지, 그리고 대안에 대한 문을 열어둘지 여부가 이 새로운 기가 스케일 지능 시대에 어떤 비전이 승리할지를 알려줄 것이다.

투자 조언 아님

당신도 좋아할지도 모릅니다

이 기사는 사용자가 뉴스 제출 규칙 및 지침에 따라 제출한 것입니다. 표지 사진은 설명을 위한 컴퓨터 생성 아트일 뿐이며 실제 내용을 나타내지 않습니다. 이 기사가 저작권을 침해한다고 생각되면, 우리에게 이메일을 보내 신고해 주십시오. 당신의 경계심과 협력은 우리가 예의 바르고 법적으로 준수하는 커뮤니티를 유지하는 데 중요합니다.

뉴스레터 구독하기

최신 기업 비즈니스 및 기술 정보를 독점적으로 엿보며 새로운 오퍼링을 확인하세요

저희 웹사이트는 특정 기능을 활성화하고, 더 관련성 있는 정보를 제공하며, 귀하의 웹사이트 경험을 최적화하기 위해 쿠키를 사용합니다. 자세한 정보는 저희의 개인정보 보호 정책 서비스 약관 에서 확인하실 수 있습니다. 필수 정보는 법적 고지