Deepseek V3.2, 올림픽 수준 추론 모델로 미국 기술 대기업 맹추격

중국 AI 스타트업, 올림픽 수준 추론 모델로 미국 기술 거대 기업들과의 격차 좁히다

오픈웨이트 LLM, 엘리트 수학 및 코딩 대회에서 금메달 수준의 성과 달성하며 OpenAI 및 Google의 지배력에 도전

딥시크(DeepSeek)가 OpenAI의 GPT-5 및 Google의 Gemini-3-Pro와 비견되거나 그를 능가하는 추론 능력을 보여주는 두 개의 새로운 대규모 언어 모델(LLM)을 출시했습니다. 이는 치열해지는 글로벌 AI 경쟁에서 또 하나의 이정표를 세우며, 실리콘밸리의 초기 우위가 지속 가능할지에 대한 의문을 제기합니다.

회사는 오늘 DeepSeek-V3.2-Speciale가 2025년 국제수학올림피아드, 중국수학올림피아드, 국제정보올림피아드에서 금메달 수준의 성과를 달성했다고 발표했습니다. 가장 주목할 만한 점은 이 시스템이 국제 대학생 프로그래밍 대회 월드 파이널에서 인간 경쟁자들 중 2위를 차지했다는 것입니다. 이는 AI 시스템이 고도로 전문화된 분야에서 엘리트 인간의 문제 해결 능력에 근접하거나 필적하고 있음을 시사합니다.

기술 논문을 검토했지만 공개적으로 발언할 권한이 없어 익명을 요청한 한 AI 연구원은 "중요한 것은 단순히 경쟁적인 성능 수준에 도달했다는 것이 아닙니다. 그들은 약 6천억 개의 매개변수를 사용하는 오픈소스 모델로 이를 해냈다는 점입니다. 이는 많은 경쟁사보다 작으며, 비용도 훨씬 적게 들었습니다."라고 말했습니다.

이번 출시는 확장된 추론과 실용적인 도구 사용을 결합하는 데 어려움을 겪었던 이전 AI 모델들과는 다른 양상을 보입니다. DeepSeek-V3.2는 회사가 "사고 융합(thinking fusion)"이라고 부르는 기능을 도입하여, 모델이 다단계 논리적 추론을 수행하는 동시에 외부 도구와 API를 호출할 수 있게 합니다. 회사는 이러한 기능이 업계 최초라고 주장합니다.

그러나 이 성과는 현재 AI 기술의 가능성과 한계를 모두 드러내는 중요한 단서들과 함께 제공됩니다. 초기 테스트의 사용자 피드백은 뚜렷한 차이를 보여줍니다. 모델은 수학, 논리 및 코드 생성과 같은 형식적 추론에서는 탁월하지만, 미묘한 언어 이해와 맥락적 해석에는 어려움을 겪습니다.

CTOL.digital 엔지니어링 팀의 한 멤버는 "의미론적 이해는 여전히 약합니다"라고 말했습니다. 모델은 "숨겨진 의도를 파악하는 데 어려움을 겪고" 종종 "맥락을 진정으로 이해하기보다 표면적인 키워드 매칭"에 의존합니다. 다른 사람들은 이 시스템의 수학적 능력에도 불구하고, 모국어인 복잡한 중국어 텍스트 이해력이 Google의 Gemini 및 Alibaba의 Qwen 모델을 포함한 경쟁사들에 뒤처진다고 지적했습니다.

모델의 수학적 혁신을 가능하게 하는 확장된 추론 체인은 또한 실질적인 문제들을 야기합니다. 최대 추론 능력을 위해 설계된 DeepSeek-V3.2-Speciale 버전은 복잡한 질문에 응답하는 데 몇 분이 걸릴 수 있으며, 표준 모델보다 훨씬 더 많은 계산 토큰을 소비하여, 장황한 추론이 언제 필요할지 예측할 수 없는 사용자들의 비용을 증가시킵니다.

이 기술적 접근 방식은 이전의 전문화된 AI 시스템이 작동하는 방식과 근본적으로 다릅니다. 훈련 데이터에서 단순히 패턴을 매칭하는 대신, 모델은 눈에 보이는 추론 체인을 생성하고, 결론에 도달하기 전에 여러 차원에서 작업을 확인하고 재확인합니다. 이러한 투명성은 검증 기회를 제공할 뿐만 아니라 신뢰할 수 있는 논리적 성능에 필요한 계산 오버헤드를 보여줍니다.

딥시크의 발전은 AI 산업의 변화하는 경쟁 구도 속에서 이루어지고 있습니다. 회사는 오픈소스 모델들이 OpenAI 및 Google의 독점 시스템과의 "격차를 크게 좁히고 있다"고 언급했습니다. 한편, 기술 자료와 함께 제공된 결론은 AI 생태계 자체가 통합되고 있을 수 있음을 시사합니다. "시장이 성숙하고 알리바바와 같은 대형 인터넷 기업들이 빠르게 따라잡음에 따라, LLM의 미래는 이미 대기업의 손으로 넘어갔을 수도 있다"고 결론은 말합니다.

이러한 평가는 미국 내 발전 상황과도 유사합니다. 미국에서는 OpenAI가 선두 주자로서 마이크로소프트와의 지속적인 파트너십에도 불구하고, 구글의 풍부한 자원을 가진 AI 부문으로부터의 경쟁 심화에 직면해 있습니다. 한때 극복하기 어려워 보였던 선점자의 이점은 컴퓨팅 자원, 인재, 훈련 기술이 업계 전반에 확산되면서 침식되고 있습니다.

이 모델들은 HuggingFace 및 ModelScope를 포함한 플랫폼에서 오픈소스 라이선스로 출시되었으며, 연구원과 개발자를 위한 API 접근이 가능합니다. V3.2-Speciale 모델을 위한 전문화된 API 엔드포인트는 커뮤니티 평가를 위해 12월 중순까지 계속 제공될 예정입니다.

아직 불분명한 점은 전문화된 추론 능력(경쟁 환경에서 아무리 인상적이라 할지라도)이 그러한 시스템을 진정으로 변혁적으로 만들 수 있는 일반적인 언어 이해 능력으로 이어질 수 있는지 여부입니다. 사용자 피드백은 순수한 추론 능력과 진정한 이해가 여전히 별개의 과제이며, 하나를 해결한다고 해서 다른 하나가 자동으로 해결되는 것은 아님을 시사합니다.

상업적 지배력과 맥락 이해 문제에 대한 의문에도 불구하고, 딥시크의 궤적은 이 회사가 대규모 언어 모델 연구의 최전선을 계속 이끌어갈 것임을 시사합니다. 지정학적 제약, 시장 접근 한계, 더 많은 자본을 가진 경쟁사들의 경쟁과 같은 요인들이 상업적 도달 범위를 제한할 수 있지만, 딥시크는 오픈웨이트 모델과 최고의 폐쇄형 LLM 간의 격차를 체계적으로 좁히는 선구자로 자리매김했습니다. 매번 새로운 모델을 출시할 때마다 이 회사는 최첨단 AI 기능이 독점적인 장벽 뒤에 갇혀 있을 필요가 없음을 보여줍니다. 이러한 철학은 많은 연구자들이 딥시크를 LLM 분야의 등대라고 여기게 만들었으며, 상업적 환경이 점점 더 혼잡하고 경쟁이 치열해지는 가운데서도 나아갈 길을 밝히고 있습니다.

Deepseek V3.2, 올림픽 수준 추론 모델로 미국 기술 대기업 맹추격

중국 AI 스타트업, 올림픽 수준 추론 모델로 미국 기술 거대 기업들과의 격차 좁히다

당신도 좋아할지도 모릅니다

뉴스레터 구독하기