딥시크의 새로운 AI 모델 V3.1-터미너스, 복합 추론에서 구글 제미니 압도, 비용은 40배 저렴

딥시크의 V3.1-터미너스, AI 추론 능력의 강자로 부상

중국 AI 개발사의 최신 모델, 복잡한 추론 작업에서 상당한 진전을 보여주며 기업 AI 도입 환경을 재편할 수 있는 공격적인 가격 전략 유지

딥시크는 2025년 9월 22일 V3.1-터미너스를 공개하며, 중국 AI 기업의 하이브리드 모델 아키텍처에 상당한 발전을 이루었다. 업계 전문가들은 이 모델이 더 유능한 추론 시스템으로의 전 세계적인 전환을 가속화할 수 있다고 보고 있다. 이 개선된 모델은 툴 기반 작업에서 놀라운 향상을 보였으며, 이미 서구 경쟁사들을 압박하고 있는 딥시크의 파괴적인 저가 정책을 유지하고 있다.

DeepSeek

획기적인 성능 지표, 새로운 경쟁 구도 예고

초기 벤치마킹 결과, V3.1-터미너스는 복잡한 추론 능력에서 극적인 도약을 이루어 HLE(고급 전문성) 점수가 15.9점에서 21.7점으로 상승했다. 이는 구글의 Gemini 2.5 Pro를 능가하며, 전 세계적으로 OpenAI의 GPT-5(25.32점)에 이어 두 번째로 높은 성능을 자랑하는 시스템으로 자리매김했다.

가장 큰 성과는 툴 활용 시나리오에서 나타났다. BrowseComp 점수는 30.0점에서 38.5점으로 올랐고, Terminal-bench 성능은 31.3점에서 36.7점으로 향상되었다. 이러한 개선은 다단계 웹 검색 및 복잡한 에이전트 기반 작업에서 향상된 능력을 반영하며, 이는 중요한 기업 활용 사례를 대변한다.

하지만 최적화 과정에서 흥미로운 상충 관계가 드러났다. 영어 웹 브라우징 성능은 상당히 향상되었지만, 중국어 웹 브라우징은 49.2점에서 45.0점으로 소폭 하락했다. 기술 분석가들은 이를 딥시크가 이전에 더 넓은 쿼리 해석을 통해 의도치 않은 검색 이점을 제공했던 언어 혼합 문제를 해결한 결과로 보고 있다.

신경-상징 통합을 통한 아키텍처 혁신

이 모델의 향상된 성능은 부분적으로 지식 상호작용 프로토콜(Knowledge Interaction Protocol, KIP)과의 통합에서 비롯된다. KIP는 현재 대규모 언어 모델 아키텍처의 근본적인 한계를 해결하는 새로운 프레임워크다. 기존의 벡터 데이터베이스나 키-값 저장소와 달리, KIP는 개념과 명제가 상호 연결된 노드와 관계로 존재하는 그래프 기반 설계 원칙을 사용한다.

우리 CTOL 엔지니어링 팀의 한 팀원은 이 시스템을 "잊어버리는 천재에서 지식 있는 파트너로의 근본적인 전환"이라고 묘사하며, 프로토콜이 상호작용 전반에 걸쳐 구조화되고 지속적인 메모리를 유지할 수 있는 능력을 강조했다. 이 프레임워크는 원자적이고 멱등적인 단위인 지식 캡슐을 도입하여, 이전에는 생산 AI 시스템에서 사용할 수 없었던 분산 지식 공유 및 버전 관리 기능을 가능하게 한다.

이 프로토콜의 자가 부트스트랩 아키텍처는 스키마가 그래프 구조 내에서 자체적으로 진화하도록 허용하여, 외부 인프라 종속성 없이 지속적인 학습을 가능하게 할 수 있다. 초기 구현 결과에 따르면, 이는 AI 에이전트를 정적 프로그램에서 교차 도메인 추론 및 협력적 지식 개발이 가능한 동적으로 진화하는 시스템으로 변화시킬 수 있음을 시사한다.

가격 전략, 서구 모델에 대한 경쟁 압력 유지

딥시크는 100만 출력 토큰당 1.68달러라는 공격적인 가격 구조를 유지했는데, 이는 100만 토큰당 75.00달러에 달하는 GPT-5 및 Claude Opus 4.1 요금보다 현저히 낮은 수준이다. API는 정교한 캐싱 메커니즘을 구현하여, 캐시 히트 시 100만 토큰당 0.07달러, 캐시 미스 시 0.56달러를 부과함으로써 반복적인 작업을 포함하는 기업 배포를 위한 비용 효율성을 창출한다.

이러한 가격 책정 방식은 중국 AI 생태계 내에서 더 넓은 전략적 위치를 반영한다. 중국 AI 생태계에서는 국가 지원이 서구 경쟁사들이 이윤을 유지하면서 따라잡기 어려운 공격적인 시장 침투 전략을 가능하게 한다. 이 모델은 중국 AI 시스템에 일반적인 국가 검열 요구 사항을 계속 준수해야 하므로, 민감한 기업 환경에서의 도입은 제한될 수 있지만 일반적인 비즈니스 애플리케이션의 접근성을 확대한다.

기술 아키텍처, 전략적 설계 결정 드러내

V3.1-터미너스는 딥시크가 8월에 도입한 듀얼 모드 아키텍처를 기반으로 하며, 다양한 작업 범주에 최적화된 별도의 "사고(思考)" 및 "비사고(非思考)" 운영 모드를 유지한다. 사고 모드는 다단계 추론을 요구하는 복잡한 툴 기반 작업을 처리하는 반면, 비사고 모드는 간단한 대화형 상호작용을 관리한다.

두 모드 모두 업데이트된 토크나이저와 프롬프트 템플릿을 사용하여 추가 8,400억 토큰으로 훈련된 128,000 토큰까지 확장되는 컨텍스트 창을 지원한다. 이러한 훈련 방식은 완전한 아키텍처 재정비보다는 반복적인 개선이라는 딥시크의 방법론을 반영하며, 시스템 안정성을 유지하면서 신속한 배포를 가능하게 한다.

앱, 웹 및 API 인터페이스를 포함한 다양한 플랫폼에서 모델을 사용할 수 있으며, MIT 라이선스 하에 Hugging Face를 통해 오픈소스 가중치가 배포되는 것은 딥시크가 광범위한 접근성과 개발자 채택에 전념하고 있음을 보여준다.

딥시크가 차세대 대규모 언어 모델 공개를 준비하는 가운데, V3.1-터미너스는 현 세대의 설득력 있는 결론을 제시한다. 이 모델의 추론 작업에서의 획기적인 성능은 하이브리드 신경-상징 아키텍처 및 파괴적인 가격 전략과 결합하여, 기업이 생산 AI 시스템에서 기대할 수 있는 새로운 기준을 정립한다. 업계 관측통들은 V3.1-터미너스가 딥시크의 다가오는 출시가 경쟁 환경을 다시 한번 재정의하기 전에 이 세대 역량의 확실한 선언문 역할을 할 수 있다고 제안하며, 이는 AI 발전의 빠른 속도가 산업이 다음 진화적 도약을 준비하는 동안 둔화될 기미를 보이지 않는다는 것을 시사한다.

이 분석은 현재 시장 데이터와 확립된 성능 지표를 기반으로 합니다. 투자 결정 시에는 지정학적 요인, 규제 개발 및 개별 조직 요구 사항을 고려해야 합니다. 독자들은 개인화된 투자 지도를 위해 자격을 갖춘 금융 자문가와 상담해야 합니다.