바이트댄스, 영상 제작의 판도를 뒤집다
2025년 10월 24일, 베이징 – 바이트댄스가 또 한 번 세상을 놀라게 할 만한 것을 공개했다. 이들의 볼케이노 엔진(Volcano Engine) 사업부가 선보인 새로운 AI 영상 모델은 너무나 빠르고 엄청나게 저렴하여, 사실상 영상 제작의 규칙을 다시 쓰고 있다. 이는 단순한 업그레이드를 넘어선 혁신이다. 정식 명칭은 '더우바오 비디오 생성 모델 1.0 프로 패스트(Doubao Video Generation Model 1.0 Pro Fast)'이며, 기술명으로는 '시댄스-1-프로-패스트(seedance-1-pro-fast)'로 불린다. 이 모델은 영상 제작의 두 가지 가장 큰 골칫거리인 시간과 비용을 정면으로 겨냥하고 있다.
이 수치들은 믿기 어려울 정도로 좋다. 생성 속도는 3배 빨라졌고, 가격은 무려 72% 인하되었다. 이제 5초 길이의 1080p 영상 클립 하나를 약 1.03위안(미화 약 14센트, 한화 약 190원대)에 만들 수 있다. 한때는 전문적이고 값비싼 도구였던 것이, 이제는 누구나 하루 종일 부담 없이 사용할 수 있는 수준이 된 것이다.
정말 놀라운 부분은 여기부터다. 예전에는 1만 위안(약 1,370달러, 한화 약 188만원)으로 괜찮은 클립 몇 개를 얻을 수 있었다면, 이제는 같은 예산으로 9,709개의 짧은 영상을 만들 수 있다. 5초짜리 720p 장면 아이디어가 떠올랐는가? 입력만 하면 약 10초 만에 렌더링되는 것을 볼 수 있다.
회사는 자신들의 야심을 숨기지 않았다. 성명서에는 "이는 창작 방정식의 근본적인 변화"라고 명시되어 있다. 이들의 전체적인 철학은 '더 빠르고(faster), 더 저렴하며(cheaper), 더 나은(better)' 세 단어로 요약된다.
물론 보도자료는 흔한 기술 과장처럼 들릴 수 있다. 하지만 더 깊이 들여다보면 흥미로운 점을 발견할 수 있다. 이 모델을 실제로 사용해본 엔지니어들은 다른 이야기를 들려준다. 나쁘다는 것이 아니라, 더 현실적인 관점이다. 그들은 이 모델을 한계까지 몰아붙여왔고, 그들의 평가는 많은 것을 시사한다.
새로운 모델은 Relicate에서 사용해볼 수 있다.
실제로 뛰어난 점
이 '패스트(Fast)' 버전은 이전 모델인 '시댄스 1.0 프로(Seedance 1.0 Pro)'를 기반으로 한다. 인상적인 기능들을 물려받았는데, 프롬프트를 정확히 따르고 다중 샷 시퀀스를 안정적으로 처리한다. 표정이나 질감 같은 세부 사항도 놀라울 정도로 잘 구현한다.
볼케이노 엔진은 자사 모델을 '베오 3.0 패스트(Veo 3.0 Fast)'와 같은 경쟁사 모델과 비교한 벤치마크 데이터를 공개했다. 전문가들이 선호하는 결과물을 선택하는 블라인드 테스트에서 시댄스 1.0 프로 패스트는 GSB 비율 +19.0%를 기록했다. 이는 사람들이 베오의 결과물보다 시댄스 모델의 결과물을 약 5분의 1 더 자주 선호했다는 의미다.
하지만 ctol.digital의 관계자들은 이 모델을 실제 환경에서 집중적으로 테스트해왔다. 그들의 평가는 마케팅 팀이 작성한 내용과는 다소 거리가 있다. 한 엔지니어는 "이 모델은 빠른 반복 작업이 필요한 팀을 위한 것"이라고 단호하게 말했다. 그들이 이 모델을 싫어한다는 오해는 없길 바란다. 하지만 이 모델이 실제로 뛰어난 점에 대해서는 분명히 밝히고 있다. "품질, 속도, 비용 사이의 정말 좋은 균형점"이라는 것이다.
이 균형이 이 제품 전체를 정의한다. 이 모델로 다음 픽사(Pixar) 영화를 만들 수는 없을 것이다. 대신, 전속력으로 돌아가는 초안 작성 기계라고 생각하라.
한 크리에이터는 이를 명확하게 설명했다. "5초짜리 480p 영상 렌더링에 실질적으로 약 15초가 걸린다." 이는 '패스트'라는 이름에 완벽하게 부합한다. 그들이 권장하는 작업 방식은 전적으로 합리적이다. 아이디어를 테스트하고, 다양한 프롬프트를 시도하며, 구도와 움직임을 실험할 때 프로 패스트를 사용하라. 그리고 효과적인 것을 확정했다면, 더 강력한 도구로 최종 버전을 렌더링하면 된다.
아무도 광고하지 않는 단점
속도와 절약에는 대가가 따른다. 엔지니어링 팀의 분석에 따르면 알아두어야 할 몇 가지 실질적인 한계가 있다. 이 모델은 주로 3초에서 10초 사이의 짧은 클립에 적합하다. 스토리보드 스타일의 시퀀스는 훌륭하게 처리하지만, 긴 내러티브를 위해 설계되지는 않았다.
접근성 또한 또 다른 문제로 작용한다. 이 모델은 다양한 타사 호스트와 특정 플랫폼에 분산되어 있다. 이러한 파편화는 API 문제와 잠재적인 지역적 제한을 야기한다. 일부 사용자들은 자신이 어떤 버전을 사용하고 있는지 혼란스러워하기도 했다. 엔지니어들은 "복제품을 피하기 위해 '시댄스-1-프로-패스트'라고 명확히 표기된 신뢰할 수 있는 공급업체를 선택하라"고 팀들에게 경고하기 시작했다.
직접적인 비교 테스트에서는 추가적인 약점들도 드러났다. 움직임 안정성과 가치 측면에서 뛰어났지만, 일부 테스트에서는 특정 텍스트-투-비디오 작업에서 베오 3 패스트(Veo 3 Fast)에 뒤처지는 모습을 보였다. 오디오 관련 작업이나 립싱크는 이 모델의 강점이 아니다.
ctol.digital 팀은 이를 완벽하게 요약했다. "이것은 경주마가 아니라 일꾼이다." 그들은 이 모델이 애니메이션 컨셉의 프로토타입 제작, 스토리보드 구성, 그리고 플랫폼 규모의 콘텐츠를 대량 생산하는 데 이상적이라고 본다. 쇼릴(showreel)을 위한 것이 아니라, 일상적인 작업을 위해 만들어졌다.
실제로 누가 이득을 얻는가?
제품 관리자와 마케팅 팀은 엄청난 선물을 받았다. 이제 6개월 전만 해도 상상에 불과했던 규모로 영상 컨셉을 A/B 테스트할 수 있게 되었다. '게시하지 않으면 사라진다(publish-or-perish)'는 식의 오늘날 경쟁적인 환경에서 고군분투하는 짧은 영상 크리에이터들에게 프로 패스트는 필수적인 도구가 될 것이다. 예산 초과나 과도한 노력 없이 매일 콘텐츠를 대량 생산할 수 있다.
특히 중소기업들은 큰 이점을 얻을 수 있다. 꾸준한 영상 마케팅은 한때 엄청난 비용이 들었지만, 이제는 빠듯한 예산으로도 경제적으로 실행 가능하다.
볼케이노 엔진의 더우바오 비디오 생성 모델 1.0 프로 패스트 출시는 단순한 제품 발표가 아니다. 이는 AI 군비 경쟁에서 선전포고와 같다. 회사는 영상 생성이 더 이상 특별한 이벤트가 아니라, 전기처럼 끊임없이 흐르는 상시적인 유틸리티가 될 것이라고 확신하고 있다.
가혹한 경제적 장벽을 정면으로 돌파함으로써, 볼케이노 엔진은 단순히 더 빠른 무언가를 만든 것이 아니다. 그들은 전체 창작 산업을 위한 새로운 기반을 구축했다. 이제 고용량 영상 제작은 사실상 모든 사람에게 접근 가능해졌다.
질문 자체가 완전히 바뀌었다. 더 이상 'AI가 매력적인 영상을 만들 수 있는가?'를 묻는 이는 없다. 이제 우리는 전 세계 크리에이터들이 아침 커피를 내리는 시간보다 빠르게 작동하는 이 도구에 어떻게 적응해 나갈지 지켜보고 있다.
