Stability AI, 텍스트 설명으로 음향 효과를 만드는 Stable Audio Open 출시
Stable Diffusion AI 이미지 생성기로 알려진 Stability AI가 텍스트 설명으로 오디오 샘플과 음향 효과를 만들어내는 AI 모델 Stable Audio Open을 출시했습니다. 이 혁신적인 도구는 사운드 디자이너와 음악가들을 대상으로 하며, 최대 47초의 고품질 오디오 클립을 만들어냅니다. 드럼 비트, 악기 리프, 그리고 주변 음향 등을 포함합니다. 전곡 생성에 특화된 상용 모델 Stable Audio 2와 달리, Stable Audio Open은 더 짧은 오디오 요소 생성에 초점을 맞추고 있습니다. 사용자들은 Hugging Face에서 제공되는 자신의 오디오 데이터를 활용해 모델을 개인화하고 개선할 수 있으며, 이는 커뮤니티 참여와 책임감 있는 AI 개발을 강조합니다.
핵심 요약
- Stability AI가 텍스트 설명으로 오디오 샘플을 생성하는 무료 오픈소스 AI 모델 Stable Audio Open을 출시했습니다.
- 이 모델은 최대 47초의 고품질 오디오 클립을 생성할 수 있으며, 다양한 음향 효과와 짧은 음악 세그먼트 제작에 활용할 수 있습니다.
- 사용자는 Hugging Face에서 모델을 다운로드하고 자신의 오디오 데이터로 커스터마이징할 수 있어, 커뮤니티의 참여가 중요합니다.
- 상용 버전인 Stable Audio 2와 달리, 이 모델은 더 짧은 오디오 샘플과 음향 효과 생성에 초점을 맞추고 있습니다.
- Stability AI는 FreeSound와 Free Music Archive의 오디오 데이터를 활용하여 사운드 디자인 분야에서 책임감 있는 AI 개발을 추구하고 있습니다.