바이트댄스, 몇 번의 시연만으로 로봇에게 새 작업 가르치는 GR-3 AI 공개

작성자
CTOL Writers - Lang Wang
7 분 독서

바이트댄스, 로봇의 한계를 재정의할 AI "두뇌" GR-3 공개

바이트댄스 연구진은 로봇이 전례 없는 적응성과 손재주로 복잡한 작업을 수행할 수 있도록 하는 정교한 시각-언어-행동 모델인 GR-3를 공개했습니다. 이 시스템은 자연어 명령을 이해하고 낯선 상황에 능력을 일반화할 수 있는 기계를 만드는 데 있어 중요한 진전을 나타내며, 이는 오랫동안 이 분야의 숙원이었습니다.

미래 기계 손의 실리콘 두뇌

본질적으로 GR-3는 보고, 이해하고, 행동하는 것 사이의 간극을 메우기 위해 설계된 40억 매개변수 AI 시스템입니다. 통제된 환경에서 특정 작업을 위해 프로그래밍된 기존 로봇과 달리, 바이트댄스의 이 기술은 최소한의 추가 훈련만으로 새로운 물체와 환경에 적응할 수 있습니다.

이 시스템은 독특한 구형 손목 디자인으로 인간과 유사한 손재주를 가능하게 하는 특수 제작 양팔 모바일 로봇인 바이트미니(ByteMini)를 구동합니다. 시연에서 이 조합은 낯선 물체를 집는 것부터 예측 불가능하고 변형 가능한 재료를 섬세하게 다뤄야 하는 악명 높은 빨래 건조대에 옷 걸기 작업에 이르기까지 다양한 난제를 성공적으로 해결했습니다.

이 기술에 정통한 한 AI 연구원은 "이러한 발전이 특히 주목할 만한 점은 시스템이 학습하는 효율성입니다. 이전 접근 방식은 각 새로운 시나리오에 대해 광범위한 재훈련을 필요로 했지만, GR-3는 단 10번의 인간 안내 시연만으로 새로운 물체에 적응할 수 있습니다."라고 언급했습니다.

삼중 학습: GR-3 적응성의 비법

바이트댄스의 혁신은 시스템이 무엇을 할 수 있는지뿐만 아니라, 어떻게 그것을 배웠는지에 있습니다. GR-3의 능력은 세 가지 개별 데이터 소스를 결합한 통합 훈련 접근 방식에서 비롯되었는데, 이는 여러 로봇 공학 전문가들이 일반 로봇을 만들려는 이전 시도에서 "빠진 조각"이라고 묘사하는 방식입니다.

이 시스템은 웹 규모의 시각-언어 데이터(ChatGPT 및 DALL-E가 텍스트와 이미지로부터 학습하는 방식과 유사), 101시간 분량의 로봇 원격 조작 궤적, 그리고 가장 중요하게는 VR 기기를 통해 캡처된 비교적 작은 인간 움직임 데이터셋을 함께 훈련하여 만들어졌습니다.

이러한 삼중 모달 접근 방식은 이 분야의 가장 지속적인 병목 현상 중 하나인, 상상할 수 있는 모든 시나리오에 대한 로봇 훈련 데이터를 수집하는 데 필요한 엄청난 비용과 시간을 해결합니다. 바이트댄스 연구진은 가상 현실에서 캡처된 인간 시연을 활용함으로써 로봇이 새로운 상황을 처리하는 능력을 획기적으로 가속화할 수 있음을 발견했습니다.

추상적 명령에서 실제 행동으로

테스트에서 GR-3는 "촉수가 있는 동물을 상자에 넣어라" 또는 "가장 큰 물체를 상자에 넣어라"와 같이 단순히 물체 인식이 아니라 개념적 이해가 필요한 추상적인 명령을 따르는 놀라운 능력을 보여주었습니다.

이 시스템은 본 적 없는 물체에 대한 추상적인 명령을 따르는 데 있어 이전 최첨단 모델의 40%에 불과했던 성공률과 비교하여 77%의 성공률을 달성했습니다. 이는 GR-3가 이전에 본 행동을 단순히 모방하는 것이 아니라, 언어, 시각적 인식, 물리적 조작 간의 관계를 진정으로 이해하고 있음을 시사합니다.

기존 시스템을 압도하는 복잡성 처리

아마도 가장 인상적인 점은 GR-3가 확장된 다단계 작업에서 보여준 성능일 것입니다. 로봇이 어수선한 식기, 음식물, 용기를 치워야 하는 식탁 정리 시나리오에서 GR-3는 특정 지시를 따를 때 97.5%의 작업 완료율을 달성했습니다.

더욱 주목할 만한 점은 예측 불가능한 직물의 특성 때문에 로봇 공학에서 악명 높은 난제인 의류를 처리하는 능력이었습니다. 주로 긴 소매 의류로 훈련되었음에도 불구하고, 이 시스템은 반팔 티셔츠도 성공적으로 조작하여 좁은 전문화가 아닌 진정한 일반화를 보여주었습니다.

한 업계 분석가는 "단단한 물체를 다루는 것에서 천을 조작하는 것으로의 도약은 능력 면에서 비약적인 발전을 의미합니다. 직물 조작은 가정 환경에서 작동하는 로봇에게 일종의 최종 개척지였습니다."라고 언급했습니다.

시장에 미치는 영향: 연구실을 넘어 세상으로

바이트댄스의 발전은 로봇 산업의 중요한 시점에 등장했습니다. 의료부터 숙박업, 제조업에 이르기까지 여러 부문에서 노동력 부족 현상이 심화되면서, 적응 가능하고 지시를 따르는 로봇 시장은 그 어느 때보다 유망해졌습니다.

분석가들은 GR-

당신도 좋아할지도 모릅니다

이 기사는 사용자가 뉴스 제출 규칙 및 지침에 따라 제출한 것입니다. 표지 사진은 설명을 위한 컴퓨터 생성 아트일 뿐이며 실제 내용을 나타내지 않습니다. 이 기사가 저작권을 침해한다고 생각되면, 우리에게 이메일을 보내 신고해 주십시오. 당신의 경계심과 협력은 우리가 예의 바르고 법적으로 준수하는 커뮤니티를 유지하는 데 중요합니다.

뉴스레터 구독하기

최신 기업 비즈니스 및 기술 정보를 독점적으로 엿보며 새로운 오퍼링을 확인하세요

저희 웹사이트는 특정 기능을 활성화하고, 더 관련성 있는 정보를 제공하며, 귀하의 웹사이트 경험을 최적화하기 위해 쿠키를 사용합니다. 자세한 정보는 저희의 개인정보 보호 정책 서비스 약관 에서 확인하실 수 있습니다. 필수 정보는 법적 고지