반응형

아지봇

 

중국 기업들의 휴머노이드 기술이 빠르게 발전하고 있다. VLA(Vision-Language-Action)와 같은 최신 로봇용 AI 기술을 신속하게 도입하는 동시에 AI 개발에 필요한 학습용 데이터를 꾸준히 축적한 덕분이다. 아지봇(AgiBot Innovation Technology)은 자사 발전의 토대인 내재화된 데이터 세트를 적극적으로 개방하고 있다. 관련 생태계를 구축하고 구심점 역할을 확보해서 휴머노이드 관련 솔루션 기업으로의 발전을 꾀하고 있다.

휴머노이드 개발을 가속화하는 AI와 데이터

대부분의 중국 휴머노이드 기업들은 원천 기술 고도화보다 응용 기술 개발에 집중해서 빠른 상용화를 추구하고 있다. 적당한 성능의 휴머노이드를 경쟁사들보다 먼저 출시해서 고객 접점을 늘리고, 고객의 피드백을 신속하게 반영해서 제품을 업그레이드하는 게 원천 기술을 내재화하는 것보다 유리하다고 보는 것이다. 그래서 중국 휴머노이드 기업들은 새로운 개발보다 VLA와 같이 빅테크들이 소개한 최신 로봇용 AI를 자사 로봇에 맞춤형으로 개발하고, 이 과정에서 필요한 학습용 데이터 세트의 축적에 주력하고 있다. 그런데 이런 시장의 관행을 거슬러 데이터를 내재화하기보다 오히려 개방해서 차별적인 경쟁력을 확보하려는 기업이 시장의 주목을 받고 있다.

데이터 축적에 진심인 아지봇

아지봇은 고품질의 데이터 세트 아지봇 월드(Agibot World)를 데이터가 필요한 로봇 기업들에 적극적으로 개방하고 있다. 2025년 3월 기준 최신 버전의 아지봇 월드는 217개 작업, 100만 개 이상의 궤적 데이터로 구성된 대규모 데이터 세트이다. 아지봇 월드의 데이터는 다중 카메라 뷰, 깊이 정보, 카메라 보정, 전체 작업과 하위 작업에 대한 언어 주석 등을 포함하고 있어 로봇용 AI의 다양한 학습을 촉진할 수 있다. 

 

아지봇 월드는 종종 AI 학습용 데이터 공유의 첫 사례인 구글의 OWE(Open X Embodiment) 데이터 세트와 비교되기도 한다. 구글의 OWE는 로봇용 AI의 개발을 촉진하기 위해 구글과 전 세계 20여 개의 연구기관들이 각자 수집한 AI 학습용 데이터를 한데 모아서 상호 호환 가능한 포맷으로 정리한 데이터 세트인 반면, 아지봇 월드는 자체 역량과 설비로 축적한 데이터 세트라서 수집 과정에서부터 다르다. 

 

아지봇은 대규모 데이터를 수집하기 위해 소규모 실험실과 차원이 다른 데이터 수집 시설인 AIDEA 기가 데이터 팩토리를 구축했다. 4000㎡ 규모의 대규모 시설에는 산업 현장, 음식점, 물류, 가정, 소매점, 사무실 등 5가지의 작업 환경을 모방한 구역이 설치되어 있다. 예를 들어 가정 구역에는 침실, 주방, 거실, 발코니가 포함되어 있고 소매점 구역에는 진열대와 농산물 코너가 재현되어 있다. 산업 현장, 음식점, 사무실 환경도 실제 현장과 동일한 조건으로 만들어져서 휴머노이드가 실제 환경에서 마주칠 수 있는 다양한 상황을 재현할 수 있게 만들어져 있다.

정교함·실용성·고품질을 특징으로 한 아지봇 월드

아지봇은 100여 대의 휴머노이드 G1을 이용해서 학습용 데이터를 수집한다. 아지봇이 자체 제작한 휴머노이드 G1은 머리, 손목, 후면부 등에 장착된 총 8개의 카메라로 작업 대상 및 로봇 주변의 시각 정보와 관절, 엔드 이펙터의 위치 등의 데이터를 수집한다. G1은 다양한 동작 데이터를 수집할 수 있도록 작업 대상에 맞춰 다양한 엔드 이펙터를 교체할 수 있다. G1의 엔드 이펙터는 사람의 양손 조작과 유사한 동작을 할 수 있는 6 자유도의 정교한 손에서부터 표준형 그리퍼, 촉각 센서 장착형 그리퍼 등을 구비하고 있다. G1의 원격제어 방식은 작업 복잡성에 따라 2가지로 나뉜다. VR 헤드셋을 이용한 원격제어는 손 동작을 엔드 이펙터의 변환으로 연결하고 조종기로 로봇 몸체의 움직임을 제어한다. 더 정교한 제어가 필요하면 모션 캡처 시스템을 사용해 손가락을 포함한 각 관절의 데이터를 실시간으로 기록해서 로봇이 취한 동작으로 해석한다. 이 시스템은 각 손가락의 움직임, 자세, 머리 방향까지 포함한 미세한 제어까지 수행할 수 있다. 

 

아지봇 월드는 음식, 가구, 의류, 전자기기 등 일상생활에서 접할 수 있는 3000가지 이상의 다양한 사물을 활용하는 데이터를 담고 있다. 아지봇은 자사의 데이터 중 80%가 보다 완전하고 연속적인 작업을 기록한 장기 동작 데이터라고 밝혔다. 일반적인 데이터가 주로 5초 이내의 짧은 동작을 담고 있는데 반해 아지봇의 장기 동작 데이터는 주로 60초 이상의 동작을 담고 있고 때로는 2분을 초과하는 경우도 있다.

 

아지봇은 업계 최초로 실패 회복 데이터라는 특이한 데이터를 체계적으로 수집하고 있다고 한다. 원격조종 과정에서 발생한 실수를 복구하는 과정에서 발생한 궤적 데이터를 폐기하는 대신, 실패 이유를 담은 설명을 주석으로 달아 실제 작업 과정에서 발생한 실수를 복구할 수 있는 동작 데이터로 활용한다. 실패 회복 데이터는 전체 데이터의 약 1%를 차지하며 차세대 로봇용 AI 모델 개발에 필수적인 요소로 활용하고 있다고 한다.

 

아지봇은 최근 업계에서 중요한 이슈로 부상한 데이터 품질 관리에 적극적이다. AI 학습용 데이터의 품질을 유지하기 위해 아지봇은 3단계 검증 과정을 운영한다. 첫 번째 단계에서는 각 작업의 실행 가능성을 검증하고 수집 표준을 확립한다. 두 번째 단계에서는 숙련된 원격 조작자들이 확립된 표준에 따라 정식 데이터 수집을 진행하고 초기 유효성 검사를 별도로 실시한다. 세 번째 단계에서는 인간참여형 검증(Human in the loop)을 실시한다. 데이터 검증팀이 사전에 정의된 로봇 학습 데이터 기준에 따라 모든 데이터를 일일이 수작업으로 검토해서 합격한 데이터에만 상세한 설명을 담은 주석과 라벨을 수작업으로 추가해 데이터화한다. 데이터의 객관성을 확보하기 위해 데이터 검증팀은 데이터 수집 과정에 직접 관여하지 않은 사람으로 구성한다고 한다. 

 

업계에서는 아지봇이 데이터 개방을 통해 협업 생태계를 구축해 장기적 관점의 솔루션 사업 기반으로 활용할 것으로 보고 있다. 실제로 아지봇 월드는 로봇용 AI 개발이 필요한 솔루션을 제공하는 엔비디아처럼 아지봇 월드라는 데이터 세트와 자체적으로 개발한 VLA 기반의 로봇용 AI GO-1, 자체 휴머노이드 G1으로 구성된 스택 개발 솔루션을 제공하고 있다. 아지봇의 데이터 개방은 로봇용 AI 산업의 새로운 사업모델이 탄생하는 사례가 가능성도 충분해 보인다.

원문기사

반응형