카카오모빌리티의 자율주행 ‘AI 학습용 데이터셋’ /카카오모빌리티 제공
카카오모빌리티의 자율주행 ‘AI 학습용 데이터셋’ /카카오모빌리티 제공

카카오모빌리티가 과학기술정보통신부와 자율주행기술개발혁신사업단의 ‘자율주행 기술개발 혁신사업’ 국책과제의 하나로 구축한 ‘AI 학습용 자율주행 데이터셋’을 공개했다.

카카오모빌리티는 레벨4 자율주행 구현을 위한 해당 사업에 참여해 차량, 엣지-인프라, 지능학습을 연계해 융합형 자율주행 데이터의 생성·관리·배포 자동화 기술 개발을 완료했다. 국내 도로 환경에서 구축한 비식별화된 AI 학습용 데이터셋을 일반에 공개하면서, 저작권 문제없이 누구나 자유롭게 자율주행 연구개발에 활용할 수 있게 됐다.

그동안 자율주행을 연구하는 소규모 기업이나 학계, 연구계에서는 막대한 비용과 시간이 소요돼 라이다·레이더·카메라 센서로 자율주행 데이터를 직접 확보하기 어려웠다. 또 이미 공개된 데이터셋은 대부분 해외지역이나 특정 시간대에 수집돼 국내 실정에 맞는 연구개발에 한계가 있었다.

카카오모빌리티의 자율주행 ‘AI 학습용 데이터셋’ /카카오모빌리티 제공
카카오모빌리티의 자율주행 ‘AI 학습용 데이터셋’ /카카오모빌리티 제공

카카오모빌리티가 이번에 공개한 데이터셋은 국내 주요 도로변에 설치된 라이다·카메라 센서 등 엣지-인프라와 카카오모빌리티가 직접 운영한 자율주행차를 통해 획득했다. 사람, 차량, 자전거 등 움직이는 3D 동적 객체와 신호등, 표지판 등 2D 정적 객체를 인지·판단할 수 있는 10개 유형의 15만건으로 구성된 데이터셋이다.

특히 해당 데이터는 도로타입, 시간, 날씨 등 총 31개 카테고리의 다양한 환경 조건에서 수집됐으며, 라이다 센서를 통해 취득한 포인트클라우드의 좌표값은 물론 사람, 사물 등 개체 속성을 구분할 수 있는 세분화 데이터도 포함돼 활용 가치가 높을 것으로 예상된다.

장성욱 카카오모빌리티 미래이동연구소장은 “이번 데이터셋 공개가 국내 자율주행 기술의 상용화와 발전을 앞당기는 초석이 되길 기대한다”며 “앞으로도 다양한 공공 및 민간기업과 협력하여 자율주행 기술 혁신과 공공 데이터 활용 확대에 앞장서겠다”고 밝혔다.

‘AI 학습용 자율주행 데이터셋’은 한국전자통신연구원(ETRI) ‘AI 나눔’에서 공개된다.

/구민주기자 kumj@kyeongin.com