안양·과천 일대에 인공지능(AI) 서비스 대표 기업인 (주)스위트케이가 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 ‘2024년 초거대 AI 확산 생태계 조성사업-컴플라이언스 데이터 구축’ 수행기관에 선정됐다.
31일 스위트케이에 따르면 초거대 AI 확산 생태계 조성사업(이하 생태계 조성사업)은 국가적 차원의 고품질 대규모 AI 학습데이터 구축을 통해 거대언어모델(LLM) 등 초거대 AI 확산과 현장 수요 등에 대응해 정부 기반의 AI 산업 고도화 및 디지털 플랫폼 등을 제공하기 위한 사업으로 41개 분야 63종의 데이터가 공모됐다.
컴플라이언스 AI 데이터는 초거대 언어 모델 학습을 위한 대규모 말뭉치 및 미세조정 등을 위한 인스트럭션(Instruction) 데이터 구축 분야의 하나로, 올해 말까지 규제 체계·체크리스트·검사 보고서 등 다양한 상황 내 규정 데이터 확립을 목표로 ▲다양한 산업 군의 규제·규정 등 컴플라이언스 텍스트 데이터 300만 문장 이상 ▲인스트럭션 튜닝 데이터 40만 건 이상 등을 구축할 방침이다.
이와 관련, 지난 10일 안양 인덕원 일원에 위치한 스위트케이 AI센터에서 진행된 ‘2024년 초거대 AI 확산 생태계 조성사업-컴플라이언스 데이터 구축’ 수행을 위한 착수보고회에는 NIA측과 한국정보통신기술협회(TTA), 사업관리지원조직(PMO), 품질컨설팅사 관계자, (주)메트릭스, 한서대 산학협력단 관계자 등이 참석한 가운데, 데이터 구축 계획과 품질 목표를 공유했다. 아울러 청렴 문화 확산과 부패 척결 실천 의지를 담은 6개 실천문을 함께 낭독하며 사업의 공적 책무와 원칙 준수 의지를 피력하기도 했다.
김민철 스위트케이 대표는 “이번 사업을 통해 초거대 LLM 기반 컴플라이언스 챗봇 서비스 출시 기반을 마련하고 민원 대응 챗봇 등 실무적 사업화가 가능하다는 점에서 한국 인공지능 경쟁력 상승에 도움이 되고, 특히 신규인력 채용에 청년 일자리 창출을 우선적으로 고려해 청년들이 인공지능 데이터 구축 직무로 신규 유입될 수 있는 기회로 활용되길 기대한다”며 “사업의 성공적인 수행을 위해 최선을 다하겠다”고 포부를 밝혔다.
한편, 스위트케이는 2019년 사람동작 영상 AI 학습용 데이터 구축을 시작으로, 매년 인공지능 학습용 데이터를 구축해 왔고, 지난해에는 표차트 이미지 해석 데이터 구축 최종 평가에서 매우 우수 평가를 받기도 했다.