데이터 AI 학습용 데이터 190종 추가 개방…총 381종으로 늘어
12일부터 AI허브에 공개…데이터 활용 확산 논의도 과학기술정보통신부는 국내 인공지능 기술과 산업 발전을 견인할 AI 학습용 데이터 190종(5억 8000만 건)을 AI 통합 플랫폼 'AI허브'를 통해 추가로 개방한다고 12일 밝혔다. 과기정통부는 2017년부터 기업, 연구자 등이 시간·비용 문제 등으로 개별 확보하기 어려운 AI 학습용 데이터를 구축·개방해 왔고, 2020년부터 구축 규모를 대폭 늘린 후 18만 건 이상의 다운로드를 기록 중이다. 이번 데이터 개방은 지난해 6월 개방한 2020년 구축 데이터 170종(4억 8000만 건)에 더해 지난해 구축한 190종에 대한 품질·활용성 검증을 거쳐 순차적으로 개방하는 것으로 총 규모는 381종에 달하게 된다. 이번에 개방되는 AI 학습용 데이터는 기획부터 구축까지 산업계와 전문가, 국민이 대거 참여한 결과물이다. 데이터 구축 과정에만 811개 기업·대학·병원·기관과 4만 3000여명에 이르는 국민이 참여했다. 데이터는 한국어 음성·자연어(아동, 다화자 음성 등 44종), 영상·이미지(스포츠 동작, 반려동물 등 39종), 교통·물류(로봇주행, 교통사고 등 22종), 헬스케어(심장질환, 정신건강 등 32종),