일반뉴스 KAIST, “소량의 데이터로도 딥러닝 정확도 향상시킬 수 있다”
헬로티 이동재 기자 | KAIST 전산학부 이재길 교수 연구팀이 적은 양의 훈련 데이터가 존재할 때도 높은 예측 정확도를 달성할 수 있는 새로운 딥러닝 모델 훈련 기술을 개발했다고 27일 밝혔다. 기술이 적용되면 기존에 수작업으로 진행돼 많은 노동력과 시간이 소모되던 레이블링(Labeling) 과정을 보다 효과적으로 수행할 수 있다. 이번에 개발된 기술은 심층 학습 모델의 훈련에서 바람직하지 않은 특성을 억제해 충분하지 않은 훈련 데이터를 가지고도 높은 예측 정확도를 달성할 수 있게 해주는 기술이다. 연구팀은 바람직하지 않은 특성을 억제하기 위해서 분포 외(out of distribution) 데이터를 활용했다. 다량의 분포 외 데이터를 추가로 활용해 추출된 특성이 영(0) 벡터가 되도록 심층 학습 모델의 훈련 과정을 규제해, 바람직하지 않은 특성의 효과를 억제하는 원리다. 기존에 딥러닝 과정에서 분포 외 데이터는 쓸모없는 것이라 여겨지고 있었으나, 이번 연구에선 오히려 훈련 데이터 부족을 해소할 수 있는 유용한 보완재로 탈바꿈됐다. 연구팀은 이 정규화 방법론을 ‘비선호 특성 억제’라고 이름 붙이고 이미지 데이터 분석의 세 가지 주요 문제에 적용했다. 그 결