테크노트 “사람처럼 언어·시각 정보를 이해하고 판단한다”...KETI, AI 기반 사전학습 모델 'VL-KE-T5' 공개
헬로티 김진희 기자 | 인공지능(AI)이 텍스트를 인간 수준으로 이해하고, 적합한 이미지를 자동으로 결합한다. 한국전자기술연구원(KETI)이 인공지능 연구에 활용 가능한 최첨단 사전학습 모델 ‘VL-KE-T5’를 무료 공개하고 배포했다고 16일 밝혔다. 사전학습 모델은 자기지도학습(Self-supervised Learning)을 통해 대용량 데이터로부터 범용적 의미를 미리 학습하는 인공지능 기법으로, 높은 구축 비용이 필요한 학습 데이터 기반의 학습을 최소화하고 비교적 쉽게 확보 가능한 원시 데이터를 학습에 활용하여 다양한 인공지능 문제에 높은 성능을 보여주고 있다. ‘VL-KE-T5’는 지난해 4월 KETI가 구축하여 무상 공개했던 언어(한국어-영어) 기반 사전학습 모델인 ‘KE-T5’와 구글이 공개한 시각 기반 사전학습 모델인 ‘ViT’의 의미 정보를 정렬시킨 모델이다. KETI는 언어 및 시각 기반 사전학습 모델을 인공지능이 동시에 처리할 수 있도록 두 모델의 상이한 의미 표현을 동일한 의미 단위로 정렬시켰다. KETI가 공개한 ‘VL-KE-T5’는 영상 정보와 언어 정보의 연계 처리가 가능한 복합지능 모델이며, 한국어와 영어를 동시에 지원하고 있으므로