일반뉴스 정보 수집하는 오픈AI GPT봇 공개 후 차단 사이트 증가 추세
GPT봇 공개 후 첫 주 5%, 2주차에 10% 육박하며 점차 증가하는 추세 보여 생성형 인공지능(AI)을 둘러싼 저작권 논란이 제기되면서 챗GPT의 정보 수집을 차단하는 사이트가 증가하고 있다. 27일(현지시간) 오리지널리티.AI에 따르면, 지난 22일 기준 전 세계에서 가장 인기 있는 사이트 1000개 가운데 챗GPT의 정보 수집 툴인 GPT봇을 차단한 사이트는 9.2%에 달했다. GPT봇은 챗GPT 개발사 오픈AI가 GPT 언어모델 학습에 필요한 데이터를 수집하는 새로운 웹 크롤러로, 지난 7일 공개됐다. 오픈AI는 GPT봇을 공개하면서 정보 수집·이용을 원하지 않는 사이트 소유자에게 GPT봇의 크롤링을 차단하는 방법을 안내했다. GPT봇 공개 후 첫 주인 지난 15일에는 GPT봇 차단율이 5%에 미치지 않았으나, 2주 차에는 10%까지 육박했다. 특히, 인기 있는 주요 사이트 100개로 범위를 좁히면 차단율은 15%에 달해 이용자 수가 많은 사이트일수록 차단율이 높은 것으로 조사됐다. 주요 사이트 중에는 로이터 통신, 아마존, 뉴욕타임스, CNN방송 등 주요 기사 사이트가 대거 포함됐다. 로이터 통신의 경우 주요 GPT봇 공개 다음 날인 8일 웹 크롤