오픈AI "NYT 뉴스 네이버 블로그에서 학습해도 출력은 금지"…저작권 침해 반박
"역류 현상 방지…NYT가 악의적 명령어 입력 가능성" 주장
- 김승준 기자
(서울=뉴스1) 김승준 기자 = 챗GPT 개발사 오픈AI가 뉴욕타임스(NYT)의 저작권 침해 주장을 반박했다. 기사가 인용 된 다른 웹사이트 정보를 학습할 수 있으나 이를 그대로 노출하는 '역류'(Regurgitation) 현상을 거의 방지하고 있다는 게 오픈AI 주장의 핵심이다.
뉴욕타임스 정보가 인용된 다른 웹사이트 사례로는 네이버 블로그를 예시로 들었다. 여기서 학습한 뉴욕타임스 기사 정보가 챗GPT에 출력됐다면 NYT가 이를 유도하는 명령어를 입력했을 가능성이 높다는 것이다. 다만 역류 현상을 완전히 방지할 수 없는 만큼 제삼자 웹사이트 정보가 그대로 출력될 가능성은 인정했다.
10일 업계에 따르면 오픈AI는 8일(현지시간) 공식 블로그에서 '오픈AI와 저널리즘'이라는 입장문을 발표했다.
NYT는 지난달 자사 기사가 챗GPT 등 인공지능(AI) 훈련에 무단 사용했다고 미국 뉴욕 맨해튼 연방법원에 소장을 냈다.
오픈AI는 "공개적으로 이용 가능한 인터넷 자료를 사용하여 AI 모델을 훈련하는 것은 오랫동안 지속되고 널리 받아들여지는 선례에 의해 뒷받침되는 공정 사용에 해당한다"며 "이는 최근 미국 저작권청에 의견을 제출한 학계, 도서관 협회, 시민 사회 단체, 스타트업, 창작자, 작가 및 기타 다양한 분야에서 지지받고 있다"고 주장했다.
이번 소송에서 NYT는 챗GPT가 자사 기사 문구를 그대로 답변한 사례를 근거로 제시한 것으로 알려졌다.
오픈AI는 그러한 현상은 '역류'(Regurgitation)라고 불리는 희귀한 버그라며 NYT가 일부러 버그를 유발한 것일 수 있다고 반박했다.
오픈AI는 "우리는 모델 출력에서 역류를 방지하려는 조처를 했다. 의도적으로 모델을 조작해 역류를 발생시키는 것 적절하지 않으며 이용약관에도 위배된다"며 "NYT가 유발한 역류는 제삼자 웹사이트에 게시된 오래된 기사에서 나온 것으로 보인다"고 했다.
오픈AI는 제삼자 웹사이트에 게시된 NYT 뉴스를 학습했을 가능성이 있는 사례로 네이버 블로그, 핀란드 펑크 커뮤니티, 온라인 질문-응답 플랫폼을 들었다.
해당 사이트들에는 NYT가 2020년 1월 보도한 '우리가 알고 있는 개인 정보 보호를 종식할 비밀 회사'라는 기사의 원문이 그대로 옮겨져 있었다.
오픈AI는 "모델이 역류하도록 긴 기사 발췌를 포함해 명령어가 의도적으로 조작된 것 같다"며 "우리는 NYT의 소송이 가치가 없다고 생각한다. 언론 기관과의 지속적인 협력을 통해 AI의 혁신적인 잠재력을 실현함으로써 양질의 저널리즘을 생산하는 능력을 높일 수 있기를 기대한다"고 강조했다.
seungjun241@news1.kr
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용금지.