검색 본문 바로가기 회사정보 바로가기

"말하는 대로 그려드립니다"…구글, 언어→그림 AI 공개

"편견·차별 걸러지지 않은 데이터 세트 사용…데모 공개는 하지 않아"

(서울=뉴스1) 김승준 기자 | 2022-05-24 18:00 송고
'달을 향해 향하는 로켓을 타고 있는 뇌'를 입력받은 구글 리서치의 브레인 팀이 개발한 인공지능 이매젠(Imagen)이 생성한 그림 (Imagen 공개 블로그 갈무리) 2022.05.24 /뉴스1
'달을 향해 향하는 로켓을 타고 있는 뇌'를 입력받은 구글 리서치의 브레인 팀이 개발한 인공지능 이매젠(Imagen)이 생성한 그림 (Imagen 공개 블로그 갈무리) 2022.05.24 /뉴스1

구글이 입력된 문장을 이해하고 그림을 만들어내는 인공지능(AI)을 공개했다.

24일 구글의 인공지능 연구 조직 '구글 리서치'의 브레인(뇌) 팀(Brain Team)은 이미지 생성 인공지능 이매젠(Imagen)을 온라인을 통해 공개했다.

구글 리서치는 "깊은 수준의 언어 이해를 갖춰, 문장에서 이미지를 만들어내는 인공지능 모델인 이매젠을 공개한다"며 "이매젠은 텍스트를 이해하는 데 있어 거대 언어 모델을 기반으로 이미지를 만든다는 강점이 있다"고 설명했다.

예를 들어 '페르시안 고양이가 검은 자킷을 입고 바다에서 기타 치는 사진'이라고 입력하면 이에 걸맞은 그림을 AI가 생성할 수 있다.

'페르시안 고양이가 검은 자킷을 입고 바다에서 기타 치는 사진'을 입력받은 구글 리서치의 브레인 팀이 개발한 인공지능 이매젠(Imagen)이 생성한 그림 (Imagen 공개 블로그 갈무리) 2022.05.24 /뉴스1
'페르시안 고양이가 검은 자킷을 입고 바다에서 기타 치는 사진'을 입력받은 구글 리서치의 브레인 팀이 개발한 인공지능 이매젠(Imagen)이 생성한 그림 (Imagen 공개 블로그 갈무리) 2022.05.24 /뉴스1

연구팀은 사람을 대상으로 한 평가에서 다른 인공지능 방법론, 오픈 AI의 이미지 생성 인공지능 달리2(DAll-E2) 등이 생성한 이미지와 비교했을 때 더 높은 선호도를 달성했다고 밝혔다.

다만 연구팀은 연구 논문과 예시 이미지를 공개했지만, 상세한 코드 및 대중이 사용해 볼 수 있는 데모 버전은 제공하지 않기로 결정했다. 악용으로 인한 사회적 해악에 대한 우려 때문이다.

연구팀은 "이번 연구에서는 선별되지 않은 웹 스크랩 데이터 세트에 의존했다. 이 방식으로 최근 몇 년 동안 알고리즘이 빠르게 발전했지만, 종종 사회적 고정 관념, 편견, 차별적 의식이 인공지능에 반영되게 되었다"며 "사전 분석에 따르면 이매젠은 이미지를 생성할 때 다양한 사회적 문화적 편견을 보였다. 우리는 향후 작업에서 이러한 도전과 제한 사항에 대해 진전을 이루는 것을 목표로 삼았다"고 밝혔다.

'바다에 떨어지는 유리로 만든 세 개의 구체. 물이 튀고 있습니다. 해가 지고 있다'를 입력받은 구글 리서치의 브레인 팀이 개발한 인공지능 이매젠(Imagen)이 생성한 그림 (Imagen 공개 블로그 갈무리) 2022.05.24 /뉴스1
'바다에 떨어지는 유리로 만든 세 개의 구체. 물이 튀고 있습니다. 해가 지고 있다'를 입력받은 구글 리서치의 브레인 팀이 개발한 인공지능 이매젠(Imagen)이 생성한 그림 (Imagen 공개 블로그 갈무리) 2022.05.24 /뉴스1



seungjun241@news1.kr

이런 일&저런 일

    더보기