ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [Data 이모저모] DALL·E란 무엇인가?
    Data 이모저모 2024. 1. 12. 19:21

    Table of Contents

    1. Introduction
    2. DALL·E란?
    3. 결론
    4. Reference

     

    Introduction

    최근 '달리'라는 이름을 많이 들어봤을 것이다. 초현실주의 작가인 살바도르 달리(Salvador Dali)를 말하는 것은 아닐 것이다. 2021년 1월 5일 OpenAI에서 출시한 달리(DALL-E)는 2022년 4월 6일 버전이 업그레이드 되면서 달리2로 세상을 마주하게 되었다. 그 전까지 인공지능을 활용한 기술이 얼마나 활용이 되겠냐고 생각했으나 실제 달리2가 등장하고 나서 미술, 패션, 건축, 마케팅까지 다양한 분야에 걸쳐서 혁신을 하기 시작했고 생성형 AI를 활용한 다양한 도서들이 출간되기 시작했다. 2023년 9월 달리3이 출시되면서 이미지를 좀 더 자세하게 구현할 수 있게 되었다.

    [그림 1] 인공지능 화가(Made by DALL-E)

     

    DALL·E란?

     DALL-E는 OpenAI에서 개발한 생성적 적대 신경망(Generative Adversarial Network; GAN) 기반의 이미지 생성 모델이다. 생성적 적대 신경망은 생성자(Generative)와 판별자(Adversarial)의 신경망이 서로 경쟁하면서 데이터를 생성하고 평가하는 딥러닝 모델이다. 이 때문에 텍스트 설명을 통해 주어진 조건에 맞는 고유하고 창의적인 이미지를 생성할 수 있는 능력으로 주목을 받고 있다. DALL-E는 인코더와 디코더로 이루어져 있다. 인코더는 텍스트 입력을 받아 벡터로 변환하고, 디코더는 이 벡터를 활용하여 이미지를 생성한다. 모델은 대규모 이미지 데이터셋을 학습하여 다양한 스타일과 주제에 대한 이미지를 생성할 수 있다.

    [그림 2] Microsoft Bing의 Image Creator

     

    DALL-E는 다양한 주제와 스타일에 따른 이미지 생성 능력을 갖추고 있습니다. 예를 들어, "새로운 종류의 고양이"나 "프랑스어로 설명된 투명한 옷을 입은 사람"과 같은 특이하고 창의적인 이미지를 생성할 수 있습니다. [그림 3]은 "인공지능 화가를 단순하게 그려줘"라고 입력했을 때 나타나는 이미지이다.

    [그림 3] "인공지능 화가를 단순하게 그려줘"에 대한 창작물

     

    결론

    DALL-E는 유니크한 캐릭터 일러스트를 생성하거나, 특정 주제에 대한 시각적인 표현을 구현할 수 있기 때문에 창의적 예술 작품, 디자인 프로젝트, 광고 캠페인 등 다양한 분야에서 활용되고 있다. 다만, DALL-E는 놀라운 성능을 보이지만, 생성된 이미지의 현실성이나 데이터 다양성 부족과 같은 도전 과제를 가지고 있다. 또한, 특정 주제에 대한 정확한 이해 부족으로 인한 오류가 발생할 수 있다. 데이터에 대한 확보와 함께 윤리적 측면에서의 이슈들을 함께 보완해준다면 앞으로는 DALL-E와 같은 AI 생성형 이미지 기술은 미래에 다양한 분야에서 폭 넓게 활용할 수 있으며, 비즈니스에 큰 변화를 가져올 수 있을 것으로 기대한다.

     

    Reference

    DALL-E, OpenAI, https://openai.com/dall-e-3

    Bing Image Creator, Microsoft, https://www.bing.com/images/create?FORM=IRPGEN

    댓글

Designed by Tistory.