본문 바로가기
IT 정보

디자이너가 AI로 그림 그려본 후기 (feat. 달리 3 1)

by nicemeanin 2024. 3. 19.

최근 회사에서 업무에 GPT4를 도입했습니다.

디자인 트렌드나 신규 서비스에 대해 조사할 때 시간을 절약할 수 있기 때문입니다.

GPT4를 사용하면서 자연스럽게 GPT4에 지원되는 이미지 생성 AI 달리 3(DALL·E 3)를 사용하게 되었습니다.

이번 포스팅에서는 달리 3에 대해 말씀드리려고 합니다. 

 


 

달리 3(DALL·E 3)

2023년 오픈에이아이(OpenAI)에서 개발한 텍스트 투 이미지(Text to Image) 생성 인공지능 모델.

이전 버전인 달리 2(DALL·E 2) 보다 더욱 발전된 성능을 보여주고 있음.

 

달리 3 홈페이지
[ 달리 3 홈페이지 ]

 

https://openai.com/dall-e-3

 

DALL·E 3

DALL·E 3 understands significantly more nuance and detail than our previous systems, allowing you to easily translate your ideas into exceptionally accurate images.

openai.com

 

1. 달리 2(DALL·E 2)와의 차이점

 

1) 이미지 품질 및 해상도

DALL·E 3는 DALL·E 2 보다 훨씬 우수한 품질과 고해상도의 이미지를 생성. 확장된 어휘력과 더 높은 이미지 해상도를 통해 더 세밀한 표현이 가능. 현실적이며 왜곡되지 않은 이미지를 생성하고, 영역을 확장하거나 수정할 수 있음.

 

2) 텍스트 생성 및 렌더링

다양한 텍스트 요소와 자연어로 구성된 광범위한 데이터 세트를 기반으로 확장된 어휘와 더 높은 이미지 해상도를 사용하여 더 풍부한 텍스트 표현을 제공. 그 결과 더 일관성 있고 노이즈가 적은 텍스트 렌더링이 가능해져 사실성과 정확성이 향상됨.

 

3) 프롬프트 준수 및 창조력

DALL·E 2 보다 더 크고 균형 잡힌 데이터 세트(다양한 유형, 범주, 특징 등을 고르게 포함하여 구성)를 사용하므로 복잡한 프롬프트를 더 정확하게 분석하고 이에 걸맞은 이미지를 생성.

따라서 DALL·E 3의 결과물은 DALL·E 2 보다 더 신뢰할 수 있음.

 

4) 다수의 언어 지원

한국어를 포함한 다수의 언어 지원.

 

5) 접속 방식

기존 DALL·E 2는 홈페이지에 접속해서 사용해야 했는데, DALL·E 3는 ChatGPT에 내장되어 GPT 대화창 안에서 사용할 수 있음.

사용자는 ChatGPT를 브레인스토밍 파트너 및 프롬프트 정제자(ex. 한국어로 명령을 내려도 알아서 AI가 인식할 수 있는 프롬프트로 전환해 줌)로 활용할 수 있고, 대화 형태로 이미지를 쉽게 생성 및 수정 가능.

 


 

2. 사용 방법(과정)

 

플랫폼의 종류에 상관없이 사용 방법은 동일합니다.

 

1) 프롬프트 작성: 원하는 이미지에 대한 상세한 설명을 텍스트로 준비.

2) 플랫폼 접근: DALL·E 3 서비스를 제공하는 플랫폼에 접속(ChatGPT 또는 Bing).

3) 이미지 생성: 준비한 텍스트 프롬프트를 입력하고 이미지 생성 요청.

4) 결과물 확인: 생성된 이미지를 확인하고, 필요에 따라 수정을 요청하거나 재생성 진행.

 

 

  • 챗지피티 플러스(ChatGPT Plus) 이용 (유료) 

달리 3 챗지피티 이용 화면
[ 달리 3 챗지피티 이용 화면 ]

 

ChatGPT상에서 DALL·E 3를 이용할 경우, 위와 같이 채팅 창내에서 대화하듯이 명령을 내리고, 결과물을 확인할 수 있습니다.

한국어로 명령을 내려도, 보시는 것처럼 적절한 결과물을 얻을 수 있었습니다. 

(명령을 내릴 때의 주의점이나 결과물의 퀄리티에 관해서는 다음 포스팅에서 더 자세히 말씀드릴 예정입니다.)

 

 

  • 마이크로소프트 빙 이미지 크리에이터((Microsoft  Bing image creator)  이용 (무료)

달리 3 빙 이미지 크리에이터 이용 화면
[ 달리 3 빙 이미지 크리에이터 이용 화면 ]

 

빙 이미지 크리에이터 화면입니다. 위와 같이 화면 상단에 프롬프트 입력 필드가 있고 중앙에 결과물이 표시됩니다.

오른쪽에는 그동안 생성한 이미지 썸네일이 타임라인 순(아래->위)으로 배치되어 있습니다.

 

https://www.bing.com/images/create?FORM=GENILP

 

Bing

Bing은 지능적인 검색 기능은 사용자가 원하는 정보를 빠르게 검색하고 보상을 제공합니다.

www.bing.com

 

 


 

지금까지 DALL·E 3의 특징과 사용법에 대해 말씀드렸습니다.

다음 포스팅에서는 DALL·E 3로 직접 그림을 그려 본 경험을 공유드리겠습니다.

 

이 글은 개인 공부 겸 작성한 글을 공유한 것입니다. 내용에 지식적 오류가 있을 시 수정하도록 하겠습니다.

댓글