OpenAI DALL-E 2는 상상할 수 있는 모든 이미지를 렌더링할 수 있습니다.

OpenAI DALL-E 2는 상상할 수 있는 모든 이미지를 렌더링할 수 있습니다.

OpenAI DALL-E 2 인공 지능은 상상의 텍스트 설명을 기반으로 만화 이미지를 만듭니다.

2021년 1월, Elon Musk가 설립하고 Microsoft가 자금을 지원하는 OpenAI 컨소시엄은 지금까지 가장 야심찬 프로젝트인 DALL-E 기계 학습 시스템을 공개했습니다. 이 독창적인 다중 모드 인공 지능은 사용자가 지정한 키워드만으로 만화 스타일의 이미지를 생성할 수 있었습니다. 보다 최근에 이 컨소시엄은 이전 버전보다 더 높은 해상도와 더 낮은 대기 시간을 갖춘 새로운 버전의 DALL-E를 도입했습니다.

인공 지능 OpenAI DALL-E 2는 만화 이미지를 만듭니다.

DALL-E의 첫 번째 버전(Dalie 및 Wall-E의 줄임말)은 이미지를 생성하고 여러 이미지를 콜라주로 결합하고 다양한 각도를 제안하며 간단한 서면 설명에서 그림자 효과와 같은 여러 이미지 요소를 추측할 수도 있습니다. .

“입력을 가장 작은 세부 사항까지 명확하게 지정해야 하는 3D 렌더러와 달리 DALL-E는 제목이 이미지에 명시적으로 명시되지 않은 특정 세부 사항이 포함되어 있음을 암시할 때 종종 ‘간격을 채울’ 수 있습니다.”라고 팀은 설명했습니다. 2021년 오픈 AI.

DALL-E는 상용 제품이 아니므로 OpenAI 팀이 연구 도구로만 간주했기 때문에 기능이 제한되었습니다. 마이크로소프트가 테이 챗봇을 가지고 있었던 상황과 시스템이 잘못된 정보를 생성할 수 없는 상황을 피하는 것도 필요했습니다. 이 두 번째 버전의 경우 목표는 동일하게 유지되며 인공 지능에 의해 생성되었음을 명확하게 나타내기 위해 이미지에 워터마크가 추가되었습니다. 또한 시스템은 이제 사용자가 적절한 이름으로 이미지를 생성하는 것을 금지합니다.

당신의 상상에서 가져온 텍스트 설명에 따라

OpenAI CLIP 이미지 인식 시스템을 사용하는 DALL-E 2는 이미지 생성 기능을 사용합니다. 이제 사용자는 기존 이미지의 특정 영역을 선택 및 편집하고, 그림자와 함께 요소를 추가 또는 제거하고, 두 이미지를 하나의 콜라주로 병합하고, 기존 이미지의 변형을 만들 수 있습니다. 생성된 이미지는 이제 1024px 정사각형이고 원래 아바타는 256px입니다. CLIP은 사람이 이해할 수 있는 방식으로 이미지의 내용을 요약하도록 설계되었습니다. 컨소시엄은 설명에서 이미지를 생성하여 프로세스를 역전했습니다.

“DALL-E 1은 언어에 대한 GPT-3 접근 방식을 적용하여 이미지를 생성했습니다. 이미지를 일련의 단어로 압축하고 다음에 일어날 일을 예측하는 방법을 배웠습니다.” 연구원 Prafulla Dhariwal이 The Rod에 설명했습니다.

누구나 OpenAI 사이트에서 플레이할 수 있는 첫 번째 버전과 달리 이 버전 2는 현재 특정 파트너만 사용할 수 있으며 파트너 자신도 할 수 있는 일이 제한되어 있습니다. 운이 좋은 소수만이 그것을 사용할 수 있습니다. 또한 OpenAI는 향후 API를 통해 DALL-E 2의 새로운 기능을 사용할 수 있도록 할 계획이지만 타사 플랫폼에서 만든 이미지를 내보낼 수 없습니다. 그래도 시스템을 사용해보고 싶다면 대기자 명단 에 등록할 수 있습니다 .

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다