OpenAI DALL-E 2 pode renderizar imagens de qualquer coisa que você possa imaginar

OpenAI DALL-E 2 pode renderizar imagens de qualquer coisa que você possa imaginar

A inteligência artificial OpenAI DALL-E 2 cria imagens de desenhos animados com base em uma descrição de texto de sua imaginação.

Em janeiro de 2021, o consórcio OpenAI, fundado por Elon Musk e financiado pela Microsoft, apresentou seu projeto mais ambicioso até o momento, o sistema de aprendizado de máquina DALL-E. Essa engenhosa inteligência artificial multimodal foi capaz de gerar imagens em estilo cartoon com base apenas em palavras-chave especificadas pelo usuário. Mais recentemente, o consórcio apresentou uma nova versão do DALL-E com maior resolução e menor latência que a anterior.

Inteligência artificial OpenAI DALL-E 2 cria imagens de desenhos animados

A primeira versão do DALL-E (abreviação de Dalie e Wall-E) podia gerar imagens e combinar várias imagens em uma colagem, sugerir diferentes ângulos e até adivinhar vários elementos de imagem – como efeitos de sombra – a partir de uma simples descrição escrita .

“Ao contrário de um renderizador 3D, cuja entrada deve ser especificada de forma inequívoca até o menor detalhe, o DALL-E pode frequentemente ‘preencher as lacunas’ quando o título implica que a imagem contém certos detalhes não declarados explicitamente”, explicou a equipe. IA aberta em 2021.

O DALL-E nunca foi planejado para ser um produto comercial, então seus recursos eram limitados, pois a equipe da OpenAI o considerava apenas como uma ferramenta de pesquisa. Também era necessário evitar a situação que a Microsoft teve com seu chatbot Tay e que o sistema não poderia gerar informações falsas. Para esta segunda versão, os objetivos permanecem os mesmos, e uma marca d’água foi adicionada à imagem para indicar claramente que ela foi criada por inteligência artificial. Além disso, o sistema agora proíbe os usuários de criar imagens com nomes próprios.

de acordo com uma descrição textual tirada de sua imaginação

O DALL-E 2, que usa o sistema de reconhecimento de imagem OpenAI CLIP, usa seus recursos de geração de imagem. Os usuários agora podem selecionar e editar áreas específicas de imagens existentes, adicionar ou remover elementos junto com suas sombras, mesclar duas imagens em uma colagem e criar variações de uma imagem existente. As imagens geradas agora são quadrados de 1024px, enquanto os avatares originais eram de 256px. O CLIP foi projetado para resumir o conteúdo de uma imagem de uma forma que possa ser entendida por um ser humano. O consórcio inverteu o processo criando uma imagem a partir de sua descrição.

“O DALL-E 1 pegou nossa abordagem GPT-3 para a linguagem e a aplicou para criar uma imagem: comprimimos imagens em um conjunto de palavras e aprendemos a prever o que aconteceria a seguir”, explicou o pesquisador Prafulla Dhariwal ao The Rod.

Ao contrário da primeira versão, com a qual todos podiam jogar no site OpenAI, esta versão 2 está atualmente disponível apenas para alguns parceiros, e eles próprios são limitados no que podem fazer. Apenas alguns poucos sortudos conseguem usá-lo. Eles também não podem exportar imagens criadas em uma plataforma de terceiros, embora a OpenAI planeje disponibilizar os novos recursos do DALL-E 2 por meio de uma API no futuro. Se ainda quiser experimentar o sistema, você pode entrar na lista de espera .

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *