OpenAI DALL-E 2 可以渲染任何你能想像到的圖像

OpenAI DALL-E 2 可以渲染任何你能想像到的圖像

OpenAI DALL-E 2 人工智能根據您想像的文本描述創建卡通圖像。

2021 年 1 月,由埃隆·馬斯克創立、微軟資助的 OpenAI 聯盟推出了迄今為止最雄心勃勃的項目:DALL-E 機器學習系統。這種巧妙的多模式人工智能能夠僅根據用戶指定的關鍵字生成卡通風格的圖像。最近,該聯盟推出了新版本的 DALL-E,與之前的版本相比,具有更高的分辨率和更低的延遲。

人工智能 OpenAI DALL-E 2 創建卡通圖像

DALL-E(Dalie 和 Wall-E 的縮寫)的第一個版本可以生成圖像並將多個圖像組合成拼貼畫,建議不同的角度,甚至從簡單的書面描述中猜測一些圖像元素,例如陰影效果。

“與 3D 渲染器不同,3D 渲染器的輸入必須明確指定到最小的細節,而當標題暗示圖像包含某些未明確說明的細節時,DALL-E 通常可以‘填補空白’,”該團隊解釋道。2021 年開放人工智能。

DALL-E 從未打算成為商業產品,因此其功能受到限制,因為 OpenAI 團隊僅將其視為一種研究工具。還要避免出現微軟 Tay 聊天機器人那樣的情況,系統無法生成虛假信息。對於第二個版本,目標保持不變,並且在圖像中添加了水印,以清楚地表明它是由人工智能創建的。此外,系統現在禁止用戶創建具有正確名稱的圖像。

根據你想像中的文字描述

DALL-E 2採用了OpenAI CLIP圖像識別系統,利用其圖像生成功能。用戶現在可以選擇和編輯現有圖像的特定區域,添加或刪除元素及其陰影,將兩個圖像合併為一張拼貼畫,以及創建現有圖像的變體。生成的圖像現在是 1024 像素的正方形,而原始頭像是 256 像素。CLIP 旨在以人類可以理解的方式總結圖像的內容。該聯盟根據他的描述創建了一幅圖像,從而扭轉了這一過程。

“DALL-E 1 採用了我們的 GPT-3 語言方法,並將其應用於創建圖像:我們將圖像壓縮為一組單詞,並學會預測接下來會發生什麼,”研究員 Prafulla Dhariwal 向 The Rod 解釋道。

與每個人都可以在 OpenAI 網站上玩的第一個版本不同,這個版本 2 目前僅對某些合作夥伴開放,而且他們本身的功能也受到限制。只有少數幸運者才能使用它。儘管 OpenAI 計劃將來通過 API 提供 DALL-E 2 的新功能,但它們也無法導出在第三方平台上創建的圖像。如果您仍想嘗試該系統,可以加入等待名單

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *