OpenAI 發布 DALL-E的第三個版本

DALL-E 3與ChatGPT整合在一起，不再需要輸入提示。

OpenAI宣布了其生成式AI視覺藝術平台 DALL-E 的第三個版本，現在用戶可以使用ChatGPT來生成提示，並包含更多的安全選項。

DALL-E將文本提示轉換為圖像。但是，即使是DALL-E 2也會出錯，經常忽略具體的措辭。OpenAI的研究人員表示，最新版本更好地理解上下文。

DALL-E 3的一個新功能是與ChatGPT整合。通過使用ChatGPT，某人不需要自己提供詳細的提示來引導DALL-E 3；他們只需請求ChatGPT提供提示，聊天機器人將為DALL-E 3撰寫一段（DALL-E對於較長的句子效果更好）。如果用戶對DALL-E有特定的想法，他們仍然可以使用自己的提示。

在向The Verge進行的演示中，DALL-E團隊的首席研究員兼負責人Aditya Ramesh要求ChatGPT幫助他為一家位於山區的拉麵餐廳設計一個標誌。然後，ChatGPT寫了一個更長的提示，DALL-E提供了四個選項。我最喜歡的是一個描繪了山脈的圖像，上面有拉麵的雪帽，湯汁像瀑布一樣流下來，醃蛋像花園石頭一樣散落在地上，盡管它看起來更像是一個不錯的商品插圖，而不是一個傳統的餐廳標誌。OpenAI表示，這種與聊天機器人的聯繫使更多人能夠創造AI藝術，因為他們不需要擅長提供提示。

DALL-E於2021年1月首次發布，早於Stability AI和Midjourney等其他文本到圖像生成式AI藝術平台。到2022年DALL-E 2發布時，OpenAI開放了一個等待名單，以控制誰可以使用該平台，因為DALL-E可以生成逼真的露骨圖像，並在生成照片時表現出偏見。該公司在去年9月取消了等待名單，並向公眾開放了DALL-E 2。

這個新版本的DALL-E將首先在10月份釋放給ChatGPT Plus和ChatGPT Enterprise用戶，然後在秋季釋放給研究實驗室和其API服務。OpenAI計劃分階段發布DALL-E 3，但沒有承諾何時會發布免費公開版本。

OpenAI聲稱在DALL-E 3上投入了大量工作，以創建堅固的安全措施，以防止生成淫穢或潛在仇恨的圖像。OpenAI表示，他們與外部紅隊合作（一個有意試圖破壞系統以測試其安全性的團隊），並依靠輸入分類器，一種教導語言模型忽略某些詞語以避免露骨或暴力提示的方法。DALL-E 3也將無法重新創建公眾人物的圖像-前提是提示明確提到了名字。

該公司的政策研究員Sandhini Agarwal表示，她對其安全措施有“很高的信心”，但澄清該模型不斷改進並且並不完美。OpenAI的代表在一封電子郵件中表示，DALL-E 3已經接受了拒絕生成以在世藝術家風格的圖像的訓練。與DALL-E 2不同，當提示時，DALL-E 2可以模仿某些藝術家風格的藝術。

為了避免訴訟，OpenAI還將允許藝術家選擇將他們的藝術排除在未來版本的文本到圖像AI模型之外。創作者可以提交他們擁有版權的圖像，並在其網站上的表格中請求其刪除。然後，DALL-E的未來版本可以阻止與藝術家的圖像和風格相似的結果。藝術家起訴了DALL-E的競爭對手Stability AI和Midjourney，以及藝術網站DeviantArt，指控他們使用了他們的受版權保護的作品來訓練他們的文本到圖像模型。

文章觀看次數: 361