DALL-E

Vikipedi, özgür ansiklopedi
DALL-E
DALL-E sample.png
"Zürafadan yapılmış ejderha" metni yazıldığında DALL-E'nin ürettiği görseller.
Orijinal yazar(lar) OpenAI
İlk yayınlanma 5 Ocak 2021 (22 ay önce) (2021-01-05)
Tür Dönüştürücü dil modeli
Resmî sitesi openai.com/blog/dall-e/

DALL-E (ya da DALL·E), 5 Ocak 2021'de OpenAI tarafından piyasa sürülen, metinsel tanımlardan görüntü oluşturan bir yapay zeka programıdır.

Adını ünlü ressam Salvador Dali ve WALL-E adlı animasyon robottan almıştır.[1] Program, doğal dil girdilerini (örneğin "beşgen şekilli yeşil deri çanta" veya "üzgün bir kapibaranın izometrik görünümü") tanımlamak için GPT-3 modelinin 12 milyar parametreden oluşan[2] sürümünü kullanır ve dil girdisine karşılık gelen görüntüyü oluşturur. Gerçekçi nesnelerin ("mavi çilek resimli vitray bir pencere") ve gerçekte var olmayan nesnelerin ("kirpi dokusuna sahip bir küp") görüntülerini oluşturabilir.

Tarihçe[değiştir | kaynağı değiştir]

DALL-E OpenAI tarafından 5 Ocak 2021'de piyasaya sürüldü.[3][4] Nisan 2022'de OpenAI, çıktıdaki görselde basit değişiklikler yapılmasına olanak sağlayan düzenleyiciyle birlikte metin açıklamalarından daha gerçekçi görüntüler üretebileceğini iddia ederek DALL-E 2'yi duyurdu. Duyuru itibarıyla, yazılımın hala yapım aşamasında olduğu ve erişimin önceden seçilmiş beta kullanıcıları ile sınırlı olduğu açıklandı. Modelin, hiçbir insanın yapmayacağı hatalar da dahil olmak üzere hala ciddi hatalar yapabildiği belirtildi.[5] DALL-E 2, "metin açıklamasından orijinal, gerçekçi görüntüler ve sanat oluşturabilen, kavramları, nitelikleri ve stilleri birleştirebilen" bir model olarak tanımlandı.[6]

CLIP[değiştir | kaynağı değiştir]

DALL-E, CLIP (Contrastive Language-Image Pre-training) ile birlikte geliştirilmiş ve duyurulmuştur.[4] Amacı, çıktıyı "anlamak ve sıralamak" olan ayrı bir modeldir.[3] DALL-E'nin oluşturduğu görseller, herhangi bir girdi için en yüksek kaliteli görüntüleri sunan CLIP tarafından küratörlüğünü yapar.[4]

Ayrıca bakınız[değiştir | kaynağı değiştir]

Kaynakça[değiştir | kaynağı değiştir]

  1. ^ "DALL-E Dijital Ressam". Bilim ve Teknik Dergisi. Şubat 2021. 26 Şubat 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 4 Şubat 2021. 
  2. ^ "OpenAI debuts DALL-E for generating images from text". VentureBeat. 5 Ocak 2021. 6 Ocak 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 5 Ocak 2021. 
  3. ^ a b "OpenAI's DALL-E creates plausible images of literally anything you ask it to". 5 Ocak 2021. 5 Ocak 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 5 Ocak 2021. 
  4. ^ a b c "This avocado armchair could be the future of AI". MIT Technology Review. 5 Ocak 2021. 5 Ocak 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 5 Ocak 2021. 
  5. ^ KAHN, JEREMY (6 Nisan 2022). "Move over Photoshop: OpenAI has just revolutionized digital image making". Fortune (İngilizce). 10 Nisan 2022 tarihinde kaynağından arşivlendi. Erişim tarihi: 10 Nisan 2022. 
  6. ^ "DALL·E 2". OpenAI (İngilizce). 6 Nisan 2022 tarihinde kaynağından arşivlendi. Erişim tarihi: 6 Nisan 2022. 

Kitaplar[değiştir | kaynağı değiştir]

  • Jens Knappe: Genesis. A Creation Story in Cooperation with an Artificial Intelligence, Berlin 2022, ISBN 978-3-940948-45-8.