DALL·E: Metin-Görsel Endeksli Yapay Zekâ
Yapay zekânın tüm insanlığa fayda sağlamasını misyon edinen, araştırma ve dağıtım şirketi OpenAI, yazılı tanımlar üzerinden, kendine özgü görseller yaratabilen bir yapay zekâ modeli bulunuyor.
Kurucuları arasında Elon Musk‘ın da bulunduğu, Y Combinator girişim hızlandırma programı ve şirketi başkanı Sam Altman gibi önemli isimleri barındıran yapay zekâ şirketinin ismini ilk kez 2015 yılında duymuştuk.
2019 yılında Microsoft’tan 1 milyar $ yatırım alan şirket, yepyeni servisler hizmetlerine ve projelere imza atmaya devam ediyor.
Peki, OpenAI tarafından geliştirilen DALL·E nedir?
DALL-E, yapay zekâ desteği sayesinde metin tanımı üzerinden görseller yaratıyor. Oldukça sade bir kullanıma sahip olan servis için yapmanız gereken, elde etmek istediğiniz görseller için belirli metinler tanımlamak.
Servis, yazılan metinlere benzer içerik üretmek için derin öğrenmeyi kullanan öz bağlanımlı dil modeli olan GPT-3 (Generative Pre-trained Transformer) ile destekleniyor. Servisin ismi, ünlü ressam Salvador Dali ile Pixar’ın sevilen karakteri WALL·E‘den geliyor.
DALL-E‘nin size tanımlayacağı görseller tamamen sizin oluşturduğunuz metinlere bağlı. Servisten mavi gözlü bir hayvan da isteyebilirsiniz, kırmızı renkte bir koltuk da.
Sık sık görsele ihtiyaç duyan insanlar için oldukça kullanışlı bir servis olan DALL·E, sıfırdan bir görsel oluşturmak ve var olan görsellerden metin tanımlarına uyacak değişiklikler yaparak sunma gibi birçok gelişmiş özelliği barındırıyor.
Geçtiğimiz aylarda OpenAI, servisin yeni sürümü DALL·E 2’yi oluşturdu.
DALL-E 2, orijinal sistemde daha yüksek çözünürlüklü ve daha az gecikme süresi olan yeni sürümünü karşımıza çıkardı.
Servis, oluşturulan metinler üzerinden yeni görselleri kısa sürede üretiyor ve servise, görüntüyü düzenlemek için yeni yetenekler de eklendi. Yeni özellik ile beraber, mevcut bir resim ile başlayabildiğimiz serviste, bir alan seçebiliyoruz ve o alanda düzenlemeler yapılmasını isteyebiliyoruz.
Bir diğer ”varyasyonlar” özelliğiyle, servise resim yüklenebiliyor ve benzer bir dizi varyasyon oluşturulabiliyor. İki görseli karşılaştırarak ikisinden de detaylar barındıran yeni bir görsel de oluşturabilirsiniz.
Servise, nefret, çıplaklık ve zarar verebilecek görüntülerin kullanılması yasak ve görüntülerin oluşturulmasında yapay zekânın rolünü açıklamamız gerektiği gibi bazı kurallar konulmuş.
Ayrıca, oluşturulan görüntüleri bir web site veya uygulama üzerinden başka birileri ile paylaşmak, şu an için mümkün değil.
Yeni servis, doğrudan kişilerin kullanımına sunulmadı fakat, sistemi denemek isteyenler online olarak kayıt oluşturabilir. DALL-E 2 daha sonra üçüncü taraf uygulamalarda kullanıma sunulacak.
6 Yorum