Yeni Al Generative Art'a bir bakış

Üretken Sanat bir insan ile otonom bir sistem arasındaki işbirliğine dayanan, çoğu durumda görsel olan bir sanat türüdür. “Özerk sistem” olarak tanımlanır. Yapay Zeka programcı müdahalesine ihtiyaç duymadan karmaşık işlemleri gerçekleştirebilen yazılım, algoritma veya model.

Yaratılan görüntülerin tuhaf yan yana dizilmesinden Dall-E Mini için NFT pazarında, AI algoritmaları tarafından oluşturulan görüntüler giderek daha fazla ana akım hayal gücüne giriyor. Aslında konuyla ilgili incelenmeyi hak eden iki önemli proje: yolculuk ve DALL-E2.

Haber tabii ki Twitter'a da ulaştı. Diğerlerinin yanı sıra bu konuda yorum yapan Charles Hoskinson şunları yazdı:

Yapay zeka tarafından oluşturulan sanat. Bu resmi birkaç dakika içinde yapabildim. Bu teknolojinin 3 yıl içinde ne kadar olağanüstü olacağını hayal bile edemiyorum. pic.twitter.com/jOTOCZj7ki
- Charles Hoskinson (@IOHK_Charles) Şubat 1, 2023

Al Üretken Sanat: erken deneyler ve özellikler

Üretken Sanatın ne olduğunu anladıktan sonra, kurucu ilkelerinden birini vurgulamak önemlidir: rasgelelik. Bu, Üretken Sanatın temel bir özelliğidir.

Aslında, yazılımın türüne bağlı olarak, otonom sistem, oluştur komutu her yürütüldüğünde her zaman farklı ve benzersiz olan sonuçları işleyebilir veya kullanıcı girişine yanıt olarak değişken sayıda sonuç döndürebilir.

Üretken Sanat alanındaki ilk deneyler, 1960'lı yıllara kadar uzanır. Harold Cohen ve onun Aaron programı. Cohen, Pop Art serigrafilerinden ilham alan soyut sanat eserleri oluşturmak için ilk olarak bağımsız bir yazılım kullandı. Cohen'in çalışmaları şimdi Londra'daki Tate Gallery'de sergileniyor.

Üretken Sanatın bir başka özelliği, ancak gittikçe daha az ayrıcalıklı hale gelen bir özellik, programcı tarafından sağlanan ve yazılım kodu içinde uygulanan kalıpların veya soyut öğelerin tekrarıdır.

Ek olarak, metin-görüntü ilişkilendirme üzerinde çalışan, giderek daha karmaşık hale gelen sinir ağlarının geliştirilmesi, giderek daha gerçekçi ve doğru görüntüler oluşturabilen üretken modellerin geliştirilmesini sağlamıştır. Bu Üretken Sanat kategorisinin en iyi bilinen örneği, Döşeme.

Dall-E, dayalı çok modlu bir sinir ağıdır. GPT 3 derin öğrenme modeli OpenAI, yakın zamanda geliştirilen aynı şirket ChatGPT, chatbot Kasım 2022'de kullanıma sunuldu ve şu özelliklerle optimize edildi: "denetimli" ve pekiştirmeli öğrenme teknikleri.

Dall-E'ye dönersek, bu sistemin metinsel bir tanımdan görüntüler üretebildiğini görüyoruz. "çabuk," metin-görüntü çiftlerinden oluşan bir veri kümesine dayalıdır.

Ocak 2021'de halka sunulan ve alandaki az sayıda profesyonelin ayrıcalığı olarak kalan Dall-E'nin ilk versiyonu, GPT-'nin yeniliklerini geride bırakarak bu tür üretken model açısından gerçek bir devrimi temsil ediyordu. 3 kendisi.

Dall-E tarafından işlenen sonuçların doğruluğunun başka bir OpenAI çözümü için mükemmel bir kapsam olduğunu kanıtlamış olması da önemlidir: CLIP (Karşıt Dil-Görüntü Ön Eğitimi).

İnternette bulunan başlıklar gibi metin-görüntü ilişkilendirmelerine dayalı olarak eğitilmiş bir görüntü sınıflandırması ve sıralama sinir ağı. İstem başına kullanıcıya önerilen sonuç sayısını 32'ye düşüren CLIP müdahalesi sayesinde, Dall-E'nin çoğu durumda tatmin edici görüntüler döndürdüğü bulundu.

Midjourney: tasarım, insan altyapısı ve yapay zeka

Tahmin edildiği gibi, yolculuk ortaya çıkan Al Generative Art konseptinin bir parçası olan önemli bir projedir. Özellikle Midjourney, yeni düşünme araçlarını keşfeden ve insan türünün yaratıcı güçlerini genişleten bağımsız bir araştırma laboratuvarıdır.

Kullanımı basittir: önce bir hesap oluşturulmalıdır. Discord, Midjourney'in de bunlardan biri olduğu çeşitli toplulukları barındıran bir platform. Uygulama içinde, kişinin tartışmalara aktif olarak katılıp katılamayacağı çeşitli sohbet odaları bulunmaktadır.

Yapay Zekayı ilk kez kullanmayı denemek için kişinin şu adrese gitmesi gerektiğini belirtmek önemlidir: “yeni başlayanlar” kanallar, nerede 25 ücretsiz render kullanılabilir.

Bir oluşturma, aynı metinsel girdiden üretilen dört farklı varyantın oluşturulmasına karşılık gelir.

Bu nedenle, 25 işleme, Midjourney botu tarafından gerçekleştirilen 25 işleme işini ifade eder. Sonuç olarak, görüntünün oluşturulması, Midjourney botuyla, kullanıcının aklındaki görüntüyü açıklayan anahtar kelimelerin olacağı "bilgi istemi" adı verilen bir metin mesajı aracılığıyla etkileşim kurmayı gerektirir.

İstediğiniz kadar detay ekleyebilirsiniz, önemli olan anahtar kelimeleri virgülle ayırmaktır. Oluşturma bittiğinde, bilgisayar, aralarından seçim yapabileceğiniz açıklamalara göre dört farklı görüntü döndürür.

Ek olarak, program oluşturmayı bitirdiğinde, tercihlerinizi görüntülere göre iletebilir ve dilerseniz yeniden dört sürüm daha oluşturabilirsiniz.

DALL-E 2: sanat eserleri için yeni AI sistemi

Midjourney'e ek olarak DALL-E 2, doğal bir dil tanımından gerçekçi görüntüler ve sanat eserleri oluşturabilen yeni yapay zeka sistemidir. Sadece bu değil, DALL-E 2 ayrıca kavramları, nitelikleri ve stilleri birleştirebilir.

Yeni yapay zeka sisteminin gücü aynı zamanda görüntüleri orijinal tuvaldekinin ötesine genişletebilmekte ve yeni geniş kompozisyonlar. Ayrıca, doğal bir dil başlığından mevcut görüntülerde gerçekçi değişiklikler yapabilir ve gölgeleri, yansımaları ve dokuları hesaba katarak öğeler ekleyip kaldırabilir.

DALL-E 2'nin yetenekleri, bir görüntü çekmeyi ve orijinalinden esinlenerek bunun çeşitli varyasyonlarını oluşturmayı da içerir. DALL-E 2, resimler ile onları tanımlamak için kullanılan metin arasındaki ilişkiyi öğrendi.

adı verilen bir süreç kullanır. "difüzyon" Rastgele noktalardan oluşan bir modelle başlayan ve bu görüntünün belirli yönlerini tanıdığında, bu deseni kademeli olarak bir görüntüye doğru değiştiren.

OpenAI, Ocak 2021'de DALL-E'yi tanıttıktan sonra, şimdi en yeni sistem olan DALL-E 2, dört kat daha yüksek çözünürlüklü daha gerçekçi ve doğru görüntüler üretiyor.

DALL-E 2 bir araştırma projesi olarak başladı ve şimdi bir beta sürümü. Sistemin geliştirdiği ve iyileştirmeye devam ettiği güvenlik azaltımları şunları içerir: sistemin şiddet, nefret veya yetişkin görüntüleri oluşturma yeteneğini sınırlama ve öğrenmeye dayalı aşamalı dağıtım.

Kaynak: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/