Yapay Zeka Günlükleri #1

0
Bu yazı serimde, yapay zeka uygulamaları ve sitelerine karmaşık yapıda bir promptla birlikte görseller hazırlatacağım. Bu sayede yapay zeka teknolojilerinin gelişim günlüklerini de blogumuzda tutmuş olacağız. Her uygulamaya kendi Checkpoint'i üzerinden komut vermeye çalışacağım. Kendi Checkpoint'i olmayan uygulamalar varsayılan olarak hangisiyle başlatıyorsa onunla devam edeceğim. Bir kez ve dört çalışma oluşturma hakkı tanıyacağım. İlk çalışmamda Ozan Sihay videosundan görüp çok beğendiğim 23 Nisan ile ilgili görseller oluşturacağım.

Kullandığım Promt: celebration in Turkey, happy and modern children in the street, Turkish flags, confetti, hyper detailed, ultra realistic, photography

Promptu seçmemdeki amaç hem kalabalık insan topluluklarında hem de insan anatomisinde neler yapabildiklerini gözlemlemek olacak. Günümüz görsel oluşturan yapay zeka modellerinin tümünde insan anatomisinde zorlandıklarını gözlemliyoruz özellikle el gibi karmaşık yapılar buna çok bariz bir örnek olacaktır. Bu nedenle, yapay zeka modellerinin sınırlarını zorlamak için insan anatomisini kullanacağız. Değerlendirmeyi yazının sonunda yapacağım. Hadi başlayalım.

1. İlk çalışmamızı LeonardoAI ile oluşturacağız. Ücretsiz bir "text to image" sitesi olan LeonardoAI oluşturulan görselleri düzenleyebileceğiniz farklı araçlar da sunuyor. Model olarak "Leonardo Diffusion" kullandım.





2. İkinci durağımızda bizi Microsoft Bing Görüntü Oluşturucu karşılıyor. Bing ilk duyurulan text to image yapay zeka teknolojilerinden biri olan Dall-E desteğiyle geliyor ve ücretsiz bir şekilde kullanılabiliyor.






3. Üçüncü sitemiz Playgroundai. Bu sitemiz de ücretsiz. İçerisinde Stable Diffusion 1.5, 2.1 ve Dall-E 2 modelleri de mevcut ama ben "Playground v1" olan  kendi modelini kullandım. 






4. Dördüncü sitemiz DreamStudio. Bu sitemiz de görseli ücretsiz üretiyor. İçerisinde Editörü de var. SDXL (Beta) modelini kullandım.





5. Beşinci deneğimiz sayfamıza da adını veren Stable Diffusion. Ücretsiz bir yapay zeka modeli olan Stable Diffusion kişisel bilgisayarın gücüyle üretim yapıyor. İyi bir ekran kartınız varsa güzel ve hızlı sonuçlar alabilirsiniz. Ayrıca yüzlerce modelden istediğinizi indirip yükleyerek farklı sonuçlar da çıkarabilirsiniz. Kullandığım model "v2-1_768-ema-pruned".






6. Altıncı sırada Lexica var. Lexica hem promptlar bulabileceğiniz hem de üretim yapabileceğiniz bir site olarak karşımıza çıkıyor. Üretimde "Lexica Aperture v3" modelini kullandım. V2 modeli de gayet iyi sonuçlar veriyor.





7. Yedinci sırada Stable Diffusion'ın rakibi olarak karşımıza çıkan Kandinsky 2.1. Kandinsky'nin farklı yönü size boş bir tuval ve üzerinde boyutlarını ayarlayabileceğiniz kutucuklar vermesi. Kullanımı ücretsiz olup içerisinde editörü de mevcut. Online versiyonu olmakla birlikte local versiyonu da bulunmakta.





8. Sekizinci sırada Adobe Firefly var. Henüz beta aşamasında olan Firefly Photoshop'un beta sürümünde de kullanıcıyla buluştu. Yani şuan hem web hem de Photoshop beta versiyonunda kullanılabilir durumda. Henüz mükemmel olmasa da Adobe'den beklenti çok yüksek.






9. Sıradaki modelimiz Midjourney gibi Discord üzerinden çalışan ama ücretsiz olan BlueWillow. Midjourney' rakip olarak geliştirilen henüz beta aşamasında olan BlueWillow süreç içinde iyi bir ivme yakaladı.






10. Son olarak onuncu modelimiz ismini en çok duyduğumuz Dall-E. Çıktığı dönemde adından çokça söz ettiren Dall-E çıkışındaki hızı sonradan sürdüremedi.






Değerlendirmeye gelecek olursak promptumuzun zor ve kısa olduğunun farkındayım. Az lafla çok iş yaptırmaya çalıştık. Her yapay zeka modeli bu kadar kısa promptla iyi işler çıkaramayabilir. Yazıya başlamadan acaba doğru mu yaptım sonuç alabilecek miyim diye düşünmedim değil. Ama arada bazı modellerin mükemmel işler çıkardığını görünce demek ki yapılıyormuş dedim. 
Önce ne istediğimize bakalım. Türkiye'de geçen bir kutlama sahnesi istedik. Sokakta mutlu çocuklar ve Türk bayrakları. Detaylı, gerçekçi ve fotografik olmasını istedik. 
Çıkan görselleri incelediğimizde LeonardoAI ve Lexica haricinde çocuk portresi oluşturabilen model çıkmadı. LeonardoAI' ın çıkardığı kalabalık modeller gayet başarılı ve fotografik görüntüye daha yakın. Lexica'nın oluşturduğu portreler de başarılı ama biraz daha illüstratif kalıyor.
İkinci değineceğimiz nokta da detay olarak Türk bayrakları istemiştik. Bing, DreamStudio, Adobe Firefly, BlueWillow ve Dall-E bazı görsellerinde doğru Türk bayrakları oluşturabildi.
Sonuç olarak bu yapay zeka modellerinin hepsi henüz geliştirme veya beta sürecindeler. Amacım modelleri yarıştırmak değil belli dönemlerde burada bahsettiğim veya sonradan aramıza katılacak yapay zeka modellerinin gelişimlerini izlemek. Siz de fikirlerinizi yorum kısmında belirtebilirsiniz. Sonuna kadar okuduğunuz için teşekkürler.


Yorum Gönder

0Yorumlar
Yorum Gönder (0)