Stability AI'ın yeni ve en gelişmiş metinden görüntüye modeli: SD3 Medium

Teknoloji

Moderator
Stability AI'ın yeni yapay zeka modeli Stable Diffusion 3'den sizlere bahsetmiştik. Stability AI, dün paylaştığı bir gönderi ile Stable Diffusion 3 serisinin en geliş modeli Stable Diffusion 3 Medium'u tanıttı.

2 milyar parametreye sahip olan bu yeni model, foto gerçekçi görüntü üretimi özelliklerini desteklemesiyle eller ve yüzlerdeki yaygın yapaylıkların üstesinden geliyor. Ayrıca karmaşık kullanıcı metin istemlerine ve stillerine uyarken, yazım hataları olmadan metni anlayabiliyor ve oluşturabiliyor. Stable Diffusion 3 Medium'un yüksek kaynak verimliliğiyle öne çıktığını belirtelim.


Hatırlarsanız, üretilen görsellerde düzgün tipografiler elde edilmesini amaçlayan Stable Diffusion 3, OpenAI'ın Sora modelinde kullandığı yeni diffusion transformer mimarisine sahip olduğunu daha önce sizlere aktarmıştık. Şirket bu konuda SD3 Medium'un çok daha iyi sonuçlar elde ettiğini iddia ediyor. Bu sonuçların başarısını ise diffusion transformer mimarisine bağlıyor.

Söz konusu ince ayar yapmak olduğunda kullanıcılar, çıktılarını özelleştirmek için küçük veri kümeleri kullanarak modeli hızlıca ayarlayabiliyor. Eğer modeli, belirli bir tema veya görsel üzerinde eğitmek istediğniz halde, üzerinde çalışılması için fazla görüntü örneğine sahip değilseniz, modelin küçük veri kümleriyle ilerlemesi avantajlı oluyor.

SD3 Medium'un parametre boyutunun daha küçük olması, 800 milyon ila 8 milyar parametre ağırlığındaki daha ağır modellere kıyasla daha yoğun olmasını sağlıyor. Böylece daha küçük VRAM ayak izinden kaynaklanan performans düşüşü bertaraf edilerek kişisel bilgisayarlarda çalışacak şekilde optimize edilebiliyor.

Stability AI, tüm Stability Diffusion modellerinin performansını artırmak için Nvidia RTX GPU'lar ve TensorRT'den yararlanıyor. Stability AI'ın bu alanda Advanced Micro Devices Inc. ile iş birliği yaptığını belirtmekte fayda var.

Stable Diffusion 3'ye erişmek isteyen geliştiriciler, model serisini şirketin uygulama programlama arayüzü aracılığıyla kullanabiliyor. Ayrıca Stable Diffusion 3 model ağırlıklarının topluluğa açık kaynak olarak sunulduğunu ekleyelim.

Bir süredir sanatçılarla dava sürecinde olan Stability AI, aynı zamanda nakit sıkıntısı çektiği haberleriyle de gündeme gelmekte. Mart ayında şirketin CEO'su ve kurucusu Emad Mostaque'in şirketten ayrılması ise bu sıkıntıları doğrular nitelikte. Yine de modellerini ileri taşımak için elinden geleni yapan şirket, önümüzdeki dönemde video, ses ve dil genelinde çok modlu geliştirmelere odaklanacak.
 
Geri
Üst