Şimdi Ara

FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor

Daha Fazla
Bu Konudaki Kullanıcılar: Daha Az
2 Misafir (1 Mobil) - 1 Masaüstü1 Mobil
5 sn
10
Cevap
0
Favori
485
Tıklama
Daha Fazla
İstatistik
  • Konu İstatistikleri Yükleniyor
4 oy
Öne Çıkar
Sayfa: 1
Giriş
Mesaj
  • FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor
    Yapay zeka görüntü oluşturucu araçlarda rekabet oldukça yüksek ve oyuna yeni birisi daha dahil oluyor: FLUX.1. Black Forest Labs adındaki Almanya merkezli bir girişim tarafından ortaya konan metinden görüntüye yapay zeka modeli FLUX.1, adından oldukça söz ettirecek gibi. Zira bu şirket Stable Diffusion'ın arkasındaki teknolojiyi geliştiren ve Latent Diffusion tekniğini icat eden araştırmacılar tarafından kurulmuş durumda ve FLUX.1 daha başlangıç.



    Güle güle Midjourney



    Black Forest Labs, çok kısa bir süre önce üç FLUX.1 metinden görüntüye modelini piyasaya sürdü: üst düzey bir ticari "pro" sürümü, ticari olmayan kullanım için açık ağırlıklara sahip orta sınıf bir "dev" sürümü ve daha hızlı olan açık "schnell" sürümü. Firma, kendi modellerinin görüntü kalitesi ve metin komutlarına bağlılık gibi alanlarda Midjourney ve DALL-E gibi rakiplerinden daha iyi olduğunu söylüyor. Bu arada daha önceki benzer haberlerimizde olduğu gibi, haber içindeki tüm görseller ilgili yapay zekaya ait.



    Ayrıca Bkz.OpenAI destekli yeni insansı robot Figure 02 tanıtıldı



    Açıkçası everart.ai (bunun yerine Fal ve Replicate de kullanabilirsiniz) üzerinden yaptığım denemelerde firmanın bu söyleminin boş olmadığını anladım. FLUX.1, görsel kalite açısından Midjourney 6'ya çok yakın ve bazen daha iyi. İstemlerdeki doğruluk da DALL-E 3 kadar iyi ve tam olarak ne isteniyorsa onu verebiliyor.



    FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor



    FLUX.1 modelleri, şirketin transformatör ve difüzyon tekniklerini birleştiren ve 12 milyar parametreye kadar ölçeklendirilen "hibrit mimari" olarak adlandırdığı bir mimari kullanıyor. FLUX.1 modelleri ayrıca diğer çoğu yapay zeka modelinin zayıf kaldığı insan eli konusunda muazzam işler çıkarıyor. İlk başlarda tüm yapay zekalar insan eli üretiminde sınıfta kalıyordu ancak günümüzde Midjourney gibi araçlar insan elinde ustalaşmış durumda. FLUX.1 ise açık bir model olduğu için insan elindeki ustalığı biraz daha fazla önem arz ediyor.



    Sırada Sora rakibi SOTA var



    FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor
    Black Forest Labs, yapay zeka alanında yeni bir şirket olsa da firmanın adını gelecekte daha sık duyabiliriz. Pazara üst seviyeden hızlı bir giriş yapan şirket, yakında SOTA adında metinden videoya yapay zekasını tanıtacak. SOTA, günümüzün popüler yapay zekaları OpenAI Sora, Runway Gen3-Alpha veya KLING ile mücadele edecek. Aşağıdaki galeriden daha fazla FLUX.1 örneğine göz atabilirsiniz.





    Resim Galerisi

    Resimin Açıklaması
    FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor
    FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor
    FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor
    FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor
    FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor
    FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor
    FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor
    FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor
    FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor
    FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor
    FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor
    FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor
    FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor
    FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor
    FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor



    Kaynak:https://arstechnica.com/information-technology/2024/08/flux-this-new-ai-image-generator-is-eerily-good-at-creating-human-hands/
    Kaynak:https://blackforestlabs.ai/







  • Bunun nedenlerinden biri insan elinin kendi karmaşıklığında yatıyor. Çeşitli şekil ve boyutlarda birden fazla öğeden oluşan ellerin yapısı inanılmaz derecede karmaşıktır, biz insanlar bunu hafife alsak da durum bu. Parmaklar, avuç içleri, eklemler, tendonlar ve diğer bileşenler birbirine bağımlı olarak hareket ediyor. Elleri gerçekçi bir şekilde çizmek için, modelin elin parçalarındaki doğal varyasyonların geniş yelpazesini öğrenmesi ve tıpkı insanlar gibi bu öğeler arasındaki mekansal ilişkileri anlaması gerekir. İnsan eli tokalaşma sırasında farklı, bir bardağı tutarken farklı, bir çay kaşığını tutarken farklı varyasyonlarda olabiliyor. Yapay zeka modelleri bu desenleri öğrenebilir ancak unutmayın, insan eli dediğimiz olguyu anlayamaz, kavrayamaz.


    Bir diğer etken ise ellerin kişiden kişiye değişkenliği. Farklı bireylerin farklı el oranları, boyutları ve hatta şekilleri var. Dolayısıyla her el tipini bir modele öğretmek muazzam bir veri kümesi gerektirir. Buna bir de modelin esasında herhangi bir şey bilmediğini ekleyin. Yani modeller insan elinin aslında 5 tane parmaktan oluştuğunu bile gerçekte bilmiyor.

    Midjourney, Dall-E veya Flux esasında bir difüzyon modelidir. Difüzyon modelleri, veri üreterek ya da dönüştürerek yapay zeka modellerinin içerik üretmesine olanak tanıyan bir yaklaşım olarak düşünülebilir. Bu modeller, veriyi adım adım iyileştirerek ya da gürültü ekleyip çıkararak hedef veriyi üretir. Bu üretimin kalitesi de modelin eğitim kümesiyle doğrudan ilişkili. Bildiğiniz gibi modeller genellikle internetteki görseller üzerinde eğitiliyor. Bu görsellerde insan yüzleri, gövdesi veya saçları oldukça barizdir. Ancak insan elleri görsellerde süreli olarak farklı pozisyon ve açılarda olabiliyor. Bu da  insan eli gibi nesnelerin temsillerinin sınırlı olmasına neden oluyor.


    Dediğimiz gibi Difüzyon modelleri, genellikle veriyi adım adım dönüştürerek çalışır. Bu süreçte eklenen veya çıkarılan gürültü, karmaşık ve ince detaylı yapılar üzerinde bozulmalara neden olabilir. İnsan eli, parmak izi desenlerinden tırnaklara, damarlardan eklemlere kadar inanılmaz bir detay seviyesine sahip. Difüzyon modelleri, bu kadar ince detayları tutarlı bir şekilde üretmekte henüz tam olarak başarılı olamıyor. Dolayısıyla eller bozulma konusuna eğilimliler.


    Bir elin sadece bir nesne değil, aynı zamanda bir kavram olduğunu unutmamak gerekiyor. Bir el, bir nesneyle etkileşime girdiğinde, o nesnenin özelliklerine göre şekil değiştirir. Bu tür anlamsal kavramayı modellere öğretmek maliyetli bir süreç. İmkansız mı? Elbette değil. En basit çözümü veri kümesini büyütmek. Ayrıca 2D görüntülerin yanı sıra 3D modelleme verileri de kullanılabilir. El hareketlerinin fiziksel simülasyonları kullanılabilir.

  • Lan nereye gidecek bu ai resim video ses olayı. Bir kaç yıl sonra filmleri vs her şeyi bütçe gerektirmeden yapacakar gibi. Gerçekliği sorgulatacaklar ciddi ciddi.

    < Bu ileti Android uygulamasından atıldı >
  • Diğerleri insan elini oluştururken neden saçmalıyor peki, olay ne? Kodlar mı karışık?

    Yani kafayı veya yüzü oluşturuyor ama ellerde neden saçmalıyor, mesela neden saçları oluştururken saçmalamıyor da eller? İzah ediniz.

  • V4LKyR V kullanıcısına yanıt

    Bunun nedenlerinden biri insan elinin kendi karmaşıklığında yatıyor. Çeşitli şekil ve boyutlarda birden fazla öğeden oluşan ellerin yapısı inanılmaz derecede karmaşıktır, biz insanlar bunu hafife alsak da durum bu. Parmaklar, avuç içleri, eklemler, tendonlar ve diğer bileşenler birbirine bağımlı olarak hareket ediyor. Elleri gerçekçi bir şekilde çizmek için, modelin elin parçalarındaki doğal varyasyonların geniş yelpazesini öğrenmesi ve tıpkı insanlar gibi bu öğeler arasındaki mekansal ilişkileri anlaması gerekir. İnsan eli tokalaşma sırasında farklı, bir bardağı tutarken farklı, bir çay kaşığını tutarken farklı varyasyonlarda olabiliyor. Yapay zeka modelleri bu desenleri öğrenebilir ancak unutmayın, insan eli dediğimiz olguyu anlayamaz, kavrayamaz.


    Bir diğer etken ise ellerin kişiden kişiye değişkenliği. Farklı bireylerin farklı el oranları, boyutları ve hatta şekilleri var. Dolayısıyla her el tipini bir modele öğretmek muazzam bir veri kümesi gerektirir. Buna bir de modelin esasında herhangi bir şey bilmediğini ekleyin. Yani modeller insan elinin aslında 5 tane parmaktan oluştuğunu bile gerçekte bilmiyor.

    Midjourney, Dall-E veya Flux esasında bir difüzyon modelidir. Difüzyon modelleri, veri üreterek ya da dönüştürerek yapay zeka modellerinin içerik üretmesine olanak tanıyan bir yaklaşım olarak düşünülebilir. Bu modeller, veriyi adım adım iyileştirerek ya da gürültü ekleyip çıkararak hedef veriyi üretir. Bu üretimin kalitesi de modelin eğitim kümesiyle doğrudan ilişkili. Bildiğiniz gibi modeller genellikle internetteki görseller üzerinde eğitiliyor. Bu görsellerde insan yüzleri, gövdesi veya saçları oldukça barizdir. Ancak insan elleri görsellerde süreli olarak farklı pozisyon ve açılarda olabiliyor. Bu da  insan eli gibi nesnelerin temsillerinin sınırlı olmasına neden oluyor.


    Dediğimiz gibi Difüzyon modelleri, genellikle veriyi adım adım dönüştürerek çalışır. Bu süreçte eklenen veya çıkarılan gürültü, karmaşık ve ince detaylı yapılar üzerinde bozulmalara neden olabilir. İnsan eli, parmak izi desenlerinden tırnaklara, damarlardan eklemlere kadar inanılmaz bir detay seviyesine sahip. Difüzyon modelleri, bu kadar ince detayları tutarlı bir şekilde üretmekte henüz tam olarak başarılı olamıyor. Dolayısıyla eller bozulma konusuna eğilimliler.


    Bir elin sadece bir nesne değil, aynı zamanda bir kavram olduğunu unutmamak gerekiyor. Bir el, bir nesneyle etkileşime girdiğinde, o nesnenin özelliklerine göre şekil değiştirir. Bu tür anlamsal kavramayı modellere öğretmek maliyetli bir süreç. İmkansız mı? Elbette değil. En basit çözümü veri kümesini büyütmek. Ayrıca 2D görüntülerin yanı sıra 3D modelleme verileri de kullanılabilir. El hareketlerinin fiziksel simülasyonları kullanılabilir.





  • V4LKyR V kullanıcısına yanıt




  • Metin Yasir Akpınar kullanıcısına yanıt
    O kadar doyurucu bir cevap kaleme almışsın ki , keşke yapay zeka hakkında
    (DH 'de Yapay Zeka haberleri sekmesi altında bu teknolojinin tarihçesi ,metotları ,terminolojisi ve mantığı hakkında wiki tarzında...) bir kaynakça olsa da bunu sen yapsan diye beklenti oluştu .

    Yok artık diyeceksin ancak , böyle karmaşık sayılabilecek bir konuyu gayet sarih bir şekilde açıklamak her editörün harcı değil ...

    Teşekkürler.

  • sendemail kullanıcısına yanıt
    Yorumunuz için çok teşekkürler, onore ettiniz. Aslında haklısınız, özellikle terminoloji tarafını doldurmak gerekiyor. Not alayım bunu :)

  • Yapay Zeka’dan İlgili Konular
    Daha Fazla Göster
  • Metin Yasir Akpınar kullanıcısına yanıt

    10 seneden fazladır bu forumdayım, şunun gibi kaliteli izahat - hem de kusursuz bir imla ile - görmedim, teşekkür ediyorum Yasir hocam, saygılar.

  • Yalnız bütün görseller o kadar iyi ki...

  • 
Sayfa: 1
- x
Bildirim
mesajınız kopyalandı (ctrl+v) yapıştırmak istediğiniz yere yapıştırabilirsiniz.