Şimdi Ara

FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor

Sıcak Fırsatlarda Tıklananlar

Editörün Seçtiği Fırsatlar

Daha Fazla

Bu Konudaki Kullanıcılar: Daha Az

2 Misafir (1 Mobil) - 1 Masaüstü,

1 Mobil

5 sn

10
Cevap

0
Favori

485
Tıklama

Daha Fazla
İstatistik

Konu İstatistikleri Yükleniyor

Konuya Özel

4 oy

Öne Çıkar

Cevapla

Sayfa: 1

Giriş

Mesaj

Metin Yasir Akpınar

Haber Editörü

7781 Mesaj

Tüm Başarılarını Gör

ANASAYFA GÖRÜNÜMÜNE GEÇ

FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor — Yapay zeka görüntü oluşturucu araçlarda rekabet oldukça yüksek ve oyuna yeni birisi daha dahil oluyor: **FLUX.1**. **Black Forest Labs** adındaki Almanya merkezli bir girişim tarafından ortaya konan metinden görüntüye yapay zeka modeli FLUX.1, adından oldukça söz ettirecek gibi. Zira bu şirket **Stable Diffusion**'ın arkasındaki teknolojiyi geliştiren ve **Latent Diffusion** tekniğini icat eden araştırmacılar tarafından kurulmuş durumda ve FLUX.1 daha başlangıç.

Güle güle Midjourney

Black Forest Labs, çok kısa bir süre önce üç FLUX.1 metinden görüntüye modelini piyasaya sürdü: üst düzey bir ticari "pro" sürümü, ticari olmayan kullanım için açık ağırlıklara sahip orta sınıf bir "dev" sürümü ve daha hızlı olan açık "schnell" sürümü. Firma, kendi modellerinin görüntü kalitesi ve metin komutlarına bağlılık gibi alanlarda Midjourney ve DALL-E gibi rakiplerinden daha iyi olduğunu söylüyor. Bu arada daha önceki benzer haberlerimizde olduğu gibi, haber içindeki tüm görseller ilgili yapay zekaya ait.

Ayrıca Bkz.OpenAI destekli yeni insansı robot Figure 02 tanıtıldı

Açıkçası everart.ai (bunun yerine Fal ve Replicate de kullanabilirsiniz) üzerinden yaptığım denemelerde firmanın bu söyleminin boş olmadığını anladım. FLUX.1, görsel kalite açısından Midjourney 6'ya çok yakın ve bazen daha iyi. İstemlerdeki doğruluk da DALL-E 3 kadar iyi ve tam olarak ne isteniyorsa onu verebiliyor.

FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor

FLUX.1 modelleri, şirketin transformatör ve difüzyon tekniklerini birleştiren ve 12 milyar parametreye kadar ölçeklendirilen "hibrit mimari" olarak adlandırdığı bir mimari kullanıyor. FLUX.1 modelleri ayrıca diğer çoğu yapay zeka modelinin zayıf kaldığı insan eli konusunda muazzam işler çıkarıyor. İlk başlarda tüm yapay zekalar insan eli üretiminde sınıfta kalıyordu ancak günümüzde Midjourney gibi araçlar insan elinde ustalaşmış durumda. FLUX.1 ise açık bir model olduğu için insan elindeki ustalığı biraz daha fazla önem arz ediyor.

Sırada Sora rakibi SOTA var

Resim Galerisi

Galeri16 Görsel

Kaynak:https://arstechnica.com/information-technology/2024/08/flux-this-new-ai-image-generator-is-eerily-good-at-creating-human-hands/
Kaynak:https://blackforestlabs.ai/

En Beğenilen Yanıtlar

Tüm Yanıtları Genişlet

Bunun nedenlerinden biri insan elinin kendi karmaşıklığında yatıyor. Çeşitli şekil ve boyutlarda birden fazla öğeden oluşan ellerin yapısı inanılmaz derecede karmaşıktır, biz insanlar bunu hafife alsak da durum bu. Parmaklar, avuç içleri, eklemler, tendonlar ve diğer bileşenler birbirine bağımlı olarak hareket ediyor. Elleri gerçekçi bir şekilde çizmek için, modelin elin parçalarındaki doğal varyasyonların geniş yelpazesini öğrenmesi ve tıpkı insanlar gibi bu öğeler arasındaki mekansal ilişkileri anlaması gerekir. İnsan eli tokalaşma sırasında farklı, bir bardağı tutarken farklı, bir çay kaşığını tutarken farklı varyasyonlarda olabiliyor. Yapay zeka modelleri bu desenleri öğrenebilir ancak unutmayın, insan eli dediğimiz olguyu anlayamaz, kavrayamaz.

Bir diğer etken ise ellerin kişiden kişiye değişkenliği. Farklı bireylerin farklı el oranları, boyutları ve hatta şekilleri var. Dolayısıyla her el tipini bir modele öğretmek muazzam bir veri kümesi gerektirir. Buna bir de modelin esasında herhangi bir şey bilmediğini ekleyin. Yani modeller insan elinin aslında 5 tane parmaktan oluştuğunu bile gerçekte bilmiyor.

Midjourney, Dall-E veya Flux esasında bir difüzyon modelidir. Difüzyon modelleri, veri üreterek ya da dönüştürerek yapay zeka modellerinin içerik üretmesine olanak tanıyan bir yaklaşım olarak düşünülebilir. Bu modeller, veriyi adım adım iyileştirerek ya da gürültü ekleyip çıkararak hedef veriyi üretir. Bu üretimin kalitesi de modelin eğitim kümesiyle doğrudan ilişkili. Bildiğiniz gibi modeller genellikle internetteki görseller üzerinde eğitiliyor. Bu görsellerde insan yüzleri, gövdesi veya saçları oldukça barizdir. Ancak insan elleri görsellerde süreli olarak farklı pozisyon ve açılarda olabiliyor. Bu da insan eli gibi nesnelerin temsillerinin sınırlı olmasına neden oluyor.

Dediğimiz gibi Difüzyon modelleri, genellikle veriyi adım adım dönüştürerek çalışır. Bu süreçte eklenen veya çıkarılan gürültü, karmaşık ve ince detaylı yapılar üzerinde bozulmalara neden olabilir. İnsan eli, parmak izi desenlerinden tırnaklara, damarlardan eklemlere kadar inanılmaz bir detay seviyesine sahip. Difüzyon modelleri, bu kadar ince detayları tutarlı bir şekilde üretmekte henüz tam olarak başarılı olamıyor. Dolayısıyla eller bozulma konusuna eğilimliler.

Bir elin sadece bir nesne değil, aynı zamanda bir kavram olduğunu unutmamak gerekiyor. Bir el, bir nesneyle etkileşime girdiğinde, o nesnenin özelliklerine göre şekil değiştirir. Bu tür anlamsal kavramayı modellere öğretmek maliyetli bir süreç. İmkansız mı? Elbette değil. En basit çözümü veri kümesini büyütmek. Ayrıca 2D görüntülerin yanı sıra 3D modelleme verileri de kullanılabilir. El hareketlerinin fiziksel simülasyonları kullanılabilir.

Yorumun Devamı

TncyKrmn

Yarbay

3311 Mesaj

Tüm Başarılarını Gör

V4LKyR

Yarbay

9606 Mesaj

Tüm Başarılarını Gör

Metin Yasir Akpınar

Haber Editörü

7781 Mesaj

Tüm Başarılarını Gör

V4LKyR V kullanıcısına yanıt

smart1978

Yarbay

24084 Mesaj

Tüm Başarılarını Gör

V4LKyR V kullanıcısına yanıt

sendemail

Yarbay

3153 Mesaj

Tüm Başarılarını Gör

Metin Yasir Akpınar

kullanıcısına yanıt

Metin Yasir Akpınar

Haber Editörü

7781 Mesaj

Tüm Başarılarını Gör

sendemail

kullanıcısına yanıt

V4LKyR

Yarbay

9606 Mesaj

Tüm Başarılarını Gör

Metin Yasir Akpınar

kullanıcısına yanıt

Bloodin

Yarbay

5801 Mesaj

Tüm Başarılarını Gör

Sayfa: 1

Benzer içerikler

Ip işlemleri

Bu mesaj IP'si ile atılan mesajları ara Bu kullanıcının son IP'si ile atılan mesajları ara Bu mesaj IP'si ile kullanıcı ara Bu kullanıcının son IP'si ile kullanıcı ara

KAPAT X

%40
Kazan

%2,8
Kazan

%6,5
Kazan

%25
Kazan

%1,6
Kazan

%3,2
Kazan

%5,5
Kazan

%3,2
Kazan

%5
Kazan

%3,2
Kazan

%5
Kazan

%2
Kazan

Alışveriş Yaptıkça Para Kazan Harekete Geç »