Üye Girişi

Bağlan

Yeni Kayıt

Derinlemesine: OpenAI Sora ile yapılan akılalmaz örnekler, detaylar ve endişeler

Sıcak Fırsatlarda Tıklananlar

Editörün Seçtiği Fırsatlar

PUMA NRGY Comet Running Shoes Futbol AyakkabısıUnisex Yetişkin : Amazon.com.tr: Moda https://www.amazon.com.tr/dp/B0C9VW77H2 8 sa. önce paylaşıldı

ATTACK SHARK X2 Pro Kablosuz Gaming Mouse, Şarj İstasyonlu, Sessiz Bluetooth Oyuncu Mouse, Tri-Mod (BT5.0/2.4G/Fillaire) Ergonomik RGB Mouse 4000 DPI, PixART PAW3212, Şeffaf Kabuklu, PC/Mac, Siyah : Amazon.com.tr: Bilgisayar https://www.amazon.com.tr/dp/B0CGCGDG8C 8 sa. önce paylaşıldı

HOKA HOKA W SPEEDGOAT 5 1123158 Spor AyakkabıKadın : Amazon.com.tr: Moda https://www.amazon.com.tr/dp/B09KTVQDLP 8 sa. önce paylaşıldı

Daha fazla göster butonu

Daha Fazla

Bu Konudaki Kullanıcılar: Daha Az

2 Misafir - 2 Masaüstü

5 sn

27
Cevap

1
Favori

3.041
Tıklama

Daha Fazla
İstatistik

Konu İstatistikleri Yükleniyor

Konuya Özel

31 oy

Öne Çıkar

Sayfa: 1 2

sonraki

Giriş

Mesaj

Metin Yasir Akpınar

Haber Editörü

8237 Mesaj

Tüm Başarılarını Gör

ANASAYFA GÖRÜNÜMÜNE GEÇ

ChatGPT ve DALL-E geliştiricisi OpenAI, Sora adında yepyeni bir yapay zeka aracı tanıttı. Sadece yazıları kullanarak onlardan bir video oluşturan Sora, yetenekleri ile şimdiden herkesi büyülemiş durumda. Akıl almaz derecede gerçekçi sonuçlar ortaya koyan Sora, bir yandan teknolojinin gelişim hızını ortaya koyarken bir yandan da endişe ve korkuyu beraberinde getiriyor. Gelin Open Sora nedir? Bizleri ne gibi tehlikeler bekliyor? gibi sorulara cevaplar ararken araca bir göz atalım.

OpenAI'ın sohbet robotlarının hukuk fakültesine gitmeden baro sınavını geçebildiğini zaten biliyoruz. Şimdi ise Sora adlı yeni bir OpenAI aracı, okula gitmeden ve hiçbir eğitim almadan sinemada usta olduğunu bizlere gösteriyor. Şimdilik bir araştırma ürünü olan Sora, birkaç seçkin içerik üreticisine ve bir dizi güvenlik uzmanına sunuluyor.

OpenAI Sora Nedir?

OpenAI Sora kısaca, metinsel istemlerden videolar oluşturan yeni üretken yapay zeka modelidir.

Google gibi devlerden Runway gibi startup'lara kadar pek çok şirket metinden videoya yapay zeka araçlarını bir süre önce duyurdu. Google’in Lumiere aracı açıkçası benim şimdiye kadar gördüğüm en yetkin modeldi. Ancak Sora ile onu kıyaslamak mümkün bile değil.

Sora, çarpıcı fotogerçekçiliğiyle (rakiplerinde görmediğim bir şey) ve diğer modellerin tipik olarak yaptığı kısa parçalardan daha uzun, bir dakikaya kadar klipler üretebilmesiyle öne çıkıyor. Şimdilik bir videonun ne kadar sürede oluşturulduğu hiçbir yerde yazmıyor ancak anlaşıldığı üzere 1 dakikalık video için birkaç dakikadan fazla beklemek gerekecek.

Sahneler kesinlikle etkileyici olsa da, Sora'nın yetenekleri arasında en şaşırtıcı olanı, eğitimini almadığı yetenekler. OpenAI'nin Dall-E 3 görüntü oluşturucusu tarafından kullanılan difüzyon modelinin bir versiyonunun yanı sıra GPT-4'ün transformatör tabanlı motorundan güç alan Sora, yalnızca istemlerin taleplerini yerine getiren videolar üretmekle kalmıyor, aynı zamanda bunu sinematik grameri temel alarak yapıyor. Bu da bir hikayeyi anlatmak için olmazsa olmazlardan. Bunun ikinci bir anlamı da Sora, girilen istemi parça parça üretip sonradan birleştirmiyor, tüm sahneyi tek seferde oluşturuyor.

Sora'da OpenAI ekibinin göstermediği ve bir süre daha gösterilmeyecek olan bir özellik de var. Sora aslında tek bir fotoğraf veya bir dizi fotoğraftan video oluşturabiliyor. Yani, Rize, Ayder Yaylası’na gidip manzaranın fotoğrafını çektiniz. Bunu Sora’ya yükleyebilecek ve orada geçen hikayenizin anlatılmasını sağlayabileceksiniz.

Sora’yı nasıl deneyebilirim?

Çoğumuz yeni yapay zeka modelini elimize almadan önce beklemek zorunda kalacağız. Şirket, metinden videoya modelini 15 Şubat'ta duyurmuş olsa da, henüz araştırma ve test aşamasında bulunuyor. OpenAI, az sayıda kişi ile birlikte sistemdeki güvenlik açıklarını ve zayıflıkları belirlemek için gerçek dünya kullanımını simüle ediyor.

Bu süre zarfında modelin profesyoneller için en yararlı olacak şekilde nasıl geliştirileceği konusunda geri bildirim almak için bir dizi görsel sanatçıya, tasarımcıya ve film yapımcısına erişim izni de verildi. Sora için net bir çıkış tarihi veya açık beta kullanımı için bir bilgi yok. Ancak bu süre çok da uzun sürmeyecektir.

Sora nasıl çalışıyor?

OpenAI, Sora’nın nasıl çalıştığı hakkında ayrıntılı bir rapor yayınlamış olsa da bunu size daha anlaşılır şekilde aktarmak daha doğru olacaktır.

Derinlemesine: OpenAI Sora ile yapılan akılalmaz örnekler, detaylar ve endişeler — Çoğumuz eski, parazitli, zaman zaman bulanık olan o eski TV’leri ve çanak antenleri hatırlıyordur. Görüntüyü netleştirmek için çanakta ince ayarlar yapmak gerekirdi. OpenAI’ın Sora yapay zekası da bu şekilde çalışıyor temelde. Sizin girdiğiniz prompt’u yani istemi, öncelikle analiz ederek anlamlandırıyor. Analize dayanılarak akabinde bir senaryo oluşturuluyor. Bu senaryoya uygun sahneler üretiliyor ve üretim tek seferde gerçekleştiriliyor. Yukarıda da dediğimiz gibi, Sora, diğerleri gibi “bir sahne üret ve mükemmelleştir” yaklaşımını benimsemiyor. Tüm sahneyi, eğitim verisindeki her şeyle (yazılar, videolar, sesler, anlatımlar, araştırmalar, filmler, diziler vb.) değerlendirip, yorumlayıp tek seferde tüm sahneyi oluşturuyor.

Derinlemesine: OpenAI Sora ile yapılan akılalmaz örnekler, detaylar ve endişeler

Sora, istenilen videoyu tek seferde oluşturuyor dedik ama aslında nihai forma gelene kadar bazı düzeltmelerden de geçiriliyor bu video. Eski TV örneğinde verdiğimiz gibi Sora’nın ilk çıktısı gürültülü ve detaydan yoksun. Ancak sistem, gürültüyü kademeli olarak gidermek ve videolar oluşturmak için "transformatör mimarisi" kullanarak süreci yinelemeli olarak iyileştiriyor.

Kelimelere dayalı metin üreten GPT modellerini düşünün. Sora da benzer bir şey yapıyor ama görüntü ve videolarla. Videoları yama adı verilen daha küçük parçalara ayırıyor, yorumluyor, işliyor.

Derinlemesine: OpenAI Sora ile yapılan akılalmaz örnekler, detaylar ve endişeler

Görüntü ve video oluşturmaya yönelik geçmiş yaklaşımlar genellikle videoları standart bir boyuta yeniden boyutlandırıyordu: örneğin, 256x256 çözünürlükte 4 saniyelik videolar gibi. Sora ise geniş ekran 1920x1080p videoları, dikey 1080x1920 videoları veya aradaki her şeyi örnekleyebiliyor. Bu, Sora'nın farklı cihazlar için doğrudan kendi doğal en boy oranlarında içerik oluşturmasını sağlıyor. Ayrıca, tam çözünürlükte oluşturmadan önce içeriği daha düşük boyutlarda hızlı bir şekilde prototip haline getirebilmenizi sağlıyor.

Bu arada Sora’nın hangi veriler üzerinde eğitildiğini bilmiyoruz. OpenAI, “lisanslanan ve kamuya açık” terimini kullanıyor ama detay yok. OpenAI, kar amacı gütmeyen bir kuruluş olsa da bir süre önce raporlarında esas detayları paylaşmayı bırakmış durumda.

Mükemmel değil

Şirket blog yazısında mevcut modelin "zayıf yönleri" olduğunu kabul ediyor. Modelin karmaşık bir sahnenin fiziğini doğru bir şekilde simüle etmede zorluklarla karşılaşabileceği ve belirli neden ve sonuç örneklerini anlayamayabileceği belirtiliyor. Örneğin, bir kişi bir kurabiyeden bir ısırık alabilir, ancak daha sonra kurabiyede ısırık izi ortadan kaybolabilir veya hiç oluşmayabilir. Veya koşu bandında ters koşan birisini oluşturabilir... Nasrettin hoca?

Ayrıca, modelin mekansal detayları karıştırma veya zaman içinde gerçekleşen olayların hassas açıklamalarını takip etme konusunda zorlandığı da belirtiliyor.

Sora neler yapabiliyor?

Ve gelelim Sora’nın neler yapabildiğine. Açıkçası OpenAI’ın dün yayınladığı araştırma makalesini saatlerce inceledim, paylaşılan örneklere göz attım ve birtakım derlemeler yaptım. Hepsi muazzam görünüyor ve yapılabilecek şeylerin bir sınırı yok.

Genel hatlarla bakacak olursak Sora şunları yapabiliyor:

İstem ve resimden bir video üretimi

Derinlemesine: OpenAI Sora ile yapılan akılalmaz örnekler, detaylar ve endişeler

Kusursuz döngü videoları

Videodan videoya düzenleme

Videoları birbirine bağlama

3D video oluşturma

Dünya etkileşimi

Dijital dünya simülasyonu

(Evet, Minecraft yapıyor)

Endişeler ve tehlikeler

Tabii bu verdiğim örnekler teknolojinin “toz pembe” versiyonu. Bir devlet yetkilisi, ünlü veya sevmediğiniz bir kişinin görüntüsünü yükleyerek potansiyel olarak tehlikeli ve sakıncalı videoların üretilmesi de mümkün. OpenAI’ın Sora’yı genel kullanıma açmamasının ana nedeni de bu güvenlik endişesi. Sora genele açılmadan önce araştırmacılar ve test kullanıcıları bu açıkları OpenAI’a aktaracak ve firma da bu açıkları kapatacak.

Bir başka potansiyel sorun da Sora'nın ürettiği videonun içeriğinin başkalarının telif hakkıyla korunan çalışmalarını ihlal edip etmeyeceği. OpenAI, Sora’nın eğitim verilerinin lisanslanan içeriklerden ve kamuya açık içeriklerden oluştuğunu söylüyor.

Ancak temel sorunları görmemeye meyilliyiz insanlar olarak. OpenAI'nin yeni aracının potansiyel olarak nasıl kötüye kullanılabileceği zaten tamamen açık. Sora devasa ölçekte sahte içerik üretecek, bu çok açık. Bu içeriğin bir kısmının çevrimiçi siyasi dezenformasyon amacıyla kullanılması, bir kısmının varsayımsal olarak çeşitli dolandırıcılık ve sahtekarlıklara yardımcı olmak için kullanılması ve bir kısmının da nefret içerikleri üretmek için kullanılması muhtemel.

OpenAI şiddet ve cinsel içeriğe anlamlı sınırlamalar getirmek istediğini söylüyor. Hadi ama, daha birkaç hafta önce Taylor Swift olayını yaşadık, aynı şeyler bu modelde de olacak. Tüm bu Sora içeriklerinin sosyal medya kanallarını dolduracağı, sıradan insanların neyin gerçek neyin sahte olduğunu ayırt etmesini zorlaştıracağı ve genel olarak interneti çok daha can sıkıcı hale getireceği açık. Bunu söylemek için uzman olmaya gerek olduğunu sanmıyorum.

Kaynak:https://openai.com/research/video-generation-models-as-world-simulators
Kaynak:https://openai.com/sora#capabilities

En Beğenilen Yanıtlar

Tüm Yanıtları Genişlet

Grafiklerler başınız sağ olsun... Sıra bu gidişle yavaş yavaş herkese gelecek.

Yorumun Devamı

Güzel bir anlatım yapmış Barış hocam.

Yorumun Devamı

Emekli Yönetici

17628 Mesaj

Tüm Başarılarını Gör

Metin Yasir Akpınar

Haber Editörü

8237 Mesaj

Tüm Başarılarını Gör

XanthiN

kullanıcısına yanıt

Yarbay

3573 Mesaj

Tüm Başarılarını Gör

Teğmen

144 Mesaj

Tüm Başarılarını Gör

Yüzbaşı

316 Mesaj

Tüm Başarılarını Gör

Yüzbaşı

857 Mesaj

Tüm Başarılarını Gör

Yarbay

2882 Mesaj

Tüm Başarılarını Gör

Yüzbaşı

344 Mesaj

Tüm Başarılarını Gör

blackkugu61

Yüzbaşı

627 Mesaj

Tüm Başarılarını Gör

Teknoloji bilgini 68 T kullanıcısına yanıt

kakarikikiri

Binbaşı

1281 Mesaj

Tüm Başarılarını Gör

Binbaşı

1750 Mesaj

Tüm Başarılarını Gör

A.J. Pacino

Binbaşı

1344 Mesaj

Tüm Başarılarını Gör

boylum

kullanıcısına yanıt

Yüzbaşı

287 Mesaj

Tüm Başarılarını Gör

stealth_op S kullanıcısına yanıt

Bu kadar büyük etki oluşturacağını sanmıyorum. Promtlayarak içerik oluşturmak özellikle fantastik bir şeyler yapmak isteyen bir yönetmen için bence çok sığ alternatifler çıkarır. Bi de uzunluk, uzunluğa göre uyumluluk, tüm içeriğin tutarlı olması lazım uzun bir video'da mesela.

Yani 1 dakikalık video yapmak ile 2 saatlik bir film yapmak arasında fark var. Mesela 3 saat civarı süren Avatar'daki gibi fantazi bir dünyayı promtlayarak oluşturmak en fazla ne derece mümkün olabilir yapay zeka gelişse bile? Diyelim mümkün oldu, mutlaka şurayı çıkaralım, burayı uzatalım, şu kısmı kesip diğerinin önüne koyalım gibi sadece insan zekasının analitik düşünme ve mantık yürütebilme yetenekleri ile şekillenecek düzenlemelere her zaman ihtiyaç olur.

Profesyonel bir film yapmak instagram videosu yapmaya benzemiyor. Bu yapay zeka örnekleri hep instagramvari videolar fark ettiyseniz.

Örneğin Photoshop'ta bile bildiğim kadarıyla bir promtlama yapılıp fotoğraf oluşturulduğu zaman, karşımıza 3 tane alternatif sonuç çıkıyor. Bu alternatiflerin hiç biri yönetmenin aradığı görseli tam olarak karşılamadığında elle düzenlemeye gidilmesi lazım. Sadece insanların anlayıp insan aklıyla yapılabilecek özel düzenlemeler daima olur profesyonel çalışılıyorsa.

Yani illa ki işin kendisini yapmayı bilen birilerine ihtiyaç olur. Zaten düzgün bir promtlama yapmak için bile işin kendisini de biliyor olmak lazım. Yani örneğin ben yapay zekaya "bir web sitesi" tasarla diye promtlama yapabilirim teknik detaylara girmeden, ama bir web sitesi tasarımcısı çok daha fazla teknik detay vererek; istediği kod kümelerinin adını söyleyerek, fonksiyonlardan bahsederek promtlama yapabilir ve benim alacağımdan çok daha iyi profesyonel bir çıktı alır, ne kadar girdi verirsen o kadar iyi çıktı alırsın. İyi girdi vermek için girdi vereceğin alanın bilir kişisi olmak lazım. Ben ona şunu yap dicem o da süper bir şekilde yapacak tarzında bir şey değil bu yapay zeka.

Bu sebeplerden ötürü benim görüşüm yapay zeka insanların yerini %100 almaz ama insanların işini çok kolaylaştırır. Daha kısa zamanda daha fazla iş görülür. Bir şirket 50 kişi çalıştıracaksa 20 kişi yeterli hali gelir belki, bu tarz dezavantajları olur çok çok.

< Bu mesaj bu kişi tarafından değiştirildi kabus2224 -- 18 Şubat 2024; 2:35:55 >

kabus2224

kullanıcısına yanıt

Yarbay

8408 Mesaj

Tüm Başarılarını Gör

Yüzbaşı

461 Mesaj

Tüm Başarılarını Gör

Yarbay

7943 Mesaj

Tüm Başarılarını Gör

Sayfa: 1 2

sonraki

Benzer içerikler

Ip işlemleri

Bu mesaj IP'si ile atılan mesajları ara Bu kullanıcının son IP'si ile atılan mesajları ara Bu mesaj IP'si ile kullanıcı ara Bu kullanıcının son IP'si ile kullanıcı ara

x

%40
Kazan

%2,8
Kazan

%6,5
Kazan

%25
Kazan

%1,6
Kazan

%3,2
Kazan

%5,5
Kazan

%3,2
Kazan

%5
Kazan

%3,2
Kazan

%5
Kazan

%2
Kazan

Alışveriş Yaptıkça Para Kazan Harekete Geç »

- x

Bildirim

X

mesajınız kopyalandı (ctrl+v) yapıştırmak istediğiniz yere yapıştırabilirsiniz.