Şimdi Ara

Derinlemesine: OpenAI Sora ile yapılan akılalmaz örnekler, detaylar ve endişeler

Daha Fazla
Bu Konudaki Kullanıcılar: Daha Az
1 Misafir - 1 Masaüstü
5 sn
27
Cevap
1
Favori
3.028
Tıklama
Daha Fazla
İstatistik
  • Konu İstatistikleri Yükleniyor
31 oy
Öne Çıkar
Sayfa: 12
Sayfaya Git
Git
sonraki
Giriş
Mesaj


  • ChatGPT ve DALL-E geliştiricisi OpenAI, Sora adında yepyeni bir yapay zeka aracı tanıttı. Sadece yazıları kullanarak onlardan bir video oluşturan Sora, yetenekleri ile şimdiden herkesi büyülemiş durumda. Akıl almaz derecede gerçekçi sonuçlar ortaya koyan Sora, bir yandan teknolojinin gelişim hızını ortaya koyarken bir yandan da endişe ve korkuyu beraberinde getiriyor. Gelin Open Sora nedir? Bizleri ne gibi tehlikeler bekliyor? gibi sorulara cevaplar ararken araca bir göz atalım.



    OpenAI'ın sohbet robotlarının hukuk fakültesine gitmeden baro sınavını geçebildiğini zaten biliyoruz. Şimdi ise Sora adlı yeni bir OpenAI aracı, okula gitmeden ve hiçbir eğitim almadan sinemada usta olduğunu bizlere gösteriyor. Şimdilik bir araştırma ürünü olan Sora, birkaç seçkin içerik üreticisine ve bir dizi güvenlik uzmanına sunuluyor.



    OpenAI Sora Nedir?



    OpenAI Sora kısaca, metinsel istemlerden videolar oluşturan yeni üretken yapay zeka modelidir.



    Google gibi devlerden Runway gibi startup'lara kadar pek çok şirket metinden videoya yapay zeka araçlarını bir süre önce duyurdu. Google’in Lumiere aracı açıkçası benim şimdiye kadar gördüğüm en yetkin modeldi. Ancak Sora ile onu kıyaslamak mümkün bile değil.





    Sora, çarpıcı fotogerçekçiliğiyle (rakiplerinde görmediğim bir şey) ve diğer modellerin tipik olarak yaptığı kısa parçalardan daha uzun, bir dakikaya kadar klipler üretebilmesiyle öne çıkıyor. Şimdilik bir videonun ne kadar sürede oluşturulduğu hiçbir yerde yazmıyor ancak anlaşıldığı üzere 1 dakikalık video için birkaç dakikadan fazla beklemek gerekecek.





    Sahneler kesinlikle etkileyici olsa da, Sora'nın yetenekleri arasında en şaşırtıcı olanı, eğitimini almadığı yetenekler. OpenAI'nin Dall-E 3 görüntü oluşturucusu tarafından kullanılan difüzyon modelinin bir versiyonunun yanı sıra GPT-4'ün transformatör tabanlı motorundan güç alan Sora, yalnızca istemlerin taleplerini yerine getiren videolar üretmekle kalmıyor, aynı zamanda bunu sinematik grameri temel alarak yapıyor. Bu da bir hikayeyi anlatmak için olmazsa olmazlardan. Bunun ikinci bir anlamı da Sora, girilen istemi parça parça üretip sonradan birleştirmiyor, tüm sahneyi tek seferde oluşturuyor.



    Sora'da OpenAI ekibinin göstermediği ve bir süre daha gösterilmeyecek olan bir özellik de var. Sora aslında tek bir fotoğraf veya bir dizi fotoğraftan video oluşturabiliyor. Yani, Rize, Ayder Yaylası’na gidip manzaranın fotoğrafını çektiniz. Bunu Sora’ya yükleyebilecek ve orada geçen hikayenizin anlatılmasını sağlayabileceksiniz.



    Sora’yı nasıl deneyebilirim?



    Çoğumuz yeni yapay zeka modelini elimize almadan önce beklemek zorunda kalacağız. Şirket, metinden videoya modelini 15 Şubat'ta duyurmuş olsa da, henüz araştırma ve test aşamasında bulunuyor. OpenAI, az sayıda kişi ile birlikte sistemdeki güvenlik açıklarını ve zayıflıkları belirlemek için gerçek dünya kullanımını simüle ediyor.



    Bu süre zarfında modelin profesyoneller için en yararlı olacak şekilde nasıl geliştirileceği konusunda geri bildirim almak için bir dizi görsel sanatçıya, tasarımcıya ve film yapımcısına erişim izni de verildi. Sora için net bir çıkış tarihi veya açık beta kullanımı için bir bilgi yok. Ancak bu süre çok da uzun sürmeyecektir.



    Sora nasıl çalışıyor?



    OpenAI, Sora’nın nasıl çalıştığı hakkında ayrıntılı bir rapor yayınlamış olsa da bunu size daha anlaşılır şekilde aktarmak daha doğru olacaktır.



    Derinlemesine: OpenAI Sora ile yapılan akılalmaz örnekler, detaylar ve endişeler
    Çoğumuz eski, parazitli, zaman zaman bulanık olan o eski TV’leri ve çanak antenleri hatırlıyordur. Görüntüyü netleştirmek için çanakta ince ayarlar yapmak gerekirdi. OpenAI’ın Sora yapay zekası da bu şekilde çalışıyor temelde. Sizin girdiğiniz prompt’u yani istemi, öncelikle analiz ederek anlamlandırıyor. Analize dayanılarak akabinde bir senaryo oluşturuluyor. Bu senaryoya uygun sahneler üretiliyor ve üretim tek seferde gerçekleştiriliyor. Yukarıda da dediğimiz gibi, Sora, diğerleri gibi “bir sahne üret ve mükemmelleştir” yaklaşımını benimsemiyor. Tüm sahneyi, eğitim verisindeki her şeyle (yazılar, videolar, sesler, anlatımlar, araştırmalar, filmler, diziler vb.) değerlendirip, yorumlayıp tek seferde tüm sahneyi oluşturuyor.



    Derinlemesine: OpenAI Sora ile yapılan akılalmaz örnekler, detaylar ve endişeler



    Sora, istenilen videoyu tek seferde oluşturuyor dedik ama aslında nihai forma gelene kadar bazı düzeltmelerden de geçiriliyor bu video. Eski TV örneğinde verdiğimiz gibi Sora’nın ilk çıktısı gürültülü ve detaydan yoksun. Ancak sistem, gürültüyü kademeli olarak gidermek ve videolar oluşturmak için "transformatör mimarisi" kullanarak süreci yinelemeli olarak iyileştiriyor.



    Kelimelere dayalı metin üreten GPT modellerini düşünün. Sora da benzer bir şey yapıyor ama görüntü ve videolarla. Videoları yama adı verilen daha küçük parçalara ayırıyor, yorumluyor, işliyor.



    Derinlemesine: OpenAI Sora ile yapılan akılalmaz örnekler, detaylar ve endişeler



    Görüntü ve video oluşturmaya yönelik geçmiş yaklaşımlar genellikle videoları standart bir boyuta yeniden boyutlandırıyordu: örneğin, 256x256 çözünürlükte 4 saniyelik videolar gibi. Sora ise geniş ekran 1920x1080p videoları, dikey 1080x1920 videoları veya aradaki her şeyi örnekleyebiliyor. Bu, Sora'nın farklı cihazlar için doğrudan kendi doğal en boy oranlarında içerik oluşturmasını sağlıyor. Ayrıca, tam çözünürlükte oluşturmadan önce içeriği daha düşük boyutlarda hızlı bir şekilde prototip haline getirebilmenizi sağlıyor.



    Bu arada Sora’nın hangi veriler üzerinde eğitildiğini bilmiyoruz. OpenAI, “lisanslanan ve kamuya açık” terimini kullanıyor ama detay yok. OpenAI, kar amacı gütmeyen bir kuruluş olsa da bir süre önce raporlarında esas detayları paylaşmayı bırakmış durumda.



    Mükemmel değil





    Şirket blog yazısında mevcut modelin "zayıf yönleri" olduğunu kabul ediyor. Modelin karmaşık bir sahnenin fiziğini doğru bir şekilde simüle etmede zorluklarla karşılaşabileceği ve belirli neden ve sonuç örneklerini anlayamayabileceği belirtiliyor. Örneğin, bir kişi bir kurabiyeden bir ısırık alabilir, ancak daha sonra kurabiyede ısırık izi ortadan kaybolabilir veya hiç oluşmayabilir. Veya koşu bandında ters koşan birisini oluşturabilir... Nasrettin hoca?



    Ayrıca, modelin mekansal detayları karıştırma veya zaman içinde gerçekleşen olayların hassas açıklamalarını takip etme konusunda zorlandığı da belirtiliyor.



    Sora neler yapabiliyor?



    Ve gelelim Sora’nın neler yapabildiğine. Açıkçası OpenAI’ın dün yayınladığı araştırma makalesini saatlerce inceledim, paylaşılan örneklere göz attım ve birtakım derlemeler yaptım. Hepsi muazzam görünüyor ve yapılabilecek şeylerin bir sınırı yok.



    Genel hatlarla bakacak olursak Sora şunları yapabiliyor:



    İstem ve resimden bir video üretimi



    Derinlemesine: OpenAI Sora ile yapılan akılalmaz örnekler, detaylar ve endişeler





    Kusursuz döngü videoları





    Videodan videoya düzenleme







    Videoları birbirine bağlama





    3D video oluşturma





    Dünya etkileşimi





    Dijital dünya simülasyonu





    (Evet, Minecraft yapıyor)



    Endişeler ve tehlikeler



    Tabii bu verdiğim örnekler teknolojinin “toz pembe” versiyonu. Bir devlet yetkilisi, ünlü veya sevmediğiniz bir kişinin görüntüsünü yükleyerek potansiyel olarak tehlikeli ve sakıncalı videoların üretilmesi de mümkün. OpenAI’ın Sora’yı genel kullanıma açmamasının ana nedeni de bu güvenlik endişesi. Sora genele açılmadan önce araştırmacılar ve test kullanıcıları bu açıkları OpenAI’a aktaracak ve firma da bu açıkları kapatacak.





    Bir başka potansiyel sorun da Sora'nın ürettiği videonun içeriğinin başkalarının telif hakkıyla korunan çalışmalarını ihlal edip etmeyeceği. OpenAI, Sora’nın eğitim verilerinin lisanslanan içeriklerden ve kamuya açık içeriklerden oluştuğunu söylüyor.



    Ancak temel sorunları görmemeye meyilliyiz insanlar olarak. OpenAI'nin yeni aracının potansiyel olarak nasıl kötüye kullanılabileceği zaten tamamen açık. Sora devasa ölçekte sahte içerik üretecek, bu çok açık. Bu içeriğin bir kısmının çevrimiçi siyasi dezenformasyon amacıyla kullanılması, bir kısmının varsayımsal olarak çeşitli dolandırıcılık ve sahtekarlıklara yardımcı olmak için kullanılması ve bir kısmının da nefret içerikleri üretmek için kullanılması muhtemel.



    OpenAI şiddet ve cinsel içeriğe anlamlı sınırlamalar getirmek istediğini söylüyor. Hadi ama, daha birkaç hafta önce Taylor Swift olayını yaşadık, aynı şeyler bu modelde de olacak. Tüm bu Sora içeriklerinin sosyal medya kanallarını dolduracağı, sıradan insanların neyin gerçek neyin sahte olduğunu ayırt etmesini zorlaştıracağı ve genel olarak interneti çok daha can sıkıcı hale getireceği açık. Bunu söylemek için uzman olmaya gerek olduğunu sanmıyorum.




    Kaynak:https://openai.com/research/video-generation-models-as-world-simulators
    Kaynak:https://openai.com/sora#capabilities








  • < Bu ileti mini sürüm kullanılarak atıldı >
  • XanthiN kullanıcısına yanıt
    Güzel bir anlatım yapmış Barış hocam.

  • Bir de kullanabilsek

    < Bu ileti iOS uygulamasından atıldı >
  • film sektörü yeniden yapılancak bu gelişmeler ile artık =) maliyetler düşerse belki fiyatlar ucuzlar :D onu geçtim de gelişmeler bence çok iyi. ama tek sıkıntı herkes birşeyler tanıtıyor ama son kullanıcıya açan yok henüz.

  • Bu işin sonu nereye gidiyor kestirmek gerçekten çok zor.

    < Bu ileti iOS uygulamasından atıldı >
  • Grafiklerler başınız sağ olsun... Sıra bu gidişle yavaş yavaş herkese gelecek.

    < Bu ileti Android uygulamasından atıldı >
  • Yalan ya hepsi.Üst akılın, küreselcilerin oyunu.Dünya düz.
    Microsoft un deli gibi yatırım yapmasi haliyle boşuna değil.
    Bence bu OpenAi nin başındaki adamı öldürebilirler bile.
    Başlarda daha dur bakalim, abartmayın bu zekayı derken iş büyüyo.
    Bu da sadece bize gösterdikleri kısmi.

    Ne diyim, kullanmasini bilirsek fayda
    Bilmezsek felaketin adı.

    < Bu ileti mobil sürüm kullanılarak atıldı >
  • Teknoloji hızlı gelişiyor bu teknoloji devrimsel bir iş bundan 5 yıl sonra aklımızın alamayacağı şeyler göreceğiz belki de

  • Endişe yazıyorsunuz da bunun ticari tarafına hiç mi bakmıyorsunuz bu yapılıyorsa buna karşı önlem alınan yapay zeka ürünlerin de pazarda payı olacak.

    Girişim yapmak isteyenlere alın fikir:
    Yapay zeka ürünlerin üretmiş olduğu sonuçları ya da içerikleri analiz ederek yapay zeka tarafından yapılıp yapılmadığını belli bir başarım oranıyla gören ürün oluşturabilirsiniz ki! Zaten çalışmalarda var.

    Yani endişe duyuyoruz falan hikaye o endişe yapay zekadan öncede vardı çünkü endişenin altında yatan asıl temel insan olması. İnsan bunları nasıl kullanacağıdır. Yapay zekaya *** atma çılgınlığını bir kenara bırakalım bu ürünlerin bir kopyasını çıkartıp Rusya gibi ürünlerde kopya ürünlerde farkındalık oluşturacak geliştirmeler yaparak para kazanmaya bakalım.

  • Bildiğim kadarıyla filmler için bir çok animatörler, modellemeciler, efektciler kullanıyor bunların şimdiden koltuğu sallanır sonra içeriğe göre fon müziği de yapay zekayla yaparsalar. Jenerik'te insan sayısı iki elin parmaklarını geçmez diye düşünüyorum. Hatta bütün işleri bir kişi bile yapabilir.
    Belli ki de bizler bu duruma evriliyoruz.
    Korkmalı mıyız ? bence evet bir çok insanlar suni videolar ile kolayca yönlendirilecek. Gidişat hiç iyi değil 2. Modern sanayi devrimi başlar.



    < Bu mesaj bu kişi tarafından değiştirildi blackkugu61 -- 17 Şubat 2024; 11:13:24 >
  • Teknoloji bilgini 68 T kullanıcısına yanıt
    İlk grafikerler sonra video editörleri içerik üreticileri.ile başlayıp tüm beyaz yakalilarin işi bitmiş olacak.robotlarin gelişimi ile diğer sınıflarda gelecek,

    < Bu ileti Android uygulamasından atıldı >
  • iş akışlarını bilmeyen arkadaşlar direk belirli meslek gruplarını öldürmüşler hemen. illa ki zamanla sektörel değişikliklere neden olacaktır ama şu aşamada daha çok toy bu araçlar. photoshop "generate fill" komutu dışında sektöre girebilmiş bir ai yok daha doğru düzgün.

  • Emek isteyen, işçilik isteyen işleri yapanlar daha da değerli hale gelecek

    < Bu ileti Android uygulamasından atıldı >
  • boylum kullanıcısına yanıt

    Kesinlikle öyle, bir şarkı bestelemesini istesek yapabilir mi mesela? Gelecek gerçekten filmlerde izlediğimizden çok farklı olacak gibi duruyor, 200-300 yıl sonrasını gormek isterdim




    < Bu mesaj bu kişi tarafından değiştirildi A.J. Pacino -- 17 Şubat 2024; 22:16:4 >
    < Bu ileti mobil sürüm kullanılarak atıldı >
  • stealth_op S kullanıcısına yanıt

    Bu kadar büyük etki oluşturacağını sanmıyorum. Promtlayarak içerik oluşturmak özellikle fantastik bir şeyler yapmak isteyen bir yönetmen için bence çok sığ alternatifler çıkarır. Bi de uzunluk, uzunluğa göre uyumluluk, tüm içeriğin tutarlı olması lazım uzun bir video'da mesela.


    Yani 1 dakikalık video yapmak ile 2 saatlik bir film yapmak arasında fark var. Mesela 3 saat civarı süren Avatar'daki gibi fantazi bir dünyayı promtlayarak oluşturmak en fazla ne derece mümkün olabilir yapay zeka gelişse bile? Diyelim mümkün oldu, mutlaka şurayı çıkaralım, burayı uzatalım, şu kısmı kesip diğerinin önüne koyalım gibi sadece insan zekasının analitik düşünme ve mantık yürütebilme yetenekleri ile şekillenecek düzenlemelere her zaman ihtiyaç olur.


    Profesyonel bir film yapmak instagram videosu yapmaya benzemiyor. Bu yapay zeka örnekleri hep instagramvari videolar fark ettiyseniz.


    Örneğin Photoshop'ta bile bildiğim kadarıyla bir promtlama yapılıp fotoğraf oluşturulduğu zaman, karşımıza 3 tane alternatif sonuç çıkıyor. Bu alternatiflerin hiç biri yönetmenin aradığı görseli tam olarak karşılamadığında elle düzenlemeye gidilmesi lazım. Sadece insanların anlayıp insan aklıyla yapılabilecek özel düzenlemeler daima olur profesyonel çalışılıyorsa.


    Yani illa ki işin kendisini yapmayı bilen birilerine ihtiyaç olur. Zaten düzgün bir promtlama yapmak için bile işin kendisini de biliyor olmak lazım. Yani örneğin ben yapay zekaya "bir web sitesi" tasarla diye promtlama yapabilirim teknik detaylara girmeden, ama bir web sitesi tasarımcısı çok daha fazla teknik detay vererek; istediği kod kümelerinin adını söyleyerek, fonksiyonlardan bahsederek promtlama yapabilir ve benim alacağımdan çok daha iyi profesyonel bir çıktı alır, ne kadar girdi verirsen o kadar iyi çıktı alırsın. İyi girdi vermek için girdi vereceğin alanın bilir kişisi olmak lazım. Ben ona şunu yap dicem o da süper bir şekilde yapacak tarzında bir şey değil bu yapay zeka.


    Bu sebeplerden ötürü benim görüşüm yapay zeka insanların yerini %100 almaz ama insanların işini çok kolaylaştırır. Daha kısa zamanda daha fazla iş görülür. Bir şirket 50 kişi çalıştıracaksa 20 kişi yeterli hali gelir belki, bu tarz dezavantajları olur çok çok.




    < Bu mesaj bu kişi tarafından değiştirildi kabus2224 -- 18 Şubat 2024; 2:35:55 >




  • kabus2224 kullanıcısına yanıt
    Ben sadece yakın gelecekten bahsetmedim, Ayrıca filmden örnek verdiniz öyle devam edelim James Cameron tek başına gelecekte kimseye ihtiyacı olmadan bir film yapma yetisine sahip olabilir bugün bile Çin'de sürücüsüz ticari taksiler yollarda, Kaldı ki yapay zeka emekleme aşamasında bile değil.
    Elbette farklı düşünceler olabilir, belki bundan 50-100 yıl sonra insanlar yapay zekayı tehlikeli görüp sınırlı kullanım durumunda birakicaklar. Şuan sadece farazi konuşuyoruz. Cevap verdiğin için teşekkürler.

    < Bu ileti Android uygulamasından atıldı >
  • Robotların yapamayacağı işlerle ilgili meslek edinmek gerek.

    Yoksa 5 seneye 80-90 ve 2000'lerde edinilmiş mesleki eğitimlerle hayatını sürdüren bireyler bazında ciddi yoksulluk başlayacak.

  • Sonra bir simülasyon içinde olabiliriz diye söyleyince kızanlar çıkıyor.

    Yakın gelecekte Oscar alabilen yapay zeka modülleri çıkar mı ? Bence olur.

  • Açık dünya oyunlarının yerini yakında ucu açık dünya oyunları alacak. İşlemci gücü ve yapay zeka kapasitesi artınca, ileride çok farklı açık dünya oyunlarıyla karşılaşabiliriz.

  • 
Sayfa: 12
Sayfaya Git
Git
sonraki
- x
Bildirim
mesajınız kopyalandı (ctrl+v) yapıştırmak istediğiniz yere yapıştırabilirsiniz.