Şimdi Ara

Yapay zekayı anlamak için yeni yol: Harry Potter

Daha Fazla
Bu Konudaki Kullanıcılar: Daha Az
2 Misafir - 2 Masaüstü
5 sn
3
Cevap
0
Favori
196
Tıklama
Daha Fazla
İstatistik
  • Konu İstatistikleri Yükleniyor
0 oy
Öne Çıkar
Sayfa: 1
Giriş
Mesaj
  • Yapay zekayı anlamak için yeni yol: Harry Potter
    Üretken yapay zekayı kullanıyor olsak da çoğu bilim insanına göre bu araçların tam olarak nasıl çalıştığını bilmiyoruz. Akademisyenler bu sistemlerin çalışma şeklini anlamak için çeşitli yöntemler deniyorlar. Şimdi ise, J.K. Rowling'in dünyayı büyülü yaratıklar, yasak ormanlar ve genç bir büyücüyle tanıştırmasının üzerinden yirmi yıldan fazla bir süre geçtikten sonra, Harry Potter çok farklı bir edebiyat alanında yeniden ilgi görmeye başladı: Yapay zeka araştırmaları.



    Harry Potter kitapları yapay zeka için kullanılıyor



    Çok sayıda araştırmacı, serinin popüler kültürdeki kalıcı etkisini ve sayfalarındaki çok çeşitli dil verilerini ve karmaşık kelime oyunlarını gerekçe göstererek, üretken yapay zeka teknolojisini denemek için en çok satan Harry Potter kitaplarını kullanıyor. Bir süre önce Harry, Hermione ve Ron’u kullanan dikkate değer bir araştırma yayınlandı. "Who's Harry Potter?" başlıklı makalede büyük dil modellerinin (LLM) bilgiyi seçerek unutmasına yardımcı olan yeni bir tekniğe ışık tutuluyor.



    Yapay zeka sohbet robotlarına güç veren büyük dil modelleri, telif hakkıyla korunan materyaller ve diğer sorunlu içerikler de dahil olmak üzere büyük miktarda çevrimiçi veri üzerine inşa ediliyor. Bu durum bazı yapay zeka şirketleri için davalara ve kamuoyu incelemelerine yol açtı ve açmaya da devam ediyor.



    Microsoft araştırmacıları Mark Russinovich ve Ronen Eldan, makalenin yazarları olarak, yapay zeka modellerinin, yapay zeka sisteminin genel karar verme ve analitik yeteneklerinden ödün vermeden, karakterler ve olay örgüsü de dahil olmak üzere Harry Potter kitaplarının varlığına dair herhangi bir bilgiyi ortadan kaldırmak için değiştirilebileceklerini veya düzenlenebileceklerini ispatladıklarını söylüyorlar.



    Kitaplar, deneyler için iyi bir araç



    Yapay zekayı anlamak için yeni yol: Harry Potter
    Bir başka çalışmada, araştırmacılar, yasal riskleri azaltmak için verileri kaldırabilen Silo adlı yeni bir dil modeli geliştirdiler. Ancak bu yılın başlarında yayınlanan bir makalede, modelin yalnızca telif hakkı olmayan kitaplar veya devlet belgeleri gibi düşük riskli metinler üzerinde eğitildiğinde performansının önemli ölçüde düştüğünü söylediler.



    Ayrıca Bkz.Microsoft Copilot'un Android uygulaması kullanıma sunuldu



    Daha derine inmek isteyen araştırmacılar, tek tek metin parçalarının bir yapay zeka sisteminin performansını etkileyip etkilemediğini görmek için Harry Potter kitaplarını kullandılar. İki veri deposu ya da web sitesi ve belge koleksiyonu oluşturdular. İlki, ilk Harry Potter kitabı hariç yayınlanmış tüm kitapları içeriyordu; diğeri ise serinin ikincisi hariç tüm kitaplarını içeriyordu.



    Araştırmacılar, yapay zeka modellerinin doğruluk ölçüsüne atıfta bulunarak, "Harry Potter kitapları veri deposundan çıkarıldığında, perplexity (Bilgi teorisinde olasılık dağılımının veya olasılık modelinin bir örneği tahmin etmedeki kabiliyeti) daha da kötüleşiyor" dedi.



    Bunlar, Harry Potter kitaplarını yapay zeka için kullanan araştırmalardan sadece ikisi. Akademisyenler, Harry Potter kitaplarının doğal dil konusunda güçlü referanslar içerdiğini söylüyor. Haliyle bunlar büyük dil modellerini anlamak için bilindik bir girdi olarak kullanılabiliyor.




    Kaynak:https://www.bloomberg.com/news/articles/2023-12-26/researchers-have-a-magic-tool-to-understand-ai-harry-potter
    Kaynak:https://arxiv.org/pdf/2310.02238.pdf
    Kaynak:https://arxiv.org/pdf/2308.04430.pdf







  • "Who’s Harry Potter? Approximate Unlearning in LLMs" geçen ayın başında yayınlanmıştı. Merak edenler için kullanılan yöntem modelin özel olarak hazırlanmış yeni bir veri seti ile fine-tune edilmesini içeriyor. Bunun sonucunda da modelin yeni öğrendiği bilgi önceki bildiğinin üzerine yazılıyor. Bu özel veri setinin hazırlanma şekli çalışmanın esas değerli noktası. Çünkü loss fonksiyonunu tersine çevirmek gibi ilk akla gelebilecek yöntemler sadece hedef bilgiyi değil modelin genel dil bilgisini de siliyor.

  • 
Sayfa: 1
- x
Bildirim
mesajınız kopyalandı (ctrl+v) yapıştırmak istediğiniz yere yapıştırabilirsiniz.