Şimdi Ara

Yeni Benchmark Programı - Cuda RayTracer

Daha Fazla
Bu Konudaki Kullanıcılar: Daha Az
2 Misafir - 2 Masaüstü
5 sn
38
Cevap
1
Favori
1.444
Tıklama
Daha Fazla
İstatistik
  • Konu İstatistikleri Yükleniyor
0 oy
Öne Çıkar
Sayfa: 12
Sayfaya Git
Git
sonraki
Giriş
Mesaj
  • Kendi yazdığım benchmark programını paylaşıyorum skorları paylaşırsanız sevinirim.


    Buradan indirebilirsiniz: İndir


    Program şimdilik çok ham durumda vaktim oldukça geliştirmeye çalışırım bu haliylede kalabilir emin değilim Program CUDA'da yazıldığı için şimdilik sadece GeForce (tesla, quadro varsa onlarda olur )kartları destekliyor.


    RayTracerV0.1.exe'yi tıkladıktan sonra beyaz ekranda 1, 2 ya da 3'ü tıklıyoruz.
    1 - tek thread CPU
    2 - tek GPU
    3 - 2 GPU (varsa)


    Bir kaç kere deneyip en iyi skoru yazabilirsiniz.

    Skorları burada sıralıyorum:

    Tek Kart GPU


    GTX 580 (core: 1GHz): 5396 (arbiter)
    GTX 570 (core: 950): 4779 (Kir$of)
    GTX 480 (925 / 4200): 4729 (Abazzers)
    GTX Titan (Stok hız): 3827 (Aydindril)
    GTX Titan (Stok hız): 3776 (Hanibal187)
    GTX 480 (stok): 3597 (Abazzers)
    GTX 680 (stok): 2895 (DeviL's)
    GTX 680 (Stok hız): 2779 (SpecturA)
    GTX 670 (stok): 2536 (mur88)
    GTX 670 (stok): 2520 (kaan0101)
    GTX 660TI (Stok hız): 2492 (kaan0101)
    GTX 690 (Stok): 2480 (rezes)
    GTX 690 (+111 GPU, +400 VRAM) 2488 (rezes)


    Çift Kart GPU

    GTX 580SLI (stok): 10378 (arbiter)
    GTX Titan (Stok hız): 7055 (Hanibal187)
    GTX 680 (Stok hız): 5270 (SpecturA)
    GTX 670SLI (stok): 4826 (mur88)
    GTX 690 (Stok): 4783 (rezes)
    GTX 690 (+111 GPU, +400 VRAM) 4800 (rezes)

    CPU

    3930K @4.160GHz: 100.3 (Hanibal187)
    3930K @4.290GHz: 103 (SpecturA)


     Yeni Benchmark Programı - Cuda RayTracer



    < Bu mesaj bu kişi tarafından değiştirildi hanibal187 -- 30 Nisan 2013; 21:21:49 >







  • Buna en kısa zamanda bi UI da yapmak gerek
  • biri testmi dedi severim testleri en kısa zamanda 660ti-670 skorları atarım :D ellerine sağlık dostum forumda böyle şeyler görmek cidden güzel
  • quote:

    Orijinalden alıntı: kaan0101

    biri testmi dedi severim testleri en kısa zamanda 660ti-670 skorları atarım :D ellerine sağlık dostum forumda böyle şeyler görmek cidden güzel

    ben sizden genelde amd kartların testlerini beklerdim. şaşırdım.


    nvidia resmin altına amd kartları yakışmış.
  • oraya nvidialarda gelecek

    edit

    660ti stock 2492

     Yeni Benchmark Programı - Cuda RayTracer



    < Bu mesaj bu kişi tarafından değiştirildi kaan0101 -- 28 Nisan 2013; 0:01:13 >
  • sağolasın kaan
  • gtx670 : 2520

    i72600k :107

     Yeni Benchmark Programı - Cuda RayTracer
  • Yapay Zeka’dan İlgili Konular
    Daha Fazla Göster
  • Tebrik ederim haydi! hayırlısı bakalım

    2500K@4.9Ghz CPU biraz fazla oynak gibi. bazen 115 bazen 118 skor alıyor!! @hanibal187

    default--------------------------------------------------------OC +111Mhz GPU +400Mhz Vram
     Yeni Benchmark Programı - Cuda RayTracer  Yeni Benchmark Programı - Cuda RayTracer



    < Bu mesaj bu kişi tarafından değiştirildi rezes -- 28 Nisan 2013; 4:07:32 >




  • bendede bu çıktı. sıfır overclock ile. müsait olunca overclocklu koyacağım.

    3970x @ default
    titan @ default

     Yeni Benchmark Programı - Cuda RayTracer
  • gtx 480 performansına gerçekten çok saşırcaksınız gtx 580 vs. bu skorları alamaz.biliyorsunuz fermi gf100 cuda hesaplama özellikleriyle öne çıkan bir gpu mimarisiydi.gtx 580 de cuda hesaplamaları yapan bölüm gpu dan çıkarıldı, oyun performansına önem verildi diye biliyorum.kısacası gtx 480 cuda hesaplamaları için mükemmel bir kart, ve benzeri yok

    driver sürümü : 320.00 beta

    gtx 480 @ stock : 3597 puan

     Yeni Benchmark Programı - Cuda RayTracer

    gtx 480 @ 925 / 4200 overclock : 4729 puan

     Yeni Benchmark Programı - Cuda RayTracer



    < Bu mesaj bu kişi tarafından değiştirildi Abazzers -- 28 Nisan 2013; 6:20:30 >




  • güzel ve basitçe gpu ham gücünü gösteren bir test tebrikler.

    tek kart 5396
    slı 10378
  • Hepinize teşekkür ederim.

    Program gpuyu full utilize edemiyor şimdilik o nsight profilerla kullanımı inceleyip farklı arhitecturelara göre bişeyler ayarlamaya bakcam artık (tesla, fermi ve kepler için farklı thread block sayısı hesabı gerekiyor ama aynı architecturelar içinde sonuçlar tutarlı en azından ).


    Fermi architecture'da daha iyi çalışıyor bunun nedeni (480 için hesaplama yapılan blokların 580'de çıkarılması değil, 580'de çıkarılan double precision üniteleri sp üniteleri aynen duruyor hatta 580'de daha fazla. Programda single precision kullanıyor driverdan özellikle double precision seçmezseniz ki gerek yok şimdilik ) kodu yazarken block warp allocationlarını hesaplamalarını fermi üstünden yapmam sizin denemeniz o yüzden çok iyi oldu. Bir ara vaktim olduğunda düzeltmeye çalışırım. Denediğiniz için tekrardan teşekkür ederim

    Not: bu arada başlığı anca açabildim forum patlamış durumda



    < Bu mesaj bu kişi tarafından değiştirildi hanibal187 -- 28 Nisan 2013; 16:22:19 >




  • Single GPU 2536

     Yeni Benchmark Programı - Cuda RayTracer

    CPU 115

     Yeni Benchmark Programı - Cuda RayTracer


    Multı GPU 4826

     Yeni Benchmark Programı - Cuda RayTracer




  • ray tracer'ı sıfırdan mı yazdınız acaba?
  • quote:

    Orijinalden alıntı: kirmik

    ray tracer'ı sıfırdan mı yazdınız acaba?

    Evet sıfırdan yazdım.

    Vakit olursa nvidia optix kullanan birşeyde yazabilirim hem daha güzel olur

    < Bu ileti mobil sürüm kullanılarak atıldı >
  • Basarilar guzel program dewamini bekliyoruz...

    < Bu ileti mobil sürüm kullanılarak atıldı >
  • quote:

    Orijinalden alıntı: hanibal187

    Kendi yazdığım benchmark programını paylaşıyorum skorları paylaşırsanız sevinirim.


    Buradan indirebilirsiniz: İndir


    Program şimdilik çok ham durumda vaktim oldukça geliştirmeye çalışırım bu haliylede kalabilir emin değilim Program CUDA'da yazıldığı için şimdilik sadece GeForce (tesla, quadro varsa onlarda olur )kartları destekliyor.


    RayTracerV0.1.exe'yi tıkladıktan sonra beyaz ekranda 1, 2 ya da 3'ü tıklıyoruz.
    1 - tek thread CPU
    2 - tek GPU
    3 - 2 GPU (varsa)


    Bir kaç kere deneyip en iyi skoru yazabilirsiniz.

    Skorları burada sıralıyorum:

    Tek Kart GPU

    GTX Titan (Stok hız): 3776 (Hanibal187)
    GTX 680 (Stok hız): 2779 (SpecturA)
    GTX 660TI (Stok hız): 2492 (kaan0101)


    Çift Kart GPU

    GTX Titan (Stok hız): 7055 (Hanibal187)
    GTX 680 (Stok hız): 5270 (SpecturA)

    CPU

    3930K @4.160GHz: 100.3 (Hanibal187)
    3930K @4.290GHz: 103 (SpecturA)


     Yeni Benchmark Programı - Cuda RayTracer

    Güzel gözüküyor. Bende hd7870 var. Kernel programı çok uzun değilse opencl sürümünü çıkartabilirim tabi paylaşmak istersen. Oyun grafik motoru olarak sadece jmonkey engine kullandım ve şu anda unity öğreniyorum.



    < Bu mesaj bu kişi tarafından değiştirildi Tugrul_512bit -- 30 Nisan 2013; 16:52:53 >




  • quote:

    Orijinalden alıntı: Tugrul_512bit

    Kernel programı çok uzun değilse opencl sürümünü çıkartabilirim tabi paylaşmak istersen. Oyun grafik motoru olarak sadece jmonkey engine kullandım ve şu anda unity öğreniyorum.

    uzun ve kötü bir durumda aslında zamanında cpu için yazdığımda bir sürü özelliği vardı depth of field, aa, soft shadows, reflection, refraction, texture vs vs... 5500 satır civarında ve çok fazla tekrar comment out içeriyor şu anki versiyonu kodu temizlediğim zaman atayım sana güzel olur opencl versiyonu.

    Dediğim gibi optix kullanmak daha mantıklı aslında sıfırdan yazınca ne kadar uğraşırsan uğraş optix gibi temiz ve hızlı olmuyor (optix de cudaya bağımlısın gerçi)




  • quote:

    Orijinalden alıntı: hanibal187

    quote:

    Orijinalden alıntı: Tugrul_512bit

    Kernel programı çok uzun değilse opencl sürümünü çıkartabilirim tabi paylaşmak istersen. Oyun grafik motoru olarak sadece jmonkey engine kullandım ve şu anda unity öğreniyorum.

    uzun ve kötü bir durumda aslında zamanında cpu için yazdığımda bir sürü özelliği vardı depth of field, aa, soft shadows, reflection, refraction, texture vs vs... 5500 satır civarında ve çok fazla tekrar comment out içeriyor şu anki versiyonu kodu temizlediğim zaman atayım sana güzel olur opencl versiyonu.

    Dediğim gibi optix kullanmak daha mantıklı aslında sıfırdan yazınca ne kadar uğraşırsan uğraş optix gibi temiz ve hızlı olmuyor (optix de cudaya bağımlısın gerçi)

    5500 satırsa boşver Ben çarpışma simülasyonnu yapmıştım 200-250 satır bile yoktur(kernel). Demekki raytracingde bir ton hesap var. Çok üşengecim de
    Peki hesapları yaptırırken thread sayısı kaça çıkıyor ve kaçar kaçar gidiyor? Threadler tek boyutlu mu yoksa 2-3 boyutlu mu?



    < Bu mesaj bu kişi tarafından değiştirildi Tugrul_512bit -- 30 Nisan 2013; 17:03:11 >




  • quote:

    Orijinalden alıntı: Tugrul_512bit

    quote:

    Orijinalden alıntı: hanibal187

    quote:

    Orijinalden alıntı: Tugrul_512bit

    Kernel programı çok uzun değilse opencl sürümünü çıkartabilirim tabi paylaşmak istersen. Oyun grafik motoru olarak sadece jmonkey engine kullandım ve şu anda unity öğreniyorum.

    uzun ve kötü bir durumda aslında zamanında cpu için yazdığımda bir sürü özelliği vardı depth of field, aa, soft shadows, reflection, refraction, texture vs vs... 5500 satır civarında ve çok fazla tekrar comment out içeriyor şu anki versiyonu kodu temizlediğim zaman atayım sana güzel olur opencl versiyonu.

    Dediğim gibi optix kullanmak daha mantıklı aslında sıfırdan yazınca ne kadar uğraşırsan uğraş optix gibi temiz ve hızlı olmuyor (optix de cudaya bağımlısın gerçi)

    5500 satırsa boşver Ben çarpışma simülasyonnu yapmıştım 200-250 satır bile yoktur(kernel). Demekki raytracingde bir ton hesap var. Çok üşengecim de
    Peki hesapları yaptırırken thread sayısı kaça çıkıyor ve kaçar kaçar gidiyor? Threadler tek boyutlu mu yoksa 2-3 boyutlu mu?

    şu an blok başına 32 thread kullanıyorum (en iyi sonucu onda veriyor halbuki 4 warp destekliyor ama kod şişkin olduğundan dolayı register sizelarını geçiyor, bide shared memory ile uğraşmadım çok fazla memory pass vardı ) tek gpuda blok sayısı olarakta 1024x1024 pixel ekran için 2-dimension block var -> GridDim dim3(1024, 1024/32, 1). Aynı anda benim kartta 14smx X 32 thread çalışıyor.

    Fermi'de hızlı çalışmasıda blok başına 32 threadden kaynaklanıyor :D 480'de 15SM ve 580'de 16SM olunca haliyle bizim 14SMX'i geçiyor



    < Bu mesaj bu kişi tarafından değiştirildi hanibal187 -- 30 Nisan 2013; 17:15:25 >




  • 
Sayfa: 12
Sayfaya Git
Git
sonraki
- x
Bildirim
mesajınız kopyalandı (ctrl+v) yapıştırmak istediğiniz yere yapıştırabilirsiniz.