Şimdi Ara

Java uygulaması ile HTML'den veri çekmek

Daha Fazla
Bu Konudaki Kullanıcılar: Daha Az
2 Misafir (1 Mobil) - 1 Masaüstü1 Mobil
5 sn
8
Cevap
0
Favori
3.281
Tıklama
Daha Fazla
İstatistik
  • Konu İstatistikleri Yükleniyor
0 oy
Öne Çıkar
Sayfa: 1
Giriş
Mesaj
  • Arkadaşlar merhaba. Bir java projesi için websayfasından sürekli veri çekmem gerekiyor. Live Cyber Attack Map sayfa bu. Bu sayfada alttaki çubuğun içinde kayarak inen verileri çekmem lazım. Time, Attack, Attacking Country, Target Country leri sürekli almam gerekiyor. Sayfadaki düzeni şöyle:

    <div ng-repeat="attack in latestAttacks" class="attackRow" "=""> 
    <div class="timeCol" inline-animation="{ properties: { opacity : 1 }, duration: 500, easing:'swing'}" style="opacity: 0.0254519;">
    <p>
    14:40:22
    </p>
    </div>
    <div class="attackCol" inline-animation="{ properties: { opacity : 1 }, duration: 500, easing:'swing'}" style="opacity: 0.0254519;">
    <p class="attackContainer">
    infecting website.cb
    </p>
    </div>
    <div class="sourceCol" inline-animation="{ properties: { opacity : 1 }, duration: 500, easing:'swing'}" style="opacity: 0.0254519;">
    <p>
    China
    </p>
    </div>
    <div class="destCol" inline-animation="{ properties: { opacity : 1 }, duration: 500, easing:'swing'}" style="opacity: 0.0254519;">
    <p>
    India
    </p>
    </div>
    </div>


    Yardımcı olursanız çok sevinirim. Şimdiden teşekkürler.







  • streamler ile url den html i çekip daha sonra html parser libraryleri ile gerekli alanları çıkarabilirsin.
  • Selamlar, Apache'nin HttpComponents kütüphanesini kullanarak kaynak html'i alıp Jsoup ile de bunu parse edebilirsin.

    https://jsoup.org/
    https://hc.apache.org/

    İstersen örnek kullanımına aşağıdan ulaşabilirsin.
    https://github.com/cemasma/imei-sorgulama




  • jsoup ve OkHttp bak bi istersen

    < Bu ileti mobil sürüm kullanılarak atıldı >
  • Bahsettiğin web scraping işi için arkadaşlar tam doğru kaynakları vermişler. Onlara ek olarak birkaç notum olacak:

    jsoup, Python'daki BeautifulSoup'un Java versiyonu olabilir cunku jsoup çıkış tar 2009, bs'un tar 2004.

    Birkaç hafta önce Rails uygulamamda kullanmak üzere html'den veri cekmem gerekmişti fakat Rails'teki "nokogiri" adlı paket ile bu işi istediğim gibi yapamadım ve ondan sonra Python BeautifulSoup'u keşfettim. BeautifulSoup en iyi yanı yanlış formatlanmış HTML'leri bile düzeltip formatlayabiliyor (html5lib paketi ile) Web'ten cektiğim bir html yanlış formatlanmıştı, <dl> ve <dt> ile etiket açmış ancak kapatılmamıştı, html5lib o şekilde tüm kapatılmamış etiketleri bulup kendisi kapama etiketi ekledi beni önemli dertten kurtardı. Aynı şeyi jsoup ta yapıyor olabilir.
  • Hic library kullanmadan core java ile de yapabilirsin bunu.
    Html i String olarak alip kendin parse edebilirsin.

    < Bu ileti tablet sürüm kullanılarak atıldı >
  • jQuery ile belli id veya belli class yapılarına sahip olan verileri çekebilirsin(binding) veya javascript ile tüm html yapısını stringe çevirip java koduna yollayarak pars edebilirsin. İlk yöntem bence daha kolay olacaktır.
  • Yapay Zeka’dan İlgili Konular
    Daha Fazla Göster
  • Selenium size çözüm sunabilir. Bazı oline oyunları bu şekilde otomatik bot yazdığım bile var :

    https://www.youtube.com/watch?v=zylSll8hsPs
  • 
Sayfa: 1
- x
Bildirim
mesajınız kopyalandı (ctrl+v) yapıştırmak istediğiniz yere yapıştırabilirsiniz.