Arkadaşlar internetteki 100 civarı pdf dosyasından veri almamı ve parse etmemi sağlıyacak program yazmaya çalışıyorum. java da yeniyim. bu iş için iki yöntem olduğunu düşünüyorum.
1- pdf dosyaları indirip onların içinden parse yapmak. bu iş için internetten dosya indirmeyle ilgili java bilgisine ihtiyacım var. ayrıca pdf dosyalarını nasıl okuyacağım? txt gibi oluyo mu?
2-Direk internet üzerinden pdf'leri indirmeden okumak. bunun için de internetten veri çekme işlemi ile ilgili bilgiye ihtiyacım var.
yardımlarınız için şimdiden teşekkürler...
not: internetten bu konuda araştırma yaptım fakat pek bişey bulamadım. bu konuyla ilgili gösterebileceğiniz link, kaynak vs. herşey kabülümdür.
internetten resim indirmek için şu linkte örnek kod var. PDF için de Java dili için hazırlanmış bedava kütüphaneler vardır. Bunlardan birini bulup projende kullanırsan sanırım sorunu çözersin.