Ben Web Kazıma için 3 dil kullanmış - Ruby, PHP ve Python ve dürüstçe bunların hiçbiri görev için mükemmel görünüyor.
Ruby mükemmel Mechanize ve XML ayrıştırma kütüphane var ama elektronik tablo desteği çok kötü.
PHP mükemmel elektronik tablo ve HTML ayrıştırma kütüphane var ama WWW bir eşdeğeri yok: Mechanize.
Python çok kötü Mechanize kütüphaneye sahiptir. Onunla pek çok sorun vardı ve hala onları çözmek mümkün. Onun elektronik tablo kütüphane de bunu yapamaz XLSX dosyaları oluşturmak için beri az ya da çok nezih.
Webscraping için sadece mükemmel bir şey var mı.
PS: Ben windows platformu üzerinde çalışıyorum.