Ben bir web sitesi kazımak için basit bir html dom parser kullanıyorum ... Nasıl belirli bir sınıfını atlayabilirsiniz bir döngü içinde süre
Http://www.imdb.com/chart/topBut bu film başlıkları bir sürü başka göründüğünü ne zaman: Ben yapıyorum bir film analizi için tam listesini indirmek için bu sayfayı benim sunucu kapmak yaşıyorum.
Ben JavaScript çalıştırmak ve PHP ile sonuçlar elde edebilmek istiyorum ve bana bunu ayrıştırmak olanak PHP için bir kütüphane var olup olmadığını merak ediyor.
Bu web ayrıştırma olduğunda nasıl Google alakalı içerik bulmak nedir? Diyelim ki, örneğin, Google içerik ayrıştırmak için PHP yerli DOM Kütüphane kullanır.
i ilk kez yüklediğinizde benim sorunum bu tür siteler şimdi hurda groupon.com istiyorsanız onların e-posta hizmeti katılmak ister ama sayfayı yeniden onlar doğrudan size sayfanın içeriğini gösterir.
Ben şu durumda değilim.
Ben duvara mesaj facebook sayfası veri kazıma yaşıyorum, burada url:!? Http://www.facebook.com/GMHTheBook?v=wall&ref=ts # / GMHTheBook v = wall & ref = TSI başarıyla kazınarak
Ben WordPress kullanarak autoblogging (yani, RSS-odaklı blog gönderme) ile deney yaşıyorum, ve tüm bu eksik automattically içeriği ... ile yazının içeriği doldurmak için bir bileşenidir
Kod üzerinde PHPControl içinde RequirementsWritten robots.txtAutomatic oranı limitingScrape Opsiyonel featuresListen dayalı (açık kaynak kodlu harika olurdu, kodu satın alma seçeneği çok olan) ...