Bu soru burada zaten bir cevabı var:
Eğer sayfasından HTML kazınır sonra ben PHP Simple HTML DOM Parser tavsiye ederim. Bu geçersiz HTML destekler ve HTML öğeleri işlemek için çok kolay bir yol sağlar.
Eğer kazıma konum sayfa geçerli X (HT) ML ise, herhangi bir PHP's built-in XML parsers yapacağız.
Ben kazıma için PHP kitaplıkları ile çok başarılı olmadı. Eğer olsa maceracı iseniz, deneyebileceğiniz simplehtmldom. Ben HTML hem excellent ayrıştırıcılar olan, Hpricot Ruby veya Beautiful Soup Python için tavsiye ederim.
Ben bu kadar üst düzey bir çözüm değil ki, htmlSQL ile çalışan bazı eğlendim, ama çalışmak için gerçekten basit.
Ben Simple Html DOM Parser yanı sıra yukarıda bahsedilen ile sonuçları ile çok iyi yaşadım. Ve sonra tidy Extension for PHP yanı sıra gerçekten çok iyi çalışıyor ki var.
Benim ana 1and1 üzerinde kıvrılmasını kullanmak zorunda kaldı.
http://www.quickscrape.com/ Ben basit DOM sınıfını kullanarak geldi budur!