Ben PHPXPath ile bir kaç şeyler yapıyor yardıma ihtiyacım var.
Herhangi bir HTML, ben gerek:
- Tüm tabloları ve bunların içeriğini çıkarın
- İlk h1 etiketinden sonra her şeyi kaldır
- (Kendi iç HTML (bağlantılar, listeler, vb) DAHİL) sadece paragraflar tutun
Regex ile, her şeyi mükemmel bir çalışma var. Ben iç içe geçmiş tablolar karşılaştı, ancak ben regex HTML ayrıştırmak için gerçekten aptalca olduğuna karar verdi.
Çok teşekkürler!