Ben kazıma web sayfalarını içeren bir php komut dosyası yazıyorum. Şu anda, komut satır sayfa satır analiz eder, fakat gibi, birden fazla satıra yayılan bir etiketi varsa kırılır
<img src="example.jpg"
alt="example">
Kötü kötü gelirse, ben muhtemelen> yakın onları yeniden yerleştirerek, daha sonra tüm satır sonlarını kaldırarak sayfasını önişlem olabilir, ama bu bir kludge gibi görünüyor.
İdeal, satıra yayılan bir etiket algılamak sadece bu hatları birleşmek ve işleme devam etmek mümkün olurdu. Yani bu tespit etmek için en iyi yöntem nedir?