Ben bir web sitesi kazımak ve bazı verileri toplamak için PHP kullanıyorum. Tüm regex kullanarak olmadan bitti. Ben bunun yerine özel HTML etiketlerini bulmak için) yöntemi (php patlamak kullanıyorum.
Bu mümkün olduğunu website değişikliklerine (CSS, HTML) yapısı, daha sonra yanlış veri kazıyıcı tarafından toplanan olabilir eğer. Yani soru - HTML yapısı değişti olmadığını nasıl anlarım? Depolanan yanlış veri önlemek için benim veritabanına herhangi bir veri depolamadan önce, bu nasıl tanıyabiliriz.