Simplehtmldom - kıvırmak, döngüler, diziler?

3 Cevap php


Pse forgive what is most likely a stupid question. I've successfully managed to follow the simplehtmldom examples and get data that I want off one webpage.

Ben bir dizindeki tüm html sayfalarını geçmesi ve veri ayıklamak için işlevini ayarlamak mümkün olmak istiyorum. Ben googled google'dan ama benim cahil devlet vardı şimdi ben dizinde dosya bir dizi oluşturmak için PHP kullanabilirsiniz (bir şekilde) olabilir ama bu mücadele ediyorum düşündüm kafam karıştı ettik.

Ayrıca gördüğüm bir çok örnek kıvırın kullanıyor gibi görünüyor. Birisi nasıl yapılması gerektiğini bana söyleyebilir Lütfen. Dosyaların önemli bir vardır. Onları birleştirerek denedim ama bu sadece bir html editörü aracılığıyla bunu yaparken ile çalışır - cat -> çalışmıyor.

3 Cevap

Muhtemelen (manual page) bir dizi olarak tüm dosyaların bir listesini almak için glob('some/directory/*.html'); kullanmak istiyorum. Sonra bu üzerinde yineleme ve her dosya için DOM malzeme kullanmak.

Eğer başka bir web sunucusu HTML çekerek eğer sadece bu web sunucusunda depolanan eğer glob() istiyorsanız, kıvırın gerek.

HTML dosyasının içeriğini veya sadece bazı belirli verileri almak istiyor musunuz?

Eğer Tamam çalışma hakkında konuşmak çözümleyici varsayarsak, basit www-örümcek inşa etmeliyiz. Bir web sayfasının tüm bağlantılara bakmak ve "link-to-tarama" bir listesini oluşturmak. Ve bu sayfaların her biri tarama ...

Eğer olsa döngüsel başvurular dikkat etmelisiniz.