The original question is below, but I changed the title because I think it will be easier to find others with the same doubt. In the end, a XHTML document is a XML document.
Bu bir acemi bir soru, ama PHP5'ta XHTML belgeleri ayrıştırma için en iyi kütüphane olduğunu düşünüyorsunuz bilmek istiyorum?
Ben HTML dosyalarından XHTML yarattı (ki Word'ü kullanarak oluşturduğunuz yere: S) Tidy ile, ve ben (
etiketleri bazı özelliklerini değiştirmek ve eleman gibi) onlardan bazı unsurları değiştirmek gerekir biliyorum.
Ben kolay biri bir var, hangi PHP ayrıştırma için birçok seçenek (vb Basit XML DOM) olarak görünüyor ve hepsi yapabilirsiniz eğer ben ne gerek bilmiyorum, çok XML kullanmadıysanız kullanmak için.
İngilizcem için özür dilerim, ben Arjantin oluştururlar. Teşekkürler!
I bit more information: Ben Word 97'de yapılan HTML sayfaları, bir sürü var. Ben temizlik ve XHTML onları dönüm için Tidy kullanılan Katı, şimdi hepsi XML uyumludur. Ben bazı unsurları bulmak ve (ben bu önemli değil yapmak hangi mantık) bunların yerine bir XML ayrıştırıcı kullanmak istiyorum. Örneğin, ben tüm sayfaları birleşik bir görünüm için, aynı CSS stil ve sınıf özelliklerini kullanmak istiyorum. Bunlar yasal belgeleri içeren tüm statik sayfalar, orada garip bir şey vardır. Ben uzantıları hangisi kullanmalıyım? SimpleXML yeterli mi? Ben daha zor olmasına rağmen DOM öğrenmek gerekir?