Ben bir HTML sayfası bir bölümünü seçmek için XPath kullanıyorum. Ben düğüm ayıklamak için XPath kullanın Ancak, bu correctly sadece metin surrounding HTML etiketlerini ve not HTML etiketlerini kendileri seçer.
Sample HTML
<body>
<div>
At first glance you may ask, “what <i>exactly</i>
do you mean?” It means that we want to help <b>you</b> figure...
</div>
</body>
I have the following XPath
/body/div
I get the following
At first glance you may ask, “what do you mean?” It means that we want to help figure...
I want
At first glance you may ask, “what <i>exactly</i> do you mean?” It means that we want to help <b>you</b> figure...
Eğer Örnek HTML fark ederseniz bir <i/>
ve içeriği <b />
HTML etiketleri vardır. Ben içeriğini ayıklamak zaman o etiketleri içinde kelime "kaybolabilir".
Bir fark yaparsa ben PHP SimpleXML kullanıyorum.