Yani get_elements_by_tag_name('p');
HTML sayfaları ayrıştırmak için çalışıyor ve paragraflar (<p>
) kullanarak arıyorum
Sorun $element->nodeValue
kullandığınızda, bu garip karakterler dönen olmasıdır. Belge bir DOMDocument yerleştirmeden sonra kıvırmak kullanarak $ html içine ilk yüklenir.
Ben charsets ile ilgisi yoktur eminim.
İşte yanıtı bir örnek: "aujourdà ¢  €  ™ hui".
Şimdiden teşekkürler.