$string = file_get_contents('http://example.com');
if ('UTF-8' === mb_detect_encoding($string)) {
$dom = new DOMDocument();
// hack to preserve UTF-8 characters
$dom->loadHTML('<?xml encoding="UTF-8">' . $string);
$dom->preserveWhiteSpace = false;
$dom->encoding = 'UTF-8';
$body = $dom->getElementsByTagName('body');
echo htmlspecialchars($body->item(0)->nodeValue);
}
Bu ¾, ¤ ve diğer çöp, Å tüm UTF-8 karakter değiştirir. Nasıl UTF-8 karakterlerini korumak için başka bir yolu var mı?
Ben UTF-8 olarak çıktısı ediyorum emin olmak için bana cevaplar sonrası etmeyin, ben olduğumdan emin yaptı.
Şimdiden teşekkürler :)