Nedir bu kodlama ...

2 Cevap php

Im bir site için bir imdb veri kazıyıcı üzerinde çalışıyor, ve ben onlar daha önce hiç görmediğim garip bir kodlama her şeyi kodlamak gibi görünüyor.

<a href="/keyword/exploding-ship/">Exploding&#xA0;Ship</a>
A Bug&#x27;s Life

Bu düzenli karakter dönüştürmek bir php işlevi var mı?

2 Cevap

Bu html kişiler onaltılık kodları bulunuyor, kodlama değildir.

denemek

$converted = html_entity_decode($string, ENT_QUOTES, 'UTF-8');

Bu SGML karakter kaçar vardır. Ya ondalık (&#39;) veya onaltılık (&#xA0) olabilir ve bir Unicode kod noktası doğrudan başvurabilirsiniz.

html_entity_decode() PHP 5 çalışmalıdır. Ben şu anda test edemez rağmen.

Bu başvuru sayfası ilk yorumda, aşağıdaki kod eski PHP sürümleri için verilir:

// For users prior to PHP 4.3.0 you may do this:
function unhtmlentities($string)
{
    // replace numeric entities
    $string = preg_replace('~&#x([0-9a-f]+);~ei', 'chr(hexdec("\\1"))', $string);
    $string = preg_replace('~&#([0-9]+);~e', 'chr("\\1")', $string);
    // replace literal entities
    $trans_tbl = get_html_translation_table(HTML_ENTITIES);
    $trans_tbl = array_flip($trans_tbl);
    return strtr($string, $trans_tbl);
}