Nasıl utf-8 olabilir dizeleri (örneğin 8-bit dizisi) XML uyumlu 7-bit dizeleri (sayısal varlık yani yazdırılabilir ASCII) için / dönüştürülebilir?
yani bir encode() fonksiyonu, öyle ki:
encode("“£”") -> "“£”"
decode() de yararlı olacaktır:
decode("“£”") -> "“£”"
PHP'nin htmlenties() / html_entity_decode() çifti doğru olanı yapmaz:
htmlentities(html_entity_decode("“£”")) ->
"“£”"
Zahmetle türlerini belirterek biraz yardımcı olur, ama yine de XML-uyumsuz adlı varlıkları değil, sayısal olanları döndürür:
htmlentities(html_entity_decode("“£”", ENT_QUOTES, "UTF-8"), ENT_QUOTES, "UTF-8") ->
"“£”"