Nasıl utf-8 olabilir dizeleri (örneğin 8-bit dizisi) XML uyumlu 7-bit dizeleri (sayısal varlık yani yazdırılabilir ASCII) için / dönüştürülebilir?
yani bir encode()
fonksiyonu, öyle ki:
encode("“£”") -> "“£”"
decode()
de yararlı olacaktır:
decode("“£”") -> "“£”"
PHP'nin htmlenties()
/ html_entity_decode()
çifti doğru olanı yapmaz:
htmlentities(html_entity_decode("“£”")) ->
"“£”"
Zahmetle türlerini belirterek biraz yardımcı olur, ama yine de XML-uyumsuz adlı varlıkları değil, sayısal olanları döndürür:
htmlentities(html_entity_decode("“£”", ENT_QUOTES, "UTF-8"), ENT_QUOTES, "UTF-8") ->
"“£”"