Tanımlanmış bir düzen vardır how to specify the character encoding in HTML:
Bir belgenin karakter kodlamasını (en yüksek öncelik en düşüğe) belirlerken [...] kullanıcı maddeleri uygun aşağıdaki öncelikleri gözlemek gerekir:
- "Content-Type" alanında bir HTTP "charset" parametresi.
- "Http-eşdeğeri" A
META
beyan set "Content-Type" ve "charset" için ayarlanmış bir değeri.
charset
özellik, harici bir kaynak ataması bir öğe ayarlanır.
Hiçbir karakter kodlaması bildirimi varsa, HTTP defines ISO 8859-1 as default character encoding. HTML için varsayılan karakter kodlaması olarak çok ya da sadece yanıtı işlemek için çöp kullanabilir ya.
XHTML için size ayrıca var XML declaration as source for the encoding:
XML belgesinde, belgenin karakter kodlamasını XML beyannamesinde belirtilir (örneğin, <?xml version="1.0" encoding="EUC-JP"?>
). Amacıyla belirli karakter kodlamaları ile taşınabilirlik, mevcut belgeler, en iyi yaklaşım, web sunucusu doğru başlıklarını sağlar sağlamaktır. Bu mümkün değilse, açıkça onun karakter kodlamasını belirlemek isteyen bir belge XML bildirimi bir kodlama bildirimi ve meta
http-eşdeğerli tablosunu her içermelidir (örneğin, <meta http-equiv="Content-type" content="text/html; charset=EUC-JP" />
). XHTML-uyumlu kullanıcı ajanlar, XML bildiriminin kodlama bildiriminin değer önceliklidir.
Eğer hiçbir karakter kodlaması bildirimi, XML defines UTF-8 and UTF-16 as default character encoding:
Bir kodlama üst düzey protokol tarafından belirlenir olmadıkça bir XML öğesi hiçbir kodlama bildirimi içermediği halde içeriği UTF-8 veya UTF-16 değilse, aynı zamanda ölümcül bir hatadır.
Yani, özetlemek için, sırası:
- "Content-Type" alanında bir HTTP "charset" parametresi.
encoding
niteliği ile XML bildirimi.
- "Http-eşdeğeri" A
META
beyan set "Content-Type" ve "charset" için ayarlanmış bir değeri.
Hiçbir karakter kodlaması bildirimi varsa, HTML için Varsayılan kodlama olarak ISO 8859-1 varsayabiliriz ve XHTML için Varsayılan kodlama olarak UTF-8 veya UTF-16 kabul gerekir.