Dosya kodlamasını Linux kontrol nasıl?

4 Cevap php

Benim şirket php scripts (fransızca, almanca, ispanyolca, italyanca ve İngilizce de dahil olmak üzere) farklı dillerde metinler vardır.

Geliştiriciler herkes için üs olarak Latin-1 kodlamasını kullanmaya karar verdi, bu yüzden bu şekilde kimse o dosya kodlama ve bozuk yabancı dil geçersiz kılar. (İlk başta bazı geliştiriciler html varlıkları kullanılır, ancak bu yol tercih edilmez)

Senin için birkaç sorum var:

  1. Nasıl linux üzerinde dosya kodlama kontrol edebilirsiniz?
  2. Eğer deneyim farklı dillerde dosyaları ile çalışan olsaydı, nasıl başkalarının kodlama kılamaz başardınız?

Önceden herhangi bir tavsiye için teşekkürler

4 Cevap

Geliştiriciler herkes için üs olarak Latin-1 kodlamasını kullanmaya karar verdi, bu yüzden bu şekilde kimse o dosya kodlama ve bozuk yabancı dil geçersiz kılar.

Latin-1 En dilleri işleyemez. Unicode Lezzetleri (tipik olarak UTF-8) tercih edilir.

Nasıl linux üzerinde dosya kodlama kontrol edebilirsiniz?

file programı ile. Sadece olsa tahmin edebilirsiniz.

Eğer deneyim farklı dillerde dosyaları ile çalışan olsaydı, nasıl başkalarının kodlama kılamaz başardınız?

Makul yapılandırılmış editörler.

file Size, vb dahil olmak üzere charset, dil,. Dosya türüne bağlı olarak bir dosya hakkında bilgi verir.

--mime-encoding yalnızca istediğiniz bilgi almak için kullanın.

1. Ben ileri ve geri dönüştürmek için iconv kullanmış, ancak kodlama bilmiyorum çünkü, ilk (Extremely Naif Karakter Analiz) enca deneyin. Ama genel olarak, o vb ortak kelime bilgisi gerektirir beri doğru almak çok zor

2. Tek aklı başında yaklaşım, bunun için Unicode gibi daha büyük bir karakter kümesi kullanmaktır. Sen sadece izin kaynak kontrol sistemine bir ön kayıt kanca ekleyerek bu zorlamak olabilir (örneğin) doğru biçimlendirilmiş utf-8 dosyaları.

Bir dosyanın kodlamasını kontrol güvenilir bir yolu yoktur; değişik 8-bit tek-bayt kodlamaları muayene olmadan neredeyse ayırt edilemez. UTF-8 kullanarak herkes her yerde çalışmak için bir tek, evrensel-geçerli kodlama anlamına gelir.