UTF-8 xml dosyası Cıbırca gösterir

3 Cevap php

Ben Wordpress MySQL veritabanı ihraç edildi UTF-8 kodlanmış xml dosyası var.

Dosya UTF-8 olarak kaydedilir ve kodlama UTF-8 iken, ben onun yerine orada, bu gibi görünüyor hangi olması gerekiyordu İbranice metnin anlamsız olsun:

™ × • × ~ × • × ª

Nasıl orijinal kodlama veya charset bulmak ve doğru İbranice içine metin dönüştürebilirsiniz?

PHP'nin mb_detect_encoding ($ str); UTF-8 döndürür

Farklı ayarları ve giriş / çıkış chartsets'ten ile, php kodlama fonksiyonları her türlü denedim, ama hepsi gibi, anlamsız blok görünümlü farklı yazdırmak:

ÃâÃËÃâ ¢ â, ¬ Ã⠢ AEA

ve

× × © × ž ×

... Herhangi bir düşünce, bu konuda gitmek nasıl?

3 Cevap

Eğer veritabanına erişebilir durumda, siz latin1 olarak ihracat ve UTF8 olarak ithal ederek kolayca çözebilirsiniz. O olmuştur gibi suggested here.

Bu this sorunun çok benzer.

Görebildiğim kadarıyla, bu, her unicode karakter iki unicode karakter olarak kodlanmış var karıştırılmış bir Unicode dizesi vardır.

Ben ile geldi kodu sadece boş yüksek mertebe bayt atılır ve bu orijinal bayt dizisi yeniden. Kodu yalnızca bir örnektir ve yaklaşım very basit, ama oraya yardımcı olmalıdır.

belki de utf-8 değildir ve xml sorgu bu istenmeyen dize döndürür nedeni şu, php dosyasına bir göz atın.