Ben bu yüzden lütfen bana ayı toplam piton çaylak değilim. Python html bir sayfa tarayabilir ve UTF-8 uyumlu şey ile Microsoft Word kişilerin örneklerini değiştirmek istiyorum.
Benim sorum Python (ben bu google'da ettik ama şimdiye kadar net bir cevap bulamadım) nasıl yaparım, nedir? Ben bu yüzden bu gibi basit bir şey anlamaya Python sularda benim parmak daldırma istiyorum başlamak için iyi bir yerdir. Ben gerekir gibi görünüyor:
- Bir değişken içine MS Word yapıştırılan yük metin
- tür içeriği işlevini yerine bazı çalıştırabilirsiniz
- çıktısı
PHP Ben bu gibi yapardı:
$test = $_POST['pasted_from_Word']; //for example “Going Mobile”
function defangWord($string)
{
$search = array(
(chr(0xe2) . chr(0x80) . chr(0x98)),
(chr(0xe2) . chr(0x80) . chr(0x99)),
(chr(0xe2) . chr(0x80) . chr(0x9c)),
(chr(0xe2) . chr(0x80) . chr(0x9d)),
(chr(0xe2) . chr(0x80) . chr(0x93)),
(chr(0xe2) . chr(0x80) . chr(0x94)),
(chr(0x2d))
);
$replace = array(
"‘",
"’",
"“",
"”",
"–",
"—",
"–"
);
return str_replace($search, $replace, $string);
}
echo defangWord($test);
Python bunu nasıl yapardınız?
EDIT: Hmmm, tamam şu an için UTF-8 ve kuruluşlar hakkında benim karışıklık görmezden. Giriş MS Word yapıştırılan metin içeriyor. Kıvırcık tırnak gibi şeyler gibi garip simgeler gösteriyor. Çeşitli PHP fonksiyonları deneyin ve bana istediğim sonuç veren değil düzeltmek için kullanılır. Bir hex editörü o garip semboller görüntüleyerek Ben onlar (0xe2, 0x80 vb) yukarıda kullanılan sembollere karşılık geldiğini gördüm. Yani ben sadece HTML kuruluşlar ile tuhaf karakterleri takas. Ben yukarıda olması bit zaten UTF-8 IS Yani, ne garip sembolleri neden olduğunu, MS Word içinde yapıştırılan ediliyor?
EDIT2: Yani Python hakkında biraz bilgi edinmek için yola ve ben gerçekten kodlama anlamıyorum bulundu. Ben çözmeye çalışıyordum sorun uçtan uca sonsistent kodlama alarak basitçe ele alınabilir. Giriş formu UTF-8 ise, giriş depolayan veritabanı Word yapıştırma çalışıyor ... UTF-8 ve UTF-8 çıkışları sayfasıdır. Özel fonksiyonlar gerekli. Şimdi, küçük bir Python öğrenme hakkında ...