Soruların mı var ? Cevaplar bizde!

Ben yapılandırılmamış metin olarak, bu örgüt içinde örgüt ve bireyin konumunu adı ile her satırda gibi bir metin alanı olan bir CSV dosyasını işlemeye çalışıyorum.
etiketler:
Pinyin sayısal / ASCII biçiminde (örneğin: Nin2 hao1) yazılı: Ben sesi işaretleri aksan (NAN hÇŽo örneğin) ile yazılır Pinyin'i dönüştürmek için arıyorum. Herkes, bunun için herhangi bir kütüphaneler biliyor mu ...
etiketler:
. Lorem ipsum * * dolor amet consectetur adipiscing elit oturmak: Ben, ilk, iki şey yapmak (n sınırlı) en çok kullanılan kelime ve sözcük dizileri Örnek olarak verilen bir metin bulmak gerekir.
etiketler:
Yakın gelecekte bazı zaman ben bir çapraz dil kelime sayısını uygulamak gerekir, ya da bu mümkün değilse, bir çapraz dil karakter count.By kelime sayısı Ben kelimelerin doğru bir sayım demek ...
etiketler:
Ben bir yazı analiz ve örneğin, yazılmış gergin hangi öğrenmek için bir yol arıyorum: "Ben markete gidiyorum" == akımı, "Ben bir araba aldım" == geçmiş vb.
etiketler:
Bu yüzden herkes bir Domain Specific Language (ben bir yaratıyorum, gibi dil, her türlü ayrıştırmak yardımcı bir sınıf veya kitaplık biliyor mu, hiç fazla bulgu olmadan etrafında google'da yüzden ben Been ...
etiketler:
Ben bir cümle var, örneğin John Doe son year.Now ben tek kelimelerle cümle bölünmüş ve ben almak New York'a taşındı: ('John', 'Doe', 'Yeni', 'için', 'hareket' dizisini
etiketler:
Ben ayıklamak (tercihen PHP) bir kitaplık için arıyorum tartmak / a string.I yükseklik verileri gibi giriş şey benim kullanıcıları istiyoruz "Ben 80 k tartmak ve ben 1.8m uzun boylu değilim" ya da "220 £"
etiketler:
Ben metin paragrafı alıp ondan "etiketleri" listesini ayıklamak gerekir.
etiketler: