Ben bir yazı analiz ve örneğin, yazılmış gergin hangi öğrenmek için bir yol arıyorum: "Ben markete gidiyorum" == akımı, "Ben bir araba aldım" == geçmiş vb. .
Bu ben nasıl yapılıyor olabilir herhangi bir ipucu?
Ben bu fark kadar Evet, bu son derece zor olacak ... Ben hızlı bir hafta sonu proje olacaktı ne için benzer bir şey yapmaya başlamıştı ... yine de burada yardımcı olmak için bulduğumuz bir kaynaktır.
Download the source code of Wordnet 3.0 from Princeton, hangi ingilizce kelimelerin bir veritabanına sahiptir. Dosya / dict / index.verb çok fazla sorun olmadan bir CSV olarak veritabanına aktarmak gerekir şimdiki ingilizce fiillerin bir listesi. Oradan, kendi konum ve İngilizce dil wierdness işlemek için nasıl anlamaya gerekir.
Bu oldukça tasking süreç olabilir. Eğer almak nasıl ayrıntılı istiyorsun? Sadece geçmiş, şimdiki ve gelecek düşünmek istiyor musunuz? Yoksa Simple Present, Present Progressive, Simple Past, vb dikkate almak istiyorsun?
Her durumda, ayrıca Olumlu formlar, formlar Olumsuz ve soru formları değerlendirmek gerekir. Yardımcı olabilecek büyük bir grafik çevrimiçi http://www.ego4u.com/en/cram-up/grammar/tenses bulunabilir
Kuralları ve sinyal kelimeleri unutmayın.
Böyle bir görev için, ben Düzenli ifadeler yeterli olmayacaktır inanıyorum: Bu oldukça zor bir görev ...
Ya regex gelen hiç iyi bir şey almazsınız, ya da sen bile anlamak ve korumak mümkün olmayacak süper-canavar-regex çeşit ile bitireceğim ...
Bu muhtemelen regex daha fazlasını gerektirir ... "dilsel-motoru" bir tür gibi bir şey, sanırım ...
Eğer gerçekten ihtiyacınız ve sadece etrafında oynamak değil iseniz, nltk bakmak olabilir. Ayrıştırma karmaşık bir konudur. Doğal dillerini Ayrıştırma daha karmaşıktır. Ve İngilizce gibi bir çok düzensiz dili, ayrıştırma, daha da kötüdür. Eğer sorun kapsamını daraltmak, bir çözüm daha iyi bir şansı.
Bunu ne için istiyorsun?