PHP metni analiz etmek iyi yaklaşım?

2 Cevap php

Ben kullanıcıların yazı analiz ve kategorize etmek gerekir. Örneğin: - "satmak" olarak kategorize edilir "I sell evim için arıyorum" Ben bir "satın alma" yazısı ya da metne dayalı bir "satmak" olarak yazılan her yazı kategorize var. Ayrıca "satmak" olarak kategorize edilmesi gerekiyor "Benim eski evin kurtulmak için arıyorum" - Sorun genellikle onun kadar basit değil ki. "Ben bir ev arıyorum" "satın alma" olur. Ben de söz konusu maddenin dayanarak bu mesajları kategorize etmek istiyorum - örneğin, yukarıda sonrası "satın alma" ve "ev" olarak kategorize olacaktır.

Can anyone recommend a good approach / good framework / technique when it comes to analyzing and understanding user input? Thanks.

2 Cevap

Haklısın; bunu yapmak zor bir şey.

Yahoo! kullanabileceğiniz bir Term Extraction API / Web servisi var. Bunu kendiniz yapmak için kod bir milyon satır yazmadan kendi metin üzerinde dil analiz kullanmak için oldukça iyi bir yoldur. Ben kullanmadım, böylece soru sorar gibi, benzer anlamları ile nasıl çalıştığını iyi bir fikrim yok.

Ne bahsediyoruz ayrıca spam filtreleme için kullanılan, temelde bir Bayesian filtering problem olduğunu. Ayrıca bakınız this talk. Bu oldukça karmaşık bir alandır.