I Begin with textmining. I have two database tables with thousands of data..
"beceri kategorilerinde" için "beceri" ve bir tablo için bir tablo
- Her "beceri" bir beceri kategoride aittir.
- beceri açıklayan bazı metin var olduğu bir "beceri", veritabanında, physicaly, bir varchar (200) alandır.
İşte beceri tablodan çıkarılan bazı becerileri:
"PHP (good level), Java (intermediaite), C++" "PHP5" "project management and quality management" "begining Javascript" "water engineering" "dfsdf zerze rzer" "cibling customers"
what i want to do is to extract knowledge from those fields, i mean extract only the real skill and ignore the rest of useless text. for the above example i want to get only an array with:
"PHP" "Java" "C++" "PHP5" "project management" "quality management" "Javascript" "water engineering" "cibling customers"
what should i do to extract the skills from tons of data please ? do you know specific algorithms to do this ? ex : k-means ... ?
Şimdiden teşekkürler.