Ben PHP kullanarak tek kelime içine bir metni bölmek istiyorum. Nasıl bunu başarmak için herhangi bir fikrin var mı?
Benim yaklaşım:
function tokenizer($text) {
$text = trim(strtolower($text));
$punctuation = '/[^a-z0-9äöüß-]/';
$result = preg_split($punctuation, $text, -1, PREG_SPLIT_NO_EMPTY);
for ($i = 0; $i < count($result); $i++) {
$result[$i] = trim($result[$i]);
}
return $result; // contains the single words
}
$text = 'This is an example text, it contains commas and full-stops. Exclamation marks, too! Question marks? All punctuation marks you know.';
print_r(tokenizer($text));
Bu iyi bir yaklaşım mı? Eğer iyileştirilmesi için herhangi bir fikrin var mı?
Şimdiden teşekkürler!