HTML dosyası tüm metin ayıklamak için nasıl
Ben <, alt öznitelikleri, tüm metin ayıklamak istiyorum p> etiketleri, vb.
Ben stil ve script etiketleri arasındaki metin ayıklamak istemiyorum ancak
Teşekkürler
şimdi ben aşağıdaki kodu var
<?PHP
$string = trim(clean(strtolower(strip_tags($html_content))));
$arr = explode(" ", $string);
$count = array_count_values($arr);
foreach($count as $value => $freq) {
echo trim ($value)."---".$freq."<br>";
}
function clean($in){
return preg_replace("/[^a-z]+/i", " ", $in);
}
?>
This works great but it retrieves script and style tags which I don't want to retrieve and the other problem I am not sure if it does retrieve attributes like alt - since strip_tags function might remove all HTML tags with their attributes
Teşekkürler