Html için Regex php niteliklerini

2 Cevap php

Ben etiket php nitelikleri html bir dizeyi ayrıştırmak çalışıyorum. 3 olgu olabilir:

attribute="value"  //inside the quotes there can be everything also other escaped quotes
attribute          //without the value
attribute=value    //without quotes so there are only alphanumeric characters

Birisi (bu mevcut ise) bana öznitelik değeri ilk maçında öznitelik adı ve ikinci alabilirsiniz bir regex bulmak için yardımcı olabilir?

2 Cevap

Bu bir şans verin ve bu etiketleri ayıklamak istediğiniz olup olmadığını görmek.

preg_match_all('/( \\w{1,}="\\w{1,}"| \\w{1,}=\\w{1,}| \\w{1,})/i', 
    $content, 
    $result, 
    PREG_PATTERN_ORDER);
$result = $result[0];

Regex, her öznitelik çeker etiket adı dışlar, ve birinci ve ikinci nitelikleri üzerinde döngü mümkün olacak böylece bir dizi sonuçları koyar.

Never ever use regular expressions for processing html, especially Bir kitaplık yazıyoruz ve giriş gibi görüneceğini bilmiyorum. Örneğin, simplexml bir göz atın.