Satırlı regex yakalama satır sonları için bir belirteç var mı?

3 Cevap php

Ben php ve gebelik * fonksiyonları ile kazıma bazı html yapmaya çalışırken önce bu sorunlar birkaç kez çalıştırmak.

Ben böyle yapıları yakalamak ettik çoğu zaman:

<!-- comment -->
<tag1>lorem ipsum</tag>

<p>just more text with several html tags in it, sometimes CDATA encapsulated…</p>
<!-- /comment -->

Özellikle ben böyle bir şey istiyorum:

/<tag1>(.*?)<\/tag1>\n\n<p>(.*?)<\/p>/mi

işe olur gibi ama \n\n görünmüyor.

Genel bir line-break anahtarı var mı?

3 Cevap

Ben size yerine sadece LF char CRLF çiftini yakalamak (\r?\n){2} bu şekilde \n\n olarak değiştirin düşünüyorum.

Eğer İfadelerinin kullanarak HTML ayrıştırmak istediğinizden emin misiniz? HTML düzenli değil ve çok sayıda köşe durumlar vardır.

Ben (belki this one?) HTML çözümleyici çeşit araştırmak ve sonra döndürülen HTML veri yapısı üzerinden ilgilendiğiniz model belirlemek olacaktır.

Yoksa php için Dom Extension bakmak olabilir. Bu load html from a string or a file için bir işlevi vardır. Daha sonra dom çapraz ve ilgilendiğiniz verileri bulmak için php dom yöntemlerini kullanabilirsiniz