Nasıl regexes ile bir web sayfasından veri ayıklamak?

3 Cevap php

Bazı cinsel suçlular hakkında bilgi toplamak için, ben aşağıda verilen gibi bağlantıları toplayıp senaryoyu geliştirdik bir kıvrılma senaryo yazıyorum:

http://criminaljustice.state.ny.us/cgi/internet/nsor/... (snipped URL)

Benim kendi değişkenlere, soyadı vb: Bu linke gittiğinizde Şimdi Suçlu Id gibi bu sayfadaki tüm alanları altında bilgi almak istiyorum. Ben buradayım neden bu regex çok zayıfım. Ya da başka bir yolu var mı?

Kimse bunu yaparken bana yardımcı olabilir misiniz?

3 Cevap

phpQuery PHP ekran kazıma için çok güzel. Bu jQuery vardır aynı yöntemleri kullanarak DOM erişmenizi sağlar.

Ben RegEx iş için doğru aracı değil varlık hakkında önceki posteri ile kabul etmek eğilimindedir. Sadece hızlı ve kirli bir ifade istiyorsanız, buraya:

Offender Id:.*
.* [0-9]*

NOTE: You must include the newline in this expression. Also note that this is very fragile as it will break if the source that your are parsing changes much at all.