Nasıl bir web sitesi kazımak ve div içindeki verileri almak ekran mı?

4 Cevap php

Nasıl cURL kullanarak bir web sitesi kazımak taranması ve belirli bir div içinde verileri gösterebilir?

4 Cevap

CURL kullanarak sayfasını indirin (belgelerinde examples bir yeri vardır). Sonra DOM div öğe değeri ayıklamak için örnek Simple HTML DOM veya PHPs için, bir DOM Parser kullanın.

CURL kullanımı ile indirdikten sonra XPath div seçin ve içeriğini ayıklayın.

Bir alternatif mümkündür.

# We will store the web page in a string variable.
var string page

# Read the page into the string variable.
cat "http://www.abczyx.com/path/to/page.ext" > $page

# Output the portion in the third (3rd) instance of "<div...</div>"
stex -r -c "^<div&</div\>^3" $page

Bu kod biterscripting bulunmaktadır. Ben 3 div ayıklamak için örnek olarak 3 kullanıyorum. Dize "ABC" demek olan div çıkarmak istiyorsanız, o zaman bu komut sözdizimini kullanın.

stex -r -c "^<div&ABC&</div\>^" $page

Bu komut bir göz atın http://www.biterscripting.com/helppages/SS_ExtractTable.html. Bu unsurlar iç içe zaman bir öğe (div, tablo, çerçeve, vb) ayıklamak için nasıl gösterir.

CURL GET isteği kullanarak web içeriği getir. curl_exec manuel sayfa bir kod örneği var.

İhtiyacınız veri aramak için normal bir ifade kullanabilirsiniz. preg_match kılavuzu sayfa , but you'll need to do some reading up on regular expressions ihtiyacınız deseni oluşturmak edebilmek için bir kod örneği var. Yacoby Ben düşünmemiştim hangi belirtildiği gibi, daha iyi bir fikir PHP'nin Basit XML veya DOM parser kullanarak HTML sayfasının DOM incelemek olabilir.

Çıktı sayfanızın HTML regex / çözümleyici buldum bilgiler (gerekli div içinde.)