Web sayfası içeriği Scrape

3 Cevap php

I am developing a project, for which I want to scrape the contents of a website in the background and get some limited content from that scraped website. For example, in my page I have "userid" and "password" fields, by using those I will access my mail and scrape my inbox contents and display it in my page. Please help me to solve the problem, thanks in advance.

i yalnız javascript kullanarak yukarıda yapmış. I düğmesi sayfamın URL'sini işaretini tıkladığınızda Ama (http://localhost/web/Login.html) i kazınarak am URL (http://mail.in.com/mails/inbox.php?nomail= ....) değiştirildi. Ama benim url değiştirmeden ayrıntıları hurda. , Sorunu çözmek peşin sayesinde bulmak için bana yardım edin ..

3 Cevap

Kesinlikle PHP Simple HTML DOM Parser ile gitmek. Bu hızlı, kolay ve süper esnek. Bu temelde o zaman o nesnenin herhangi bir öğeye erişmek için bir nesne bütün bir HTML sayfası yapışır.

Resmi sitesi örnekte olduğu gibi, ana Google sayfadaki tüm linkler almak için:

// Create DOM from URL or file
$html = file_get_html('http://www.google.com/');

// Find all images 
foreach($html->find('img') as $element) 
       echo $element->src . '<br>';

// Find all links 
foreach($html->find('a') as $element) 
       echo $element->href . '<br>';

Eğer PHP sayfası komut dosyası içinde başka bir web sitesine HTTP isteklerini yapmak için PHP cURL uzantısını kullanabilirsiniz. Bkz the documentation here.

Tabii burada olumsuz sizin kullanıcı için tam sayfa / çıktı sunmak için önce harici web sitesine kazımak zorunda çünkü sitenizin yavaş cevap olacaktır.

Ben kullanımını PHP Simple HTML DOM ayrıştırıcı ve onun iyi olması. Ben stackoverflow sık eklenti için bu kullanmışlardır.