Question

Ben başarmak için çalışıyorum:

HTTP bir sitenin içeriğini GET (diyelim google.com)
Sonra bu sayfayı (örneğin CSS dosyaları, tüm JavaScript dosyaları, tüm görüntüleri, tüm iframe'lerin, vb) yüklemeye çalışır tüm kaynakları çekecektir kanca veya filtrenin çeşit var

: Akla gelen ilk şey, ancak çok sayıda ve bazıları zor, CSS, örneğin bildirilen bir görüntü arka plan gibi, indirilen sayfa / kodu ayrıştırmak ve bir kaynak bağlantı olabilir tüm etiketleri ayıklamak için

body {background-image:url('paper.gif');}

Ayrıca, JavaScript yoluyla yüklenebilir amaçlanan tüm bilgi yakalamak gerekir. Örneğin bir URL oluşturmak ve kaynak yüklemek için yorumlamak daha bir JS işlevi var.

Bu nedenle ben kanca veya filtrenin çeşit sahip düşünüyorum / monitör ihtiyacım budur.

(Unix kutusu üzerinde çalışıyor güzel bir şey olurdu rağmen) programlama dili önemli değildir.

GÜNCELLEME: Bu otomatik bir çözüm olması gerekiyor.

Teşekkür ederim.

Answer 1

Ben size tam otomatik çözüm arıyoruz varsayarak yaşıyorum.

Orada birkaç (tüm önemli betik dillerde, wget-tabanlı, ve diğerleri) dosyasını ayrıştırma yaklaşımlar vardır ama biliyorum ki hiçbiri aslında bu interpret JavaScript (bu iniyor ne olacağını çünkü).

Sana sahip tek seçenek, bir Firefox (veya diğer modern tarayıcı) Unix / Linux kutuyu örneği kurmak ona bir URL beslemek ve / bloğunu bunu yapmak için çalışır giden tüm bağlantıları izlemek olduğunu düşünüyorum. Bir istemci PC'de, bu Firebug "Net" sekmesinin içeriği olduğunu. İster bu aslında tarayıcının parçaları yeniden olmadan otomatik olabilir ne ölçüde, bilmiyorum. Belki Selenium RC ya da Selenyum takımından diğer araçlardan biri bir başlangıç noktasıdır.

Answer 2

Bunu yapmanın en basit yolu bir Fiddler addon yazmak olacaktır.

Answer 3

Ayrı sayfa için ilk çağrı bir şey talep edilmektedir ek kaynak olacak - Hep kurulum fiddler ve trafik bakmak gibi bir vekil olabilir.

JS veya bir HTML sayfası yükleme kaynakları üzerinde herhangi bir başka dil kanca

3 Cevap

etiketler