Herkes 'Nutch arama motoru' tarama sonuçlarını okumak için bir PHP API ile çalıştı?

3 Cevap php

I have set up 'Nutch search engine' to crawl websites. Now,I need to write an php API to talk to the Nutch search engine. I need to do 2 things:

  1. using a PHP script I need to specify to Nutch as to which URLs to crawl (for this I have some pointers from http://www.cs.sjsu.edu/faculty/pollett/masters/Semesters/Fall07/sheetal/?Deliverable2.html

  2. using a PHP script I need to retrieve the crawl result from the Nutch crawl DB. I cant seem to find any help on this (or I might be too dumb to see the answer if it's already there :()

Herkes Nutch tarama sonuçlarını okumak için bir PHP API kullanmışsa, bana bazı işaretçiler paylaşın lütfen.

Umutsuzca bazı yardım bekliyor.

3 Cevap

I'm looking for a real good way to do this too. But as of now, Im using a JSP API to display search results. This should start you off.

Sen alternatif JSON nesneleri olarak sonuçları tarifesi için php kullanabilirsiniz.

To kick you off in this direction, there's a interesting page to get you started on JSON using jquery. Google for other tutorials on JSON. There are plenty of'em.

for your question #1 you need to inject these URLs to the crawler. Relatively simple : + create a file with the URLs you want added + issue inject command with these URL's (may need to wait for the end of the previous crawl/fetch/index cycle) + start a new crawl

Not: Emin adresler de filtre değil yapmak gerekir

Eğer arama ya da başka bir arama platformu için, nutch sadece bir tarayıcı olduğunu SOLR kullanmanız gerekir, fikir basittir:

  • ==> Tarama için nutch
  • ==> Bir dizin oluşturmak için Solr
  • ==> build an interface to search inside the index( step 2). i used SolariumBundle‎ for this step