PHP kelime indeksi, performans ve uygun sonuçlar

0 Cevap php

I'm currently working on an indexer for a search feature. The indexer will work over data from "fields". Fields looks like:

  Field_id   Field_type   Field_name   Field_Data
- 101        text         Name         Intel i7
- 102        integer      Cores        4 physical, 4 virtual
- 103        select       Vendor       Intel
- 104        multitext    Description  The i7 is intel's next gen range of cpus.

Dizinleyici aşağıdaki sonuçlar / index oluşturmak istiyoruz:

  Keyword    Occurrences
- intel      101, 103, 104
- i7         101, 104
- physical   102
- virtual    102
- next       104
- gen        104
- range      104
- cpus       104   (*)
- cpu        104   (*)

Bu yüzden biraz tüm hoş ve güzel görünüyor, ancak ben dışarı sıralamak istiyorum bazı konular vardır:

  • ortak kelimeleri filtreleyerek (belki fark olarak, "" "ve" intel ait "listesinde eksik" yorum "" dir)
  • Bakışlarına "CPU'lar" (tekil kelimeler çoğul vs) ile, belirli bir türü (tekil veya çoğul), tam iki ya da (yani, "CPU'lar" farklı "cpu") kullanmak için iyi olurdu?
  • Önceki öğe ile devam eden, nasıl bir çoğul (farklı tatlar: test => Balık => balık ve yaprak => yaprak testleri) belirleyebilirsiniz
  • Şu anda MySQL kullanılarak ve ben very concerned performans sorunları ile kulüpler; Biz 500 + kategoriler var ve biz bile siteyi başlatmak değildi
  • , Satıcı alan adı (field_name), size SQL Server üzerinde büyük bir etkisi olacağını düşünüyorsunuz belirtir: Diyelim ki arama terimi "intel satıcı" kullanmak istedim diyelim?
  • Arama kısıtlama; Ben tüm bu sevmiyorum, ama bu bir olasılık, ve herhangi bir geçici çözümler biliyorsanız, kendinizi duyurmak!
  • Ben muhtemelen herhangi bir nokta varsa, bana bağırma için buyrun, unutmuşum diğer sorunlar vardı ;-)
  • Ben aslında, ben specifically want it to not crawl links, tarama bağlantıları arama motoru gerekmez.

(by the way, I'm not biased towards intel, it simply happens that I own an i7-based pc ;-) )

0 Cevap