I'm currently working on an indexer for a search feature. The indexer will work over data from "fields". Fields looks like:
Field_id Field_type Field_name Field_Data
- 101 text Name Intel i7
- 102 integer Cores 4 physical, 4 virtual
- 103 select Vendor Intel
- 104 multitext Description The i7 is intel's next gen range of cpus.
Dizinleyici aşağıdaki sonuçlar / index oluşturmak istiyoruz:
Keyword Occurrences
- intel 101, 103, 104
- i7 101, 104
- physical 102
- virtual 102
- next 104
- gen 104
- range 104
- cpus 104 (*)
- cpu 104 (*)
Bu yüzden biraz tüm hoş ve güzel görünüyor, ancak ben dışarı sıralamak istiyorum bazı konular vardır:
- ortak kelimeleri filtreleyerek (belki fark olarak, "" "ve" intel ait "listesinde eksik" yorum "" dir)
- Bakışlarına "CPU'lar" (tekil kelimeler çoğul vs) ile, belirli bir türü (tekil veya çoğul), tam iki ya da (yani, "CPU'lar" farklı "cpu") kullanmak için iyi olurdu?
- Önceki öğe ile devam eden, nasıl bir çoğul (farklı tatlar: test => Balık => balık ve yaprak => yaprak testleri) belirleyebilirsiniz
- Şu anda MySQL kullanılarak ve ben very concerned performans sorunları ile kulüpler; Biz 500 + kategoriler var ve biz bile siteyi başlatmak değildi
- , Satıcı alan adı (field_name), size SQL Server üzerinde büyük bir etkisi olacağını düşünüyorsunuz belirtir: Diyelim ki arama terimi "intel satıcı" kullanmak istedim diyelim?
- Arama kısıtlama; Ben tüm bu sevmiyorum, ama bu bir olasılık, ve herhangi bir geçici çözümler biliyorsanız, kendinizi duyurmak!
- Ben muhtemelen herhangi bir nokta varsa, bana bağırma için buyrun, unutmuşum diğer sorunlar vardı ;-)
- Ben aslında, ben specifically want it to not crawl links, tarama bağlantıları arama motoru gerekmez.
(by the way, I'm not biased towards intel, it simply happens that I own an i7-based pc ;-) )