Şu anda bir veritabanında benim "sayfalar" üzerinde bir tam metin arama yapıyorum. Kullanıcıların istedikleri sonuçları elde ederken, ben dünyanın geldi sonuçlar geldi neden olarak ilgili bilgileri onlara veremiyoruz.
Ben arıyorum ne Özellikler:
- Ben böyle "test" ve içerdiği çıkan sayfada bir dönem için arama yaparsanız,
<b>here is some test</b> page
, yani HTML Veri var. Ben olumsuz sayfada html kodu etkilemeden terimini vurgulamak gerekir. - Ben sadece google yaptığı gibi, belgenin bir kısmını iade etmek istiyorum; döndürülen kısmı benim arama terimleri iyi bir kısmını içermesi durumunda. Nasıl en terimleri içeren bölümü belirleyebilirsiniz? Hangi bölüm genel olarak en terimleri döndürür, veya tek tek arama terimlerinin çoğu vardır bölümü, ya da her ikisinin kombinasyonu belirlemek için iyi olurdu? Veya birden çok bilgi snipits dahil edilmelidir?
- Ben bu uygulanabilir bir seçenek ise, bu sunucu tarafı yapmak istiyorsunuz?
Ben bu iki şeyi yapmayı gidiş iyi yolu ne olduğu konusunda emin değilim. Ben dikkate alınması gereken kolayca göz ardı edilebilir bir sorunu biliyor musunuz:
a. Eğer dikkatli değilseniz rastgele noktalarda html veri kapalı Snipping tamamen örneğin, bir div etiketi kapanış değil off benim bütün düzeni atabilir, sayfa berbat edebilir. Bu çevrede en iyi çözümler nelerdir?
Yukarıdaki gibi bir arama sistemi elde etmek için en iyi yöntemler nelerdir?