Sfenks düzeltme Yazım?

2 Cevap php

Ben sitenize entegre Sfenks-tabanlı arama entegre etmek üzereydi, ama ben yazım düzeltme için yerleşik destek var olduğunu tespit ettik.

Web'de millet halletmek için Pspell veya diğer üçüncü parti kütüphaneleri kullanmanızı öneririz, ama sorun ben aramak için gidiyorum veri, marka isimleri gibi çoğunlukla "teknik" terimlerini içeren, böylece ben ortak kitaplıkları sanmıyorum bunları içerecek.

Öte yandan, Xapian devletler endeksli verilere dayalı yazım düzeltme desteği var, bu yüzden tam olarak ne istediğini. Bu Xapian yerine kullanarak değer mi? Sfenks oldukça iyi görünüyor, ama ikincisi daha küçük topluluk ve daha az belgelerine sahip gibi görünüyor ise, Xapian (ya da belki Lucene?) Serin bazı özellikleri eksik: Ben hala kullanmanız gereken tam arama motoru oldukça karıştı.

Ben kelimeleri özel bunun için birini kullanarak Pspell sözlükte mevcut değildir ile sorunu çözebilir düşünüyorum, ama bunu fark performans kayıplarını empoze edip emin değilim? Ben oldukça popüler bir web sitesinde spot arama (girilen her harfine ajax ayrı arama) için arama sistemi kullanmak için gidiyoruz, bu yüzden performans önemli ediyorum.

İdeal olarak, marka isimleri gibi bazı alanlar Ortak Sözlük üzerinde daha fazla önceliğe sahip olmak isterdim ama çoğu marka, diğer bir deyişle bir oldukça farklı çünkü gerçekten önemli değil sanırım.

Özel bir tam metin arama motoru genel tasarımı üzerinde herhangi bir öneriniz çok açıktır.

Teşekkürler

2 Cevap

Sfenks hiçbir yazım-düzeltme-inşa etti, ancak bu Sfenks kullanılarak uygulanabilir. Sadece bir nasıl yapılır makalesi (Sfenks yazar tarafından) bu konuda http://habrahabr.ru/blogs/sphinx/61807 (Rusça, bu makaleyi okumak için GoogleTranslate kullanabilirsiniz. "Я понял, это adlı makalenin ikinci bölümünde bakın orada bulunabilir намек. ")

Geçenlerde bu yöntemi uygulamak - mükemmel çalışıyor!

Sphinx morfolojisi preprocessors ve kelime formları sözlükler kullanmanızı sağlar. Kombine Bunların her ikisi de elde etmek istediğiniz şeye daha yakın alabilir. Daha aşağıda http://sphinxsearch.com/docs/manual-0.9.8.html#conf-morphology ve: burada hem konu hakkında daha fazla bilgi edinebilirsiniz.

Mevcut morfoloji önişlemcilere birkaç "lezzetleri" sizin ihtiyaçlarınıza en uygun bir seçim vardır. Dokümanlar da eklemek için kullanılabilir Kartopu proje dışındaki dillerde kaynaklanıyor söz yerleşik İngilizce ve Rusça, gerekirse. Projenin web sitesi: http://snowball.tartarus.org/

Sfenks çok hızlı tam metin arama motoru ve köklerini kullanarak bunu fark başlangıç ​​ölçüde yavaşlatmak olası değildir.