Zengin medya dosyaları ile tam arama

1 Cevap php

Zengin medya dosyalarının genelinde tam metin arama gerçekleştirmek için en iyi yolu nedir? Ben kullanıcı rastgele dosyaları (. Doc,. Pdf,. Jpg, ...) yükleyebilir ve satır aşağı, o dosya içeriği veya meta dayalı onları aramak mümkün olacak bir sistem uygulamak çalışıyorum.

Ben bu oluşturmak için nasıl bazı fikirler takdir ediyorum.

PS - Ben Lucene ve Nutch içine bakarak başladı ama onlar ne gerek şekilde daha fazla düşünüyorum.

Teşekkür ederim.

1 Cevap

Sen meta ve yapılandırılmış metin tespit ve ayıklanması için bir araç olduğunu Tika bir göz (http://lucene.apache.org/tika/) almalıdır.