Ben Office 2007 dosyalarını destekleyen nesneleri zaten var biliyorum, ama herhangi bir yerli Office 2003 veya önceki desteği var mı?
Zend_Search_Lucene
a>, olanlar için ile birlikte bir şey var gibi görünüyor değil.
Yine, HTML için Office 2003 belgelerini dönüştürmek için bir yol bulabilirsiniz eğer indeks HTML documents, (at least, for indexing -- keeping to original version alonside the HTML one, for consultation), sen endeksi bu mümkün olabilir olabilir düşünüyor ...
Ben birlikte Solr ve Tika ile endeksleme belgeler ve PHP sizin Solr / Lucene endeksi aramak için JSON kullanarak öneriyoruz. Daha fazla bilgi için ExtractingRequestHandler (Solr wiki page) article bakınız.