Ikili Word belgelerini okuma DOC formatı için yayınlanan dosya biçimi özelliklerine göre bir ayrıştırıcı oluşturarak içerecektir. Ben bu gerçek uygulanabilir bir çözüm olduğunu düşünüyorum.
Word dosyalarını okuma ve yazma için Microsoft Office XML formats kullanabilirsiniz - Bu Word 2003 ve 2007 sürümü ile uyumludur. Okumak için Word belgeleri doğru biçimde (bu Word 2007, Word 2003 XML-Belge denir) kaydedilir sağlamak zorunda. Yazma için sadece açıkça mevcut XML şemasını takip etmek zorunda. Ben PHP Office belgeleri yazmak için bu biçimi hiç kullanmadım, ama ben (doğal XML elektronik tablosu 2003 olarak kaydedilmiş) bir Excel çalışma sayfasında okuma ve bir web sayfasında verileri görüntülemek için kullanıyorum. Dosyaları açıkça XML veri olduğu gibi gezinmek ve ihtiyacınız veri ayıklamak için nasıl anlamaya sorun yok.
Diğer seçenek - (açık XML dosya biçimleri Word 2003 yüklü değilse) bir Word 2007 tek seçenek - OpenXML için RESSORT olacaktır. databyss here DOCX dosya biçimi XML dosyaları dahil olan sadece bir ZIP arşivi işaret ettiği gibi. Orada bir sürü kaynak MSDN açık XML dosya biçimi ile ilgili üzerinde, böylece istediğiniz verileri okumak için nasıl anlamaya gerekir. Yazı çok daha karmaşık bence olacak - bu sadece yatırım olacak ne kadar zaman bağlıdır.
Perhaps you can have a look at PHPExcel hangi Excel 2007 dosyalarını yazmak ve açık XML standardını kullanarak Excel 2007 dosyalarını okuyabilecek bir kütüphanedir. Sen Açık XML Word belgelerini okuma ve yazmaya çalışırken çalışmanızın bir fikir alabilir. Strong>