PHP docx (Office Open XML) okuma

6 Cevap php

Bizim CMS için bir sözcük alma işlevi eklemek istiyorum, ben yapamam tek sorun docx dosyalarını okumak için iyi bir kitaplık (Word 2007) bulmak gibi görünüyor.

Herkes bazı tavsiyeler var mı, kütüphane italik, kalın, üst simge gibi belge ve temel stil içeriği ayıklamak gerekir?

Yardımlarınız için teşekkürler

6 Cevap

Bir kitaplık istenen beri Ya da, Docvert gibi bir şey içine bakmak isteyebilirsiniz. Ben sadece soru dayalı etrafa, ve PHP için şimdiye kadar benim favorim. Sen girdi word dosyası konumu, nitelikleri ve bütün bu iyi şeyler ile basit bir şey haline dönüştürür.

docx dosya aslında belgenin XML için sadece kaplar vardır. Sen docx dosya açmak ve daha sonra document.xml için, içinde kelime klasörüne gitmek gerekir. Bu gerçek metin vardır. Ancak yazı ve stilleri gibi şeyler docx kapta diğer xml dosyaları, yani muhtemelen biraz etrafında karışıklık istiyorum ve ne ve nasıl (bahse girerim, ad kullanarak başlayabilirsiniz) o kadar maç ne olduğunu anlamaya olacak.

Ama evet, o zaman etrafında aslında dalaşamaz şey haline dönüştürmek için SimpleXML kullanın, dosya halletmek.

. PHPDocX PRO docx (zip) dosyalarını okuma ve ondan XHTML (ya da PDF) üretebilir bir TransformDoc sınıfı içerir:

...
require_once 'phpdocx_pro/classes/TransformDoc.inc';
$doc = new TransformDoc();
$doc->setStrFile($file->filepath);
$doc->generateXHTML();
$html = $doc->getStrXHTML();

Ben sadece okuma ve destek codeplex demirci http://openxmlapi.codeplex.com üzerinde kontrol yazma hem de vardır ve bu GPLv2 altında lisanslı bir kütüphane bulmak.

Kullanarak bir odt bir docx belge dönüştürmek OpenOffice. eZ Components ayrıştırma ve ithalat yapmak için daha sonra kullanın. Onlar aslında kendi Cmz olarak kullanabileceğiniz ithalat eZ Publish.

Burada bulunan basit bir çalışma çözümdür

http://webcheatsheet.com/php/reading_the_clean_text_from_docx_odt.php