Php ile pdf dosyalarını okumak

5 Cevap php

Ben bir bina için bir zemin harita büyük bir PDF dosyası var. Bu koltuk konumu metin kutuları dahil tüm ofis mobilyaları için katmanları vardır.

Amacım, PHP ile bu dosyayı okumak, metin katmanları için belge aramak, onların içeriğini almak ve dosyaya koordinatları. Ben koltuk konumları harita Bu şekilde -> x / y koordinatları.

PHP ile bunu yapmak için herhangi bir yolu var mı? (Hatta Ruby veya Python bu gerekli buysa)

5 Cevap

(FPDI ile) FPDF Çıkış:

http://www.fpdf.org/

http://www.setasign.de/products/pdf-php-solutions/fpdi/

Bunlar bir pdf açalım ve PHP buna içerik katacak. Ben de size ihtiyacınız değerleri için mevcut içeriği ile arama işlevselliğini kullanabilirsiniz tahmin ediyorum.

Başka bir olası kütüphane TCPDF olup: http://www.tecnick.com/public/code/cp_dpage.php?aiocp_dp=tcpdf

Hmm ... tam olarak php, ancak geçici bir html dosyası pdf dönüştürmek ve daha sonra php ile sonuçlanan dosya ayrıştırmak için php bir program diyebiliriz. Benim bir proje için benzer bir şey yaptık ve bu kullandığım program:

PdfToHtml

Ne program hakkında serin o metin öğeleri dışarı tükürmek olacaktır < Mutlak pozisyon koordinatları ile div> etiketleri. Bu Yapmaya çalıştığınız tam olarak ne gibi görünüyor.

Ayrıca, bu uygulamayı http://pdfbox.apache.org/ denemek isteyebilirsiniz. Bir çalışma örneği https://www.jinises.com bulunabilir

Eğer istiyor tam olarak ne bir php kütüphanesi (pdfparser) vardır.

project website

http://www.pdfparser.org/

github

https://github.com/smalot/pdfparser

Demo page/api

http://www.pdfparser.org/demo

FPDF is smaller in size compared to TCPDF . Ancak, işlevleri, TCPDF kazanır. TCPDF özellikleri ve işlevleri çok var.

Eğer PDF oluşturma çok gelişmiş özelliklere istiyorsanız o TCPDF sizin için. PDF oluşturma sadece minimal özellikler istiyoruz ve istiyorsanız, bir boyut sınıfındaki küçük o FPDF sizin için.