Pdf sayfasından Zend_Pdf kullanarak metin ayıklamak için nasıl

2 Cevap php

Herkes bir pdf bir sayfa metin ayıklamak yardımcı olabilir misiniz?

<?php
$pdf = Zend_Pdf::load('example.pdf');
$page = $pdf->page[0];

Ben bir sayfa yöntem var olacağını varsayıyorum ama bana içeriğini ayıklamak izin şey bulamadı.

Örnek: $ sayfa-> GetContents (); $ Sayfa-> toString (); $ Sayfa-> extractText ();

... Yardım!! Bu beni deli ediyor!

2 Cevap

Ben bu desteklenmeye görünmüyor Andy katılıyorum. Bir alternatif olarak, Shaun Farrell's solution to extracting text from a PDF for use with Zend_Search_Lucene bakabilirsiniz. O XPDF, hangi zamanda ihtiyaçlarınızı karşılamak olabilir kullanır.

Dan the manual bu işlevselliği desteklendiğinden emin görünmüyor. Ayrıca, yeni metin görüntüleri değil, düz "çözülebilir" metin yazmak için görünen, drawText() function kullanılarak yazılmıştır.