Nasıl bir PDF dosyası görüntüleri ayıklamak?

3 Cevap php

Benim sunucuda bir PDF dosyası tüm görüntüleri ayıklamak gerekir. Ben, onların orijinal boyutunda ve çözünürlüğünde sadece görüntüleri PDF sayfalarını istemiyorum.

Ben bu Perl, PHP veya (ben PHP exec fonksiyonu ile çağırmak olacaktır) diğer UNIX tabanlı uygulaması ile nasıl yapabilir?

3 Cevap

pdfimages yok sadece. Bu poppler-utils ve xpdf-utils paketlerinin parçası bulunuyor.

Manpage Gönderen:

Pdfimages saves images from a Portable Document Format (PDF) file as Portable Pixmap (PPM), Portable Bitmap (PBM), or JPEG files.

Pdfimages reads the PDF file, scans one or more pages, PDF-file, and writes one PPM, PBM, or JPEG file for each image, image-root-nnn.xxx, where nnn is the image number and xxx is the image type (.ppm, .pbm, .jpg).

NB: pdfimages extracts the raw image data from the PDF file, without performing any additional transforms. Any rotation, clipping, color inversion, etc. done by the PDF content stream is ignored.

Perl ile ilgili olarak, sizi kontrol CPAN? Var

  • PDF::GetImages - pdf belgesi görüntüler elde
  • PDF::OCR - Bir pdf dosyası üzerinden ocr ve görüntüleri almak
  • PDF::OCR2 - tüm metin ve tüm görüntü OCR ayıklamak pdf

Bu reencode ancak jpegler ayıklamak değil gibi pdfimages güzel. Ama bir hata var:

pdfimages paket "poppler-utils" veya daha büyük "xpdf-utils" geliyor. En azından Ubuntu "poppler-utils" zaten önceden yüklenmiş olarak geliyor. Poppler-utils in pdfimages 10.0.3 (Ubuntu 9.04 Jaunty) hala ". Jpg" ayıklamak için seçeneği "-j" tepki vermez. Her zaman ayıklar ". Ppm".

As a workaround you may replace "poppler-utils" with "xpdf-utils": $ sudo apt-get install xpdf-utils

saygılarımızla ile,

+ + + Oliver