Bir txt gibi bir pdf dosyası okumak mümkün mü?

4 Cevap php

Ben bir pdf dosyası belirli bir anahtar bulmak gerekir. Bildiğim kadarıyla bunu yapmak için tek yol txt dosyası olarak bir pdf yorumlamak. Ben bir addon / çerçeve / etc kurmadan PHP bunu yapmak istiyor.

Teşekkürler

4 Cevap

Kesinlikle metin olarak bir PDF dosyasını açabilirsiniz. PDF dosya biçiminde aslında nesneleri topluluğudur. Size sürümünü söyler ilk satırda bir başlık var. Daha sonra tüm nesnelerin bulunduğu söyler xref tablonun başlamasından ofset bulmak için alt giderdim. Dosyayı tek tek nesnelerin içeriği, grafik gibi, sık sık ikili ve sıkıştırılmış vardır. 1.7 özellikleri bulunabilir here.

Umarım işe yarar, bu işlevi bulundu.

http://community.livejournal.com/php/295413.html

Bu kodlama, yazı, metin dahil olmak üzere PDF görüntü oluşturmak için kullanılan nesneler, ikili bir dökümü gibi sadece dosyayı açamıyor. Ben metin http://pdf.jpedal.org/java-pdf-blog/bid/27187/Understanding-the-PDF-file-format-text-streams depolanan nasıl yapıldığını anlatan bir blog yazısı yazdı

Yardımlarınız için hepinize teşekkür ederim. Sana bu kod parçası borçluyum:

// Proceed if file exists
if(file_exists($sourcePath)){
    $pdfFile = fopen($sourcePath,"rb");
    $data = fread($pdfFile, filesize($sourcePath));
    fclose($pdfFile);

    // Check if file is encrypted or not
    if(stripos($data,$searchFor)){ // $searchFor = "/Encrypt"
        $counterEncrypted++;    
    }else{
        $counterNotEncrpyted++;
    }
}else{
    $counterNotExisting++;
}