Ben bir pdf dosyası belirli bir anahtar bulmak gerekir. Bildiğim kadarıyla bunu yapmak için tek yol txt dosyası olarak bir pdf yorumlamak. Ben bir addon / çerçeve / etc kurmadan PHP bunu yapmak istiyor.
Teşekkürler
Kesinlikle metin olarak bir PDF dosyasını açabilirsiniz. PDF dosya biçiminde aslında nesneleri topluluğudur. Size sürümünü söyler ilk satırda bir başlık var. Daha sonra tüm nesnelerin bulunduğu söyler xref tablonun başlamasından ofset bulmak için alt giderdim. Dosyayı tek tek nesnelerin içeriği, grafik gibi, sık sık ikili ve sıkıştırılmış vardır. 1.7 özellikleri bulunabilir here.
Bu kodlama, yazı, metin dahil olmak üzere PDF görüntü oluşturmak için kullanılan nesneler, ikili bir dökümü gibi sadece dosyayı açamıyor. Ben metin http://pdf.jpedal.org/java-pdf-blog/bid/27187/Understanding-the-PDF-file-format-text-streams depolanan nasıl yapıldığını anlatan bir blog yazısı yazdı
Yardımlarınız için hepinize teşekkür ederim. Sana bu kod parçası borçluyum:
// Proceed if file exists
if(file_exists($sourcePath)){
$pdfFile = fopen($sourcePath,"rb");
$data = fread($pdfFile, filesize($sourcePath));
fclose($pdfFile);
// Check if file is encrypted or not
if(stripos($data,$searchFor)){ // $searchFor = "/Encrypt"
$counterEncrypted++;
}else{
$counterNotEncrpyted++;
}
}else{
$counterNotExisting++;
}