PDF / A dönüştürme ve Linux altında uygunluğunu kontrol [kapalı]

5 Cevap java

Ben araştırmacılar araştırma kağıtları yükleyebilirsiniz bir online portal, üzerinde çalışıyorum. Bir gereksinimi tüm PDF'leri PDF / A formatında saklanır olmasıdır. Ben PDF / A uyumlu belgeleri oluşturmak için kullanıcılar güvenemezsiniz, ben PDF / A formatında içine standart PDF'leri kontrol ve dönüştürmek için bir araç gerekiyor.

Bildiğin en iyi aracı nedir?

  • Fiyat
  • Kalite
  • Hız
  • Mevcut API'ler

Açık kaynak araçları tercih olurdu, ama bir arama hiçbiri ortaya çıkardı. iText PDF / A oluşturmak, ama her sayfayı okumak zorunda ve yeni bir belgeye kopyalamak gibi dönüştürerek, bu süreçte tüm yer imlerini ve açıklamaları kaybetme, yapmak kolay değildir yapabilirsiniz. (En azından bildiğim kadarıyla, sen kolay bir çözüm biliyorsanız, bana bildirin).

API'ler PHP, Java veya bir komut satırı aracı-sağlanmalıdır ya için mevcut olmalıdır. Ya GUI-okunur veya yalnızca Online çözümler listesi etmeyiniz.

5 Cevap

Ben tüm golleri aynı anda memnun olabilir emin değilim. PDF / A etrafında hikaye png tiff gibi format dönüşümleri çok daha karmaşık.

  • Ne bu yüksek sürümleri özelliklerini kullanmak daha yüksek sürümlü belgeleri ile ilgisi: Baz formatı PDF 1.4 nedir? Bilgiler kaybolmuş olabilir.
  • PDF/A-1a ve 1b her ikisinde de, XMP / RDF biçimde meta zorunludur. Orijinal belge meta olmadan ise, somewhere onu almak ve eklemek gerekir. En azından iText yapabilirsiniz.
  • Sağ olsun küçük ayrıntı bir sürü yerine sadece yatay hareket komutları mevcut emin boşluk yapma yazı gömme vardır.

Tüm Özetle: Ben PDF'leri üreticileri ile uyum için sorumluluk bazı veya tüm yerleştirerek daha iyi olduğunu düşünüyorum. Tabii ki, siz onlara yardımcı olamaz anlamına gelmez: Eğer bildiri oluşturmak için hangi araçları çoğunluğu kullanımını anlamaya varsa, PDF / A ve özel araçları ile ilgili belgeleri işaret edebilir. (Gibi belgelerin aşırı bir örnek bir bit olarak, this bakabilirsiniz)

Çabaları ile iyi şanslar.

Ben şeyler bu tür yaptım bir arşiv sistemi oluşturmak için, Fransız Milli Kütüphanesi çalışmak için kullanılır. Dünyanın ilk on kütüphanelerin çoğu gibi, biz JHOVE dosya biçimlerini tanımak için kullanılır.

JHOVE can dosyalarını PDF / A veya değil, ve hatta validate Onlara olmadığını söylemek. Ayrıca, PDF 7 başka türlü bkz the details bilir.

JHOVE açık kaynak, bu JSTOR ve Harvard Üniversitesi Kütüphanesi tarafından yapılmaktadır. Bu use oldukça basittir.

Tanımlama bölümü için Pronom technical registry (PDF/A içeren) erişim sağlar Droid tool (Dijital Kayıt Object Identification), deneyebilirsiniz.

Open Office API project sizin aradığınız şey olabilir. 2.4 Open Office gibi PDF / a belgeleri destekler. İşte code example belgesine dönüştürmek için nasıl web sitesi değil, bu örnek Java olduğunu.

I am not sure of PDF/a documents, but you have looked at jodconverter? It can convert many different formats for you, and it is open source. We use it quite extensively in our project.

http://www.artofsolving.com/opensource/jodconverter