Konwersja PDF rozdzielanie stron do oddzielnych plików i odwrotnie

Xenom · November 9, 2012, 9:16am

Witam. Mam bardzo duży problem z pewną koncepcją.
Otóż wykonuję aplikacje webową, której zadaniem ma być:
-rozdzielenie całego PDF na strony(oddzielne pliki), bez straty tekstu, linków itd.
-ponowne łączenie rozdzielonych plików do jednego PDF
-opcjonalnie Konwersja PDF do HTML - niewymagane

Od ponad tygodnia szukam informacji na necie na ten temat i to w różnych językach
programowania, ale nie mogę znaleźć nic konkretnego.
Będę bardzo wdzięczny za jakiekolwiek nakierowanie, wskazanie bibliotek w Ruby, bądź
innym języku, który pomoże mi zrealizować zamierzony cel.

apohllo · November 9, 2012, 9:48am

Najprościej (chyba) użyć JRubiego i biblioteki PDFbox.

[code=ruby] require ‘jruby’

    file = java.io.FileInputStream.new(path)
    parser = org.apache.pdfbox.pdfparser.PDFParser.new(file)
    parser.parse()
    document = parser.getPDDocument[/code]

Esse · November 10, 2012, 12:33am

do merge’owania może być po prostu pdftk ( http://www.pdflabs.com/tools/pdftk-the-pdf-toolkit/ )
pdftk 1.pdf 2.pdf 3.pdf cat output 123.pdf

nie udało mi się na szybko znaleźć dobrego przykładu podziału na strony - ale ponoć jest

meal · November 10, 2012, 8:18am

http://documentcloud.github.com/docsplit/

do większości rzeczy związanych z jakimikolwiek dokumentami jest genialny. jedyny minus jest taki, że wymaga openoffice’a odpalonego w trybie headless

cube · November 10, 2012, 6:01pm

na pojedyncze strony

pdftk filename.pdf burst

Esse · November 10, 2012, 9:40pm

na pojedyncze strony

pdftk filename.pdf burst

[/quote]
próbowałem, ale nie chciało mi coś to za bardzo działać.

cube · November 11, 2012, 12:45am

też nie zawsze mi działa burst
u mnie dodatkowo, pdftk czasami przy mergu wrzuca jakieś pojedyncze strony podwójnie, wiec nie ufam mu do końca