Pdf ( ? )

Witam czy ktoś zajmował się, albo przynajmniej ma pomysł jak można z pdf’ow wyciągnąć pare informacji
a dokłądniej interesowało by mnie szerokość strony, wysokość strony, czy jest kolorowa ( jeśli jest to możliwe ) czy czarno-biała, no i oczywiście ilość stron. z góry dzięki :slight_smile:

Zacząłbym od http://www.foolabs.com/xpdf/index.html . W Ubuntu/Debianie jest paczka xpdf-utils, w której znajdują się różne narzędzia do obróbki PDF-ów, wyciągania z nich informacji, itp.

http://pdf-toolkit.rubyforge.org/

moze to się przyda

Nie wiem czy powyższe rozwiązania udostępniają informacje o kolorach, ale imagemagick może jednym poleceniem przekonwertować całego pdfa na pliki graficzne zawierające poszczególne strony. Wtedy możesz już działać na nich w RMagicku chociażby.

PDF::Reader umożliwia dostęp do metadanych w pliku PDF. W katalogu examples są przykłady , najlepiej przetestować prostego pdf’a na tym przykładzie callbacks.rb i zobaczyć jakie callbacki są wywoływane. Na pewno możesz odczytać ilość stron, wielkość strony też powinna być, nie wiem jak odczytać kolory. Zapuść ten callbacks.rb i zobacz co wypluwa (czy jest coś o kolorach).