Mam problem, dotyczy on konwersji plików z rozszerzeniem “doc” to HTML’a. Zdąrzyłem się zapoznać z biblioteką win32ole, ale ona niestety wymaga pakietu office. Znacie może jakieś sposoby do przeprowadzenia takiej konwersji? API od Google niestety odpada bo wymagana jest ochrona danych.
Ja robiłem to kiedyś właśnie za pomocą win32ole sterując Wordem, spod Windowsa oczywiście. Zawsze możesz próbować na jakiś trailu Office’a, chyba.
Aplikacja działa na unixie (a konkretniej linuxie) więc office odpada, a zabawa Wine’em to gra nie warta świeczki.
Może spróbuj czegoś remote, np. http://www.textfixer.com/html/convert-word-to-html.php/ Nie wiem jak to działa bo nie testowałem, ale możesz poszukać w tym kierunku.
Jeśli masz możliwość zrobienia konwersji doc->odt, to potem już z górki:
https://github.com/imanel/odt2html
- http://documentcloud.github.com/docsplit/ + open office w trybie headless
- run
- profit.
afair docsplit potrafi do htmla, ale ręki sobie uciąć nie dam