ну, вообще-то это очень узкая формулировка задачи. Шире: как вытащить содержимое офисного документа (так называемые вордовские, эксельные документы, презентации и т.п.), то есть получить картинки, звуковые файлы и т.п.?
Просто пользователь сделает так:
Дополнение: список фильтров, как подсказал Гугль, тут.
Просто пользователь сделает так:
- Откроет файл в LibreOffice/OpenOffice
- нажмёт правой кнопочкой мышки на нужный ресурс (картинку, например)
- если повезёт, выберет опцию "Сохранить".
- Откроет файл в LibreOffice/OpenOffice
- Сохранит его в формате ODF
- переименует файл, поменяв расширение ODx (ODT, ODP, ...) на ZIP (в общем-то, необязательно)
- откроет файл, как архив и вытащит оттуда всё, что нужно
- запустит примерно такую команду:
libreoffice4.0 --headless --convert-to zip:impress8_draw *ppt
- откроет файл, как архив и вытащит оттуда всё, что нужно
Дополнение: список фильтров, как подсказал Гугль, тут.