IMHO.WS

IMHO.WS (http://www.imho.ws/index.php)
-   Обсуждение программ (http://www.imho.ws/forumdisplay.php?f=3)
-   -   "Сжатие" pdf-файлов (http://www.imho.ws/showthread.php?t=100387)

doro 02.03.2006 11:31

"Сжатие" pdf-файлов
 
Существует ли возможность и, соответсвенно, имеются ли инструменты для удаления из pdf-файлов избыточной информации (мусора) с целью уменьшения их конечного размера (проще говоря сжатия :) )?

Cartman 02.03.2006 13:54

doro, ну для примера Adobe Acrobat, не путать с Acrobat Reader.

Borland 02.03.2006 22:44

Многое зависит от исходного PDF.
Если это результат работы того же Акробата на основе текста и картинок с преобладанием текста (для примера можно вззять мануал практически от любой компьютерной железки), то сделать можно очень мало. Текст и так весит немного, а картинки в таких документах обычно уже максимально оптимизированные...
Если результат работы вьюера картинок типа ACDSee (pdf-фотоальбом), то оптимизация, опять же, возможна только по графике со значительной потерей качества.
Если результат работы т.н. pdf-принтера - сильно зависит от того, что, и каким "принтером" "печатали".
Лучше всего поддаются переработке сканы книг (например, сохранённые из FineReader'а). Но процесс очень трудоёмкий: требуется распознать и откорректировать текст, оптимизировать картинки в нём, передать результаты в Acrobat и уже из него сохранить pdf. Процесс сродни вёрстке этой же книги...

В общем и целом, обычно игра не стоит свеч...

topknot 03.03.2006 17:46

Правильнее это было бы назвать "оптимизацией" а не "сжатием". Существует несколько программ которые предназначены для выполнения указанной операции. Я пользовался одно время Apago PDF Enhancer. Вот что они пишут о себе:
PDF Enhancer improves the quality and functionality of your PDF files, first reducing them in size sometimes as much as 90% of their original size while preserving annotations, hyperlinks, and form fields and then applying such features as security, linearization and more.
На деле многое, конечно зависит от исходного файла. Некоторые файлы можно было уменьшить значительно, другие - никак.

albarc 06.03.2006 22:23

Я использую для "оптимизации" pdf файлов PDF Transformer, который интегрируется в Word.
Собственно pdf файл трансформируется в doc и с помощью Word убираю лишний текст, рисунки и т.д.
Работать конечно с ним легко, но только затем документ сохраняется как вордовский.

imhoman101 07.03.2006 13:08

Не знаю, оффтопик ли или нет, но если pdf представляет собой текст в виде отсканенных картинок, то самое лучше "сжатие" - это распознать этот текст, оставив картинками только картинки-иллюстрации (если есть). Размер уменьшается заметно.
К примеру от 20 Мегов до 500 Килобайт.

albarc 07.03.2006 13:45

По этой теме может быть полезно прочитать статью, опубликованную на KpNemo.
Находится она здесь.
Речь в ней идет об оптимизациии PDF. В частности :
Цитата:

В последней, 7-й, версии Acrobat'а имеется инструмент "PDF optimizer".
Вы его найдете в меню Advanced --> PDF optimizer...

Cartman 07.03.2006 16:09

imhoman101, а чего не досказал? Сделать описанное тобой можно программой Abbyy FineReader, она прекрасно понимает pdf-ы.

Цитата:

albarc:
В последней, 7-й, версии Acrobat'а имеется инструмент "PDF optimizer".
Этой штукой можно зажать файлы с картинками высокого качества. Оптимизер, насколько я понял, просто снижает качество картинок в файле.
Скан какой-нибудь книги им сильно не пожмешь, они и так хорошо сжаты.

BabaNata 07.03.2006 16:35

Цитата:

Cartman:
Скан какой-нибудь книги им сильно не пожмешь
Картинки лучше оптимизером не трогать - испоганит, а вот распознанный текст хорошо сжимается - примерно в полтора, а то и в два раза. С такими вот установками:

aleks_vira 14.03.2006 21:29

Добавлю и я своё ИМХО, благо с PDF-ми работаю очччень давно.

В дополнение к описанным выше способам можно использовать еще плагин Enfocus PitStop -- написать в нём простейший Action, который будет удалять из файла лишний мусор. Тот же встроренный Optimizer удаляет не всё, я обычно сначала запускаю свой Экшн, затем Optimizer.

BabaNata
Насчет "картинки испоганит" -- это сильно зависит от того, какие настройки выбраны. Можно ведь сжимать разными методами, и без потери качества. И не всегда Jpeg-сжатие есть лучший вариант.
Для монохромных изображений метод сжатия "CCITT Group 4" зачастую даёт самое сильное сжатие данных.


Часовой пояс GMT +4, время: 23:54.

Powered by vBulletin® Version 3.8.5
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.