Блог → Как сделать нормальный PDF из кучи JPG файлов

На днях скачал с одного из торрентов любопытный старый журнал, аж 1976 года выпуска, и только собрался его почитать, как обнаружил, что журнал этот - вовсе и не журнал, а куча отсканированных страниц, каждая из которых лежит в отдельном JPEG файле. Поскольку хранить в таком виде журналы не очень удобно, да и не совсем понятно как его читать (на планшете, например, один PDF файл открыть гораздо удобнее), было решено перегнать его в ту самую PDF'ку.

Сказано - сделано, лезем в Интернет и традиционно, через Яндекс ищем полезную инфу по теме. Тут нужно заметить, что поскольку операция простейшая (сотня JPG -> один PDF), то и времени я на это дело отвёл немного. Был более, чем уверен, что за минут 15-20 уж точно управлюсь. Как бы не так! Поставил с десяток различных программ, с каждой ознакомился, и попытался в каждой проделать эту несложную, в-сущности, операцию. Начал с простешего софта, вроде Scan2PDF, который усиленно рекламируется на просторах Сети. Программа действительно простая, но результат оказался просто плачевным. Причём это не беда какой-то отдельно взятой софтины, а какой-то непонятный общий недуг.

Мой дурацкий перфекционизм в очередной раз не даёт мне удовлетвориться малым, когда я расчитывал на большее. Я видел нормально свёрстанные PDF журналы, и они выглядели очень привлекательно - никаких полей, ненужного места по краям, торчащих фонов и прочей ерунды. Но практически весь опробованный мною софт, по какой-то неведомой причине, предлагал впихнуть имеющиеся JPG файлы в строго определённый формат листа - A4, A3, US letter и прочие, что меня абсолютно не устраивало, ведь скан не ложился на лист "один в один", а по-любому оставалось пустое место. Из-за чего страницы готового журнала выглядели просто неряшливо. Я менял программу за программой, в поисках (видимо недостижимого) идеала, и уже начал отчаиваться.

Были опробованы Advanced Scan to PDF Free, SuperGeek Free JPG to PDF Converter, Hexonic ScanToPDF и ещё несколько софтин, найдённые на Download.com, но всё тщетно - нужного результата получить не удавалось. Всё не то. Одна программа делала с полями, в другой поля удалось убрать, но не смог решить вопрос с компрессией (из 45 Мб сканов получался ПДФ весом в 1 Гб), а софт от SuperGeek вообще предлагал конвертить по одному JPG за раз (один JPG -> один PDF), что разумеется, вообще ни в какие ворота.

С горя, я даже попробовал слепить PDF'ку через FineReader (вспомнилось, что там есть такая фича). Файнридер долго кряхтел над моими ста страницами скана, и выяснилось, что он непременно пытается разокрить содержимое - т.е. распознаёт текст, иллюстрации, таблицы и прочее - и пытается сформировать из них нормальный, честный PDF. В-принципе, стремление похвально, и судя по результатам, которые я успел посмотреть - получалось очень даже неплохо, но журнал был старый, а шрифты в нём - не совсем стандартные, и после OCR'а вылезли сотни ошибок в тексте, которые нужно было править (работа ещё на пару дней, ведь 100 страниц же).

И наконец, совершенно случайно, нужная софтина была найдена. Ура! Оказался ей опенсорсный проект Images2PDF. Почему случайно? Потому что основными продуктами этих ребят является PDFCreator (что-то типа универсального PDF принтера) и PDFArchitect (редактор готовых файлов), а нужный мне Images2PDF, насколько я понял - какая-то побочная разработка, которая даже не фигирирует на сайте (найти её удалось только из раздела Download). Однако же, софтина оказалось очень даже замечательной, и за пару минут сделала то, что мне было нужно! Со сжатием всё тоже решилось очень элегантно - при экспорте готового файла есть опция "Embedd JPG images without recompressing" (т.е. "Встроить JPEG файлы без сжатия", в том виде, как они есть), что отразилось на размере, и надеюсь - что и на качестве тоже.




Пользоваться софтом максимально просто - жмём Import Files, чтобы загрузить список файлов, которые нужно объеденить. Слева у нас будет список файлов, которые можно отсортировать в нужном порядке (они сортируются автоматом, но их можно двигать и вручную), а справа - предпросмотр страниц. В пункте Settings скрываются кое-какие настройки для импорта, экспорта и мета-описаний, тоже всё очень просто и понятно. После сортировки страниц в нужном порядке, жмём Export to PDF, указываем путь и имя файла и всё - наша ПДФ'ка готова! Крайне рекомендую попробовать этот софт, если вы столкнётесь с проблемой сборки журнала или книги, из кучи сканированных страничек. Моя оценка - 5 из 5, и огромное спасибо создателям сей удобной и бесплатной проги!