(Начало в №5)
Итак, перед нами задача - превратить бумажную книгу в электронную DjVu-книгу без лишних хлопот... Рассмотрим довольно простой алгоритм, а также его достоинства и недостатки.
Предлагаемый метод будет заключаться в следующем: сканируем развороты книги в какой-либо программе (я предлагаю IrfanView, но можно и в любой другой). Разрешение де-факто для DjVu - 300dpi, его и используем. Опытным путем определено, что при этом разрешении качество хорошее, а размер не слишком велик. При сканировании стараемся максимально плотно прижимать книгу к стеклу сканера (не перестарайтесь - один мой знакомый, сканируя довольно тяжелую книгу, выдавил стекло сканера!), чтобы увеличить качество сканов. Иначе ваши сканы будут выглядеть плохо.
Без ручной обработки тут не обойтись, а нам это ни к чему. Однако при сканировании программой-вьюером встает одна проблема - книга сканируется разворотом, и в конечном варианте так и останется. Подавляющее большинство DjVu-книг так и делаются. Для чтения это очень неудобно, т.к. весь разворот на экране монитора выглядит довольно мелко, а при увеличении масштаба страницы приходится таскать по экрану по мере прочтения. Гораздо удобнее, если развороты будут разрезаны на отдельные страницы. При просмотре потом не составит труда расположить их как понравится. Как автоматически делить развороты? В ABBYY FineReader есть такая возможность. Идем в Сервис - Опции - Сканирование/Открытие и в группе "Обработка изображений" выставляем все галочки, кроме "Инвертировать". Таким образом, FineReader в процессе сканирования произведет резку разворотов на отдельные страницы, компенсирует наклоны, почистит мусор. Хотя это все очень просто сделать, почему-то очень многие "первопечатники" пренебрегают такой возможностью и выкладывают книги в ужасном виде.
Поэтому, если нет времени или желания - отсканируйте книгу в FineReader, выделите все отсканированные страницы (в колонке слева), нажмите F12 и сохраните все в формат TIFF, черно-белый, Group4. Сохраняем отсканированные страницы в отдельные файлы. Далее нам понадобится один из основных инструментов для работы с Дежавю - Document Express Editor.
В экспресс-варианте создание DjVu будет выглядеть так. Открываем первый из сохраненных нами файлов (Файл - Открыть), к этому файлу добавляем все остальные (Правка - Добавить страницы после...). Последний шаг - сохраняем полученную последовательность страниц в единый DjVu-файл (Файл - Сохранить как...), дополнительные параметры оставляем по умолчанию. Все! Книжка готова. Не верите? Откройте ее в любой программе просмотра (одна из лучших программ просмотра файлов DjVu - WinDjVu) и убедитесь в этом...
Все бы хорошо, но созданная нами книга оставляет многого желать. Нет никакой навигации, отсутствует поиск, нельзя скопировать текст. Помимо этого, довольно большое количество мусора, который не удалил FineReader. О том, как сделать нашу электронную книгу более удобной для чтения, поговорим далее.
Добавляем оглавление и возможность
поиска
Что касается оглавления, то у нас есть два варианта - "оживить" оглавление, уже бывшее в книге и отсканированное нами при помощи гиперссылок, или создать свое. Минус первого варианта - для перехода по ссылкам придется возвращаться к оглавлению, которое обычно находится в начале или конце книги, но этот метод более простой.
Итак, делаем гиперссылки.
Для этого открываем полученный DjVu-файл в Document Express Editor. Для создания гиперссылок нам понадобится панель инструментов "Аннотации". При нажатии кнопки "Прямоугольная гиперссылка" у нас появится возможность выделить область изображения и изменить параметры создаваемой ссылки:
Здесь мы просто указываем номер страницы, соответствующей пункту оглавления, и все! Вам придется отслеживать соответствие между нумерацией в бумажной и вашей электронной книге. В общем, будет достаточно сделать ссылки только на главы, хотя, если есть желание, можете сделать подробное оглавление. При желании гиперссылки можно выделить цветом, подчеркиванием и т.д. Второй вариант, с использованием возможностей Document Express Editor, можно реализовать следующим образом. При открытом Дежавю-файле слева мы видим две закладки - "Эскизы" и "Список". В эскизах мы видим уменьшенные изображения каждой страницы. В списке же, собственно, список всех страниц документа. Приступим. Первое, что надо сделать - в "Списке" удалить все страницы. Далее переключаемся в "Эскизы" и смотрим номер страницы, на которую нужно сделать ссылку в нашем оглавлении. Номер страницы должен быть не "книжным", а тем, который ему присвоил Document Express Editor (эти номера стоят под каждым эскизом). Вам нужно будет выяснить разность между "книжной" и электронной нумерацией. Это нужно для того, чтобы, просто имея перед глазами оглавление книги (а вызвать его очень просто с помощью кнопок "Первая страница" или "Последняя страница", в зависимости от того, в начале или в конце находится оглавление), сделать свое оглавление. Итак, мы выяснили, что книжная нумерация отличается от электронной на единицу. То есть, прибавив к книжному номеру 1, мы получим номер, который присвоил этой странице Document Express Editor. Начинаем создавать оглавление. Переходим к оглавлению книги, открываем "Список". Правой клавишей мыши выбираем "Добавить", вызываем окно "Свойства закладки".
Заполняем имя закладки, указываем ссылку на страницу. Номера страниц узнаем из книжного оглавления, прибавляя или отнимая число, на которое оно отличается от электронного. Все просто! В итоге мы получим электронное содержание, обеспечивающее быструю навигацию по документу.
Андрей АЧИНОВИЧ,
minhex@gmail.com
Горячие темы