Формат DjVu(ДеЖаВю)

Status
Not open for further replies.

KiN

Founder
Свой / Own
Формат DjVu (ДеЖаВю)

Графический формат DJVU(произносится Дежавю) разработан фирмой AT&T в первую очередь для размещения в Интернет отсканированных изображений. Это могут быть книги, рукописи, географические карты, художественно оформленные меню ресторанов и многое многое другое.
Его уникальной особенностью является черезвычайная компактность при хранении изображений в высоком разрешении (300 DPI и выше). На одной дискете можно разместить до двадцати страниц пригодных для распечатывания на лазерном принтере.
Кроме того, этот формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать еще до завершения скачивания. Таким образом DJVU является уникальным инструментом для открытия Интернет-доступа к фондам обычных, бумажных библиотек.

Продвижением DjVu занимается расположенная в Сиэтле LizardTech Inc. совместно с AT&T Labs. DjVu – открытый стандарт. Доступны как описание формата файла (спецификация), так и исходный код декодера (и части кодировщика).

Обычно DjVu сжимает в 5-10 раз лучше, чем существующие методы вроде JPEG и GIF для цветных документов, и в 3-8 раз лучше TIFF для черно-белых документов. Цветные страницы, сканированные в полном цвете с разрешением 300 DPI могут быть сжаты с 25МБ до 30-100КБ. Черно-белые документы 300 DPI обычно сжимаются до 5-30КБ. Это ставит размер качественно сканированных страниц в один ряд с обычными HTML страницами (занимающими обычно 50КБ)

Для цветных документов содержащих одновременно текст и картинки файлы DjVu обычно в 5-10 раз меньше JPEG файлов того же качества. Для черно-белых страниц DjVu файлы обычно в 10-20 раз меньше JPEG и в 5 раз меньше GIF. Также DjVu файлы в 3-8 раз меньше черно-белых PDF файлов, полученных из сканированных документов (сканировать цветные докумеенты в PDF непрактично).

Помимо сканирования документов DjVu можно применять к документам, созданным другими программами, например Adobe PostScript или PDF. В этом случае размер файла варьируется от 15 до 20КБ за страницу 300 DPI.
---

Линки для более подробного понимания работы данного стандарта

Смежные темы на форуме:
По программе для создания DJVU Файлов - DjVu Editor - http://dumpz.ru/showthread.php?t=20797&highlight=Djvu
По программам для просмотра DjVu-файлов - http://dumpz.ru/showthread.php?t=9488

Что такое DjVu
_http://djvu.khakasia.ru/about_djvu.html

DjVu - все уже было
_http://www.cqham.ru/likbez_djvu.htm

Что такое DJVU и как с ним бороться
_http://www.cqham.ru/djvu_print.htm

Советы по подготовке материалов в электронном и бумажном виде
_http://www.cqham.ru/m2_scan.htm

OCR в djvu файлах
_http://www.cqham.ru/djvu_ocr.htm

Еще один ресурс, где подробно написано о djvu
_http://www.dstu2204.narod.ru/doc/djvu/djvu.htm

Программы для просмотра:

DjVuReader
_http://dumpz.ru/showthread.php?t=9488

LizardTech Document Express
_http://www.lizardtech.com/solutions/doc/

WinDjView и MacDjView
_http://windjview.sourceforge.net/

DjVu Browser Plug-in (Windows, Mac OS X, UNIX)
ExpressView for PocketPC (PocketPC !!!)

http://www.lizardtech.com/download/dl_options.php?page=viewers
 
Last edited by a moderator:

metrim

Турист
Формат то конечно отличный, обеспечивает огромное сжатие без потерь качества.
"Его уникальной особенностью является черезвычайная компактность при хранении изображений в высоком разрешении (300 DPI и выше). На одной дискете можно разместить до двадцати страниц пригодных для распечатывания на лазерном принтере. "
Значительно больше: книга из 300 стр. с разрешением 300dpi занимает (если правильно обработать) около 1,5мб

Существуют химические, физические и биологические библиотеки сделанные в этом формате.
Однако я столкнулся с одной не приятностью при работе с форматом - отсутствуют возможности защиты файлов (какие есть для Адобовских програм). Допустим сканирую я книгу, чищу, обрабатываю, делаю OCR для обеспечения поиска, но не могу заблокировать копирование OCR текста из книги и экспорт страниц. (А это необходимо мне сделать т.к. такова договоренность с авторами). ПОэтому часто приходится пользоваться более громоздкими pdf файлами.
Может быть кто нибудь посоветует как решать проблему защиты авторских прав силами DjVu?
Кстати опытным путем установлено, что плагин для браузера это наиболее удобное решение для просмотра DjVu..
 
Last edited by a moderator:

E-van

Турист
metrim, pdf файл можно очень просто взломать и сделать доступным для редактирования, разве авторы книг об этом не знают?
 

metrim

Турист
Да взломать то можно что угодно, было бы желание, да нужные програмки.
Однако в джВю нет даже намека на возможность защиты
 

Mirabo

Турист
Как раз сейчас скачиваю файл в этом формате. Кто знает, существуют ли специальные программы для чтения или просмотра этих файлов или все пока только на уровне плагинов к браузерам? Можно ли с конвертировать DjVu в PDF или DOC? Или обратная конвертация из TIFF и JPG в DjVu? Интересно так же, если это такой продвинутый формат по сравненияю с JPG и разрабатывается с 96 года, то почему же не используется в Интернете при верстке сайтов?
 

Egoizte

ex-Team DUMPz
Программа для чтения - в шапке. DjVuReader называется.
Конвертировать можно таким способом: через файнпринт сохраняешь каждую страницу в tiff, потом закидываешь в djvueditor из пакета LizardTech Document Express.
 

Mirabo

Турист
Просмотрел я статьи про этот формат, и, Imho, при всех положительных свойствах, следует отметить большую ложку дегтя: судя по всему, ребята-разработчики софта жутко жадные и хотят снять как можно больше денег, постоянно контролируя распростанение формата в массы. Жадность все и тормозит.
 

Msha

ex-Team DUMPz
Свой / Own
Heralt, а распечатывать от туда (из djvu) можно? Если можно, то для перевода в PDF проще всего PDF factory распечатать.

На счёт конвертации djvu в другие форматы кто-нибудь ещё может какие варианты предложить?
 

Egoizte

ex-Team DUMPz
Msha, из djvureader нельзя, насчет плагина к эксплореру незнаю.
 

Baka

Турист
Msha said:
Heralt, а распечатывать от туда (из djvu) можно? Если можно, то для перевода в PDF проще всего PDF factory распечатать.

На счёт конвертации djvu в другие форматы кто-нибудь ещё может какие варианты предложить?

Плагин к експлореру нормально печатает. Нужно только жать на иконку принтера, которая на дежавюшном баре. Возможно придется еще немного пошаманить: некоторые книги у меня печатаются по-человечески только если поставить масштаб 300% а в окошке печати задать, чтобы использовался текущий масштаб. Когда я пытался в пдф-ки печатать, то размер довольно серьезно увеличивался, нужно быть к этому готовым.

По поводу конвертации: это же формат для хранения графики, во что еще его переделать можно? Можно сделать много отдельных файлов-картинок - см. статью про DJVU OCR в шапке, там есть ссылка на программу. Можно, разумеется потом эти картинки распознать и т.д. Но большинство дежавюшек, которые мне попадались, содержали довольно много формул, схем и т.д., а эти элементы очень плохо поддаются распознаванию.


2 Heralt - djvureader вообще какой-то урезанный вышел - у меня в нем поиск не работает, в то время как в плагине к ИЕ все в порядке.
 

Msha

ex-Team DUMPz
Свой / Own
Я поставил плагтн к эксплореру, теперь смотрю книжки. Могу сказать, что по мне не очень удобно. Т.к. пролиставать страницу приходится стрелочками, а перелистывать Page Down. Пролистывать страницу PageDown лично мне неудобно - не люблю когда изображение резко сменяется. Я теряю место нак отором остановился и это мешает сосредоточится. Вот PDF в Акробате пролистыавть можно плавно. Нажал стрелку вниз и всё. К тому же мышка позволяет задать постоянную скорость движения страницы.
Плагин для просмотра DjVu мне такихъ вещей не позволяет. Возможно спец. программа лучше, но ставить её как-то ломает.

Ну и если честно, нормальный текст смотрится лучше чем сканированное изображение, особенно если сканировали криво лежащие листы. Неприятно, когда текст наклонён то в одну, то в другую сторону.
________________________________________________________________________

Ещё возникло такое сооображение: если текст содержит большое кол-во картинок, то удобнее формат DjVu т.к. обеспечивает наилучшее сжатие с сохранением качества.
В тоже время если в файле только текст и картинок почти нет, то лучше формат PDF. Т.к. распознаный текст засунутый в PDF занимает меньше места.

Конкретный пример: 600 страниц только рисунков в DjVu занимает примерно 9 Мб, а в PDF значительно больше (где-то 20 -30 Мб, как минимум). В тоже время 600 страниц распознаного текста (только текст) займут в PDF всего 5 Мб (или меньше, 130 страниц заняло 900 Кб), в то время как в DjVu останется всё те же 9 Мб.

Если я чего-то не понял - поправьте меня.
 

pariman

ex-Team DUMPz
Спец программы не лучше. DJVU Reader ставить не надо, он просто распаковывается, после чего запускается экзешник.
У меня есть книжка CRC.Concise.Encyclopedia.of.Mathematics.2nd.edition.djv, в которой ~3300 страниц. Размер ~66 метров. Представь сколько понадобилось бы времени на распознание. В pdf, кстати, эта книжка, не знаю правда как, но влезла на диск - 694 метра.
 
Z

Zygot

Гость
А как можно конвертнуть из djvu в pdf?
 

leosan

Турист
Zygot,
А как можно конвертнуть из djvu в pdf?/b]

Печатать через FinePrint pdfFactory
 
T

TsAN

Гость
Zygot said:
А как можно конвертнуть из djvu в pdf?
Можно так же использовать редактор (наиболее доступен Djvu Solo), позволяющий экспортировать страницы в формате bmp. И уже из этого формата преобразовать в нужный.

Удачи!
 
Status
Not open for further replies.
Top