Кто делал электронные книги?

Делали ли вы электронные книги?


  • Total voters
    186
Status
Not open for further replies.

lohness

Профи
OnThink said:
нет. К сожалению, время упущено. Аборт делают только на ранней стадии беременности. ;)
ну не совсем так
скорее даже совсем не так...
и аборты делают на разных сроках
и чистить можно практически любой скан

Конечно сделать из скана с бликующей или черной полосой по диагонали, вряд-ли что удасться.
Но откорректировать контраст и яркость, убрать мусор и многое другое можно.
Превратить бумагу из желтой (серой в ч/б) в белую убрать пятна и детские каляки-маляки можно - главное желание и ВРЕМЯ (куча времени).

Иногда проще все-таки найти оригинал и отсканить снова (если проблема появилась на стадии сканирования)

А вот брать пережатый в pdf или djvu файл, конвертить его обратно в картинки и снова чистить точно не стоит. Обычно "авторы" таких файлов сильно уменьшают размер и как следствие качество сканов.
 

AlexPkr

Турист
Нориально получается делать в FineReader'е.
Распознаешь текст и сохраняешь в pdf и картинки и текст.
 

peps

Турист
Когда готовлю статьи для публикации на сайте то для сканирования изображений пользуюсь Fotocanvas из пакета ACDSee 5.0 очень просто и удобно. Ну а если надо выдрать текст, то конечно это FineReader читает даже старые газетные статьи.
 

Anri

Турист
Без FineReader в этом деле очень сложно обойтись.
Есть, конечно, и другие распознавалки (раньше пользовался, например, CuneiForm), но рабоают они много хуже.
 

Vadimir

Турист
xolms
вопрос - как исправить плохой скан ? можно-ли это сделать фотошопом?
Пользуйтесь сканкромсатором! Если не испугаетесь :).
 

lohness

Профи
Отсканировал не одну сотню книжек и журналов
Перевел в электронный вид почти все художественные книги со своего стелажа. Потом принялся за технические и журналы.
Художественную литературу делать легче всего - отсканил, распознал, проверил, вычитал и готово.
Старые книги приходится еще чистить от мусора возникающего из за старой темной (желтой) бумаги.
Журналы, детские и технические книги содержат большое количество иллюстраций. Возникает дилема в каком виде сохранять. Если картинок немного, то формат HTML со вставкой картинок. Если же много и хочется сохранить оформление (особенно журналы и детские) то сохраняю в JPG 300 dpi для своего архива и сжав до 40-50 процентов сохраняю в DJVU для выкладывания в интернете (проблема размера).
Основное время уходит на очистку таких сканов от мусора.
Старая желтая бумага на ч/б становится серой
Да и в цветном варианте белая бумага новых книг тоже не особо белая.
 

e-lena

Турист
Я делала много электронных книг. Сканировала с хорошим разрешением (300 dpi), потом в Фотошопе выравнивала страницы, делала их белыми (скан у меня получался немного серым), обрезала ненужное. Конечно, это требует времени и сил, но зато потом как приятно такую книгу смотреть. :)
 

Alex Pro

Турист
Работа та еще... мне очень жаль тех людей , которые занимаются вычиткой и прочим постоянно
Впервые в этом форуме, дай, думаю, загляну. Ну и, конечно, потянуло в книжный раздел, хотя форум нашел ради музыки.
Сам я сканирую книги около 4 лет, сделал около 300 книг, т.е. отсканил более 100 тыс. страниц. Сканю в ФайнРидере (8-м), сам вычитываю, перегоняю в формат word-doc, картинки к избранным книгам сохраняю в JPG в этом же файле или (для особо-художественных изданий отдельно в виде слайд-шоу, обычно с музыкальным сопровождениям). Это, так сказать, для гурманов. Сканю только художественную, биографическую лит-ру, отборное литературоведение, кое-что по искусству (джаз, живопись), кое-какие исторические труды. Пользуюсь только книгами из своей библиотеки, благо собиралась она около 45 лет и собралось около 8 тыс. книг. Собственно и сканить начал из-за того, что после меня моя библиотека скорее всего разбежится по рукам и сгинет, что хоть и обидно, но неизбежно. Сканирование и особенно вычитка (а это не менее 2 проходов) отнимает много времени и здоровья (глаза сильно устают). Постоянно выкладываюсь в б-ке Александра Белоусенко, делаю посты у Кэпа (kpnemo), модерирую форум библиотеки, отдельно выложил все, сделанное мною в библиотечке на Рапиде.ком.
А теперь постараюсь ответить на цитату, вынесенную в начало. Жалеть окрщиков не нужно, каждый из них (я имею ввиду тех, кто этим занимается постоянно и кого признало сообщество коллег по "профессии") занимается этим сугубо по личным соображениям, имеет склонность к просветительству, альтруизму, озабочен низкой общей и сетевой культурой и, наконец, отличается определенным складом характера. Конечно, окрщик должен быть культурен в самом широком смысле слова, очень грамотен, энциклопедически образован, иметь приличный художественный вкус, быть любознательным и контактным. Конечно, все это в идеале, хотя список требований для занятия этой деятельностью я привел далеко неполный.
И последнее. Сканирование и вычитка книг (не технических) предполагает очень вдумчивое перечитывание обрабатываемой книги. Поэтому каждый, кто сканит, делает в первую очередь свои любимые или близкие ему по духу книги. Подчеркну, что работа эта абсолютно бескорыстна и кроме потери времени и зрения других "доходов" не приносит. Но здесь очень важен моральный фактор. Он является определяющим для постоянного занятия этим нелегким делом.
 

borisrs

Турист
Отсканировал чуть более десятка книг. Все перевел в дежавю. Качество меня (и не только) устраивает.
Предпочитаю по возможности делать черно-белый (двухцветный) вариант.
Если есть полутоновые картинки, то можно только эти страницы сделать в сером формате. Важно в начале сканирования не полениться настроить порог чувствительности сканера. Тут надо попробовать разные варианты и выбрать оптимум. Тогда часто удается избавиться от "грязи" еще на этапе сканирования. Любимое разрешение 400 dpi. Сжатие .jpg к сканам текста применять неправильно, т.к. на контрастных переходах появляются хорошо (а на самом деле это плохо) заметные артефакты. Использую формат - Tiff (ч.-б.: без сжатия для дальнейшей переработки и со сжатием CCITT Group4 - для хранения; серый - сжатие Lzw, в программе ACDSee 5.0). Если книга небольшая (до 300 стр.), то можно сжимать с помощью Document Express Editor v5.0.0 Build 16 plus. Можно и большую но тогда лучше по частям. Приходится временами подождать.
Если загнать очень много страниц (более 300), может и зависнуть.
Подробно о создании книг в дежавю написано по ссылке. Там же куча софта, из которого необходима небольшая часть. OCR я не добавляю. Можно его добавить и после создания книги. Имеется недостаток: русская г становится латинской R.
 

miralita

Турист
В свое время довелось, можно сказать, профессионально заниматься электронными книгами. Сканирование, вычищение в фотошопе, сохранение в TIFF CCITT Group 4, а там в зависимости от пожелания заказчика - либо PageMaker -> принтер, либо в PDF.
Неплохо набила руку на сканировании старых книг, где текст был едва различим даже на глаз. Сканировалось в полноцвете, вытягивались уровни, потом уже руками или фильтрами (в зависимости от результата - фильтры сильно бьют коцаный текст) - убрать шум.
 

Ares_XT

Турист
Делал парочку книг в формате СНМ с бумажного оригинала. Чтобы сделать качественно, нужно МНОГО времени.. Поэтому особенно этим и не занимаюсь. \На заметку: Если есть ксерокс типа WorkCenter 130, то сканирование одной страницы занимает секунд 5.
 

tehspec

Турист
Приветствую всех собравшихся).
Книжек и журналов отсканил в свое время просто огромное кол-во.
Поначалу пытался переводить их в Word-DOC, но потом забросил эту идею, потому как практически весь материал это техническая литература с огромным количеством формул и картинок.
В итоге стал сшивать в pdf и DjVu, но в максимальном качестве, что бы потом без проблем и потерь читать.
 

Владушка

Турист
Старая желтая бумага на ч/б становится серой
Да и в цветном варианте белая бумага новых книг тоже не особо белая.
для этого есть регулировка чувствительности к оттенкам серого =)
гораздо хуже вариант, когда исходный аналорговый вариант сильно затерт и засален(а это чаще всего происходит с часто используемой литературой узкой специализации)...
в таких случаях может не помочь регулировка чувствительности к оттенкам серого, т.к. оттенки засаленности и потертый текст в черно-белом варианте приравниваются...
в таком случае иногда легче распознавать цветной вариант страницы, т.к. желтый и серый сильнее отличаются =)
но обычно такие книги стоят затраченных на них усилий и им ну очень рады коллеги =)
 

fed

Турист
Не все так плохо при наработанном опыте. А чем больше вложишь старания, тем качественнее результат.
 
Status
Not open for further replies.
Top