Кто делал электронные книги?

Делали ли вы электронные книги?


  • Total voters
    186
Status
Not open for further replies.

Baka

Турист
Vish666 said:
Вообще OCR это очень хорошо, но каким способом крепить его к DjVu? Самый серьёзный пакет - DjVu Editor 5.0 (Pro), вроде. Распознавал в нём, какой замес он делает из русских и английских символов :) .
Я так и не смог сохранить его прикреплённым к файлу. У меня в опциях сохранения не ставится галочка чтобы сохранить вместе с OCR. Наверно из-за этого, я и не видел ещё книг с OCR.
Точно не помню где, но видел утилиту, которая позволяет использовать распознанное FineReader - ом. DjvuOCR или как-то так называется. Работает, правда, из коммандной строки и для распознавания в ридере потребуется предварительный перегон всей (или по частям) книги в графику. Зато если мучения только начинаются и пока на руках только сканы - это очень хороший вариант.
Весит вся эта радость немного - порядка мегабайта. Если совсем разочаруешься найти - пиши приваты - отправлю на мыло.
 

Msha

ex-Team DUMPz
Свой / Own
Эдектронная книга на редкость не удобна. по сравнению со своим бумажным предшественником, но бумажный вариант стоит денег и иногда больших. Купить все книги, которые хотелось бы иметь - денег не хватит. А качаешь бесплатно. Вот недавно скачал одну книгу, справочник по математике, она у меня уже есть. Так качество сканирования такое ужасное, что практически ничего понять не получается. OCR такой книги сделать сложно, потому как там большое кол-во формул, на их набор наверное целый год бы ушёл. С другой стороны отсканировать получше всё же можно было....

Я пока сделал только 2, но я уже имел сам текст, мне просто оставлось его привести в более удобный вид. да и выложил я это в виде DOC-файлов, а там уж кому надо переделает.

я понял, что лучше всего сканить в FineReadere (картинки получаются отчётливые,
А мне наоборот неудобно - чтобы распознать текст достаточно и 150 dpi (если он не очень мелкий), а чтобы получилась хорошая картинка нужно 300. Но даже и при этом мне не нравится как картинки получаются, я их отдельно сканирую.

Вообще OCR это очень хорошо, но каким способом крепить его к DjVu?
А зачем, если распознанный текст, именно в DjVu? Насколько я пониаю этот формат удобен именно для хранения графики, а зачем в него пихать текст? Или так получается удобнее с картинками?
 

Vish666

Турист
Да правильно OCR нужен только для поиска. DjVu конечно больше предназначен для хранения изображений. Но когда ищешь что-то конкретное хочется иметь хоть какой-то поиск.
Распознать картинку, да ещё и с форулами тяжело и finereader сделает полную ...., а DjVu Editor 5.0 (Pro) делает как-то умно - он не трогает саму картинку, а лепит поверх распознанные буквы. Привязка точная и этот OCR совсем не мешает. Не знаю сколько весит DjVu вместе с OCR, т.к. сохранить вместе не удалось. А расспознавать достаточно длитетельное занятие поэтому сильно не набалуешься.
 
I

IGOR_777

Гость
Сканировал в личных целях, технология...

Сканирую через файнридер (он лучше работает с автоподатчиком) разрешение 300 dpi , причем цветное (это что бы картинки были приемленного качества)

дальше в фотошопе автоматически обрезаю, коректирую цвета (что бы буквы были четче)

Распознаю только то что по считаю нужным (для себя же делаю)

Перегоняю в PDF и деляю закладки в оглавлении (это однозначно иначе просто не найти нужную инфу)

Кстати намедни сосканил
VB.NET для профессионалов
вес в архиве 500 мегов, распозновать не охото всетаки 800 страниц, лучше сохранить в хорошем качестве IMXO
Если есть надобность то могу выложить.
 

S3

Турист
А нафига если есть бумажные книги?и форматы даже свои есть туалет. наждак. и тп.))
 

StanloW

Турист
А я вот когда сканирую и создаю е-книгу, то изначально ее мучу в формат PDF, а затем конвертирую в формат RGO (ReplyGO).
В чем достоинства:

1. Во первых, являясь обладателем КПК, долго искал достойный вариант для чтения электронных книг. PDF очень тяжел, да и нет нормальной PDF читалки для КПК. DJVU - тоже на кпк толком нормально не работает.... Но вот как только узнал о программе ReplyGO, забыл обо всех иных ридерах.

Программа имеет десктопную и наладонную часть. На десктопе можно конвертировать книжки в формат RGO.... ну и соответственно читать.

2. При конвертации размер файла становиться на порядок меньше (для примера - есть книга которая весит в формате PDF 18 мегов, а в RGO - 10).

3. На КПК книги замечательно смотрятся и прекрасно читаются...

Вот такие у меня мысли на эту тему !
 

Alex Penguin

Турист
IGOR_777,
а как ты делаешь закладки? Я сколько ни бился в Акробате - нифига не получается.
Все работает, а эта функция не активна - хоть тресни. :fai:

Может еще кто-нить что-нить присоветует... :help2:
 

Egoizte

ex-Team DUMPz
Alex Penguin, может какую-то lite версию поставил, у меня вот все активно и все без проблем работает. У меня Adobe Acrobat Pro 7.0.0.0
 

Alex Penguin

Турист
Heralt,
так в том и дело, что версия "Про" и никаких ограничений не наблюдается,
окромя этой, что и выводит из себя. Похоже все идет к тому, что придется
попробовать поставить семерку.
Кстати, а как она с русскими шрифтами работает? А то в моей шестерке
редактировать текст - один геморрой. Реально можно только размер поменять,
да растянуь-поджать, что не есть хорошо... либо использовать дополнительные
русские шрифты.
 

Egoizte

ex-Team DUMPz
Alex Penguin, да и с этим в порядке, только зачем тебе текст в акробате редактировать. Я туда только готовые кидаю, закладки сделаю и все...
 

cyberhermit

<font color="darkorange">Спец</font>
Однажды пришлось сканировать редкую книгу 1945 года издания ( Коломб "Морская война" ) Книга весьма любопытная и пару лет назад ее невозможно было найти в продаже. Книгу эту чудом удалось достать в библиотеке одного из военных ВУЗов, под честное слово и всего на сутки. Пришлось сканить очень быстро всю книгу, а потом долго вычитывать и распознавать. Работа та еще... мне очень жаль тех людей , которые занимаются вычиткой и прочим постоянно :)
 

Egoizte

ex-Team DUMPz
cyberhermit, а мне вот не жаль таких людей, у меня к ним большое уважение и огромная благодарность :)
 

Alex Penguin

Турист
cyberhermit,
действительно. не понятно - при чем тут жалость - никто ж не заставляет. Хотя, сам
до сих пор не пойму - на кой ляд этим занимаюсь.

Heralt,
насчет Акробата. Конечно, редактировать текст в нем особой необходимости нет.
Но, дело в том, что FineReader при конвертации в pdf очень часто неправильно
расставляет интервалы между буквами и словами и некоторые строчки становятся
совершенно нечитаемые (вроде "...ятебялюблюиуважаю..." - ты разве не сталкивался
с этим?). Вот в Акробате я эту проблему и устраняю, а при этом, порой, находятся
дополнительные ошибки. И вместо того, чтобы просто заменить одну-две буквы или
сделать текст жирным, например, приходится открывать FineReader, редактировать
текст, сохранять отдельную страницу и заменять ее в Акробате.
 

cyberhermit

<font color="darkorange">Спец</font>
Heralt, Alex Penguin, я имел ввиду корректоров ( кажется так называется эта профессия) - профессионалов, работающих в издательствах. Жаль мне их потому, что им приходится постоянно заниматся этой работой : вычитывать тексты, искать ошибки... Работа действительно очень сложная. И естественно я очень уважаю этих людей, так как без них было бы очень непросто читать книги :)
 
Status
Not open for further replies.
Top