"Журнал «Компьютерра» №33 от 13 сентября 2005 года" - читать интересную книгу автора (Компьютерра Журнал 605)ОГОРОД КОЗЛОВСКОГО |
Косвенно эту материю я уже задевал в прошлом «Огороде» («Восточный DocExpress»)[Поскольку вегетационный период у овощей разный, редакция решила пропустить FineReader вперед. А DocExpress как раз через недельку и поспеет. - Прим. ред], когда писал, что цифровой фотоаппарат в ряде случаев удобнее любого, даже карманного (не говоря уж о настоящем) сканера, - но не мог и не признать, что результаты распознавания после фотосъемки выходят очевидно худшими. Дело понятное: оптика универсальных аппаратов недостаточно жестка, получаемое разрешение заметно ниже, чем у сканерных картинок, освещение, как правило, недостаточное и неравномерное, и вообще… И вот, программисты из ABBYY решили попробовать приспособить программу к этим «плохим» картинкам (предупредив, что лучше снимать камерами не менее чем с четырехмегапиксельными матрицами). И приспособили.
Я провел следующий тест: взял полосу «Компьютерры» с собственным «Огородом» («Компьютерру» потому, что она напечатана на полуглянцевой, бликующей бумаге и довольно мелким шрифтом; если бумага надежно матовая, можно у фотоаппаратов включать вспышку, что сразу резко повышает качество снимка), отсканировал ее сперва недорогим планшетником (Astra 4700 от Umax), потом - безо всякого специального света, но со штатива - снял ее же Olympus’ом Е-20 (5 мегапикселов) и шестимегапиксельным Exilim’ом Pro 600 от Casio (у него есть специальный режим для съемки документов, - распознавальщики и производители цифровых фотоаппаратов идут навстречу друг другу!). Все картинки скинул на винчестер и вызвал их для распознания сначала седьмым, а потом - восьмым «Клёвым чтецом».
Сканерная картинка в обоих случаях распозналась одинаково: практически стопроцентно, только после «восьмерки» гиперссылки, при сохранении в PDF, работали! Картинку с Olympus’а «семерка» распознала процентов эдак на шестьдесят, а «восьмерка» - ну… на семьдесят. Другое дело - картинка с Casio, у которого был включен «документ-режим». Там процент «семерки» повысился до восьмидесяти, а «восьмерки» - только, может, процента на три не дотянул до сотни! То есть разница налицо, причем видно, что аппаратная составляющая тоже играет свою, и немалую, роль. Короче: чудес, разумеется, не бывает, но если подходить к проблеме с умом и пониманием - можно добиться результатов, которые «третья» версия лет восемь назад давала при картинке со сканера.
В общем, браво, ABBYY! Верной дорогой идете, товарищи! Есть шанс дожить до времени, когда цифровики будут комплектоваться FineReader’ом Lite, как сегодня комплектуются сканеры.
Покончив с изюминкой «восьмерки», перейдем к неприятному, обозначенному в заголовке как «Новый сказ о Левше». Помните, в чем там, у Лескова, была главная грустная заковыка? Левша сумел подковать микроскопическую блоху и даже на гвоздиках автограф накарябал, - а сообразить, что после подковки она перестанет скакать - на это ума не хватило. Вот и FineReader, еще с самых первых своих версий, ковать учится все изощреннее, а думать, увы, нет.
Поясню в чем дело. Сканируется, положим, задняя обложка компакт-диска со списком треков, номера которых частенько набираются каким-нибудь высокохудожественным шрифтом или заключаются в квадратики или обводы другой формы. «Клёвому чтецу», несмотря на шрифт и квадратики, удается-таки разобрать два-три (а иной раз - и пять-шесть) номеров правильно. Но догадаться, что это - нумерованный список и, следовательно, нераспознанный между «тройкой» и «пятеркой» значок вероятнее всего есть «четверка» - это уж, извините, кишка тонка. Или еще пример, с той же обложки: фамилии авторов песни, заключенные в круглую скобку, распознаются не всегда точно: «(Josea - Taub» в четырех случаях распознаны как «Qosea - Taub», а в трех оставшихся - правильно. Честное слово, семи пядей во лбу не надо иметь, чтобы - по шрифту ли, по расположению - догадаться, что эта часть двадцатидвухпозиционного списка вся заключена в скобки, а нераспознанный Qosea есть не что иное, как распознанный рядышком Josea, - а вот поди ж ты!
Не то чтобы мне было так уж трудно поправить эти несколько «замученных очепяток», - но я в толк не мог никогда взять, почему такая умная программа, разбирающая знаковую составляющую порой очень трудно идентифицируемых закорючек, пасует перед столь элементарными задачами - и на каждой презентации тупо продолжал задавать один и тот же вопрос: когда же «Клёвый чтец» хоть чуть-чуть поумнеет? Задал и на этой, и мне, наконец, было отвечено, что в «восьмерку» «интеллектуальный» модуль уже встроен, хотя как следует еще на заточен, и, вероятно, точить его будут вплоть до выхода очередной версии. Но зачатки уже есть, так что я могу попробовать проверить.
Проверил первым делом - даже еще до фотографирования. Увы, «умнеющая» (по заявлениям разработчиков) «восьмерка» повела себя - в интеллектуальном отношении - ровно так же, как глупые «семерка», «шестерка», «пятерка» - и далее вверх до начала списка. Ну, как говорится: хорошо не жили, начинать нечего…
И все же закончить «Огород» хочется на ноте оптимистической: к «восьмерке», отдельно, прилагается замечательная утилитка под названием ABBYY Screenshot Reader, которая, правда, начинает работать только после того, как FineReader зарегистрируешь (эдакий легкий шантаж). Она запускается в виде маленького продолговатого окошка, в коем качестве и может висеть на экране, не особенно мешая работать. При необходимости можно выбрать, в каком из доброго десятка распространенных форматов сохранить содранное с экрана и тут же распознанное, потом - нажать на кнопочку с изображением фотоаппарата, потом - выделить нужную область экрана и… все.
Нельзя сказать, что раньше я не пользовался FineReader’ом для распознания текстов, скажем, системных табличек или субтитров фильма, - но тогда приходилось делать это в три с половиной этапа: сохранять в буфер обмена, записывать в графический файл и уж только потом вызывать FineReader, а в него - этот графический файл. Теперь процесс стал заметно проще и много приятнее.
Особенно впечатляет дерево каталогов с раскрытым справа списком файлов, экспортированное непосредственно в Excel. Правда, и тут ум прихрамывает: в тринадцати случаях правильно распознав и спозиционировав в таблице время создания файлов, в следующих пятнадцати Screenshot Reader (а вернее, думаю, сам FineReader) зачем-то отвел под минуты отдельную колонку.
В общем, как призвал в свое время Великий Вождь: учиться, учиться и еще раз учиться! Толк, рано или поздно, надеюсь выйдет.
Автор: Козловский Евгений.
© 2024 Библиотека RealLib.org (support [a t] reallib.org) |