Архивы: по дате | по разделам | по авторам

Все выше и выше

Архив
автор : Дмитрий Шарапенко   13.10.2003

Когда я вижу пресс-релиз об очередной версии какой-либо программы, то каждый раз с большим интересом изучаю приведенные в нем цифры. Потому что практика показывает — чем больше цифр в тексте, тем меньше в них смысла.

 Когда я вижу пресс-релиз об очередной версии какой-либо программы, то каждый раз с большим интересом изучаю приведенные в нем цифры. Потому что практика показывает — чем больше цифр в тексте, тем меньше в них смысла. «Производительность возросла на столько-то процентов», «добавлено четыре новых модуля», «два новых словаря»… Бесконечное увеличение и разрастание всего, что только возможно. Я, конечно, прекрасно понимаю, что цифры продавать легче всего: вроде как если чего-то стало больше, значит, и продукт стал лучше.

А хотелось бы видеть совсем иные фразы. Например: «В новой версии нашего продукта мы еще больше упростили интерфейс и снизили общее количество инструментов еще на N. Точность и стабильность работы программы теперь позволяет сократить вмешательство наших любимых пользователей еще на N%. Теперь Вам достаточно запустить нашу программу и выбрать, какой результат Вы хотите получить». Не это ли путь для развития?

Подобные мысли посещали меня, пока я устанавливал только что вышедший FineReader под номером 7. До определенного момента эта программа от версии к версии приятно удивляла своими качественными изменениями. С увеличением порядкового номера рос не только объем программы, но и заметно улучшалось качество распознавания текста. Да и добавление новых языков распознавания действительно шло на пользу потребителю. Первый тревожный звоночек прозвучал около года назад. Это мое чисто субъективное мнение, но когда у меня на столе лежит лицензионный диск с программой, я ее устанавливаю, а мне сообщают, что для полноценной работы еще нужно выйти в Интернет и что-то там активировать, то волей-неволей возникает раздражение. Плюс ко всему видимых глазу отличий шестая версия не представила: вроде стало лучше — а вроде и нет. Впрочем, появилась поддержка работы с PDF, за что разработчикам огромное человеческое спасибо. Больше, однако, ничего не запомнилось.

От седьмой версии я ожидал если не чудес, то хотя бы сюрпризов. Причем заметных мне — простому «некорпоративному» пользователю. И первым сюрпризом оказался пресс-релиз на сайте компании, сообщающий о том, что:

- седьмая версия FineReader стала на 25% точнее;
- документы сложной верстки… теперь распознаются лучше на 33% (по результатам внутренних тестов компании ABBYY);
- точность распознавания PDF-файлов возросла на 45%.

Наверное, с точки зрения отдела маркетинга это звучит неплохо. С точки зрения пользователя — не несет абсолютно никакой информации о продукте. Если бы методика внутренних тестов была уточнена — возможно, она бы разрешила мое недоумение. Что ж, придется изобрести маленький велосипедик самому.

В качестве «тестовых заданий» я выбрал три образца: рекламную брошюрку одного американского автомобиля, отсканированную и сохраненную в JPG (проверяем распознавание нечеткого текста); ксерокопию книжки XIX века (сохранение макета); извещение об оплате электричества от Мосэнерго (сохранение макета, низкая контрастность и цветной текст на цветном фоне).

Тест первый. Случилось так, что мне понадобилось сделать из jpg-файлов, содержащих постранично отсканированную брошюру, полноценный макет. То бишь текст отдельно, картинки отдельно. Никаких иллюзий по поводу качества исходного материала у меня не было, поэтому мысль о распознавании текста в OCR-программах в голову раньше не приходила — предполагалось набить все ручками. Но поскольку разработчики не уточнили, в чем именно седьмая версия FineReader «на 25% точнее» предыдущей, такая крамольная мысль появилась и я подсунул программе страничку (рис. 1). Ниже приведен фрагмент распознанного текста (рис. 2):

I .oolc at the variety of seating options on this page. Trial’s what we call choice. That’s what you call luxury. The luxury of choice.

Что ж, в целом — очень неплохо. Однако слишком тесная работа механизма распознавания со словарями приводит к появлению слов, верных с точки зрения грамматики, но неверных по смыслу (например, «that’s» превратилось в «trial’s»). И если я решу проверять текст не в FineReader’е, а в каком-либо текстовом редакторе, то подобные вещи нельзя будет отловить без тщательной вычитки текста.

Можно ли сказать, что на четверть улучшилось распознавание отдельных символов, я не уверен. И хороший тому пример — изувеченное слово «look». Но работа со словарями действительно стала более активной — возможно, именно на указанное число процентов.
Тест второй. Давно хотелось увидеть корректное распознавание так называемых открытых таблиц, то есть отпечатанных с невидимыми границами ячеек. В качестве исходного материала я подсунул FineReader’у ксерокопии одной книжки XIX века, которую моя жена использует для написания диссертации. В данном случае интерес представляет не распознавание текста, а сохранение макета страницы (рис. 3).

Революции не произошло, и табличек не появилось. Даже при указании типа блока «Таблица». Может быть, у меня слишком экзотичные требования, но мне такой вид представления табличных данных попадается очень часто. И мне кажется, что научить программу анализировать интервалы между словами и делать соответствующие выводы при их закономерном изменении (тем более когда тип блока задан вручную), вполне реально.

Тест третий. Бланк довольно замысловатой верстки, отпечатанный на некой субстанции, в которой не сразу опознаешь бумагу. Это явление в нашей стране довольно распространено. Что поделать, бланков вечно не хватает и добыть новый зачастую негде. Попробую скормить FineReader’у мосэнерговскую платежку (рис. 4).

И тут я не был разочарован — получилось. Дабы не занимать место на журнальной полосе, результат приводить не буду. Но можете поверить на слово: несмотря на отдельные ошибки в тексте, общий макет был сохранен почти на сто процентов, что меня, как пользователя, вполне устраивает.

Подведем итоги. Видно, что ребята из ABBYY покорпели над FineReader’ом. Но, разумеется, сколько там и где процентов прироста — сказать невозможно. Работа со стандартными офисными бумагами, как обычно, на высоте, и хорошо отпечатанные таблицы средней сложности тоже проглатываются без проблем. Но если у вас уже стоит пятая или шестая версия программы, то немедленно бежать и разыскивать седьмую смысла нет — никакого прорыва не случилось. Если до сих пор кипяти… то есть пользуетесь другой OCR-программой — смело ставьте FineReader, будете приятно удивлены. Хотя в наличии сколь-нибудь значительного числа таких «кипятящих» у меня серьезные сомнения: на отечественном рынке OCR-систем ABBYY осталась практически монополистом; единственный конкурент — компания Cognitive Technologies со своей программой CuneiForm — за последние три года не выпустила ни единой новой версии продукта (вернейший признак того, что пациент скорее мертв, чем жив).

И — что поделать — морально готовьтесь к потокам новых, ничего не значащих, цифр: похоже, что соцсоревнования с количеством тонн чугуна на душу населения вновь возрождаются в качестве основного «штиля» в рекламных отделах софтверных компаний.  

И снова об активации продукта. После первого запуска, как и было обещано, программа потребовала себя активировать. Так как телефон был занят, сей процесс я решил временно отложить. «Мастер активации» сообщил, что напомнит о себе позднее, а пока мне будут недоступны «некоторые возможности». ReadMe я просмотрел по диагонали, а потому не обратил внимания на подробности. Оказывается, если вы купили FineReader 7 и увезли диск на дачу, где не работает даже мобильник, то о работе можно забыть — вы не сможете ни сохранить результат распознавания, ни передать его в какую-либо программу. Придется добираться до ближайшего телефона/факса/выхода в Интернет и совершать ритуальное камлание.
Я выбрал активацию через Интернет, и заняла она ровно пять секунд. Однако сразу после этого FineReader торжественно рухнул — правда, к его чести, без потери открытого пакета. Что стало тому виной — измученная зоопарком софта Win98, несколько запущенных приложений или глюк FineReader’а, — сие науке не известно.

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.