Архивы: по дате | по разделам | по авторам

IRISnotes: С пера – на жесткий диск

АрхивПериферия
автор : Григорий Рудницкий   10.07.2009

Долгое время считалось, что рукописный текст нельзя распознать. Многие разработчики OCR-систем и по сю пору не считают нужным инвестировать в эту область. Однако уже появляются решения, доказывающие обратное.

Принято считать, что рукописный текст не поддается распознаванию. Обычно это объясняют тем, что почерк каждого человека сугубо индивидуален, и если некто пишет ту или иную букву одним способом, другой может писать её же совершенно иначе. Тем не менее, несмотря на особенности почерка, большинство рукописей могут быть прочитаны кем угодно. Исключение составляют почерки медиков, но это отдельная история. Разработчики OCR-систем, несмотря на довольно солидную историю этих программ, мало внимания уделяли распознаванию рукописного текста. Разве что в девяностые годы появились программы, способные распознать печатные символы, вписанные от руки в специальные квадратики – так называемые формы. Конечно, пользователям КПК знакомы системы ввода рукописных символов, но это довольно специфические программы, и вводить символы в них требуется по отдельности, а не слитно, при этом нужно руководствоваться заранее установленным способом. Собственно говоря, они мало чем отличаются от тех же систем распознавания форм. Чуть больше 10 лет назад компания British Telecom предприняла попытку создать ручку, запоминающую и распознающую текст, SmartQuill, но это устройство так и осталось прототипом. Несколько лет назад на рынке начали появляться серийные программно-аппаратные решения подобного рода и для обычных ПК. Стоит упомянуть ручку io2 от компании Logitech, которая позволяла моментально переносить рукописный текст в цифровой вид, но при этом от пользователя требовалось "обучать" и пополнять словарь. Кроме того, для работы с такой ручкой требовалась специальная бумага.

На прошедшем совсем недавно в Подмосковье форуме Digital Consumer Channel 2009 впервые в России было представлено широкой публике устройство, предназначенное для того, чтобы упростить и сократить разрыв между рукописным и печатным текстом. Речь идет о ручке-распознавалке IRISnotes, разработанной бельгийской компанией I.R.I.S. Внешне ручка ничем не отличается от своих аналоговых собратьев. Разве что в комплекте с ней поставляется небольшой ресивер, подключающийся к компьютеру через USB-порт. Его не нужно всё время держать в подключенном состоянии, так как ресивер снабжен аккумулятором, заряжающимся через USB-порт. Время полной зарядки составляет три с половиной часа. Ресивер способен запомнить от 70 до 100 страниц рукописного текста, а при подключении к компьютеру он выгружает на него содержимое своей внутренней памяти. На лицевой панели ресивера находится небольшой ЖК-экран, на котором отображается служебная информация, а именно – режим работы, индикатор заряда аккумулятора, а также количество записей, находящихся в памяти. Рядом находится небольшая кнопочка, предназначение которой как раз и состоит в переключении режима работы. Их всего два – собственно запись и мышь. Да, ручка может использоваться и как мышь, на её корпусе расположена кнопка, заменяющая левую кнопку мыши. Конечно, полноценной заменой компьютерного "грызуна" она служить не может по причине отсутствия правой кнопки, однако её вполне можно использовать для рисования. Получается некое примитивное подобие графического планшета.

Наиболее же интересная область применения, это, конечно, распознавание рукописного текста. Ничего особенного для этого не нужно. Желательно, конечно, иметь для письма ровную поверхность, а сам ресивер расположить в левом или правом верхнем углу, либо в середине верхней части бумажного листа. Как показывает опыт, если вы пишете на бумаге формата A4, последний вариант будет наиболее удобным. На задней стороне корпуса находятся специальные зажимы, позволяющие жестко закрепить устройство, дабы оно не перемещалось по бумаге туда-сюда. После этого включаем ресивер и следим, чтобы он находился в режиме фиксирования записей. Он включен, если в тот момент, когда вы пишете, на ЖК-экране ресивера мигает изображение ручки. Особых советов по технике письма нет. Писать можно довольно быстро, но аккуратно, без помарок и разборчиво, иначе не избежать ошибок при последующем распознавании. По строчкам скакать также не следует. Лучше всего использовать разлинованную бумагу с полями. Хотя, если приноровиться, можно практически безошибочно писать и на обычной. При письме можно делать переносы, соответствующая опция включается в настройках программы распознавания, но лучше обойтись без них по причине некорректной обработки многих переносов.

В комплекте с устройством поставляются две программы – менеджер записей Easy Note Taker и утилита для распознавания MyScript Notes Lite. Если вы работали в отключенном от компьютера состоянии, при подключении следует запустить менеджер записей и загрузить результаты ваших трудов из памяти ручки. Не знаю, почему (очевидно, в целях конфиденциальности), всякий раз при загрузке новых заметок программа предлагает удалить те, что уже до этого хранились в памяти и были синхронизированы с компьютером ранее. В главном окне программы можно увидеть уменьшенные копии ваших записей, на каждую из которых можно кликнуть и запустить процесс распознавания, после чего запустится MyScript Notes Lite. Эта программа помимо русского умеет работать ещё с 15-ю языками, среди которых есть японский и китайский. К сожалению, разработчиками до сих пор не предусмотрена возможность распознавания текстов, в которых присутствуют слова на нескольких языках, к примеру – на русском и английском. Уж будьте добры, выбирайте или то или другое. Структурированный текст – таблицы и списки тоже пока довольно сложно поддаётся распознаванию. Если попробовать скормить программе нечитаемые каракули, она попросту зависнет в задумчивости. Зато предусмотрена работа не только с обычным рукописным текстом, но и с текстом, написанным печатными или заглавными буквами. Как показал опыт, в этом случае возникает больше ошибок и неточностей, чем при распознавании обычного почерка. Что касается цифр, то с ними никаких проблем не возникало.

Стоит также отметить, что в программе MyScript Notes Lite запись можно предварительно обработать для улучшения качества распознавания. Для этого предназначена специальная функция – "редактор чернил". Впрочем, процесс этот весьма трудоёмкий, и вряд ли стоит к нему прибегать при работе с большими текстами. Гораздо проще отредактировать уже распознанный текст. Кстати, результат распознавания может быть экспортирован в Microsoft Word, электронную почту и, конечно, обычный текстовый файл. Если обобщить впечатления от качества распознавания, которое предлагает IRISnotes, то его можно сравнить с тем, что выдавали OCR-системы ещё 8-10 лет назад – ошибки есть, редактирование необходимо, но в небольшом объёме.

Безусловно, ручка-распознавалка, даже несмотря на всё ещё существенные недостатки, среди которых отсутствие механизма распознавания многоязычного текста можно считать самым серьёзным, может пригодиться студентам, аспирантам, а также учёным, которым часто приходится бывать в библиотеках и архивах и делать выписки из книг и прочих изданий. Все-таки ручка гораздо легче и компактнее даже самого небольшого нетбука. Впрочем, интерес подобное устройство вызовет у всех, кому приходится делать записи вручную, а затем переносить их в компьютер. Рукописи всё же горят... Но их можно оцифровать.

© ООО "Компьютерра-Онлайн", 1997-2019
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.