Архивы: по дате | по разделам | по авторам

Си-пение

Архив
автор : Серж Скаут   11.06.2001

Как и все интересные истории, эта начиналась с цепочки случайностей и была в основном спровоцирована тремя факторами: тем средневековым кретинизмом, который до сих пор царит в наших публичных библиотеках, чувством взаимовыручки и ленью. Но - обо всем по порядку.

Как и все интересные истории, эта начиналась с цепочки случайностей и была в основном спровоцирована тремя факторами: тем средневековым кретинизмом, который до сих пор царит в наших публичных библиотеках, чувством взаимовыручки и ленью. Но - обо всем по порядку.

В один вполне прекрасный весенний день редактор нашего сайта «SoftТерра» Юля Василькина сидела у меня в гостях и жаловалась на жизнь. Находясь в процессе написания диплома, она в кои-то веки вышла из Интернета и пошла в обычную библиотеку, где выяснилось, что общий прогресс в информатизации мира приобрел в наших книгохранилищах весьма извращенную форму, сводившуюся к тому, что в библиотеках (не буду указывать пальцем, каких именно) запретили пользоваться ноутбуками, ручными сканерами и прочей умной техникой без письменного разрешения руководства оных библиотек. Разнообразные же ксероксы/сканеры, имевшиеся в наличии в этих самых библиотеках, были, во-первых, весьма небесплатны, во-вторых, снабжены огромными очередями, а в-третьих, почти всегда не работали. И вот бедной Юле - человеку, давно и плотно сидящему (во всех смыслах) на компьютере, - пришлось брать в руки ручку и вспоминать навыки рукописного… (чуть не написал «ввода») письма. А значит - прощай, «Файнридер», здравствуй, грусть…

Человек я добрый и отзывчивый 1, поэтому задумался, чем бы помочь. В думах прошли один день и одна ночь. Наутро редколлегии 2 наш Главный Гаджетёр 3 зазвал меня в кабинет похвастаться новым гад… «приспособлением, принадлежностью» и жестом фокусника достал из кармана что-то, отдаленно напоминающее гибрид фломастера-переростка с бесконтактным электронным градусником. От первого в нем была утонченность форм корпуса, мягко ложащегося в руку и явно предназначенного для того, чтобы нижним концом по чему-то водить, от второго - жидкокристаллический дисплей непонятного пока назначения и кнопки…

Все, хватит тянуть. Это была ручка-сканер C-Pen 600 MX. И, конечно, я ее выпросил и дал Юле, и Юля пошла в библиотеку и все отсканировала и распознала, и диплом был защищен, и все кончилось хорошо. Теперь же, выполняя данное Козловскому обещание (человек он тоже небескорыстный и в обмен на гаджет потребовал статью об оном и новые батарейки), я расскажу поподробнее обо всем, что удалось выяснить об этом самом «сипене» в процессе эксплуатации, а заодно объясню, почему третьим провоцирующим фактором была лень.

По одежке…

C-Pen упоительно эстетичен. Темно-бирюзовая крышка корпуса ( у «шестисотой» модели), притопленные упругие кнопки… Но главное - он эргономичен. Несмотря на то, что руки у меня, мягко скажем, не крупные 4, но, распаковав коробку и достав C-Pen, я понял, что ничего более удобного в руках давно не держал. Ручка имеет два рабочих положения: в первом вы ею читаете, при этом она лежит в руке и все операции производятся с помощью расположенной под большим и указательным пальцами кнопок, во втором вы ею управляете, при этом все действия осуществляются колесиком под большим пальцем. Кстати, про левшей создатели C-Pen тоже не забыли: в меню настроек есть выбор опции «Правая/левая рука».

Теперь - о «мозгах». Конструктивно C-Pen состоит из двух модулей: сканера и «бортового компьютера». Сердцем устройства является стамегагерцовый интеловский StrongArm, справляющийся со своей работой быстро и весело. В шесть мегабайт флеш-памяти впихнуты распознавалка от Abbyy, англо-русский и русско-английский словари Lingvo общим объемом более 110 тыс. слов и еще парочка полезных приложений, после чего для собственно текста осталось около восьмисот килобайт, что позволяет сохранить страниц так триста-четыреста. Официально в спецификациях указано, что максимальная емкость «ручки» составляет две тысячи страниц, но для этого вам придется удалить словари, чтобы высвободить занимаемые ими почти четыре мегабайта. Еще 512 Кбайт оперативки используются как буфер для сканирования и распознавания. Кормится C-Pen двумя AAA-батарейками.

Для связи с компьютером используется, как ни печально, все тот же старый недобрый COM-порт. Осознание этого факта ввергло меня в ступор, ибо свободных COM’ов у меня на машине нет уже очень давно, более того - во всей своей домашней сети мне удалось найти лишь одну машину со свободным портом. Почему трудно было сделать USB-интерфейс, через который, кстати, ручку можно было бы и запитывать, - непонятно. Помимо шнурка существует еще инфракрасный порт, с помощью которого можно связываться как с «большими» компьютерами, так и с PDA. Правда, для моего Psion’a пришлось скачивать специальную программу - pIBeam, ибо в операционку Psion прошита «неполная» имплементация стандарта IrOBEX. Что же касается Palm, то я обратился к известному «пилотоману» Козловскому с просьбой черкнуть пару строк о совместной работе C-Pen и Palm и получил в ответ ровно две строки: «Ну а чего там писать. Подносишь IR к IR. Нажимаешь «послать». В разделе «Заметки» появляется новый файл».

Учимся читать

В отличие от своего предшественника, умевшего читать только по одному слову за раз, C-Pen позволяет считывать слитный текст. Процесс прост и интуитивно понятен, и в инструкции нет практически никакой нужды. Включив ручку, нужно просто установить ее в начале строки, нажать кнопку сканирования и провести с более-менее постоянной скоростью. В каком бы режиме C-Pen ни находился, он автоматически откроет приложение Notes (что-то вроде Notepad), примет полученный текст в буфер и начнет его распознавать, после чего поместит на место курсора. Самое приятное, что можно, не дожидаясь завершения распознавания одной строки, сканировать следующую - она сохранится в буфере памяти, позволяющем принять три-четыре строчки, а затем будет распознана.

C-Pen поддерживает несколько режимов чтения: непрерывный, построчный и табулированный. Построчный наиболее прост: каждый сосканированный кусок текста (или даже отдельное слово) помещается на новую строку. В табулированном режиме отдельные блоки отбиваются друг от друга знаком табуляции, что может пригодиться, скажем, для ввода табличных данных. А вот непрерывный режим, предназначенный для чтения текста, интересен маленькой, но очень приятной полезностью: C-Pen автоматически удаляет знаки переноса, и при считывании текста из книги вы получите слитный текст абзаца без какого-либо редактирования.

Основной инстинкт

Основная задача C-Pen - читать. И с нею он справляется почти идеально. Почему идеально? Потому, что благодаря использованному алгоритму распознавания от Abbyy, создателя небезызвестного FineReader, считывает практически любые шрифты, причем и на плохой бумаге, и вывороткой, и курсивом, «и бочком, и на спинке»… Первый раз взяв его в руки, я никак не мог остановиться и сканировал все подряд - книги, обложки, надписи на батарейках и пультах дистанционного управления. Затем я все же упорядочил свои изыскания и начал тестировать C-Pen продуманно, распечатав тексты на разных сортах бумаги с разным качеством разными шрифтами. И вот вам результаты.

На распечатке струйного принтера (Epson 600) с «обычным» качеством на обычной бумаге уверенно читаются тексты начиная с десятого кегля 5 и заканчивая тридцатым, хотя в спецификации указано, что максимальный кегль шрифта - 22 пункта. Текст меньше 10 пунктов читается плохо, но в основном оттого, что плохо пропечатывается принтером. Не любит C-Pen сжатые темные шрифты типа Compact и всякие «оформительские», что неудивительно. Удивительно другое: разнообразнейшие сорта курсива читаются легко и непринужденно. А уж при использовании хорошей бумаги и установки наилучшего режима печати считывается вообще практически всё.

С полиграфического оттиска С-Pen прекрасно считывает текст начиная с пятого кегля, однако сканировать столь мелкий текст, особенно набранный в несколько строк, неудобно, поскольку сканер зачастую «цепляется» не за ту строку (при шрифте пятого кегля в зону захвата попадает 3-4 строки), - но все же вводить можно! Вообще, тексты полиграфического качества, даже газетные и на плохой бумаге, C-Pen понимает «на раз». Цвет и выворотка делу тоже не помеха.

Ну и напоследок в качестве «crash-теста» я скормил ему перетемненную ксерокопию слепого машинописного текста. И что вы думаете? Съел! Ошибок было, конечно, немало - около 25 на страницу, но это все одно лучше, нежели набивать ту же страницу руками.

Как видите, тестирование проходило в экстремальных для C-Pen условиях. Те же тексты, для ввода которых он в основном и должен использоваться, - распечатанные, машинописные и книжные, - вводятся вообще без проблем. Кстати, сканировать можно и смешанный англо-русский текст, а помимо русского и английского С-Pen понимает еще 13 языков.

Но идеальной его работу назвать все же нельзя, поскольку некоторые мелочи не то чтобы раздражают, но иногда мешают жить. Так, одна из замеченных особенностей - ни в одном из режимов чтения C-Pen не понимает начинающих строку маркеров или тире, используемых в книгах для оформления прямой речи или списков. Очевидно, он рассматривает их как «мусор», предшествовавший тексту.

Вторая особенность, уже чисто технологическая, связана с тем, что C-Pen использует красную подсветку для сканирования строки, поэтому считать текст красного цвета или его оттенков, равно как и выворотку на красном фоне, невозможно - хотя красный текст на черном фоне считывается без проблем.

Фенечки-мулечки

Помимо базового софта для сканирования/распознавания/сохранения текста в C-Pen есть несколько «побочных» фенечек, правда, оригинальность подхода разработчиков к подбору дополнительного софта для русской версии C-Pen меня весьма озадачила. Во-первых, в ручку встроен англо-русский и русско-английский словарь, необходимости в котором я не вижу никакой, поскольку пользоваться им неудобно: переводимое слово должно быть сначала напечатано на бумаге, - а памяти словарь отъедает немерено 6. Во-вторых, зачем-то оставлена оригинальная, весьма забавная, но совершенно ненужная русскому человеку ввиду ее нелокализованности примочка под названием C-Write, позволяющая вводить или редактировать текст, «рисуя» сканером разнообразные граффити. Третья мулечка - Storage - более полезна и позволяет использовать C-Pen как ба-альшую и очень дорогую дискету, сохраняя во встроенной флеш-памяти любые файлы. Но вот то, что часть базового софта из русского C-Pen была удалена, послужило причиной самого большого моего разочарования.

Птичка Обломинго, или Еще раз о лени

Как вы помните, в самом начале я указал, что третьим провоцирующим фактором была лень. Вот уже полгода я с грустью смотрел на немаленькую коробку от модема, до половины засыпанную визитками, и никак не мог решиться на подвиг: сесть и вбить их все в адресную книгу, ибо было не просто лень, а очень лень - не помогало даже наличие FineReader’а и сканера. Но вот на коробке C-Pen я увидел анонс приложения C-Address, специально предназначенного для сканирования визиток и создания адресной книги, и сердце мое возликовало. Пока Василькина в поте лица трудилась в библиотеках над дипломом, я предвкушал момент возврата ручки, читал User Manual на сайте www.cpen.com и мечтал о том, как я разделаюсь со всеми этими визитками с легкостью необыкновенной. Увы и ах! В русском C-Pen этого приложения нет. То ли не хватило памяти после того, как в C-Pen влили словарь Lingvo, то ли просто лень было локализовать еще одно приложение, но факт остается фактом: господа разработчики явно считают русских неделовыми людьми. Ну в самом деле, зачем этим суровым медведям с загадочной русской душой адресная книга! Пусть лучше у них будет словарь, потому как без словаря понять их никак не удается…

P. S. А батарейки я Козловскому так и не отдал, ибо старые после полумесячной эксплуатации продолжали вести себя как новые.

[i39926]


1 (обратно к тексту) - Вдобавок еще и небескорыстный, поскольку процесс посещения библиотек отрывал Юлю от сайта ну просто напрочь.
2 (обратно к тексту) - См. «Утро стрелецкой казни» Василия Иваныча Сурикова.
3 (обратно к тексту) - Gadgeteer - сущ.; разг. любитель всевозможных приспособлений и устройств, механических штучек и т. п. (Lingvo).
4 (обратно к тексту) - То есть сойти за шофера, как и Шарапову, мне бы вряд ли удалось.
5 (обратно к тексту) - Для неполиграфистов: размер шрифта 10 пунктов.
6 (обратно к тексту) - Видимо, в Abbyy так разогнались с впихиванием FineReader в два мегабайта памяти, что по инерции перенесли в C-Pen и Lingvo.
© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.