Архивы: по дате | по разделам | по авторам

Давид Ян: "В России всё ещё выгодно разрабатывать продукты"

АрхивИнтерактивные интервью
автор : Марина Пелепец   22.05.2009

Основатель компании ABBYY ответил на всё ваши вопросы. В Lingvo придут web-технологии, а основным российским конкурентом FineReader до сих пор остается её пиратская версия.

Основатель компании ABBYY ответил на всё ваши вопросы. В Lingvo придут web-технологии, а основным российским конкурентом FineReader до сих пор остается её пиратская версия.

 

Скажите, пожалуйста, может ли специалист не из Москвы устроиться в ваши подшефные компании?

Да, может. У нас работает большое количество сотрудников не из Москвы, некоторые даже не из России. В частности, есть люди из Беларуси и даже из дальнего зарубежья. Талантливых людей мы очень ждем, и у них есть серьёзный шанс получить работу в нашей компании. Правда, правила приема иностранцев на работу в России никто не отменял, и формальности нужно соблюсти.

Здравствуйте! Уже есть наметки, как будет называться версия ABBYY Lingvo, следующая за х3? Что видится вам самым главным в этом проекте и что ещё хочется в него внедрить?

Всех секретов я раскрывать не буду. Главное отличие новых версий ABBYY Lingvo от существующих в том, что они будут ещё глубже интегрированы с Интернетом и с сообществом пользователей.

Давид, а в России сейчас вообще выгодно создавать продукты? Не дешевле ли где-нибудь ТАМ? У меня такое ощущение, что всё ТУДА переползает...

Нет, в России всё ещё выгодно разрабатывать продукты, и основная выгода – наличие большого количества талантливых людей. Из 900 сотрудников ABBYY 98% разработчиков трудятся в России. Если речь идет о стоимости работ, в России она ниже, чем на Западе, но выше, чем, например, в Индии или Китае. Сложные разработки, связанные с научными исследованиями, по-прежнему эффективно размещать в России, потому что здесь проще найти сотрудника с необходимым научным потенциалом.

Давид, а давно ли на российском рынке прижились системы управления ресторанным бизнесом? Потому как у нас в Апатитах всё до сих пор по старинке: официантка, блокнот, ручка, счеты...

В российском ресторанном бизнесе очень высока степень автоматизации: из общего числа ресторанов и предприятий общественного питания (а это 50-60 тысяч) около 50% имеют компьютерные системы. Это явление просто объяснить: внедрение информационной системы резко повышает прибыльность заведения за счет возможности эффективной борьбы со злоупотреблениями, а также прозрачного финансового и материального учета. Особенно эффективна электронная система управления ресторанным бизнесом в сетевых предприятиях, где необходимо соблюдать единые технологии стандарта обслуживания и требуется централизация финансовых потоков. В частности, система iiko, которую разрабатывает одна из наших компаний, уже внедряется в крупнейших ресторанных сетях в России, таких как "Sbarro", "Кофе-Хаус" и других.

Не считаете ли вы, что алгоритмы распознавания печатного/машинописного текста достигли "потолка"? Например, я не стал переходить на 9-ю версию FineReader, потому что 8-я версия более быстрая и легкая, а качество распознавания, по-моему, конкурирует уже с моими невооруженными глазами.

Действительно, качество распознавания простых документов типа книжных и журнальных страниц у FineReader близко к "потолку": на обыкновенных печатных документах система делает одну ошибку на десять, а иногда даже на тридцать страниц, Это во много раз меньше того количества ошибок, которые допускает профессиональная машинистка. Сегодня компании-разработчики конкурируют, прежде всего, в создании программ распознавания документов со сложной вёрсткой (например, газетных страниц со сложным расположением текста). В сложном документе система должна понять, какой участок текста является продолжением той или иной заметки на первой странице. Это неочевидная задача для программы, ведь иногда даже человек не может до конца разобраться, где продолжение начатой статьи. Вторая область конкуренции – это новые языки распознавания. Не так много систем в мире имеют собственную технологию распознавания, скажем, китайского, японского или корейского языков, а у нас она есть. И самое главное: битва всё ещё продолжается на поле распознавания документов низкого качества – факсов, фотокопий, испорченных или содержащих исправления документов. Они представляют собой серьёзную сложность для распознавания, потому что содержат потерянную информацию.

Не собираетесь ли вводить в FineReader систему распознавания рукописного текста?

В принципе, так называемый "рукопечатный" текст (формуляры, бланки, банковские документы, анкеты, заполненные от руки) мы распознаем уже много лет на многих языках. Это действительно очень важная область технологии, потому что миллионы документов ежегодно заполняются гражданами разных стран в государственных и коммерческих организациях. Подобные технологии экономят деньги и силы предприятий. Что касается распознавания рукописного текста в бытовом понимании, т.е. слитной рукописи, то этим мы не занимаемся по различным причинам. В первую очередь потому, что эти дорогостоящие технологии не имеют ясного, прозрачного рынка сбыта.

Какие проекты компании вы сейчас считаете для себя приоритетными, не планируете от распознавания текста перейти к распознаванию голоса?

В данный момент мы не занимаемся распознаванием голоса. Но здесь важно понимать следующее: распознавание непрерывного голосового материала без настройки на голос диктора (Speaker Independent Continuous Speech Recognition Technology) не в полной мере имеет отношение к проблеме распознавания. В непрерывном голосовом сигнале теряется до 70% первичной информации, человек воспринимает только 30% услышанного, а остальное восстанавливает на основании знаний о мире, о контексте беседы. Что касается распознавания голоса, мы в какой-то мере причастны к этим технологиям, если говорить о потерянных 70%. Мы занимаемся знаниями о мире, разработкой универсальной семантической иерархии и семантических технологий, связанных с наполнением модели мира в определенных областях знаний.

Являюсь лицензионным пользователем Lingvo 11, 12, х3 и домашней версии FineReader. Конечно, неприятно, когда результаты твоего труда воруют (пиратство), но хотелось бы узнать: что для вас является "справедливой ценой" за программный продукт? Как она определяется? Возможен ли пересмотр цены при достижении "нужной" финансовой отдачи? И ещё хотелось бы узнать, какие трудности есть при работе на зарубежных рынках, нехарактерные для России.

Если не касаться экономических аспектов ценообразования, доход от продаж ПО должен как минимум покрывать затраты компании на поддержание продукта на современном технологическом уровне. Ошибочно предполагать, что, разработав версию 3.0 какого-либо продукта, компания может отойти от дел, прекратить инвестиции в разработку и бесконечно наслаждаться продажами этой версии по символической цене. Меняются технологические платформы, для которых был разработан продукт, меняются требования клиента, меняется контекст, меняются технологии, с которыми этот продукт должен быть интегрирован. Значит, продукт должен развиваться, иначе он очень быстро умрет.

На Западе существенно ниже уровень пиратства, это немного облегчает работу. Но с другой стороны, на зарубежных рынках более сложная конкурентная среда: больше конкурирующих продуктов, а значит, выше затраты на вхождение в рынок.

В 1999 и 2006 году вы уже давали "Компьютерре" интервью, где упоминался продукт "Natural Language Compiler" (NLC), но на сайте вашей компании нет ни одного упоминания о нём (исключая ссылки на эти интервью). Означает ли это, что работы над NLC прекращены? Используете ли вы в текущих продуктах наработки этого проекта?

Работа над NLC ведётся с 1995 года, и мы её не прекращали. Сегодня в проекте задействовано 120 штатных сотрудников и 100 внештатных. Промежуточные наработки NLC мы активно используем в FineReader, а первые коммерческие продукты, целиком основанные на технологии NLC, планируем выпустить в 2010 году.

Вы являетесь одним из основателей компании iiko, разрабатывающей системы управления ресторанным бизнесом, и соучредителем клубов ArteFAQ, FAQ-Café, "Сквот", "Сестры Гримм". Значит ли это, что вы потеряли интерес к разработкам и бизнесу в сфере AI и Recognition Technology?

Что вы! Конечно же, интерес к искусственному интеллекту и технологиям распознавания не потерян. Просто я работаю одновременно над несколькими проектами. Кроме ABBYY, я занимаюсь компанией iiko, небольшое время посвящаю FAQ-холдингу, в который входят 4 ресторана (FAQ-Café, ArteFAQ, Squat Café, "Сестры Гримм"), также участвую в ряде образовательных проектов, являюсь членом наблюдательного совета МФТИ, участвую в работе фонда AYB и др. В рамках ABBYY я вовлечен в большей степени в проект Lingvo: активно участвовал в работе над 12-й версией ABBYY Lingvo, частично над 13-й и ещё более активно буду вовлечен в разработку версий 14 и 15, в которых мы планируем добавить принципиально новые функциональные возможности.

Что вы можете сказать о Open Source OCR решении CuneiForm? Не опасаетесь ли конкуренции со стороны Tesseract? Как вообще вами ощущается динамика движения от локальных программ в сторону web-приложений? Собираетесь ли развивать это направление?

По данным нашей тестовой лаборатории упомянутые Open Source OCR решения по характеристикам существенно отстают от FineReader. В частности один из упомянутых продуктов представляет собой SDK (а не продукт для пользователей), представляющий базовую функциональность распознавания символов и по-настоящему поддерживает только английский язык. Тем временем, за десятилетия существования индустрии, под словом OCR стало принято понимать гораздо больше, чем просто распознавание символов. Это и поддержка различных типов ввода изображения (сканер, фотокамера, телефон и т.п.), специальная предобработка и улучшение изображений, преобразование результатов распознавания в форматы для редактирования (например, Word) или долгосрочного хранения (например, PDF с компрессией), интеллектуальное извлечение данных из слабоструктурированных документов, и т.п.

Что касается web-технологий, то рынок SaaS в России пока не очень развит. Коммерчески успешные проекты можно пересчитать по пальцам. Но в будущем этот рынок имеет хорошие перспективы. На западных рынках стоит отметить растущую популярность платформы для создания сервисов Amazon Elastic Computing Cloud (Amazon EC2). У ABBYY есть партнеры, лицензирующие технологии распознавания под эту платформу. Если говорить о других продуктах, у нас давно разработана online-версия электронного словаря ABBYY Lingvo, она работает как на сайте www.ABBYYonline.ru, так и на Яндексе. Мы получаем очень много запросов от наших партнеров по лицензированию наших технологий для web и думаем, что это направление имеет большой потенциал.

Присоединяюсь к вопросу о распознавании речи и расширения возможностей программы: как вы считаете, есть ли общее в распознавании текста, речи, образов, 3D? Будут ли ваши программы использовать технологии NVIDIA (СUDA)? Еще хочу задать вопрос по поводу качества распознавания: с журналами, в которых попадаются страницы со сложным форматированием, FineReader плохо справляется. Планируете что-то улучшать?

Да, есть много общего в распознавании различных структурных объектов. Структурные объекты состоят из определенных элементов, между которыми существуют взаимные отношения. Это касается как отдельных слов (структурные элементы – буквы), так и семантических конструкций в естественных языковых массивах, когда структурными элементами являются слова и части речи, а взаимными отношениями является их подчиненность внутри предложения. Ко всем этим подходам применима методология, которой придерживается наша компания – целостное целенаправленное адаптивное (ЦЦА) распознавание. Это методология, которую мы глубоко проработали в наших продуктах и целенаправленно применяем в работе. Говоря о схожих моментах в теоретических подходах к распознаванию, каждая конкретная область имеет свою специфику в предобработке данных в структурных моделях и других деталях реализации. Поэтому мы не занимается распознаванием вообще, в частности, не занимается распознаванием трёхмерных сцен.

Технологии NVIDIA мы пока не планируем использовать в наших продуктах. Проведенные эксперименты показали, что технология векторных вычислений SSE компании Intel дает на наших приложениях лучшие результаты, чем СUDA.

Насчет качества распознавания журналов: бывают сложные элементы форматирования, где наша система ошибается, но, по данным независимых тестирований (одно из них опубликовано в майском номере журнала Hard’n’Soft), FineReader распознает сложные документы лучше конкурентов. В следующей версии FineReader мы предусмотрели закладку "Модель глянцевого журнала" – специально для распознавания журнальных страниц. Разработка высокоинтеллектуального софта – процесс эволюционный. Как я упоминал выше, сложные документы – это область дальнейшего развития OCR.

Хочу поблагодарить вас за FineReader. В свое время он много времени мне сэкономил. А есть ли что-то в вашем арсенале для документов, которые не скоро заменятся электронным вариантом? Ибо на них должны быть мокрые печати и подписи руководителей. Я говорю об обработке платежных поручений бюджетных организаций в казначействах Украины.

Да, такой продукт есть, называется он ABBYY FlexiCapture. Эта система способна обрабатывать документы с разной степенью структурированности: анкеты, налоговые декларации, листы переписи населения, счета, платежки, накладные, договора, письма и т.п. В России ABBYY FlexiCapture используют, например, при обработке результатов ЕГЭ.

Давид, насколько сложно было переходить от компании из пары энтузиастов к организации численностью несколько сотен человек? Как вы учились менеджменту?

Переход был плавный, и сложно не было, потому что эта группа никуда не делась, она продолжает существовать. Мы повышали свои управленческие способности поступательно, мы обучались и самообучались все вместе. Если в компании не потеряны главные ценности, то в ней сохраняется дух группы энтузиастов, даже если её численность достигнет 900 человек. Конечно, увеличение количества сотрудников накладывает определенный отпечаток: появляется структурность, появляется необходимость структурировать бизнес-процессы. Но очень важно, чтобы дух энтузиазма сохранялся как на уровне топ-менеджмента, так и у рядовых менеджеров. Я нигде не учился менеджменту и не получал профессионального управленческого образования. Тем не менее, я и все мои коллеги за годы работы в компании прочитали много полезных книжек, и в этих книжках мы зачастую обнаруживали то, что для себя уже интуитивно сформулировали и применяли в работе. Одна из таких полезных книг, открытие последних нескольких лет – это книга Джима Коллинза "От хорошего к великому" (Jim Collins, "Good to Great"), в которой излагаются некоторые ключевые принципы создания компании.

У Lingvo достаточно удобный интерфейс, но как словарь для переводчика он проигрывает Мультитрану или Мультилексу. Вас устраивает такое положение дел?

По экспертным оценкам, электронным словарем ABBYY Lingvo в том или ином виде пользуется почти половина владельцев персональных компьютеров в России. В развитии этого продукта мы обязаны учитывать интересы наших основных пользователей, не испортить то, что для них удобно. Ведь некоторые опции, которые являются достоинством для одной группы людей, могут стать недостатком для другой, и для разработчика это всегда непростой выбор. Тем не менее, мы с большим вниманием подходим к изучению потребностей самых разных групп пользователей Lingvo. Мы продолжаем работать над тем, чтоб сделать систему одновременно удобной и для профессионалов, и для начинающих изучать язык. С другой стороны, я не был бы так категоричен в оценке ситуации: нашим электронным словарем с удовольствием пользуются и профессиональные переводчики. Ассоциация переводчиков России, ряд профессиональных сообществ переводчиков применяют технологии Lingvo в качестве корпоративного стандарта, используя все возможности программы: корпоративное пополнение словарей, создание специализированных глоссариев, полнотекстовый поиск по телу словаря, поиск по форуму обсуждения вариантов перевода и т.д. Возможно, мы не всегда успеваем эффективно доносить до профессиональных сообществ новые возможности Lingvo, принципиально важные для корпоративной работы.

Возможно ли, заинтересовав вас, добиться вашего участия в каком-либо проекте? Если да, то как с вами связаться?

Я человек увлекающийся, мне интересны многие проекты и во многих из них я участвую, но стараюсь следовать принципу: доводить начатое дело до конца. В связи с этим я решил не участвовать ни в одном новом проекте до тех пор, пока не доведу начатые до уровня самостоятельности, когда мне не нужно будет участвовать в ежедневной работе. Скажем, ресторанные проекты уже доведены до этой фазы и в них я не участвую ежедневно. Что касается iiko, она по-прежнему требует моего пристального внимания: из 80 рабочих часов в неделю я трачу больше 40 часов на iiko. Так что, к сожалению, сейчас я не смогу рассматривать даже очень интересные предложения.

После ухода с рынка OCR компании Cognitive Technologies, ABBYY стала фактически монополистом рынка OCR в России. Как следствие, стремясь извлечь максимум прибыли из своих продуктов, ABBYY из девятой версии FineReader Professional Edition убрала некоторые инструменты, которые присутствовали в версии 8.0. например FineOCR.exe (распознавание из командной строки). Не кажется ли Вам, что урезание функциональности более поздних версий одних и тех же продуктов, это не очень правильный путь, напоминающий методы Microsoft?

Мы никогда не злоупотребляли доминирующим положением, тем более что на западном рынке мы делим пальму первенства с крупной американской компанией. Мы постоянно находимся в тонусе, в конкурентной борьбе. Что касается российского рынка, основным нашим конкурентом всегда была и сейчас остается пиратская версия FineReader, именно она является доминирующей в России.

Мы действительно убрали распознавание из командной строки из FineReader 9.0 Professional Edition, но этот инструмент остался в FineReader 9.0 Corporate Edition. Это инструмент для коллективной работы, он более уместен именно в Corporate Edition.

У компании Google есть проект http://books.google.ru/. Участвует ли ABBYY в этом проекте? Если да, то не могли бы вы рассказать об этом подробнее?

К сожалению, мы связаны соглашением о конфиденциальности и не можем комментировать данный вопрос.

Ещё 4-5 лет назад многие аналитики прогнозировали закат рынка OCR в связи с всеобщим переходом на электронные документы и в перспективе на электронную бумагу. Сейчас уже очевидно, что массовая оцифровка библиотечных фондов несколько отодвинула сроки заката рынка OCR. Как вы считаете, надолго?

Закат рынка OCR прогнозируют столько времени, сколько существует сам OCR, но реальность заключается в том, что объём информации в современном обществе растёт в геометрической прогрессии. Поэтому, несмотря на то, что доля электронных документов заметно увеличивается, абсолютное количество бумажных документов не уменьшается.

Как вы думаете, что лучше делать во время кризиса: держаться за имеющуюся работу (как вариант – за свой бизнес) или искать новую и начинать новые проекты?

Нельзя ответить однозначно на этот вопрос. Всё зависит от того, чего хочется достичь в жизни. Помните, у Кэрролла разговор Алисы и Чеширского кота:

– Скажите, пожалуйста, куда мне отсюда идти? – спросила Алиса.
– А куда ты хочешь попасть? – ответил Кот.
– Мне всё равно – сказала Алиса.
– Тогда всё равно, куда и идти, – заметил Кот.

В жизни и в бизнесе всё то же самое.

Вы наверняка очень занятой человек и много времени уделяете своему бизнесу, но очень хотелось бы услышать, как из человека "научного" вы стали ещё и деловым. Что читали? Как добивались результатов? Принимали ли к себе спонсоров или работали вечерами в личное время? Распылялись ли на большое количество идей или добивали какую-то одну, а потом переходили к другой? Очень много людей: и кандидатов, и докторов, и просто светлых голов, вынашивают интересные идеи. Посоветуйте направление. Я понимаю, что совет дается при понимании конкретной ситуации. Скажите, как поступали вы в вашей ситуации.

Я оканчивал МФТИ. Там, кроме того, что учат физике, учат работоспособности и способности устанавливать цели и достигать их. Это не пустые слова, так действительно устроена "система Физтеха", заложенная Капицей и девятью нобелевскими лауреатами, которые основали Физтех. Это сыграло существенную роль не только в моей жизни, но и в жизни моих партнёров, с которыми мы вместе создавали компанию. Так что с точки зрения личных качеств, для достижения успеха очень важны работоспособность и бескомпромиссность в желании достичь результата.

С точки зрения отношения к работе, на мой взгляд, принципиальный элемент – это желание создать команду. Желание создать команду должно быть первичным, стоять выше желания достичь результата, как ни парадоксально это звучит. Основополагающим в успехе бизнеса, я абсолютно убежден, является успешная, мотивированная и целеустремленная команда. Если удается создать такое отношение к работе и удержать таких людей, то рано или поздно эта команда достигнет успеха. И зачастую этот успех будет найден не в том месте, где вы его ожидали найти.

Ответы на этот и многие другие вопросы прекрасно сформулированы в книге, которую я уже упоминал, и даже не хочется её пересказывать – почитайте! Что касается вопроса об идеях, в некотором смысле надо и концентрироваться на одной, и воспринимать многие. В компании нужно создать атмосферу открытости к новым идеям, чтобы сотрудники могли безбоязненно и совершенно свободно предлагать самые безумные идеи. Компания не должна быть устроена как one-man-show, идеи должны открыто обсуждаться, критиковаться. Но после того как команда коллегиально принимает решение сконцентрироваться на какой-то конкретной идее, уже "распыляться" нельзя, нужно, как говорит Джим Коллинз, "раскручивать маховик". То есть, с одной стороны, важно наличие открытой атмосферы, критики, самокритики и творчества в обсуждении самых безумных идей, с другой – в случае принятия решения – дисциплинированное, поступательное и прямое движение в заданном направлении без частых смен курса.


Вопросы в этом интервью задавали читатели "Компьютерры-Онлайн" на нашем форуме. С какими компаниями вы бы хотели пообщаться? Пишите на адрес site@computerra.ru письма с заголовком "интерактивное интервью", и мы постараемся его организовать.
© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.