Глаза - паспорт души
АрхивВводТехнологии биометрической идентификации давно покинули мир фантастических фильмов и вовсю внедряются на крупных заводах и в паспортно-визовых службах, причём в России внедрение этой перспективной технологии уже вышло на государственный уровень.
Как известно, глаза - зеркало души. Заглядывая в них, можно много узнать о человеке - его характер, настроение, ум... Системам биометрической идентификации эти человеческие качества абсолютно чужды. Им нужно другое - просто узнать конкретного человека. И только за этим они пристально вглядываются в наши лица черными зрачками фото- и видеокамер. Для этого они аккуратно считывают отпечатки наших пальцев. Технологии биометрической идентификации уже давно покинули мир фантастических фильмов и вовсю внедряются на крупных заводах и в паспортно-визовых службах. В России внедрение этой перспективной технологии уже вышло на государственный уровень, и для того чтобы разузнать, кто и зачем нас будет фотографировать, попутно снимая отпечатки пальцев, я встретился с генеральным директором компании "Сонда" Андреем Соловьёвым.
Биометрические паспорта внедряют в США и Японии. Насколько я слышал, сейчас в Японию вообще невозможно въехать, не оставив отпечатки пальцев. А мы тут при чём, почему у нас столь активно вводится эта система?
- На самом деле, в других странах к этому подходят поэтапно, и основной процесс наберёт крейсерскую скорость только в 2007-2008 годах. И то, если говорить о "биопаспортах" (правильнее называть их "паспортно-визовые документы нового поколения"), которые постепенно идут на смену обычным бумажным заграничным паспортам. Идея здесь в следующем: на пропускном пункте человек идентифицируется уже не бумажным документом, номер которого можно подделать, но своими собственными биометрическими характеристиками, которые сравниваются с внесёнными в паспорт. Отсюда - надежная страховка от злоупотреблений, быстрота прохождения пункта контроля (взгляд в камеру, касание сенсора и все!). Над подобным решением мы сейчас работаем вместе с НИИ "Восход". Видели их регистрационные кабины?
Нет, но когда настанет время получать "загран" - увижу…
- Старые загранпаспорта будут иметь хождение еще долго. Сейчас паспорта нового образца выдают только в Калининграде. Думаю, в Москве их не скоро получишь. Поэтому лучше получить обычный паспорт - так быстрее.
Прежде всего, конечно, речь идет о новых технологиях биометрической идентификации. Наша технология комплексной биометрической идентификации по цифровой фотографии лица и отпечаткам пальцев позволяет надёжно идентифицировать человека по базе из десятков миллионов значений указанных параметров. "Комплексность" идентификации, то есть использование сразу двух биометрических параметров, резко повышает надёжность. И дело здесь не в том, что один алгоритм усиливает другой: и отпечатки пальцев, и фотография лица с учётом структуры кожи по отдельности способны идентифицировать личность по миллионным базам. Наличие же двух параметров позволяет системе справиться с ситуациями, когда, например, человек повредил пальцы - что ж, тогда используем лицо. Человек получил травмы лица - используем пальцы.
Сразу оговорюсь, что использование отпечатков пальцев пока не закреплено законодательно, то есть гражданин не обязан сдавать свои "пальчики" при оформлении паспорта. Поэтому использование дактилоскопической идентификации в системе является лишь технической возможностью.
А вы пробовали какие-нибудь другие документы, например права?
- Да, конечно. У Cognitive Technologies есть подразделение Cognitive Labs, которое занято вводом информации из самых разных документов: пенсионных удостоверений, водительских прав и т. п. В чём вообще проблема снять информацию с паспорта? Не столько в том, что надо распознать некий текст, а в том, что, когда сканируешь, фон очень сильно мешает распознаванию. Есть специальные инфракрасные или ультрафиолетовые сканеры, но они стоят довольно дорого. Мы же, сканируя обычным образом, ориентируемся на регулярность и цветовую гамму, которая, конечно, от паспорта к паспорту меняется, но некоторые закономерности мы выявили.
Кстати, наши алгоритмы идентификации по лицу позволяют автоматизировано "сверить" лицо человека с его фотографией в паспорте. При этом мы высчитываем некий специальный коэффициент идентичности вашего лица с фотографией на паспорте, и он обычно отличается на один-два порядка от нормы, если идентифицируется человек с чужим паспортом.
А как же шутка: "чтоб ты был похож на свою фотографию в паспорте"?
- Мы таким образом даже различаем однояйцевых близнецов! Правда, коэффициент в данном случае отличается не на порядки, а всего раза в два. Обычно мы добавляем в базу и отпечатки пальцев. Для точности достаточно снять два отпечатка - с правого и левого больших пальцев. Все десять же отпечатков важны для криминалистики, когда порой неизвестно, отпечаток какого пальца найден на месте преступления, или вообще непонятно, какая это часть "пальца". А при обычной идентификации на контрольно-пропускном пункте достаточно любого из зарегистрированных ранее пальцев. Вообще, идентификация по отпечаткам гораздо точнее идентификации по лицу, и только если с ними какие-то проблемы, тогда нужно работать с фотографией. Но в любом случае, если не удалось идентифицировать ни по пальцам, ни по лицу, тогда проверка будет осуществляться обычным образом.
Короче говоря, идея такая: проходя контроль на границе, вы отдаете оператору паспорт, заходите в специальную кабину, встаете напротив камеры в нужном месте и фотографируетесь, потом прикладываете палец к сканеру отпечатков. И всё - идете дальше. Если же вы каким-либо образом подделаете палец (а это ой как непросто; ведь нужно, чтобы он был тёпленький, с правильным потоотделением), на экране у оператора высветится лицо настоящего владельца отпечатка, и появится надпись - что по пальцу вы идентифицированы, а по фотографии - нет. А дальше - стандартная процедура: пограничник просит вас пройти к старшему пограничного отряда, и там начинают разбираться, в чём дело… Это же не обязательно злоумышленник, может быть, человеку, прошу прощения, глаз успели выбить, или рубец какой-нибудь появился, или с пальцем что-то не то, отпечаток пальца на время испортить очень легко.
Расскажите, пожалуйста, о самом алгоритме, особенно про распознавание лиц.
- Алгоритмы распознавания отпечатков пальцев фирмы "Сонда" прошли тестирование в NIST1 и в Международной биометрической ассоциации. Это независимые международные организации, обеспечивающие тестирование различных систем в абсолютно равных условиях на репрезентативных базах данных биометрических параметров. Имеется в виду, что люди, с которых снималась биометрическая информация, равномерно распределены по возрастам, по разным профессиональным сферам и другим параметрам.
Действительно, если взять базу отпечатков людей, каждый день работающих с абразивными материалами, у которых все пальцы стёрты, - будут получены одни показатели избирательности алгоритмов, а если взять студентов, у которых отличные отпечатки пальцев, это будут совсем другие результаты. Указанные организации отбирали базу таким образом, чтобы представлены были все. И фирмы, занимающиеся распознаванием отпечатков пальцев и желающие проверить свой алгоритм, высылают туда созданное по некоторым правилам программное обеспечение. А уж NIST сам прогоняет эти программы по своим тестам, а информацию о результатах испытаний выкладывает на сайт.
На тестировании FVC 2004 года, проводимом Международной биометрической ассоциацией, алгоритмы "Сонда" заняли первое место в мире по базам данных, собранных с оптических и термальных сенсоров. В том же году на испытаниях SlapSeg04, проводимых NIST, "Сонда" показала одни из лучших в мире результатов - причём в борьбе с такими авторитетами, как Sagem (Франция), NEC (Япония), Cogent (США) и другими. Это очень хороший результат. И конкурентов по миру, находящихся на близком техническом уровне, – единицы. Одна в России и ещё несколько за границей.
Что касается лица, в первую очередь, локализуются глаза. Поэтому важно, чтобы глаза были видны. Есть несколько организаций (например ICAO2) которые выработали для себя стандарты на то, каким образом люди должны фотографироваться для идентификации. В соответствии с правилами ICAO лицо должно быть открыто, не должно быть никаких маскирующих лицо объектов (шарфы, темные очки и т. п.). Установлены определенные требования к чувствительности и т. д. Требования наших алгоритмов гораздо слабее! Скажем, на фотографии в паспорте улыбающееся лицо не мешает распознаванию. Или если человек носит очки (главное, чтобы не бликовали), он на регистрации может сфотографироваться в очках, а на идентификации - без и наоборот. Хотя это тоже отклонение от стандартов, и немалое. Лишь бы зрачки были видны, а в кабине это будет обеспечено в любом случае.
Алгоритм работает следующим образом. Сначала он локализует зрачки, затем вокруг них пытается выстроить лицо. Далее сравнение идет в три прохода. Первый и второй проход завязаны на геометрию лица; существует некоторое количество точек, по которым строится шаблон лица. И после двух проходов от многомиллионной базы, в которой вас пытаются найти, остаётся где-то 0,1%. Но и это немало. Ведь сколько разных способов идентификации ни пробуй, если пользоваться только геометрией, то все лица можно разбить на несколько сотен (в лучшем случае - тысяч) классов. То есть для идентификации даже на большом заводе это уже никуда не годится.
Если однозначности нет (система выдает одного-двух-трёх кандидатов), такой итог бесполезен. В идеале в проходной должно быть так: работник в камеру посмотрел, оставил "пальчик" - пошёл дальше, никаких вариантов. Поэтому разные фирмы вынуждены использовать разную дополнительную информацию. Кто-то пытается радужку захватить, а, например, А4-Vision пытается ещё трехмерное лицо снять и нормализовать двухмерное по трёхмерному. Она утверждает, что тогда точность распознавания приближается к точности дактилоскопического метода. Хотя это пока не доказано, и независимых тестирований алгоритмы A4-Vision не проходили. Мы же на третьем проходе используем информацию о структуре кожи. И здесь избирательность совсем не плоха. Если, скажем, по отпечатку одного пальца при FAR (False Acceptance Rate - уровень ошибочно принятых) равным 10-4, FRR (False Rejection Rate - уровень ошибочно отклонённых) оказывается где-то на уровне 1-3% (на базах NIST) , то для двухмерной фотографии (также на базах NIST) этот показатель где-то всего в два раза хуже. Однако если имеется два отпечатка или больше, то "лицу" тут уже не угнаться, потому что каждый дополнительный отпечаток - это дополнительный порядок в избирательности.
Учёт структуры кожи вносит достаточно высокие требования к разрешению…
- Да, но эти требования не выше предъявляемых стандартом ICAO. Вообще, такое качество можно получить обычным цифровым фотоаппаратом с разрешением в три мегапикселя за две сотни долларов. Такого же примерно качества оптика используется в нашем прототипе. Такого же примерно качества оптика установлена и в кабине, которая будет использоваться в системах биометрической идентификации.
Как я понял, на действительно репрезентативной выборке вы испытывали только идентификацию по отпечаткам пальцев, а по лицам вы пока на большой базе не тестировались?
- Нет, тестировались. Если говорить про базу данных отпечатков, то у нас самих есть база с пятьюдесятью миллионами отпечатков
Интересно, где вы ее раздобыли?
- Это элемент нашего ноу-хау, хотя мы проверяли и на NIST’овской. А что касается лица, алгоритмы, на основании которых мы строили свою систему, тоже прошли соответствующее тестирование. На тестах NIST 2002 и 2004 года они заняли первое место.
Трудно поверить, что в деле распознавания лиц уже все решено. Наверняка возникают проблемы, какие-нибудь нестандартные лица…
- Грубо говоря, написать алгоритм распознавания, который хорошо работает на "нормальных объектах" - неважно, лица это, или буквы, или отпечатки пальцев, - может любой квалифицированный выпускник технического вуза. Конечно, если он хоть немножко "в теме". И будет у него распознавание 90%, ну 92%. А вот чтобы было 99,9999%… Такую систему могут сделать лишь несколько контор в мире, потому что для этого необходимо приличное количество средств и научный потенциал, а главное - очень большой опыт.
Собственно в направлении увеличения избирательности нашего алгоритма дальнейшее движение и идёт, но нет такого, что "осталась проблема одноглазых, и мы сейчас бьемся над ними!"… Всё уже поднято на очень высокий уровень абстракции, сейчас решается проблема "а как теперь вот с таким признаком бороться, поскольку он частенько встречается у людей с определённым (не всегда заметным даже глазу) отклонением в чертах лица"…
А где-нибудь ваши технологии уже внедрены?
- Любые серьёзные проекты устроены следующим образом. Крупная фирма-интегратор получает подобный проект. Далее она подбирает соисполнителей, способных обеспечить технологии, необходимые для реализации заказанной системы. Как правило, мы являемся в подобных проектах соисполнителями по биометрии. Спектр внедрений чрезвычайно широк: это почти вся Юго-Восточная Азия, Южная Америка, страны СНГ. Например, сейчас наш исполнительный директор находится в Перу на переговорах о внедрении там АДИС СОНДА.
Ваша система алгоритмов ориентирована на распознавание лиц. А легко ли ее модифицировать, чтобы она смогла распознавать изображение зверей или товары?
- Вопрос хороший. Существует общая теория распознавания объектов, неважно каких (скажем, из космоса распознают участки земной поверхности и определяют по неким признакам, где могут залегать полезные ископаемые). В рамках такой теории работа идет с произвольными объектами, о которых только и известно, что они характеризуются некой системой признаков с определённым весом.
Теперь вернемся к вопросу, возможно ли гладко трансформировать алгоритмы распознавания одних объектов в алгоритмы распознавания других? Да, возможно, и сравнительно малой кровью, но при одном условии: исходные алгоритмы распознавания были воплощены в реально работающей технологии, показывающей высокое (99,9999%) качество в условиях, далёких от идеальных. Выполнение этого условия означает, что разработчики алгоритмов имеют серьезный задел и в теории, и в нюансах практической реализации. Им остаётся лишь тщательно изучить предметную область и построить систему признаков для нового объекта.
Должен заметить, что именно наличие успешного практического опыта по реализации технологий распознавания прежде всего и отличает те немногие фирмы, которые могут обеспечить 99,9999%, от тысяч других, остановившихся на 90%.
Хорошо, а вот если с другой стороны зайти? Положим, у меня есть большая библиотека фотографий с вечеринок, и я хочу найти среди них все фотографии с неким человеком…
- Ну да, например, все фотографии с Машей. Сделать такую систему с технической стороны для нашей команды проще простого. Более того, такие системы уже есть. Но это ритейл, розница, совсем другой вид бизнеса. Продажа таких систем требует совершенно другой организационной технологии, нежели та, которая используется при разработке и внедрении проектов "под ключ". Но развиваться в этом направлении мы тоже планируем.
А вы не думали открыть такой сервис в Интернете, вроде своего фотосайта, или на основе чужого фотографического отстойника сделать, где будет предоставляться услуга поиска по имеющейся фотографии какого-либо старого знакомого - не встречается ли он на чужих фотографиях?
- Очень похоже на предыдущую задачу. Чисто технически - вполне решаемая задача. А с точки зрения зарабатывания денег - это специфический вид бизнеса, здесь надо все точно просчитать. В отличие от крупных проектов, где чётко известен бюджет и ты должен его освоить. Здесь же весь смысл в массовости, чтобы понемножку нащипать с каждой продажи, чётко понимая при этом, что затраченные усилия окупятся. Кроме того, эту задачу можно решить технически проще. Достаточно снабдить фотографии текстовыми комментариями и реализовать поиск по ним. Это вообще ничего не стоит, а по эффективности - почти то же самое.
Как вы думаете, насколько вероятно появление алгоритмов распознавания смысла изображений - вот это "мячик", а это - "дом". Есть ли какие-то серьёзные продвижения в этой области?
- Здесь как с решением уравнений в частных производных. Одни уравнения решаются впрямую, а про другие только известно, что решения существуют. И в каждом конкретном случае приходится искать свой способ решения. Научившись решать уравнения какого-то одного класса, вы конечно гораздо лучше подготовлены к работе с другим классом, чем новичок.
Данная задача в такой постановке, в отличие от обсуждавшихся ранее задач, может решаться целым спектром методов, от чисто технических до чисто философских. Слово "распознавание" здесь отчасти вводит в заблуждение. Ибо эта задача скорее относится к области компьютерного зрения или понимания, над чем уже давно бьются специалисты по искусственному интеллекту.
Распознавание объектов здесь является лишь одним (впрочем, весьма важным) из инструментов, позволяющим компьютеру классифицировать многообразие объектов, которые он "видит" на картинке. Чем "понимание" отличается от "распознавания", можно пояснить на простейшем примере. Распознавание позволит чётко идентифицировать мячик на картинках по значениям признаков "круглый", "цветной", "с полоской по экватору". Но "догадаться", что круглый черно-белый предмет без полоски, вокруг которого суетятся дети, является мячиком, можно только в рамках "понимания". И в этом смысле прорыва в распознавании объектов любой природы - так, как мы распознаем лицо, - не произошло.
По материалам еженедельника "Компьютерра"