Лица, подлежащие опознанию

(Октябрь 2007)

Прогресс и проблемы технологий биометрической идентификации

3DModel3

В одном из недавних интервью для прессы большой босс из американского военно-промышленного комплекса Брюс Уокер (Bruce Walker) — вице-президент корпорации Northrop Grumman, курирующий разработки для «безопасности отечества» — мимоходом сообщил весьма любопытную информацию, удивившую даже многих экспертов, отслеживающих прогресс в технологиях биометрического опознания.

Цитируя Уокера дословно, уже сегодня «мы можем считывать отпечатки пальцев на расстоянии порядка 5 метров… Все 10 отпечатков. С этой же дистанции мы также можем делать сканирование радужки глаза».

Всякий, кто более-менее интересуется инфотехнологиями безопасности, наверняка должен быть в курсе, что область автоматического опознания людей по их биометрии — лицу, голосу, пальцам, ирису глаз, рисунку вен, походке и так далее — переживает ныне эпоху бурного расцвета. Каждая из перечисленных биометрических характеристик с точки зрения надежности идентификации имеет свои наборы плюсов и минусов.

Но в силу специфики задач, которые ставят перед технологией службы безопасности, среди наиболее важных факторов при сравнительной оценке разных методов непременно фигурируют расстояние, с которого возможна идентификация, и относительная сложность подделки человеком своей биометрии.

Так, скажем, сканирование радужной оболочки глаз по многим параметрам выглядит очень заманчиво, однако уникальный рисунок ириса совсем несложно изменить или подделать с помощью контактных линз. Еще хуже с точки зрения широкомасштабного применения выглядят перспективы у таких технологий, как опознание по голосу, запаху, походке или рисунку кровеносных сосудов. В итоге же — на данном этапе развития, по крайней мере — наибольшее предпочтение отдается биометрической идентификации по лицу и по отпечаткам пальцев.

Опознание по лицу, в силу очевидных причин, выглядит намного более перспективным при идентификации людей на расстоянии. С другой стороны, компьютерные алгоритмы для анализа лиц в своем быстродействии и эффективности обычно заметно уступают алгоритмам анализа дактилоскопии. Но ситуация здесь довольно быстро и заметно меняется.

Теория прогресса

В конце мая этого (2007) года Национальный институт стандартов и технологий (НИСТ) США подвел итоги большого биометрического конкурса FRVT-2006 или, развернуто, Face Recognition Vendor Test — «Тестирование поставщиков систем для распознавания лиц». Общий итог конкурса для всех разработчиков подобных систем прозвучал весьма и весьма позитивно.

Компетентное жюри констатировало, что в целом компьютерные технологии распознавания людей развиваются очень быстро. В частности, алгоритмы опознания лиц за период с 2002 года улучшились примерно в 10 раз, а с 1995 года — в сто раз. Причем, отметила комиссия, самые лучшие из протестированных технологий ныне в своих возможностях опознания превосходят соответствующие способности большинства людей.

Джонатан Филипс (Jonathan Phillips), возглавлявший в НИСТ организацию конкурса и подготовку итогового отчета, полагает, что столь заметное снижение доли ошибок распознавания — одного из важнейших параметров оценки биометрических систем — достигнуто благодаря применению снимков высокого разрешения и 3-мерных алгоритмов опознания лиц.

Технологии трехмерного опознания были разработаны за последние несколько лет и на рынке начали появляться лишь совсем недавно. В рамках конкурса FRVT их эксплуатационные качества впервые тестировались только в 2006 году, но зато сразу для шести новых 3D-алгоритмов. Основная их особенность, как можно понять из названия, — анализ информации об объемных формах и соотношениях деталей лица.

Среди преимуществ новой технологии особо отмечают способность 3D-идентификации к выделению отличительных черт в поверхности лица человека. Например, характерных 3-мерных кривых для линии глазниц, носа, подбородка — где ткани и кости выступают наиболее очевидно и почти не меняют форму со временем. Кроме того, на качество работы традиционных систем распознавания лиц очень существенно влияет освещение. Однако форма лица, анализируемая 3D-системами, практически не меняется при переменах в освещении. По этой причине трехмерное опознание может работать даже в условиях почти полной темноты.

По свидетельству другого эксперта, Ральфа Гросса (Ralph Gross) из Института роботехники при университете Карнеги-Меллона, 3D-системы опознания лиц могут эффективно идентифицировать людей при разных углах поворота головы, вплоть до 90 градусов. Иначе говоря, вплоть до вида в профиль.

Традиционные системы распознавания работают довольно неплохо при снимках анфас и при повороте головы на угол до 20 градусов. Но как только угол увеличивается дальше и лицо больше становится похоже на профиль, у техники начинаются большие проблемы. Объясняется это очень просто, коль скоро на первых этапах основной задачей систем распознавания всегда была работа в качестве сканера лиц на пунктах контроля доступа, где человек по умолчанию сотрудничает с системой, подставляя лицо для проверки анфас и при правильном освещении. Ныне же главная задача — это опознание людей в толпе, где угол поворота головы и условия освещения лица могут быть совершенно произвольные.

Еще один фактор существенного прогресса в технологиях машинного распознавания лиц — способность современных камер делать снимки высокого разрешения. Благодаря этому, в частности, становится возможен тщательный компьютерный анализ текстуры кожи человека. При таком анализе любой из участков кожи — именуемый кожным отпечатком (skin print) — может захватываться как отдельный образ, а затем разбиваться на меньшие фрагменты, которые алгоритмами превращаются в математически зафиксированные соотношения между складками, порами и другими характеристиками конкретной кожной текстуры.

Когда все эти характеристики записаны, система без особого труда может различать даже идентичных близнецов, что в обычных системах распознавания лиц пока невозможно. По свидетельству Ральфа Гросса, комбинирование стандартных возможностей биометрической идентификации по лицу с анализом кожных текстур может повышать точность опознания на 20-25 процентов.

Среди выводов итогового отчета по результатам конкурса FRVT-2006 особо, наверное, следует отметить пункт о том, что некоторые из систем распознавания лиц демонстрируют ныне качества, превосходящие соответствующие возможности человека. Ведь все люди и даже маленькие дети, как известно, демонстрируют настолько хорошие способности в опознании лиц, что компьютерщикам очень долго и близко не удавалось достичь чего-то подобного в своих алгоритмах.

Джонатан Филипс объясняет достигнутый прогресс примерно так. Вообще говоря, люди очень хороши при распознавании лишь тех лиц, которые принадлежат знакомым им людям. Но когда речь идет о незнакомых лицах, то тут картина существенно иная. В рамках же тестирования FRVT специально проводились — первые в своем роде — сравнительные испытания способностей людей и алгоритмов в области распознавания незнакомых лиц.

Благодаря этим тестам стало возможным привлекать усредненные человеческие возможности как важную меру для оценки потенциальной эффективности компьютерных приложений. Как показали конкретные тесты, при ориентации на низкий уровень ложных опознаний (т.е. вероятность того, что биометрическая система ошибочно даст положительное распознавание для не того человека), шесть из семи новейших алгоритмов идентификации сработали так же или даже лучше, чем люди.

В отчете перечислены конкретные разработчики этих алгоритмов: Neven Vision, Viisage, Cognitec, Identix, Институт передовых технологий Samsung и Университет Синьхуа (Tsinghua). Правда, с сожалением отметил Филипс, подавляющее большинство участников конкурса FRVT-2006 не пожелало раскрывать подробности об устройстве своих технологий, поэтому невозможно объективно оценить различия и сходство протестированных алгоритмов.

Практика ошибок

Не слишком быстро, но, тем не менее, вполне отчетливо технологии биометрической идентификации вообще, и алгоритмы опознания по лицу в частности, находят все больше практических приложений в реальных системах безопасности. О системах контроля доступа знают практически все, но есть и множество других, столь же массово, можно сказать, внедряемых технологий.

В США, к примеру, больше десятка штатов уже применяют автоматизированную систему сканирования фотографий для водительских удостоверений. С ее помощью отлавливаются люди, подающие заявления на новые права в разных штатах (ведущих разные базы данных) или же в одном штате, но под разными именами. Однако и в этой, весьма успешной, надо заметить, системе условия для опознания лиц практически идеальные — на водительские удостоверения снимок должен быть строго единообразным, только анфас и при правильном освещении.

Куда же больший интерес у полиции, спецслужб и прочих органов безопасности сейчас вызывают существенно иные системы — способные быстро анализировать лица в толпе и эффективно выявлять среди них тех людей, что находятся в розыске. И вот тут, прямо скажем, общая ситуация выглядит куда менее радужно, а прогресс технологий далеко не столь однозначен.

Скажем, Bitkom — германская Ассоциация инфотехнологий, телекоммуникаций и новых средств информации — в июле этого года опубликовала специальное заявление по поводу роста систем биометрического опознания по лицу. В частности, в данном документе упоминается о том, что BKA, Федеральное управление криминальной полиции, «на протяжении последних нескольких месяцев в рамках пилотного проекта на главной железнодорожной станции города Майнц успешно протестировало систему, предназначенную для выявления конкретных людей в толпе с помощью биометрических данных». Подробности этого проекта, правда, не приводятся.

Заявление Bitkom главным образом сосредоточено на экономической важности подобного рода технологий, поскольку лишь в одной Германии биометрическому рынку прогнозируется ощутимый рост от 120 миллионов евро сейчас до 300 миллионов в 2010 году (в США этот сектор уже сегодня меряют миллиардами долларов). Одновременно доля систем опознания по лицу, как предполагается, вырастет до 30%, особенно в области банковского дела. Что же касается полиции, то для нее прогнозы пока не строятся и, как сейчас будет показано, вовсе не случайно.

Цель большого тестового проекта в г. Майнц, стоившего полиции примерно 210 тысяч евро, заключалась в том, чтобы проверить в реальных условиях эксплуатации три наиболее современных системы опознания по лицу на предмет их пригодности для «охоты на людей», грубо говоря. На центральном вокзале города с пассажиропотоком порядка 23 000 человек в день были установлены цифровые камеры систем опознания с задачей в реальном времени выявлять в толпе лица 200 регулярно пользующихся транспортом добровольцев, биометрия лиц которых хранилась в базе данных.

Каждую из трех систем опознания обслуживали по две камеры, одна из которых контролировала лестницу вокзала, а вторая — ленту эскалатора. Для автоматического контроля работы систем опознания каждый из добровольцев, находившихся «в розыске», носил на себе еще и маячок с RFID-чипом, идентификатор которого считывался ридером всякий раз, когда человек поднимался или спускался по лестницам. Таким способом фиксировались все случаи, когда биометрическим системам не удавалось «отловить» разыскиваемых.

В итоговом отчете криминальной полиции, выложенном на сайте BKA, выводы о тестировании систем сформулированы достаточно четко, но трактовать их, тем не менее, можно очень по-разному. Например, ученые-криминалисты сделали заключение, что проект в целом подтвердил техническую реализуемость сценариев по охоте за людьми на основе распознавания биометрии лица (откуда и появился оптимистичный релиз Bitkom). В частности, испытания показали, что без каких либо дополнительных усилий доля успешных опознаний разыскиваемых людей может достигать 60% при уровне ложных опознаний 0,1%.

Однако дальше идет трезвый разбор этих и сопутствующих им цифр. Откуда, во-первых, следует, что целиком опираться на автоматику в этом деле пока никак невозможно, поскольку одна десятая доля процента для ложных положительных опознаний — это все еще очень много. Ибо в конкретных условиях вокзала Майнца, к примеру, это означало бы ежедневное задержание и выяснение личности для 23 ни в чем не повинных людей. Во-вторых, 60% верных опознаний — это пиковый уровень при наилучшем освещении в период времени между поздним утром и полуднем. Как только условия освещения ухудшались, качество систем распознавания заметно падало, в среднем примерно до 30%. В третьих, на эффективность опознания очень ощутимо влияло движение «целей», так что эскалатор мог улучшать долю успешных опознаний на величины до 15%.

В целом же итоговый отчет BKA делает вывод, согласно которому современные биометрические системы визуального поиска людей по лицу пока что недостаточно развиты для того, чтобы реально применяться в розыскных мероприятиях полиции. По этой причине германские ученые-криминалисты, признавая в целом перспективность технологии, выражают надежду, что более практичными окажутся будущие 3D-системы опознания лиц. Однако пока что, по их мнению, эта технология находится в незрелом младенческом состоянии.

Проблема дистанции

В высших органах власти ФРГ, как и многих других западноевропейских стран, есть особая должность под названием федеральный комиссар по защите данных, в обязанности которого входит бдительный присмотр за порядком хранения накапливаемой в базах информации о гражданах и недопущение злоупотреблений.

В своем специальном комментарии по поводу итогового отчета BKA о тестировании систем опознания Петер Шаар (Peter Schaar), нынешний комиссар по защите данных, счел необходимым подчеркнуть, что в будущем, когда дистанционное опознание по лицу станет зрелой технологией, ни в коем случае нельзя допустить, чтобы это привело к режиму тотальной слежки в обществе.

Особо тревожна, по мнению Шаара, проблема ложных положительных опознаний, когда абсолютно любой человек на какое-то время может становиться подозреваемым и, не сделав ничего дурного, вынужден доказывать задержавшим властям свою невиновность. (В нынешних нервных условиях, как показывает опыт, такие разбирательства — порой весьма жесткие по форме — могут длиться часами, а иногда и сутками.)

Кроме того, комиссар настойчиво потребовал создания юридических барьеров, препятствующих объединению видеозаписей, снимаемых камерами наблюдения, с базами данных, хранящими фотографии в цифровых паспортах и в органах регистрации граждан.

Последнее из требований Шаара имеет смысл отметить особо, поскольку в нем сконцентрирована, по сути, попытка предотвратить сползание в такое общество, которое настойчиво пытаются создать некоторые политики и силовые структуры очень многих государств, начиная с США или Китая и заканчивая каким-нибудь Брунеем. Ибо именно эту модель — тотальный автоматизированный контроль за всеми перемещениями и коммуникациями граждан — уже довольно давно, с середины 1990-х годов, обкатывают в разных вариантах многие спецслужбы.

Признаки этого можно увидеть и в экспериментах с сотрудниками больших государственных ведомств, вроде министерства обороны США, где уже в прошлом десятилетии всех начали оснащать универсальными баджами, играющими роль и пропуска, и кошелька, и медицинской книжки. И в экспериментах 2000-х годов с заключенными или школьниками, на которых навешивают браслеты или ID-карточки с RFID-чипами для контроля всех перемещений по зданию тюрьмы или школы. И в настойчиво внедряемых повсюду RFID-паспортах с биометрией.

И, наконец, даже в так называемой СКМ, социальной карте москвича, которую ныне столичные власти решили преобразовать в единый документ-проездной, в одном флаконе заменяющий человеку паспорт, пенсионное удостоверение или студбилет, водительские права и медкнижку с записями о группе крови и хронических болезнях.

Поскольку компетентные органы в этом контексте особенно интересуют возможности скрытной дистанционной идентификации человека без его ведома, очень большую роль в новых документах играют RFID, чипы радиочастотной идентификации. Но и при такой постановке дела у человека, в принципе, остается возможность контролировать свой документ и блокировать излучение RFID чехлом-экраном в тех случаях, когда карточка не используется по назначению.

С лицом же человека, ясное дело, подобные простые трюки уже не проходят. Или с отпечатками пальцев, которые — если верить американскому военно-промышленному комплексу — тоже незаметно считываются уже на расстояниях до 5 метров.

Известный гуру по ИТ-безопасности Брюс Шнайер недавно мрачно изрек по данному поводу:

«С некоторых пор я стал говорить, что все эти дебаты о внедрении национальных цифровых паспортов [их опасностях и рисках] скоро станут неуместны. В будущем вам не надо будет показывать свой паспорт. Они и так будут знать, кто вы есть».

* * *

[ВРЕЗКА]

Технология двойного применения

В последнем биометрическом конкурсе НИСТ FRVT с энтузиазмом участвовали не только компании вроде Viisage и Identix, узко специализирующиеся на технологиях идентификации для служб безопасности и охранных структур, но и весьма почтенные корпорации-гиганты вроде Toshiba или Samsung, плюс ИТ-фирмы, ориентирующиеся на широкое бытовое применение своей технологии, вроде Neven Vision (недавнее приобретение Google), а также исследовательские центры университетов Пекина, Кембриджа, Карнеги-Меллона.

Столь широкий разброс участников наглядно демонстрирует, что продвинутые технологии распознавания лиц представляют большой интерес далеко не только для полиции и служб охраны.

К примеру, корпорация Google в комментариях к недавней покупке компании Neven Vision и ее оригинальных биометрических разработок пояснила, что видит заманчивые перспективы интеграции подобных технологий в свои сервисы для работы с графической информацией, вроде Picasa и Picasa Web Albums. В частности, эффективное распознавание лиц было бы очень полезно для пользователей во всем, что касается организации цифровых фотоальбомов и быстрого поиска в них нужных фотографий.

Буквально на днях, в последних числах сентября (2007), новостное агентство Reuters объявило о том, что намерено встроить в свой новый сайт программу видеопоиска. В сочетании с Viewdle, средством распознавания лиц, программа Reuters индексирует видеоматериалы агентства, так что в ближайшее время пользователи получат возможность искать в новостных потоках и архивах видеосюжеты, содержащие конкретных людей.

Простейшие функции опознания лиц уже довольно широко реализованы в цифровых фотоаппаратах многих фирм, вроде Canon, Pentax и Fuji. Встроенные в них программы поиска могут автоматически находить в картинке кадра, выбранного для съемки, человеческие лица по их характерным признакам — глазам, ушам, носу и так далее. Если лицо одно, камера сама может настроить фокус исключительно на него, если же лиц несколько, то может вычислить усредненный фокус для всех. Или, скажем, лишь для лиц переднего плана.

А совсем недавно фирма Sony объявила еще об одной новинке — цифровой фотокамере, которая удерживает затвор от срабатывания до тех пор, пока люди на фотографии не улыбнутся. Специальная программа анализирует лица на предмет счастливого выражения — положение уголков рта, размыкание губ, мимические морщинки вокруг глаз. При желании, фотограф может задать и нужный уровень счастья на снимке: просто улыбочка, широкая улыбка, смех.

[КОНЕЦ ВРЕЗКИ]

[МЕЖКОЛОННЫЕ ВРЕЗКИ]

Для защиты приватности граждан, лица которых фиксируются видеосъемкой наблюдения, в университете Карнеги-Меллона недавно разработана занятная технология. Компьютер на основе множества лиц на кадрах вычисляет некое «усредненное лицо» и накладывает его как маску на все лица видеозаписи наблюдения перед помещением в архив. Если запись понадобится затем полиции, программа вычтет эту маску обратно.

*

Одна из популярных программ опознания по лицу была протестирована на большом массиве фотографий знаменитостей с сайта MyHeritage.com. Среди соответствий, выявленных программой, оказалось довольно много забавных пар: Билл Клинтон похож на Эрика Клаптона, Джордж Буш на Иосифа Сталина, Горлум на Майкла Дукакиса, Шрек на Барбру Стрейзанд, а знаменитый Smiley, круглое лицо-улыбка, оказался одновременно похож на Кэмерон Диаз и Оззи Осборна.

* * *