"Журнал "Компьютерра" №706" - читать интересную книгу автора (Компьютерра)

АНАЛИЗЫ: Лица, подлежащие опознанию

Автор: Киви Берд

В одном из недавних интервью для прессы большой босс из американского военно-промышленного комплекса Брюс Уокер (Bruce Walker) - вице-президент корпорации Northrop Grumman, курирующий разработки для "безопасности отечества", - мимоходом изрек любопытную фразу, удивившую даже экспертов, отслеживающих прогресс в технологиях биометрического опознавания. Уокер заявил, что уже сегодня "мы можем считывать отпечатки пальцев с пяти метров… Все десять отпечатков. С этой же дистанции мы можем и сканировать радужку глаза".

Те, кто интересуются инфотехнологиями безопасности, наверняка знают, что область автоматического опознавания людей по их биометрии - лицу, голосу, отпечаткам пальцев, радужной оболочке глаз, рисунку вен, походке и так далее, - переживает ныне бурный расцвет. Каждая из перечисленных характеристик, с точки зрения надежности идентификации, имеет свои плюсы и минусы. Но в силу специфики задач, которые ставятся перед технологиями безопасности, среди самых важных факторов при сравнительной оценке разных методов непременно фигурирует расстояние, с которого возможна идентификация, и относительная сложность подделки человеком своей биометрии.

Например, сканирование радужной оболочки глаз выглядит очень заманчиво, однако уникальный рисунок радужки нетрудно изменить или подделать с помощью контактных линз. Еще хуже с точки зрения широкомасштабного применения выглядят перспективы таких технологий, как опознавание по голосу, запаху, походке или рисунку кровеносных сосудов. В итоге же предпочтение отдается идентификации по лицу и отпечаткам пальцев. Опознавание по лицу, в силу очевидных причин, гораздо перспективнее при идентификации людей на расстоянии. С другой стороны, компьютерные алгоритмы для анализа лиц обычно уступают по быстродействию и эффективности алгоритмам анализа дактилоскопии. Но ситуация здесь быстро меняется.

Теория прогресса

Маска

Для защиты приватности граждан, чьи лица фиксируются камерами наблюдения, в Университете Карнеги-Меллона недавно разработана занятная технология. Компьютер на основе множества лиц на кадрах вычисляет некое "усредненное лицо" и накладывает его как маску на все лица видеозаписи перед помещением в архив. Если запись понадобится полиции, программа эту маску удалит.


В конце мая Национальный институт стандартов и технологий США подвел итоги конкурса FRVT-2006 (Face Recognition Vendor Test, или "Тестирование поставщиков систем для распознавания лиц"). Компетентное жюри констатировало, что в целом компьютерные технологии распознавания людей развиваются очень быстро. В частности, алгоритмы опознания лиц с 2002 года улучшились примерно в десять раз, а с 1995 года - в сто раз. Причем самые лучшие из протестированных технологий превосходят соответствующие способности большинства людей.

Джонатан Филипс (Jonathan Phillips), отвечавший за организацию конкурса и подготовку итогового отчета, полагает, что столь заметное снижение ошибок распознавания - одного из важнейших параметров оценки биометрических систем - достигнуто благодаря применению снимков высокого разрешения и трехмерных алгоритмов опознавания лиц. Технологии трехмерного опознавания были разработаны за последние несколько лет и на рынок вышли совсем недавно. В рамках конкурса FRVT их эксплуатационные качества впервые тестировались только в прошлом году, но зато сразу для шести новых 3D-алгоритмов. Их главная особенность, как можно понять из названия, - анализ информации об объемных формах и соотношениях деталей лица.

Среди преимуществ новой технологии отмечают способность 3D-идентификации к выделению отличительных черт в поверхности лица человека. Например, характерных трехмерных кривых для линии глазниц, носа, подбородка, где ткани и кости выступают наиболее очевидно и почти не меняют форму со временем. Кроме того, на качество работы традиционных систем распознавания лиц сильно влияет освещение. Однако форма лица, анализируемая 3D-системами, не меняется при переменах в освещении.

По свидетельству другого эксперта, Ральфа Гросса (Ralph Gross) из Института роботехники при Университете Карнеги-Меллона, 3D-системы опознавания лиц могут эффективно идентифицировать людей при разных углах поворота головы, вплоть до вида в профиль. Традиционные системы работают довольно неплохо при снимках анфас и при повороте головы на угол до двадцати градусов. Но как только угол увеличивается и лицо становится больше похоже на профиль, техника дает сбои. Объясняется это просто: ведь на ранней стадии развития этой технологии основной задачей систем распознавания была работа в качестве сканера лиц на пунктах контроля доступа, где человек по умолчанию сотрудничает с системой, подставляя лицо для проверки анфас и при правильном освещении. Ныне же главная задача - опознать людей в толпе, где угол поворота головы и условия освещения лица могут быть произвольными.

Еще один фактор существенного прогресса в технологиях машинного распознавания лиц - способность современных камер делать снимки высокого разрешения. Благодаря этому, в частности, становится возможен тщательный компьютерный анализ текстуры кожи человека. При таком анализе любой из участков кожи, именуемый кожным отпечатком (skin print), может захватываться как отдельный образ, а затем разбиваться на меньшие фрагменты, которые алгоритмами превращаются в математически зафиксированные соотношения между складками, порами и другими характеристиками кожной текстуры. Когда все эти характеристики известны, они позволяют различать даже близнецов, что обычным системам распознавания лиц пока не под силу. По свидетельству Ральфа Гросса комбинирование стандартных возможностей биометрической идентификации по лицу с анализом кожных текстур может повышать точность опознания на 20–25 процентов.

Среди выводов итогового отчета конкурса FRVT-2006 следует отметить пункт о том, что некоторые из систем распознавания лиц демонстрируют качества, превосходящие возможности человека. Ведь все люди, даже маленькие дети, как известно, столь хорошо опознают лица, что компьютерщикам долго не удавалось даже приблизиться к подобным показателям в своих алгоритмах. Джонатан Филипс объясняет достигнутый прогресс примерно так. Обычно люди очень хорошо распознают лишь уже знакомые лица. Когда же речь идет о незнакомых, картина существенно иная. В рамках тестирования FRVT впервые проводились сравнительные испытания способностей людей и алгоритмов в области распознавания незнакомых лиц. Благодаря этим тестам усредненные человеческие возможности превратились в важную меру для оценки потенциальной эффективности компьютерных приложений. Как показали эксперименты, в ситуациях, где люди давали низкий уровень ложных опознаний, шесть из семи новейших алгоритмов идентификации сработали сопоставимо или даже лучше, чем люди. Больше того, три алгоритма работали не хуже людей и при высоком уровне ложных тревог (то есть в таких условиях, где даже люди сталкивались с серьезными трудностями). В отчете перечислены разработчики этих алгоритмов: Neven Vision, Viisage, Cognitec, Identix, Институт передовых технологий Samsung (SAIT) и Университет Синьхуа. Правда, с сожалением отметил Филипс, подавляющее большинство участников конкурса FRVT-2006 не пожелало раскрывать подробности о своих технологиях, поэтому невозможно объективно оценить различия и сходство протестированных алгоритмов.

Практика ошибок

Технологии биометрической идентификации вообще и алгоритмы опознавания по лицу в частности находят все больше практических приложений в системах безопасности. О системах контроля доступа знают практически все, но есть и множество других столь же массово внедряемых технологий. В США, к примеру, больше десятка штатов уже применяют автоматизированную систему сканирования фотографий для водительских удостоверений. С ее помощью отлавливаются люди, подающие заявления на новые права в разных штатах (ведущих разные базы данных) или же в одном штате, но под разными именами. Однако и в этой весьма успешной системе условия для опознания лиц практически идеальные - на водительском удостоверении снимок должен быть единообразным: обязательно анфас и при правильном освещении. Куда больший интерес у полиции, спецслужб и прочих органов безопасности сейчас вызывают существенно иные системы - способные быстро анализировать лица в толпе и эффективно выявлять среди них тех людей, что находятся в розыске. И тут ситуация выглядит куда менее радужно, а прогресс технологий далеко не столь однозначен.

Скажем, Bitkom - немецкая Ассоциация инфотехнологий, телекоммуникаций и новых средств информации - в июле этого года опубликовала специальное заявление по поводу развития систем биометрического опознания по лицу. В документе упоминается о том, что BKA, Федеральное управление криминальной полиции, "на протяжении последних нескольких месяцев в рамках пилотного проекта на главной железнодорожной станции города Майнц успешно протестировало систему, предназначенную для выявления конкретных людей в толпе с помощью биометрических данных". Подробности проекта, правда, не сообщаются. Заявление Bitkom главным образом сосредоточено на экономической важности подобного рода технологий, поскольку лишь в одной Германии биометрическому рынку прогнозируется ощутимый рост от нынешних 120 миллионов евро до 300 миллионов в 2010 году (в США этот сектор уже сегодня измеряется миллиардами долларов). Одновременно доля систем опознания по лицу, как предполагается, вырастет на 30%, особенно в области банковского дела. Что же касается полиции, то для нее прогнозы пока не строятся и, как сейчас будет показано, вовсе не случайно.

Цель большого тестового проекта в Майнце, обошедшегося полиции примерно в 210 тысяч евро, заключалась в том, чтобы проверить три новейшие системы опознавания по лицу на предмет их пригодности, грубо говоря, для "охоты на людей". На центральном вокзале города с пассажиропотоком около 23 тысяч человек в день были установлены цифровые камеры, которым предстояло в реальном времени находить в толпе двести регулярно пользующихся транспортом добровольцев, чьи биометрические параметры лиц хранились в базе данных. Каждую из трех систем опознавания обслуживали две камеры, одна из которых следила за лестницей вокзала, а вторая - за эскалатором. Для автоматического контроля работы систем каждый из добровольцев, находившихся "в розыске", носил на себе еще и маячок с RFID-чипом, идентификатор которого считывался ридером всякий раз, когда человек поднимался или спускался по лестницам. Таким способом фиксировались все случаи, когда биометрическим системам не удавалось "отловить" разыскиваемых.

В итоговом отчете криминальной полиции, выложенном на сайте BKA, выводы о тестировании систем сформулированы четко, но трактовать их можно по-разному. Например, ученые-криминалисты заключили, что проект в целом подтвердил техническую реализуемость сценариев охоты за людьми на основе распознавания биометрии лица (откуда и появился оптимистичный релиз Bitkom). В частности, испытания показали, что доля успешных опознаний разыскиваемых людей может достигать 60% при уровне ложных опознаний в 0,1%.

Однако дальше идет трезвый разбор этих цифр, из которого следует, во-первых, что целиком опираться на автоматику в этом деле пока невозможно, поскольку десятая доля процента для ложных опознаний - все еще очень много. То есть для вокзала Майнца это означало бы ежедневное задержание и выяснение личности для 23 ни в чем не повинных людей. Во-вторых, 60% верных опознаний - это пиковый уровень при наилучшем освещении в период между поздним утром и полуднем. Как только условия освещения ухудшались, качество систем распознавания заметно падало, в среднем примерно до 30%. В-третьих, на эффективность опознавания ощутимо влияло движение "целей", так что эскалатор мог улучшать долю успешного срабатывания камер на 15%.

В целом же составители отчета BKA делают такой вывод: современные биометрические системы визуального поиска людей по лицу пока недостаточно хороши, чтобы использоваться в розыскных мероприятиях. По этой причине немецкие криминалисты, признавая перспективность технологии, выражают надежду, что более практичными окажутся будущие 3D-системы опознавания лиц. Однако, по их мнению, эта технология пока не созрела.

Проблема дистанции

Похожи

Одна из популярных программ опознания по лицу была протестирована на большом массиве фотографий знаменитостей с сайта MyHeritage.com. Среди выявленных соответствий оказалось довольно много забавных пар: Билл Клинтон похож на Эрика Клэптона, Джордж Буш на Иосифа Сталина, Майкл Дукакис на Горлума, Барбра Стрейзанд на Шрека, а на знаменитого Smiley (круглое лицо-улыбка) оказались похожи сразу и Кэмерон Диаc, и Оззи Осборн.


В высших органах власти ФРГ, как и многих других западноевропейских стран, есть особая должность под названием федеральный комиссар по защите данных, в обязанности которого входит присмотр за порядком хранения накапливаемой в базах информации о гражданах и недопущение злоупотреблений. В своем специальном комментарии по поводу итогового отчета BKA о тестировании систем опознавания Петер Шаар (Peter Schaar), нынешний комиссар по защите данных, счел необходимым подчеркнуть, что в будущем, когда дистанционное опознавание по лицу станет зрелой технологией, ни в коем случае нельзя допустить, чтобы это привело к режиму тотальной слежки в обществе. Особо тревожна, по мнению Шаара, проблема ложных срабатываний системы, чреватых тем, что человеку, не сделавшему ничего дурного, придется доказывать свою невиновность. (В нынешних нервных условиях, как показывает опыт, такие разбирательства - порой весьма жесткие по форме - могут длиться часами, а иногда и сутками.) Кроме того, комиссар настойчиво потребовал возвести юридические барьеры, препятствующие объединению видеозаписей, ведущихся камерами наблюдения, с базами данных, где хранятся фотографии из цифровых паспортов, и с базами данных органов регистрации граждан.

Последнее из требований Шаара особенно важно: в нем, по сути, сделана попытка предотвратить сползание в такое общество, которое настойчиво пытаются создать некоторые политики и силовые структуры многих государств, начиная с США или Китая и заканчивая, допустим, Брунеем. Ибо именно эту модель - тотальный автоматизированный контроль за всеми перемещениями и коммуникациями граждан - с середины 1990-х годов спецслужбы обкатывают в разных вариантах. Признаки этого процесса можно увидеть и в экспериментах с сотрудниками крупных государственных ведомств вроде Министерства обороны США, где уже в прошлом десятилетии начали снабжать сотрудников универсальными бэджами, играющими роль и пропуска, и кошелька, и медицинской книжки. И в экспериментах 2000-х годов с заключенными или школьниками, на которых навешивают браслеты или ID-карточки с RFID-чипами для контроля перемещений по зданию тюрьмы или школы. И в настойчиво внедряемых RFID-паспортах с биометрией. И, наконец, даже в так называемой СКМ, социальной карте москвича, которую столичные власти решили преобразовать в единый документ-проездной, заменяющий человеку паспорт, пенсионное удостоверение, водительские права и медицинскую книжку.

Поскольку компетентные органы особенно интересуют возможности скрытной дистанционной идентификации человека без его ведома, очень большую роль в новых документах играют чипы радиочастотной идентификации. Но и при такой постановке дела у человека, в принципе, остается возможность контролировать свой документ и блокировать излучение RFID чехлом-экраном, когда карточка не используется по назначению. С лицом же человека, ясное дело, подобный трюк не пройдет. Или с отпечатками пальцев, которые - если верить американскому военно-промышленному комплексу - тоже незаметно считываются на расстоянии.

Известный гуру по ИТ-безопасности Брюс Шнайер мрачно изрек по этому поводу: "С некоторых пор я стал говорить, что все дебаты о внедрении национальных цифровых паспортов скоро станут неуместны. В будущем вам не придется показывать свой паспорт. Они и так будут знать, кто вы есть".

Технология двойного применения

В последнем биометрическом конкурсе Национального института стандартов и технологий FRVT с энтузиазмом участвовали не только компании вроде Viisage и Identix, специализирующиеся на технологиях идентификации для служб безопасности и охранных структур. Там были и почтенные корпорации-гиганты, в том числе Toshiba и Samsung, ИТ-фирмы, ориентирующиеся на широкое бытовое применение своей технологии (в частности, Neven Vision, недавнее приобретение Google), а также исследовательские центры университетов Пекина, Кембриджа и Карнеги-Меллона. Столь широкое представительство наглядно показывает, что продвинутые технологии распознавания лиц интересуют не только полицию и службы охраны.

К примеру, Google, комментируя недавнюю покупку компании Neven Vision и ее оригинальных биометрических разработок, пояснила, что видит заманчивые перспективы интеграции подобных технологий в свои сервисы для работы с графической информацией, вроде Picasa и Picasa Web Albums. В частности, эффективное распознавание лиц было бы очень полезно во всем, что касается организации цифровых фотоальбомов и быстрого поиска фотографий в них.

А в последних числах сентября агентство Reuters объявило о том, что намерено встроить в свой новый сайт программу видеопоиска. В сочетании с Viewdle, средством распознавания лиц, программа Reuters индексирует видеоматериалы агентства, так что в ближайшее время пользователи получат возможность искать видеосюжеты, содержащие конкретных людей.

Простейшие функции опознавания лиц уже реализованы в цифровых фотоаппаратах многих фирм, в том числе Canon, Pentax и Fuji. Встроенные программы поиска могут автоматически находить в картинке видоискателя человеческие лица по характерным признакам - глазам, ушам, носу и т. д. Если лицо одно, камера сама может настроить фокус исключительно на него, если же лиц несколько, то может вычислить усредненный фокус для всех. Или, скажем, лишь для лиц переднего плана. А недавно фирма Sony объявила еще об одной новинке - цифровой камере, которая удерживает затвор от срабатывания до тех пор, пока люди не улыбнутся. Специальная программа анализирует лица "на предмет счастливого выражения", исследуя положение уголков рта, размыкание губ, мимические морщинки вокруг глаз. При желании, можно задать и "нужный уровень счастья" на снимке: просто улыбочка, широкая улыбка, смех…