Какие факторы необходимо учитывать при внедрении решения с распознаванием лиц, чтобы получить качественное распознавание и эффективную работу всей системы? В статье разберем параметры модуля распознавания лиц, на которые нужно обратить внимание, разберем основные термины и понятия, внешние факторы, которые оказывают влияние на качество распознавания. Поговорим, какие задачи можно эффективно решать с использованием модуля распознавания.
Система распознавания лиц — три кита эффективной работы
При выборе системы распознавания лиц самое большое заблуждение, что качество работы системы напрямую зависит от выбора алгоритма распознавания, и достаточно взять самый лучший алгоритм распознавания и автоматически получить качественное решение. Качественное распознавание — это комплексный результат, а алгоритм распознавания — одна из составляющих.
На эффективную работу системы распознавания лиц влияют три основных фактора: алгоритм распознавания лиц и выбор параметров настройки модуля распознавания, внешние факторы, качество базы для идентификации лиц. Если не уделить внимание хотя бы одному из факторов, то получить качественную работу системы распознавания не получится.
Самые распространённые решения с использованием распознавания лиц — решения по контролю доступа на объект, решения с многофакторной идентификацией человека, решения идентификации человека в толпе.
Система распознавания лиц в VideoNet PSIM может работать в двух основных режимах: режим верификации и режим идентификации. Режим верификации — это сравнение пары фотографий: биометрического шаблона, хранящегося в базе, и изображения поступающего на вход модуля распознавания. Результат — модуль распознавания выдает бинарное решение: «да» изображения принадлежат одному лицу, или «нет» на фотографиях изображены разные люди. Используется режим верификации при организации многофакторной идентификации, где распознанное лицо сравнивается с лицом, например, владельца карты доступа. И при положительном сравнении система принимает решение, что доступ на объект разрешен. Режим идентификации — это сравнение изображения поступающего на вход модуля распознавания с одной или несколькими базами фотографий (сравнение одного со многими), результат — это разрешение или отказ в доступе на объект, идентификация постоянного клиента или идентификация правонарушителя и т.д. Вариантов использования множество. Результатом сравнения будет лицо с максимальным процентом сходства.
Фактор #1. Алгоритм работы модуля распознавания лиц
Алгоритм распознавания лиц — это метод построения биометрической модели лица или дескриптор. На основе построенного дескриптора происходит дальнейший процесс идентификации человека. Существуют три основных вида алгоритмов: математические, нейросетевые и гибридные, основанные на комбинации первых двух алгоритмов. Большинство современных систем распознавания используют алгоритмы, построенные на нейросетях. Нейросетевые алгоритмы распознавания лиц обучаются на больших наборах фотографий людей со специально размеченными элементами на изображении. От качества фотографий, на которых обучается нейросеть, зависит точность распознавания.
В VideoNet PSIM используются нейросетевые алгоритмы распознавания лиц. В VideoNet PSIM можно выбрать один из трех встроенных алгоритмов распознавания в зависимости от задачи, требований к качеству распознавания и требований к вычислительным ресурсам.
Процесс распознавания лица в VideoNet PSIM складывается из следующих этапов:
- Детектирование лица в видеопотоке
- Выбор лучшего кадра
- Определение характеристик человека: пол, возраст, эмоции (радость, грусть и т.д.)
- Формирование дескриптора (биометрического шаблона)
- Cравнение биометрических шаблонов с шаблонами в базе данных лиц
- Определение степени сходства шаблонов
- Принятие решения об идентификации человека на основе заданного значения сходства
Настройка модуля распознавания лиц
В зависимости от выбранной зоны контроля: коридор, проходная с турникетом, контролируемый вход в дверь и т.д., осуществляется выбор, установка и настройка камеры для распознавания лиц. Для каждой камеры производится индивидуальная настройка модуля распознавания лиц. В VideoNet PSIM существуют три группы настроек.
Параметры потока:
Разрешение. При настройке указывается разрешение кадра, которое будет подаваться на вход модуля распознавания — стандартное, высокое или максимальное. Значение данного параметра влияет на скорость распознавания.
Частота кадров. Выбирается частота кадров, поступающих на обработку. Значение подбирается в зависимости от производительности системы. Значение данного параметра влияет на загрузку процессора.
Параметры детекции лиц:
Порог достоверности. При детектировании лица в видеопотоке — т.е. определении, что в кадре есть лицо, используется параметр порог достоверности. Этот параметр определяет уверенность модуля распознавания в том, что обнаруженный в кадре объект является лицом. Чем выше порог достоверности, тем меньше количество ложных срабатываний, но при этом повышаются шансы пропустить настоящее лицо.
Выбор настройки порога достоверности определяется индивидуально для каждой решаемой задачи. Когда в настойках задает высокое значение порога достоверности, система не пропустит постороннего, но при этом даст большое количество ложных срабатываний, c которыми придется разбираться. Когда порог достоверности понижается, шансы пропустить лицо малы, но при этом возрастает ошибка пропуска постороннего на объект. Поэтому выбор значения порога достоверности в каждом случае индивидуален.
Частота детекции. Данный параметр регламентирует обнаружение лиц не чаще, чем на указанном количестве кадров в секунду. Значение выбирается в зависимости от производительности системы. Значение данного параметра влияет на скорость распознавания.
Алгоритм детектора. В VideoNet PSIM существуют два варианта алгоритмов поиска и обнаружения лиц на изображении — качественный или быстрый. Быстрый алгоритм рекомендуется использовать в случае очень ограниченных вычислительных ресурсов. Значение данного параметра влияет на скорость распознавания.
Параметры распознавания лиц:
Игнорировать повторное распознавание. Задается время по истечении которого одно и тоже лицо повторно появившееся в зоне распознавания следует считать новым. Настройка данного параметра необходима, т.к. в процессе нахождения в кадре человек может кратковременно отвернуться и может быть перекрыт другим человеком.
Сохранять лица. Сохранение лиц в базу данных.
Подсчитывать лица Подсчет количества распознанных лиц.
Определение пола, возраста, эмоций человека по изображению лица:
По изображению лица можно определять характеристики человека: пол, возраст, эмоции (радость, гнев, печаль и т.д.). Этот функционал входит в состав модуля распознавания лиц в VideoNet PSIM.
Определение характеристик человека пол, возраст, эмоции называется классификацией. Классификацию человека по изображению лица применяют во многих областях для анализа возрастного состава аудитории, например, магазина или ресторан, анализа гендерного состава аудитории, анализа качества обслуживания покупателей, поиск людей в видеоархиве по фотографии, полу, возрасту, эмоциям.
Подмена лица фотографией:
Функционал «подмена лица фотографией» используется в случаях, когда злоумышленник использует фотографию, чтобы скрыть своё лицо или же пытается проникнуть на объект, используя фотографию одного из сотрудников данного объекта. Подобный контроль потребует дополнительных ресурсов компьютера. Значение данного параметра влияет на скорость распознавания. В настройках задается процент вероятности того, что прошедший человек закрыл лицо фотографией, при превышении заданного значения лицо человека должно считаться подменённым.
Посмотреть работу установки «Подмена лица фотографией»
Какие данные попадают в журнал лиц
Все события, связанные с результатами работы модуля распознавания лиц, записываются в Журнал Лиц. Существуют четыре вида событий: распознано лицо, совпадение с базой данных лиц, нет совпадения с базой лиц, подмена лица фотографией. События журнала распознавания лиц содержат следующие данные, которые можно использовать для построения отчетов и статистики:
- Тип события;
- Дата/Время;
- Лицо с камеры;
- Фотография из базы данных лиц;
- Камера;
- Компьютер;
- Ф.И.О.;
- Подразделение;
- Должность;
- Возраст;
- Имя базы данных лиц;
- Комментарий;
- Пол;
- Уровень сходства;
- Эмоция
В журнале Лиц для удобной работы с данными реализован механизм фильтрации. Можно задать временной диапазон для выборки, и выбрать необходимые данные для фильтрации по журналу. Построенный отчет можно сохранить в формате xlsx. Например, можно задать выборку по возрасту, указав нужный возрастной диапазон или сделать выборку по полу. Доступны любые варианты фильтрации. Из журнала лиц можно посмотреть видео по любому события из журнала.
Фактор #2. Внешние факторы
От правильного выбора видеокамеры, ее настройки и выбора места установки зависит точность распознавания и соответственно эффективность работы всей системы. Мы собрали основные рекомендации, следуя которым, вы повысите качество системы распознавания.
Рекомендации по организации зоны распознавания лиц
- Рекомендуется использовать отдельную камеру для распознавания лиц.
- Устанавливать камеру желательно на уровне головы человека среднего роста, чтобы обеспечить значение угла отклонения лица по вертикали не более 15 градусов
- Направление движения людей в зоне контроля должно осуществляться к камере
- Организуйте ровное освещение лиц в зоне распознавания
- Избегайте сложного фона за людьми. Наилучшие результаты распознавания получаются на фоне светлой и однородной стены или пола
- Время нахождения человека в зоне контроля должно составлять 1 секунду. Остановка человека в зоне контроля, например, при помощи турникета, повысит качество распознавания.
Алгоритм в своей работе ориентируется на характерные особенности лица, глаза, уголки губ, нос и т.п. Для успешного распознавания лица требуется, чтобы лицо было представлено не менее 160 пикселями приходящимися на овал лица, и в идеале не менее 60 пикселей — на расстояние между глазами. Как бы тщательно вы не выбирали месторасположение камеры, чтобы добиться этих значений ее придется подстраивать по месту. Чаще для возможности настройки на месте выбирают камеру с вариофокальным объективом.
Технический вебинар «Рекомендации по настройке распознавания лиц в VideoNet»
Для обеспечения наилучшего результата распознавания соблюдайте рекомендации
- Изображение лица в кадре должно быть четким, не смазанным и равномерно освещенным
- Наличие на лице отдельных теней или бликов значительно снизит вероятность корректной идентификации человека
- Фон, на котором расположено лицо, должен быть однородным и светлым
- Угол поворота лица в кадре не должен превышать 15 градусов по вертикали и горизонтали
- Рекомендуемое расстояние между зрачками на изображении лица - не менее 60 пикселей
На качество идентификации человека наличие усов, бороды, очков, моргание и эмоции не оказывают существенное влияние. Для качественной идентификации личности человек не обязательно должен смотреть в камеру, модуль распознавания лиц показывает хороший процент сходства вплоть до 30 градусов отклонения оси наблюдения от фронтальной плоскости лица при соблюдении рекомендаций к распознаваемому изображению и требований по организации зоны распознавания лиц.
Фактор#3. Качественная база фотографий для распознавания
Вероятность распознавания лица повышается при добавлении нескольких фотографий человека в базу. Чем более разнообразные фотографии одного человека (разные ракурсы) добавлены в базу, тем больше вероятность его идентификации.
Рекомендации к изображениям для построения дескрипторов:
- При создании дескрипторов рекомендуется получать эталонные изображения лиц путем фотографирования. В этом случае возможно добиться максимальной точности при распознавании лица;
- Положение лица должно быть фронтальным. Поворот, наклон и отклонение головы должны быть менее 5 градусов в любом направлении от фронтального положения по каждой угловой координате;
- Выражение лица должно быть нейтральным (без улыбки), оба глаза должны быть открыты (но не шире, чем в нормальном положении) и смотреть в камеру, рот закрыт;
- Волосы человека не должны закрывать его глаза, наличие головного убора, платка не рекомендуется;
- Если на изображении человек в очках, их оправа не должна закрывать часть глаз. Очки должны иметь чистые и прозрачные стекла, чтобы зрачки глаз и радужные оболочки были четко видны;
- Плечи человека должны быть обращены к камере. Не допускается использование изображений на которых человек смотрит «через плечо»;
- Фон на изображении должен быть без теней, ровным и не должен содержать текстуры с прямыми или кривыми линиями, которые могут внести искажения в результаты автоматизированной обработки лица;
- Фон должен иметь однородную цветовую палитру или быть одноцветным, с последовательным изменением яркости от светлой к темной только в одном направлении;
- Лицо человека должно быть равномерно освещено, без теней. Не допускается наличие теней, засветки и наличие на изображении лица «ярких пятен» (бликов);
- Не допускается наличие темных теней от бровей в глазных впадинах. Радужные оболочки и зрачки глаз должны быть четко видны;
- На изображении должна быть четко видна текстура кожи в каждой области лица. При этом на лице не должно быть областей с насыщением (недостаточной или слишком большой экспозицией);
- Все точки полученного изображения лица должны быть в фокусе (от носа до ушей и от подбородка до верха головы);
- Не допускается использование неестественного освещения: желтого, красного и т. д.;
- Освещение не должно искажать естественный цвет кожи при рассмотрении в естественных условиях. Не допускается эффект «красных глаз»;
- Не допускается редактирование цветного или черно-белого изображения с целью улучшения внешнего вида изображенного лица или его художественной обработки;
- Разрешение фотографии лица должно составлять не менее 256х256 пикселей.
Посмотреть видео о создании эталона для идентификации в VideoNet PSIM.
Дополнительный функционал. # Поиск человека по фотографии
Для расследования происшествий или анализе информации в VideoNet PSIM предусмотрен функционал поиска человека по фотографии. Для поиска человека по фотографии достаточно выбрать фотографию человека из журнала лиц, загрузить фотографию из файла или с Web-камеры, добавить ее в окно поиска и настроить необходимый уровень сходства лица с лицами в событиях VideoNet. Система найдет и покажет только те события, где лицо на изображении имеет необходимый уровень сходства с лицом на выбранной для поиска фотографии. Вы можете просмотреть видео фрагменты с результатами поиска в один клик.
Заключение. # Каждая система распознавания лиц индивидуальна
Наши рекомендации даны для получения максимального результата от системы распознавания лиц. Это не означает, что при несоблюдении наших рекомендаций, система не будет работать. Каждый объект индивидуален и имеет свои особенности, и зачастую некоторые рекомендации не возможно реализовать максимально возможным образом. Специалисты нашей компании помогут настроить систему распознавания лиц с учетом особенностей вашего объекта и логики дальнейшей работы с распознанным лицом, помогут построить решение с многофакторной идентификацией.
За поддержкой, подбором решений и рекомендациями обращайтесь по электронной почте info@videonet.ru или по телефону 8-800-50-50-100. У нас есть опыт реализации различных решений с распознаванием лиц и самой большой инсталляции системы распознавания лиц, более чем на 300 каналов распознавания в рамках одной системы.
Последние комментарии