Победителем первого в мире чемпионата по распознаванию человеческих эмоций при помощи компьютерного алгоритма стала российская компания NtechLab, разработчик популярного сервиса распознавания лиц FindFace. Чемпионат EmotionNet Challenge, в ходе которого предстояло определить лучший визуальный алгоритм автоматического анализа большого массива изображений, организовал Университет штата Огайо.
"Распознавание эмоций – это зарождающаяся отрасль, в которой нет хороших бенчмарков. Конкурс, проводимый университетом Огайо, - один из кандидатов на эту роль. Мы решили поучаствовать в нем, чтобы понять, где находимся относительно наших конкурентов и какие наработки в этой области существуют во всем мире. Мы рады результатам, ведь это не финальная версия нашего алгоритма», - отмечает сооснователь NtechLab Артем Кухаренко.
На чемпионат заявились около 40 команд, однако большинство отсеялись на предварительном этапе. Участникам предстояло проанализировать эмоции не на постановочных фотографиях, а на изображениях, полученных в естественных условиях.
В общей сложности на чемпионате EmotionNet Challenge предстояло проанализировать миллион изображений. Около 950 тыс. из них использовались для «обучения» программы, а 25 тыс., на которых заранее вручную были размечены эмоции людей, использовались участниками для проверки точности алгоритма. Еще 25 тыс., также размеченные организаторами вручную, были приготовлены уже собственно для сравнения эффективности алгоритмов.
"Российские программисты одни из самых лучших в мире — они традиционно показывают сильные результаты в международных конкурсах. В 2000 году Россия впервые выиграла Assoсiation for Computing Machinary International Collegiate Programming, самый престижный и известный мировой конкурс по программированию, и с тех пор команды из РФ несколько раз оказывались на первом месте», - отметил гендиректор российской инвестиционной интернет-платформы StartTrack Константин Шабалин.
Основная трудность с определением эмоций по выражению лица в естественных условиях, была связана с тем, что на фотографии или на видео лицо не всегда повернуто прямо к камере. В частности, из-за этого, по оценке организаторов чемпионата, существующие алгоритмы еще предстоит значительно дорабатывать.
Участникам чемпионата предстояло распознать 16 основных эмоций. Это более чем вдвое больше, чем требовалось в ходе прежних экспериментов в этой области. Теперь уже речь шла не только о простых эмоциях («счастливый», «печальный», рассерженный»), но и о сложных, составных («рассержен и удивлен» и т. п.). Каждая эмоция определятся по уникальной вариации сокращения лицевых мышц. Если действие одних мышц хорошо видно, то других — едва заметно даже для человека. При этом организаторы соревнования снижали качество изображения, уменьшая четкость и закрывая небольшую часть фотографии.