Аннотация
Данная статья затрагивает проблему распознавания лиц при решении задачи идентификации, где в качестве входных данных для последующей классификации используются вектора-признаки, полученные в результате работы сети глубокого обучения. Немногие существующие алгоритмы способны проводить классификацию на открытых наборах (open-set classification) с достаточно высокой степенью надежности.
Общепринятым подходом к проведению классификации является применение классификатора на основании порогового значения. Такой подход обладает рядом существенных недостатков, что и является причиной низкого качества классификации на открытых наборах. Из основных недостатков можно выделить следующие. Во-первых, отсутствие фиксированного порога — невозможно подобрать универсальный порог для каждого лица. Во-вторых, увеличение порога ведет к снижению качества классификации. И, в-третьих, при пороговой классификации одному лицу может соответствовать сразу большое количество классов. В связи с этим мы предлагаем использование метода главных компонент в качестве дополнительного способа понижения размерности, вдобавок к выделению ключевых признаков лица сетью глубокого обучения, для дальнейшей классификации векторов-признаков.
Геометрически применение метода главных компонент к векторам-признакам и проведение дальнейшей классификации равносильно поиску пространства меньшей размерности, в котором проекции исходных векторов будут хорошо разделимы. Идея понижения размерности логически вытекает из предположения, что не все компоненты N-мерных векторов-признаков несут значимый вклад в описание человеческого лица и что лишь некоторые компоненты образуют большую часть дисперсии. Таким образом, выделение только значимых компонентов из векторов-признаков позволяет производить разделение классов на основании самых вариативных признаков, без изучения при этом менее информативных данных и без сравнения вектора в пространстве большой размерности.
Литература
Айвазян С. А. Теория вероятностей и прикладная статистика. М., 2001.
Ле Мань Ха. Сверточная нейронная сеть для решения задачи классификации. Труды МФТИ. 2016;8(3):91-97.
Liu W., Wen Y., Yu Z., Li M., Raj B., Song L. Sphereface: Deep Hypersphere Embedding for Face Recognition. CoRR. 2017. Vol. abs/1704.08063. Режим доступа: http://arxiv.org/abs/1704.08063.
PyTorch Documentation. Режим доступа: https://pytorch.org/docs/stable/index.html.
Günther M., Hu P., Herrmann C., Chan C. H., Jiang M. et al. Unconstrained Face Detection and Open-Set Face Recognition Challenge. IEEE International Joint Conference on Biometrics (IJCB). 2017. Vol. abs/1708.02337. Режим доступа: http://arxiv.org/abs/1708.02337.
Sumit Saha. A Comprehensive Guide to Convolutional Neural Networks — the ELI5 way. Режим доступа: https://towardsdatascience.com/a-comprehensive-guide-to-convolutional-neural-networks-the-eli5-way-3bd2b1164a53.
OpenCV-Python Tutorials. Режим доступа: https://docs.opencv.org/master/d6/d00/tutorial_py_root.html.
Документация по MySQL. Режим доступа: http://www.mysql.ru/docs/.