Алгоритм классификации лиц на основании сверточной нейронной сети и метода главных компонент
PDF

Ключевые слова

компьютерное зрение
распознавание лиц
классификация лиц
метод главных компонент
сверточные нейронные сети

Как цитировать

1.
Алексанян А.О., Старков С.О., Моисеев К.В. Алгоритм классификации лиц на основании сверточной нейронной сети и метода главных компонент // Успехи кибернетики. 2020. Т. 1, № 3. С. 6-14. DOI: 10.51790/2712-9942-2020-1-3-1.

Аннотация

Данная статья затрагивает проблему распознавания лиц при решении задачи идентификации, где в качестве входных данных для последующей классификации используются вектора-признаки, полученные в результате работы сети глубокого обучения. Немногие существующие алгоритмы способны проводить классификацию на открытых наборах (open-set classification) с достаточно высокой степенью надежности.

Общепринятым подходом к проведению классификации является применение классификатора на основании порогового значения. Такой подход обладает рядом существенных недостатков, что и является причиной низкого качества классификации на открытых наборах. Из основных недостатков можно выделить следующие. Во-первых, отсутствие фиксированного порога — невозможно подобрать универсальный порог для каждого лица. Во-вторых, увеличение порога ведет к снижению качества классификации. И, в-третьих, при пороговой классификации одному лицу может соответствовать сразу большое количество классов. В связи с этим мы предлагаем использование метода главных компонент в качестве дополнительного способа понижения размерности, вдобавок к выделению ключевых признаков лица сетью глубокого обучения, для дальнейшей классификации векторов-признаков.

Геометрически применение метода главных компонент к векторам-признакам и проведение дальнейшей классификации равносильно поиску пространства меньшей размерности, в котором проекции исходных векторов будут хорошо разделимы. Идея понижения размерности логически вытекает из предположения, что не все компоненты N-мерных векторов-признаков несут значимый вклад в описание человеческого лица и что лишь некоторые компоненты образуют большую часть дисперсии. Таким образом, выделение только значимых компонентов из векторов-признаков позволяет производить разделение классов на основании самых вариативных признаков, без изучения при этом менее информативных данных и без сравнения вектора в пространстве большой размерности.

https://doi.org/10.51790/2712-9942-2020-1-3-1
PDF

Литература

Айвазян С. А. Теория вероятностей и прикладная статистика. М., 2001.

Ле Мань Ха. Сверточная нейронная сеть для решения задачи классификации. Труды МФТИ. 2016;8(3):91-97.

Liu W., Wen Y., Yu Z., Li M., Raj B., Song L. Sphereface: Deep Hypersphere Embedding for Face Recognition. CoRR. 2017. Vol. abs/1704.08063. Режим доступа: http://arxiv.org/abs/1704.08063.

PyTorch Documentation. Режим доступа: https://pytorch.org/docs/stable/index.html.

Günther M., Hu P., Herrmann C., Chan C. H., Jiang M. et al. Unconstrained Face Detection and Open-Set Face Recognition Challenge. IEEE International Joint Conference on Biometrics (IJCB). 2017. Vol. abs/1708.02337. Режим доступа: http://arxiv.org/abs/1708.02337.

Sumit Saha. A Comprehensive Guide to Convolutional Neural Networks — the ELI5 way. Режим доступа: https://towardsdatascience.com/a-comprehensive-guide-to-convolutional-neural-networks-the-eli5-way-3bd2b1164a53.

OpenCV-Python Tutorials. Режим доступа: https://docs.opencv.org/master/d6/d00/tutorial_py_root.html.

Документация по MySQL. Режим доступа: http://www.mysql.ru/docs/.

Скачивания

Данные скачивания пока не доступны.