Emotion Recognition based on Tracking Facial Keypoints
얼굴 특징점 추적을 통한 사용자 감성 인식(2019.03) [이용환, 김흥준]
https://www.koreascience.or.kr/article/JAKO201915061086666.pdf
- 감성 인식 기술 (영상 인식 기반 기술, 음성 인식 기반 기술)
: 본 논문에서는 AAM을 통해 입력 영상의 랜드마크를 검출하고 표정 변화에 따른 랜드마크의 움직임과 변화로 감정을 분류하는 방법을 제안.
- AAM(Active Appearance Model) 모델
: Shape Model 과 Appearnace Model을 결합하고 파라미터를 조정해 여러 얼굴 생김새를 표현함.
- Shape Model : 사람 얼굴 이미지에 n개의 랜드마크 위치 구성. 표정과 생김새에 따라 다양한 벡터가 생성. 좌표상의 크기, 위치, 기울기가 일정치 않으므로 Procrustes Alignment[1]를 수행해 벡터를 정렬한 후 PCA(Principal Component Analysis)로 Shape 모델을 구성한다.
- Appearance Model : 피부, 눈, 입술 등의 색 정보로 구성. Appearance 벡터가 평균 Shape 벡터에 대응되기 위해 Delaunay Triangulation[2]을 통해 매쉬를 구성하고, 생성된 매쉬를 Piecewise Affine Warping[3]을 수행해 정규화한다.
- AAM Fitting : 입력 영상과 모델 사이의 오차를 최소화하는 파라미터를 계산. 입력 영상과 Δp ( p←p+Δp로 파라미터를 갱신하는 매개변수) 사이의 오차를 최소화하는 Δp를 찾고, Δp의 반복적인 수정을 통해 오차가 더 이상 변하지 않거나 일정한 값 이하가 되었을 때 완료된다.
- Fuzzy k-NN(Neighbor Nearest)
: 입력 데이터의 분류를 결정하기 위해 각각의 이웃 마다 기여도를 할당해 기여에 따른 정보를 추가하여 분류하는 알고리즘. 개별 클래스에 대한 기여도를 결정하는 Mahalanobios Distance[4]를 계산하고 가까운 거리에 있는 클래스에 대한 기여도에 가중치를 적용한다. 클래스 c에 대한 이웃들의 기여도는 아래 수식으로 계산된다.
- 요약 : AMM 학습에 사용된 표정 Shape 벡터는 무표정을 기초하여 감정 모델에 따라 기쁨, 슬픔과 화남 표정에 대한 Procrustes Alignment를 수행하여 변화량을 측정하고 표정별 평균 Shape 벡터를 획득하고 분류한다. 입력 Shape 벡터를 Fuzzy k-NN 계산 분류에 따라 입력 영상에 대한 변화량을 구하여 가장 인접한 k개를 구한다. 이에 대한 기여도에 따라 표정의 정도를 게이지로 표시하고 근접한 감정을 인식한다.
- 성능 평가 : 감성 인식 분야에서 많이 활용되는 CK+(Extended Cohn-Kanade Dataset)을 대상으로 실험. 기쁨 감정은 82% 수준의 얼굴 특징점의 변화에 민감한 감정에서 보다 우수한 인식률을 보이는 반면, 슬픔 감정의 경우 다른 감정에 비해 얼굴 특성을 묘사하는데 어려움이 있어 상대적으로 낮은 인식 수준을 보임.
💌 참고자료/블로그
[1] 프로크루스테스 분석 : https://redstarhong.tistory.com/55
[2] 들로네 삼각분할 : https://darkpgmr.tistory.com/96
[3] Piecewise affine warping : https://www.researchgate.net/figure/The-process-of-piecewise-affine-warping-a-the-original-image-b-the-original-face-has_fig6_311668493
Skimage - Piecewise Affine Transformaition : https://sharky93.github.io/docs/dev/auto_examples/plot_piecewise_affine.html
warping : https://cjsal95.tistory.com/7
[4] 마할라노비스 거리 : https://wiserloner.tistory.com/1089
https://www.machinelearningplus.com/statistics/mahalanobis-distance/
'SELF-IMPROVEMENT > 논문' 카테고리의 다른 글
[논문읽기] 대규모 텍스트 분석을 위한 한국어 형태소 분석기 실행 성능 비교 (0) | 2022.04.18 |
---|---|
[논문읽기] Is BERT Really Robust? A Strong Baseline for Natural Language Attack on Text Classification and Entailment (0) | 2021.08.23 |
효과적인 논문 읽기 방법 (0) | 2021.08.05 |