TCC: Comparativo de Algoritmos Clássicos de Aprendizado de Máquina em um Problema de Reconhecimento de Faces

mateusloredo
7 de jun. de 2024
4 min de leitura

Discente: KREISLER BRENNER MENDES

Orientador: ELIANA PANTALEÃO

Título: COMPARATIVO DE ALGORITMOS CLÁSSICOS DE APRENDIZADO DE MÁQUINA EM UM PROBLEMA DE RECONHECIMENTO DE FACES

Link: https://repositorio.ufu.br/handle/123456789/28614

_________________________________________________________________________

O TCC da graduado Kreisler Brenner Mender, do curso de Engenharia Eletrônica e de Telecomunicações, pela UFU no campus Patos de Minas, investiga a aplicação de métodos convencionais de aprendizado de máquina para o reconhecimento de indivíduos por meio de imagens de rostos. Com a crescente disponibilidade de dados faciais, essas técnicas se tornam cada vez mais importantes para identificar pessoas em diferentes contextos.

A pesquisa foca em extrair características das imagens faciais utilizando a técnica de Análise de Componentes Principais (PCA). Esta abordagem reduz a complexidade dos dados ao representar cada rosto como um vetor em um espaço de dimensão n, que é menor do que a quantidade total de pixels da imagem original.

Para realizar o reconhecimento facial, o trabalho testou vários algoritmos de aprendizado de máquina, incluindo:

Classificadores por distância
Árvores de decisão
Máquinas de vetores de suporte (SVM)
Redes neurais artificiais

INTRODUÇÃO

Nos últimos anos tem-se observado um constante aumento da qualidade e número de dispositivos com câmera integrada no mercado. Desta forma, pesquisas relacionadas a aprendizado de máquina (ML do inglês machine learning) estão em alta, devido ao grande volume de informações geradas por estes dispositivos. Dentro do universo de ML várias tecnologias vêm sendo desenvolvidas e/ou otimizadas. Dentre elas temos a tecnologia de Reconhecimento Facial (FR, do inglês Face Recognition), que surgiu como uma útil ferramenta para reconhecer características de rostos por meio de seus 14 traços inerentes.

Biometria

É a ciência que estabelece a autenticidade de um indivíduo baseada em suas características fisiológicas ou comportamentais. A tecnologia biométrica é um conjunto de técnicas aplicadas para capturar, analisar e identificar pessoas por meio de seus traços biométricos em representação digital.

Etapas de um sistema de reconhecimento facial

Detecção Facial

Dada uma única imagem ou um vídeo, um detector facial ideal deve ser capaz de identificar e localizar todas as faces presentes, independentemente de sua posição, escala, orientação, idade e expressão.

Normalização

O objetivo da normalização de imagens é remover efeitos ou sinais que não tenham relevância e que apresentem singularidades não desejadas intrínsecas ao processo de aquisição das imagens.

Extração de características

Consiste em encontrar novas representações para os dados. Com isso, é possível reduzir ao mínimo o número de dimensões de um problema sem que haja perdas de informações relevantes.

O desenvolvimento deste trabalho consiste na realização de quatro etapas como mostrado na Figura abaixo.

Etapas do desenvolvimento deste trabalho

ETAPA I: Preparação das amostras

O banco de dados de faces escolhido para a maioria dos experimentos foi o Yale Face Database, constituído de 165 imagens faciais de 15 indivíduos distintos sendo que 14 são homens e uma mulher. Cada indivíduo possui 11 amostras de imagens faciais com variações de expressões e iluminação.

ETAPA II: Treinamento

Esta etapa se resume em realizar o treinamento do algoritmo com as imagens de treino selecionadas e normalizadas na etapa anterior. O método de extração de características utilizado para treinamento e FR em todo o projeto foi a técnica PCA para reduzir a dimensão eliminando a redundância de informação nas imagens.

ETAPA III: Teste

Realização de testes dos algoritmos de classificação. A partir das imagens de testes escolhidas e normalizadas na etapa I, foi realizada a extração do vetor de características com o método PCA. Em seguida foi realizada a predição/classificação das amostras de teste de cada modelo treinado na etapa anterior e também utilizando os classificadores de distância: Euclidiana, Manhattan, Chebyshev e Mahalanobis. Por fim foi calculada a acurácia média, desvio padrão das acurácias e tempo de processamento da validação cruzada de cada um dos modelos obtidos.

ETAPA IV: Comparação de Resultados

A Figura a seguir é mostrado de uma forma geral, como é organizado o fluxo de testes para a análise comparativa dos modelos de classificadores. Inicialmente as amostras de face do banco Yale Face Database passa pelos processos de Detecção Facial, Equalização de Histograma e suas características principais são obtidas com a técnica PCA. As acurácias dos modelos com classificadores utilizando métricas de similaridade, DT, SVM e RNA são calculadas para cada fold de teste do processo de validação cruzada. Com as acurácias obtidas, 36 seleciona-se o melhor modelo de cada classificador utilizado. O melhor modelo é escolhido pelo que demonstra maior taxa de acurácia, caso de empate escolhe-se o que demonstrar menor desvio padrão.

Fluxo dos testes realizados para a comparação dos classificadores

RESULTADOS

Comparando os melhores modelos obtidos de cada configuração de HL e AF observados nos Quadros 11, 12, e 13, visualiza-se que o melhor modelo escolhido foi o com uma HL e AF Logística. O mesmo apresentou acurácia de 99,4 % com baixo desvio padrão e tempo de processamento mediano.

Considerações Finais

No experimento utilizando as métricas de similaridade como classificador, a métrica Euclidiana obteve 91,5% de acurácia com 1,51 de desvio e menor tempo de processamento dentre todas as métricas avaliadas. Porém o tempo de classificação aumenta com o tamanho do conjunto de treinamento utilizado. A simplicidade de implementação é um fator positivo.

Os classificadores de DT foram os que apresentaram pior desempenho, o melhor modelo de DT obteve 69,1% de acurácia com desvio de 23,7. Esse baixo desempenho pode ser justificado devido ao overfitting do conjunto de treinamento, pois a quantidade de amostras (11 por classe) foi insuficiente para uma boa generalização. As DTs com critério Gini demonstraram maiores valores de acurácia em relação aos com Entropia.

Observou-se que a utilização da técnica de análise de componentes principais como extrator de características foi muito eficiente. Por meio desta técnica, foi possível representar uma amostra utilizando menos de 1% da quantidade de atributos originais da mesma.

TCC: Comparativo de Algoritmos Clássicos de Aprendizado de Máquina em um Problema de Reconhecimento de Faces

Posts recentes

Comentários