Resumo: | As redes neurais convolucionais pertencem a um subcampo da inteligência artificial e
possuem aplicação em diversas áreas, incluindo no imageamento médico. Os tumores cerebrais podem ser categorizados como primários, originados das células do sistema nervoso, ou
secundários, também conhecidos como metastáticos, quando se originam em outras partes
do corpo e se estendem para o sistema nervoso. Diversos métodos de diagnóstico são empregados para identificar tumores cerebrais, com destaque para abordagens não invasivas,
como a ressonância magnética (MRI), que fornecem imagens detalhadas do interior do corpo
humano.
Uma ferramenta na análise de imagens de MRI é a utilização de redes neurais convolucionais. Essas redes apresentam a capacidade de identificar tumores e classificá-los por
meio de t´técnicas de aprendizado de máquina. Essa abordagem simplifica a interpretação
de grandes volumes de dados provenientes das imagens médicas e demonstra desempenho
comparável ao dos médicos, contribuindo para o pré-diagnóstico.
Este estudo tem como objetivo comparar arquiteturas de redes neurais profundas e
rasas, com o intuito de auxiliar no diagnóstico de tumores cerebrais. Para essa análise, foi
utilizado o modelo VGG-16 como representante da arquitetura profunda e um modelo com
3 camadas convolucionais e 1 densa como representante da arquitetura rasa. A avaliação
do desempenho de ambos os modelos será realizada através da observação da acurácia e da
função de perda durante o treinamento, tanto no conjunto de validação quanto no conjunto
de teste. Métricas como acurácia, precisão, recall e F1-score serão calculadas para o conjunto
de teste, a fim de obter uma compreensão mais completa da performance de cada modelo
na tarefa de classificação de tumores cerebrais.
Nos experimentos com a arquitetura rasa, foi realizado uma busca pelos melhores parâmetros
ajustando hiper parâmetros como número de épocas, número de camadas, número de filtros,
tamanho dos filtros e tipos de otimizadores. Para evitar o overfitting, foi empregado técnicas
como dropout e data augmentation, que aumentam a diversidade dos dados de treinamento.
Já na arquitetura profunda VGG-16, foi utilizado a técnica de transfer learning. Congelando as camadas convolucionais, que já aprenderam a extrair características relevantes
de imagens a partir do conjunto de dados ImageNet. As três ´ultimas camadas convolucionais foram descongeladas para que seus pesos fossem atualizados durante o treinamento,
permitindo a adaptação da rede `a tarefa específica de classificação de tumores cerebrais.
Adicionalmente, foi realizado uma comparação da relação sinal-ruído (SNR) nas imagens, variando o valor de SNR de 3 dB até 30 dB, em incrementos de 3 dB. Essa análise nos
permitiu avaliar o impacto do ruído no desempenho dos modelos. Com base nos resultados obtidos, as redes obtiveram resultados similares com uma
vantagem da rede profunda. A rede rasa obteve 84% de acurácia, 61% de F1-Score, 66%
de recall e 75% de precisão e a rede profunda com 86% de acurácia, 68% de F1-Score, 71%
de recall e 80% de precisão. Um ajuste mais fino da rede rasa pode obter um desempenho
similar sendo necessário menos recursos computacionais, maior controle dos parâmetros
ajustáveis e menor tempo de execução. Em relação aos experimentos com ruídos adicionado
ambas as arquiteturas obtiveram perda de desempenho, a rasa reduziu 21% e a profunda
16% mostrando que a importância de se ter um conjunto de dados de qualidade e podem
afetar no desempenho da rede. |