Título: | Comparação de Modelos de Aprendizado de Máquina para Classificação de Plantas quanto ao seu Mecanismo de Resistência à Presença de Alumínio no Solo |
Autor(es): | Freire, Alessandra Maia |
Orientador(es): | Ferreira, Renan Utida |
Coorientador(es): | Silva, Luciano Paulino da |
Assunto: | Aprendizado de máquina Imagens - classificação |
Data de apresentação: | 11-Mai-2022 |
Data de publicação: | 15-Fev-2023 |
Referência: | FREIRE, Alessandra Maia. Comparação de Modelos de Aprendizado de Máquina para Classificação de Plantas quanto ao seu Mecanismo de Resistência à Presença de Alumínio no Solo. 2022. 113 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Eletrônica) — Universidade de Brasília, Brasília, 2022. |
Resumo: | A disponibilidade de alumínio solúvel em solos ácidos é um grande inibidor do crescimento das plantas, sendo um dos principais limitadores da produtividade agrícola nesses solos. Em contrapartida, na flora do Cerrado brasileiro são encontradas diversas espécies de plantas resistentes à presença desse metal no solo. Os mecanismos de resistência ao alumínio são divididos em duas categorias: a das plantas excludentes, que impedem a entrada do metal nas suas partes aéreas, e a das plantas acumuladoras, que incorporam o metal dentro de si. Esse projeto visa realizar uma comparação entre determinadas arquiteturas de aprendizado profundo de máquina para classificação de imagens microscópicas de folhas de plantas específicas, quanto à presença ou ausência de alumínio nas folhas das plantas. Para isso, foi utilizado um banco de imagens privado, desenvolvido pelo Laboratório de Nanobiotecnologia da Embrapa Recursos Genéticos e Biotecnologia,de aproximadamente 1040 imagens de folhas de plantas do Cerrado resistentes à presença de alumínio no solo, caracterizadas como acumuladoras ou excludentes.Para os treinos, foram utilizadas as arquiteturas Resnet-RS-152, Resnet-RS-101 e Resnet-RS-50, todas testadas com modelos com e sem o uso de parâmetros pré-treinados. Todas as partes de programação, treinamento e testes das arquiteturas foram realizadas no ambiente computacional Kaggle, utilizando o Pytorch como principal biblioteca de implementação desse processo. Foram realizadas duas classificações distintas no mesmo banco de imagens: a classificação binária das plantas das imagens em acumuladoras ou excludentes de alumínio e a classificação em famílias de plantas, com 12 famílias no total.A implementação das redes foi feita e validada utilizando a função de perda de entropia cruzada e por métricas de desempenho k-fold, com 10 folds. Nos resultados, puderam ser observadas as diferenças de acurácias obtidas entre os modelos com parâmetros pré-treinados e os modelos sem esse pré-treino para ambos conjuntos de classificações. Para a classificação binária, o modelo sem pré-treino ResNet-RS-152 obteve uma acurácia total de 89,13% e desvio padrão de±1,14%enquanto o modelo de ResNet-RS-152 pré-treinado alcançou 98,37% de acurácia, com desvio padrão de±0,62%.Na classificação das imagens em famílias de plantas, o modelo sem pré-treino que alcançou melhor resultado foi o da ResNet-RS-101, com 88,65% de acurácia e desvio padrão de±1,04%enquanto o modelo pré-treinado com melhores resultados foi o da ResNet-RS-50,com 98,17% de acurácia total e desvio padrão de±0,97%. Neste trabalho também foram avaliados os resultados das métricas de desempenho precisão, sensibilidade e f1-score para cada classe de ambos conjuntos, com o objetivo de analisar mais profundamente a qualidade de classificação dos modelos e identificar possíveis dificuldades ou irregularidades nas classificações. Ao final, são gerados gráficos juntamente com as tabelas de resultados para uma melhor visualização desses resultados e são avaliadas futuros incrementos e implementações para o projeto.Os resultados mostraram que, para a máquina, é possível classificar as imagens microscópicas de plantas em agrupamentos de acordo com suas características de resistência ao alumínio, como acumuladoras e excludentes. É mostrada também a possibilidade de classificação das imagens do banco de acordo com as famílias às quais as plantas pertencem, mesmo havendo mais de uma espécie por família no banco de dados. Como para este trabalho haviam apenas duas famílias com espécies acumuladoras e dez famílias com espécies excludentes, não se sabe se as características encontradas pela máquina são referentes à resistência ao alumínio ou se são características que as famílias das plantas do banco de dados possuem em comum. Com a expansão do banco de dados, acrescentando mais espécies de plantas de ambas classificações, será possível tirar mais conclusões quanto à esse fato. Mesmo assim, o trabalho apresentado pode auxiliar no desenvolvimento de uma grande diversidade de pesquisas onde a característica de acumulação ou exclusão de metal em plantas é relevante. Tais quais podem incluir desde a avaliação de plantas comestíveis que, por acumularem determinados metais podem causar problemas de saúde ao ser humano (BOJÓRQUEZ-QUINTAL et al., 2017; GUERRA et al., 2012)até pesquisas relacionadas à fitomineração, que é a extração de metais pesados do solo por determinados grupos de plantas acumuladoras, favorecendo também a remediação desses solos (fitorremediação) (AKINBILE; MAKHUBELA; AMBUSHE, 2021; ASHRAF et al.,2019; SHEORAN; SHEORAN; POONIA, 2009). |
Abstract: | Soluble aluminum availability in acid soils is a major inhibitor of plant growth, bein gone of the main agricultural productivity limiting factor in these type of soils. In the brazilian Cerrado flora, several species of plants have developed resistance mechanisms toAl under those conditions. These resistance mechanisms are divided into two categories:plants that are able to prevent the aluminum to entry in its aerial parts have the excluding mechanism, while those that are able to incorporate Al within them are called accumulators. This project aims to make a comparison between certain deep machine learning architectures for classifying microscopic images of specific plant leaves, for the presence or absence of aluminum in the leaves of the plants. For this purpose, it was used an image database developed in the Nanobiotechnology Laboratory of Embrapa Genetic Resources and Technology. This database contains approximately 1040 images of leaves of cerrado plants which are resistant to the presence of alluminum in the soil, classified as as alluminum accumulators or excluders. For training, the ResnetRS-152, ResnetRS-101 and ResnetRS-50 architectures were used,all tested with and without pre-trained parameters. The programming, training and test-ing steps of the models implementation were carried out in the Kaggle computing envi-ronment, using Pytorch as the main implementation library for this process. The image database was duplicated and organized to be used in two groups of classifications: a bi-nary classification, in which the plant from the image will be classified as an aluminum accumulator or excluder and a multiclass classification, in which the images are classi-fied according to the plants families, with 12 classes in total. The implementation of thenetworks was done and validated using the cross entropy loss function and the k-fold performance metrics, with 10 folds. In the results, it was possible to observe the difference between the accuracies obtained from the models with pre-trained parameters and the ones without pre-training for both classification groups. For the binary classification, the model without pre-training, ResNet-Rs-152, obtained a total accuracy of 89,13% and a standard deviation of±1.14% while the same model with pre-trained parameters reached 98,37% accuracy, with a standard deviation of±0,62%. For the multiclass classification into plant families, the model with-out pre-training that achieved the highest result was the ResNet-RS-101, with 88,65% of accuracy and standard deviation of±1.04%while the pre-trained model with the best results was the ResNet-RS-50, with 98,17% total accuracy and a standard deviation of±0,97%.
In this work, the results of performance metrics precision, sensitivity and f1-score for each class of both groups are also evaluated, with the objective of analyzing more deeply the classification quality of the models and identifying possible difficulties or irregularities in the classifications. Finally, graphs are used along with the tables with the resulting values for a better visualization of these values. At the end, future increments and implementations for the project are evaluated. The results showed that, for a machine learning program, it is possible to classify the microscopic images of plants according to their aluminum resistance features, such as accumulators and excluders. The possibility of image classification according to the families to which the plants belong is also shown, even for cases in the database where there is more than one species per family. Because there were only two families with accumula-tor species and ten families with excluder species in the database, it is not known if the features found by the machine are related to aluminum resistance or if they are charac-teristics that the families of plants in the database have in common. With the expansion of the database, adding more species of plants of both classifications, it would be possible to draw more conclusions regarding this fact. Even so, the presented work could aid the development of a great diversity of researches where the feature of metal accumulation or exclusion in plants is relevant. Such range of researches could include from the evaluation of edible plants that, by accumulating certain metals, can cause health problems to humans (BOJÓRQUEZ-QUINTAL et al., 2017; GUERRA et al., 2012) to researches related to phytomining, which is the extraction of heavy metals from the soil by certain groups of accumulator plants, also favoring the remediation of these soils (phytoremedia-tion) (AKINBILE; MAKHUBELA; AMBUSHE, 2021; ASHRAF et al., 2019; SHEORAN;SHEORAN; POONIA, 2009). |
Informações adicionais: | Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Faculdade UnB Gama, 2022. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta. |
Aparece na Coleção: | Engenharia Eletrônica
|
Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.