Por favor, use este identificador para citar o enlazar este ítem:
https://dspace.unl.edu.ec/jspui/handle/123456789/30539
Título : | Fitting of the “vit-base-patch16-224-in21k” model for pneumonia classification in chest radiographic images using transformer vision networks. |
Otros títulos : | Ajuste del modelo “vitbase-patch16-224-in21k” para la clasificación de neumonía en imágenes radiográficas de tórax utilizando redes de visión transformer. |
Autor : | Cumbicus Pineda, Oscar Miguel Paccha Rojas, Eduardo José |
Palabras clave : | VISIÓN TRANSFORMER VISIÓN POR COMPUTADOR NEUMONÍA VITBASE-PATCH16-224-IN21K CRISP-ML(Q) RADIOGRAFÍA DE TÓRAX |
Fecha de publicación : | 9-sep-2024 |
Editorial : | Universidad Nacional de Loja |
Resumen : | La detección de neumonía es una tarea de alto impacto dentro del campo médico en general, y el análisis de la enfermedad mediante imágenes radiográficas se establece como prioridad para un diagnóstico oportuno ante la afección médica. En este contexto, la investigación planteó como objetivo principal utilizar las redes de vision transformers (ViT) para la clasificación de neumonía en imágenes radiograficas de tórax. Con el propósito de cumplir el objetivo se realizó un ajuste fino al modelo “vitbase-patch16-224-in21k” utilizando como marco de trabajo la metodología CRISP-ML(Q). El marco de trabajo ayudó al desarrollo de la investigación mediante 3 fases principales: Ingeniería de datos, donde se realizó la elección del conjunto de imágenes y en posteriormente se realizó el balanceo de las clases. La fase de ingeniería de modelos, ayudó al ajuste del modelo pre entrenado para la necesidad de la clasificación de neumonía según las clases del conjunto de datos “PNEUMONIA” y “NORMAL”. La tercera y última fase ayudó a la evaluación del modelo ajustado y que los resultados de la evaluación sean analizados en base a la métrica de la sensibilidad. Tras la finalización de las fases, se logró obtener los resultados de la investigación, que son: El modelo ajustado con un porcentaje del 99.34% de precisión en la clasificación de neumonía, y el análisis de clasificación basado en la métrica de sensibilidad, dónde el modelo ajustado obtuvo un porcentaje del 99.88% para clasificación de la clase “PNEUMONÍA” y un 98.76% de sensibilidad para la clasificación de la clase “NORMAL” en la evaluación. Adicionalmente se utilizó la técnica de Zero-Shot donde se obtuvo un resultado del 96.67% en la precisión del modelo y una sensibilidad total de 93.33% en la clasificación de neumonía. Finalmente se concluye que la solución propuesta para el ajuste del modelo es eficaz para la clasificación de neumonía, dados los altos porcentajes obtenidos en las métricas de evaluación. Por lo tanto, se establece como un aporte valioso en el estudio del uso de las redes ViT para la clasificación eficiente de enfermedades en imágenes. Palabras clave: Visión transformer, Visión por computador, Neumonía, vitbase-patch16-224-in21k, CRISP-ML(Q), radiografía de tórax. |
Descripción : | Detecting pneumonia is a high-impact task in the medical sector in general, and illness analysis utilizing radiographic images has been designated as a priority for rapid diagnosis of the medical condition. In this context, the primary goal of the research was to use vision transformer (ViT) networks to classify pneumonia in chest radiography pictures. To achieve this goal, the "vit base-patch16-224-in21k" model was fine-tuned, utilizing the CRISP-ML (Q) methodology as a foundation of reference. The framework facilitated the advancement of the study in three primary stages: data engineering, which involved choosing the chest radiography image collection, and class balancing, which was then completed. The pre-trained model was refined during the model engineering phase to satisfy the requirements of pneumonia classification based on the classes of the "PNEUMONIA" and "NORMAL" datasets. The last stage helped assess the refined model, and the sensitivity metric was used to examine the assessment findings. Upon completion of these phases, the research achieved results showing that the fine-tuned model reached 99.34% accuracy in pneumonia classification. The classification analysis, based on the sensitivity metric, showed that the fine-tuned model obtained a 99.88% sensitivity for the "PNEUMONIA" class and a 98.76% sensitivity for the "NORMAL" class. Additionally, the zero-shot technique was used, yielding a 96.67% model accuracy and an overall sensitivity of 93.33% in pneumonia classification. Finally, it is concluded that the proposed solution for model fitting is effective for pneumonia classification, given the high percentages obtained in the evaluation metrics. Furthermore, it is established as a valuable contribution to the study of the use of ViT networks for the efficient classification of diseases in images. Keywords: Vision transformer, vision computer, Pneumonía, vitbase-patch16-224- in21k, CRISP-ML(Q), Chest X-Ray. |
URI : | https://dspace.unl.edu.ec/jspui/handle/123456789/30539 |
Aparece en las colecciones: | TRABAJOS DE TITULACION AEIRNNR |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
EduardoJose_PacchaRojas.pdf | 4,19 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.