Modelo de Subtitulación en Español de Imágenes con Gráficos Estadísticos de Tipo Pastel y Barras ajustando el modelo preentrenado UniChart

Sefla Macas, Jonathan David

Por favor, use este identificador para citar o enlazar este ítem: https://dspace.unl.edu.ec/jspui/handle/123456789/30600

Título :	Modelo de Subtitulación en Español de Imágenes con Gráficos Estadísticos de Tipo Pastel y Barras ajustando el modelo preentrenado UniChart
Otros títulos :	Spanish Image Captioning Model with Statistical Pie and Bar Graphs fitting the pre-trained UniChart model
Autor :	Cumbicus Pineda, Oscar Miguel Sefla Macas, Jonathan David
Palabras clave :	SUBTITULADO DE GRÁFICOS CRISP-ML (Q) UNICHART ROUGE
Fecha de publicación :	18-sep-2024
Editorial :	Universidad Nacional de Loja
Resumen :	La subtitulación de gráficos tiene como propósito facilitar la comprensión de la información presente en gráficos, mediante descripciones que explican o describen los datos de manera textual, permitiendo así el acceso a dicha información tanto para personas con discapacidad visual como para aquellos que prefieren el texto. El presente Trabajo de Integración Curricular (TIC) tuvo como objetivo el ajuste del modelo preeentrenado UniChart para generar subtítulos en español de imágenes con gráficos estadísticos, únicamente de tipo pastel y barras, tomando como referencia las fases del modelo de procesos CRISP-ML (Q), en las que se incluyó: recopilación de datos, ingeniería de datos, ingeniería de modelos y la evaluación del modelo. En la primera fase se recolectaron datos de dos fuentes, Google y el Repositorio Digital de la Universidad Nacional de Loja, para crear un conjunto de datos diverso y representativo. En la segunda fase se llevó a cabo la ingeniería de datos, creando un conjunto de datos personalizado con pares de imagen/texto. En la tercera fase se ajustó el modelo UniChart, y en la última fase se evaluó la capacidad del modelo ajustado final en la generación de subtítulos mediante la métrica ROUGE, obteniendo puntuaciones de 0.8709 en ROUGE-1, 0.7847 en ROUGE-2, 0.8465 en ROUGE-L y 0.8506 en ROUGE-Lsum. Además, se realizó una evaluación A/B adaptada para comprobar su capacidad en la generación de subtítulos, identificando aspectos importantes al generalizar nuevos datos, como son las limitaciones. Los resultados mostraron que la creación de un conjunto de datos personalizado en español basado en una estructura predefinida permitió obtener subtítulos adecuados para imágenes con gráficos estadísticos. Así mismo, se demostró que se pueden ajustar modelos preentrenados en inglés para la subtitulación en español, lo que proporciona una herramienta útil para la inclusión y accesibilidad de datos estadísticos. Palabras Clave: Subtitulado de gráficos, CRISP-ML (Q), UniChart, ROUGE.
Descripción :	The purpose of Chart Captioning is to facilitate the understanding of the information present in graphics, using descriptions that explain or describe the data in a textual manner, thus allowing access to such information both for people with visual disabilities and for those who prefer text. The objective of this Curricular Integration Work (TIC) was to adjust the pre-trained UniChart model to generate Spanish subtitles of images with statistical graphs, only pie and bar charts, taking as a reference the phases of the CRISP-ML (Q) process model, which included: data collection, data engineering, model engineering, and model evaluation. In the first phase, data were collected from two sources, Google and the Digital Repository of the National University of Loja, to create a diverse and representative dataset. In the second phase, data engineering was carried out, creating a customized dataset with image and text pairs. The third phase involved making adjustments to the UniChart model. The final phase involved using the ROUGE metric to assess the final adjusted model's ability to generate subtitles; results showed scores of 0.8709 in ROUGE-1, 0.7847 in ROUGE-2, 0.8465 in ROUGE-L, and 0.8506 in ROUGE-Lsum. In addition, an adapted A/B test was performed to test its capability in subtitle generation, identifying important aspects when generalizing new data, such as limitations. The results showed that the creation of a customized dataset in Spanish based on a predefined structure allowed for obtaining suitable captions for images with statistical graphics. Likewise, it was demonstrated that pre-trained models in English can be adjusted for Spanish subtitling, providing a useful tool for the inclusion and accessibility of statistical data. Keywords: Graphics Captioning, CRISP-ML (Q), UniChar, ROUGE.
URI :	https://dspace.unl.edu.ec/jspui/handle/123456789/30600
Aparece en las colecciones:	TRABAJOS DE TITULACION AEIRNNR

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
JonathanDavid_ SeflaMacas.pdf		6,68 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro Dublin Core completo del ítem