Optimización de la Precisión en la Detección de Noticias Falsas de política en español mediante la Aplicación de Algoritmos de  Optimización en la Regresión Logística

Tene Castillo, Santiago Emanuel

Por favor, use este identificador para citar o enlazar este ítem: https://dspace.unl.edu.ec/jspui/handle/123456789/32452

Registro completo de metadatos

Campo DC	Valor	Lengua/Idioma
dc.contributor.advisor	Chamba Eras, Luis Antonio	-
dc.contributor.author	Tene Castillo, Santiago Emanuel	-
dc.date.accessioned	2025-04-23T22:43:01Z	-
dc.date.available	2025-04-23T22:43:01Z	-
dc.date.issued	2025-04-23	-
dc.identifier.uri	https://dspace.unl.edu.ec/jspui/handle/123456789/32452	-
dc.description	Logistic regression, while widely employed in text classification for fake news detection, shows suboptimal optimization practices in this specific domain. The limited systematic exploration of optimization algorithms—Gradient Descent (GD), Stochastic Gradient Descent (SGD), Mini-Batch Gradient Descent (MBGD), AdaGrad, Adam, and RMSProp—hinders the accurate assessment of their impact on classification metrics. This Curricular Integration Project (CIP) addressed this gap by applying these six algorithms to a logistic regression model for detecting Spanish-language political fake news, following the CRISP-ML methodology. The workflow included: 1) Data engineering to create a custom dataset, 2) Model optimization through hyperparameter tuning of the algorithms, and 3) Evaluation using confusion matrices and performance metrics (Sensitivity, Specificity, Precision, Accuracy, and F1-Score). Results revealed that the SGD-LR variant (Stochastic Gradient Descent) outperformed both the baseline non-optimized logistic regression model (73.7% vs. 80.3% precision) and other evaluated optimizers. This 6.6% improvement highlights how strategic algorithm selection directly enhances classification performance. The study not only validates SGD’s efficacy for this task but also sets a methodological precedent by integrating CRISP-ML into optimization workflows. These findings underscore the necessity of systematic experimentation with optimizers as a critical phase in developing misinformation detection systems, particularly for Spanish-language content where technical studies remain scarce.	es_ES
dc.description.abstract	La regresión logística, ampliamente utilizada en clasificación de textos para detectar noticias falsas, presenta limitaciones en su optimización dentro de este campo específico. La escasa exploración sistemática de algoritmos de optimización Gradiente Descendente (GD), Gradiente Descendente Estocástico (SGD), Gradiente Descendente por Mini-Lotes (MBGD), AdaGrad, Adam y RMSProp dificulta determinar su impacto real en la mejora de métricas de clasificación. Este trabajo de integración curricular abordó dicho problema aplicando estos seis algoritmos a un modelo de regresión logística para la detección de noticias políticas falsas en español, bajo la metodología CRISP-ML. El proceso incluyó: 1) Ingeniería de datos para generar un conjunto personalizado, 2) Optimización mediante ajuste de hiperparámetros de los algoritmos, y 3) Evaluación con matriz de confusión y métricas (Sensibilidad, Especificidad, Precisión, Exactitud y F1-Score). Los resultados demostraron que la variante SGD-LR (Gradiente Descendente Estocástico) superó significativamente al modelo base no optimizado (73.7% vs. 80.3% en precisión), así como a las demás técnicas evaluadas. Este incremento del 6.6% evidencia que la selección estratégica de algoritmos de optimización impacta directamente en el rendimiento de modelos de clasificación. El estudio no solo valida la eficacia del SGD para esta tarea específica, sino que establece un precedente metodológico al integrar CRISP-ML en el proceso de optimización de modelos. Estos hallazgos resaltan la necesidad de incluir fases sistemáticas de experimentación con optimizadores como paso crítico en el desarrollo de sistemas de detección de desinformación, particularmente para contenidos en español donde los estudios técnicos siguen siendo escasos.	es_ES
dc.format.extent	126 p.	es_ES
dc.language.iso	spa	es_ES
dc.publisher	Loja	es_ES
dc.rights	openAccess	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by-nc-sa/3.0/ec/	es_ES
dc.subject	MACHINE LEARNING	es_ES
dc.subject	CLASIFICACION DE TEXTO	es_ES
dc.subject	AJUSTAR HIPERPARAMETROS	es_ES
dc.title	Optimización de la Precisión en la Detección de Noticias Falsas de política en español mediante la Aplicación de Algoritmos de Optimización en la Regresión Logística	es_ES
dc.type	bachelorThesis	es_ES
Aparece en las colecciones:	Biblioteca FEIRNNR

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
SantiagoEmanuel_TeneCastillo.pdf		23,14 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro sencillo del ítem