Por favor, use este identificador para citar o enlazar este ítem: https://dspace.unl.edu.ec/jspui/handle/123456789/23796
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorCumbicus Pineda, Oscar Miguel-
dc.contributor.authorRomero Vega, Raúl Ramiro-
dc.date.accessioned2021-01-28T02:44:02Z-
dc.date.available2021-01-28T02:44:02Z-
dc.date.issued2021-01-27-
dc.identifier.urihttps://dspace.unl.edu.ec/jspui/handle/123456789/23796-
dc.descriptionEcuador registers a great number of Venezuelan immigrants, confirmed by the International Organization of Migration and indicates that it is the third country with the greatest number of Venezuelan immigrants, and that these are part of the countries that have presented the worst social indicators, showing themselves as ethnic and racial discrimination, being these indicators the basis of xenophobic feelings among the countries of the region, this led to the need to determine their existence in the population to prevent hate crimes from being committed. The purpose of present final project (TT) was to determine the existence of xenophobic content in a group of tweets collected from Venezuelan immigrants in Ecuador. This was done through the phases of the Knowledge Discovery in Text (KDT) methodology, which were carried out in Python, with the most important libraries such as NLTK, Imbalanced-Learn and Scikit-Learn, as well as the application of Machine Translation for the translation of the tweets. Xenophobia being a complex feeling to identify through natural language processing, another set of tweets had to be used which had already been classified by crowdsourcing, that is, those tweets were classified by humans in a collaborative way to detect hate speech and offensive language, giving as a result a model already trained which was improved by fine-tuning, being this the base for the training of the algorithms used in the present TT, during the fine-tuning it was determined to use the Synthetic Minority Oversampling Technique (SMOTE) for the creation of synthetic data in the minority classes, this technique also allowed to balance the classes of the set of tweets of interest where a new classification divided in three feelings was obtained: xenophobic, offensive and others. To obtain predictions, three supervised classification algorithms were executed: Support Vector Machine (SVM), Naïve Bayes and Logistic Regression, with SVM being the algorithm with the best performance with an F1 score of 94%. Finally, it was found that 5.76% of the collected tweets contain xenophobic feelings, 31.23% offensive feelings and the remaining 63% contain other feelings that are directed towards Venezuelan immigrants in Ecuador. Keywords: Natural Language Processing, Sentiment Analysis, Python, Xenophobia, Venezuelan Immigrants in Ecuador.es_ES
dc.description.abstractEcuador registra un gran número de inmigrantes venezolanos, lo confirma la Organización Internacional de las Migraciones e indica que es el tercer país con el mayor número de inmigrantes venezolanos, y que estos son parte de los países que han presentado los peores indicadores sociales, mostrándose como discriminación étnica y racial, siendo estos indicadores la base de los sentimientos xenófobos entre los países de la región, esto conllevó a la necesidad de determinar su existencia en la población para prevenir que se cometan delitos causados por el odio. El presente Trabajo de Titulación (TT) tuvo el propósito de determinar la existencia de contenido xenófobo en un conjunto de tuits, recolectados entorno a los inmigrantes venezolanos en Ecuador, se lo llevó a cabo mediante las fases de la metodología para el Descubrimiento de Conocimiento en Texto (KDT), las mismas que fueron realizadas en Python, con las librerías más destacadas como NLTK, Imbalanced-Learn y Scikit-Learn, así como la aplicación de Machine Translation para la traducción de los tuits. La xenofobia por ser un sentimiento complejo de identificar a través del procesamiento de lenguaje natural, se tuvo que utilizar otro conjunto de tuits que ya había sido clasificado mediante crowdsourcing, es decir, dichos tuits se clasificaron por humanos de forma colaborativa para detectar discursos de odio y lenguaje ofensivo, dando como salida un modelo ya entrenado que se mejoró mediante fine-tuning (ajuste fino), siendo este la base para el entrenamiento de los algoritmos utilizados en el presente TT, durante el fine-tuning se determinó emplear la Técnica de Sobremuestreo de Minorías Sintéticas (SMOTE) para la creación de datos sintéticos en las clases minoritarias, esta técnica también permitió equilibrar las clases del conjunto de tuits de interés en donde se obtuvo una nueva clasificación dividida en tres sentimientos: xenófobos, ofensivos y otros. Para la obtención de predicciones se ejecutaron tres algoritmos de clasificación supervisados: Máquinas de Soporte Vectorial (SVM), Naive Bayes y Regresión Logística, siendo SVM el algoritmo con mejor desempeño con una puntuación F1 del 94%. Finalmente, se encontró que el 5,76% de los tuits recolectados contienen sentimientos xenófobos, el 31,23% de sentimientos ofensivos y el 63% de los tuits restantes contienen otros sentimientos que van dirigidos hacia los inmigrantes venezolanos en el Ecuador. Palabras clave: Procesamiento de Lenguaje Natural, Análisis de sentimientos, Python, Xenofobia, Inmigrantes Venezolanos en Ecuador.es_ES
dc.format.extent181 P.es_ES
dc.language.isospaes_ES
dc.publisherUniversidad Nacional de Loja.es_ES
dc.rightsopenAccesses_ES
dc.subject<DESCRIMINACIÓN RACIAL><SENTIMIENTOS XENÓFOBO>< INMIGRANTES VENEZOLANOS EN ECUADOR> <XENOFOBIA><LENGUAJE OFENSIVO >es_ES
dc.titleAnálisis de sentimientos en twitter para descubrir contenido xenófobo hacia los inmigrantes venezolanos en Ecuador.es_ES
dc.typebachelorThesises_ES
Aparece en las colecciones: TRABAJOS DE TITULACION AEIRNNR

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
RaulRamiro_RomeroVega.pdf14,57 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.