Por favor, use este identificador para citar o enlazar este ítem:
https://dspace.unl.edu.ec/jspui/handle/123456789/26982
Título : | Modelo de lenguaje utilizando RoBERTuito, para identificar tweets con contenido de violencia política de género hacia las asambleístas electas en Ecuador para el periodo 2021-2025 |
Autor : | Cumbicus-Pineda, Oscar Miguel. Pezantes Urrego, Edmundo José_ |
Palabras clave : | <VIOLENCIA POLÍTICA DE GÉNERO> < KDT> < PROCESAMIENTO DE LENGUAJE NATURAL> < MODELO DE LENGUAJE> < ROBERTUITO>< TRANSFORMADOR>< PYTHON> |
Fecha de publicación : | 8-may-2023 |
Editorial : | Universidad Nacional de Loja |
Resumen : | En Ecuador, según el Instituto Nacional de Estadística y Censos, 65 de cada 100 mujeres han sufrido algún tipo de violencia en diferentes ámbitos a lo largo de su vida. Uno de estos ámbitos es la política, donde las mujeres enfrentan diversas formas de violencia, ya sea dentro de los partidos políticos o en otros espacios relacionados con la esfera política, familias, comunidades e inclusive en las redes sociales. Ante esta problemática, en el presente Trabajo de Titulación se plantea como objetivo general, construir un modelo de lenguaje utilizando RoBERTuito, para identificar tweets con contenido de violencia política de género hacia las asambleístas electas en Ecuador para el periodo 2021-2025. Se tomaron como referencia las fases de la metodología de Descubrimiento de Conocimiento en Textos (KDT), ya que los datos que se trabajó son textos, los cuales se procesaron en el lenguaje de programación Python, utilizando herramientas y librerías como Transformers de HuggingFace para llevar a cabo la tokenización de los textos y PyTorch para la ejecución y ajuste del modelo RoBERTuito, la interfaz de usuario se diseñó utilizando la plataforma Streamlit para permitir la interacción con el prototipo. Además, para levantar los servicios se utilizó Spaces de Hugging Face. El rendimiento del modelo se evaluó con el acuraccy de entrenamiento y el conjunto de datos de evaluación, obteniendo un modelo optimó para identificar contenido de violencia política de género. Se concluyó que es posible diseñar un prototipo funcional mediante el uso del modelo lenguaje creado a partir del modelo preentrenado RoBERTuito, ya que por medio de la evaluación realizada a las mujeres políticas validaron que las respuestas generadas por el prototipo resultaron apropiadas. Palabras claves: Violencia política de género, KDT, Procesamiento de Lenguaje Natural, Modelo de Lenguaje, RoBERTuito, Transformador, Python. |
Descripción : | In Ecuador, according to the National Institute of Statistics and Censuses, 65 out of 100 women have suffered some type of violence in different areas throughout their lives. One of these areas is politics, where women face various forms of violence, either within political parties or in other spaces related to the political sphere, families, communities and even in social networks. Facing this problem, in the present research work the general objective is to build a language model using RoBERTuito, to identify tweets with content of gender political violence towards elected female senators in Ecuador for the period 2021-2025. The phases of the Knowledge Discovery in Texts (KDT) methodology were taken as a reference, since the data that were worked are texts, which were processed in the Python programming language, using tools and libraries such as HuggingFace Transformers to carry out the tokenization of the texts and PyTorch for the execution and adjustment of the RoBERTuito model, the user interface was designed using the Streamlit platform to allow interaction with the prototype. In addition, Spaces by Hugging Face was used to lift the services. The performance of the model was evaluated with the training accuracy and the evaluation data set, obtaining an optimal model to identify gender political violence content. It was concluded that it is possible to design a functional prototype through the use of the language model created from the RoBERTuito pretrained model, since through the evaluation carried out on the women politicians they validated that the responses generated by the prototype were appropriate. Keywords: Political gender violence, KDT, Natural Language Processing, Language Model, RoBERTuito, Transformer, Python. |
URI : | https://dspace.unl.edu.ec/jspui/handle/123456789/26982 |
Aparece en las colecciones: | TRABAJOS DE TITULACION AEIRNNR |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
EdmundoJosé_PezantesUrrego-signed-signed.pdf | 4,67 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.