Por favor, use este identificador para citar o enlazar este ítem: https://dspace.unl.edu.ec/jspui/handle/123456789/24502
Título : Minería de datos para determinar los factores más influyentes en la ocurrencia de siniestros de tránsito en Ecuador en el año 2020.
Autor : Cumbicus Pineda, Oscar Miguel
Torres Quezada, Yulissa Stefania
Palabras clave : <MINERÍA DE DATOS>< METODOLOGÍA KDD>< ÁRBOLES DE DECISIÓN> <REDES NEURONALES>< REDES BAYESIANAS><SINIESTROS DE TRÁNSITO EN ECUADOR>
Fecha de publicación : 14-ene-2022
Editorial : Universidad Nacional de Loja
Resumen : La ocurrencia de siniestros de tránsito representa un problema de salud pública a nivel nacional y regional, ocasionando pérdidas humanas, además de que cada día va en aumento a nivel mundial, es por ello que resulta oportuno plantear un estudio que permita determinar cuáles son los factores que ocasionan la ocurrencia de siniestros de tránsito. El objetivo del presente Trabajo de Titulación (TT) es aplicar minería de datos para determinar los factores más influyentes en la ocurrencia de siniestros de tránsito en Ecuador en el año 2020, esto se llevó a cabo mediante cinco fases de la metodología de Descubrimiento de Conocimiento en Bases de Datos (KDD) constituida por: búsqueda de información, obtención de datos, depuración de la base de datos, aplicación de técnicas de minería de datos e interpretación y presentación de resultados, por lo cual, por medio del establecimiento de lineamientos para la búsqueda de información se obtuvo el conjunto de datos recolectado por la Agencia Nacional de Tránsito (ANT), en el que consta la recopilación de los partes policiales, diseñados y aprobados por cada uno de los entes de control, bajo los parámetros técnicos establecidos por la misma institución, que reposa en su sitio web oficial. Utilizando las herramientas OpenRefine y RStudio se realizó la depuración del conjunto de datos obtenido, evaluando y determinando las variables más útiles y relevantes para el objeto de estudio. Las herramientas de software empleadas para la aplicación de los algoritmos de minería de datos fueron SPSS Statistics y Weka. Se aplicaron siete técnicas predictivas de minería de datos: CHAID, CHAID Exhaustivo, CRT, Perceptrón Multicapa, Función de Base Radial, Naive Bayes y BayesNet. La evaluación de estos algoritmos se realizó comparando los resultados obtenidos por cada uno, en relación a métricas de rendimiento con respecto a porcentajes de clasificación correcta de las instancias y de precisión. El algoritmo CHAID Exhaustivo fue el que obtuvo los mejores resultados con un porcentaje de clasificación correcta del 58,38% y 44,60% de precisión, con el cual se identificó los patrones más importantes en los datos y se evaluó las posibles asociaciones entre las variables recogidas. Finalmente, se determinó que el factor humano es el factor más influyente con una probabilidad de ocurrencia del 69,64%. Palabras clave: Minería de datos, metodología KDD, Árboles de Decisión, Redes Neuronales, Redes Bayesianas, Siniestros de Tránsito en Ecuador.
Descripción : The occurrence of traffic accidents represents a public health problem at national and regional level, causing human losses, in addition to the fact that every day is increasing worldwide, which is why it is appropriate to propose a study to determine what are the factors that cause the occurrence of traffic accidents. The objective of this thesis is to apply data mining to determine the most influential factors in the occurrence of traffic accidents in Ecuador in the year 2020, this was carried out through five phases of the methodology of Knowledge Discovery in Databases (KDD) consisting of: search for information, data collection, database cleaning, application of data mining techniques and interpretation and presentation of results, whereby, through the establishment of guidelines for the search for information, the set of data collected by the National Transit Agency (ANT) was obtained, which includes the collection of police reports, designed and approved by each of the control entities, under the technical parameters established by the same institution, which is available on its official website. Using the OpenRefine and RStudio tools, the obtained data set was debugged, evaluating and determining the most useful and relevant variables for the object of study. The software tools used for the application of the data mining algorithms were SPSS Statistics and Weka. Seven predictive data mining techniques were applied: CHAID, Exhaustive CHAID, CRT, Multilayer Perceptron, Radial Basis Function, Naive Bayes and BayesNet. The evaluation of these algorithms was performed by comparing the results obtained by each one, in relation to performance metrics with respect to percentages of correct classification of instances and accuracy. The CHAID Exhaustive algorithm was the one that obtained the best results with a percentage of correct classification of 58.38% and 44.60% accuracy, with which the most important patterns in the data were identified and the possible associations between the variables collected were evaluated. Finally, the human factor was determined to be the most influential factor with a probability of occurrence of 69.64%. Keywords: Data mining, KDD methodology, Decision Trees, Neural Networks, Bayesian Networks, Traffic Accidents in Ecuador.
URI : https://dspace.unl.edu.ec/jspui/handle/123456789/24502
Aparece en las colecciones: TRABAJOS DE TITULACION AEIRNNR

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
YulissaStefania_TorresQuezada.pdf5,63 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.