Por favor, use este identificador para citar o enlazar este ítem:
https://dspace.unl.edu.ec/jspui/handle/123456789/11395
Título : | Desarrollo de un sistema inteligente para la clasificación de documentos ya digitalizados aplicando redes neuronales supervisadas. |
Autor : | Paz Arias, Henry Patricio Jiménez Ochoa, Doris Yadira |
Palabras clave : | <INTELIGENCIA ARTIFICIAL> <WEKA Y REDES NEURONALES> <APLICACIONES WEB> <CATEGORIZACIÓN DE DOCUMENTOS> <REDES MULTICAPAS> <SISTEMAS EXPERTOS Y EL CONOCIMIENTO> |
Fecha de publicación : | 2016 |
Resumen : | En este trabajo se propone un modelo de Redes Neuronales Artificiales con aprendizaje supervisado: Perceptrón Multicapa utilizando como criterio de clasificación el área disciplinar, de esta manera se propone el desarrollo de una nueva aplicación web que utilizando técnicas de sistemas inteligentes implemente un sistema de clasificación de documentos de tipo supervisado para agrupar los documentos por categorías según corresponda. El criterio para realizar la clasificación de documentos está basado por 14 categorías de esta manera el sistema formará grupos de documentos afines a la categoría correspondiente, además se puede contrastar sus resultados con el ingreso de 100 documentos de la biblioteca del Área de la Energía las Industrias y los Recursos no Renovables de la carrera de Ingeniería en Sistemas. EL dominio de esta aplicación es utilizar un corpus de 5000 documentos del repositorio de la Universidad Autónoma de la ciudad de México(Red de Revistas Científicas de América Latina y el Caribe ,España y Portugal ) en distintos formatos(Microsoft Word, PDF, texto plato ).En el sistema se han implementado analizadores que extraen meta-datos(título, autor, palabras claves, descripción, fecha entre otros ) así mismo se ha desarrollado una variedad de algoritmos de aprendizaje supervisados aplicados a la categorización de documentos, del mismo modo se desarrolló un lematizador lo cual ayuda al recall(reduce la palabra a su raíz ) a los documentos de consulta y eliminar los artículos. En particular, en los experimentos de nuestro dominio el lenguaje R con su paquete RWEKA ha demostrado tener buenas propiedades para experimentar y demostrar resultados de la asertividad y error de la clasificación de los documentos. El objetivo final es construir una aplicación web para categorizar documentos de forma automática de acuerdo a las categorías que se planteó. |
Descripción : | A model of artificial neural networks with supervised learning is proposed in this research work, Multilayer Perceptron using criterion for classifying the area as discipline, thus proposes the development of a new web application that using techniques of intelligent systems implement a type supervised document classification system to group documents into categories as appropriate. The criteria for classifying documents is based for 14 categories in this way system formed groups of related documents to the corresponding category, also their results can be contrasted with the income of 100 documents from the library of the energy Area industries and non-renewable resources of the engineering systems. The domain of this application is to use a body of 5000 documents in the repository of the University of the city of Mexico(Network of scientific journals of Latin America and the Caribbean, Spain and Portugal) in different formats(Microsoft Word, PDF, text plate).The system have implemented scanners that extract metadata (title, author, keywords, description, date among others), has also developed a variety of supervised learning algorithms applied to the categorization of documents, in the same way a stemmer was developed which helps the recall (reduces the word to its root), to consultation documents and delete articles. In particular, in the experiments of our domain language R with your package RWEKA has shown good properties to experiment and demonstrate results of the assertion and error of classification of the documents. Our ultimate goal is to build a web application to categorize documents automatically, this system allows any user to upload books and automatically classifies them according to the existing categories. In particular, in the experiments of our domain language R with your package RWEKA has shown good properties to experiment and demonstrate results of the assertion and error of classification of the documents |
URI : | http://dspace.unl.edu.ec/jspui/handle/123456789/11395 |
Aparece en las colecciones: | TRABAJOS DE TITULACION AEIRNNR |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
Jiménez Ochoa, Doris Yadira.pdf | 3,88 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.