Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.ugto.mx/handle/20.500.12059/12453
Título: Sistema automático de clasificación de la polaridad de opiniones de películas de largometraje
Autor: JESÚS ANDRÉS SIERRA RANGEL
ID del Autor: info:eu-repo/dai/mx/cvu/1165067
Contributor: RAFAEL GUZMAN CABRERA
Contributor's IDs: info:eu-repo/dai/mx/cvu/88306
Resumen: El crecimiento del big data en el internet es una de las áreas de oportunidad que las empresas buscan aprovechar para poder obtener una retroalimentación de los usuarios quienes prefieren dejar una opinión o reseña a realizar una encuesta, es por ello por lo que los últimos años el reto para las compañías es analizar esa información para obtener datos específicos que les brinden una ventaja frente a sus competidores, para lo cual el aprendizaje automático representa una herramienta sumamente útil. En este trabajo de tesis se desarrolló un sistema que contiene 5 modelos de aprendizaje: naive bayes (NB), máquinas de soporte vectorial (MSV), k-vecinos más cercanos(K-VC), regresión logística (RL) y bosque aleatorio (BA), los cuales son sometidos a procesos sin y con etapas de pre-procesamiento para poder determinar las mejores opciones para cada uno. El resultado sorprende por el alto grado de exactitud que se tiene, siendo NB el mejor, logrando un 97.5% de exactitud. Con solo 400 opiniones y se descubrió que es mejor no tener pre-procesamiento para obtener un mejor rendimiento, es de destacar en la búsqueda del estado del arte no se encontró un modelo que pudiera alcanzar una exactitud del 97.5%. Con los demás modelos se logró tener incrementos del 12% en exactitud y precisión con eliminación de acentos y eliminación de palabras de paro para máquinas de soporte vectorial, incremento del 14% para la exactitud y precisión usando eliminación de palabras de paro para bosque aleatorio, en K-Vecinos más cercano se logró un incremento del 8% con eliminación de palabras de paro y regresión logística logró alcanzar una exactitud del 0.925 con eliminación de acentos y eliminación de palabras de paro.
Fecha de publicación: 2023
Editorial: Universidad de Guanajuato
Licencia: http://creativecommons.org/licenses/by-nc-nd/4.0
URI: http://repositorio.ugto.mx/handle/20.500.12059/12453
Idioma: spa
Aparece en las colecciones:Maestría en Administración de Tecnologías

Archivos en este ítem:
Archivo Descripción TamañoFormato 
JESÚS ANDRÉS SIERRA RANGEL_Tesis24.pdf3.98 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.