Please use this identifier to cite or link to this item: http://repositorio.ugto.mx/handle/20.500.12059/10445
Title: Clasificación de reseñas de Amazon utilizando NLP y Random Forest
Authors: Marcos Ruvalcaba García
Abstract: En este trabajo se realizóelanálisis y clasificación de reseñas deproductos de Amazon contenidas en un conjunto de datos. Primeramente, fue necesario llevar a cabo un preprocesamiento a dichas opiniones, con la finalidad deaplicarles unadepuraciónprevio a la clasificación. Las variables que se tomaron en cuenta para la depuración fueron: eliminación de palabras de parada o “stop words”, lematización, eliminación de palabras de poca frecuencia y ganancia de información.La clasificación de las reseñas se efectuó mediante el método de aprendizaje Random Forest, para esto se utilizó la herramienta de software Weka. Se eligió esta herramienta debido a que es ampliamente utilizada para minería de datos, aprendizaje automático y diversas tareas relacionadas con el análisis de datos. Los resultados obtenidos en la clasificación fueron muy alentadores sobrepasando el 80% de precisión para el método de aprendizaje seleccionado.
Issue Date: 10-Jan-2024
Publisher: Universidad de Guanajuato
License: http://creativecommons.org/licenses/by-nc-nd/4.0
URI: http://repositorio.ugto.mx/handle/20.500.12059/10445
Language: spa
Appears in Collections:Revista Jóvenes en la Ciencia

Files in This Item:
File Description SizeFormat 
4 - Clasificación de reseñas de Amazon utilizando NLP y Random Forest.pdf409.74 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.