Please use this identifier to cite or link to this item:
http://repositorio.ugto.mx/handle/20.500.12059/10445
Title: | Clasificación de reseñas de Amazon utilizando NLP y Random Forest |
Authors: | Marcos Ruvalcaba García |
Abstract: | En este trabajo se realizóelanálisis y clasificación de reseñas deproductos de Amazon contenidas en un conjunto de datos. Primeramente, fue necesario llevar a cabo un preprocesamiento a dichas opiniones, con la finalidad deaplicarles unadepuraciónprevio a la clasificación. Las variables que se tomaron en cuenta para la depuración fueron: eliminación de palabras de parada o “stop words”, lematización, eliminación de palabras de poca frecuencia y ganancia de información.La clasificación de las reseñas se efectuó mediante el método de aprendizaje Random Forest, para esto se utilizó la herramienta de software Weka. Se eligió esta herramienta debido a que es ampliamente utilizada para minería de datos, aprendizaje automático y diversas tareas relacionadas con el análisis de datos. Los resultados obtenidos en la clasificación fueron muy alentadores sobrepasando el 80% de precisión para el método de aprendizaje seleccionado. |
Issue Date: | 10-Jan-2024 |
Publisher: | Universidad de Guanajuato |
License: | http://creativecommons.org/licenses/by-nc-nd/4.0 |
URI: | http://repositorio.ugto.mx/handle/20.500.12059/10445 |
Language: | spa |
Appears in Collections: | Revista Jóvenes en la Ciencia |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
4 - Clasificación de reseñas de Amazon utilizando NLP y Random Forest.pdf | 409.74 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.