Please use this identifier to cite or link to this item:
http://repositorio.ugto.mx/handle/20.500.12059/5919
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.rights.license | http://creativecommons.org/licenses/by-nc-nd/4.0 | es_MX |
dc.contributor.author | Luis Miguel López Santamaría | es_MX |
dc.creator | JUAN CARLOS GOMEZ CARRANZA | es_MX |
dc.date.accessioned | 2022-03-28T18:52:23Z | - |
dc.date.available | 2022-03-28T18:52:23Z | - |
dc.date.issued | 2021-09-07 | - |
dc.identifier.uri | http://repositorio.ugto.mx/handle/20.500.12059/5919 | - |
dc.description.abstract | El perfilado de autor en redes sociales es una tarea que trata de predecir de forma automática los atributos demográficos de una población objetivo de usuarios a partir de la información que estos comparten y generan en las redes sociales. El perfilado de autor permite segmentar a los usuarios dependiendo de sus atributos demográficos. Con esta segmentación, distintas empresas y organizaciones pueden ajustar el contenido que proveen a los usuarios con fines de mercadotecnia, promoción política, programas sociales, información educativa, entretenimiento, entre otros. En este artículo se presenta el proyecto de investigación que analiza los mensajes de texto publicados por los seguidores de celebridades (usuarios populares) en Twitter, con el fin de predecir el perfil demográfico de tales celebridades, conformado por su género, ocupación y año de nacimiento. Para esta tarea se utilizandos conjuntos de datos: el de entrenamiento y el de prueba. El conjunto de datos de entrenamiento contiene 5,066,608 tweets pertenecientes a 1,920 celebridades de Twitter. El conjunto de datos de prueba está conformado por 34,893,195 tweets generados por los seguidores de 400 celebridades (con al menos 10 seguidores). A partir de estos datos se realizaron experimentos extrayendo una serie de características textuales de los tweets y con ellas se construyeron diversos modelos de aprendizaje de máquina. Para evaluar los modelos se midió el área bajo la curva ROC. Los resultados indican que algunos atributos como el año de nacimiento son complicados de predecir. Se observa de igual forma, que características como los vectores de palabras presentan buen desempeño sobre todo en combinación con modelos de aprendizaje discriminativos. | es_MX |
dc.language.iso | spa | es_MX |
dc.publisher | Universidad de Guanajuato | es_MX |
dc.relation | https://www.jovenesenlaciencia.ugto.mx/index.php/jovenesenlaciencia/article/view/3312/2957 | es_MX |
dc.rights | info:eu-repo/semantics/openAccess | es_MX |
dc.source | Jóvenes en la Ciencia: XXVI Verano de la Ciencia. Vol. 10(2021) | es_MX |
dc.title | Perfilado demográfico de celebridades en redes sociales | es_MX |
dc.type | info:eu-repo/semantics/article | es_MX |
dc.creator.id | info:eu-repo/dai/mx/cvu/37720 | es_MX |
dc.subject.cti | info:eu-repo/classification/cti/7 | es_MX |
dc.subject.cti | info:eu-repo/classification/cti/33 | es_MX |
dc.subject.cti | info:eu-repo/classification/cti/3304 | es_MX |
dc.subject.keywords | Perfilado de autor | es_MX |
dc.subject.keywords | Minería de datos | es_MX |
dc.subject.keywords | Aprendizaje de máquina | es_MX |
dc.subject.keywords | Redes sociales | es_MX |
dc.type.version | info:eu-repo/semantics/publishedVersion | es_MX |
dc.creator.two | Juan Carlos Alonso Sánchez | es_MX |
dc.creator.three | Aldo Isaac Hernández Antonio | es_MX |
dc.creator.four | José Alfredo Romero González | es_MX |
dc.creator.five | HugoIván Lozoyo Belman | es_MX |
Appears in Collections: | Revista Jóvenes en la Ciencia |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Perfilado demográfico de celebridades en redes sociales.pdf | 483.45 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.