Please use this identifier to cite or link to this item: http://repositorio.ugto.mx/handle/20.500.12059/1162
Full metadata record
DC FieldValueLanguage
dc.rights.licensehttp://creativecommons.org/licenses/by-nc-nd/4.0es_MX
dc.creatorMA. DE GUADALUPE GARCIA HERNANDEZes_MX
dc.date2012-02-02-
dc.date.accessioned2019-06-27T04:49:05Z-
dc.date.available2019-06-27T04:49:05Z-
dc.date.issued2012-02-02-
dc.identifier.urihttp://repositorio.ugto.mx/handle/20.500.12059/1162-
dc.description.abstractEn este artículo se presenta un nuevo método de aceleración para resolver a los procesos de decisión de Markov. El clásico algoritmo de iteración de valor ha resuelto satisfactoriamente a estos procesos estocásticos, pero este algoritmo y sus variantes aceleradas han sido lentos con factores de descuento cercanos a la unidad y sus propiedades de convergencia han dependido, en gran medida, de un buen ordenamiento en la actualización de estados. Recientemente se mostró que la iteración de valor presenta buena velocidad de convergencia gracias al uso de un algoritmo de ordenamiento topológico mejorado. Sin embargo, la desventaja de este algoritmo es debida a sus requerimientos de memoria. Aquí se presenta un método diferente para obtener un buen ordenamiento de estados actualizados con menor requerimiento de memoria. De igual manera se presentan los resultados experimentales obtenidos sobre un problema de ruta estocástica más corta.es_MX
dc.formatapplication/pdf-
dc.language.isospaes_MX
dc.publisherUniversidad de Guanajuatoes_MX
dc.relationhttp://www.actauniversitaria.ugto.mx/index.php/acta/article/view/38/26-
dc.rightsinfo:eu-repo/semantics/openAccesses_MX
dc.sourceActa Universitaria. Multidisciplinary Scientific Journal. Vol 21, No 2 (2011)-
dc.sourceISSN: 2007-9621-
dc.titleNuevo método de aceleración de los procesos de decisión de Markoves_MX
dc.typeinfo:eu-repo/semantics/articlees_MX
dc.creator.idinfo:eu-repo/dai/mx/cvu/61398es_MX
dc.subject.ctiinfo:eu-repo/classification/cti/7es_MX
dc.subject.keywordsProcesos de decisión de Markoves_MX
dc.subject.keywordsOrdenamiento topológicoes_MX
dc.subject.keywordsRuta mas cortaes_MX
dc.subject.keywordsMarkov decision processesen
dc.subject.keywordsTopological orderingen
dc.subject.keywordsShortest pathen
dc.type.versioninfo:eu-repo/semantics/publishedVersiones_MX
dc.creator.twoJOSE RUIZ PINALESes_MX
dc.creator.threeSERGIO EDUARDO LEDESMA OROZCOes_MX
dc.creator.fourJUAN GABRIEL AVIÑA CERVANTESes_MX
dc.creator.fiveEDGAR ALVARADO MENDEZes_MX
dc.creator.idtwoinfo:eu-repo/dai/mx/cvu/31357-
dc.creator.idthreeinfo:eu-repo/dai/mx/cvu/123351-
dc.creator.idfourinfo:eu-repo/dai/mx/cvu/37149-
dc.creator.idfiveinfo:eu-repo/dai/mx/cvu/19455-
dc.description.abstractEnglishIn this paper we propose a new acceleration method for solving Markov decision processes. Value iteration is a classical algorithm for solving Markov decision processes, but this algorithm and its variants are quite slow for discount factors close to one and their convergence properties depend to a great extent on a good state update order. Recently, it has been shown that improved topological value iteration presents a good convergence speed thanks to the use of an improved topological ordering algorithm. Nevertheless, the drawback of this algorithm is due to its memory requirements. So, we present a different method to obtain a good state backup order with less memory requirements. Experimental results obtained on a stochastic shortest path problem are presented.en
Appears in Collections:Revista Acta Universitaria

Files in This Item:
File Description SizeFormat 
Ma_de Guadalupe Garcia-Hernandez.pdf585.34 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.