Nuevo método de aceleración de los procesos de decisión de Markov

MA. DE GUADALUPE GARCIA HERNANDEZ

Please use this identifier to cite or link to this item: http://repositorio.ugto.mx/handle/20.500.12059/1162

Full metadata record

DC Field	Value	Language
dc.rights.license	http://creativecommons.org/licenses/by-nc-nd/4.0	es_MX
dc.creator	MA. DE GUADALUPE GARCIA HERNANDEZ	es_MX
dc.date	2012-02-02	-
dc.date.accessioned	2019-06-27T04:49:05Z	-
dc.date.available	2019-06-27T04:49:05Z	-
dc.date.issued	2012-02-02	-
dc.identifier.uri	http://repositorio.ugto.mx/handle/20.500.12059/1162	-
dc.description.abstract	En este artículo se presenta un nuevo método de aceleración para resolver a los procesos de decisión de Markov. El clásico algoritmo de iteración de valor ha resuelto satisfactoriamente a estos procesos estocásticos, pero este algoritmo y sus variantes aceleradas han sido lentos con factores de descuento cercanos a la unidad y sus propiedades de convergencia han dependido, en gran medida, de un buen ordenamiento en la actualización de estados. Recientemente se mostró que la iteración de valor presenta buena velocidad de convergencia gracias al uso de un algoritmo de ordenamiento topológico mejorado. Sin embargo, la desventaja de este algoritmo es debida a sus requerimientos de memoria. Aquí se presenta un método diferente para obtener un buen ordenamiento de estados actualizados con menor requerimiento de memoria. De igual manera se presentan los resultados experimentales obtenidos sobre un problema de ruta estocástica más corta.	es_MX
dc.format	application/pdf	-
dc.language.iso	spa	es_MX
dc.publisher	Universidad de Guanajuato	es_MX
dc.relation	http://www.actauniversitaria.ugto.mx/index.php/acta/article/view/38/26	-
dc.rights	info:eu-repo/semantics/openAccess	es_MX
dc.source	Acta Universitaria. Multidisciplinary Scientific Journal. Vol 21, No 2 (2011)	-
dc.source	ISSN: 2007-9621	-
dc.title	Nuevo método de aceleración de los procesos de decisión de Markov	es_MX
dc.type	info:eu-repo/semantics/article	es_MX
dc.creator.id	info:eu-repo/dai/mx/cvu/61398	es_MX
dc.subject.cti	info:eu-repo/classification/cti/7	es_MX
dc.subject.keywords	Procesos de decisión de Markov	es_MX
dc.subject.keywords	Ordenamiento topológico	es_MX
dc.subject.keywords	Ruta mas corta	es_MX
dc.subject.keywords	Markov decision processes	en
dc.subject.keywords	Topological ordering	en
dc.subject.keywords	Shortest path	en
dc.type.version	info:eu-repo/semantics/publishedVersion	es_MX
dc.creator.two	JOSE RUIZ PINALES	es_MX
dc.creator.three	SERGIO EDUARDO LEDESMA OROZCO	es_MX
dc.creator.four	JUAN GABRIEL AVIÑA CERVANTES	es_MX
dc.creator.five	EDGAR ALVARADO MENDEZ	es_MX
dc.creator.idtwo	info:eu-repo/dai/mx/cvu/31357	-
dc.creator.idthree	info:eu-repo/dai/mx/cvu/123351	-
dc.creator.idfour	info:eu-repo/dai/mx/cvu/37149	-
dc.creator.idfive	info:eu-repo/dai/mx/cvu/19455	-
dc.description.abstractEnglish	In this paper we propose a new acceleration method for solving Markov decision processes. Value iteration is a classical algorithm for solving Markov decision processes, but this algorithm and its variants are quite slow for discount factors close to one and their convergence properties depend to a great extent on a good state update order. Recently, it has been shown that improved topological value iteration presents a good convergence speed thanks to the use of an improved topological ordering algorithm. Nevertheless, the drawback of this algorithm is due to its memory requirements. So, we present a different method to obtain a good state backup order with less memory requirements. Experimental results obtained on a stochastic shortest path problem are presented.	en
Appears in Collections:	Revista Acta Universitaria

Files in This Item:

File	Description	Size	Format
Ma_de Guadalupe Garcia-Hernandez.pdf		585.34 kB	Adobe PDF	View/Open

Show simple item record