Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/20.500.12104/95644
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.creator | Montenegro Meza, Mauro Alejandro | - |
dc.creator | Menchaca Méndez, Rolando | - |
dc.creator | Menchaca Méndez, Ricardo | - |
dc.date | 2023-06-11 | - |
dc.date.accessioned | 2023-09-01T20:35:01Z | - |
dc.date.available | 2023-09-01T20:35:01Z | - |
dc.identifier | http://recibe.cucei.udg.mx/index.php/ReCIBE/article/view/268 | - |
dc.identifier.uri | https://hdl.handle.net/20.500.12104/95644 | - |
dc.description | The interaction within the world constitutes one of the main ways in which learning is generated, as it is the way by which we obtain information from the environment and we experience cause-effect relationships. This idea of learning through interaction is a fundamental issue in many learning theories and, in this paper, we will address a computational approach called Reinforcement Learning (RL) and we will build in a progressive and simple way its mathematical basis, as well as its main solution methods. Lastly, applications and algorithms that are relevant in the industry and research are presented. | en-US |
dc.description | La interacción con el mundo es una de las principales formas en las que se genera el aprendizaje, pues es el medio por el cuál se obtiene información del entorno, y se experimentan relaciones causa-efecto. Esta idea de aprender mediante la interacción es una aspecto fundamental en muchas teorías del aprendizaje y, en este artículo abordaremos un enfoque computacional llamado "aprendizaje por refuerzo" (Reinforcement Learning, RL) además de construir de manera progresiva y sencilla sus bases matemáticas, así como los métodos principales de solución. Por último, mostramos aplicaciones y algoritmos que son relevantes en la industria e investigación. | es-ES |
dc.format | application/pdf | - |
dc.language | spa | - |
dc.publisher | Universidad de Guadalajara | es-ES |
dc.relation | http://recibe.cucei.udg.mx/index.php/ReCIBE/article/view/268/190 | - |
dc.rights | Derechos de autor 2023 ReCIBE, Revista electrónica de Computación, Informática, Biomédica y Electrónica | es-ES |
dc.rights | https://creativecommons.org/licenses/by-nc-sa/2.5/mx/deed.es_ES | es-ES |
dc.source | ReCIBE, electronic journal of Computing, Informatics, Biomedical and Electronics; Vol. 12 No. 1 (2023): May 2023 - Oct 2023; C1-15 | en-US |
dc.source | ReCIBE, Revista electrónica de Computación, Informática, Biomédica y Electrónica; Vol. 12 Núm. 1 (2023): May 2023 - Oct 2023; C1-15 | es-ES |
dc.source | 2007-5448 | - |
dc.subject | Markov decision process | en-US |
dc.subject | Proceso de decisión markoviano | es-ES |
dc.title | A Gently but rigorous introduction to reinforcement learning | en-US |
dc.title | Una Introducción amable pero riguroza al aprendizaje por refuerzo | es-ES |
dc.type | info:eu-repo/semantics/article | - |
dc.type | info:eu-repo/semantics/publishedVersion | - |
Aparece en las colecciones: | Revista ReCIBE |
Ficheros en este ítem:
No hay ficheros asociados a este ítem.
Los ítems de RIUdeG están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.