Vista MARC

000		02168cam a2200205 a 4500
007		ta
008		170908s2020 us a \|\|f \|\|\|\| 001 0 eng d
020		_a9781098114831
082		_a006.3 _bW763r _223
100		_aWinder, Phil. _94856
245		_aReinforcement Learning : _bIndustrial applications of intelligent agents / _cPhil Winder.
260		_aBoston : ( Estados Unidos) : _bO´reilly, _c2021.
300		_axxiii, 379 p. : _bil., graf.; _c24 cm.
504		_6Incluye índice
520		_aEl aprendizaje por refuerzo (RL) brindará uno de los mayores avances en IA durante la próxima década, lo que permitirá que los algoritmos aprendan de su entorno para lograr objetivos arbitrarios. Este emocionante desarrollo evita las limitaciones que se encuentran en los algoritmos tradicionales de aprendizaje automático (ML). Este libro práctico muestra a los profesionales de ciencia de datos e inteligencia artificial cómo aprender por refuerzo y permitir que una máquina aprenda por sí misma. El autor Phil Winder de Winder Research cubre todo, desde los componentes básicos hasta las prácticas más avanzadas. Explorará el estado actual de RL, se centrará en aplicaciones industriales, aprenderá numerosos algoritmos y se beneficiará de capítulos dedicados a la implementación de soluciones de RL en producción. Este no es un libro de cocina; no rehuye las matemáticas y espera familiarizarse con ML. Aprenda qué es RL y cómo los algoritmos ayudan a resolver problemas. Adéntrese en los fundamentos de RL, incluidos los procesos de decisión de Markov, la programación dinámica y el aprendizaje de diferencias temporales. Sumérjase en una variedad de métodos de gradiente de políticas y valores. Aplique soluciones avanzadas de RL, como metaaprendizaje, aprendizaje jerárquico. , multiagente y aprendizaje por imitación. Comprenda los algoritmos de RL profundos de vanguardia, incluidos Rainbow, PPO, TD3, SAC y más. Obtenga ejemplos prácticos a través del sitio web adjunto.
650	0	_99238 _aINTELIGENCIA ARTIFICIAL
650	0	_aALGORITMOS _941053
650	0	_aAPRENDIZAJE AUTOMÁTICO _954592
942		_2ddc _cBK
999		_c23230 _d23230