000 02168cam a2200205 a 4500
007 ta
008 170908s2020 us a ||f |||| 001 0 eng d
020 _a9781098114831
082 _a006.3
_bW763r
_223
100 _aWinder, Phil.
_94856
245 _aReinforcement Learning :
_bIndustrial applications of intelligent agents /
_cPhil Winder.
260 _aBoston : ( Estados Unidos) :
_bO´reilly,
_c2021.
300 _axxiii, 379 p. :
_bil., graf.;
_c24 cm.
504 _6Incluye índice
520 _aEl aprendizaje por refuerzo (RL) brindará uno de los mayores avances en IA durante la próxima década, lo que permitirá que los algoritmos aprendan de su entorno para lograr objetivos arbitrarios. Este emocionante desarrollo evita las limitaciones que se encuentran en los algoritmos tradicionales de aprendizaje automático (ML). Este libro práctico muestra a los profesionales de ciencia de datos e inteligencia artificial cómo aprender por refuerzo y permitir que una máquina aprenda por sí misma. El autor Phil Winder de Winder Research cubre todo, desde los componentes básicos hasta las prácticas más avanzadas. Explorará el estado actual de RL, se centrará en aplicaciones industriales, aprenderá numerosos algoritmos y se beneficiará de capítulos dedicados a la implementación de soluciones de RL en producción. Este no es un libro de cocina; no rehuye las matemáticas y espera familiarizarse con ML. Aprenda qué es RL y cómo los algoritmos ayudan a resolver problemas. Adéntrese en los fundamentos de RL, incluidos los procesos de decisión de Markov, la programación dinámica y el aprendizaje de diferencias temporales. Sumérjase en una variedad de métodos de gradiente de políticas y valores. Aplique soluciones avanzadas de RL, como metaaprendizaje, aprendizaje jerárquico. , multiagente y aprendizaje por imitación. Comprenda los algoritmos de RL profundos de vanguardia, incluidos Rainbow, PPO, TD3, SAC y más. Obtenga ejemplos prácticos a través del sitio web adjunto.
650 0 _99238
_aINTELIGENCIA ARTIFICIAL
650 0 _aALGORITMOS
_941053
650 0 _aAPRENDIZAJE AUTOMÁTICO
_954592
942 _2ddc
_cBK
999 _c23230
_d23230