000 | 02168cam a2200205 a 4500 | ||
---|---|---|---|
007 | ta | ||
008 | 170908s2020 us a ||f |||| 001 0 eng d | ||
020 | _a9781098114831 | ||
082 |
_a006.3 _bW763r _223 |
||
100 |
_aWinder, Phil. _94856 |
||
245 |
_aReinforcement Learning : _bIndustrial applications of intelligent agents / _cPhil Winder. |
||
260 |
_aBoston : ( Estados Unidos) : _bO´reilly, _c2021. |
||
300 |
_axxiii, 379 p. : _bil., graf.; _c24 cm. |
||
504 | _6Incluye índice | ||
520 | _aEl aprendizaje por refuerzo (RL) brindará uno de los mayores avances en IA durante la próxima década, lo que permitirá que los algoritmos aprendan de su entorno para lograr objetivos arbitrarios. Este emocionante desarrollo evita las limitaciones que se encuentran en los algoritmos tradicionales de aprendizaje automático (ML). Este libro práctico muestra a los profesionales de ciencia de datos e inteligencia artificial cómo aprender por refuerzo y permitir que una máquina aprenda por sí misma. El autor Phil Winder de Winder Research cubre todo, desde los componentes básicos hasta las prácticas más avanzadas. Explorará el estado actual de RL, se centrará en aplicaciones industriales, aprenderá numerosos algoritmos y se beneficiará de capítulos dedicados a la implementación de soluciones de RL en producción. Este no es un libro de cocina; no rehuye las matemáticas y espera familiarizarse con ML. Aprenda qué es RL y cómo los algoritmos ayudan a resolver problemas. Adéntrese en los fundamentos de RL, incluidos los procesos de decisión de Markov, la programación dinámica y el aprendizaje de diferencias temporales. Sumérjase en una variedad de métodos de gradiente de políticas y valores. Aplique soluciones avanzadas de RL, como metaaprendizaje, aprendizaje jerárquico. , multiagente y aprendizaje por imitación. Comprenda los algoritmos de RL profundos de vanguardia, incluidos Rainbow, PPO, TD3, SAC y más. Obtenga ejemplos prácticos a través del sitio web adjunto. | ||
650 | 0 |
_99238 _aINTELIGENCIA ARTIFICIAL |
|
650 | 0 |
_aALGORITMOS _941053 |
|
650 | 0 |
_aAPRENDIZAJE AUTOMÁTICO _954592 |
|
942 |
_2ddc _cBK |
||
999 |
_c23230 _d23230 |