Reinforcement Learning : Industrial applications of intelligent agents / Phil Winder.
Tipo de material: TextoEditor: Boston : ( Estados Unidos) : O´reilly, 2021Descripción: xxiii, 379 p. : il., graf.; 24 cmISBN: 9781098114831Tema(s): INTELIGENCIA ARTIFICIAL | ALGORITMOS | APRENDIZAJE AUTOMÁTICOClasificación CDD: 006.3 Resumen: El aprendizaje por refuerzo (RL) brindará uno de los mayores avances en IA durante la próxima década, lo que permitirá que los algoritmos aprendan de su entorno para lograr objetivos arbitrarios. Este emocionante desarrollo evita las limitaciones que se encuentran en los algoritmos tradicionales de aprendizaje automático (ML). Este libro práctico muestra a los profesionales de ciencia de datos e inteligencia artificial cómo aprender por refuerzo y permitir que una máquina aprenda por sí misma. El autor Phil Winder de Winder Research cubre todo, desde los componentes básicos hasta las prácticas más avanzadas. Explorará el estado actual de RL, se centrará en aplicaciones industriales, aprenderá numerosos algoritmos y se beneficiará de capítulos dedicados a la implementación de soluciones de RL en producción. Este no es un libro de cocina; no rehuye las matemáticas y espera familiarizarse con ML. Aprenda qué es RL y cómo los algoritmos ayudan a resolver problemas. Adéntrese en los fundamentos de RL, incluidos los procesos de decisión de Markov, la programación dinámica y el aprendizaje de diferencias temporales. Sumérjase en una variedad de métodos de gradiente de políticas y valores. Aplique soluciones avanzadas de RL, como metaaprendizaje, aprendizaje jerárquico. , multiagente y aprendizaje por imitación. Comprenda los algoritmos de RL profundos de vanguardia, incluidos Rainbow, PPO, TD3, SAC y más. Obtenga ejemplos prácticos a través del sitio web adjunto.Tipo de ítem | Ubicación actual | Colección | Signatura | Info Vol | Copia número | Estado | Fecha de vencimiento | Código de barras | Reserva de ítems |
---|---|---|---|---|---|---|---|---|---|
LIBRO - MATERIAL GENERAL | Biblioteca Jorge Álvarez Lleras Fondo general | Colección General | 006.3 W763r (Navegar estantería) | Ej.1 | 1 | Disponible | 029846 |
Navegando Biblioteca Jorge Álvarez Lleras Estantes, Ubicación: Fondo general, Código de colección: Colección General Cerrar el navegador de estanterías
006.3 V133p Practical natural language processing : a comprehensive guide to building real-world NLP systems / | 006.3 V133p Practical natural language processing : a comprehensive guide to building real-world NLP systems / | 006.3 W457a Artificial intelligence / | 006.3 W763r Reinforcement Learning : Industrial applications of intelligent agents / | 006.31 T261l Life 3.0: | 006.31 W447m Machine Learning : | 006.31 W447m Machine Learning : |
Incluye índice
El aprendizaje por refuerzo (RL) brindará uno de los mayores avances en IA durante la próxima década, lo que permitirá que los algoritmos aprendan de su entorno para lograr objetivos arbitrarios. Este emocionante desarrollo evita las limitaciones que se encuentran en los algoritmos tradicionales de aprendizaje automático (ML). Este libro práctico muestra a los profesionales de ciencia de datos e inteligencia artificial cómo aprender por refuerzo y permitir que una máquina aprenda por sí misma. El autor Phil Winder de Winder Research cubre todo, desde los componentes básicos hasta las prácticas más avanzadas. Explorará el estado actual de RL, se centrará en aplicaciones industriales, aprenderá numerosos algoritmos y se beneficiará de capítulos dedicados a la implementación de soluciones de RL en producción. Este no es un libro de cocina; no rehuye las matemáticas y espera familiarizarse con ML. Aprenda qué es RL y cómo los algoritmos ayudan a resolver problemas. Adéntrese en los fundamentos de RL, incluidos los procesos de decisión de Markov, la programación dinámica y el aprendizaje de diferencias temporales. Sumérjase en una variedad de métodos de gradiente de políticas y valores. Aplique soluciones avanzadas de RL, como metaaprendizaje, aprendizaje jerárquico. , multiagente y aprendizaje por imitación. Comprenda los algoritmos de RL profundos de vanguardia, incluidos Rainbow, PPO, TD3, SAC y más. Obtenga ejemplos prácticos a través del sitio web adjunto.
No hay comentarios en este titulo.