Reinforcement Learning : An introduction / Richard S. Sutton and Andrew G. Barto.

Por: Sutton, RichardColaborador(es): Barto, Andrew G [Autor.]Tipo de material: TextoTextoEditor: Boston : ( Estados Unidos) : MIT Press, 2020Edición: Second editionDescripción: xxii, 526 p. : il., graf.; 24 cmISBN: 9780262039246Tema(s): INTELIGENCIA ARTIFICIAL | ALGORITMOS | APRENDIZAJE AUTOMÁTICOClasificación CDD: 006.3 Resumen: El aprendizaje por refuerzo, una de las áreas de investigación más activas en inteligencia artificial, es un enfoque computacional del aprendizaje mediante el cual un agente trata de maximizar la cantidad total de recompensa que recibe mientras interactúa con un entorno complejo e incierto. En Reinforcement Learning, Richard Sutton y Andrew Barto brindan una descripción clara y simple de las ideas y algoritmos clave del campo. Esta segunda edición ha sido significativamente ampliada y actualizada, presentando nuevos temas y actualizando la cobertura de otros temas. Al igual que la primera edición, esta segunda edición se enfoca en los algoritmos básicos de aprendizaje en línea, con el material más matemático resaltado en recuadros sombreados. La Parte I cubre la mayor cantidad posible de aprendizaje por refuerzo sin ir más allá del caso tabular para el cual se pueden encontrar soluciones exactas. Muchos algoritmos presentados en esta parte son nuevos en la segunda edición, incluidos UCB, Expected Sarsa y Double Learning. La Parte II amplía estas ideas a la aproximación de funciones, con nuevas secciones sobre temas como las redes neuronales artificiales y la base de Fourier, y ofrece un tratamiento más amplio del aprendizaje fuera de las políticas y los métodos de gradiente de políticas. La Parte III tiene nuevos capítulos sobre las relaciones del aprendizaje por refuerzo con la psicología y la neurociencia, así como un capítulo de estudios de casos actualizado que incluye AlphaGo y AlphaGo Zero, juegos de Atari y la estrategia de apuestas de IBM Watson. El capítulo final analiza los futuros impactos sociales del aprendizaje por refuerzo.
Etiquetas de esta biblioteca: No hay etiquetas de esta biblioteca para este título. Ingresar para agregar etiquetas.
    Valoración media: 0.0 (0 votos)
Tipo de ítem Ubicación actual Colección Signatura Info Vol Copia número Estado Fecha de vencimiento Código de barras Reserva de ítems
LIBRO - MATERIAL GENERAL LIBRO - MATERIAL GENERAL Biblioteca Jorge Álvarez Lleras
Fondo general
Colección General 006.3 S967r 2a ed. (Navegar estantería) Ej.1 1 Prestado 2024-04-16 029852
LIBRO - MATERIAL GENERAL LIBRO - MATERIAL GENERAL Biblioteca Jorge Álvarez Lleras
Fondo general
Colección General 006.3 S967r 2a ed. (Navegar estantería) Ej.2 2 Prestado 2024-07-31 029853
Total de reservas: 0

Incluye índice

El aprendizaje por refuerzo, una de las áreas de investigación más activas en inteligencia artificial, es un enfoque computacional del aprendizaje mediante el cual un agente trata de maximizar la cantidad total de recompensa que recibe mientras interactúa con un entorno complejo e incierto. En Reinforcement Learning, Richard Sutton y Andrew Barto brindan una descripción clara y simple de las ideas y algoritmos clave del campo. Esta segunda edición ha sido significativamente ampliada y actualizada, presentando nuevos temas y actualizando la cobertura de otros temas.

Al igual que la primera edición, esta segunda edición se enfoca en los algoritmos básicos de aprendizaje en línea, con el material más matemático resaltado en recuadros sombreados. La Parte I cubre la mayor cantidad posible de aprendizaje por refuerzo sin ir más allá del caso tabular para el cual se pueden encontrar soluciones exactas. Muchos algoritmos presentados en esta parte son nuevos en la segunda edición, incluidos UCB, Expected Sarsa y Double Learning. La Parte II amplía estas ideas a la aproximación de funciones, con nuevas secciones sobre temas como las redes neuronales artificiales y la base de Fourier, y ofrece un tratamiento más amplio del aprendizaje fuera de las políticas y los métodos de gradiente de políticas. La Parte III tiene nuevos capítulos sobre las relaciones del aprendizaje por refuerzo con la psicología y la neurociencia, así como un capítulo de estudios de casos actualizado que incluye AlphaGo y AlphaGo Zero, juegos de Atari y la estrategia de apuestas de IBM Watson. El capítulo final analiza los futuros impactos sociales del aprendizaje por refuerzo.

No hay comentarios en este titulo.

para colocar un comentario.

Haga clic en una imagen para verla en el visor de imágenes