Este livro introduz o conceito de aprendizado por reforço, com foco no algoritmo SARSA (State-Action-Reward-State-Action). O objetivo é ensinar como aplicar este algoritmo em problemas de tomada de decisão sequencial, com um exemplo prático utilizando Python.
A obra explora a implementação do SARSA em um ambiente de grade (gridworld), demonstrando o processo de treinamento de um agente para maximizar suas recompensas. O livro abrange conceitos fundamentais do aprendizado por reforço, como exploração vs. exploração, funções de valor e políticas de decisão. Além disso, oferece uma compreensão prática das técnicas de aprendizado em ambientes dinâmicos.
Ideal para estudantes, pesquisadores e profissionais, este livro fornece uma introdução acessível ao aprendizado por reforço, equipando o leitor com as ferramentas necessárias para implementar e avaliar o algoritmo SARSA de forma eficiente.
Número de páginas | 113 |
Edição | 1 (2025) |
Formato | A5 (148x210) |
Acabamento | Brochura c/ orelha |
Tipo de papel | Estucado Mate 90g |
Idioma | Português |
Tem algo a reclamar sobre este livro? Envie um email para [email protected]
Faça o login deixe o seu comentário sobre o livro.