(진행중)

Sutton and Barto의 Reinforcement Learning: An Introduction은 모든 내용을 정말 자세하게 설명하기 때문에 강화학습의 교과서라고도 불립니다. 이 책에는 수많은 예제들이 존재하는데, 이 예제들을 주피터 노트북으로 구현하였습니다.

목차

  1. Introduction
  2. Multi-armed Bandits
  3. Finite Markov Decision Processes
  4. Dynamic Programming
  5. Monte Carlo Methods
  6. Temporal-Difference Learning
  7. $n$-step Bootstrapping
  8. Planning and Learning with Tabular Methods
  9. On-policy Prediction with Approximation
  10. On-policy Control with Approximation
  11. Off-policy Methods with Approximation
  12. Eligibility Traces
  13. Policy Gradient Methods