Part โ . Tabular Solution Methods ๊ฐํํ์ต์ simplest forms์ ๋ํ์ฌ ๋ฐฐ์ฐ๋ ์ฑํฐ๋ค. action-value function์ด array๋ table ํํ๋ก ๋ํ๋๊ธฐ์ ์ถฉ๋ถํ ์ ๋๋ก ๊ทธ state์ action space๊ฐ ์์ ํํ๋ค. ์ด๋ฌํ ๊ฒฝ์ฐ, optimal value function๊ณผ optimal policy๋ฅผ ์ฐพ์ ๊ฐ๋ฅ์ฑ์ด ๋๋ค. ์ด๋ ์ค์ง approximate solutions๋ง ์ฐพ์๋ด๋ much larger problems๊ณผ ๋๋น๋๋ค. ๊ฐํํ์ต์ด ๋ค๋ฅธ ํ์ต๋ค๊ณผ ๊ตฌ๋ถ๋๋ ๊ฐ์ฅ ์ค์ํ ํน์ง์ correct actions์ ๋ํ ์ ๋ณด๋ฅผ ์ ๊ณตํ์ฌ instruct ํ๋ ๊ฒ์ด ์๋๋ผ actions์ ํ๊ฐํ๋ค๋ ๊ฒ์ด๋ค. ์ด๊ฒ์ด ๊ณง active exploration์..