【알고리즘】 11강. 강화학습
11강. 강화학습(reinforcement learning; RL) 추천글 : 【알고리즘】 알고리즘 목차 1. 개요 [본문] 2. Markov decision process [본문] 1. 개요 [목차] ⑴ 정의 ① (참고) supervised learning ○ 데이터 : (x, y) (단, x는 feature, y는 label) ○ 목표 : 맵핑 함수 x → y의 계산 ② (참고) unsupervised learning ○ 데이터 : x (단, x는 feature이고 label은 없음) ○ 목표 : x의 underlying structure에 대한 학습 ③ reinforcement learning ○ 데이터 : (s, a, r, s') (단, s는 state, a는 action, r은 reward, s..
최근댓글