【제어이론】 강화학습 예제 [01-10]
강화학습 예제 [01-10] 추천글 : 【제어이론】 확률적 제어이론 문제 1. (controlled Markov chain 정식화) 어떤 시스템이 이산 시간(discrete-time) Markov chain으로서 유한한 상태공간 S = {1, 2, ···, I} 위에서 진화한다고 하자. 시간 t = 0, 1, 2, ···에서 상태 i에 있을 때, 그 전이 확률은 Pt(j | i)로 주어지고, 그때의 비용은 ct(i)이다. 어떤 시점에서든, 의사결정자는 시스템을 그대로 두어 자연스럽게 진화하도록 할 수도 있고, 혹은 개입하여 u ∈ 𝒰 (단, 𝒰는 유한 집합)을 선택할 수도 있다. 이 경우 전이 확률은 Pt(j | i, u)로 바뀌며, 그 시점의 비용은 ct(i, u)로 주어진다. 이 문제를 cont..
【대수경】 제 26회 전국 대학생 수학 경시대회 제 2 분야
제 26회 전국 대학생 수학 경시대회 제 2 분야 추천글 : 【전국 대학생 수학경시대회】 전국 대학생 수학경시대회 풀이 모음 제 26회 전국 대학생 (공업)수학 경시대회제 2 분야2007년 11월 03일 (10:00 - 12:00) 1-1. 다음 적분을 계산하시오. Solution. 1-2. 곡선 C(t) = (cos t, sin t), 0 ≤ t ≤ 2π에 대하여 다음 선적분을 계산하여라. Solution. 1-3. 꼭지점의 좌표가 각각 A(0, 0, 0), B(1, 2, 3), C(3, 1, 2), D(7, 4, 7)인 사각형의 넓이를 계산하여라. Solution. AB + 2AC = AD임을 확인하자. 따라서 사각형의 넓이는 다음과 같다. 1-4. 함수 f(x) = ex /..
【대수경】 제 26회 전국 대학생 수학 경시대회 제 1 분야
제 26회 전국 대학생 수학 경시대회 제 1 분야 추천글 : 【전국 대학생 수학경시대회】 전국 대학생 수학경시대회 풀이 모음 제 26회 전국 대학생 (공업)수학 경시대회제 1 분야2007년 11월 03일 (10:00 - 12:00) 1-1. 꼭짓점의 좌표가 각각 A(0, 0, 0), B(1, 2, 3), C(3, 1, 2), D(7, 4, 7)인 사각형의 넓이를 계산하여라. Solution. 위를 통해 A, B, C, D가 한 평면에 있음을 알 수 있다.또한, 이므로 A의 반대편에 D가 놓인다.따라서 □ ABCD가 오목사각형일 경우도 고려하여, 1-2. 함수 f(x) = ex / x, 1 ≤ x ≤ 2의 역함수 g에 대하여 다음 적분을 계산하여라. Solution. f(1) = e, ..
최근댓글