일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Python Programming
- 김성훈 교수님
- paper
- 유니티
- list
- David Silver
- unity
- machine learning
- 딥러닝
- ML-Agent
- neural network
- 모두를 위한 RL
- optimization
- 리스트
- Series
- 강화학습
- rl
- reinforcement learning
- 데이터 분석
- Deep Learning
- Jacobian Matrix
- Laplacian
- statistics
- 판다스
- Hessian Matrix
- 논문
- pandas
- Linear algebra
- convex optimization
- 사이킷런
목록분류 전체보기 (88)
RL Researcher
우선 $\mathbb{R}^{n}$ 차원에 대해서 정의하면, $\mathbb{R}^{n}$ 차원 공간의 elements는 n-component vector $x=[x_{1},x_{2},...,x_{n}]^{T}$이다. $\mathbb{R}^{n}$서 두점 $x$와 $y$사이의 $\boldsymbol{line \ segment}$는 점 $x$와 $y$를 접합하는 직선 상의 점 집합입니다. $z$가 $x$와 $y$ 사이의 $\boldsymbol{line \ segment}$에 있는 경우는 아래와 같이 정의할 수 있습니다. $$z-y=\alpha (x-y)$$ $\alpha$는 $[0,1]$ 사이의 실수. 위의 방정식은 $z=\alpha x+(1-\alpha)y$로 다시 쓸 수 있으므로, 따라서 $x$와 $y..
What is Hyperplane? 초평면의 "초" 는 뛰어넘을 초(超)이며, 평면을 뛰어넘는 평면이라는 뜻임. (Plane에서 확장된 개념) 아래의 두 개의 변수로 만들어진 1차식을 봅시다. $$ax+by+c=0$$ 위 식은 2차원 평면에 그려지는 직선의 방정식이다. 변수를 하나 추가해보겠습니다. $$ax+by+cz+d=0$$ 위 식은 3차원 공간 상에 그려지는 평면의 방정식입니다. 변수를 하나 더 추가해 보겠습니다. $$a_{1}x_{1}+a_{2}x_{2}+a_{3}x_{3}+a_{4}x_{4}+c=0$$ 위의 식은 어떻게 정의할 수 있을까요? $\Rightarrow$ 정의는 "plane"을 일반화하여 "Hyperplane"으로 부르기로 하였습니다. 일차식으로 만들어지는 도형을 전부 "Hyperpl..
What is Statistics? 모집단(Population)에서 표본(Sample)을 추출하여 표본을 분석해 모집단을 추정하고 추론하는 것. 모집단 (Population) : 분석의 대상이 되는 모든 개체들을 모은 집합. 일반적으로는 시간적이나 공간적인 제약이 존재하여 모집단 전체를 대상으로 분석은 불가능하다. 표본 (Sample) : 모집단의 일부분의 관측값들을 추출한 것. * 우리가 하게 되는 Statistics에서는 표본의 통계량(Statistic)을 통해서 모집단의 요약값인 Parameter를 추정하는 것이다. 모수 (Parameter) : 표본을 통해서 뽑아낸 통계량을 이용해 수치로 표현되는 모집단의 특성. 통계량 (Statistic) : 표본의 관측값들에 의해서 결정되는 양. Types o..
큰 population에서 무작위로 뽑은 sample average가 전체 population의 average와 가까울 가능성이 높다는 통계와 확률 분야의 기본 개념이다. Week Law of Larfe Numbers라고도 한다 Law of Large Numbers는 population 전체를 조사, 관측하지 않더라도 population으로부터 충분히 큰 표본을 뽑아 sample average를 계산하면 그것이 모평균과 같아진다는 점을 보여주기 때문에, sample average를 통한 모평균의 예측방법(Generally, 표본 통계량을 통한 모수의 추정 방법)이 타탕함을 보여주는 매우 중요한 법칙임. ex) 모든 학생의 평균 성적을 조사한다고 했을 때, 학교 전체를 조사할 수 없으므로 일정 학교만을 무..