강화학습 개요
- 최초 등록일
- 2022.04.30
- 최종 저작일
- 2022.04
- 4페이지/
한컴오피스
- 가격 3,000원
![할인쿠폰받기](/images/v4/document/ico_det_coupon.gif)
* 본 문서(hwp)가 작성된 한글 프로그램 버전보다 낮은 한글 프로그램에서 열람할 경우 문서가 올바르게 표시되지 않을 수 있습니다.
이 경우에는 최신패치가 되어 있는 2010 이상 버전이나 한글뷰어에서 확인해 주시기 바랍니다.
소개글
"강화학습 개요"에 대한 내용입니다.
목차
Ⅰ. 서론
Ⅱ. 본론
1. 강화학습이란?
2. 강화학습의 특성
3. 강화학습에서 에이전트
4. 강화학습의 문제점
5. 강화학습과 최적제어
Ⅲ. 결론
Ⅳ. 참고문헌
본문내용
I. 서론
강화학습은 개념이 소개된지는 오래된 역사를 갖고 있다. 하지만 여러 가지 한계로 인하여 실용화되지 못하였다. 최근에 딥러닝의 활용과 더불어 강화학습도 여러 가지 분야에 적용되고 있는데 본 보고서에서는 강화학습의 개념과 문제점 및 한계점에 대해서 알아보도록 하겠다. 또한 강화학습과 최적제어의 차이점에 대해서 알아보도록 하겠다.
II. 본론
1. 강화학습이란?
- 강화학습은 어떤 에이전트(agent)가 환경(environment)이 주는 누적보상(reward)의 기댓값을 최대화하기 위해 시간 순서대로 환경에 가해지는 행동(action)을 결정하는 문제이다.
- 누적 보상의 기댓값(성능지수)는 다음과 같다.
2. 강화학습의 특성
1) 기본 동역학 모델을 몰라도 환경과의 상호작용을 통해 얻은 데이터만으로 직접 정책을 유도할 수 있다.
2) 상태변수와 행동을 랜덤변수로 가정한다.
- 보상도 랜덤변수가 된다.
참고 자료
https://pasus.tistory.com/