• LF몰 이벤트
  • 파일시티 이벤트
  • 서울좀비 이벤트
  • 탑툰 이벤트
  • 닥터피엘 이벤트
  • 아이템베이 이벤트
  • 아이템매니아 이벤트

1. 강화학습 구성요소

통도사
개인인증판매자스토어
최초 등록일
2019.10.20
최종 저작일
2019.10
2페이지/ 한컴오피스
가격 1,000원 할인쿠폰받기
다운로드
장바구니

* 본 문서(hwp)가 작성된 한글 프로그램 버전보다 낮은 한글 프로그램에서 열람할 경우 문서가 올바르게 표시되지 않을 수 있습니다. 이 경우에는 최신패치가 되어 있는 2010 이상 버전이나 한글뷰어에서 확인해 주시기 바랍니다.

목차

I. 강화학습 구성요소
II. 참고문헌

본문내용

I. 강화학습 구성요소
1. 상태(State)
- 현재 상황을 나타내는 정보
- 에이전트가 관찰할 수 있는 상태의 집합(시간에 따라 변함)
- 예) 에이전트가 탁구를 치려면 탁구공의 위치, 속도, 가속도와 같은 정보가 필요

2. Episode
- 에피소드 : 처음 상태부터 마지막 상태까지를 나열한 것
- 예) S(0), S(1), S(2), ..., S(t-1), S(t)

3. 행동(Action)
- 에이전트가 할 수 있는 활동의 집합
- 행동 a에 대해 모두 상태 s’로 가는 것은 아니다.
- 상태 변환확률에 따라 다음 상태가 결정된다.
- 행동에는 연속, 이산형 행동이 존재한다.
- 예) 시간 t에 취한 활동 : A(t)=a

참고 자료

이원웅(2018), 가깝고도 먼 DeepRL
통도사
판매자 유형Gold개인인증
해당 판매자는 노하우톡 기능을 사용하는 회원입니다.노하우톡
* 노하우톡 기능이란?노하우 자료를 판매하는 회원에게 노하우 컨설팅, 활용방법 등을 1:1 대화를 통해 문의할 수 있는 기능입니다.

주의사항

저작권 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

이런 노하우도 있어요!더보기

찾던 자료가 아닌가요?아래 자료들 중 찾던 자료가 있는지 확인해보세요

더보기
최근 본 자료더보기
탑툰 이벤트
1. 강화학습 구성요소
  • 레이어 팝업
  • 프레시홍 - 특가
  • 프레시홍 - 특가
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업
AI 챗봇
2024년 07월 18일 목요일
AI 챗봇
안녕하세요. 해피캠퍼스 AI 챗봇입니다. 무엇이 궁금하신가요?
12:19 오후
New

24시간 응대가능한
AI 챗봇이 런칭되었습니다. 닫기