2019-Summer-Seminar

Deep Reinforcement Learning for HCIL Masters

Github Google Drive

1. 개요

  1. 강화학습을 공부합니다.
  2. 실습과 구현에 집중합니다.
  3. 전원 완주를 목표로 합니다.

2. 계획

회차 날짜 제목 발표자
1 2019.7.15 Dummy Q Learning 김민지
2 2019.7.22 Q-learning exploit & exploration and discounted reward 김준회
3 2019.7.29 Q-learning in nondeterministic world 박관모
4 2019.8.5 Q-network 정석원
5 2019.8.12 DQN 최길웅
6 2019.8.19 프로젝트 구현 1 고형권
7 2019.8.26 프로젝트 구현 2 안단태

강의 동영상 및 자료는 시즌 RL 페이지에서 참조하세요.

3. 진행 방식

3-1. 수강생의 할 일

3-2. 발표자의 할 일

발표자는 세미나 시간 전까지 다음을 준비해야 합니다.

3-3. 세미나 시간에 하는 일

세미나 시간엔 발표자의 브리핑을 듣고, 수강생들이 서로의 코드를 보면서 피드백을 주고 받습니다.

Projects

5주차: 주제 발표

2주 동안 구현할 강화학습 프로젝트 주제 제안발표를 준비해 와주시기 바랍니다 (3 슬라이드 이내)

너무 쉬운 주제를 가져오시면 청중의 피드백에 의해 반려/강화될 수 있습니다. OpenAI Gym Environment는 다음의 카테고리만 허용됩니다.

  1. Atari
  2. Box2D
  3. MuJoCo
  4. Roboschool
  5. Robotics