• >
  • 학과소식
  • >
  • 세미나


■ 제목: Identifying the key actions that lead an agent to accomplish a task in model-based deep reinforcement learning

■ 연사: Luiz Felipe Vecchietti 박사(KAIST 기계기술연구소)

■ 일시: 10.14(목) 16:00

■ URL: https://kaist.zoom.us/j/88529018177?pwd=YkdsV1FKRGl5Z1g3Q1Z6amxNTTlWZz09 

■ 요약: Recent advances in Artificial Intelligence (AI), especially in the area of deep reinforcement learning (RL), have been responsible for breakthrough results in robotics. For a specific type of RL, known as multigoal RL, the agent learns to achieve multiple different goals (objectives) with a goal-conditioned policy. The goal-conditioned policy is trained to effectively generalize its behavior for multiple goals. For complex goals, the agent finishes a task after completing a long sequence of actions. For example, it can take thousands of actions for an agent to solve a Rubik’s cube. Because of the long delay to receive feedback, the agent is not able to recognize key actions that were the important ones leading to success. In this talk, we will present a recent change in paradigm from model-free to model-based techniques in deep RL. The agent not only tries to train a policy to maximize future rewards received but also tries to infer and internalize information about the environment, such as predicting future rewards received, learning the environment dynamics, and understanding its own learning capabilities. We present our results proposing a rewards prediction model to detect the most important action contributing to the accomplishment of a task by an agent and also discuss recent results obtained in different environments.

번호 제목 글쓴이 날짜 조회 수
104 [GSGT 정기세미나] 이상훈 교수(계명대학교, 기계자동차공학과) 3/23(목) 16:00, N7-5 #308 file 관리자 2017.03.21 2277
103 [GSGT] 2016년 봄학기 정기세미나 안내 - 이상준 과장(산업부), 4/28(목) 오후 4시, 창의학습관(E11) #206 file 관리자 2016.04.28 2215
102 [안승영교수연구실 세미나 안내][WPT Seminar in KAIST] Prof. Mauro Felizian(Univ. of L'Aqula), 5/7(Wed) 11:00AM 관리자 2014.05.08 2147
101 [GSGT] 정기세미나 개최안내(안남성 원장, 한국에너지기술평가원, 6/5(목) 16시) file 관리자 2014.05.29 2069
100 조천식녹색교통대학원(3월 23일 수요일, 최성임교수) file 관리자 2011.03.29 2027
99 [GSGT 정기세미나] Gerard Lachapelle (Professor Emeritus, University of Calgary) 4/6(목) 16:00, E11 #101 file 관리자 2017.03.31 2010
98 [GSGT] 정기세미나 개최안내(11/7(목) 16시, 송태승 박사, 한국산업기술시험원) 관리자 2013.11.08 1993
97 [GT 정기세미나]2019학년도 봄학기 세미나 전체 일정 file 관리자 2019.03.21 1739
96 [2021 가을 GT 세미나] 11.4(목) 16:00 - 정하욱 부대표(라이드플럭스) 관리자 2021.10.29 1622
95 [GSGT 정기세미나] 강신진 교수(홍익대학교, 게임소프트웨어 전공) 3/30(목) 16:00, N7-5 #308 file 관리자 2017.03.28 1605
94 [GSGT 정기세미나] 한기진 교수(UNIST, 전기전자컴퓨터공학부) 3/16(목) 16:00, N7-5 #308 file 관리자 2017.03.14 1555
93 세미나 개최안내 (3월 22일 목요일, 경북대 한동석) 관리자 2012.03.20 1407
92 7월 7월 오전 11시, GM Global R&D 금동석 박사 file 관리자 2011.07.07 1373
91 [GSGT] 정기세미나 개최안내(오철 교수님, 한양대학교, 5/1(목) 16시) 관리자 2014.04.30 1298
90 [GSGT] 정기세미나 개최안내(문영준 박사, 한국교통연구원, 3/20(목) 16시) 관리자 2014.03.21 1216
89 [세미나개최]9월26일 (목),오현서박사(한국전자통신연구원) 관리자 2013.09.26 1212
88 [2022 봄 GT 세미나] 5.12(목) 16:00 - 김시호 교수(연세대학교 글로벌융합공학부) 관리자 2022.03.18 1194
87 대학원 정기세미나 개최안내(손영욱 PD님, Keit, 4/17(목) 16시) 관리자 2014.04.17 1182
86 세미나 개최안내 (3월 8일 목요일, 연세대 김철구 교수) 관리자 2012.03.06 1137
85 세미나 개최안내 (3월 15일 목요일, 서울대 이경수 교수) 관리자 2012.03.14 931