• HOME
  • >
  • 학과소식
  • >
  • 세미나

세미나

■ 제목: Identifying the key actions that lead an agent to accomplish a task in model-based deep reinforcement learning

■ 연사: Luiz Felipe Vecchietti 박사(KAIST 기계기술연구소)

■ 일시: 10.14(목) 16:00

■ URL: https://kaist.zoom.us/j/88529018177?pwd=YkdsV1FKRGl5Z1g3Q1Z6amxNTTlWZz09 

■ 요약: Recent advances in Artificial Intelligence (AI), especially in the area of deep reinforcement learning (RL), have been responsible for breakthrough results in robotics. For a specific type of RL, known as multigoal RL, the agent learns to achieve multiple different goals (objectives) with a goal-conditioned policy. The goal-conditioned policy is trained to effectively generalize its behavior for multiple goals. For complex goals, the agent finishes a task after completing a long sequence of actions. For example, it can take thousands of actions for an agent to solve a Rubik’s cube. Because of the long delay to receive feedback, the agent is not able to recognize key actions that were the important ones leading to success. In this talk, we will present a recent change in paradigm from model-free to model-based techniques in deep RL. The agent not only tries to train a policy to maximize future rewards received but also tries to infer and internalize information about the environment, such as predicting future rewards received, learning the environment dynamics, and understanding its own learning capabilities. We present our results proposing a rewards prediction model to detect the most important action contributing to the accomplishment of a task by an agent and also discuss recent results obtained in different environments.

번호 제목 글쓴이 날짜 조회 수
104 [2020 가을 GT 세미나] 10.8(목) 16:00 - 장대준 교수(KAIST 기계공학과) 관리자 2020.10.05 215
103 [2021 봄 GT 세미나] 5.6(목) 16:00 - 임성훈 교수 (DGIST) 관리자 2021.05.03 221
102 [2020 가을 GT 세미나] 11.26(목) 16:00 - 이진복 CTO(올룰로) 관리자 2020.11.23 231
101 [2021 봄 GT 세미나] 4.8(목) 16:00 - 소재현 교수(아주대학교) 관리자 2021.04.06 237
100 [2020 가을 GT 세미나] 11.12(목) 16:00 - 백종윤 책임리더(네이버랩스) 관리자 2020.11.10 238
99 [2022 봄 GT 세미나] 5.19(목) 16:00 - Yisheng Lv 교수(Chinese Academy of Sciences, Institute of Automation) 관리자 2022.03.18 246
98 [2020 가을 GT 세미나] 12.3(목) 16:00 - 김덕훈 이사(퀄콤 코리아) 관리자 2020.11.30 250
97 [2022 봄 GT 세미나] 4.7(목) 16:00 - 장경희 교수(인하대학교 전자공학과) 관리자 2022.03.18 282
96 [2021 봄 GT 세미나] 4.15(목) 16:00 - 김용재 소장 (스마트레이더시스템) 관리자 2021.04.12 305
95 [2020 가을 GT 세미나] 9.24(목) 16:00 - 박기범 교수(조천식녹색교통대학원) 관리자 2020.09.24 309
94 [2020 가을 GT 세미나] 12.10(목) 16:00 - 권영민 박사(인천국제공항공사) 관리자 2020.12.07 342
93 [2021 봄 GT 세미나] 6.10(목) 16:00 - 류병의 처장 (한국교통안전공단 주차안전처) 관리자 2021.05.31 380
92 [2020 가을 GT 세미나] 9.17(목) 16:00 - 김정민 박사(카카오모빌리티) 관리자 2020.09.14 457
91 세미나 개최안내 (10월18일 목요일, 한국철도시설공단 최강윤기술본부장) 관리자 2012.10.16 458
90 [2022 봄 GT 세미나] 5.26(목) 16:00 - Le Hai Vu 교수(Civil Engineering, Monash University) 관리자 2022.03.18 473
89 [GSGT] ICC Global lecture, Prof. Andrew George Brooks, 8/19(월)~8/26(월) 관리자 2013.07.13 483
88 세미나 개최안내 (11월 22일 목요일, 한국전자통신연구소 이상욱팀장) 관리자 2012.11.22 486
87 세미나 개최안내 (10월 23일 화요일, 한국철도공사 배영규팀장) 관리자 2012.10.23 495
86 세미나 안내 (10월10일 수요일, UNIST 김남훈교수) 관리자 2012.10.09 524
85 [2021 가을 GT 세미나] 11.11(목) 16:00 - 이기범 교수(가천대학교 미래자동차학과) 관리자 2021.11.05 538