• HOME
  • >
  • 학과소식
  • >
  • 세미나

세미나

■ 제목: Identifying the key actions that lead an agent to accomplish a task in model-based deep reinforcement learning

■ 연사: Luiz Felipe Vecchietti 박사(KAIST 기계기술연구소)

■ 일시: 10.14(목) 16:00

■ URL: https://kaist.zoom.us/j/88529018177?pwd=YkdsV1FKRGl5Z1g3Q1Z6amxNTTlWZz09 

■ 요약: Recent advances in Artificial Intelligence (AI), especially in the area of deep reinforcement learning (RL), have been responsible for breakthrough results in robotics. For a specific type of RL, known as multigoal RL, the agent learns to achieve multiple different goals (objectives) with a goal-conditioned policy. The goal-conditioned policy is trained to effectively generalize its behavior for multiple goals. For complex goals, the agent finishes a task after completing a long sequence of actions. For example, it can take thousands of actions for an agent to solve a Rubik’s cube. Because of the long delay to receive feedback, the agent is not able to recognize key actions that were the important ones leading to success. In this talk, we will present a recent change in paradigm from model-free to model-based techniques in deep RL. The agent not only tries to train a policy to maximize future rewards received but also tries to infer and internalize information about the environment, such as predicting future rewards received, learning the environment dynamics, and understanding its own learning capabilities. We present our results proposing a rewards prediction model to detect the most important action contributing to the accomplishment of a task by an agent and also discuss recent results obtained in different environments.

번호 제목 글쓴이 날짜 조회 수
114 [2022 봄 GT 세미나] 5.26(목) 16:00 - Le Hai Vu 교수(Civil Engineering, Monash University) 관리자 2022.03.18 377
113 [2022 봄 GT 세미나] 5.19(목) 16:00 - Yisheng Lv 교수(Chinese Academy of Sciences, Institute of Automation) 관리자 2022.03.18 178
112 [2022 봄 GT 세미나] 5.12(목) 16:00 - 김시호 교수(연세대학교 글로벌융합공학부) 관리자 2022.03.18 1047
111 [2022 봄 GT 세미나] 4.28(목) 16:00 - 정구민 교수(국민대학교 전자공학부) 관리자 2022.03.18 100
110 [2022 봄 GT 세미나] 4.7(목) 16:00 - 장경희 교수(인하대학교 전자공학과) 관리자 2022.03.18 209
109 [2022 봄 GT 세미나] 3.31(목) 16:00 - 오현동 교수(UNIST 기계공학과) 관리자 2022.03.18 70
108 [2022 봄 GT 세미나] 3.24(목) 16:00 - 양지현 교수(국민대학교 자동차공학과) 관리자 2022.03.18 4304
107 [2022 봄 GT 세미나] 3.17(목) 16:00 - 정구민 교수(국민대학교 전자공학부) 관리자 2022.03.10 148
106 [2022 봄 GT 세미나] 3.10(목) 16:00 - 원종훈 교수(인하대학교 전기공학과) 관리자 2022.02.25 99
105 [2022 봄 GT 세미나] 3.3(목) 16:00 - 김의환 교수(GIST AI대학원) 관리자 2022.02.23 471
104 [2021 가을 GT 세미나] 12.2(목) 16:00 - 한용하 연구위원(현대자동차 버추얼이노베이션 리서치랩)) 관리자 2021.11.29 539
103 [2021 가을 GT 세미나] 11.25(목) 16:00 - 김우용 교수(호서대학교 로봇자동화공학과) 관리자 2021.11.19 142
102 [2021 가을 GT 세미나] 11.18(목) 16:00 - 김진희 교수(연세대학교 도시공학과) 관리자 2021.11.16 141
101 [2021 가을 GT 세미나] 11.11(목) 16:00 - 이기범 교수(가천대학교 미래자동차학과) 관리자 2021.11.05 429
100 [2021 가을 GT 세미나] 11.4(목) 16:00 - 정하욱 부대표(라이드플럭스) 관리자 2021.10.29 1554
99 [2021 가을 GT 세미나] 10.28(목) 16:00 - 원숙영 Technical Leader(AIRS Company) file 관리자 2021.10.26 93
» [2021 가을 GT 세미나] 10.14(목) 16:00 - Luiz Felipe Vecchietti 박사(KAIST) 관리자 2021.10.07 20617
97 [2021 가을 GT 세미나] 10.07(목) 16:00 - 김선우 교수(한양대학교) 관리자 2021.10.05 102
96 [2021 가을 GT 세미나] 9.30(목) 16:00 - 박춘수 연구소장(한국철도기술연구원 신교통혁신연구소) 관리자 2021.09.27 7082
95 [2021 가을 GT 세미나] 9.23(목) 16:00 - 김현미 교수 (한국항공대학교) 관리자 2021.09.17 4173