• HOME
  • >
  • 학과소식
  • >
  • 세미나

세미나

■ 제목: Identifying the key actions that lead an agent to accomplish a task in model-based deep reinforcement learning

■ 연사: Luiz Felipe Vecchietti 박사(KAIST 기계기술연구소)

■ 일시: 10.14(목) 16:00

■ URL: https://kaist.zoom.us/j/88529018177?pwd=YkdsV1FKRGl5Z1g3Q1Z6amxNTTlWZz09 

■ 요약: Recent advances in Artificial Intelligence (AI), especially in the area of deep reinforcement learning (RL), have been responsible for breakthrough results in robotics. For a specific type of RL, known as multigoal RL, the agent learns to achieve multiple different goals (objectives) with a goal-conditioned policy. The goal-conditioned policy is trained to effectively generalize its behavior for multiple goals. For complex goals, the agent finishes a task after completing a long sequence of actions. For example, it can take thousands of actions for an agent to solve a Rubik’s cube. Because of the long delay to receive feedback, the agent is not able to recognize key actions that were the important ones leading to success. In this talk, we will present a recent change in paradigm from model-free to model-based techniques in deep RL. The agent not only tries to train a policy to maximize future rewards received but also tries to infer and internalize information about the environment, such as predicting future rewards received, learning the environment dynamics, and understanding its own learning capabilities. We present our results proposing a rewards prediction model to detect the most important action contributing to the accomplishment of a task by an agent and also discuss recent results obtained in different environments.

번호 제목 글쓴이 날짜 조회 수
114 [2022 봄 GT 세미나] 3.31(목) 16:00 - 오현동 교수(UNIST 기계공학과) 관리자 2022.03.18 36
113 [2022 봄 GT 세미나] 4.28(목) 16:00 - 정구민 교수(국민대학교 전자공학부) 관리자 2022.03.18 58
112 [2022 봄 GT 세미나] 3.10(목) 16:00 - 원종훈 교수(인하대학교 전기공학과) 관리자 2022.02.25 64
111 [2021 가을 GT 세미나] 10.28(목) 16:00 - 원숙영 Technical Leader(AIRS Company) file 관리자 2021.10.26 65
110 [2021 가을 GT 세미나] 10.07(목) 16:00 - 김선우 교수(한양대학교) 관리자 2021.10.05 75
109 [2022 봄 GT 세미나] 5.19(목) 16:00 - Yisheng Lv 박사(Chinese Academy of Sciences, Institute of Automation) 관리자 2022.03.18 85
108 [2021 가을 GT 세미나] 11.18(목) 16:00 - 김진희 교수(연세대학교 도시공학과) 관리자 2021.11.16 87
107 [2022 봄 GT 세미나] 5.12(목) 16:00 - 김시호 교수(연세대학교 글로벌융합공학부) 관리자 2022.03.18 96
106 [2022 봄 GT 세미나] 3.17(목) 16:00 - 정구민 교수(국민대학교 전자공학부) 관리자 2022.03.10 97
105 [2021 가을 GT 세미나] 11.25(목) 16:00 - 김우용 교수(호서대학교 로봇자동화공학과) 관리자 2021.11.19 101
104 [2021 봄 GT 세미나] 4.1(목) 16:00 - 심상오 교수(한밭대학교) 관리자 2021.03.29 129
103 [2022 봄 GT 세미나] 5.26(목) 16:00 - Le Hai Vu 교수(Civil Engineering, Monash University) 관리자 2022.03.18 144
102 [2022 봄 GT 세미나] 4.7(목) 16:00 - 장경희 교수(인하대학교 전자공학과) 관리자 2022.03.18 155
101 [2021 봄 GT 세미나] 4.29(목) 16:00 - 김정호 책임연구원(한국전자기술연구원)) 관리자 2021.04.19 162
100 [2021 봄 GT 세미나] 5.6(목) 16:00 - 임성훈 교수 (DGIST) 관리자 2021.05.03 165
99 [2021 봄 GT 세미나] 4.8(목) 16:00 - 소재현 교수(아주대학교) 관리자 2021.04.06 176
98 [2021 봄 GT 세미나] 5.13(목) 16:00 - 정수환 교수 (숭실대학교) 관리자 2021.05.10 180
97 [2020 가을 GT 세미나] 10.8(목) 16:00 - 장대준 교수(KAIST 기계공학과) 관리자 2020.10.05 189
96 [2020 가을 GT 세미나] 11.26(목) 16:00 - 이진복 CTO(올룰로) 관리자 2020.11.23 191
95 [2020 가을 GT 세미나] 11.12(목) 16:00 - 백종윤 책임리더(네이버랩스) 관리자 2020.11.10 196