• HOME
  • >
  • 학과소식
  • >
  • 세미나

세미나

■ 제목: Identifying the key actions that lead an agent to accomplish a task in model-based deep reinforcement learning

■ 연사: Luiz Felipe Vecchietti 박사(KAIST 기계기술연구소)

■ 일시: 10.14(목) 16:00

■ URL: https://kaist.zoom.us/j/88529018177?pwd=YkdsV1FKRGl5Z1g3Q1Z6amxNTTlWZz09 

■ 요약: Recent advances in Artificial Intelligence (AI), especially in the area of deep reinforcement learning (RL), have been responsible for breakthrough results in robotics. For a specific type of RL, known as multigoal RL, the agent learns to achieve multiple different goals (objectives) with a goal-conditioned policy. The goal-conditioned policy is trained to effectively generalize its behavior for multiple goals. For complex goals, the agent finishes a task after completing a long sequence of actions. For example, it can take thousands of actions for an agent to solve a Rubik’s cube. Because of the long delay to receive feedback, the agent is not able to recognize key actions that were the important ones leading to success. In this talk, we will present a recent change in paradigm from model-free to model-based techniques in deep RL. The agent not only tries to train a policy to maximize future rewards received but also tries to infer and internalize information about the environment, such as predicting future rewards received, learning the environment dynamics, and understanding its own learning capabilities. We present our results proposing a rewards prediction model to detect the most important action contributing to the accomplishment of a task by an agent and also discuss recent results obtained in different environments.

번호 제목 글쓴이 날짜 조회 수
124 [2022 가을 MO 세미나] 11.10(목) 16:00 - 김태훈 원장(한국공예디자인문화진흥원) 관리자 2022.10.25 211
123 [2022 가을 MO 세미나] 11.17(목) 16:00 - 이윤구 교수(한밭대 기계공학과) 관리자 2022.09.20 245
122 [2022 가을 MO 세미나] 11.03(목) 16:00 - Chen Tiantian(KAIST 조천식모빌리티대학원) 관리자 2022.09.20 253
121 [2022 가을 MO 세미나] 10.27(목) 16:00 - 이창우 박사(KAIST 조천식모빌리티대학원) 관리자 2022.09.20 209
120 [2022 가을 MO 세미나] 10.13(목) 16:00 - 홍영근 상무((주)에버온) 관리자 2022.09.20 153
119 [2022 가을 MO 세미나] 10.06(목) 16:00 - 신유준 박사(KAIST 조천식모빌리티대학원) 관리자 2022.09.20 182
118 [2022 가을 MO 세미나] 9.29(목) 16:00 - 최경환 교수(GIST 기계공학부) 관리자 2022.08.25 202
117 [2022 가을 MO 세미나] 9.22(목) 16:00 - 신혜원 대표(바이에스필라테스) 관리자 2022.08.25 202
116 [2022 가을 MO 세미나] 9.15(목) 16:00 - 오정훈 대표(현대NGV) 관리자 2022.08.25 201
115 [2022 가을 MO 세미나] 9.1(목) 16:00 - 이상금 박사(ETRI) 관리자 2022.08.25 236
114 [2022 봄 GT 세미나] 5.26(목) 16:00 - Le Hai Vu 교수(Civil Engineering, Monash University) 관리자 2022.03.18 552
113 [2022 봄 GT 세미나] 5.19(목) 16:00 - Yisheng Lv 교수(Chinese Academy of Sciences, Institute of Automation) 관리자 2022.03.18 328
112 [2022 봄 GT 세미나] 5.12(목) 16:00 - 김시호 교수(연세대학교 글로벌융합공학부) 관리자 2022.03.18 1200
111 [2022 봄 GT 세미나] 4.28(목) 16:00 - 정구민 교수(국민대학교 전자공학부) 관리자 2022.03.18 218
110 [2022 봄 GT 세미나] 4.7(목) 16:00 - 장경희 교수(인하대학교 전자공학과) 관리자 2022.03.18 365
109 [2022 봄 GT 세미나] 3.31(목) 16:00 - 오현동 교수(UNIST 기계공학과) 관리자 2022.03.18 207
108 [2022 봄 GT 세미나] 3.24(목) 16:00 - 양지현 교수(국민대학교 자동차공학과) 관리자 2022.03.18 4791
107 [2022 봄 GT 세미나] 3.17(목) 16:00 - 정구민 교수(국민대학교 전자공학부) 관리자 2022.03.10 821
106 [2022 봄 GT 세미나] 3.10(목) 16:00 - 원종훈 교수(인하대학교 전기공학과) 관리자 2022.02.25 219
105 [2022 봄 GT 세미나] 3.3(목) 16:00 - 김의환 교수(GIST AI대학원) 관리자 2022.02.23 1165