• HOME
  • >
  • 학과소식
  • >
  • 세미나

세미나

■ 제목: Identifying the key actions that lead an agent to accomplish a task in model-based deep reinforcement learning

■ 연사: Luiz Felipe Vecchietti 박사(KAIST 기계기술연구소)

■ 일시: 10.14(목) 16:00

■ URL: https://kaist.zoom.us/j/88529018177?pwd=YkdsV1FKRGl5Z1g3Q1Z6amxNTTlWZz09 

■ 요약: Recent advances in Artificial Intelligence (AI), especially in the area of deep reinforcement learning (RL), have been responsible for breakthrough results in robotics. For a specific type of RL, known as multigoal RL, the agent learns to achieve multiple different goals (objectives) with a goal-conditioned policy. The goal-conditioned policy is trained to effectively generalize its behavior for multiple goals. For complex goals, the agent finishes a task after completing a long sequence of actions. For example, it can take thousands of actions for an agent to solve a Rubik’s cube. Because of the long delay to receive feedback, the agent is not able to recognize key actions that were the important ones leading to success. In this talk, we will present a recent change in paradigm from model-free to model-based techniques in deep RL. The agent not only tries to train a policy to maximize future rewards received but also tries to infer and internalize information about the environment, such as predicting future rewards received, learning the environment dynamics, and understanding its own learning capabilities. We present our results proposing a rewards prediction model to detect the most important action contributing to the accomplishment of a task by an agent and also discuss recent results obtained in different environments.

번호 제목 글쓴이 날짜 조회 수
124 [2022 가을 MO 세미나] 10.13(목) 16:00 - 홍영근 상무((주)에버온) 관리자 2022.09.20 89
123 [2022 가을 MO 세미나] 10.06(목) 16:00 - 신유준 박사(KAIST 조천식모빌리티대학원) 관리자 2022.09.20 109
122 [2021 가을 GT 세미나] 10.07(목) 16:00 - 김선우 교수(한양대학교) 관리자 2021.10.05 128
121 [2022 가을 MO 세미나] 10.27(목) 16:00 - 이창우 박사(KAIST 조천식모빌리티대학원) 관리자 2022.09.20 129
120 [2022 가을 MO 세미나] 9.22(목) 16:00 - 신혜원 대표(바이에스필라테스) 관리자 2022.08.25 132
119 [2022 가을 MO 세미나] 11.10(목) 16:00 - 김태훈 원장(한국공예디자인문화진흥원) 관리자 2022.10.25 139
118 [2022 봄 GT 세미나] 3.31(목) 16:00 - 오현동 교수(UNIST 기계공학과) 관리자 2022.03.18 140
117 [2022 가을 MO 세미나] 9.15(목) 16:00 - 오정훈 대표(현대NGV) 관리자 2022.08.25 145
116 [2021 가을 GT 세미나] 10.28(목) 16:00 - 원숙영 Technical Leader(AIRS Company) file 관리자 2021.10.26 146
115 [2022 가을 MO 세미나] 9.29(목) 16:00 - 최경환 교수(GIST 기계공학부) 관리자 2022.08.25 150
114 [2022 봄 GT 세미나] 3.10(목) 16:00 - 원종훈 교수(인하대학교 전기공학과) 관리자 2022.02.25 159
113 [2022 봄 GT 세미나] 4.28(목) 16:00 - 정구민 교수(국민대학교 전자공학부) 관리자 2022.03.18 163
112 [2022 가을 MO 세미나] 11.17(목) 16:00 - 이윤구 교수(한밭대 기계공학과) 관리자 2022.09.20 167
111 [2022 가을 MO 세미나] 9.1(목) 16:00 - 이상금 박사(ETRI) 관리자 2022.08.25 168
110 [2021 봄 GT 세미나] 4.1(목) 16:00 - 심상오 교수(한밭대학교) 관리자 2021.03.29 175
109 [2022 가을 MO 세미나] 11.03(목) 16:00 - Chen Tiantian(KAIST 조천식모빌리티대학원) 관리자 2022.09.20 175
108 [2021 가을 GT 세미나] 11.18(목) 16:00 - 김진희 교수(연세대학교 도시공학과) 관리자 2021.11.16 178
107 [2021 가을 GT 세미나] 11.25(목) 16:00 - 김우용 교수(호서대학교 로봇자동화공학과) 관리자 2021.11.19 188
106 [2021 봄 GT 세미나] 4.29(목) 16:00 - 김정호 책임연구원(한국전자기술연구원)) 관리자 2021.04.19 199
105 [2021 봄 GT 세미나] 5.13(목) 16:00 - 정수환 교수 (숭실대학교) 관리자 2021.05.10 213