• HOME
  • >
  • 학과소식
  • >
  • 세미나

세미나

■ 제목: Identifying the key actions that lead an agent to accomplish a task in model-based deep reinforcement learning

■ 연사: Luiz Felipe Vecchietti 박사(KAIST 기계기술연구소)

■ 일시: 10.14(목) 16:00

■ URL: https://kaist.zoom.us/j/88529018177?pwd=YkdsV1FKRGl5Z1g3Q1Z6amxNTTlWZz09 

■ 요약: Recent advances in Artificial Intelligence (AI), especially in the area of deep reinforcement learning (RL), have been responsible for breakthrough results in robotics. For a specific type of RL, known as multigoal RL, the agent learns to achieve multiple different goals (objectives) with a goal-conditioned policy. The goal-conditioned policy is trained to effectively generalize its behavior for multiple goals. For complex goals, the agent finishes a task after completing a long sequence of actions. For example, it can take thousands of actions for an agent to solve a Rubik’s cube. Because of the long delay to receive feedback, the agent is not able to recognize key actions that were the important ones leading to success. In this talk, we will present a recent change in paradigm from model-free to model-based techniques in deep RL. The agent not only tries to train a policy to maximize future rewards received but also tries to infer and internalize information about the environment, such as predicting future rewards received, learning the environment dynamics, and understanding its own learning capabilities. We present our results proposing a rewards prediction model to detect the most important action contributing to the accomplishment of a task by an agent and also discuss recent results obtained in different environments.

번호 제목 글쓴이 날짜 조회 수
124 [2022 가을 MO 세미나] 10.13(목) 16:00 - 홍영근 상무((주)에버온) 관리자 2022.09.20 145
123 [2022 가을 MO 세미나] 10.06(목) 16:00 - 신유준 박사(KAIST 조천식모빌리티대학원) 관리자 2022.09.20 175
122 [2022 가을 MO 세미나] 10.27(목) 16:00 - 이창우 박사(KAIST 조천식모빌리티대학원) 관리자 2022.09.20 189
121 [2022 가을 MO 세미나] 9.15(목) 16:00 - 오정훈 대표(현대NGV) 관리자 2022.08.25 191
120 [2022 봄 GT 세미나] 3.31(목) 16:00 - 오현동 교수(UNIST 기계공학과) 관리자 2022.03.18 192
119 [2022 가을 MO 세미나] 9.22(목) 16:00 - 신혜원 대표(바이에스필라테스) 관리자 2022.08.25 192
118 [2022 가을 MO 세미나] 9.29(목) 16:00 - 최경환 교수(GIST 기계공학부) 관리자 2022.08.25 196
117 [2021 가을 GT 세미나] 10.07(목) 16:00 - 김선우 교수(한양대학교) 관리자 2021.10.05 202
116 [2022 가을 MO 세미나] 11.10(목) 16:00 - 김태훈 원장(한국공예디자인문화진흥원) 관리자 2022.10.25 206
115 [2022 봄 GT 세미나] 4.28(목) 16:00 - 정구민 교수(국민대학교 전자공학부) 관리자 2022.03.18 211
114 [2022 봄 GT 세미나] 3.10(목) 16:00 - 원종훈 교수(인하대학교 전기공학과) 관리자 2022.02.25 212
113 [2022 가을 MO 세미나] 9.1(목) 16:00 - 이상금 박사(ETRI) 관리자 2022.08.25 223
112 [2022 가을 MO 세미나] 11.17(목) 16:00 - 이윤구 교수(한밭대 기계공학과) 관리자 2022.09.20 234
111 [2021 가을 GT 세미나] 10.28(목) 16:00 - 원숙영 Technical Leader(AIRS Company) file 관리자 2021.10.26 237
110 [2021 가을 GT 세미나] 11.18(목) 16:00 - 김진희 교수(연세대학교 도시공학과) 관리자 2021.11.16 237
109 [2022 가을 MO 세미나] 11.03(목) 16:00 - Chen Tiantian(KAIST 조천식모빌리티대학원) 관리자 2022.09.20 242
108 [2021 봄 GT 세미나] 4.1(목) 16:00 - 심상오 교수(한밭대학교) 관리자 2021.03.29 243
107 [2021 가을 GT 세미나] 11.25(목) 16:00 - 김우용 교수(호서대학교 로봇자동화공학과) 관리자 2021.11.19 243
106 [2021 봄 GT 세미나] 4.29(목) 16:00 - 김정호 책임연구원(한국전자기술연구원)) 관리자 2021.04.19 265
105 [2021 봄 GT 세미나] 4.8(목) 16:00 - 소재현 교수(아주대학교) 관리자 2021.04.06 280