• >
  • 학과소식
  • >
  • 세미나


■ 제목: Identifying the key actions that lead an agent to accomplish a task in model-based deep reinforcement learning

■ 연사: Luiz Felipe Vecchietti 박사(KAIST 기계기술연구소)

■ 일시: 10.14(목) 16:00

■ URL: https://kaist.zoom.us/j/88529018177?pwd=YkdsV1FKRGl5Z1g3Q1Z6amxNTTlWZz09 

■ 요약: Recent advances in Artificial Intelligence (AI), especially in the area of deep reinforcement learning (RL), have been responsible for breakthrough results in robotics. For a specific type of RL, known as multigoal RL, the agent learns to achieve multiple different goals (objectives) with a goal-conditioned policy. The goal-conditioned policy is trained to effectively generalize its behavior for multiple goals. For complex goals, the agent finishes a task after completing a long sequence of actions. For example, it can take thousands of actions for an agent to solve a Rubik’s cube. Because of the long delay to receive feedback, the agent is not able to recognize key actions that were the important ones leading to success. In this talk, we will present a recent change in paradigm from model-free to model-based techniques in deep RL. The agent not only tries to train a policy to maximize future rewards received but also tries to infer and internalize information about the environment, such as predicting future rewards received, learning the environment dynamics, and understanding its own learning capabilities. We present our results proposing a rewards prediction model to detect the most important action contributing to the accomplishment of a task by an agent and also discuss recent results obtained in different environments.

번호 제목 글쓴이 날짜 조회 수
124 조천식녹색교통대학원 세미나 안내(3월 2일 수요일, 김경철교수) file 관리자 2011.03.02 699
123 조천식녹색교통대학원 세미나 안내(3월 9일 수요일, 장인권교수) file 관리자 2011.03.09 777
122 조천식녹색교통대학원 세미나 안내(3월 16일 수요일, 윤윤진교수) file 관리자 2011.03.15 777
121 조천식녹색교통대학원(3월 23일 수요일, 최성임교수) file 관리자 2011.03.29 2028
120 조천식녹색교통대학원 세미나 안내(4월 6일 수요일, 한국항공우주연구원 이주진원장) file 관리자 2011.03.29 750
119 4월 13일 수요일 한국철도시설공단 김영국 KR원장 file 관리자 2011.04.13 801
118 7월 7월 오전 11시, GM Global R&D 금동석 박사 file 관리자 2011.07.07 1374
117 세미나 개최안내 (3월 8일 목요일, 연세대 김철구 교수) 관리자 2012.03.06 1139
116 세미나 개최안내 (3월 15일 목요일, 서울대 이경수 교수) 관리자 2012.03.14 932
115 세미나 개최안내 (3월 22일 목요일, 경북대 한동석) 관리자 2012.03.20 1407
114 세미나 개최안내 (4월 5일 목요일, 홍익대 이수용 교수) 관리자 2012.04.03 822
113 세미나 개최안내 (4월 9일 월요일, 스마트하이웨이사업단 박상욱 단장) 관리자 2012.04.07 708
112 세미나 개최안내 (4월 19일 월요일, 항공우주연구원 염찬홍 센터장) 관리자 2012.04.17 889
111 세미나 개최안내 (5월 3일 목요일, 건국대 윤광준 교수) file 관리자 2012.05.01 821
110 세미나 개최안내 (5월 10일 목요일, 서울대 서승우 교수) 관리자 2012.05.08 927
109 세미나 개최안내(9월 19일 수요일, 한국항공우주연구원 허문범팀장) 관리자 2012.09.19 626
108 세미나 안내(9월26일 수요일, 동원OLEV-정태승사장) 관리자 2012.09.25 695
107 세미나 안내(10월4일 목요일, 조천식녹색교통대학원-금동석교수) 관리자 2012.09.29 639
106 세미나 안내 (10월10일 수요일, UNIST 김남훈교수) 관리자 2012.10.09 596
105 세미나 개최안내 (10월18일 목요일, 한국철도시설공단 최강윤기술본부장) 관리자 2012.10.16 523