• >
  • 학과소식
  • >
  • 세미나


■ 제목: Identifying the key actions that lead an agent to accomplish a task in model-based deep reinforcement learning

■ 연사: Luiz Felipe Vecchietti 박사(KAIST 기계기술연구소)

■ 일시: 10.14(목) 16:00

■ URL: https://kaist.zoom.us/j/88529018177?pwd=YkdsV1FKRGl5Z1g3Q1Z6amxNTTlWZz09 

■ 요약: Recent advances in Artificial Intelligence (AI), especially in the area of deep reinforcement learning (RL), have been responsible for breakthrough results in robotics. For a specific type of RL, known as multigoal RL, the agent learns to achieve multiple different goals (objectives) with a goal-conditioned policy. The goal-conditioned policy is trained to effectively generalize its behavior for multiple goals. For complex goals, the agent finishes a task after completing a long sequence of actions. For example, it can take thousands of actions for an agent to solve a Rubik’s cube. Because of the long delay to receive feedback, the agent is not able to recognize key actions that were the important ones leading to success. In this talk, we will present a recent change in paradigm from model-free to model-based techniques in deep RL. The agent not only tries to train a policy to maximize future rewards received but also tries to infer and internalize information about the environment, such as predicting future rewards received, learning the environment dynamics, and understanding its own learning capabilities. We present our results proposing a rewards prediction model to detect the most important action contributing to the accomplishment of a task by an agent and also discuss recent results obtained in different environments.

번호 제목 글쓴이 날짜 조회 수
104 세미나 개최안내 (10월 23일 화요일, 한국철도공사 배영규팀장) 관리자 2012.10.23 495
103 세미나 개최안내 (10월 30일 화요일,Boeing Research and Technology 이상욱박사 ) 관리자 2012.10.25 545
102 세미나 개최안내 (11월 22일 목요일, 한국전자통신연구소 이상욱팀장) 관리자 2012.11.22 486
101 [세미나개최]12월5일(수),자동차성능연구소 신재곤팀장 관리자 2012.12.04 588
100 [세미나개최]12월13일(목) 채일권(서울대 책임연구원) 관리자 2012.12.13 629
99 [세미나개최]12월24일(월) Griffith University, Australia,Professor Jun Jo 관리자 2012.12.25 624
98 [세미나개최]3월7일 목요일, 신정호박사(eTRIZ 대표) 관리자 2013.03.07 590
97 [세미나개최]3월14일 목요일,안창선박사(한국기계연구원 자기부상연구실) 관리자 2013.03.14 643
96 [세미나개최]3월21일 목요일,서승일 신교통연구본부장(한국철도기술연구원) 관리자 2013.03.22 629
95 [세미나개최]3월28일 목요일,이재욱교수(한국항공대학교) 관리자 2013.03.28 787
94 [세미나개최]4월4일 목요일,조성균 서기관(국토해양부) 관리자 2013.04.04 626
93 [세미나개최]4월18일 목요일,노홍승 물류정책 기술본부장(한국교통연구원) 관리자 2013.04.17 665
92 [세미나개최]5월2일 목요일,박덕신 연구실장(한국철도기술연구원 에코시스템연구실장) 관리자 2013.05.03 647
91 [세미나개최]5월9일 목요일, 이춘범 단장(자동차부품연구원 핵심연구단장) 관리자 2013.05.08 693
90 [세미나개최]5월16일 목요일,윤대섭박사(한국전자통신연구원) 관리자 2013.05.16 666
89 [세미나개최]5월23일 목요일,권용장 단장(한국철도기술연구원 첨단물류시스템연구단장) 관리자 2013.05.24 725
88 [세미나개최]6월13일 목요일,염병수 박사(한국철도공사 국가R&D기획팀장) 관리자 2013.06.13 774
87 [GSGT] ICC Global lecture, Prof. Andrew George Brooks, 8/19(월)~8/26(월) 관리자 2013.07.13 483
86 [공동세미나] Luigi Colani 교수 초청 공동 세미나 "Towards Unconventional Design" file 관리자 2013.09.10 699
85 [GSGT] 정기세미나 개최안내(9월12일(목) 16시, 최종묵 상무, 현대로템) 관리자 2013.09.12 629