로드 중...
현재 시스템이 작동되지 않습니다. 나중에 다시 시도해 주세요.
연간 인용횟수
중복된 서지정보
다음 학술 문서는 학술검색에서 병합되어 있습니다.
총 인용
횟수가 첫 번째 학술 문서에 대해서만 계산됩니다.
병합된 서지정보
이 '인용' 횟수는 학술검색의 다음 학술 문서에 대한 인용문을 포함합니다.
*
표시된 인용문은 프로필에 있는 학술 문서와 다를 수 있습니다.
공동 저자 추가
공동 저자
팔로우
이 저자의 새 학술자료
이 저자를 인용한 새 학술자료
이 저자의 연구와 관련된 새 학술자료
업데이트를 받을 이메일 주소
완료
내 프로필
내 서재
통계
알리미
설정
로그인
로그인
내 프로필 만들기
인용
전체
2020년 이후
서지정보
21
21
h-index
1
1
i10-index
1
1
0
12
6
2022
2023
2024
3
7
11
공동 저자
Frederik Träuble
Max Planck Institute for Intelligent Systems
tuebingen.mpg.de의 이메일 확인됨
Francesco Locatello
Assistant Professor, ISTA
ista.ac.at의 이메일 확인됨
Stefan Bauer
Helmholtz | TUM | CIFAR
tum.de의 이메일 확인됨
Bernhard Schölkopf
Director, Max Planck Institute for Intelligent Systems & ELLIS Institute Tübingen; Professor at ETH
tuebingen.mpg.de의 이메일 확인됨
팔로우
Davide Mambelli
TU Delft and Booking.com
booking.com의 이메일 확인됨 -
홈페이지
Reinforcement Learning
Multi-agent systems
Robotics
학술자료
인용
공동 저자
제목
정렬
서지정보순 정렬
연도순 정렬
제목순 정렬
인용
인용
연도
Compositional multi-object reinforcement learning with linear relation networks
D Mambelli, F Träuble, S Bauer, B Schölkopf, F Locatello
arXiv preprint arXiv:2201.13388
, 2022
21
2022
When Do Off-Policy and On-Policy Policy Gradient Methods Align?
D Mambelli, S Bongers, O Zoeter, MTJ Spaan, FA Oliehoek
arXiv preprint arXiv:2402.12034
, 2024
2024
현재 시스템이 작동되지 않습니다. 나중에 다시 시도해 주세요.
학술자료 1–2
더보기
개인정보처리방침
약관
도움말
학술검색 정보
검색 도움말