Učitavanje...
Sustav trenutno ne može provesti ovu radnju. Pokušajte ponovo kasnije.
Godišnji broj citata
Dvostruki navodi
Sljedeći su članci spojeni u Znalcu.
Navodi iz obaju
članaka broje se samo za prvi članak.
Spojeni navodi
Zbroj za "Citirano" uključuje navode sljedećeg članka u Znalcu. Oni koji su označeni znakom
*
mogu biti različiti od članka u profilu.
Dodavanje suautora
Suautori
Prati
Novi članci tog autora
Novi navodi tog autora
Novi članci povezani s istraživanjem tog autora
E-adresa za obavijesti
Završeno
Moj profil
Moja knjižnica
Mjerni podaci
Upozorenja
Postavke
Prijavite se
Prijavite se
Izradite svoj profil
Javni pristup
Prikaži sve
Prikaži sve
1 članak
0 članaka
dostupno
nije dostupno
Na temelju uvjeta financiranja
Suautori
Longbo Huang
Professor, IIIS, Tsinghua University, ACM Distinguished Scientist
Potvrđena adresa e-pošte na tsinghua.edu.cn
Zhuoran Li
Tsinghua University
Potvrđena adresa e-pošte na mails.tsinghua.edu.cn
Bolei Zhang
Nanjing University of Posts and Telecommunications
Potvrđena adresa e-pošte na njupt.edu.cn
Haonan Chen
National University of Singapore
Potvrđena adresa e-pošte na u.nus.edu
Junming Yang
Southeast University
Potvrđena adresa e-pošte na seu.edu.cn
Prati
Xun Wang
PhD student,
Tsinghua University
Potvrđena adresa e-pošte na mails.tsinghua.edu.cn -
Početna stranica
Reinforcement Learning
Članci
Javni pristup
Suautori
Naslov
Razvrstaj
Poredaj po navodima
Poredaj po godini
Poredaj po naslovu
Citirano
Citirano
Godina
Few is More: Task-Efficient Skill-Discovery for Multi-Task Offline Multi-Agent Reinforcement Learning
X Wang, Z Li, H Zhong, L Huang
arXiv preprint arXiv:2502.08985
, 2025
2025
Offline-to-Online Multi-Agent Reinforcement Learning with Offline Value Function Memory and Sequential Exploration
H Zhong, X Wang, Z Li, L Huang
arXiv preprint arXiv:2410.19450
, 2024
2024
SDV: Simple Double Validation Model-Based Offline Reinforcement Learning
X Wang, H Chen, J Yang, Z Qian, B Zhang
ECAI 2023, 2568-2574
, 2023
2023
Sustav trenutno ne može provesti ovu radnju. Pokušajte ponovo kasnije.
Članci 1–3
Prikaži više
Privatnost
Uvjeti
Pomoć
O Znalcu
Pomoć za pretraživanje