Alexander Nikulin

Citata da

	Tutte	Dal 2020
Citazioni	245	245
Indice H	8	8
i10-index	8	8

180

135

20222023202420255 56 173 10

Accesso pubblico

Visualizza tutto

1 articolo

0 articoli

Disponibili

Non disponibili

In base ai mandati di finanziamento

Coautori

Vladislav Kurenkovdunnolab, AIRIEmail verificata su innopolis.ru
Denis TarasovETH ZurichEmail verificata su ethz.ch
Sergey KolesnikovEmail verificata su phystech.edu
Ilya Zismandunnolab, AIRIEmail verificata su edu.hse.ru
Dmitry AkimovIndependent ResearcherEmail verificata su edu.hse.ru
Viacheslav SiniiT-BankEmail verificata su tinkoff.ru
Oleg SvidchenkoJetBrains ResearchEmail verificata su jetbrains.com
Aleksei ShpilmanGazprom neft / HSE / ITMOEmail verificata su shpilman.com
Yury BelousovUniversity of GenevaEmail verificata su unige.ch
Alexander ItinHamburg University of TechnologyEmail verificata su tuhh.de

Segui

Alexander Nikulin

dunnolab.ai

Email verificata su phystech.edu - Home page

reinforcement learning embodied ai


Titolo Ordina per citazioni Ordina per anno Ordina per titolo	Citata da Citata da	Anno
CORL: Research-oriented deep offline reinforcement learning library D Tarasov, A Nikulin, D Akimov, V Kurenkov, S Kolesnikov Advances in Neural Information Processing Systems 36, 2024	82	2024
Revisiting the minimalist approach to offline reinforcement learning D Tarasov, V Kurenkov, A Nikulin, S Kolesnikov Advances in Neural Information Processing Systems 36, 2024	28	2024
Minerl diamond 2021 competition: Overview, results, and lessons learned A Kanervisto, S Milani, K Ramanauskas, N Topin, Z Lin, J Li, J Shi, D Ye, ... NeurIPS 2021 Competitions and Demonstrations Track, 13-28, 2022	28	2022
Anti-exploration by random network distillation A Nikulin, V Kurenkov, D Tarasov, S Kolesnikov International Conference on Machine Learning, 26228-26244, 2023	27	2023
Q-ensemble for offline rl: Don't scale the ensemble, scale the batch size A Nikulin, V Kurenkov, D Tarasov, D Akimov, S Kolesnikov arXiv preprint arXiv:2211.11092, 2022	19	2022
XLand-minigrid: Scalable meta-reinforcement learning environments in JAX A Nikulin, V Kurenkov, I Zisman, A Agarkov, V Sinii, S Kolesnikov arXiv preprint arXiv:2312.12044, 2023	16	2023
Let offline rl flow: Training conservative agents in the latent space of normalizing flows D Akimov, V Kurenkov, A Nikulin, D Tarasov, S Kolesnikov arXiv preprint arXiv:2211.11096, 2022	12	2022
In-context reinforcement learning for variable action spaces V Sinii, A Nikulin, V Kurenkov, I Zisman, S Kolesnikov arXiv preprint arXiv:2312.13327, 2023	10	2023
Machine learning models for photonic crystals band diagram prediction and gap optimisation A Nikulin, I Zisman, M Eich, AY Petrov, A Itin Photonics and Nanostructures-Fundamentals and Applications 52, 101076, 2022	8	2022
Open RL Benchmark: Comprehensive Tracked Experiments for Reinforcement Learning S Huang, Q Gallouédec, F Felten, A Raffin, RFJ Dossa, Y Zhao, ... arXiv preprint arXiv:2402.03046, 2024	7	2024
Emergence of In-Context Reinforcement Learning from Noise Distillation I Zisman, V Kurenkov, A Nikulin, V Sinii, S Kolesnikov arXiv preprint arXiv:2312.12275, 2023	5	2023
Katakomba: tools and benchmarks for data-driven NetHack V Kurenkov, A Nikulin, D Tarasov, S Kolesnikov Advances in Neural Information Processing Systems 36, 2024	2	2024
XLand-100B: A Large-Scale Multi-Task Dataset for In-Context Reinforcement Learning A Nikulin, I Zisman, A Zemtsov, V Sinii, V Kurenkov, S Kolesnikov arXiv preprint arXiv:2406.08973, 2024	1	2024
Latent Action Learning Requires Supervision in the Presence of Distractors A Nikulin, I Zisman, D Tarasov, N Lyubaykin, A Polubarov, I Kiselev, ... arXiv preprint arXiv:2502.00379, 2025		2025
Vintix: Action Model via In-Context Reinforcement Learning A Polubarov, N Lyubaykin, A Derevyagin, I Zisman, D Tarasov, A Nikulin, ... arXiv preprint arXiv:2501.19400, 2025		2025
N-Gram Induction Heads for In-Context RL: Improving Stability and Reducing Data Needs I Zisman, A Nikulin, A Polubarov, N Lyubaykin, V Kurenkov arXiv preprint arXiv:2411.01958, 2024		2024

Il sistema al momento non può eseguire l'operazione. Riprova più tardi.

Articoli 1–16

Citazioni per anno

Citazioni duplicate

Citazioni unite

Aggiungi coautoriCoautori

Segui

Citata da

Coautori