Daniil Tiapkin

Навело

	Све	Од 2020
Наводи	169	168
h-индекс	9	9
i10-индекс	7	7

2020202120222023202420253 6 18 45 70 24

Јавни приступ

Прикажи све

6 чланака

1 чланак

доступно

није доступно

На основу услова финансирања

Коаутори

Alexey NaumovProfessor, HSE UniversityВерификована је имејл адреса на hse.ru
Eric MoulinesProfesseur, Ecole Polytechnique, Membre de l'Académie des SciencesВерификована је имејл адреса на polytechnique.edu
Michal ValkoChief Models Officer @ Stealth Startup, Inria & MVA - Ex: Llama at Meta; Gemini and BYOL @ DeepmindВерификована је имејл адреса на meta.com
Prof. Dr. Denis BelomestnyDuisburg-Essen UniversityВерификована је имејл адреса на uni-due.de
Pierre MénardOvGU MagdeburgВерификована је имејл адреса на inria.fr
Sergey SamsonovHSE university, MoscowВерификована је имејл адреса на hse.ru
Daniele CalandrielloResearch Scientist, DeepMindВерификована је имејл адреса на google.com
Nikita MorozovHSE UniversityВерификована је имејл адреса на hse.ru
Rémi MunosFAIR, MetaВерификована је имејл адреса на inria.fr
Yunhao TangResearch Scientist, Llama research team; Previously, DeepMindВерификована је имејл адреса на columbia.edu
Dmitry VetrovProfessor of Computer Science at Constructor University, BremenВерификована је имејл адреса на constructor.university
Alexander GasnikovMIPTВерификована је имејл адреса на mipt.ru
Sholom SchechtmanTélécom SudParisВерификована је имејл адреса на telecom-sudparis.eu
Michael MuehlebachMax Planck Institute for Intelligent SystemsВерификована је имејл адреса на tuebingen.mpg.de
Darina DvinskikhHSE UniversityВерификована је имејл адреса на hse.ru
Michael I. JordanProfessor of Electrical Engineering and Computer Sciences and Professor of Statistics, UC BerkeleyВерификована је имејл адреса на cs.berkeley.edu
Pavel DvurechenskyWeierstrass Institute for Applied Analysis and StochasticsВерификована је имејл адреса на wias-berlin.de
Mark RowlandResearch Scientist, Google DeepMindВерификована је имејл адреса на google.com
Alain DurmusEcole polytechniqueВерификована је имејл адреса на polytechnique.edu
Antoine ScheidPhD student, Ecole polytechniqueВерификована је имејл адреса на polytechnique.edu

Прати

Daniil Tiapkin

Друга именаDaniil Tyapkin, Daniil Nikolaevich Tyapkin

École Polytechnique

Верификована је имејл адреса на polytechnique.edu - Почетна страница

optimization reinforcement learning


Наслов Сортирај по наводима Сортирај по години Сортирај по наслову	Навело Навело	Година
Improved complexity bounds in wasserstein barycenter problem D Dvinskikh, D Tiapkin International Conference on Artificial Intelligence and Statistics, 1738-1746, 2021	27	2021
Generative Flow Networks as Entropy-Regularized RL D Tiapkin, N Morozov, A Naumov, D Vetrov AISTATS-2024, 2023	25	2023
From Dirichlet to Rubin: Optimistic Exploration in RL without Bonuses D Tiapkin, D Belomestny, E Moulines, A Naumov, S Samsonov, Y Tang, ... International Conference on Machine Learning, 21380-21431, 2022	20	2022
Fast Rates for Maximum Entropy Exploration D Tiapkin, D Belomestny, D Calandriello, E Moulines, R Munos, ... International Conference on Machine Learning, 2023	18	2023
Stochastic saddle-point optimization for the Wasserstein barycenter problem D Tiapkin, A Gasnikov, P Dvurechensky Optimization Letters 16 (7), 2145-2175, 2022	13	2022
Primal-Dual Stochastic Mirror Descent for MDPs D Tiapkin, A Gasnikov International Conference on Artificial Intelligence and Statistics, 9723-9740, 2022	13	2022
Optimistic Posterior Sampling for Reinforcement Learning with Few Samples and Tight Guarantees D Tiapkin, D Belomestny, D Calandriello, E Moulines, R Munos, ... Neural Information Processing Systems, 2022	11	2022
Improved High-Probability Bounds for the Temporal Difference Learning Algorithm via Exponential Stability S Samsonov, D Tiapkin, A Naumov, E Moulines The Thirty Seventh Annual Conference on Learning Theory, 4511-4547, 2024	9*	2024
Orthogonal Directions Constrained Gradient Method: from non-linear equality constraints to Stiefel manifold S Schechtman, D Tiapkin, M Muehlebach, E Moulines The Thirty Sixth Annual Conference on Learning Theory, 1228-1258, 2023	9	2023
Demonstration-Regularized RL D Tiapkin, D Belomestny, D Calandriello, E Moulines, A Naumov, ... ICLR-2024, 2023	8*	2023
Incentivized Learning in Principal-Agent Bandit Games A Scheid, D Tiapkin, E Boursier, A Capitaine, EME Mhamdi, É Moulines, ... arXiv preprint arXiv:2403.03811, 2024	6	2024
Model-free posterior sampling via learning rate randomization D Tiapkin, D Belomestny, D Calandriello, E Moulines, R Munos, ... Advances in Neural Information Processing Systems 36, 73719-73774, 2023	3	2023
First-Order Constrained Optimization: Non-smooth Dynamical System Viewpoint S Schechtman, D Tiapkin, E Moulines, MI Jordan, M Muehlebach IFAC-PapersOnLine 55 (16), 236-241, 2022	3	2022
Improving GFlowNets with Monte Carlo Tree Search N Morozov, D Tiapkin, S Samsonov, A Naumov, D Vetrov arXiv preprint arXiv:2406.13655, 2024	2	2024
Federated UCBVI: Communication-Efficient Federated Regret Minimization with Heterogeneous Agents S Labbi, D Tiapkin, L Mancini, P Mangold, E Moulines arXiv preprint arXiv:2410.22908, 2024	1	2024
Optimizing Backward Policies in GFlowNets via Trajectory Likelihood Maximization T Gritsaev, N Morozov, S Samsonov, D Tiapkin arXiv preprint arXiv:2410.15474, 2024	1	2024
Revisiting Non-Acyclic GFlowNets in Discrete Environments N Morozov, I Maksimov, D Tiapkin, S Samsonov arXiv preprint arXiv:2502.07735, 2025		2025
On Teacher Hacking in Language Model Distillation D Tiapkin, D Calandriello, J Ferret, S Perrin, N Vieillard, A Ramé, ... arXiv preprint arXiv:2502.02671, 2025		2025
A New Bound on the Cumulant Generating Function of Dirichlet Processes P Perrault, D Belomestny, P Ménard, É Moulines, A Naumov, D Tiapkin, ... arXiv preprint arXiv:2409.18621, 2024		2024
Narrowing the Gap between Adversarial and Stochastic MDPs via Policy Optimization D Tiapkin, E Chzhen, G Stoltz arXiv preprint arXiv:2407.05704, 2024		2024

Систем тренутно не може да изврши ову радњу. Пробајте поново касније.

Чланци 1–20

Годишњи број навода

Дупли наводи

Обједињени наводи

Додавање коаутораКоаутори

Прати

Навело

Коаутори