Priyank Agrawal

Cytowane przez

	Wszystkie	Od 2020
Cytowania	100	99
h-indeks	4	4
i10-indeks	3	3

2020202120222023202420251 7 14 24 38 14

Dostęp publiczny

Wyświetl wszystko

1 artykuł

0 artykułów

dostępne

niedostępne

Objęte finansowaniem

Współautorzy

Theja TulabandhulaUniversity of Illinois ChicagoZweryfikowany adres z alum.mit.edu
Vasilis GkatzelisDrexel University, Computer ScienceZweryfikowany adres z drexel.edu
Xizhi TanPhD. Student, Drexel UniversityZweryfikowany adres z drexel.edu
Eric BalkanskiColumbia UniversityZweryfikowany adres z columbia.edu
Tingting OuColumbia UniversityZweryfikowany adres z columbia.edu
Nan JiangAssociate Professor of Computer Science, UIUCZweryfikowany adres z illinois.edu
Jinglin ChenUniversity of Illinois Urbana-ChampaignZweryfikowany adres z illinois.edu
Vashist AvadhanulaHead of Data Science, MolocoZweryfikowany adres z moloco.com
Shipra AgrawalColumbia universityZweryfikowany adres z columbia.edu
Navdeep KumarTechnionZweryfikowany adres z campus.technion.ac.il
Kfir Yehuda LevyAssociate Professor at Technion - Israel Institute of TechnologyZweryfikowany adres z technion.ac.il
Shie MannorProfessor of Electrical Engineering @ Technion & Researcher @ NvidiaZweryfikowany adres z technion.ac.il
Giorgia RamponiAssistant Professor, University of ZurichZweryfikowany adres z ifi.uzh.ch

Obserwuj

Priyank Agrawal

Columbia University

Zweryfikowany adres z columbia.edu - Strona główna


Tytuł Sortuj wg cytatów Sortuj wg roku Sortuj wg tytułu	Cytowane przez Cytowane przez	Rok
Learning-augmented mechanism design: Leveraging predictions for facility location P Agrawal, E Balkanski, V Gkatzelis, T Ou, X Tan Proceedings of the 23rd ACM Conference on Economics and Computation, 497-528, 2022	49	2022
Improved worst-case regret bounds for randomized least-squares value iteration P Agrawal, J Chen, N Jiang Proceedings of the AAAI Conference on Artificial Intelligence 35 (8), 6566-6573, 2021	23	2021
A tractable online learning algorithm for the multinomial logit contextual bandit P Agrawal, T Tulabandhula, V Avadhanula European Journal of Operational Research 310 (2), 737-750, 2023	17	2023
Incentivising exploration and recommendations for contextual bandits with payments P Agrawal, T Tulabandhula Multi-Agent Systems and Agreement Technologies: 17th European Conference …, 2020	5	2020
Optimistic Q-learning for average reward and episodic reinforcement learning P Agrawal, S Agrawal arXiv preprint arXiv:2407.13743, 2024	3	2024
Learning by repetition: Stochastic multi-armed bandits under priming effect P Agrawal, T Tulabandula Conference on Uncertainty in Artificial Intelligence, 470-479, 2020	3	2020
Improved Sample Complexity for Global Convergence of Actor-Critic Algorithms N Kumar, P Agrawal, G Ramponi, KY Levy, S Mannor arXiv preprint arXiv:2410.08868, 2024		2024
Bandits with Temporal Stochastic Constraints P Agrawal, T Tulabandhula arXiv preprint arXiv:1811.09026, 2018		2018
Policy Gradient with Tree Search (PGTS) in Reinforcement Learning Evades Local Maxima N Kumar, P Agrawal, KY Levy, S Mannor The Second Tiny Papers Track at ICLR 2024, 0

Nie można teraz wykonać tej operacji. Spróbuj ponownie później.

Prace 1–9

Cytowania rocznie

Powielone cytowania

Scalone cytowania

Dodaj współautorówWspółautorzy

Obserwuj

Cytowane przez

Współautorzy