Aviral Kumar

Посилання

	Усі	З 2020
Цитування	16390	16323
h-індекс	42	42
i10-індекс	60	60

8000

4000

2000

6000

201920202021202220232024202553 329 1119 2160 3503 7805 1384

Доступні для всіх

Переглянути всі

21 стаття

0 статей

доступні

недоступні

За умовами фінансування

Співавтори

Sergey LevineUC Berkeley, Physical IntelligenceПідтверджена електронна адреса в eecs.berkeley.edu
George TuckerGoogle DeepMindПідтверджена електронна адреса в google.com
Chelsea FinnStanford University, Physical IntelligenceПідтверджена електронна адреса в cs.stanford.edu
Anikait SinghStanford UniversityПідтверджена електронна адреса в stanford.edu
Rishabh AgarwalStaff Research Scientist, Google DeepMind. Adjunct Prof, McGillПідтверджена електронна адреса в google.com
Yevgen ChebotarRobot AI at FigureПідтверджена електронна адреса в figure.ai
Tianhe YuGoogle DeepMindПідтверджена електронна адреса в google.com
Aurick ZhouGoogle DeepMindПідтверджена електронна адреса в berkeley.edu
Xue Bin PengAssistant Professor at Simon Fraser University, Research Scientist at NVIDIAПідтверджена електронна адреса в sfu.ca
Kevin SwerskyGoogle BrainПідтверджена електронна адреса в cs.toronto.edu

Підписатись

Aviral Kumar

CMU & Google DeepMind

Підтверджена електронна адреса в andrew.cmu.edu - Домашня сторінка

Machine Learning Reinforcement Learning


Назва Сортувати за цитуваннями Сортувати за роком Сортувати за назвою	Посилання Посилання	Рік
Gemini: a family of highly capable multimodal models G Team, R Anil, S Borgeaud, JB Alayrac, J Yu, R Soricut, J Schalkwyk, ... arXiv preprint arXiv:2312.11805, 2023	3181	2023
Offline reinforcement learning: Tutorial, review, and perspectives on open problems S Levine, A Kumar, G Tucker, J Fu arXiv preprint arXiv:2005.01643, 2020	2198	2020
Conservative q-learning for offline reinforcement learning A Kumar, A Zhou, G Tucker, S Levine Advances in Neural Information Processing Systems 33, 1179-1191, 2020	2088	2020
D4rl: Datasets for deep data-driven reinforcement learning J Fu, A Kumar, O Nachum, G Tucker, S Levine arXiv preprint arXiv:2004.07219, 2020	1306	2020
Stabilizing Off-Policy Q-Learning via Bootstrapping Error Reduction A Kumar, J Fu, G Tucker, S Levine NeuRIPS 2019, arXiv:1906.00949, 2019	1197	2019
Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context M Reid, N Savinov, D Teplyashin, D Lepikhin, T Lillicrap, J Alayrac, ... arXiv preprint arXiv:2403.05530, 2024	1116	2024
Advantage-weighted regression: Simple and scalable off-policy reinforcement learning XB Peng, A Kumar, G Zhang, S Levine arXiv preprint arXiv:1910.00177, 2019	575	2019
Combo: Conservative offline model-based policy optimization T Yu, A Kumar, R Rafailov, A Rajeswaran, S Levine, C Finn Advances in neural information processing systems 34, 28954-28967, 2021	456	2021
Trainable calibration measures for neural networks from kernel mean embeddings A Kumar, S Sarawagi, U Jain International Conference on Machine Learning, 2805-2814, 2018	327	2018
Graph Normalizing Flows J Liu, A Kumar, J Ba, J Kiros, K Swersky NeurIPS 2019, arxiv:1905.13177, 2019	309*	2019
Opal: Offline primitive discovery for accelerating offline reinforcement learning A Ajay, A Kumar, P Agrawal, S Levine, O Nachum arXiv preprint arXiv:2010.13611, 2020	197	2020
Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters C Snell, J Lee, K Xu, A Kumar arXiv preprint arXiv:2408.03314, 2024	183	2024
Diagnosing Bottlenecks in Deep Q-learning Algorithms J Fu, A Kumar, M Soh, S Levine International Conference on Machine Learning (ICML) 2019, https://arxiv.org …, 2019	170	2019
Conservative safety critics for exploration H Bharadhwaj, A Kumar, N Rhinehart, S Levine, F Shkurti, A Garg arXiv preprint arXiv:2010.14497, 2020	157	2020
When should we prefer offline reinforcement learning over behavioral cloning? A Kumar, J Hong, A Singh, S Levine arXiv preprint arXiv:2204.05618, 2022	151*	2022
Why generalization in rl is difficult: Epistemic pomdps and implicit partial observability D Ghosh, J Rahme, A Kumar, A Zhang, RP Adams, S Levine Advances in neural information processing systems 34, 25502-25515, 2021	133	2021
Implicit under-parameterization inhibits data-efficient deep reinforcement learning A Kumar, R Agarwal, D Ghosh, S Levine arXiv preprint arXiv:2010.14498, 2020	123	2020
Discor: Corrective feedback in reinforcement learning via distribution correction A Kumar, A Gupta, S Levine Advances in Neural Information Processing Systems 33, 18560-18572, 2020	123	2020
Cal-ql: Calibrated offline rl pre-training for efficient online fine-tuning M Nakamoto, S Zhai, A Singh, M Sobol Mark, Y Ma, C Finn, A Kumar, ... Advances in Neural Information Processing Systems 36, 2024	119	2024
Cog: Connecting new skills to past experience with offline reinforcement learning A Singh, A Yu, J Yang, J Zhang, A Kumar, S Levine arXiv preprint arXiv:2010.14500, 2020	116	2020

У даний момент система не може виконати операцію. Спробуйте пізніше.

Статті 1–20

Кількість бібліографічних посилань на рік

Повторювані посилання

Об’єднані посилання

Додати співавторівСпівавтори

Підписатись

Посилання

Співавтори