Archit Sharma

Citata da

	Tutte	Dal 2020
Citazioni	4173	4163
Indice H	18	18
i10-index	22	22

3200

1600

800

2400

20202021202220232024202552 116 140 425 3149 273

Accesso pubblico

Visualizza tutto

4 articoli

0 articoli

Disponibili

Non disponibili

In base ai mandati di finanziamento

Coautori

Chelsea FinnStanford University, Physical IntelligenceEmail verificata su cs.stanford.edu
Sergey LevineUC Berkeley, Physical IntelligenceEmail verificata su eecs.berkeley.edu
Karol HausmanPhysical Intelligence, StanfordEmail verificata su physicalintelligence.company
Shixiang Shane GuGoogle DeepMindEmail verificata su google.com
Abhishek GuptaUniversity of WashingtonEmail verificata su cs.washington.edu

Segui

Archit Sharma

PhD Student, Stanford University

Email verificata su stanford.edu - Home page

Reinforcement Learning Machine Learning Robotics


Titolo Ordina per citazioni Ordina per anno Ordina per titolo	Citata da Citata da	Anno
Direct preference optimization: Your language model is secretly a reward model R Rafailov, A Sharma, E Mitchell, CD Manning, S Ermon, C Finn Advances in Neural Information Processing Systems 36, 2024	2346	2024
Dynamics-aware unsupervised discovery of skills A Sharma, S Gu, S Levine, V Kumar, K Hausman International Conference on Learning Representations (ICLR), 2020, 2019	490	2019
Open X-Embodiment: Robotic learning Datasets and RT-X Models A Padalkar, A Pooley, A Jain, A Bewley, A Herzog, A Irpan, A Khazatsky, ... arXiv preprint arXiv:2310.08864, 2023	458*	2023
Just Ask for Calibration: Strategies for Eliciting Calibrated Confidence Scores from Language Models Fine-Tuned with Human Feedback K Tian, E Mitchell, A Zhou, A Sharma, R Rafailov, H Yao, C Finn, ... arXiv preprint arXiv:2305.14975, 2023	220	2023
DROID: A Large-Scale In-The-Wild Robot Manipulation Dataset A Khazatsky, K Pertsch, S Nair, A Balakrishna, S Dasari, S Karamcheti, ... arXiv preprint arXiv:2403.12945, 2024	104	2024
Preference fine-tuning of llms should leverage suboptimal, on-policy data F Tajwar, A Singh, A Sharma, R Rafailov, J Schneider, T Xie, S Ermon, ... arXiv preprint arXiv:2404.14367, 2024	63	2024
Variational empowerment as representation learning for goal-based reinforcement learning J Choi, A Sharma, H Lee, S Levine, SS Gu arXiv preprint arXiv:2106.01404, 2021	58*	2021
Emergent Real-World Robotic Skills via Unsupervised Off-Policy Reinforcement Learning A Sharma, M Ahn, S Levine, V Kumar, K Hausman, S Gu Robotics: Science and Systems (RSS), 2020	50	2020
Waypoint-Based Imitation Learning for Robotic Manipulation LX Shi, A Sharma, TZ Zhao, C Finn arXiv preprint arXiv:2307.14326, 2023	45	2023
Yell At Your Robot: Improving On-the-Fly from Language Corrections LX Shi, Z Hu, TZ Zhao, A Sharma, K Pertsch, J Luo, S Levine, C Finn arXiv preprint arXiv:2403.12910, 2024	40	2024
Autonomous Reinforcement Learning via Subgoal Curricula A Sharma, A Gupta, S Levine, K Hausman, C Finn Thirty-Fifth Conference on Neural Information Processing Systems, 2021	37	2021
Autonomous Reinforcement Learning: Formalism and Benchmarking A Sharma, K Xu, N Sardana, A Gupta, K Hausman, S Levine, C Finn arXiv preprint arXiv:2112.09605, 2021	36*	2021
An Emulator for Fine-Tuning Large Language Models using Small Language Models E Mitchell, R Rafailov, A Sharma, C Finn, CD Manning arXiv preprint arXiv:2310.12962, 2023	32	2023
SERL: A Software Suite for Sample-Efficient Robotic Reinforcement Learning J Luo, Z Hu, C Xu, YL Tan, J Berg, A Sharma, S Schaal, C Finn, A Gupta, ... arXiv preprint arXiv:2401.16013, 2024	28	2024
You Only Live Once: Single-Life Reinforcement Learning A Chen, A Sharma, S Levine, C Finn Advances in Neural Information Processing Systems 35, 14784-14797, 2022	26	2022
A State-Distribution Matching Approach to Non-Episodic Reinforcement Learning A Sharma, R Ahmad, C Finn arXiv preprint arXiv:2205.05212, 2022	20	2022
Robot fine-tuning made easy: Pre-training rewards and policies for autonomous real-world reinforcement learning J Yang, MS Mark, B Vu, A Sharma, J Bohg, C Finn 2024 IEEE International Conference on Robotics and Automation (ICRA), 4804-4811, 2024	19	2024
Stream of Search (SoS): Learning to Search in Language K Gandhi, D Lee, G Grand, M Liu, W Cheng, A Sharma, ND Goodman arXiv preprint arXiv:2404.03683, 2024	18	2024
Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement Learning A Sharma, AM Ahmed, R Ahmad, C Finn arXiv preprint arXiv:2303.01488, 2023	15	2023
Language Model Detectors Are Easily Optimized Against C Nicks, E Mitchell, R Rafailov, A Sharma, CD Manning, C Finn, S Ermon The Twelfth International Conference on Learning Representations, 2023	14	2023

Il sistema al momento non può eseguire l'operazione. Riprova più tardi.

Articoli 1–20

Citazioni per anno

Citazioni duplicate

Citazioni unite

Aggiungi coautoriCoautori

Segui

Citata da

Coautori