Gokul Swamy

Παρατίθεται από

	Όλα	Από το 2020
Παραθέσεις	421	416
h-index	11	11
i10-index	11	11

240

120

180

20192020202120222023202420255 12 30 45 82 223 24

Δημόσια πρόσβαση

Προβολή όλων

8 άρθρα

0 άρθρα

διαθέσιμα

μη διαθέσιμα

Σύμφωνα με εντολές χρηματοδότησης

Συν-συγγραφείς

Zhiwei Steven WuCarnegie Mellon UniversityΗ διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα andrew.cmu.edu
J. Andrew BagnellCarnegie Mellon UniversityΗ διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα ri.cmu.edu
Sanjiban ChoudhuryAssistant Professor, CornellΗ διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα cornell.edu
Anca D DraganAssistant Professor at UC Berkeley // Director, AI Safety and Alignment, Google DeepMindΗ διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα berkeley.edu
Wen SunAssistant Professor, Cornell UniversityΗ διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα cornell.edu
Dylan Hadfield-MenellMassachusetts Institute of TechnologyΗ διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα csail.mit.edu
Kianté BrantleyAssistant Professor, Harvard UniversityΗ διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα g.harvard.edu
Sergey LevineUC Berkeley, Physical IntelligenceΗ διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα eecs.berkeley.edu
Christoph DannResearch Scientist, GoogleΗ διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα google.com
Alekh AgarwalGoogleΗ διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα google.com
Siddharth ReddyΗ διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα siddharth.io
Wenhao ZhanGraduate Student, Princeton UniversityΗ διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα princeton.edu
Zhaolin GaoCornell UniversityΗ διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα cornell.edu
Jason D. LeeAssociate Professor of Electrical Engineering and Computer Science, Princeton UniversityΗ διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα princeton.edu
Jonathan D. ChangResearch Scientist, Databricks MosaicΗ διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα cornell.edu
Yuda SongCarnegie Mellon UniversityΗ διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα andrew.cmu.edu
Aarti SinghProfessor of Machine Learning Department, Carnegie Mellon UniversityΗ διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα cmu.edu
Nived RajaramanEECS PhD student at UC BerkeleyΗ διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα berkeley.edu
Thorsten JoachimsProfessor of Computer Science, Cornell UniversityΗ διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα cs.cornell.edu
Owen OertellUndergraduate, Cornell UniversityΗ διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα cornell.edu

Παρακολούθηση

Gokul Swamy

PhD Candidate, Carnegie Mellon University

Η διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα andrew.cmu.edu - Αρχική σελίδα

Imitation Learning Reinforcement Learning RLHF


Τίτλος Ταξινόμηση με βάση τις αναφορές Ταξινόμηση κατά έτος Ταξινόμηση κατά τίτλο	Παρατίθεται από Παρατίθεται από	Έτος
Of Moments and Matching: A Game-Theoretic Framework for Closing the Imitation Gap G Swamy, S Choudhury, JA Bagnell, ZS Wu 38th International Conference on Machine Learning (ICML), 2021	84*	2021
On the Utility of Model Learning in HRI G Swamy, J Schulz, R Choudhury, D Hadfield-Menell, A Dragan arXiv preprint arXiv:1901.01291, 2019	68*	2019
A Minimaximalist Approach to Reinforcement Learning from Human Feedback G Swamy, C Dann, R Kidambi, ZS Wu, A Agarwal arXiv preprint arXiv:2401.04056, 2024	58	2024
Scaled autonomy: Enabling human operators to control robot fleets G Swamy, S Reddy, S Levine, AD Dragan 2020 IEEE International Conference on Robotics and Automation (ICRA), 5942-5948, 2020	50	2020
Sequence model imitation learning with unobserved contexts G Swamy, S Choudhury, J Bagnell, SZ Wu Advances in Neural Information Processing Systems 35, 17665-17676, 2022	29	2022
Causal imitation learning under temporally correlated noise G Swamy, S Choudhury, D Bagnell, S Wu International Conference on Machine Learning, 20877-20890, 2022	28	2022
Inverse Reinforcement Learning without Reinforcement Learning G Swamy, S Choudhury, D Bagnell, S Wu International Conference on Machine Learning, 33299-33318, 2023	25	2023
REBEL: Reinforcement Learning via Regressing Relative Rewards Z Gao, JD Chang, W Zhan, O Oertell, G Swamy, K Brantley, T Joachims, ... arXiv preprint arXiv:2404.16767, 2024	17	2024
Minimax Optimal Online Imitation Learning via Replay Estimation G Swamy, N Rajaraman, M Peng, S Choudhury, J Bagnell, SZ Wu, J Jiao, ... Advances in Neural Information Processing Systems 35, 7077-7088, 2022	17	2022
Learning Shared Safety Constraints from Multi-task Demonstrations K Kim, G Swamy, Z Liu, D Zhao, S Choudhury, SZ Wu Advances in Neural Information Processing Systems 36, 2024	13	2024
Hybrid Inverse Reinforcement Learning J Ren, G Swamy, ZS Wu, JA Bagnell, S Choudhury arXiv preprint arXiv:2402.08848, 2024	11	2024
Understanding Preference Fine-Tuning Through the Lens of Coverage Y Song, G Swamy, A Singh, JA Bagnell, W Sun arXiv preprint arXiv:2406.01462, 2024	9*	2024
EvIL: Evolution Strategies for Generalisable Imitation Learning S Sapora, G Swamy, C Lu, YW Teh, JN Foerster arXiv preprint arXiv:2406.11905, 2024	4	2024
A Critique of Strictly Batch Imitation Learning G Swamy, S Choudhury, JA Bagnell, ZS Wu arXiv preprint arXiv:2110.02063, 2021	3	2021
Generative Models for Pose Transfer P Chao, A Li, G Swamy arXiv preprint arXiv:1806.09070, 2018	3	2018
Diffusing States and Matching Scores: A New Framework for Imitation Learning R Wu, Y Chen, G Swamy, K Brantley, W Sun arXiv preprint arXiv:2410.13855, 2024	1	2024
Multi-Agent Imitation Learning: Value is Easy, Regret is Hard J Tang, G Swamy, F Fang, ZS Wu arXiv preprint arXiv:2406.04219, 2024	1	2024
Your Learned Constraint is Secretly a Backward Reachable Tube M Qadri, G Swamy, J Francis, M Kaess, A Bajcsy arXiv preprint arXiv:2501.15618, 2025		2025
Regressing the Relative Future: Efficient Policy Optimization for Multi-turn RLHF Z Gao, W Zhan, JD Chang, G Swamy, K Brantley, JD Lee, W Sun arXiv preprint arXiv:2410.04612, 2024		2024
Efficient Inverse Reinforcement Learning without Compounding Errors NE Dice, G Swamy, S Choudhury, W Sun First Reinforcement Learning Safety Workshop, 2024		2024

Δεν είναι δυνατή η εκτέλεση της ενέργειας από το σύστημα αυτή τη στιγμή. Προσπαθήστε ξανά αργότερα.

Άρθρα 1–20

Παραθέσεις ανά έτος

Διπλότυπες αναφορές

Συγχωνευμένες αναφορές

Προσθήκη από κοινού συγγραφέωνΣυν-συγγραφείς

Παρακολούθηση

Παρατίθεται από

Συν-συγγραφείς