Nathan Lambert

Cytowane przez

	Wszystkie	Od 2020
Cytowania	3750	3726
h-indeks	27	27
i10-indeks	42	42

2600

1300

650

1950

201920202021202220232024202517 44 122 207 550 2563 226

Dostęp publiczny

Wyświetl wszystko

3 artykuły

0 artykułów

dostępne

niedostępne

Objęte finansowaniem

Współautorzy

Roberto CalandraProfessor, TU Dresden / Centre for Tactile Internet with Human-in-the-Loop (CeTI)Zweryfikowany adres z tu-dresden.de
Valentina PyatkinAllen Institute for AI & University of WashingtonZweryfikowany adres z allenai.org
Kristofer PISTERUC BerkeleyZweryfikowany adres z berkeley.edu
Tom ZickHarvardZweryfikowany adres z berkeley.edu
Hannaneh HajishirziUniversity of Washington; Allen AIZweryfikowany adres z cs.washington.edu
Noah A. SmithUniversity of Washington; Allen Institute for Artificial IntelligenceZweryfikowany adres z cs.washington.edu
Thomas Krendl GilbertNew York Academy of SciencesZweryfikowany adres z nyas.org
Daniel S. DrewElectrical and Computer Engineering, University of Hawaiʻi at MānoaZweryfikowany adres z hawaii.edu
Luca SoldainiAllen Institute for AIZweryfikowany adres z allenai.org
Sarah DeanCornellZweryfikowany adres z cornell.edu
Brandon AmosMetaZweryfikowany adres z fb.com
Luis PinedaResearch Engineer, Facebook AI ResearchZweryfikowany adres z fb.com
Craig B. SchindlerUniversity of California, BerkeleyZweryfikowany adres z berkeley.edu
Lydia LeeSandia National LaboratoriesZweryfikowany adres z sandia.gov
Kyle LoAllen Institute for Artificial IntelligenceZweryfikowany adres z allenai.org

Obserwuj

Nathan Lambert

Research Scientist, Allen AI

Zweryfikowany adres z allenai.org - Strona główna

Reinforcement Learning Machine Learning Robotics Responsible AI


Tytuł Sortuj wg cytatów Sortuj wg roku Sortuj wg tytułu	Cytowane przez Cytowane przez	Rok
Zephyr: Direct distillation of lm alignment L Tunstall, E Beeching, N Lambert, N Rajani, K Rasul, Y Belkada, ... arXiv preprint arXiv:2310.16944, 2023	498	2023
[Github] Diffusers: State-of-the-art diffusion models P von Platen, S Patil, A Lozhkov, P Cuenca, N Lambert, K Rasul, ... https://github.com/huggingface/diffusers, 2022	442*	2022
Open LLM Leaderboard E Beeching, C Fourrier, N Habib, S Han, N Lambert, N Rajani, ... URL https://huggingface. co/spaces/HuggingFaceH4/open_llm_leaderboard, 2023	319*	2023
Olmo: Accelerating the science of language models D Groeneveld, I Beltagy, P Walsh, A Bhagia, R Kinney, O Tafjord, AH Jha, ... arXiv preprint arXiv:2402.00838, 2024	229*	2024
[Github] Trl: Transformer reinforcement learning L von Werra, Y Belkada, L Tunstall, E Beeching, T Thrush, N Lambert https://github.com/lvwerra/trl, 2020	215*	2020
Low Level Control of a Quadrotor with Deep Model-Based Reinforcement Learning N Lambert, DS Drew, J Yaconelli, R Calandra, S Levine, KSJ Pister IEEE Robotics and Automation Letters 4 (4), 4224-4230, 2019	197	2019
Dolma: An open corpus of three trillion tokens for language model pretraining research L Soldaini, R Kinney, A Bhagia, D Schwenk, D Atkinson, R Authur, ... arXiv preprint arXiv:2402.00159, 2024	164*	2024
Camels in a changing climate: Enhancing lm adaptation with tulu 2 H Ivison, Y Wang, V Pyatkin, N Lambert, M Peters, P Dasigi, J Jang, ... arXiv preprint arXiv:2311.10702, 2023	157	2023
Rewardbench: Evaluating reward models for language modeling N Lambert, V Pyatkin, J Morrison, LJ Miranda, BY Lin, K Chandu, N Dziri, ... arXiv preprint arXiv:2403.13787, 2024	150*	2024
On the importance of hyperparameter optimization for model-based reinforcement learning B Zhang, R Rajan, L Pineda, N Lambert, A Biedenkapp, K Chua, F Hutter, ... International Conference on Artificial Intelligence and Statistics, 4015-4023, 2021	137	2021
[Blog] Illustrating reinforcement learning from human feedback (RLHF) N Lambert, L Castricato, L von Werra, A Havrilla https://hf.co/blog/rlhf, 2022	124*	2022
Objective Mismatch in Model-based Reinforcement Learning N Lambert, B Amos, O Yadan, R Calandra Learning for Dynamics and Control (L4DC), 2020	112	2020
Toward controlled flight of the ionocraft: a flying microrobot using electrohydrodynamic thrust with onboard sensing and no moving parts D Drew, N Lambert, C Schindler, K Pister IEEE Robotics and Automation Letters 3 (4), 2807-2813, 2018	90	2018
A survey on data selection for language models A Albalak, Y Elazar, SM Xie, S Longpre, N Lambert, X Wang, ... arXiv preprint arXiv:2402.16827, 2024	80	2024
Molmo and pixmo: Open weights and open data for state-of-the-art multimodal models M Deitke, C Clark, S Lee, R Tripathi, Y Yang, JS Park, M Salehi, ... arXiv preprint arXiv:2409.17146, 2024	57*	2024
Mbrl-lib: A modular library for model-based reinforcement learning L Pineda, B Amos, A Zhang, NO Lambert, R Calandra arXiv preprint arXiv:2104.10159, 2021	56	2021
Learning generalizable locomotion skills with hierarchical reinforcement learning T Li, N Lambert, R Calandra, F Meier, A Rai IEEE International Conference on Robotics and Automation (ICRA), 413-419, 2020	52	2020
The Alignment Handbook L Tunstall, E Beeching, N Lambert, N Rajani, S Huang, K Rasul, ... URL https://github. com/huggingface/alignment-handbook, 2023	51	2023
Social Choice Should Guide AI Alignment in Dealing with Diverse Human Feedback V Conitzer, R Freedman, J Heitzig, WH Holliday, BM Jacobs, N Lambert, ... arXiv preprint arXiv:2404.10271, 2024	42*	2024
The challenges of exploration for offline reinforcement learning N Lambert, M Wulfmeier, W Whitney, A Byravan, M Bloesch, V Dasagi, ... arXiv preprint arXiv:2201.11861, 2022	41	2022

Nie można teraz wykonać tej operacji. Spróbuj ponownie później.

Prace 1–20

Cytowania rocznie

Powielone cytowania

Scalone cytowania

Dodaj współautorówWspółautorzy

Obserwuj

Cytowane przez

Współautorzy