Stephen McAleer

Citata da

	Tutte	Dal 2020
Citazioni	3828	3764
Indice H	23	23
i10-index	39	39

1700

850

425

1275

201920202021202220232024202559 182 317 519 866 1686 190

Accesso pubblico

Visualizza tutto

19 articoli

0 articoli

Disponibili

Non disponibili

In base ai mandati di finanziamento

Coautori

Pierre BaldiProfessor, University of California, IrvineEmail verificata su ics.uci.edu
Yaodong YangBOYA (博雅) Assistant Professor at Peking UniversityEmail verificata su pku.edu.cn
Roy FoxAssistant Professor, UC IrvineEmail verificata su uci.edu
JB LanierUC IrvineEmail verificata su uci.edu
Tuomas SandholmAngel Jordan University Professor of Computer Science, Carnegie Mellon UniversityEmail verificata su cs.cmu.edu
Alexander ShmakovUniversity of California IrvineEmail verificata su uci.edu
Jun WangProfessor, Computer Science, University College LondonEmail verificata su cs.ucl.ac.uk
Forest AgostinelliAssistant Professor at the University of South CarolinaEmail verificata su cse.sc.edu
Oliver SlumbersUniversity College LondonEmail verificata su ucl.ac.uk
Gabriele FarinaAssistant Professor of Computer Science, MITEmail verificata su mit.edu
Marc LanctotResearch Scientist, Google DeepMindEmail verificata su google.com
Shauharda (Shaw) KhadkaSenior Applied Scientist at MicrosoftEmail verificata su microsoft.com
Somdeb MajumdarIntel CorpEmail verificata su intel.com
Kagan TumerOregon State UniversityEmail verificata su oregonstate.edu
Pieter AbbeelUC Berkeley | CovariantEmail verificata su cs.berkeley.edu
Ioannis PanageasAssistant Professor, University of California, IrvineEmail verificata su ics.uci.edu
Kevin A. WangBrown UniversityEmail verificata su kevinwang.us
Alexander IhlerUniversity of California, IrvineEmail verificata su ics.uci.edu
Michael DennisGoogle DeepMindEmail verificata su cs.berkeley.edu
Karl TuylsResearch Scientist, Entrepreneur, ex-Google DeepMind, Prof at University of LiverpoolEmail verificata su hcompany.ai

Segui

Stephen McAleer

OpenAI

Email verificata su openai.com - Home page

Artificial Intelligence


Titolo Ordina per citazioni Ordina per anno Ordina per titolo	Citata da Citata da	Anno
Highly accurate machine fault diagnosis using deep transfer learning S Shao, S McAleer, R Yan, P Baldi IEEE Transactions on Industrial Informatics 15 (4), 2446-2455, 2018	1320	2018
Language Models can Solve Computer Tasks G Kim, P Baldi, S McAleer Neural Information Processing Systems (NeurIPS), 2023	310	2023
Llemma: An Open Language Model for Mathematics Z Azerbayev, H Schoelkopf, K Paster, M Dos Santos, S McAleer, AQ Jiang, ... International Conference on Learning Representations (ICLR), 2023	255	2023
Mastering the game of Stratego with model-free multiagent reinforcement learning J Perolat, B De Vylder, D Hennes, E Tarassov, F Strub, V de Boer, ... Science 378 (6623), 990-996, 2022	246	2022
Solving the Rubik’s cube with deep reinforcement learning and search F Agostinelli, S McAleer, A Shmakov*, P Baldi Nature Machine Intelligence 1 (8), 356-363, 2019	244	2019
AI Alignment: A Comprehensive Survey J Ji, T Qiu, B Chen, B Zhang, H Lou, K Wang, Y Duan, Z He, J Zhou, ... arXiv preprint arXiv:2310.19852, 2023	226	2023
Towards Human-Level Bimanual Dexterous Manipulation with Reinforcement Learning Y Chen, Y Yang, T Wu, S Wang, X Feng, J Jiang, SM McAleer, H Dong, ... 36th Conference on Neural Information Processing Systems (NeurIPS 2022 …, 2022	104	2022
Solving the Rubik's Cube with Approximate Policy Iteration S McAleer, F Agostinelli, A Shmakov*, P Baldi International Conference on Learning Representations (ICLR), 2018	103*	2018
Pipeline PSRO: A scalable approach for finding approximate nash equilibria in large games S McAleer, J Lanier, R Fox, P Baldi 34th Conference on Neural Information Processing Systems (NeurIPS), 2020	89	2020
Alphazero-like tree-search can guide large language model decoding and training Z Wan, X Feng, M Wen, SM McAleer, Y Wen, W Zhang, J Wang Forty-first International Conference on Machine Learning, 2024	86	2024
Evolutionary reinforcement learning for sample-efficient multiagent coordination S Majumdar, S Khadka, S Miret, S McAleer, K Tumer International Conference on Machine Learning (ICML), 2020	75	2020
XDO: A double oracle algorithm for extensive-form games S McAleer, J Lanier, P Baldi, R Fox Advances in Neural Information Processing Systems (NeurIPS), 2021	62	2021
Independent Natural Policy Gradient Always Converges in Markov Potential Games R Fox, S McAleer, W Overman, I Panageas AISTATS 2022, 2021	58	2021
Neural auto-curricula in two-player zero-sum games X Feng, O Slumbers, Z Wan, B Liu, S McAleer, Y Wen, J Wang, Y Yang Advances in Neural Information Processing Systems (NeurIPS), 2021	52*	2021
Online Double Oracle LC Dinh, Y Yang, S McAleer, NP Nieves, O Slumbers, Z Tian, DH Mguni, ... Transactions on Machine Learning Research, 2021	36	2021
Confronting Reward Model Overoptimization with Constrained RLHF T Moskovitz, AK Singh, DJ Strouse, T Sandholm, R Salakhutdinov, ... International Conference on Learning Representations (ICLR) spotlight, 2023	34	2023
Deep-learning-based reconstruction of the neutrino direction and energy for in-ice radio detectors C Glaser, S McAleer, S Stjärnholm, P Baldi, SW Barwick Astroparticle Physics 145, 102781, 2023	32*	2023
White Paper: ARIANNA-200 high energy neutrino telescope A Anker, P Baldi, SW Barwick, D Bergman, H Bernhoff, DZ Besson, ... arXiv preprint arXiv:2004.09841, 2020	30	2020
Tree search for language model agents JY Koh, S McAleer, D Fried, R Salakhutdinov arXiv preprint arXiv:2407.01476, 2024	29	2024
Toward Optimal Policy Population Growth in Two-Player Zero-Sum Games S McAleer, JB Lanier, K Wang, P Baldi, R Fox, T Sandholm International Conference on Learning Representations (ICLR), 2022	29*	2022

Il sistema al momento non può eseguire l'operazione. Riprova più tardi.

Articoli 1–20

Citazioni per anno

Citazioni duplicate

Citazioni unite

Aggiungi coautoriCoautori

Segui

Citata da

Coautori