Yao Liu

Citada per

	Totes	Des de 2020
Citacions	824	769
Índex h	11	11
Índex i10	11	11

200

100

150

201820192020202120222023202420258 43 77 165 157 186 162 21

Accés públic

Mostra-ho tot

8 articles

0 articles

disponibles

no disponibles

Es basa en els requisits de les agències que proporcionen el finançament

Coautors

Emma BrunskillAssociate Professor of Computer Science, Stanford UniversityCorreu electrònic verificat a cs.stanford.edu
Omer GottesmanAmazonCorreu electrònic verificat a amazon.com
Finale Doshi-VelezProfessor, HarvardCorreu electrònic verificat a seas.harvard.edu
Alekh AgarwalGoogleCorreu electrònic verificat a google.com
Adith SwaminathanNetflixCorreu electrònic verificat a netflix.com
Rasool FakoorAmazon Web ServicesCorreu electrònic verificat a amazon.com
Pierre-Luc BaconUniversity of MontrealCorreu electrònic verificat a mila.quebec
Shoham SabachAssociate Professor, Technion, Faculty of Data and Decision SciencesCorreu electrònic verificat a technion.ac.il
Kavosh AsadiAmazonCorreu electrònic verificat a amazon.com
Zuxin LiuSalesforce AI ResearchCorreu electrònic verificat a cs.cmu.edu
Jesse ZhangPhD Student, USCCorreu electrònic verificat a usc.edu
Pratik ChaudhariUniversity of PennsylvaniaCorreu electrònic verificat a seas.upenn.edu
Zhaohan Daniel GuoDeepMindCorreu electrònic verificat a google.com
Allen NieStanford UniversityCorreu electrònic verificat a stanford.edu
Yannis Flet-BerliacPostdoc, Stanford UniversityCorreu electrònic verificat a stanford.edu
Dipendra MisraStaff Research Scientist, Mosaic Team, DatabricksCorreu electrònic verificat a databricks.com
Robert SchapireMicrosoft ResearchCorreu electrònic verificat a microsoft.com
Miroslav DudikMicrosoft ResearchCorreu electrònic verificat a microsoft.com
Liwei WangProfessor, Peking UniversityCorreu electrònic verificat a cis.pku.edu.cn
Philip ThomasUniversity of Massachusetts AmherstCorreu electrònic verificat a cs.umass.edu

Segueix

Yao Liu

Amazon

Correu electrònic verificat a stanford.edu - Pàgina d'inici

Reinforcement Learning Machine Learning


Títol Ordena per cites Ordena per any Ordena per títol	Citada per Citada per	Any
Provably good batch reinforcement learning without great exploration Y Liu, A Swaminathan, A Agarwal, E Brunskill Advances in Neural Information Processing Systems 33, 1264–1274, 2020	231	2020
Off-Policy Policy Gradient with Stationary Distribution Correction Y Liu, A Swaminathan, A Agarwal, E Brunskill Proceedings of The 35th Uncertainty in Artificial Intelligence Conference …, 2019	188*	2019
Representation balancing mdps for off-policy policy evaluation Y Liu, O Gottesman, A Raghu, M Komorowski, A Faisal, F Doshi-Velez, ... Advances in Neural Information Processing Systems 31, 2644--2653, 2018	85	2018
Interpretable off-policy evaluation in reinforcement learning by highlighting influential transitions O Gottesman, J Futoma, Y Liu, S Parbhoo, L Celi, E Brunskill, ... International Conference on Machine Learning, 3658-3667, 2020	69	2020
Behaviour policy estimation in off-policy policy evaluation: Calibration matters A Raghu, O Gottesman, Y Liu, M Komorowski, A Faisal, F Doshi-Velez, ... arXiv preprint arXiv:1807.01066, 2018	47	2018
Understanding the curse of horizon in off-policy evaluation via conditional importance sampling Y Liu, PL Bacon, E Brunskill International Conference on Machine Learning, 6184-6193, 2020	44	2020
Combining parametric and nonparametric models for off-policy evaluation O Gottesman, Y Liu, S Sussex, E Brunskill, F Doshi-Velez In International Conference on Machine Learning, 2366-2375, 2019	36	2019
When Simple Exploration is Sample Efficient: Identifying Sufficient Conditions for Random Exploration to Yield PAC RL Algorithms Y Liu, E Brunskill The 14th European Workshop on Reinforcement Learning, 2018	27	2018
Pac continuous state online multitask reinforcement learning with identification Y Liu, Z Guo, E Brunskill Proceedings of the 2016 International Conference on Autonomous Agents …, 2016	22	2016
Reinforcement learning tutor better supported lower performers in a math task S Ruan, A Nie, W Steenbergen, J He, JQ Zhang, M Guo, Y Liu, ... Machine Learning 113 (5), 3023-3048, 2024	20	2024
Tail: Task-specific adapters for imitation learning with large pretrained models Z Liu, J Zhang, K Asadi, Y Liu, D Zhao, S Sabach, R Fakoor arXiv preprint arXiv:2310.05905, 2023	17	2023
All-action policy gradient methods: A numerical integration approach B Petit, L Amdahl-Culleton, Y Liu, J Smith, PL Bacon arXiv preprint arXiv:1910.09093, 2019	9	2019
Td convergence: An optimization perspective K Asadi, S Sabach, Y Liu, O Gottesman, R Fakoor Advances in Neural Information Processing Systems 36, 49169-49186, 2023	7	2023
Budgeting counterfactual for offline rl Y Liu, P Chaudhari, R Fakoor Advances in Neural Information Processing Systems 36, 5729-5751, 2023	5	2023
Offline policy optimization with eligible actions Y Liu, Y Flet-Berliac, E Brunskill Uncertainty in Artificial Intelligence, 1253-1263, 2022	4	2022
Nonlinear dimensionality reduction by local orthogonality preserving alignment T Lin, Y Liu, B Wang, LW Wang, HB Zha Journal of Computer Science and Technology 31 (3), 512-524, 2016	4*	2016
Agentoccam: A simple yet strong baseline for llm-based web agents K Yang, Y Liu, S Chaudhary, R Fakoor, P Chaudhari, G Karypis, ... arXiv preprint arXiv:2410.13825, 2024	3	2024
EXTRACT: Efficient Policy Learning by Extracting Transferable Robot Skills from Offline Data J Zhang, M Heo, Z Liu, E Biyik, JJ Lim, Y Liu, R Fakoor arXiv preprint arXiv:2406.17768, 2024	2	2024
Provably sample-efficient RL with side information about latent dynamics Y Liu, D Misra, M Dudík, RE Schapire Advances in Neural Information Processing Systems 35, 33482-33493, 2022	2	2022
Learning the target network in function space K Asadi, Y Liu, S Sabach, M Yin, R Fakoor arXiv preprint arXiv:2406.01838, 2024	1	2024

En aquests moments el sistema no pot dur a terme l'operació. Torneu-ho a provar més tard.

Articles 1–20

Cites per any

Cites duplicades

Cites combinades

Addició de coautorsCoautors

Segueix

Citada per

Coautors