Masatoshi Uehara

Viittaukset

	Kaikki	2020 lähtien
Sitaatit	2253	2183
h-indeksi	24	24
i10-indeksi	42	41

760

380

190

570

2017201820192020202120222023202420257 21 29 121 211 351 604 752 140

Yleisessä käytössä

Näytä kaikki

16 artikkelia

0 artikkelia

käytettävissä

ei käytettävissä

Perustuu rahoitusehtoihin

Muut kirjoittajat

Nathan KallusCornell UniversityVahvistettu sähköpostiosoite verkkotunnuksessa cornell.edu
Wen SunAssistant Professor, Cornell UniversityVahvistettu sähköpostiosoite verkkotunnuksessa cornell.edu
Jason D. LeeAssociate Professor of Electrical Engineering and Computer Science, Princeton UniversityVahvistettu sähköpostiosoite verkkotunnuksessa princeton.edu
Sergey LevineUC Berkeley, Physical IntelligenceVahvistettu sähköpostiosoite verkkotunnuksessa eecs.berkeley.edu
Tommaso BiancalaniGenentechVahvistettu sähköpostiosoite verkkotunnuksessa gene.com
Xiaojie Mao (毛小介)Associate Professor, School of Economics and Management, Tsinghua UniversityVahvistettu sähköpostiosoite verkkotunnuksessa sem.tsinghua.edu.cn
Yulai ZhaoPrinceton UniversityVahvistettu sähköpostiosoite verkkotunnuksessa princeton.edu
Nan JiangAssociate Professor of Computer Science, UIUCVahvistettu sähköpostiosoite verkkotunnuksessa illinois.edu
Wenhao ZhanGraduate Student, Princeton UniversityVahvistettu sähköpostiosoite verkkotunnuksessa princeton.edu
Gabriele ScaliaGenentechVahvistettu sähköpostiosoite verkkotunnuksessa gene.com
Chengchun ShiLondon School of Economics and Political ScienceVahvistettu sähköpostiosoite verkkotunnuksessa lse.ac.uk
Xuezhou ZhangBoston UniversityVahvistettu sähköpostiosoite verkkotunnuksessa bu.edu
Vasilis SyrgkanisAssistant Professor, Stanford UniversityVahvistettu sähköpostiosoite verkkotunnuksessa stanford.edu
Mengdi WangCenter for Statistics & Machine Learning, ECE, Princeton UniversityVahvistettu sähköpostiosoite verkkotunnuksessa princeton.edu
Whitney NeweyProfessor of Economics, MITVahvistettu sähköpostiosoite verkkotunnuksessa mit.edu
Yutaka MatsuoProfessor, University of TokyoVahvistettu sähköpostiosoite verkkotunnuksessa weblab.t.u-tokyo.ac.jp
Alekh AgarwalGoogleVahvistettu sähköpostiosoite verkkotunnuksessa google.com
Tengyang XieAssistant Professor of Computer Science, University of Wisconsin-MadisonVahvistettu sähköpostiosoite verkkotunnuksessa cs.wisc.edu
Xiner LiPh.D student, Texas A&M UniversityVahvistettu sähköpostiosoite verkkotunnuksessa tamu.edu
Gokcen EraslanPrincipal Scientist @ GenentechVahvistettu sähköpostiosoite verkkotunnuksessa gene.com

Seuraa

Masatoshi Uehara

EvolutionaryScale

Vahvistettu sähköpostiosoite verkkotunnuksessa evolutionaryscale.ai - Kotisivu

Machine Learning Reinforcement Learning Generative Models Drug Discovery Causal Inference


Nimike Lajittele sitaattien mukaan Lajittele vuoden mukaan Lajittele otsikon mukaan	Viittaukset Viittaukset	Vuosi
Double reinforcement learning for efficient off-policy evaluation in markov decision processes N Kallus, M Uehara Journal of Machine Learning Research 21 (167), 1-63, 2020	228	2020
Minimax weight and q-function learning for off-policy evaluation M Uehara, J Huang, N Jiang International Conference on Machine Learning, 9659-9668, 2020	205	2020
Pessimistic Model-based Offline Reinforcement Learning under Partial Coverage M Uehara, W Sun International Conference on Learning Representations, 2022	163	2022
Representation Learning for Online and Offline RL in Low-rank MDPs M Uehara, X Zhang, W Sun International Conference on Learning Representations, 2022	162	2022
Generative adversarial nets from a density ratio estimation perspective M Uehara, I Sato, M Suzuki, K Nakayama, Y Matsuo arXiv preprint arXiv:1610.02920, 2016	111	2016
Efficiently breaking the curse of horizon in off-policy evaluation with double reinforcement learning N Kallus, M Uehara Operations Research 70 (6), 3282-3302, 2022	110*	2022
Mitigating covariate shift in imitation learning via offline data with partial coverage J Chang, M Uehara, D Sreenivas, R Kidambi, W Sun Advances in Neural Information Processing Systems 34, 965-979, 2021	105	2021
A review of off-policy evaluation in reinforcement learning M Uehara, C Shi, N Kallus arXiv preprint arXiv:2212.06355, 2022	78	2022
Efficient reinforcement learning in block mdps: A model-free representation learning approach X Zhang, Y Song, M Uehara, M Wang, A Agarwal, W Sun International Conference on Machine Learning, 26517-26547, 2022	75	2022
Causal inference under unmeasured confounding with negative controls: A minimax learning approach N Kallus, X Mao, M Uehara arXiv preprint arXiv:2103.14029, 2021	74	2021
Finite sample analysis of minimax offline reinforcement learning: Completeness, fast rates and first-order efficiency M Uehara, M Imaizumi, N Jiang, N Kallus, W Sun, T Xie arXiv preprint arXiv:2102.02981, 2021	69	2021
Intrinsically efficient, stable, and bounded off-policy evaluation for reinforcement learning N Kallus, M Uehara Advances in Neural Information Processing Systems 32, 2019	58	2019
Off-policy evaluation and learning for external validity under a covariate shift M Uehara, M Kato, S Yasui Advances in Neural Information Processing Systems 33, 49-61, 2020	51*	2020
Statistically efficient off-policy policy gradients N Kallus, M Uehara Proceedings of the 37th International Conference on Machine Learning, 5089-5100, 2020	50	2020
PAC Reinforcement Learning for Predictive State Representations W Zhan, M Uehara, W Sun, JD Lee International Conference on Learning Representations, 2023	49	2023
A minimax learning approach to off-policy evaluation in confounded partially observable markov decision processes C Shi, M Uehara, J Huang, N Jiang International Conference on Machine Learning, 20057-20094, 2022	44	2022
Localized debiased machine learning: Efficient inference on quantile treatment effects and beyond N Kallus, X Mao, M Uehara Journal of Machine Learning Research 25 (16), 1-59, 2024	40*	2024
Provably efficient reinforcement learning in partially observable dynamical systems M Uehara, A Sekhari, JD Lee, N Kallus, W Sun Advances in Neural Information Processing Systems 35, 578-592, 2022	40	2022
Fine-tuning of continuous-time diffusion models as entropy-regularized control M Uehara, Y Zhao, K Black, E Hajiramezanali, G Scalia, NL Diamant, ... arXiv preprint arXiv:2402.15194, 2024	39	2024
Optimal off-policy evaluation from multiple logging policies N Kallus, Y Saito, M Uehara International Conference on Machine Learning, 5247-5256, 2021	36	2021

Järjestelmä ei voi suorittaa toimenpidettä nyt. Yritä myöhemmin uudelleen.

Artikkelit 1–20

Sitaatteja vuodessa

Päällekkäiset lähteet

Yhdistetyt sitaatit

Lisää muut kirjoittajatMuut kirjoittajat

Seuraa

Viittaukset

Muut kirjoittajat