Kefan Dong

Viittaukset

	Kaikki	2020 lähtien
Sitaatit	466	461
h-indeksi	10	10
i10-indeksi	10	10

140

105

20192020202120222023202420255 42 82 93 122 109 13

Yleisessä käytössä

Näytä kaikki

7 artikkelia

0 artikkelia

käytettävissä

ei käytettävissä

Perustuu rahoitusehtoihin

Muut kirjoittajat

Tengyu MAStanford UniversityVahvistettu sähköpostiosoite verkkotunnuksessa stanford.edu
Yuan ZhouDepartment of ISE, University of Illinois Urbana-ChampaignVahvistettu sähköpostiosoite verkkotunnuksessa illinois.edu
Jian PengHelixonVahvistettu sähköpostiosoite verkkotunnuksessa helixon.com
Yuanhao WangPrinceton UniversityVahvistettu sähköpostiosoite verkkotunnuksessa princeton.edu
Liwei WangProfessor, Peking UniversityVahvistettu sähköpostiosoite verkkotunnuksessa cis.pku.edu.cn
Xiaoyu ChenPeking UniversityVahvistettu sähköpostiosoite verkkotunnuksessa pku.edu.cn
Zhizhou RenUniversity of Illinois at Urbana-ChampaignVahvistettu sähköpostiosoite verkkotunnuksessa illinois.edu
Qiang LiuAssociate Professor of Computer Science, UT AustinVahvistettu sähköpostiosoite verkkotunnuksessa cs.utexas.edu
Yuping LuoComputer Science Department, Princeton UniversityVahvistettu sähköpostiosoite verkkotunnuksessa cs.princeton.edu
Yingkai LiNational University of SingaporeVahvistettu sähköpostiosoite verkkotunnuksessa nus.edu.sg

Seuraa

Kefan Dong

Stanford University

Vahvistettu sähköpostiosoite verkkotunnuksessa stanford.edu - Kotisivu

Reinforcement Learning


Nimike Lajittele sitaattien mukaan Lajittele vuoden mukaan Lajittele otsikon mukaan	Viittaukset Viittaukset	Vuosi
Q-learning with ucb exploration is sample efficient for infinite-horizon mdp K Dong, Y Wang, X Chen, L Wang International Conference on Learning Representations, 2019	124	2019
Exploration via hindsight goal generation Z Ren, K Dong, Y Zhou, Q Liu, J Peng Advances in Neural Information Processing Systems 32, 2019	99	2019
Root-n-regret for learning in markov decision processes with function approximation and low bellman rank K Dong, J Peng, Y Wang, Y Zhou Conference on Learning Theory, 1554-1557, 2020	49	2020
Provable model-based nonlinear bandit and reinforcement learning: Shelve optimism, embrace virtual curvature K Dong, J Yang, T Ma Advances in Neural Information Processing Systems 34, 26168-26182, 2021	44	2021
On the expressivity of neural networks for deep reinforcement learning K Dong, Y Luo, T Yu, C Finn, T Ma International conference on machine learning, 2627-2637, 2020	36	2020
Design of experiments for stochastic contextual linear bandits A Zanette, K Dong, JN Lee, E Brunskill Advances in Neural Information Processing Systems 34, 22720-22731, 2021	32	2021
First steps toward understanding the extrapolation of nonlinear models to unseen domains K Dong, T Ma arXiv preprint arXiv:2211.11719, 2022	22	2022
Multinomial logit bandit with low switching cost K Dong, Y Li, Q Zhang, Y Zhou International Conference on Machine Learning, 2607-2615, 2020	21	2020
Beyond ntk with vanilla gradient descent: A mean-field analysis of neural networks with polynomial width, samples, and time A Mahankali, H Zhang, K Dong, M Glasgow, T Ma Advances in Neural Information Processing Systems 36, 57367-57480, 2023	14	2023
Asymptotic instance-optimal algorithms for interactive decision making K Dong, T Ma arXiv preprint arXiv:2206.02326, 2022	14	2022
Model-based offline reinforcement learning with local misspecification K Dong, Y Flet-Berliac, A Nie, E Brunskill Proceedings of the AAAI Conference on Artificial Intelligence 37 (6), 7423-7431, 2023	4	2023
Toward L_∞ Recovery of Nonlinear Functions: A Polynomial Sample Complexity Bound for Gaussian Random Fields K Dong, T Ma The Thirty Sixth Annual Conference on Learning Theory, 2877-2918, 2023	3	2023
Formal Theorem Proving by Rewarding LLMs to Decompose Proofs Hierarchically K Dong, A Mahankali, T Ma arXiv preprint arXiv:2411.01829, 2024	2	2024
Refined analysis of fpl for adversarial markov decision processes Y Wang, K Dong arXiv preprint arXiv:2008.09251, 2020	2	2020
STP: Self-play LLM Theorem Provers with Iterative Conjecturing and Proving K Dong, T Ma arXiv preprint arXiv:2502.00212, 2025		2025

Järjestelmä ei voi suorittaa toimenpidettä nyt. Yritä myöhemmin uudelleen.

Artikkelit 1–15

Sitaatteja vuodessa

Päällekkäiset lähteet

Yhdistetyt sitaatit

Lisää muut kirjoittajatMuut kirjoittajat

Seuraa

Viittaukset

Muut kirjoittajat