Google Academic

Articole

Academic

1 rezultat (0,02 sec.)

Profilul meu Biblioteca mea

Codeplay: Autotelic Learning through Collaborative Self-Play in Programming Environments

Caută în articolele care citează

[免费ChatGPT] [DeepSeek可用网址] [PDF] arxiv.org

Beyond Limited Data: Self-play LLM Theorem Provers with Iterative Conjecturing and Proving

K Dong, T Ma - arxiv preprint arxiv:2502.00212, 2025 - arxiv.org

A fundamental challenge in formal theorem proving by LLMs is the lack of high-quality
training data. Although reinforcement learning or expert iteration partially mitigates this issue …

Salvați Citați Articole cu conținut similar Afișare ca HTML

Creează alerta

Citați

Căutare avansată

Salvat în Bibliotecă

Codeplay: Autotelic Learning through Collaborative Self-Play in Programming Environments

Beyond Limited Data: Self-play LLM Theorem Provers with Iterative Conjecturing and Proving