- Academic Search

Articles

Scholar

About 35 results (0.03 sec)

Reinforced self-training (rest) for language modeling

C Gulcehre, TL Paine, S Srinivasan… - ar** random
noise in high-dimensional spaces to a target manifold through iterative denoising. In this …

Save Cite Cited by 4 Related articles All 4 versions Free GPT-4 View as HTML

[Free GPT-4]

[PDF] arxiv.org

A new approach to solving smac task: Generating decision tree code from large language models

Y Deng, W Ma, Y Fan, Y Zhang, H Zhang… - arxiv preprint arxiv …, 2024 - arxiv.org

StarCraft Multi-Agent Challenge (SMAC) is one of the most commonly used experimental
environments in multi-agent reinforcement learning (MARL), where the specific task is to …

Save Cite Cited by 1 Related articles All 2 versions Free GPT-4 View as HTML

Cite

Advanced search

Saved to My library

Reinforced self-training (rest) for language modeling

A new approach to solving smac task: Generating decision tree code from large language models