Μελετητής Google

Άρθρα

Μελετητής

2 αποτελέσματα (0,08 δευτ.)

Το προφίλ μου Η βιβλιοθήκη μου

Rethinking Transformers in Solving POMDPs

Αναζήτηση σε άρθρα με παραπομπές

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Real-Time Recurrent Learning using Trace Units in Reinforcement Learning

E Elelimy, A White, M Bowling, M White - arxiv preprint arxiv:2409.01449, 2024 - arxiv.org

Recurrent Neural Networks (RNNs) are used to learn representations in partially observable
environments. For agents that learn online and continually interact with the environment, it is …

Αποθήκευση Παράθεση Γίνεται αναφορά σε 1 Σχετικά άρθρα Όλες οι 4 εκδοχές Προβολή ως HTML

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

TOP-ERL: Transformer-based Off-Policy Episodic Reinforcement Learning

G Li, D Tian, H Zhou, X Jiang, R Lioutikov… - arxiv preprint arxiv …, 2024 - arxiv.org

This work introduces Transformer-based Off-Policy Episodic Reinforcement Learning (TOP-
ERL), a novel algorithm that enables off-policy updates in the ERL framework. In ERL …

Αποθήκευση Παράθεση Σχετικά άρθρα Όλες οι 3 εκδοχές Προβολή ως HTML

Δημιουργία ειδοποίησης

Παράθεση

Σύνθετη αναζήτηση

Αποθηκεύτηκε στη Βιβλιοθήκη μου

Rethinking Transformers in Solving POMDPs

Real-Time Recurrent Learning using Trace Units in Reinforcement Learning

TOP-ERL: Transformer-based Off-Policy Episodic Reinforcement Learning