- Academic Search

S Hu, L Shen, Y Zhang, Y Chen… - IEEE Transactions on …, 2024 - ieeexplore.ieee.org

Transformers, originally devised for natural language processing (NLP), have also produced
significant successes in computer vision (CV). Due to their strong expression power …

Simpan Kutip Dirujuk 33 kali Artikel terkait 5 versi

[Free GPT-4]

[PDF] arxiv.org

Integrating reinforcement learning with foundation models for autonomous robotics: Methods and perspectives

A Moroncelli, V Soni, AA Shahid, M Maccarini… - arxiv preprint arxiv …, 2024 - arxiv.org

Foundation models (FMs), large deep learning models pre-trained on vast, unlabeled
datasets, exhibit powerful capabilities in understanding complex patterns and generating …

Simpan Kutip Dirujuk 1 kali Artikel terkait 2 versi Versi HTML

[Free GPT-4]

[PDF] arxiv.org

Q-value regularized transformer for offline reinforcement learning

S Hu, Z Fan, C Huang, L Shen, Y Zhang… - arxiv preprint arxiv …, 2024 - arxiv.org

Recent advancements in offline reinforcement learning (RL) have underscored the
capabilities of Conditional Sequence Modeling (CSM), a paradigm that learns the action …

Simpan Kutip Dirujuk 9 kali Artikel terkait 3 versi Versi HTML

[Free GPT-4]

[PDF] arxiv.org

HarmoDT: Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning

S Hu, Z Fan, L Shen, Y Zhang, Y Wang… - arxiv preprint arxiv …, 2024 - arxiv.org

The purpose of offline multi-task reinforcement learning (MTRL) is to develop a unified policy
applicable to diverse tasks without the need for online environmental interaction. Recent …

Simpan Kutip Dirujuk 9 kali Artikel terkait 3 versi Versi HTML

[Free GPT-4]

[PDF] arxiv.org

Meta-DT: Offline Meta-RL as Conditional Sequence Modeling with World Model Disentanglement

Z Wang, L Zhang, W Wu, Y Zhu, D Zhao… - arxiv preprint arxiv …, 2024 - arxiv.org

A longstanding goal of artificial general intelligence is highly capable generalists that can
learn from diverse experiences and generalize to unseen tasks. The language and vision …

Simpan Kutip Dirujuk 2 kali Artikel terkait 3 versi Versi HTML

[Free GPT-4]

[PDF] arxiv.org

Context-former: Stitching via latent conditioned sequence modeling

Z Zhang, J Xu, J Liu, Z Zhuang, D Wang, M Liu… - arxiv preprint arxiv …, 2024 - arxiv.org

Offline reinforcement learning (RL) algorithms can learn better decision-making compared to
behavior policies by stitching the suboptimal trajectories to derive more optimal ones …

Simpan Kutip Dirujuk 2 kali Artikel terkait 3 versi Versi HTML

[Free GPT-4]

[PDF] arxiv.org

Pre-trained Language Models Improve the Few-shot Prompt Ability of Decision Transformer

Y Yang, P Xu - arxiv preprint arxiv:2408.01402, 2024 - arxiv.org

Decision Transformer (DT) has emerged as a promising class of algorithms in offline
reinforcement learning (RL) tasks, leveraging pre-collected datasets and Transformer's …

Simpan Kutip Artikel terkait 4 versi Versi HTML

[Free GPT-4]

[PDF] arxiv.org

Is Mamba Compatible with Trajectory Optimization in Offline Reinforcement Learning?

Y Dai, O Ma, L Zhang, X Liang, S Hu, M Wang… - arxiv preprint arxiv …, 2024 - arxiv.org

Transformer-based trajectory optimization methods have demonstrated exceptional
performance in offline Reinforcement Learning (offline RL), yet it poses challenges due to …

Simpan Kutip Dirujuk 2 kali Artikel terkait 2 versi Versi HTML

[Free GPT-4]

[PDF] arxiv.org

Task-Aware Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning

Z Fan, S Hu, Y Zhou, L Shen, Y Zhang, Y Wang… - arxiv preprint arxiv …, 2024 - arxiv.org

The purpose of offline multi-task reinforcement learning (MTRL) is to develop a unified policy
applicable to diverse tasks without the need for online environmental interaction. Recent …

Simpan Kutip Artikel terkait 2 versi Versi HTML

[Free GPT-4]

[PDF] arxiv.org

Hierarchical Prompt Decision Transformer: Improving Few-Shot Policy Generalization with Global and Adaptive

Z Wang, H Wang, Y Qi - arxiv preprint arxiv:2412.00979, 2024 - arxiv.org

Decision transformers recast reinforcement learning as a conditional sequence generation
problem, offering a simple but effective alternative to traditional value or policy-based …

Simpan Kutip Artikel terkait 2 versi Versi HTML

Buat notifikasi

Kutip

Penelusuran lanjutan

Disimpan ke Koleksi saya

Prompt-tuning decision transformer with preference ranking

On Transforming Reinforcement Learning With Transformers: The Development Trajectory

Integrating reinforcement learning with foundation models for autonomous robotics: Methods and perspectives

Q-value regularized transformer for offline reinforcement learning

HarmoDT: Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning

Meta-DT: Offline Meta-RL as Conditional Sequence Modeling with World Model Disentanglement

Context-former: Stitching via latent conditioned sequence modeling

Pre-trained Language Models Improve the Few-shot Prompt Ability of Decision Transformer

Is Mamba Compatible with Trajectory Optimization in Offline Reinforcement Learning?

Task-Aware Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning

Hierarchical Prompt Decision Transformer: Improving Few-Shot Policy Generalization with Global and Adaptive