Google Академія

FM Luo, T Xu, H Lai, XH Chen, W Zhang… - Science China Information …, 2024 - Springer

Reinforcement learning (RL) interacts with the environment to solve sequential decision-
making problems via a trial-and-error approach. Errors are always undesirable in real-world …

Зберегти Послатися Цитовано в 133 джерелах Пов’язані статті Кількість версій: 6

[Free GPT-4]
[DeepSeek]

[PDF] frontiersin.org

Robot learning from randomized simulations: A review

F Muratore, F Ramos, G Turk, W Yu… - Frontiers in Robotics …, 2022 - frontiersin.org

The rise of deep learning has caused a paradigm shift in robotics research, favoring
methods that require large amounts of data. Unfortunately, it is prohibitively expensive to …

Зберегти Послатися Цитовано в 111 джерелах Пов’язані статті Кількість версій: 16 Кеш

[Free GPT-4]
[DeepSeek]

[PDF] neurips.cc

Morel: Model-based offline reinforcement learning

R Kidambi, A Rajeswaran… - Advances in neural …, 2020 - proceedings.neurips.cc

In offline reinforcement learning (RL), the goal is to learn a highly rewarding policy based
solely on a dataset of historical interactions with the environment. This serves as an extreme …

Зберегти Послатися Цитовано в 794 джерелах Пов’язані статті Кількість версій: 7 Показати у форматі HTML

[Free GPT-4]
[DeepSeek]

[PDF] neurips.cc

Rambo-rl: Robust adversarial model-based offline reinforcement learning

M Rigter, B Lacerda, N Hawes - Advances in neural …, 2022 - proceedings.neurips.cc

Offline reinforcement learning (RL) aims to find performant policies from logged data without
further environment interaction. Model-based algorithms, which learn a model of the …

Зберегти Послатися Цитовано в 140 джерелах Пов’язані статті Кількість версій: 7 Показати у форматі HTML

[Free GPT-4]
[DeepSeek]

[PDF] mlr.press

Adversarially trained actor critic for offline reinforcement learning

CA Cheng, T **e, N Jiang… - … Conference on Machine …, 2022 - proceedings.mlr.press

Abstract We propose Adversarially Trained Actor Critic (ATAC), a new model-free algorithm
for offline reinforcement learning (RL) under insufficient data coverage, based on the …

Зберегти Послатися Цитовано в 152 джерелах Пов’язані статті Кількість версій: 8 Показати у форматі HTML

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Randomized ensembled double q-learning: Learning fast without a model

X Chen, C Wang, Z Zhou, K Ross - arxiv preprint arxiv:2101.05982, 2021 - arxiv.org

Using a high Update-To-Data (UTD) ratio, model-based methods have recently achieved
much higher sample efficiency than previous model-free methods for continuous-action DRL …

Зберегти Послатися Цитовано в 296 джерелах Пов’язані статті Кількість версій: 8 Показати у форматі HTML

[Free GPT-4]
[DeepSeek]

[PDF] mlr.press

Masked trajectory models for prediction, representation, and control

P Wu, A Majumdar, K Stone, Y Lin… - International …, 2023 - proceedings.mlr.press

Abstract We introduce Masked Trajectory Models (MTM) as a generic abstraction for
sequential decision making. MTM takes a trajectory, such as a state-action sequence, and …

Зберегти Послатися Цитовано в 46 джерелах Пов’язані статті Кількість версій: 9 Показати у форматі HTML

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Rrl: Resnet as representation for reinforcement learning

R Shah, V Kumar - arxiv preprint arxiv:2107.03380, 2021 - arxiv.org

The ability to autonomously learn behaviors via direct interactions in uninstrumented
environments can lead to generalist robots capable of enhancing productivity or providing …

Зберегти Послатися Цитовано в 124 джерелах Пов’язані статті Кількість версій: 6 Показати у форматі HTML

[Free GPT-4]
[DeepSeek]

[HTML] mdpi.com

[HTML][HTML] A review of deep reinforcement learning approaches for smart manufacturing in industry 4.0 and 5.0 framework

A del Real Torres, DS Andreiana, Á Ojeda Roldán… - Applied Sciences, 2022 - mdpi.com

In this review, the industry's current issues regarding intelligent manufacture are presented.
This work presents the status and the potential for the I4. 0 and I5. 0's revolutionary …

Зберегти Послатися Цитовано в 58 джерелах Пов’язані статті Кількість версій: 3 Кеш

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Deployment-efficient reinforcement learning via model-based offline optimization

T Matsushima, H Furuta, Y Matsuo, O Nachum… - arxiv preprint arxiv …, 2020 - arxiv.org

Most reinforcement learning (RL) algorithms assume online access to the environment, in
which one may readily interleave updates to the policy with experience collection using that …

Зберегти Послатися Цитовано в 166 джерелах Пов’язані статті Кількість версій: 9 Показати у форматі HTML

Створити сповіщення

Послатися

Розширений пошук

Збережено в моїй бібліотеці

A game theoretic framework for model based reinforcement learning

A survey on model-based reinforcement learning

Robot learning from randomized simulations: A review

Morel: Model-based offline reinforcement learning

Rambo-rl: Robust adversarial model-based offline reinforcement learning

Adversarially trained actor critic for offline reinforcement learning

Randomized ensembled double q-learning: Learning fast without a model

Masked trajectory models for prediction, representation, and control

Rrl: Resnet as representation for reinforcement learning

[HTML][HTML] A review of deep reinforcement learning approaches for smart manufacturing in industry 4.0 and 5.0 framework

Deployment-efficient reinforcement learning via model-based offline optimization