Hosein Hasanbeig

引用次數

	全部	自 2020 年
引文	1070	1017
H 指數	14	14
i10 指數	16	15

300

150

225

2018201920202021202220232024202518 28 106 137 196 286 260 32

公開取用

查看全部

4 篇文章

0 篇文章

可供使用

無法使用

根據資金強制性政策

共同作者

Alessandro AbateProfessor of Verification and Control, University of Oxford, UK在 cs.ox.ac.uk 的電子郵件地址已通過驗證
Daniel KroeningAmazon在 amazon.com 的電子郵件地址已通過驗證
Ida MomennejadMicrosoft Research在 microsoft.com 的電子郵件地址已通過驗證
Felipe Vieira FrujeriMicrosoft Research在 microsoft.com 的電子郵件地址已通過驗證
Yiannis KantarosAssistant Professor, Washington University in St. Louis在 wustl.edu 的電子郵件地址已通過驗證
Tom MelhamProfessor of Computer Science, University of Oxford在 cs.ox.ac.uk 的電子郵件地址已通過驗證
Hamid PalangiGoogle and University of Washington在 google.com 的電子郵件地址已通過驗證
Robert Osazuwa NessMicrosoft Research在 altdeep.ai 的電子郵件地址已通過驗證
Jonathan LarsonMicrosoft Research在 microsoft.com 的電子郵件地址已通過驗證
George PappasUPS Foundation Professor, Electrical and Systems Engineering, University of Pennsylvania在 seas.upenn.edu 的電子郵件地址已通過驗證
Insup LeeProfessor, Computer and Information Science, University of Pennsylvania在 cis.upenn.edu 的電子郵件地址已通過驗證
Nebojsa JojicMicrosoft Research在 microsoft.com 的電子郵件地址已通過驗證
Mirco GiacobbeUniversity of Birmingham在 bham.ac.uk 的電子郵件地址已通過驗證
Hjalmar WijkMETR在 metr.org 的電子郵件地址已通過驗證
Jun WangPhD Candidate, Washington University in St. Louis在 wustl.edu 的電子郵件地址已通過驗證
Thomas J. RingstromPh.D. candidate, University of Minnesota, Twin Cities在 umn.edu 的電子郵件地址已通過驗證
Fazl BarezUniversity of Oxford在 robots.ox.ac.uk 的電子郵件地址已通過驗證

追蹤

Hosein Hasanbeig

Microsoft Research

在 microsoft.com 的電子郵件地址已通過驗證 - 首頁

Machine Learning Deep Learning Formal Methods Automatic Control


標題按引用次數排序按年份排序按標題排序	引用次數引用次數	年份
Reinforcement Learning for Temporal Logic Control Synthesis with Probabilistic Satisfaction Guarantees M Hasanbeig, Y Kantaros, A Abate, D Kroening, GJ Pappas, I Lee IEEE Conference on Decision and Control (CDC), 2019	155	2019
Logically-Constrained Reinforcement Learning M Hasanbeig, A Abate, D Kroening arXiv preprint arXiv:1801.08099, 2018	127	2018
Cautious Reinforcement Learning with Logical Constraints M Hasanbeig, A Abate, D Kroening AAMAS, 483-491, 2020	107	2020
Modular Deep Reinforcement Learning for Continuous Motion Planning with Temporal Logic M Cai, M Hasanbeig, S Xiao, A Abate, Z Kan IEEE Robotics and Automation and IROS, 2021	99	2021
Deep Reinforcement Learning with Temporal Logics M Hasanbeig, D Kroening, A Abate International Conference on Formal Modeling and Analysis of Timed Systems, 1-22, 2020	77	2020
Certified reinforcement learning with logic guidance H Hasanbeig, D Kroening, A Abate Artificial Intelligence 322, 103949, 2023	74	2023
Deepsynth: Program Synthesis for Automatic Task Segmentation in Deep Reinforcement Learning M Hasanbeig, NY Jeppu, A Abate, T Melham, D Kroening AAAI Conference on Artificial Intelligence (AAAI-21), 2021	68*	2021
Evaluating cognitive maps in large language models with cogeval: No emergent planning I Momennejad, H Hasanbeig, FV Frujeri, H Sharma, RO Ness, N Jojic, ... Advances in neural information processing systems 37, 2023	61*	2023
Logically-Constrained Neural Fitted Q-iteration M Hasanbeig, A Abate, D Kroening AAMAS, 2012-2014, 2019	51	2019
Modular Deep Reinforcement Learning with Temporal Logic Specifications LZ Yuan, M Hasanbeig, A Abate, D Kroening arXiv preprint arXiv:1909.11591, 2019	48	2019
Towards Verifiable and Safe Model-free Reinforcement Learning M Hasanbeig, D Kroening, A Abate Workshop on Artificial Intelligence and Formal Verification, Logics …, 2020	31*	2020
Shielding Atari Games with Bounded Prescience M Giacobbe, M Hasanbeig, D Kroening, H Wijk International Conference on Autonomous Agents and Multiagent Systems, 2021	30	2021
LCRL: Certified Policy Synthesis via Logically-Constrained Reinforcement Learning M Hasanbeig, D Kroening, A Abate International Conference on Quantitative Evaluation of Systems, 217-231, 2022	19	2022
Deepsynth: Program synthesis for automatic task segmentation in deep reinforcement learning M Hasanbeig, NY Jeppu, A Abate, T Melham, D Kroening arXiv preprint arXiv:1911.10244, 2019	19	2019
On Synchronous Binary Log-Linear Learning and Second Order Q-learning M Hasanbeig, L Pavel IFAC World Congress 50 (1), 8987-8992, 2017	14	2017
Allure: A systematic protocol for auditing and improving llm-based evaluation of text using iterative in-context-learning H Hasanbeig, H Sharma, L Betthauser, FV Frujeri, I Momennejad arXiv preprint arXiv:2309.13701 3, 2023	10	2023
From Game-theoretic Multi-agent Log Linear Learning to Reinforcement Learning M Hasanbeig, L Pavel arXiv preprint arXiv:1802.02277, 2018	9	2018
Distributed Coverage Control by Robot Networks in Unknown Environments using a Modified EM Algorithm M Hasanbeig, L Pavel International Journal of Computer and Information Engineering 11 (7), 815-823, 2017	8	2017
ALLURE: auditing and improving llm-based evaluation of text using iterative in-context-learning H Hasanbeig, H Sharma, L Betthauser, FV Frujeri, I Momennejad arXiv preprint arXiv:2309.13701, 2023	7	2023
Logically-correct reinforcement learning. CoRR abs/1801.08099 M Hasanbeig, A Abate, D Kroening	6	2017

系統目前無法執行作業，請稍後再試。

文章 1–20

每年的引文數

重複引用

合併引文

新增共同作者共同作者

追蹤

引用次數

共同作者