Įkeliama...
Sistema negali atlikti operacijos. Bandykite vėliau dar kartą.
Šaltinių per metus
Dubliuoti šaltiniai
Toliau nurodyti straipsniai sujungti Mokslinčiuje. Jų
suderinti šaltiniai
skaičiuojami tik pirmajam straipsniui.
Sujungti šaltiniai
Į grafą „Cituota“ įeina šaltiniai į toliau nurodytus straipsnius Mokslinčiuje. Pažymėti
*
gali skirtis nuo straipsnių profilyje.
Pridėti bendraautorius
Bendraautoriai
Stebėti
Nauji šio autoriaus straipsniai
Nauji šio autoriaus šaltiniai
Nauji su šio autoriaus tyrimu susiję straipsniai
El. pašto adresas atnaujinimams
Baigta
Mano profilis
Mano biblioteka
Metrika
Įspėjimai
Nustatymai
Registruotis
Registruotis
Gauti savo profilį
Cituota
Visi
Nuo 2020
Šaltiniai
30
30
h-rodyklė
1
1
i10-rodyklė
1
1
0
24
12
2023
2024
2025
1
23
6
Viešas pasiekiamumas
Peržiūrėti viską
Peržiūrėti viską
1 straipsnis
0 straipsnių
pasiekiami
nepasiekiami
Pagal finansavimo įpareigojimus
Bendraautoriai
Jianfei Chen
Associate Professor, Tsinghua University
Patvirtintas el. paštas mail.tsinghua.edu.cn
Jun Zhu
Professor of Computer Science, Tsinghua University
Patvirtintas el. paštas mail.tsinghua.edu.cn
Zhanpeng Zhou
Shanghai Jiao Tong University
Patvirtintas el. paštas sjtu.edu.cn
Taiji Suzuki
The University of Tokyo
Patvirtintas el. paštas mist.i.u-tokyo.ac.jp
Wei Huang
Research Scientist, RIKEN AIP
Patvirtintas el. paštas riken.jp
Andi Han
Postdoctoral Researcher, Riken AIP
Patvirtintas el. paštas riken.jp
Stebėti
Bingrui Li
Kiti vardai
李 炳睿
Tsinghua University
Patvirtintas el. paštas mails.tsinghua.edu.cn -
Pagrindinis puslapis
Machine Learning
Optimization
Deep Learning Theory
Large Language Models
Straipsniai
Cituota
Viešas pasiekiamumas
Bendraautoriai
Pavadinimas
Rūšiuoti
Rūšiuoti pagal šaltinius
Rūšiuoti pagal metus
Rūšiuoti pagal pavadinimą
Cituota
Cituota
Metai
Memory Efficient Optimizers with 4-bit States
B Li, J Chen, J Zhu
Advances in Neural Information Processing Systems 36
, 2023
29
2023
On the Optimization and Generalization of Two-layer Transformers with Sign Gradient Descent
B Li, W Huang, A Han, Z Zhou, T Suzuki, J Zhu, J Chen
arXiv preprint arXiv:2410.04870
, 2024
1
2024
Sharpness-Aware Minimization Efficiently Selects Flatter Minima Late in Training
Z Zhou, M Wang, Y Mao, B Li, J Yan
arXiv preprint arXiv:2410.10373
, 2024
2024
Sistema negali atlikti operacijos. Bandykite vėliau dar kartą.
Straipsniai 1–3
Rodyti daugiau
Privatumas
Sąlygos
Pagalba
Apie Mokslinčių
Paieškos pagalba