Minsu Kim

Cituota

	Visi	Nuo 2020
Šaltiniai	583	583
h-rodyklė	15	15
i10-rodyklė	17	17

320

160

240

202120222023202420254 46 164 319 49

Bendraautoriai

Yong Man RoProfessor of Electrical Engineering, KAIST, ICT Endowed Chair ProfessorPatvirtintas el. paštas kaist.ac.kr
Joanna HongPh.D. at Korea Advanced Institute of Science and TechnologyPatvirtintas el. paštas kaist.ac.kr
Se Jin ParkKorea Advanced Institute of Science and Technology (KAIST)Patvirtintas el. paštas kaist.ac.kr
Jeongsoo ChoiKAISTPatvirtintas el. paštas kaist.ac.kr
Jeong Hun YeoKorea Advanced Institute of Science and TechnologyPatvirtintas el. paštas kaist.ac.kr
Shinji WatanabeCarnegie Mellon UniversityPatvirtintas el. paštas cmu.edu
Hyeongseop RhaIntegrated PhD program in KAISTPatvirtintas el. paštas kaist.ac.kr
Junho KimKorea Advanced Institute of Science and Technology (KAIST)Patvirtintas el. paštas kaist.ac.kr
Soumi MaitiCarnegie Mellon UniversityPatvirtintas el. paštas andrew.cmu.edu
Hyunjun KimKorea Advanced Institute of Science and TechnologyPatvirtintas el. paštas kaist.ac.kr
Hong Joo, LeeTechnical University of MunichPatvirtintas el. paštas tum.de
Hyung-Il KimSenior Researcher, ETRIPatvirtintas el. paštas etri.re.kr
Chae Won KimKorea Advanced Institute of Science and TechnologyPatvirtintas el. paštas kaist.ac.kr
Sangmin LeeAssistant Professor, Sungkyunkwan UniversityPatvirtintas el. paštas skku.edu
Seunghee HanKAIST, Samsung researchPatvirtintas el. paštas kaist.ac.kr
Siddhant AroraGraduate Student, Carnegie Mellon UniversityPatvirtintas el. paštas andrew.cmu.edu
Xuankai ChangApple AI/MLPatvirtintas el. paštas apple.com
Jee-weon JungApple, Carnegie Mellon UniversityPatvirtintas el. paštas ieee.org
Honglie ChenMeta AI, University of OxfordPatvirtintas el. paštas meta.com
Umberto CappellazzoPhD candidate @ University of Trento.Patvirtintas el. paštas unitn.it

Stebėti

Minsu Kim

Meta AI

Patvirtintas el. paštas meta.com - Pagrindinis puslapis

Multimodal Learning Audio-Visual Speech Processing Generative AI


Pavadinimas Rūšiuoti pagal šaltinius Rūšiuoti pagal metus Rūšiuoti pagal pavadinimą	Cituota Cituota	Metai
Synctalkface: Talking face generation with precise lip-syncing via audio-lip memory SJ Park, M Kim, J Hong, J Choi, YM Ro Proceedings of the AAAI Conference on Artificial Intelligence 36 (2), 2062-2070, 2022	81	2022
Distinguishing homophenes using multi-head visual-audio memory for lip reading M Kim, JH Yeo, YM Ro Proceedings of the AAAI conference on artificial intelligence 36 (1), 1174-1182, 2022	57	2022
Multi-modality associative bridging through memory: Speech sound recollected from face video M Kim, J Hong, SJ Park, YM Ro Proceedings of the IEEE/CVF International Conference on Computer Vision, 296-306, 2021	52	2021
Lip to speech synthesis with visual context attentional GAN M Kim, J Hong, YM Ro Advances in Neural Information Processing Systems 34, 2758-2770, 2021	48	2021
Watch or listen: Robust audio-visual speech recognition with visual corruption modeling and reliability scoring J Hong, M Kim, J Choi, YM Ro Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern …, 2023	38	2023
Cromm-vsr: Cross-modal memory augmented visual speech recognition M Kim, J Hong, SJ Park, YM Ro IEEE Transactions on Multimedia 24, 4342-4355, 2021	33	2021
Speech reconstruction with reminiscent sound via visual voice memory J Hong, M Kim, SJ Park, YM Ro IEEE/ACM Transactions on Audio, Speech, and Language Processing 29, 3654-3667, 2021	25	2021
Speaker-adaptive lip reading with user-dependent padding M Kim, H Kim, YM Ro European Conference on Computer Vision, 576-593, 2022	24	2022
Visual context-driven audio feature enhancement for robust end-to-end audio-visual speech recognition J Hong, M Kim, D Yoo, YM Ro INTERSPEECH 2022, 2022	24	2022
Lip-to-speech synthesis in the wild with multi-task learning M Kim, J Hong, YM Ro ICASSP 2023-2023 IEEE International Conference on Acoustics, Speech and …, 2023	22	2023
Prompt tuning of deep neural networks for speaker-adaptive visual speech recognition M Kim, HI Kim, YM Ro IEEE Transactions on Pattern Analysis and Machine Intelligence, 2024	18	2024
Textless Unit-to-Unit training for Many-to-Many Multilingual Speech-to-Speech Translation M Kim, J Choi, D Kim, YM Ro IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2024	18*	2024
Akvsr: Audio knowledge empowered visual speech recognition by compressing audio knowledge of a pretrained model JH Yeo, M Kim, J Choi, DH Kim, YM Ro IEEE Transactions on Multimedia 26, 6462-6474, 2024	18	2024
Intelligible Lip-to-Speech Synthesis with Speech Units J Choi, M Kim, YM Ro INTERSPEECH 2023, 2023	17	2023
Visual Speech Recognition for Languages with Limited Labeled Data using Automatic Labels from Whisper JH Yeo, M Kim, S Watanabe, YM Ro ICASSP 2024-2024 IEEE International Conference on Acoustics, Speech and …, 2024	15*	2024
Lip reading for low-resource languages by learning and combining general speech knowledge and language-specific knowledge M Kim, JH Yeo, J Choi, YM Ro Proceedings of the IEEE/CVF International Conference on Computer Vision …, 2023	13	2023
Multi-temporal lip-audio memory for visual speech recognition JH Yeo, M Kim, YM Ro ICASSP 2023-2023 IEEE International Conference on Acoustics, Speech and …, 2023	11	2023
Interpretation of lesional detection via counterfactual generation J Kim, M Kim, YM Ro 2021 IEEE International Conference on Image Processing (ICIP), 96-100, 2021	9	2021
Where visual speech meets language: VSP-LLM framework for efficient and context-aware visual speech processing JH Yeo, S Han, M Kim, YM Ro arXiv preprint arXiv:2402.15151, 2024	8	2024
Towards practical and efficient image-to-speech captioning with vision-language pre-training and multi-modal tokens M Kim, J Choi, S Maiti, JH Yeo, S Watanabe, YM Ro ICASSP 2024-2024 IEEE International Conference on Acoustics, Speech and …, 2024	7	2024

Sistema negali atlikti operacijos. Bandykite vėliau dar kartą.

Straipsniai 1–20

Šaltinių per metus

Dubliuoti šaltiniai

Sujungti šaltiniai

Pridėti bendraautoriusBendraautoriai

Stebėti

Cituota

Bendraautoriai