Naoyuki Kanda

Citeret af

	Alle	Siden 2020
Henvisninger	5789	5260
h-index	34	31
i10-indeks	62	53

2200

1100

550

1650

2006200720082009201020112012201320142015201620172018201920202021202220232024202515 21 15 15 14 19 28 35 44 31 42 60 62 111 193 480 881 1337 2136 221

Medforfattere

Takuya YoshiokaAssemblyAIVerificeret mail på assemblyai.com
Zhuo ChenBytedance (formerly Microsoft, Columbia University)Verificeret mail på columbia.edu
Jinyu LiPartner Applied Science Manager, MicrosoftVerificeret mail på microsoft.com
Xiaofei WangMicrosoftVerificeret mail på jhu.edu
Zhong MengGoogleVerificeret mail på google.com
Xiong XiaoPrincipal Applied scientist, MicrosoftVerificeret mail på microsoft.com
Yashesh GaurMeta, GenAI, Llama foundation modelsVerificeret mail på cs.cmu.edu
Yusuke FujitaLY Corp.Verificeret mail på linecorp.com
Shota HoriguchiNTT CorporationVerificeret mail på ntt.com
Shinji WatanabeCarnegie Mellon UniversityVerificeret mail på cmu.edu
Yu Wu (吴俣)DeepSeek AIVerificeret mail på deepseek.com
Yao QianMicrosoftVerificeret mail på microsoft.com
Yifan GongPrincipal Science Manager, Microsoft Corp.Verificeret mail på microsoft.com
Hiroshi G OkunoProfessor Emeritus, Kyoto University, Adjunct Researcher, Waseda UniversityVerificeret mail på nue.org
Aswin Shanmugam SubramanianMicrosoftVerificeret mail på microsoft.com
Kazunori KomataniProfessor, Osaka UniversityVerificeret mail på sanken.osaka-u.ac.jp
Hiroshi TsujinoHonda R&D Co., Ltd.Verificeret mail på jp.honda
Kazuhiro NakadaiInstitute of Science TokyoVerificeret mail på ra.sc.e.titech.ac.jp
Christoph BoeddekerPaderborn UniversityVerificeret mail på mail.upb.de
Vimal ManoharMeta Platforms Inc.Verificeret mail på meta.com

Følg

Naoyuki Kanda

Meta

Verificeret mail på meta.com

Speech Recognition Speech Synthesis Speech and Language Processing Machine Learning


Titel Sortér efter henvisninger Sortér efter årstal Sortér efter titel	Citeret af Citeret af	År
Wavlm: Large-scale self-supervised pre-training for full stack speech processing S Chen, C Wang, Z Chen, Y Wu, S Liu, Z Chen, J Li, N Kanda, T Yoshioka, ... IEEE Journal of Selected Topics in Signal Processing 16 (6), 1505-1518, 2022	1862	2022
A review of speaker diarization: Recent advances with deep learning TJ Park, N Kanda, D Dimitriadis, KJ Han, S Watanabe, S Narayanan Computer Speech & Language 72, 101317, 2022	429	2022
CHiME-6 Challenge: Tackling multispeaker speech recognition for unsegmented recordings S Watanabe, M Mandel, J Barker, E Vincent, A Arora, X Chang, ... arXiv preprint arXiv:2004.09249, 2020	366	2020
End-to-end neural speaker diarization with self-attention Y Fujita, N Kanda, S Horiguchi, Y Xue, K Nagamatsu, S Watanabe 2019 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU …, 2019	296	2019
End-to-end neural speaker diarization with permutation-free objectives Y Fujita, N Kanda, S Horiguchi, K Nagamatsu, S Watanabe arXiv preprint arXiv:1909.05952, 2019	292	2019
Elastic spectral distortion for low resource speech recognition with deep neural networks N Kanda, R Takeda, Y Obuchi Automatic Speech Recognition and Understanding (ASRU), 2013 IEEE Workshop on …, 2013	153	2013
Serialized output training for end-to-end overlapped speech recognition N Kanda, Y Gaur, X Wang, Z Meng, T Yoshioka arXiv preprint arXiv:2003.12687, 2020	131	2020
Internal language model estimation for domain-adaptive end-to-end speech recognition Z Meng, S Parthasarathy, E Sun, Y Gaur, N Kanda, L Lu, X Chen, R Zhao, ... 2021 IEEE Spoken Language Technology Workshop (SLT), 243-250, 2021	116	2021
Integration of speech separation, diarization, and recognition for multi-speaker meetings: System description, comparison, and analysis D Raj, P Denisov, Z Chen, H Erdogan, Z Huang, M He, S Watanabe, J Du, ... 2021 IEEE spoken language technology workshop (SLT), 897-904, 2021	103	2021
Joint speaker counting, speech recognition, and speaker identification for overlapped speech of any number of speakers N Kanda, Y Gaur, X Wang, Z Meng, Z Chen, T Zhou, T Yoshioka arXiv preprint arXiv:2006.10930, 2020	91	2020
Microsoft speaker diarization system for the voxceleb speaker recognition challenge 2020 X Xiao, N Kanda, Z Chen, T Zhou, T Yoshioka, S Chen, Y Zhao, G Liu, ... ICASSP 2021-2021 IEEE International Conference on Acoustics, Speech and …, 2021	84	2021
Guided source separation meets a strong ASR backend: Hitachi/Paderborn University joint investigation for dinner party ASR N Kanda, C Boeddeker, J Heitkaemper, Y Fujita, S Horiguchi, ... arXiv preprint arXiv:1905.12230, 2019	79	2019
A two-layer model for behavior and dialogue planning in conversational service robots M Nakano, Y Hasegawa, K Nakadai, T Nakamura, J Takeuchi, T Torii, ... 2005 IEEE/RSJ International Conference on Intelligent Robots and Systems …, 2005	70	2005
Speechx: Neural codec language model as a versatile speech transformer X Wang, M Thakker, Z Chen, N Kanda, SE Eskimez, S Chen, M Tang, ... IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2024	69	2024
Streaming multi-talker ASR with token-level serialized output training N Kanda, J Wu, Y Wu, X Xiao, Z Meng, X Wang, Y Gaur, Z Chen, J Li, ... arXiv preprint arXiv:2202.00842, 2022	63	2022
Maximum a posteriori Based Decoding for CTC Acoustic Models N Kanda, X Lu, H Kawai Interspeech 2016, 1868-1872, 2016	58	2016
Multi-domain spoken dialogue system with extensibility and robustness against speech recognition errors K Komatani, N Kanda, M Nakano, K Nakadai, H Tsujino, T Ogata, ... Proceedings of the 7th SIGdial Workshop on Discourse and Dialogue, 9-17, 2006	58	2006
Internal language model training for domain-adaptive end-to-end speech recognition Z Meng, N Kanda, Y Gaur, S Parthasarathy, E Sun, L Lu, X Chen, J Li, ... ICASSP 2021-2021 IEEE International Conference on Acoustics, Speech and …, 2021	57	2021
Face-voice matching using cross-modal embeddings S Horiguchi, N Kanda, K Nagamatsu Proceedings of the 26th ACM international conference on Multimedia, 1011-1019, 2018	55	2018
The Hitachi/JHU CHiME-5 system: Advances in speech recognition for everyday home environments using multiple microphone arrays N Kanda, R Ikeshita, S Horiguchi, Y Fujita, K Nagamatsu, X Wang, ... Proc. CHiME-5, 6-10, 2018	54	2018

Systemet kan ikke foretage handlingen nu. Prøv igen senere.

Artikler 1–20

Henvisninger pr. år

Dublerede henvisninger

Flettede henvisninger

Tilføj medforfattereMedforfattere

Følg

Citeret af

Medforfattere