Google Académico

Artículos

Académico

Aproximadamente 83 resultados (0.02 s)

Aishell-4: An open source dataset for speech enhancement, separation, recognition and speaker diarization in conference scenario

Y Fu, L Cheng, S Lv, Y Jv, Y Kong, Z Chen… - arxiv preprint arxiv …, 2021 - arxiv.org

In this paper, we present AISHELL-4, a sizable real-recorded Mandarin speech dataset
collected by 8-channel circular microphone array for speech processing in conference …

Guardar Citar Citado por 90 Artículos relacionados Las 8 versiones Versión en HTML

[Free GPT-4]

[PDF] ieee.org

Encoder-decoder based attractors for end-to-end neural diarization

S Horiguchi, Y Fujita, S Watanabe… - … /ACM Transactions on …, 2022 - ieeexplore.ieee.org

This paper investigates an end-to-end neural diarization (EEND) method for an unknown
number of speakers. In contrast to the conventional cascaded approach to speaker …

Guardar Citar Citado por 69 Artículos relacionados Las 6 versiones

[Free GPT-4]

[PDF] acm.org

Ava-avd: Audio-visual speaker diarization in the wild

EZ Xu, Z Song, S Tsutsui, C Feng, M Ye… - Proceedings of the 30th …, 2022 - dl.acm.org

Audio-visual speaker diarization aims at detecting" who spoke when''using both auditory
and visual signals. Existing audio-visual diarization datasets are mainly focused on indoor …

Guardar Citar Citado por 50 Artículos relacionados Las 2 versiones

Citar

Búsqueda avanzada

Guardado en Mi biblioteca

Aishell-4: An open source dataset for speech enhancement, separation, recognition and speaker diarization in conference scenario

Encoder-decoder based attractors for end-to-end neural diarization

Ava-avd: Audio-visual speaker diarization in the wild