- Academic Search

文章

学术搜索

找到约 44 条结果（用时0.02秒）

我的个人学术档案我的图书馆

Wavllm: Towards robust and adaptive speech large language model

在引用文章中搜索

[Free GPT-4]

[PDF] arxiv.org

Llama-omni: Seamless speech interaction with large language models

Q Fang, S Guo, Y Zhou, Z Ma, S Zhang… - ar** the overall human perceptual
experience. While prevailing large language models (LLMs) and visual language models …

保存引用被引用次数：9 相关文章所有 3 个版本

[Free GPT-4]

[PDF] arxiv.org

BLSP-KD: Bootstrap** Language-Speech Pre-training via Knowledge Distillation

C Wang, M Liao, Z Huang, J Zhang - arxiv preprint arxiv:2405.19041, 2024 - arxiv.org

Recent end-to-end approaches have shown promise in extending large language models
(LLMs) to speech inputs, but face limitations in directly assessing and optimizing alignment …

保存引用被引用次数：5 相关文章所有 2 个版本 HTML 版

创建快讯

引用

高级搜索

已保存到“我的图书馆”

Wavllm: Towards robust and adaptive speech large language model

Llama-omni: Seamless speech interaction with large language models

BLSP-KD: Bootstrap** Language-Speech Pre-training via Knowledge Distillation