- Academic Search

記事

Scholar

1 件（0.02 秒）

プロフィールマイライブラリ

FlashAudio: Rectified Flows for Fast and High-Fidelity Text-to-Audio Generation

引用している記事内を検索

[Free GPT-4]

[PDF] arxiv.org

Vintage: Joint video and text conditioning for holistic audio generation

SS Kushwaha, Y Tian - arxiv preprint arxiv:2412.10768, 2024 - arxiv.org

Recent advances in audio generation have focused on text-to-audio (T2A) and video-to-
audio (V2A) tasks. However, T2A or V2A methods cannot generate holistic sounds …

保存引用被引用数: 1 関連記事 HTMLバージョン

アラートを作成

引用

検索オプション

マイライブラリに保存しました

FlashAudio: Rectified Flows for Fast and High-Fidelity Text-to-Audio Generation

Vintage: Joint video and text conditioning for holistic audio generation