- Academic Search

Artikelen

Scholar

1 resultaat (0,02 sec)

Mijn profiel Mijn bibliotheek

Boosting weakly-supervised referring image segmentation via progressive comprehension

Zoeken in citerende artikelen

Turnitin 降AI改写早检测系统早降重系统 Turnitin-UK版万方检测-期刊版维普编辑部版 Grammarly检测 Paperpass检测 checkpass检测 PaperYY检测

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Mova: Adapting mixture of vision experts to multimodal context

Z Zong, B Ma, D Shen, G Song, H Shao, D Jiang… - arxiv preprint arxiv …, 2024 - arxiv.org

As the key component in multimodal large language models (MLLMs), the ability of the
visual encoder greatly affects MLLM's understanding on diverse image content. Although …

Opslaan Citeren Geciteerd door 35 Verwante artikelen Alle 5 versies HTML-versie

Melding maken

Citeren

Geavanceerd zoeken

Opgeslagen in Mijn bibliotheek

Boosting weakly-supervised referring image segmentation via progressive comprehension

Mova: Adapting mixture of vision experts to multimodal context