Google Académico

J Zhang, R Liu, H Shi, K Yang, S Reiß… - Proceedings of the …, 2023 - openaccess.thecvf.com

Multimodal fusion can make semantic segmentation more robust. However, fusing an
arbitrary number of modalities remains underexplored. To delve into this problem, we create …

Guardar Citar Citado por 105 Artículos relacionados Las 7 versiones Versión en HTML

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Chatbridge: Bridging modalities with large language model as a language catalyst

Z Zhao, L Guo, T Yue, S Chen, S Shao, X Zhu… - arxiv preprint arxiv …, 2023 - arxiv.org

Building general-purpose models that can perceive diverse real-world modalities and solve
various tasks is an appealing target in artificial intelligence. In this paper, we present …

Guardar Citar Citado por 54 Artículos relacionados Las 2 versiones Versión en HTML

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Deep learning based 3D segmentation: A survey

Y He, H Yu, X Liu, Z Yang, W Sun, S Anwar… - arxiv preprint arxiv …, 2021 - arxiv.org

3D segmentation is a fundamental and challenging problem in computer vision with
applications in autonomous driving and robotics. It has received significant attention from the …

Guardar Citar Citado por 98 Artículos relacionados Las 3 versiones Versión en HTML

An efficient RGB-D indoor scene-parsing solution via lightweight multiflow intersection and knowledge distillation

W Zhou, Y Zhang, W Yan, L Ye - IEEE Journal of Selected …, 2024 - ieeexplore.ieee.org

The rapid progression of convolutional neural networks (CNNs) has significantly improved
indoor scene parsing, transforming the fields of robotics, autonomous navigation …

Guardar Citar Citado por 12 Artículos relacionados Las 2 versiones

Cross-modal attention fusion network for RGB-D semantic segmentation

Q Zhao, Y Wan, J Xu, L Fang - Neurocomputing, 2023 - Elsevier

RGB-D semantic segmentation is crucial for robots to understand scenes. Most existing
methods take depth information as an additional input, leading to cross-modal semantic …

Guardar Citar Citado por 25 Artículos relacionados Las 2 versiones

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Object segmentation by mining cross-modal semantics

Z Wu, J Wang, Z Zhou, Z An, Q Jiang… - Proceedings of the 31st …, 2023 - dl.acm.org

Multi-sensor clues have shown promise for object segmentation, but inherent noise in each
sensor, as well as the calibration error in practice, may bias the segmentation accuracy. In …

Guardar Citar Citado por 18 Artículos relacionados Las 4 versiones

Dual-modal non-local context guided multi-stage fusion for indoor RGB-D semantic segmentation

X Guo, W Ma, F Liang, Q Mi - Expert Systems with Applications, 2024 - Elsevier

Complementarily fusing RGB and depth images while effectively suppressing task-irrelevant
noise is crucial for achieving accurate indoor RGB-D semantic segmentation. In this paper …

Guardar Citar Citado por 5 Artículos relacionados Las 2 versiones

[Free GPT-4]
[DeepSeek]

[HTML] sciencedirect.com

[HTML][HTML] A Transformer-based multi-modal fusion network for semantic segmentation of high-resolution remote sensing imagery

Y Liu, K Gao, H Wang, Z Yang, P Wang, S Ji… - International Journal of …, 2024 - Elsevier

Semantic segmentation of high-resolution multispectral remote sensing image has been
intensely studied. However, the shadow occlusions, or the similar color and textures …

Guardar Citar Citado por 3 Artículos relacionados Las 3 versiones

Deep learning based 3D segmentation in computer vision: A survey

Y He, H Yu, X Liu, Z Yang, W Sun, S Anwar, A Mian - Information Fusion, 2025 - Elsevier

Abstract 3D segmentation is a fundamental and challenging problem in computer vision with
applications in autonomous driving and robotics. It has received significant attention from the …

Guardar Citar Citado por 1 Artículos relacionados Las 2 versiones

Cross-modal transformer for RGB-D semantic segmentation of production workshop objects

Q Ru, G Chen, T Zuo, X Liao - Pattern Recognition, 2023 - Elsevier

Scene understanding in a production workshop is an important technology to improve its
intelligence level, semantic segmentation of production workshop objects is an effective …

Guardar Citar Citado por 8 Artículos relacionados Las 3 versiones

Crear alerta

Citar

Búsqueda avanzada

Guardado en Mi biblioteca

Transformer fusion for indoor rgb-d semantic segmentation

Delivering arbitrary-modal semantic segmentation

Chatbridge: Bridging modalities with large language model as a language catalyst

Deep learning based 3D segmentation: A survey

An efficient RGB-D indoor scene-parsing solution via lightweight multiflow intersection and knowledge distillation

Cross-modal attention fusion network for RGB-D semantic segmentation

Object segmentation by mining cross-modal semantics

Dual-modal non-local context guided multi-stage fusion for indoor RGB-D semantic segmentation

[HTML][HTML] A Transformer-based multi-modal fusion network for semantic segmentation of high-resolution remote sensing imagery

Deep learning based 3D segmentation in computer vision: A survey

Cross-modal transformer for RGB-D semantic segmentation of production workshop objects