JavaScript Language Online Compiler

Vision-Language Models for Vision Tasks: A Survey

Abstract: Most visual recognition studies rely heavily on crowd-labelled data in deep neural networks (DNNs) training, and they usually train a DNN for each single visual recognition task, leading to ...

IEEE

OVL-MAP: An Online Visual Language Map Approach for Vision-and-Language Navigation in Continuous Environments

Abstract: Vision-and-Language Navigation in Continuous Environments (VLN-CE) requires agents to navigate 3D environments based on visual observations and natural language instructions. Existing ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results

Vision-Language Models for Vision Tasks: A Survey

OVL-MAP: An Online Visual Language Map Approach for Vision-and-Language Navigation in Continuous Environments

Trending now