标签【VQA】 - 码上欢乐

花费 7 ms

　　在VQA， Image Caption等任务中，构建模型是一件工作量较大的工作。有没有什么能减少这些重复的工作量呢？与此同时，Pytorch，tensorflow等开源的深度学习工具包发布，大大减 ...

标题：基于知识的视觉问答的多模态知识提取与积累来源：CVPR 2022https://arxiv.org/abs/2203.09138 代码：https://github.com/Ander ...