原文:AI論文解讀丨融合視覺、語義、關系多模態信息的文檔版面分析架構VSR

摘要:文檔版式分析任務中,文檔的視覺信息 文本信息 各版式部件間的關系信息都對分析過程具有很重要的作用。本文提出一種融合視覺 文本 關系多模態信息的版式分析架構VSR。 本文分享自華為雲社區 論文解讀系列十八:融合視覺 語義 關系多模態信息的文檔版面分析架構VSR ,作者: 小菜鳥chg 。 現有文檔版面分析方法大致可分為兩種:基於NLP的方法將版面分析任務看作是序列標簽分類任務 sequenc ...

2021-07-30 11:10 0 191 推薦指數:

查看詳情

論文解讀文檔結構分析

摘要:一個端到端的文檔結構分析方案(DocParser),對文檔(掃描版、圖片版等)進行結構提取,包括實體識別(這里實體指所有需要檢測的元素,包括文本、行、列、單元格等)和關系分類。 本文分享自華為雲社區《論文解讀系列十五:文檔結構分析》,原文作者:一笑傾城。 1 文章摘要 提出 ...

Mon Jul 05 23:11:00 CST 2021 0 156
論文解讀LayoutLM: 面向文檔理解的文本與版面預訓練

摘要:LayoutLM模型利用大規模無標注文檔數據集進行文本與版面的聯合預訓練,在多個下游的文檔理解任務上取得了領先的結果。 本文分享自華為雲社區《論文解讀系列二十五:LayoutLM: 面向文檔理解的文本與版面預訓練》,作者: 松軒。 1. 引言 文檔理解或文檔智能 ...

Thu Nov 18 23:18:00 CST 2021 0 128
論文解讀無監督視覺表征學習的動量對比

摘要:本文提出了一個用於無監督視覺表征學習的動量對比方法(MoCo)。從將對比學習作為字典查詢過程的角度來看,本文構建了一個由隊列和移動平均編碼器組成的動態字典。 本文分享自華為雲社區《論文解讀系列二十九:無監督視覺表征學習的動量對比》,作者:谷雨潤一麥。 摘要 本文提出了一個用於 ...

Wed Nov 17 19:54:00 CST 2021 0 106
論文解讀|激光視覺融合的V-LOAM

本文轉載自「計算機視覺工坊」,該公眾號重點在於介紹計算機視覺方向的知識點,主要包括3D算法、2D算法、自動駕駛、光學介紹、算法與編程等。 論文題目:《Visual-lidar Odometry and Mapping: Low-drift, Robust, and Fast》 發表在2015年 ...

Sat Sep 05 18:23:00 CST 2020 0 843
論文解讀圖神經網絡應用於半結構化文檔的命名實體識別和關系提取

摘要: 隨着用於傳遞和記錄業務信息的管理文檔的廣泛使用,能夠魯棒且高效地從這些文檔中自動提取和理解內容的方法成為一個迫切的需求。本次解讀的文章提出利用圖神經網絡來解決半結構化文檔中的實體識別(NER)和關系提取問題。 本文分享自華為雲社區《論文解讀系列十一:圖神經網絡應用於半結構化文檔 ...

Wed Jul 07 22:57:00 CST 2021 0 135
論文解讀基於局部特征保留的圖卷積神經網絡架構(LPD-GCN)

摘要:本文提出一種基於局部特征保留的圖卷積網絡架構,與最新的對比算法相比,該方法在多個數據集上的圖分類性能得到大幅度提升,泛化性能也得到了改善。 本文分享自華為雲社區《論文解讀:基於局部特征保留的圖卷積神經網絡架構(LPD-GCN)》,原文作者:PG13 。 近些年,很多研究者開發了許多 ...

Fri May 07 18:46:00 CST 2021 0 1040
論文解讀表格識別模型TableMaster

摘要:在此解決方案中把表格識別分成了四個部分:表格結構序列識別、文字檢測、文字識別、單元格和文字框對齊。其中表格結構序列識別用到的模型是基於Master修改的,文字檢測模型用到的是PSENet,文字識別用到的是Master模型。 本文分享自華為雲社區《論文解讀二十八:表格識別模型 ...

Wed Oct 27 18:37:00 CST 2021 0 1078
論文解讀無參數的注意力模塊SimAm

摘要:本文提出了一個概念簡單但對卷積神經網絡非常有效的注意力模塊。 本文分享自華為雲社區《論文解讀系列三十:無參數的注意力模塊SimAm論文解讀》,作者:谷雨潤一麥。 摘要 本文提出了一個概念簡單但對卷積神經網絡非常有效的注意力模塊。相比於現有的通道注意力和空間注意力機制,本文直接 ...

Wed Nov 24 22:26:00 CST 2021 0 164
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM