pdf文件標簽自動批量生成


  1. 打開abbyy finereader軟件並新建一個pdf文件到word的任務,啟動對指定pdf文件的文字識別,如果pdf文件較大,識別過程會很長,因此當完成目錄頁的識別后即可停止,然后將識別出的目錄文本拷貝到excel表格中(也可以將pdf文件的目錄頁面導出,然后用abbyy finereader將導出的pdf文件轉換為word文檔,再將word文檔中的目錄文本拷貝粘貼到excel表格)。
  2.  對excel表格中的目錄文本進行修整。由於abbyy的文字識別准確率不能達到100%,可以對其中錯誤的文字進行適當修正。有些頁碼並不是數字形式(比如I、IV、XI等),需要替換成數字形式。將表格調整為兩列,每行文本除頁碼外的內容放置第一列(通過列合並來實現),頁碼放置在另一列。如果頁面的實際頁碼與目錄中標明的頁碼不一致,需要對每行文本的頁碼都加上(或減去)一個差值(excel很容易完成這種任務,這也是使用excel來調整目錄文本的原因),注意在調整頁碼數值之前需要移除所有的空行。
  3. 書簽文檔制作。新建txt文件並將excel表格中的文本復制到該文檔,對書簽文檔中的每行文本按目錄級別縮進相應數目的tab(第一級不縮進),然后將書簽文檔保存在特定目錄下。
  4. 打開FreePic2Pdf軟件,點擊右下角的“更改pdf”按鈕,在彈出的"更改pdf"對話框中點擊“往pdf掛書簽”標簽頁,然后選擇待修改的pdf文件、設置工作目錄(存放配置文件和書簽文檔的目錄)和編輯配置文件(接口文件),操作步驟如下圖所示。點擊上圖中的配置文件編輯按鈕后,彈出下圖所示窗口,在[Bkmk]-->[File]配置項處填入制作好的書簽文檔的名稱,然后點擊“保存”按鈕關閉編輯窗口。接着在“更改pdf”窗口中點擊“開始”按鈕,即可在pdf文件中插入書簽(注意此操作會改動原始的pdf文件)。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM