自動獲取書簽軟件V0505+PdgCntEditor詳解
https://blog.csdn.net/qq_42732229/article/details/118360102
想法是想要給pdf文件制作書簽,這個問題從我使用淘寶購買書籍的pdf文件開始就存在了,大概在2020年的3月就存在了。
PdgCntEditor的軟件開發者,老馬,在博客園有博客。
我發現買來的pdf文件的開頭數字編號,就是自動獲取書簽軟件需要的ss號。
所以,以后有了對掃描版Pdf制作書簽目錄的方法。還是很好的。
https://github.com/chroming/pdfdir 這是一個開源方案,但是也需要有txt格式的書簽信息才行。

火絨報木馬之后
自動獲取書簽軟件,被火絨報含有木馬。
那么,新的方案是京東商品界面,豆瓣條目,找到書籍的目錄信息。
配合ocr
wangjiati/ClipboardImageOCR: 截圖轉字 原理:監聽剪切板,提取圖片到OCR平台. 如QQ的Ctrl+Alt+A 截圖 ORC 使用百度提供的API (github.com)
這個項目用起來很不錯,ocr pdf信息。
可以用這個ocr書籍pdf文件中的目錄信息。
離線ocr
前一個ocr需要聯網,調用百度智能雲API
https://github.com/cloudy-sfu/GUI-for-paddlepaddle-OCR
這個無需聯網
