前言:
最近學習python,找的電子書基本沒有目錄,發現文泉試讀里面有目錄 就抱着試試 找了找,很快找到了目錄文件 是json文件,但並不知道如何解析。於是一直放着。
2020年5月26日學習了 python 列表、for、字典的皮毛等相關知識。勉強解決問題。
python解析這里應該會有更好的方法,但我目前根據自己學到只能這樣做啦。願意分享的可以分享下。謝謝
步驟:
網上有借鑒,但借鑒的教程在尋找目錄方面比較麻煩,因此沒有馬上行動。之后才有了上面的找目錄的發現。
一、提取目錄
二、使用 PdgCntEditor 軟件添加目錄
三、檢測檢查目錄
一、提取目錄
1、找到對應電子書文泉試讀—— 打開審查元素—— network—— 搜索到目錄相關文字 找到目錄json
2、雙擊自動選中 可以直接打開 復制 或者 復制鏈接下載都行。
3、然后看到是這樣一個數據。
4、接着用到剛學的python基礎知識
桌面存放剛剛保存的json數據 json.txt
1 #!/usr/bin/env python 2 # -*- coding:utf-8 -*- 3 import json 4 # 讀取數據 5 with open(r'C:\Users\HAPPY\Desktop\json.txt', 'r', encoding="utf-8") as f: 6 load_dict = json.load(f) 7 json_len = len(load_dict["data"]) 8 for i in range(0, json_len): 9 json_label = load_dict["data"][i]["label"] 10 json_pnum = load_dict["data"][i]["pnum"] 11 print(json_label, json_pnum) 12 if "children" in load_dict["data"][i]: 13 json_len_children = len(load_dict["data"][i]["children"]) 14 for z in range(0, json_len_children): 15 children_json_label = load_dict["data"][i]["children"][z]["label"] 16 children_json_pnum = load_dict["data"][i]["children"][z]["pnum"] 17 print(children_json_label, children_json_pnum)
二、使用 PdgCntEditor 軟件添加目錄
1、先打開軟件 打開需要添加的目錄 然后把剛剛python解析的目錄復制到空白
全選目錄文字 點擊 自動切分頁碼
2、這里的目錄 和電子書基本是核對得上的。
基准頁就是PDF 打開的第一頁,要和目錄對應。
確定后保存
3、不用目錄排版 也行,我這里目錄只有1級,多級目錄就點下縮進排版 。軟件具體操作看上面參考鏈接
三、檢測目錄 (ok 沒有問題)