使用python自動化生成軟件著作權的源代碼

本文轉載自查看原文 2020-04-18 21:41 1297 python/ 源代碼/ 軟件著作權

一個小需求：

在申請軟件著作權的時候，需要提交一頁50行，總共60頁的源代碼。但是設計的項目保存在多級的目錄下，不想一個一個復制，遂通過python ，os模塊獲得全部目錄的文件，re正則化過濾無效源代碼，然后基於docx模塊寫入到word中。涉及的模塊有 os, docx, re

分為2 個大的步驟：

1. 先將一個文件夾下的所有文件夾的 .java 文件路徑保存到一個列表中
2. 依次讀取列表的路徑，將 .java 文件內容保存到word 中

#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
__title__ = ''
__author__ = 'mike_jun'
__mtime__ = '2019-7-1'
#目的： 1. 先將一個文件夾下的所有文件夾的 .java 文件路徑保存到一個列表中
        2. 依次讀取列表的路徑， 將 .java 文件內容保存到word 中
"""
import os
from docx import Document
from docx.oxml.ns import qn
from docx.shared import Pt
import re
from docx.shared import Length


fileList = [] # 使用全局列表保存文件路徑
def getAllFile(path, fileList):  # 使用遞歸方法
    dirList = []  # 保存文件夾
    files = os.listdir(path) # 返回一個列表，其中包含文件 和 文件夾
    for f in files:
        if (os.path.isdir(path + '/' + f)):
            dirList.append(path + '/' + f)    #  將文件夾 名字 進行保存

        if (os.path.isfile(path + '/' + f)):
            fileList.append(path + '/' + f) # 將文件名 保存

    for dir in dirList: #如果文件夾為空時，遞歸自動退出
        getAllFile(dir, fileList) # 遞歸保存到將.java 文件保存到 fileList 中

getAllFile( r'E:\src\main\java\com\gdut', fileList)
print('文件數量為： ',len(fileList))

def getJavaFile(fileList):
    for file in fileList:
        if not file.endswith('.java'): # 刪除不是 .java 文件的格式
            fileList.remove(file)
    print('文件數量為： ',len(fileList))
getJavaFile(fileList)
print(os.path.isfile(fileList[0])) # 判斷第一個值是否是文件

def saveDocFile():
    # SINGLE         =>  單倍行距（默認）
    # ONE_POINT_FIVE =>  1.5倍行距
    # DOUBLE2        =>  倍行距
    # AT_LEAST       =>  最小值
    # EXACTLY        =>  固定值
    # MULTIPLE       =>  多倍行距
    doc = Document()
    from docx.enum.text import WD_LINE_SPACING
    p = doc.add_paragraph('') #增加一頁
    doc.styles['Normal'].font.name = 'Times New Roman'  # 正文是normal， 設置正文的字體格式
    doc.styles['Normal'].font.size = Pt(8) #  設置字體的大小為 5 號字體
    p.line_spacing_rule = WD_LINE_SPACING.EXACTLY  # 固定值
    paragraph_format = doc.styles['Normal'].paragraph_format
    paragraph_format.line_spacing = Pt(12.9)  # 固定值12,9磅, 保證每頁有50行代碼
    save_file = r'E:\text.doc'
    codeNum = 0
    for i, f in enumerate(fileList):
        print('starting deal %d'%i)
        with open(f, encoding='UTF-8') as file:  # 轉換編碼以實現正確輸出中文格式
            for line in file.readlines():

                if line == '\n':  # 刪除空行
                    continue
                if re.match(r'^\s+$', line):  # 使用正則表達式刪除全是空格的空行
                    continue
                if line.__contains__(r'/*') or \
                    line.__contains__(r' *'):   # 刪除注釋
                    continue
                if line.__contains__(r'//'): # 刪除包含 // 的注釋, 嚴格意義上應該使用正則表達式進行刪除
                    continue
                p.add_run(line)
                codeNum += 1 # 記錄是已經寫入的數據
                if codeNum == 3050:  # 保證打印出不大大超過與 60 頁
                    doc.save(save_file)
                    return
    doc.save(save_file)  # 不足60 頁進行保存
    print('all done')

saveDocFile()
print('all done')

還有缺點就是：頁眉，頁碼，標題頁沒有做，手動做也是可以的，呵呵。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 軟件著作權之源代碼 Guns自動化生成代碼使用著作權和專利權的區別快速手工實現軟件著作權源碼60頁制作軟件著作權申請書在線打印分頁不正常問題的解決利用Python半自動化生成Nessus報告使用randoop自動化生成測試用例網站頁面底部的著作權（版權）聲明應該怎么寫？ Python 隨機生成數字，字符串，用戶自動化生成數據用doxygen+graphviz自動化生成代碼文檔（附詳細教程）