使用 python 把一個文件生成 C 語言中的數組並保存到頭文件中

本文轉載自查看原文 2021-07-07 17:45 279 python

（一）要做什么

之前有這么一個需求，是要把一個二進制文件里面的數據，轉換成 C 代碼里面的數組，可以看之前的一篇文章：

NUC980 運行 RT-Thread 驅動 SPI 接口 OLED 播放 badapple

於是用 python 把這個功能給做了出來，原理非常簡單，代碼量也很小。

所處理的文件大小如下，用一個編輯器以二進制形式打開的話，一行16字節，一共 336448 行。

（二）實現功能

上代碼，Show me your code.Talk is cheap.

import os
import time
start_time = time.time()
fileinfo = os.stat("badapple.bin")
line = fileinfo.st_size / 16
print(line)

首先導入 os、time 模塊，os 模塊用戶獲取所處理文件的大小，生成的頭文件里面的數組每 16 字節一行，time 模塊用於統計程序所使用時間，上述代碼運行結果為：

336648 行，正好與之前看到的一致。

然后定義一個變量，用來存儲最終的數據：

target = "#ifndef __BADAPPLE_H__ \n#define __BADAPPLE_H__\n\n const uint8_t badapple[] = \n{\n"

然后打開文件 badapple.bin，以二進制、只讀方式打開，每次讀取一字節，然后轉換成二進制，與 0x 組成一個字節數據，保存到上述字符串中，每處理完 16 字節添加換行，處理完后關閉文件，代碼如下：

f = open("badapple.bin", "rb")
for l in range(int(line)):
    for j in range(16):
        data = f.read(1)
        he = "0x" + data.hex()
        target = target + he + ","
    print(l)
    target = target + "\n"

target = target + "}; \n\n#endif\n"
print(target)
f.close()

由於全部數據有 30 多萬行，不好測試，先只處理 badapple.bin 文件中的前 15 行，來測試下代碼有沒有問題，把上面代碼中的第二行改為：

for l in range(15):

運行結果為：

看上去是可以的，然后實現把轉換出來的數據保存到文件中，並加上獲取運行改代碼所花時間，代碼如下：

file = open("badapple.h","w")
file.write(target)
file.close()
end_time = time.time()
print(end_time - start_time)

運行結果為：

所生成的文件為：

從所生成的文件來看，算是大功告成了，把所需處理行數改為實際文件的行數，就完成了。

然而，我還是圖樣圖森破啊，我以為我在第二層，其實我在第五層。

第一次運行的時候，跑了幾十分鍾，停了，感覺所花時間大大久了，

出於對自己寫的代碼負責的態度，第二天下午 3 點多的時候，再次把這代碼跑了起來，可是到了6點多還是沒跑完，又中途結束了，

很好奇，究竟需要多長時間來跑，第三天，一早上就把代碼跑了起來，結果是到了下午 6 點多，差不多 7 點才跑完，來看下運行的最后結果：

從數字來看，30545 秒，感覺也不是很大，可是轉換為小時的話：

30545 / 60 / 60 = 8.4

居然達到了 8.4 個小時，這是生成的文件：

（三）優化

要這么久時間來跑肯定是不實際的，修改下代碼，之前是一個字節一個字節從文件里面讀出來，這次改為每次從文件中讀取 16 字節，轉換，然后再讀取16字節，知道結束，代碼如下：

target = "#ifndef __BADAPPLE_H__ \n#define __BADAPPLE_H__\n\n const uint8_t badapple[] = \n{\n"

line = fileinfo.st_size / 16
print(line)
for l in range(int(line)):
    data = f.read(16)
    he = ""
    for da in data:
        he = he + hex(da) + ","
    print(l)
    target = target + he + "\n"

target = target + "}; \n\n#endif\n"

運行下，最后結果為：

2165 秒，大概是 36 分鍾，也還是有點長。

再改改，對比下這 2 中方法，第二種是每次讀出來的字節數是第一種的16倍，速度明顯提升了，可以看出時間是損耗在從文件讀取數據，那如果一次性把所用數據從文件種讀取出來會不會更快呢？試了下，代碼改為：

f = open("badapple.bin", "rb")
target = "#ifndef __BADAPPLE_H__ \n#define __BADAPPLE_H__\n\n const uint8_t badapple[] = \n{\n"
dat = f.read()
print(type(dat))
f.close()
whole = dat.__len__()
line = int(whole / 16)
for i in range(line):
    temp = dat[i*16:i*16+16]
    he = ""
    for da in temp:
        he = he + hex(da) + ","
    target = target + he + "\n"
    print(i)

target = target + "}; \n\n#endif\n"

運行了下，結果為：