python拆分pubchem SDF文件

本文轉載自查看原文 2020-12-14 11:33 497 python

從pubchem下載的sdf文件是一個壓縮格式，一個sdf里面有多個化學物質,需要拆分開單獨保存，

先將大的sdf拆分成一個個單獨的sdf小文件，然后再讀取每一行小文件的第一行獲取CID編號

# coding=utf-8

def splitSDF():
    file_name = "48600001_48625000.sdf"
    # 讀取的文件內容保存在列表里
    file_str_list = []
    # 設置文件索引
    index = 0
    # import pdb
    # pdb.set_trace()
    with open(file_name, 'r+') as f:
        for ln in f:
            if ln != "$$$$\n":
                file_str_list.append(ln)
            else:
                # 將對應的內容按照索引寫入文件
                index = index + 1
                with open('{0}.sdf'.format(index), 'w+') as wt:
                    for ds in file_str_list:
                        wt.write(ds)
                file_str_list = []


if __name__ == '__main__':
    splitSDF()

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 SDF文件的用途關於urdf/xacro/sdf, world/launch文件 GrADS 讀取NetCDF和HDF的ctl文件 SDF文件的描述文件 Python將大的csv文件拆分多個小的csv文件 Python拆分大型CSV文件（親測拆分178G）注釋超全 python自動拆分某個文件下的某個excel，按照一定數量去拆分為對個excel python pandas使用chunksize異步拆分固定行數的文件數字后端文件——SDF文件格式實例 VS工程目錄下的ipch文件夾和.sdf文件 python：文件轉二維碼（拆分轉換）