python拆分pubchem SDF文件

本文转载自查看原文 2020-12-14 11:33 497 python

从pubchem下载的sdf文件是一个压缩格式，一个sdf里面有多个化学物质,需要拆分开单独保存，

先将大的sdf拆分成一个个单独的sdf小文件，然后再读取每一行小文件的第一行获取CID编号

# coding=utf-8

def splitSDF():
    file_name = "48600001_48625000.sdf"
    # 读取的文件内容保存在列表里
    file_str_list = []
    # 设置文件索引
    index = 0
    # import pdb
    # pdb.set_trace()
    with open(file_name, 'r+') as f:
        for ln in f:
            if ln != "$$$$\n":
                file_str_list.append(ln)
            else:
                # 将对应的内容按照索引写入文件
                index = index + 1
                with open('{0}.sdf'.format(index), 'w+') as wt:
                    for ds in file_str_list:
                        wt.write(ds)
                file_str_list = []


if __name__ == '__main__':
    splitSDF()

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 SDF文件的用途关于urdf/xacro/sdf, world/launch文件 GrADS 读取NetCDF和HDF的ctl文件 SDF文件的描述文件 Python将大的csv文件拆分多个小的csv文件 Python拆分大型CSV文件（亲测拆分178G）注释超全 python自动拆分某个文件下的某个excel，按照一定数量去拆分为对个excel python pandas使用chunksize异步拆分固定行数的文件数字后端文件——SDF文件格式实例 VS工程目录下的ipch文件夹和.sdf文件 python：文件转二维码（拆分转换）