搬運來源: https://blog.csdn.net/weixin_43364556/article/details/106780358
pipeline piplot就是相當於一堆元器件,我們可以用這些元器件組成各種各樣的電子產品。
分類
pipeline piplot中左側的工具欄中分為三個部分(見左下部分),第一個部分為用戶的自定義的工具(也就是用戶自己組裝好的電子產品,這一部分以用戶的名稱進行命名)。第二部分為DS中常用的流程(命名為Protocols),第三部分為各種組件的名稱,不同的組件完成的功能不同(相當於各種元器件,命名為Components)。
Chemistry
Chemistry中的組件的主要功能是跟化學相關的(如下圖),比如分子讀取,文庫設計,文件格式的轉化(比如二維轉化為三維的格式),分子的操作(分子的篩選,比如lipinski五規則,相似性的搜索等),化合物聚類(基於結構)等等。
案例
參考文獻:
A combinatory screen of the CLOUD uncovers a synergy targeting the androgen receptor.
文獻是通過FDA通過的化學分子葯物,希望通過這些分子的組合或者其他方式找出其不同的發揮功能的方向。文獻收集了308個小分子葯物,The CeMM Library of Unique Drugs (CLOUD)是一個整合了前體葯物以及在葯用中的活性形式,適合用來進行葯物配對的篩選,找出能殺死癌細胞的葯物組合。最后文獻發現兩種葯物的組合(flutamide(氟他胺) and phenprocoumon (PPC:苯丙香豆素))能夠穩定癌細胞的AR受體,並且使前列腺癌細胞的AR受體對氟他胺變得更加敏感。
文章首先通過手機FDA通過的葯物整合成一個數據庫,剔除大分子,提取通過配體受體方式相互作用的葯物,剔除鹽離子,最后通過聚類剔除冗余的分子(剔除me too葯物,因為結構和作用方式相似)。作者根據化學結構進行聚類,並且提出其中位於中心位置的分子葯物。最后從2萬多個葯物中提取出176類,239個代表性的葯物。另外,通過查閱文獻找出其中的35個前體葯物,把這些前體葯物的活化形式加入庫中。另外加入其它34個靶標未知的分子,形成最后的CLOUD庫,含有308個分子。最后再利用高通量的方法進行篩選。
流程實例:讀取chemDraw格式文件並且轉化為3D格式
一、搜索目標模塊
直接在component模塊的左上方的搜索數據框中進行搜索。比如找出能夠讀取chemDraw分子結構文件的讀取程序,直接搜索reader(這個應該與經驗有關,用的次數多了應該會更熟練一些)會顯示出與reader相關的組件。writer/filter的模塊也是同樣的操作。在這里我們找出chemDraw reader,雙擊其將其添加到protocal框中(雙擊自動添加,不影響原始文件)。
可以看到剛剛添加的組件是紅色的,是因為一些必要的參數沒有設定,該模塊無法正常工作。我們將其中需要的參數進行設置之后就可以正常運行了(變成了藍色)。
這里的文件設成自己文件就可以,路徑也要帶上。我隨便做了一個,可以在這里下載https://pan.baidu.com/s/14kD9A9dU8FKLDJMUI-EbxQ,提取碼fa0v。
二、添加3D coods模塊
3D coods模塊能夠將二維的數據轉化為三維的坐標數據。直接雙擊,就能夠將這個模塊加到之前的模塊上。
三、添加H原子(add Hydrogens)
原來的系統不含有H原子,這里添加H原子到系統中。
四、保存為SD格式文件(SD writer)
修改參數(指定文件的保存位置),使其變為藍色正常狀態。
五、運行
點擊上方的開始按鈕,整套系統開始運行。假如系統報錯那么久根據錯誤的類型來進行修改,比如我這里久報錯說找不到目標文件,因為系統只能識別服務器上的文件,而不能識別本地機器上的文件。那么我就將文件上傳到服務器,然后修改路徑,再次運行。運行成功能看到綠色的小1。注意,我們也可以通過路徑參數旁邊的三個點號來選擇路徑。