都有哪些玩家?
- 某個生物學方向(發育、免疫、癌症)的大佬,強在領域的深耕,先進的技術平台,能產生高質量的data,第一作者和通訊一般都是搞實驗的,生信最多也就是個共一,文章容易沖擊CNS。【掌握實驗材料、臨床樣本、測序數據】
- 某個疾病(depression、SLE、HSCR)的遺傳學家,主要就是借助genomics的技術來找疾病的variants和genes,以技術為主,文章不容易發大,除非data夠大。
- 大型Atlas合作項目,基本就是燒錢,作鋪墊性的工作,短期內很難看到成效,文章基本能發到CNS。
- 開發算法、模型和數據庫的計算生物學家,針對前沿的數據(scRNA-seq,image data)和問題(pleiotropy),提出特定的解決方案,文章也不容易發大,以統計和算法為主。
2023年04月10日
點評SR paper: Histone deacetylase (HDAC) 1 and 2 complexes regulate both histone acetylation and crotonylation in vivo
優點:
1. 思考的深度是有的,乍一看,甚至還感覺到了有點novel;
2. 有些圖做得還挺好看的,尤其是Figure 4,我都有點想模仿;
缺點:
1. 全程不提disease,作者完全不懂現在的biomed的研究邏輯,必須分子+疾病關聯起手,否則就是垃圾;而且工作量太少,就四個section,怎么也要7個左右;
2. 可以在眾多cancer中篩選出,該機制發揮重要作用的sub-disease,而且必須用多個model來確認;【實在沒實驗,那就多搞些公共數據】
3. 然后再深入機制,這篇文章完全跟disease脫鈎,機制也沒啥本質創新,研究技術方法也不新穎,所以SR就是你的歸宿;
4. 有條件就加入drug的分析,如果能correct disease表型,那基本就是10+的文章,做好一點就是cancer四大神刊任君投;
2023年01月27日
點評SR Paper:SOX9 promotes tumor progression through the axis BMI1-p21CIP
優點:
1. 核心的都有了,但都不夠,讓人覺得十分可惜;
2. 起手就是Sox9敲除,用的shRNA,有點過時了;過表達也做了;
3. 其次,model太簡單,只有cell line是遠遠不夠的,必須引入相應的cancer model,以及organoid;
4. 基本的表型檢測都有;沒有NGS,也沒有單細胞,就是WB做了兩個目標基因,這是不可取的;
5. 臨床數據也有,但同樣太簡單,就是一個關聯,這個section也就配做一個sub-figure;
6. rescue實驗也做了,但model太簡單
如果這篇Paper能把approach徹底提升一下,發在10分以上的雜志完全沒問題。
1. 加入mouse model和organoid model;
2. 加入single-cell,ST,cut&run;
3. 對機制的描述更加深入一點;
反思:
1. 其實Elly和Nialy都算是搬磚灌水的,只是拿到錢了,敢追新,舍得花錢;
2. 本質上沒有任何創新,方法沒有,結果沒有,理論也沒有;
3. 你博后出站了能做到什么地步呢?
信息
這部分我比較擅長,邏輯明確,不存在什么歧義。
調控variants的功能研究
2015 - PNAS - Multiple functional variants in long-range enhancer elements contribute to the risk of SNP rs965513 in thyroid cancer
GWAS的non-coding variant入手(靶向測序) - haplotype和LD找鄰近的enhancer variant(類似fine mapping) - 對基因表達的影響 - 公共數據挖掘鄰近enhancers,靶向測序驗證 - Allele-Specific Enhancer Activities - differential occupancy of TF - chromosome conformation capture (3C) assay來看Physical Interaction
簡評:GWAS下游的典型分析,找到了lead SNP,再找causal SNP,做得很細。haplotype分析縮小目標區域;公共數據庫挖掘確定目標enhancer,靶向測序驗證;多角度闡述,allele specific enhancer活性;TF差異的occupancy;最后3C直接串聯,解釋了本質的eQTL。整篇工作非常扎實,策略得當,省了不少錢和工作量,可以套路化(pipeline),值得后人借鑒。【通篇邏輯非常明確,基本都是genomics和genetics的分析,以技術為主】
2020 - NAR - Functional effects of variation in transcription factor binding highlight long-range gene regulation by epromoters【DNA順式調控元件,CRMs Atlas,1300 CRM variants】
allelic associations with gene expression(就是eQTL,一個非常好的串聯上下游的工具)
把我的一個想法給做了,就是找那些在enhancer里面的variants,從而影響了gene expression。
是你怎么做?需要預測一個variant是否會顯著改變motif的binding,結合capture-Hic來看這些predicted的variant 是否會改變gene expression,這不就完了嗎?有什么問題?
別人是怎么做的?【我靠,一步就能搞定,做了這么多工作,扎實。挖public data真難,NAR不好灌水啊】
- 公共ChIP-seq narrow peak files,定義CRM區域
- 1000 Genomes Project找在CRM區域的variants,分析TF binding affinity
- DeepSea預測variant對TF binding的影響,與前面的做比較
- DNase I sensitivity QTL,variant還能影響表觀狀態(這也是DeepSea的假設),就是allelic associated DHS signal 【參考】原始paper
- ATAC-QTLs
- massively-parallel reporter assays (MPRA) 輔佐驗證
- PCHi-C data
- Gene expression
- Association testing ( threshold-free)
- eQTL fine mapping
- Causal variant colocalization
預印版 - Trans-ethnic eQTL meta-analysis of human brain reveals regulatory architecture and candidate causal variants for brain-related traits【eQTL的meta analysis】
2021 - GB - The genetic mechanism of heterosis utilization in maize improvement 【雜種優勢原理探討,嚴建兵】
生物
專業領域,需要很強的biology理解,什么是關鍵問題。生成的data完全取決於需解決的問題和所采取的的實驗技術,這里的生物信息只是輔助,歸根結底還是需要生物學的思維。【以故事為主,發力不當就像打海綿,使不出力,身為行外人,很難理解為什么有些研究可以發那么高分】
腸道神經發育生物學
2017 - Science - Lineage-dependent spatial and functional organization of the mammalian enteric nervous system【ENCC development】
fate mapping技術/genetic labeling strategy標記某個細胞的發育進程 - 單細胞轉錄組揭示發育的分子機制 - mosaic analysis with double markers (MADM)分析RET對ENS發育的影響 - ENS發育的Topology分析 - Coordinate activity電刺激下的神經元的協同運動
簡評:借助先進的fate mapping技術來研究ENS的發育,單細胞轉錄組揭示分子機制,深入RET對ENS發育的影響,高級的Topology和電刺激協同性分析。因為不是該領域的資深專家,不是很理解該工作的重要性,我也就能做好這部分單細胞的數據分析,不敢妄評。
cancer
2021 - NC - Model-based analysis uncovers mutations altering autophagy selectivity in human cancer【薛宇,整合分析】
算法
數據庫
2019 - NAR - GENCODE reference annotation for the human and mouse genomes
GWASdb
2020 - Briefings in Bioinformatics - CellTalkDB: a manually curated database of ligand–receptor interactions in humans and mice
2015 - NC - A draft network of ligand–receptor-mediated multicellular signalling in human
2012 - Bioinformatics - RNA-Seq Atlas—a reference database for gene expression profiling in normal tissue by next-generation sequencing (https://www.ebi.ac.uk/gxa/home)
2019 - JMB - refTSS: A Reference Data Set for Human and Mouse Transcription Start Sites 【TSS數據庫】
遺傳與葯物
2015 - NG - The support of human genetic evidence for approved drug indications
實證了遺傳學證據對臨床葯物成功率的關系,遺傳學GWAS大有所為。
drug repositioning
Atlas系列
2021 - Cell - Population-scale tissue transcriptomics maps long non-coding RNAs to complex disease 【lncRNA,中文解讀】
技術類
2018 - NC - Single-cell full-length total RNA sequencing uncovers dynamics of recursive splicing and enhancer RNAs
轉錄調控
Hnisz, D. et al. Super-enhancers in the control of cell identity and disease. Cell 155, 934–947 (2013). - super-enhancers
Saint-André, V. et al. Models of human core transcriptional regulatory circuitries. Genome Res. 26, 385–396 (2016). - 提出CRCs概念
2017 - NG - Heterogeneity of neuroblastoma cell identity defined by transcriptional circuitries - 使用CRCs進行分析的案例