R splatter包學習


轉自:http://www.bioconductor.org/packages/release/bioc/vignettes/splatter/inst/doc/splatter.html

1.quickstart

library(splatter)
library(scater)# 創建模擬數據
set.seed(1)
sce <- mockSCE()
params <- splatEstimate(sce)

跑上面的代碼時,出現了Error in mockSCE() : could not find function "mockSCE" 錯誤,emmm。

這個函數是scater包里的函數,引入了這個包為啥找不到函數呢。

可能是和R的版本有關系,我目前使用的是3.5.1,但有warning:

Warning messages:
1: 程輯包‘scater’是用R版本3.5.2 來建造的 
2: 程輯包‘ggplot2’是用R版本3.5.3 來建造的 

所以嘗試使用3.5.2版本的R。

還是不行,依舊會報這個錯誤:

> sce <- mockSCE()
Error in mockSCE() : could not find function "mockSCE"

> sce <- scater::mockSCE()
Error: 'mockSCE'不是'namespace:scater'內的出口對象

 看到一個博客說可能是這個函數沒有了,所以找到了包的手冊。

 

 這個函數還是有的啊,而且給出了例子。

在library(scater)的過程中出現以下:

載入需要的程輯包:ggplot2

載入程輯包:‘scater’

The following object is masked from ‘package:S4Vectors’:

    rename

The following object is masked from ‘package:stats’:

    filter

Warning message:
程輯包‘ggplot2’是用R版本3.5.3 來建造的 

嘗試> library('ggplot2') 在3.5.2下是可以正常使用的。

可能是3.5版本的都沒有這個函數???

全網都搜不到相關的問題。

直接換3.6.2版本的R,在安裝時還遇到了這個問題Do you want to install from sources the packages which need compilation

之前一直都默認選的yes,但是看來好像應該選no,https://community.rstudio.com/t/meaning-of-common-message-when-install-a-package-there-are-binary-versions-available-but-the-source-versions-are-later/2431

原來真的是因為R版本的問題,3.5的是沒有這個函數的,只有3.6版本安裝的scater包有這個。。。並且在選擇上面問題時選擇了no。emmm

最后,這個官方手冊還是很不錯的。

可以學習到不同group不同群體,也就是說,比如小鼠和人?還是說患病的人和不患病的人的同一組織的細胞?

2.log-normal

library size的normal和log之后的normal,有什么區別是需要注意一下的。

3.simpleSimulate

這個函數也是splatter包里的,

從一個簡單的負二項分布仿真數據,沒有library size和差異表達等。

4.與真實數據or分布的比較

 

忽然一下子明白了這個比較,simple它是根據負二項分布直接生成的數據, 而這里進行比較就是查看仿真的數據和負二項分布的差異,這個是一方面,可以用來對一個數據集是否符合負二項分布來說,也可以用來判斷兩個數據集的分布是否相似;非常有用的點! 

5.cpm

作圖多次出現這個單位,搜了一下https://www.jianshu.com/p/1a80c66a8510

流行的轉換包括每百萬次計數(CPM),每百萬次計數(log-CPM),每千克轉錄本的讀數(RPKM)和每千萬轉錄本的百萬分率(FPKM)。

 

//基本搞定,比較簡單,可以用來仿真數據,並且對仿真結果與真實的對比。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM