如果只有SNP的染色体和物理位置信息,该如何批量转换得到 rs ID? 思路非常简单,只需要下载 dbSNP 的参考文件,根据位置信息从参考文件中获取对应的 rs 编号即可。 下面列举两个例子。 重命名 PLINK 文件 SNP 名字 第一个例子是 PLINK 格式的文件,要把 ...
cat snpeff.vcf java jar SnpSift.jar filter POS gt amp POS lt amp CHROM chr gt spe snpeff.vcf 提取一号染色体上位置为 范围的位点 cat variants.vcf java jar SnpSift.jar filter set my rs.txt ID in SET gt filtered.vcf my r ...
2019-09-10 09:34 0 634 推荐指数:
如果只有SNP的染色体和物理位置信息,该如何批量转换得到 rs ID? 思路非常简单,只需要下载 dbSNP 的参考文件,根据位置信息从参考文件中获取对应的 rs 编号即可。 下面列举两个例子。 重命名 PLINK 文件 SNP 名字 第一个例子是 PLINK 格式的文件,要把 ...
目录 需求 示例文件 代码实现 补充说明 需求 客户的一个简单需求: 我有一批功能基因位点,想从重测序的群体材料中找到这些位点,如何批量快速获得? 示例文件 gene.txt test.vcf 代码实现 run.sh ...
提取fasta文件genome_test.fa中第14号染色体的序列,其内容如下: >chr1 ATATATATAT >chr2 ATATATATATCGCGCGCGCG >chr3 ATATATATATCGCGCGCGCGATATATATAT >chr4 ...
1、bcftools提取指定区段的vcf文件 下载安装bcftools 见如下命令: bcftools filter 1000Genomes.vcf.gz --regions 9:4700000-4800000 > 4700000-4800000.vcf 注意:输入 ...
1.基因染色体定位TBtools Graphics-show gene on chr-第一个 文件准备: ①染色体长度信息 ②基因位置信息 #①:染色体长度文件 用基因组序列提取每条染色体的长度信息,结果是NC_开头的基因组编号,不是染色体号 记录 ...
鉴于太多人问我怎么批量根据chr:pos查找RS号,在这里出一个教程。 注意以下教程展示的是修改hg19基因组版本的RS号,如果你的数据是其他版本的,请修改为对应版本的数据。 假定数据是 ...
资料来源: 细胞、染色体、DNA和基因的关系 细胞核中包含染色体,人体共有23对染色体(22+XY/XX),染色体由DNA组成,DNA是由互补碱基对组成的双螺旋结构,DNA链中只有一部分信息可以编码为蛋白质,这些蛋白质是构成细胞和组织最小的组成成分,这些有效编码的部分称为gene,而不能有效编码 ...