bedtools怎么操作VCF文件

本篇内容主要讲解“bedtools怎么操作VCF文件”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“bedtools怎么操作VCF文件”吧!

创新互联是一家朝气蓬勃的网站建设公司。公司专注于为企业提供信息化建设解决方案。从事网站开发,网站制作,网站设计,网站模板,微信公众号开发,软件开发,小程序制作,十多年建站对混凝土搅拌罐等多个方面,拥有多年的网站维护经验。

一 mpileup 函数

使用方法:bcftools mpileup [OPTIONS] -f ref.fa in.bam [in2.bam […]]

示例:bcftools mpileup -C 50 -m 2 -F 0.002  -d 1000 -q 20 -Q 20 -a DP,DP4,ADR -f hg19.fa A.bam B.bam

参数说明:

-f: 指定参考基因组,后跟需要变异检测的bam文件,bam较少时可以直接写;

bcftools mpileup  -f hg19.fa A.bam B.bam

-b:后跟一个bamlist的文件;

bcftools mpileup -f hg19.fa -b bamList

-C --adjust-MQ INT  矫正的MQ值,推荐是50;

-q, -min-MQ INT (MQ质量值)# 过滤MQ质量值;

-Q, --min-BQ INT (base质量值)# 过滤base质量值;

-r, --regions 只call特定的染色体,或者点,区域

形式为CHR|CHR:POS|CHR:FROM-TO|CHR:FROM-[,…];

示例:bcftools mpileup -r chr1 -f hg19.fa  A.bam | bcftools call -c -v > A.chr1.vcfbcftools mpileup -r chr1:111111-122222 -f hg19.fa  A.bam B.bam | bcftools call -c -v > A.chr1_111111-122222.vcf

-R, --regions-file FILE  当有多个region时,将region存入文件,使用-R参数,文件格式:tab分割的三列,chr start end即可 ;

-a, --annotate LIST    在INFO/FORMAT列中增加一些如DP,DP4,AD等的信息,群call可能会需要;

Comma-separated list of FORMAT and INFO tags to output.

二 bcftools call函数

使用方法:bcftools call [OPTIONS] FILE

示例:bcftools mpileup  -f hg19.fa A.bam B.bam | bcftools call -c -v -r chr1:111111-122222 -s A -V indels

示例说明:

只检测A样本,且只输出chr1:111111-122222区域的SNP信息,保存到test2.vcf文件中。

参数说明:

-c  -m为两种call的方式,旧版本使用-c ,现在默认使用-m,能解决大部分任务

-V, --skip-variants snps|indels 跳过SNP或者INDEL位点

-v, --variants-only  只输出变异位点

-s, --samples LIST 只检测此处给出的样本ID (通用参数)

-S, --samples-file FILE 只对此文件中列出的样本进行检测 (通用参数)

-r  -R为通用参数,与上面用法一致

三 bcftools filter 函数

使用方法:bcftools filter [OPTIONS] FILE

示例:bcftools filter  ALL.vcf TYPE="snp" -e 'DP < 20 || MQ < 20 || %QUAL<10 || DP < 20 ||MAF < 0.05 || '

示例说明:群体检测结果ALL.vcf文件中,只保留 质量值大于10,MQ大于20,MAF大于等于0.05,样本总深度大于20X的过滤后的SNP数据集。

参数说明:

TYPE="snp":只保留SNP信息;

-s:样本过滤,bcftools filter ALL.vcf -s A

-e 可加感兴趣的各种参数,常见的如下:

群体样本总深度DP:bcftools filter  ALL.vcf TYPE="snp" -e 'DP < 20' 

前两个样本的DP:bcftools filter  ALL.vcf -e 'FORMAT/DP[0-1] < 20 ' 

最小等位基因频率:bcftools filter  ALL.vcf -e 'MAF < 0.05 ' |ee

质量值和mapping 质量值:bcftools filter  ALL.vcf -e ‘%QUAL<10 || MQ < 20 ' 

BAF值(alt depth / (ref depth + alt depth ))

熟练使用以上及链接中的参数,就可以办到不写py或者pl脚本,强势过滤了。

四 bcftools index 函数

bgzip 压缩 vcf 文件为 gz 文件

bgzip -c A.vcf >A.vcf.gz ;bgzip -c B.vcf >B.vcf.gz

bcftools 为 gz 文件建索引

bcftools index -t A.vcf.gz ; bcftools index -t B.vcf.gz

五  bcftools merge 函数

使用说明:将多个VCF文件,合并成一个VCF文件

bcftools merge -m snps -f PASS,. --force-samples A.vcf.gz B.vcf.gz > A_B.merge.vcf

同样不用自己写脚本合并VCF文件,省事 且较少出错。

到此,相信大家对“bedtools怎么操作VCF文件”有了更深的了解,不妨来实际操作一番吧!这里是创新互联网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!


网站栏目:bedtools怎么操作VCF文件
本文路径:http://myzitong.com/article/gdoesc.html