SAM是一个文本文件,因此对于读取reads的比对信息很慢。SAMtools可以将.sam文件转换为.bam文件(其是SAM文件采用GZIP算法压缩的二进制文件),因此加载和读取都很快。转换SAM文件为BAM文件之后,需要进行排序(sorted),以便当程序想查找在某个位点的reads时,不必搜索整个BAM文件。
先看看samtools帮助手册:
http://www.htslib.org/doc/samtools.html
(1).sam转为.bam:
samtools view -b -S -o samtools_bowtie/SRR030257.bam samtools_bowtie/SRR030257.sam
-b 指定输出BAM format
-S 指定输入为SAM文件,如果@SQ headers缺剩, 要写-t
-o 指定输出文件
(2).排序和建立索引:
samtools sort samtools_bowtie/SRR030257.bam -o samtools_bowtie/SRR030257_sorted.bamsamtools index samtools_bowtie/SRR030257_sorted.bam
注意事项:
(1).bam文件为二进制文件,不能使用head 或者less 或者tail等查看,会出现乱码。使用samtools view查看,例如:
samtools view SRR030257_sorted.bam|head
(2).IGV可查看.bam文件,但是由.sam文件转为.bam文件后,必须接着对其进行排序和建立索引,处理之后的.bam才可用IGV查看,否则会报错!
联系客服