HISAT2

简介

HISAT2 是一种快速、灵敏的比对程序,用于将下一代测序读数 (全基因组、转录组和外显子组测序数据)与普通人群 (以及单个参考基因组)进行映射。基于GCSA(图的BWT的扩展),我们设计并实现了图 FM 索引(GFM),这 是一种原始方法,也是我们所知的第一个实现。 除了使用一个代表一般人群的全局 GFM 索引外, HISAT2 还使用了一组大型的小型 GFM 索引,它们共同覆盖了整个基因组 (每个索引代表一个 56 Kbp 的基因组区域,需要 55,000 个索引来覆盖人群)。 这些小索引(称为本地索引)与多种对齐策略相结合,可以实现测序读数的有效对齐。