GATK¶
简介¶
GATK是GenomeAnalysisToolkit的简称,是一系列用于分析高通量测序后基因突变的工具集合。它提供一种工作流程, 称作“ GATK Best Practices”。
CPU 容器版GATK¶
使用CPU容器版GTAK时,需要先指定GATK镜像的路径。然后使用 singularity exec 镜像路径 GTAK命令
的方式调用容器版GATK。
示例脚本如下(gatk-container.slurm):
#!/bin/bash
#SBATCH --job-name=test
#SBATCH --partition=cpu
#SBATCH -N 1
#SBATCH --ntasks-per-node=40
#SBATCH --output=%j.out
#SBATCH --error=%j.err
export IMAGE_NAME=/lustre/share/img/gatk-4.2.2.0.sif
singularity exec $IMAGE_NAME gatk --java-options "-Xmx128G" ...
使用如下指令提交:
$ sbatch gatk-container.slurm
ARM Spack版GATK¶
示例脚本如下(gatk.slurm):
#!/bin/bash
#SBATCH --job-name=test
#SBATCH --partition=arm128c256g
#SBATCH -N 1
#SBATCH --ntasks-per-node=128
#SBATCH --output=%j.out
#SBATCH --error=%j.err
module use /lustre/share/spack/modules/kunpeng920/linux-centos7-aarch64
module load gatk/4.2.0.0-gcc-9.3.0-openblas
gatk --java-options "-Xmx128G" ...
使用如下指令提交:
$ sbatch gatk.slurm
ARM 容器版GATK¶
使用容器版GTAK时,需要先指定GATK镜像的路径。然后使用 singularity exec 镜像路径 GTAK命令
的方式调用容器版GATK。
示例脚本如下(gatk-container.slurm):
#!/bin/bash
#SBATCH --job-name=test
#SBATCH --partition=arm128c256g
#SBATCH -N 1
#SBATCH --ntasks-per-node=128
#SBATCH --output=%j.out
#SBATCH --error=%j.err
export IMAGE_NAME=/lustre/share/singularity/aarch64/gatk/gatk-4.2.0.0.sif
singularity exec $IMAGE_NAME gatk --java-options "-Xmx128G" ...
使用如下指令提交:
$ sbatch gatk-container.slurm
最后更新:
2024 年 11 月 22 日