RNA PIPELINE - NVIDIA Docs

Run GATK best practices for RNAseq short variant discovery (SNPs + Indels)

The RNA GATK pipeline process the input fastq files. The output is in VCF format.

Quick Start

CLI

Copy
Copied!

            
            # The commandline below will run RNA GATK pipeline.
$ pbrun rna_gatk --ref Ref/Homo_sapiens_assembly38.fasta \
                --in-fq Data/sample_1.fq.gz Data/sample_2.fq.gz \
                --read-files-command  zcat \
                --genome-lib-dir Ref/ \
                --out-variants output.vcf \
                --out-bam tumor.bam \
                --output-dir output

Options

--ref
--in-fq
--in-se-fq
--genome-lib-dir
--knownSites
--interval-file
--output-dir
--out-recal-file
--read-files-command
--out-bam
--out-variants
--num-cpu-threads
--no-ignore-mark
--num-threads
--out-prefix
--read-group-sm
--read-group-lb
--read-group-pl
--read-group-id-prefix
--two-pass-mode
--read-length
--haplotypecaller-options
--static-quantized-quals
--gvcf
--batch
--disable-read-filter
--max-alternate-alleles
-G, --annotation-group
-GQB, --gvcf-gq-bands
--rna
--dont-use-soft-clipped-bases
--ploidy
-L, --interval
-ip, --interval-padding
--dont-use-soft-clipped-bases
--ploidy PLOIDY

--num-gpus NUM_GPUS
--gpu-devices GPU_DEVICES

--tmp-dir TMP_DIR
--no-seccomp-override
--with-petagene-dir WITH_PETAGENE_DIR
--keep-tmp
--license-file LICENSE_FILE
--version