VARIANT PROCESSING - NVIDIA Docs

ACCELERATED VARIANT MANIPULATION METHODS

VCFQC

Generating QC charts from the input VCF. You need to pass “–extra-tools” to the installer to use this tool.

QUICK START

Copy
Copied!

            
            $ pbrun vcfqc --in-vcf sample.vcf \
                        --out-image-dir sample_charts\
                        --out-report sample_qc_report

OPTIONS

--in-vcf
--out-image-dir
--out-report
--in-bamqc-dir
--caller
--quality
--mapq
--depth
--allele-depth
--vaf
--window-size
--image-format
--threads

--tmp-dir TMP_DIR
--with-petagene-dir WITH_PETAGENE_DIR
--keep-tmp
--license-file LICENSE_FILE
--version

DBSNP

Annotate variants based on a variant database

QUICK START

Copy
Copied!

            
            $ pbrun dbsnp --in-vcf sample.vcf \
                         --out-vcf output.vcf\
                        --in-dbsnp-file database.vcf.gz

OPTIONS

--in-vcf
--in-dbsnp-file
--out-vcf

--tmp-dir TMP_DIR
--with-petagene-dir WITH_PETAGENE_DIR
--keep-tmp
--license-file LICENSE_FILE
--version

CNNSCOREVARIANTS

GPU accelerated CNNScorevariants

Generate variant scores using a Convolutional Neural Network.

QUICK START

Copy
Copied!

            
            $ pbrun cnnscorevariants --ref Ref.fa \
                         --in-bam sample.bam \
                         --in-vcf sample.vcf \
                         --out-vcf output.vcf

COMPATIBLE GATK4 COMMAND

Copy
Copied!

            
            gatk CNNScoreVariants -R Ref.fa \
                      -I sample.bam \
                      -V sample.vcf \
                      -O output.vcf \
                      --tensor-type read_tensor

CNNScoreVariants generates an info field for each variant called CNN_2D. This field can be used to create filters for each variant by running the GATK4 tool FilterVariantTranches on the CNNScoreVariants output.

OPTIONS

--ref
--in-bam
--in-vcf
--out-vcf
--pb-model-file

--num-gpus NUM_GPUS
--gpu-devices GPU_DEVICES

--tmp-dir TMP_DIR
--with-petagene-dir WITH_PETAGENE_DIR
--keep-tmp
--license-file LICENSE_FILE
--version

VARIANTFILTRATION

Accelerated variant filtration based on conditions

Filter a VCF using a boolean expression.

QUICK START

Copy
Copied!

            
            $ pbrun variantfiltration --in-vcf sample.vcf \
                          --out-file output.vcf \
                          --expression "QD < 2.0 || ReadPosRankSum < -20.0" \
                          --filter-name FILTER

COMPATIBLE GATK4 COMMAND

Copy
Copied!

            
            gatk VariantFiltration -V sample.vcf \
                       -O output.vcf \
                       --filter-expression "QD < 2.0 || ReadPosRankSum < -20.0" \
                       --filter-name FILTER

OPTIONS

--in-vcf
--out-file
--expression
--filter-name
--mode

--tmp-dir TMP_DIR
--with-petagene-dir WITH_PETAGENE_DIR
--keep-tmp
--license-file LICENSE_FILE
--version

VQSR

Accelerated variant filtration using VQSR

Build a recalibration model to score variant quality and apply a score cutoff to filter variants.

QUICK START

Copy
Copied!

            
            $ pbrun vqsr --in-vcf sample.vcf \
             --out-vcf output.vcf
             --out-recal output.recal \
             --out-tranches output.tranches \
             --resource omni,known=false,training=true,truth=true,prior=12.0:1000G_omni2.5.hg38.vcf \
             --annotation QD --annotation MQ --annotation MQRankSum -annotation ReadPosRankSum

COMPATIBLE GATK4 COMMAND

Copy
Copied!

            
            gatk VariantRecalibrator -V sample.vcf \
                         -O output.recal \
                         --tranches-file output.tranches \
                         --resource omni,known=false,training=true,truth=true,prior=12.0:1000G_omni2.5.hg38.vcf \
                         -an QD -an MQ -an MQRankSum -an ReadPosRankSum \
                         --mode BOTH

gatk ApplyVQSR -V sample.vcf \
               --recal-file output.recal \
               --tranches-file output.tranches \
               -O output.vcf \
               --mode BOTH

OPTIONS

--in-vcf
--out-vcf
--out-recal
--out-tranches
--resource
--annotation
--mode
--max-gaussians
--truth-sensitivity-level
--lod-score-cutoff

--tmp-dir TMP_DIR
--with-petagene-dir WITH_PETAGENE_DIR
--keep-tmp
--license-file LICENSE_FILE
--version