Duplicate alleles in VCFs derived from tvc
最近,我們碰到一個棘手的技術問題。其他同仁反映,我們開發的變異分析工具在執行 GATK 時意外中止,並呈現以下錯誤訊息:
1 | The provided VCF file is malformed at approximately line number 1: Duplicate allele added to VariantContext: TA |
我檢查該步驟使用的 VCF 檔,發現其中一列的 REF 與 ALT 欄位內容重複,導致 GATK 報錯:
1 | chr1 100 . TA GT,TA |
標準的 VCF 檔只記錄實際存在的變異,不應出現 REF 和 ALT 欄位相同的狀況。即使該位置沒有變異,通常也會以點號(.
)標記。因此,我推測問題的源頭不是分析工具本身,而是上游的 variant caller。