如何使用 hap.py stratification?
基因體結構會影響變異分析的效度。舉例來說,在 homopolymer 或是 segmental duplicate 區域,依賴 PCR 的 Indel 分析準確性往往低於其他區域 1。因此,若能針對基因體不同區域個別評估效度,將有助於了解技術或流程的限制,進而提升效度分析的鑑別度。
為此,GIAB (Genome in a Bottle consortium) 維護了一系列 BED 檔,記錄基因體上的功能性區域、重複性區域以及高度多樣性區域等。用戶可以使用 hap.py
等工具,配合這些 BED 檔來評估其分析流程在各個區域的表現。