先前製作 Tabletop simulator 的 MOD 時,累積了一些電子桌遊自動化的想法。Tabletop simulator (以下簡稱 TTS)提供了近似真實桌面的環境,允許玩家建立紙牌、公仔、token等桌遊配件。TTS 也設計了抽牌、堆疊、擲骰、彈射等與配件互動的行為,因此從經典的撲克牌、疊疊樂、到銀河彈彈樂等利用不同互動機制的桌遊都能在TTS 內重現。

閱讀全文 »

hidden state prediction (HSP) 是一種基於分子演化關係來預測未知基因功能的演算法 (Zaneveld & Thurber, 2014),它能用於重度仰賴定序技術的微生物生態研究,提供性狀或功能面的資訊 (Guittar et al., 2019)。

儘管存在這樣有力的生態學研究工具,卻還沒有統一的方式來驗證其有效範圍。在應用 HSP 的研究中,Guittar et al. (2019) 沒有考量預測誤差,Langille et al. (2013) 沒有界定適用範圍。因此,我想以他們的研究為基礎,設計能評估預測工具有效範圍的方法。

閱讀全文 »

在微生物增幅子分析當中,DADA2 是常用於校正 illumina 定序錯誤的軟體。在使用這軟體前,需要移除和裁切低品質的定序產物,確保資料在可校正的範圍之內。對於讀長 300 bp 的 illumina 雙端定序產物而言,可以選擇的參數非常多。目前參數的選擇往往依據經驗或是直接套用預設值,但是所以我想設計一種,能依據資料特性來選擇最佳參數的方法,改善分析過程的解釋性和把握度。

閱讀全文 »

基因體結構會影響變異分析的效度。舉例來說,在 homopolymer 或是 segmental duplicate 區域,依賴 PCR 的 Indel 分析準確性往往低於其他區域 1。因此,若能針對基因體不同區域個別評估效度,將有助於了解技術或流程的限制,進而提升效度分析的鑑別度。

為此,GIAB (Genome in a Bottle consortium) 維護了一系列 BED 檔,記錄基因體上的功能性區域、重複性區域以及高度多樣性區域等。用戶可以使用 hap.py 等工具,配合這些 BED 檔來評估其分析流程在各個區域的表現。

閱讀全文 »

VCF 檔中的 ##contig=<ID=*,lenth=*> 記錄了參考基因體所有染色體的名稱和長度等資訊,而 CHROM 欄位則標示變異所在的染色體。目前,染色體名稱有 UCSC (chr + 染色體編號,例如:chr1chrX)和 Ensembl (沒有前綴,僅有染色體編碼,例如:1X)兩種慣例。執行分析時, 如果輸入的 VCF 檔和對應的參考資料採用相異命名慣例,往往會導致分析結果失真。

舉例來說,GIAB 提供的 VCF 檔是評估變異分析常用的資料。這些 VCF 檔採用 Ensembl 慣例,如果拿 UCSC 慣例的 VCF 檔和它們比較,程式會以為沒有找到這些變異。因此,執行分析時,常常要調整染色體名稱,確保分析結果正確。

本文簡介使用 linux sed 和 bcftools 轉換 VCF 檔染色體命名慣例的方式。

閱讀全文 »

最近生活苦悶,想看點富含貼貼的療癒著作,正好這本《美好少女的垂直社會》現身在網路書城的推薦清單。這本書的插畫很美,而且人物也畫得很可愛,目錄除了數字命名的章節以外,只有兩個女孩的名字:江鯉庭和林鳶。

兩個人!?我想這一定是描寫女孩間純粹美好的友情吧?是那種以各自視角重述彼此接近與曖昧關係,在即將日落的末日世界互相扶持的溫馨故事吧?

讀完前兩章發現自己大錯特錯,所以決定把此書的筆記分類為 sf。

閱讀全文 »

羽衣、帆乃夏和由貴離開京都回到家之後,便著手研究夜未提供的文獻和紀錄。她們從中推論,若能取得保存在東京魔術師總部的最高權杖,由貴將能發揮百分之百的魔力,擁有對抗巨型屍人的力量。驅車前往東京的路上,她們討論起災變的元兇,羽衣認為眾多證據皆指向帆乃夏的姊姊春香策畫了召喚屍人的儀式。由於帆乃夏不相信姊姊有引發災變的動機,所以反感羽衣的指控。不過更讓帆乃夏焦躁不安的是,如果最敬愛的姊姊是讓世人陷入不幸的元凶,那麼帆乃夏該如何走下一步?

閱讀全文 »
0%