RDP classifier 是基於 Naive Bayes 的物種分類器,常用於註解 16S rRNA 基因序列的分類資訊。除了使用內建的 RDP 資料庫以外,RDP classifier 也允許使用自訂資料庫來訓練分類器。除了內建的 RDP database,也支援以其他資料庫來訓練分類器。

目前,RDP classifier 的核心演算法已被整合到 Mothur 和 DADA2 等流程的副程式庫,所以只要有安裝這些流程軟體,即使沒有安裝 RDP classifier,也能以相同的演算法註解物種資訊。然而,若想要依據自訂或最新的資料庫註解序列,或是使用 copy number 校正等功能,仍有獨立使用 RDP classifier 的必要。

本文將介紹三種下載和安裝 RDP classifier 的方式。

閱讀全文 »

本書並非控訴,也非懺悔。它試圖報導一個被戰爭摧毀的世代——儘管有些人得以在炮火下幸免於難。

年輕人在追求國族主義的師長鼓吹下,即使帶有疑慮,仍在「民族」、「愛國」、「勇氣」等氛圍下從軍。然而,和崇高精神相悖的軍隊文化很快地磨耗青年人的熱情。軍隊唯一的目的是把所有人鑄成合格的士兵其中不注重思想,只在乎規矩和系統。

閱讀全文 »

illumina 的 Miseq 和 Hiseq 平台常用於定序 16S rRNA 基因特定變異區的增幅產物。因為這兩平台皆屬雙端定序 (paired-end sequencing),所以每一條 DNA 都會獲得順向和逆向的序列(即定序結果)。在資料處理時,須比對這對序列的重疊區域,再基於重疊區域合併雙方,才能重建出代表該 DNA 的完整序列。

不管使用的軟體為 FLASH 、PEAR 還是 Usearch,合併雙端序列時都有許多參數可以設定。其中一個參數是合併時允許的錯配數量。這參數的必要性在於,即使順向和逆向序列都源於同一條 DNA,兩者的重疊區域仍會因為定序錯誤而略有差異。合併時允許少量的錯配數量能避免捨棄掉這些正確的序列。

然而,我們要怎麼知道洽當的錯配數量上限?使用預設值、反覆試誤、調查文獻都是常見的方法,不過我更想要知道能依照資料選定適用參數的策略。畢竟,如果能先推算出理論值,那麼測試時便有參考的基準,除了能縮減試誤時間,在寫論文或向他人解釋方法時也比較有依據。

因此,雖然在資料處理流程已成熟的今日,糾結參數設定可能被視為無關宏旨,我還是想以本文紀錄,自己思考這個問題的方向與看法。

閱讀全文 »

哺乳動物的排遺樣本代表游離於腸道腔室的細菌(luminal microbes),黏膜樣本則反映棲居於腸道黏膜細菌(mucosal microbes)。許多研究指出,排遺樣本與黏膜樣本的細菌群落組成有別。

例如,在排序分析當中,樣本點往往依採樣部位分群。這意味著排遺樣本未必能反映腸道黏膜的細菌群落組成,而這些細菌的組成與宿主許多生理與疾病相關。

閱讀全文 »

歌,是有序的聲音;聲音,則是波動的一種形式。若沒有變動與交互作用,也就不會產生聲音。因此,聲音也是網路的一項性質。

Haskell 以樹木為觀察對象,描述樹木與雨水、風、動植物、微生物等事物互動發出的聲響,揭示了看似孤立的樹,實則串聯萬物的生命史,形成龐雜的生命網路。

閱讀全文 »

未來,大概日本。
機器人應用行之有年。
人形機器人才剛實用化。

女孩小時候出了車禍成為植物人,二十年後奇蹟甦醒醒面對大不同的環境

閱讀全文 »

安德是被聯邦選中的天才,其個性不若他姊姊薇倫泰溫和得無法下手殺人,也不像他哥哥彼得殘暴得不能博取部屬信任,因此被聯邦培育為抵禦蟲族第三次入侵的領袖。

為使安德在絕望與孤立下激發潛能,他自出生以後,便活在上級注視及同儕欺凌的恐懼中。這些境遇在進入戰鬥學校中是每況愈下,例如長官會特意拔擢安德,以引起資淺者忌妒和資深者輕視。

此外,不合理的訓練要求接二連三,他辛苦建立的友情也被拆散。就連他姊姊薇倫泰,安德唯一的心理慰藉,也只是奉上級之命來關懷他。

閱讀全文 »
0%