如何下載和安裝 RDP classifier
RDP classifier 是基於 Naive Bayes 的物種分類器,常用於註解 16S rRNA 基因序列的分類資訊。除了使用內建的 RDP 資料庫以外,RDP classifier 也允許使用自訂資料庫來訓練分類器。除了內建的 RDP database,也支援以其他資料庫來訓練分類器。
目前,RDP classifier 的核心演算法已被整合到 Mothur 和 DADA2 等流程的副程式庫,所以只要有安裝這些流程軟體,即使沒有安裝 RDP classifier,也能以相同的演算法註解物種資訊。然而,若想要依據自訂或最新的資料庫註解序列,或是使用 copy number 校正等功能,仍有獨立使用 RDP classifier 的必要。
本文將介紹三種下載和安裝 RDP classifier 的方式。
Conda
透過 conda 安裝的方式可參考 Anaconda 的教學。目前,conda 與 RDP 官網提供的 classifier 皆為最新的 2.13 版。
1 | conda install -c bioconda rdp_classifier |
官方網站
若不想要裝一堆附加的軟體或剛好 conda 沒有需要的版本,也可以直接到官網提供的連結下載可執行檔。
1 | wget https://jaist.dl.sourceforge.net/project/rdp-classifier/rdp-class |
由於 RDP classifier 是依賴 JAVA 的軟體,所以執行時要輸入 .jar 的絕對路徑。
1 | java -jar /path/to/rdp_classifier_2.13/dist/classifier.jar <command> |
為了簡化指令,可以創造名為 rdp_classifier 的腳本,並將腳本所在的目錄加入環境變數。
1 | touch rdp_classifier |
接著把落落長的指令放到腳本中。
1 | #!/usr/bin/env bash |
如此一來,往後執行時就只需要輸入 rdp_classifier即可。
1 | rdp_classifier <command> <parameters> |
Ubuntu
若是 Ubuntu,則可以從套件庫安裝。只是相較於 conda,ubuntu 套件庫內的 RDP classifier 還停在 2.10 版。
1 | sudo apt-get -y install rdp-classifier |
除了前述方法,也能夠安裝集合了 RDP 團隊包含了 classifier 在內各種開發工具的 RDPTools。只是 RDPTools 是透過 make 和 makefile 來編譯與安裝。由於依賴的軟體和環境設定等問題,我到現在還沒成功過,暫時無法整理出相關的筆記。