我對論文寫作的第一印象是「寫論文很難,要花很長的時間才能完成,而且從準備到發表過程中會受到大量的批判,一路過關斬將才有機會嶄露頭角」。

所以每當開啟 word 檔開始打字的時候,都有起步的焦慮感:覺得自己還沒準備好,想要把文獻回顧完全,研究結果做到滴水不漏才有辦法動筆。

這種印象部分奠基於碩士論文寫作經驗,當時往往盯著螢幕許久沒有任何想法,最後歸因於自己文獻回顧不夠完整或是研究做得不夠完善。

我意識到阻礙我進展的是對於完美論文的期待,我期待論文能夠達到讓我感到愉悅和成就感的標準。

然而,人們總是無法在初稿時達到滿意的程度吧?而且論文需要於修改中逐漸精緻,沒辦法一蹴可幾,我的期待反過來成為我的壓力。

為了舒緩這種壓力和焦慮,我轉而把精力投注在文獻回顧或改進研究內容。雖然多做準備能暫時減緩我的焦慮和踏實感,但這只是將自己的壓力和負擔延後,之後將面對更多的時間、資源和要求的壓力。

閱讀全文 »

RDP classifier 是基於 Naive Bayes 的物種分類器,常用於註解 16S rRNA 基因序列的分類資訊。除了使用內建的 RDP 資料庫以外,RDP classifier 也允許使用自訂資料庫來訓練分類器。除了內建的 RDP database,也支援以其他資料庫來訓練分類器。

目前,RDP classifier 的核心演算法已被整合到 Mothur 和 DADA2 等流程的副程式庫,所以只要有安裝這些流程軟體,即使沒有安裝 RDP classifier,也能以相同的演算法註解物種資訊。然而,若想要依據自訂或最新的資料庫註解序列,或是使用 copy number 校正等功能,仍有獨立使用 RDP classifier 的必要。

本文將介紹三種下載和安裝 RDP classifier 的方式。

閱讀全文 »

本書並非控訴,也非懺悔。它試圖報導一個被戰爭摧毀的世代——儘管有些人得以在炮火下幸免於難。

年輕人在追求國族主義的師長鼓吹下,即使帶有疑慮,仍在「民族」、「愛國」、「勇氣」等氛圍下從軍。然而,和崇高精神相悖的軍隊文化很快地磨耗青年人的熱情。軍隊唯一的目的是把所有人鑄成合格的士兵其中不注重思想,只在乎規矩和系統。

閱讀全文 »

illumina 的 Miseq 和 Hiseq 平台常用於定序 16S rRNA 基因特定變異區的增幅產物。因為這兩平台皆屬雙端定序 (paired-end sequencing),所以每一條 DNA 都會獲得順向和逆向的序列(即定序結果)。在資料處理時,須比對這對序列的重疊區域,再基於重疊區域合併雙方,才能重建出代表該 DNA 的完整序列。

不管使用的軟體為 FLASH 、PEAR 還是 Usearch,合併雙端序列時都有許多參數可以設定。其中一個參數是合併時允許的錯配數量。這參數的必要性在於,即使順向和逆向序列都源於同一條 DNA,兩者的重疊區域仍會因為定序錯誤而略有差異。合併時允許少量的錯配數量能避免捨棄掉這些正確的序列。

然而,我們要怎麼知道洽當的錯配數量上限?使用預設值、反覆試誤、調查文獻都是常見的方法,不過我更想要知道能依照資料選定適用參數的策略。畢竟,如果能先推算出理論值,那麼測試時便有參考的基準,除了能縮減試誤時間,在寫論文或向他人解釋方法時也比較有依據。

因此,雖然在資料處理流程已成熟的今日,糾結參數設定可能被視為無關宏旨,我還是想以本文紀錄,自己思考這個問題的方向與看法。

閱讀全文 »

哺乳動物的排遺樣本代表游離於腸道腔室的細菌(luminal microbes),黏膜樣本則反映棲居於腸道黏膜細菌(mucosal microbes)。許多研究指出,排遺樣本與黏膜樣本的細菌群落組成有別。

例如,在排序分析當中,樣本點往往依採樣部位分群。這意味著排遺樣本未必能反映腸道黏膜的細菌群落組成,而這些細菌的組成與宿主許多生理與疾病相關。

閱讀全文 »

歌,是有序的聲音;聲音,則是波動的一種形式。若沒有變動與交互作用,也就不會產生聲音。因此,聲音也是網路的一項性質。

Haskell 以樹木為觀察對象,描述樹木與雨水、風、動植物、微生物等事物互動發出的聲響,揭示了看似孤立的樹,實則串聯萬物的生命史,形成龐雜的生命網路。

閱讀全文 »

未來,大概日本。
機器人應用行之有年。
人形機器人才剛實用化。

女孩小時候出了車禍成為植物人,二十年後奇蹟甦醒醒面對大不同的環境

閱讀全文 »
0%