給定一條 DNA 序列與其 intron 序列(兩者儲存於同一個 FASTA 檔案),求此序列經過轉錄、剪切與轉譯後所產生的蛋白質序列。

After identifying the exons and introns of an RNA string, we only need to delete the introns and concatenate the exons to form a new string ready for translation.

Given: A DNA string s (of length at most 1 kbp) and a collection of substrings of s acting as introns. All strings are given in FASTA format.

Return: A protein string resulting from transcribing and translating the exons of s. (Note: Only one solution will exist for the dataset provided.)

(https://rosalind.info/problems/splc/)

閱讀全文 »

至今,我仍記得第一次競賽培訓,坐在 512 教室那骯髒而灰暗的生物實驗室裡,上午時分,人煙希罕,有些悠閒的感覺。

講完理論的阿灰老師開始介紹實驗,他強調︰

「做實驗時,你們要注意一些基本操作,不要給人見笑。我們學校培育出來的學生,要有不一樣的氣度,除了桌子整潔而且動作井然有序外,像是稀釋溶液或看顯微鏡等都要一步到位,不要在那邊滴半天、轉半天還調不出所需濃度、看不到東西!」

接著,他抽起不知為何插在筆筒裡的塑膠滴管︰

「你看這上頭寫著 3 cc,但你們就這樣相信了嗎?你們要去嘗試,統計滴管的實際容量,還有你們每次操作會擠出多少 cc!這樣調配溶液才會快而精準!」

「操作顯微鏡,沒有人從 40 倍開始看的啦!都是從 100 倍開始,你們要練習、練習再練習,直到不用注視目鏡,光看物鏡和物體的距離就能把焦距調好!」

聽到這些嚴格要求,當時的我油然升起「太帥了」的念頭。沒錯,每位實驗者都要有他獨門的必殺絕招,所以我也要有。

閱讀全文 »

為了認識世界和交流想法,人類發明了度量衡制度。度量衡的發展不只與經濟產業的需求密切相關,也深受政治社會環境的影響。因此,不僅各個國家有其獨特的度量衡制度,不同產業也發展出各自慣用的度量衡系統。

這些系統既因為地域而異,也隨時間推進不斷演變。這本書的目的是介紹長度、面積、體積與重量等生活常見的度量衡單位,探討各個國家與產業的度量衡差異與其流變,並且探討這些差異與變化的可能成因。

(李開周(2020),從奈米到光年:有趣的度量衡簡史。)

閱讀全文 »

Rosalind 是一個以生物資訊為主題的程式解題平台,它與 LeetCode 等解題網站類似,能提供測試資料並且自動核對用戶上傳的答案。不過,Rosalind 的特色在於它收錄了生物資訊領域的經典問題,例如序列比對、譜系分析與基因重組等。

因此,在解決這些問題的同時,不僅能熟悉程式語言特性和了解演算法內涵,還能學習如何將生物學問題轉換為資訊科學問題,培養建模思考的方式。

閱讀全文 »

「你有去過橋下俱樂部嗎?」

橋下俱樂部,是我家鄉某個村民聯絡感情的地方。俱樂部的位置在中山高某段陸橋底下,旁邊則是一條長滿雜草的臭水溝。整個空間只有一個排球場大,高度也不高,稍微伸展就能摸到因車流而震動的橋底。

原本橋下沒什麼人的,好像某次有一整套家具被棄置到這邊,才吸引了沒事幹的中老年人聚到這,甚至一些被子女拋棄的老人把更多家具堆積到橋下,經營著自己真正的家。

我的舅舅對於這現象有個精闢的見解,他說橋下俱樂部是沒有神的地方。橋下正好位於那邊幾個宮廟的中心,由於橋下附近的居民離廟宇都很遠,所以一旦橋下俱樂部的硬體成形後,村民都聚集到這裡來了。

橋下俱樂部的興盛可能從我幼稚園開始,而衰退是什麼時候我不清楚,因為等我再次造訪橋下時,「橋下俱樂部」的塗鴉已經被抹去,先前堆積的雜物也被清空,只剩下公路工人在此小憩留下的菸蒂和飲料瓶。

新店溪左右岸兩岸的橋下俱樂部呈現某種不對稱性。

不對稱性的其中一層含義是某種事物比另一種多:重子不對稱性是重子的數量大與反重子,掌性不對稱是自然界的胺基酸多數左旋。而都市的不對稱性應該可以說是某種不平衡,例如區域的環境、硬體和人流組成差異等。

閱讀全文 »

給定一條以 FASTA 儲存的 DNA 序列,求長度介於 4 到 12 之間的反向迴文(reverse palindrome)的起始位置與長度。

A DNA string is a reverse palindrome if it is equal to its reverse complement. For instance, GCATGC is a reverse palindrome because its reverse complement is GCATGC. See Figure 2.

Given: A DNA string of length at most 1 kbp in FASTA format.

Return: The position and length of every reverse palindrome in the string having length between 4 and 12. You may return these pairs in any order.

(https://rosalind.info/problems/revp/)

閱讀全文 »

童話故事都是千真萬確的:不是因為它們告訴我們惡龍真的存在,而是因為它們告訴我們,惡龍是可以打敗的。——G.K.切斯特頓

勇敢不代表不害怕,勇敢代表你怕,真的很怕,非常害怕,但你還是作出正確的選擇。

閱讀全文 »

我們的競爭對手不是綜合榜的暢銷書,而是YouTube、網路漫畫、遊戲、Netflix等。下班回家的路上,在客滿的地鐵裡用手機看網路小說的讀者,因為周邊環境嘈雜,再加上一整天上班後的疲勞,使得他們的眼睛十分乾澀。你覺得他們會想看哪種句子呢?

讀者要的是趣味性!還有情感的宣洩!以及能夠讓他們忘記苦澀人生的汽水!網路小說家則是販售趣味性的人,所以商業價值當然比文學性來得重要。……網路小說是個完全繞著讀者轉的市場。

鄭穆尼(2021),我的職業是網路小說家:韓國人氣作家的致富寫作教室。

閱讀全文 »

給定一條以 FASTA 格式儲存的 DNA 序列,依據它的 open reading frames,列出所有可能由這條 DNA 序列轉譯出的蛋白質序列。

An open reading frame (ORF) is one which starts from the start codon and ends by stop codon, without any other stop codons in between. Thus, a candidate protein string is derived by translating an open reading frame into amino acids until a stop codon is reached.

Given: A DNA string s of length at most 1 kbp in FASTA format.

Return: Every distinct candidate protein string that can be translated from ORFs of s. Strings can be returned in any order.

(https://rosalind.info/problems/orf/)

閱讀全文 »
0%