我想大家對於「基因密碼」一詞並不陌生,路上隨便抓一把應該有一半以上都聽過,但要是真的問他們「基因密碼」是什麼,可能又都支支吾吾的說不出個所以然吧!其實,生命科學是很有意思的,深入了解之後更會驚嘆於它的神奇與奧妙,在這邊大概講解一下,我會盡力寫得淺顯易懂,不用看到化學結構就害怕唷!

先簡單介紹一下 DNA 好了,不過專有名詞我只用英文,因為我不知道中文是什麼,不好意思。

DNA 是由四種 nucleotides 組成的:ATP, CTP, TTP, GTP



以上四種兩兩配對:A = T, C = G



上圖中的名字 cytosine, guanine, thymine, adenine 指的是只有六角型的那的部份,那個部份叫 base,加了醣(suger)的部份(五角型的部份)以後就叫 cytidine, guanosine, thymidine, adenosine。

DNA 的結構,如上圖所看到的,是雙股螺旋(double helix),而說到 DNA 結構你不能不知道的兩個人就是 James Watson 和 Francis Crick,這兩位利用 X-crystallography 發現了 DNA 是雙股螺旋的結構,也因此得到 1962 年的諾貝爾獎,之後他們也發表 Central Dogma (下面會介紹)讓後世的我們了解 DNA 是如何背負生命之源的重責大任,這可是生物學裡的大貢獻阿,不知道他們兩個人是誰就別說你知道什麼是 DNA。下面是 Watson 在 TED 的演講,告訴大家他們怎麼發現 DNA 的,有興趣可以看看。



看到這裡應該就猜的出上面說的 nucleotides 跟下面的序列有什麼關係了吧!

ATC GCT ATG TCA CTG GAA GAG CCA TAC

ATC CTA ATA AAG GAG CTA ATT TTC GAA AGC TGT ATT GAA AAC TGC GAA

沒錯,上面的序列就是由這四種 nucleotides 組成的,也就是說,我們的 DNA 就是只由這四種組成的,那要怎麼變成胺基酸(amino acid)呢?

首先,DNA 會先被轉譯(transcription)成 RNA。基本上,RNA 和 DNA 的不同只在於醣的部份。

DNA 全名是:deoxyribonucleic acid
RNA 全名是:ribosenucleic acid



ribose 指的是五角型的醣,"de-" 是指「去掉」的意思,"oxy-" 指的是氧(oxygen)的部份,也就是醣的 OH 部份,DNA 既然叫 deoxy-,就是說它少了一個 OH。另外,RNA 裡面沒有 T,T 被 U (uridine) 取代了,所以在 RNA 裡面是這樣配的:A = U & C = G

好了,現在 Central Dogma 中,DNA 變 RNA 的過程完成了,接下來 RNA 變 amino acid 呢?解謎的重點來了,在這個過程中,必須要介紹另一種 RNA,叫 tRNA (下圖紅色圈起來部份)。

Central Dogma: DNA → RNA → mRNA → amino acid

(mRNA: messenger RNA)



DNA 序列三個一組為一個 codon,而 tRNA下面會帶一組 anticodon,上面則帶一個胺基酸。所謂 anticodon 就是對應 codon 的序列,例如:基因序列是 ACG 的話,anticodon 就是 TGC (A=T, C=G),而每一組 codon 有自己所屬的一個胺基酸。



所以,如上圖,如果基因序列是 GGC 的話,帶著 CCG 的 tRNA 就會帶著那組 codon 所屬的胺基酸去對。



基因解碼表[註]如上,可以看到 GGC 所屬的胺基酸是 glycine (Gly)。表上列的只有胺基酸名字的前三個字母,除此之外,每個胺基酸為方便研究,又常只以第一個字母代替,如 Gly 就是 G,Ala 是 A,有重複的則用音來代替,如 arginine (Arg) 是 R。

【註】總共有20種胺基酸,其中有幾種人體無法自己製造,需要由食物中攝取。

好了,大概介紹完了,現在可以開始來解讀基因密碼了。

先看第一個序列:ATC GCT ATG TCA CTG GAA GAG CCA TAC

ATC: AUC → Ile → I
GCT: GCU → Ala → A
ATC: AUC → Met → M

接下來,以此類推。

整個下來就會變成:IAMSLEEPY
拆開來看,就是:I AM SLEEPY

有趣吧!

第二個序列解碼出來是:LIFE SCIENCE

呵呵,有沒有覺得很神奇,也很有趣呢?!雖然只有四種 nucleotides,卻可以製造出千百種各式各樣的蛋白質[註]。當然,這裡還是要註明一下,我們的基因序列解讀出來當然不是一個完整的英文句子之類的,以上只是我自己好玩編出來的序列。

【註】每個蛋白質有自己的胺基酸序列。

另外還要再補充一下,上面這些都是最基本的,在人體裡面的機制當然沒那麼簡單,例如:那麼長的 DNA 序列要怎麼知道從哪裡開始讀?又,因為是三個三個一組,所以從不同點開始讀出來的胺基酸也會不同。例如,這一段序列:ATCGCTATGTCACTGGAAGAGCCA

從 A 開始讀是:ATC GCT ATG TCA CTG GAA GAG CCA
但是從T 開始讀就會變成:A TCG CTA TGT CAC TGG AAG AGC CA
從 C 開始則是:AT CGC TAT GTC ACT GGA AGA GCC A

從不同點開始讀序列,製造出來的胺基酸序列就完全不同。所以可以想見,要是我們的某個基因序列中,有一個 nucleotide 被 delete 掉的話,製造出來的胺基酸整個就是錯的,於是就會產生疾病。

例:ATC GCT ATG TCA CTG GAA GAG

假設正常的胺基酸序列是從A 開始讀,如果劃線的那個被 delete 的話,整個序列就會變成:
ATC GCT AGT CAC TGG AAG AG → 從紅色部份開始,後面製造出來的胺基酸序列整個就錯了。

除此之外,還有其他很複雜的機制,再解釋下去就說不完了,我想大家也會開始霧煞煞的,真的有興趣的再自己拜見孤狗大神吧!


【minc 說】

雖然說也許很多人早就知道了(高中可能有教吧?沒唸完不清楚),但是我放在PTT簽名檔的時候,還是有很多人不知道,然後查了以後覺得很有趣。(其實有人回文的時候,我還挺訝異的,畢竟我只是放簽名檔而已,沒想到會有人因為好奇去查簽名檔的意思。)








arrow
arrow
    全站熱搜

    minc 發表在 痞客邦 留言(5) 人氣()