這次先不談化學結構,讓我們來熟悉一下二十個胺基酸的英文字母代碼。先看下頭兩個東東:
(1) |
ATGGGACGAGCGTTTGAATACAGAAGAGCGGCTAAAGAAAAACGATGGGATAAGATGAGT AAGGTTTTCCCAAAGCTCGCTAAAGCGATCACTCTAGCGGCAAAAGATGGCGGGAGCGAA CCGGACACGAACGCCAAACTACGAACAGCGATTTTAAACGCTAAAGCGCAAAACATGCCT AAAGACAATATTGACGCAGCGATTAAAAGAGCGAGCAGTAAAGAAGGGAATTTGAGTGAA ATCACTTATGAAGGTAAGGCGAATTTTGGCGTGCTAATCATCATGGAATGCATGACTGAT AACCCCACCAGAACCATTGCCAACCTTAAAAGCTATTTCAATAAAACGCAAGGGGCAAGC ATCGTGCCTAATGGCTCTTTAGAGTTTATGTTTAACCGAAAAAGCGTGTTTGAATGCTTG AAAAATGAAGTGGAAAATTTAAAACTCAGTCTAGAAGATTTAGAATTCGCTCTCATTGAT TATGGTTTGGAAGAATTAGAAGAAGTGGAAGACAAGATCATTATTAGGGGGGATTATAAC AGCTTCAAGCTTTTAAATGAGGGGTTTGAAAGCTTGAAATTACCCATTTTAAAAGCGAGT TTGCAACGCATCGCCACAACGCCCATTGAATTGAATGACGAACAAATGGAGCTTACCGAA AAATTACTGGACAGGATTGAAGACGATGATGATGTGGTCGCGCTTTATACCAATATTGAG |
(2) |
MGRAFEYRRAAKEKRWDKMSKVFPKLAKAITLAAKDGGSEPDTNAKLRTAILNAKAQNMP KDNIDAAIKRASSKEGNLSEITYEGKANFGVLIIMECMTDNPTRTIANLKSYFNKTQGAS IVPNGSLEFMFNRKSVFECLKNEVENLKLSLEDLEFALIDYGLEELEEVEDKIIIRGDYN SFKLLNEGFESLKLPILKASLQRIATTPIELNDEQMELTEKLLDRIEDDDDVVALYTNIE |
注意看一下,第一段從頭到尾只有ACTG四個英文字母,第二段字母種類比較多,除了ACTG外,從最開頭看起,還有M, G, R, F, E, Y....等其他。看到這裡,需要知道的只有一件事情:第一段描述的是一個核酸 (nucleic acid)分子的鹼基序列 (base pair sequence),第二段則是一個蛋白質 (protein) 分子的胺基酸序列 (amino acid sequence)。至於詳情,請看下頭分解。
關於第一段描述核酸的部份,ATCG分別是指Adenine,Cytosine,Thymine,及Guanine,它們是核甘酸(nucleotide)上頭的鹼基(base),而核甘酸是構成核酸的基本單元,這部份不是這次所要談論的重點,看不懂的話就算了,沒關係的。(假如非要弄清楚不可,可以參考莊榮輝老師的網頁)
第二段對於蛋白質的描述,會用到二十個字母,其中也有ATCG,但含意和描述核酸的ATCG完全不同,它們分別是Alanine,Threonine,Cysteine,及Glycine,是四種不同的胺基酸(amino acid)。胺基酸是構成蛋白質的基本單元,就像是火車的每一節車廂一樣,串成一列。ATCG之外的十六個字母是……等一下!我們反過來看好了,二十六個英文字母,有六個沒用上,其餘全用上了,沒用上的是BJOUXZ六個,為什麼不用這六個呢?其它十六個又是代表什麼意思呢?先來看這二十個胺基酸的全名好了!
字母 | 胺基酸英文全名 | 個數 | 代碼 | 全名 | 簡寫 |
A | Alanine, Arginine, Asparagine, Aspartic acid | 4 個 | A | alanine | Ala |
B | 0 個 | B | |||
C | Cysteine | 1 個 | C | cysteine | Cys |
D | 0 個 | D | aspartic acid | Asp | |
E | 0 個 | E | glutamic acid | Glu | |
F | 0 個 | F | phenylalanine | Phe | |
G | Glutamic acid, Glutamine, Glycine | 3 個 | G | glycine | Gly |
H | Histidine | 1 個 | H | histidine | His |
I | Isoleucine | 1 個 | I | isoleucine | Ile |
J | 0 個 | J | |||
K | 0 個 | K | lysine | Lys | |
L | Leucine, Lysine | 2 個 | L | leucine | Leu |
M | Methionine | 1 個 | M | methionine | Met |
N | 0 個 | N | asparagine | Asn | |
O | 0 個 | O | |||
P | Phenylalanine, Proline | 2 個 | P | proline | Pro |
Q | 0 個 | Q | glutamine | Gln | |
R | 0 個 | R | arginine | Arg | |
S | Serine | 1 個 | S | serine | Ser |
T | Threonine, Tryptophan, Tyrosine | 3 個 | T | threonine | Thr |
U | 0 個 | U | |||
V | Valine | 1 個 | V | valine | Val |
W | 0 個 | W | tryptophan | Trp | |
X | 0 個 | X | |||
Y | 0 個 | Y | tyrosine | Tyr | |
Z | 0 個 | Z | |||
共 20個 |
這二十個胺基酸的英文名字有些特色:
由於以某些字母開頭的胺基酸個數不只一個,無法像核甘酸的四個鹼基一樣,用英文名稱的開頭字母作為縮寫代碼,必須用前三個字母來代替,例如Alanine的縮寫是Ala,Proline的縮寫是Pro。這種作法有個問題:Aspartic acid及Asparagine的前三字母相同,均為Asp;Glutamic acid及Glutamine都是Glu開頭。怎麼辦呢?
Asparagine及Glutamine結尾部份都有字母 n,把它們的縮寫以n結尾。於是Asp給了Aspartic acid,Asparagine縮寫為Asn;Glu就給Glutamic acid用,Glutamine縮寫成Gln。只要先知道了二十個胺基酸的英文名稱,就立刻可知它們的三碼縮寫。反之,從三碼縮寫也可輕易地聯想其英文全名。
蛋白質的胺基酸數目多達百個以上時,用三碼來表示胺基酸序列,如Met-Gly-Arg-Ala-Phe-Glu-Tyr-Arg-Arg-Ala…還是頗佔篇幅,故有必要規定一套單一字母代碼表才行,例如把同樣的序列寫成MGRAFEYRRA…不是清爽多了嗎?
看表一的中間,以某些字母開頭的胺基酸只有一個,可直接以第一個字母為其代碼,它們是CHIMSV,分別是Cysteine,Histidine,Isoleucine,Methionine,Serine,及Valine。這樣的胺基酸有六個。
相同字母開頭的胺基酸,只能選其中一個為其代碼,A代表Alanine,非Asp、Asn,也不是Arg;G是Glycine,不是Glu、Gln;L是Leucine,不是Lysine;P是Proline,不是phenylalanine;T是Threonine,不是Tyrosine。這樣的胺基酸有五個。
有些名稱聽來頗像某字母,就用該字母作為代碼,例如Arginine聽來像R,phenylalanine開頭像是F字頭單字的發音,Glutamine勉強可聯想到Q,Asparagine有N的音,Tryptophan音節和W類似,Tyrosine和Y有共同的發音/ㄞ/,這樣的胺基酸有六個。
剩下三個胺基酸是用和字首字母排列相近者為其代碼,Aspartic acid和Glutamic acid分別以D和E為代碼,因為Aspartic開頭字母A靠近D,而Glutamic開頭字母G靠近E。Lysine的開頭字母L被Leucine用去,最靠近的字母是K,就用它作為代碼。
以上所說,有些很容易記,因為直觀,只要知道胺基酸的英文名稱即可,例如Arginine的縮寫是R,Cystein縮寫為C…等等;稍難的是像Tryptophan和Glutamine,腦筋要轉一下;最難記的是兩個酸和兩個胺,兩個酸是用靠前面的字母,分別是D和E,代表Asp和Glu,兩個胺靠中間,以N和Q代表,分別是Asn和Gln。看到Asp,Asn,Glu,Gln的英文名稱,很難想到它的縮寫是D,N,E,Q,同樣地,看到D,N,E,Q這幾個字母,也很難聯想出它們的全名是aspartic acid, asparagine, glutamic acid, glutamine。
最後,看到字母,就得聯想到它所代表的胺基酸,可以順著字母次序來背:
(將滑鼠移到空格內,點下,可看到答案)
2003, 8, 1 修正 (2003, 4, 12 初版)