<<上一篇|回目錄|下一篇>>

字母新解

二十個胺基酸的英文縮寫

這次先不談化學結構,讓我們來熟悉一下二十個胺基酸的英文字母代碼。先看下頭兩個東東:

(1)
ATGGGACGAGCGTTTGAATACAGAAGAGCGGCTAAAGAAAAACGATGGGATAAGATGAGT
AAGGTTTTCCCAAAGCTCGCTAAAGCGATCACTCTAGCGGCAAAAGATGGCGGGAGCGAA
CCGGACACGAACGCCAAACTACGAACAGCGATTTTAAACGCTAAAGCGCAAAACATGCCT
AAAGACAATATTGACGCAGCGATTAAAAGAGCGAGCAGTAAAGAAGGGAATTTGAGTGAA
ATCACTTATGAAGGTAAGGCGAATTTTGGCGTGCTAATCATCATGGAATGCATGACTGAT
AACCCCACCAGAACCATTGCCAACCTTAAAAGCTATTTCAATAAAACGCAAGGGGCAAGC
ATCGTGCCTAATGGCTCTTTAGAGTTTATGTTTAACCGAAAAAGCGTGTTTGAATGCTTG
AAAAATGAAGTGGAAAATTTAAAACTCAGTCTAGAAGATTTAGAATTCGCTCTCATTGAT
TATGGTTTGGAAGAATTAGAAGAAGTGGAAGACAAGATCATTATTAGGGGGGATTATAAC
AGCTTCAAGCTTTTAAATGAGGGGTTTGAAAGCTTGAAATTACCCATTTTAAAAGCGAGT
TTGCAACGCATCGCCACAACGCCCATTGAATTGAATGACGAACAAATGGAGCTTACCGAA
AAATTACTGGACAGGATTGAAGACGATGATGATGTGGTCGCGCTTTATACCAATATTGAG
(2)
MGRAFEYRRAAKEKRWDKMSKVFPKLAKAITLAAKDGGSEPDTNAKLRTAILNAKAQNMP
KDNIDAAIKRASSKEGNLSEITYEGKANFGVLIIMECMTDNPTRTIANLKSYFNKTQGAS
IVPNGSLEFMFNRKSVFECLKNEVENLKLSLEDLEFALIDYGLEELEEVEDKIIIRGDYN
SFKLLNEGFESLKLPILKASLQRIATTPIELNDEQMELTEKLLDRIEDDDDVVALYTNIE
    
看得出所以然嗎?

注意看一下,第一段從頭到尾只有ACTG四個英文字母,第二段字母種類比較多,除了ACTG外,從最開頭看起,還有M, G, R, F, E, Y....等其他。看到這裡,需要知道的只有一件事情:第一段描述的是一個核酸 (nucleic acid)分子的鹼基序列 (base pair sequence)第二段則是一個蛋白質 (protein) 分子的胺基酸序列 (amino acid sequence)。至於詳情,請看下頭分解。

二十個字母

關於第一段描述核酸的部份,ATCG分別是指AdenineCytosineThymine,及Guanine,它們是核甘酸(nucleotide)上頭的鹼基(base),而核甘酸是構成核酸的基本單元,這部份不是這次所要談論的重點,看不懂的話就算了,沒關係的。(假如非要弄清楚不可,可以參考莊榮輝老師的網頁)

第二段對於蛋白質的描述,會用到二十個字母,其中也有ATCG,但含意和描述核酸的ATCG完全不同,它們分別是AlanineThreonineCysteine,及Glycine,是四種不同的胺基酸(amino acid)。胺基酸是構成蛋白質的基本單元,就像是火車的每一節車廂一樣,串成一列。ATCG之外的十六個字母是……等一下!我們反過來看好了,二十六個英文字母,有六個沒用上,其餘全用上了,沒用上的是BJOUXZ六個,為什麼不用這六個呢?其它十六個又是代表什麼意思呢?先來看這二十個胺基酸的全名好了!

二十個胺基酸的英文名字

這二十個胺基酸的英文全名,依字母順序排列如表一的左半部,其中A開頭的就有四個之多,若要仿照核甘酸的鹼基,以英文名稱的第一個字母作為代碼,顯然是不可行的,只好想些其他的方式,讓代碼好記一些,但前題是得先熟悉它們的全名。

表一、構成蛋白質的二十個胺基酸之英文全名、代碼、及簡寫
字母 胺基酸英文全名 個數 代碼 全名 簡寫
A Alanine, Arginine, Asparagine, Aspartic acid 4 個 A alanine Ala
B   0 個 B    
C Cysteine 1 個 C cysteine Cys
D    0 個 D aspartic acid Asp
E   0 個 E glutamic acid Glu
F   0 個 F phenylalanine Phe
G Glutamic acid, Glutamine, Glycine 3 個 G glycine Gly
H Histidine 1 個 H histidine His
I Isoleucine 1 個 I isoleucine Ile
J   0 個 J    
K   0 個 K lysine Lys
L Leucine, Lysine 2 個 L leucine Leu
M Methionine 1 個 M methionine Met
N   0 個 N asparagine Asn
O   0 個 O    
P Phenylalanine, Proline 2 個 P proline Pro
Q   0 個 Q glutamine Gln
R   0 個 R arginine Arg
S Serine 1 個 S serine Ser
T Threonine, Tryptophan, Tyrosine 3 個 T threonine Thr
U   0 個 U    
V Valine 1 個 V valine Val
W   0 個 W tryptophan Trp
X    0 個 X    
Y     0 個 Y tyrosine Tyr
Z    0 個 Z    
     

共 20個

      

這二十個胺基酸的英文名字有些特色:

  1. 字尾幾乎都是-ine結尾,唯一的例外是tryptophan。

     

  2. 你也許會說,aspartic acid和glutamic acid也不是-ine結尾,沒錯,但它們都是由兩個字構成,自成一格,只有這兩個胺基酸的英文名稱是兩個字,且第二個字都是acid。

     

  3. lysine, tyrosine, glycine, leucine, isoleucine字尾的讀法相同,但lysine和tyrosine是-sine結尾,glycine, leucine和isoleucine是-cine。

     

  4. 名稱上,alanine是phenylalanine的一部份,leucine是isoleucine的一部份,phenyl是取代基的名稱,iso是異構物(isomer)的字頭,從名稱上可以猜出結構上的相似性。
 

胺基酸名稱的三碼縮寫

由於以某些字母開頭的胺基酸個數不只一個,無法像核甘酸的四個鹼基一樣,用英文名稱的開頭字母作為縮寫代碼,必須用前三個字母來代替,例如Alanine的縮寫是Ala,Proline的縮寫是Pro。這種作法有個問題:Aspartic acid及Asparagine的前三字母相同,均為Asp;Glutamic acid及Glutamine都是Glu開頭。怎麼辦呢?

Asparagine及Glutamine結尾部份都有字母 n,把它們的縮寫以n結尾。於是Asp給了Aspartic acid,Asparagine縮寫為Asn;Glu就給Glutamic acid用,Glutamine縮寫成Gln。只要先知道了二十個胺基酸的英文名稱,就立刻可知它們的三碼縮寫。反之,從三碼縮寫也可輕易地聯想其英文全名。

以單一字母為代碼

蛋白質的胺基酸數目多達百個以上時,用三碼來表示胺基酸序列,如Met-Gly-Arg-Ala-Phe-Glu-Tyr-Arg-Arg-Ala…還是頗佔篇幅,故有必要規定一套單一字母代碼表才行,例如把同樣的序列寫成MGRAFEYRRA…不是清爽多了嗎?

看表一的中間,以某些字母開頭的胺基酸只有一個,可直接以第一個字母為其代碼,它們是CHIMSV,分別是Cysteine,Histidine,Isoleucine,Methionine,Serine,及Valine。這樣的胺基酸有六個。

相同字母開頭的胺基酸,只能選其中一個為其代碼,A代表Alanine,非Asp、Asn,也不是Arg;G是Glycine,不是Glu、Gln;L是Leucine,不是Lysine;P是Proline,不是phenylalanine;T是Threonine,不是Tyrosine。這樣的胺基酸有五個。

有些名稱聽來頗像某字母,就用該字母作為代碼,例如Arginine聽來像R,phenylalanine開頭像是F字頭單字的發音,Glutamine勉強可聯想到Q,Asparagine有N的音,Tryptophan音節和W類似,Tyrosine和Y有共同的發音/ㄞ/,這樣的胺基酸有六個。

剩下三個胺基酸是用和字首字母排列相近者為其代碼,Aspartic acid和Glutamic acid分別以D和E為代碼,因為Aspartic開頭字母A靠近D,而Glutamic開頭字母G靠近E。Lysine的開頭字母L被Leucine用去,最靠近的字母是K,就用它作為代碼。

以上所說,有些很容易記,因為直觀,只要知道胺基酸的英文名稱即可,例如Arginine的縮寫是R,Cystein縮寫為C…等等;稍難的是像Tryptophan和Glutamine,腦筋要轉一下;最難記的是兩個酸和兩個胺,兩個酸是用靠前面的字母,分別是D和E,代表Asp和Glu,兩個胺靠中間,以N和Q代表,分別是Asn和Gln。看到Asp,Asn,Glu,Gln的英文名稱,很難想到它的縮寫是D,N,E,Q,同樣地,看到D,N,E,Q這幾個字母,也很難聯想出它們的全名是aspartic acid, asparagine, glutamic acid, glutamine。

最後,看到字母,就得聯想到它所代表的胺基酸,可以順著字母次序來背:
(將滑鼠移到空格內,點下,可看到答案)

 

A =    C =     D =     E =

F =     G =     H =     I =

K =    L =     M =     N =

P =     Q =     R =     S =

T =     V =     W =    Y =

      

2003, 8, 1 修正 (2003, 4, 12 初版) 

<<上一篇|回目錄|下一篇>>