CDSとORF

 CDSとORFは、それぞれCoDing SequenceとOpen Reading Frameの略で、前者はタンパク質に翻訳されるDNA配列領域を指し*、後者は開始コドンから終始コドンの間のDNA配列領域を指す。原則として、原核生物では、ORF中にタンパク質に翻訳されない領域がないため、CDS = ORFと考えてよい。また、遺伝子(gene)やシストロン(cistron)ともほぼ同義である**

*終始コドンはアミノ酸をコードしていないが、CDSに含まれる。
**同じものを、gene、CDS、ORF、cistronなどと呼び分けるのは、曖昧さを避けるためである。特に、geneは概念的な名称であり、狭義にはcistron、広義にはgenomeの意味で用いられことがある。したがって、文脈によって明確に使い分けたいときには、それぞれに適した用語を用いる。例えば、cistronという用語は、後述のように、monocistronicやpolycistronicを表したい場合に用いられる用語である。
図1 原核生物の場合
 CDS = ORF = cistron ≒ gene の関係と考えてよい。

 また、一つのmRNAに、1つのシストロンを持っている場合と、2つ以上のシストロンを持っている場合があり、前者をmonocistronic、後者をpolycistronicと表現する。

図2 polycistronicな遺伝子
赤は開始コドン、青は終始コドンを示している。

 真核生物では、タンパク質に翻訳されるエクソンとエクソンの間に、タンパク質に翻訳されないイントロンが介在しており、イントロンはスプライシングによって取り除かれる。したがって、ORFの方がCDSよりも長くなる。 

図3 真核生物の場合
赤は開始コドン、青は終始コドンを示している。
[戻る]