アセンブリ

 アセンブリassembly)とは、「組み立て」という意味で、シークエンス解析においては、リードread)をつないで、コンティグcontig)という一つながりの長い塩基配列を組み立てることをいう。
 シークエンスをパズルで喩えると、ゴールはパズルのピースを全部埋めることである。de novo assemblymappingという2つの方法がある。de novo assemblyとは、ゴールの図がない状態から、パズルのピースを埋めて完成させることを指し、mappingとは、ゴールの図がなんとなくわかった状態から、パズルのピースを埋めて完成させることを指す。
 パズルのピースがreadであり、パズルのピースを埋める作業がassembly(名詞)またはassemble(動詞)である。また、「なんとなくわかった状態」の図を参照配列と呼ぶ。

アセンブリの説明
図1 de novo assemblyとmapping

 一つ一つのread長が長いシークエンスをlong read sequence(LRS)、短いシークエンスをshort read sequence(SRS)と呼ぶ。パズルで喩えると、LRSはパズルのピースが大きい場合、SRSはパズルのピースが小さい場合と言える。LRSの方がピースが大きいので完成させやすい。しかし、一つ一つのピースの完成度はSRSの方がよい。

LRSとSRSの説明
図2 LRSとSRS
LRSは、一つ一つのリードが長いのでのりしろが多くつながりやすいが、読み間違いが多い(=精度が低い)。一方、SRSは、読み間違いが少ない(=精度が高い)が、断片化しすぎてつながりにくい。

関連項目 canu unicycler

[戻る]