アセンブリ(assembly)とは、「組み立て」という意味で、シークエンス解析においては、リード(read)をつないで、コンティグ(contig)という一つながりの長い塩基配列を組み立てることをいう。
シークエンスをパズルで喩えると、ゴールはパズルのピースを全部埋めることである。de novo assemblyとmappingという2つの方法がある。de novo assemblyとは、ゴールの図がない状態から、パズルのピースを埋めて完成させることを指し、mappingとは、ゴールの図がなんとなくわかった状態から、パズルのピースを埋めて完成させることを指す。
パズルのピースがreadであり、パズルのピースを埋める作業がassembly(名詞)またはassemble(動詞)である。また、「なんとなくわかった状態」の図を参照配列と呼ぶ。
一つ一つのread長が長いシークエンスをlong read sequence(LRS)、短いシークエンスをshort read sequence(SRS)と呼ぶ。パズルで喩えると、LRSはパズルのピースが大きい場合、SRSはパズルのピースが小さい場合と言える。LRSの方がピースが大きいので完成させやすい。しかし、一つ一つのピースの完成度はSRSの方がよい。