次世代シーケンサデータの処理
次世代シーケンサから出力される配列には、以下のような解析処理が可能です。
参照ゲノム塩基配列に貼り付ける(マッピング)
次世代シーケンサからのデータがすでに近縁種ゲノム塩基配列(参照ゲノム)が決定されているものである場合は、それらの配列が参照ゲノムに相同性を利用して、相同性がある場合は、その領域に由来する配列としてゲノム配列上に貼り付ける(マッピングする)ことができます。
DeNovoアセンブルする
現在のところ、次世代シーケンサの配列長は比較的短く、DeNovoアセンブル処理には有利ではありません。しかしながら、今後はリード長を長くする方向に開発が進んでおり、近い将来DeNovoアセンブルの可能性が高くなることが予想されます。
- 次世代シーケンサデータのDeNovoアセンブルへ
クラスタリングする
DeNovoアセンブルの前処理として実行されるクラスタリングは、たとえDeNovoアセンブルが難しい場合でも、クラスタリング結果自体に意味があり、解析に使用できる可能性があります。
- 次世代シーケンサデータのクラスタリングへ
データ(配列)の品質を見る
次世代シーケンサのデータは一度に大量に生成されるため、従来のように各リードの塩基配列毎に配列の品質を吟味しマスキングする方法は前処理に時間がかかります。このため、品質の管理に際しても、効率のよい方法が求められています。
- 次世代シーケンサデータの品質管理へ
