次世代シーケンサからの短塩基長配列を参照ゲノムにマッピングする
次世代シーケンサからの大量の短塩基長配列をゲノム塩基配列上に相同性を利用して由来する位置を同定し、貼りつけることをマッピングと読んでいます。
MGG:MetaGenomeGAMBLERを使う
MGG:MetaGenomeGAMBLER Professional Editionでは、次世代シーケンサからの大量の塩基配列を参照ゲノム塩基配列にマッピングすることができます。現在は、454、Solexa、SOLiDからの配列を読込ます。SOLiD以外のデータの場合は、通常のFastA形式の塩基配列ファイルやGenBank形式、あるいはABI/SCF形式の波形ファイルも混在させてマッピングが可能となっています。
マッピングする配列データ
Life Technology Appled Biosystems SOLiD
Roche (454 Life Science) Genome Sequencer FLX System
Illumina (Solexa) Genome Analyzer
- SOLiD, Solexa, 454などの次世代シーケンサから出力される大量の塩基配列を既知近縁種ゲノム塩基配列上に相同性により、マッピングし、そのアラインメントとコンセンサス配列を決定し、ゲノム塩基配列との比較を行います。
- 参照ゲノムとコンセンサス配列との相違点をリストアップし、その領域のアラインメントを即時表示し、またリストはエクセル形式のファイルとして出力することができます。
性能
- 通常のPCやMacで、数千万フラグメント(数億から数十億塩基)もの塩基配列をマッピングします。
制限事項
- MGGPとISAが必要です(MGGLでは実行できません)
入力データ
- 近縁種ゲノム塩基配列ファイル Single FastA Format
- 次世代シーケンサによる大量塩基配列ファイル Multiple FastA Format
結果出力
- 参照ゲノム配列にマッピングされたフラグメントのアラインメントおよびコンセンサス配列
- 塩基相違箇所の表示とリストおよびリスト位置へのジャンプ
- 参照ゲノム塩基配列とコンセンサス配列のペアワイズアラインメント
- 入力塩基配列の品質管理用ファイル出力
