第3回ngs現場の会モーニング教育セッション 配布用資料

57
いまさら聞けない NGS超!入門 株式会社ジナリス 竹田 綾

Upload: aya-takeda

Post on 14-Jul-2015

3.164 views

Category:

Technology


7 download

TRANSCRIPT

いまさら聞けない

NGS超!入門

株式会社ジナリス

竹田 綾

ブース#40: 株式会社ジナリス

目的

• NGSについて「少し会話ができるレベル」になる

• 知りたい情報を効率よく入手するためのヒント

OUTLINE

• NGS:なにができるの?

• 「次世代」シーケンサー

– 活躍中のシーケンサー

– 第n世代シーケンサーたち

• 基本の「き」 用語集

– ライブラリー作製

– シーケンシング

– データ解析

• 情報源のまとめ

NGSで何ができるの?

(どんなふうに使われているのか)

http://cell-innovation.nig.ac.jp/public/contents/sra_stat.html

42%

NCBI Short Read Archive DDBJ = DRA

アプリケーション

• 新規ゲノム解析 • リシーケンス(変異) • RNA-seq(発現) • 新規トランスクリプトーム • miRNA • ChIP-seq • メチル化 • 16S rRNAメタゲノム • メタゲノム(ショットガン) などなど

NGS = 実験ツール

“一方、シークエンサーはマイクロアレイと違い、DNA 多型から、転写、DNAタンパク質相互作用、エピゲノムまで、あらゆる現象を捉える「多目的顕微鏡」になっている。先日、“何々-Seq”がどのぐらいあるかを、数人で思

い出してみたところ、60手法ぐらいはすらすらと出てきた。”

(大会長挨拶より)

「次世代」シーケンサーたち

http://flxlexblog.wordpress.com/2012/12/03/developments-in-next-generation-sequencing-a-visualisation/

Dec 3rd, 2012

41%

8%

1% 0% 0% 0%

50%

シーケンサー別統計

Illumina

Roche454

SOLiD

IonTorrent

PacBio

Helicos

Others

Next“次世代”シーケンサー

• Qiagen GeneReader

– Intelligent Bio-System “Max-Seq Genome Sequencer”

– 20-400M reads/flowcell, 20 flowcell (independent)

– Early access starts 2013

• GnuBIO

– Beta version start shipping in April

– Sequence by Hybridization

– Read length ~1000bp, 1.2Gb/run, $50,000

• Oxford Nanopore GridION & MinION

基本の「き」 用語集

(ほぼ)共通のながれ

ライブラリー作製

シーケンシング

データ解析

ライブラリー作製

• DNA断片化→シーケンシングアダプター付与

• フラグメントサイズ:断片化したDNAの長さ

• RNA:PolyA濃縮/ rRNA除去後、cDNA作製

• Target capture

• Amplicon

など

ライブラリー

フラグメント/シングルエンド ペアエンド

アダプター DNAフラグメント

シーケンスリード

メイトペアライブラリー

http://wako-chem.co.jp/siyaku/jutaku/dna_sequence/img/figure_03_01.jpg

マルチプレックス

http://www.illuminakk.co.jp/technology/multiplexing_sequencing_assay.ilmn

(ほぼ)共通のながれ

ライブラリー作製

シーケンシング

データ解析

“生データ”

• 生データ: ベースコールと最低限のフィルタリング後、シーケンサーから出力されるリード配列とそのクオリティー情報

(Fastq, SFF, etc)

• 出力データ量 = リード数 x リード長

• リード長

• クオリティー Phred Score

Phred Score

http://en.wikipedia.org/wiki/Phred_quality_score

http://en.wikipedia.org/wiki/Phred_quality_score

トリミング・フィルタリング

生データのQual. Valueの分布

1 51 bp

トリミング後のデータの

Qual. Valueの分布

1 51 bp

(株)ジナリス

(ほぼ)共通のながれ

ライブラリー作製

シーケンシング

データ解析

アセンブリー vs マッピング

コンセンサス配列

参照配列/リファレンス

リード

アダプター DNAフラグメント

シーケンスリード

http://www.slideshare.net/kbradnam/assemblathon-2-talk

ペアリード

アダプター DNAフラグメント

メイトペアリード

コンティグ

コンティグ

スキャフォールド/スーパーコンティグ

コンティグ1 コンティグ2

スキャフォールド/スーパーコンティグ

コンティグ1 コンティグ2

NNNNNNNNNNNN

スキャフォールド

ギャップ

アセンブリー結果の評価

• アセンブリーサイズ:総コンティグ/スキャフォールド長

• コンティグ・スキャフォールド数

• N50

• ギャップ数・ギャップ長

N50

12個のスキャフォールド/コンティグ、総塩基長200Mb

http://www.slideshare.net/kbradnam/assemblathon-2-talk

N50

12個のスキャフォールド/コンティグ、総塩基長200Mb

http://www.slideshare.net/kbradnam/assemblathon-2-talk

マッピングの評価

参照配列/リファレンス

A A A A A

Depth=リードの厚み

%Coverage = 参照配列の全長に対して、リードがマップされている領域の割合

SNP・一塩基置換

A A A A A

G A A A A A

G A A G G

InDel Deletion

Insertion

リピート配列

ATTGGCTATGGTTACAGAACGCGCGCGCGCGCGCGCGCGCGCGCGCGCATTGCACTT

GTTACA

GTTACA

GCACTT

GCACTT

CGCGCG

CGCGCG

??

高次解析

• 遺伝子アノテーション

• SNP解析

• 発現量解析

• コピー数

• 菌叢推定

などなど

情報収集源

First Option

https://www.google.com/?tbm=pts

Google 特許

メーカーサイト

http://www.illuminakk.co.jp/events/webinar_japan.ilmn

http://454.com/publications/index.asp

http://cell-innovation.nig.ac.jp/wiki/tiki-index.php

http://togotv.dbcls.jp/index.rb?category=NGS

http://seqanswers.com/

http://qa.lifesciencedb.jp/

http://www.genome.gov/27552682

業界ニュース

個人ブログ

http://pacbiobrothers.blogspot.jp/

http://shortreadbrothers.blogspot.jp/

匠たちに聞く

• Twitter

#ngsfield

http://genaport.genaris.com/GOC_topics.php

http://genaport.genaris.com/GOC_topics.php

GOクラブ会員募集中! 次世代シーケンシング関連の最新ニュースを定期的にお届けします。 会員登録、メールマガジン購読をご希望の方はこちら。 http://genaport.genaris.com/GOC_top.htm

ご清聴ありがとうございました

宿題: せっかくですので、本会期中に「匠」印の人を見つけて、一つ質問してみましょう!