deepsequencing - 株式会社マイス・ワン...な平均sequence depth...

7
Deep sequencing 牧島秀樹 Key words : Deep sequencing, MDS, MDS/MPN, AML はじめに 近年のテクノロジーの発達により,somatic あるいは germline を問わず,遺伝子・染色体異常を発見・検出 する方法は急速に発達してきた。検査室レベルで有用で ある metaphase cytogeneticsFISH に 加 え て,single nucleotide polymorphism arraySNP-A)が,新しい染 色体異常および遺伝子異常の検索手段を広げた。永年に わたって,シークエンス法の王道であった,前世代の Sanger sequencing は,その役割の大部分を,様々な次 世代シークエンス法にとって代わられようとしている。 実際,次世代シークエンス法は,この紙面で述べるよう deep sequencing の原理に基づいて,これまでになく 多くの遺伝情報を,より早いスピードで,より sensi- tive に同定し,われわれに供給する。これはまさに,遺 伝子シークエンスのパラダイムシフトというべき変化で あって,遺伝子異常に基づく病因,病態を明らかにする 上で,現在,欠かすことのできないツールである 1, 2) 2013 年現在,世界のメジャーなシークエンスラボにお いて,もっとも頻用されているシークエンサーは Illumina 社製の HiSeq 2000 である。一回のランで 600 G base pair 2 週間でシークエンスする。それに対して, 個人レベルのラボ用の,スモールスケールのシークエン サーが MiSeq であり,8 G base pair 1 日でシークエ ンスする。 Deep sequencing は,massive parallel sequencing とい う言葉で言い換えられ,同時に複数(通常 3040 reads 以上)のシークエンスを一度に行うことを指し,いわゆ る次世代シークエンシングとして,前(現)世代の Sanger シークエンス,subcloning シークエンスなどと 区別される。ここで述べた 3040 reads 以上という, deep sequencing の定義自体は,平均,30 回以上,全ゲ ノムをシークエンスすると,99%以上の SNP が確認で きることに基づいている 3) 。しかしながら,基本的には, 目的によって,ゲノムをどのぐらい深く読むか(se- quencing reads を確保するか)は異なるので,deep se- quencing sequencing depth による定義は,方法に よってさまざまである。たとえば,後述するように, ターゲット遺伝子が決まっている,ultra-deep sequenc- ing の場合,変異の allelic burden の差異を統計学的に処 理する目的のため,10,000 reads 以上が望ましい場合も ある。 Deep sequencing による次世代シークエンス法の主な 分類は以下の通りである。サンプルの種類,シークエン スする場所,前処置などの違いによる,プラクティカル な分類である。 1Whole genome sequencing 2Whole exome sequencing 3RNA deep sequencing 4Targeted deep sequencing 5ChIP deep sequencing このレビューでは,それぞれのシークエンスについ て,主に,血液腫瘍を解析する際の有用性,問題点など を,従来のほかの検査法との関連を交えて述べる。 Whole genome sequencing(全ゲノムシークエン シング) ゲノム全体を詳細に,直接スクリーニングする,現在 可能な,もっとも期待される解析方法である。具体的に は,コーディング,ノンコーディング(たとえば,プロ モーター領域,メチレーション領域)に関わらず,全て の核酸レベルの遺伝子変異が明らかにされるだけにとど まらない。Whole exome sequencing ではほぼ不可能で ある,融合遺伝子,さらに,欠失のみならず,コピー数 5410 131559クリーブランドクリニック トーシックがんセンター 75 回日本血液学会学術集会 造血システム/造血幹細胞 EL-3 プログレス

Upload: others

Post on 12-Feb-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Deepsequencing - 株式会社マイス・ワン...な平均sequence depth を得ようとすると,莫大なコン ピューターの情報処理能力,コスト,サンプルの質を必

Deep sequencing

牧 島 秀 樹

Key words : Deep sequencing, MDS, MDS/MPN, AML

はじめに

近年のテクノロジーの発達により,somaticあるいはgermline を問わず,遺伝子・染色体異常を発見・検出する方法は急速に発達してきた。検査室レベルで有用で

ある metaphase cytogenetics,FISH に加えて,singlenucleotide polymorphism array(SNP-A)が,新しい染色体異常および遺伝子異常の検索手段を広げた。永年に

わたって,シークエンス法の王道であった,前世代の

Sanger sequencingは,その役割の大部分を,様々な次世代シークエンス法にとって代わられようとしている。

実際,次世代シークエンス法は,この紙面で述べるよう

な deep sequencingの原理に基づいて,これまでになく多くの遺伝情報を,より早いスピードで,より sensi-tiveに同定し,われわれに供給する。これはまさに,遺伝子シークエンスのパラダイムシフトというべき変化で

あって,遺伝子異常に基づく病因,病態を明らかにする

上で,現在,欠かすことのできないツールである1, 2)。

2013年現在,世界のメジャーなシークエンスラボにおいて,もっとも頻用されているシークエンサーは

Illumina社製の HiSeq 2000である。一回のランで 600 Gbase pairを 2週間でシークエンスする。それに対して,個人レベルのラボ用の,スモールスケールのシークエン

サーが MiSeqであり,8 G base pairを 1日でシークエンスする。

Deep sequencingは,massive parallel sequencingという言葉で言い換えられ,同時に複数(通常 30∼40 reads以上)のシークエンスを一度に行うことを指し,いわゆ

る次世代シークエンシングとして,前(現)世代の

Sangerシークエンス,subcloningシークエンスなどと区別される。ここで述べた 30∼40 reads 以上という,

deep sequencingの定義自体は,平均,30回以上,全ゲノムをシークエンスすると,99%以上の SNPが確認できることに基づいている3)。しかしながら,基本的には,

目的によって,ゲノムをどのぐらい深く読むか(se-quencing readsを確保するか)は異なるので,deep se-quencing の sequencing depth による定義は,方法によってさまざまである。たとえば,後述するように,

ターゲット遺伝子が決まっている,ultra-deep sequenc-ingの場合,変異の allelic burdenの差異を統計学的に処理する目的のため,10,000 reads以上が望ましい場合もある。

Deep sequencingによる次世代シークエンス法の主な分類は以下の通りである。サンプルの種類,シークエン

スする場所,前処置などの違いによる,プラクティカル

な分類である。

1.Whole genome sequencing2.Whole exome sequencing3.RNA deep sequencing4.Targeted deep sequencing5.ChIP deep sequencingこのレビューでは,それぞれのシークエンスについ

て,主に,血液腫瘍を解析する際の有用性,問題点など

を,従来のほかの検査法との関連を交えて述べる。

Whole genome sequencing(全ゲノムシークエンシング)

ゲノム全体を詳細に,直接スクリーニングする,現在

可能な,もっとも期待される解析方法である。具体的に

は,コーディング,ノンコーディング(たとえば,プロ

モーター領域,メチレーション領域)に関わらず,全て

の核酸レベルの遺伝子変異が明らかにされるだけにとど

まらない。Whole exome sequencingではほぼ不可能である,融合遺伝子,さらに,欠失のみならず,コピー数

臨 床 血 液 54:10

13(1559)

クリーブランドクリニック トーシックがんセンター

第 75回日本血液学会学術集会

造血システム/造血幹細胞

EL-3 プログレス

Page 2: Deepsequencing - 株式会社マイス・ワン...な平均sequence depth を得ようとすると,莫大なコン ピューターの情報処理能力,コスト,サンプルの質を必

の減少を伴わない LOH(uniparental disomy; UPD)も理論的には解析可能である。これはつまり,whole ge-nome sequencingが可能になれば,他の全ての遺伝子解析(個別の遺伝子変異検査など)や染色体解析(meta-phase cytogeneticsなど)が必要なくなる可能性を意味する。これまでの代表的な報告として,2008 年には,骨髄腫瘍と皮膚組織をペアにして解析した最初の論文に

より,バイアスの無い遺伝子変異の検索方法であること

が示された4)。つづいて,一例の AML 症例において,全ゲノムを解析することにより,変異のホットスポット

をもつ recurrent な IDH1 遺伝子異常が発見され5),さ

らに,同じグループから,AML において高頻度のDNMT3A変異が報告された6)。続いて,20例をこえる解析により,AMLにおいて遺伝子変異が不規則に起きる一方,複数の変異が相互に強く関係していることが示

された7)。最近,さらに多数例の骨髄腫瘍の全ゲノムの

解析結果が Washington 大学を中心とした The CancerGenome Atlas(TCGA)(http://cancergenome.nih.gov/)より,報告され,腫瘍由来のゲノムを包括的に解析する

時代が幕を開けた8)。さらに,リンパ系腫瘍でも,高頻

度の NOTCH1変異が CLLで,MYD88がWaldenström:s macroglobulinemiaにおいて報告された9, 10)。このよう

に,全てのゲノム情報を提供する,もっとも網羅性があ

る whole genome sequencing が,将来,臨床現場で,もっとも有望かつ,優先されるべき検査のひとつとなる

可能性がある。しかしながら,適切な解析のために十分

な平均 sequence depthを得ようとすると,莫大なコンピューターの情報処理能力,コスト,サンプルの質を必

要とする。したがって,現在のプラットフォームを使用

している限り,一般臨床に導入されるには,いまだ,数

年以上は必要と思われる。

また,その際,腫瘍由来の情報のみならず,先祖から

子孫へ伝わる,全ての遺伝情報が明らかになるため,結

果の利用方法や情報の保存・提供基準等の整備も必要と

なろう。言い換えれば,全ゲノムを解析することにより

得られる臨床的なメリットは計り知れないが,一方,全

ゲノムを明らかにすることで生じる可能性のある,さま

ざなな倫理的な問題は,クリアーされなければならな

い。

Whole exome sequencing(全エクソンシークエンシング)

現在判明している全ての coding regionをターゲットにした massive parallel sequencingで,現在もっとも広く行われている次世代シークエンス法のひとつである。

病理学的に最重要とされるアミノ酸配列が変化する遺伝

子変異を,網羅的に把握することができる(Fig. 1, 2)。血液腫瘍では,やはり TCGAによる AMLにおける大規模研究(N=200)が有名である。Whole exome se-quencing で 得 ら れ る,reference と 異 な る non-

−臨 床 血 液−

14(1560)

Fig. 1 <Mutatome: by whole exome sequencing in myeloid malignanciesWhole exome sequencing demonstrated mutational profile <mutatome: of entire cohort for 100most common genes, sub-classified by disease subtype. Gene mutations are listed in order ofdecreasing frequency on longitudinal axis.

Page 3: Deepsequencing - 株式会社マイス・ワン...な平均sequence depth を得ようとすると,莫大なコン ピューターの情報処理能力,コスト,サンプルの質を必

synonymous や stop gain の結果は,あまりにも膨大なため,たとえ,それが報告されていない variantであったとしても,腫瘍検体のみを用いた解析では somatic変異として SNPと区別することが非常に困難である。そのため,CD3+ T細胞や口腔粘膜由来の germlineサンプルを同時にペアとして解析する必要がある。さらに,

SNP-A を併用することで,LOH による見かけ上の mi-nor allele増加を,somatic変異と混同することを避けられる。Whole exome sequencing では,およそ,95%程度の領域が,少なくとも 20 sequence reads によりカバーされていれば,十分な解析が可能である。

Whole exome sequencingにより,頻度が高い代表的な遺伝子が,つぎつぎと発見されている(BCOR,spli-ceosome関連遺伝子,SETBP1など)11∼14)。とくに,著

しく高い頻度と病型特異性により,世界中を「あっと」

驚かせたのは,spliceosome関連遺伝子変異の発見である。まず,イタリアのグループが ringed sideroblastsの

増加を伴う骨髄腫瘍において,65%という高い頻度でSF3B1 の変異を報告した15)。さらに興味深いのは,

SF3B1の変異は,鉄芽球を伴わないほかのMDSの病型には認められないという所見である。これは,鉄芽球の

増加という形態学的特徴を遺伝子学的に示した,非常に

歴史的な発見であった。さらに,東京大学の小川研など

により,U2AF1, SRSF2 などの変異が,やはり,wholeexome sequencingによって発見された11, 16)。SF3B1の変異において示されたのと同様に,他の spliceosome関連遺伝子変異もまた,疾患特異的に認められた。たとえ

ば,U2AF1は MDSと二次性の AMLで頻繁に変異し,SRSF2 変異は,慢性骨髄単球性白血病(CMML)において高い頻度で認められた17, 18)。さらに,最近,やはり

whole exome sequencingによって,T-cell large granularlymphocytic leukemia(T-LGL)において,STAT3 の変異が発見された19, 20)。本疾患は,WHO分類には T細胞系の腫瘍としてエントリーされているものの,その腫瘍

臨 床 血 液 54:10

15(1561)

Fig. 2 Multiple comparisons of mutational spectrum in each hematological categoryComparison of mutational heterogeneity between MDS-related neoplasms (MDS and secondary AML) andprimary AML highlights the distinct mutational pattern of the two disease groups. At right, 30 functional genegroups and common cytogenetic aberrations are compared between subgroups. Mutations in RTK family,DNMT family, IDH family, and NPM1 are overrepresented in pAML, whereas mutations in TET2 andspliceosome genes are characteristic of MDS-related neoplasms. Below right, bright colors highlight whichgenes frequently co-occur (bright green) or occur with mutual exclusivity (bright red) within each diseasesubtype.

DiagnosisIPSS

del_20qtrisomy_8

del_7qdel_5q

ComplexFSIP2FILIP1

FAM47CEIF4G3

EDC4CC2D1BC10orf68ATP1A2

ARIH2Tetraspanin Family

SH3TC2ROCK2

RFC1PAPPA2

NXF1MED12KCNH7

IL23RIGSF3HEG1

GATA2FAM13A

ETNK1DYNC1H1

CHD7CFTR

AURK FamilyATRX

USP9XTCF4

SPATA21SETBP1MTUS2GRID1

CPAMD8CELSR Family

SRCAPJAK FamilyCACNA1E

Collagen FamilyCEBPA

WNT Signal PathwayFAT2

FANC FamilyETV6

Keratin FamilyPRPF8

DOCK FamilyCDH Fam

BCOR FamilyCBL Family

PHF6WT1

Hedgehog FamilyUsher Syndrome Genes

Laminin FamilyCSMD Family

KDM FamilyCell Cycle Check Point

RNA HelicaseCytoskeletonASXL Family

Spliceosome 2TP53 FamilyPRC2 Family

RUNX1Spliceosome 3Spliceosome 1

Cohesin FamilyIDH Family

NPM1TET2

RAS FamilyRTK Family

DNMT Family

MDS + sAML Mutation Frequency pAML Mutation Frequency Mutation Frequency in MDS + sAML

0.2 0.1 0

del_20qtrisomy_8

del_7qdel_5q

ComplexKeratin Family

PRPF8DOCK Family

CDH FamBCOR FamilyCBL Family

PHF6WT1

Hedgehog FamilyUsher Syndrome Genes

Laminin FamilyCSMD FamilyKDM Family

Cell Cycle Check PointRNA HelicaseCytoskeletonASXL Family

Spliceosome 2TP53 FamilyPRC2 Family

RUNX1Spliceosome 3Spliceosome 1Cohesin Family

IDH FamilyNPM1TET2

RAS FamilyRTK Family

DNMT Family

Mutation Frequency in pAML

0 0.1 0.2

Gene Pair Cooccurrence in MDS+sAML

DN

MT

Fam

ilyR

TK F

amily

RA

S F

amily

TET2

NP

M1

IDH

Fam

ilyC

ohes

in F

amily

Spl

iceo

som

e 1

Spl

iceo

som

e 3

RU

NX

1P

RC

2 Fa

mily

TP53

Fam

ilyS

plic

eoso

me

2A

SX

L Fa

mily

Cyt

oske

leto

nR

NA

Hel

icas

eC

ell C

ycle

Che

ck P

oint

KD

M F

amily

CS

MD

Fam

ilyLa

min

in F

amily

DNMT Family

RTK Family

RAS Family

TET2

NPM1

IDH Family

Cohesin Family

Spliceosome 1

Spliceosome 3

RUNX1

PRC2 Family

TP53 Family

Spliceosome 2

ASXL Family

Cytoskeleton

RNA Helicase

Cell Cycle Check Point

KDM Family

CSMD Family

Laminin Family

P−v

alue

1.00e−03

3.98e−03

1.58e−02

6.31e−02

2.51e−01

1.00e+00

2.51e−01

6.31e−02

1.58e−02

3.98e−03

1.00e−03

Dis

cord

ant

Con

cord

ant

Gene Pair Cooccurrence in pAML

Lam

inin

Fam

ilyC

SM

D F

amily

KD

M F

amily

Cel

l Cyc

le C

heck

Poi

ntR

NA

Hel

icas

eC

ytos

kele

ton

AS

XL

Fam

ilyS

plic

eoso

me

2TP

53 F

amily

PR

C2

Fam

ilyR

UN

X1

Spl

iceo

som

e 3

Spl

iceo

som

e 1

Coh

esin

Fam

ilyID

H F

amily

NP

M1

TET2

RA

S F

amily

RTK

Fam

ilyD

NM

T Fa

mily

DNMT Family

RTK Family

RAS Family

TET2

NPM1

IDH Family

Cohesin Family

Spliceosome 1

Spliceosome 3

RUNX1

PRC2 Family

TP53 Family

Spliceosome 2

ASXL Family

Cytoskeleton

RNA Helicase

Cell Cycle Check Point

KDM Family

CSMD Family

Laminin Family

Page 4: Deepsequencing - 株式会社マイス・ワン...な平均sequence depth を得ようとすると,莫大なコン ピューターの情報処理能力,コスト,サンプルの質を必

としての特徴が,長年はっきりとは確定できずにいた。

本疾患の病態上 STAT3 の機能亢進が重要であることは,すでに明らかにされていたので,somaticの変異が限られたアミノ酸に限定して認められ,gain of functionを来たすことは,これまでの報告を再現することとなっ

た。さらに,2012 年から 2013 年にかけてイタリア(atypical CML)14),日本(JMML)21),アメリカ(CMML,secondary AML)13)からほぼ同時に報告されたのが,so-maticの SETBP1変異である。驚くべきことに,骨髄腫瘍で見つかった 95%以上の変異は,先天性の Schinzel-Giedion syndromeに認められる germline変異と一致していたのである(Fig. 3)。

Whole exome sequencing は,コーディング領域に限って解析されるため,いくつかの不十分な点がある。

SNP の zygosity や sequencing reads の結果が,全ゲノムにわたって連続的に行われず,詳細な LOH/karyotyp-ingの解析には不向きである。したがって,後述する全ゲノムをターゲットとする whole genome sequencingが,データ解析能力不足により困難な場合には,SNP-

Aが併用される。加えて,理論上は,エクソン同士の融合遺伝子が検索可能であるが,実際には,後述する

RNA deep sequencingに軍配が上がる。また,現在のプラットフォームでは,somatic変異かどうかを確認するには解像度が不十分であり,以下に述べる,target deepsequencingによる確認(validation)が必要である。

Target deep sequencing

遺伝子あるいは変異を決めてその箇所を集中的に深く

読む sequence法である。ターゲットにより,様々な用途が考えられる。

まずは,whole exome sequencingあるいは whole ge-nome sequencing の validation(再確認)目的の使用である。これら前述した網羅的なシークエンス法は,現在

のプラットフォームでは,プローブキャプチャー法が一

般的で,アーチファクトが出やすく,false positiveを完全に除くことはできない。データベース上のレファレン

ス配列と異なる結果は,target deep sequencing やSanger sequencing など,他の方法で validation が必要

−臨 床 血 液−

16(1562)

Fig. 3 Novel recurrent SETBP1 activated mutations discovered by deep sequencingBy whole exome sequencing of an index case with RAEB, we detected more mutantreads in leukemia cells than in the germ line DNA (lower left panels). Somatic nature ofthis mutation has been confirmed by analysis of CD3 fraction, using Sanger and deepsequencing as shown in the right panels. We expanded the cohort into 734 cases withvarious myeloid malignancies. Totally, 52 recurrent SETBP1 somatic mutations werefound, all mutations were heterozygous affecting a canonical position located in a highlyconserved SKI homologous region of the protein (upper panels). Most mutations wereidentical to germline mutations responsible for congenital Schinzel-Giedion syndrome(*).

Page 5: Deepsequencing - 株式会社マイス・ワン...な平均sequence depth を得ようとすると,莫大なコン ピューターの情報処理能力,コスト,サンプルの質を必

とされている。

さらに,この場合,sequence depthを 1,000 reads以上確保することにより,それぞれの変異の allele fre-quencyをほぼ正確に把握することができる(Fig. 3, 4)。具体的には,複数の変異が一検体に同時に認められた際

に,どの変異が最初に起きたか,あるいは臨床経過の後

半で獲得されたのか,あるいはどの変異クローンがどの

変異のサブクローンなのか,などいわゆる,clonal ar-chitectureを定量的に把握することができる。また,変異同士が近傍にあれば,それらが,同じ Allele上にあるかどうかも確認できる。このとき,allele frequency をクローンサイズに翻訳する際に重要なことは,SNP-Aなどで,LOH の有無を確認することである。さらに,semisolid culture によりピックアップした colony や,single cell由来の whole genome amplificationした DNAを用いることにより,intra-tumor heterogeneityを最終的に詳細に確定することができる(Fig. 4)。これら,Validationのために利用される deep sequenc-

ingの際には,通常,1つのターゲットに対して 1つのamplicon を使う。この際に,非特異的な増幅を最小限に抑えれば,複数の ampliconを一度の PCRにより増幅し target deep sequencingを行うこともできる。これをmultiplex sequencing あるいは multi-amplicon deep se-quencingなどと呼ぶ。もちろん複数のプライマーは自分で調整することもできる。しかし,Agilent 社のSureselectや,Illumina社の TrueSeqなどに代表される,商業ベースのプラットフォームを使えば,一度に 500以上の遺伝子由来の 5,000以上の ampliconを一度の PCRにより増幅し,一回のランで同時に数百のサンプルに

index を付けて(区別して)deep sequencing することもできる。この方法は,whole exomeなどにより,疾患によって代表的な遺伝子がすでにわかっている場合に,

時間と試薬とサンプルを著しく節約する。そのほか,融

合遺伝子を targetとして multiplex PCRを設定すれば,疾患別に報告されているほぼ全ての融合遺伝子を,一度

に定量的に把握することができる。

さらに,target sequencing は,理論的にはいかなるDNA も deep sequencing 可能である。たとえば,ある施設では,ミトコンドリアゲノムを deep sequencingする試みが行われている22, 23)。ミトコンドリアゲノムは,

1つの細胞中に多数認められ,SNPあるいは変異が見つかったとしても,ミトコンドリアごとに異なる場合があ

る。したがって,定量が推奨される。

あるいは,感染症の原因となる,細菌,ウイルス,そ

のほかの病原体(真菌,寄生虫)なども target deep se-quencingの対象となる。疾患によっては,原因となりうる新たなウイルス,細菌などが見つけられる可能性も

あるし,あるいは,それらの変異が,薬剤耐性や宿主特

異性に関係することを見つけられるかもしれない。

RNA deep sequencing(全 RNA トランスクリプトームシークエンス)

RNA deep sequencingの利用法は 3つある。1)まず,より正確な遺伝子発現の評価である。Expression アレイやリアルタイム PCRのように,プローブ配列に一致する範囲の遺伝子の一部でなく,遺伝子全体にわたる発

現を定量的に測定できる。その際,alternative splicingによる複数のアイソフォームもほぼ完全に相対的に定量

臨 床 血 液 54:10

17(1563)

Fig. 4 Clonal architecture clarified by deep sequencingA. Comparison of clonal size by deep sequencing showed ASXL1, U2AF1 and SETBP1mutations were concomitantly observed, but SETBP1 mutation was clearly acquired as asubclone with ancestral ASXL1 and U2AF1 mutations.B. In 2 cases with RCMD, serial analyses revealed that SETBP1 mutations were observedonly after disease progressions (RAEB and CMML, respectively). However, ancestralASXL1 or U2AF1 mutations were observed at both disease stages. Deep sequencingclarified acquisition of SETBP1 mutations in the context of clonal architecture.

Page 6: Deepsequencing - 株式会社マイス・ワン...な平均sequence depth を得ようとすると,莫大なコン ピューターの情報処理能力,コスト,サンプルの質を必

できる。2)つぎに,splicing異常の発見と評価である。特に,前述した,血液腫瘍における,高頻度の spliceo-some関連遺伝子変異体において,現在精力的に解析されている。Mutantに特有の,exon skippingパターンや,exon retentionにともなう,pre-mRNA nonesense decayを示す所見が認められている11, 16, 17)。この際,使われる

ソフトとしては SpliceTrap(http: //rulai. cshl. edu/splicetrap/)が有用である。3)最後の利用法は,融合遺伝子の検索である。Whole genome sequencingが使えない場合には,特に有用である。しかも,病態に重要な

融合遺伝子の場合,転写効率が高いので,トランスクリ

プトームの解析により明瞭に認められる。この際有用な

のは,TopHat-Fusion software である(http: //tophat.cbcb.umd.edu/fusion_index.html)。したがって,十分なdepthの RNA deep sequencingが可能であれば,遺伝子の unbiasedな全トランスクリプトームの発現,splicingpattern,病因融合遺伝子を一度に解析できることになる。

理論上は,ゲノムの遺伝子異常を同定することも可能

である。しかしながら,いったん転写された後,解析の

ために逆転写されたサンプルには,すでに多くの(生物

学的,人工的)エラーが起きていて,ゲノムを正確に再

現したものとしては,推奨されない。

ChIP deep sequencing(免疫沈降全ゲノムシークエンス)

ターゲットとなる蛋白に対して免疫沈降を行い,結合

していた DNA を抽出し deep sequence する方法である。たとえば,transcription factorやクロマチンに結合している DNAを,網羅的に,定量的に,塩基配列を含めて,知ることができる。これまで,遺伝子のターゲッ

トを決めて増幅するなどしているが,ChIP deep se-quencingがうまくいけば,特定の蛋白が結合する遺伝子(あるいは遺伝子外領域を)ゲノム全体にわたって,

変異解析を含めて,一度にスクリーニングすることがで

きる24)。

Deep sequencingの一般臨床での利用

複数の遺伝子変異の情報が,定量的に一度に把握でき

るメリットは計り知れない。近い将来 deep sequencingが一般臨床の場で利用できるようになれば,ひとつひと

つの遺伝子を形態に基づく推定により選択しなければな

らないというプレッシャーは減るだろう。というより,

簡便さ,経済効率,網羅性からすれば,まず,次世代シー

クエンスにより候補遺伝子をしぼり,次に,他の方法で

個別の遺伝子の確認を行うようになるかもしれない。た

とえば,我々のラボでは,whole exome sequencing により,成人の骨髄系腫瘍を多数例検討し,50個程度の病態や予後に重要と考えられる遺伝子変異を選んで変異

検索のためのパネルを作成した。根拠となったのは,限

られたこれら重要な遺伝子変異をスクリーニングするこ

とにより,ほぼ 90%の症例で,最低 1個は変異が見つかるという結果である(Fig. 1, 2)。また,whole exomesequencingにより,コーディング領域全体では,MDSでは平均 3個,AMLでは 5個の変異が認められる(Fig.1)。こうして明らかとなった,Tire1遺伝子群は multi-plex target deep sequencingパネルにより,一日で全ての変異が定量的に明らかにされる。個別の疾患に関して

は,CMMLにおいて,7個あるいは 9個の遺伝子をターゲットとして,deep sequencingによる変異検索のパネルが試みられている18, 25)。これらの診断プラットフォー

ムには,融合遺伝子を含むことも可能である。さらに,

予後との関連として,deep sequencingにより把握される微小なクローンが,予後不良因子として報告されてい

る(TP53変異)26, 27)。また,複数の遺伝子変異のクロー

ンサイズの検討により,病態進展の早期チェックが可能

になる。この場合,targeted deep sequencingが利用される。

しかしながら,target deep sequencing は MRD の評価に利用できるほど感度が高くなく,実際に臨床の現場

で使うには,まだハードルが高い。従来の定量的 PCRや,ARMS-PCR などのほうが,感度や特異性が高い。現在のプラットフォームでは,診断段階において,より

有用と考えられる。

おわりに

近い将来,さらなるコンピューター処理能力向上と

シークエンスコストの低下により,ベッドサイドで

whole genome sequencingが可能になれば,染色体分析,whole exome sequencing をする必要なくなり,全ての遺伝情報が一度に把握される。一方で,これら網羅的な

解析から,病態を説明する主な変異遺伝子,融合遺伝子

は把握されるので,疾患特異的,あるいは,全ての血液

腫瘍をカバーするような新たな target sequencing のセットが提案される日が来るかもしれない。もし,臨床

現場で使われれば,即日結果が得られ,時間,労力,ス

トレスとも飛躍的に減少すると思われる。

こうして,新しい手法が開発されると,常に,これま

で不明であった新しい病態が明らかとなる。その場合,

もっとも望まれるのは,新たな情報を患者さんの予後改

善に「繫ぐ」ことであり,deep sequencingは,そのために有用でありうる。

著者の COI(conflicts of interest)開示:本論文発表内容に関連

−臨 床 血 液−

18(1564)

Page 7: Deepsequencing - 株式会社マイス・ワン...な平均sequence depth を得ようとすると,莫大なコン ピューターの情報処理能力,コスト,サンプルの質を必

して特に申告なし

文 献

1)Kohlmann A, Grossmann V, Nadarajah N, Haferlach T. Next-generation sequencing - feasibility and practicality inhaematology. Br J Haematol. 2013; 160: 736-753.

2)Yoshida K, Sanada M, Ogawa S. Deep sequencing in cancerresearch. Jpn J Clin Oncol. 2013; 43: 110-115.

3)Li H, Ruan J, Durbin R. Mapping short DNA sequencingreads and calling variants using mapping quality scores.Genome Res. 2008; 18: 1851-1858.

4)Ley TJ, Mardis ER, Ding L, et al. DNA sequencing of acytogenetically normal acute myeloid leukaemia genome.Nature. 2008; 456: 66-72.

5)Mardis ER, Ding L, Dooling DJ, et al. Recurring mutationsfound by sequencing an acute myeloid leukemia genome. NEngl J Med. 2009; 361: 1058-1066.

6)Ley TJ, Ding L, Walter MJ, et al. DNMT3A mutations in acutemyeloid leukemia. N Engl J Med. 2010; 363: 2424-2433.

7)Welch JS, Ley TJ, Link DC, et al. The origin and evolution ofmutations in acute myeloid leukemia. Cell. 2012; 150: 264-278.

8)Cancer Genome Atlas Research Network. Genomic andepigenomic landscapes of adult de novo acute myeloidleukemia. N Engl J Med. 2013; 368: 2059-2074.

9)Puente XS, Pinyol M, Quesada V, et al. Whole-genomesequencing identifies recurrent mutations in chronic lympho-cytic leukaemia. Nature. 2011; 475: 101-105.

10)Treon SP, Xu L, Yang G, et al. MYD88 L265P somaticmutation in Waldenstrom: s macroglobulinemia. N Engl JMed. 2012; 367: 826-833.

11)Yoshida K, Sanada M, Shiraishi Y, et al. Frequent pathwaymutations of splicing machinery in myelodysplasia. Nature.2011; 478: 64-69.

12)Grossmann V, Tiacci E, Holmes AB, et al. Whole-exomesequencing identifies somatic mutations of BCOR in acutemyeloid leukemia with normal karyotype. Blood. 2011; 118:6153-6163.

13)Makishima H, Yoshida K, Nguyen N, et al. Somatic mutationsin Schinzel-Giedion syndrome gene SETBP1 determineprogression in myeloid malignancies[abstract]. Blood. 2012;120: Abstract 2.

14)Piazza R, Valletta S, Winkelmann N, et al. Recurrent SETBP1mutations in atypical chronic myeloid leukemia. Nat Genet.

2013; 45: 18-24.15)Papaemmanuil E, Cazzola M, Boultwood J, et al. Chronic

Myeloid Disorders Working Group of the International Can-cer Genome Consortium. Somatic SF3B1 mutation inmyelodysplasia with ring sideroblasts. N Engl J Med. 2011;365: 1384-1395.

16)Graubert TA, Shen D, Ding L, et al. Recurrent mutations inthe U2AF1 splicing factor in myelodysplastic syndromes. NatGenet. 2011; 44: 53-57.

17)Makishima H, Visconte V, Sakaguchi H, et al. Mutations inthe spliceosome machinery, a novel and ubiquitous pathwayin leukemogenesis. Blood. 2012; 119: 3203-3210.

18)Meggendorfer M, Roller A, Haferlach T, et al. SRSF2mutations in 275 cases with chronic myelomonocytic leuke-mia (CMML). Blood. 2012; 120: 3080-3088.

19)Koskela HL, Eldfors S, Ellonen P, et al. Somatic STAT3mutations in large granular lymphocytic leukemia. N Engl JMed. 2012; 366: 1905-1913.

20)Jerez A, Clemente MJ, Makishima H, et al. STAT3 mutationsunify the pathogenesis of chronic lymphoproliferativedisorders of NK cells and T-cell large granular lymphocyteleukemia. Blood. 2012; 120: 3048-3057.

21)Sakaguchi H, Okuno Y, Muramatsu H, et al. Exomesequencing identifies secondary mutations of SETBP1 andJAK3 in juvenile myelomonocytic leukemia. Nat Genet. 2013;45: 937-941.

22)Payne BA, Wilson IJ, Hateley CA, et al. Mitochondrial agingis accelerated by anti-retroviral therapy through the clonalexpansion of mtDNA mutations. Nat Genet. 2011; 43: 806-810.

23)Mercer TR, Neph S, Dinger ME, et al. The humanmitochondrial transcriptome. Cell. 2011; 146: 645-658.

24)Pepke S, Wold B, Mortazavi A. Computation for ChIP-seq andRNA-seq studies. Nat Methods. 2009; 6: S22-S32.

25)Kohlmann A, Grossmann V, Klein HU, et al. Next-generationsequencing technology reveals a characteristic pattern ofmolecular mutations in 72. 8% of chronic myelomonocyticleukemia by detecting frequent alterations in TET2, CBL,RAS, and RUNX1. J Clin Oncol. 2010; 28: 3858-3865.

26)Jädersten M, Saft L, Smith A, et al. TP53 mutations in low-risk myelodysplastic syndromes with del(5q)predict diseaseprogression. J Clin Oncol. 2011; 29: 1971-1979.

27)Zenz T, Eichhorst B, Busch R, et al. TP53 mutation andsurvival in chronic lymphocytic leukemia. J Clin Oncol. 2010;28: 4473-4479.

臨 床 血 液 54:10

19(1565)