CHARACTERIZATION OF CANCER
GENOMES THROUGH WHOLE-
EXOME AND mRNA-SEQUENCING
R. Piazza
Dip. Medicina Clinica,
Università di Milano-Bicocca
R. Piazza – Roma, 23/6/11
WHOLE-EXOME SEQUENCING
PERCHÉ WHOLE-EXOME ?
RIDUZIONE DELLE DIMENSIONI
DEL PROBLEMA 50-100X
RIDUZIONE DELLA COMPLESSITÀ
DI ANALISI
RIDUZIONE PROPORZIONALE
DEI COSTI
MAGGIORE RAPIDITÀ
MUTAZIONI IN REGIONE
CODIFICANTE ?
R. Piazza – Roma, 23/6/11
WHOLE-EXOME SEQUENCING
R. Piazza – Roma, 23/6/11
THE EXOME – GALAXY AND UCSC
WHOLE-EXOME SEQUENCING - COVERAGE
R. Piazza – Roma, 23/6/11
BIOINFORMATICA:
OBIETTIVI
SEMPLICITÀ D’USO
- GRAFICO, NO SCRIPT
PORTABILITÀ:
- WINDOWS XP, 7, VISTA, 2000
- LINUX (UBUNTU, RED HAT…)
- MAC
RISORSE HARDWARE:
- NOTEBOOK, DESKTOP PC
WHOLE-EXOME SEQUENCING: BIOINFORMATICA
R. Piazza – Roma, 23/6/11
Mapping Quality
Read Coverage
Mutation ratio
Mutation Coverage
Read Quality
Control Pileup Cancer Pileup
Cancer vs. Control
Matching Algorithm
Filters
Output data Annotations: SIFT, UCSC
- SNP ?
- Contamination ?
- Artefact ?
- Is the SNP/Mut heterozygous?
Somatic model call
Somatic mutation P-value
LOH model call - Somatic
LOH P-value
LOH model call - SNP
LOH P-value
WHOLE-EXOME SEQUENCING: BIOINFORMATICA
C T ….ACTGAATTGCTGATTG….
G
A A A G G G
A A A A A A
G G G G T T
A A G G G G
T T T T T T
….ACTGAATTGCTGATTG….
A A
A A
T T T
T T T T
G G G G G
C C C C C C
T T T T T T
TUMORE
CONTROLLO
G G
CELLULE NEOPLASTICHE CELLULE SANE
R. Piazza – Roma, 23/6/11
PATIENT 1: IDH2 (Isocitrate dehydrogenase) R140Q
IDH2 – Control
IDH2 – Leukemia
aCML-Ph+001 Atypical CML – Pt 1
aCML-Ph+002 Atypical CML – Pt 2
aCML-Ph+003 Atypical CML – Pt 3
R. Piazza – Roma, 23/6/11
mRNA-seq – DRIVER FUSION TRANSCRIPTS
Bridge reads
Junction reads
R. Piazza – Roma, 23/6/11
Tyr Kinase Domain
Exon 7 (Bcr)
Exon 8 (Bcr)
Exon 9 (Bcr)
Exon 10 (Bcr)
Exon 11 (Bcr)
Exon 12 (Bcr)
Exon 13 (b2)(Bcr)
Exon 14 (b3)(Bcr)
Exon 6 (Bcr)
Exon 5 (Bcr)
Exon 4 (Bcr)
Exon 3 (Bcr)
Exon 2 (Bcr)
Exon 1 (Bcr)
Exon 2 (Abl)
Exon 3 (Abl)
Exon 4
Exon 5
Exon 6
Exon 7
Exon 8
Exon 9
Exon 10 Exon 11
Ex4 Ex3 Ex2 Ex14 Ex13 Ex12
2 1 3
BCR ABL
SAMBUILDER
ARTIFICIAL SAM
RANDOM PAIRED
END READS
4
AML1-ETO t(8;21)
BCR-ABL1 p190 t(9;22)
BCR-ABL1 p210 (e13a2) t(9;22)
BCR-ABL1 p210 (e14a2) t(9;22)
CBFB-MYH11 inv(16)
CEP110-FGFR1 t(8;9)
EWSR1-ERG t(21;22)
MLL-MLLT1 t(11;19)
MLL-MLLT3 t(9;11)
MLLT10-PICALM t(10;11)
NCOA4-RET inv(10)
NPM-ALK t(2;5)
NUP98-HOXD13 t(2;11)
PLZF-RARa t(11;17)
PML-RARa t(15;17)
SRSF3-BCL6 t(3;6)
TCF3-PBX1 t(1;19)
TEL-AML1 t(12;21)
TEL-JAK2 t(9;12)
TEL-NTRK3 t(12;15)
TRIP11-PDGFRb t(5;14)
R. Piazza – Roma, 23/6/11
AML1-ETO t(8;21) BCR-ABL1 p190 t(9;22) BCR-ABL1 p210
e13a2 t(9;22)
BCR-ABL1 p210
e14a2 t(9;22)
CBFB-MYH11 inv(16) CEP110-FGFR1 t(8;9) EWSR1-ERG t(21;22) MLL-MLLT1 t(11;19)
MLL-MLLT3 t(9;11) MLLT10-PICALM t(10;11) NCOA4-RET inv(10) NPM-ALK t(2;5)
R. Piazza – Roma, 23/6/11
NUP98-HOXD13 t(2;11) PLZF-RARa t(11;17) PML-RARa t(15;17) SRSF3-BCL6 t(3;6)
TCF3-PBX1 t(1;19) TEL-AML1 t(12;21) TEL-JAK2 t(9;12) TEL-NTRK3 t(12;15)
TRIP11-PDGFRb t(5;14)
R. Piazza – Roma, 23/6/11
R. Piazza – Roma, 23/6/11
‘BRIDGE’ EVENTS
ANNOTAZIONE ‘STRAND’
ANNOTAZIONE ‘JUNCTION’
ANNOTAZIONE ‘FRAME’
ANNOTAZIONE ‘RECIPROCAL’
BCR/ABL1 ARPC4/TTLL3
READTHROUGH FUSION ?
R. Piazza – Roma, 23/6/11
RIASSUMENDO…
Le tecnologie di sequenziamento whole-exome e
trascrittomico sono ormai mature e pienamente
utilizzabili
Per qualunque tipo di approfondimento in relazione ai
temi trattati, ci trovate presso l’università di Milano-
Bicocca! (rocco.piazza [at] unimib.it)
- Alessandra Pirola
- Roberta Spinelli
- Simona Valletta
- Carlo Gambacorti
L’uso di queste tecnologie e lo sviluppo di strumenti
bioinformatici ‘user-friendly’ consentono oggi anche a
team privi di informatici/programmatori di realizzare
progetti di sequenziamento complessi
R. Piazza – Roma, 23/6/11