une approche par patchs, multi-atlas, itérative pour la ...€¦ · une approche par patchs,...

8
Une approche par patchs, multi-atlas, itérative pour la segmentation du cortex cérébral en IRM néonatale Carlos Tor-Díez 1 Nicolas Passat 2 Isabelle Bloch 3 Sylvain Faisan 4 Nathalie Bednarek 2,5 François Rousseau 1 1 IMT Atlantique, LaTIM U1101 INSERM, UBL, Brest, France 2 Université de Reims Champagne-Ardenne, CReSTIC, Reims, France 3 LTCI, Télécom ParisTech, Université Paris-Saclay, Paris, France 4 ICube UMR 7357, Université de Strasbourg, CNRS, FMTS, Illkirch, France 5 Service de médecine néonatale et réanimation pédiatrique, CHU de Reims, France [email protected] Résumé L’analyse des structures cérébrales chez le nouveau-né constitue un enjeu de santé majeur, notamment en cas de prématurité, afin de disposer d’informations prédictives sur le développement de l’enfant. Le cortex est, en particulier, une structure d’intérêt, observable en IRM (imagerie par résonance magnétique). Les données IRM néonatales pré- sentent toutefois des spécificités qui les rendent complexes à traiter. Dans ce contexte, les approches multi-atlas consti- tuent une stratégie efficace, tirant parti de données traitées préalablement. La méthode proposée dans cet article re- pose sur une telle stratégie multi-atlas. Elle s’appuie no- tamment sur deux paradigmes : l’utilisation d’un modèle non local par patchs, et l’utilisation d’un schéma d’optimi- sation itératif. L’usage couplé de ces deux concepts permet notamment de considérer des patchs liés à l’image ainsi qu’à sa segmentation courante. Cette stratégie, comparée à de précédentes méthodes multi-atlas de la littérature, abou- tit à des résultats de segmentation corticale robustes. Mots-Clefs Segmentation, IRM cérébrale néonatale, cortex, multi- atlas, approches par patchs, optimisation, schéma itératif. Abstract Brain structure analysis in the new-born is a major health issue. This is especially the case for premature neonates, in order to obtain predictive information related to the child development. In particular, the cortex is a structure of in- terest, that can be observed in MRI (magnetic resonance imaging). However, neonatal MRI data present specific properties that make them challenging to process. In this context, multi-atlas approaches constitute an efficient stra- tegy, taking advantage of images processed beforehand. The method proposed in this article relies on such multi- atlas strategy. More precisely, it uses two paradigms: first, a non-local model based on patches; second, an iterative optimization scheme. Coupling both concepts allows us to consider patches related not only to the image information, but also to the current segmentation. This strategy is com- pared to other multi-atlas methods proposed in the litera- ture. It provides robust cortex segmentation results. Keywords Segmentation, neonatal brain MRI, cortex, multi-atlas, patch-based approaches, optimization, iterative schemes. 1 Introduction Au cours des dernières décennies, les progrès réalisés en imagerie médicale, et plus précisément en imagerie par ré- sonance magnétique (IRM), ont permis une démocratisa- tion de ses usages en routine clinique. Parallèlement, les méthodes de traitement et d’analyse des images obtenues en IRM ont permis d’accroître le potentiel informatif de ces données, notamment en ce qui concerne l’étude des struc- tures cérébrales [1]. Toutefois, la majorité des efforts investis dans le dévelop- pement de méthodes d’analyse d’images, en particulier en segmentation, s’est focalisée sur des images IRM céré- brales de sujets adultes. Depuis une dizaine d’années, les données IRM acquises sur des enfants et nouveaux-nés font néanmoins l’objet d’un intérêt croissant. Cet intérêt est no- tamment motivé par l’étude des mécanismes de développe- ment cérébral chez l’Homme. Il a ainsi donné lieu à l’essor de domaines spécifiques en analyse d’images cérébrales, d’une part in utero, d’autre part chez le nouveau-né et plus spécifiquement chez le prématuré [2, 3]. En effet, les méthodes et outils de segmentation céré- brale « classiques », valides pour les images IRM adultes, ne sont généralement pas adaptés au cas des images de nouveaux-nés, a fortiori prématurés. À des problématiques liées à la difficulté d’acquérir des images 3D dans de

Upload: others

Post on 28-Jun-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Une approche par patchs, multi-atlas, itérative pour la ...€¦ · Une approche par patchs, multi-atlas, itérative pour la segmentation du cortex cérébral en IRM néonatale Carlos

Une approche par patchs, multi-atlas, itérative pour la segmentation du cortexcérébral en IRM néonatale

Carlos Tor-Díez1 Nicolas Passat2 Isabelle Bloch3

Sylvain Faisan4 Nathalie Bednarek2,5 François Rousseau1

1 IMT Atlantique, LaTIM U1101 INSERM, UBL, Brest, France2 Université de Reims Champagne-Ardenne, CReSTIC, Reims, France

3 LTCI, Télécom ParisTech, Université Paris-Saclay, Paris, France4 ICube UMR 7357, Université de Strasbourg, CNRS, FMTS, Illkirch, France

5 Service de médecine néonatale et réanimation pédiatrique, CHU de Reims, France

[email protected]

RésuméL’analyse des structures cérébrales chez le nouveau-néconstitue un enjeu de santé majeur, notamment en cas deprématurité, afin de disposer d’informations prédictives surle développement de l’enfant. Le cortex est, en particulier,une structure d’intérêt, observable en IRM (imagerie parrésonance magnétique). Les données IRM néonatales pré-sentent toutefois des spécificités qui les rendent complexesà traiter. Dans ce contexte, les approches multi-atlas consti-tuent une stratégie efficace, tirant parti de données traitéespréalablement. La méthode proposée dans cet article re-pose sur une telle stratégie multi-atlas. Elle s’appuie no-tamment sur deux paradigmes : l’utilisation d’un modèlenon local par patchs, et l’utilisation d’un schéma d’optimi-sation itératif. L’usage couplé de ces deux concepts permetnotamment de considérer des patchs liés à l’image ainsiqu’à sa segmentation courante. Cette stratégie, comparée àde précédentes méthodes multi-atlas de la littérature, abou-tit à des résultats de segmentation corticale robustes.

Mots-ClefsSegmentation, IRM cérébrale néonatale, cortex, multi-atlas, approches par patchs, optimisation, schéma itératif.

AbstractBrain structure analysis in the new-born is a major healthissue. This is especially the case for premature neonates, inorder to obtain predictive information related to the childdevelopment. In particular, the cortex is a structure of in-terest, that can be observed in MRI (magnetic resonanceimaging). However, neonatal MRI data present specificproperties that make them challenging to process. In thiscontext, multi-atlas approaches constitute an efficient stra-tegy, taking advantage of images processed beforehand.The method proposed in this article relies on such multi-atlas strategy. More precisely, it uses two paradigms: first,

a non-local model based on patches; second, an iterativeoptimization scheme. Coupling both concepts allows us toconsider patches related not only to the image information,but also to the current segmentation. This strategy is com-pared to other multi-atlas methods proposed in the litera-ture. It provides robust cortex segmentation results.

KeywordsSegmentation, neonatal brain MRI, cortex, multi-atlas,patch-based approaches, optimization, iterative schemes.

1 IntroductionAu cours des dernières décennies, les progrès réalisés enimagerie médicale, et plus précisément en imagerie par ré-sonance magnétique (IRM), ont permis une démocratisa-tion de ses usages en routine clinique. Parallèlement, lesméthodes de traitement et d’analyse des images obtenuesen IRM ont permis d’accroître le potentiel informatif de cesdonnées, notamment en ce qui concerne l’étude des struc-tures cérébrales [1].Toutefois, la majorité des efforts investis dans le dévelop-pement de méthodes d’analyse d’images, en particulier ensegmentation, s’est focalisée sur des images IRM céré-brales de sujets adultes. Depuis une dizaine d’années, lesdonnées IRM acquises sur des enfants et nouveaux-nés fontnéanmoins l’objet d’un intérêt croissant. Cet intérêt est no-tamment motivé par l’étude des mécanismes de développe-ment cérébral chez l’Homme. Il a ainsi donné lieu à l’essorde domaines spécifiques en analyse d’images cérébrales,d’une part in utero, d’autre part chez le nouveau-né et plusspécifiquement chez le prématuré [2, 3].En effet, les méthodes et outils de segmentation céré-brale « classiques », valides pour les images IRM adultes,ne sont généralement pas adaptés au cas des images denouveaux-nés, a fortiori prématurés. À des problématiquesliées à la difficulté d’acquérir des images 3D dans de

Page 2: Une approche par patchs, multi-atlas, itérative pour la ...€¦ · Une approche par patchs, multi-atlas, itérative pour la segmentation du cortex cérébral en IRM néonatale Carlos

bonnes conditions (temps d’acquisition réduits, risquesde mouvements. . . ), s’ajoutent des difficultés d’interpré-tations liées à l’immaturité de certaines structures céré-brales (par exemple, myélinisation partielle de la substanceblanche menant à des inversions de contrastes) et, bien évi-demment, la taille réduite des structures d’intérêt.L’analyse des structures cérébrales chez le nouveau-né peuts’avérer déterminante. En effet, elles peuvent être utiliséescomme biomarqueurs de lésions quantitatives (un défautde croissance est susceptible d’être mis en lien avec destroubles cognitifs), pour l’évaluation des effets neuropro-tecteurs des essais thérapeutiques utilisés en néonatalogie(par exemple, neuroprotection par mélatonine), ou encorepour mettre en place une prise en charge rééducative per-sonnalisée pour stimuler la plasticité cérébrale. Parmi cesstructures, le cortex, qui se caractérise par une faible épais-seur, demeure difficile à segmenter dans les images IRMde nouveaux-nés, mais fait néanmoins partie des structuresd’intérêt crucial [4].Plusieurs méthodes ont récemment été proposées, afin depermettre la segmentation d’images cérébrales néonatalesen IRM. D’un point de vue technique, différentes ap-proches ont été explorées (morphologie mathématique [5,6], modèles déformables [7, 8], classification [9, 10]). Au-delà des techniques de traitement d’images mises en jeu,l’utilisation d’approches dites multi-atlas [11, 12, 13, 14]a démontré une bonne capacité à tirer parti du maximumd’information disponible à partir de bases de cas, dans uncontexte où les connaissances a priori permettent de com-penser la faible qualité et la complexité des données ac-quises.La méthode présentée dans cet article se positionne dansla veine des approches multi-atlas. Notre objectif est icide segmenter le cortex à partir de données IRM 3D chezdes nouveaux-nés, en considérant non seulement des in-formations a priori d’apparence (une intensité donnée estassociée à une sémantique donnée) mais également des in-formations a priori spatiales. Toutefois, la mise en corres-pondance point-à-point classiquement utilisée dans les ap-proches multi-atlas, couplée aux incertitudes induites parla phase de recalage entre les données, tend à rendre lesinformations a priori spatiales peu robustes.Une solution à ce problème consiste à utiliser la notionde patchs, introduite initialement pour le filtrage non-locald’images [15]. Cette notion permet de prendre en comptenon seulement la valeur en un point, mais également leprofil des valeurs dans son voisinage, afin de le compareraux points ou voisinages dans les autres images. Cette stra-tégie, qui permet notamment de compenser d’inévitableserreurs et approximations de recalage, a été utilisée dans[16, 17, 18, 19] pour la segmentation cérébrale.Dans cet article, nous proposons une nouvelle manièred’utiliser une approche par patchs pour réaliser la segmen-tation multi-atlas du cortex en IRM 3D. Ainsi, nous pro-posons d’utiliser conjointement : (1) un modèle non localà base de patchs, et (2) un schéma d’optimisation itératif.

L’usage couplé de ces deux concepts permet non seule-ment de considérer des patchs liés à l’image (comme c’estclassiquement le cas) mais aussi liés à une estimation desa segmentation courante. Ces deux types d’informationss’apparentent ainsi respectivement à l’usage d’une attacheaux données et d’une régularisation. Cette dernière assurela définition d’un comportement homogène de la structuresegmentée au regard de sa géométrie, et le raffinement pro-gressif du résultat au fil des itérations.L’article s’organise comme suit. En section 2 les principesgénéraux de la segmentation multi-atlas sont rappelés. Lasection 3 passe en revue les principales méthodes de cettefamille mises en jeu pour la segmentation corticale. Notreméthode est présentée en section 4. Une étude comparativedes différentes méthodes est présentée en section 5. Unediscussion, proposée en section 6, conclut l’article.

2 Segmentation multi-atlasPar opposition à une méthode de segmentation par atlas,qui utilise un atlas probabiliste unique obtenu à partir den images, une méthode de segmentation multi-atlas uti-lise n exemples de segmentations, chacun obtenu à partird’une image, afin de guider le processus de segmentationde l’image donnée en entrée.

2.1 Approche généraleLes n images-exemples sont généralement choisies commesimilaires (modalité, résolution, objet observé. . . ) àl’image d’entrée. En règle générale, la segmentation del’image courante est alors définie comme une combinai-son linéaire des informations de segmentation issues des nimages-exemples.L’ensemble E des exemples est défini comme :

E = Ei = (Ii, Si), i = 1...n (1)

où chaque exemple Ei est composé d’une image Ii et de sasegmentation associée Si. Dans notre cas, Ii est une imageIRM 3D (à niveaux de gris) représentant les structures céré-brales d’un nouveau-né, tandis que Si est la segmentationassociée qui, à chaque point y de Ii, associe dans Si unevaleur de [0, 1] indiquant le degré d’appartenance de y à lastructure d’intérêt choisie (ici, le cortex).Soit I l’image d’entrée et S la segmentation que l’on sou-haite calculer à partir de I , grâce aux exemples de E . Lasegmentation S n’est alors pas simplement définie commeune fonction f(I), mais plus généralement comme :

S = f(I, E1, . . . , En) (2)

En d’autres termes, S dépend non seulement de l’informa-tion intrinsèquement liée à l’image I , mais aussi de la ma-nière dont les images Ii ont elles-mêmes été segmentéesdans le même but.Cette fonction f est souvent définie comme un opérateurlinéaire. Plus précisément, la segmentation S de I est es-timée, en chacun de ses points x comme une combinaison

Page 3: Une approche par patchs, multi-atlas, itérative pour la ...€¦ · Une approche par patchs, multi-atlas, itérative pour la segmentation du cortex cérébral en IRM néonatale Carlos

linéaire des informations en différents points y dans toutesles autres images, où les points y et les poids wi(x, y) sontdéfinis en fonction de la “similarité” entre x dans I et ydans Ii. La manière la plus intuitive de définir un tel facteurconsiste à le considérer comme inversement proportionnelà une distance entre x et y. Par exemple, une telle distancepeut être définie relativement à l’information d’intensité enx et y dans leurs images respectives, c’est-à-dire :

wi(x, y) = g(‖I(x)− Ii(y)‖) (3)

où g est une fonction de la distance entre I(x) et Ii(y). Lasegmentation S de I en x peut ainsi être définie comme unecombinaison linéaire (normalisée) f des segmentations Siissues des n exemples de E , soit :

S(x) = f(I, E1, . . . , En)(x)

=

n∑i=1

∑y

wi(x, y)Si(y) (4)

Néanmoins, une mesure de similarité sans prise en compted’un contexte spatial, présente une faible robustesse, no-tamment par rapport au bruit et aux erreurs de recalage.Plutôt que de considérer le pixel ou voxel comme unité decomparaison, certaines méthodes de segmentation multi-atlas considèrent une notion de patch, c’est-à-dire une ré-gion dans le voisinage de chaque point d’intérêt x. La simi-larité relative à x dans les images Ii peut alors être consi-dérée au regard d’un contexte plus riche.

2.2 Approches par patchsDans le cadre d’une segmentation multi-atlas, l’utilisationdes patchs comme unités de comparaison nous amène àdéfinir une distance entre x dans I et y dans Ii qui est nonplus seulement liée aux valeurs de I(x) et Ii(y), mais plusgénéralement à l’ensemble des valeurs de I et Ii dans desvoisinages P (x) et P (y), respectivement.De tels patchs sont souvent définis comme des volumes iso-tropes P (.) (carrés ou cubes de côté 2k+ 1) centrés sur lespoints d’intérêt. Dans ce cadre, les poidswi(x, y) (cf. équa-tion (3)) dépendent de l’ensemble des informations portéespar les sous-images restreintes aux supports des patchs :

wi(x, y) = g(‖PI(x)− PIi(y))‖) (5)

En d’autres termes, la distance considérée pour le calculde wi(x, y) met en jeu l’ensemble des distances point-à-point, telles que définies par l’équation (3), sur l’ensembledes deux patchs PI(x) dans I et PIi(y) dans Ii.Un tel calcul peut être coûteux en fonction de la taille despatchs P (.) et de leur nombre. Afin de limiter cet effet, ilest généralement choisi de restreindre l’espace des patchsconsidérés pour un point x de I aux points y situés dans unvoisinageN (x) de x dans Ii (en considérant, évidemment,qu’une mise correspondance spatiale a préalablement étéétablie entre I et les images Ii de E , par exemple par re-calage). Sous ces hypothèses, la segmentation S de I se

traduit désormais comme :

S(x) =

n∑i=1

∑y∈N (x)

wi(x, y)Si(y) (6)

Dans la prochaine section, le calcul de ces poids wi(x, y)est spécifié pour différentes méthodes de segmentationmulti-atlas présentées dans la littérature.

3 Segmentation multi-atlas : état del’art

Suivant le même schéma que dans l’article d’état del’art [14], les méthodes multi-atlas comportent trois étapesprincipales : (1) recalage, (2) propagation des segmenta-tions et (3) fusion des segmentations.Dans ce qui suit, nous nous attachons à décrire l’étape (3)pour les principales méthodes de la littérature. En parti-culier, partant du principe que la fusion de segmentationsest réalisée suivant l’équation (6) (en considérant un coeffi-cient de normalisation visant à rendre la somme de tous lespoids égale à 1 en chaque point x), la discussion porte prin-cipalement sur la manière de calculer les poids wi(x, y).

3.1 Moyennes non-localesDans l’article fondateur [15] sur les moyennes non-locales(Non-Local Means, NLM), les poids considérés sont cal-culés suivant une hypothèse gaussienne, à des fins de dé-bruitage. Ce type de poids, nommés wNLM dans la suitede l’article, correspond à une fonction de similarité inver-sement proportionnelle, suivant une loi normale, à la dis-tance d’intensité point-à-point entre les patchs considérés :

wNLMi(x, y) = exp−‖PI(x)− PIi(y))‖2

h2(7)

avec h une constante de régularisation pouvant être auto-matiquement ajustée [20] comme h2 = 2σ2βp où p estla taille des patchs, avec en général β = 1, tandis que σcorrespond à l’écart-type du bruit gaussien présent dans lesimages. Par construction, on a wNLMi(x, y) ∈ ]0, 1].

3.2 Fusion d’étiquettes jointesLa méthode de fusion d’étiquettes jointes (Joint Label Fu-sion) [18], tout comme l’approche NLM présentée précé-demment, utilise des patchs. Toutefois, il s’agit ici d’unalgorithme spécifiquement dédié à la segmentation multi-atlas.En particulier, contrairement à l’approche NLM, seul unpatch est sélectionné dans la zone de recherche N (x), afinde déterminer la contribution d’une image Ii à la segmenta-tion de I en x. En d’autres termes, l’équation (6) se réécritcomme :

S(x) =

n∑i=1

wi(x)Si(yi) (8)

où, pour chaque image Ii, yi est l’unique point choisi dansN (x) au regard de la similarité entre les patchs PI(x) et

Page 4: Une approche par patchs, multi-atlas, itérative pour la ...€¦ · Une approche par patchs, multi-atlas, itérative pour la segmentation du cortex cérébral en IRM néonatale Carlos

PIi(yi). En d’autres termes, on a :

yi = arg miny∈N (x)

‖PI(x)− PIi(y)‖ (9)

Une seule pondération wi est donc à calculer pour chaqueimage Ii. Néanmoins, elle est définie comme spatiale-ment variante. En particulier, en x, l’ensemble w(x) =wi(x), i = 1...n est calculé comme le minimiseur sui-vant :

w(x) = arg minw(x)∈W

w(x)tMxw(x) (10)

où W est l’ensemble des vecteurs (wi)ni=1 ∈ [0, 1]n tels

que∑ni=1 wi = 1 et Mx est la matrice de corrélation entre

les probabilités d’erreur de segmentation induites par les nimages Ii de E (cf. [18, équations (6–12)]).

3.3 Optimisation de pondération linéaireAfin de calculer la segmentation S de I , la détermina-tion des poids wi(x, y) dans l’équation (6) peut égalementêtre envisagée comme un problème d’optimisation entre lepatch de l’image cible I au point x et une combinaison li-néaire des patchs sur l’image Ii dans le voisinage N (x).

Optimisation de l’image intensité. Ce problème d’opti-misation s’exprime naturellement dans l’espace image. Onpeut ainsi définir une fonction d’énergie :

φI(x) =∥∥∥PI(x)−

n∑i=1

∑y∈N (x)

wi(x, y)PIi(y)∥∥∥ (11)

qui définit la distance entre le patch PI(x) estimé dansl’image I au voisinage de x, et la combinaison linéaire despatchs PIi(y) dans Ii pour tous les y de N (x).La minimisation de φI(x) permet d’accéder aux poidsw(x) = wi(x, y) | y ∈ N (x), i = 1...n :

w(x) = arg minw∈W

φI(x) (12)

oùW est l’ensemble des vecteurs normalisés à valeurs dans[0, 1].Cette approche est notamment inspirée de l’algorithmeLLE (Locally Linear Embedding) [21], initialement conçuà des fins de réduction de dimension.

Optimisation de la segmentation. Il est à noter que lastratégie précédente peut également être considérée dansl’espace des segmentations. Il convient alors de remplacer,dans la définition de φI(x) (équation (11)), les patchs PIet PIi sur les images I et Ii par les patchs PS et PSi sur lessegmentations S et Si associées à ces images.Le même schéma d’optimisation (équation (12)) peut alorss’appliquer pour déterminer les poids w(x) = wi(x, y) |y ∈ N (x), i = 1...n.Cette formulation requiert une connaissance de la segmen-tation S de l’image cible I . Elle a donc, en premier lieu, unintérêt rétrospectif pour la comparaison de résultats. Néan-moins, comme il sera discuté ci-après, elle peut égalementêtre utile dans le cadre d’un schéma itératif d’optimisation.

4 Optimisation itérativeL’approche que nous proposons est dédiée à la segmenta-tion multi-atlas par patchs. Elle s’appuie essentiellementsur le schéma d’optimisation présenté en section 3.3. Lesdeux grands principes qui la régissent sont les suivants.D’une part, le schéma d’optimisation proposé est ici itéra-tif. En particulier, les poids wi(x, y) calculés vont pouvoirévoluer afin de converger progressivement vers une solu-tion satisfaisante. D’autre part, contrairement à la formu-lation proposée dans les équations (11–12), l’optimisationne s’appuie plus simplement sur une attache aux données,mais également sur la segmentation courante. En d’autrestermes, l’évolution des poids wi(x, y) va être guidée pardeux types d’information : la proximité entre patchs dansl’espace image et leur proximité dans l’espace des segmen-tations.

4.1 Patchs mixtesEn particulier, nous proposons de définir des patchs mixtesPE? à partir des couples “image-segmentation” E? =(I?, S?).Toutes les images I? considérées (I et les Ii) sont défi-nies sur un même support Ω (elles sont en effet préalable-ment recalées), et prennent leurs valeurs dans un intervalleV ⊂ R. Les segmentations associées, S?, sont définies surle même support Ω, mais prennent leurs valeurs dans [0, 1].Sans perte de généralité, on considère que V est norma-lisé. Sous ces conditions, tant les I? que les S? s’exprimentcomme des fonctions Ω→ [0, 1] (bien qu’avec des séman-tiques distinctes). Cette normalisation s’avère importantepour la définition d’une distance inter-patchs non biaisée.Concrètement, étant donné un couple image-segmentationE? = (I?, S?), l’espace des patchs associés à E? est unefonction :∣∣∣∣ PE? : Ω → [0, 1]p × [0, 1]p

x 7→ (PI?(x), PS?(x))(13)

où PI?(x) et PS?(x) sont les patchs classiques, respective-ment de l’image et de la segmentation, c’est-à-dire des vec-teurs de [0, 1]p indiquant les valeurs de I? et S? dans une fe-nêtreN (x) de Ω de taille p localement centrée sur x. (Dansun souci de concision, on considérera de manière équiva-lente PE?(x) comme un vecteur (pkE?(x))2pk=1 de [0, 1]2p

plutôt qu’un couple de vecteurs de taille p.)

4.2 Distance inter-patchs, fonction d’énergiePour définir la distance inter-patchs, les normes Lk (et no-tamment L1 et L2) peuvent être considérées :

‖PEα(x)− PEβ (x)‖1 =

2p∑k=1

∣∣pkEα(x)− pkEβ (x)∣∣ (14)

‖PEα(x)− PEβ (x)‖2 =( 2p∑k=1

(pkEα(x)− pkEβ (x)

)2) 12

(15)

Page 5: Une approche par patchs, multi-atlas, itérative pour la ...€¦ · Une approche par patchs, multi-atlas, itérative pour la segmentation du cortex cérébral en IRM néonatale Carlos

En particulier, il est possible de définir, de manière ana-logue à l’équation (11), une fonction d’énergie φE qui,étant donné un couple image-segmentation E = (I, S) etun ensemble multi-atlas E = Ei = (Ii, Si), i = 1...n,traduit la distance entre E et une combinaison linéaire surE en un point x de Ω :

φE(x) =∥∥∥PE(x)−

n∑i=1

∑y∈N (x)

wi(x, y)PEi(y)∥∥∥ (16)

L’objectif va alors consister à déterminer les poidswi(x, y)permettant de minimiser cette fonction.

4.3 Schéma d’optimisationTout comme dans l’équation (12), notre but est de mini-miser l’énergie φE(x), afin de déduire un vecteur de poidsoptimaux pour la segmentation S de I en x :

w(x) = arg minw∈W

φE(x) (17)

avec les mêmes notations qu’en section 3.3.En particulier, le même schéma d’optimisation peut êtreemployé. En revanche, la stratégie est désormais itérative,et cette optimisation est donc réalisée plusieurs fois, jus-qu’à atteindre la convergence. L’algorithme 1 résume laméthode, dont les étapes sont discutées ci-après.

Initialisation. La première itération du processus re-quiert la définition préalable d’un couple initial image-segmentation E(−1) = (I, S(−1)) associé à I . La segmen-tation initiale S(−1) peut être choisie de manière arbitraire.Cette initialisation est justifiée ci-après, dans la descriptiondu mécanisme de pondération.

Itération. À la j-ème étape du processus itératif, la fonc-tion d’énergie courante φ(j)E (x) est optimisée en considé-rant P (j−1)

E (x) = (PI(x), PS(j−1)(x)) afin de définir lespoids w(j)

i (x, y) (cf. équations (16–17)) :

w(j)(x) = arg minw∈W

∥∥∥P (j−1)E (x) (18)

−n∑i=1

∑y∈N (x)

wi(x, y)PEi(y)∥∥∥

puis de calculer S(j) à partir des poids w(j)i (x, y) de

w(j)(x) :

S(j)(x) =

n∑i=1

∑y∈N (x)

w(j)i (x, y)Si(y) (19)

Pondération. Nous proposons de pondérer l’importancedes termes liés à l’intensité et à la segmentation estiméeau cours du processus itératif de segmentation. L’idée estici de relâcher petit à petit l’hypothèse d’isométrie entrel’espace d’intensité et l’espace des segmentations.

Algorithme 1 Algorithme d’optimisation itérative

Entrée : I : image à segmenter ; E = Ei = (Ii, Si), i =1...n : multi-atlas ; ε : critère d’arrêt

Sortie : S : segmentation de I1: j ← 02: répéter3: pour tout x ∈ Ω faire4: Calculer w(j)(x) (éq. (18))5: Calculer S(j)(x) à partir de w(j)(x) (éq. (19))6: fin pour7: j ← j + 18: jusqu’à ‖S(j) − S(j−1)‖ < ε9: S ← S(j)

En particulier on considère, à chaque itération j, un para-mètre αj ∈ [0, 1] tel que les termes de PE? liés au patchPS? (resp. PI? ) sont pondérés par αj (resp. 1− αj).Concrètement, cette pondération peut être réalisée sans re-mettre en cause la formulation des équations (17–19). Ilsuffit que les poids αj interviennent dans la définition dePE? par application d’une fonction d’échelle sur l’espacedes valeurs. En d’autres termes, on se donne une fonction :

∣∣∣∣ Πα : [0, 1]p × [0, 1]p → Rp × Rp(PI? , PS?) 7→ ((1− α)PI? , αPS?)

(20)Il suffit alors de substituer Παj PE? à PE? dans leschéma d’optimisation ci-avant. Afin de garantir une évo-lution continue du processus, on choisit une suite de poids(αj) croissante en fonction de j. Lors de la première itéra-tion, α0 est égal à 0. Ainsi, l’initialisation de la segmenta-tion S(−1) peut être quelconque.

Terminaison. Le processus itératif se termine lorsqu’uncritère de convergence est atteint, c’est-à-dire lorsque

‖S(j) − S(j−1)‖ < ε (21)

pour une valeur de seuil donnée ε > 0.

5 ExpérimentationsDans cette section, nous expérimentons la méthode propo-sée sur des images IRM cérébrales néonatales 3D. L’objec-tif est de segmenter les structures corticales à partir de cesdonnées, en nous appuyant sur une base d’images de mêmenature déjà segmentées.

5.1 DonnéesLes images utilisées sont des IRM pondérées en T2 misesà disposition [22] dans le cadre du projet « DevelopingHuman Connectome » (dHCP) 1 [23], provenant du centreEvelina Neonatal Imaging, Londres.Les âges des sujets varient entre 37 et 44 semaines. Lesdonnées ont été acquises sur un imageur Achieva 3T, dédié

1. http://www.developingconnectome.org

Page 6: Une approche par patchs, multi-atlas, itérative pour la ...€¦ · Une approche par patchs, multi-atlas, itérative pour la segmentation du cortex cérébral en IRM néonatale Carlos

à des examens néonataux avec un temps d’acquisition d’en-viron 60 minutes. La taille des voxels est de 0, 5×0, 5×0, 5mm3. Les temps de répétition (TR) et d’écho (TE) sont res-pectivement de 12 000 et 156 ms.Un ensemble de 40 images est considéré. Parmi elles,30 sont employées afin de composer la base d’exemples(multi-atlas : Ii) tandis que 10 sont employées commeimages d’entrée (I). Pour chacune de ces 40 images, lasuite algorithmique dHCP 2 a été appliquée. Les segmen-tations obtenues, validées visuellement, constituent notreréférence. Pour les 30 images Ii, elles fournissent les seg-mentations Si ; pour les 10 images I , elles fournissent lasegmentation idéale attendue S.

5.2 Préparation des donnéesLes images exemples ont été recalées en deux étapes (reca-lage affine, puis non rigide) en utilisant ANTs 3 [24]. Afinde permettre aux méthodes par patchs de fonctionner demanière robuste, les intensités des images exemples (Ii)ont été normalisées par appariement d’histogramme parrapport à celles du sujet à segmenter (I) afin de s’abstrairedes effets de biais additifs sur les distances inter-patchs (cf.équations (14–15)).

5.3 Méthodes comparéesLa méthode proposée, décrite dans la section 4, et dénom-mée ITER, est comparée au méthodes suivantes :

— moyennes non-locales – NLM [15] (section 3.1) ;— fusion d’étiquettes jointes – JLF [18] (section 3.2) ;— optimisation sur I – OPT I [21] (section 3.3) ;— MANTIS [9].

Il est à noter que les trois premières méthodes sont, toutcomme ITER, des méthodes multi-atlas par patchs, alorsque MANTIS est une méthode non multi-atlas fondée surdes principes de classification. Cette dernière s’appuie surune adaptation de l’algorithme de segmentation unifiée(unified segmentation) [25], enrichie de phases de traite-ment morphologique et filtrage topologique.En complément de ces quatre méthodes de segmentation, laméthode d’optimisation sur S, notée OPT S (section 3.3),est également considérée. Il ne s’agit pas d’une méthodede segmentation, puisque ses résultats s’appuient sur uneconnaissance a priori de la segmentation S attendue. Enrevanche, elle fournit une borne supérieure sur la capacitéd’une approche multi-atlas par patchs à permettre l’obten-tion d’un résultat de segmentation par combinaison linéaired’exemples.

5.4 ParamètresLa méthode MANTIS présente peu de paramètres. Il s’agitde paramètres de régularisation pour la classification ini-tiale de la segmentation unifiée [25]. Les valeurs utiliséessont celles définies par défaut.

2. https://github.com/DevelopingHCP/structural-pipeline

3. http://stnava.github.io/ANTs

Les autres méthodes considérées utilisant des patchs, pré-sentent toutes des caractéristiques similaires. Elle partagenten particulier un certain nombre de paramètres. Ces para-mètres sont : K, le nombre de plus proches voisins parmiN (.) considérés pour le calcul des fonctions d’énergie φ(.)(cf. équation (11) et suivantes) ; les tailles p des patchsP (.) ; et la dimension des zones de recherche N (.).L’usage des K plus proches voisins parmi n.|N (x)| pourle calcul de φ(x) vise à réduire l’influence d’un trop grandnombre de patchs ayant une faible similarité avec le patchconsidéré en chaque point x ∈ Ω. Le paramètreK est fixé à15, à l’exception de la méthode JLF où, par définition,K =n (ici, 30). Dans JLF, un seul patch est extrait pour chaqueimage de la base d’apprentissage. En revanche, pour lesautres méthodes, les K plus proches voisins sont obtenusà partir de l’ensemble de patches des zones de recherchepour tous les exemples de la base. La valeur de p est 27, etcorrespond à des patchs de taille 3×3×3 voxels. Les zonesde rechercheN (.) sont des cubes des 7×7×7 voxels. Cesparamètres ont été choisis sur la base d’expérimentationspréliminaires.Quelques paramètres sont spécifiques à certaines mé-thodes. Dans la méthode JLF, les paramètres additionnelsont été fixés aux valeurs par défaut. Pour les méthodes quiutilisent une optimisation de type LLE, le paramètre de ré-gularisation pour l’inversion est fixé à 10−3. Pour la mé-thode ITER, la distance inter-patch repose sur la norme L2

(équation (15)). La critère d’arrêt ε est fixé à 10−6. Lesvaleurs du coefficient α de pondération suivent une loi li-néaire : αj = j/(N − 1) avec un nombre d’itérations Nfixé empiriquement à 4. Les K plus proches voisins sontrecalculés à chaque itération, ce qui permet de combinerdes exemples de plus en plus adaptés à l’estimation de lasegmentation suivant l’évolution de αj .

5.5 RésultatsLe tableau 1 synthétise les résultats des expériences effec-tuées. Ces résultats sont également illustrés par la figure 1.Deux mesures d’évaluation quantitative ont été considé-rées : l’indice de Dice et le Peak Signal to Noise Ratio(PSNR). L’indice de Dice est une mesure (entre 0 et 1)de recouvrement entre la segmentation estimée et la véritéterrain. Le PSNR fournit quant à lui une mesure de qualité(erreur quadratique moyenne) de l’image estimée.Les méthodes ITER, NLM, OPT I et OPT S fournissentdes résultats sous forme de cartes floues. Afin de pouvoircomparer ces résultats à ceux des méthodes JLF et MAN-TIS (qui fournissent des cartes binaires), un seuillage descartes floues à 0,5 a été effectué.

6 DiscussionD’un point de vue quantitatif, les résultats obtenus sontmeilleurs pour la méthode ITER que ceux des autres mé-thodes expérimentées. L’incrément est notable par rapportaux méthodes JLF et MANTIS ; il est moins élevé par rap-port aux méthodes NLM et OPT I.

Page 7: Une approche par patchs, multi-atlas, itérative pour la ...€¦ · Une approche par patchs, multi-atlas, itérative pour la segmentation du cortex cérébral en IRM néonatale Carlos

TABLE 1 – Performances de la méthode ITER, comparée à quatre autres méthodes de segmentation (NLM, JLF, OPT I,MANTIS) et à une mesure de référence (OPT S), sur la base de 10 sujets, avec une base d’apprentissage de 30 sujets.

NLM [15] JLF [18] OPT I [21] MANTIS [9] ITER OPT S

Moyenne Dice 0,876 0,845 0,873 0,793 0,882 0,987

Écart-type Dice 0,011 0,018 0,011 0,028 0,013 0,003Moyenne PSNR (dB) 20,758 18,966 20,671 16,661 20,837 26,330

Écart-type PSNR (dB) 0,396 0,487 0,411 0,533 0,430 0,482

FIGURE 1 – Première colonne : coupe axiale d’une IRM cérébrale pondérée en T2. Colonnes suivantes : résultats de segmen-tation obtenus (de gauche à droite) par les méthodes : NLM [15], JLF [18], MANTIS [9] et ITER.

Si ces différences quantitatives sont faibles, l’observationdes résultats visuels permet de constater que la méthodeITER semble qualitativement plus satisfaisante. On ob-serve notamment que le cortex segmenté présente un bordplus régulier, et que des artefacts topologiques (petitescomposantes déconnectées) présents avec les méthodesNLM, JLF et MANTIS ne sont pas induits par ITER.Ces résultats sont néanmoins préliminaires. Ils portent surun ensemble réduit de données, dont la qualité en termes decontraste et de rapport signal à bruit est bonne. Au demeu-rant, l’espace des paramètres de la méthode ITER n’a pasencore été complètement exploré (type de distance, nombrede plus proches voisins, politique de pondération. . . ).Les prochains travaux viseront à évaluer la robustessed’ITER dans des contextes plus difficiles. Des basesd’images cliniques, de moins bonne qualité et munies desegmentation imparfaites, seront considérées. Notre hypo-thèse est que l’usage combiné des images et des segmenta-tions devrait permettre d’atteindre un degré de robustesseplus élevé qu’avec les autres méthodes de la littérature.

FinancementCes travaux ont été financés par l’Agence Nationalede la Recherche (projet MAIA, « Multiphysics image-based analysis for premature brain development unders-tanding », http://recherche.imt-atlantique.

fr/maia), référence ANR-15-CE23-0009. Ces travauxont également bénéficié d’un soutien financier de l’Ame-rican Memorial Hospital Foundation.

Références[1] F. Rousseau and N. Passat, “Analyse et traitement

d’images anatomiques en IRM cérébrale,” Techniquesde l’Ingénieur, no. MED900, 2014.

[2] C. N. Devi, A. Chandrasekharan, V. K. Sundarara-man, and Z. C. Alex, “Neonatal brain MRI segmenta-tion: A review,” Computers in Biology and Medicine,vol. 64, pp. 163–178, 2015.

[3] A. Makropoulos, S. J. Counsell, and D. Rueckert, “Areview on automatic fetal and neonatal brain MRIsegmentation,” NeuroImage, In Press.

[4] H. Kim, C. Lepage, R. Maheshwary, S. Jeon, A. C.Evans, C. P. Hess, A. J. Barkovich, and D. Xu, “NEO-CIVET: Towards accurate morphometry of neonatalgyrification and clinical applications in preterm new-borns,” NeuroImage, vol. 138, pp. 28–42, 2016.

[5] L. Gui, R. Lisowski, T. Faundez, P. S. Hüppi, F. La-zeyras, and M. Kocher, “Morphology-driven automa-tic segmentation of MR images of the neonatal brain,”Medical Image Analysis, vol. 16, no. 8, pp. 1565–1579, 2012.

Page 8: Une approche par patchs, multi-atlas, itérative pour la ...€¦ · Une approche par patchs, multi-atlas, itérative pour la segmentation du cortex cérébral en IRM néonatale Carlos

[6] B. Morel, Y. Xu, A. Virzi, T. Géraud, C. Adamsbaum,and I. Bloch, “A challenging issue: Detection of whitematter hyperintensities in neonatal brain MRI,” inEMBC, Procs., pp. 93–96, 2016.

[7] F. Leroy, J.-F. Mangin, F. Rousseau, H. Gla-sel, L. Hertz-Pannier, J. Dubois, and G. Dehaene-Lambertz, “Atlas-free surface reconstruction of thecortical grey-white interface in infants,” PloS One,vol. 6, no. 11, p. e27128, 2011.

[8] A. Schuh, A. Makropoulos, R. Wright, E. C. Robin-son, N. Tusor, J. Steinweg, E. J. Hughes, L. Cordero-Grande, A. N. Price, J. Hutter, J. V. Hajnal, andD. Rueckert, “A deformable model for the reconstruc-tion of the neonatal cortex,” in ISBI, Procs., pp. 800–803, 2017.

[9] R. J. Beare, J. Chen, C. E. Kelly, D. Alexopoulos,C. D. Smyser, C. E. Rogers, W. Y. Loh, L. G. Mat-thews, J. L. Y. Cheong, A. J. Spittle, P. J. Ander-son, L. W. Doyle, T. E. Inder, M. L. Seal, and D. K.Thompson, “Neonatal brain tissue classification withmorphological adaptation and unified segmentation,”Frontiers in Neuroinformatics, vol. 10, p. 12, 2016.

[10] P. Moeskops, M. J. N. L. Benders, S. M. Chita, K. J.Kersbergen, F. Groenendaal, L. S. de Vries, M. A.Viergever, and I. Išgum, “Automatic segmentation ofMR brain images of preterm infants using supervisedclassification,” NeuroImage, vol. 118, pp. 628–641,2015.

[11] A. Makropoulos, I. S. Gousias, C. Ledig, P. Aljabar,A. Serag, J. V. Hajnal, A. D. Edwards, S. J. Coun-sell, and D. Rueckert, “Automatic whole brain MRIsegmentation of the developing neonatal brain,” IEEETransactions on Medical Imaging, vol. 33, no. 9,pp. 1818–1831, 2014.

[12] M. J. Cardoso, A. Melbourne, G. S. Kendall, M. Mo-dat, N. J. Robertson, N. Marlow, and S. Ourselin,“AdaPT: An adaptive preterm segmentation algo-rithm for neonatal brain MRI,” NeuroImage, vol. 65,pp. 97–108, 2013.

[13] N. I. Weisenfeld and S. K. Warfield, “Automaticsegmentation of newborn brain MRI,” NeuroImage,vol. 47, no. 2, pp. 564–572, 2009.

[14] J. E. Iglesias and M. R. Sabuncu, “Multi-atlas seg-mentation of biomedical images: A survey,” MedicalImage Analysis, vol. 24, no. 1, pp. 205–219, 2015.

[15] A. Buades, B. Coll, and J. Morel, “A review of imagedenoising algorithms, with a new one,” MultiscaleModeling & Simulation, vol. 4, no. 2, pp. 490–530,2005.

[16] M. Liu, A. Kitsch, S. Miller, V. Chau, K. Poskitt,F. Rousseau, D. Shaw, and C. Studholme, “Patch-based augmentation of Expectation-Maximization forbrain MRI tissue segmentation at arbitrary age afterpremature birth,” NeuroImage, vol. 127, pp. 387–408,2016.

[17] F. Rousseau, P. A. Habas, and C. Studholme, “Asupervised patch-based approach for human brainlabeling,” IEEE Transactions on Medical Imaging,vol. 30, no. 10, pp. 1852–1862, 2011.

[18] H. Wang, J. W. Suh, S. R. Das, J. B. Pluta, C. Craige,and P. A. Yushkevich, “Multi-atlas segmentation withjoint label fusion,” IEEE Transactions on PatternAnalysis and Machine Intelligence, vol. 35, no. 3,pp. 611–623, 2013.

[19] P. Coupé, J. V. Manjón, V. Fonov, J. Pruessner,M. Robles, and D. L. Collins, “Patch-based seg-mentation using expert priors: Application to hip-pocampus and ventricle segmentation,” NeuroImage,vol. 54, no. 2, pp. 940–954, 2011.

[20] P. Coupé, P. Yger, S. Prima, P. Hellier, C. Kervrann,and C. Barillot, “An optimized blockwise nonlocalmeans denoising filter for 3-D magnetic resonanceimages,” IEEE Transactions on Medical Imaging,vol. 27, no. 4, pp. 425–441, 2008.

[21] S. T. Roweis and L. K. Saul, “Nonlinear dimensiona-lity reduction by locally linear embedding,” Science,vol. 290, no. 5500, pp. 2323–2326, 2000.

[22] E. Hughes, L. Cordero-Grande, M. Murgasova,J. Hutter, A. Price, A. Santos Gomes, J. Allsop,J. Steinweg, N. Tusor, J. Wurie, J. Bueno-Conde,J.-D. Tournier, M. Abaei, S. Counsell, M. Ruther-ford, M. Pietsch, D. Edwards, J. Hajnal, S. Fitzgib-bon, E. Duff, M. Bastiani, J. Andersson, S. Jbabdi,S. Sotiropoulos, M. Jenkinson, S. Smith, S. Harri-son, L. Griffanti, R. Wright, J. Bozek, C. Beckmann,A. Makropoulos, E. Robinson, A. Schuh, J. Passe-rat Palmbach, G. Lenz, F. Mortari, T. Tenev, andD. Rueckert, “The Developing Human Connectome:Announcing the first release of open access neonatalbrain imaging,” in OHBM, Procs., 2017.

[23] A. Makropoulos, E. C. Robinson, A. Schuh,R. Wright, S. Fitzgibbon, J. Bozek, S. J. Counsell,J. Steinweg, J. Passerat-Palmbach, G. Lenz, F. Mor-tari, T. Tenev, E. P. Duff, M. Bastiani, L. Cordero-Grande, E. Hughes, N. Tusor, J.-D. Tournier, J. Hut-ter, A. N. Price, M. Murgasova, C. Kelly, M. A. Ru-therford, S. M. Smith, A. D. Edwards, J. V. Hajnal,M. Jenkinson, and D. Rueckert, “The Developing Hu-man Connectome Project : a Minimal Processing Pi-peline for Neonatal Cortical Surface Reconstruction,”bioRxiv, p. 125526, Apr. 2017.

[24] B. B. Avants, C. L. Epstein, M. Grossman, and J. C.Gee, “Symmetric diffeomorphic image registrationwith cross-correlation : evaluating automated labe-ling of elderly and neurodegenerative brain,” MedicalImage Analysis, vol. 12, pp. 26–41, Feb. 2008.

[25] J. Ashburner and K. J. Friston, “Unified segmenta-tion,” NeuroImage, vol. 26, no. 3, pp. 839–851, 2005.