proprietes statistiques des copules de valeurs extremes bidimensionnelles

11
The Cunudiun Juurnul uf Srurisrics Vol. 26, No. 1, 1998, Pages 187-197 Lu Revue Cundienne de Sfutistique Proprietes statistiques des copules de valeurs extremes bidimensionnelles* Kilani GHOUDI, Abdelhaq KHOUDRAJI, et Louis-Paul RIVEST Universite du Quebec a Trois-Rivieres, Universite Cadi Ayyad, et Universite Lava1 Key words and phrases: Galambos's distribution, goodness of fit, Gumbel's depen- dence function, jackknife variance estimator, multivariate extreme-value distributions, simulation, U-statistic. AMS 1991 subject classifications: Primary 62H05; secondary 62E10. Soit (X, Y) un couple de variables aliatoires dont la fonction de ripartition H(x, y) est une loi de valeurs extremes bidimensionnelles. Si F1 et F2 sont les lois marginales de X et Y, on a H(x,y) = C { Fl(x), F2(y)), ou C est une copule de valeurs extremes bidimensionnelles. Dans un premier temps, on ditermine la distribution conjointe de Z = {log FI(X))/{log Fl(X)F2( Y)) et de W = C{ Fl(X),F2( Y )). Ce rtsultat a plusieurs applications intiressantes. I1 permet d'abord de construire un algorithme relativement simple pour simuler des lois de valeurs extremes bidimensionnelles. De plus, quelque soit la copule des valeurs extremes C, ce rtsultat montre tgalement que la loi marginale de W = C { F,(X),F2( Y )) appartient a une famille de distributions indicie par un paramhe. Cette observation permet de construire un test d'ajustement pour diterminer si une copule C appartient a la famille des copules de valeurs extremes. ABSTRACT Let (X, Y) be a bivariate random vector whose distribution function H(x,y) belongs to the class of bivariate extreme-value distributions. If F1 and F2 are the marginals of X and Y, then H(x,y) = C{Fl(x), F2(y)), where C is a bivariate extreme-value dependence function. This paper gives the joint distribution of the random variables Z = {log F,(~))/{log FI(X)F2(Y)) and W = C { FI(X), F2( Y )). Using this distribution, an algorithm to generate random variables having bivariate extreme-value distribution is presented. Furthermore, it is shown that for any bivariate extreme-value dependence function C, the distribution of the random variable W = C{Fl(X), F2(Y)) belongs to a monoparametric family of distributions. This property is used to derive goodness-of-fit statistics to determine whether a copula belongs to an extreme-value family. Dans plusieurs domaines d'applications de la statistique, cornrne par exemple en hydrologie ou en science de l'environnement, l'ttude des grandes valeurs d'un Cchantillon revet un inttret particulier. Ainsi, lors de la construction d'un barrage hydrotlectrique sur une rivikre, les valeurs maximales des crues printanikres des affluents de la rivitre sont des donntes t r b importantes qui interviennent dans la planification du barrage. Les *Le financement de ce travail de recherche a CtC assurt en partie par le Counseil de recherches en sciences naturelles et en g6nie du Canada, par le Fonds pour la formation de chercheurs et I'aide B la recherche du Gouvemement de Qutbec, ainsi que le Fonds institutionnel de la recherche de I'Universiti du QuCbec Trois-Rivitres.

Upload: independent

Post on 04-Feb-2023

0 views

Category:

Documents


0 download

TRANSCRIPT

The Cunudiun Juurnul uf Srurisrics Vol. 26, No. 1, 1998, Pages 187-197 Lu Revue Cundienne de Sfutistique

Proprietes statistiques des copules de valeurs extremes bidimensionnelles* Kilani GHOUDI, Abdelhaq KHOUDRAJI, et Louis-Paul RIVEST

Universite du Quebec a Trois-Rivieres, Universite Cadi Ayyad, et Universite Lava1

Key words and phrases: Galambos's distribution, goodness of fit, Gumbel's depen- dence function, jackknife variance estimator, multivariate extreme-value distributions, simulation, U-statistic.

AMS 1991 subject classifications: Primary 62H05; secondary 62E10.

Soit ( X , Y ) un couple de variables aliatoires dont la fonction de ripartition H(x , y ) est une loi de valeurs extremes bidimensionnelles. Si F1 et F2 sont les lois marginales de X et Y , on a H ( x , y ) = C { F l (x ) , F2 (y ) ) , ou C est une copule de valeurs extremes bidimensionnelles. Dans un premier temps, on ditermine la distribution conjointe de Z = {log F I ( X ) ) / { l o g Fl(X)F2( Y ) ) et de W =

C{ Fl(X) , F2( Y ) ) . Ce rtsultat a plusieurs applications intiressantes. I1 permet d'abord de construire un algorithme relativement simple pour simuler des lois de valeurs extremes bidimensionnelles. De plus, quelque soit la copule des valeurs extremes C , ce rtsultat montre tgalement que la loi marginale de W = C { F,(X) , F2( Y ) ) appartient a une famille de distributions indicie par un paramhe. Cette observation permet de construire un test d'ajustement pour diterminer si une copule C appartient a la famille des copules de valeurs extremes.

ABSTRACT

Let ( X , Y ) be a bivariate random vector whose distribution function H ( x , y ) belongs to the class of bivariate extreme-value distributions. If F1 and F2 are the marginals of X and Y , then H ( x , y ) = C { F l ( x ) , F 2 ( y ) ) , where C is a bivariate extreme-value dependence function. This paper gives the joint distribution of the random variables Z = {log F , ( ~ ) ) / { l o g F I ( X ) F 2 ( Y ) ) and W = C { F I ( X ) , F2( Y ) ) . Using this distribution, an algorithm to generate random variables having bivariate extreme-value distribution is presented. Furthermore, it is shown that for any bivariate extreme-value dependence function C , the distribution of the random variable W = C { F l ( X ) , F 2 ( Y ) ) belongs to a monoparametric family of distributions. This property is used to derive goodness-of-fit statistics to determine whether a copula belongs to an extreme-value family.

Dans plusieurs domaines d'applications de la statistique, cornrne par exemple en

hydrologie ou en science de l'environnement, l ' t tude des grandes valeurs d'un Cchantillon revet un inttret particulier. Ainsi, lors d e la construction d'un barrage hydrotlectrique sur une rivikre, les valeurs maximales des crues printanikres des affluents d e l a rivitre sont des donntes t r b importantes qui interviennent dans la planification du barrage. Les

*Le financement de ce travail de recherche a CtC assurt en partie par le Counseil de recherches en sciences naturelles et en g6nie du Canada, par le Fonds pour la formation de chercheurs et I'aide B la recherche du Gouvemement de Qutbec, ainsi que le Fonds institutionnel de la recherche de I'Universiti du QuCbec Trois-Rivitres.

188 GHOUDI, KHOUDRAJI ET RIVEST Vol. 26, No. 1

modkles statistiques pour les valeurs extremes sont des outils prtcieux pour comprendre le comportement des grandes valeurs d'un tchantillon.

La thtorie mathtmatique des modkles univarits pour les valeurs extremes est bien diveloppte (voir Galambos 1987). Les modeles multidimensionnels des valeurs extremes sont les distributions limites, lorsque la taille d'tchantillon tend vers l'infini, de la loi conjointe des maxima marginaux, convenablement normalists, dans un tchantillon de p variables alCatoires. Si Fl(xl), . . . , F,(x,) sont les lois marginales des valeurs extremes, que nous supposerons non digtntries, les distributions limites sont du type C{ FI (XI), F2(x2), . . . , Fp(x,)), ob C est une copule de valeurs extremes. Rap- pelons qu'une copule est une fonction de rtpartition dont les marges sont uniformes (Sklar 1959). Dans 1e cas bidimensionnel, Geoffroy (1958), Tiago de Olivera (1958) et Sibuya (1960) ont donnt la forme gtntrale des copules de valeurs extremes. Elles s'expriment cornme suit,

en terme d'une fonction convexe A dtfinie sur [O, 11, satisfaisant

Plusieurs familles paramttriques de modkles pour A ont C t t suggtrtes; voir, par exemple, Anderson et Nadarajah (1993). Tawn (1988) discute de l'estimation des paramktres des lois bidimensionnelles pour des valeurs extremes. Pickands (1981) a donnt la forme gtntrale des copules de valeurs extrzmes multidimensionnelles. Joe (1990, 1994) prtsente des familles paramttriques pour la loi conjointe de plus de deux valeurs extremes.

Soit (X, Y) un couple de variables altatoires dont la fonction de rtpartition est donnte par H(x, y) = C{ Fl(x), F Z ( ~ ) } , ob C est donnte par (1.1) pour une certaine fonction A. La section 2 donne la loi conjointe des variables altatoires

Z = log F 1 ( X ) et W = C{ Fl (X), F2( Y)} log FI (X)F2( Y)

Ce rtsultat est utilist 2 la section 3 pour construire un algorithme simple de simulation des lois de valeurs extremes bidimensionnelles. I1 permet ensuite d'tlaborer, 2 la section 4, un test d'ajustement pour les copules de valeurs extremes bidimensionnelles.

Tous les rtsultats obtenus dans ce travail sont indtpendants des marges. On peut donc supposer, sans perte de giniralitt, que les marges de X et de Y sont uniformes; i.e. Fl(x) = F2(x) = X, pour x E (0,l) . On a alors H(x,y) - C(x,y).

2. CALCUL DE LA LO1 CONJOINTE DE Z ET DE W

Dans cette section (X, Y) reprtsente un couple de variables altatoires distribut selon C(x,y); on tcrira (X, Y) C, ob C est donnt par (1.1) pour une certaine fonction A. Les dtmonstrations des deux propositions suivantes sont reltgutes en annexe.

PROPOSITION 1. Si (X, Y) C, alors la loi conjointe de X er de Z = (log X)/(log XY) est donnke par

et A'(z) de'note la de'rive'e ci droite de la fonction A au point z.

1998 COPULES DE VALEURS EXTREMES 189

Puisque A est une fonction convexe satisfaisant (1.2), la dtrivte B droite de A est dtfinie sur [O, 1) et satisfait -1 5 A1(z) 5 1. Par extension, on dtfinit A1(l) c o m e ttant le suprtmum, sur (0, l), de ~ ' ( 2 ) . En posant u = 1 dans le rtsultat prtctdent, on obtient la loi marginale de Z,

Ce rtsultat a t t t dtmontrt par Deheuvels (1991), dans le cas oh A admet une dtrivte seconde. Captraa, Fougkres et Genest (1997) utilisent (2.1) pour construire une estimation semi-paramttrique de A B partir d'un estimateur de G.

F'ROPOS~TION 2. Si (X, Y ) - C, alors la loi conjointe de Z = (log X)/(log XY) et de W = C(X, Y) est donne'e par:

Dans le cas de l'indtpendance, on a A(t) = 1 et donc, F(z, w) = z(w - w log w). Les variables altatoires Z et W sont alors indtpendantes; Z suit un loi uniforme sur (0,l) et W est distribute c o m e le produit de deux uniformes indtpendantes sur (0,l). Lorsque A admet une dtrivte seconde dans (0, l), F est absolument continue. Par contre, lorsque A' a des sauts, ceux-ci correspondent des singularitts dans la loi de Z. Par exemple, lorsque A(t) = max(t, 1 - t), Z prend la valeur avec probabilitt 1 et la loi de W est uniforrne sur (0, 1).

Pour une copule de valeurs extrEmes quelconque, la loi marginale de C(X, Y), s'obtient de (2.2) en posant z = 1. On a

p{c(X, Y) 5 W ) = K,(w) = w - (1 - z)w log w,

L'expression simple obtenue pour KT permet de calculer facilement le tau de Kendall, z(X, Y), une mesure de la dtpendance entre deux variables alkatoires qui ne dtpend pas des marges. On a

t(X, Y) = 4E C(X, Y) - 1 = T,

oh t est dtfini par (2.3). Cette forrnule permet de calculer le tau de Kendall d'une copule de valeurs extr&mes.

Considirons maintenant quelques exemples. Les f a i l l e s de fonctions de ripartition ttudites dans ce travail, de m&me que les fonctions A assocites sont donntes au tableau 1. Les fonctions de ripartition de Gumbel de type A et B sont rtpertorites par Johnson et Kotz (1972), voir aussi Hutchinson et Lai (1990). La famille de Galambos apparait dans Galambos (1975) alors que la farnille MO gtntralise une farnille introduite par Marshall et Olkin (1967); voir aussi Nelsen (1991). La distribution de Gumbel de type B et la distribution de Galambos sont parfois appeltes respectivement loi logistique et loi logistique ntgative (Tawn 1988). Le tau de Kendall, Cvalut B l'aide de (2.3), de meme

190 GHOUDI, KHOUDRAJI ET RIVEST Vol. 26, No. 1

TABLEAU 1: Quatre familles de lois de valeurs extrsmes

Famille A(t) Domaine C(X,Y)

Gumbel B {(I - tlr + t r } l l r r > l exp[-{(-log x)' + (-log y)'}llr]

log x log y Gumbel A 0t2 - Ot + I I 3 0 > 0 xy exP (kO log x +log y

Galambos 1 - {t-a + (I - t)-e}-'la 0 2 0

) xy exp[{(-log x ) - ~ + (-log y)-a}-'/e]

MO maxi1 - Ot, 1 - p(1 - t)} 1 > 8, fl 2 0 X ~ - ~ y I-p min(xe,yB)

TABLEAU 2: Tau de Kendall, fonction de ripartition Gz et sa densitt gz pour quatre familles de lois de valeurs e x t r h e s .

Famille t Gz(z) g z k )

Gumbel B zr-l(] - z)'-l

{z' + (1 - z ) ' } ~

8 a r c t a n { m l - 2 - z + 2 z - 1 2 - 0(2z2 - 2~ + I ) Gurnbel A - 1

V'@=3 0z2 - Hz + 1 (0z2 - Oz+

Galambos ~ ( 0 ) H~{me(z)} 0- zo+l m a ( ~ ) ~ h ~ { m e ( z ) ) (1

MO Fonction discontinue lndtfinie e + p - e p

a OD m,(z) = zr/{zr + (1 - z)'}.

que la fonction de ripartition marginale de Z et sa densit6 sont donnCs au tableau 2, pour les quatre familles du tableau 1.

Pour la famille de Gumbel de type B, des calculs ClCmentaires montrent que les variables W et Z de la proposition 2 sont independantes. On aurait pu obtenir ce risultat A partir de la caractkrisation des copules archimkdiennes donnke par Genest et Rivest (1993); voir aussi Genest et MacKay (1 986). La famille de Gumbel de type A ne permet pas d'obtenir une dependance ClevCe entre X et Y. La valeur maximale du tau de Kendall pour cette famille, tel que prCsentC au tableau 2, est de 8 x 3-i arctan(3-f )-2 M 0.4184. Notons que lorsque 0 = I, la copule de Galambos est Cgale A la copule de Gumbel de type A, avec 0 = 1. La formule pour le tau de Kendall prCsentCe au tableau 2 pour la famille de Galambos est obtenue en faisant le changement de variable, s = tO/{te + (1 - t)') dans (2.3). Dans la famille MO, la dCrivCe de A est constante sauf pour un saut de 0 + P en t = P/(P + 0). La distribution F est singulikre. On peut facilement montrer que w z = P/(P + 0)) = eP/(e + P - 0 ~ ) .

Notons finalement que la proposition 2 ne semble pas se gknhaliser facilement i p dimensions. En effet, nous n'avons pu trouver une forme simple pour la loi conjointe de

(log X,)/(log X1 + . . . + log X,), j = 1,. . . , p et de C(XI,. . . , X,) lorsque (XI,. . . ,X,) est distribut selon une copule de valeurs extr2mes C(x1,. . . , x,).

De nombreux articles Ctudient l'estimation paramitrique (Tawn 1988, Joe 1994) ou semi-paramktrique (Deheuvels 1991, CapCraA, Fougkres et Genest 1997) de copules de valeurs extRmes. Pour Ctudier les mCthodes d'estimation par simulation, il est utile de pouvoir gtntrer des couples de variables aleatoires extremes. Cette section montre comment utiliser la proposition 2 pour simuler un couple de variables alCatoires (X, Y) selon une distribution C(x,y) dans la classe (1.1). Si on sait simuler (X, Y) selon la loi C(x,y), et si F1 et F2 sont des lois de valeurs extrEmes unidimensionnelles, alors le couple ( Frl(X), F T ~ ( Y)) est distribuC selon une loi de valeurs extrEmes bidimen- sionnelle. L'algorithme propost ici permet ainsi de simuler une loi de valeurs extrEmes bidimensionnelle.

Pour simplifier la prisentation, supposons que A admet une dCrivee seconde et donc que la distribution F est absolument continue. Dans ce cas, Z est absolument continue et a une densitt gZ(z) que l'on peut calculer en dirivant (2.1). La distribution conditionnelle de W Ctant donnC Z peut alors s'tcrire

~ t a n t donne 2, la loi de W est donc uniforme sur (0, I) avec probabilite p(Z) et Cgale A la loi du produit de deux uniformes indipendantes sur (0, 1) avec probabilitk 1 -p(Z),

Notons que puisque gz(z) est la dCrivte de (2.1), 0 5 p(z) 5 1. Dans la discussion qui suit, Uo, U1, U2 et U3 reprisentent des variables aleatoires

indkpendantes uniformCment distribuCes sur (0,l). Pour simuler un couple de variables altatoires (X, Y) selon la loi C(x,y) donnee par (1.1), avec fonction de dtpendance A, on peut utiliser la procedure suivante:

(1) Simuler Z selon la loi Gz(z) donnee par (2.1). (2) Sachant 2, prendre W = UI avec probabilite p(Z) et W = U1U2 avec probabilitt

1 - P(Z). (3) Poser X = wZ/A(Z) et Y w(IpZ)/A(Z).

ConsidCrons quelques exemples. Pour la copule de Gumbel de type B, d'aprks le tableau 2, Gz(z) = mr(z). Puisque m;'(t) = mllr(t), A l'ttape 1 de l'algorithme il suffit de prendre Z = ml/,(Uo). De plus A 1'Ctape 2, p(Z) = 1 - l / r . Cet algorithme est tquivalent A celui obtenu en tcrivant C c o m e une copule archimtdienne (Genest et Rivest, 1993).

Lorsque la distribution Gz(z) n'est pas inversible on suggkre, pour simuler Z, d'utiliser la mCthode du rejet (Ross 1985, p. 438). Cette mCthode permet de simuler Z A partir de Zl, une variable aliatoire de densite gl(z) que I'on sait simuler et telle que gz(z)/gl(z) soit born6 par une constante c sur (0, 1). La mtthode du rejet utilise le resultat suivant:

.anb!loldw/(se !o[ es asyd la uo!le3yp?r\ a1la3 al!q ap lauuad !nb anby~sy~e~s aun al?88ns uoy13as aaa3 '(1.1) aIIpej el luayedde H ap alndo3 el anb lalnsse's luawa[e8? jnej I! 's!ojalnoL '(9661 'suaydals la pe~ppo7 'o!zu8-1auo~o3) s?!.mr\!un ~uawalsnre'p sjsal ap ap!e'I a saw?llxa slnalm ap s!o[ sap luos sa8lew sat anb layu?r\ p1oqe.p ~nad uo 'sa[[auuo!suaw!p!q sawyxa slnap ap suo!lnquls!p sap a[[pej "1 ~ua!pedde H IS .t!or\es mod 'H !o~ aun'p ?uer\!q uo[[pueq3a un {u ' -. "I = ! : (!A '!x)) 110s

.sal!e~uaw?[ddns xneAe11 sap al!ssa3?u aIIg .anbpew?[qold Isa sappow sa3 !3! ?sodold uo!je[nw!s ap awqluo8[eG[ ap uopm![dde,7 'a1!3!1dxa awloj aun sad e,u (1.1) suep y uo!13uoj a[ 'j~e%?u anb!ls!8o[!q la anb!ls!8o[!q sappow sa1 saIIa1 'alnle~?n![ e[ suep luess!e.mdde sawyxa sJna[er\ ap s!o[ sau!epa3 1nod

'(066 1 umq) ar\!1e8?u anbps!80[ la anb!ls!801 s!o[ sap sanbul?w/(se suo!slar\ ap suo!ieAlasqo sap 'soqweIeg e[ la 8 ad4 ap [aqurng e[ 'nod sawqluo81e sap qped '1uawa[!3ej lal?u?8 ap ‘saline a1lua 'lamad uo!ler\lasqo aua3 xamylxa slna[er\ ap alndo3 aun luawa1e89 Isa (d/:~ '(d-r)/F~)~~" la (o/~x'~o~I,/~x)xeur ap alu!oruo3 !o[ el 'slo[e '13 la 03 saw?llxa slnaler\ ap sa~nd -03 saI uo~as sanqulsrp ~uos (1~ '1~) la (OK 'OX) IS :aluessal?~u! uo!les!pl?u?% aun e lel~ns?.~ a3 .(d'~) sa.qm~ed ap ON aIndo3 eI ua!q lsa (d/,En '(d-I)/;n)~"" = A ap la (,/,En '(o-I,l,'~)xew = x ap aluroruo3 101 el anb ~uawal!3ej aauow uo 'laua us .uope[nur!s ap al3a.n~ apoqpw aun'p uop3~1suo3 e[ lauuad alndo3 ana3 mod 3 ap a[dwts awloj e[ luepuada3 '(~661 !reqno~) a.1?![n8u!s lsa z ap 101 e[ no se3 ne !3!

?was?ld awy1uo8le,[ laidepe lnad uo 'OK a[[pej el ap sa~ndos sap la[nw!s mod -alq!aj sn~d nad

un 3 awoq aun lue/(e awyluo81e la3 ap alueGr\ aun auuop (~661) !relpnoQ 'soqweleg ap alpurej e[ mod ~mwlopad uopelnw!s ap awyluo8[e un auuop (.)Ow uopeuuojsueq el ap uo!les!Ipn61 anb alluow 3 ap lna[er\ aIq!y e7 .cx, a 1 ap er\ 0 anbslol 1

aP l!ol3?P (4)Y = 3 aP InaIeA e7 '((1 - o/r+r~)O)/(l + 0) + @/I = (:)% > l!qs!les ?l!suap es anb lalluow lnad uo .Z nealqel ne a!uy?p (~)LH md aauuop slo[e lsa (z)ew = J. ap !o[ e7 .x!oq3 uoq un 1sa 0 = A ~SO~WBIBE) ap aI[!wq a[ lnod .(~.)"[w = alpuald la A ap xnap!pn[ x!oy3 un mod (z)h = J a[qeuer\ el 'amoj!un !o[ aun,p ~rped a 'lalaua8 3uop lnad uo .Z anb 4 ap Jnolne a?~lua3uos surow al!ole?[e a[qeuer\ aun '1 c A 3a~e 'auuop 'Z nealqe1 ne a!uy?p '(z)h uopeunojsuell e7 .a3e3yja snld alpual a[ mod papa3a~d awqluo8[e,[ lay!pow mop lnej I! f?r\a[? slo[e lsa (z)Z8 ap 3

urnw!xew q .! ap Jnolne aalwa3uo3 Isa z ap lo[ e[ 'a3uepuadap auoj ap se3 sap suea .a3a3yjau! uo1e Isa uo!~e[nw!s ap awyluo%[e,7

.soqweIeE) ap alp~ej el mod apue18 sy luawap!del luayap 3 a~uelsuos el '1 ap a[ap na aluaw8ne g anbs.101 'luapuada3 .sa[[!urq xnap sal suep 0 ap er\ 0 anbs.101 la 1 allua aueA 3 awoq e7 .sa[l*q xnap sa3 mod (f)z8 = 3 alpuald mop ~nad uo laral np auryluo8[e,1 suaa .(I - o/r+r~)/(~ +g)+ 1 = (4)~8 > (z)Z8 anb lualluow s[n3[e3 spaged ap 'soqwepg ap aII!ureJ el mod anb srpuel '(0 - p)/(g+p) = (f)z8 5 (2)zB e uo 'v ad4 ap [aqwng ap alndo3 e[ mod '(1 '0) 3 z mod 1 = (2)IB lueuald ua lafa1 np awqluo3[e,[ .1asr[11n . . 'Z la~nw!s mod 'lnad uo 'a[q!q lsa A la x aaua a3uapuadap a[ anbslo7

.luew.~opad nad lsa awqluo8p,[ la al!ejs!les luauralel lsa {(~z)~B~)/(~z)zS 5 00 uo!l!puo3 e, 'puel8 lsa 3 anb -slot 'allu03 led !luama3~3yja zg la[nw!s ap lamad awql!lo8le la3 '1 ap u!s!or\ lsa 3

anbslo7 .(z)zg lsa 12 ap a~[auuo!l!puo3 !o[ e[ '{(Iz)IBD}/(~z)ZB > On anb auuop wela

c 'ON '92 'PA IS~AIU 13 ~rvtlano~y '1an0~9 z6 c

1998 COPULES DE VALEURS EXTREMES 193

A la section 2, on a montrC que pour toute copule de valeurs extrEmes C , la loi de W = C ( X , Y ) est donnCe par K,(w) = w - ( 1 - t ) w log w. Nous forrnulons la conjecture que la famille K, caractCrise ( 1 . 1 ) . En d'autres termes, si la loi conjointe de X et de Y est C ( x , y ) et si la loi de C ( X , Y ) est Cgale i K,(w) pour un certain t dans (0, I), alors, si la conjecture est vraie, C est une copule de valeurs extrCmes. Genest et Rivest (1989) prisentent une preuve partielle de ce rCsultat, pour les copules archimkdiennes. En effet, la seule copule archimkdienne qui soit une copule de valeurs extrCmes est la copule de Gumbel de type B, car les copules archimidiennes sont caractCrisCes par la loi de C ( X , Y ) (Genest et Rivest 1993).

Dans la mesure oh la conjecture prCcCdente est vraie, on peut tester si une copule appartient i la famille ( 1 . I ) , en considirant l'hypothbe H0 : K(w) = K,(w), t E ( 0 , l ) . On peut construire un test d'ajustement simple 2i l'aide des deux premiers moments de KT. Si W est distribuie selon K,(w), alors, quelque soit t, 8E W -9E w2 - 1 = 0. Les moments de W peuvent facilernent Ctre estimb. En effet, si 6 { ( x l , yl) , (x2,y2)) = 1 si X I 2 x2 et yl > y2 et 0 sinon, alors, si ( i , j , k) sont des indices distincts, E 6{(Xi , Y;) , (Xj , I;.)) = E W et

E [a{(Xi, Yi), (Xi, I;.>)6{(Xi, Yi), (Xk, Yk))I = E w2. Ces rCsultats sont dCmontrCs en calculant des espCrances conditionnelles, Ctant donnC (Xi, Y;). Une estimation non biaisCe de 8E W - 9 E w2 - 1 est donc donnCe par la statistique suivante:

8 " Sn = - x 6{(Xi, Yi)? (Xj9 I;.)}

n(n - 1 ) i#j

Pour Ctudier la distribution asymptotique et pour estimer la variance de S,, il est utile de noter que cette dernikre est une U-statistique d'ordre 3, dont le noyau syrnitrique est donnC par

On Ccrit alors

Notons ql (Xi , Y;) = E [${(Xi, Yi) , (Xj , I;.), (Xk , Y k ) ) J(Xi, Yi)]. Posons p = 8 E W - 9E w2 - 1 et appelons o2 la variance de q 1 ( X , Y ) . La thCorie asyrnptotique des U- statistiques (voir Lee 1990) implique que &(Sn - p) converge en loi vers une normale

194 GHOUDI, KHOUDRAJI ET RIVEST Vol. 26, No. 1

de moyenne 0 et de variance 90'. En particulier, p = 0 si la copule C appartient B la classe des copules de valeurs extrirnes.

Pour estimer la variance de S,, on propose I'utilisation de la rntthode du jackknife (Lee 1990, chapitre 5). Une formule relativement simple pour cet estimateur est donnte Par

ob Sip') est la statistique S, calculte sur un Cchantillon de taille n - 1, obtenu en excluant la ikme observation. vJack(sn) est convergent (Lee 1990, p. 221); de plus, il a un ICger biais positif dans de petits Cchantillons (Lee 1990, 219). On peut donc espCrer que le test statistique qui rejette 310 lorsque ~ s , I / J-" VJ,,~(S,) > ~ a / 2 sera conservateur dans de petits tchantillons. Ici, za dtnote le quantile d'ordre 1 - a de la loi normale centrte rtduite.

Pour les contre-hypothkses satisfaisant y = 8E W - 9E W2 - 1 # 0, le test proposC est convergent. On a la convergence pour plusieurs farnilles de copules. Considtrons, par exemple, celle de Clayton (1978). Pour cette famille K(v) = v + v(l - va)/a (Genest and Rivest 1993) et 8E W - 9 E w2 - 1 = 2a/(a + 2)(a + 3), ce qui est non-nu1 lorsque a est positif. En fait, la copule de Clayton est archimtdienne. Puisque les copules de cette classe sont caracttristes par leurs fonctions K, le test suggtrC est, rkgle gCntrale, convergent pour des contre-hypothkses archirntdiennes.

Pour ktudier le cornportement de la statistique du test dans de petits Cchantillons, ses seuils exacts ont Ctt calcults par simulation (10,000 rCpttitions) pour quelques lois. Les rtsultats apparaissent au tableau 3. On peut constater que lorsque le tau de Kendall est faible, le seuil empirique est voisin du seuil nominal alors que, pour des taus de Kendall tlevts, le seuil empirique est infkrieur au seuil nominal ce qui fait que le test est conservateur. Notons qu'un autre estimateur de variance, obtenu B partir des rCsultats de Barbe, Genest, Ghoudi et Rtmillard (1996), a CtC Ctudit par simulation. Dans de petits Cchantillons, il donne un test libtral lorsque le tau de Kendall est faible. L'estimateur de variance donnt par la mtthode du jackknife nous sernble prCf6rable car il donne toujours un test conservateur.

A titre d'illustration, on peut se demander si les maxima annuels des niveaux de la mer dans le Lowestoft et le Sheerness, CtudiCs par Tawn (1988), suivent une distribution de valeurs extrimes. Dans ce cas de figure, le test de cette section donne une statistique standardiske de zobs = -0.146. L'hypothkse que la copule sous-jacente appartient B la classe (1 .l) n'est donc pas rejetCe. En d'autres termes, il est acceptable de rnodtliser ces donntes i l'aide d'une copule de valeurs extrimes.

Notons finalement que ce test se gtntralise facilement 2 l'ttude de I'ajustement d'une copule de valeurs ex t rhes B p composantes. En effet, le vecteur S, des p(p - 1)/2 statistiques (4.1), pour toutes les paires de composantes possibles, est une U-statistique multidimensionnelle. On peut utiliser la mtthode du jackknife pour estimer sa rnatrice de variances-covariances v(S,). Sous I'hypothkse nulle, la loi de s~v(s,)-IS, suit ap- proximativement une loi du khi-deux B p(p - 1)/2 degrCs de libertt, ce qui permet de construire un test d'ajusternent.

5. ANNEXE

De'monstration de la proposition 1. Puisque la loi marginale de X est uniforme, Clo(x, y), la dCrivCe partielle de C(x, y) par rapport B x, est en fait la loi conditionnelle de Y ttant

1998 COPULES DE VALEURS EXTREMES 195

TABLEAU 3: Seuil empirique du test d'ajustement avec un seuil nominal de 5%.

Seuil

Farnille t n = 20 n = 30 n = 50 n = 100

Gumbel B 0.25 0.50 0.75

Galarnbos 0.25 0.50 0.75

donnC que X = x. Cette loi est donnCe par

En conditionnant par rapport i X, on obtient

L'tvaluation de cette intkgrale conduit i 1'CnoncC de la proposition 1 .

La dimonstration de la proposition 2 fait appel a la fonction q dCfinie de [0, 1 1 dans [O, 11 par t H t /A( t ) . Notons que q est stricternent croissante sur son support. En effet, sa dCrivCe 5 droite est donnCe par

A(t) - tA' ( t ) 4'(t) =

A2(t> .

Cette demikre est toujours positive car A(t) > t , et Af( t ) < 1 sur le support de q. Notons cependant que si A(t) = t dans un intervalle du type ( 1 - 6 , l ) , q( t ) est constante et Cgale a 1 dans cet intervalle.

Dkrnonstration de la proposition 2. En ecrivant W = C ( X , Y ) = xA(')IZ, on dCduit les CgalitCs suivantes,

= P q(Z) < rnin q(z ) , - ( { ;:::I) Si A(t) = t dans un intervalle du type (1 - 6 , l), alors { q ( Z ) 5 q ( z ) ) = { Z < z ) sauf lorsque z E (1 - c , 1). Dans ce cas { q ( Z ) < q ( z ) ) = ( 1 - 6 < Z < 1). Cependant, on a alors GZ( l - 6 ) = 1 et (5.1) est toujours vraie. La fonction q( t ) = t /A( t ) Ctant croissante sur son support, le nlinirnurn dans 1'Cquation preckdente est Cgal i q(z) seulernent si X < wzIA('). Ainsi 1'Cquation (5.1) devient

GHOUDI, KHOUDRAJI ET RIVEST Vol. 26, No. 1

- - ~(w~"" ' , Z) + / I W : / ~ ( ; ) c10 {.', 4-1 ( * ) } &, log w

oh Glo(x,z) est la dCrivCe partielle par rapport B x de la fonction G(x,z) dCfinie B la proposition 1 et q-'(t) est l'inverse de la fonction q(t).

Le premier terme de (5.2) est facilement tvalut. Pour tvaluer le deuxikme terme, on fait le changement de variable t = q-'((log x)/(log w)). Puisque x = w'lA('), le jacobien est donnC par

dx = (log w) A(t) - fA1(f) wt,A(') dt

AW2

Ainsi, sachant que

le deuxikme terme de (5.2) est tgal B

En regroupant les Cquations (5.2) et (5.3), on conclut que P(Z 5 z, W 5 w) s'tcrit

BIBLIOGRAPHIE

Anderson, C.W., et Nadarajah, S. (1993). Environmental factors affecting reservoir safety. Statistics for the Environment (publit sous la direction de V. Bamett et de F. Turkman), Wiley, New York, 163-182.

Barbe, P., Genest, C., Ghoudi, K., et Rtmillard, B. (1996). On Kendall's process. J. Multivariate Anal., 58, 197-229.

Captrai, P., Fougkres, A.-L. et Genest, C. (1997). A nonparametric estimation procedure for bivariate extreme value copulas. Biometrika, 84, 567-578.

Clayton, D.G. (1978). A model for association in bivariate life tables and its application in epidernjological studies of familial tendency in chronic disease incidence. Biometrika, 65, 141-151.

Coronel-Brizio, H.F., Lockhart, R.A., et Stephens, M.A. (1996). Tests of fit for the generalized extreme value distribution. Rapport technique, Universitt Simon-Fraser, Colombie Britannique, Canada.

Deheuvels, P. (1991). On the limiting behavior of the Pickands estimator for bivariate extreme-value distribu- tions. Statist. Probab. LPtt., 12, 429439.

Galambos, J. (1975). Order statistics from sample from multivariate distributions. J. Amer. Statist. Assoc., 70, 676680.

COPULES DE VALEURS EX'TR~MES

Galambos, J. (1987). The Asymptoric Theory of Extreme Order Statistics. Second Edition. Kreir, Melbourne, Fla.

Genest, C., et MacKay, R.J. (1986). Copules archimtdiennes et familles de lois bidimensionnelles dont les marges sont donntes. Rev. Canad. Statist., 14. 145-159.

Genest, C., et Rivest, L.-P. (1989). A characterization of Gumbel's family of extreme value distributions. Statist. Probab. Lett., 8, 207-21 1.

Genest, C., et Rivest, L.-P. (1993). Statistical inference procedures for bivariate Archimedean copulas. J. Arner. Statist. Assoc., 88, 1034-1043.

Geoffroy, J. (1958). Contribution B la thtorie des valeurs extremes. Publ. Inst. Statist. Univ. Paris, 7, 37-185. Hutchinson, T.P., et Lai, C.D. (1990). Continuous Bivariate Distributions, Emphasizing Applications. Rumsby

Scientific, Adelaide. Joe, H. (1990). Families of min-stable multivariate exponential and multivariate extreme value distributions.

Statist. Probab. Lett., 9, 75-81. Joe, H. (1994). Multivariate extreme-value distributions with applications to environmental data. Rev. Canad.

Statist., 22, 47-64. Johnson, N.L., et Kotz, S. (1972). Distributions in Statistics: Continuous Multivariate Distributions. Wiley,

New York. Khoudraji, A. (1995). Contributions B I'itude des copules et a la modtlisation des copules aux valeurs extrsmes.

Thtse de doctorat, Universitt Laval, Qutbec, Canada. Lee, H.A. (1990). U-Statistics. Theory and Practice. Marcel Dekker, New York. Marshall, A.W., et Olkin, I. (1967). A generalized bivariate exponential distribution. J. Appl. Probab., 4,

291-302. Nelsen, R.B. (1991). Copulas and association. Advances in Probability Distributions with Given Marginals

(publie sous la direction de G. Dall'Aglio, S. Kotz & G. Salinetti), Kluwer Academic, 51-74. Pickands, J. (1981). Multivariate extreme value distributions. Proc. 43rd Session Internat. Statist. Inst. (Buenos

Aires), 859-878. Ross, S.M. (1985). Introduction to Stochastic Processes. Third Edition. Wiley, New York. Sibuya, M. (1960). Bivariate extreme statistics. Ann. Inst. Statist. Math., 11, 195-210. Sklar, A. (1959). Fonctions de ripartition a n dimensions et leurs marges. Publ. Inst. Statist. Univ. Paris, 8,

229-23 1. Tawn, J.A. (1988). Bivariate extreme value theory: Models and estimation. Biornetrikn, 75, 397415. Tawn, J.A. (1990). Modelling multivariate extreme value distributions. Biornetrikn, 77, 245-253. Tiago de Olivera, 1. (1958). Extremal distributions. Rev. Fac. Ciencas Univ. Lisboa, A8, 299-310.

Received 10 July 1996 Revised 12 February 1997 Accepted 16 May 1997

Diparternent de rnathimatiques et d'informatique Universiti du Quibec d Trois-Rivitres

Trois-Rivihres, Que'bec Canada G9A 5H7

ernail: [email protected]

Dipartement de rnathirnatiques Faculte' des sciences Sernlalia

Universiti Cadi Ayyad Boulevard du Prince Moulay Abdellah

B.P. SI5, Marrakech Maroc

DPparternent de rnathe'motiques el de statistiques UniversitC Laval Ste-Foy, Que'bec

Canada G I K 7P4