act 2008 mathématiques actuarielles iard ii (théorie de la

82
ACT 2008 Mathématiques actuarielles IARD II (Théorie de la crédibilité)

Upload: others

Post on 22-Jun-2022

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

ACT 2008

Mathématiquesactuarielles IARD II

(Théorie de la crédibilité)

Page 2: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la
Page 3: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

ACT 2008

Mathématiquesactuarielles IARD II

(Théorie de la crédibilité)

Vincent Goulet

École d’actuariat, Université Laval

Hiver 2010

Page 4: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

c© 2010 Vincent Goulet

Cette création est mise à disposition selon le contrat Paternité-Partage à l’iden-tique 2.5 Canada disponible en ligne http://creativecommons.org/licenses/by-sa/2.5/ca/ ou par courrier postal à Creative Commons, 171 Second Street,Suite 300, San Francisco, California 94105, USA.

Page 5: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Table des matières1 Introduction à la théorie de la crédibilité 1

2 Crédibilité de stabilité 52.1 Origines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.2 Crédibilité complète . . . . . . . . . . . . . . . . . . . . . . 62.3 Crédibilité partielle . . . . . . . . . . . . . . . . . . . . . . . 9

3 Crédibilité bayesienne 113.1 Quelques notes historiques . . . . . . . . . . . . . . . . . . 113.2 Estimation bayesienne . . . . . . . . . . . . . . . . . . . . . 123.3 Modélisation de l’hétérogénéité . . . . . . . . . . . . . . . . 173.4 Prévision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183.5 Approche par la distribution prédictive . . . . . . . . . . . 243.6 Crédibilité bayesienne linéaire (ou exacte) . . . . . . . . . . 263.7 Le modèle de Jewell . . . . . . . . . . . . . . . . . . . . . . . 37

4 Le modèle de crédibilité de Bühlmann 394.1 Notation et relations de covariance . . . . . . . . . . . . . . 394.2 Modèle et prévision . . . . . . . . . . . . . . . . . . . . . . . 424.3 Approche paramétrique . . . . . . . . . . . . . . . . . . . . 474.4 Approche non paramétrique . . . . . . . . . . . . . . . . . . 504.5 Interprétation des résultats . . . . . . . . . . . . . . . . . . 56

5 Le modèle de Bühlmann–Straub 595.1 Modèle et prévision . . . . . . . . . . . . . . . . . . . . . . . 595.2 Estimation des paramètres de structure . . . . . . . . . . . 645.3 Données manquantes . . . . . . . . . . . . . . . . . . . . . . 675.4 Exemple numérique . . . . . . . . . . . . . . . . . . . . . . . 67

Bibliographie 73

v

Page 6: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la
Page 7: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

1 Introduction à la théorie de lacrédibilité

Théorie de la crédibilité : ensemble de techniques utilisées par les ac-tuaires pour déterminer la prime d’un assuré/contrat dans un porte-feuille hétérogène.

En faisant une tarification, un assureur cherche

1. d’abord à charger assez de primes pour poyer les sinistres ; puis

2. distribuer équitablement ces primes entre les assurés.

Plusieurs façons d’atteindre le second but :

1. d’abord par une structure de classification ; puis

2. par la tarification basée sur l’expérience (experience rating) ñ théoriede la crédibilité.

Définition (Experience rating). La tarification basée sur l’expérience viseà assigner à chaque risque sa prime juste et équitable. Cette prime pourune période dépend exclusivement de la distribution des sinistres (in-connue) de ce risque pour la période. (Bühlmann, 1969)

La tarification basée sur l’expérience exige un volume d’expérience im-portant. Elle est donc principalement utilisée en

assurance automobile

accidents du travail.

Elle ne peut toutefois être utilisée, par exemple, en

assurance-vie (on ne meurt qu’une fois)

1

Page 8: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

assurance habitation (fréquence trop faible)

Exemple 1.1. Un portefeuille d’assurance est composé de dix contrats.Les contrats sont a priori considérés équivalents. Les conditions sui-vantes prévalent : tout contrat ne peut avoir qu’au plus un sinistre par année ; le montant de ce sinistre est 1 ; la prime collective est 0,20, c’est-à-dire que l’assureur s’attend à ce

qu’en moyenne deux assurés sur 10 aient un sinistre au cours d’uneannée.

Situation après une année

Voici l’expérience au sein du portefeuille après une année.

Contrat

Année 1 2 3 4 5 6 7 8 9 10

1 1

Montant de sinistre moyen par contrat = 1/10 = 0,10. La prime collective est peut-être trop élevée. Trop peu de données pour tirer une conclusion.

Situation après deux années

Après deux années, l’expérience est maintenant comme suit.

Contrat

Année 1 2 3 4 5 6 7 8 9 10

1 1

2 1 1 1

2

Page 9: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Montant de sinistre moyen par contrat = 4/20 = 0,20.

La prime collective est adéquate.

Le contrat 9 a déjà eu deux sinistres.

Situation après dix années

Observons maintenant la situation après dix années.

Contrat

Année 1 2 3 4 5 6 7 8 9 10

1 1

2 1 1 1 1

3 1 1

4 1 1

5 1

6 1

7 1 1 1 1

8 1 1 1 1

9 1 1

10 1 1

Si 0,6 0,3 0,2 0,2 0,2 0,1 0 0 0,7 0

S 0,23

Montant de sinistre moyen par contrat = 23/100 = 0,23.

La prime collective est raisonnablement adéquate.

Le contrat 9, avec ses 7 sinistres, est en effet plus risqué.

Les contrats 7, 8 et 10 n’ont eu aucun sinistre.

3

Page 10: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Conclusions

La prime collective, si elle est globalement adéquate, n’est en revancheclairement pas équitable.

Contrairement à l’hypothèse de départ de l’assureur, le portefeuilleest hétérogène.

Besoin d’une technique de tarification basée sur l’expérience (expe-rience rating) pour adéquatement distribuer les primes entre les assu-rés.

Deux grandes branches en théorie de la crédibilité :

1. Credibilité de stabilité, ou américaine, limited fluctuations.L’assureur tient compte de l’expérience individuelle seulement si celle-ci est suffisamment stable dans le temps.

2. Crédibilité de précision, ou européenne, greatest accuracy.L’assureur tient compte de l’expérience individuelle de façon à obte-nir la meilleure estimation de l’expérience future. Le poids de l’expé-rience individuelle augmente avec l’hétérogénéité du portefeuille.

4

Page 11: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

2 Crédibilité de stabilité

2.1 Origines

La théorie de la crédibilité est apparue dans le domaine des accidentsdu travail au début des années 1900.

Petite histoire du gros employeur avec une meilleure expérience que legroupe...

Première solution : Mowbray (1914) définit une prime pure «fiable» (de-pendable) comme «une prime pour laquelle la probabilité est forte qu’ellene diffère pas de la vraie prime par plus d’une limite arbitraire».

En termes mathématiques, on veut que

Pr[(1� k)E[S] ¤ S ¤ (1 + k)E[S]] ¥ p,

k est petit, habituellement 5 % ;

p est près de 1, habituellement 0,90, 0,95 ou 0,99 ;

S représente l’expérience d’un contrat, sous une forme ou une autre.

5

Page 12: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

2.2 Crédibilité complète

En crédibilité complète, un contrat d’assurance est considéré crédible sison expérience est stable.

La notion de portefeuille n’est pas nécessaire pour le moment.

Intuitivement, la stabilité de l’expérience va de pair avec la «taille» d’uncontrat, qu’elle soit exprimée en termes de volume de prime ; masse salariale ; nombre d’employés ; nombre de sinistres ; nombre d’années d’expérience ; etc.De plus, la taille du contrat est généralement liée à la fréquence dessinistres, et non à la sévérité de ceux-ci.

Définition (Crédibilité complète). Une crédibilité complète d’ordre (k, p)est attribuée à l’expérience S d’un contrat si les paramètres de la distri-bution de S sont tels que la relation

Pr[(1� k)E[S] ¤ S ¤ (1 + k)E[S]] ¥ p

est vérifiée.

Exemple 2.1 (Binomiale pure). Mowbray (1914) voulait trouver le nombred’employés minimal pour considérer l’expérience d’un employeur plei-nement crédible. On définit alors

S : nombre d’accidents par année

avecS � Binomiale(n, θ),

n = nombre d’employésθ = probabilité d’accident (connue).

6

Page 13: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

On cherche n tel que

Pr[(1� k)E[S] ¤ S ¤ (1 + k)E[S]] ¥ p

pour des valeurs de k et p données. Par le Théorème central limite,

S� E[S]aVar[S]

nÑ8ÝÑ N(0,1),

d’où

Pr

[�

kE[S]aVar[S]

¤S� E[S]a

Var[S]¤

kE[S]aVar[S]

]�Φ

(kE[S]aVar[S]

)�Φ

(�

kE[S]aVar[S]

)

= 2Φ

(kE[S]aVar[S]

)� 1¥ p.

On a donckE[S]aVar[S]

¥ ζε/2,

où ε = 1� p et ζα est le 100(1� α)e centile d’une loi N(0,1).

Avec E[S] = nθ et Var[S] = nθ(1� θ) et en isolant n dans l’inégalité, onobtient

n ¥(

ζε/2

k

)2 1� θ

θ.

Exemple 2.2 (Poisson composée). La taille d’un contrat est souvent ex-primée en termes du nombre espéré de sinistres dans une période —typiquement une année. La distribution la plus populaire pour S dansun tel cas est alors la Poisson composée, c’est-à-dire

S = X1 + � � �+ XN

où N � Poisson(λ) et la distribution de X1, X2, . . . est FX(�). On a

E[S] = E[N]E[X]

= λE[X]

Var[S] = Var[N]E[X]2 + E[N]Var[X]

= λE[X]2 + λVar[X]

= λE[X2].

7

Page 14: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

En suivant le même cheminement qu’à l’exemple précédent, on trouve

λ ¥

(ζε/2

k

)2(1 +

Var[X]

E[X]2

)=

(ζε/2

k

)2

(1 + CV(X)2),

CV(X) =

aVar[X]

E[X].

Remarques.1. Plus CV(X) augmente, plus λ augmente.2. Si k = 0,05 et p = 0,90, alors ζ0,05 = 1,645 et

λ ¥ 1082,41(

1 +Var[X]

E[X]2

).

3. Si, en plus, X est dégénérée (c’est-à-dire Pr[X = M] = 1 pour M quel-conque), alors

λ ¥ 1082,41,

un nombre célèbre.4. Si X est dégénérée en 1 on a en définitive S � Poisson(λ).

Exemple 2.3. Dans les deux exemples précédents, on détermine si uncontrat est pleinement crédible une période à la fois. On pourrait aussifixer le seuil de crédibilité complète en fonction du nombre d’annéesd’expérience. Pour cela, on définit simplement

S � S =S1 + � � �+ Sn

n,

où S1, . . . , Sn sont des variables aléatoires indépendantes et identique-ment distribuées et St est l’expérience de l’année t = 1, . . . , n.

On a alors

E[S] = E[St]

Var[S] =Var[St]

n,

8

Page 15: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

d’où l’expérience d’un contrat est considérée pleinement crédible après

n ¥(

ζε/2

k

)2 Var[St]

E[St]2

périodes.

Remarques.

1. De manière générale, le seuil de crédibilité complète est tel que

E[S] ¥(

ζε/2

k

)bVar[S].

2. La distribution de S n’est en général pas symétrique. Est-il alors cor-rect d’utiliser le Théorème central limite (TCL) ? Le critère de crédibi-lité complète exige que la distribution de S soit très concentrée autourde sa moyenne, donc presque symétrique. Le TCL est donc bien assezprécis.

3. Il y a en fait très peu d’applications légitimes de la crédibilité de sta-bilité. Un bon exemple : seuil d’admissibilité à un régime rétrospectif.

2.3 Crédibilité partielle

Le besoin de tenir compte en partie de l’expérience individuelle d’uncontrat se trouvant sous le seuil de crédibilité complète apparait rapide-ment.

Whitney (1918) propose de pondérer l’expérience individuelle (S) et laprime collective (m) par un facteur de crédibilité (0 ¤ z ¤ 1) en une primede la forme

π = zS + (1� z)m.

9

Page 16: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Plusieurs formules différentes ont été proposées pour z. Soit n0 le seuilde crédibilité complète. Les formules les plus populaires sont

z = min"c

nn0

, 1*

,

z = min

#(nn0

)2/3

, 1

+,

et la formule de Whitney

z =n

n + K,

où K est une constante déterminée au jugement de façon à limiter lesfluctuations dans la prime d’une année à l’autre (swing).

Remarques.

1. But de cette approche : incorporer autant d’expérience individuellepossible sans trop affecter la stabilité de la prime.

2. La distribution des primes est basée uniquement sur la taille des assu-rés. La tarification n’est donc pas nécessairement précise et équitable.

10

Page 17: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

3 Crédibilité bayesienne

3.1 Quelques notes historiques

Whitney (1918) est le premier auteur à proposer l’approche de pré-cision de par «la nécessité, par équité envers le risque individuel,de pondérer l’expérience du groupe d’une part et l’expérience indi-viduelle d’autre part.»

Modèle mal reçu parce que Whitney utilise la règle de Bayes.

Défenseur de l’approche bayesienne : Bailey (1945, 1950). Bailey établitque la minimisation de l’erreur quadratique moyenne résulte en uneprime bayesienne linéaire de la forme

π = zS + (1� z)m

avec

z =z

z + K

pour certaines combinaisons de distributions.

Véritable essor de la crédibilité de précision : Bühlmann (1967, 1969).Son idée : forcer la prime bayesienne à être linéaire.

11

Page 18: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

3.2 Estimation bayesienne

3.2.1 Cas continu

Supposons que l’on souhaite estimer le paramètre inconnu θ d’une dis-tribution continue avec f.d.p. f (x;θ) (une loi normale avec moyenne in-connue θ et variance connue σ2, par exemple) à partir d’un échantillonaléatoire X1, . . . , Xn.

Les statisticiens classiques développeront des estimateurs à partir d’uncritère quelconque : absence de biais, maximum de vraisemblance, etc.On remarquera qu’aucune hypothèse a priori n’est faite sur θ, on «laisseparler les données».

Dans l’approche bayesienne, l’opinion a priori d’un individu sur la va-leur du paramètre θ est prise en compte dans l’estimation de ce dernier.On considère alors le paramètre comme une simple réalisation d’unevariable aléatoire Θ avec f.d.p. u(θ). Au fur et à mesure que les don-nées de l’échantillon aléatoire (l’information) s’accumulent, l’opinion apriori sur la valeur possible de θ est révisée et améliorée. On calculealors u(θ|x1, . . . , xn), la distribution a posteriori de Θ, à l’aide de la réglede Bayes :

u(θ|x1, . . . , xn) =f (x1, . . . , xn, θ)

f (x1, . . . , xn)

=f (x1, . . . , xn|θ)u(θ)

f (x1, . . . , xn).

Par la loi des probabilités totales,

f (x1, . . . , xn) =

» 8�8

f (x1, . . . , xn|θ)u(θ)dθ,

et donc

u(θ|x1, . . . , xn) =f (x1, . . . , xn|θ)u(θ)³8

�8 f (x1, . . . , xn|θ)u(θ)dθ.

Le dénominateur du côté droit de l’expression ci-dessus n’est qu’uneconstante de normalisation et, par conséquent, est souvent omise dansles calculs.

12

Page 19: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Enfin, un estimateur ponctuel θ = g(X1, . . . , Xn) du paramètre θ est ob-tenu en minimisant l’espérance a posteriori d’une fonction de perte. Lafonction de perte la plus fréquemment employée est l’erreur quadra-tique, c’est-à-dire

L(θ, θ) = (θ � θ)2.

Dans un tel cas l’estimateur bayesien minimisant

E[L(θ, θ)|X1, . . . , Xn] = E[(θ � θ)2|X1, . . . , Xn]

est

θ = E[Θ|X1, . . . , Xn]

=

» 8�8

θ u(θ|x1, . . . , xn)dθ,

soit l’espérance de Θ calculée par rapport à la distribution a posteriori.

3.2.2 Cas discret

Les idées expliquées ci-dessus demeurent exactement les mêmes dansle cas discret, seule la notation change légèrement. Pour simplifier lanotation, soit X = (X1, . . . , Xn) et x = (x1, . . . , xn).

Si la variable aléatoire Θ ne prend que des valeurs discrètes, la distri-bution a priori est exprimée sous forme d’une fonction de probabilitéPr[Θ = θ]. La fonction de probabilité conjointe de X1, . . . , Xn peut tou-jours être calculée par la loi des probabilités totales :

Pr[X = x] =8

θ=�8

Pr[X = x|Θ = θ]Pr[Θ = θ].

La règle de Bayes permet de calculer la distribution a posteriori de Θ :

Pr[Θ = θ|X = x] =Pr[X = x|Θ = θ]Pr[Θ = θ]

Pr[X = x]

=Pr[X = x|Θ = θ]Pr[Θ = θ]°8

θ=�8Pr[X = x|Θ = θ]Pr[Θ = θ].

13

Page 20: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Enfin, l’estimateur bayesien minimisant l’erreur quadratique moyennedemeure inchangé :

θ = E[Θ|X1, . . . , Xn]

=8

θ=�8

θ Pr[Θ = θ|X = x].

3.2.3 Cas mixtes

Il est simple de dériver les formules des cas mixtes ou, par exemple, ladistribution de X|Θ est discrète et celle de Θ est continue.

Exemple 3.1. Un portefeuille d’assurance automobile est composé de75 % de bons conducteurs et de 25 % de mauvais conducteurs. Les bonsconducteurs ont une probabilité de 1

15 d’avoir un accident, alors que laprobabilité est de 1

10 pour les mauvais conducteurs. On suppose que lecoût d’un accident est de 1 000 et qu’au plus un accident peut survenirdans une année.

a) On choisit un assuré au hasard. Quelle est la probabilité que cet as-suré ait un accident dans l’année qui suit ?Soit les événements :

A : avoir un accidentB : être un bon conducteur.

On cherche Pr[A] sachant

Pr[A|B] =1

15

Pr[A|B] =1

10

Pr[B] =34

Pr[B] =14

.

14

Page 21: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Par la loi des probabilités totales,

Pr[A] = Pr[A|B]Pr[B] + Pr[A|B]Pr[B]

=

(115

)(34

)+

(1

10

)(14

)=

340

.

b) Quelle est la prime pure de cet assuré la première année ?Soit S le montant total des sinistres de cet assuré. On cherche E[S].On peut procéder de deux façons.1. À partir de la réponse en a), on a

Pr[S = x] =

#340 , x = 10003740 , ailleurs.

Par conséquent,

E[S] = 1000(

340

)= 75.

2. De l’énoncé on peut établir

Pr[S = x|B] =

#115 , x = 10001415 , ailleurs

et

Pr[S = x|B] =

#110 , x = 1000910 , ailleurs,

d’où

E[S|B] =2003

E[S|B] = 100.

Ainsi, on a

E[S] = E[E[S|type de conducteur]]= E[S|B]Pr[B] + E[S|B]Pr[B]

=2003

(34

)+ 100

(14

)= 75.

15

Page 22: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

c) L’assuré choisi en a) a eu un accident dans la première année. Quelleest la probabilité qu’il s’agisse d’un bon conducteur ?On cherche Pr[B|A]. Par la règle de Bayes,

Pr[B|A] =Pr[A|B]Pr[B]

Pr[A]

=( 1

15)(14)

340

=23 

34

.

d) Quelle est la prime pure de cet assuré pour la seconde année ?On cherche E[S|A]. Encore ici, on peut procéder de deux façons dif-férentes, mais équivalentes.1. On trouve la fonction de masse de probabilité de la variable aléa-

toire S|A. On a

Pr[A|A] = Pr[A|B]Pr[B|A] + Pr[A|B]Pr[B|A]

=

(1

15

)(23

)+

(1

10

)(13

)=

790

,

d’où

Pr[S = x|A] =

#790 , x = 10008390 , ailleurs.

et

E[S|A] = 1000(

790

)=

7009

.

2. On a

E[S|A] = E[S|B]Pr[B|A] + E[S|B]Pr[B|A]

=2003

(23

)+ 100

(13

)=

7009

.

16

Page 23: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

3.3 Modélisation de l’hétérogénéité

On utilise le modèle classique de crédibilité de précision tel qu’établipar Bühlmann (1967, 1969).

On a un portefeuille (groupe) hétérogène de I contrats. Le niveau derisque du contrat i = 1, . . . , I est inconnu, mais des données Si1, . . . , Sinsont disponibles pour fins de tarification.

Soit Θi une variable aléatoire représentant le niveau de risque du contrati. Cette variable aléatoire est

supposée constante dans le temps ;

non observable (facile sinon).

* * *

Dans l’exemple 3.1, la variable aléatoire a deux valeurs pos-sibles : θ = 1

15 et θ = 110 .

* * *

On note U(θ) la fonction de répartition de Θ, aussi appelée la fonctionde structure du portefeuille, et u(θ) la fonction de densité (ou masse) deprobabilité de Θ.

* * *

Dans l’exemple 3.1, on a

U(θ) =

$'&'%

0, θ   115

34 , 1

15 ¤ θ   110

1, θ ¥ 110

Pr[Θ = θ] =

#34 , θ = 1

1514 , θ = 1

10 .

* * *

On fait les hypothèses suivantes.

17

Page 24: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

1. Les observations du contrat i sont conditionnellement indépendanteset identiquement distribuées avec fonction de répartition F(x|θi).Conséquence : phénomène de contagion apparente. [Explication]

2. Les variables aléatoires Θ1, . . . , ΘI sont identiquement distribuées avecfonction de répartition U(θ).Conséquence : les contrats sont différents (chacun son niveau de risque),mais suffisamment similaires (les niveaux de risque proviennent tousdu même processus) pour justifier de les regrouper.

3. Les contrats sont indépendants.Conséquence : le dossier d’un contrat n’a pas d’influence sur les autrescontrats.

On a un modèle «urne d’urne» à deux étapes :1. choisir d’abord un niveau de risque selon U(θ) ;2. obtenir des montants de sinistres selon F(x|θi).

3.4 Prévision

Le but en crédibilité de précision consiste à calculer la «meilleure» pré-vision du montant total des sinistres (ou toute autre quantité d’intérêt)de la prochaine année, Si,n+1 pour i = 1, . . . , I.

On utilise l’erreur quadratique moyenne comme mesure de distance.

3.4.1 Prime de risque

Si le niveau de risque du contrat i est connu, alors la meilleure prévisionest l’espérance

µ(θi) = E[Sit|Θ = θi] =

» 80

x f (x|θi)dx.

Cette fonction est appelée la prime de risque. Or, le niveau de risque et, donc, la prime de risque sont inconnus ; prévoir Si,n+1 et prévoir µ(θi) deviennent donc des problèmes équiva-

lents.

18

Page 25: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

3.4.2 Prime collective

Comme première approximation de la prime de risque, on peut utiliserla moyenne pondérée de toutes les primes de risque possibles :

m = E[µ(Θ)] =

» 8�8

µ(θ)u(θ)dθ.

Cette approximation sera la même pour tous les contrats ; c’est la primecollective.

Remarque. On a

m = E[µ(Θ)] = E[E[Sit|Θ]] = E[Sit],

soit le montant moyen des sinistres dans le portefeuille.

3.4.3 Prime bayesienne

On l’a vu, la prime collective est globalement adéquate, mais pas néces-sairement équitable. En termes statistiques, cela signifie qu’il existe unemeilleure approximation des primes de risque lorsque des données sontdisponibles.

La meilleure approximation (ou estimation, ou prévision) de la prime derisque µ(θi) est la fonction des observations g�(Si1, . . . , Sin) minimisantl’erreur quadratique moyenne

E[(µ(Θ)� g(Si1, . . . , Sin))2],

où g() est une fonction quelconque.

On peut démontrer (voir un livre de statistique mathématique) que lafonction g�(Si1, . . . , Sin) est la prime bayesienne

Bi,n+1 � g�(Si1, . . . , Sin)

= E[µ(Θ)|Si1, . . . , Sin] =

» 8�8

µ(θ)u(θ|Si1, . . . , Sin)dθ,

19

Page 26: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

où u(θ|x1, . . . , xn) est la distribution a posteriori des niveaux de risque.En d’autres mots, U(θ|x1, . . . , xn) est la fonction de structure réviséeaprès l’observation de l’expérience Si1 = x1, . . . , Sin = xn.

Or, par la règle de Bayes et étant donné l’indépendance conditionnelledes observations,

u(θi|x1, . . . , xn) =f (x1, . . . , xn|θi)u(θi)³8�8 f (x1, . . . , xn|θ)u(θ)

=

±nt=1 f (xt|θi)u(θi)³8

�8

±nt=1 f (xt|θ)u(θ)dθ

9 u(θi)n¹

t=1

f (xt|θi).

Remarques.

1. La prime bayesienne est la meilleure prévision de Si,n+1 que l’onpuisse calculer.

2. Comme la prime collective, la prime bayesienne est une moyennepondérée des primes de risque, mais utilisant la distribution a poste-riori de Θ plutôt que la distribution a priori ; comparer

m =

» 8�8

µ(θ)u(θ)dθ

et

Bi,n+1 =

» 8�8

µ(θ)u(θ|Si1, . . . , Sin)dθ.

3. À l’inverse, on peut interpréter la prime collective comme la primebayesienne de première année, lorsque aucune expérience n’est dis-ponible.

4. L’ordre des sinistres n’est pas pris en compte dans les calculs puisque

f (x1, . . . , xn|θi) =n¹

t=1

f (xt|θi).

20

Page 27: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Exemple 3.2. Soit

St|Θ � Poisson(Θ)

et

Pr[Θ = θ] =

$'&'%

0,3, θ = 12

0,5, θ = 10,2, θ = 2.

a) Calculer les primes de risque.On a E[St|Θ = θ] = θ, d’où

µ(12) =

12

µ(1) = 1µ(2) = 2.

b) Calculer la prime collective.On a

m = E[µ(Θ)]

= E[Θ]

=12(0,3) + 1(0,5) + 2(0,2)

= 1,05.

On ne peut calculer la prime collective avec la formule m = E[St]puisque la distribution marginale est inconnue.

c) Calculer la prime bayesienne pour la troisième année si S1 = 2 etS2 = 1.

1. Calculer la distribution a posteriori de Θ :

Pr[Θ = θ|S1 = 2, S2 = 1] =Pr[S1 = 2, S2 = 1|Θ = θ]Pr[Θ = θ]°θ Pr[S1 = 2, S2 = 1|Θ = θ]Pr[Θ = θ]

21

Page 28: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Or,

Pr[S1 = 2, S2 = 1|Θ = θ] = Pr[S1 = 2|Θ = θ]Pr[S2 = 1|Θ = θ]

=θ2e�θ

2!θe�θ

1!

=θ3e�2θ

2et donc

Pr[Θ = θ|S1 = 2, S2 = 1] =

$'&'%

0,1245, θ = 12

0,6109, θ = 10,2646, θ = 2.

2. Calculer la prime bayesienne :

B3 = E[µ(Θ)|S1 = 2, S2 = 1]= E[Θ|S1 = 2, S2 = 1]

=12(0,1245) + 1(0,6109) + 2(0,2646)

= 1,20.

Dans le cas présent, 1,05 = m   B3   S = 1,5. Il importe de noter quece n’est pas toujours le cas avec la prime bayesienne.

Exemple 3.3. Considérer le portefeuille simplifié de l’exemple 1.1. Uncontrat ne peut avoir au maximum qu’un seul sinistre de montant 1 parannée. (En d’autres termes, l’expérience consiste en une suite de 1 et de0 selon qu’il y a eu un sinistre dans une année ou non.) La probabilitéd’avoir un sinistre est toutefois inconnue et potentiellement différentepour chaque contrat.

On a doncSt|Θ = θ � Bernoulli(θ),

où le paramètre θ est une réalisation d’une variable aléatoire Θ. Onsuppose une distribution bêta de paramètres α et β pour Θ. Ainsi, on a

f (x|θ) = θx(1� θ)1�x, x = 0,1

22

Page 29: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

et

u(θ) =Γ(α + β)

Γ(α)Γ(β)θα�1(1� θ)β�1, 0  θ   1.

a) Calculer la prime de risque.On a E[St|Θ = θ] = θ.

b) Calculer la prime collective.On a

m = E[µ(Θ)]

= E[Θ]

α + β.

c) Calculer la prime bayesienne après n années.Tout d’abord, la distribution a posteriori de Θ après n années d’ex-périence est, à une constante de proportionnalité près,

u(θ|x1, . . . , xn)9u(θi)n¹

t=1

f (xt|θi)

9θα�1(1� θ)β�1n¹

t=1

θxt(1� θ)1�xt

= θα+°n

t=1 xt�1(1� θ)β+n�°n

t=1 xt�1.

La distribution de Θ|S1 = x1, . . . , Sn = xn est donc toujours une bêta,mais avec de nouveaux paramètres α = α +

°nt=1 xt et β = β + n �°n

t=1 xt. Par conséquent, la prime bayesienne pour l’année n + 1 est

Bn+1 = E[µ(Θ)|S1, . . . , Sn]

= E[Θ|S1, . . . , Sn]

α + β

=α +

°nt=1 St

α + β + n.

23

Page 30: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Exemple 3.4. On reprend le modèle de l’exemple 3.3, soit

St|Θ = θ � Bernoulli(θ),

mais en changeant la distribution de la variable Θ pour une uniformesur l’intervalle (a, b).

Soit nS =°n

t=1 St le montant total des sinistres d’un contrat. Norberg(1979) démontre que la prime bayesienne avec ce modèle est

Bn+1 =

°n�nSj=1 (�1)j bnS+j+2�anS+j+2

(n�nS�j)! j! (nS+j+2)°n�nSj=1 (�1)j bnS+j+1�anS+j+1

(n�nS�j)! j! (nS+j+1)

.

Cette prime bayesienne n’est pas linéaire et, de plus, elle ne se trouve pasnécessairement entre l’expérience individuelle S et la prime collective m.

3.5 Approche par la distribution prédictive

On a déjà vu à la section 3.4.2 que

m = E[µ(Θ)] = E[Sit].

De manière similaire, on peut démontrer que

Bi,n+1 = E[µ(Θ)|Si1, . . . , Sin] = E[Si,n+1|Si1, . . . , Sin].

La distribution de Sn+1|S1, . . . , Sn avec fonction de densité de probabilitéf (x|x1, . . . , xn) est appelée la distribution prédictive de la variable aléatoireSn+1.

Théorème 3.1. La fonction de densité de probabilité de la distribution prédic-tive de Sn+1 est

f (x|x1, . . . , xn) =

» 8�8

f (x|θ)u(θ|x1, . . . , xn)dθ.

24

Page 31: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Démonstration.

f (x|x1, . . . , xn) =f (x, x1, . . . , xn)

f (x1, . . . , xn)

=

³8�8 f (x, x1, . . . , xn|θ)u(θ)dθ³8�8 f (x1, . . . , xn|θ)u(θ)dθ

=

» 8�8

f (x|θ)f (x1, . . . , xn|θ)u(θ)³8

�8 f (x1, . . . , xn|θ)u(θ)dθdθ

=

» 8�8

f (x|θ)u(θ|x1, . . . , xn)dθ.

Remarque. Puisque

f (x) =» 8�8

f (x|θ)u(θ)dθ,

alors la seule différence entre l’expression de f (x) et celle de f (x|x1, . . . , xn)réside dans l’utilisation de la distribution a priori de Θ pour la premièreet de la distribution a posteriori pour la seconde. Par conséquent,

u(θ|x1, . . . , xn) du mêmetype que u(θ) ñ

f (x|x1, . . . , xn) du mêmetype que f (x).

Du théorème 3.1, on a

E[µ(Θ)|Si1 = x1, . . . , Sin = xn] =

» 8�8

µ(θ)u(θ|x1, . . . , xn)dθ

=

» 8�8

(» 80

x f (x|θ)dx)

u(θ|x1, . . . , xn)dθ

=

» 8�8

» 80

x f (x|θ)u(θ|x1, . . . , xn)dx dθ

=

» 80

x(» 8

�8f (x|θ)u(θ|x1, . . . , xn)dθ

)dx

=

» 80

x f (x|x1, . . . , xn)dx

= E[Si,n+1|Si1 = x1, . . . , Sin = xn].

25

Page 32: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Avec cette approche, la prime collective et la prime bayesienne s’inter-prètent toutes deux comme le montant moyen des sinistres dans le por-tefeuille, mais avec des pondérations différentes.

3.6 Crédibilité bayesienne linéaire (ou exacte)

La prime bayesienne de l’exemple 3.3 peut se réécrire sous la forme

Bn+1 =α +

°nt=1 St

α + β + n

=n

n + α + βS +

α + β

n + α + β

α

α + β

= zS + (1� z)m,

oùz =

nn + K

, K = α + β.

Une prime de la forme

πn+1 = zS + (1� z)m

est appelée prime de crédibilité et 0¤ z ¤ 1 est le facteur de crédibilité.

Whitney (1918) et Bailey (1950) furent les premiers à démontrer que laprime bayesienne est une prime de crédibilité pour certaines combinai-sons de distributions.

Exemple 3.5 (Cas Poisson/gamma). Soit

St|Θ = θ � Poisson(θ)Θ �Gamma(α, λ),

c’est-à-dire

f (x|θ) =θxe�θ

x!, x = 0,1, . . .

u(θ) =λα

Γ(α)θα�1e�λθ , θ ¡ 0.

26

Page 33: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

a) Calculer la prime de risque.On a

µ(θ) = E[St|Θ = θ] = θ.

On calcule également, pour usage futur,

σ2(θ) = Var[St|Θ = θ] = θ.

b) Calculer la prime collective.On a

m = E[µ(Θ)] = E[Θ] =α

λ.

c) Calculer la prime bayesienne à partir de la distribution a posterioride Θ.Tout d’abord, on a

u(θ|x1, . . . , xn)9u(θ)n¹

t=1

f (xt|θ)

9θα�1e�λθn¹

t=1

θxt e�θ

= θα+°n

t=1 xt�1e�(λ+n)θ ,

d’où Θ|S1, . . . , Sn � Gamma(α = α +°n

t=1 St, λ = λ + n). Par consé-quent, la prime bayesienne est

Bn+1 = E[µ(Θ)|S1, . . . , Sn]

= E[Θ|S1, . . . , Sn]

λ

=α +

°nt=1 St

λ + n

=n

n + λS +

λ

n + λ

α

λ

= zS + (1� z)m

avecz =

nn + λ

.

La prime bayesienne est donc linéaire dans le cas Poisson/gamma.

27

Page 34: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

d) Calculer la distribution marginale de St.On a

f (x) =» 8

0f (x|θ)u(θ)dθ

=λα

Γ(α)x!

» 80

θxe�θθα�1e�λθ dθ

=λα

Γ(α)Γ(x + 1)

» 80

θα+x�1e�(λ+1)θ dθ

=λα

Γ(α)Γ(x + 1)Γ(α + x)(λ + 1)α+x

=Γ(α + x)

Γ(α)Γ(x + 1)

λ + 1

)α( 1λ + 1

)x

=

(α + x� 1

α� 1

)pα(1� p)x, x = 0,1, . . . ,

d’où St � Binomiale négative(r = α, p = λλ+1). Par conséquent,

m = E[St] =r(1� p)

p=

α

λ.

Astuce : on peut obtenir le même résultat par les fonctions généra-trices des moments :

MS(t) = E[etS]

= E[E[etS|Θ]]

= E[MS|Θ(t)]

= E[eΘ(et�1)]

= MΘ(et � 1)

=

λ + 1� et

=

λ+1

1� 1λ+1 et

,

ce qui est la fonction génératrice des moments d’une binomiale né-gative de paramètres α et λ

λ+1 .

28

Page 35: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

e) Calculer la prime bayesienne à partir de la distribution prédictive.Puisque

Θ �Gamma(α, λ)

etΘ|S1 = x1, . . . , Sn = xn �Gamma(α, λ),

alors

Sn+1|S1 = x1, . . . , Sn = xn � Binomiale négative(r, p)

avec

r = α = α +n

t=1

xt

p =λ

λ + 1=

λ + nλ + n + 1

.

Par conséquent,

Bn+1 = E[Sn+1|S1, . . . , Sn]

λ

=α +

°nt=1 St

λ + n.

f) Calculer Var[S].On peut procéder de deux façons.

1. En conditionnant sur Θ :

Var[S] = E[Var[S|Θ]] + Var[E[S|Θ]]

= E[σ2(Θ)] + Var[µ(Θ)]

= E[Θ] + Var[Θ]

λ+

α

λ2

=α(λ + 1)

λ2 .

29

Page 36: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

2. Directement depuis la marginale :

Var[S] =r(1� p)

p2

=α(λ + 1)

λ2 .

g) Calculer la prime bayesienne pour les dix prochaines années si apriori Θ � Gamma(3,3) et que les montants de sinistres au coursde ces années sont les suivants : 5, 3, 0, 1, 1, 2, 0, 2, 0, 2.La prime bayesienne dans le cas Poisson/gamma est

Bn+1 =α +

°nt=1 xt

λ + n.

On a donc le tableau suivant :

n xn°

xt α +°

xt λ + n Bn+1

0 – – 3 3 11 5 5 8 4 22 3 8 11 5 2,23 0 8 11 6 1,834 1 9 12 7 1,715 1 10 13 8 1,6256 2 12 15 9 1,6677 0 12 15 10 1,58 2 14 17 11 1,549 0 14 17 12 1,42

10 2 16 19 13 1,46

Conclusions :

La distribution a posteriori de Θ est de plus en plus concentrée au-tour de sa moyenne au fur et à mesure que l’expérience s’accumule(voir les figures 3.1–3.4).

La précision de la prime bayesienne s’améliore (la vraie valeur deθ est 1,48 dans cet exemple).

30

Page 37: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

0 1 2 3 4

0.0

0.2

0.4

0.6

0.8

A priori

Figure 3.1: Distribution gammaavec α = 3 et λ = 3. L’espéranceest égale à 1.

0 1 2 3 4

0.0

0.1

0.2

0.3

0.4

0.5

0.6

Après 1 année

Figure 3.2: Distribution gammaavec α = 8 et λ = 4. L’espéranceest égale à 2.

0 1 2 3 4

0.0

0.2

0.4

0.6

0.8

Après 5 années

Figure 3.3: Distribution gammaavec α = 13 et λ = 8. L’espéranceest égale à 1,625.

0 1 2 3 4

0.0

0.2

0.4

0.6

0.8

1.0

1.2

Après 10 années

Figure 3.4: Distribution gammaavec α = 19 et λ = 13. L’espé-rance est égale à 1,46.

31

Page 38: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Exemple 3.6 (Cas exponentielle/gamma). Soit

St|Θ = θ � Exponentielle(θ)Θ �Gamma(α, λ).

La prime de risque est

µ(θ) =1θ

et la variance conditionnelle est

σ2(θ) =1θ2 .

La prime collective est

m = E[

]=

λα

Γ(α)

» 80

θα�1�1e�λθ dθ

=λα

Γ(α)Γ(α� 1)

λα�1

α� 1.

La distribution a posteriori de Θ est

u(θ|x1, . . . , xn)9θα�1e�λθn¹

t=1

θe�θxt

= θα+n�1e�(λ+°n

t=1 xt)θ ,

d’où Θ|S1, . . . , Sn �Gamma(α = α + n, λ = λ +°n

t=1 St).

32

Page 39: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Quant aux distributions marginale et prédictive, on a

f (x) =λα

Γ(α)

» 80

θe�θθα�1e�λθ dθ

=λα

Γ(α)

» 80

θα+1�1e�(λ+x)θ dθ

=λα

Γ(α)Γ(α + 1)(λ + x)α+1

=αλα

(λ + x)α+1 , x ¡ 0,

d’où St � Pareto(α, λ) et

Sn+1|S1 = x1, . . . , Sn = xn � Pareto(α = α + n, λ = λ +°n

t=1 xt).

La prime bayesienne est donc

Bn+1 = E[Θ�1|S1, . . . , Sn]

= E[Sn+1|S1, . . . , Sn]

α� 1

=λ +

°nt=1 St

α + n� 1

=n

n + α� 1S +

α� 1n + α� 1

λ

α� 1= zS + (1� z)m

avec

z =n

n + α� 1.

La prime bayesienne est donc linéaire.

Exemple 3.7 (Cas normale/normale). Soit

St|Θ �Normale(Θ, σ22 )

Θ �Normale(µ, σ21 ).

33

Page 40: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Alors,

µ(Θ) = Θ

σ2(Θ) = σ22 (constante)

et

m = E[Θ] = µ.

Trouver la distribution a posteriori n’est toutefois pas une sinécure. Toutd’abord,

u(θ|x1, . . . , xn)9e�(θ�µ)2/2σ21 e�

°nt=1(xt�θ)2/2σ2

2 .

En développant l’exposant tout en laissant de côté tous les termes nonfonction de θ, on obtient

Exposant = �12

[θ2 � 2θµ

σ21

+n

t=1

�2θxt + θ2

σ22

+ cte

]

= �12

[θ2

(1σ2

1+

nσ2

2

)�

2θµ

σ21��2θ

°nt=1 xt

σ22

+ cte

]

= �12

(1σ2

1+

nσ2

2

)loooooomoooooon

φ

θ2 �2θµ/σ2

1

( 1σ2

1+ n

σ22)��2θ

°nt=1 xt/σ2

2

( 1σ2

1+ n

σ22)

+ cte

= �12

φ

[θ2 � 2θ

(µ/σ2

1 +°n

t=1 xt/σ22

φ

)+ cte

]

= �12

(θ �

φσ21+°n

t=1 xtφσ2

2

))2

1/φ+ cte.

Par conséquent,

Θ|S1 = x1, . . . , Sn = xn �Normale(µ, σ21 )

34

Page 41: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

avec

σ21 =

=σ2

1 σ22

σ22 + nσ2

1

=σ2

11 + nσ2

1 /σ22  σ2

1

et

µ =µ

φσ21+

°nt=1 xt

φσ22

=µσ2

2 + σ21°n

t=1 xt

σ22 + nσ2

1.

La distribution marginale de S est plus aisée à trouver à l’aide des fonc-tions génératrice des moments. En effet,

MS(t) = E[E[etS|Θ]]

= E[eΘt+σ22 t2/2]

= eσ22 t2/2E

[eΘt]

= eσ22 t2/2eµt+σ2

1 t2/2

= eµt+(σ21+σ2

2 )t2/2

et donc

S �Normale(µ, σ21 + σ2

2 ).

Puisque la distribution a posteriori de Θ est du même type que la dis-tribution a priori, on peut immédiatement conclure que

Sn+1|S1, . . . , Sn �Normale(µ, σ21 + σ2

2 ).

35

Page 42: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

La prime bayesienne est donc, en utilisant indifféremment l’approche dela distribution a posteriori ou de la prédictive,

Bn+1 = µ

=nσ2

1nσ2

1 + σ22

S +σ2

2nσ2

1 + σ22

µ

= zS + (1� z)m

z =n

n + σ22 /σ2

1.

Il y a en fait cinq combinaisons de distributions qui résultent en uneprime bayesienne linéaire (plus leurs convolutions) :1. Poisson/gamma2. Exponentielle/gamma3. Normale/normale4. Bernoulli/bêta5. Géométrique/bêta.Les formules de crédibilité exacte pour les combinaisons de distribu-tions issues de la famille exponentielle sont rassemblées dans l’annexeA du recueil d’exercices. Les commentaires suivants se rapportent à cesrésultats.

1. Dans le cas normale/normale, on a

σ21 =

σ21

nσ2

1σ2

2+ 1

¤ σ21 ,

avec égalité seulement lorsque σ21 = 0 (le cas σ2

2 = 8 ne présentantaucun intérêt). Cette inégalité s’interprète comme une baisse de l’in-certitude quant au niveau de risque d’un contrat au fur et à mesureque l’expérience s’accumule.

36

Page 43: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

2. Le cas normale/normale est celui considéré par Whitney (1918), maisaussi celui dont les formules sont les plus complexes. Cela expliquesans doute en partie qu’il ait éventuellement recommandé de fixer Kau jugement.

3. Dans tous les cas, z Ñ 1 lorsque n Ñ8. Le poids accordé à la primeindividuelle d’un contrat va donc croissant avec le nombre d’annéesd’expérience disponible.

4. De plus, z = n/(n + K)Ñ 1 lorsque K Ñ 0 et z Ñ 0 lorsque K Ñ8.Dans le cas Poisson/gamma, où K = λ, une petite valeur de λ corres-pond à une grande incertitude quant au niveau de risque θ (la courbegamma sera très évasée, voir la figure 3.5). On accorde donc peu depoids à la prime collective, d’où un grand facteur de crédibilité.

5. Dans le cas normale/normale, K est grand si σ22 est également grand

ou alors si σ21 est petit. Respectivement, cela signifie que ou bien l’ex-

périence est potentiellement si volatile que l’on ne peut s’y fier, oubien que le niveau de risque θ est presque connu avec certitude. Dansun cas comme dans l’autre, il convient de charger la prime collective.On peut répéter une telle analyse pour chacun des autres cas.

6. À un haut niveau de risque ne correspond pas nécessairement unegrande valeur de θ, comme en fait foi le cas exponentielle/gamma.

3.7 Le modèle de Jewell

Le modèle de crédibilité exacte de Jewell unifie les résultats des cinq casspéciaux étudiés précédemment.

En analyse bayesienne, si u(θ|x1, . . . , xn) appartient à la même familleque u(θ), on dit de u(θ) et f (x|θ) qu’elles sont des conjuguées naturelles.

Les lois de Poisson, exponentielle, normale, Bernouilli et géométriqueappartiennent toutes à la famille exponentielle univariée, c’est-à-dire queleur fonction de densité (ou de probabilité) peut s’écrire sous la forme

f (x|θ) =p(x)e�θx

q(θ).

37

Page 44: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

0 2 4 6 8 10

0.0

0.2

0.4

0.6

0.8

Gamma(3, 3)Gamma(3, 1/2)

Figure 3.5: Distributions gamma avec différents paramètres d’échelle λ.

Jewell (1974) démontre que lorsqu’une fonction de vraisemblance estcombinée avec sa conjuguée naturelle, alors la prime bayesienne esttoujours une prime de crédibilité exacte.

Goel (1982) conjecture que ceci n’arrive qu’avec les membres de lafamille exponentielle :

– il ne peut le prouver ;

– il ne peut non plus donner de contre-exemple.

38

Page 45: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

4 Le modèle de crédibilité deBühlmann

On a deux problèmes pratiques en crédibilité bayesienne :1. la prime bayesienne est une prime de crédibilité dans certains cas

seulement ;2. la prime repose sur des hypothèses très subjectives pour les distribu-

tions de Θi et Sit|Θi.Pour pallier au premier problème, Bühlmann (1967) restreint l’approxi-mation de la prime de risque aux fonctions linéaires des observations,c’est-à-dire de la forme

c0 +n

t=1

ctSit.

On verra que la meilleure approximation est une prime de crédibilité.

Quant au second problème, il sera contourné en utilisant une approchenon paramétrique pour calculer la prime de crédibilité, tel que proposépar Bühlmann (1969).

4.1 Notation et relations de covariance

On définit la notation suivante :

s2 = E[Var[Sit|Θi]]

= E[σ2(Θi)]

= EVPV de la CAS

39

Page 46: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

a = Var[E[Sit|Θi]]

= Var[µ(Θi)]

= VHM de la CAS.

Théorème 4.1. Soit X, Y et Θ des variables aléatoires dont la densité conjointeexiste. Alors

Cov(X,Y) = Cov(E[X|Θ], E[Y|Θ]) + E[Cov(X,Y|Θ)].

Démonstration. En premier lieu, noter qu’une espérance conditionnelleest une variable aléatoire. Nous utiliserons également ces deux proprié-tés : pour toute variable aléatoire Y,

E[Y] = E[E[Y|Θ]]

et

E[Y� E[Y]] = 0.

Or,

Cov(X,Y) = E[(X � E[X])(Y� E[Y])]= E[(X � E[X|Θ] + E[X|Θ]� E[X])�

(Y� E[Y|Θ] + E[Y|Θ]� E[Y])]= E[E[(X � E[X|Θ])(Y� E[Y|Θ])|Θ]]

+ E[E[(X � E[X|Θ])(E[Y|Θ]� E[Y])|Θ]]

+ E[E[(E[X|Θ]� E[X])(Y� E[Y|Θ])|Θ]]

+ E[(E[X|Θ]� E[X])(E[Y|Θ]� E[Y])]= E[E[(X � E[X|Θ])(Y� E[Y|Θ])|Θ]]

+ E[(E[Y|Θ]� E[Y])E[X � E[X|Θ]|Θ]]

+ E[(E[X|Θ]� E[X])E[Y� E[Y|Θ]|Θ]]

+ E[(E[X|Θ]� E[X])(E[Y|Θ]� E[Y])]= E[Cov(X,Y|Θ)] + 0 + 0 + Cov(E[X|Θ], E[Y|Θ]).

40

Page 47: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Corollaire 4.1. En posant X � Y dans le théorème 4.1, on obtient

Var[X] = E[Var[X|Θ]] + Var[E[X|Θ]].

Théorème 4.2. Soit S1, . . . , Sn des variables aléatoires conditionnellement in-dépendantes sachant la variable aléatoire Θ et

E[St|Θ] = µ(Θ), t = 1, . . . , n

Var[St|Θ] = σ2(Θ), t = 1, . . . , n.

Alors

Cov(St, Su) =

#a, t � ua + s2, t = u

= a + δtus2, t, u = 1, . . . , nCov(µ(Θ), St) = a,

où δtu est le delta de Kronecker :

δtu =

#1, t = u0, t � u.

Démonstration. Pour le premier résultat, on a

Cov(St, Su) = Cov(E[St|Θ], E[Su|Θ]) + E[Cov(St, Su|Θ)]

= Cov(µ(Θ), µ(Θ)) + E[δtuVar[St|Θ]]

= Var[µ(Θ)] + δtuE[σ2(Θ)]

= a + δtus2.

De plus,

Cov(µ(Θ), St) = Cov(µ(Θ), E[St|Θ]) + E[Cov(µ(Θ), St|Θ)]

= Var[µ(Θ)] + E[0]= a.

41

Page 48: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

4.2 Modèle et prévision

Le modèle pour portefeuille hétérogène est similaire à celui utilisé encrédibilité bayesienne, mais on relâche légèrement les hypothèses.

Schématiquement, on a

Variables non Observationsobservables 1 . . . t . . . n

Θ1 S11 . . . S1t . . . S1n...

......

Θi Si1 . . . Sit . . . Sin...

......

ΘI SI1 . . . SIt . . . SIn

Chaque contrat est donc caractérisé par

1. un niveau de risque θi réalisation d’une variable aléatoire Θi ;

2. des observations (Si1, . . . , Sin) � Si.

Les hypothèses du modèle de Bühlmann sont les suivantes (version lamoins restrictive).

(B1) Les contrats (Θi, Si), i = 1, . . . , I sont indépendants, les variablesaléatoires Θ1, . . . , ΘI sont identiquement distribuées et les variablesaléatoires Sit ont une variance finie.

(B2) Les variables aléatoires Sit, sont telles que

E[Sit|Θi] = µ(Θi) i = 1, . . . , I

Cov(Sit, Siu|Θi) = δtuσ2(Θi), t, u = 1, . . . , n.

Remarques.

1. L’hypothèse d’indépendance entre les contrats peut ne pas être réa-liste, mais a) elle simplifie les calculs ; et b) c’est une bonne approxi-mation dans plusieurs cas.

2. Hypothèse (B1) : indépendance inter contrats (between).

42

Page 49: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

3. Hypothèse (B2) : homogénéité temporelle et «indépendance» intracontrats (within), c’est-à-dire :

µ(Θi) constante dans le temps ;

observations conditionnellement non corrélées.

Théorème 4.3. Pour un portefeuille tel qu’illustré précédemment et sous leshypothèses (B1) et (B2), la meilleure approximation linéaire non homogène dela prime de risque µ(Θi) est

πBi,n+1 = zSi + (1� z)m

Si =1n

n

t=1

Sit

z =n

n + K, K =

s2

a.

Démonstration. On se restreint aux approximations de la prime de risquede la forme ci

0 +°I

j=1°n

t=1 cijtSjt. Il faut donc trouver les constantes

ci0, ci

11, . . . , cikn minimisant

E[(

µ(Θi)� ci0 �

I

j=1

n

t=1

cijtSjt

)2]

.

Par indépendance entre les contrats, on sait déjà que la prime de cré-dibilité du contrat i sera une fonction de ses observations seulement.On peut donc réduire le problème à trouver les constantes c0, c1, . . . , cnminimisant

E[(

µ(Θi)� c0 �n

t=1

ctSit

)2]

.

43

Page 50: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

En calculant les dérivées partielles, d’abord par rapport à c0, puis parrapport à cu, u = 1, . . . , n, on obtient

c0 = E[µ(Θi)]�n

t=1

ctE[Sit] (4.1)

Cov(µ(Θi), Siu) =n

t=1

ct Cov(Sit, Siu). (4.2)

Or, l’équation (4.2) peut se réécrire

a =n

t=1

ct(a + δtus2)

= an

t=1

ct + cus2.

Par symétrie, on peut conclure que

c1 = c2 = � � �= cn = c =a

an + s2 .

De l’équation (4.1), on obtient

c0 = (1� nc)m

et donc

πBi,n+1 = c0 +

n

t=1

ctSit

=an

an + s2

n

t=1

Sit

n+

(1�

anan + s2

)m

= zSi + (1� z)m

avec z = n/(n + s2/a).

Remarques.

44

Page 51: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

1. Remplacer µ(Θi) dans le théorème par Si,n+1 ne change rien puisque

E[µ(Θi)] = E[Si,n+1] = m

et

Cov(µ(Θi), Sit) = Cov(Si,n+1, Sit) = a

pour t = 1, . . . , n.

2. La prime de crédibilité a deux belles propriétés :

a) elle est sans biais, c’est-à-dire que

E[πBi,n+1] = zE[Si] + (1� z)m = m.

En moyenne, l’assureur perçoit donc suffisamment de primes pourpayer les sinistres ;

b) puisque SinÑ8ÝÑ µ(Θi) et z nÑ8

ÝÑ 1 alors πBi,n+1

nÑ8ÝÑ µ(Θi).

3. Puisque πBi,n+1 est sans biais, une mauvaise estimation du facteur de

crédibilité n’a pas d’impact négatif sur le montant des primes perçupar l’assureur.

4. À cause de l’indépendance des contrats, les données collatérales, lesdonnées des autres contrats, n’entrent pour le moment pas dans l’es-timation de µ(Θi) (ci

jt = 0 pour j � i).

5. Une approximation linéaire homogène de µ(Θi) est de la forme

I

j=1

n

t=1

cijtSjt.

Il est facile de démontrer que l’approximation est alors

zXi + (1� z)S, S =1I

I

i=1

Si.

6. La prime de crédibilité peut aussi s’écrire sous la forme

πBi,n+1 = m + z(Si �m).

45

Page 52: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Il est intéressant de constater que la meilleure approximation linéaire dela prime de risque est également la meilleure approximation linéaire dela prime bayesienne.

Théorème 4.4. Si πBi,n+1 est la combinaison linéaire des observations minimi-

sant

E[(

µ(Θi)� c0 �n

t=1

ctSit

)2]

,

alors πBi,n+1 minimise également

E[(

Bi,n+1 � c0 �n

t=1

ctSit

)2]

,

où Bi,n+1 = E[µ(Θi)|Si].

Démonstration. On a

E[(

µ(Θi)� c0 �n

t=1

ctSit

)2]

= E[(

µ(Θi)� Bi,n+1

)2]

+ 2E[

E[(

µ(Θi)� Bi,n+1

)(Bi,n+1 � c0 �

n

t=1

ctSit

)���Si

]]

+ E[(

Bi,n+1 � c0 �n

t=1

ctSit

)2]

= E[(

Bi,n+1 � c0 �n

t=1

ctSit

)2]+ 0 + constante.

Corollaire 4.2. On a

E[(µ(Θi)� πBi,n+1)

2] ¥ E[(µ(Θi)� Bi,n+1)2],

l’égalité survenant lorsque la prime bayesienne est une prime de crédibilité.

46

Page 53: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Ce résultat s’interprète comme une minimisation en deux étapes :

1. trouver la meilleure approximation de la prime de risque (primebayesienne) ;

2. trouver la meilleure approximation linéaire de la prime bayesienne(prime de crédibilité).

4.3 Approche paramétrique

Dans un premier temps, on peut considérer que les distributions deSit|Θi et de Θi sont connues, comme en crédibilité bayesienne.

La notion de portefeuille n’est alors pas nécessaire puisque l’on déter-mine les distributions pour chaque contrat. On peut laisser tomber l’in-dice i dans les formules.

Il est maintenant très simple de calculer la prime de crédibilité de Bühl-mann pour n’importe quelle combinaison de distributions.

Exemple 4.1 (Bernoulli/uniforme). On a vu à l’exemple 3.4 que si

St|Θ = θ � Bernoulli(θ)Θ �U(a, b),

alors la prime bayesienne est très compliquée. Ici, µ(θ) = θ et σ2(θ) =θ(1� θ), d’où

m = E[µ(Θ)]

= E[Θ]

=a + b

2s2 = E[σ2(Θ)]

= E[Θ]� E[Θ2]

=a + b

2+

a2 + ab + b2

3

47

Page 54: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

a = Var[µ(Θ)]

= Var[Θ]

=(b� a)2

12,

donc

K =s2

a

=6(a + b)� 4(a2 + ab + s2)

(b� a)2

et

πBn+1 =

nn + K

S +

(1�

nn + K

)a + b

2.

Exemple 4.2 (Poisson/gamma). On a

St|Θ = θ � Poisson(θ)Θ �Gamma(α, λ).

On sait déjà que µ(θ) = σ2(θ) = θ. Par conséquent,

m = E[Θ] =α

λ

s2 = E[Θ] =α

λ

a = Var[Θ] =α

λ2 ,

d’où

K =s2

a= λ

et

πBn+1 =

nn + λ

S +λ

n + λ

α

λ.

48

Page 55: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Exemple 4.3. Soit

St|Θ = θ � Exponentielle(θ)Θ �Gamma(α, λ).

Alors,

µ(Θ) =1Θ

,

σ2(Θ) =1

Θ2

et donc

s2 = E[

1Θ2

]a = E

[1

Θ2

]� E

[1Θ

]2

.

Or, pour k PZ,

E[Θk] =λα

Γ(α)

» 80

θα+k�1e�λθ dθ

=λα

Γ(α)Γ(α + k)

λα+k

» 80

λα+k

Γ(α + k)θα+k�1e�λθ dθ

=Γ(α + k)Γ(α)λk

=

$''''&''''%

α(α + 1) � � � (α + k� 1)λk , k ¥ 1

1, k = 0λ|k|

(α� 1)(α� 2) � � � (α� |k|), k ¤�1, |k|   α.

On a donc

E[Θ�1] =λ

α� 1

E[Θ�2] =λ2

(α� 1)(α� 2)

49

Page 56: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

et ainsi

s2 =λ2

(α� 1)(α� 2)

a =λ2

(α� 1)(α� 2)�

λ2

(α� 1)2

=λ2

(α� 1)2(α� 2).

Finalement,

K =s2

a= α� 1

et le facteur de crédibilité dans la prime de Bühlmann est donc

z =n

n + α� 1,

tel qu’obtenu à l’exemple 3.6.

4.4 Approche non paramétrique

En pratique, l’approche paramétrique est d’un intérêt limité puisqu’ellenécessite toujours de déterminer les distributions de Sit|Θi et Θi.

Avec l’approche non paramétrique, nous délaissons l’approche baye-sienne pure pour l’approche bayesienne empirique.

Nous avons plusieurs réalisations de la variable aléatoire Θ.

U(θ) est la fonction de structure du portefeuille :

– avant : opinion a priori de l’assureur sur le niveau de risque d’uncontrat ;

– maintenant : proportion de contrats avec un niveau de risque in-férieur ou égal à θ, distribution des niveaux de risque entre lescontrats.

50

Page 57: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Homogénéité du portefeuille : à quel point les moyennes des contratssont semblables.

Nous devons estimer les paramètres de structure du portefeuille :

1. m = E[µ(Θ)], moyenne du portefeuille ;

2. s2 = E[σ2(Θ)], variabilité moyenne du portefeuille, homogénéitétemporelle ;

3. a = Var[µ(Θ)], variance entre les moyennes des contrats, homogé-néité du portefeuille.

Nous développons des estimateurs sans biais des paramètres.

4.4.1 Estimation de m

Intuitivement,

m = S =1In

I

i=1

n

t=1

Sit.

L’estimateur est effectivement sans biais :

E[m] =1In

I

i=1

n

t=1

E[Sit]

=1In

I

i=1

n

t=1

m

= m.

4.4.2 Estimation de s2

Un estimateur sans biais de la variance du contrat i = 1, . . . , n est

1n� 1

n

t=1

(Sit � Si)2, n ¥ 2.

51

Page 58: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Pour obtenir un estimateur sans biais de s2, on prend la moyenne detous ces estimateurs :

s2 =1

I(n� 1)

I

i=1

n

t=1

(Sit � Si)2.

Pour démontrer l’absence de biais, on note d’abord que

E[(Sit � Si)2|Θi] = Var[Sit � Si|Θi]

= Var[Sit|Θi] + Var[Si|Θi]� 2Cov(Sit, Si|Θi)

= σ2(Θi) +σ2(Θi)

n� 2

σ2(Θi)

n

=n� 1

nσ2(Θi).

Par conséquent,

E[(Sit � Si)2] = E[E[(Sit � Si)

2|Θi]]

=n� 1

nE[σ2(Θi)]

=n� 1

ns2

et

E[s2] =1

I(n� 1)

I

i=1

n

t=1

n� 1n

s2

= s2.

4.4.3 Estimation de a

Un estimateur intuitif de a = Var[µ(Θ)] est

1I � 1

I

i=1

(Si � S)2.

52

Page 59: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Or, cet estimateur est biaisé. En effet, on a

E[(Si � S)2] = Var[Si � S]= Var[Si] + Var[S]� 2Cov(Si, S).

Par indépendance entre les contrats, on a

Cov(Si, S) =1I

I

j=1

Cov(Si, Sj)

=1I

Var[Si]

et

Var[S] =Var[Si]

I,

d’oùE[(Si � S)2] =

I � 1I

Var[Si].

et

E

[1

I � 1

I

i=1

(Si � S)2

]= Var[Si].

Or,

Var[Si] = Var[E[Si|Θi]] + E[Var[Si|Θi]]

= Var[µ(Θi)] + E[

σ2(Θi)

n

]= a +

s2

n.

Un estimateur sans biais de a est donc

a =1

I � 1

I

i=1

(Si � S)2 �1n

s2.

Problème : l’estimateur a peut être négatif. En pratique, on posera

a1 = max(a, 0),

qui est un estimateur biaisé.

53

Page 60: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

4.4.4 Prime de crédibilité

On estime la prime de crédibilité en remplaçant chaque paramètre in-connu par son estimateur :

πBi,n+1 = zSi + (1� z)m

z =n

n + s2/a.

Bien que tous les estimateurs soient sans biais, on ne peut conclure queE[K] = K et donc que E[z] = z. Par conséquent, l’estimateur de la primede crédibilité est fort probablement biaisé.

Exemple 4.4. Soit le portefeuille de I = 3 contrats suivant après n = 6années d’expérience.

Années

Contrat 1 2 3 4 5 6

1 0 1 2 1 2 02 3 4 2 1 4 43 3 3 2 1 2 1

Calculer la prime de crédibilité pour la septième année pour chacun descontrats.

Tout d’abord, on a

S1 = 1 S2 = 3 S3 = 2

et S = 2. On doit par la suite calculer les estimateurs des paramètres de

54

Page 61: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

structure :

m = S = 2

s2 =1I

I

i=1

1n� 1

n

t=1

(Sit � Si)2

=13

[45+

85+

45

]=

1615

a =1

I � 1

I

i=1

(Si � S)2 �1n

s2

=22�

16�

1615

=3745

.

Par conséquent, K = 48/37� 1,30 et

z =6

6 + 1,30= 0,82,

d’où

πB1,7 = 0,82(1) + 0,18(2) = 1,18

πB2,7 = 2,82

πB3,7 = 2.

On peut obtenir les mêmes résultats avec la fonction cm de actuar (Du-tang et collab., 2008).

### ACT 2008### Mathématiques actuarielles IARD II###### Vincent Goulet### École d’actuariat , Université Laval###### FICHIER###### exemple_4.4.R###### CONTENU###

55

Page 62: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

### Calculs de l’exemple 4.4 avec la fonction cm() de actuar

## Charger le package actuar en mémoirelibrary(actuar)

## Les données doivent se trouver dans un data frame ou une matrice ,## avec une colonne pour identifier le "numéro" du contrat. Les## colonnes doivent être étiquetées.(x <- data.frame(contract = 1:3,

matrix(c(0, 3, 3,1, 4, 3,2, 2, 2,1, 1, 1,2, 4, 2,0, 4, 1), nrow = 3)))

## Ajustement du modèle de Bühlmann aux données. Par défaut , la## fonction considérera que toutes les colonnes (autres que celles## présentes dans la formule) contiennent des données.(fit <- cm(~ contract , x)) # appel simple(fit <- cm(~ contract , x, ratios = X1:X6)) # équivalent ici

## Calcul des primes de crédibilité.predict(fit)

## Résultats détaillés.summary(fit)

4.5 Interprétation des résultats

On s’attarde principalement au facteur de crédibilité

z =n

n + K, K =

s2

a=

E[σ2(Θ)]

Var[µ(Θ)].

56

Page 63: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Le facteur de crédibilité augmente — un plus grand poids est donné àl’expérience individuelle — dans les situations suivantes :

1. le nombre d’années d’expérience est grand, n Ñ 8. À long terme,l’expérience d’un contrat représente exactement son niveau de risque.C’est la même situation qu’en crédibilité de stabilité, c’est-à-dire quele niveau de crédibilité augmente avec le volume d’expérience ;

2. le paramètre s2 est petit, s2 Ñ 0, l’expérience est globalement stabledans le temps. Les moyennes Si représentent alors bien les niveauxde risque des contrats, ce qui réduit l’utilité de la prime collective.

3. le paramètre a est grand, a Ñ8, le portefeuille est hétérogène. Dansun tel cas, les moyennes individuelles sont de meilleures approxi-mations des primes de risque que la prime collective. On notera aupassage que a est en général le paramètre le plus intéressant et celuiqui fluctue le plus d’un portefeuille à un autre.

Les figure 4.1 et 4.2 illustrent les points 2 et 3 ci-dessus. Chaque courbereprésente l’expérience d’un contrat. Dans les deux cas, le facteur decrédibilité est plus grand dans le graphique de droite.

Remarques.

1. Si s2 et a varient en des directions opposées, il devient difficile d’in-terpréter les résultats.

2. Si S1 = � � �= SI = S, alors a = 0 et la prime de crédibilité est πBi,n+1 =

S = Si pour chaque contrat. Pourquoi alors ne pas charger tout sim-plement Si ? Parce que dans une telle situation, il n’est pas nécessairede faire de la tarification basée sur l’expérience.

57

Page 64: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

0 5 10 15 20 0 5 10 15 20

Figure 4.1: Effet de s2 = E[σ2(Θ)] sur le facteur de crédibilité. Gauche :grand s2, l’expérience est trop volatile pour être fiable. Droite : petit s2,les moyennes individuelles sont fiables. Les moyennes sont identiquesdans les deux graphiques.

0 5 10 15 20 0 5 10 15 20

Figure 4.2: Effet de a = Var[µ(Θ)] sur le facteur de crédibilité. Gauche :petit a, le portefeuille est homogène. Droite : grand a, le portefeuille esthétérogène. Les variances sont identiques dans les deux graphiques.

58

Page 65: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

5 Le modèle de Bühlmann–Straub

Le modèle de Bühlmann–Straub est une généralisation du modèle deBühlmann tenant compte de l’exposition au risque des contrats. Ceci estparticulièrement important dans les situations où la taille des contratsvarie beaucoup.

Par exemple, en accidents de travail, l’exposition au risque d’un em-ployeur avec 1 000 employés au beaucoup plus grande que celle d’unemployeur avec seulement 10 employés.

5.1 Modèle et prévision

Dans la forme la plus générale du modèle de Bühlmann–Straub, on as-socie un poids wit à chaque donnée, qui sera maintenant notés Xit.

Schématiquement, on a maintenant

Variables non Observations Poidsobservables 1 . . . t . . . n 1 . . . t . . . n

Θ1 X11 . . . X1t . . . X1n w11 . . . w1t . . . w1n...

......

......

Θi Xi1 . . . Xit . . . Xin wi1 . . . wit . . . win...

......

......

ΘI XI1 . . . XIt . . . XIn wI1 . . . wIt . . . wIn

59

Page 66: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Intuitivement, on s’attend à ce que l’expérience d’un «gros» contrat soitplus stable dans le temps que celle d’un «petit» contrat. Pour que lemodèle réflète cela, l’hypothèse de variances conditionnelles identiquesdu modèle de Bühlmann est modifiée.

Les hypothèses du modèle de Bühlmann–Straub sont les suivantes.

(BS1) Les contrats (Θi, X i), i = 1, . . . , I sont indépendants, les variablesaléatoires Θ1, . . . , ΘI sont identiquement distribuées et les variablesaléatoires Xit ont une variance finie.

(BS2) Les variables aléatoires Xit, sont telles que

E[Xit|Θi] = µ(Θi) i = 1, . . . , I

Cov(Xit, Xiu|Θi) = δtuσ2(Θi)

wit, t, u = 1, . . . , n.

On a donc

Var[Xit|Θi] =σ2(Θi)

wit.

Pour que cette relation soit vraie, les variables aléatoires Xit doivent êtredes ratios. La définition la plus usuelle de Xit est

Xit =Sit

wit

où, par exemple

Sit est le montant total des sinistres et wit est la prime totale payée(loss ratio) ;

Sit est le montant total des sinistres et wit est la masse salariale ;

Sit est le nombre d’accidents dans une flotte de véhicules et wit est lenombre de véhicules ;

etc.

60

Page 67: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

5.1.1 Notation et relations de covariance

On définit la notation suivante :

wiΣ =n

t=1

wit

wΣΣ =I

i=1

wiΣ =I

i=1

n

t=1

wit

zΣ =I

i=1

zi

Xiw =n

t=1

wit

wiΣXit

Xww =I

i=1

wiΣ

wΣΣXiw =

I

i=1

n

t=1

wit

wΣΣXit

Xzw =I

i=1

zi

zΣXiw.

Théorème 5.1. Soit Xit, i = 1, . . . I, t = 1, . . . , n des variables aléatoires satis-faisant les hypothèses (BS1) et (BS2) ci-dessus. Alors,

Cov(Xit, Xku) = δik

(a + δtu

s2

wit

)Cov(µ(Θi), Xku) = δika

Cov(Xit, Xkw) = δik

(a +

s2

wiΣ

).

Démonstration. Tout d’abord, toutes les covariance sont nulles lorsquei � k par indépendance entre les contrats.

Les deux premiers résultats sont équivalents à ceux du théorème 4.2 à

61

Page 68: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

la seule différence que

E[Var[Xit|Θi]] = E[

σ2(Θi)

wit

]=

s2

wit.

Pour le troisième résultat, on a

Cov(Xit, Xiw) =n

u=1

wit

wiΣCov(Xit, Xiu)

=n

u=1

wit

wiΣ

(a + δtu

s2

wit

)= a +

wit

wiΣ

s2

wit

= a +s2

wiΣ.

5.1.2 Meilleure prévision linéaire

Tout comme dans le modèle de Bühlmann, on recherche la meilleureapproximation linéaire de la prime de risque d’un contrat.

Théorème 5.2. Pour un portefeuille tel qu’illustré précédemment et sous leshypothèses (BS1) et (BS2), la meilleure approximation linéaire non homogènede la prime de risque µ(Θi) — ou de Xi,n+1 — est

πBSi,n+1 = ziXiw + (1� zi)m

zi =wiΣ

wiΣ + K, K =

s2

a.

62

Page 69: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Démonstration. La démonstration est similaire à celle du théorème 4.3.Comme précédemment, on peut se restreindre à trouver les constantesc0, c1, . . . , cn minimisant

E[(

µ(Θi)� c0 �n

t=1

ctXit

)2]

.

En calculant les dérivées partielles, d’abord par rapport à c0, puis parrapport à cu, u = 1, . . . , n, on obtient

c0 = E[µ(Θi)]�n

t=1

ctE[Xit] (5.1)

Cov(µ(Θi), Xiu) =n

t=1

ct Cov(Xit, Xiu). (5.2)

Or, l’équation (5.2) peut se réécrire

a =n

t=1

ct

(a + δtu

s2

wiu

)= acΣ + cu

s2

wiu.

Par symétrie, on a quec1

wi1=

c2

wi2= � � �=

cn

win=

wiΣ= Ri.

Par conséquent,

a = awiΣRi + Ris2

d’où

Ri =a

awiΣ + s2 =ct

wit

et donc

ct =wit

wiΣ

awiΣ

awiΣ + s2

=wit

wiΣzi.

63

Page 70: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

De l’équation (4.1), on obtient

c0 = m�n

t=1

wit

wiΣzim

= (1� zi)m

et donc

πBSi,n+1 = c0 +

n

t=1

ctXit

= (1� zi)m +n

t=1

wit

wiΣziXit

= ziXiw + (1� zi)m.

5.2 Estimation des paramètres de structure

Les paramètres de structure à estimer à partir des données sont lesmêmes que précédemment, soit m, s2 et a.

5.2.1 Estimation de m

Un estimateur intuitif de m est

Xww =I

i=1

wiΣ

wΣΣXiw.

Or, on peut démontrer qu’en théorie de la crédibilité l’estimateur linéaireà variance minimale est plutôt

m = Xzw =I

i=1

zi

zΣXiw.

Remarque. Formellement, Xzw n’est pas un estimateur puisqu’il dépenddes paramètres inconnus s2 et a. On appellera de tels estimateurs despseudo-estimateurs (De Vylder, 1981).

64

Page 71: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

5.2.2 Estimation de s2

En généralisant simplement l’estimateur obtenu dans le modèle de Bühl-mann, on obtient l’estimateur sans biais

s2 =1

I(n� 1)

I

i=1

n

t=1

wit(Xit � Xiw)2.

5.2.3 Estimation de a

Du chapitre 4, on soupçonne que l’estimateur intuitif

I

i=1

wiΣ(Xiw � Xww)2

est biaisé. En effet, on démontre sans grande difficulté que

E[(Xiw � Xww)2] = Var[Xiw] + Var[Xww]� 2Cov(Xiw, Xww)

= a

(1� 2

wiΣ

wΣΣ+

I

i=1

(wiΣ

wΣΣ

)2)+ s2

(1

wi�

1wΣΣ

),

d’où

E

[I

i=1

wiΣ(Xiw � Xww)2

]= a

(w2

ΣΣ �°I

i=1 w2iΣ

wΣΣ

)+ (I � 1)s2.

Un estimateur sans biais du paramètre a est donc

a =wΣΣ

w2ΣΣ �

°Ii=1 w2

(I

i=1

wiΣ(Xiw � Xww)2 � (I � 1)s2

).

Cet estimateur peut être négatif. Si l’on utilise plutôt

a1 = max(a, 0),

on a un estimateur biaisé.

65

Page 72: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

5.2.4 Autre estimateur de a

L’estimateur de Bichsel–Straub du paramètre a est sans biais et toujourspositif :

a =1

I � 1

I

i=1

zi(Xiw � Xzw)2.

Remarques.1. Il n’y a rien de gratuit :

a est un pseudo-estimateur ;

a est sans biais seulement si les facteurs de crédibilité sont connus.Sinon, l’espérance est impossible à calculer.

2. On a en fait a = f (a). L’estimation est donc calculée par la méthodedu point fixe.

3. On peut démontrer que si a   0, alors a converge vers 0.

5.2.5 Sommaire des calculs

1. Calculer wiΣ, i = 1, . . . , I et wΣΣ.

2. Calculer Xiw, i = 1, . . . , I et Xww.

3. Calculer s2.

4. Calculer a.

5. Si a ¡ 0 :

5.1 calculer a et poser a = a ;

5.2 calculerz =

wiΣ

wiΣ + s2/a;

5.3 calculer

m =I

i=1

zi

zΣXiw.

6. Sinon

6.1 poser a = 0 ;

66

Page 73: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

6.2 poser zi = 0, i = 1, . . . , I ;

6.3 poser m = Xww.

7. Calculer les primes de crédibilité

πBSi,n+1 = ziXiw + (1� zi)m, i = 1, . . . , I.

5.3 Données manquantes

Dans l’application du modèle de Bühlmann–Straub, il arrive fréquem-ment que le nombre d’observations ne soit pas le même pour tous lescontrats.

Les données et les poids sont alors disponibles pour i = 1, . . . , I et t =1, . . . , ni (en supposant les données contiguës). On aura donc, par exemple,

wiΣ =ni

t=1

wit

ou

Xiw =ni

t=1

wit

wiΣXit.

La seule formule affectée par ce changement est celle de s2 :

s2 =1°I

i=1(ni � 1)

I

i=1

n

t=1

wit(Xit � Xiw)2.

5.4 Exemple numérique

Les résultats de cette section sont tirés de Goovaerts et Hoogstad (1987),eux-mêmes basés sur les données de Hachemeister (1975). Ces données

67

Page 74: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

sont composées de montants de sinistres moyens au chapitre de la res-ponsabilité civile en assurance automobile entre juillet 1970 et juin 1973dans cinq états américains. On a donc I = 5 contrats et n = 12 périodesd’expérience. Les montants de sinistres moyens Xit sont présentés au ta-bleau 5.1 (à noter que le tableau est transposé par rapport à la notationusuelle).

Au tableau 5.2, on trouvera les poids wit associés aux données précé-dentes. Il s’agit ici du nombre total de sinistres dans chaque périodepour chaque état, soit le dénominateur des ratios Xit. On remarqueraque le nombre de sinistres est beaucoup plus élevé dans l’État 1 et,quoique dans une moindre mesure, dans l’État 5.

5.4.1 Résultats avec le modèle de Bühlmann

On illustre d’abord le modèle de Bühlmann en ignorant les poids ratta-chés aux données. Les estimateurs des paramètres de structure sont lessuivants :

m = 1671

s2 = 46040a = 72310,

ce qui mène aux résultats du tableau 5.3. Le facteur de crédibilité estplutôt élevé. Une analyse rapide des données suffit pour constater quel’expérience des états est relativement stable dans le temps. Il en résulteune valeur de s2 petite par rapport à celle de a et, donc, un grand facteurde crédibilité.

Pour l’État 1, dont l’expérience est la pire du portefeuille, un grandfacteur de crédibilité a pour effet de ne réduire la prime de crédibilité(2 044) que de 1% par rapport à la prime individuelle (2 064).

5.4.2 Résultats avec le modèle de Bühlmann–Straub

Le tableau 5.2 montre que le poids relatif de chacun des cinq états (poidsmesuré en nombre de sinistres) est très différent : l’État 1 compte pour

68

Page 75: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

i = 1 i = 2 i = 3 i = 4 i = 5

t = 1 1738 1364 1759 1223 1456t = 2 1642 1408 1685 1146 1499t = 3 1794 1597 1479 1010 1609t = 4 2051 1444 1763 1257 1741t = 5 2079 1342 1674 1426 1482t = 6 2234 1675 2103 1532 1572t = 7 2032 1470 1502 1953 1606t = 8 2035 1448 1622 1123 1735t = 9 2115 1464 1828 1343 1607t = 10 2262 1831 2155 1243 1573t = 11 2267 1612 2233 1762 1613t = 12 2517 1471 2059 1306 1690

Table 5.1: Montants de sinistres moyens (ratios Xit) dans le portefeuillede Hachemeister

i = 1 i = 2 i = 3 i = 4 i = 5

t = 1 7861 1622 1147 407 2902t = 2 9251 1742 1357 396 3172t = 3 8706 1523 1329 348 3046t = 4 8575 1515 1204 341 3068t = 5 7917 1622 998 315 2693t = 6 8263 1602 1077 328 2910t = 7 9456 1964 1277 352 3275t = 8 8003 1515 1218 331 2697t = 9 7365 1527 896 287 2663t = 10 7832 1748 1003 384 3017t = 11 7849 1654 1108 321 3242t = 12 9077 1861 1121 342 3425

Table 5.2: Nombres totaux de sinistres (poids wit) dans le portefeuillede Hachemeister

69

Page 76: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

i = 1 i = 2 i = 3 i = 4 i = 5

Prime individuelle Xi 2 064 1 511 1 822 1 360 1 599Prime de crédibilité πB

i,13 2 044 1 519 1 814 1 376 1 602Facteur de crédibilité z 0,95 0,95 0,95 0,95 0,95

Table 5.3: Résultats avec le modèle de Bühlmann pour le portefeuille deHachemeister

i = 1 i = 2 i = 3 i = 4 i = 5

Prime individuelle Xiw 2 061 1 511 1 806 1 353 1 600Prime de crédibilité πBS

i,13 2 053 1 529 1 790 1 468 1 605Facteur de crédibilité z 0,98 0,90 0,86 0,66 0,94

Table 5.4: Résultats avec le modèle de Bühlmann-Straub pour le porte-feuille de Hachemeister

57,5% des sinistres du portefeuille, alors qu’à l’opposé l’État 4 ne compteque pour 2,4%. Dans une telle situation, il convient d’utiliser le modèlede Bühlmann–Straub dans la tarification afin de tenir compte des vo-lumes très différents d’un contrat à un autre.

Les estimateurs des paramètres de structure sont les suivants :

m = Xzw = 1689

s2 = 139120026a = 89639a = 64367.

On notera que l’estimateur Xzw de la moyenne collective ainsi que lesprimes de crédibilité du tableau 5.4 ont été calculés avec l’estimateur ade la variance entre les moyennes.

C’est pour l’État 4 que les différences entre les résultats des tableaux 5.3et 5.4 sont les plus marquées. La prime de crédibilité de cet état aug-mente en effet de 1 376 à 1 468. Ceci est en partie dû à l’augmentation del’estimateur de la prime collective, mais surtout à la forte baisse de sonfacteur de crédibilité. Le modèle de Bühlmann–Straub permet donc de

70

Page 77: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

reconnaître le rôle minime joué par cet état dans les résultats du porte-feuille. C’est pourquoi on y accorde peu de poids lors de la répartitiondes primes.

5.4.3 Limitations des modèles précédents

L’examen des données de l’État 1 montre que le montant moyen dessinistres va en augmentant d’une période à l’autre. Or la prime de cré-dibilité calculée avec le modèle de Bühlmann–Straub se trouve environau niveau de la période 8. Il semble donc évident que la prime de crédi-bilité s’avèrera trop peu élevée.

C’est afin de pouvoir traiter de tels cas que Hachemeister (1975) a pro-posé son modèle de crédibilité avec régression. L’utilisation d’un tel mo-dèle est particulièrement indiquée dans des situations de forte inflationou d’augmentation ou diminution structurelle des coûts.

71

Page 78: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la
Page 79: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

Bibliographie

Bailey, A. L. 1945, «A generalized theory of credibility», Proceedings ofthe Casualty Actuarial Society, vol. 32, p. 13–20.

Bailey, A. L. 1950, «Credibility procedures, Laplace’s generalization ofBayes’ rule and the combination of collateral knowledge with ob-served data», Proceedings of the Casualty Actuarial Society, vol. 37, p.7–23.

Bühlmann, H. 1967, «Experience rating and credibility», ASTIN Bulletin,vol. 4, p. 199–207.

Bühlmann, H. 1969, «Experience rating and credibility», ASTIN Bulletin,vol. 5, p. 157–165.

De Vylder, F. 1981, «Practical credibility theory with emphasis on pa-rameter estimation», ASTIN Bulletin, vol. 12, p. 115–131.

Dutang, C., V. Goulet et M. Pigeon. 2008, «actuar: An R package foractuarial science», Journal of Statistical Software, vol. 25, no 7. URLhttp://www.jstatsoft.org/v25/i07.

Goel, P. K. 1982, «On implications of credible means being exactbayesian», Scandinavian Actuarial Journal, p. 41–46.

Goovaerts, M. J. et W. J. Hoogstad. 1987, Credibility Theory, no 4 dans Sur-veys of actuarial studies, Nationale-Nederlanden N.V., Netherlands.

Hachemeister, C. A. 1975, «Credibility for regression models with appli-cation to trend», dans Credibility, theory and applications, Proceedings

73

Page 80: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

of the Berkeley actuarial research conference on credibility, AcademicPress, New York, p. 129–163.

Jewell, W. S. 1974, «Credible means are exact bayesian for exponentialfamilies», ASTIN Bulletin, vol. 8, p. 77–90.

Mowbray, A. H. 1914, «How extensive a payroll exposure is necessaryto give a dependable pure premium?», Proceedings of the Casualty Ac-tuarial Society, vol. 1, p. 25–30.

Norberg, R. 1979, «The credibility approach to ratemaking», Scandina-vian Actuarial Journal, vol. 1979, p. 181–221.

Whitney, A. W. 1918, «The theory of experience rating», Proceedings ofthe Casualty Actuarial Society, vol. 4, p. 275–293.

74

Page 81: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la
Page 82: ACT 2008 Mathématiques actuarielles IARD II (Théorie de la