tude de la dmographie franaise du xixe sicle ... ...

Download tude de la dmographie franaise du XIXe sicle  ...  franaise,commelerappellentBourdieuetal.(2014).Depuis,ladmographiehistorique

Post on 11-May-2018

214 views

Category:

Documents

2 download

Embed Size (px)

TRANSCRIPT

  • HAL Id: hal-01724269https://hal.archives-ouvertes.fr/hal-01724269

    Submitted on 6 Mar 2018

    HAL is a multi-disciplinary open accessarchive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come fromteaching and research institutions in France orabroad, or from public or private research centers.

    Larchive ouverte pluridisciplinaire HAL, estdestine au dpt et la diffusion de documentsscientifiques de niveau recherche, publis ou non,manant des tablissements denseignement et derecherche franais ou trangers, des laboratoirespublics ou privs.

    tude de la dmographie franaise du XIXe sicle partir de donnes collaboratives de gnalogie

    Arthur Charpentier, Ewen Gallic

    To cite this version:Arthur Charpentier, Ewen Gallic. tude de la dmographie franaise du XIXe sicle partir dedonnes collaboratives de gnalogie. 2018.

    https://hal.archives-ouvertes.fr/hal-01724269https://hal.archives-ouvertes.fr

  • tude de la dmographie franaise du XIXe sicle partir de donnes collaboratives de gnalogie

    Arthur Charpentiera, b and Ewen Gallica,c

    aCREM, UMR CNRS 6211, 7 Place Hoche, 35065 Rennes Cedex, France.bUniversit de Rennes 1, 2 rue du Thabor CS 46510, 35042 Rennes

    Cedex, France.cInstitut Louis Bachelier, Palais Brongniart 28 place de la Bourse 75002

    Paris, France.

    6 mars 2018

    RsumAvec lre du numrique, les donnes collaboratives permettent de collecter mas-

    sivement et moindre cot des donnes. Les sites de gnalogie fleurissent surInternet pour proposer leurs utilisateurs de reconstituer en ligne leur arbre gna-logique. Le travail de collecte et de saisie effectu par ces utilisateurs peut poten-tiellement tre rutilis en dmographie historique pour complter la connaissancedu pass de nos anctres. Dans notre tude, partir denregistrements concernant2 457 450 individus franais ou dorigine franaise ayant vcu au XIXe sicle, nousmontrons quil est possible de retrouver, bien quil subsiste parfois quelques biais,certains rsultats de la littrature. Nous proposons dexplorer les caractristiquestemporelles contenues dans les arbres gnalogiques pour tudier la longvit, puisde se saisir des caractristiques spatiales pour analyser les phnomnes migratoiresinternes en France.

    Mots-cls : Gnalogie, Donnes collaboratives, Longvit, Migration.

    1 Introduction et motivations

    Au milieu du XXe sicle, les travaux initis par Henry (1956) fondent le cadre concep-tuel dune nouvelle discipline, la dmographie historique. De nombreuses tudes sont alorsCes travaux de recherche ont t raliss dans le cadre de lInitiative de Recherche Valorisation et

    nouveaux usages actuariels de linformation , place sous lgide de la Fondation du Risque en partenariatavec le GENES, lUniversit de Rennes 1, lUniversit Paris-Est La Valle. Un travail prliminaire avaitt prsent lors des journes Science XXL organises en mars 2017 lINED. Nous remercions OlivierCabrignac et Jrme Galichon pour leur aide sur lexploration des donnes, ainsi que les participantspour les discussions que nous avions pu avoir alors, et qui ont motiv certains lments prsents danscette tude.Auteur correspondant : ewen.gallic@gmail.com

    1

  • menes dans les annes 1960 pour donner un aperu des caractristiques de la populationfranaise, comme le rappellent Bourdieu et al. (2014). Depuis, la dmographie historiquea connu un intrt croissant. Les travaux consacrs lenrichissement de la connaissancede nos anctres ont fait de la dmographie historique un secteur la croise de plusieursdisciplines prenant appui sur loutil statistique : dmographie, sociologie, biologie et co-nomie (Dupquier, 1981). Les thmes abords en dmographie portent en particulier surla reconstitution des effectifs de la population, ltude de la natalit, de la mortalit ouencore la nuptialit (Blayo et Henry, 1967; Blayo, 1975a; Henry et Blayo, 1975). En so-ciologie, il est question de la structure des familles (Matthijs et Moreels, 2010) et desliens quelles peuvent avoir avec la migration sociale (Bonneuil et al., 2008; van Leeuwenet al., 2015; Bourdieu et al., 2004). La distinction entre ce qui est hrditaire ou li lenvironnement dans lexplication des caractres et comportements relve plutt de labiologie, avec en particulier, ltude des transferts hrditaires lis lesprance de viedune gnration lautre (Gavrilov et Gavrilova, 2001; Motta et al., 2007) et/ou entrefrres et surs (Perls et al., 2002). En conomie, ce sont les notions de mobilit qui sontprincipalement tudies (Dribe et Lundh, 2005).

    Au cur de la dmographie historique se trouvent les donnes. Leur source varie dunetude lautre. On note une forte exploitation des registres contenant des informationsdates sur nos aeux : dates de naissances, de mariages, de dcs. Les registres parois-siaux puis ltat civil depuis la Rvolution franaise, ainsi que les donnes de recensementsavrent largement utilises, mais ne constituent pas lunique source dinformation pr-sente dans la littrature. Les registres matricules militaires tablis par ladministrationmilitaire constituent par exemple une source diffrente, utilise notamment pour tudierles migrations au cours de la vie (Ho., 1971; Kesztenbaum, 2008, 2014). Une source troi-tement lie lexistence des divers registres, puisquelle sappuie sur ceux-l, a particip lamlioration de la connaissance de lhistoire de nos anctres : il sagit des donnesgnalogiques. On peut noter que les mormons ont constitu lUniversit dUtah devolumineuses bases de donnes gnalogiques ayant aid ltude de la population dansle pass (Bean et al., 1978; Lindahl-Jacobsen et al., 2013). Rcemment, avec lre dudveloppement des techniques informatiques, ce type de donnes semble bnficier dungain dintrt. La rvolution du numrique permet daccder dans des temps relative-ment courts, pour des cots moindres et des efforts rduits des quantits consquentesdinformations relatives la gnalogie. De multiples sites proposent leurs utilisateursde reconstituer leurs arbres gnalogiques. Cest le cas de wikitree.com, familysearch.org,ou encore geni.com. Pour linstant, les informations enregistres par les utilisateurs ontsurtout permis dtudier la longvit des individus (Gavrilova et Gavrilov, 2007; Gavrilovet al., 2002; Cummins, 2017; Fire et Elovici, 2015).

    De manire gnrale, les donnes collaboratives semblent offrir de prometteuses pers-pectives. Elles permettent dentraner des modles, de valider des rsultats quasiment entemps rel, et de grer manuellement des cas dans lesquels des algorithmes ont chou(Lease et Yilmaz, 2013). Leur utilisation dans le milieu de la recherche sobserve parexemple en mdecine. Dans cette discipline, bien que la collecte des donnes se restreintparfois un cercle dexperts, comme dans le cas de la base CIViC 1 visant accroitre lesconnaissances relatives aux cancers (Griffith et al., 2017), elle peut aussi tre ralise demanire efficace par des non-experts, pour ltude du sommeil par exemple (Warby et al.,

    1. Clinical Interpretations of Variants in Cancer : https://civicdb.org/home.

    2

    https://www.wikitree.com/https://www.familysearch.org/http://geni.com/https://civicdb.org/home

  • 2014). En gographie, les donnes collaboratives, notamment celles dOpen Street Map 2(OSM), le projet international visant crer une carte libre du monde, ont aussi affectle domaine de la recherche. Leur pertinence tait dj discute il y a une dizaine dan-nes par les gographes. En effet, Haklay (2010) ont montr que bien quelles comportentquelques erreurs, les informations fournies par les utilisateurs dOSM sont plutt prciseslorsquil sagit de faire de la cartographie. Girres et Touya (2010) sont arrivs aux mmesconclusions, en soulignant toutefois des difficults lies lhtrognit des donnes.

    La dmographie historique peut-elle tirer profit des donnes de gnalogie renseignespar des millions dutilisateurs ? La rponse cette question serait positive, en croireKaplanis et al. (2018), qui explorent les arbres gnalogiques de plusieurs millions dindi-vidus. Leur tude montre que les donnes de gnalogie issues de la collaboration dama-teurs permettent dobtenir des arbres gnalogiques de grande qualit. Nous souhaitonscomplter la rponse laide de donnes de gnalogie issues du site geneanet.org, ennous concentrant sur le cas franais et en fournissant de plus amples comparaisons avecles rsultats dj connus de la littrature. Nous proposons dans cet article de commencerpar un point mthodologique visant expliquer les mthodes employes pour extraire etclasser les informations contenues dans les donnes de Geneanet (Section 2). Nous explo-rons ensuite la reprsentativit des donnes (Section 3), puis examinons deux dimensionsde nos donnes : la dimension temporelle, avec une tude de la mortalit (Section 4) etla dimension spatiale au travers dune tude de la migration (Section 5).

    2 Aspects mthodologiques

    Ce travail sappuie sur des donnes de gnalogie issues du site web Geneanet 3. Il sagitde donnes collectes par des amateurs de gnalogie la recherche de leurs anctres.Les utilisateurs du service peuvent construire leur arbre gnalogique en renseignant, demanire plus ou moins dtaille, les informations glanes au cours de leurs recherches.Pour chaque individu de larbre, les informations concernant trois types dvnementscorrespondant aux actes dtat civil peuvent tre communiqus : (i) sa naissance, (ii) sonou ses mariages le cas chant, (iii) son dcs ; chaque vnement pouvant renseigner la fois le lieu et la date auxquels il est enregistr. Les individus composant un arbre sontrelis en fonction de leurs parents et de leur(s) conjoint(s).

    Les donnes collaboratives de gnalogie jouissent de nombreux atouts. La couverturespatiale en est un. De nombreuses tudes sont contraintes de se limiter un village ou unergion en particulier, faute de donnes sur un territoire plus vaste ou de moyens financierspour collecter sur les donnes su

View more