apport des sciences du numérique dans les sciences participatives

18
Apport des sciences du numérique dans les sciences participatives ALLISTENE - GT “Sciences Participatives” 19 Novembre 2015

Upload: julien-hering-phd

Post on 09-Feb-2017

1.175 views

Category:

Science


0 download

TRANSCRIPT

Page 1: Apport des sciences du numérique dans les sciences participatives

Apport des sciences du numérique dans les sciences

participatives

ALLISTENE - GT “Sciences Participatives”

19 Novembre 2015

Page 2: Apport des sciences du numérique dans les sciences participatives

Préambule

Sollicitée par François Houllier dans le cadre de lamission sur les Sciences Participatives1pourapprécierlaplacedecessciencesdanslechampdel’Alliance,ALLISTENEamobiliséungrouped’experts,animéparJean-GabrielGanasciaetMokraneBouzeghoubpourpréciserlesapportsmutuelsentreSciencesetTechnologiesduNumériqueetSciencesParticipatives.Le groupe d’experts composé de Sihem Amer-Yahia, Mokrane Bouzeghoub, Jean-GabrielGanasciaetJean-MarcOgieraproduitcerapport.

1http://www.sciences-participatives.com

Page 3: Apport des sciences du numérique dans les sciences participatives

SciencesParticipatives(synthèse)

1

Groupedetravailsurl’apportdessciencesdunumériquedanslessciencesparticipatives

Contributeurs:SihemAMER-YAHIA,MokraneBOUZEGHOUB,Jean-GabrielGANASCIA,Jean-MarcOGIER

Recommandationsd’actionsA l’issue des travaux engagés à l’initiative d’Allistène sur l’apport des sciences dunumériquedanslessciencesparticipatives,notregroupedetravailtientd’abordàinsistersurlecaractèremutueldecetapport.

L’apportdunumériqueapparaîtévident,tantlessciencesparticipativesbénéficientdel’utilisationdesréseauxinformatiques(calculetstockage)quecesoitpourcollecteretagréger les contributions individuelles ou pour distribuer le travail et l’organiser sur unmode coopératif (allocations de tâches, synchronisation, validation,…). Réciproquement,lessciencesdunumériquerecourentauxtechniquesparticipativespourl’entraînementdelogicielsd’apprentissagemachine,pour le recueildes retoursd’usagedans la conceptioncentrée sur l’utilisateur et pour la résolution de problèmes distribués (identification decompétences,décompositiondetâches,modèlesdegratification,…).

Afind’améliorerlepartiquelessciencesdunumériquepeuventtirerdestechniquesparticipativesetdeleurpermettre,enretour,decontribuerauperfectionnementdesoutilsetdesméthodesderecueilparticipatif,notregroupefaitquatrepropositions:

1. Aider au développement deplateformespérennes de «crowdsourcing» et delogicielsdetraitementadaptésafindepermettreauxchercheursd’avoirlamaîtrisedesdifférentscomposants,toutenévitantdeuxécueils,lacentralisationexcessiveetladispersiondesefforts.

2. Mettreenplacedes«maisonsdessciencesparticipatives»bienidentifiéessurleterritoirenational.Cesmaisonsabriterontdesplateformestechnologiquesavecdeséquipes supports d’ingénieurs qui assureront la pérennité de plateformes de«crowdsourcing», leur maintenance, l’accès libre et la fourniture de ressourceslogiciellespourl’acquisitioncollaborativededonnéesetleurtraitement.

3. Financerdesaxesderechercheprioritairesdanslessciencesdunumériquequiporteront, entre autre, sur la modélisation des compétences des participants, ladécomposition et l’allocation des tâches, la construction et la validation desconnaissances,laconceptiond’interfaces,lamiseaupointdemodèleséconomiquesetletraitementdegrandesmassesdedonnéesissuesd’uneacquisitiondistribuée.

4. Encourager à la faveur de projets communs l’émergence de compétencesinterdisciplinaires entre les sciences du numérique et certains secteurs dessciences de l’Homme et de la société, en particulier la sociologie des usages, lapsychologiesociale,lapsychologiecognitiveetl’économie.

Page 4: Apport des sciences du numérique dans les sciences participatives

2

Tabledesmatières

Recommandationsd’actions................................................................................................1

Tabledesmatières..................................................................................................................2

1 Objectifsetplan.................................................................................................................3

2 Impactsociétaletquestionséthiques........................................................................42.1 Apports......................................................................................................................................42.2 Risquesliésauxsciencesparticipatives.........................................................................5

3 Apportdessciencesparticipativesauxsciencesdunumérique.......................63.1 Lacollectededonnées..........................................................................................................63.2 Résolutiondeproblèmes.....................................................................................................7

4 Problématiquesscientifiquesdanslessciencesdunumérique.......................94.1 Déploiementdestâches.......................................................................................................94.2 Motivationdesparticipants..............................................................................................104.3 Validationetdétectiond’anomalies..............................................................................114.4 Modèlesetalgorithmes......................................................................................................114.5 Plateformes............................................................................................................................12

5 Recommandationd’actions........................................................................................135.1 Infrastructured’accompagnementdelarecherche.................................................135.1.1 Plateformestechnologiques.....................................................................................................135.1.2 Centrederessourcesetsupporteningénierie................................................................14

5.2 Axesderechercheprioritaires........................................................................................145.3 Emergencedecompétencesinterdisciplinaires........................................................155.4 Résumédesrecommandations.......................................................................................15

6 Références........................................................................................................................16

Page 5: Apport des sciences du numérique dans les sciences participatives

3

SciencesParticipativesGroupedetravailsurl’apportdessciencesdunumériquedanslessciencesparticipatives

Contributeurs:SihemAMER-YAHIA,MokraneBOUZEGHOUB,Jean-GabrielGANASCIA,Jean-MarcOGIER

1 Objectifsetplan

En premier lieu, rappelons que ce groupe de travail s’est constitué à la demande de laprésidente d’Allistène, Brigitte PLATEAU, qui répondait à une sollicitation de FrançoisHOULLIER, président de l’INRA qui, lui-même, faisait suite à une requête conjointe de laMinistredel’Educationnationale,del’EnseignementsupérieuretdelaRechercheetdelaSecrétaire d’Etat chargée de l’Enseignement supérieur et de la Recherche. Les deuxMinistresontexprimélesouhaitderecevoirunguidedebonnespratiquessurlessciencesparticipativesd’icile30novembre20151.Notonsqueleurrequêteportesurl’apportdescitoyensauxprogrèsscientifiquesparlesdonnéesoulesconnaissancesqu’ilsaidentàcollecter, etnonsur ladiffusionde la culturescientifiquedans lapopulation,mêmesil’implication des citoyens dans le recueil de données ou de connaissances y contribuecertainement.Quantauxquestions liéesà laparticipationdescitoyensà ladéfinitiondesorientationsscientifiquesouauxbénéficesqu’ilstirentdelarecherchescientifique,ellesnerelèventpasnonplusdecetteétude.

Emanant d’Allistène, ce groupe de travail doit porter naturellement surl’implicationdessciencesdunumériquedanslessciencesparticipatives.Al’issuedenos travaux, il nous apparaît qu’en cettematière le rôle des sciences du numérique estdouble:

♦ D’uncôté,lessciencesdunumériquebénéficientdessciencesparticipativeslorsquecelles-ciaidentàconstruiredesbasesdedonnées,desannotationsoudesensemblesd’apprentissageetqu’ellespermettentderésoudrecollectivementdesproblèmes.♦ D’un autre côté, le numérique donne un essor aux sciences participatives enfacilitant la collecte et l’échange à travers les réseaux informatiques. Dès lors, lessciences du numérique se trouvent tout naturellement convoquées pour aider àsystématiseretàaméliorercespratiquescommunautaires.

1Lalettredemissionenvoyéele19février2015étaitsignéedeMadameNajatVallaud-BELKACEM,Ministredel’Education nationale, de l’enseignement supérieur et de la Recherche, et de Madame Geneviève FIORASO,Secrétaired’Etatchargéedel’EnseignementsupérieuretdelaRecherche.

Page 6: Apport des sciences du numérique dans les sciences participatives

4

Acela, ilconvientd’ajouterunvoletsur l’impactsocialdessciencesparticipatives,que ce soit pour les contributeurs qui risqueraient de subir une forme d’exploitation,commec’estparfoislecasaveccertainesapplicationsdu«crowdsourcing»(oudecequecertainappellent lamyriadisation2 en français), oupour certains chercheursquiyvoientunesciencemolledénuéedefondementsméthodologiquesouunesciencedontlecontrôleéchapperaitàleursprérogatives.

Cesremarquespréliminairesnousconduisentàadopterunplanenquatreparties:(i)impact sociétaldes sciencesparticipativesetquestionséthiques liéesà la collectedesdonnées, (ii)apport des sciences participatives aux sciences du numérique,(iii)problématiques scientifiques posées par les sciences participatives aux chercheursdanslessciencesdunumérique,etenfin,(iv)recommandationd’actions.

2 Impactsociétaletquestionséthiques

2.1 Apports

En préalable, soulignons que les sciences participatives contribuent à l’avancée desconnaissances, dumoins c’est l’une desmotivations de leurs promoteurs, et qu’elles ontune vertu éducative. Elles forment ceux qui s’y adonnent à la méthode et à la rigueurscientifique.Cefaisant,elleaidentàmieuxfairecomprendrelesenjeuxetlesprocéduresdelascience.Onpeutdèslorsespérerqu’ellesfassentnaîtreouconfirmentdesvocationsdescientifiques chez des jeunes filles et des jeunes gens tout en diminuant lesméfiances àl’égardde lasciencequise font tropsouvent jourdans lapopulation.Ellesseprésententdonccommeétantbénéfiquespourtous.

A cette motivation générale s’ajoute un intérêt pratique dans les sciences dunumérique où beaucoup d’applications recourent, dès à présent, au méthodesparticipatives pour l’acquisition de données. Mentionnons, à titre d’illustration, quatreapplicationsdéjàlargementrépandues:

1. L’annotation distribuée d’images ou de vidéos pour faciliter lamise enœuvre detechniquesd’apprentissagesuperviséàdesfinsdecaractérisationdescènes.

2. L’annotationdegazouillis(Tweets),envue,làencore,d’entraînerparapprentissagemachine,deslogicielsdecatégorisationoud’extractiondecontenu.

2 Le terme de «crowdsourcing», littéralement les ressources de la foule, a été forgé sur le modèled’«outsourcing» (externalisation en français) pour désigner une forme de délégation du travail au grandnombre. Cela a conduit un certainnombrede linguistes duCNRS à proposer le termedemyriadisation enfrançais.Quoiquelemotnousapparaisseheureux,nousnel’utiliseronspasicipournepasdérouterlelecteurdurapportglobaldanslequelcetextedevraitêtreinséréultérieurement.

Page 7: Apport des sciences du numérique dans les sciences participatives

5

3. Lerecueildesretoursd’utilisateursàl’identificationdesCAPTCHA3pouraméliorerlareconnaissanceautomatiquedecaractèresmanuscrits, làencoreparapprentissagemachine.

4. L’obtentiondesretoursd’usagepourdesinterfacesoudeslogicielsdanslecontexted’uneconceptiondite«centréesurl’utilisateur».

2.2 Risquesliésauxsciencesparticipatives

Cependant,indépendammentdeleursvertusputatives,lessciencesparticipativessuscitentun certainnombrede craintes,plusoumoins justifiées.Tant laperceptionque la réalitédesrisquesdépend,bienévidemment,desdomainesd’applicationetdelanatureactiveoupassive, rémunérée ou bénévole, du recueil d’information. Enumérons les, pour essayerd’enévaluerladangerosité.

Ilexisteparfoisunecraintedevoir,aveclessciencesparticipatives,desscientifiquesdudimanche remplacer, àmoindrecoût,des chercheursenposteque l’onpourrait alorsdébaucher par mesure d’économie. Rappelons, s’il en est besoin, que cela n’a aucunfondement. En effet, même s’ils ne se réduisent pas à être de simples «capteurs dedonnées»,lescontributeursbénévolesnefontpaslemêmetravailquelesscientifiquesdemétier.

En revanche, avec la collectemassivededonnées, deuxquestionsd’ordre éthiquedemandentàêtreprisestrèsausérieux.

L’uneportesurlaprotectiondelavieprivée.Aveclerecueilpassifdedonnéesdesantéoud’usageaumoyend’objetsconnectés,descapteurs font irruptiondans l’intimitéindividuelleetpermettentdésormaisdesuivreàlatracelesindividus.Sil’utilisationdecesdonnées personnelles à des fins de recherche peut se justifier lorsque les personnesdonnentleuraccord,leurventeouleurdiffusionseraittrèsproblématique.Ilconvientdoncderappelerlecaractèreexceptionneldesdonnéespersonnellescollationnéesettraitéesàdesfinsderecherche,toutenexigeantdeschercheursqu’ilsprennentconsciencedeleursobligationsmoralesdediscrétionetqu’ilss’ysoumettent.

Ajoutons à cela que, l’utilisationdes données personnelles à des fins scientifiquespeut requérir une anonymisation, c’est-à-dire un effacement du lien entre donnéesindividuellesetpersonnes.Empêcherderétablirce lienet, lecaséchéant, caractériser ledegré d’anonymisation, c’est-à-dire la difficulté à reconstruire ce lien, posent desproblèmesintéressantsetdélicatsauxchercheurs.Eneffet,ilnesuffitpasdesupprimerles

3Destinéesàdistinguerleshommesdesrobotsvirtuels(bots)surdestâchessimplesdereconnaissancedecaractères, les CAPTCHAS sont largement utilisés sur Internet pour prémunir les sites contre des attaquesmassives.

Page 8: Apport des sciences du numérique dans les sciences participatives

6

noms, car on peut bien souvent retrouver, par croisement de bases de données, desinformationsindividuelles,sanscompterquecelafaitparfoisperdreleursensauxdonnées.Lescritèresetlestechniquesd’anonymisationfontdoncl’objetdenombreusesrecherchesdanslessciencesdunumériques.

Lasecondeestrelativeaurecoursàuntravaildistribuéetfaiblementrémunéré,sans contrat ni assurances sociales, qui peut conduire à des formes d’exploitationdifficilementadmissiblesdansnospays[1].Malheureusement,lamondialisationdesréseauxfait qu’il n’est pas aisé d’introduire des législations nationales dans ces activités[2]. Onfranchitparfoislepasquifaitpasserdes«sciencesparticipatives»bénévolesàun«travaildistribué» réparti et rétribué sur mode tayloriste. On ne peut alors empêcher que lesméthodesdéveloppées initialementpouraccroître lesconnaissancesscientifiquesn’aient,commefinalité,qu’unaccroissementdesgains.

3 Apportdessciencesparticipativesauxsciencesdunumérique

Les approches participatives se développent dans beaucoup de domaines scientifiques.Dans le contextedunumérique,elles contribuentessentiellementàdeuxproblématiquesmajeures:lacollectededonnéesetlarésolutiondeproblèmes.

3.1 Lacollectededonnées

C’estl’unedescontributionsimportantedessciencesparticipatives,aupointoùonpourrait en réduire leur portée à ce seul point. Cette collecte peut prendre diversesformes: relevés et transmission d’observations de terrain (photos de plantes, audios dechamps d’oiseaux, traces d’animaux, ...), annotation interactive de corpus (étiquetage outaging d’images, reconnaissances de caractères, identification de personnages dans unescène, ...), retours explicites ou implicites d’usages (évaluation qualitative de scènes oud’objets,fréquenced’accèsàuneressource,duréed’affichaged’unepage,...).

Leprocessusdecollectepeutêtreactifoupassifetengendredecefaitdestypesdemanipulation et des traitements différents. Dans le premier cas, le participant est àl’initiativedel’actiondecollecte(prisedephoto,mesure,étiquetage,appréciation).C’estlecasdesamateursenastronomie[3],oudesclubsderandonnéesintéressésparlesespècesdechampignons.Onpeut recouriraussiàuneparticipationpassivedecontributeursdèslors qu’ils sont porteurs d’équipements susceptibles d’acquérir automatiquement desdonnées.C’estlecasdesmartphones,desmontresconnectés,destablettesetordinateursportables, voire même des implants de capteurs qui enregistrent et envoient des fluxd’information. Il existe une autre forme d’acquisition passive qui est en relation avec

Page 9: Apport des sciences du numérique dans les sciences participatives

7

l’analyseducomportement(nombredeclickssurInternet,duréeentredeuxclicks,duréed’affiched’unepage,vitessedefrappesurunclavier,lessitesfréquemmentvisités,...).

A titre d’illustration, nous citons deux exemples d’application aux sciences dunumériquedecetteformedecollectedesdonnées

- Annotationdecorpuspourl’apprentissageetl’évaluation:Aujourd’hui,onadeplusen plus souvent besoin de grands corpus annotés pour mettre en œuvre destechniques d’apprentissage supervisé dans tous les domaines de l’informatique,parexemplepourlareconnaissancedemotifs,d’objets,oudescènessurlesimagesou pour l’indexation de textes avec la reconnaissance d’entités nommées et derelations,ouencorepourl’interprétationdetextescourtscommeles«gazouillis»(Tweets) ou de textes anciens. Identiquement, dans beaucoup de domaines où nepréexiste pas de mesure formelle, comme là où il est question de sémantique,l’évaluationdelaperformanced’algorithmesrecourtaussiàdescorpusannotés.

- Laconceptiond’interfacescentréesurl’utilisateurfaitappeldepuislongtempsàdesretours d’usage. On conçoit dès lors l’apport des techniques participatives pourrecueillir ces retours et les agrégeren vue de valider par exemple une interfaceutilisateur.Plusgénéralement,lessciencesparticipativespeuventservird’outilpourconcevoirouvaliderdesmodèlesd’interaction,présentésparexemplecommedes“jeuxsérieux”(seriousgames),dansdifférentsdomainesoùl’analysedesusagesestunenjeudanslacréationdelavaleuroul’acceptationd’unsystèmeoud’unobjet.

Danstouslescas,lacontributionessentielledessciencesparticipativesàceprocessusde collecte d’informations réside dans leur capacité à mobiliser des foules autour d’unthème, à établir les règlesde gouvernancedesdonnées collectées (y compris le droit depropriété),àdéfinirunmodèleéconomiquerespectueuxdesloisetdel’éthiquedanslecasde le rétribution des participants. Il est à noter aussi que les sciences participatives ontconstituéunlevieràl’améliorationetlagénéralisationdesplateformesd’acquisition.

3.2 Résolutiondeproblèmes

L’usagedessciencesparticipativesdanslarésolutiondeproblèmespeutparaîtrecommelapartie “la plus noble” de ce nouveau courant, pour peuque laméthodologie utilisée soitbien formalisée et reconnue comme outil scientifique par les pairs. L’enjeu est doncdouble:(i)formulerunproblèmedetellesortequesarésolutionsoitdistribuéeentreunemyriade d’acteurs, (ii) inscrire cette résolution dans uneméthodologie scientifiquementvalidée.

Page 10: Apport des sciences du numérique dans les sciences participatives

8

Laquestiondelaformulationduproblèmeestessentielle.Ils’agitd’expliciterlebutàatteindre,d’esquisserleprocessusavecsestâchesélémentaires,sesétapesetsespointsdesynchronisation,d’établirlesprofilsdesparticipants,dedéfinirlemodèleéconomiqueoulesmodalitésdemobilisationdesparticipants,d’élaborerlaprocédurederecrutementdecesderniersetdelancerlacampagnederecrutement.Cetravailconstituerauncahierdeschargespréalableoùl’élicitationdetâchesdépendfortementdudomained’application.Lessciencesdunumériquesprendrontensuitelerelaipourtraduirececahierdeschargesentermes technologiques, c’est-à-dire en mise en oeuvre de plateformes et en uneimplémentationduprocédéesquisséprécédemment.

La définition et l’implémentation d’un tel procédé n’ont de valeur que si lacommunauté scientifique du domaine correspondant les reconnait comme des pratiquesscientifiques valables et conformes aux usages du domaine. Un regard particulier seraporté sur la crédibilité de l’approche, sa tolérance aux fautes (en particulier lescomportements potentiellement malveillants des participants), les biais qu’elle peutinduire dans les tâches élémentaires ou dans l’agrégation de ces tâches, lamesure de laqualité des résultats intermédiaires ou finaux, l’interprétabilité des résultats, lareproductibilitéduprocessus,etc.

Bienquecesdeuxpointssoientconnusdanslessciencesdunumérique,enparticulierdans la conception des logiciels (analyse, décomposition, développement coopératif,intégration, test, validation, ...), ils n’ont jamais été à ce point «externalisés» vers desacteurs non spécialistes du domaine, et n’ont jamais connu une implication aussinombreused’acteurs (milliers, centainesdemilliers, voiremillionsdeparticipants).D’oùl’importancequeprennent lessciencesparticipativesenarticulationavec lessciencesdunumérique et les ouvertures que cette articulation offre pour adresser des problèmesnouveauxoujamaisrésoluspardéfautdeméthodeouenraisondeleurcomplexité.

Atitred’illustration,citonsunexempledeplateformeetunexempledeprojet:

- Les plateformes InnoCentive[5] et IdeaConnection[6]. En l’occurrence, onmentionnesur le site de la plateforme IdeaConnection la “success story” d’une sociétéCanadienne qui serait parvenue à découvrir une mine d’or[7] en partageant sesdonnées géologiques et en les faisant prospecter de façon distribuée par desmathématiciens,desgéologues,desmilitaires,desétudiantsetc.

- Le projetGraph Isomorphim Game[8] de la plateforme crowdcrafting[9] propose derésoudre des instances du problème d’isomorphisme de graphes (GIP - GraphIsomorphismProblem)defaçondistribuée.Onpeutaussiconsultersurlesite“nextstopdesign”[10] laréférenceàuneexpériencedeconceptiondistribuéequiaportésur les abris bus. Plus généralement, il existe des tâches d’optimisation dans des

Page 11: Apport des sciences du numérique dans les sciences participatives

9

domaines spécifiques comme la manipulation de gros graphes où le coup d’œilhumain peut aider considérablement dans la recherche d’une solution à desproblèmesdecroisement,d’appariementoud’identificationdesous-graphesayantcertainespropriétés.

Les sciences participatives constituent donc pour le numérique une nouvelleapproched’analyseetderésolutiondeproblèmes,originalesdansleurcapacitéàformulerunproblèmeenunensembledetâchesdistribuées,etàmobiliserlesressourceshumainesnécessairespourréalisercestâches.

4 Problématiquesscientifiquesdanslessciencesdunumérique

La mise en œuvre de campagnes de collecte massive d’information auprès d’amateursbénéficie grandement de l’apport des technologies du numérique. Cela tient à la fois aurecueilenlignequitirepartidesfacilitésoffertesparlewebetautraitementdesmassesdedonnées (ce que l’on appelle aussi les Big Data) ainsi recueillies qui fait appel à destechniquesd’apprentissagemachineetdefouillededonnées.

Audelàde lamiseenœuvrede techniques connues, celaouvre surdesquestionsnouvellesauxquelleslessciencesdunumériquepeuventetdoiventcontribuer,soitseules,soit en collaboration avec différentes disciplines, en particulier avec lesmathématiques,l’économie, lasociologiedesusageset lapsychologiesociale.Déjà,desateliersdetravail,descolloquesoudessessionsspécialesdansdegrandesconférencesscientifiquesabordentcespoints.Cettesectionenénumèreuncertainnombre.

4.1 Déploiementdestâches

Unepremière question tient à ladécompositiondes tâches en sous-tâches qui doiventêtreacceptablespar lesparticipants.Queldegrédedifficultéestadmissiblepourobtenirlesmeilleursrésultats?Quelledoitêtrelanatureetladuréedecestâches?

Unesecondequestionportesurl’assignationdestâchesauxutilisateurs:commentfaut il procéder ? Doit-on donner une seule tâche à chaque contributeur ou plusieurs ?Ainsi, si l’on annote des bandes dessinées, faut-il demander à la fois de reconnaître lecontenu textuel des bulles et des phylactères, le nom de protagonistes et les lieux, ouspécialiser les contributeurs sur une seule de ces tâches? De façon symétrique, doit-onassignerlamêmetâcheàplusieurspourconfronterlesrésultats?Acetégard,onpeutaussiessayerdefairecoopérerlesgens.Celaposedesquestionsrelativesàlatailledesgroupeset à la complémentarité des compétences, ce qui relève plus de la sociologie desorganisationsquedessciencesdunumérique. Indépendammentdecesquestionsd’ordre

Page 12: Apport des sciences du numérique dans les sciences participatives

10

sociologique, cela pose des questions intéressantes sur lamodélisation de processuscoopératifsavecdesagentsauxcompétencesvariéesetsurlasynchronisationéventuelledesdifférentestâches.

Enfin, comment repérer, parmi les participants, ceuxqui sont les plus àmêmederéaliser une tâche? Pour cela, il convient certainement de les profiler. Mais, commentconstruire ces profils et comment lesmettre en adéquation avec les tâches et enfincommentaiderlesparticipantsàchoisirlatâchequileurconvientlemieux?

4.2 Motivationdesparticipants

Pourrecruterdesparticipantspotentiels, ilconvient,d’abord,delessollicitercequitientgénéralementà laplateformeetà sonaudience.Onpourrait toutefois imaginerdansdesopérationsdescienceparticipativepasserpardescommunautéssavantes,desinstitutionséducativesoudesorganismesderecherchespourattirerlesparticipantspotentiels.

Outrecettesollicitation,ilfautlesmotiver,cequitientsoitàl’intérêtintellectueldelatâche,soitàsoncaractèreludique[16],soitencoreàlastimulationproduiteparl’enviedecontribuer à l’avancée des connaissances ou à la soif d’apprendre. C’est le cas dansFoldIt[17],uneplateformesurlaquellelesparticipantssontinvitésàparticiperàunjeuderepliement de protéines. Cela peut aussi être un scénario pédagogique : des classes decollégienscontribuent,àlademandedeleurprofesseur,àréaliserdestâchesd’annotation;lecontextescolaireinduitalorsuneformedemotivation.

Cettemotivationprendaussiparfoislaformed’unerétributionfinancière,cequipose tout naturellement la question du montant de cette rétribution. En effet, nonseulement, cela a un certain coût mais, de plus, l’expérience montre qu’une indemnitéimportanteattireunegrandemassedepersonnemuesuniquementparl’appâtdugain.Ilenrésulteunforttauxderéponseserronées,parcequehâtives.Onassistedoncàdeseffetsparadoxauxquiconduisentàobtenirdemeilleuresréponsesavecunerémunérationplusfaible.A cela, il faut ajouter quedes expériences ont prouvéque, plusque la rétributiontotale,lacomparaisondesrétributionsconduitàcertainesfrustrations[18].

Notons que les recherches touchant à la motivation des participants débordentlargementlacompétencedesseulesinformaticiens:lessciencesdel’hommeetdelasociétésontinvitéesàexaminerlesdimensionspsychologiques,sociologiquesetéconomiques.Les“cobayes humains” ou les cohortes utilisés en médecine depuis des lustres constituentcertainement une source d’information à exploiter et analyser pour en déterminer lesmotivations.

Page 13: Apport des sciences du numérique dans les sciences participatives

11

4.3 Validationetdétectiond’anomalies

Unefoislestâchesexécutées,ilconvientdevaliderlesréponses,d’évaluerleurqualitéetde détecter les anomalies systématiques ainsi que les biais. Pour déterminer uneréponse acceptable, on peut soit recourir à un vote majoritaire, soit prendre enconsidérationleprofildecompétencedesutilisateurs.Ceprofillui-mêmepeutêtreapprisautomatiquement en fonction de la qualité des réponses apportées antérieurement. Ausurplus,ilconvientd’éliminerlebruitinhérentàunecollectedistribuée.Ladéterminationdesmodèlesdevalidationdesréponses,le«nettoyage»desdonnéesacquisesainsiquelaconstruction des profils de compétences apparaissent comme autant de sujetsd’investigationintéressantspourdeséquipesderecherchedanslessciencesdunumérique.

Acela,ajoutonsquelessitesdesciencesparticipativesnesontpasàl’abrid’actionspartisannes menées par des groupes de militants voulant, pour des raisons diverses,infléchir les résultatsd’une étude. Là encore, ladétectionde ces actions individuellesoucollectivesdevraitfairel’objetderecherche.

4.4 Modèlesetalgorithmes

Certaines questions liées à la modélisation des participants et des tâches ainsi qu’auxalgorithmesd’assignationdetâchesauxparticipantsetauxalgorithmesd’apprentissagedeprofils des participants, ont déjà été abordées par des équipes de recherche. Un grandnombre de ces questions reste ouvert[11]. La modélisation des participants nécessite deprendre en compte des facteurs humains tels que l’expertise des participants, leurdisponibilité, la nature de leur motivation ou leur ratio de participation à des tâchesantérieures.Ces facteursdoivent intervenirdans laconceptiond’algorithmesd’allocationdetâchesauxparticipantsetdevalidationdesréponsesdesparticipantsauxtâches.

Deplus, commeunegrandemajoritédesplateformesdecrowdsourcingsebasentsur le volontariat, et sur la capacité des participants à s’auto-assigner des tâches, ellesbénéficieraient de travaux antérieurs dans le domaine de larecommandation en ligne.Celapermettraitd’orienterlesparticipantsetdelesaideràtrouverlestâchesqui lesintéressentleplus,toutengérantaumieuxlefluxdestâchesàtraiter.

L’apprentissage des compétences des participants soulève de nouveauxproblèmes d’ordre algorithmique. Aujourd’hui, pour établir les compétences departicipants potentiels, la majorité des plateformes recourent à des tests de pré-qualification, sous forme de questionnaires remplis par les utilisateurs eux-mêmespréalablement à l’exécution des tâches. Ces questionnaires sont coûteux, fastidieux etdoiventêtreadaptésauxbesoinsdechaquetâche.Uneapprochebaséesurl’apprentissage

Page 14: Apport des sciences du numérique dans les sciences participatives

12

automatique des qualifications des participants à partir de tâches exécutées auparavant,seraitplusrobuste.

Alorsquecertainsmodèlesetalgorithmespourlecrowdsourcingontététestéssurdes simulateurs, il convient aussi, pour certaines évaluations, de lesdéployer avec desparticipantshumains.Ladisponibilitédetelsenvironnementsestessentiellepour(1)lepassageàl’échelledesalgorithmes,et(2)leurconfrontationauxfacteurshumains[12].Celapermet de valider les hypothèses scientifiques sur les motivations et les pratiquescollectives.Parexemple,l’hypothèseselonlaquellelestâchescollaboratives(ex.,rédactiond’untexteàplusieurs)sontmieuxeffectuéespardesgroupesdemoinsdetroismembres(masse critique) peut être ainsi validée. Egalement, le déploiement de tâches avec desparticipants humains permet d’aborder des questions demotivation ou les questions deremplacement incrémental de participants au cas où certains seraient indisponibles aumoment du déploiement ce qui n’est évidemment pas possible dans un environnementsimulé.

4.5 Plateformes

Dans chaqueopérationde scienceparticipative en ligne, il faut construiredes sitespourmettre en œuvre le recueil informatique de données et de connaissances. Ce travail deprogrammation assez lourd et coûteux est grandement facilité par l’utilisation deplateformesgénériquesde«crowdsourcing».Cependant,beaucoupresteàfairepourallégerlefardeaudeceuxquisouhaitentselancerdanscetteentreprise,enparticulierpourles aider à décomposer les tâches, à valider les réponses, àmotiver les participants, etc.Aujourd’hui, laplateforme laplusutiliséesembleêtreAmazonMechanicalTurk[13] (AMT)dufaitdunombredeparticipantspotentiels.Cependant,celle-cisembleplusdédiéeàdesopérations commerciales qu’aux sciences participatives, car elle repose d’abord sur unerétribution financière des exécutants. Il en existe d’autres comme Crowd4U[14] et, enlogiciellibre,PyBossa[15]maislerecrutementyestmoinsaisépuisqu’iln’estpasrémunéréet qu’il repose sur desmilieux plus restreints que la clientèle Amazon tel que lemilieuacadémiquepourCrowd4Uetlescerclesd’amispourPyBossa.Acela,ilfautajouterquelesplateformes commerciales ne donnent pas la maîtrise de tous les composants. Leschercheurséprouventdoncdesdifficultés àmodifierunmodule spécifiqueouà intégrerune fonctionnalité qu’ils désirent tester. Et, quand bien même ils seraient parvenus àajouterunmoduleoriginal, ilsn’arriventpasà lemettreàdispositionde lacommunautéd’utilisateursdelaplateformeetàfaireconnaîtreleurtravail.

En outre, on pourrait essayer de rendre les attributions de tâches et lesrémunérations transparentessur lesplateformes,desorteque lescitoyenscontribuantàune activité scientifique aient une idée du but ultime de la recherche à laquelle ilscontribuent, qu’ils sachent quelle est leur place dans l’ensemble du dispositif et qu’ils

Page 15: Apport des sciences du numérique dans les sciences participatives

13

connaissent leurs partenaires et éventuellement échangent avec eux. Cependant, cettevisionouvertepeutêtrediscutablesielle“romptlaneutralité”duprocessusscientifiqueetconduit à des “alliances d’activistes” souhaitant orienter la méthode ou les résultatsscientifiquesdansunedirectionquileurestfavorable.

5 Recommandationd’actions

Ilexiste,danslespaysdéveloppés,desinitiativesetdesfinancementsimportantspourdesprojets de recherche ayant trait aux dimensions numériques des sciences participatives.C’estenparticulierlecasauxEtats-Unisaveclelancementd’appelsd’offredelaNSFdepuisplusieursannées,parexempleen2014,surlesSocial-Computationalsystems[19].Demême,il yeuquelques initiativeseuropéennes sur cesproblématiques;notons,parexemple, leprojetSocial-IST[20]surl’intelligencesocialecollective(SocialCollectiveIntelligence)[21].

A cela, onpeut ajouter, auxEtats-Unis, des laboratoires, comme leAMPLab[22] del’université de Berkeley, dont l’activité contribue en grande partie au développement detechniques d’interprétation des données recueillies par les sciences participatives[23]. Sil’on souhaite donner, dans notre pays, un essor aux sciences participatives, il apparaîtindispensable de lancer et financer des programmes de recherche sur leur versantnumérique, tant auniveau théoriquequ’à celui, plusappliqué,des technologiesmisesenœuvre.

Compte tenu de l’état d’avancement des recherches et du domaine sur lequel ilsportent, ces programmes doivent se répartir sur trois volets complémentaires:infrastructure d’accompagnement de la recherche, axes de recherche spécifiques etémergencedecompétencesinterdisciplinaires.

5.1 Infrastructured’accompagnementdelarecherche

5.1.1 Plateformestechnologiques

Nousavonsvuque larechercheencedomainepassaitparundéploiementen ligneavecdesparticipantshumains.Acettefin,ilfautrecouriràdesplateformestechnologiquespourne pas recommencer, à chaque fois, le travail de programmation. Or, outre qu’elles nedonnentpaspleinementsatisfaction,lesplateformesdisponiblesenlibreaccèsaujourd’huineprocurentpasauxutilisateurslamaîtrisesurtousleurscomposants,cequiconstitueunverrou pour des chercheurs qui souhaiteraient procéder à des expérimentationsspécifiques. Il faudrait donc promouvoir des plateformes technologique decrowdsourcing ouvertes à toute la communauté scientifique. Sur ce point, il apparaîtimportant d’éviter la fragmentation des efforts et la dispersion des ressources en

Page 16: Apport des sciences du numérique dans les sciences participatives

14

mobilisant les forces sur quelques sites bien identifiés et en poursuivant lesfinancementsdans le temps,pourassurer leurpérennité.A cet égard, ilne semblepasnon plus souhaitable d’imposer une centralisation excessive sur un seul équipementnational, car tant l’émulation que la proximité thématique et géographique apparaissentbénéfiques.

5.1.2 Centrederessourcesetsupporteningénierie

Audelàdesplateformestechnologiquesdecrowdsourcing,leschercheursrecourenttousàdes équipements logiciels qu’il serait bon de partager dans des centres de ressourcesmutualisées. Cela permettrait à la fois de valoriser des réalisations existantes, pour lesoffriràtous,delesperfectionner,entenantcomptedescontributionsetdesremarquesdesutilisateurs, et de faciliter la tâche des chercheurs en leur procurant des outils qu’ilsn’aurontpaseux-mêmesàreprogrammer.

De même, il faudrait partager les données recueillies, pour tester et comparerdifférentestechniquesdetraitement.

Encomplémentàceséquipementslogiciels,ilfaudraitmettreenplacedessupportsen ingénierie qui s’occuperaient de la maintenance des équipements logiciels et desplateformes de crowdsourcing, tout en développant des outils et en les mettant à ladisposition de toute la communauté. Ces supports sont essentiels pour éviter de voir lefruitd’effortsfinanciers,parfoisconsidérable,seperdre,fautedesuivi.

Ceséquipesd’ingénieursetcescentresderessourcespourraientprendreplacedansdes «maisonsdes sciencesparticipatives» qui auraient pour vocation d’accompagnerles chercheurs d’horizons différents et de contribuer à la pérennité des équipements.Soulignons,ici,lecaractèreincrémentaldelarecherchequis’appuiesurlesrésultatsetlesapportsantérieurspourprogresser.

5.2 Axesderechercheprioritaires

Indépendamment de ces infrastructures technologiques et de l’ingénierie, un certainnombredeproblèmesnepourrontêtrerésolusquesil’onpromeutdesrecherchesdanslessciencesdunumérique.Parmi ces recherches, certainesapparaissentaujourd’hui commeprioritaires.C’estenparticulierlecaspour:

♦ Ladécompositiondeproblèmesentâchesetl’allocationdestâchesauxutilisateurs,♦ La constructiondynamiquedesprofils de compétences àpartir desperformancesobtenues et la détection de «vandales», ce qui sert à la fois pour l’allocation destâches, pour l’évaluation de la qualité des réponses et pour la validation desconnaissances,

Page 17: Apport des sciences du numérique dans les sciences participatives

15

♦ La construction et la validation des connaissances acquises par croisement desréponsesobtenues,avecl’utilisationdemodèlesdecompétencedesutilisateurs♦ Lamiseaupointdemodèleséconomiquestenantcomptedesdifférentesformesderétribution,♦ Le traitement des grandes masses données provenant, en particulier, des objetsconnectésetdestracesd’usage.

5.3 Emergencedecompétencesinterdisciplinaires

Lessciencesparticipativesnesecontententpasderecouriràdesinfrastructureslogiciellesetàdutraitementd’information.Silessciencesdunumériqueetlesmathématiquesyontune grandepart, ellesne suffisentpaspour comprendre lesblocagesou les réussitesdetelleoutelleopération.Eneffet,lescontributeursyjouentunrôlecentral.Enconséquence,pour concevoir les interfaces d’acquisition de données, pour motiver les participants etpourévaluerleurscompétencesondoitaussifaireappelauxsciencesdel’Hommeetdelasociété,enparticulieràlapsychologiecognitive,àlapsychologiesociale,àlasociologiedesusages, à l’économie, etc.Cetapportdes sciencesde l’Hommeetde la sociéténepeut sefaireenparallèle,de façondisjointe. Il fautdeséquipesqui travaillentdeconcert,sur lesprojetscommun,afinquelaréflexiondessciencesdel’Hommeetdelasociétésoitpriseencomptedès la conception et qu’elle intègre les contraintes techniques et algorithmiques.Des liensentredisciplinesdoiventdoncs’établir surdesprojets conjoints.Les«maisonsdes sciences participatives» pourraient jouer là un rôle très positif en favorisant leséchangesetenstimulantlesinitiatives.

5.4 Résumédesrecommandations

Enconclusion,lesrecommandationssontdesquatreordres:

1. Aider au développement deplateformespérennes de «crowdsourcing» et delogicielsdetraitementadaptésafindepermettreauxchercheursd’avoirlamaîtrisedesdifférentscomposants,toutenévitantdeuxécueils,lacentralisationexcessiveetladispersiondesefforts.

2. Mettreenplacedes«maisonsdessciencesparticipatives»bienidentifiéessurleterritoirenational.Cesmaisonsabriterontdesplateformestechnologiquesavecdeséquipes supports d’ingénieurs qui assureront la pérennité de plateformes de«crowdsourcing», leur maintenance, l’accès libre et la fourniture de ressourceslogiciellespourl’acquisitioncollaborativededonnéesetleurtraitement.

3. Financerdesaxesderechercheprioritairesdanslessciencesdunumériquequiporteront, entre autre, sur la modélisation des compétences des participants, ladécomposition et l’allocation des tâches, la construction et la validation des

Page 18: Apport des sciences du numérique dans les sciences participatives

16

connaissances,laconceptiond’interfaces,lamiseaupointdemodèleséconomiquesetletraitementdegrandesmassesdedonnéesissuesd’uneacquisitiondistribuée.

4. Encourager à la faveur de projets communs l’émergence de compétencesinterdisciplinaires entre les sciences du numérique et certains secteurs dessciences de l’Homme et de la société, en particulier la sociologie des usages, lapsychologiesociale,lapsychologiecognitiveetl’économie.

6 Références[1]https://hal.archives-ouvertes.fr/hal-01067110/document[2]https://en.wikipedia.org/wiki/Amazon_Mechanical_Turk#Labor_relations[3]http://www.galaxyzoo.org/[4]http://slide-apps.liglab.fr/~crowdhealth/[5]https://www.innocentive.com/[6]http://www.ideaconnection.com/[7] http://www.ideaconnection.com/open-innovation-success/Open-Innovation-

Goldcorp-Challenge-00031.html[8]http://crowdcrafting.org/project/graphisomorphism/[9]http://crowdcrafting.org/[10]http://nextstopdesign.com/[11]http://www.www2015.it/documents/proceedings/companion/p1531.pdf[12]http://wp.sigmod.org/?author=22[13]https://www.mturk.com/mturk/welcome[14]http://crowd4u.org/en[15]http://www.pybossa.com[16]Lesplateformesde«CrowdSourcing»prennentparfoislaformedejeux.[17]http://fold.it/portal/[18]http://arxiv.org/abs/1008.1276[19]http://www.nsf.gov/funding/pgm_summ.jsp?pims_id=503406[20]http://social-ist.eu/[21]http://www.springer.com/us/book/9783319086804[22]AMPLab–AlgorithmicMachineandPeopleLaboratoryhttps://amplab.cs.berkeley.edu/#[23] Le site de l’AMP Lab décrit de façon très explicite ses objectifs, en faisant

référenceautraitementdemassesdedonnéesissuesducrowdsourcing:“Workingattheintersection of three massive trends: powerful machine learning, cloud computing, andcrowdsourcing, the AMPLab is creating a new Big Data analytics platform that combinesAlgorithms,MachinesandPeopletomakesenseatscale.”