le web 2.0 pour la veille et la recherche d'information
Post on 03-Feb-2022
1 Views
Preview:
TRANSCRIPT
Le Web 20 pour la veille et la recherche dinformation Exploitez toutes les ressources du Web Social
Juin 2007
Whi
te P
aper
DIGIMIND
wwwdigimindcom Digimind Services ndash White Paper|0
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Avertissement
Ce document a eacuteteacute reacutealiseacute par la socieacuteteacute Digimind
Le contenu de ce document est proteacutegeacute par le droit drsquoauteur Il peut ecirctre reproduit
en partie agrave la condition de citer Digimind comme auteur et drsquoindiquer lrsquoadresse
httpwwwdigimindcom Pour toute information compleacutementaire vous pouvez
contacter Digimind par mail agrave lrsquoadresse contactdigimindcom ou par teacuteleacutephone au
01 53 34 08 08
copy Digimind Digimind Services ndash White Paper |1
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Sommaire
AVERTISSEMENT 1
AVANT PROPOS 4 Web 20 4
QUEST-CE QUE LE WEB 20 5
Preacuteambule 5
Deacutefinition du web 20 6
Les 7 principes du Web 20 8
Les eacutevolutions par rapport au Web 10 le rocircle de linternaute 9
GLOSSAIRE DU WEB 20 12
LES TECHNOLOGIES DU WEB 20 15
LES FAMILLES DAPPLICATIONS DU WEB 20 18
Typologie 18
Comment identifier un site Web 20 23
LES APPLICATIONS WEB 20 POUR LA VEILLE ET LA RECHERCHE DINFORMATIONS 24
Les types dapplications 24 I Partager et collaborer 24 a Les Bookmarks sociaux 24 b Le Multimeacutedia photos et videacuteos 30 c Partage de cv et reacuteseaux sociaux35 d Les sites dactualiteacutes collaboratives recommandation et notation38 II Rechercher Collecter 42 a La recherche de blogs et de flux RSS42 b La recherche par tags48 c La recherche de personnes et dinformations entreprises 54 d Les moteurs de recherche humains56 e les moteurs de recherche collaboratifs59 f La verticalisation par la personnalisation du peacuterimegravetre de recherche62 g Lenrichissement de bases de donneacutees faccedilon Web20 65 h Conserver et exploiter lhistorique de vos recherches et navigations67 i Les mash-up 69 III Diffuser73
copy Digimind Digimind Services ndash White Paper |2
Le Web 20 pour la veille et recherche dinformation DIGIMIND
a Les Blogs et le flux RSS 73 b Les Wikis 74 IV Surveiller 78 a La deacutetection du flux RSS 78 b La mise en surveillance79 c Pourquoi une veille via le RSS 81 V Carte des outils et ressources Web 2082
Exemple dune recherche et veille via le Web 20 84
LES LIMITES DU WEB 20 86
La participation 86 I Une participation heacuteteacuterogegravene 86 Une minoriteacute participativehellip 86 Wikipedia un faux modegravele collaboratif 87 II Une participation damateurs 88
Le web 10 reste neacutecessaire 89 Le mail reacutesiste 89 Une population souvent isoleacutee et non repreacutesentative 90 Des domaines mal couverts 91
CONCLUSION 92
A PROPOS DES AUTEURS 96
WEBOGRAPHIE BIBLIOGRAPHIE 98 Sites web wikis et blogs98 Articles 101 Ouvrages 102
DANS LA MEME COLLECTION 104
NOTES 105
copy Digimind Digimind Services ndash White Paper |3
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Avant propos
Web 20
La notion de Web 20 est tregraves souvent employeacutee mais finalement peu de
personnes sont capables de lexpliquer preacuteciseacutement
Lobjectif de ce document est de deacutemocratiser le concept de Web 20 aupregraves des
Knowledge Workers Il sadresse aux diffeacuterents collaborateurs de lentreprise qui
nutilisent pas encore ou peu les diffeacuterentes applications regroupeacutees sous ce
concept Les sensibiliser agrave ces outils pourra ameacuteliorer la pertinence de leur
recherche et de leur veille informationnelle
copy Digimind Digimind Services ndash White Paper |4
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Quest-ce que le Web 20
PREAMBULE
Pour certains le Web 20 nest qun gadget un pur pheacutenomegravene de mode qui ne
meacuterite pas que lon sy attarde Pourtant une eacutevolution importante a bien eu lieu sur
le web quelque soit le nom que lon lui donne
Ainsi en 2006 un metteur en scegravene a choisi de diffuser son long meacutetrage Autumn1
gratuitement et ce uniquement sur internet via le service Google Video2 Il navait
pas trouveacute de distributeur capable dexploiter son film dans plus de 30 salles En mai
2007 plus de 920 000 internautes avaient deacutejagrave vu Autumn sur le service de partage
de videacuteos de Google
Fin 2005 pour le compte de la prestigieuse revue scientifique Nature des experts
ont compareacute des documents publieacutes sur Wikipedia lencyclopeacutedie collaborative en
ligne reacutealiseacutee par des internautes volontaires et beacuteneacutevoles avec ceux de la ceacutelegravebre
Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche
Cette eacutetude a abouti agrave une formidable controverse comment une encyclopeacutedie
reacutealiseacutee par des non-speacutecialistes peut-elle remettre en cause les ouvrages
classiques
Il se passe donc bien quelque chose de nouveau via ce web nouvelle geacuteneacuteration ougrave
linternaute devient actif et collaboratif Mais tellement dacteurs et dapplications se
reacuteclament de ce web 2 que lon a vite limpression de naviguer en Terra Incognita
Certains nheacutesitent dailleurs pas agrave repreacutesenter ce nouveau web via une carte
dexplorateur 3
Aussi agrave travers ce document plongeons dans le Web 20 pour mieux lexploiter
lors de recherche dinformation et de veilles
copy Digimind Digimind Services ndash White Paper |5
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La carte des communauteacutes virtuelles Par Randall Munroe DR
DEFINITION DU WEB 20
Comment deacutefinir de faccedilon preacutecise ce que recouvre cette notion parfois floue
Depuis plusieurs mois le blog collectif Dessine moi le Web 20 4 propose agrave des
universitaires informaticiens philosophes entrepreneurs de donner leur propre
vision du pheacutenomegravene et eacutechanger ideacutees et points de vue La diversiteacute et la richesse
des contributions illustrent la difficulteacute agrave donner une deacutefinition exhaustive de ce
concept agrave geacuteomeacutetrie variable mecirclant agrave la fois des aspects techniques et sociaux
Une vision reacuteductrice du Web 20 consisterait agrave nrsquoy voir que la mutualisation de
contenus produits et mis en ligne par les utilisateurs eux-mecircmes ou agrave reacutesumer
lrsquoengouement actuel agrave un effet de mode passager Depuis la premiegravere confeacuterence
Web 20 en 2004 le concept srsquoest concreacutetiseacute agrave travers de nombreuses
expeacuterimentations ou le deacuteveloppement de nombreux services largement utiliseacutes
Nous tenterons dans ce document de brosser un panorama des enjeux usages et
technologies lieacutes agrave cette notion aussi encenseacutee que controverseacutee
copy Digimind Digimind Services ndash White Paper |6
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Plusieurs auteurs srsquoaccordent sur lrsquoideacutee selon laquelle le web 20 ne constitue pas
une rupture technologique ni hellip sociale Il srsquoagirait plutocirct drsquoun retour aux sources
drsquoune renaissance du web tel qursquoil a eacuteteacute conccedilu agrave lrsquoorigine les utilisateurs srsquoeacutetant
entre temps approprieacutes les modes de creacuteation et de diffusion
Pour Paul Graham5 pionnier de lrsquoInternet et fondateur de la socieacuteteacute Viaweb en
1995 le web 20 est le web comme il a eacuteteacute conccedilu pour ecirctre utiliseacute Les tendances que
nous distinguons sont simplement la nature inheacuterente du web qui eacutemerge des mauvaises
pratiques qui lui ont eacuteteacute imposeacutees pendant la bulle Internet
Le web creacuteeacute au deacutebut des anneacutees 90 par Tim Berners Lee comportait deacutejagrave en
germe bien des eacuteleacutements du web 20 mutualisation des connaissances eacutechange
travail collaboratif interactiviteacute intelligence collective hellip Ce nrsquoest sans doute pas
un hasard si Dale Dougherty lrsquoun des pegraveres fondateurs de la formule 20 fut lui
aussi lrsquoun des pionniers du web et notamment le fondateur de GNN le premier
portail financeacute par la publiciteacute
Naissance du concept
Crsquoest au cours de lrsquoeacuteteacute 2004 que le terme de web 20 apparaicirct pour la premiegravere
fois lors drsquoune seacuteance de brainstorming Dale Dougerthy co-fondateur de la
socieacuteteacute drsquoeacutedition OrsquoReilly et Craig Cline de MediaLive reacutefleacutechissent agrave des thegravemes
eacutemergents en vue drsquoune confeacuterence agrave venir Le journaliste John Battelle co-
fondateur du magazine Wired se joint un peu plus tard au duo et la premiegravere
confeacuterence Web 20 a lieu en octobre 2004 Lrsquoexpression 20 est utiliseacutee agrave ce
propos pour marquer lrsquoeacutemergence drsquoune nouvelle eacutetape dans la courte histoire du
web eacutetape caracteacuteriseacutee par un changement des regravegles et une modification des
modegraveles de revenus Le volet social sera deacuteveloppeacute plus tardivement par Tim
OReilly lors de la deuxiegraveme confeacuterence Web 20 en octobre 2005
Les nouveaux produits et services associeacutes au web 20 vont ainsi repositionner
lrsquointernaute au cœur du systegraveme Des techniques de publications simples et souples
comme les blogs les plates-formes collaboratives de type Wiki offrent des
possibiliteacutes accrues de production diffusion et consommation des contenus
Lrsquointernaute devient ainsi co-creacuteateur de nouvelles applications en ligne initiant
souvent de faccedilon collective ou communautaire de nouvelles formes de relations
numeacuteriques Selon lrsquoexpression drsquoHubert Guillaud6 le web devient non plus une
aventure technologique mais bien une aventure humaine
copy Digimind Digimind Services ndash White Paper |7
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LES 7 PRINCIPES DU WEB 20
Le texte de Tim OrsquoReilly paru en 2005 7 sous le titre Qursquoest ce que le web 20
deacutegage sept principes cleacutes du Web 20 en voici un petit reacutesumeacute
1 Le web vu comme une plate-forme de services
On passe dune collection de sites web agrave une plateforme informatique agrave part
entiegravere fournissant des applications web aux utilisateurs
2 Consideacuterer les internautes comme co-deacuteveloppeurs des applications On passe ainsi
de la notion de logiciel produit agrave celle de logiciel service
3 Le service srsquoameacuteliore quand le nombre drsquoutilisateurs augmente
Le Web 20 met agrave profit lrsquoeffet de la longue traicircne (ou long tail en anglais)
populariseacute par le magazine Wired les produits qui sont lrsquoobjet drsquoune faible
demande ou qui nrsquoont qursquoun faible volume de vente peuvent collectivement
repreacutesenter une part de marcheacute eacutegale ou supeacuterieure agrave celle des best-sellers si les
canaux de distribution peuvent proposer assez de choix Les utilisateurs du Web
20 disposent de donneacutees uniques difficiles agrave recreacuteer et dont la richesse srsquoaccroicirct
avec lrsquoaugmentation du nombre des utilisateurs
4 La richesse est dans les donneacutees Toutes les applications web drsquoimportance sont
lieacutees agrave une base de donneacutees speacutecialiseacutee OrsquoReilly envisage un mouvement des
donneacutees libres srsquoopposant peu agrave peu agrave lrsquounivers des donneacutees proprieacutetaires
5 Tirer parti de lrsquointelligence collective crsquoest le principe mecircme adopteacute par
lencyclopeacutedie en ligne Wikipedia et drsquoautres sites similaires Pour Tim OrsquoReilly
lrsquoimplication des utilisateurs dans le reacuteseau est le facteur-cleacute pour la supreacutematie sur le
marcheacute
6 Mettre en place des interfaces souples et leacutegegraveres fondeacutees sur les nouveaux
standards et protocoles du Web Le logiciel se libegravere du PC Une autre des
caracteacuteristiques du web 20 est le fait qursquoil nrsquoest plus limiteacute agrave la plate-forme PC
mais vise notamment les objets nomades teacuteleacutephone portable PDA ou lecteur
portatif audio
copy Digimind Digimind Services ndash White Paper |8
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LES EVOLUTIONS PAR RAPPORT AU WEB 10 LE ROLE DE LINTERNAUTE
En quoi le Web 20 se distingue-t-il de la vague preacuteceacutedente On a vu que lrsquoune des
caracteacuteristiques majeures du pheacutenomegravene est lrsquoappropriation des contenus et des
modes de diffusion par les internautes eux-mecircmes via des applications souples et
leacutegegraveres
Paul Graham eacutevoque le principe de deacutemocratie du Web 20 cest-agrave-dire la
superposition au reacuteseau technique drsquoun reacuteseau humain qui participe agrave la creacuteation et
agrave lrsquoenrichissement de contenus et services Lrsquointernaute deviendrait ainsi
consommrsquoacteur agrave lui de produire publier diffuser indexer partager des
contenus de tous types
Web 10 Web 20
Leaders du web Entreprises marchands Internautes
Profil de linternaute Passif Actif
Interactiviteacute perccedilue Seacutelection et lecture dinformation
Seacutelection lecture et publication de donneacutees
Uniteacute de recherche Mot-cleacute Tag
Du Web 1 vers le Web 2 Source ZDNet 8
Pour autant les internautes vont-ils devenir tous acteurs de ce processus Selon un
article de Charles Arthur dans The Guardian 9 pour un groupe de 100 personnes si
lrsquoune creacutee du contenu 10 seulement vont interagir en apportant commentaires et
ameacuteliorations les autres se contentant drsquoune consommation passive Ce constat
obtenu via des retours drsquoexpeacuterience sur des sites collaboratifs illustre la regravegle des
11089 selon laquelle plus de 80 des contenus produits proviennent drsquoun
nombre tregraves restreint drsquoutilisateurs
Tendance confirmeacutee par les chiffres preacutesenteacutes lors de la Web 20 Expo en avril 2007
et repris dans Internetactu 10 selon la socieacuteteacute de mesure drsquoaudience Hitwise11
016 des internautes qui passent sur YouTube y placent des films - alors qursquoils
eacutetaient encore 05 agrave le faire en juillet 2006 seulement 02 des visiteurs de
Flickr y publient des photos La seule exception agrave cette faible participation provient
copy Digimind Digimind Services ndash White Paper |9
Le Web 20 pour la veille et recherche dinformation DIGIMIND
de Wikipedia ougrave 46 des visiteurs contribuent agrave lrsquoenrichissement de
semblent en effet
voir eacutecrit des textes longs (en un nombre reacuteduit drsquointerventions) tandis que les
eacutediteursrdquo les plus actifs qui forment le noyau des wikipeacutediens nettoient corrigent
lective fondeacutee sur des actions agrave faible niveau drsquoexigence
(lire enregistrer un signet tagger commenter) de lrsquointelligence collaborative
caracteacuteriseacutee par des formes de participations plus actives et intenses eacutecrire
collaborer modeacutererhellip
lrsquoencyclopeacutedie
Jimmy Wales fondateur de Wikipedia estime qursquoun nombre restreint de
contributeurs et eacutediteurs font lrsquoessentiel du travail alors qursquoun nombre consideacuterable
de lecteurs apportent peu de modifications Le wikipeacutedien Aaron Swartz nuance
ce point de vue un grand nombre de contributeurs occasionnels
a
ldquo
mais sans apporter eacutenormeacutement de texte
Le Web 20 et tout particuliegraverement la blogosphegravere semble suivre la loi de la
participation eacutedicteacutee par Ross Mayfield preacutesident de la socieacuteteacute Social Text sous le
nom de Power law of participation12 Cette loi baseacutee sur lrsquoobservation des
pratiques et des seuils de participation aux dispositifs communautaires constate que
la participation srsquoamenuise agrave mesure que les formes de participation se
complexifient Le scheacutema ci-dessous qui rappelle celui de la Longue Traicircne
distingue lrsquointelligence col
Power Law of Participation par Ross Mayfield CC
copy Digimind Digimind Services ndash White Paper |10
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Le cabinet Forrester deacutetaille enc
de la participation figurant dans son eacutetude Social Technographics 13 la grille compte
6 eacutechelons correspondant aux niveaux de particip
les inactifs (52 )
les spectateurs (33 ) consommateurs de contenus texte ou multimeacutedia (blogs
videacuteos mis en ligne par les utilisateurs podcasts)
ore davantage les niveaux drsquoimplication dans la grille
ation
les menuisiers (19 ) utilisateurs de reacuteseaux sociaux
es collecteurs (15 ) utilisent des flux RSS et taggent les pages web
les critiques (19 ) postent des commentaires sur les blogs des avis et critiques
les creacuteateurs (13 ) publient des contenus en ligne (blogs videacuteos)
l
copy Digimind Digimind Services ndash White Paper |11
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Glossaire du Web 20
Pour mieux comprendre les concepts utiliseacutes dans lunivers du Web 20 nous vous
proposons ce glossaire des termes essentiels
Tags mot clef sous forme drsquo eacutetiquette que les utilisateurs peuvent apposer sur
un document numeacuterique (texte photo videacuteo) de faccedilon agrave en deacutecrire le contenu Le
tagging introduit une part de subjectiviteacute par rapport agrave lrsquoindexation automatique
effectueacutee par les moteurs Les tags peuvent eacutegalement ecirctre extraits
automatiquement drsquoun texte en fonction de leur freacutequence drsquooccurrence
Nuage de tags preacutesente les tags correspondant agrave un site (ou agrave plusieurs) en les
regroupant sur un mecircme espace et leur attribuant une taille variable suivant la
freacutequence dutilisation ou drsquooccurrence Cela donne une vision drsquoensemble des
principales theacutematiques Le site Tagcrowdcom14 permet de geacuteneacuterer un nuage de
tags agrave partir drsquoun texte
Folksonomie (traduit eacutegalement parfois par potonomie peuplonomiehellip)
Ce mot valise contraction de folk (peuple) et taxonomie deacutesigne une forme de
classification collaborative deacutecentraliseacutee spontaneacutee baseacutee non pas sur un
vocabulaire controcircleacute et standardiseacute mais sur des termes choisis par les utilisateurs
eux-mecircmes intituleacutes tags Lrsquoobjectif eacutetant de faciliter lrsquoindexation des contenus
ainsi que la recherche drsquoinformation
Blogs journal personnel disponible sur le web Peut ecirctre tenu par un particulier
un chercheur un journaliste un salarieacute drsquoentreprise ou plus rarement par un groupe
de personne (entreprise collectiviteacutehellip) Le blog a pour objet de diffuser des billets
geacuteneacuteralement lieacutes agrave lrsquoactualiteacute et preacutesenteacutes par ordre chronologique alors qursquoun
wiki est destineacute agrave la mutualisation des connaissances Un blog peut preacutesenter des
contenus multimeacutedias photo (photoblog) son ou videacuteo (vblog vlog)hellip
Blogosphegravere la biosphegravere des blogs Ce mot valise deacutesigne la communauteacute
des blogs ou encore lrsquoensemble des auteurs de blogs La blogosphegravere est largement
interconnecteacutee les trackbacks situeacutes sur la plupart des blogs permettant de lier
copy Digimind Digimind Services ndash White Paper |12
Le Web 20 pour la veille et recherche dinformation DIGIMIND
deux articles traitant de sujets connexes Lrsquoeacutelite des blogueurs particuliegraverement
influents peut ecirctre qualifieacutee ironiquement de blogeoisie
Blogroll ou blogoliste liste de liens vers drsquoautres blogs preacutesenteacutes par lrsquoauteur
drsquoun blog On peut syndiquer sur une mecircme page des billets venant de ces blogs via
les formats RSS
RSS lrsquoacronyme signifie selon les versions Really Simple Syndication (RSS 20) RDF
Site Summary (RSS 09 10 et 11) ou encore Rich Site Summary (RSS 091) Ce
format de syndication permet drsquoextraire automatiquement dun site web ou drsquoun
blog du contenu reacuteguliegraverement mis agrave jour Un fichier RSS est un simple fichier texte
au format XML comportant la description syntheacutetique du contenu Ce format a eacuteteacute
creacuteeacute en 1999 par Netscape On peut srsquoabonner gratuitement agrave plusieurs flux RSS agrave
partir drsquoun lecteur on-line ou installeacute sur le PC
Atom Format normaliseacute de syndication de contenu Web baseacute sur le XML qui
permet la syndication de contenu entre diffeacuterentes ressources Web Concurrent
de RSS Le format Atom a eacuteteacute creacuteeacute dans le but de simplifier les diffeacuterents formats
RSS existants La diffeacuterence entre les deux formats reacuteside surtout dans lemploi de
balises XML diffeacuterentes Les deux formats sont geacuteneacuteralement lus par les
agreacutegateurs
Wiki Site web dynamique dont tout visiteur peut modifier les pages agrave loisir Le
terme vient la langue hawaiumlenne (wikiwiki = rapide) Un wiki a pour objectif de
mutualiser des connaissances et est organiseacute autour drsquoun plan de classement Les
contributeurs drsquoun wiki sont geacuteneacuteralement anonymes
Crowdsourcing Litteacuteralement approvisionnement par la foule Le
crowdsourcing consiste agrave utiliser la creacuteativiteacute lintelligence et le savoir-faire dun
grand nombre dinternautes pour creacuteer des contenus participer agrave lrsquoalimentation
drsquoun site Cette participation des utilisateurs agrave la creacuteation des contenus repreacutesente
une forme drsquoexternalisation (outsourcing) et permet de reacuteduire les coucircts en se
basant sur un systegraveme de beacuteneacutevolat ou de micropaiement
Reacuteseaux sociaux de nombreux sites de social networking ou reacuteseautage social
sont apparus avec la vague du Web 20 Ils permettent de mettre en relation des
personnes partageant les mecircmes centres drsquointeacuterecirct personnels ou professionnels
Ces reacuteseaux peuvent devenir de veacuteritables communauteacutes en ligne les plus fameux
eacutetant les sites Friendster ou Myspace ou bien dans la sphegravere professionnelle
copy Digimind Digimind Services ndash White Paper |13
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Linkedin ViadeohellipLa plupart des reacuteseaux sont ouverts certains fonctionnent sur le
mode de la cooptation
Podcasts issu de la combinaison des termes iPod (dApple) et broadcasting ce
terme deacutesigne le fait de rendre disponible en ligne un fichier audio au format
numeacuterique Ce fichier peut-ecirctre teacuteleacutechargeacute directement sur un ordinateur ou un
peacuteripheacuterique via un flux de diffusion Equivalent franccedilais baladodiffusion
Lrsquoutilisateur peut ainsi se composer une liste de lecture agrave la carte Pour les fichiers
videacuteo on emploi le terme de videacuteocast
AJAX (Asynchronous JavaScript And XML) meacutethode informatique de
deacuteveloppement dapplications Web permettant deacuteconomiser de la bande passante
en ne rechargeant pas une page entiegravere alors que seuls certains eacuteleacutements ont besoin
de lecirctre mais en ne rafraicircchissant que ces eacuteleacutements de la page Cela permet de
produire des contenus dynamiques et reacuteactifs en ne neacutecessitant que peu drsquoappels au
serveur heacutebergeant la page AJAX est une combinaison de plusieurs technologies
HTML CSS Javascript XMLhellipDe nombreux sites web 20 sont deacuteveloppeacutes en
AJAX
API Interface de programmation permettant agrave un utilisateur de deacutevelopper des
applications conviviales De nombreux sites classiques ou Web 20 proposent des
API pour inteacutegrer automatiquement leur contenu agrave dautres sites
Mashup ou Mash up application web composite mixant plusieurs sources ou
plusieurs contenus pour fournir un nouveau produit ou service Le terme se traduit
en franccedilais par remixage ou mosaiumlque Exemple de mashup la visualisation des
reacutesultats des eacutelections preacutesidentielles franccedilaises via Google Earth qui mixe les cartes
Google et les chiffres du Ministegravere de lInteacuterieur
Long tail (longue traicircne) Cette expression est utiliseacutee en statistiques et peut
srsquoappliquer au marketing Des produits rares ou qui font lrsquoobjet drsquoune faible
demande peuvent collectivement repreacutesenter une part de marcheacute eacutegale ou
supeacuterieure agrave celle des best-sellers si les canaux de distribution peuvent proposer
assez de choix Le caractegravere virtuel du web permet de geacuteneacuterer une longue seacuterie de
marcheacutes de niche heacuteteacuterogegravenes (exemple e-bay) par opposition aux grands
marcheacutes homogegravenes et grand public du monde reacuteel
copy Digimind Digimind Services ndash White Paper |14
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les technologies du Web 20
Mettons dabord les choses au point le Web 20 nest pas une (r)eacutevolution ou un
concept de dimension technologique
Ses applications sappuient sur des technologies deacutejagrave existantes reacutepondant aux doux
noms dAjax Soap REST RSS Perl Python PHP Ruby ou GreaseMonkey Lobjectif de
ce document nest pas de deacutevelopper ce volet technologique Nous en eacutevoquerons
seulement les grandes caracteacuteristiques pour mieux comprendre les enjeux
Le Web 2 repose notamment sur les interfaces utilisateurs dites riches qui
permettent des possibiliteacutes daffichage de configuration et de maniement plus
puissantes que les pages html classiques du Web 1 que ce soit pour le
deacuteveloppeur ou lutilisateur final
Tim Berners Lee co-inventeur du web remarque en fait ce Web 20 utilise les
standards qursquoont produit tous ces gens qui travaillent sur le Web 10 le Document
object model HTML et SVG (Scalable Vector Graphics) HTTPhellip Le Web 20
construit des services en srsquoappuyant sur les standards du web ainsi que sur JavaScript
(hellip)
Pour se structurer en reacuteseau de bases de donneacutees et services collaboratifs le web
20 utilise donc des technologies matures acircgeacutees de 5 agrave 10 ans pour la plupart
Leacutevolution nest pas tant dans la technologie elle-mecircme que dans la faccedilon de mixer
ces technologies pour apporter des services et une ergonomie nouvelle agrave
lutilisateur
Ainsi lAjax (voir glossaire) que lon cite souvent agrave propos des technologies phares
du Web 2 nest pas un nouveau langage mais un nouveau concept qui utilise les
standards XHTML et CSS DOM (Document Object Model) pour laffichage
dynamique XML et XSLT pour leacutechange de donneacutees ainsi que la reacutecupeacuteration de
donneacutees asynchrones via XMLHttpRequest JavaScript integravegre et combine tout ces
langages Le terme Ajax a eacuteteacute apporteacute par Jesse James Garrett de lrsquoagence web
Adaptive Path
copy Digimind Digimind Services ndash White Paper |15
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LAjax permet notamment de ne recharger que certains eacuteleacutements dune page plutocirct
que la page entiegravere Lors de modifications sur une page seuls les nouveaux
eacuteleacutements se rafraicircchissent eacuteconomisant ainsi des ressources du temps et de la
bande passante Lun des preacutecurseurs grand public dans lutilisation de cette
technologie fut A9 le moteur de recherche dAmazon il neacutetait pas neacutecessaire de
recharger la page agrave chaque fois que lon ajoutait de nouvelles sources et moteurs agrave
interroger 15
Greasemonkey est eacutegalement baseacute sur des scripts Cette extension pour le
navigateur Mozilla Firefox va encore plus loin dans le pouvoir accordeacute agrave linternaute
en exeacutecutant des scripts ce plug-in 16 permet de modifier lapparence des pages
web visiteacutees dy ajouter des fonctions (boutons case agrave cocher suppression des
publiciteacutes) Lutilisateur avanceacute peut mecircme eacutecrire ses propres scripts ou
teacuteleacutecharger des scripts mis agrave la disposition de tous
Le Web 2 est en fait une sorte de web lego qui permet dinnover via lassemblage
de briques les technologies de base sont multiples il est possible de creacuteer de
nouvelles applications agrave valeur ajouteacutee en les assemblant diffeacuteremment ou plus
rationnellement
Les mash-up un mixage de plusieurs applications (voir glossaire) en est une des
illustrations les plus visibles avec les mashups on agreacutege le contenu eacutemanant de
plusieurs sites afin de creacuteer un site nouveau On utilise alors souvent lobjet XML
lAJAX du cocircteacute de linternaute les RSS et les API (Web Services) des sites mixeacutes
LAPI nest donc pas seulement un dieu eacutegyptien Pour faire simple on peut dire
que cest une interface de programmation mise agrave disposition des internautes
(avertis) pour deacutevelopper des applications Une application pourra alors acceacuteder agrave
des programmes systegraveme pour envoyer recevoir ou extraire des donneacutees Ainsi
Google publie lAPI de Google Maps qui est utiliseacute par de nombreux deacuteveloppeurs
pour creacuteer des applications deacuteriveacutees du service de cartographie de Google par
exemple la carte de suivi du teacutelescope spatial Hubble la meacuteteacuteo dans le monde 17
Le rocircle du RSS (voir glossaire) est par ailleurs preacutepondeacuterant Ce format qui
permet dexporter et lire des donneacutees dactualiteacutes au format XML se retrouve dans
quasiment toutes les applications dites Web 2 et peut en constituer lemblegraveme sinon
la caracteacuteristique majeure avec les tags Il permet de surveiller les flux de nouvelles
informations issues de sites dactualiteacutes de blogs de moteurs de recherchehellipbref
de tout site web qui propose un contenu qui se renouvelle Le RSS va aussi servir agrave
exporter des bookmarks sociaux que sont les tags ou les favoris par exemple
copy Digimind Digimind Services ndash White Paper |16
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Si le Web 2 nest pas une reacutevolution technologique en soit la relative simpliciteacute de
mise en place de ces techniques et leurs coucircts de programmation reacuteduits expliquent
le tregraves fort deacuteveloppement que connaissent toutes ces applications Par ailleurs la
baisse constante du coucirct dheacutebergement et de bande passante a faciliteacute la diffusion
de ce web nouvelle geacuteneacuteration
Mais il subsiste des effets de seuil Des applications gigantesques comme Flickr de
Yahoo offrant lheacutebergement et le partage de photos impliquent la gestion de
vastes bases de donneacutees et des infrastructures de stockage importantes Seules de
grandes firmes comme Yahoo Inc Google Microsoft ou AOL par exemple peuvent
se deacutepartir efficacement de ce type de contraintes
copy Digimind Digimind Services ndash White Paper |17
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les familles dapplications du Web 20
TYPOLOGIE
Les familles drsquoapplications Web 20 sont nombreuses et diverses de nouveaux
services apparaissent quotidiennement (sans garantie de peacuterenniteacutehellipet bien souvent
de faccedilon redondante) Sans preacutetendre dresser une liste exhaustive des nombreuses
possibiliteacutes on peut deacutegager une typologie des applications selon diffeacuterents
domaines drsquoactiviteacute Les applications speacutecifiquement deacutedieacutees agrave la veille et agrave la
recherche dinformation seront deacuteveloppeacutees dans la partie suivante
Bureautique en ligne
Courant 2006 Google a lanceacute successivement plusieurs logiciels collaboratifs en
ligne un outil de gestion drsquoagendas (Google Calendar 18) un tableur (Google
Spreadsheet) et enfin apregraves le rachat de la socieacuteteacute Writely un traitement de texte
(Google Docs) 19 Ces logiciels permettent de creacuteer modifier partager et publier en
ligne des documents sur un espace de stockage Depuis plusieurs mois on assiste agrave
une veacuteritable deacuteferlante de logiciels de bureautique en ligne deacutesigneacutes parfois sous le
terme de web office RallyPoint AjaxWrite (pour Firefox uniquement) ZohoWriter
ThinkfreehellipOutre la gratuiteacute lrsquointeacuterecirct de ces logiciels concurrents de la suite
Microsoft Office est leur disponibiliteacute sur toute machine connecteacutee au reacuteseau et tout
systegraveme drsquoexploitation Attention toutefois aux questions de sauvegarde de
compatibiliteacute de synchronisation des donneacutees et enfin de confidentialiteacutehellip
Emploi
Les blogs constituent un bon moyen pour promouvoir son CV mettre en avant
expeacuterience et compeacutetences et faciliter les eacutechanges Des jobblogs verticaux
speacutecialiseacutes par secteur ou reacutegion connaissent un grand succegraves (voir par exemple
ceux du site et moteur Moovement20) Le networking professionnel est eacutegalement agrave
la mode agrave travers des sites comme Linkedin (creacuteeacute en 2003 aux Etats-Unis) Viadeo
(ex Viaduc drsquoorigine franccedilaise) ou Xing (ex OpenBC agrave vocation europeacuteenne) Le
principe est de tirer parti des reacuteseaux de connexions sociales virtuelles afin
copy Digimind Digimind Services ndash White Paper |18
Le Web 20 pour la veille et recherche dinformation DIGIMIND
drsquoidentifier des salarieacutes ou employeurs potentiels mais aussi drsquoeacutetoffer son reacuteseau de
clients partenaires fournisseurshellip
Lrsquoe-cooptation (Cooptin Jobmeeters 21) met le reacuteseau au cœur de la deacutemarche de
recrutement via un systegraveme de prime de cooptation et peut aider les demandeurs
agrave identifier les offres du marcheacute cacheacute
Commerce en ligne
Le client est roi et le Web 20 permet de rehausser son niveau de participation sur
les sites marchands On peut ainsi tagger ou annoter des reacutefeacuterences drsquoouvrages dans
le catalogue Amazon Gracircce agrave des sites comme Zlio ou la Shoposphegravere de Yahoo22
les internautes peuvent recommander agrave leur entourage des produits et
serviceshellipen touchant une commission sur les ventes reacutealiseacutees Des guides drsquoachat
et comparateurs de prix comme Ciao integravegrent les avis de consommateurs et
drsquoexperts Le site Wantuno (inspireacute de lrsquoameacutericain Woot) innove dans le domaine
de la vente eacuteveacutenementielle en vendant un seul produit nouveau high tech par jour
annonceacute en podcast videacuteo agrave des internautes preacutevenus par flux RSS23 Certains
analystes voient lrsquoavenir du commerce eacutelectronique dans le concept de CtoB
(Consumer to Business) inverse du BtoChellip
Geacuteolocalisation
Google Maps a eacuteteacute lrsquoun des premiers services de geacuteolocalisation en srsquoappuyant sur
lrsquooutil de recherche pour localiser sur des cartes des services de proximiteacute
(commerces station servicehellip) La version 2 du site Geacuteoportail de lrsquoIGN disponible
depuis fin mai 2007 srsquoenrichit de nouveaux services pratiques et citoyens (accegraves au
cadastre visualisation des zones agrave risquehellip) Google Earth fait lrsquoobjet de partenariats
avec la NASA ou le programme des Nations Unies pour lrsquoenvironnement La
geacuteolocalisation peut srsquoadapter eacutegalement au partage de photos (Yahoo Maps et
Flickr ou le projet Pikeo chez Orange)24
Recherche drsquoinformations
Des agreacutegateurs de meacutedia comme Digg ou Wikio laissent une large place agrave
lrsquointernaute pour tagger ou recommander par vote les articles issus de meacutedias
classiques ou blogs On suivra eacutegalement lrsquoactualiteacute en syndiquant des flux RSS agrave
travers des agreacutegateurs comme Netvibes ou Newsgator Les grands moteurs (Google
Custom Search Yahoo Search Builder MSN Live search Macros) offrent des options de
copy Digimind Digimind Services ndash White Paper |19
Le Web 20 pour la veille et recherche dinformation DIGIMIND
creacuteation de moteurs personnalisables effectuant des recherches sur des bouquets
de sources preacuteseacutelectionneacutees par lrsquoutilisateur On peut mutualiser les connaissances agrave
travers des wikis collaboratifs geacuteneacuteralistes (Wikipedia) ou speacutecialiseacutes Enfin le projet
de moteur collaboratif Wikiasari qui doit aboutir courant 2007 aura recours aux
mecircmes technologies libres que la ceacutelegravebre encyclopeacutedie ainsi qursquoagrave un reacuteseau humain
ou communauteacute de confiance qui validera les reacutesultats de la recherche
Les actualiteacutes sur Wikio sites de presse blogs et navigation par tags (agrave droite)
Diffusion drsquoactualiteacutes
Pour Pierre Chappaz fondateur du site Wikio les blogueurs ne sont pas journalistes
mais ils peuvent apporter une vraie expertise sur certains sujets quils connaissent et il
serait dommage de sen priver Selon lui les meacutedias 20 ne seront plus des canaux
exclusifs de diffusion mais producteurs de contenu et des marques Deacutesormais le
scoop nrsquoest plus lrsquoapanage des seuls journalistes aux Etats-Unis une jurisprudence
donne droit depuis 2006 aux blogueurs de proteacuteger leurs sources au mecircme titre
que les journalistes professionnels Des centaines de blogs politiques ont fleuri sur le
web certains drsquoentre eux se reacuteveacutelant particuliegraverement influents On parlera de
journalisme citoyen agrave propos de sites comme Agoravox ou de lrsquo alleacutee
numeacuterique Rue 89 lanceacutee en mai 2007 par drsquoanciens journalistes du quotidien
Libeacuteration Ces nouveaux meacutedias en ligne marient les communications venant de
journalistes professionnels experts et internautes
copy Digimind Digimind Services ndash White Paper |20
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Loisirs
On retrouve ici la notion de filtrage collaboratif baseacute sur un systegraveme de
recommandations et drsquoeacutevaluations par les utilisateurs Ces recommandations
peuvent concerner les livres les destinations de voyage la musique la videacuteohellipet
proviennent de lrsquoanalyse de comportements drsquoachats des internautes et de leurs
eacutevaluations de produits Le moteur drsquoanalyse preacutedictive Criteo 25 a ainsi lanceacute en
feacutevrier 2007 un service de recommandations automatique de blogs apregraves avoir
utiliseacute sa technologie pour lrsquoeacutevaluation de videacuteos
La participation des internautes peut aller jusqursquoau financement et agrave la production
drsquoœuvres artistiques le projet A swarm of angels permet drsquoaider agrave la creacuteation de
films qui seront distribueacutes sous licence creative commons et diffuseacutes via les reacuteseaux
peer-to-peer
Partage de documents multimeacutedia
Il srsquoagit sans doute drsquoune des applications les plus reacutepandues du Web 20 Les grands
acteurs du web ont largement investi ce domaine Google a racheteacute en 2006 le site
de partage de videacuteo Youtube Yahoo de son cocircteacute avait racheteacute le site de partage de
photos Flickr Les favoris peuvent eacutegalement ecirctre mutualiseacutes via des services en
ligne comme Delicious (groupe Yahoo) ou Blogmarks De nombreux services de
partages de photos videacuteo ou podcasts se sont deacuteveloppeacutes reacutecemment on peut
citer parmi eux les sites franccedilais DailyMotion ou la banque drsquoimages Fotolia Podemus
ou Radioblog figurent parmi les sites communautaires de podcasts
Enseignement et recherche
Henry Jenkins26 professeur au MIT imagine des uniteacutes drsquoenseignement conccedilues
sur les modegraveles YouTube ou Wikipedia des deacutepartements qui ldquopermettraient le
deacuteploiement rapide drsquoexpertises disperseacutees et la reconfiguration des champsrdquo De
nouveaux usages apparaissent dans le paysage eacuteducatif mais attention lagrave encore agrave
lrsquoillusion de faciliteacute selon le philosophe Fernando Savater laquo Internet neacuteduque pas il
neacutecessite mecircme une eacuteducation preacutealable raquo Olivier Ertzcheid dans son blog Affordance 27 distingue plusieurs eacuteleacutements caracteacuteristiques drsquoune science 20 et notamment
la possibiliteacute drsquoannoter et commenter des publications scientifiques (notamment les
collections Open Acess Plos One28) ou de nouveaux modes drsquointerrogation des
bases de donneacutees (interface Hubmed sur la base meacutedicale Medline)
copy Digimind Digimind Services ndash White Paper |21
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Marie France Blanquet29 maicirctre de confeacuterence en sciences de lrsquoinformation
distingue le travail coopeacuteratif du travail collaboratif En matiegravere drsquoapprentissage le
travail coopeacuteratif reacutealiseacute par chaque eacutequipe contribue agrave une œuvre collective ougrave le
rocircle de chacun est deacutefini de faccedilon claire Lrsquoapprentissage collaboratif reacutesulte du
travail individuel soutenu par des activiteacutes de groupe ou drsquoeacutequipes de faccedilon souple
et ouverte Ce type de travail se base sur les capaciteacutes de communication et
drsquointeraction de chacun Lrsquoeacutecriture collective des articles composant lrsquoencyclopeacutedie
Wikipeacutedia en est un exemple
Plusieurs expeacuterimentations drsquousage des blogs et podcasts ont eacuteteacute tenteacutees agrave
lrsquoUniversiteacute A Lyon II des eacutetudiants ont pu enregistrer des cours sur un Ipod pour
diffusion en podcast sur leurs blogs A lrsquoUniversiteacute Catholique de Lille les eacutetudiants
de Jean-Paul Pinte30 chargeacute de lrsquoinnovation peacutedagogique doivent alimenter
reacuteguliegraverement un blog Pour ce chercheur speacutecialiste de la veille en eacuteducation le
renouveau des meacutethodes drsquoenseignement se traduit par le rocircles des Enseignants
Connecteurs et eacutetudiants proneacutetaires
Bibliothegraveques
La bibliothegraveque 20 place elle aussi lrsquoutilisateur au centre et ce agrave travers plusieurs
types drsquoexpeacuterimentations de lrsquoutilisation des logiciels de messagerie instantaneacutee
pour eacutechanger avec les utilisateurs agrave lrsquointeacutegration de tags pour enrichir les
catalogues en passant par des interfaces de consultation simplifieacuteeshellip De
nombreux blogs de bibliotheacutecaires (Bibliobsession 31) permettent de suivre lrsquoeacutetat de
lrsquoart La bibliothegraveque de lrsquoUniversiteacute drsquoAlbany est alleacutee jusqursquoagrave publier un manifeste
du bibliotheacutecaire 20 32
copy Digimind Digimind Services ndash White Paper |22
Le Web 20 pour la veille et recherche dinformation DIGIMIND
COMMENT IDENTIFIER UN SITE WEB 20
Est-ce que le site sur lequel vous naviguez ou lapplication que vous utilisez est
Web 20 Quelle importance pourrait-on reacutepondrehellipToutefois un site de cette
geacuteneacuteration offrira plus de possibiliteacutes agrave vous lutilisateur Pour reconnaicirctre un tel
site quelques caracteacuteristiques sont agrave retenir
- le type de site il appartiendra agrave lune des grandes familles citeacutees plus haut il sera
blog bookmark ou reacuteseau social mashup ou page personnalisable bref il permet
de partager et de diffuser du contenu aiseacutement Le site peut ecirctre lui-mecircme une
application Web 2 ou en inteacutegrer des briques Exemple un site Corporate qui
heacuteberge des blogs de ses salarieacutes etou diffuse son actualiteacute via un fils RSS
- le rocircle de lutilisateur le site Web 2 vous permet de participer de personnaliser
et de collaborer vous pouvez en effet ajouter des commentaires eacutecrire un billet
lire un flux RSS noter (voter) ou annoter un article teacuteleacutecharger ou uploader des
images des videacuteos eacutecouter un podcast Ces sites proposent souvent des interfaces
personnalisables couleurs style organisation de laffichage du contenuhellip
- la navigation elle est plutocirct simplifieacutee par rapport aux sites de premiegravere
geacuteneacuteration Les menus sont plus leacutegers un flux RSS est toujours proposeacute et un
nuage de tags est souvent preacutesent
- le testeur cest vous non content de faire apporter une partie de son contenu par
linternaute un service Web 20 fait en plus souvent tester ses applications agrave ses
utilisateurs et est donc freacutequemment en version becircta (voire alpha) une becircta
publique ou priveacutee (linternaute fait alors partie dun petit cercle dinitieacutes dans le
secret des dieux)
copy Digimind Digimind Services ndash White Paper |23
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les applications Web 20
pour la veille et la
recherche dinformations
LES TYPES DAPPLICATIONS
Pour le veilleur et le chercheur dinformation les applications du Web 20 sont
riches tant dans les possibiliteacutes offertes par leurs interfaces que dans le contenu
diffuseacute Mieux connaicirctre ces services permettra de trouver davantage dinformation
(ou autrement) de gagner du temps de mieux partager voire decirctre plus visible sur
le web
Vous laurez compris le web 20 se fonde essentiellement sur la notion de partage
de participation et de collaboration entre les individus Ce nest pas forceacutement
toujours facile possible voire autoriseacute dans le monde professionnel Mais partager
cest aussi agrave terme pouvoir recevoirhellip
I Partager et collaborer
a Les Bookmarks sociaux
Les bookmarks sociaux sont une des applications les plus caracteacuteristiques du Web 2
et en sont preacutecurseurs Apparus en 2004 ces services vous offrent la possibiliteacute de
partager vos bookmarks cest-agrave-dire vos favoris Ainsi apregraves enregistrement le plus
souvent gratuit vous pouvez mettre en ligne tout ou partie de vos favoris (titre
copy Digimind Digimind Services ndash White Paper |24
Le Web 20 pour la veille et recherche dinformation DIGIMIND
adresse et description dune page ou site) et les rendre potentiellement accessibles
aux internautes du monde entier et du moins aux utilisateurs de ce service Vous
avez la possibiliteacute de garder ces favoris priveacutes en ne les partageant quavec vos
proches ou seulementhellipvous-mecircme
Ces applications sont au deacutepart tregraves simples et proposent ensuite suivant les sites
plus ou moins de perfectionnements il suffit dajouter le nom et ladresse (url) de la
page web qui vous inteacuteresse assortis des commentaires de votre choix Ces
adresses web sont rattacheacutees agrave un espace qui vous est personnel auquel vous
acceacutedez en vous identifiant Cet espace personnel est identifiable via une adresse
preacutecise Par exemple sur Delicious33 (de Yahoo) lun des services de bookmarks
sociaux les plus utiliseacutes lurl deacutesignant mes favoris est httpdeliciousslide68 En
naviguant sur Delicious vous pouvez acceacuteder aux favoris mis en ligne par des
collaborateurs amis ou inconnus qui partagent les mecircmes inteacuterecircts et passions que
vous Leurs pages sont eacutegalement identifieacutees par une url unique
Lajout dadresse
Lajout dadresse seffectue en se connectant directement sur le site de
bookmarking social ou plus pratique via une barre ou un bouton deacutedieacutes qui
inteacutegreacutes agrave votre navigateur facilitent lajout du site que vous ecirctes en train de visiter
Vous pouvez eacutegalement trouver des icocircnes sur des pages web vous proposant
dajouter un contenu un site agrave votre service de social bookmaking Peut-ecirctre avez-
vous deacutejagrave rencontreacute ces icocircnes agrave la fin dun billet de blog par exemple (voir
illustration ci-dessous) Ils permettent alors dajouter ladresse du billet agrave un ou
plusieurs services de bookmarks sociaux ainsi quagrave des services dactualiteacutes
collaboratives (nous en reparlerons plus bas)
copy Digimind Digimind Services ndash White Paper |25
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ce blog propose via des icocircnes lajout de ce billet dans les favoris de Delicious ou les services sociaux dactualiteacutes
Lorsque vous ajoutez une adresse vous lui attribuez des tags (voir glossaire) cest-agrave-
dire un ou plusieurs mots cleacutes de votre choix qui vont caracteacuteriser expliquer
contextualiser eacutetiqueter le favori et donc lidentifier de maniegravere simple pour vous et
tous les visiteurs Cest une information qui vient sajouter agrave la traditionnelle
description du site Cest donc vous qui choisissez votre propre mode de
classement de hieacuterarchisation et de labellisation (et non plus un service qui vous
propose de ranger vos ressources dans des cateacutegories preacutedeacutefinies) Cette possibiliteacute
fait partie de ce que lon appelle la folksonomie agrave savoir une taxonomie (science du
classement) populaire en quelque sorte
Ainsi vous pouvez ajouter ladresse du site portail NanotechNow
httpwwwnanotech-nowcom consacreacute aux nanotechnologies et y adjoindre les
tags nano nanotehnologies sciences science research mais aussi pourquoi
pas qualiteacute excellent pour donner votre opinion
copy Digimind Digimind Services ndash White Paper |26
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Des favoris consacreacutes agrave la Chine dans Delicious A droite les tags associeacutes agrave ces bookmarks Les tags
Sur une application typique de social bookmarking (type delicious) il est possible
de rechercher sur le titre des favoris de tous les autres utilisateurs et aussi sur
leurs tags Ainsi en cliquant sur le tag Nanotech vous obtiendrez la liste de tous
les favoris que les internautes ont classeacutes sous ce label Cest lagrave lun des principaux
inteacuterecircts la possibiliteacute de rechercher sur le nom des eacutetiquettes textuelles deacutefinies
par les internautes eux-mecircmes Mais tous les internautes nont pas la mecircme logique
de classement et il est fort possible de passer agrave coteacute de favoris inteacuteressants mais
eacutetiqueteacutes selon un mot auquel vous nauriez jamais penseacute De plus un mecircme mot
peut avoir plusieurs sens ou ecirctre employeacute diffeacuteremment selon les individus
Delicious a reacutesolu ndashpartiellement- ce problegraveme en offrant la possibiliteacute de deacutecrire
ses tags cest agrave dire de les expliquer (par orange je parle de la couleur ou de la
production dagrumes en Floride) Cest donc un deacutebut de seacutemantique appliqueacute agrave
cette folksonomie Quoiquil en soit le problegraveme du sens des mots employeacutes par
les creacuteateurs de contenu concerne lensemble du web Lorsque vous ne trouvez
pas un site via une requecircte sur un outil de recherche et que ce site existe pourtant
bel et bien cest souvent parce que vous nemployez pas les mecircmes mots cleacutes que
ceux utiliseacutes par le creacuteateur du site dans son texte
Les tags peuvent eacutegalement sappliquer agrave des photos (Flickr) agrave des projets
(43Things) ou des videacuteos (YouTube DailyMotion) Ils peuvent servir aussi agrave eacutetiqueter
et cateacutegoriser les billets dun blog
copy Digimind Digimind Services ndash White Paper |27
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les communauteacutes
Lautre atout des bookmarks sociaux pouvoir constituer et se connecter avec
une communauteacute de speacutecialistes Par speacutecialiste on deacutesignera simplement un
internaute qui centre ses recherches sur les mecircmes sujets que vous quil soit
amateur ou professionnel
Exemple Votre domaine ce sont les biotechnologies En entrant la requecircte
Biotechnologies sur le moteur de recherche de Delicious vous obtenez une liste
de plusieurs milliers de favoris Pour chacun dentre eux est indiqueacute le nombre de
personnes qui ont sauvegardeacute cette mecircme adresse En seacutelectionnant lun de ces
utilisateurs vous pouvez deacutecouvrir un internaute qui comme vous reacuteguliegraverement
ajoute des adresses de sites deacutedieacutes ou connexes aux biotech Il ne vous reste plus
quagrave mettre en surveillance ce membre de delicious Il disposera en effet de sa
propre adresse XML Exemple httpdeliciousrssvantive98 Vous serez alors
averti degraves lors que cet utilisateur ajoute un favori agrave sa page
La valeur des outils de social bookmarking est encore plus probante lorsquils sont
deacutedieacutes agrave des communauteacutes de pratiques ou agrave des secteurs dactiviteacutes bien preacutecis
Plusieurs initiatives ont deacutejagrave eacuteteacute mises en ligne34 On peut citer Connotea eacutediteacute par
la ceacutelegravebre revue Nature et donc destineacute agrave un public scientifique Lors de la mise en
favoris ce service extrait automatiquement les reacutefeacuterences bibliographiques
lorsquelles sont issues de sites tels que Nature Science ou PubMed Plus ancien
CiteUlike est baseacute sur le mecircme principe mais est compatible avec davantage de
revues scientifiques encore Snipitron est lui deacutedieacute aux chercheurs eacutetudiants et
professionnels Ici vos bookmarks font partie dun projet qui seacutecoule dans le temps
concernant une recherche ou une tacircche preacutecise
Linteacuterecirct des bookmarks sociaux est donc dabord dans lutilisation de la
communauteacute afin de trouver des sources pertinentes Ce type doutil reacutevegravele toute
sa puissance lorsquun utilisateur proche de vous en terme de domaines de veille a
eacuteteacute identifieacute Vous pouvez donc alors lutiliser comme collaborateur virtuel mais
aussi rechercher parmi les sources jugeacutees pertinentes par un groupe dutilisateurs
identifier des leaders de veille ou juger de la populariteacute dune source (combien de
fois a-t-elle eacuteteacute mise en favoris Ce nombre de sauvegardes neacutetant quun indicateur
parmi dautres) Si vous ne partagez pas ces outils restent toutefois un tregraves bon
moyen de meacutemoriser et cateacutegoriser vos favoris en un point unique daccegraves
copy Digimind Digimind Services ndash White Paper |28
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Quel service
Il existe plusieurs dizaines de services de bookmarks sociaux Ils proposent des
fonctionnaliteacutes plus ou moins sophistiqueacutees Un des critegraveres essentiels de choix est
leur succegraves En effet leur force repose en grande partie sur le nombre de favoris
dutilisateurs partageacutes agrave moins de freacutequenter des bookmarks deacutedieacutes agrave des
communauteacutes tregraves cibleacutees Dautre part la rapiditeacute du service et la pertinence de
son moteur de recherche sont aussi des paramegravetres importants
Delicious qui appartient agrave Yahoo est lun des plus connus et des plus utiliseacutes Yahoo
MyWeb2 rassemble eacutegalement une grande communauteacute ainsi que Furl ou encore
Blogmarks et Blinklist35 Certains de ces sites au-delagrave de larchivage de ladresse
proposent de conserver une copie inteacutegrale dune page web Dautres vous
suggegraverent des sites similaires agrave ceux que vous avez mis dans vos favoris Cette
similariteacute se base notamment sur les favoris ajouteacutes par les autres utilisateurs La
recherche par similariteacute (ou par suggestion en fonction de vos habitudes de
navigation) offerte par des services comme Yoono StumbleUpon ou Similicious 36 est
une meacutethodologie de recherche particuliegraverement inteacuteressante Nous en reparlerons
plus loin
Pour choisir preacuteciseacutement votre service de bookmarks sociaux vous pouvez vous
aider de ces ressources 37
- le site Irox propose un tableau comparatif de pregraves de 20 services
- le blog de Robin Good offre une seacutelection inteacuteressante de bookmarks sociaux
- la page Free Bookmark Managers affiche une liste dune quarantaine de logiciels et
utilitaires deacutedieacutes au partage et agrave la gestion de vos favoris (bookmarks) en ligne via
accegraves distant en local ou sur serveur Attention tous ne sont pas sociaux cest-agrave-
dire baseacutes sur le partage
copy Digimind Digimind Services ndash White Paper |29
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b Le Multimeacutedia photos et videacuteos
Le partage de vos ressources ne se limite pas au texte et adresse de sites Il est
eacutegalement possible de partager vos photos et videacuteos
Les images
Flickr 38 racheteacute par Yahoo Inc en 2005 est lapplication type de partage dimages
voire mecircme larcheacutetype du service Web 20 ce site permet de mettre en ligne ses
photos de les partager avec ses proches ses collegravegues ou de les laisser en accegraves
priveacute
Il est possible dutiliser un moteur pour rechercher agrave travers les millions de photos
mises en ligne par les autres utilisateurs
Flickr na pas de points communs avec les nombreuses applications Web 2 en becircta agrave
linterface artisanale Sur le service de Yahoo la puissante interface en fait un outil
tregraves simple agrave utiliser Ainsi via le menu Organize vous pouvez acceacuteder agrave une
veacuteritable table de montage virtuelle pour organiser vos photos
copy Digimind Digimind Services ndash White Paper |30
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche sur Flickr A droite les noms dutilisateurs et les tags associeacutes aux photos
Comme sur les bookmarks sociaux la recherche peut seffectuer sur le titre ou la
description mais aussi sur les tags chaque internaute qui partage ses photos leur
attribue des mots cleacutes pour les deacutefinir les expliquer les contextualiser voire donner
son opinion
Chaque liste de reacutesultats chaque photo est accompagneacutee par ses tags Ceux-ci
permettent aussi daffiner ou deacutelargir votre recherche lorsque vous en seacutelectionnez
un Il est possible de rechercher sur les photos les utilisateurs mais aussi sur les
groupes En effet la notion de communauteacute est eacutegalement importante Les
groupes rassemblent les utilisateurs qui partagent les mecircmes centres dinteacuterecirct
photographiques Des forums de discussions sont inteacutegreacutes agrave ces groupes
permettant dentrer en contact direct avec certains membres
copy Digimind Digimind Services ndash White Paper |31
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Par exemple le groupe The Eyes Have It 39 rassemble les utilisateurs (et donc leurs
photos) autour du thegraveme de la communication visuelle des secteurs pharmacie et
biotech
Que peut trouver le veilleur sur un service de photos tel que Flickr
Finalement la mecircme chose que sur les bookmarks sociaux tout ce que les
membres ont voulu partager des photos du dernier salon automobile de Detroit 40
ou de la convention annuelle des industries cosmeacutetiques dAmeacuterique du Nord La
veille concurrentielle ou la veille image sur votre propre socieacuteteacute est eacutegalement
inteacuteressante Ainsi une recherche (full text) sur la socieacuteteacute peacutetroliegravere Exxon affiche
plus de 1400 photos relatives aux stations services aux puits de peacutetrole aux
raffineries aux employeacutes aux manifestions de contestataires ou aux publiciteacutes
deacutetourneacutees
Comme avec le social bookmarking vous pouvez vous attacher agrave suivre les
membres qui partagent les mecircmes centres dinteacuterecirct que vous ou votre organisation
apregraves seacutelection de la page de lutilisateur la mise en surveillance de son flux RSS
permet decirctre averti degraves que cette personne ajoute de nouvelles photos
Dautres services permettant le partage de photos existent Toutefois ils ne vont
pas aussi loin que Flickr dans la logique Web 20 Le service PhotoBucket 41 est le
grand concurrent de Flickr mais avec une approche plus grand public Flickr est
davantage freacutequenteacute par des internautes avertis des professionnels et des
passionneacutes de photographie En ce sens le service de Yahoo sera donc plus
inteacuteressant pour le veilleur
Squidoo 42 est en quelque sorte un annuaire de bookmarks perfectionneacute une
rencontre de services sociaux comme Delicious et Flickr Squidoo vous permet en
effet de creacuteer une page de liens dans un domaine qui vous passionne et de la
structurer en rubriques agreacutementeacutees de photos
Linterface simple rend possible la creacuteation rapide de pages speacutecialiseacutees (appeleacutees
lensgtobjectifs lentilles) et de les rendre visible agrave tout un chacun On trouve par
exemple plusieurs lens consacreacutees aux nanotechnologies43 Chaque lens est
accompagneacutee de tags connexes agrave son sujet
Vous pouvez rechercher ces pages gracircce agrave un moteur de recherche un reacutepertoire
par cateacutegories un nuage de tags (exemple le tag Marketing 44) ou mecircme parcourir
le Top100
copy Digimind Digimind Services ndash White Paper |32
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La videacuteo
Via les services YouTube ou DailyMotion le partage de videacuteos en ligne est plus
meacutediatiseacute que les services de photos Notamment parce que le leader Google a
racheteacute YouTube en octobre 2006 geacuteneacuterant un buzz sans preacutecegravedent au sein des
blogs et de la presse traditionnelle (Mainstream medias)
YouTube 45 et ses concurrents Web 20 fonctionnent agrave peu pregraves de maniegravere
eacutequivalente agrave Flickr sans en atteindre toutefois sa clarteacute ergonomique
Tout ces sites de videacuteos vont permettre drsquouploader (charger vers le site) et
partager vos videacuteos (converties automatiquement au format FlashVideo) et aussi
bien sucircr de rechercher parmi les videacuteos des autres utilisateurs
Sur ces applications on retrouve de nombreuses caracteacuteristiques du Web 2 les
videacuteos classeacutees par cateacutegories sont accompagneacutees de tags qui aident agrave les
contextualiser et les deacutecrire en plus du titre et de la description renseigneacutes par
lutilisateur Un fils RSS permet de surveiller lajout de videacuteos dans une cateacutegorie ou
par un utilisateur deacutefini A linstar des billets dun blog les internautes peuvent
commenter les videacuteos De plus les videacuteos sont noteacutees ce qui impacte ensuite leur
place dans le classement et donc leur visibiliteacute
Ces services contiennent des favoris inteacutegreacutes ougrave lon peut sauvegarder ses videacuteos
preacutefeacutereacutees Il est possible de partager sa videacuteo par mail ou messagerie instantaneacutee
de la poster sur son blog Dailleurs de nombreux blogueurs utilisent les services de
type YouTube (ou Flickr pour la photo) pour stocker leurs fichiers multimeacutedias trop
volumineux pour les heacutebergeurs de blogs La notion de groupe comme sur Flickr
est preacutesente des communauteacutes rassemblent des utilisateurs autour de grandes
theacutematiques lieacutees par exemple agrave la politique aux sports et aux voyages
YouTube a de nombreux concurrents aux fonctions tregraves proches Impossible de
tous les mentionner Mais on peut retenir cependant le franccedilais DailyMotion 46 tregraves
populaire dailleurs neacute quelques semaines avant YouTube Citons eacutegalement Yahoo
Videos AOL Videos Revver Grouper (de Sony) Metacafe SoapBox (de Microsoft)
Zudeo Wideo MySpace Vimeo 47Certains de ces services proposent du contenu
amateur ainsi que des films professionnels issus des networks de TV et de cineacutema
Mais les plus petits services se cantonnent aux videacuteos envoyeacutees par linternaute que
celles-ci aient dailleurs eacuteteacute copieacutees ou non
copy Digimind Digimind Services ndash White Paper |33
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche sur DailyMotion
Quel contenu agrave usage professionnel le veilleur peut espeacuterer trouver sur ces
plateformes Essentiellement des videacuteos consacreacutees agrave des socieacuteteacutes et individus
Ainsi si je reacuteitegravere ma recherche sur la socieacuteteacute peacutetroliegravere Exxon jobtiens des videacuteos
sur des manifestations des mareacutees noires le reacutechauffement climatique des
actualiteacutes boursiegraveres des retransmissions de procegraves des deacutetournements de
publiciteacutehellipLa recherche de videacuteos saverra particuliegraverement utile pour une veille
Image Produits ou concurrentielle Le contenu de videacuteos est eacutegalement souvent
tregraves politique agrave partir de la campagne des eacutelections preacutesidentielles franccedilaises de
2007 la diffusion de videacuteos sur les hommes et femmes politiques est devenue une
veacuteritable arme Autre aspect inteacuteressant la possibiliteacute de deacutecouvrir de nombreux
extraits de videacuteos de documentaires sur des sujets extrecircmement varieacutes eacutecologie
industrie socieacuteteacute consommation
Le contenu de ces services de videacuteos est donc agrave limage du net heacuteteacuterogegravene mais
potentiellement riche
copy Digimind Digimind Services ndash White Paper |34
Le Web 20 pour la veille et recherche dinformation DIGIMIND
c Partage de CV et reacuteseaux sociaux
Termineacute le temps ou seules les personnes agrave qui vous transmettiez votre CV ou
votre carte de visite pouvaient prendre connaissance de votre identiteacute et de votre
parcours professionnel Via les plateformes de reacuteseaux sociaux le push fait place au
pull de plus dans une optique de cooptation et de recommandation il y est
possible de mettre son CV en ligne sous format hypertexte et de demander agrave
rentrer en relation avec des proches de votre reacuteseau immeacutediat Les plateformes de
reacuteseaux sociaux sont nombreuses certaines sont agrave vocation geacuteneacuteraliste dautres
uniquement deacutedieacutees aux actifs dautres encore reacuteserveacutees agrave une communauteacute
(eacutetudiants lyceacuteens anciens eacutelegraveves passionneacutes de voyages)
Ces applications repreacutesentent un marcheacute conseacutequent puisque pour les seuls USA
on preacutevoit un chiffre daffaires des reacuteseaux sociaux de 25 milliards de dollars agrave
lhorizon 2011 contre 350 millions en 200648 La France est domineacutee par la
plateforme Viadeo (ex-Viaduc)49 Ce service leader lanceacute en 2004 compte plus de
750 000 profils Dans les autres pays cest LinkedIn 50 qui domine geacuteneacuteralement
avec plus de 9 millions dutilisateurs dans 135 pays
Une recherche sur Viadeo
copy Digimind Digimind Services ndash White Paper |35
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les fonctionnaliteacutes
Que trouve-t-on sur ces sites Notamment des profils de personnes en activiteacute ou
en recherche demploi ainsi que des hubs regroupant des utilisateurs autour dun
mecircme centre dinteacuterecirct toujours la notion de communauteacutes de pratiques propre au
Web 20 Sur ces services tout est penseacute pour creacuteer du lien social Le profil
individuel se constitue dun CV enrichi de nombreux liens vers ses employeurs ses
amis ses reacuteseaux professionnels et associatifs ses travaux et publications Les hubs
regroupent les personnes autour de secteurs meacutetiers associations danciens eacutelegraveves
pays reacutegions Par exemple sur Viadeo saffichent les hubs Analyse Veille
Strateacutegique amp Concurrentielle Intelligence Eco Blogs amp Bloggers Editeurs de
Logiciels Profession documentaliste and co mais aussi Grande distribution
Oceacuteanie ou Normes meacutethodes et outils Dans ces hubs des forums organisent les
discussions des membres autour de theacutematiques deacutefinies Un moteur de recherche
permet de trouver des profils selon un secteur une fonction une reacutegion Une fois
un profil identifieacute il faut demander agrave entrer en relation avec lui Cela sera dautant
plus facile et rapide sil est peu eacuteloigneacute de votre propre reacuteseau de contacts
La veille
Linteacuterecirct pour le professionnel de linformation est double il peut augmenter sa
visibiliteacute et celle de certains de ses projets services publications thegraveses ou articles
Dautre part il peut rechercher des donneacutees sur des personnes et entreprises ou
identifier un expert Comme sur dautres services Web 20 il est facile de se
constituer une communauteacute dutilisateurs partageant ses centres dinteacuterecirct que lon
visitera reacuteguliegraverement Ainsi sur Viadeo une recherche sur le secteur Agro-
alimentaire avec le mot cleacute veilleur 1 affiche plus de 50 reacutesultats avec les fonctions
entreprises et synthegraveses de parcours des membres Vous pouvez alors entrer en
relation avec ces personnes ou tout simplement collecter des donneacutees sur celles-ci
et leurs reacuteseaux Ces sites sont dailleurs devenus un outil essentiel pour certaines
fonctions commerciaux pour la prospection recruteurs journalistes
ethellipresponsables de casting pour eacutemissions TV
1 Certaines fonctionnaliteacutes avanceacutees sont payantes
copy Digimind Digimind Services ndash White Paper |36
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les autres reacuteseaux
Parmi les autres services de reacuteseaux sociaux outre LinkedIn davantage tourneacute agrave
linternational il existe assez utiliseacutes en France 6nergiesnet et Xing (ex Open BC)51
Les reacuteseaux ciblant plus particuliegraverement les jeunes (FaceBook MySpace) peuvent
eacutegalement ecirctre utiliseacutes MySpace feacutedegravere plus particuliegraverement des professions de la
communication de la publiciteacute et des meacutetiers multimeacutedias
Le reacuteseau FaceBook52 est original ce site nord-ameacutericain est preacutecurseur dun social
networking tregraves segmenteacute reacuteserveacute aux eacutetudiants et aux lyceacuteens Au deacutepart les
membres devaient sinscrire obligatoirement via lemail de leur universiteacute afin de
garantir lauthenticiteacute des profils et donc le seacuterieux de la communauteacute Depuis
FaceBook sest ouvert aussi aux entreprises Ainsi ce site capte tregraves tocirct les futurs
actifs et les fideacutelise
Des ressources
Certaines ressources peuvent vous aider agrave identifier les plateformes de reacuteseaux
sociaux professionnels utiles pour vos recherches Le wiki List of social networking
websites liste de nombreuses plateformes de reacuteseaux sociaux 53 et le site Link n
Rank cateacutegorise des sites de social networking 54
copy Digimind Digimind Services ndash White Paper |37
Le Web 20 pour la veille et recherche dinformation DIGIMIND
d Les sites dactualiteacutes collaboratives recommandation et notation
Ces sites recouvrent en fait diffeacuterents types dapplications
- Les Digg Like Ces services qui sinspirent tous du preacutecurseur Digg55 recueillent des actualiteacutes
proposeacutees par les internautes Le principe apregraves enregistrement un formulaire
simple vous permet de poster lactualiteacute de votre choix susceptible dinteacuteresser les
autres internautes son titre son url sa description Il faut aussi choisir une
cateacutegorie Par exemple Technologies Sciences Monde Affaires Divertissement Ces
cateacutegories peuvent ecirctre subdiviseacutees en theacutematiques plus fines Lactualiteacute si elle est
valideacutee par les modeacuterateurs apparaicirctra alors en ligne Elle sera noteacutee par les autres
internautes qui votent pour elle selon son inteacuterecirct Les actualiteacutes disposant du plus
grand nombre de points se placent alors en haut du classement
La cateacutegorie Sciences sur Digg A gauche les nombres de votes
Ces sites affichent les principales caracteacuteristiques du Web 20 interface eacutepureacutee
possibiliteacute de laisser des commentaires fils RSS pour surveiller les nouvelles
actualiteacutes classement des articles les plus lus les mieux noteacutes possibiliteacute denvoyer
par mail ou de bloguer un article et bien sucircr forte contribution de linternaute Sur
certains sites leacutetiquetage des articles via le systegraveme de tags est proposeacute
copy Digimind Digimind Services ndash White Paper |38
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Linteacuterecirct est de pouvoir positionner certaines informations les unes par rapport aux
autres et connaicirctre la populariteacute dune actualiteacute ou dun sujet (entreprise personne)
abordeacute (la critique de mon produit est-elle tregraves populaire ) Cest une approche
alternative aux agreacutegateurs de news de type Google Actualiteacutes ou Yahoo Actualiteacutes
qui hieacuterarchisent les news avec de puissants algorithmes mais sans recourir agrave
lhumain Ainsi Google Actualiteacutes preacutecise La seacutelection et le positionnement des
articles de cette page ont eacuteteacute reacutealiseacutes automatiquement par un programme
informatique
En outre sur ces services de type Digg linformation nest pas brute linternaute
qui poste lactualiteacute peut selon son expertise y apporter un commentaire de
valeur Linformation peut ecirctre commenteacutee (en plus du vote) par les autres
internautes Comme de nombreux blogueurs les utilisateurs des Digg Like jouent
aux journalistes ou tout simplement donnent leur opinion
Lorsquil sagit dactualiteacutes concernant le produit ou le service dune socieacuteteacute ces
commentaires positifs ou non sont une veacuteritable manne pour de nombreux
professionnels de linformation veilleurs marketeurs chargeacutes deacutetudes et autres
analystes qui vont pouvoir recueillir agrave moindre frais des informations sur leur
nouveau produit leurs clients ou ceux de la concurrence
Digg est lun des sites les plus copieacutes du Web 20 Sil reste la reacutefeacuterence dautres
applications tregraves largement inspireacutees tirent leur eacutepingle du jeu En France Scoopeo
Fuzz et TapeMoi offrent eux aussi des services dactualiteacutes collaboratives On peut
eacutegalement citer Rojo le canadien Niouz lespagnol Meneames le reacuteseau de sites
BlogMemes 56 Mecircme Netscape pionnier du navigateur web a lanceacute un portail
sinspirant du systegraveme de notation de Digg
On peut reprocher agrave ce type de site de favoriser les cateacutegories techniques et
scientifiques faisant la part belle aux contributions des geeks et autres accrocs du
net grands utilisateurs de services Web 2 Toutefois les sites comme Blogmemes ou
Netscape diffusent davantage dactualiteacutes agrave teneur eacuteconomique et sociale
- Les mix actualiteacutes contributions des internautes
Wikio57 est un service dorigine franccedilaise (creacuteeacute par le fondateur de Kelkoo) agrave
lintersection de Google Actualiteacutes et de Digg En effet Wikio mixe les articles issus
de sites dactualiteacutes de blogs avec des contributions des internautes On peut
prendre connaissance des informations de diffeacuterentes maniegraveres
copy Digimind Digimind Services ndash White Paper |39
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- En naviguant via les theacutematiques (France International Politique Economie
Finance Santeacute Science hellip) ou via le nuage de tags dynamiques qui se modifient en
fonction de la rubrique ou vous vous situez
- En recherchant via le moteur
- En sabonnant aux flux RSS agrave chaque cateacutegorie et agrave chaque tag correspond son
flux RSS De mecircme lorsque vous lancez une requecircte via le moteur vous pourrez
surveiller ces reacutesultats via un flux RSS
- les plateformes de contributeurs indeacutependants
La deacutefiance et la volonteacute dindeacutependance vis-agrave-vis des grands meacutedias traditionnels de
la presse eacutecrite et audio-visuelle se sont traduites degraves 2001 par la creacuteation massive
de blogs Les blogueurs sont-ils et peuvent-ils simproviser journalistes Ce deacutebat
qui promet decirctre sans fin est inteacuteressant De nombreux blogueurs (mais pas la
majoriteacute) sont devenus de veacuteritables experts dans leur domaine agrave force deacutecriture
de lecture et danalyses quotidiennes Ainsi les mainstream medias invitent
maintenant dans leurs colonnes et plateaux les blogueurs les plus talentueux
Ces blogueurs experts ou professionnels ne constituent pas les seuls creacuteateurs
dactualiteacutes alternatives
Des initiatives de plateformes dactualiteacutes eacutecrites par des non professionnels ont
aussi vu le jour Agoravox58 est lun des premiers portails de journalisme citoyen
lanceacute par Joeumll de Rosnay et Carlo Revelli 59 en mai 2005 Agoravox permet aux
internautes de proposer leurs articles pour commenter reacutefleacutechir agrave des sujets
dactualiteacutes si possible avec une approche et un regard diffeacuterents des meacutedias
traditionnels Le format des contributions est multimeacutedia Le site explique Tout le
monde peut devenir reacutedacteur drsquoAgoraVox Il nrsquoest pas neacutecessaire de savoir eacutecrire avec
un style journalistique affirmeacute Chacun drsquoentre nous peut devenir une sorte de capteur
en temps reacuteel de ce qui se passe dans notre entourage en fournissant des articles des
images des extraits videacuteo ou audio Ce qui est important crsquoest de pouvoir teacutemoigner
drsquoun eacuteveacutenement auquel vous avez assisteacute ou que vous avez deacutecouvert en faisant des
recherches Il poursuit Pourquoi devenir reacutedacteur Tout simplement pour faire
entendre votre voix et pour relater des faits que vous avez identifieacutes et qui ne vous
paraissent pas ecirctre suffisamment repris dans les meacutedias traditionnels voire ignoreacutes ou
censureacutes
Agoravox encourage donc agrave utiliser son style personnel Il convient de sinscrire pour
devenir reacutedacteur Les articles doivent toutefois obeacuteir agrave une politique eacuteditoriale60
Un comiteacute de reacutedaction valide ensuite les contributions
copy Digimind Digimind Services ndash White Paper |40
Le Web 20 pour la veille et recherche dinformation DIGIMIND
En quelques mois Agoravox a prouveacute que de simples internautes pouvaient ecirctre
aussi bon reacutedacteurs et experts en fonction de leurs profession passion et
centres dinteacuterecirct agrave linstar des blogueurs professionnels
Agoravox na pas la vocation dun agreacutegateur dactualiteacutes de type Digg Wikio ou
Google News Cest une sorte de quotidien qui privileacutegie les articles de fond et
lanalyse Bien sucircr des reacutedacteurs stars eacutecrivent reacuteguliegraverement et leurs articles
sont attendus Mais ce ne sont pas les rubriqueurs traditionnels des autres meacutedias
Comme sur les autres sites Web 20 le lecteur peut attribuer une note dinteacuterecirct agrave
chaque article et poster un commentaire Enfin leacutetonnante technologie
ReadSpeaker 61 permet de retranscrire automatiquement tous les textes en version
audio
Agoravox nest pas le seul exemple de site de journalisme citoyen Le portail
OhMyNews 62 initiative coreacuteenne est baseacute sur le mecircme principe Lanceacute en feacutevrier
2000 le reacuteseau international OhMyNews reacuteunit plus de 40 000 reacutedacteurs
Pour le veilleur ces sites dactualiteacutes collaboratives constituent des sources
dinformations alternatives avec une partie de lactualiteacute issue des organes et
agences de presse et lautre partie provenant des internautes Dautre part ces
nouveaux meacutedias permettent de deacutecouvrir et surveiller des experts voire des
leaders dopinion
Un article sur Agoravox A droite une preacutesentation de son auteur En haut la possibiliteacute de voter et
commenter larticle
copy Digimind Digimind Services ndash White Paper |41
Le Web 20 pour la veille et recherche dinformation DIGIMIND
II Rechercher Collecter
Doreacutenavant tout internaute peut creacuteer et publier sa propre information
Lidentification des sources dinformation et de linformation elle-mecircme est devenue
complexe car elles sont de plus en plus morceleacutees et atomiseacutees Il convient
dutiliser une large palette doutils de recherche pour collecter les donneacutees en
provenance des blogs des bookmarks et reacuteseaux sociaux Pour faciliter la
collecte il est en outre possible de verticaliser la recherche et de faire appel agrave des
humains Par ailleurs dautres outils permettent darchiver ses deacutemarches de
requecirctes et de navigation
a La recherche de blogs et de flux RSS
Le volume de blogs est en constante croissance sur le net Le nombre de blogs a
litteacuteralement exploseacute sur toute la planegravete Estimeacute agrave 70 millions agrave leacuteteacute 2005 ils sont
eacutevalueacutes agrave plus de 120 millions en mars 2007 Technorati lun des moteurs de
recherche de blogs les plus utiliseacutes mesure en 2007 un doublement du nombre de
blogs tous les 320 jours 120 000 blogs seraient ainsi creacuteeacutes chaque jour 63
Europe
33
Afrique 15 000
Ameacuterique du Nord
33
Ameacuterique du Sud
1
Asie
55
5 Australie 790 000
copy Digimind Digimind Services ndash White Paper |42
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Nombre de blogs en milliers et millions (la Russie est inteacutegreacutee dans lAsie) Estimation DIGIMIND Services 64
Les fils RSS omnipreacutesents A chaque blog correspond son flux RSS ce format qui permet dextraire et de
surveiller tout nouveau contenu qui parait sur le blog Si un vrai blog implique
toujours un flux RSS un flux RSS ninduit pas forceacutement un blog En effet le RSS et
son concurrent Atom sont preacutesents sur de plus en plus de type de meacutedias et outils
internet degraves lors que leur contenu est appeleacute agrave se modifier reacuteguliegraverement
On pourra donc trouver des flux RSS sur
-les blogs
-les sites de presse et dactualiteacute Exemple Les Echos Libeacuteration La Tribune Le
Figaro)
-les sites de revues et magazines speacutecialiseacutes Exemple La revue Nature propose ses
fils RSS concernant ses publications speacutecialiseacutees par domaines Science fait de
mecircme65
-les sites corporate des entreprises page dactualiteacutes catalogues produits (Ex Air
Liquide)
-les reacutesultats de moteurs de recherche de blogs Tous proposent des flux RSS
permettant de surveiller une requecircte (Technorati Google Blog Search Feedster
IceRockethellip)
-les pages de reacutesultats de moteur de recherche web Certains de ces moteurs
geacutenegraverent un flux RSS permettant de surveiller lapparition de nouveaux reacutesultats
pour une requecircte donneacutee
MSN Search (devenu Live Search66) le proposait depuis janvier 2005 et chaque page
de reacutesultats offrait une icocircne orange en bas de page permettant dobtenir des fils
RSS Cette icocircne RSS a disparu sur Live Search mais les flux RSS sont toujours lagrave (ils
sont deacutetectables automatiquement avec un navigateur Firefox Maxthon IE7 ou
votre lecteur RSS Attensa ou RSS Bandit par exemple)
Depuis peu Yahoo Search Web 67 offre lui aussi un fils RSS sur ses reacutesultats lagrave
encore deacutetectable via un lecteur ou navigateur (cela fonctionne uniquement pour le
Yahoo US)
copy Digimind Digimind Services ndash White Paper |43
Le Web 20 pour la veille et recherche dinformation DIGIMIND
-les moteurs dactualiteacutes La majoriteacute des portails qui agregravegent des flux dactualiteacutes
proposent des flux RSS Exemple Google Actualiteacutes Yahoo Actualiteacutes Topix MSN
Actualiteacutes Wikiohellip 68
-les Newsgroups Usenet (groupes de discussion) Les fils RSS sont en effet aussi
preacutesents sur Google Groupes (ou Google Groups) ce qui rend plus aiseacute la surveillance
des discussions Chaque groupe (Google ou Usenet) affiche un fils RSS ou Atom 69
(et ce quelque soit la langue) signaleacute par le logo orange RSS en bas de page
-certains forums web Exemple Forum Mobiles 70
-certaines listes de diffusion elles peuvent ecirctre surveilleacutees via labonnement agrave leur
flux RSS Cela eacutevite lengorgement de votre boicircte mail Exemple la liste Veille sur
Yahoo Groupes 71 dispose dun flux RSS
-les bookmarks sociaux Delicious Yahoo MyWeb2 Blogmarks 72hellipLe fils RSS
permet decirctre alerteacute de lajout de nouveaux favoris pour un tag ou un utilisateur
deacutefinis
-les plateformes de partage de photos Exemple Flickr PhotoBucket 73
-les services de partage de videacuteos comme YouTube DailyMotion 74 pour ecirctre alerteacutes
des nouveauteacutes
-de tregraves nombreux sites offrant un contenu qui se renouvelle
copy Digimind Digimind Services ndash White Paper |44
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Veille Corporate La Tribune propose des flux RSS segmenteacutes par socieacuteteacutes
Le veilleur via ces flux RSS pourra surveiller de nombreuses sources
dinformations Par ailleurs au-delagrave des blogs introspectifs dadolescents dont peu
preacutesentent un inteacuterecirct pour les professionnels certains types de blogs peuvent se
reacuteveacuteler utiles
-Le blog dactualiteacute et dopinion preacutesentant reacuteflexions et critiques de journalistes et
internautes
-Le blog theacutematique eacutediteacute par des passionneacutes experts professionnels consultants
et techniciens
-Le blog dentreprise outil de communication externe ou interne agrave linitiative des
salarieacutes ou des dirigeants
copy Digimind Digimind Services ndash White Paper |45
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les outils pour trouver des blogs et flux RSS Sur ces moteurs la recherche seffectue par mots cleacutes classiques ou par tags comme
sur Technorati par exemple Le contenu indexeacute (blogs et flux) est tregraves heacuteteacuterogegravene
Aussi lutilisation de la recherche avanceacutee sur ces outils est souvent neacutecessaire En
effet un blog peut avoir abordeacute la theacutematique deacuteveloppement durable 1 seule fois
parmi ses 4500 billets Il conviendra donc alors de centrer sa recherche sur le titre
du blog ou son url
Les moteurs
Certains moteurs sont deacutedieacutes agrave la recherche de blogs Cest en fait un abus de
langage Ces moteurs se focalisent sur la recherche de flux RSS mais ne peuvent
faire la diffeacuterence entre un flux provenant dun grand journal et celui dun blog
Ainsi le moteur Technorati classe parmi les blogs les plus populaireshellipLe Figaro
Pour mener une recherche efficace il conviendra dutiliser plusieurs moteurs Car
comme pour la recherche web ougrave il ne faut pas se limiter agrave Google au risque de
manquer pregraves de 85 des reacutesultats75 la recherche sur les blogs neacutecessite lemploi
de plusieurs outils76 En voici quelques-uns
gt Google Blog Search Recherche de blogs Google applique sa technologie puissante
aux flux RSS et blogs Linterface est notamment disponible en franccedilais et en anglais
Le moteur est doteacute de fonctions de recherche avanceacutee (recherche sur le titre le
billet recherche par ancienneteacutehellip)
gt Ask Blog amp Flux Ce moteur permet de rechercher parmi les blogs les flux XML
(RSS ou Atom) Et aussi de sabonner agrave un blog ou un flux RSS
gt Feedster Ce moteur recense plus de 900 000 sources et 5000 sont rajouteacutees
chaque jour
gt BlogPulse Indexe plus de 46 millions de blogs
gt Technorati Ce moteur rafraicircchit son index toutes les 5 agrave 15 minutes et
recherche parmi plus de 70 millions de blogs (en avril 2007 77) ou sites proposant
des flux RSS Il est possible de rechercher par mots cleacutes ou par tags
gt Sphere va prendre en compte plusieurs variables pour mieux chercher parmi la
blogosphegravere
- comme pour le contenu web classique les reacuteseaux de liens entrants et sortants
- la qualiteacute de ces liens
copy Digimind Digimind Services ndash White Paper |46
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- les internautes agrave lorigine de ces liens (simple commentateurs ou leaders dopinion)
3 moteurs web integravegrent la recherche sur les blogs au sein de leur recherche
avanceacutee 78
gt Yahoo Search
Pour centrer sa recherche sur les flux RSS et les blogs il convient drsquoaller dans la
recherche avanceacutee (agrave droite de la boite de requecircte) puis dans le menu deacuteroulant
Format de fichiers et de seacutelectionner le format RSSXML
gt Exalead
Apregraves avoir effectueacute votre recherche il suffit de cliquer sur le bouton RSS jaune
dans la fenecirctre Preacuteciser la recherche Au sein des reacutesultats de recherche le flux
RSS est disponible via licocircne RSS Simple et propre
gt Microsoft MSN Live Search
MSN a ameacutelioreacute les interfaces de son moteur pour restreindre la recherche sur les
fils RSS Apregraves laffichage de votre page de reacutesultats vous pouvez affiner votre
recherche gracircce au bouton Flux (ou Feed en anglais) Ce bouton est accessible via
le menu Plus Au sein des reacutesultats de recherche sont alors disponibles lurl du flux
le cache et un lien pour sinscrire au fils RSS
Au-delagrave de ces moteurs speacutecialiseacutes il peut ecirctre beacuteneacutefique de tenter une recherche
sur un moteur Web (Google ou Yahoo Search par exemple) de type blog OR RSS
[votre sujet] Exemple blogs sur les teacuteleacutecoms Cela vous permettra non pas de
chercher au sein des blogs mais de trouver dautres blogs
Les reacutepertoires 79
Comme pour le web un certain nombre dannuaires entendent recenser les blogs
et fils RSS Attention comme la blogosphegravere est tregraves mouvante et en constante
croissance ces guides sont par nature non exhaustifs et leur mise agrave jour reacuteguliegravere
est difficile
gt Blogarama Ce reacutepertoire recense plus de 49 000 blogs classeacutes par cateacutegories
gt RSS Network indexe plus de 150 000 fils RSS
gt RSSFeeds Reacutepertorie plus de 119 000 fils organiseacutes en cateacutegories
copy Digimind Digimind Services ndash White Paper |47
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b La recherche par tags
Nous lavons vu avec la Folksonomie linternaute peut deacutesormais mettre en place et
partager sa propre classification via les tags Lutilisateur affecte leacutetiquette de son
choix agrave ses favoris images videacuteos Lavantage est indeacuteniable cest linternaute qui
deacutefinit son eacutetiquette et non plus un organisme Mais les inconveacutenients sont
nombreux difficile gestion des singulierspluriels problegraveme de synonymes de
signification (que deacutesigne cet internaute par ce tag) dhomonymes de polyseacutemie
dheacuteteacuterogeacuteneacuteiteacute plusieurs tags peuvent designer les mecircmes documents
Toutefois lapproche par tag facilite la recherche dune part en ajoutant une couche
seacutemantique aux documents web et dautre part en permettant une navigation par
concepts de plus en plus abandonneacutee compte tenu de la deacutesertion progressive des
cateacutegories des grands reacutepertoires web par les internautes
De plus on peut tagger pratiquement tout type de contenu web Ainsi les sites 43
Things et son eacutequivalent franccedilais 36 Trucs 80 proposent aux internautes de lister
leurs objectifs expeacuteriences ou projets Chacun de ces projets est taggeacute via un ou
plusieurs mots cleacutes
Les moteurs et meacutetamoteurs de tags
Les moteurs
La plupart des applications de social bookmarking ou de partage de fichiers images
ou videacuteos permettent donc de tagger leur contenu Sur certaines le moteur de
recherche interne rend possible en plus de la recherche sur le full text une
recherche centreacutee sur les tags Cest le cas sur Flickr vous pouvez rechercher au
choix sur le titre et la description des images ou sur les tags associeacutes deacutefinis par les
utilisateurs qui ont placeacute leurs photos
Un outil comme Delicious tag search 81 va vous permettre deffectuer des
recherches via un ou plusieurs tags sur le service de social bookmarking Delicious
Pour la recherche de blogs ou flux RSS le moteur Technorati propose une
recherche classique sur les mots cleacutes contenus dans les billets mais aussi une
copy Digimind Digimind Services ndash White Paper |48
Le Web 20 pour la veille et recherche dinformation DIGIMIND
recherche par tags82 En effet leacutediteur dun blog peut tagger chacun de ses billets
via des mots cleacutes qui les cateacutegorisent Ces mots ou tags seront repris par lindex du
moteur Ainsi la recherche du mot pollution parmi les tags affiche un billet sur le
reacutechauffement climatique Si ce billet est bien cateacutegoriseacute par son auteur dans une
rubriquepollution (parmi dautres) il ne contient pas ce mot dans son texte
toutefois en relation avec le concept de pollution Clairement une recherche
classique sur le seul texte des billets naurait pas rameneacute ce billet ou du moins pas
dans les premiers reacutesultats Autre inteacuterecirct Technorati vous propose des tags
associeacutes Ainsi pour pollution il affiche environment politics global warming science
china energy news air climate climate change autant de mots cleacutes pour eacutelargir ou
affiner vos requecirctes
Le moteur SearchLess 83 offre une approche originale il associe la recherche par
mots cleacutes agrave la recherche par tags Ainsi si vous effectuez une requecircte avec le mot
intelligence vous pouvez preacuteciser par le tag CIA Les reacutesultats seacutelectionneront
donc le mot intelligence sur des contenus (billets de blogs par exemple) taggeacutes CIA
par lutilisateur lui-mecircme on est alors sucircr que les 2 concepts sont intimement lieacutes
Meacutetamoteurs
Des meacutetamoteurs 84 permettent de rechercher sur les diffeacuterents types de contenu
sociaux bookmarks images videacuteos
Ainsi Tag Central agreacutege de nombreux formats web taggeacutes En lui indiquant un
tag il affiche des reacutesultats provenant agrave la fois de Flickr Smugmug (photos)
Technorati (blogs) Blogmarks Connotea Furl delirious (bookmarks sociaux) ou
encore 43Things (listes de projets)
Zewol outil de meacuteta syndication francophone permet de rechercher parmi les tags
(Flickr delicious) mais aussi sur les actualiteacutes (Google News Ask Actualiteacutes
Yahoo Actualiteacutes) les blogs (Technorati IceRocket Google Blog Search Ask
Blogshellip) le buzz (Tapemoi Scoopeo Wikipedia) les videacuteos (Google Videos
Podscope Video Daily Motion) et un mix (Furl Echonimo actualiteacutes Plazoo
Feed24) Concregravetement cest une bonne approche de recherche globale sur de
nombreuses ressources de type Web 20
Il est toujours possible de traquer la preacutesence ou lapparition dun mot clef sur le
web via la mise en surveillance du flux RSS de la requecircte
Ketoag est un outil qui permet dinterroger de nombreux services sociaux
copy Digimind Digimind Services ndash White Paper |49
Le Web 20 pour la veille et recherche dinformation DIGIMIND
(Delicious Furl Diig Wikio Blinklist) mais eacutegalement des moteurs de recherche
(Google Blog Search) Par ailleurs vous pouvez geacuteneacuterer pour chaque requecircte un
flux RSS mais aussi un fichier OPML (format permettant lagreacutegation et leacutechange de
listes de flux RSS)
Gnosh est un meacutetamoteur qui recherche parmi les moteurs web les moteurs de
blogs et les outils de partage de favoris De plus une recherche sur longlet People
vous permet de rechercher parmi les favoris des internautes inscrits agrave la
communauteacute Gnosh
Exalead recherche sur Wikipedia A droite le nuage de tags
Les nuages de tags
Ces nuages regroupent un ensemble de tags dans un mecircme espace en affectant agrave
chacun une taille variant selon leur populariteacute (freacutequence dutilisation ou de requecircte
sur ces mots) ou la densiteacute darticles auxquels ils se reacutefeacuterent (deacutepecircches dactualiteacutes
par exemple)
Les nuages de tags sont devenus agrave la mode car ils permettent une navigation facile
tregraves visuelle au sein dun site dune base de donneacutee ou des reacutesultats dun moteur
Ils apportent une grille de lecture suppleacutementaire agrave des sites dont les menus sont
souvent surchargeacutes ou le contenu atomiseacute
copy Digimind Digimind Services ndash White Paper |50
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Nombreuses sont les applications qui utilisent le nuage de tags pour optimiser la
navigation et mettre en valeur leur contenu le partage de videacuteos (DailyMotion) les
bookmarks sociaux (Delicious MyWeb2 de Yahoo) ou les services dactualiteacutes
collaboratives comme Wikio Certains moteurs comme Exalead ont eacutegalement
choisis dafficher des nuages de tags au sein de leurs pages de reacutesultats Dans ce cas
il sagit dune aide agrave laffinage des requecirctes un clic sur un tag va afficher une
nouvelle page de reacutesultat prenant ce mot en compte
Zibb85 moteur de recherche vertical deacutedieacute au Business to Business utilise aussi le
nuage de tags pour visualiser clairement les mots cleacutes de theacutematiques connexes les
plus freacutequents agrave votre requecircte
Dautres sites plus classiques ont eacutegalement choisi lapproche du nuage de tag pour
rendre leur navigation plus attractive et leurs rubriques plus visibles Ainsi le site
Ecrans 86(du journal Libeacuteration) affiche en bas agrave droite un nuage de tags mettant en
valeur son contenu tregraves touffu
Certains outils proposent de geacuteneacuterer des nuages de tags pour des sites ou moteurs
nen disposant pas
Google Tag Cloud Maker 87 est un script pour Firefox qui permet dafficher un nuage
de tags agrave droite des reacutesultats de Google plus un mot est freacutequent dans les reacutesultats
de votre recherche plus la taille dun tag est importante
Newzingo 88 extrait des mots de Google News pour constituer un nuage
doccurrences parmi les termes de lactualiteacute Plus le terme est gros plus les articles
relatifs agrave ce terme sont nombreux Techzingo reacutealise le mecircme process mais cette
fois les cibles sont des meacutedias de reacutefeacuterence dans le High Tech et le logiciel
Slashdot Diggcom et TheRegister
Un nuage de tags sur lInternet Movie Database une maniegravere de naviguer parmi tous les mots cleacutes associeacutes aux films
copy Digimind Digimind Services ndash White Paper |51
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La qualification du contenu par les utilisateurs (rdquofolksonomierdquo) est une reacuteelle valeur
ajouteacutee Les moteurs de recherche font reposer une grande part de lrsquoeffort sur
lrsquoutilisateur final une page de reacutesultats de Google doit ecirctre eacutevalueacutee souvent
interpreacuteteacutee par linternaute La folksonomie fait elle reposer lrsquoeffort de filtrage sur
lrsquoutilisateur initial celui qui va rechercher et appliquer ses propres ldquotagsrdquo Parce
quen amont 1743 personnes ont taggeacute une page avec un groupe de mots cleacutes
lrsquoutilisateur final lors de sa requecircte reccediloit une page de reacutesultats souvent tregraves
pertinente
Sur un moteur classique cest agrave lutilisateur dimaginer ses mots cleacutes pour affiner sa
recherche Sur les bookmarks sociaux de type Delicious les internautes qui
partagent leurs ressources ont deacutejagrave preacutepareacute ce travail daffinage via leurs tags
Prenons le cas dune recherche extrecircme car geacuteneacuterant de la synonymie la requecircte
Jaguar Sur Googlecom on me propose certes des mots cleacutes connexes pour
affiner mais tous sont lieacutes agrave la voiture Sur Delicious les tags afficheacutes sont relatifs agrave
la voiture mais aussi au systegraveme dexploitation agrave un groupe de musique et agrave lanimal
Pouvoir rechercher parmi les tags classifications eacutemanant de lutilisateur peut ecirctre
particuliegraverement inteacuteressant lorsquune recherche classique par mots cleacutes sur le
contenu des documents sest aveacutereacutee infructueuse ou geacutenegravere des reacutesultats peu
pertinents
Le tagging une pratique quotidienne
Selon une enquecircte meneacutee en deacutecembre 2006 par le Pew Internet amp American Life
Project 28 dutilisateurs des internautes ameacutericains ont taggeacute ou cateacutegoriseacute en
ligne des contenus tels que des photos des billets dans des blogs des articles
drsquoactualiteacutehellipSur une base journaliegravere 7 des utilisateurs drsquoInternet pratiquent le
tag en ligne
Ce systegraveme de laquo taxonomie populaire raquo pourrait-il constituer une alternative aux
outils de recherche traditionnels par mots cleacutes Il convient de distinguer les
usages professionnels des usages grand public Olivier Le Deuff 89 reprend dans
son eacutetude sur les Folksonomies la distinction effectueacutee par Thomas Vander
Wal entre les folksonomies eacutetroites (narrow folksonomies) et geacuteneacuterales (broad
folksonomies) Selon Olivier Le Deuff cette distinction est importante car les
premiegraveres sont surtout utiliseacutees dans un objectif individuel tandis que les secondes
privileacutegient lrsquoaspect collectif et collaboratif du partage drsquoinformation Ainsi les sites
de partages de favoris comme delicious ou Connotea sont plutocirct des
folksonomies geacuteneacuterales puisqursquoun mecircme site peut ecirctre partageacute par plusieurs
utilisateurs et recevoir le mecircme tag Ce type de folksonomies srsquoappuyant sur des
copy Digimind Digimind Services ndash White Paper |52
Le Web 20 pour la veille et recherche dinformation DIGIMIND
reacuteseaux sociaux ne fait pas que classer de lrsquoinformation et la partager Il met en
relation des usagers qui partagent les mecircmes centres drsquointeacuterecirct Lrsquousager indexeur
devient agrave son tour un peu indexeacute et mis en relation agrave la fois avec drsquoautres mots-
cleacutes drsquoautres sites et drsquoautres usagers
Il est clair que dans le domaine de lrsquoinformation professionnelle ou speacutecialiseacutee le
manque duniformisation des folksonomies qursquoelles soient geacuteneacuterales ou agrave vocation
plus eacutetroite pose les limites de ce systegraveme Les outils drsquoindexation et de
classification traditionnels ont en effet eacuteteacute creacuteeacutes pour des corpus structureacutes aux
limites clairement deacutefinies et srsquoadressent agrave des utilisateurs experts drsquoun domaine
ou de la recherche drsquoinformation Lrsquoabsence de hieacuterarchisation et de controcircle
constitue agrave la fois le point fort et le point faible de la folksonomie La barriegravere des
langues pourra constituer eacutegalement un obstacle les tags eacutetant parfois meacutelangeacutes
dans un mecircme site sans distinction De plus comme le note Cyril Fievet 90 la
pratique du tagging nrsquoest pas uniforme drsquoun site agrave lrsquoautre Sur Technorati les tags
indexeacutes sont ceux choisis par les blogueurs et fonction du contenu qursquoils ont eux-
mecircmes publieacute Sur delicious en revanche ce sont les internautes qui taguent le
contenu des pages qursquoils conservent dans leurs signets raquo
Il convient eacutegalement drsquoecirctre vigilant quant agrave une utilisation laquo frauduleuse raquo des
tags destineacutee uniquement agrave garantir la populariteacute drsquoun blog comme cela a pu
ecirctre le cas avec les meacuteta-donneacutees incorporeacutees dans le code source drsquoune page
html
Eacutelie Francis et Odile Quesnel preacutesentent dans la revue Documentaliste Sciences
de lrsquoinformation les quatre modes drsquoindexation et de classification sur le web la
classification personnelle lrsquoindexation par lrsquoauteur lrsquoindexation par lrsquoutilisateur et la
classification globale Et srsquointerrogent sur lrsquoavenir de lrsquoindexation collaborative agrave la
croiseacutee de la qualiteacute (liberteacute diversiteacute enrichissement) et de la deacutesinformation
(subjectiviteacute manque de coheacuterence)
Il nrsquoen reste pas moins que folksonomie et indexation classique ne srsquoopposent pas
neacutecessairement et constituent des moyens de description de contenus adapteacutes agrave
des contextes diffeacuterents Stephen Lee creacuteateur du site Guten Tag voit dans la
folksonomie une sorte de web seacutemantique du pauvre peu oneacutereux agrave mettre en
place mais dont le succegraves reposera sur une seacuterie de bonnes pratiques collectives
Lrsquointeacuterecirct de ce systegraveme reacutesidera non pas dans la capaciteacute agrave trouver une reacuteponse agrave
une question preacutecise mais plutocirct agrave deacutecouvrir des sources originales et peu connues
ou de localiser des experts drsquoun domaine pointu Les tags les plus rares et preacutecis
pourront entre autres trouver leur application dans le domaine de la veille mettant
copy Digimind Digimind Services ndash White Paper |53
Le Web 20 pour la veille et recherche dinformation DIGIMIND
en œuvre la seacuterendipiteacute ou lrsquoart de favoriser le hasard pour des deacutecouvertes
heureuses
Laissons la conclusion sur ce point agrave lrsquoAssociation des Professionnels de
lrsquoInformation et de la Documentation (ADBS) qui estime dans sa newsletter que
Le foisonnement des propositions de mots-cleacutes aboutirait agrave un reacutesultat plus efficace
quune indexation reacutealiseacutee par un vocabulaire contraint Cette affirmation semble
ecirctre deacutemontreacuteehellip pour linstant
c La recherche de personnes et dinformations entreprises
La recherche de donneacutees sur les personnes physiques ou morales seffectuait
jusquici principalement en interrogeant les bases de donneacutees dinformations leacutegales
et financiegraveres gratuites ou payantes Linterrogation de service tel que Societecom
Infogreffe ou Yahoo Finance est bien sucircr encore neacutecessaire Mais il faut compter
maintenant avec les reacuteseaux sociaux professionnels qui eux aussi rassemblent des
donneacutees sur les entreprises ou les individus
Linteacuterecirct des reacuteseaux sociaux
Que peuvent-il apporter par rapport aux services classiques dinformations
dentreprises Dabord comme expliqueacute preacuteceacutedemment ils sont ouverts agrave tous
Les informations y figurant ne sont plus le seul fait de leacutediteur du site et ne sont pas
uniquement constitueacutees par les fichiers de donneacutees leacutegales publieacutees par les
organismes officiels comme le Greffe du Tribunal de Commerce en France Sur les
reacuteseaux sociaux centreacutes sur les personnes le contenu est inteacutegralement ameneacute par
linternaute qui affiche son CV deacutetailleacute ses publications ses oeuvres (textes ou
multimeacutedias) Linteacuterecirct est eacutevident des personnes peu visibles auparavant parce
que ne faisant pas partie des dirigeants dentreprises (geacuterant fondateur membre du
conseil) sont maintenant accessibles et donc requecirctables par les internautes On
peut donc collecter des informations sur un cadre de RampD dune socieacuteteacute de
teacuteleacutecoms concurrente ou sur le management eacutetonnant de telle entreprise de
plasturgie citeacutee dans le CV dun employeacute de passagehellip
A linstar des blogs linformation preacutesente sur les reacuteseaux sociaux ne tient plus du
discours ou des donneacutees officielles puisque cest linternaute qui communique sur sa
vie et son entreprise
copy Digimind Digimind Services ndash White Paper |54
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Geacuterer leacuteparpillement de linformation
Dautres plateformes de social networking mixent linformation collecteacutee sur le web
avec les contributions des utilisateurs (agrave linstar de Wikio pour les actualiteacutes) Ainsi
le service ZoomInfo 91 permet de rechercher des socieacuteteacutes et des personnes en
parcourant des milliers de donneacutees extraites du web mais aussi en provenance de
profils dindividus et dentreprises renseigneacutes par les socieacuteteacutes ou les employeacutes eux-
mecircmes Aussi cohabitent des informations sur des entreprises coteacutees avec des
donneacutees de firmes non coteacutees des fiches de cadres du top management et des
conseils dadministration avec des CV demployeacutes plus fonctionnels
Le franccedilais Ziki 92 utilise aussi des informations collecteacutees sur le web cest une
sorte dannuaire perfectionneacute qui indexe et archive non pas les donneacutees
signaleacutetiques mais les contenus produits par une personne agrave partir du moment ougrave ils
disposent dun flux RSS (billets de blogs photo Flickr favoris Delicioushellip) Ziki ne
permet pas de creacuteer du contenu propre mais agregravege des donneacutees eacutelaboreacutees par un
mecircme individu auparavant eacuteparpilleacutees sur linternet Bref vous ameacuteliorez votre
visibiliteacute et facilitez la recherche de vos productions sur le net en creacuteant un point
unique daccegraves
La recherche sur tous ces reacuteseaux sociaux implique souvent linterrogation
fastidieuse apregraves inscription de plusieurs dizaines de sites
Aussi certains outils 93 proposent une meacutetarecherche en lanccedilant une mecircme
requecircte sur plusieurs services de social networking Stalkerati recherche le nom
dune personne sur les reacuteseaux Friendster et FaceBook Plus complet et ciblant
davantage les reacuteseaux professionnels YoName recherche les noms sur MySpace
LinkedIn Friendster Windows Live Spaces Bebo Digg ou Xanga
Le moteur de recherche de personnes Wink scrute les reacuteseaux sociaux MySpace
Bebo Friendster LinkedIn Live Spaces et autres De plus avec cet outil il est
possible de creacuteer son propre profil et de le connecter agrave des reacuteseaux sociaux
Attention toutefois si vous ecirctes un utilisateur recherchant des donneacutees en franccedilais
la nature des reacutesultats est plutocirct tourneacutee vers le monde anglophone
Ces reacuteseaux sociaux ne sont pas suffisants pour une recherche professionnelle
complegravete A linstar des blogs face agrave la presse traditionnelle ils constituent un
compleacutement inteacuteressant aux bases de donneacutees officielles
copy Digimind Digimind Services ndash White Paper |55
Le Web 20 pour la veille et recherche dinformation DIGIMIND
d Les moteurs de recherche humains
Apregraves ecirctre apparus sur le net agrave la fin des anneacutees 90 les services de questions-
reacuteponses avaient laisseacute la place aux algorithmes tout puissants des moteurs de
recherche de type Google Mais les robots et programmes ont tous besoin dune
intervention humaine pour geacuterer la qualiteacute et la pertinence des reacutesultats
Ainsi tous les grands moteurs majeurs ne font pas confiance agrave leurs seuls
algorithmes Les employeacutes de Yahoo sont mis agrave contribution pour surveiller la
qualiteacute des reacutesultats fournis par le moteur Chez Google et MSN Search des
process deacutevaluation humaine avaient eacuteteacute identifieacutes agrave travers les sites
EvalGooglecom et MSN HRS notamment
La revanche de lhumain
Au-delagrave de ce rating humain sur les reacutesultats de moteurs de recherche de
nombreux services depuis 2 ans mettent agrave disposition des experts en chair et en
os Cest alors un veacuteritable mode collaboratif qui se met en place lorsque le produit
est bien penseacute Cest la cas de Yahoo Answers (Yahoo Questions Reacuteponses en
France) 94 Ce service gratuit de questions reacuteponses lanceacute fin 2005 permet agrave
linternaute de poser une question dans un formulaire Chaque membre de la
communauteacute Yahoo (agrave savoir tout ceux qui disposent dun compte Yahoo) peut
jouer le rocircle dexpert Yahoo propose aussi le service (eacutegalement gratuit) Ask
Yahoo qui propose de reacutepondre agrave vos questions mais cette fois via un groupe
dexperts seacutelectionneacutes par Yahoo Inc Yahoo Answers a certes une orientation
initiale grand public mais des questions un peu techniques voire scientifiques
trouvent reacuteponse En effet parmi tous les contributeurs agrave Yahoo Answers figurent
des meacutetiers et expertises tregraves diverses du fait de son audience importante Il y
cohabite des types de questions varieacutes Quels sont les groupes strateacutegiques de
lindustrie mondiale du jouet Quelles sont les donneacutees eacuteconomiques du marcheacute de
lassurance vie collective en France
Autre point inteacuteressant le service est deacuteployeacute dans de nombreux pays (Etats-Unis
Royaume-Uni Canada Australie Inde Espagne Breacutesil Argentine Mexique Italie
Allemagne Singapour Taiwan Coreacutee du Sud Hong Kong Japon Chinehellip) Aussi il
est possible de localiser certaines questions et de beacuteneacuteficier parfois dune
expertise pays
Lune des raisons du succegraves du service de Yahoo tient au fait de baser les questions
et reacuteponses sur la contribution dinternautes volontaires Chacun participe
constitue un vrai reacuteseau et peut surtout se valoriser en devenant expert dans son
copy Digimind Digimind Services ndash White Paper |56
Le Web 20 pour la veille et recherche dinformation DIGIMIND
domaine de compeacutetences ou sa passion Il est mecircme possible de creacuteer sa propre
communauteacute qui rassemblera vos amis mais aussi vos experts preacutefeacutereacutes qui
reacutepondent agrave vos questions et centres dinteacuterecirct Le pool de reacutepondants nest donc
pas limiteacute agrave une liste restreinte et il sauto-entretient Dautre part les experts
seacutevaluent entre eux et seacutelectionnent parmi une liste si neacutecessaire ce quils
considegraverent comme la meilleure reacuteponse agrave une question
Une question sur Yahoo Answers
Sur ce marcheacute des Questions-Reacuteponses Google a eacutechoueacute notamment parce quil a
seacutepareacute formellement demandeurs et contributeurs limitant ainsi fortement laspect
collaboratif Le Service Google Answers 95 permettait de poser des questions agrave des
experts Mais lagrave ougrave des services concurrents comme Yahoo Answsers Lycos IQ
copy Digimind Digimind Services ndash White Paper |57
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Windows Live QnA96 sont gratuits Google Answers eacutetait un service payant faisant
appel agrave un reacuteseau de 800 experts Aussi Google Answers apregraves 4 ans dactiviteacute a
fermeacute Les questions ne sont deacutesormais plus accepteacutees mais laccegraves aux archives des
questions-reacuteponses est maintenu
Par ailleurs les reacuteseaux sociaux eacutevoqueacutes plus haut ont bien compris la puissance des
communauteacutes pour faire office de speacutecialistes Ainsi avec LinkedIn Answers la
plateforme de reacuteseaux sociaux LinkedIn sest lanceacutee elle aussi dans le service de
QuestionsReacuteponses
Ne pas oublier les services Web 10
Lorsque lon parle de Web 20 on eacutevoque rarement ces services de Questions-
Reacuteponses au profit de sites plus technologiques Pourtant nous sommes ici dans la
logique des bookmarks sociaux partager ses connaissances faire beacuteneacuteficier les
autres de son savoir et en retour profiter de lexpertise de la communauteacute
Comme la plupart des applications Web 2 la seule utilisation des services QR ne
suffit pas Elle doit venir en compleacutement de recherches parallegraveles via dautres outils
Ainsi pour la veille linscription agrave des listes de diffusion permet aussi de poser des
questions agrave des experts ou passionneacutes De plus il subsiste des services dexpert
traditionnels qui sils ne mettent pas laccent sur la collaboration permettent
didentifier des compeacutetences parfois tregraves pointues Certaines ressources
reacutepertorient des milliers dexperts quil faudra ensuite contacter personnellement
pour beacuteneacuteficier de leur conseil Cest le cas du site Expertscom qui identifie des
experts dans des domaines allant de lacoustique agrave la biochimie en passant par
lindustrie peacutetroliegravere97
copy Digimind Digimind Services ndash White Paper |58
Le Web 20 pour la veille et recherche dinformation DIGIMIND
e les moteurs de recherche collaboratifs
Nous lavons vu certains services dactualiteacutes collaboratives proposent des reacutesultats
issus dun mixage entre contribution des internautes et collecte de nouvelles sur le
web Cette approche de mixiteacute se met peu agrave peu en place pour les moteurs de
recherche web En effet les modegraveles algorithmiques ou humains preacutesentent tout 2
leurs limites en terme de pertinence de fiabiliteacute et dexhaustiviteacute
Aussi de plus en plus de projet de moteur mixtes agrave savoir proposant des reacutesultats
web conjointement agrave des reacutesultats etou seacutelections issus dhumains voient le jour
Du web donc mais avec une forte dose de cerveaux humains
Wikiasari
Celui qui fait le plus parler de lui est le projet de Jimmy Wales le co-fondateur de
lencyclopeacutedie Wikipedia Baptiseacute Wikiasari 98 (combinaison de wiki rapide en
hawaiumlen et asari recherche fouilleacutee en japonais) le projet vise agrave creacuteer un outil de
recherche ougrave les internautes pourront influer sur les reacutesultats en notant leur
pertinence etou en en proposant de nouveaux selon leur expertise
Ce type de moteur sinscrit donc agrave lopposeacute doutils comme Google aux algorithmes
automatiques dont les robots sont souvent trompeacutes par des manipulations de
webmasters (spamdexing par exemple)
Cet outil qui devrait voir le jour courant 2007 sappuie sur des infrastructures Open
Source existantes comme Nutch ou Lucent
Cest un projet particuliegraverement inteacuteressant Comme sur lencyclopeacutedie ouverte
Wikipedia ougrave des milliers de contributeurs construisent et alimentent louvrage sur
ce moteur des reacuteseaux de centaines dinternautes pourront apporter leur savoir
pour ameacuteliorer la pertinence des reacutesultats Ce nest plus seulement la puissance de
calcul de machines qui sera mise agrave contribution mais aussi la puissance de la
communauteacute
Derriegravere le projet Wikiasari il y a de gros moyens financiers et humains
lexpeacuterience de la fondation Wikipedia et le potentiel de trafic que pourra apporter
lencyclopeacutedie ouverte Fin 2006 Comscore a en effet classeacute Wikipedia comme le
6egraveme site le plus visiteacute au monde avec 1719 millions de visiteurs uniques au mois
de novembre On peut donc y croire
copy Digimind Digimind Services ndash White Paper |59
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche de sites similaires sur Yoono
Decipho Yoono
Certes lideacutee dun moteur de recherche collaboratif nest pas nouvelle Reacutecemment
on peut citer le lancement du moteur Decipho ou en mars 2006 celui de Yoono
Mecircme si les approches diffegraverent ces outils font tous la part belle agrave lrsquoapport de
chaque utilisateur dans le traitement des reacutesultats
Decipho 99 est un moteur baseacute sur la technologie de Askcom lun des 4 moteurs les
plus utiliseacutes aux USA Linternaute creacuteeacute ses propres cateacutegories de reacutesultats
partageables avec les autres Il peut eacutegalement tagger les reacutesultats afin deacutetiqueter
un site Aussi lors dune requecircte on peut preacuteciser les mots cleacutes classiques avec des
tags On beacuteneacuteficie alors de tous les tags mis en place par la communauteacute des
utilisateurs Un curseur permet de deacutefinir la proportion de cateacutegorisation des
autres utilisateurs agrave prendre en compte dans sa recherche
Le franccedilais Yoono 100 propose une autre deacutemarche encore loutil fonde ses reacutesultats
sur la mutualisation des connaissances des internautes par le partage des favoris Le
copy Digimind Digimind Services ndash White Paper |60
Le Web 20 pour la veille et recherche dinformation DIGIMIND
moteur utilise les favoris que sa communauteacute dutilisateurs a accepteacute de partager
Lors dune requecircte les reacutesultats sont classeacutes par populariteacute agrave savoir selon le
nombre de fois ougrave une page a eacuteteacute mise en favoris par les utilisateurs Une logique
proche de Delicious mais avec Yoono lajout de favoris est automatique De plus
loutil affiche les utilisateurs qui comme vous ont reacutefeacuterenceacute des sites sur la
politique veacuteneacutezuelienne par exemple De cette maniegravere vous pouvez identifier des
passionneacutes ou experts partageant vos domaines de preacutedilections Les reacutesultats ne
sont plus baseacutes sur les seuls algorithmes mais sur lexpeacuterience et la capacitation des
autres utilisateurs
Les initiatives de moteurs collaboratifs plus ou moins inteacuteressantes sont multiples
Foox est un moteur baseacute sur des communauteacutes dinteacuterecirct et sur Webzzle lutilisateur
preacutecise les concepts qui linteacuteressent afin de contextualiser les mots-cleacutes choisis 101
Humains ou algorithmes
Certes le mode collaboratif ne remplacera pas totalement la recherche
algorithmique Les 2 sont compleacutementaires Lune permet dameacuteliorer la pertinence
de prendre en compte des concepts des contextes du sens et non plus simplement
des chaicircnes de caractegraveres Lautre vise lexhaustiviteacute en indexant des milliards de
pages Web Aujourdhui et en attendant le Web seacutemantique ainsi que la recherche
dite naturelle 102 toutes deux grandes quecirctes du monde de linternet seul lapport
de communauteacutes dhumains permet dinjecter un peu de sens agrave une recherche
Mais de son cocircteacute la recherche coopeacuterative comporte bien entendu des risques de
subjectiviteacute
Sur les moteurs de recherche la coopeacuteration peut prendre une autre forme via le
peacuterimeacutetrage des sites agrave interroger la construction dun moteur sur mesure en
quelque sorte Cest la verticalisation de la recherche
copy Digimind Digimind Services ndash White Paper |61
Le Web 20 pour la veille et recherche dinformation DIGIMIND
f La verticalisation par la personnalisation du peacuterimegravetre de recherche
Lune des grandes faiblesses des moteurs de recherche web agrave large eacutechelle (Google
Exalead Yahoo MSNhellip) est le bruit geacuteneacutereacute par certaines requecirctes Lorsque vous
tapez puma le moteur ne sait pas agrave priori si vous vous inteacuteressez aux vecirctements
de sport agrave lanimal ou aux heacutelicoptegraveres Or si vous ne reacutealisez des recherches que
dans laeacuterospatiale vous devrez souvent deacutesambiguiumlser par vos mots cleacutes ce qui
engendre une perte de temps voire de reacutesultats si vos requecirctes deviennent trop
restrictives
Certains moteurs ou meacutetamoteurs clusteacuterisent (cateacutegorisent) les reacutesultats en les
rassemblant par groupes (grappes) dans de petits dossiers Cette deacutemarche avait
eacuteteacute initieacutee par le moteur Northern Light en 1998 Ainsi tous les reacutesultats relatifs aux
chaussures Puma sont regroupeacutes dans une mecircme valise ceux eacutevoquant lanimal
dans une autre Mais cette solution nest pas complegravetement satisfaisante car elle
seffectue agrave posteriori une fois votre requecircte lanceacutee Le bruit nest pas eacutelimineacute mais
simplement circonscrit dans des sortes de cateacutegories poubelle
Pour beacuteneacuteficier dune deacutemarche agrave priori il convient dutiliser des outils de
recherche verticaux cest-agrave-dire speacutecialiseacutes dans un secteur dactiviteacute une fonction
un type dinformation ou de meacutedias
Face aux problegravemes de pertinence des moteurs geacuteneacuteralistes de plus en plus de
moteurs verticaux voient le jour Ainsi le seul domaine meacutedical a vu apparaicirctre ces
20 derniers mois les moteurs SearchMedica Medstory MedWorm ou encore Medgle 103
Mais si votre secteur de preacutedilection nest pas couvert par un moteur speacutecialiseacute
Cest lagrave quintervient un autre type de moteur collaboratif agrave qui lon peut indiquer le
peacuterimegravetre des sites sur lesquels effectuer la recherche Sur les moteurs classiques
les algorithmes peuvent placer en prioriteacute des reacutesultats sans inteacuterecirct pour vous A
force de navigation et de veille dans votre secteur vous connaissez certainement
10 20 100 sites que vous jugez incontournables et indispensables pour vos
recherches
2 solutions techniques existent
- les outils agrave peacuterimegravetre de recherche personnalisable (adaptable scope)
Ils utilisent les index des moteurs geacuteneacuteralistes (Yahoo ou Google) et restreignent le
scope de leur recherche aux pages des sites que vous avez choisis Ainsi des outils
comme Rollyo Swicki Yahoo Search Builder Google Custom Search 104 vous
demandent dindiquer une liste de sites sur lesquels vous allez limiter votre
recherche Lors dune requecircte les reacutesultats proviendront uniquement des sites de
votre choix Pratique
copy Digimind Digimind Services ndash White Paper |62
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Mais ces outils preacutesentent une limite de taille ils ne prennent en compte que les
pages indexeacutees par Google ou Yahoo Conseacutequence si la reacuteponse pertinente agrave
votre requecircte figure au sein dune page non indexeacutee par le moteur geacuteneacuteraliste vous
nobtenez pas de reacutesultats
De plus en ninterrogeant que lindex dun ou 2 moteurs vous manquerez
obligatoirement de nombreuses informations puisque le nombre de reacutesultats
communs entre les moteurs diminue constamment105
Les pages non indexeacutees par les moteurs geacuteneacuteralistes constituent une part du web
invisible106 et sont plus nombreuses que lon ne croit Ainsi si jinterroge le moteur
interne du site de la prestigieuse revue scientifique The Lancet 107 avec la requecircte
Diabetes jobtiens plus de 2800 reacutesultats Si jeffectue cette mecircme requecircte sur
Google en restreignant ma recherche au site The Lancet (via la syntaxe
sitehttpwwwthelancetcom) jobtienshellip1 reacutesultat Sur Yahoo Search guegravere
mieux 9 reacutesultats Pourquoi Parce que les technologies de ces moteurs ne
permettent pas dindexer correctement tous les sites
La constitution de bouquets de moteurs speacutecialiseacutes sur Digimind Finder
- les outils agrave moteurs personnalisables
La solution pour beacuteneacuteficier des reacutesultats de moteurs internes non indexeacutes par des
Google ou Yahoo est dutiliser un outil permettant dexploiter directement les
moteurs des sites qui vous inteacuteressent et ce sans avoir agrave passer par les index de
moteurs geacuteneacuteralistes Cest le cas du Finder108 mis au point par Digimind un
copy Digimind Digimind Services ndash White Paper |63
Le Web 20 pour la veille et recherche dinformation DIGIMIND
meacutetamoteur qui permet de plugger nimporte quel moteur de son choix et de
linterroger ensuite Il est donc alors simple de se constituer des bouquets de
moteurs speacutecialiseacutes dans votre secteur dactiviteacute De plus cet outil indexe en temps
reacuteel les reacutesultats et les documents retourneacutes par les moteurs interrogeacutes Cela
permet daffiner ensuite vos reacutesultats en interrogeant cet index au contenu
speacutecialiseacute via une recherche avanceacutee Avec le Finder cest donc lutilisateur final qui
constitue sa propre seacutelection de moteurs
copy Digimind Digimind Services ndash White Paper |64
Le Web 20 pour la veille et recherche dinformation DIGIMIND
g Lenrichissement de bases de donneacutees faccedilon Web20
Nous avons vu que les bookmarks sociaux permettaient de mutualiser les
ressources et pour certains autour de communauteacutes deacutedieacutees comme les
scientifiques Avant lapparition des applications Web 20 ont eacuteteacute constitueacutees de
nombreuses bases de donneacutees professionnelles Celles-ci jusquici noffraient pas
aux groupes dutilisateurs la possibiliteacute dinteragir de commenter et deacutechanger
Aussi de plus en plus de grandes bases de donneacutees se dotent dinterfaces
collaboratives et ergonomiques pour laisser plus de place agrave la contribution
PubMed
Cest le cas de lune des plus grandes bases du domaine meacutedical PubMed 109 Cette
immense base bibliographique a vu naicirctre deux initiatives110 pour ameacuteliorer son
interface de recherche
- Avec PubMed Interact la recherche integravegre de lAjax et permet de pondeacuterer via
des curseurs les critegraveres de sources dancienneteacute de nombre de reacutesultats de date
de publication de liens avec le mapping du MeSH (le theacutesaurus de la base) de
filtrage via des cateacutegories Vous pouvez ensuite annoter et attribuer une note de
pertinence agrave vos reacutesultats afficher labstract des articles ou leur texte complet
supprimer des reacutesultats ou encore afficher les articles lieacutes On retrouve donc
lessentiel des fonctionnaliteacutes de lactuel PubMed mais avec une convivialiteacute et
ergonomie Web 20 et donc une plus grande accessibiliteacute
-Hubmed est une autre interface alternative qui ajoute des fonctionnaliteacutes agrave PubMed
application de ses propres tags aux reacutesultats de recherche historique des recherches
clusteacuterisation des reacutesultats visualisation sous forme graphique creacuteation simplifieacutee
de fils RSS avec les mots de votre requecircte suggestion de termes connexes
visualisation de vos mots cleacutes dans larborescence Mesh Le tout est deacuteveloppeacute en
Ajax notamment permettant une navigation plus fluide et plus rapide Parmi toutes
ces fonctions la possibiliteacute de tagger les reacutesultats est tregraves novatrice on peut ainsi se
deacutepartir de la taxonomie de la base via sa propre folksonomie
copy Digimind Digimind Services ndash White Paper |65
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les nombreux reacuteglages de filtres sur linterface PubMed Interact
LUSPTO
LUSPTO 111 est la base des brevets ameacutericains (United States Patent and Trademark
Office)
Cette veacuteneacuterable institution a en projet une plateforme de brevets sociale agrave la
maniegravere dun Digg (cf les services dactualiteacutes collaboratives) les internautes
pourront commenter les brevets en ligne et les eacutevaluer via un systegraveme de notation
Les brevets les mieux noteacutes remonteront alors en haut de classement
copy Digimind Digimind Services ndash White Paper |66
Le Web 20 pour la veille et recherche dinformation DIGIMIND
h Conserver et exploiter lhistorique de vos recherches et navigations
Le chercheur dinformation sur le net perd souvent ses nerfs quand il ne retrouve
plus ce quil a deacutejagrave collecteacute quelque semaines auparavant ou lorsquil lui est
impossible de se souvenir quelle requecircte agrave geacuteneacutereacute ce fameux reacutesultat remarquable
cette veacuteritable peacutepitehellip
Google a reacutesolu partiellement ces problegravemes de meacutemoire Mais comme souvent
cela ne va pas sans certains sacrifices
Via son service Historique Web112 (ex Historique de recherche) vous pouvez apregraves
enregistrement gratuit
- meacutemoriser les requecirctes effectueacutees sur le moteur ainsi que les reacutesultats cliqueacutes
- enregistrer votre navigation sur les pages web
Il est alors possible deffectuer des requecirctes sur et agrave linteacuterieur des pages que vous
avez visiteacutees dans le passeacute (sur le texte les images les videacuteos)
Google affiche donc deacutesormais vos requecirctes la date et lheure de la recherche les
reacutesultats cliqueacutes mais aussi les reacutesultats de recherches qui nrsquoont pas geacuteneacutereacute de clics
Par ailleurs ce service va encore plus loin dans la personnalisation et lanalyse de
votre recherche
Avec la fonction Tendances saffichent vos requecirctes les plus courantes vos sites les
plus visiteacutes les reacutesultats que vous avez le plus cliqueacutes
Plus puissante la fonction Eleacutements inteacuteressants ougrave Google vous propose des
requecirctes et des pages web en relation avec vos habitudes de recherche113
En outre si vous activez cet historique Google lutilisera aussi pour agrave moyen
terme personnaliser vos recherches en fonction de vos centres dinteacuterecirct Le
moteur explique
Vos reacutesultats personnaliseacutes seront baseacutes sur vos recherches preacuteceacutedentes ainsi que les
reacutesultats de recherche et les titres agrave la une sur lesquels vous avez cliqueacute
Dans les premiers temps la diffeacuterence ne sera peut-ecirctre pas notable mais agrave mesure
que votre historique de recherches seacutetoffera les reacutesultats obtenus seront de plus en plus
personnaliseacutes
Dailleurs si vous reacutealisez de nombreuses recherches sur Google avec une
connexion agrave votre compte Google activeacutee vous devriez voir safficher de temps agrave
autre ce type de message Nouveau activez votre historique de recherche pour
personnaliser vos reacutesultats
copy Digimind Digimind Services ndash White Paper |67
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ces reacutesultats personnaliseacutes apprenant selon vos inteacuterecircts permettent de reacutepondre
en partie agrave la probleacutematique de deacutesambiguiumlsation lors de requecirctes sur des
homonymes Ce sont les exemples classiques de lavocat (fruit ou juriste ) de
jaguar (voiture ou animal ) ou de puma (articles de sports animal ou heacutelicoptegravere
)
Cocircteacute vie priveacutee tout votre surf part sur les serveurs de Google Aussi vous
pouvez (devez) mettre en pause lenregistrement de votre navigation lorsque cela
vous apparaicirct adeacutequat
Lhistorique de vos requecirctes et de vos reacutesultats sur Google
copy Digimind Digimind Services ndash White Paper |68
Le Web 20 pour la veille et recherche dinformation DIGIMIND
i Les mash-up
Les mash-up sont certainement les nouveauteacutes engendreacutees par les technologies
dites Web 20 les plus spectaculaires Mixage de plusieurs applications provenant
de plusieurs sites (souvent deux) ils permettent de creacuteer un service nouveau et ce
agrave partir de la mise en relation voire du croisement des donneacutees des applications
dorigines En franccedilais Wikipedia parle dapplications composites 114 Ainsi en
mixant la liste des socieacuteteacutes ougrave il fait bon travailler eacutetablie par le magazine Fortune et
une carte des USA issue de Google Maps on obtient une carte qui localise toutes
ces entreprises De mecircme si on meacutelange les donneacutees dun site de meacuteteacuteo agrave une
carte de France le reacutesultat est une carte des tempeacuteratures et des neacutebulositeacutes en
quasi temps reacuteel 115
Concregravetement comment cela fonctionne-t-il Chacune des applications
communique et eacutechange des informations via des API (voir glossaire) Ainsi Yahoo
Maps ou Google Maps ont ouvert leurs interfaces de programmation agrave tous les
deacuteveloppeurs
Les exemples sont tregraves nombreux car les Mashups ont rapidement connu un vif
succegraves aupregraves des deacuteveloppeurs et internautes avertis qui parviennent agrave maicirctriser le
code et les API Les Mashups de cartographie ne sont pas les seules possibiliteacutes mais
ce sont les plus freacutequents tant la geacuteolocalisation est attrayante pour les
professionnels comme pour linternaute novice Nous allons explorer quelques
mashups pour mieux comprendre leur inteacuterecirct
Les mashups cartographiques les plus courants mixent des cartes et des donneacutees
provenant de services sociaux comme Flickr le service de partage de photo de
Yahoo Inc Cest le cas de Tagmaps116 qui affiche en temps reacuteel sur une carte les tags
associeacutes aux photos de lieux mise en ligne sur Flickr Le Mashup Flickrvision 117 fait
encore plus simple il affiche les photos agrave lemplacement de la ville dorigine de
linternaute qui a posteacute limage lagrave aussi en temps reacuteel
Donneacutees statiques et temps reacuteel
Au-delagrave de certains mixages un peu gadget certains Mashups sont vraiment
inteacuteressants pour la surveillance de donneacutees ou la collecte dinformations En effet
on peut trouver deux grands types de visualisation celle de donneacutees statiques (une
liste dadresse dentreprises geacuteolocaliseacutees) et celle dinformations eacutevoluant en
temps reacuteel Cest le cas par exemple du Mashup SpaceCraft Tracking 118 qui permet
copy Digimind Digimind Services ndash White Paper |69
Le Web 20 pour la veille et recherche dinformation DIGIMIND
de visualiser la trajectoire sur le globe terrestre de la navette spatiale ou du
teacutelescope Hubble
Souvent le Mashup exploite des donneacutees de reacutepertoires douvrages de services
publics pour les rendre plus compreacutehensives attrayantes bref plus accessibles 119
- HealthMap rassemble des donneacutees de santeacute publique et des actualiteacutes issues de
plusieurs sources (Google News OMS European Centre for Disease Prevention and
Controlhellip) afin de reacutealiser une carte des maladies infectieuses dans le monde Cette
carte se met agrave jour au fur et agrave mesure de lactualisation des informations
Linteractiviteacute permet de zoomer sur un pays et de seacutelectionner des pathologies en
particulier
-BioDiesel Station Maps affiche sur une carte les stations services ameacutericaines qui
deacutelivrent des biocarburants
-Kartametro superpose le reacuteseau du meacutetro moscovite agrave la carte de la ville On y
visualise aussi les correspondances avec les bus
-Wikimapia mixe les informations relatives agrave des lieux de Wikipedia agrave une carte
Google Maps Reacutesultat la plupart des noms de villes sites ou monuments sont
cliquables et pointent vers les articles de lencyclopeacutedie
Le Mashup HealthMap ici des actualiteacutes sur les maladies infectieuses en Asie geacuteolocaliseacutees
copy Digimind Digimind Services ndash White Paper |70
Le Web 20 pour la veille et recherche dinformation DIGIMIND
-GlobaI Incident Maps affiche sur un planisphegravere les eacuteveacutenements lieacutes au terrorisme
ou les risques agrave partir des informations de sites speacutecialiseacutees mises agrave jour en continu
-Enfin un parfait exemple de visualisation et de surveillance deacuteveacutenements en temps
reacuteel DartMaps indique lemplacement des trains de banlieue de Dublin
Mais certains Mashup en minoriteacute certes nexploitent pas de donneacutees
cartographiques Cest le cas de Delexaorg 120 un outil qui mixe les bookmarks
sociaux de Delicious aux donneacutees statistiques dAlexa Delexa va en effet afficher les
tags de Delicious associeacutes aux statistiques de freacutequentation des 50 000 premiers
sites web US fournis par Alexa (agrave partir des donneacutees transmises par les barres
doutils Alexa installeacutees par les internautes) Un tel outil est inteacuteressant notamment
pour se familiariser avec les tags et Delicious mais surtout pour deacutecouvrir quels
sont les sites dinfluence et populaires dans un secteur On peut eacutegalement observer
la correacutelation ou non entre nombre de tags et donneacutees de freacutequentation Alexa
Cocircteacute moteur de recherche les mashups Molu et Gnosh fournissent des
meacutetamoteurs reacutealiseacutes agrave partir du mixage de dizaines doutils de recherche121
Des ressources
Comment trouver des mashups Comme pour de nombreuses informations sur le
web des annuaires speacutecialiseacutes 122 sont apparus Ils reacutepertorient aussi bien des API agrave
destination des deacuteveloppeurs que des mashups WebMashup auto-proclameacute Open
Directory for Mashups et Web 20 APIs en liste des centaines ProgrammableWeb
lun de sites de reacutefeacuterence dans le domaine en propose plus de 1800 sous la forme
dun reacutepertoire et eacutegalement dune matrice permettant de visualiser clairement le
croisement de deux applications ou plus Mashup Feed liste aussi des mixages
populaires
Des blogs sont eacutegalement centreacutes sur ces pratiques Google Maps Mania123 recense
de nombreux Mashups cartographiques
Ces Mashups sont un beau symbole de ce web nouvelle geacuteneacuteration on ne lit plus
seulement de linformation statique de maniegravere passive Deacutesormais on est agrave la fois
fournisseur et spectateur en temps reacuteel des contributions de communauteacutes Le tout
copy Digimind Digimind Services ndash White Paper |71
Le Web 20 pour la veille et recherche dinformation DIGIMIND
gracircce agrave des interfaces reacutealiseacutees par des deacuteveloppeurs agrave partir de code ouverts de
grandes socieacuteteacutes Le succegraves est notamment provoqueacute par la possibiliteacute de mixage
entre des donneacutees du monde reacuteel et des informations ou fichiers posteacutes sur le net
Les internautes peuvent donc maintenant se rassembler par centres dinteacuterecirct mais
eacutegalement par proximiteacute geacuteographique Je recherche un speacutecialiste de linformation
sur les biocarburants situeacutes agrave moins de 10 km de chez moi
Par ailleurs on peut imaginer agrave terme des applications meacutelangeant les donneacutees de
centaines de fichiers et bases de donneacutees On en est certes aux preacutemisses mais le
mashup Alkemis 124 en est deacutejagrave un bon exemple il affiche sur une carte de New
York des donneacutees provenant dA9 OpenSearch Delicious Flickr Google Maps et
Yahoo Traffic Reacutesultat la possibiliteacute de visualiser en une seule interface un eacutetat du
trafic routier via des cameacuteras de surveillance la meacuteteacuteo les actualiteacutes locales ou les
liens Delicious en rapport avec la villehellip
copy Digimind Digimind Services ndash White Paper |72
Le Web 20 pour la veille et recherche dinformation DIGIMIND
III Diffuser
Avec lapparition des applications collaboratives et des plateformes de blogs la
faciliteacute de publication sur le web sest accrue Tout individu mecircme sans
connaissances techniques peut publier et diffuser son propre contenu sur un blog
un wiki et via des fils RSS
a Les Blogs et le flux RSS
Il suffit de 5 minutes pour sinscrire agrave une plateforme de blogs et commencer agrave
eacutecrire Ces plateformes proposent des services de bases gratuits et des
fonctionnaliteacutes plus avanceacutees neacutecessitant un abonnement Ces services qui
permettent de creacuteer maintenir et heacuteberger votre blog sont nombreux Parmi les
prestataires de qualiteacute on peut citer Blogger (qui appartient agrave Google) TypePad et
Vox (de la socieacuteteacute SixApart) Overblog Viablog Haut et Fort ou BlogSpirit 125 Bien
dautres socieacuteteacutes proposent des services de creacuteation et dheacutebergement126 Des
comparatifs sont disponibles en ligne127
Nous lavons vu le format RSS permet de diffuser tregraves facilement le contenu de son
blog utilisant le XML (un html eacutepureacute) langage natif du blog chaque carnet web
comporte un fils RSS permettant aux visiteurs de sabonner agrave vote blog et de
recevoir instantaneacutement toute nouvelle publication actualiteacutes billets podcast ou
videacuteos Par ailleurs des services comme Feedburner128 permettent de rendre
compatibles vos flux RSS avec la majoriteacute des lecteurs RSS outils dont nous
reparlerons plus loin
La creacuteation de sites internet classiques sest elle aussi consideacuterablement simplifieacutee
un outil tel que Google Page Creator129 permet de creacuteer un site simple en 1 heure
Des sites plus sophistiqueacutes sont eacutegalement abordables sans avoir agrave connaicirctre une
ligne de programmation de html gracircce au perfectionnement des eacutediteurs dits
WYSIWYG ce que vous voyez quand vous construisez votre page est ce que vous
obtiendrez en ligne
Les outils Web 20 permettent agrave des speacutecialistes journalistes ou salarieacutes de diffuser
leur contenu Il y a encore 2 ans ils eacutetaient pour la plupart eacutecarteacutes de la publication
web faute de bagage technique
copy Digimind Digimind Services ndash White Paper |73
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Depuis le deacuteveloppement des blogs agrave partir de lautomne 2001 il est possible pour
tout internaute de diffuser sa propre information Au-delagrave des blogs dadolescents
et autres carnets intimes le web regorge de blogs agrave tendance professionnelle
corporate produits marketing experts politiques ressources humaines Cest
autant de sources potentielles quil faut exploiter afin de capter des sources
primaires de qualiteacute Le volume des blogs publieacutes et maintenus chaque jour est lui
aussi en constante augmentation
Le White Paper Blogs et RSS des outils pour la veille strateacutegique deacuteveloppe les
aspects inteacuteressants des blogs pour le professionnel de linformation130
b Les Wikis
Le wiki est finalement diffeacuterent du blog de par sa nature et son utilisation Selon
Wikipedia le Wiki est un site Web dynamique permettant agrave tout individu den
modifier les pages agrave volonteacute Il permet de communiquer et diffuser des informations
rapidement de structurer cette information pour permettre dy naviguer
commodeacutement (Wiki vient du terme hawaiien wiki wiki =rapide ou informel)
Lagrave ougrave le blog sera adapteacute agrave la diffusion dactualiteacute et de contenu se renouvelant
freacutequemment le wiki sera davantage deacutedieacute agrave du texte plus statique mais neacutecessitant
ou pouvant senrichir de la collaboration de plusieurs personnes Ainsi les articles
dune encyclopeacutedie ou les fiches correspondants aux diffeacuterentes phases dun projet
impliquant de nombreux collaborateurs pourront ecirctre reacutealiseacutees sous forme de
Wiki
Sur un blog laffichage du contenu est anteacute-chronologique (le plus reacutecent en haut)
sur un wiki il est structureacute en rubriques larchitecture comme le contenu pouvant
ecirctre modifieacutes agrave tout moment par les participants Ceux-ci peuvent beacuteneacuteficier de
droits daccegraves et de modification hieacuterarchiseacutes
Les versions anteacuterieures ainsi que les modifications sont accessibles via une rubrique
Historique Sur un blog le visiteur peut collaborer mais uniquement via ses
commentaires Sur un wiki tout collaborateur autoriseacute peut modifier le texte
comme le titre et lorganisation des rubriques
Par ailleurs la prise en main dun wiki et de ses syntaxes denrichissement et
modification demande un peu de pratique et nest pas aussi simple que le
maniement dun blog Le wiki est un des outils ideacuteaux pour la gestion de projet
Certaines entreprises les utilisent en tant que tel (parfois en parallegravele avec les blogs)
pour eacuteviter des eacutechanges des recherches et un archivage via les mails fastidieux
copy Digimind Digimind Services ndash White Paper |74
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Geacutereacute via des droits daccegraves gradueacutes il peut alors se reacuteveacuteler comme un outil tregraves
simple agrave manier et agrave sapproprier Ces wikis seront eacutevidemment reacuteserveacutes agrave
lentreprise en accegraves priveacute
Exemples de wikis publics
gt Wikipedia131
Le wiki le plus connu est Wikipedia lencyclopeacutedie collaborative gratuite dont le
contenu est creacuteeacute et maintenu par des milliers dinternautes beacuteneacutevoles Chacun est
libre de creacuteer un article modifier ceux des autres ou les commenter En mai 2007
lencyclopeacutedie proposait plus de 7 millions darticles dans 192 langues et dialectes
dont plus de 500 000 en franccedilais Wikipedia jouit dune populariteacute et dun succegraves
tregraves important Google indexe de nombreux articles de Wikipedia agrave tel point quil
est rare deffectuer une recherche sur le moteur sans voir safficher une deacutefinition
issue de lencyclopeacutedie Selon la socieacuteteacute de mesure daudience Comscore en janvier
2007 Wikipedia eacutetait le 9egraveme site US le plus visiteacute (derriegravere les sites Yahoo
premiers puis les sites Time Warner Microsoft Google eBay Fox Interactive
Amazon et Ask) 6 groupes eacuteditant un moteur geacuteneacuteraliste (Google Ask Microsoft
Yahoo Amazon et AOL) occupent le top10 US Mais cest la premiegravere fois quun
site collaboratif truste les premiegraveres places des sites les plus visiteacutes
Wikipedia comme tout service leader est tregraves critiqueacute Notamment sur la
possibiliteacute pour tout un chacun de modifier et de creacuteer des articles pouvant
entraicircner des risques de diffamation ou de vandalisation 132 Mecircme si ces risques
sont reacuteels nous le verrons dans la partie consacreacutee aux limites du Web 20 il ne
faut pas pour autant se focaliser sur ces problegravemes
Par ailleurs on a souvent mis en cause la qualiteacute des articles du contenu eacutemanant
dinternautes pas forceacutement qualifieacutes ou experts et donc par nature douteux Or
une eacutetude commandeacutee par la Revue Nature agrave remis en cause ce type de ressenti
des experts ont compareacute 42 documents publieacutes sur Wikipedia et sur la ceacutelegravebre
Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche133
Seulement 8 erreurs seacuterieuses comme des mauvaises interpreacutetations de concepts
ont eacuteteacute repeacutereacutees dans les articles analyseacutes 4 pour chaque encyclopeacutedie Des
erreurs factuelles omissions ou fausses descriptions ont eacutegalement eacuteteacute deacutetecteacutees
162 dans Wikipedia et 123 dans lEncyclopaedia Britannica
Le succegraves et limportance de Wikipedia nont pas eacutechappeacute aux moteurs de
recherche qui sont plusieurs agrave secirctre speacutecialiseacutes dans la recherche sur lencyclopeacutedie
Ainsi WikiSeek 134 est un moteur lanceacute deacutebut 2007 qui recherche sur le contenu de
Wikipedia Il indexe le contenu en crawlant les pages en profondeur et aspire
eacutegalement le contenu des liens preacutesents sur les pages de lencyclopeacutedie
copy Digimind Digimind Services ndash White Paper |75
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Plus eacutelaboreacute le moteur franccedilais Exalead 135 enrichit consideacuterablement la recherche
dans lencyclopeacutedie en ligne Cette fonctionnaliteacute est accessible en cliquant sur
longlet Wikipedia Il est eacutevidemment possible de rechercher des articles par mots
cleacutes mais aussi daffiner par langue via le nuage de tags dynamique ( les eacutetiquettes
correspondent agrave des emplacements geacuteographiques personnes ceacutelegravebres noms
drsquoorganisations termes lieacutes agrave votre requecircte ou cateacutegories de Wikipedia)
WikiMindmap 136 recherche sur Wikipedia et affiche les reacutesultats sous forme de
MindMap (cartes heuristiques) Il est alors possible de naviguer dans larborescence
des termes
WikiMindMap
gt Citizendium 137 Lanceacute fin 2006 Citizendium est une initiative de Larry Sanger co-fondateur de
Wikipedia avec Jimmy Wales Citizendium est eacutegalement une encyclopeacutedie Mais
jugeant la communauteacute Wikipedia senseacutee srsquoauto-reacuteguler dysfonctionnelle Larry
Singer integravegre dans Citizendium des proceacutedures de seacutelection des articles par des
experts et refuse aux contributeurs la possibiliteacute de lrsquoanonymat misant ainsi sur la
responsabilisation Le collegravege dexperts a le dernier mot concernant la veacuterification
des articles le but eacutetant dobtenir une encyclopeacutedie contenant le moins derreurs
possible Citizendium est structureacutee en grandes cateacutegories acadeacutemiques
correspondant agrave des groupes de travail Sciences naturelles Sciences Humaines
Arts Sciences Humaines Divertissement Arts appliqueacutes et Sciences
copy Digimind Digimind Services ndash White Paper |76
Le Web 20 pour la veille et recherche dinformation DIGIMIND
gt Alacrawiki 138
AlacraWiki est un guide deacutedieacute aux socieacuteteacutes du secteur de linformation eacutediteurs et
bases de donneacutees La rubrique Alacra Industry Spotlights est particuliegraverement
remarquable elle fournit des analyses et commentaires sur les sites dinteacuterecirct pour
une trentaine de secteurs industriels Le wiki offre des informations sur les
agreacutegateurs de contenu les bases de donneacutees et les meilleurs blogs deacutedieacutes au
secteur de linformation on-line Alacra propose aussi un blog et un fils RSS
Alacra Wiki
gt Les fils RSS 139
Sur cette page de wiki vous trouverez agrave peu pregraves tout sur le RSS
La norme comment utiliser les fils RSS des articles une seacutelection dagreacutegateurs
mixer des fils RSS entre eux mesurer lactiviteacute des fils RSS creacuteer un fil RSS
gtWikidweb 140
Wikidweb est un Wiki qui propose un reacutepertoire de sites web (et non de wikis)
Aussi vous pouvez y participer selon les fonctionnaliteacutes courantes du format wiki
vous avez ainsi la possibiliteacute dy ajouter vos propres sites mais eacutegalement de
modifier les entreacutees des autres internautes (urls texte) ou de les commenter
copy Digimind Digimind Services ndash White Paper |77
Le Web 20 pour la veille et recherche dinformation DIGIMIND
IV Surveiller
Nous lavons vu dans la partie Recherche de blogs et de flux RSS les flux RSS sont
preacutesents sur de nombreux formats du net et vont permettre de surveiller les
nouveauteacutes apparaissant sur les blogs les sites corporate les sites de presse dans
les reacutesultats de moteurs de recherche dactualiteacutes de blogs web dans les
newsgroups sur certains forums web sur certaines listes de diffusion les
bookmarks sociaux les sites de partage de photos et de videacuteoshellipbref sur de tregraves
nombreux sites classiques et ressources collaboratives de type 20
Ces flux RSS peuvent ecirctre inteacutegreacutes agrave votre process de veille en deux clics via des
outils simples gratuits ou payants mais plus puissants
a La deacutetection du flux RSS
Pour pouvoir mettre en surveillance le flux RSS (RSS Feed en anglais) il faut dabord
le trouver Or il nest pas toujours aiseacute de mettre la main sur ces petits logos
oranges ou les liens RSS Abonnez-vous Syndiquez ce flux qui pointent vers les
flux RSS parfois cacheacutes dans les meacuteandres des pages web
Des icocircnes signalant la preacutesence de flux RSS
Certains navigateurs permettent de deacutetecter automatiquement les flux lorsquils
sont preacutesents sur une page web Une icocircne vous avertira alors et dans la plupart
des cas affichera ladresse du ou des flux disponibles sur la page Plusieurs formats
de flux peuvent coexister les diffeacuterentes versions du RSS (090 091 092 10 20)
et le format ATOM concurrent mais offrant les mecircmes fonctionnaliteacutes
Internet Explorer 7 Opera Firefox permettent de deacutetecter les flux Cest aussi le cas
de Maxthon une puissante interface de navigation qui vient se greffer sur
larchitecture dInternet Explorer 141
copy Digimind Digimind Services ndash White Paper |78
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b La mise en surveillance
Quelque soit laspect de la page qui contient votre flux RSS (xml rdf interface
Feedburner) il convient de copier et coller ladresse (url) dans loutil qui va vous
servir agrave lire ce flux et agrave ecirctre alerteacute degraves lors quune nouveauteacute apparaicirct
4 grands types doutils peuvent ecirctre utiliseacutes (du plus simple au plus sophistiqueacute)
- Les navigateurs web
Les navigateurs citeacutes preacuteceacutedemment outre la deacutetection du flux RSS permettent de
sy abonner et de les lire Les flux sintegravegrent alors dans un menu lateacuteral ou dans la
page principale Cest simple mais deacutepourvu de fonctions avanceacutees de tri ou
dorganisation
- Les lecteurs (ou agreacutegateurs) de flux RSS
Ce sont les outils deacutedieacutes aux fils RSS Comme de nombreuses applications ces
lecteurs sont soit disponibles en ligne soit agrave installer localement sur votre PC
- Exemples de lecteurs RSS en ligne Bloglines Pluck Newsgator
- Exemples de lecteurs RSS installeacutes RSS Reader Amphetadesk Newsgator (sintegravegre
agrave Outlook) FeedDemon
Le lecteur Bloglines exploite de maniegravere astucieuse la logique communautaire
lorsque vous ecirctes abonneacute agrave un flux RSS vous pouvez visualiser les autres abonneacutes
(ceux qui ont accepteacute de rendre leur abonnement public) Un clic sur leur nom
affiche tous les fils RSS auxquels ils ont souscrits un moyen rapide de deacutecouvrir
dautres ressources pertinentes collecteacutees par des internautes proches de vos
centres dinteacuterecirct
Les lecteurs RSS sont tregraves nombreux Pour mieux les distinguer certains blogs ou
sites proposent des comparatifs142
copy Digimind Digimind Services ndash White Paper |79
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La communauteacute sur Bloglines les abonneacutes au flux RSS du blog Voip Weblog
- Les pages personnalisables
Ce sont des pages web geacuteneacuteralement organiseacutees en onglets et boicirctes permettant
dorganiser et de ranger ses flux par cateacutegories et ce dans un mecircme espace Ces
services sont ergonomiques et ideacuteaux pour lire dun coup doeil le maximum de flux
Les plus connus sont NetVibes PageFlakes ou Webwag
Outre la lecture de flux RSS ces pages offrent la possibiliteacute dinteacutegrer des services
de meacuteteacuteo mail bloc-notes et des flux provenant de service sociaux comme les
bookmarks ou les reacuteseaux damis
Certains blogs fournissent des listes et comparatifs de ces services143
- Les progiciels de veille inteacutegreacutes
Face agrave labondance des flux RSS et blogs des applications de veille inteacutegreacutee comme
Digimind Evolution 144 donnent la possibiliteacute de filtrer les RSS via lapplication de
requecirctes diffeacuterentes sur chaque fils RSS
On peut ainsi seacutelectionner les informations agrave remonter via des requecircte simples ou
plus complexes (booleacuteens parenthegraveses troncatures et opeacuterateurs de proximiteacute) agrave
longueur illimiteacutee En outre il est possible de surveiller jusquagrave 10 000 flux RSS
quotidiennement
Les boutons inteacutegreacutes
Certains sites vont vous simplifier la tacircche ils affichent sur leurs pages agrave coteacute de
leurs flux des boutons qui permettent dajouter directement le flux agrave votre lecteur
copy Digimind Digimind Services ndash White Paper |80
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ainsi le service dactualiteacutes Wikio ou le moteur Ask Blogs amp Flux proposent tous
deux des boutons vers Bloglines MyYahoo Google Reader Newsgator et Ask Blog
Les fichiers OPML
LOPML (Outline Processor Markup Language) est un format deacuteveloppeacute en XML qui
permet leacutechange dinformations structureacutees entre applications fonctionnant sur des
OS et environnement diffeacuterents Exemple les abonnements dun internaute agrave un
ensemble de flux RSS entre un navigateur Firefox et Internet Explorer de MacOS agrave
Windows XP
Des agreacutegateurs RSS comme Bloglines NewsGator ou Rojo offrent la possibiliteacute
dexporter lensemble de vos flux RSS favoris ou ceux dautres abonneacutes au format
OPML pour les importer ensuite dans votre agreacutegateur
Share your OPML145 est comme son nom lindique un portail qui vous permet de
partager vos flux RSS au format OPML Ce service liste des centaines de fichiers
OPML
c Pourquoi une veille via le RSS
Faire une veille via les fils RSS preacutesente des inteacuterecircts notables
- Lhyper-segmentation le choix des fils RSS rend possible une seacutelection fine de
linformation Ainsi sur le site du Figaro on peut choisir lactualiteacute internationale
nationale les sciences et meacutedecine eacutevitant ainsi decirctre submergeacute par linformation
superflue Sur La Tribune on peut seacutelectionner un flux par socieacuteteacute
Certains blogs proposent mecircme des flux RSS permettant aux choix de surveiller les
commentaires ou uniquement les billets
- Un gain de temps inutile de se connecter au site au blog ou au moteur de
recherche pour visualiser ses nouveauteacutes
- Lanonymat labonnement agrave un flux RSS contrairement agrave une newsletter ou agrave une
liste de diffusion est anonyme
- La consultation aiseacutee vos fils RSS via une lecture sur un agreacutegateur en ligne sont
accessibles de nimporte quel PC connecteacute agrave linternet ougrave que vous soyez
copy Digimind Digimind Services ndash White Paper |81
Le Web 2
copy Digimin
0 pour la veille et recherche dinformation DIGIMIND
d Digimind Services ndash White Paper
V Carte des outils et ressources Web 20
gt Page suivante
|82
wwwdigimindcom Digimind Services ndash White Paper|83
Carte des outils et ressources Web 20 - DIGIMIND Services 2007
Le Web 20 pour la veille et recherche dinformation DIGIMIND
EXEMPLE DUNE RECHERCHE ET VEILLE VIA LE WEB 20
Cas drsquoeacutecole Nous avons agrave mener une recherche et une veille sur le
deacuteveloppement des smartphones ou teacuteleacutephones multimeacutedias haut de gamme Des
sites de type 20 pourront se reacuteveacuteler compleacutementaires de sites classiques (sites
drsquoentreprises portails associations professionnelleshellip) pour deacutetecter les tendances
et sujets eacutemergents
Une premiegravere recherche via lrsquoencyclopeacutedie Wikipedia permettra drsquoobtenir une
premiegravere deacutefinition du sujet et drsquoidentifier les principaux mots cleacutes ainsi que des
liens vers des sites pertinents
Etape suivante nous pourrons eacutelargir notre recherche en identifiant des sites
similaires aux sites trouveacutes preacuteceacutedemment via les suggestions fournies par des
moteurs collaboratifs tels que Yoono ou Similicious
Une recherche sur le tag Smartphone dans des sites de social bookmarking
comme Delicious nous permettra eacutegalement drsquoidentifier les pages plus ou moins
populaires taggeacutees par les contributeurs du site ainsi que drsquoautres tags en relation
avec notre sujet
Explorons ensuite les avis drsquoexperts plus ou moins autoriseacutes que lrsquoon trouvera dans
les meacuteandres de la blogosphegravere gracircce agrave des moteurs de blogs comme Technorati
Blogpulse ou Google Blog Search
La recherche pourra srsquoeffectuer via les tags ou le texte inteacutegral des billets On
pourra ensuite parcourir les blogrolls des auteurs les plus pertinents afin drsquoidentifier
drsquoautres sources
La lecture des blogs fournira non seulement des avis de speacutecialistes ou journalistes
mais aussi des avis plus ou moins critiques de consommateurs ou utilisateurs de
smartphoneshellip
Il conviendra toutefois de rester vigilant quant agrave lrsquoeffet pot de miel de certains
blogs ougrave les contributions des internautes se reacutevegravelent ecirctre de simples messages
publicitaires deacuteguiseacutes (voir agrave ce sujet la mise en garde du site UFC Que choisir146)
Pour recueillir les derniegraveres informations drsquoactualiteacute on pourra utiliser un
agreacutegateur tel que Wikio ou Digg et creacuteer un flux RSS agrave partir drsquoune requecircte sur les
copy Digimind Digimind Services ndash White Paper |84
Le Web 20 pour la veille et recherche dinformation DIGIMIND
tags preacuteceacutedemment identifieacutes Wikio propose des raccourcis pour inteacutegrer ce flux
au sein de plusieurs lecteurs RSS du marcheacute (Netvibes Newsgator Google Reader
etc)
Les reacuteseaux sociaux professionnels permettront eacutegalement drsquoidentifier des acteurs
importants du domaine dans les sphegraveres universitaires ou de lrsquoentreprise
La communauteacute 20 srsquoexprimera eacutegalement sur les grands portails consacreacutes aux
nouvelles technologies Crsquoest le cas par exemple du portail ZDNet qui permet aux
utilisateurs de commenter les articles ou de les ajouter directement agrave leur profil
Delicioushellip Les commentaires ou les trackbacks pointant sur un article pourront
constituer un preacutecieux compleacutement drsquoinformations
Afin de mener une veille reacuteguliegravere sur le sujet on syndiquera les flux RSS provenant
des diffeacuterents sites ou blogs identifieacutes Pourquoi ne pas eacutegalement creacuteer agrave partir de
ce bouquet de sources personnaliseacutees un moteur sur mesure conccedilu gracircce agrave Rollyo
ou Yahoo Search Builder
copy Digimind Digimind Services ndash White Paper |85
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les limites du Web 20
LA PARTICIPATION
I Une participation heacuteteacuterogegravene
Nous lavons deacutejagrave eacutevoqueacute tout le monde ne participe pas de la mecircme maniegravere sur
les applications du Web 20
Une minoriteacute participativehellip
Bill Tancer de la socieacuteteacute de mesure daudience Hitwise reacutevegravele dans une eacutetude147
que sur les sites type Web 20 les internautes regardent mais participent peu
Seulement 016 des visiteurs du site YouTube viennent y partager leurs videacuteos
Les 9984 restant ne font que regarder Idem pour le site de partage de photos
de Yahoo Flickr seulement 02 des visites conduisent agrave la publication de photos
Wikipedia est lexception sur lencyclopeacutedie collaborative gratuite 46 des
visites correspondent agrave une modification des articles
Sur ces sites on est donc encore loin de la regravegle de la 11089 eacutedicteacutee par Charles
Arthur dans The Guardian148 Il estime que sur le net sur un groupe de 100
personnes si une creacutee du contenu 10 vont interagir (commentaires
ameacuteliorations) et les 89 restant ne feront que le lire et regarder Le journaliste
lillustre via des exemples quantifieacutes avec YouTube Wikipedia ou Yahoo Groups
Most Web 20 Users Are Really Just Couch Potatoes Bruce Nussbaum compare
mecircme les internautes Web 20 aux spectateurs de TV passifs et affaleacutes dans leurs
canapeacutes149
Mais parallegravelement les sites de type Web 20 ont vu leur audience grimper
de668 en 2 ans reacutevegravele leacutetude Hitwise Cela repreacutesente 12 du trafic web aux
USA contre 2 il y a seulement 2 ans
Les sites de partage de photos sont parmi les plus populaires Flickr bien sucircr mais
aussi PhotoBucket qui repreacutesente agrave lui seul 41 du trafic des sites de photos en
ligne
copy Digimind Digimind Services ndash White Paper |86
Le Web 20 pour la veille et recherche dinformation DIGIMIND
hellipdautant plus que la forme de participation se complexifie
Dapregraves le cabinet Forrester les internautes sont nombreux sur les actions agrave faible
niveau dexigence (lire enregistrer un signet commenter) mais beaucoup moins sur
des participations plus actives (eacutecrire collaborer) 150
Wikipedia un faux modegravele collaboratif
On cite souvent lencyclopeacutedie Wikipedia en exemple cest lun des emblegravemes les
plus forts et les plus lus du Web 20 Son mode de fonctionnement est
caracteacuteristique voire symptomatique du web collaboratif Mais le process de
Wikipedia serait finalement tregraves classique avec une hieacuterarchie de contributeurs
sorte de cadres disposant de nombreux droits eacutecrivant la majoriteacute des articles
Cest lanalyse de Lionel Barbe du CNRS151 Il explique que si le principe de liberteacute
de publication sur Wikipedia reste valable il est de moins en moins commun car
la plupart des entreacutees basiques ne precirctant pas agrave discussion ont deacutejagrave eacuteteacute effectueacutees
Lrsquoeacutetude des laquo logs raquo historiques montre que la creacuteation de nouvelles entreacutees qui
correspondent agrave de nouvelles pages articles dans la Wikipedia Francophone ne
concerne qursquoenviron 3 agrave 4 des opeacuterations Par comparaison cette proportion tombe
agrave 2 pour la version anglaise de Wikipedia qui contient plus de 1 million drsquoarticles A
lrsquoinverse la proportion monte entre 8 et 10 pour des Wikipedias ayant moins de
100 000 articles comme la Wikipedia en Lituanien et bien drsquoautres
Selon lui on assiste agrave un effet de professionnalisation de lencyclopeacutedie [hellip] les
plus gros contributeurs que nous consideacutererons comme eacutetant les 5 des individus
eacuteditant le plus drsquoarticles eacuteditent entre 85 et 95 du contenu total de lrsquoencyclopeacutedie
Au fur et agrave mesure ces gros contributeurs acquiegraverent des privilegraveges comme le statut
drsquoadministrateur qui leur permettent non seulement de participer mais aussi de
surveiller et le cas eacutecheacuteant censurer le contenu eacutediteacute par les autres contributeurs et de
participer aux grandes lignes de lrsquoorganisation de Wikipedia
Cette analyse a toutefois eacuteteacute battue en bregraveche par Aaron Swartz dans une petite
eacutetude 152 En mesurant non pas le nombre drsquointerventions de chaque contributeur
mais la quantiteacute de texte produit par chacun la reacutealiteacute est diffeacuterente les
contributeurs occasionnels eacutecriraient des textes longs en peu dinterventions tandis
que les eacutediteurs actifs reacutealiseraient un travail tenant davantage de la maintenance
(correction veacuterification suppression) mais sans apporter beaucoup de texte
copy Digimind Digimind Services ndash White Paper |87
Le Web 20 pour la veille et recherche dinformation DIGIMIND
II Une participation damateurs
Tout internaute peut-il simproviser journaliste expert commentateurhellip
Michel Fingerhut 153 voit dans le succegraves dune encyclopeacutedie comme Wikipedia une
manifestation du web comme heacutegeacutemonie de lrsquoamateurisme et comme encouragement
agrave lrsquoextreacutemisme ideacuteologique et au communautarisme
Les contenus creacuteeacutes et diffuseacutes sont-ils de qualiteacute Le Web 20 devient une
plateforme qui stimule la creacuteativiteacute et la production de contenu par cela mecircme
qursquoelle en permet la diffusion (avec indice de notorieacuteteacute) On assiste agrave une libeacuteration
de talents qui peuvent enfin se reacuteveacuteler parallegravelement agrave des productions
caracteacuteriseacutees par un certain amateurisme et lrsquoabsence de veacuteritable ambition
creacuteatrice Car comme sur lensemble de linternet sur ce Web 20 le pire cocirctoie le
meilleur
Par ailleurs toujours en prenant lexemple de Wikipedia un certain nombre de
pheacutenomegravenes se reacutevegravelent tout de mecircme preacuteoccupants
Si leacutetude reacutealiseacutee pour le magazine Nature reacutevegravele que la qualiteacute des articles de
lencyclopeacutedie est presque au niveau de celle de lEncyclopaedia Britannica certains
articles de Wikipedia relegravevent de la deacutesinformation ou de la propagande
- larticle Droits de lHomme en Iran154 a ainsi eacuteteacute tregraves controverseacute en effet cet
article tregraves long de plus de 20 pages se preacutesente davantage comme une apologie du
reacutegime iranien quune analyse argumenteacutee des droits de lhomme dans ce pays Or
certainement au nom du principe de neutraliteacute qui reacutegit Wikipedia cet article
tendancieux a eacuteteacute classeacute comme article de qualiteacute 155
- le cas Seigenthaler 156 en mai 2005 un contributeur publie anonymement sur
Wikpedia un article sur John Seigenthaler Sr un eacutecrivain ceacutelegravebre aux USA Or ce
billet mentionne que leacutecrivain a eacuteteacute directement impliqueacute dans les assassinats de
John et Bob Kennedy en preacutecisant toutefois que rien na jamais eacuteteacute prouveacute Cette
information est tout simplement fausse Mais larticle nest deacutecouvert (par un ami de
John Seigenthaler) et corrigeacute que 4 mois plus tard mettant agrave mal la creacutedibiliteacute de
lencyclopeacutedie A la suite de cette affaire largement relayeacutee par les meacutedias
ameacutericains le fondateur de Wikipedia a rigidifieacute les regravegles de publication concernant
les tout nouveaux contributeurs
Certes sur les milliers darticles mis en ligne par Wikipedia ces dysfonctionnements
restent heureusement minoritaires mais ils reacutevegravelent tout de mecircme certaines limites
du tout collaboratif et la neacutecessiteacute de regravegles de publication emprunteacutees aux meacutedias
classiques
copy Digimind Digimind Services ndash White Paper |88
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Lagreacutegation de petites choses faciles
Elles ont tendance agrave dominer le contenu du Web 20 La faciliteacute de publication le
rythme des blogs qursquoil convient drsquoalimenter freacutequemment peut entrer en conflit
avec le temps de la recherche et de la reacuteflexion Souvent les thegravemes traiteacutes ne
peuvent degraves lors ecirctre que des sujets du quotidien des opinions non reacutefleacutechies non
argumenteacuteeshellipOn peut donc craindre agrave linstar du mode de diffusion sur dautres
meacutedias quinteacutegreacute agrave un reacuteseau social noteacute eacutevalueacute agrave la recherche de notorieacuteteacute et de
visibiliteacute le creacuteateur de contenu ait tout inteacuterecirct agrave aller dans le sens de son audience
produire du divertissant plus agrave mecircme de lui garantir un succegraves immeacutediat
Par ailleurs des opinions peuvent-elles se transformer en jugement pertinent par
lrsquoeffet de leur agreacutegation Lrsquoagreacutegation drsquoune quantiteacute importante drsquoavis peut elle
vraiment deacutepasser lrsquoimpreacutecision des avis pris indeacutependamment Peut-on sans une
harmonisation des critegraveres drsquoappreacuteciation atteindre un jugement collectif fiable Les
tendances qui ressortent risquent en effet de se limiter souvent au reflet de
lrsquoopinion majoritaire
Mais leacutevocation de ces limites ne doit pas occulter toutes les contributions matures
produites par des internautes soucieux dapporter un contenu veacuteritablement
constructif Les billets et les commentaires de nombres de blogs politiques franccedilais
en 2007 en sont une parfaite illustration
LE WEB 10 RESTE NECESSAIRE
Le mail reacutesiste
Nous lavons vu au cours de la description des applications pour la veille les services
Web 20 ne sont pas suffisants en soit pour la recherche dinformation De plus
bien que ses possibiliteacutes soient tregraves puissantes lutilisation du Web 20 reste encore
marginale agrave leacutechelle de tous les internautes Une eacutetude du cabinet Pew Internet 157
montre que lactiviteacute internet dominante sur une journeacutee type dun ameacutericain reste
tout simplement le mail 53 des internautes lutilisent Ils sont 38 agrave utiliser un
moteur de recherche Par contre ils ne sont que 8 agrave creacuteer des blogs et 26 agrave
partager des photos et videacuteos cette collaboration multimeacutedia eacutetant de loin lactiviteacute
la plus courante du Web 2
copy Digimind Digimind Services ndash White Paper |89
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une enquecircte en ligne de lUniversiteacute dOxford reacutealiseacutee aupregraves de 1469 personnes
(une majoriteacute deacutetudiants) fin 2006 deacutetaille les usages du Web 20 158 Elle reacutevegravele elle
aussi que les applications de ce web nouvelle geacuteneacuteration sont encore peu connues
et peu utiliseacutees La majoriteacute des reacutepondants na jamais employeacute ou jamais entendu
parleacute des fils RSS ou des applications de Social Bookmarking comme Delicious
Aussi linfluence grandissante du Web 20 ne doit pas masquer les usages
traditionnels du web qui restent majoritaires
Une population souvent isoleacutee et non repreacutesentative
Lage
Si de nombreuses applications sociales apportent un reacuteel progregraves il faut tempeacuterer
la nature de certains contenus issus du mode collaboratif celui-ci nest en effet pas
repreacutesentatif des internautes puisque le public du Web 20 est une population plutocirct
jeune
Ainsi leacutetude Pew Internet reacutevegravele que laudience de Wikipedia aux USA eacutetait en aoucirct
2006 agrave 47 situeacutee dans la tranche des 18-34 ans Les plus de 45 repreacutesentaient
28 Sur le site dEncarta lencyclopeacutedie de Microsoft plus traditionnelle (Web 10)
la part des plus de 45 ans atteint 33
Des communauteacutes isoleacutees structureacutees en icircles Les communauteacutes actuelles du Web 20 sont souvent renfermeacutees sur elles-mecircmes
les statistiques sur les liens pointant vers les blogs et sur les liens preacutesents dans les
billets reacutevegravelent que les blogueurs se lient et se lisent beaucoup entre eux
Lrsquointernaute Web 20 aurait donc tendance agrave senfermer sur lui-mecircme et autour
dindividus feacutedeacutereacutes en communauteacutes focaliseacutes sur les mecircmes centres drsquointeacuterecirct que
lui
Par ailleurs lhyper segmentation et le ciblage des nouvelles rendu possible par le
flux RSS notamment peut conduire agrave favoriser ces microcosmes communautaires
Parcourir un journal papier peut favoriser davantage louverture la prise de recul et
la mise en perspective des diffeacuterentes informations que la lecture de flux aux
theacutematiques tregraves speacutecialiseacutees
Les diffeacuterentes communauteacutes par reacuteflexe et de par la nature des applications Web
20 qui se dupliquent mais ne se connectent pas ont tendance agrave peu communiquer
entre elles Ainsi les liens entre reacuteseaux sociaux sont rares Peu de personnes
copy Digimind Digimind Services ndash White Paper |90
Le Web 20 pour la veille et recherche dinformation DIGIMIND
enregistreacutes sur LinkedIn iront eacutegalement sinscrire sur Viadeo ou FaceBook
Latomisation des donneacutees sur des dizaines dapplications reste eacutegalement un vrai
problegraveme
Des domaines mal couverts
Certaines theacutematiques vont ecirctre surrepreacutesenteacutees au deacutetriment dautres au
traitement beaucoup plus confidentiel car boudeacutees par les internautes producteurs
volontaires dinformation Les ingeacutenieurs techniciens et jeunes eacutetant fortement
repreacutesenteacutes parmi les blogueurs les theacutematiques high tech sont tregraves largement
couvertes par les blogs par exemple dans le domaine de la RFID (Identification par
Radio Freacutequence) on compte plus de 100 blogs idem pour la VoIP (Voix sur IP) A
linverse si vous travaillez dans le secteur des machines outils ou de la plasturgie il
vous sera difficile de trouver du contenu sur la blogosphegravere
Tous les secteurs ne sont donc pas eacutegaux en volume sur le net et davantage encore
sur la blogosphegravere et sur les autres applications collaboratives ougrave tout internaute
peut publier son propre contenu et ougrave certaines tranches dacircges et cateacutegories
professionnelles ne sont pas bien repreacutesenteacutees
copy Digimind Digimind Services ndash White Paper |91
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Conclusion
Le Web 20 ce mot qui geacutenegravere eacutenormeacutement de buzz deacutecrits et de blogs
speacutecialiseacutes nest-il quun terme marketing un courant de mode 159 Il est probable
que bientocirct on ne lemploiera plus pour deacutesigner ces nouvelles applications qui
seront devenues la norme Toutefois ce terme sorte de parapluie conceptuel qui
recouvre les diffeacuterentes tendances du web nouvelle geacuteneacuteration a le meacuterite de
mettre un nom simple sur un courant du net novateur
Le Web 20 nest pas une reacutevolution ou une rupture technologique mais plus
certainement une eacutevolution qui permet de replacer lutilisateur au centre des
reacuteseaux Cela nest certes pas tregraves nouveau Usenet lun des plus anciens
protocoles de linternet bien anteacuterieur au WWWeb offrait du contenu en ligne
creacuteeacute par linternaute via les Newsgroups degraves les anneacutees 1980
Mais les progregraves technologiques ont permis dintensifier cette tendance et de
deacutemocratiser laccegraves agrave la creacuteation de contenu en ligne et agrave sa diffusion au plus grand
nombre Potentiellement tout internaute peut maintenant diffuser ses publications
tant les outils sont devenus simples
Le Web 20 tend agrave sinseacuterer au cœur du quotidien de chacun en lui apportant des
services novateurs reacuteellement utiles et qui rendent possible lrsquoapparition de
nouveaux usages Ainsi les mash-up qui srsquoappuient sur la geacuteolocalisation ouvrent
des possibiliteacutes inenvisageables jusquici On peut mecircme imaginer agrave terme une
superposition de ces cartes dynamiques agrave la vision reacuteelle dun pieacuteton ou dun
automobiliste Le Web 20 est en perpeacutetuelle eacutevolution ses capaciteacutes drsquoinnovation
sont tregraves fortes car elles reposent souvent sur des recombinaisons audacieuses de
lrsquoexistant hybridant applications et services dans un systegraveme de deacuteveloppement
open source hellipLrsquoinnovation est aussi innovation de postures (prendre la parole
consommer du contenu amateurhellip) qui parfois challengent lrsquoordre eacutetabli et
redistribuent les pouvoirs La position des acteurs du Web 10 ou des meacutedias
classiques pourrait se trouver de plus en plus remise en question lagrave ougrave les
internautes tendent agrave se placer en experts
copy Digimind Digimind Services ndash White Paper |92
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La place de lhumain
Si celle-ci est devenue preacutepondeacuterante il est toutefois difficile de saffranchir
dorganisations un tant soit peu hieacuterarchiseacutees lautoreacutegulation voir Wikipedia ayant
ses limites
En outre la question de la consommation de contenu et de sa qualification sur
lrsquointernet devient cruciale La pertinence des votes de tous les internautes est
discutable ou du moins le fait qursquoils puissent agrave eux seuls qualifier et eacutevaluer la
qualiteacute Par ailleurs que repreacutesente exactement un vote une adheacutesion au contenu
agrave la forme aux ideacutees aux eacutecrits dun ami agrave une ideacutee avec laquelle je suis en
deacutesaccord mais qui agrave le meacuterite dexister
Finalement il faut continuer agrave normer organiser coordonner
reacutegulerhellipnotamment pour eacuteviter les diffamations ou la deacutesinformation Pour ce qui
est du contenu et de sa qualiteacute les critiques eacutemises agrave lrsquoencontre de Wikipeacutedia nous
incitent agrave eacutetudier de plus pregraves les initiatives qui hybrident les interventions
drsquoamateurs avec les compeacutetences de professionnels
Nous sommes passeacutes en 10 ans dun contenu geacuteneacutereacute par quelques internautes pour
la masse agrave un contenu de masse agrave destination de la masse (Evertybody to
Everybody) Cela ne peut guegravere se deacutevelopper sans des meacutecanismes qui replacent
les internautes les plus speacutecialiseacutes dans des processus de validation dune
information devenue pleacutethorique
Les donneacutees personnelles
Simpliciteacute reacuteactiviteacute personnalisation souplesse mutualisationhellipfont partie des
avantages les plus appreacuteciables du web 20 Mais cette liberteacute de publication et de
diffusion nrsquoest elle pas parfois illusoire Les utilisateurs doivent rester vigilants face
aux problegravemes de confidentialiteacute seacutecuriteacute et traccedilabiliteacute de lrsquoinformation160 Des voix
srsquoeacutelegravevent pour deacutenoncer les risques lieacutes agrave la maicirctrise des donneacutees personnelles ou
au respect des droits drsquoauteurs A noter que les licences Creative Commons161
permettent de mieux deacutefinir les contours de cette liberteacute agrave partir de contrats
flexibles de droit dauteur Ce systegraveme Creative Commons donne la possibiliteacute
gratuitement et simplement aux titulaires de droits de choisir et drsquoexprimer les
conditions drsquoutilisation de leurs œuvres agrave travers onze possibiliteacutes Quant aux
utilisateurs ils nrsquoont pas agrave neacutegocier systeacutematiquement une autorisation avant toute
utilisation ou reacuteutilisation
copy Digimind Digimind Services ndash White Paper |93
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Un autre problegraveme reacuteside aussi dans lrsquoeacuteparpillement des donneacutees dans des sites
diffeacuterents ou parfois redondants Il srsquoagira donc de deacutefinir les objets (livre
personne CD photoshellip) agrave partir drsquoun identifiant Cette bataille pour savoir qui
geacuterera ces donneacutees de base telles que la position geacuteographique les espaces de noms et
le code unique de chaque produit a deacutejagrave commenceacute estime Tim OReilly 162
Les perspectives deacutevolution vers un Web 3
Le web actuel est destructureacute et la classification et lrsquoorganisation de son contenu
posent problegraveme La recherche de nouveaux modes de recherche et de
structuration est une sorte de quecircte du graal que de nombreux experts et
entreprises poursuivent
La folksonomie repose sur une ideacutee originale qui sous tend toute lrsquoideacuteologie Web
20 celle de lrsquointelligence collective et de la deacutecentralisation Mais les limites de la
folksonomie appeleacutee aussi web seacutemantique du pauvre remettent en question
lrsquoaffirmation selon laquelle lrsquointelligence collective et la libeacuteralisation totale du
fonctionnement du web 20 sont une solution viable
Aussi la neacutecessiteacute drsquoun Web seacutemantique 163 fiable se fait de plus en plus urgente
Cette nouvelle phase de deacuteveloppement du Web permettrait drsquoameacuteliorer
lrsquoexploitation des informations par les utilisateurs en obtenant une information
organiseacutee normaliseacutee de faccedilon agrave rendre le web compreacutehensible aux machines pour
faciliter lrsquoexploitation par les utilisateurs
Dans un article paru dans le New York Times en novembre 2006 John Markoff
imagine un web 30 selon le principe drsquoajout dune couche de sens tout en haut du
web existant pour en faire un guide au lieu drsquoun simple catalogue Pour lrsquoauteur
nous sommes en train de passer dun web de documents connecteacutes agrave un web de
donneacutees connecteacutees
Le web seacutemantique offrira un langage commun permettant aux donneacutees de
renvoyer agrave des objets du monde reacuteel dune faccedilon identique Le projet Freebase
lanceacute par la start up Metaweb illustre cette approche il a pour objectif de faciliter
la recherche et le partage drsquoinformations agrave travers une base de connaissances
communes structureacutees via des meacutetadonneacutees permettant de deacutecrire chaque
eacuteleacutement drsquoinformation Ces eacuteleacutements seraient relieacutes entre eux par un systegraveme de
relations Tim OrsquoReilly deacutefinit le projet comme la machine agrave creacuteer les synapses du
cerveau global
Il srsquoagirait de creacuteer en quelque sorte un Google du web seacutemantique un reacutepertoire global
drsquoinformations structureacutees intelligibles et exploitables autant par des machines que par
copy Digimind Digimind Services ndash White Paper |94
Le Web 20 pour la veille et recherche dinformation DIGIMIND
des humains -et donc capables drsquoextraire et drsquointerpreacuteter les relations entre des donneacutees
pour par exemple reacutepondre agrave des requecirctes par des solutions plutocirct que des listes de
document 164
La veille
Dans cet univers le chercheur dinformations et le veilleur doiventhellipgarder la tecircte
froide la forte meacutediatisation du Web 20 ne doit pas masquer la pertinence doutils
plus traditionnels Les diffeacuterentes applications Web 20 nous lavons vu suffisent
rarement pour mener agrave bien une collecte dinformation Certes les bookmarks
sociaux apportent un contenu seacutelectionneacute par linternaute mais on ne peut se
deacutepartir des moteurs de recherche web classiques La surveillance des flux RSS
permet decirctre alerteacute sur de nombreux sujets mais la majoriteacute des sites web restent
encore deacutepourvus de ces fils Les tags apportent une veacuteritable souplesse agrave
lutilisateur mais la taxonomie des bibliothegraveques ou des reacutepertoires web- pour ne
citer que ces lieux- reste essentielle pour se repeacuterer agrave travers des milliers de
ressources
Le Web 20 pour la recherche et la veille nen est quagrave ses balbutiements Aussi
avant quil ne digegravere complegravetement par enrichissement les ressources et les
applications Web 10 il convient de faire coexister ces 2 web dans les pratiques
Le Web 20 apporte une richesse essentielle lrsquoexpression drsquoindividus porteurs
drsquoideacutees et de faculteacutes susceptibles drsquoapporter des changements de re-questionner
lrsquoordre eacutetabli eacuteleacutements indispensables agrave lrsquoeacutevolution de la culture agrave condition de ne
pas oublier que des volonteacutes ambitieuses doivent intervenir pour canaliser les
initiatives sans les eacutetouffer et leur insuffler une veacuteritable ambition Voilagrave tout
lenjeuhellip
copy Digimind Digimind Services ndash White Paper |95
Le Web 20 pour la veille et recherche dinformation DIGIMIND
A propos des auteurs DIGIMIND SERVICES
Digimind Services accompagne les plus grandes entreprises pour la conception la
mise en œuvre et le deacuteploiement de projets de veille qui reposent sur la solution
Digimind Evolution apportant agrave ses clients un retour sur investissement de plus de
600 et ce degraves la premiegravere anneacutee Les meacutethodologies proprieacutetaires du
deacutepartement conseil ainsi que son expertise des probleacutematiques et sources
drsquoinformations sur plus de 20 secteurs drsquoactiviteacute deacuteveloppeacutee aupregraves de ses clients
depuis de nombreuses anneacutees permet aux entreprises drsquoanticiper les changements
de leur environnement pour prendre les meilleures deacutecisions sur leur marcheacute
Le conseil Digimind porte sur tous les aspects du workflow de veille ciblage
strateacutegique collecte des informations traitement et analyse exploitation et
diffusion gestion de projet conseil organisationnel et gestion du changement
formations et support fonctionnel et technique
CHRISTOPHE ASSELIN
Issu drsquoun cabinet drsquoeacutetudes de marcheacute B2B et speacutecialiseacute depuis 1997 dans la mise en
place de systegravemes de veille (e-Franceorg Ecole Militaire) Christophe Asselin allie
une connaissance approfondie des secteurs eacuteconomiques et une parfaite maicirctrise
des outils de recherche sur internet et des solutions avanceacutees de veille Expert
reconnu il eacutedite le site httpwwwintelligence-centercom et le blog
httpinfluxjouebcom tout deux consacreacutes agrave la recherche dinformation
Speacutecialiste de la veille internet chez Digimind il accompagne les clients dans la mise
en place de leur dispositif de veille (expression des besoins deacutefinition de plans de
veille sourcing architecture parameacutetrage formation accompagnement) Il
intervient ainsi aupregraves de socieacuteteacutes dans diffeacuterents secteurs les teacuteleacutecoms avec
France Telecom RampD lrsquoindustrie pharmaceutique avec Sanofi Aventis Roche
Pharma Expanscience ainsi quAlstom Transport Veolia Environnement et des
reacutefeacuterences confidentielles dans le secteur des biotechnologies de leacutenergie des
teacuteleacutecoms de limprimerie de la deacutefense du conseilhellip
copy Digimind Digimind Services ndash White Paper |96
Le Web 20 pour la veille et recherche dinformation DIGIMIND
[Merci au Service Marketing agrave Malaiac wwwmalaiacnet et agrave Elsa Bonier eacutetudiante
en Master 2 Management des innovations en communication agrave Paris XIII pour leur
fructueuse collaboration]
VERONIQUE MESGUICH
Apregraves avoir fondeacute et co-dirigeacute pendant six ans un cabinet speacutecialiseacute en veille
technologique Veacuteronique Mesguich dirige lrsquoInfothegraveque du Pocircle Universitaire
Leacuteonard de Vinci Elle enseigne eacutegalement la maicirctrise de linformation strateacutegique
dans plusieurs eacutetablissements denseignement supeacuterieur et anime reacuteguliegraverement
des sessions de formation continue autour de la meacutethodologie de recherche
avanceacutee et de veille sur Internet
Veacuteronique Mesguich est lrsquoauteur avec Armelle Thomas de lrsquoouvrage Net
recherche le guide pour trouver lrsquoinformation utile dont la deuxiegraveme eacutedition est
parue en mars 2007 aux eacuteditions de lrsquoADBS
copy Digimind Digimind Services ndash White Paper |97
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Webographie Bibliographie
Sources dinformation sur le Web 20
Sites web wikis et blogs
Reacutepertoires et classement de services et socieacuteteacutes Web 20 - 20 Websites http20websitescom - Web 20 Magazine Top 100 Web 20 Sites httpweb2magazineblogspotcom200701thanks-for-web-2html - Web 20 Magazine The Best Web 20 Software of 2006 httpweb2socialcomputingmagazinecomthe_best_web_20_software_of_2006htm - Complete List of Web 20 Products and Services httpwwwlistiblecomlistcomplete-list-of-web-2-0-products-and-services - The Complete Web 20 Directory httpwwwgo2web20net - FredCavazzanet le meilleur du Web 20 httpwwwfredcavazzanetindexphp20051212986-le-meilleur-du-web-20 - Web 20 Directory 1200+ Web 20 Sites in 50+ categories httpweb2econsultantcomindexhtml
- Top 25 Web 20 Search Engines httpoedborglibraryfeaturestop-25-web20-search-engines
- 25 start-ups Web 20 prometteuses httpmoneycnncom20070221magazinesbusiness2nextnet_introbiz2
copy Digimind Digimind Services ndash White Paper |98
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Blogs et sites speacutecialiseacutes - Le groupe de travail Web20 francophone httpwwwweb20workgroupfr
- Web 20 Work Group httpweb20workgroupcom - Dessine-moi le Web 20 httpwwwdeuxzerocom - FredCavazzanet httpwwwfredcavazzanet
- TechCrunch en franccedilais httpfrtechcrunchcom - TechCrunch httpwwwtechcrunchcom
- Le web 20 cest pas du buzz httpweb2rulesblogspotcom
- Mashable France httpfrmashablecom - Mashable httpmashablecom - AccessoWeb httpblogaccessowebinfo - Web 20 Magazine httpweb2magazineblogspotcom - Reacutevolution Web 20 en Live httpwwwwebdeuxinfo
- ReadWriteWeb httpwwwreadwritewebcom - Web 20 Innovations httpweb2innovationscom - Web 20 Summit httpwwwweb2concom
- Original Signal (agreacutegateur de flux RSS) httpwwworiginalsignalfr - Whats Web 20 (agreacutegateur de flux RSS) httpwwwwhatsweb20comaggregatorfrom=100
- Le blog de Bloxx Communiquons avec le Web 20 httpblogbloxxfr
copy Digimind Digimind Services ndash White Paper |99
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- FrenchWeborg Le blog des professionnels franccedilais du Web 20 httpwwwfrenchweborg
- Blog Web 20 et Marketing httpwwwvincentabrycom - Le Web 20 en Action httpleweb2blogspotcom - aYsoon 20 httpblogaysooncom Emmanuel de Taillac httpemmanueldetaillacfr - NiouMedia httpnioumediacom - 2803 httpwww2803com - Web 2 francophone (Wiki) httpweb2frcomAccueil
Blogs et sites avec un axe Web 20
- Publishing 20 httppublishing2com - Social-Computing httpwwwsocial-computingcom - Ecosphere httpecospherewordpresscom - inFLUX httpinfluxjouebcom - Benoit Descary httpdescarycom - Jean Michel Billaut httpbillauttypepadcomjm - Blog francophone des TIC httpwww2607fr 20Minutes Top 50 tech et meacutedias httpwww20minutesfrarticle15087620070410-Blogs-Top-50-tech-et-mediaphp - Intruderstv httpnewintruderstvintruders_fr
copy Digimind Digimind Services ndash White Paper |100
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- Jeff Clavier Sans Accent httpsansaccentsofttechvccom - Demain tous journalistes httpbenoit-raphaelblogspotcom
- Collectif louvre-boicircte Initiatives sur le partage dinformation httplouvre-boiteviablogacom
- Zero seconde httpzerosecondeblogspotcom
Articles
Introduction au Web 20
- Web 20 lrsquoarticle de OrsquoReilly reacutesumeacute pour les faineacuteantshellip httpwwwexpressionsbe20051101web-20-resume-pour-les-faineants
- Dossiers Web 20 - Journal Du net httpwwwjournaldunetcomdossiersweb20
- Avis des managers le Web 20 agrave la loupe httpwwwjournaldunetcomsolutions0603diaporamaavis-managers-web21shtml
- Les entreprises face aux deacutefis du Web 20 httpwwwjournaldunetcomsolutions0704070413-entreprises-web-201shtml
-The Machine is Using Us Transcription (videacuteo) httpmediatedculturesnetksudiggp=78
- The New Wisdom of the Web httpwwwmsnbcmsncomid12015774sitenewsweek
- Quest-ce que Web 20 httpwww01netcomarticle294819html
- Approaching a definition of Web 20 httpsocialsoftwareweblogsinccom20050929approaching-a-definition-of-web-2-0
- Fonctionnement de lrsquoentreprise classique vs entreprise 20 httpalbancornilletfreefrakwindexphp20061002fonctionnement-de-lentreprise-classique-vs-entreprise-20
- Meacutedias traditionnels et acteurs du Web 20 vers la cohabitation ou la convergence des acteurs de lrsquoinformation et du divertissement httpwwwscribdcomdoc50818These-sur-le-Web-2-Cabanis
copy Digimind Digimind Services ndash White Paper |101
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ajax
- LAjax en 5 questions httpwwwjournaldunetcomsolutions0602060208_qr-ajaxshtml - Ajax et Moteurs 20 httpwwwmoteurzinecomarchives2006moteurzine127html2
Les Mashups
- Les Mashups applications Web composites tregraves Web 20 httpwwwjournaldunetcomsolutions0606060628-qr-mashup-hybrideshtml
- Le modegravele eacuteconomique des Mashups httpwwwinternetactunetp=6285 Bookmarks sociaux Social search
- Le Social Bookmarking au secours de la pertinence de la recherche drsquoinformation httpwwwgillesbalmissecomv2spipphparticle171 - Whats the Big Deal With Social Search httpsearchenginewatchcomshowPagehtmlpage=3623153
- Whos Who in Social Search httpsearchenginewatchcomshowPagehtmlpage=3623173
Ouvrages
- Web 20 - Les internautes au pouvoir - Jean-Franccedilois Gervais httpwwwdunodcompagesouvragesficheouvrageaspid=50701
- Les reacuteseaux sociaux Pivot de lrsquointernet 20 - Alain Lefebvre httpwwwcluster21comfrbookreviewlivre_les_reseaux_sociaux - Web 20 (R)eacutevolutions et nouveaux services dInternet - Jean-Noeumll Anderruthy httpwwwamazonfrWeb-2-0-C3A9volutions-nouveaux-dInternetdp2746034972ref=sr_1_18402-7140143-8118507ie=UTF8amps=booksampqid=1178118687ampsr=8-18 - Web 20 The Future of the Internet and Technology Economy and How Entrepreneurs Investors Executives amp Consumers Can Take Ad httpwwwamazoncomWeb-2-0-Technology-Entrepreneurs-Execenablersdp1587622009ref=sr_1_6103-0331542-4028646ie=UTF8amps=booksampqid=1178118732ampsr=1-6
- La Longue Traicircne La nouvelle eacuteconomie est lagrave - Chris Anderson httpwwwamazonfrLongue-TraC3AEne-nouvelle-C3A9conomie-
copy Digimind Digimind Services ndash White Paper |102
Le Web 20 pour la veille et recherche dinformation DIGIMIND
estdp2744062693ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180542516ampsr=1-1 - The Geospatial Web How Geobrowsers Social Software and the Web 20 are Shaping the Network Society httpwwwamazoncomGeospatial-Web-Geobrowsers-Information-Processingdp1846288266ref=sr_1_28103-0331542-4028646ie=UTF8amps=booksampqid=1178118760ampsr=1-28 - Les Wikis espaces de lintelligence collective - Jeacuterocircme Delacroix httpwwwamazonfrWikis-JC3A9rC3B4me-Delacroixdp2952051445ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180544723ampsr=8-1 - Pro Web 20 Mashups Remixing Data and Web Services httpwwwamazonfrPro-Web-2-0-Mashups-Remixingdp159059858Xref=sr_1_4403-1740173-8750801ie=UTF8amps=english-booksampqid=1180542751ampsr=8-4 - Web 20 et Web avanceacute - Alexandre Boni Nicolas Stemart httpwwwamazonfrWeb-2-0-avancC3A9-Alexandre-Bonidp2742967281
copy Digimind Digimind Services ndash White Paper |103
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Dans la mecircme collection
White Paper Blogs et RSS des outils pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind
White Paper
Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind
White Paper
Cateacutegorisation automatique de textes
White Paper
Benchmark des solutions de veille strateacutegique
White Paper
Evaluer le Retour sur Investissement dun logiciel de veille Edouard Fillias Consultant Veille Strateacutegique Digimind
gt A teacuteleacutecharger sur httpwwwdigimindfrserviceswhite_paperhtm
copy Digimind Digimind Services ndash White Paper |104
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Notes 1 httpwwwguimfrblog200612le_film_autumn_html httpwwwlemondefrwebarticle01-02-65186536-8751060html 2 httpvideogooglefrvideoplaydocid=724218352255575783 3 Map of online communities par Randall Munroe httpwwwxkcdcomc256html 4 httpwwwdeuxzerocom 5 httpwwwpaulgrahamcombiohtml httpfrwikipediaorgwikiPaul_Graham 6 Qursquoest ce que le web 20 Hubert Guillaud Internet Actu 29 mai 2005 httpwwwinternetactunetp=6144 7 httpwwworeillynetcompubaoreillytimnews20050930what-is-web-20html httpweb2rulesblogspotcom200601what-is-web-20-par-tim-oreilly-versionhtml 8 httpwwwzdnetfractualitesinternet0390207743933447900htm 9 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 10 httpwwwinternetactunetp=7035 11 httpwwwhitwisecomdatacenter 12 httprosstypepadcomblog200604power_law_of_pahtml 13 httpblogsforrestercomcharleneli200704forresters_new_html 14 httpwwwtagcrowdcom 15 You Say You Want a Web Revolution httpwwwwiredcomsciencediscoveriesnews20050868403 16 httpsaddonsmozillaorgfrfirefoxaddon748 httpwwwjournaldunetcomdeveloppeurtutorielout050525-greasemonkey-presentationshtml 17 Mashups Google Maps httpwwwmibazaarcomextrasfortune100html httpwwwweatherbonkcomweatherindexjsp httpgmapstommanganusspacecraft_trackinghtml 18 httpwwwgooglecomcalendar 19 httpdocsgooglecom 20 httpwwwmoovementfr 21 httpwwwcooptincomfrWEBhomeaspx httpwwwjobmeeterscomfraccueilindexphp 22 httpwwwzliocom httpshoppingyahoocomshoposphere
copy Digimind Digimind Services ndash White Paper |105
Le Web 20 pour la veille et recherche dinformation DIGIMIND
23 httpwwwciaofr httpwwwwantunocom 24 httpmapsgooglefr httpwwwgeoportailfr httpearthgooglefr httpmapsyahoocom httpwwwflickrcom httpwwwzdnetfractualitesinternet0390207743936635400htm 25 httpwwwcriteocom 26 From Youtube to Youniversities Henry Jenkins 16 feacutevrier 2007 httpwwwhenryjenkinsorg200702from_youtube_to_youniversityhtml 27 httpaffordancetypepadcom 28 httpwwwplosoneorghomeaction 29 Web collaboratif web coopeacuteratif web 20 quelles interrogations pour lrsquoenseignant documentaliste Marie France Blanquet 12 janvier 2007 httpeprofsdocscrdp-aix-marseillefrIMGrtfintervention-MF-Blanquetrtf 30 httpveillepedagogiquebloglemondefr 31 httpbibliobsessionfreefrdotclear 32 httpliblogsalbanyedulibrary20200611a_librarians_20_manifestohtml 33 httpdelicious 34 httpwwwconnoteaorg httpwwwciteulikeorg httpwwwsnipitroncom 35 httpdelicious httpwwwblinklistcom httpblogmarksnet httpwwwfurlnet httpfrbetabookmarksyahoocom httpmyweb2searchyahoocom 36 httpwwwstumbleuponcom httpsimilicious httpwwwyoonocomindexjsp 37 Social bookmarks charts version 35 httpwwwiroxdefile_download3 httpwwwroxomaticde856 Social Bookmarking Services And Tools The Wisdom Of Crowds That Organizes The Web httpwwwmasternewmediaorgnews20061201social_bookmarking_services_and_toolshtm Free Bookmark Managers
copy Digimind Digimind Services ndash White Paper |106
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwfeedbuscombookmarks 38 httpwwwflickrcom 39 httpwwwflickrcomgroupstehipool 40 httpwwwflickrcomphotostagsnorthamericaninternationalautoshow 41 httpphotobucketcom 42 httpwwwsquidoocom 43 httpwwwsquidoocomnanotechRev 44 httpwwwsquidoocomtagsmarketing 45 httpwwwyoutubecom 46 httpwwwdailymotioncom 47 Une seacutelection de moteurs de recherche videacuteo et de services de partage et teacuteleacutechargement de videacuteos httpcasselinfreefrfrenchvideoshtm 48 httpwwwemarketercomArticleaspxid=1004918 49 httpwwwviadeocom 50 httpwwwlinkedincom 51 httpwww6nergiesnet httpwwwxingcom 52 httpwwwfacebookcom 53 httpenwikipediaorgwikiList_of_social_networking_sites 54 httpwwwlinknrankcombusinessphp 55 httpdiggcom 56 httpwwwnuouzcom httpwwwblogmemescom httpwwwscoopeocom httpwwwfuzzfr httpwwwtapemoicom httpmeneamenet httpwwwrojocom httpwwwbetanetscapecom 57 httpwwwwikiofr 58 httpwwwagoravoxfr 59 Carlo Revelli Joeumll de Rosnay httpfrwikipediaorgwikiCarlo_Revelli httpfrwikipediaorgwikiJoC3ABl_de_Rosnay 60 Agoravox politique eacuteditoriale httpwwwagoravoxfrarticlephp3id_article=60 61 httpwwwreadspeakercom 62 httpenglishohmynewscom
copy Digimind Digimind Services ndash White Paper |107
Le Web 20 pour la veille et recherche dinformation DIGIMIND
63 State of the Blogosphere- avril 2007 httpwwwsifrycomalertsarchives000493html 64 Les blogs dans le monde Estimation agrave partir des chiffres produits par Digimind Blog Herald Technorati PewInternet Meacutediameacutetrie Loiumlc le Meur Live Journal Skyblogs Overblogs Terra MSN Spaces Splinder Excite Bloggersit Timblog W3B Skynet Bloghr Overskriftdk Smartlog onetpl Tenbit mylogpl eblogpl Blogpl Blogipl blogcentralis Romandiefr Blogspot timsoftro Globocom Financial Express Prixadi blog Baidu Yahoo Blogs South Korea Planet Weblog Service Cyworld LAtelier et ZDNet Australia 65 httpwwwnaturecomwebfeedsindexhtml httpwwwsciencemagorgrss 66 httpsearchlivecom 67 httpsearchyahoocom 68 httpnewsgooglefr httpfrnewsyahooco httpfrnewsbotmsncom httpwwwtopixnet httpwwwwikiofr 69 httpgroupsgooglefrgrouprectraveleuropefeedshl=fr 70 httpwwwforummobilescomindexphpshowforum=200 71 httpfrgroupsyahoocom 72 httpfrmyweb2searchyahoocom httpblogmarksnet httpdelicious 73 httpwwwflickrcom httpphotobucketcom 74 httpwwwyoutubecom httpwwwdailymotioncomfr 75 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 76 httpblogsearchgooglefr httpfraskcomsubjectbls|pg1 httpwwwfeedstercom httpwwwblogpulsecom httpwwwtechnoraticom httpwwwspherecom 77 httpwwwsifrycomalertsarchives000493html 78 httpfrsearchyahoocomwebadvancedei=UTF-8ampybs=0 httpwwwexaleadfrsearchresultsq=sarkozyamp24mode=allweb 79 httpwwwblogaramacom httpwwwrss-networkcom
copy Digimind Digimind Services ndash White Paper |108
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwrssfeedscom 80 httpwww43thingscom http36trucscom 81 httptrainquecomcodedelicious_lookupphp 82 httptechnoraticomtag 83 httpwwwsearchlescom 84 httptagcentralnet httpwwwkeotagcom httpwwwthagoocom httpwwwzewolnet httpwwwgnoshorg 85 httpwwwzibbcom 86 httpwwwecransfr 87 Google Tag Cloud Maker httpuserscriptsorgscriptsshow6171 88 httpnewzingocom 89 Folksonomies les usagers indexent le web Olivier le Deuff Bulletin des Bibliothegraveques de France ndeg4 2006 90 Folksonomy les tags en deacutelire Cyril Fieacutevet Internetactu 13 octobre 2005 httpwwwinternetactunetp=6166 91 httpwwwzoominfocom 92 httpwwwzikicom 93 httpwwwyonamecom httpwwwstalkeraticom httpwinkcom 94 httpfranswersyahoocom httpanswersyahoocom httpaskyahoocom 95 httpanswersgooglecomanswers 96 httpiqlycosfr httpqnalivecombetaaspx 97 httpwwwexpertscomdirectoryasp 98 httpsearchwikiacomwikiSearch_Wikia 99 httpdeciphocom 100 httpwwwyoonocom 101 httpwwwfooxxcom
copy Digimind Digimind Services ndash White Paper |109
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwwebzzlecom 102 httpinfluxjouebcomnewspowerset-et-xerox-parc-s-attaquent-a-google-naturellement 103 httpwwwmedglecom httpwwwmedwormcom httpwwwmedstorycom httpwwwsearchmedicacouk 104 httpwwwrollyocom httpswickihomeeurekstercom httpgooglecomcoopcseoverview httpbuildersearchyahoocom 105 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 106 Le web invisible (deep web hidden web) deacutesigne la partie du web non accessible aux moteurs de recherche classiques Le web invisible comprend des bases banques de donneacutees et bibliothegraveques en ligne gratuites ou payantesIl est constitueacute de pages web mal ou non indexeacutees par les moteurs Pour plus de preacutecisions voir le White Paper Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique httpwwwdigimindfrserviceswhite_paperhtm 107 httpwwwthelancetcom 108 httpwwwdigimindfrproduitsfinderhtm 109 httpwwwncbinlmnihgoventrezqueryfcgiCMD=searchampDB=pubmed 110 httppminlmnihgovinteractindexphptop httpwwwhubmedorg 111 httpwwwusptogovpatftindexhtml httpwwwwashingtonpostcomwp-dyncontentarticle20070304AR2007030401263html 112 httpwwwgooglecomhistory 113 httpwwwgooglecomhistorytrends httpwwwgooglecomhistoryitems 114 httpfrwikipediaorgwikiApplication_composite 115 httpwwwmibazaarcomextrasfortune100html 116 httptagmapsresearchyahoocomworldexplorerphp 117 httpflickrvisioncom 118 httpgmapstommanganusspacecraft_trackinghtml 119 httpwwwhealthmaporg httpwwwbrevardbiodieselorgmapbdhtml httpkartametroinfokartadefaultaspxhl=EN httpwwwwikimapiaorg httpwwwglobalincidentmapcomhomephp httpdartmapsmackerscom
copy Digimind Digimind Services ndash White Paper |110
Le Web 20 pour la veille et recherche dinformation DIGIMIND
120 httpwwwtagurlscom 121 httpwwwthemolucom httpwwwgnoshorg 122 httpwwwwebmashupcom httpwwwprogrammablewebcommashupsdirectory httpmashupfeedcom 123 httpgooglemapsmaniablogspotcom 124 httplocalalkemiscom 125 httpwwwvoxcom httpwwwover-blogcom httpwwwblogspiritcomfrindexphp httpwwwtypepadcom httpswwwbloggercomstart httpviablogacom httpwwwhautetfortcom 126 httpcasselinfreefrfrenchweblogshtmoutils 127 httpwwwclubiccomarticle-67515-8-comparatif-plateformes-blogshtml httpwwwojrorgojrimagesblog_software_comparisoncfm 128 httpwwwfeedburnercomfbahome 129 httppagesgooglecom 130 httpwwwdigimindfrserviceswhite_paperhtm 131 httpfrwikipediaorgwikiAccueil 132 httpblogouter-courtcomarchive2006-12-05-n22html 133 httpwwwnaturecomnews2005051212full438900ahtml httpwwwnaturecomnaturebritannicaindexhtml httpwwwnaturecomnews2005051212multimedia438900a_m1html 134 httpwwwwikiseekcom 135 httpwwwexaleadfr 136 httpwwwwikimindmaporg 137 httpencitizendiumorgwikiMain_Page 138 httpwwwalacrawikicom 139 httpceclinesxwikicomxwikibinviewMainFils+RSS 140 httpwwwwikidwebcom 141 httpwwwoperacom httpwwwmaxthoncom httpwwwmicrosoftcomfrancewindowsie httpwwwmozilla-europeorgfrproductsfirefox
copy Digimind Digimind Services ndash White Paper |111
Le Web 20 pour la veille et recherche dinformation DIGIMIND
142 httpfrtechcrunchcom20060401analysons-les-lecteurs-rss-en-ligne httpvtechcanalblogcomarchives20051025927489html httpvtechcanalblogcomarchives20050905780635html httpallrsscomrssreadershtml 143 httpinfluxjouebcomnewsles-pages-personnalisables-bookmark-n-1 httpwwwinformationoverlordcouk200603where-to-start-in-search-of-ideal_26 144 httpwwwdigimindfrproduitsindexhtm 145 httpshareopmlorg 146 httpwwwquechoisirorgArticlejspid=RessourcesArticlesEF33CF34D5616AF2C125720D0050E701ampcatcss=TEL000 147 httpweblogshitwisecombill-tancer 148 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 149 httpwwwbusinessweekcominnovateNussbaumOnDesignarchives200704are_most_web_20html 150 httpblogsforrestercomcharleneli200704forresters_new_html httprosstypepadcomblog200604power_law_of_pahtml 151 httpwwwobservatoire-omicorgcolloque-icicpdfBarbe3_1pdf 152 httpwwwaaronswcomweblogwhowriteswikipedia 153 httpaphgcaenfreefrchronique393aphg393htm 154 httpfrwikipediaorgwikiDroits_de_l27homme_en_Iran 155 httpfrwikipediaorgwikiWikipC3A9diaArticles_de_qualitC3A9 156 httpenwikipediaorgwikiJohn_Seigenthaler_Sr_Wikipedia_biography_controversy 157 httppewresearchorgpubs71riding-the-waves-of-web-20 158 httptallblogcontedoxacukwp-contentuploads200703survey-summarypdf 159 httpwwwcafepresscomnerdwideweb 160 httpwwwecransfrspipphprubrique30 161 httpfrcreativecommonsorg 162 httpwwwzdnetfractualitesinternet0390207743933447900htm 163 httpwebsemantiqueorgPagePrincipale httpwwww3orgDesignIssuesSemantichtml httpwwww3org2002Talks1213-lpslide1-0html 164 httpwwwinternetactunetp=6902
copy Digimind Digimind Services ndash White Paper |112
- Digimind Services
- Christophe ASSELIN
- Veronique MESGUICH
-
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Avertissement
Ce document a eacuteteacute reacutealiseacute par la socieacuteteacute Digimind
Le contenu de ce document est proteacutegeacute par le droit drsquoauteur Il peut ecirctre reproduit
en partie agrave la condition de citer Digimind comme auteur et drsquoindiquer lrsquoadresse
httpwwwdigimindcom Pour toute information compleacutementaire vous pouvez
contacter Digimind par mail agrave lrsquoadresse contactdigimindcom ou par teacuteleacutephone au
01 53 34 08 08
copy Digimind Digimind Services ndash White Paper |1
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Sommaire
AVERTISSEMENT 1
AVANT PROPOS 4 Web 20 4
QUEST-CE QUE LE WEB 20 5
Preacuteambule 5
Deacutefinition du web 20 6
Les 7 principes du Web 20 8
Les eacutevolutions par rapport au Web 10 le rocircle de linternaute 9
GLOSSAIRE DU WEB 20 12
LES TECHNOLOGIES DU WEB 20 15
LES FAMILLES DAPPLICATIONS DU WEB 20 18
Typologie 18
Comment identifier un site Web 20 23
LES APPLICATIONS WEB 20 POUR LA VEILLE ET LA RECHERCHE DINFORMATIONS 24
Les types dapplications 24 I Partager et collaborer 24 a Les Bookmarks sociaux 24 b Le Multimeacutedia photos et videacuteos 30 c Partage de cv et reacuteseaux sociaux35 d Les sites dactualiteacutes collaboratives recommandation et notation38 II Rechercher Collecter 42 a La recherche de blogs et de flux RSS42 b La recherche par tags48 c La recherche de personnes et dinformations entreprises 54 d Les moteurs de recherche humains56 e les moteurs de recherche collaboratifs59 f La verticalisation par la personnalisation du peacuterimegravetre de recherche62 g Lenrichissement de bases de donneacutees faccedilon Web20 65 h Conserver et exploiter lhistorique de vos recherches et navigations67 i Les mash-up 69 III Diffuser73
copy Digimind Digimind Services ndash White Paper |2
Le Web 20 pour la veille et recherche dinformation DIGIMIND
a Les Blogs et le flux RSS 73 b Les Wikis 74 IV Surveiller 78 a La deacutetection du flux RSS 78 b La mise en surveillance79 c Pourquoi une veille via le RSS 81 V Carte des outils et ressources Web 2082
Exemple dune recherche et veille via le Web 20 84
LES LIMITES DU WEB 20 86
La participation 86 I Une participation heacuteteacuterogegravene 86 Une minoriteacute participativehellip 86 Wikipedia un faux modegravele collaboratif 87 II Une participation damateurs 88
Le web 10 reste neacutecessaire 89 Le mail reacutesiste 89 Une population souvent isoleacutee et non repreacutesentative 90 Des domaines mal couverts 91
CONCLUSION 92
A PROPOS DES AUTEURS 96
WEBOGRAPHIE BIBLIOGRAPHIE 98 Sites web wikis et blogs98 Articles 101 Ouvrages 102
DANS LA MEME COLLECTION 104
NOTES 105
copy Digimind Digimind Services ndash White Paper |3
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Avant propos
Web 20
La notion de Web 20 est tregraves souvent employeacutee mais finalement peu de
personnes sont capables de lexpliquer preacuteciseacutement
Lobjectif de ce document est de deacutemocratiser le concept de Web 20 aupregraves des
Knowledge Workers Il sadresse aux diffeacuterents collaborateurs de lentreprise qui
nutilisent pas encore ou peu les diffeacuterentes applications regroupeacutees sous ce
concept Les sensibiliser agrave ces outils pourra ameacuteliorer la pertinence de leur
recherche et de leur veille informationnelle
copy Digimind Digimind Services ndash White Paper |4
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Quest-ce que le Web 20
PREAMBULE
Pour certains le Web 20 nest qun gadget un pur pheacutenomegravene de mode qui ne
meacuterite pas que lon sy attarde Pourtant une eacutevolution importante a bien eu lieu sur
le web quelque soit le nom que lon lui donne
Ainsi en 2006 un metteur en scegravene a choisi de diffuser son long meacutetrage Autumn1
gratuitement et ce uniquement sur internet via le service Google Video2 Il navait
pas trouveacute de distributeur capable dexploiter son film dans plus de 30 salles En mai
2007 plus de 920 000 internautes avaient deacutejagrave vu Autumn sur le service de partage
de videacuteos de Google
Fin 2005 pour le compte de la prestigieuse revue scientifique Nature des experts
ont compareacute des documents publieacutes sur Wikipedia lencyclopeacutedie collaborative en
ligne reacutealiseacutee par des internautes volontaires et beacuteneacutevoles avec ceux de la ceacutelegravebre
Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche
Cette eacutetude a abouti agrave une formidable controverse comment une encyclopeacutedie
reacutealiseacutee par des non-speacutecialistes peut-elle remettre en cause les ouvrages
classiques
Il se passe donc bien quelque chose de nouveau via ce web nouvelle geacuteneacuteration ougrave
linternaute devient actif et collaboratif Mais tellement dacteurs et dapplications se
reacuteclament de ce web 2 que lon a vite limpression de naviguer en Terra Incognita
Certains nheacutesitent dailleurs pas agrave repreacutesenter ce nouveau web via une carte
dexplorateur 3
Aussi agrave travers ce document plongeons dans le Web 20 pour mieux lexploiter
lors de recherche dinformation et de veilles
copy Digimind Digimind Services ndash White Paper |5
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La carte des communauteacutes virtuelles Par Randall Munroe DR
DEFINITION DU WEB 20
Comment deacutefinir de faccedilon preacutecise ce que recouvre cette notion parfois floue
Depuis plusieurs mois le blog collectif Dessine moi le Web 20 4 propose agrave des
universitaires informaticiens philosophes entrepreneurs de donner leur propre
vision du pheacutenomegravene et eacutechanger ideacutees et points de vue La diversiteacute et la richesse
des contributions illustrent la difficulteacute agrave donner une deacutefinition exhaustive de ce
concept agrave geacuteomeacutetrie variable mecirclant agrave la fois des aspects techniques et sociaux
Une vision reacuteductrice du Web 20 consisterait agrave nrsquoy voir que la mutualisation de
contenus produits et mis en ligne par les utilisateurs eux-mecircmes ou agrave reacutesumer
lrsquoengouement actuel agrave un effet de mode passager Depuis la premiegravere confeacuterence
Web 20 en 2004 le concept srsquoest concreacutetiseacute agrave travers de nombreuses
expeacuterimentations ou le deacuteveloppement de nombreux services largement utiliseacutes
Nous tenterons dans ce document de brosser un panorama des enjeux usages et
technologies lieacutes agrave cette notion aussi encenseacutee que controverseacutee
copy Digimind Digimind Services ndash White Paper |6
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Plusieurs auteurs srsquoaccordent sur lrsquoideacutee selon laquelle le web 20 ne constitue pas
une rupture technologique ni hellip sociale Il srsquoagirait plutocirct drsquoun retour aux sources
drsquoune renaissance du web tel qursquoil a eacuteteacute conccedilu agrave lrsquoorigine les utilisateurs srsquoeacutetant
entre temps approprieacutes les modes de creacuteation et de diffusion
Pour Paul Graham5 pionnier de lrsquoInternet et fondateur de la socieacuteteacute Viaweb en
1995 le web 20 est le web comme il a eacuteteacute conccedilu pour ecirctre utiliseacute Les tendances que
nous distinguons sont simplement la nature inheacuterente du web qui eacutemerge des mauvaises
pratiques qui lui ont eacuteteacute imposeacutees pendant la bulle Internet
Le web creacuteeacute au deacutebut des anneacutees 90 par Tim Berners Lee comportait deacutejagrave en
germe bien des eacuteleacutements du web 20 mutualisation des connaissances eacutechange
travail collaboratif interactiviteacute intelligence collective hellip Ce nrsquoest sans doute pas
un hasard si Dale Dougherty lrsquoun des pegraveres fondateurs de la formule 20 fut lui
aussi lrsquoun des pionniers du web et notamment le fondateur de GNN le premier
portail financeacute par la publiciteacute
Naissance du concept
Crsquoest au cours de lrsquoeacuteteacute 2004 que le terme de web 20 apparaicirct pour la premiegravere
fois lors drsquoune seacuteance de brainstorming Dale Dougerthy co-fondateur de la
socieacuteteacute drsquoeacutedition OrsquoReilly et Craig Cline de MediaLive reacutefleacutechissent agrave des thegravemes
eacutemergents en vue drsquoune confeacuterence agrave venir Le journaliste John Battelle co-
fondateur du magazine Wired se joint un peu plus tard au duo et la premiegravere
confeacuterence Web 20 a lieu en octobre 2004 Lrsquoexpression 20 est utiliseacutee agrave ce
propos pour marquer lrsquoeacutemergence drsquoune nouvelle eacutetape dans la courte histoire du
web eacutetape caracteacuteriseacutee par un changement des regravegles et une modification des
modegraveles de revenus Le volet social sera deacuteveloppeacute plus tardivement par Tim
OReilly lors de la deuxiegraveme confeacuterence Web 20 en octobre 2005
Les nouveaux produits et services associeacutes au web 20 vont ainsi repositionner
lrsquointernaute au cœur du systegraveme Des techniques de publications simples et souples
comme les blogs les plates-formes collaboratives de type Wiki offrent des
possibiliteacutes accrues de production diffusion et consommation des contenus
Lrsquointernaute devient ainsi co-creacuteateur de nouvelles applications en ligne initiant
souvent de faccedilon collective ou communautaire de nouvelles formes de relations
numeacuteriques Selon lrsquoexpression drsquoHubert Guillaud6 le web devient non plus une
aventure technologique mais bien une aventure humaine
copy Digimind Digimind Services ndash White Paper |7
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LES 7 PRINCIPES DU WEB 20
Le texte de Tim OrsquoReilly paru en 2005 7 sous le titre Qursquoest ce que le web 20
deacutegage sept principes cleacutes du Web 20 en voici un petit reacutesumeacute
1 Le web vu comme une plate-forme de services
On passe dune collection de sites web agrave une plateforme informatique agrave part
entiegravere fournissant des applications web aux utilisateurs
2 Consideacuterer les internautes comme co-deacuteveloppeurs des applications On passe ainsi
de la notion de logiciel produit agrave celle de logiciel service
3 Le service srsquoameacuteliore quand le nombre drsquoutilisateurs augmente
Le Web 20 met agrave profit lrsquoeffet de la longue traicircne (ou long tail en anglais)
populariseacute par le magazine Wired les produits qui sont lrsquoobjet drsquoune faible
demande ou qui nrsquoont qursquoun faible volume de vente peuvent collectivement
repreacutesenter une part de marcheacute eacutegale ou supeacuterieure agrave celle des best-sellers si les
canaux de distribution peuvent proposer assez de choix Les utilisateurs du Web
20 disposent de donneacutees uniques difficiles agrave recreacuteer et dont la richesse srsquoaccroicirct
avec lrsquoaugmentation du nombre des utilisateurs
4 La richesse est dans les donneacutees Toutes les applications web drsquoimportance sont
lieacutees agrave une base de donneacutees speacutecialiseacutee OrsquoReilly envisage un mouvement des
donneacutees libres srsquoopposant peu agrave peu agrave lrsquounivers des donneacutees proprieacutetaires
5 Tirer parti de lrsquointelligence collective crsquoest le principe mecircme adopteacute par
lencyclopeacutedie en ligne Wikipedia et drsquoautres sites similaires Pour Tim OrsquoReilly
lrsquoimplication des utilisateurs dans le reacuteseau est le facteur-cleacute pour la supreacutematie sur le
marcheacute
6 Mettre en place des interfaces souples et leacutegegraveres fondeacutees sur les nouveaux
standards et protocoles du Web Le logiciel se libegravere du PC Une autre des
caracteacuteristiques du web 20 est le fait qursquoil nrsquoest plus limiteacute agrave la plate-forme PC
mais vise notamment les objets nomades teacuteleacutephone portable PDA ou lecteur
portatif audio
copy Digimind Digimind Services ndash White Paper |8
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LES EVOLUTIONS PAR RAPPORT AU WEB 10 LE ROLE DE LINTERNAUTE
En quoi le Web 20 se distingue-t-il de la vague preacuteceacutedente On a vu que lrsquoune des
caracteacuteristiques majeures du pheacutenomegravene est lrsquoappropriation des contenus et des
modes de diffusion par les internautes eux-mecircmes via des applications souples et
leacutegegraveres
Paul Graham eacutevoque le principe de deacutemocratie du Web 20 cest-agrave-dire la
superposition au reacuteseau technique drsquoun reacuteseau humain qui participe agrave la creacuteation et
agrave lrsquoenrichissement de contenus et services Lrsquointernaute deviendrait ainsi
consommrsquoacteur agrave lui de produire publier diffuser indexer partager des
contenus de tous types
Web 10 Web 20
Leaders du web Entreprises marchands Internautes
Profil de linternaute Passif Actif
Interactiviteacute perccedilue Seacutelection et lecture dinformation
Seacutelection lecture et publication de donneacutees
Uniteacute de recherche Mot-cleacute Tag
Du Web 1 vers le Web 2 Source ZDNet 8
Pour autant les internautes vont-ils devenir tous acteurs de ce processus Selon un
article de Charles Arthur dans The Guardian 9 pour un groupe de 100 personnes si
lrsquoune creacutee du contenu 10 seulement vont interagir en apportant commentaires et
ameacuteliorations les autres se contentant drsquoune consommation passive Ce constat
obtenu via des retours drsquoexpeacuterience sur des sites collaboratifs illustre la regravegle des
11089 selon laquelle plus de 80 des contenus produits proviennent drsquoun
nombre tregraves restreint drsquoutilisateurs
Tendance confirmeacutee par les chiffres preacutesenteacutes lors de la Web 20 Expo en avril 2007
et repris dans Internetactu 10 selon la socieacuteteacute de mesure drsquoaudience Hitwise11
016 des internautes qui passent sur YouTube y placent des films - alors qursquoils
eacutetaient encore 05 agrave le faire en juillet 2006 seulement 02 des visiteurs de
Flickr y publient des photos La seule exception agrave cette faible participation provient
copy Digimind Digimind Services ndash White Paper |9
Le Web 20 pour la veille et recherche dinformation DIGIMIND
de Wikipedia ougrave 46 des visiteurs contribuent agrave lrsquoenrichissement de
semblent en effet
voir eacutecrit des textes longs (en un nombre reacuteduit drsquointerventions) tandis que les
eacutediteursrdquo les plus actifs qui forment le noyau des wikipeacutediens nettoient corrigent
lective fondeacutee sur des actions agrave faible niveau drsquoexigence
(lire enregistrer un signet tagger commenter) de lrsquointelligence collaborative
caracteacuteriseacutee par des formes de participations plus actives et intenses eacutecrire
collaborer modeacutererhellip
lrsquoencyclopeacutedie
Jimmy Wales fondateur de Wikipedia estime qursquoun nombre restreint de
contributeurs et eacutediteurs font lrsquoessentiel du travail alors qursquoun nombre consideacuterable
de lecteurs apportent peu de modifications Le wikipeacutedien Aaron Swartz nuance
ce point de vue un grand nombre de contributeurs occasionnels
a
ldquo
mais sans apporter eacutenormeacutement de texte
Le Web 20 et tout particuliegraverement la blogosphegravere semble suivre la loi de la
participation eacutedicteacutee par Ross Mayfield preacutesident de la socieacuteteacute Social Text sous le
nom de Power law of participation12 Cette loi baseacutee sur lrsquoobservation des
pratiques et des seuils de participation aux dispositifs communautaires constate que
la participation srsquoamenuise agrave mesure que les formes de participation se
complexifient Le scheacutema ci-dessous qui rappelle celui de la Longue Traicircne
distingue lrsquointelligence col
Power Law of Participation par Ross Mayfield CC
copy Digimind Digimind Services ndash White Paper |10
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Le cabinet Forrester deacutetaille enc
de la participation figurant dans son eacutetude Social Technographics 13 la grille compte
6 eacutechelons correspondant aux niveaux de particip
les inactifs (52 )
les spectateurs (33 ) consommateurs de contenus texte ou multimeacutedia (blogs
videacuteos mis en ligne par les utilisateurs podcasts)
ore davantage les niveaux drsquoimplication dans la grille
ation
les menuisiers (19 ) utilisateurs de reacuteseaux sociaux
es collecteurs (15 ) utilisent des flux RSS et taggent les pages web
les critiques (19 ) postent des commentaires sur les blogs des avis et critiques
les creacuteateurs (13 ) publient des contenus en ligne (blogs videacuteos)
l
copy Digimind Digimind Services ndash White Paper |11
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Glossaire du Web 20
Pour mieux comprendre les concepts utiliseacutes dans lunivers du Web 20 nous vous
proposons ce glossaire des termes essentiels
Tags mot clef sous forme drsquo eacutetiquette que les utilisateurs peuvent apposer sur
un document numeacuterique (texte photo videacuteo) de faccedilon agrave en deacutecrire le contenu Le
tagging introduit une part de subjectiviteacute par rapport agrave lrsquoindexation automatique
effectueacutee par les moteurs Les tags peuvent eacutegalement ecirctre extraits
automatiquement drsquoun texte en fonction de leur freacutequence drsquooccurrence
Nuage de tags preacutesente les tags correspondant agrave un site (ou agrave plusieurs) en les
regroupant sur un mecircme espace et leur attribuant une taille variable suivant la
freacutequence dutilisation ou drsquooccurrence Cela donne une vision drsquoensemble des
principales theacutematiques Le site Tagcrowdcom14 permet de geacuteneacuterer un nuage de
tags agrave partir drsquoun texte
Folksonomie (traduit eacutegalement parfois par potonomie peuplonomiehellip)
Ce mot valise contraction de folk (peuple) et taxonomie deacutesigne une forme de
classification collaborative deacutecentraliseacutee spontaneacutee baseacutee non pas sur un
vocabulaire controcircleacute et standardiseacute mais sur des termes choisis par les utilisateurs
eux-mecircmes intituleacutes tags Lrsquoobjectif eacutetant de faciliter lrsquoindexation des contenus
ainsi que la recherche drsquoinformation
Blogs journal personnel disponible sur le web Peut ecirctre tenu par un particulier
un chercheur un journaliste un salarieacute drsquoentreprise ou plus rarement par un groupe
de personne (entreprise collectiviteacutehellip) Le blog a pour objet de diffuser des billets
geacuteneacuteralement lieacutes agrave lrsquoactualiteacute et preacutesenteacutes par ordre chronologique alors qursquoun
wiki est destineacute agrave la mutualisation des connaissances Un blog peut preacutesenter des
contenus multimeacutedias photo (photoblog) son ou videacuteo (vblog vlog)hellip
Blogosphegravere la biosphegravere des blogs Ce mot valise deacutesigne la communauteacute
des blogs ou encore lrsquoensemble des auteurs de blogs La blogosphegravere est largement
interconnecteacutee les trackbacks situeacutes sur la plupart des blogs permettant de lier
copy Digimind Digimind Services ndash White Paper |12
Le Web 20 pour la veille et recherche dinformation DIGIMIND
deux articles traitant de sujets connexes Lrsquoeacutelite des blogueurs particuliegraverement
influents peut ecirctre qualifieacutee ironiquement de blogeoisie
Blogroll ou blogoliste liste de liens vers drsquoautres blogs preacutesenteacutes par lrsquoauteur
drsquoun blog On peut syndiquer sur une mecircme page des billets venant de ces blogs via
les formats RSS
RSS lrsquoacronyme signifie selon les versions Really Simple Syndication (RSS 20) RDF
Site Summary (RSS 09 10 et 11) ou encore Rich Site Summary (RSS 091) Ce
format de syndication permet drsquoextraire automatiquement dun site web ou drsquoun
blog du contenu reacuteguliegraverement mis agrave jour Un fichier RSS est un simple fichier texte
au format XML comportant la description syntheacutetique du contenu Ce format a eacuteteacute
creacuteeacute en 1999 par Netscape On peut srsquoabonner gratuitement agrave plusieurs flux RSS agrave
partir drsquoun lecteur on-line ou installeacute sur le PC
Atom Format normaliseacute de syndication de contenu Web baseacute sur le XML qui
permet la syndication de contenu entre diffeacuterentes ressources Web Concurrent
de RSS Le format Atom a eacuteteacute creacuteeacute dans le but de simplifier les diffeacuterents formats
RSS existants La diffeacuterence entre les deux formats reacuteside surtout dans lemploi de
balises XML diffeacuterentes Les deux formats sont geacuteneacuteralement lus par les
agreacutegateurs
Wiki Site web dynamique dont tout visiteur peut modifier les pages agrave loisir Le
terme vient la langue hawaiumlenne (wikiwiki = rapide) Un wiki a pour objectif de
mutualiser des connaissances et est organiseacute autour drsquoun plan de classement Les
contributeurs drsquoun wiki sont geacuteneacuteralement anonymes
Crowdsourcing Litteacuteralement approvisionnement par la foule Le
crowdsourcing consiste agrave utiliser la creacuteativiteacute lintelligence et le savoir-faire dun
grand nombre dinternautes pour creacuteer des contenus participer agrave lrsquoalimentation
drsquoun site Cette participation des utilisateurs agrave la creacuteation des contenus repreacutesente
une forme drsquoexternalisation (outsourcing) et permet de reacuteduire les coucircts en se
basant sur un systegraveme de beacuteneacutevolat ou de micropaiement
Reacuteseaux sociaux de nombreux sites de social networking ou reacuteseautage social
sont apparus avec la vague du Web 20 Ils permettent de mettre en relation des
personnes partageant les mecircmes centres drsquointeacuterecirct personnels ou professionnels
Ces reacuteseaux peuvent devenir de veacuteritables communauteacutes en ligne les plus fameux
eacutetant les sites Friendster ou Myspace ou bien dans la sphegravere professionnelle
copy Digimind Digimind Services ndash White Paper |13
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Linkedin ViadeohellipLa plupart des reacuteseaux sont ouverts certains fonctionnent sur le
mode de la cooptation
Podcasts issu de la combinaison des termes iPod (dApple) et broadcasting ce
terme deacutesigne le fait de rendre disponible en ligne un fichier audio au format
numeacuterique Ce fichier peut-ecirctre teacuteleacutechargeacute directement sur un ordinateur ou un
peacuteripheacuterique via un flux de diffusion Equivalent franccedilais baladodiffusion
Lrsquoutilisateur peut ainsi se composer une liste de lecture agrave la carte Pour les fichiers
videacuteo on emploi le terme de videacuteocast
AJAX (Asynchronous JavaScript And XML) meacutethode informatique de
deacuteveloppement dapplications Web permettant deacuteconomiser de la bande passante
en ne rechargeant pas une page entiegravere alors que seuls certains eacuteleacutements ont besoin
de lecirctre mais en ne rafraicircchissant que ces eacuteleacutements de la page Cela permet de
produire des contenus dynamiques et reacuteactifs en ne neacutecessitant que peu drsquoappels au
serveur heacutebergeant la page AJAX est une combinaison de plusieurs technologies
HTML CSS Javascript XMLhellipDe nombreux sites web 20 sont deacuteveloppeacutes en
AJAX
API Interface de programmation permettant agrave un utilisateur de deacutevelopper des
applications conviviales De nombreux sites classiques ou Web 20 proposent des
API pour inteacutegrer automatiquement leur contenu agrave dautres sites
Mashup ou Mash up application web composite mixant plusieurs sources ou
plusieurs contenus pour fournir un nouveau produit ou service Le terme se traduit
en franccedilais par remixage ou mosaiumlque Exemple de mashup la visualisation des
reacutesultats des eacutelections preacutesidentielles franccedilaises via Google Earth qui mixe les cartes
Google et les chiffres du Ministegravere de lInteacuterieur
Long tail (longue traicircne) Cette expression est utiliseacutee en statistiques et peut
srsquoappliquer au marketing Des produits rares ou qui font lrsquoobjet drsquoune faible
demande peuvent collectivement repreacutesenter une part de marcheacute eacutegale ou
supeacuterieure agrave celle des best-sellers si les canaux de distribution peuvent proposer
assez de choix Le caractegravere virtuel du web permet de geacuteneacuterer une longue seacuterie de
marcheacutes de niche heacuteteacuterogegravenes (exemple e-bay) par opposition aux grands
marcheacutes homogegravenes et grand public du monde reacuteel
copy Digimind Digimind Services ndash White Paper |14
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les technologies du Web 20
Mettons dabord les choses au point le Web 20 nest pas une (r)eacutevolution ou un
concept de dimension technologique
Ses applications sappuient sur des technologies deacutejagrave existantes reacutepondant aux doux
noms dAjax Soap REST RSS Perl Python PHP Ruby ou GreaseMonkey Lobjectif de
ce document nest pas de deacutevelopper ce volet technologique Nous en eacutevoquerons
seulement les grandes caracteacuteristiques pour mieux comprendre les enjeux
Le Web 2 repose notamment sur les interfaces utilisateurs dites riches qui
permettent des possibiliteacutes daffichage de configuration et de maniement plus
puissantes que les pages html classiques du Web 1 que ce soit pour le
deacuteveloppeur ou lutilisateur final
Tim Berners Lee co-inventeur du web remarque en fait ce Web 20 utilise les
standards qursquoont produit tous ces gens qui travaillent sur le Web 10 le Document
object model HTML et SVG (Scalable Vector Graphics) HTTPhellip Le Web 20
construit des services en srsquoappuyant sur les standards du web ainsi que sur JavaScript
(hellip)
Pour se structurer en reacuteseau de bases de donneacutees et services collaboratifs le web
20 utilise donc des technologies matures acircgeacutees de 5 agrave 10 ans pour la plupart
Leacutevolution nest pas tant dans la technologie elle-mecircme que dans la faccedilon de mixer
ces technologies pour apporter des services et une ergonomie nouvelle agrave
lutilisateur
Ainsi lAjax (voir glossaire) que lon cite souvent agrave propos des technologies phares
du Web 2 nest pas un nouveau langage mais un nouveau concept qui utilise les
standards XHTML et CSS DOM (Document Object Model) pour laffichage
dynamique XML et XSLT pour leacutechange de donneacutees ainsi que la reacutecupeacuteration de
donneacutees asynchrones via XMLHttpRequest JavaScript integravegre et combine tout ces
langages Le terme Ajax a eacuteteacute apporteacute par Jesse James Garrett de lrsquoagence web
Adaptive Path
copy Digimind Digimind Services ndash White Paper |15
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LAjax permet notamment de ne recharger que certains eacuteleacutements dune page plutocirct
que la page entiegravere Lors de modifications sur une page seuls les nouveaux
eacuteleacutements se rafraicircchissent eacuteconomisant ainsi des ressources du temps et de la
bande passante Lun des preacutecurseurs grand public dans lutilisation de cette
technologie fut A9 le moteur de recherche dAmazon il neacutetait pas neacutecessaire de
recharger la page agrave chaque fois que lon ajoutait de nouvelles sources et moteurs agrave
interroger 15
Greasemonkey est eacutegalement baseacute sur des scripts Cette extension pour le
navigateur Mozilla Firefox va encore plus loin dans le pouvoir accordeacute agrave linternaute
en exeacutecutant des scripts ce plug-in 16 permet de modifier lapparence des pages
web visiteacutees dy ajouter des fonctions (boutons case agrave cocher suppression des
publiciteacutes) Lutilisateur avanceacute peut mecircme eacutecrire ses propres scripts ou
teacuteleacutecharger des scripts mis agrave la disposition de tous
Le Web 2 est en fait une sorte de web lego qui permet dinnover via lassemblage
de briques les technologies de base sont multiples il est possible de creacuteer de
nouvelles applications agrave valeur ajouteacutee en les assemblant diffeacuteremment ou plus
rationnellement
Les mash-up un mixage de plusieurs applications (voir glossaire) en est une des
illustrations les plus visibles avec les mashups on agreacutege le contenu eacutemanant de
plusieurs sites afin de creacuteer un site nouveau On utilise alors souvent lobjet XML
lAJAX du cocircteacute de linternaute les RSS et les API (Web Services) des sites mixeacutes
LAPI nest donc pas seulement un dieu eacutegyptien Pour faire simple on peut dire
que cest une interface de programmation mise agrave disposition des internautes
(avertis) pour deacutevelopper des applications Une application pourra alors acceacuteder agrave
des programmes systegraveme pour envoyer recevoir ou extraire des donneacutees Ainsi
Google publie lAPI de Google Maps qui est utiliseacute par de nombreux deacuteveloppeurs
pour creacuteer des applications deacuteriveacutees du service de cartographie de Google par
exemple la carte de suivi du teacutelescope spatial Hubble la meacuteteacuteo dans le monde 17
Le rocircle du RSS (voir glossaire) est par ailleurs preacutepondeacuterant Ce format qui
permet dexporter et lire des donneacutees dactualiteacutes au format XML se retrouve dans
quasiment toutes les applications dites Web 2 et peut en constituer lemblegraveme sinon
la caracteacuteristique majeure avec les tags Il permet de surveiller les flux de nouvelles
informations issues de sites dactualiteacutes de blogs de moteurs de recherchehellipbref
de tout site web qui propose un contenu qui se renouvelle Le RSS va aussi servir agrave
exporter des bookmarks sociaux que sont les tags ou les favoris par exemple
copy Digimind Digimind Services ndash White Paper |16
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Si le Web 2 nest pas une reacutevolution technologique en soit la relative simpliciteacute de
mise en place de ces techniques et leurs coucircts de programmation reacuteduits expliquent
le tregraves fort deacuteveloppement que connaissent toutes ces applications Par ailleurs la
baisse constante du coucirct dheacutebergement et de bande passante a faciliteacute la diffusion
de ce web nouvelle geacuteneacuteration
Mais il subsiste des effets de seuil Des applications gigantesques comme Flickr de
Yahoo offrant lheacutebergement et le partage de photos impliquent la gestion de
vastes bases de donneacutees et des infrastructures de stockage importantes Seules de
grandes firmes comme Yahoo Inc Google Microsoft ou AOL par exemple peuvent
se deacutepartir efficacement de ce type de contraintes
copy Digimind Digimind Services ndash White Paper |17
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les familles dapplications du Web 20
TYPOLOGIE
Les familles drsquoapplications Web 20 sont nombreuses et diverses de nouveaux
services apparaissent quotidiennement (sans garantie de peacuterenniteacutehellipet bien souvent
de faccedilon redondante) Sans preacutetendre dresser une liste exhaustive des nombreuses
possibiliteacutes on peut deacutegager une typologie des applications selon diffeacuterents
domaines drsquoactiviteacute Les applications speacutecifiquement deacutedieacutees agrave la veille et agrave la
recherche dinformation seront deacuteveloppeacutees dans la partie suivante
Bureautique en ligne
Courant 2006 Google a lanceacute successivement plusieurs logiciels collaboratifs en
ligne un outil de gestion drsquoagendas (Google Calendar 18) un tableur (Google
Spreadsheet) et enfin apregraves le rachat de la socieacuteteacute Writely un traitement de texte
(Google Docs) 19 Ces logiciels permettent de creacuteer modifier partager et publier en
ligne des documents sur un espace de stockage Depuis plusieurs mois on assiste agrave
une veacuteritable deacuteferlante de logiciels de bureautique en ligne deacutesigneacutes parfois sous le
terme de web office RallyPoint AjaxWrite (pour Firefox uniquement) ZohoWriter
ThinkfreehellipOutre la gratuiteacute lrsquointeacuterecirct de ces logiciels concurrents de la suite
Microsoft Office est leur disponibiliteacute sur toute machine connecteacutee au reacuteseau et tout
systegraveme drsquoexploitation Attention toutefois aux questions de sauvegarde de
compatibiliteacute de synchronisation des donneacutees et enfin de confidentialiteacutehellip
Emploi
Les blogs constituent un bon moyen pour promouvoir son CV mettre en avant
expeacuterience et compeacutetences et faciliter les eacutechanges Des jobblogs verticaux
speacutecialiseacutes par secteur ou reacutegion connaissent un grand succegraves (voir par exemple
ceux du site et moteur Moovement20) Le networking professionnel est eacutegalement agrave
la mode agrave travers des sites comme Linkedin (creacuteeacute en 2003 aux Etats-Unis) Viadeo
(ex Viaduc drsquoorigine franccedilaise) ou Xing (ex OpenBC agrave vocation europeacuteenne) Le
principe est de tirer parti des reacuteseaux de connexions sociales virtuelles afin
copy Digimind Digimind Services ndash White Paper |18
Le Web 20 pour la veille et recherche dinformation DIGIMIND
drsquoidentifier des salarieacutes ou employeurs potentiels mais aussi drsquoeacutetoffer son reacuteseau de
clients partenaires fournisseurshellip
Lrsquoe-cooptation (Cooptin Jobmeeters 21) met le reacuteseau au cœur de la deacutemarche de
recrutement via un systegraveme de prime de cooptation et peut aider les demandeurs
agrave identifier les offres du marcheacute cacheacute
Commerce en ligne
Le client est roi et le Web 20 permet de rehausser son niveau de participation sur
les sites marchands On peut ainsi tagger ou annoter des reacutefeacuterences drsquoouvrages dans
le catalogue Amazon Gracircce agrave des sites comme Zlio ou la Shoposphegravere de Yahoo22
les internautes peuvent recommander agrave leur entourage des produits et
serviceshellipen touchant une commission sur les ventes reacutealiseacutees Des guides drsquoachat
et comparateurs de prix comme Ciao integravegrent les avis de consommateurs et
drsquoexperts Le site Wantuno (inspireacute de lrsquoameacutericain Woot) innove dans le domaine
de la vente eacuteveacutenementielle en vendant un seul produit nouveau high tech par jour
annonceacute en podcast videacuteo agrave des internautes preacutevenus par flux RSS23 Certains
analystes voient lrsquoavenir du commerce eacutelectronique dans le concept de CtoB
(Consumer to Business) inverse du BtoChellip
Geacuteolocalisation
Google Maps a eacuteteacute lrsquoun des premiers services de geacuteolocalisation en srsquoappuyant sur
lrsquooutil de recherche pour localiser sur des cartes des services de proximiteacute
(commerces station servicehellip) La version 2 du site Geacuteoportail de lrsquoIGN disponible
depuis fin mai 2007 srsquoenrichit de nouveaux services pratiques et citoyens (accegraves au
cadastre visualisation des zones agrave risquehellip) Google Earth fait lrsquoobjet de partenariats
avec la NASA ou le programme des Nations Unies pour lrsquoenvironnement La
geacuteolocalisation peut srsquoadapter eacutegalement au partage de photos (Yahoo Maps et
Flickr ou le projet Pikeo chez Orange)24
Recherche drsquoinformations
Des agreacutegateurs de meacutedia comme Digg ou Wikio laissent une large place agrave
lrsquointernaute pour tagger ou recommander par vote les articles issus de meacutedias
classiques ou blogs On suivra eacutegalement lrsquoactualiteacute en syndiquant des flux RSS agrave
travers des agreacutegateurs comme Netvibes ou Newsgator Les grands moteurs (Google
Custom Search Yahoo Search Builder MSN Live search Macros) offrent des options de
copy Digimind Digimind Services ndash White Paper |19
Le Web 20 pour la veille et recherche dinformation DIGIMIND
creacuteation de moteurs personnalisables effectuant des recherches sur des bouquets
de sources preacuteseacutelectionneacutees par lrsquoutilisateur On peut mutualiser les connaissances agrave
travers des wikis collaboratifs geacuteneacuteralistes (Wikipedia) ou speacutecialiseacutes Enfin le projet
de moteur collaboratif Wikiasari qui doit aboutir courant 2007 aura recours aux
mecircmes technologies libres que la ceacutelegravebre encyclopeacutedie ainsi qursquoagrave un reacuteseau humain
ou communauteacute de confiance qui validera les reacutesultats de la recherche
Les actualiteacutes sur Wikio sites de presse blogs et navigation par tags (agrave droite)
Diffusion drsquoactualiteacutes
Pour Pierre Chappaz fondateur du site Wikio les blogueurs ne sont pas journalistes
mais ils peuvent apporter une vraie expertise sur certains sujets quils connaissent et il
serait dommage de sen priver Selon lui les meacutedias 20 ne seront plus des canaux
exclusifs de diffusion mais producteurs de contenu et des marques Deacutesormais le
scoop nrsquoest plus lrsquoapanage des seuls journalistes aux Etats-Unis une jurisprudence
donne droit depuis 2006 aux blogueurs de proteacuteger leurs sources au mecircme titre
que les journalistes professionnels Des centaines de blogs politiques ont fleuri sur le
web certains drsquoentre eux se reacuteveacutelant particuliegraverement influents On parlera de
journalisme citoyen agrave propos de sites comme Agoravox ou de lrsquo alleacutee
numeacuterique Rue 89 lanceacutee en mai 2007 par drsquoanciens journalistes du quotidien
Libeacuteration Ces nouveaux meacutedias en ligne marient les communications venant de
journalistes professionnels experts et internautes
copy Digimind Digimind Services ndash White Paper |20
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Loisirs
On retrouve ici la notion de filtrage collaboratif baseacute sur un systegraveme de
recommandations et drsquoeacutevaluations par les utilisateurs Ces recommandations
peuvent concerner les livres les destinations de voyage la musique la videacuteohellipet
proviennent de lrsquoanalyse de comportements drsquoachats des internautes et de leurs
eacutevaluations de produits Le moteur drsquoanalyse preacutedictive Criteo 25 a ainsi lanceacute en
feacutevrier 2007 un service de recommandations automatique de blogs apregraves avoir
utiliseacute sa technologie pour lrsquoeacutevaluation de videacuteos
La participation des internautes peut aller jusqursquoau financement et agrave la production
drsquoœuvres artistiques le projet A swarm of angels permet drsquoaider agrave la creacuteation de
films qui seront distribueacutes sous licence creative commons et diffuseacutes via les reacuteseaux
peer-to-peer
Partage de documents multimeacutedia
Il srsquoagit sans doute drsquoune des applications les plus reacutepandues du Web 20 Les grands
acteurs du web ont largement investi ce domaine Google a racheteacute en 2006 le site
de partage de videacuteo Youtube Yahoo de son cocircteacute avait racheteacute le site de partage de
photos Flickr Les favoris peuvent eacutegalement ecirctre mutualiseacutes via des services en
ligne comme Delicious (groupe Yahoo) ou Blogmarks De nombreux services de
partages de photos videacuteo ou podcasts se sont deacuteveloppeacutes reacutecemment on peut
citer parmi eux les sites franccedilais DailyMotion ou la banque drsquoimages Fotolia Podemus
ou Radioblog figurent parmi les sites communautaires de podcasts
Enseignement et recherche
Henry Jenkins26 professeur au MIT imagine des uniteacutes drsquoenseignement conccedilues
sur les modegraveles YouTube ou Wikipedia des deacutepartements qui ldquopermettraient le
deacuteploiement rapide drsquoexpertises disperseacutees et la reconfiguration des champsrdquo De
nouveaux usages apparaissent dans le paysage eacuteducatif mais attention lagrave encore agrave
lrsquoillusion de faciliteacute selon le philosophe Fernando Savater laquo Internet neacuteduque pas il
neacutecessite mecircme une eacuteducation preacutealable raquo Olivier Ertzcheid dans son blog Affordance 27 distingue plusieurs eacuteleacutements caracteacuteristiques drsquoune science 20 et notamment
la possibiliteacute drsquoannoter et commenter des publications scientifiques (notamment les
collections Open Acess Plos One28) ou de nouveaux modes drsquointerrogation des
bases de donneacutees (interface Hubmed sur la base meacutedicale Medline)
copy Digimind Digimind Services ndash White Paper |21
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Marie France Blanquet29 maicirctre de confeacuterence en sciences de lrsquoinformation
distingue le travail coopeacuteratif du travail collaboratif En matiegravere drsquoapprentissage le
travail coopeacuteratif reacutealiseacute par chaque eacutequipe contribue agrave une œuvre collective ougrave le
rocircle de chacun est deacutefini de faccedilon claire Lrsquoapprentissage collaboratif reacutesulte du
travail individuel soutenu par des activiteacutes de groupe ou drsquoeacutequipes de faccedilon souple
et ouverte Ce type de travail se base sur les capaciteacutes de communication et
drsquointeraction de chacun Lrsquoeacutecriture collective des articles composant lrsquoencyclopeacutedie
Wikipeacutedia en est un exemple
Plusieurs expeacuterimentations drsquousage des blogs et podcasts ont eacuteteacute tenteacutees agrave
lrsquoUniversiteacute A Lyon II des eacutetudiants ont pu enregistrer des cours sur un Ipod pour
diffusion en podcast sur leurs blogs A lrsquoUniversiteacute Catholique de Lille les eacutetudiants
de Jean-Paul Pinte30 chargeacute de lrsquoinnovation peacutedagogique doivent alimenter
reacuteguliegraverement un blog Pour ce chercheur speacutecialiste de la veille en eacuteducation le
renouveau des meacutethodes drsquoenseignement se traduit par le rocircles des Enseignants
Connecteurs et eacutetudiants proneacutetaires
Bibliothegraveques
La bibliothegraveque 20 place elle aussi lrsquoutilisateur au centre et ce agrave travers plusieurs
types drsquoexpeacuterimentations de lrsquoutilisation des logiciels de messagerie instantaneacutee
pour eacutechanger avec les utilisateurs agrave lrsquointeacutegration de tags pour enrichir les
catalogues en passant par des interfaces de consultation simplifieacuteeshellip De
nombreux blogs de bibliotheacutecaires (Bibliobsession 31) permettent de suivre lrsquoeacutetat de
lrsquoart La bibliothegraveque de lrsquoUniversiteacute drsquoAlbany est alleacutee jusqursquoagrave publier un manifeste
du bibliotheacutecaire 20 32
copy Digimind Digimind Services ndash White Paper |22
Le Web 20 pour la veille et recherche dinformation DIGIMIND
COMMENT IDENTIFIER UN SITE WEB 20
Est-ce que le site sur lequel vous naviguez ou lapplication que vous utilisez est
Web 20 Quelle importance pourrait-on reacutepondrehellipToutefois un site de cette
geacuteneacuteration offrira plus de possibiliteacutes agrave vous lutilisateur Pour reconnaicirctre un tel
site quelques caracteacuteristiques sont agrave retenir
- le type de site il appartiendra agrave lune des grandes familles citeacutees plus haut il sera
blog bookmark ou reacuteseau social mashup ou page personnalisable bref il permet
de partager et de diffuser du contenu aiseacutement Le site peut ecirctre lui-mecircme une
application Web 2 ou en inteacutegrer des briques Exemple un site Corporate qui
heacuteberge des blogs de ses salarieacutes etou diffuse son actualiteacute via un fils RSS
- le rocircle de lutilisateur le site Web 2 vous permet de participer de personnaliser
et de collaborer vous pouvez en effet ajouter des commentaires eacutecrire un billet
lire un flux RSS noter (voter) ou annoter un article teacuteleacutecharger ou uploader des
images des videacuteos eacutecouter un podcast Ces sites proposent souvent des interfaces
personnalisables couleurs style organisation de laffichage du contenuhellip
- la navigation elle est plutocirct simplifieacutee par rapport aux sites de premiegravere
geacuteneacuteration Les menus sont plus leacutegers un flux RSS est toujours proposeacute et un
nuage de tags est souvent preacutesent
- le testeur cest vous non content de faire apporter une partie de son contenu par
linternaute un service Web 20 fait en plus souvent tester ses applications agrave ses
utilisateurs et est donc freacutequemment en version becircta (voire alpha) une becircta
publique ou priveacutee (linternaute fait alors partie dun petit cercle dinitieacutes dans le
secret des dieux)
copy Digimind Digimind Services ndash White Paper |23
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les applications Web 20
pour la veille et la
recherche dinformations
LES TYPES DAPPLICATIONS
Pour le veilleur et le chercheur dinformation les applications du Web 20 sont
riches tant dans les possibiliteacutes offertes par leurs interfaces que dans le contenu
diffuseacute Mieux connaicirctre ces services permettra de trouver davantage dinformation
(ou autrement) de gagner du temps de mieux partager voire decirctre plus visible sur
le web
Vous laurez compris le web 20 se fonde essentiellement sur la notion de partage
de participation et de collaboration entre les individus Ce nest pas forceacutement
toujours facile possible voire autoriseacute dans le monde professionnel Mais partager
cest aussi agrave terme pouvoir recevoirhellip
I Partager et collaborer
a Les Bookmarks sociaux
Les bookmarks sociaux sont une des applications les plus caracteacuteristiques du Web 2
et en sont preacutecurseurs Apparus en 2004 ces services vous offrent la possibiliteacute de
partager vos bookmarks cest-agrave-dire vos favoris Ainsi apregraves enregistrement le plus
souvent gratuit vous pouvez mettre en ligne tout ou partie de vos favoris (titre
copy Digimind Digimind Services ndash White Paper |24
Le Web 20 pour la veille et recherche dinformation DIGIMIND
adresse et description dune page ou site) et les rendre potentiellement accessibles
aux internautes du monde entier et du moins aux utilisateurs de ce service Vous
avez la possibiliteacute de garder ces favoris priveacutes en ne les partageant quavec vos
proches ou seulementhellipvous-mecircme
Ces applications sont au deacutepart tregraves simples et proposent ensuite suivant les sites
plus ou moins de perfectionnements il suffit dajouter le nom et ladresse (url) de la
page web qui vous inteacuteresse assortis des commentaires de votre choix Ces
adresses web sont rattacheacutees agrave un espace qui vous est personnel auquel vous
acceacutedez en vous identifiant Cet espace personnel est identifiable via une adresse
preacutecise Par exemple sur Delicious33 (de Yahoo) lun des services de bookmarks
sociaux les plus utiliseacutes lurl deacutesignant mes favoris est httpdeliciousslide68 En
naviguant sur Delicious vous pouvez acceacuteder aux favoris mis en ligne par des
collaborateurs amis ou inconnus qui partagent les mecircmes inteacuterecircts et passions que
vous Leurs pages sont eacutegalement identifieacutees par une url unique
Lajout dadresse
Lajout dadresse seffectue en se connectant directement sur le site de
bookmarking social ou plus pratique via une barre ou un bouton deacutedieacutes qui
inteacutegreacutes agrave votre navigateur facilitent lajout du site que vous ecirctes en train de visiter
Vous pouvez eacutegalement trouver des icocircnes sur des pages web vous proposant
dajouter un contenu un site agrave votre service de social bookmaking Peut-ecirctre avez-
vous deacutejagrave rencontreacute ces icocircnes agrave la fin dun billet de blog par exemple (voir
illustration ci-dessous) Ils permettent alors dajouter ladresse du billet agrave un ou
plusieurs services de bookmarks sociaux ainsi quagrave des services dactualiteacutes
collaboratives (nous en reparlerons plus bas)
copy Digimind Digimind Services ndash White Paper |25
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ce blog propose via des icocircnes lajout de ce billet dans les favoris de Delicious ou les services sociaux dactualiteacutes
Lorsque vous ajoutez une adresse vous lui attribuez des tags (voir glossaire) cest-agrave-
dire un ou plusieurs mots cleacutes de votre choix qui vont caracteacuteriser expliquer
contextualiser eacutetiqueter le favori et donc lidentifier de maniegravere simple pour vous et
tous les visiteurs Cest une information qui vient sajouter agrave la traditionnelle
description du site Cest donc vous qui choisissez votre propre mode de
classement de hieacuterarchisation et de labellisation (et non plus un service qui vous
propose de ranger vos ressources dans des cateacutegories preacutedeacutefinies) Cette possibiliteacute
fait partie de ce que lon appelle la folksonomie agrave savoir une taxonomie (science du
classement) populaire en quelque sorte
Ainsi vous pouvez ajouter ladresse du site portail NanotechNow
httpwwwnanotech-nowcom consacreacute aux nanotechnologies et y adjoindre les
tags nano nanotehnologies sciences science research mais aussi pourquoi
pas qualiteacute excellent pour donner votre opinion
copy Digimind Digimind Services ndash White Paper |26
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Des favoris consacreacutes agrave la Chine dans Delicious A droite les tags associeacutes agrave ces bookmarks Les tags
Sur une application typique de social bookmarking (type delicious) il est possible
de rechercher sur le titre des favoris de tous les autres utilisateurs et aussi sur
leurs tags Ainsi en cliquant sur le tag Nanotech vous obtiendrez la liste de tous
les favoris que les internautes ont classeacutes sous ce label Cest lagrave lun des principaux
inteacuterecircts la possibiliteacute de rechercher sur le nom des eacutetiquettes textuelles deacutefinies
par les internautes eux-mecircmes Mais tous les internautes nont pas la mecircme logique
de classement et il est fort possible de passer agrave coteacute de favoris inteacuteressants mais
eacutetiqueteacutes selon un mot auquel vous nauriez jamais penseacute De plus un mecircme mot
peut avoir plusieurs sens ou ecirctre employeacute diffeacuteremment selon les individus
Delicious a reacutesolu ndashpartiellement- ce problegraveme en offrant la possibiliteacute de deacutecrire
ses tags cest agrave dire de les expliquer (par orange je parle de la couleur ou de la
production dagrumes en Floride) Cest donc un deacutebut de seacutemantique appliqueacute agrave
cette folksonomie Quoiquil en soit le problegraveme du sens des mots employeacutes par
les creacuteateurs de contenu concerne lensemble du web Lorsque vous ne trouvez
pas un site via une requecircte sur un outil de recherche et que ce site existe pourtant
bel et bien cest souvent parce que vous nemployez pas les mecircmes mots cleacutes que
ceux utiliseacutes par le creacuteateur du site dans son texte
Les tags peuvent eacutegalement sappliquer agrave des photos (Flickr) agrave des projets
(43Things) ou des videacuteos (YouTube DailyMotion) Ils peuvent servir aussi agrave eacutetiqueter
et cateacutegoriser les billets dun blog
copy Digimind Digimind Services ndash White Paper |27
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les communauteacutes
Lautre atout des bookmarks sociaux pouvoir constituer et se connecter avec
une communauteacute de speacutecialistes Par speacutecialiste on deacutesignera simplement un
internaute qui centre ses recherches sur les mecircmes sujets que vous quil soit
amateur ou professionnel
Exemple Votre domaine ce sont les biotechnologies En entrant la requecircte
Biotechnologies sur le moteur de recherche de Delicious vous obtenez une liste
de plusieurs milliers de favoris Pour chacun dentre eux est indiqueacute le nombre de
personnes qui ont sauvegardeacute cette mecircme adresse En seacutelectionnant lun de ces
utilisateurs vous pouvez deacutecouvrir un internaute qui comme vous reacuteguliegraverement
ajoute des adresses de sites deacutedieacutes ou connexes aux biotech Il ne vous reste plus
quagrave mettre en surveillance ce membre de delicious Il disposera en effet de sa
propre adresse XML Exemple httpdeliciousrssvantive98 Vous serez alors
averti degraves lors que cet utilisateur ajoute un favori agrave sa page
La valeur des outils de social bookmarking est encore plus probante lorsquils sont
deacutedieacutes agrave des communauteacutes de pratiques ou agrave des secteurs dactiviteacutes bien preacutecis
Plusieurs initiatives ont deacutejagrave eacuteteacute mises en ligne34 On peut citer Connotea eacutediteacute par
la ceacutelegravebre revue Nature et donc destineacute agrave un public scientifique Lors de la mise en
favoris ce service extrait automatiquement les reacutefeacuterences bibliographiques
lorsquelles sont issues de sites tels que Nature Science ou PubMed Plus ancien
CiteUlike est baseacute sur le mecircme principe mais est compatible avec davantage de
revues scientifiques encore Snipitron est lui deacutedieacute aux chercheurs eacutetudiants et
professionnels Ici vos bookmarks font partie dun projet qui seacutecoule dans le temps
concernant une recherche ou une tacircche preacutecise
Linteacuterecirct des bookmarks sociaux est donc dabord dans lutilisation de la
communauteacute afin de trouver des sources pertinentes Ce type doutil reacutevegravele toute
sa puissance lorsquun utilisateur proche de vous en terme de domaines de veille a
eacuteteacute identifieacute Vous pouvez donc alors lutiliser comme collaborateur virtuel mais
aussi rechercher parmi les sources jugeacutees pertinentes par un groupe dutilisateurs
identifier des leaders de veille ou juger de la populariteacute dune source (combien de
fois a-t-elle eacuteteacute mise en favoris Ce nombre de sauvegardes neacutetant quun indicateur
parmi dautres) Si vous ne partagez pas ces outils restent toutefois un tregraves bon
moyen de meacutemoriser et cateacutegoriser vos favoris en un point unique daccegraves
copy Digimind Digimind Services ndash White Paper |28
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Quel service
Il existe plusieurs dizaines de services de bookmarks sociaux Ils proposent des
fonctionnaliteacutes plus ou moins sophistiqueacutees Un des critegraveres essentiels de choix est
leur succegraves En effet leur force repose en grande partie sur le nombre de favoris
dutilisateurs partageacutes agrave moins de freacutequenter des bookmarks deacutedieacutes agrave des
communauteacutes tregraves cibleacutees Dautre part la rapiditeacute du service et la pertinence de
son moteur de recherche sont aussi des paramegravetres importants
Delicious qui appartient agrave Yahoo est lun des plus connus et des plus utiliseacutes Yahoo
MyWeb2 rassemble eacutegalement une grande communauteacute ainsi que Furl ou encore
Blogmarks et Blinklist35 Certains de ces sites au-delagrave de larchivage de ladresse
proposent de conserver une copie inteacutegrale dune page web Dautres vous
suggegraverent des sites similaires agrave ceux que vous avez mis dans vos favoris Cette
similariteacute se base notamment sur les favoris ajouteacutes par les autres utilisateurs La
recherche par similariteacute (ou par suggestion en fonction de vos habitudes de
navigation) offerte par des services comme Yoono StumbleUpon ou Similicious 36 est
une meacutethodologie de recherche particuliegraverement inteacuteressante Nous en reparlerons
plus loin
Pour choisir preacuteciseacutement votre service de bookmarks sociaux vous pouvez vous
aider de ces ressources 37
- le site Irox propose un tableau comparatif de pregraves de 20 services
- le blog de Robin Good offre une seacutelection inteacuteressante de bookmarks sociaux
- la page Free Bookmark Managers affiche une liste dune quarantaine de logiciels et
utilitaires deacutedieacutes au partage et agrave la gestion de vos favoris (bookmarks) en ligne via
accegraves distant en local ou sur serveur Attention tous ne sont pas sociaux cest-agrave-
dire baseacutes sur le partage
copy Digimind Digimind Services ndash White Paper |29
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b Le Multimeacutedia photos et videacuteos
Le partage de vos ressources ne se limite pas au texte et adresse de sites Il est
eacutegalement possible de partager vos photos et videacuteos
Les images
Flickr 38 racheteacute par Yahoo Inc en 2005 est lapplication type de partage dimages
voire mecircme larcheacutetype du service Web 20 ce site permet de mettre en ligne ses
photos de les partager avec ses proches ses collegravegues ou de les laisser en accegraves
priveacute
Il est possible dutiliser un moteur pour rechercher agrave travers les millions de photos
mises en ligne par les autres utilisateurs
Flickr na pas de points communs avec les nombreuses applications Web 2 en becircta agrave
linterface artisanale Sur le service de Yahoo la puissante interface en fait un outil
tregraves simple agrave utiliser Ainsi via le menu Organize vous pouvez acceacuteder agrave une
veacuteritable table de montage virtuelle pour organiser vos photos
copy Digimind Digimind Services ndash White Paper |30
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche sur Flickr A droite les noms dutilisateurs et les tags associeacutes aux photos
Comme sur les bookmarks sociaux la recherche peut seffectuer sur le titre ou la
description mais aussi sur les tags chaque internaute qui partage ses photos leur
attribue des mots cleacutes pour les deacutefinir les expliquer les contextualiser voire donner
son opinion
Chaque liste de reacutesultats chaque photo est accompagneacutee par ses tags Ceux-ci
permettent aussi daffiner ou deacutelargir votre recherche lorsque vous en seacutelectionnez
un Il est possible de rechercher sur les photos les utilisateurs mais aussi sur les
groupes En effet la notion de communauteacute est eacutegalement importante Les
groupes rassemblent les utilisateurs qui partagent les mecircmes centres dinteacuterecirct
photographiques Des forums de discussions sont inteacutegreacutes agrave ces groupes
permettant dentrer en contact direct avec certains membres
copy Digimind Digimind Services ndash White Paper |31
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Par exemple le groupe The Eyes Have It 39 rassemble les utilisateurs (et donc leurs
photos) autour du thegraveme de la communication visuelle des secteurs pharmacie et
biotech
Que peut trouver le veilleur sur un service de photos tel que Flickr
Finalement la mecircme chose que sur les bookmarks sociaux tout ce que les
membres ont voulu partager des photos du dernier salon automobile de Detroit 40
ou de la convention annuelle des industries cosmeacutetiques dAmeacuterique du Nord La
veille concurrentielle ou la veille image sur votre propre socieacuteteacute est eacutegalement
inteacuteressante Ainsi une recherche (full text) sur la socieacuteteacute peacutetroliegravere Exxon affiche
plus de 1400 photos relatives aux stations services aux puits de peacutetrole aux
raffineries aux employeacutes aux manifestions de contestataires ou aux publiciteacutes
deacutetourneacutees
Comme avec le social bookmarking vous pouvez vous attacher agrave suivre les
membres qui partagent les mecircmes centres dinteacuterecirct que vous ou votre organisation
apregraves seacutelection de la page de lutilisateur la mise en surveillance de son flux RSS
permet decirctre averti degraves que cette personne ajoute de nouvelles photos
Dautres services permettant le partage de photos existent Toutefois ils ne vont
pas aussi loin que Flickr dans la logique Web 20 Le service PhotoBucket 41 est le
grand concurrent de Flickr mais avec une approche plus grand public Flickr est
davantage freacutequenteacute par des internautes avertis des professionnels et des
passionneacutes de photographie En ce sens le service de Yahoo sera donc plus
inteacuteressant pour le veilleur
Squidoo 42 est en quelque sorte un annuaire de bookmarks perfectionneacute une
rencontre de services sociaux comme Delicious et Flickr Squidoo vous permet en
effet de creacuteer une page de liens dans un domaine qui vous passionne et de la
structurer en rubriques agreacutementeacutees de photos
Linterface simple rend possible la creacuteation rapide de pages speacutecialiseacutees (appeleacutees
lensgtobjectifs lentilles) et de les rendre visible agrave tout un chacun On trouve par
exemple plusieurs lens consacreacutees aux nanotechnologies43 Chaque lens est
accompagneacutee de tags connexes agrave son sujet
Vous pouvez rechercher ces pages gracircce agrave un moteur de recherche un reacutepertoire
par cateacutegories un nuage de tags (exemple le tag Marketing 44) ou mecircme parcourir
le Top100
copy Digimind Digimind Services ndash White Paper |32
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La videacuteo
Via les services YouTube ou DailyMotion le partage de videacuteos en ligne est plus
meacutediatiseacute que les services de photos Notamment parce que le leader Google a
racheteacute YouTube en octobre 2006 geacuteneacuterant un buzz sans preacutecegravedent au sein des
blogs et de la presse traditionnelle (Mainstream medias)
YouTube 45 et ses concurrents Web 20 fonctionnent agrave peu pregraves de maniegravere
eacutequivalente agrave Flickr sans en atteindre toutefois sa clarteacute ergonomique
Tout ces sites de videacuteos vont permettre drsquouploader (charger vers le site) et
partager vos videacuteos (converties automatiquement au format FlashVideo) et aussi
bien sucircr de rechercher parmi les videacuteos des autres utilisateurs
Sur ces applications on retrouve de nombreuses caracteacuteristiques du Web 2 les
videacuteos classeacutees par cateacutegories sont accompagneacutees de tags qui aident agrave les
contextualiser et les deacutecrire en plus du titre et de la description renseigneacutes par
lutilisateur Un fils RSS permet de surveiller lajout de videacuteos dans une cateacutegorie ou
par un utilisateur deacutefini A linstar des billets dun blog les internautes peuvent
commenter les videacuteos De plus les videacuteos sont noteacutees ce qui impacte ensuite leur
place dans le classement et donc leur visibiliteacute
Ces services contiennent des favoris inteacutegreacutes ougrave lon peut sauvegarder ses videacuteos
preacutefeacutereacutees Il est possible de partager sa videacuteo par mail ou messagerie instantaneacutee
de la poster sur son blog Dailleurs de nombreux blogueurs utilisent les services de
type YouTube (ou Flickr pour la photo) pour stocker leurs fichiers multimeacutedias trop
volumineux pour les heacutebergeurs de blogs La notion de groupe comme sur Flickr
est preacutesente des communauteacutes rassemblent des utilisateurs autour de grandes
theacutematiques lieacutees par exemple agrave la politique aux sports et aux voyages
YouTube a de nombreux concurrents aux fonctions tregraves proches Impossible de
tous les mentionner Mais on peut retenir cependant le franccedilais DailyMotion 46 tregraves
populaire dailleurs neacute quelques semaines avant YouTube Citons eacutegalement Yahoo
Videos AOL Videos Revver Grouper (de Sony) Metacafe SoapBox (de Microsoft)
Zudeo Wideo MySpace Vimeo 47Certains de ces services proposent du contenu
amateur ainsi que des films professionnels issus des networks de TV et de cineacutema
Mais les plus petits services se cantonnent aux videacuteos envoyeacutees par linternaute que
celles-ci aient dailleurs eacuteteacute copieacutees ou non
copy Digimind Digimind Services ndash White Paper |33
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche sur DailyMotion
Quel contenu agrave usage professionnel le veilleur peut espeacuterer trouver sur ces
plateformes Essentiellement des videacuteos consacreacutees agrave des socieacuteteacutes et individus
Ainsi si je reacuteitegravere ma recherche sur la socieacuteteacute peacutetroliegravere Exxon jobtiens des videacuteos
sur des manifestations des mareacutees noires le reacutechauffement climatique des
actualiteacutes boursiegraveres des retransmissions de procegraves des deacutetournements de
publiciteacutehellipLa recherche de videacuteos saverra particuliegraverement utile pour une veille
Image Produits ou concurrentielle Le contenu de videacuteos est eacutegalement souvent
tregraves politique agrave partir de la campagne des eacutelections preacutesidentielles franccedilaises de
2007 la diffusion de videacuteos sur les hommes et femmes politiques est devenue une
veacuteritable arme Autre aspect inteacuteressant la possibiliteacute de deacutecouvrir de nombreux
extraits de videacuteos de documentaires sur des sujets extrecircmement varieacutes eacutecologie
industrie socieacuteteacute consommation
Le contenu de ces services de videacuteos est donc agrave limage du net heacuteteacuterogegravene mais
potentiellement riche
copy Digimind Digimind Services ndash White Paper |34
Le Web 20 pour la veille et recherche dinformation DIGIMIND
c Partage de CV et reacuteseaux sociaux
Termineacute le temps ou seules les personnes agrave qui vous transmettiez votre CV ou
votre carte de visite pouvaient prendre connaissance de votre identiteacute et de votre
parcours professionnel Via les plateformes de reacuteseaux sociaux le push fait place au
pull de plus dans une optique de cooptation et de recommandation il y est
possible de mettre son CV en ligne sous format hypertexte et de demander agrave
rentrer en relation avec des proches de votre reacuteseau immeacutediat Les plateformes de
reacuteseaux sociaux sont nombreuses certaines sont agrave vocation geacuteneacuteraliste dautres
uniquement deacutedieacutees aux actifs dautres encore reacuteserveacutees agrave une communauteacute
(eacutetudiants lyceacuteens anciens eacutelegraveves passionneacutes de voyages)
Ces applications repreacutesentent un marcheacute conseacutequent puisque pour les seuls USA
on preacutevoit un chiffre daffaires des reacuteseaux sociaux de 25 milliards de dollars agrave
lhorizon 2011 contre 350 millions en 200648 La France est domineacutee par la
plateforme Viadeo (ex-Viaduc)49 Ce service leader lanceacute en 2004 compte plus de
750 000 profils Dans les autres pays cest LinkedIn 50 qui domine geacuteneacuteralement
avec plus de 9 millions dutilisateurs dans 135 pays
Une recherche sur Viadeo
copy Digimind Digimind Services ndash White Paper |35
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les fonctionnaliteacutes
Que trouve-t-on sur ces sites Notamment des profils de personnes en activiteacute ou
en recherche demploi ainsi que des hubs regroupant des utilisateurs autour dun
mecircme centre dinteacuterecirct toujours la notion de communauteacutes de pratiques propre au
Web 20 Sur ces services tout est penseacute pour creacuteer du lien social Le profil
individuel se constitue dun CV enrichi de nombreux liens vers ses employeurs ses
amis ses reacuteseaux professionnels et associatifs ses travaux et publications Les hubs
regroupent les personnes autour de secteurs meacutetiers associations danciens eacutelegraveves
pays reacutegions Par exemple sur Viadeo saffichent les hubs Analyse Veille
Strateacutegique amp Concurrentielle Intelligence Eco Blogs amp Bloggers Editeurs de
Logiciels Profession documentaliste and co mais aussi Grande distribution
Oceacuteanie ou Normes meacutethodes et outils Dans ces hubs des forums organisent les
discussions des membres autour de theacutematiques deacutefinies Un moteur de recherche
permet de trouver des profils selon un secteur une fonction une reacutegion Une fois
un profil identifieacute il faut demander agrave entrer en relation avec lui Cela sera dautant
plus facile et rapide sil est peu eacuteloigneacute de votre propre reacuteseau de contacts
La veille
Linteacuterecirct pour le professionnel de linformation est double il peut augmenter sa
visibiliteacute et celle de certains de ses projets services publications thegraveses ou articles
Dautre part il peut rechercher des donneacutees sur des personnes et entreprises ou
identifier un expert Comme sur dautres services Web 20 il est facile de se
constituer une communauteacute dutilisateurs partageant ses centres dinteacuterecirct que lon
visitera reacuteguliegraverement Ainsi sur Viadeo une recherche sur le secteur Agro-
alimentaire avec le mot cleacute veilleur 1 affiche plus de 50 reacutesultats avec les fonctions
entreprises et synthegraveses de parcours des membres Vous pouvez alors entrer en
relation avec ces personnes ou tout simplement collecter des donneacutees sur celles-ci
et leurs reacuteseaux Ces sites sont dailleurs devenus un outil essentiel pour certaines
fonctions commerciaux pour la prospection recruteurs journalistes
ethellipresponsables de casting pour eacutemissions TV
1 Certaines fonctionnaliteacutes avanceacutees sont payantes
copy Digimind Digimind Services ndash White Paper |36
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les autres reacuteseaux
Parmi les autres services de reacuteseaux sociaux outre LinkedIn davantage tourneacute agrave
linternational il existe assez utiliseacutes en France 6nergiesnet et Xing (ex Open BC)51
Les reacuteseaux ciblant plus particuliegraverement les jeunes (FaceBook MySpace) peuvent
eacutegalement ecirctre utiliseacutes MySpace feacutedegravere plus particuliegraverement des professions de la
communication de la publiciteacute et des meacutetiers multimeacutedias
Le reacuteseau FaceBook52 est original ce site nord-ameacutericain est preacutecurseur dun social
networking tregraves segmenteacute reacuteserveacute aux eacutetudiants et aux lyceacuteens Au deacutepart les
membres devaient sinscrire obligatoirement via lemail de leur universiteacute afin de
garantir lauthenticiteacute des profils et donc le seacuterieux de la communauteacute Depuis
FaceBook sest ouvert aussi aux entreprises Ainsi ce site capte tregraves tocirct les futurs
actifs et les fideacutelise
Des ressources
Certaines ressources peuvent vous aider agrave identifier les plateformes de reacuteseaux
sociaux professionnels utiles pour vos recherches Le wiki List of social networking
websites liste de nombreuses plateformes de reacuteseaux sociaux 53 et le site Link n
Rank cateacutegorise des sites de social networking 54
copy Digimind Digimind Services ndash White Paper |37
Le Web 20 pour la veille et recherche dinformation DIGIMIND
d Les sites dactualiteacutes collaboratives recommandation et notation
Ces sites recouvrent en fait diffeacuterents types dapplications
- Les Digg Like Ces services qui sinspirent tous du preacutecurseur Digg55 recueillent des actualiteacutes
proposeacutees par les internautes Le principe apregraves enregistrement un formulaire
simple vous permet de poster lactualiteacute de votre choix susceptible dinteacuteresser les
autres internautes son titre son url sa description Il faut aussi choisir une
cateacutegorie Par exemple Technologies Sciences Monde Affaires Divertissement Ces
cateacutegories peuvent ecirctre subdiviseacutees en theacutematiques plus fines Lactualiteacute si elle est
valideacutee par les modeacuterateurs apparaicirctra alors en ligne Elle sera noteacutee par les autres
internautes qui votent pour elle selon son inteacuterecirct Les actualiteacutes disposant du plus
grand nombre de points se placent alors en haut du classement
La cateacutegorie Sciences sur Digg A gauche les nombres de votes
Ces sites affichent les principales caracteacuteristiques du Web 20 interface eacutepureacutee
possibiliteacute de laisser des commentaires fils RSS pour surveiller les nouvelles
actualiteacutes classement des articles les plus lus les mieux noteacutes possibiliteacute denvoyer
par mail ou de bloguer un article et bien sucircr forte contribution de linternaute Sur
certains sites leacutetiquetage des articles via le systegraveme de tags est proposeacute
copy Digimind Digimind Services ndash White Paper |38
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Linteacuterecirct est de pouvoir positionner certaines informations les unes par rapport aux
autres et connaicirctre la populariteacute dune actualiteacute ou dun sujet (entreprise personne)
abordeacute (la critique de mon produit est-elle tregraves populaire ) Cest une approche
alternative aux agreacutegateurs de news de type Google Actualiteacutes ou Yahoo Actualiteacutes
qui hieacuterarchisent les news avec de puissants algorithmes mais sans recourir agrave
lhumain Ainsi Google Actualiteacutes preacutecise La seacutelection et le positionnement des
articles de cette page ont eacuteteacute reacutealiseacutes automatiquement par un programme
informatique
En outre sur ces services de type Digg linformation nest pas brute linternaute
qui poste lactualiteacute peut selon son expertise y apporter un commentaire de
valeur Linformation peut ecirctre commenteacutee (en plus du vote) par les autres
internautes Comme de nombreux blogueurs les utilisateurs des Digg Like jouent
aux journalistes ou tout simplement donnent leur opinion
Lorsquil sagit dactualiteacutes concernant le produit ou le service dune socieacuteteacute ces
commentaires positifs ou non sont une veacuteritable manne pour de nombreux
professionnels de linformation veilleurs marketeurs chargeacutes deacutetudes et autres
analystes qui vont pouvoir recueillir agrave moindre frais des informations sur leur
nouveau produit leurs clients ou ceux de la concurrence
Digg est lun des sites les plus copieacutes du Web 20 Sil reste la reacutefeacuterence dautres
applications tregraves largement inspireacutees tirent leur eacutepingle du jeu En France Scoopeo
Fuzz et TapeMoi offrent eux aussi des services dactualiteacutes collaboratives On peut
eacutegalement citer Rojo le canadien Niouz lespagnol Meneames le reacuteseau de sites
BlogMemes 56 Mecircme Netscape pionnier du navigateur web a lanceacute un portail
sinspirant du systegraveme de notation de Digg
On peut reprocher agrave ce type de site de favoriser les cateacutegories techniques et
scientifiques faisant la part belle aux contributions des geeks et autres accrocs du
net grands utilisateurs de services Web 2 Toutefois les sites comme Blogmemes ou
Netscape diffusent davantage dactualiteacutes agrave teneur eacuteconomique et sociale
- Les mix actualiteacutes contributions des internautes
Wikio57 est un service dorigine franccedilaise (creacuteeacute par le fondateur de Kelkoo) agrave
lintersection de Google Actualiteacutes et de Digg En effet Wikio mixe les articles issus
de sites dactualiteacutes de blogs avec des contributions des internautes On peut
prendre connaissance des informations de diffeacuterentes maniegraveres
copy Digimind Digimind Services ndash White Paper |39
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- En naviguant via les theacutematiques (France International Politique Economie
Finance Santeacute Science hellip) ou via le nuage de tags dynamiques qui se modifient en
fonction de la rubrique ou vous vous situez
- En recherchant via le moteur
- En sabonnant aux flux RSS agrave chaque cateacutegorie et agrave chaque tag correspond son
flux RSS De mecircme lorsque vous lancez une requecircte via le moteur vous pourrez
surveiller ces reacutesultats via un flux RSS
- les plateformes de contributeurs indeacutependants
La deacutefiance et la volonteacute dindeacutependance vis-agrave-vis des grands meacutedias traditionnels de
la presse eacutecrite et audio-visuelle se sont traduites degraves 2001 par la creacuteation massive
de blogs Les blogueurs sont-ils et peuvent-ils simproviser journalistes Ce deacutebat
qui promet decirctre sans fin est inteacuteressant De nombreux blogueurs (mais pas la
majoriteacute) sont devenus de veacuteritables experts dans leur domaine agrave force deacutecriture
de lecture et danalyses quotidiennes Ainsi les mainstream medias invitent
maintenant dans leurs colonnes et plateaux les blogueurs les plus talentueux
Ces blogueurs experts ou professionnels ne constituent pas les seuls creacuteateurs
dactualiteacutes alternatives
Des initiatives de plateformes dactualiteacutes eacutecrites par des non professionnels ont
aussi vu le jour Agoravox58 est lun des premiers portails de journalisme citoyen
lanceacute par Joeumll de Rosnay et Carlo Revelli 59 en mai 2005 Agoravox permet aux
internautes de proposer leurs articles pour commenter reacutefleacutechir agrave des sujets
dactualiteacutes si possible avec une approche et un regard diffeacuterents des meacutedias
traditionnels Le format des contributions est multimeacutedia Le site explique Tout le
monde peut devenir reacutedacteur drsquoAgoraVox Il nrsquoest pas neacutecessaire de savoir eacutecrire avec
un style journalistique affirmeacute Chacun drsquoentre nous peut devenir une sorte de capteur
en temps reacuteel de ce qui se passe dans notre entourage en fournissant des articles des
images des extraits videacuteo ou audio Ce qui est important crsquoest de pouvoir teacutemoigner
drsquoun eacuteveacutenement auquel vous avez assisteacute ou que vous avez deacutecouvert en faisant des
recherches Il poursuit Pourquoi devenir reacutedacteur Tout simplement pour faire
entendre votre voix et pour relater des faits que vous avez identifieacutes et qui ne vous
paraissent pas ecirctre suffisamment repris dans les meacutedias traditionnels voire ignoreacutes ou
censureacutes
Agoravox encourage donc agrave utiliser son style personnel Il convient de sinscrire pour
devenir reacutedacteur Les articles doivent toutefois obeacuteir agrave une politique eacuteditoriale60
Un comiteacute de reacutedaction valide ensuite les contributions
copy Digimind Digimind Services ndash White Paper |40
Le Web 20 pour la veille et recherche dinformation DIGIMIND
En quelques mois Agoravox a prouveacute que de simples internautes pouvaient ecirctre
aussi bon reacutedacteurs et experts en fonction de leurs profession passion et
centres dinteacuterecirct agrave linstar des blogueurs professionnels
Agoravox na pas la vocation dun agreacutegateur dactualiteacutes de type Digg Wikio ou
Google News Cest une sorte de quotidien qui privileacutegie les articles de fond et
lanalyse Bien sucircr des reacutedacteurs stars eacutecrivent reacuteguliegraverement et leurs articles
sont attendus Mais ce ne sont pas les rubriqueurs traditionnels des autres meacutedias
Comme sur les autres sites Web 20 le lecteur peut attribuer une note dinteacuterecirct agrave
chaque article et poster un commentaire Enfin leacutetonnante technologie
ReadSpeaker 61 permet de retranscrire automatiquement tous les textes en version
audio
Agoravox nest pas le seul exemple de site de journalisme citoyen Le portail
OhMyNews 62 initiative coreacuteenne est baseacute sur le mecircme principe Lanceacute en feacutevrier
2000 le reacuteseau international OhMyNews reacuteunit plus de 40 000 reacutedacteurs
Pour le veilleur ces sites dactualiteacutes collaboratives constituent des sources
dinformations alternatives avec une partie de lactualiteacute issue des organes et
agences de presse et lautre partie provenant des internautes Dautre part ces
nouveaux meacutedias permettent de deacutecouvrir et surveiller des experts voire des
leaders dopinion
Un article sur Agoravox A droite une preacutesentation de son auteur En haut la possibiliteacute de voter et
commenter larticle
copy Digimind Digimind Services ndash White Paper |41
Le Web 20 pour la veille et recherche dinformation DIGIMIND
II Rechercher Collecter
Doreacutenavant tout internaute peut creacuteer et publier sa propre information
Lidentification des sources dinformation et de linformation elle-mecircme est devenue
complexe car elles sont de plus en plus morceleacutees et atomiseacutees Il convient
dutiliser une large palette doutils de recherche pour collecter les donneacutees en
provenance des blogs des bookmarks et reacuteseaux sociaux Pour faciliter la
collecte il est en outre possible de verticaliser la recherche et de faire appel agrave des
humains Par ailleurs dautres outils permettent darchiver ses deacutemarches de
requecirctes et de navigation
a La recherche de blogs et de flux RSS
Le volume de blogs est en constante croissance sur le net Le nombre de blogs a
litteacuteralement exploseacute sur toute la planegravete Estimeacute agrave 70 millions agrave leacuteteacute 2005 ils sont
eacutevalueacutes agrave plus de 120 millions en mars 2007 Technorati lun des moteurs de
recherche de blogs les plus utiliseacutes mesure en 2007 un doublement du nombre de
blogs tous les 320 jours 120 000 blogs seraient ainsi creacuteeacutes chaque jour 63
Europe
33
Afrique 15 000
Ameacuterique du Nord
33
Ameacuterique du Sud
1
Asie
55
5 Australie 790 000
copy Digimind Digimind Services ndash White Paper |42
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Nombre de blogs en milliers et millions (la Russie est inteacutegreacutee dans lAsie) Estimation DIGIMIND Services 64
Les fils RSS omnipreacutesents A chaque blog correspond son flux RSS ce format qui permet dextraire et de
surveiller tout nouveau contenu qui parait sur le blog Si un vrai blog implique
toujours un flux RSS un flux RSS ninduit pas forceacutement un blog En effet le RSS et
son concurrent Atom sont preacutesents sur de plus en plus de type de meacutedias et outils
internet degraves lors que leur contenu est appeleacute agrave se modifier reacuteguliegraverement
On pourra donc trouver des flux RSS sur
-les blogs
-les sites de presse et dactualiteacute Exemple Les Echos Libeacuteration La Tribune Le
Figaro)
-les sites de revues et magazines speacutecialiseacutes Exemple La revue Nature propose ses
fils RSS concernant ses publications speacutecialiseacutees par domaines Science fait de
mecircme65
-les sites corporate des entreprises page dactualiteacutes catalogues produits (Ex Air
Liquide)
-les reacutesultats de moteurs de recherche de blogs Tous proposent des flux RSS
permettant de surveiller une requecircte (Technorati Google Blog Search Feedster
IceRockethellip)
-les pages de reacutesultats de moteur de recherche web Certains de ces moteurs
geacutenegraverent un flux RSS permettant de surveiller lapparition de nouveaux reacutesultats
pour une requecircte donneacutee
MSN Search (devenu Live Search66) le proposait depuis janvier 2005 et chaque page
de reacutesultats offrait une icocircne orange en bas de page permettant dobtenir des fils
RSS Cette icocircne RSS a disparu sur Live Search mais les flux RSS sont toujours lagrave (ils
sont deacutetectables automatiquement avec un navigateur Firefox Maxthon IE7 ou
votre lecteur RSS Attensa ou RSS Bandit par exemple)
Depuis peu Yahoo Search Web 67 offre lui aussi un fils RSS sur ses reacutesultats lagrave
encore deacutetectable via un lecteur ou navigateur (cela fonctionne uniquement pour le
Yahoo US)
copy Digimind Digimind Services ndash White Paper |43
Le Web 20 pour la veille et recherche dinformation DIGIMIND
-les moteurs dactualiteacutes La majoriteacute des portails qui agregravegent des flux dactualiteacutes
proposent des flux RSS Exemple Google Actualiteacutes Yahoo Actualiteacutes Topix MSN
Actualiteacutes Wikiohellip 68
-les Newsgroups Usenet (groupes de discussion) Les fils RSS sont en effet aussi
preacutesents sur Google Groupes (ou Google Groups) ce qui rend plus aiseacute la surveillance
des discussions Chaque groupe (Google ou Usenet) affiche un fils RSS ou Atom 69
(et ce quelque soit la langue) signaleacute par le logo orange RSS en bas de page
-certains forums web Exemple Forum Mobiles 70
-certaines listes de diffusion elles peuvent ecirctre surveilleacutees via labonnement agrave leur
flux RSS Cela eacutevite lengorgement de votre boicircte mail Exemple la liste Veille sur
Yahoo Groupes 71 dispose dun flux RSS
-les bookmarks sociaux Delicious Yahoo MyWeb2 Blogmarks 72hellipLe fils RSS
permet decirctre alerteacute de lajout de nouveaux favoris pour un tag ou un utilisateur
deacutefinis
-les plateformes de partage de photos Exemple Flickr PhotoBucket 73
-les services de partage de videacuteos comme YouTube DailyMotion 74 pour ecirctre alerteacutes
des nouveauteacutes
-de tregraves nombreux sites offrant un contenu qui se renouvelle
copy Digimind Digimind Services ndash White Paper |44
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Veille Corporate La Tribune propose des flux RSS segmenteacutes par socieacuteteacutes
Le veilleur via ces flux RSS pourra surveiller de nombreuses sources
dinformations Par ailleurs au-delagrave des blogs introspectifs dadolescents dont peu
preacutesentent un inteacuterecirct pour les professionnels certains types de blogs peuvent se
reacuteveacuteler utiles
-Le blog dactualiteacute et dopinion preacutesentant reacuteflexions et critiques de journalistes et
internautes
-Le blog theacutematique eacutediteacute par des passionneacutes experts professionnels consultants
et techniciens
-Le blog dentreprise outil de communication externe ou interne agrave linitiative des
salarieacutes ou des dirigeants
copy Digimind Digimind Services ndash White Paper |45
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les outils pour trouver des blogs et flux RSS Sur ces moteurs la recherche seffectue par mots cleacutes classiques ou par tags comme
sur Technorati par exemple Le contenu indexeacute (blogs et flux) est tregraves heacuteteacuterogegravene
Aussi lutilisation de la recherche avanceacutee sur ces outils est souvent neacutecessaire En
effet un blog peut avoir abordeacute la theacutematique deacuteveloppement durable 1 seule fois
parmi ses 4500 billets Il conviendra donc alors de centrer sa recherche sur le titre
du blog ou son url
Les moteurs
Certains moteurs sont deacutedieacutes agrave la recherche de blogs Cest en fait un abus de
langage Ces moteurs se focalisent sur la recherche de flux RSS mais ne peuvent
faire la diffeacuterence entre un flux provenant dun grand journal et celui dun blog
Ainsi le moteur Technorati classe parmi les blogs les plus populaireshellipLe Figaro
Pour mener une recherche efficace il conviendra dutiliser plusieurs moteurs Car
comme pour la recherche web ougrave il ne faut pas se limiter agrave Google au risque de
manquer pregraves de 85 des reacutesultats75 la recherche sur les blogs neacutecessite lemploi
de plusieurs outils76 En voici quelques-uns
gt Google Blog Search Recherche de blogs Google applique sa technologie puissante
aux flux RSS et blogs Linterface est notamment disponible en franccedilais et en anglais
Le moteur est doteacute de fonctions de recherche avanceacutee (recherche sur le titre le
billet recherche par ancienneteacutehellip)
gt Ask Blog amp Flux Ce moteur permet de rechercher parmi les blogs les flux XML
(RSS ou Atom) Et aussi de sabonner agrave un blog ou un flux RSS
gt Feedster Ce moteur recense plus de 900 000 sources et 5000 sont rajouteacutees
chaque jour
gt BlogPulse Indexe plus de 46 millions de blogs
gt Technorati Ce moteur rafraicircchit son index toutes les 5 agrave 15 minutes et
recherche parmi plus de 70 millions de blogs (en avril 2007 77) ou sites proposant
des flux RSS Il est possible de rechercher par mots cleacutes ou par tags
gt Sphere va prendre en compte plusieurs variables pour mieux chercher parmi la
blogosphegravere
- comme pour le contenu web classique les reacuteseaux de liens entrants et sortants
- la qualiteacute de ces liens
copy Digimind Digimind Services ndash White Paper |46
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- les internautes agrave lorigine de ces liens (simple commentateurs ou leaders dopinion)
3 moteurs web integravegrent la recherche sur les blogs au sein de leur recherche
avanceacutee 78
gt Yahoo Search
Pour centrer sa recherche sur les flux RSS et les blogs il convient drsquoaller dans la
recherche avanceacutee (agrave droite de la boite de requecircte) puis dans le menu deacuteroulant
Format de fichiers et de seacutelectionner le format RSSXML
gt Exalead
Apregraves avoir effectueacute votre recherche il suffit de cliquer sur le bouton RSS jaune
dans la fenecirctre Preacuteciser la recherche Au sein des reacutesultats de recherche le flux
RSS est disponible via licocircne RSS Simple et propre
gt Microsoft MSN Live Search
MSN a ameacutelioreacute les interfaces de son moteur pour restreindre la recherche sur les
fils RSS Apregraves laffichage de votre page de reacutesultats vous pouvez affiner votre
recherche gracircce au bouton Flux (ou Feed en anglais) Ce bouton est accessible via
le menu Plus Au sein des reacutesultats de recherche sont alors disponibles lurl du flux
le cache et un lien pour sinscrire au fils RSS
Au-delagrave de ces moteurs speacutecialiseacutes il peut ecirctre beacuteneacutefique de tenter une recherche
sur un moteur Web (Google ou Yahoo Search par exemple) de type blog OR RSS
[votre sujet] Exemple blogs sur les teacuteleacutecoms Cela vous permettra non pas de
chercher au sein des blogs mais de trouver dautres blogs
Les reacutepertoires 79
Comme pour le web un certain nombre dannuaires entendent recenser les blogs
et fils RSS Attention comme la blogosphegravere est tregraves mouvante et en constante
croissance ces guides sont par nature non exhaustifs et leur mise agrave jour reacuteguliegravere
est difficile
gt Blogarama Ce reacutepertoire recense plus de 49 000 blogs classeacutes par cateacutegories
gt RSS Network indexe plus de 150 000 fils RSS
gt RSSFeeds Reacutepertorie plus de 119 000 fils organiseacutes en cateacutegories
copy Digimind Digimind Services ndash White Paper |47
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b La recherche par tags
Nous lavons vu avec la Folksonomie linternaute peut deacutesormais mettre en place et
partager sa propre classification via les tags Lutilisateur affecte leacutetiquette de son
choix agrave ses favoris images videacuteos Lavantage est indeacuteniable cest linternaute qui
deacutefinit son eacutetiquette et non plus un organisme Mais les inconveacutenients sont
nombreux difficile gestion des singulierspluriels problegraveme de synonymes de
signification (que deacutesigne cet internaute par ce tag) dhomonymes de polyseacutemie
dheacuteteacuterogeacuteneacuteiteacute plusieurs tags peuvent designer les mecircmes documents
Toutefois lapproche par tag facilite la recherche dune part en ajoutant une couche
seacutemantique aux documents web et dautre part en permettant une navigation par
concepts de plus en plus abandonneacutee compte tenu de la deacutesertion progressive des
cateacutegories des grands reacutepertoires web par les internautes
De plus on peut tagger pratiquement tout type de contenu web Ainsi les sites 43
Things et son eacutequivalent franccedilais 36 Trucs 80 proposent aux internautes de lister
leurs objectifs expeacuteriences ou projets Chacun de ces projets est taggeacute via un ou
plusieurs mots cleacutes
Les moteurs et meacutetamoteurs de tags
Les moteurs
La plupart des applications de social bookmarking ou de partage de fichiers images
ou videacuteos permettent donc de tagger leur contenu Sur certaines le moteur de
recherche interne rend possible en plus de la recherche sur le full text une
recherche centreacutee sur les tags Cest le cas sur Flickr vous pouvez rechercher au
choix sur le titre et la description des images ou sur les tags associeacutes deacutefinis par les
utilisateurs qui ont placeacute leurs photos
Un outil comme Delicious tag search 81 va vous permettre deffectuer des
recherches via un ou plusieurs tags sur le service de social bookmarking Delicious
Pour la recherche de blogs ou flux RSS le moteur Technorati propose une
recherche classique sur les mots cleacutes contenus dans les billets mais aussi une
copy Digimind Digimind Services ndash White Paper |48
Le Web 20 pour la veille et recherche dinformation DIGIMIND
recherche par tags82 En effet leacutediteur dun blog peut tagger chacun de ses billets
via des mots cleacutes qui les cateacutegorisent Ces mots ou tags seront repris par lindex du
moteur Ainsi la recherche du mot pollution parmi les tags affiche un billet sur le
reacutechauffement climatique Si ce billet est bien cateacutegoriseacute par son auteur dans une
rubriquepollution (parmi dautres) il ne contient pas ce mot dans son texte
toutefois en relation avec le concept de pollution Clairement une recherche
classique sur le seul texte des billets naurait pas rameneacute ce billet ou du moins pas
dans les premiers reacutesultats Autre inteacuterecirct Technorati vous propose des tags
associeacutes Ainsi pour pollution il affiche environment politics global warming science
china energy news air climate climate change autant de mots cleacutes pour eacutelargir ou
affiner vos requecirctes
Le moteur SearchLess 83 offre une approche originale il associe la recherche par
mots cleacutes agrave la recherche par tags Ainsi si vous effectuez une requecircte avec le mot
intelligence vous pouvez preacuteciser par le tag CIA Les reacutesultats seacutelectionneront
donc le mot intelligence sur des contenus (billets de blogs par exemple) taggeacutes CIA
par lutilisateur lui-mecircme on est alors sucircr que les 2 concepts sont intimement lieacutes
Meacutetamoteurs
Des meacutetamoteurs 84 permettent de rechercher sur les diffeacuterents types de contenu
sociaux bookmarks images videacuteos
Ainsi Tag Central agreacutege de nombreux formats web taggeacutes En lui indiquant un
tag il affiche des reacutesultats provenant agrave la fois de Flickr Smugmug (photos)
Technorati (blogs) Blogmarks Connotea Furl delirious (bookmarks sociaux) ou
encore 43Things (listes de projets)
Zewol outil de meacuteta syndication francophone permet de rechercher parmi les tags
(Flickr delicious) mais aussi sur les actualiteacutes (Google News Ask Actualiteacutes
Yahoo Actualiteacutes) les blogs (Technorati IceRocket Google Blog Search Ask
Blogshellip) le buzz (Tapemoi Scoopeo Wikipedia) les videacuteos (Google Videos
Podscope Video Daily Motion) et un mix (Furl Echonimo actualiteacutes Plazoo
Feed24) Concregravetement cest une bonne approche de recherche globale sur de
nombreuses ressources de type Web 20
Il est toujours possible de traquer la preacutesence ou lapparition dun mot clef sur le
web via la mise en surveillance du flux RSS de la requecircte
Ketoag est un outil qui permet dinterroger de nombreux services sociaux
copy Digimind Digimind Services ndash White Paper |49
Le Web 20 pour la veille et recherche dinformation DIGIMIND
(Delicious Furl Diig Wikio Blinklist) mais eacutegalement des moteurs de recherche
(Google Blog Search) Par ailleurs vous pouvez geacuteneacuterer pour chaque requecircte un
flux RSS mais aussi un fichier OPML (format permettant lagreacutegation et leacutechange de
listes de flux RSS)
Gnosh est un meacutetamoteur qui recherche parmi les moteurs web les moteurs de
blogs et les outils de partage de favoris De plus une recherche sur longlet People
vous permet de rechercher parmi les favoris des internautes inscrits agrave la
communauteacute Gnosh
Exalead recherche sur Wikipedia A droite le nuage de tags
Les nuages de tags
Ces nuages regroupent un ensemble de tags dans un mecircme espace en affectant agrave
chacun une taille variant selon leur populariteacute (freacutequence dutilisation ou de requecircte
sur ces mots) ou la densiteacute darticles auxquels ils se reacutefeacuterent (deacutepecircches dactualiteacutes
par exemple)
Les nuages de tags sont devenus agrave la mode car ils permettent une navigation facile
tregraves visuelle au sein dun site dune base de donneacutee ou des reacutesultats dun moteur
Ils apportent une grille de lecture suppleacutementaire agrave des sites dont les menus sont
souvent surchargeacutes ou le contenu atomiseacute
copy Digimind Digimind Services ndash White Paper |50
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Nombreuses sont les applications qui utilisent le nuage de tags pour optimiser la
navigation et mettre en valeur leur contenu le partage de videacuteos (DailyMotion) les
bookmarks sociaux (Delicious MyWeb2 de Yahoo) ou les services dactualiteacutes
collaboratives comme Wikio Certains moteurs comme Exalead ont eacutegalement
choisis dafficher des nuages de tags au sein de leurs pages de reacutesultats Dans ce cas
il sagit dune aide agrave laffinage des requecirctes un clic sur un tag va afficher une
nouvelle page de reacutesultat prenant ce mot en compte
Zibb85 moteur de recherche vertical deacutedieacute au Business to Business utilise aussi le
nuage de tags pour visualiser clairement les mots cleacutes de theacutematiques connexes les
plus freacutequents agrave votre requecircte
Dautres sites plus classiques ont eacutegalement choisi lapproche du nuage de tag pour
rendre leur navigation plus attractive et leurs rubriques plus visibles Ainsi le site
Ecrans 86(du journal Libeacuteration) affiche en bas agrave droite un nuage de tags mettant en
valeur son contenu tregraves touffu
Certains outils proposent de geacuteneacuterer des nuages de tags pour des sites ou moteurs
nen disposant pas
Google Tag Cloud Maker 87 est un script pour Firefox qui permet dafficher un nuage
de tags agrave droite des reacutesultats de Google plus un mot est freacutequent dans les reacutesultats
de votre recherche plus la taille dun tag est importante
Newzingo 88 extrait des mots de Google News pour constituer un nuage
doccurrences parmi les termes de lactualiteacute Plus le terme est gros plus les articles
relatifs agrave ce terme sont nombreux Techzingo reacutealise le mecircme process mais cette
fois les cibles sont des meacutedias de reacutefeacuterence dans le High Tech et le logiciel
Slashdot Diggcom et TheRegister
Un nuage de tags sur lInternet Movie Database une maniegravere de naviguer parmi tous les mots cleacutes associeacutes aux films
copy Digimind Digimind Services ndash White Paper |51
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La qualification du contenu par les utilisateurs (rdquofolksonomierdquo) est une reacuteelle valeur
ajouteacutee Les moteurs de recherche font reposer une grande part de lrsquoeffort sur
lrsquoutilisateur final une page de reacutesultats de Google doit ecirctre eacutevalueacutee souvent
interpreacuteteacutee par linternaute La folksonomie fait elle reposer lrsquoeffort de filtrage sur
lrsquoutilisateur initial celui qui va rechercher et appliquer ses propres ldquotagsrdquo Parce
quen amont 1743 personnes ont taggeacute une page avec un groupe de mots cleacutes
lrsquoutilisateur final lors de sa requecircte reccediloit une page de reacutesultats souvent tregraves
pertinente
Sur un moteur classique cest agrave lutilisateur dimaginer ses mots cleacutes pour affiner sa
recherche Sur les bookmarks sociaux de type Delicious les internautes qui
partagent leurs ressources ont deacutejagrave preacutepareacute ce travail daffinage via leurs tags
Prenons le cas dune recherche extrecircme car geacuteneacuterant de la synonymie la requecircte
Jaguar Sur Googlecom on me propose certes des mots cleacutes connexes pour
affiner mais tous sont lieacutes agrave la voiture Sur Delicious les tags afficheacutes sont relatifs agrave
la voiture mais aussi au systegraveme dexploitation agrave un groupe de musique et agrave lanimal
Pouvoir rechercher parmi les tags classifications eacutemanant de lutilisateur peut ecirctre
particuliegraverement inteacuteressant lorsquune recherche classique par mots cleacutes sur le
contenu des documents sest aveacutereacutee infructueuse ou geacutenegravere des reacutesultats peu
pertinents
Le tagging une pratique quotidienne
Selon une enquecircte meneacutee en deacutecembre 2006 par le Pew Internet amp American Life
Project 28 dutilisateurs des internautes ameacutericains ont taggeacute ou cateacutegoriseacute en
ligne des contenus tels que des photos des billets dans des blogs des articles
drsquoactualiteacutehellipSur une base journaliegravere 7 des utilisateurs drsquoInternet pratiquent le
tag en ligne
Ce systegraveme de laquo taxonomie populaire raquo pourrait-il constituer une alternative aux
outils de recherche traditionnels par mots cleacutes Il convient de distinguer les
usages professionnels des usages grand public Olivier Le Deuff 89 reprend dans
son eacutetude sur les Folksonomies la distinction effectueacutee par Thomas Vander
Wal entre les folksonomies eacutetroites (narrow folksonomies) et geacuteneacuterales (broad
folksonomies) Selon Olivier Le Deuff cette distinction est importante car les
premiegraveres sont surtout utiliseacutees dans un objectif individuel tandis que les secondes
privileacutegient lrsquoaspect collectif et collaboratif du partage drsquoinformation Ainsi les sites
de partages de favoris comme delicious ou Connotea sont plutocirct des
folksonomies geacuteneacuterales puisqursquoun mecircme site peut ecirctre partageacute par plusieurs
utilisateurs et recevoir le mecircme tag Ce type de folksonomies srsquoappuyant sur des
copy Digimind Digimind Services ndash White Paper |52
Le Web 20 pour la veille et recherche dinformation DIGIMIND
reacuteseaux sociaux ne fait pas que classer de lrsquoinformation et la partager Il met en
relation des usagers qui partagent les mecircmes centres drsquointeacuterecirct Lrsquousager indexeur
devient agrave son tour un peu indexeacute et mis en relation agrave la fois avec drsquoautres mots-
cleacutes drsquoautres sites et drsquoautres usagers
Il est clair que dans le domaine de lrsquoinformation professionnelle ou speacutecialiseacutee le
manque duniformisation des folksonomies qursquoelles soient geacuteneacuterales ou agrave vocation
plus eacutetroite pose les limites de ce systegraveme Les outils drsquoindexation et de
classification traditionnels ont en effet eacuteteacute creacuteeacutes pour des corpus structureacutes aux
limites clairement deacutefinies et srsquoadressent agrave des utilisateurs experts drsquoun domaine
ou de la recherche drsquoinformation Lrsquoabsence de hieacuterarchisation et de controcircle
constitue agrave la fois le point fort et le point faible de la folksonomie La barriegravere des
langues pourra constituer eacutegalement un obstacle les tags eacutetant parfois meacutelangeacutes
dans un mecircme site sans distinction De plus comme le note Cyril Fievet 90 la
pratique du tagging nrsquoest pas uniforme drsquoun site agrave lrsquoautre Sur Technorati les tags
indexeacutes sont ceux choisis par les blogueurs et fonction du contenu qursquoils ont eux-
mecircmes publieacute Sur delicious en revanche ce sont les internautes qui taguent le
contenu des pages qursquoils conservent dans leurs signets raquo
Il convient eacutegalement drsquoecirctre vigilant quant agrave une utilisation laquo frauduleuse raquo des
tags destineacutee uniquement agrave garantir la populariteacute drsquoun blog comme cela a pu
ecirctre le cas avec les meacuteta-donneacutees incorporeacutees dans le code source drsquoune page
html
Eacutelie Francis et Odile Quesnel preacutesentent dans la revue Documentaliste Sciences
de lrsquoinformation les quatre modes drsquoindexation et de classification sur le web la
classification personnelle lrsquoindexation par lrsquoauteur lrsquoindexation par lrsquoutilisateur et la
classification globale Et srsquointerrogent sur lrsquoavenir de lrsquoindexation collaborative agrave la
croiseacutee de la qualiteacute (liberteacute diversiteacute enrichissement) et de la deacutesinformation
(subjectiviteacute manque de coheacuterence)
Il nrsquoen reste pas moins que folksonomie et indexation classique ne srsquoopposent pas
neacutecessairement et constituent des moyens de description de contenus adapteacutes agrave
des contextes diffeacuterents Stephen Lee creacuteateur du site Guten Tag voit dans la
folksonomie une sorte de web seacutemantique du pauvre peu oneacutereux agrave mettre en
place mais dont le succegraves reposera sur une seacuterie de bonnes pratiques collectives
Lrsquointeacuterecirct de ce systegraveme reacutesidera non pas dans la capaciteacute agrave trouver une reacuteponse agrave
une question preacutecise mais plutocirct agrave deacutecouvrir des sources originales et peu connues
ou de localiser des experts drsquoun domaine pointu Les tags les plus rares et preacutecis
pourront entre autres trouver leur application dans le domaine de la veille mettant
copy Digimind Digimind Services ndash White Paper |53
Le Web 20 pour la veille et recherche dinformation DIGIMIND
en œuvre la seacuterendipiteacute ou lrsquoart de favoriser le hasard pour des deacutecouvertes
heureuses
Laissons la conclusion sur ce point agrave lrsquoAssociation des Professionnels de
lrsquoInformation et de la Documentation (ADBS) qui estime dans sa newsletter que
Le foisonnement des propositions de mots-cleacutes aboutirait agrave un reacutesultat plus efficace
quune indexation reacutealiseacutee par un vocabulaire contraint Cette affirmation semble
ecirctre deacutemontreacuteehellip pour linstant
c La recherche de personnes et dinformations entreprises
La recherche de donneacutees sur les personnes physiques ou morales seffectuait
jusquici principalement en interrogeant les bases de donneacutees dinformations leacutegales
et financiegraveres gratuites ou payantes Linterrogation de service tel que Societecom
Infogreffe ou Yahoo Finance est bien sucircr encore neacutecessaire Mais il faut compter
maintenant avec les reacuteseaux sociaux professionnels qui eux aussi rassemblent des
donneacutees sur les entreprises ou les individus
Linteacuterecirct des reacuteseaux sociaux
Que peuvent-il apporter par rapport aux services classiques dinformations
dentreprises Dabord comme expliqueacute preacuteceacutedemment ils sont ouverts agrave tous
Les informations y figurant ne sont plus le seul fait de leacutediteur du site et ne sont pas
uniquement constitueacutees par les fichiers de donneacutees leacutegales publieacutees par les
organismes officiels comme le Greffe du Tribunal de Commerce en France Sur les
reacuteseaux sociaux centreacutes sur les personnes le contenu est inteacutegralement ameneacute par
linternaute qui affiche son CV deacutetailleacute ses publications ses oeuvres (textes ou
multimeacutedias) Linteacuterecirct est eacutevident des personnes peu visibles auparavant parce
que ne faisant pas partie des dirigeants dentreprises (geacuterant fondateur membre du
conseil) sont maintenant accessibles et donc requecirctables par les internautes On
peut donc collecter des informations sur un cadre de RampD dune socieacuteteacute de
teacuteleacutecoms concurrente ou sur le management eacutetonnant de telle entreprise de
plasturgie citeacutee dans le CV dun employeacute de passagehellip
A linstar des blogs linformation preacutesente sur les reacuteseaux sociaux ne tient plus du
discours ou des donneacutees officielles puisque cest linternaute qui communique sur sa
vie et son entreprise
copy Digimind Digimind Services ndash White Paper |54
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Geacuterer leacuteparpillement de linformation
Dautres plateformes de social networking mixent linformation collecteacutee sur le web
avec les contributions des utilisateurs (agrave linstar de Wikio pour les actualiteacutes) Ainsi
le service ZoomInfo 91 permet de rechercher des socieacuteteacutes et des personnes en
parcourant des milliers de donneacutees extraites du web mais aussi en provenance de
profils dindividus et dentreprises renseigneacutes par les socieacuteteacutes ou les employeacutes eux-
mecircmes Aussi cohabitent des informations sur des entreprises coteacutees avec des
donneacutees de firmes non coteacutees des fiches de cadres du top management et des
conseils dadministration avec des CV demployeacutes plus fonctionnels
Le franccedilais Ziki 92 utilise aussi des informations collecteacutees sur le web cest une
sorte dannuaire perfectionneacute qui indexe et archive non pas les donneacutees
signaleacutetiques mais les contenus produits par une personne agrave partir du moment ougrave ils
disposent dun flux RSS (billets de blogs photo Flickr favoris Delicioushellip) Ziki ne
permet pas de creacuteer du contenu propre mais agregravege des donneacutees eacutelaboreacutees par un
mecircme individu auparavant eacuteparpilleacutees sur linternet Bref vous ameacuteliorez votre
visibiliteacute et facilitez la recherche de vos productions sur le net en creacuteant un point
unique daccegraves
La recherche sur tous ces reacuteseaux sociaux implique souvent linterrogation
fastidieuse apregraves inscription de plusieurs dizaines de sites
Aussi certains outils 93 proposent une meacutetarecherche en lanccedilant une mecircme
requecircte sur plusieurs services de social networking Stalkerati recherche le nom
dune personne sur les reacuteseaux Friendster et FaceBook Plus complet et ciblant
davantage les reacuteseaux professionnels YoName recherche les noms sur MySpace
LinkedIn Friendster Windows Live Spaces Bebo Digg ou Xanga
Le moteur de recherche de personnes Wink scrute les reacuteseaux sociaux MySpace
Bebo Friendster LinkedIn Live Spaces et autres De plus avec cet outil il est
possible de creacuteer son propre profil et de le connecter agrave des reacuteseaux sociaux
Attention toutefois si vous ecirctes un utilisateur recherchant des donneacutees en franccedilais
la nature des reacutesultats est plutocirct tourneacutee vers le monde anglophone
Ces reacuteseaux sociaux ne sont pas suffisants pour une recherche professionnelle
complegravete A linstar des blogs face agrave la presse traditionnelle ils constituent un
compleacutement inteacuteressant aux bases de donneacutees officielles
copy Digimind Digimind Services ndash White Paper |55
Le Web 20 pour la veille et recherche dinformation DIGIMIND
d Les moteurs de recherche humains
Apregraves ecirctre apparus sur le net agrave la fin des anneacutees 90 les services de questions-
reacuteponses avaient laisseacute la place aux algorithmes tout puissants des moteurs de
recherche de type Google Mais les robots et programmes ont tous besoin dune
intervention humaine pour geacuterer la qualiteacute et la pertinence des reacutesultats
Ainsi tous les grands moteurs majeurs ne font pas confiance agrave leurs seuls
algorithmes Les employeacutes de Yahoo sont mis agrave contribution pour surveiller la
qualiteacute des reacutesultats fournis par le moteur Chez Google et MSN Search des
process deacutevaluation humaine avaient eacuteteacute identifieacutes agrave travers les sites
EvalGooglecom et MSN HRS notamment
La revanche de lhumain
Au-delagrave de ce rating humain sur les reacutesultats de moteurs de recherche de
nombreux services depuis 2 ans mettent agrave disposition des experts en chair et en
os Cest alors un veacuteritable mode collaboratif qui se met en place lorsque le produit
est bien penseacute Cest la cas de Yahoo Answers (Yahoo Questions Reacuteponses en
France) 94 Ce service gratuit de questions reacuteponses lanceacute fin 2005 permet agrave
linternaute de poser une question dans un formulaire Chaque membre de la
communauteacute Yahoo (agrave savoir tout ceux qui disposent dun compte Yahoo) peut
jouer le rocircle dexpert Yahoo propose aussi le service (eacutegalement gratuit) Ask
Yahoo qui propose de reacutepondre agrave vos questions mais cette fois via un groupe
dexperts seacutelectionneacutes par Yahoo Inc Yahoo Answers a certes une orientation
initiale grand public mais des questions un peu techniques voire scientifiques
trouvent reacuteponse En effet parmi tous les contributeurs agrave Yahoo Answers figurent
des meacutetiers et expertises tregraves diverses du fait de son audience importante Il y
cohabite des types de questions varieacutes Quels sont les groupes strateacutegiques de
lindustrie mondiale du jouet Quelles sont les donneacutees eacuteconomiques du marcheacute de
lassurance vie collective en France
Autre point inteacuteressant le service est deacuteployeacute dans de nombreux pays (Etats-Unis
Royaume-Uni Canada Australie Inde Espagne Breacutesil Argentine Mexique Italie
Allemagne Singapour Taiwan Coreacutee du Sud Hong Kong Japon Chinehellip) Aussi il
est possible de localiser certaines questions et de beacuteneacuteficier parfois dune
expertise pays
Lune des raisons du succegraves du service de Yahoo tient au fait de baser les questions
et reacuteponses sur la contribution dinternautes volontaires Chacun participe
constitue un vrai reacuteseau et peut surtout se valoriser en devenant expert dans son
copy Digimind Digimind Services ndash White Paper |56
Le Web 20 pour la veille et recherche dinformation DIGIMIND
domaine de compeacutetences ou sa passion Il est mecircme possible de creacuteer sa propre
communauteacute qui rassemblera vos amis mais aussi vos experts preacutefeacutereacutes qui
reacutepondent agrave vos questions et centres dinteacuterecirct Le pool de reacutepondants nest donc
pas limiteacute agrave une liste restreinte et il sauto-entretient Dautre part les experts
seacutevaluent entre eux et seacutelectionnent parmi une liste si neacutecessaire ce quils
considegraverent comme la meilleure reacuteponse agrave une question
Une question sur Yahoo Answers
Sur ce marcheacute des Questions-Reacuteponses Google a eacutechoueacute notamment parce quil a
seacutepareacute formellement demandeurs et contributeurs limitant ainsi fortement laspect
collaboratif Le Service Google Answers 95 permettait de poser des questions agrave des
experts Mais lagrave ougrave des services concurrents comme Yahoo Answsers Lycos IQ
copy Digimind Digimind Services ndash White Paper |57
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Windows Live QnA96 sont gratuits Google Answers eacutetait un service payant faisant
appel agrave un reacuteseau de 800 experts Aussi Google Answers apregraves 4 ans dactiviteacute a
fermeacute Les questions ne sont deacutesormais plus accepteacutees mais laccegraves aux archives des
questions-reacuteponses est maintenu
Par ailleurs les reacuteseaux sociaux eacutevoqueacutes plus haut ont bien compris la puissance des
communauteacutes pour faire office de speacutecialistes Ainsi avec LinkedIn Answers la
plateforme de reacuteseaux sociaux LinkedIn sest lanceacutee elle aussi dans le service de
QuestionsReacuteponses
Ne pas oublier les services Web 10
Lorsque lon parle de Web 20 on eacutevoque rarement ces services de Questions-
Reacuteponses au profit de sites plus technologiques Pourtant nous sommes ici dans la
logique des bookmarks sociaux partager ses connaissances faire beacuteneacuteficier les
autres de son savoir et en retour profiter de lexpertise de la communauteacute
Comme la plupart des applications Web 2 la seule utilisation des services QR ne
suffit pas Elle doit venir en compleacutement de recherches parallegraveles via dautres outils
Ainsi pour la veille linscription agrave des listes de diffusion permet aussi de poser des
questions agrave des experts ou passionneacutes De plus il subsiste des services dexpert
traditionnels qui sils ne mettent pas laccent sur la collaboration permettent
didentifier des compeacutetences parfois tregraves pointues Certaines ressources
reacutepertorient des milliers dexperts quil faudra ensuite contacter personnellement
pour beacuteneacuteficier de leur conseil Cest le cas du site Expertscom qui identifie des
experts dans des domaines allant de lacoustique agrave la biochimie en passant par
lindustrie peacutetroliegravere97
copy Digimind Digimind Services ndash White Paper |58
Le Web 20 pour la veille et recherche dinformation DIGIMIND
e les moteurs de recherche collaboratifs
Nous lavons vu certains services dactualiteacutes collaboratives proposent des reacutesultats
issus dun mixage entre contribution des internautes et collecte de nouvelles sur le
web Cette approche de mixiteacute se met peu agrave peu en place pour les moteurs de
recherche web En effet les modegraveles algorithmiques ou humains preacutesentent tout 2
leurs limites en terme de pertinence de fiabiliteacute et dexhaustiviteacute
Aussi de plus en plus de projet de moteur mixtes agrave savoir proposant des reacutesultats
web conjointement agrave des reacutesultats etou seacutelections issus dhumains voient le jour
Du web donc mais avec une forte dose de cerveaux humains
Wikiasari
Celui qui fait le plus parler de lui est le projet de Jimmy Wales le co-fondateur de
lencyclopeacutedie Wikipedia Baptiseacute Wikiasari 98 (combinaison de wiki rapide en
hawaiumlen et asari recherche fouilleacutee en japonais) le projet vise agrave creacuteer un outil de
recherche ougrave les internautes pourront influer sur les reacutesultats en notant leur
pertinence etou en en proposant de nouveaux selon leur expertise
Ce type de moteur sinscrit donc agrave lopposeacute doutils comme Google aux algorithmes
automatiques dont les robots sont souvent trompeacutes par des manipulations de
webmasters (spamdexing par exemple)
Cet outil qui devrait voir le jour courant 2007 sappuie sur des infrastructures Open
Source existantes comme Nutch ou Lucent
Cest un projet particuliegraverement inteacuteressant Comme sur lencyclopeacutedie ouverte
Wikipedia ougrave des milliers de contributeurs construisent et alimentent louvrage sur
ce moteur des reacuteseaux de centaines dinternautes pourront apporter leur savoir
pour ameacuteliorer la pertinence des reacutesultats Ce nest plus seulement la puissance de
calcul de machines qui sera mise agrave contribution mais aussi la puissance de la
communauteacute
Derriegravere le projet Wikiasari il y a de gros moyens financiers et humains
lexpeacuterience de la fondation Wikipedia et le potentiel de trafic que pourra apporter
lencyclopeacutedie ouverte Fin 2006 Comscore a en effet classeacute Wikipedia comme le
6egraveme site le plus visiteacute au monde avec 1719 millions de visiteurs uniques au mois
de novembre On peut donc y croire
copy Digimind Digimind Services ndash White Paper |59
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche de sites similaires sur Yoono
Decipho Yoono
Certes lideacutee dun moteur de recherche collaboratif nest pas nouvelle Reacutecemment
on peut citer le lancement du moteur Decipho ou en mars 2006 celui de Yoono
Mecircme si les approches diffegraverent ces outils font tous la part belle agrave lrsquoapport de
chaque utilisateur dans le traitement des reacutesultats
Decipho 99 est un moteur baseacute sur la technologie de Askcom lun des 4 moteurs les
plus utiliseacutes aux USA Linternaute creacuteeacute ses propres cateacutegories de reacutesultats
partageables avec les autres Il peut eacutegalement tagger les reacutesultats afin deacutetiqueter
un site Aussi lors dune requecircte on peut preacuteciser les mots cleacutes classiques avec des
tags On beacuteneacuteficie alors de tous les tags mis en place par la communauteacute des
utilisateurs Un curseur permet de deacutefinir la proportion de cateacutegorisation des
autres utilisateurs agrave prendre en compte dans sa recherche
Le franccedilais Yoono 100 propose une autre deacutemarche encore loutil fonde ses reacutesultats
sur la mutualisation des connaissances des internautes par le partage des favoris Le
copy Digimind Digimind Services ndash White Paper |60
Le Web 20 pour la veille et recherche dinformation DIGIMIND
moteur utilise les favoris que sa communauteacute dutilisateurs a accepteacute de partager
Lors dune requecircte les reacutesultats sont classeacutes par populariteacute agrave savoir selon le
nombre de fois ougrave une page a eacuteteacute mise en favoris par les utilisateurs Une logique
proche de Delicious mais avec Yoono lajout de favoris est automatique De plus
loutil affiche les utilisateurs qui comme vous ont reacutefeacuterenceacute des sites sur la
politique veacuteneacutezuelienne par exemple De cette maniegravere vous pouvez identifier des
passionneacutes ou experts partageant vos domaines de preacutedilections Les reacutesultats ne
sont plus baseacutes sur les seuls algorithmes mais sur lexpeacuterience et la capacitation des
autres utilisateurs
Les initiatives de moteurs collaboratifs plus ou moins inteacuteressantes sont multiples
Foox est un moteur baseacute sur des communauteacutes dinteacuterecirct et sur Webzzle lutilisateur
preacutecise les concepts qui linteacuteressent afin de contextualiser les mots-cleacutes choisis 101
Humains ou algorithmes
Certes le mode collaboratif ne remplacera pas totalement la recherche
algorithmique Les 2 sont compleacutementaires Lune permet dameacuteliorer la pertinence
de prendre en compte des concepts des contextes du sens et non plus simplement
des chaicircnes de caractegraveres Lautre vise lexhaustiviteacute en indexant des milliards de
pages Web Aujourdhui et en attendant le Web seacutemantique ainsi que la recherche
dite naturelle 102 toutes deux grandes quecirctes du monde de linternet seul lapport
de communauteacutes dhumains permet dinjecter un peu de sens agrave une recherche
Mais de son cocircteacute la recherche coopeacuterative comporte bien entendu des risques de
subjectiviteacute
Sur les moteurs de recherche la coopeacuteration peut prendre une autre forme via le
peacuterimeacutetrage des sites agrave interroger la construction dun moteur sur mesure en
quelque sorte Cest la verticalisation de la recherche
copy Digimind Digimind Services ndash White Paper |61
Le Web 20 pour la veille et recherche dinformation DIGIMIND
f La verticalisation par la personnalisation du peacuterimegravetre de recherche
Lune des grandes faiblesses des moteurs de recherche web agrave large eacutechelle (Google
Exalead Yahoo MSNhellip) est le bruit geacuteneacutereacute par certaines requecirctes Lorsque vous
tapez puma le moteur ne sait pas agrave priori si vous vous inteacuteressez aux vecirctements
de sport agrave lanimal ou aux heacutelicoptegraveres Or si vous ne reacutealisez des recherches que
dans laeacuterospatiale vous devrez souvent deacutesambiguiumlser par vos mots cleacutes ce qui
engendre une perte de temps voire de reacutesultats si vos requecirctes deviennent trop
restrictives
Certains moteurs ou meacutetamoteurs clusteacuterisent (cateacutegorisent) les reacutesultats en les
rassemblant par groupes (grappes) dans de petits dossiers Cette deacutemarche avait
eacuteteacute initieacutee par le moteur Northern Light en 1998 Ainsi tous les reacutesultats relatifs aux
chaussures Puma sont regroupeacutes dans une mecircme valise ceux eacutevoquant lanimal
dans une autre Mais cette solution nest pas complegravetement satisfaisante car elle
seffectue agrave posteriori une fois votre requecircte lanceacutee Le bruit nest pas eacutelimineacute mais
simplement circonscrit dans des sortes de cateacutegories poubelle
Pour beacuteneacuteficier dune deacutemarche agrave priori il convient dutiliser des outils de
recherche verticaux cest-agrave-dire speacutecialiseacutes dans un secteur dactiviteacute une fonction
un type dinformation ou de meacutedias
Face aux problegravemes de pertinence des moteurs geacuteneacuteralistes de plus en plus de
moteurs verticaux voient le jour Ainsi le seul domaine meacutedical a vu apparaicirctre ces
20 derniers mois les moteurs SearchMedica Medstory MedWorm ou encore Medgle 103
Mais si votre secteur de preacutedilection nest pas couvert par un moteur speacutecialiseacute
Cest lagrave quintervient un autre type de moteur collaboratif agrave qui lon peut indiquer le
peacuterimegravetre des sites sur lesquels effectuer la recherche Sur les moteurs classiques
les algorithmes peuvent placer en prioriteacute des reacutesultats sans inteacuterecirct pour vous A
force de navigation et de veille dans votre secteur vous connaissez certainement
10 20 100 sites que vous jugez incontournables et indispensables pour vos
recherches
2 solutions techniques existent
- les outils agrave peacuterimegravetre de recherche personnalisable (adaptable scope)
Ils utilisent les index des moteurs geacuteneacuteralistes (Yahoo ou Google) et restreignent le
scope de leur recherche aux pages des sites que vous avez choisis Ainsi des outils
comme Rollyo Swicki Yahoo Search Builder Google Custom Search 104 vous
demandent dindiquer une liste de sites sur lesquels vous allez limiter votre
recherche Lors dune requecircte les reacutesultats proviendront uniquement des sites de
votre choix Pratique
copy Digimind Digimind Services ndash White Paper |62
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Mais ces outils preacutesentent une limite de taille ils ne prennent en compte que les
pages indexeacutees par Google ou Yahoo Conseacutequence si la reacuteponse pertinente agrave
votre requecircte figure au sein dune page non indexeacutee par le moteur geacuteneacuteraliste vous
nobtenez pas de reacutesultats
De plus en ninterrogeant que lindex dun ou 2 moteurs vous manquerez
obligatoirement de nombreuses informations puisque le nombre de reacutesultats
communs entre les moteurs diminue constamment105
Les pages non indexeacutees par les moteurs geacuteneacuteralistes constituent une part du web
invisible106 et sont plus nombreuses que lon ne croit Ainsi si jinterroge le moteur
interne du site de la prestigieuse revue scientifique The Lancet 107 avec la requecircte
Diabetes jobtiens plus de 2800 reacutesultats Si jeffectue cette mecircme requecircte sur
Google en restreignant ma recherche au site The Lancet (via la syntaxe
sitehttpwwwthelancetcom) jobtienshellip1 reacutesultat Sur Yahoo Search guegravere
mieux 9 reacutesultats Pourquoi Parce que les technologies de ces moteurs ne
permettent pas dindexer correctement tous les sites
La constitution de bouquets de moteurs speacutecialiseacutes sur Digimind Finder
- les outils agrave moteurs personnalisables
La solution pour beacuteneacuteficier des reacutesultats de moteurs internes non indexeacutes par des
Google ou Yahoo est dutiliser un outil permettant dexploiter directement les
moteurs des sites qui vous inteacuteressent et ce sans avoir agrave passer par les index de
moteurs geacuteneacuteralistes Cest le cas du Finder108 mis au point par Digimind un
copy Digimind Digimind Services ndash White Paper |63
Le Web 20 pour la veille et recherche dinformation DIGIMIND
meacutetamoteur qui permet de plugger nimporte quel moteur de son choix et de
linterroger ensuite Il est donc alors simple de se constituer des bouquets de
moteurs speacutecialiseacutes dans votre secteur dactiviteacute De plus cet outil indexe en temps
reacuteel les reacutesultats et les documents retourneacutes par les moteurs interrogeacutes Cela
permet daffiner ensuite vos reacutesultats en interrogeant cet index au contenu
speacutecialiseacute via une recherche avanceacutee Avec le Finder cest donc lutilisateur final qui
constitue sa propre seacutelection de moteurs
copy Digimind Digimind Services ndash White Paper |64
Le Web 20 pour la veille et recherche dinformation DIGIMIND
g Lenrichissement de bases de donneacutees faccedilon Web20
Nous avons vu que les bookmarks sociaux permettaient de mutualiser les
ressources et pour certains autour de communauteacutes deacutedieacutees comme les
scientifiques Avant lapparition des applications Web 20 ont eacuteteacute constitueacutees de
nombreuses bases de donneacutees professionnelles Celles-ci jusquici noffraient pas
aux groupes dutilisateurs la possibiliteacute dinteragir de commenter et deacutechanger
Aussi de plus en plus de grandes bases de donneacutees se dotent dinterfaces
collaboratives et ergonomiques pour laisser plus de place agrave la contribution
PubMed
Cest le cas de lune des plus grandes bases du domaine meacutedical PubMed 109 Cette
immense base bibliographique a vu naicirctre deux initiatives110 pour ameacuteliorer son
interface de recherche
- Avec PubMed Interact la recherche integravegre de lAjax et permet de pondeacuterer via
des curseurs les critegraveres de sources dancienneteacute de nombre de reacutesultats de date
de publication de liens avec le mapping du MeSH (le theacutesaurus de la base) de
filtrage via des cateacutegories Vous pouvez ensuite annoter et attribuer une note de
pertinence agrave vos reacutesultats afficher labstract des articles ou leur texte complet
supprimer des reacutesultats ou encore afficher les articles lieacutes On retrouve donc
lessentiel des fonctionnaliteacutes de lactuel PubMed mais avec une convivialiteacute et
ergonomie Web 20 et donc une plus grande accessibiliteacute
-Hubmed est une autre interface alternative qui ajoute des fonctionnaliteacutes agrave PubMed
application de ses propres tags aux reacutesultats de recherche historique des recherches
clusteacuterisation des reacutesultats visualisation sous forme graphique creacuteation simplifieacutee
de fils RSS avec les mots de votre requecircte suggestion de termes connexes
visualisation de vos mots cleacutes dans larborescence Mesh Le tout est deacuteveloppeacute en
Ajax notamment permettant une navigation plus fluide et plus rapide Parmi toutes
ces fonctions la possibiliteacute de tagger les reacutesultats est tregraves novatrice on peut ainsi se
deacutepartir de la taxonomie de la base via sa propre folksonomie
copy Digimind Digimind Services ndash White Paper |65
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les nombreux reacuteglages de filtres sur linterface PubMed Interact
LUSPTO
LUSPTO 111 est la base des brevets ameacutericains (United States Patent and Trademark
Office)
Cette veacuteneacuterable institution a en projet une plateforme de brevets sociale agrave la
maniegravere dun Digg (cf les services dactualiteacutes collaboratives) les internautes
pourront commenter les brevets en ligne et les eacutevaluer via un systegraveme de notation
Les brevets les mieux noteacutes remonteront alors en haut de classement
copy Digimind Digimind Services ndash White Paper |66
Le Web 20 pour la veille et recherche dinformation DIGIMIND
h Conserver et exploiter lhistorique de vos recherches et navigations
Le chercheur dinformation sur le net perd souvent ses nerfs quand il ne retrouve
plus ce quil a deacutejagrave collecteacute quelque semaines auparavant ou lorsquil lui est
impossible de se souvenir quelle requecircte agrave geacuteneacutereacute ce fameux reacutesultat remarquable
cette veacuteritable peacutepitehellip
Google a reacutesolu partiellement ces problegravemes de meacutemoire Mais comme souvent
cela ne va pas sans certains sacrifices
Via son service Historique Web112 (ex Historique de recherche) vous pouvez apregraves
enregistrement gratuit
- meacutemoriser les requecirctes effectueacutees sur le moteur ainsi que les reacutesultats cliqueacutes
- enregistrer votre navigation sur les pages web
Il est alors possible deffectuer des requecirctes sur et agrave linteacuterieur des pages que vous
avez visiteacutees dans le passeacute (sur le texte les images les videacuteos)
Google affiche donc deacutesormais vos requecirctes la date et lheure de la recherche les
reacutesultats cliqueacutes mais aussi les reacutesultats de recherches qui nrsquoont pas geacuteneacutereacute de clics
Par ailleurs ce service va encore plus loin dans la personnalisation et lanalyse de
votre recherche
Avec la fonction Tendances saffichent vos requecirctes les plus courantes vos sites les
plus visiteacutes les reacutesultats que vous avez le plus cliqueacutes
Plus puissante la fonction Eleacutements inteacuteressants ougrave Google vous propose des
requecirctes et des pages web en relation avec vos habitudes de recherche113
En outre si vous activez cet historique Google lutilisera aussi pour agrave moyen
terme personnaliser vos recherches en fonction de vos centres dinteacuterecirct Le
moteur explique
Vos reacutesultats personnaliseacutes seront baseacutes sur vos recherches preacuteceacutedentes ainsi que les
reacutesultats de recherche et les titres agrave la une sur lesquels vous avez cliqueacute
Dans les premiers temps la diffeacuterence ne sera peut-ecirctre pas notable mais agrave mesure
que votre historique de recherches seacutetoffera les reacutesultats obtenus seront de plus en plus
personnaliseacutes
Dailleurs si vous reacutealisez de nombreuses recherches sur Google avec une
connexion agrave votre compte Google activeacutee vous devriez voir safficher de temps agrave
autre ce type de message Nouveau activez votre historique de recherche pour
personnaliser vos reacutesultats
copy Digimind Digimind Services ndash White Paper |67
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ces reacutesultats personnaliseacutes apprenant selon vos inteacuterecircts permettent de reacutepondre
en partie agrave la probleacutematique de deacutesambiguiumlsation lors de requecirctes sur des
homonymes Ce sont les exemples classiques de lavocat (fruit ou juriste ) de
jaguar (voiture ou animal ) ou de puma (articles de sports animal ou heacutelicoptegravere
)
Cocircteacute vie priveacutee tout votre surf part sur les serveurs de Google Aussi vous
pouvez (devez) mettre en pause lenregistrement de votre navigation lorsque cela
vous apparaicirct adeacutequat
Lhistorique de vos requecirctes et de vos reacutesultats sur Google
copy Digimind Digimind Services ndash White Paper |68
Le Web 20 pour la veille et recherche dinformation DIGIMIND
i Les mash-up
Les mash-up sont certainement les nouveauteacutes engendreacutees par les technologies
dites Web 20 les plus spectaculaires Mixage de plusieurs applications provenant
de plusieurs sites (souvent deux) ils permettent de creacuteer un service nouveau et ce
agrave partir de la mise en relation voire du croisement des donneacutees des applications
dorigines En franccedilais Wikipedia parle dapplications composites 114 Ainsi en
mixant la liste des socieacuteteacutes ougrave il fait bon travailler eacutetablie par le magazine Fortune et
une carte des USA issue de Google Maps on obtient une carte qui localise toutes
ces entreprises De mecircme si on meacutelange les donneacutees dun site de meacuteteacuteo agrave une
carte de France le reacutesultat est une carte des tempeacuteratures et des neacutebulositeacutes en
quasi temps reacuteel 115
Concregravetement comment cela fonctionne-t-il Chacune des applications
communique et eacutechange des informations via des API (voir glossaire) Ainsi Yahoo
Maps ou Google Maps ont ouvert leurs interfaces de programmation agrave tous les
deacuteveloppeurs
Les exemples sont tregraves nombreux car les Mashups ont rapidement connu un vif
succegraves aupregraves des deacuteveloppeurs et internautes avertis qui parviennent agrave maicirctriser le
code et les API Les Mashups de cartographie ne sont pas les seules possibiliteacutes mais
ce sont les plus freacutequents tant la geacuteolocalisation est attrayante pour les
professionnels comme pour linternaute novice Nous allons explorer quelques
mashups pour mieux comprendre leur inteacuterecirct
Les mashups cartographiques les plus courants mixent des cartes et des donneacutees
provenant de services sociaux comme Flickr le service de partage de photo de
Yahoo Inc Cest le cas de Tagmaps116 qui affiche en temps reacuteel sur une carte les tags
associeacutes aux photos de lieux mise en ligne sur Flickr Le Mashup Flickrvision 117 fait
encore plus simple il affiche les photos agrave lemplacement de la ville dorigine de
linternaute qui a posteacute limage lagrave aussi en temps reacuteel
Donneacutees statiques et temps reacuteel
Au-delagrave de certains mixages un peu gadget certains Mashups sont vraiment
inteacuteressants pour la surveillance de donneacutees ou la collecte dinformations En effet
on peut trouver deux grands types de visualisation celle de donneacutees statiques (une
liste dadresse dentreprises geacuteolocaliseacutees) et celle dinformations eacutevoluant en
temps reacuteel Cest le cas par exemple du Mashup SpaceCraft Tracking 118 qui permet
copy Digimind Digimind Services ndash White Paper |69
Le Web 20 pour la veille et recherche dinformation DIGIMIND
de visualiser la trajectoire sur le globe terrestre de la navette spatiale ou du
teacutelescope Hubble
Souvent le Mashup exploite des donneacutees de reacutepertoires douvrages de services
publics pour les rendre plus compreacutehensives attrayantes bref plus accessibles 119
- HealthMap rassemble des donneacutees de santeacute publique et des actualiteacutes issues de
plusieurs sources (Google News OMS European Centre for Disease Prevention and
Controlhellip) afin de reacutealiser une carte des maladies infectieuses dans le monde Cette
carte se met agrave jour au fur et agrave mesure de lactualisation des informations
Linteractiviteacute permet de zoomer sur un pays et de seacutelectionner des pathologies en
particulier
-BioDiesel Station Maps affiche sur une carte les stations services ameacutericaines qui
deacutelivrent des biocarburants
-Kartametro superpose le reacuteseau du meacutetro moscovite agrave la carte de la ville On y
visualise aussi les correspondances avec les bus
-Wikimapia mixe les informations relatives agrave des lieux de Wikipedia agrave une carte
Google Maps Reacutesultat la plupart des noms de villes sites ou monuments sont
cliquables et pointent vers les articles de lencyclopeacutedie
Le Mashup HealthMap ici des actualiteacutes sur les maladies infectieuses en Asie geacuteolocaliseacutees
copy Digimind Digimind Services ndash White Paper |70
Le Web 20 pour la veille et recherche dinformation DIGIMIND
-GlobaI Incident Maps affiche sur un planisphegravere les eacuteveacutenements lieacutes au terrorisme
ou les risques agrave partir des informations de sites speacutecialiseacutees mises agrave jour en continu
-Enfin un parfait exemple de visualisation et de surveillance deacuteveacutenements en temps
reacuteel DartMaps indique lemplacement des trains de banlieue de Dublin
Mais certains Mashup en minoriteacute certes nexploitent pas de donneacutees
cartographiques Cest le cas de Delexaorg 120 un outil qui mixe les bookmarks
sociaux de Delicious aux donneacutees statistiques dAlexa Delexa va en effet afficher les
tags de Delicious associeacutes aux statistiques de freacutequentation des 50 000 premiers
sites web US fournis par Alexa (agrave partir des donneacutees transmises par les barres
doutils Alexa installeacutees par les internautes) Un tel outil est inteacuteressant notamment
pour se familiariser avec les tags et Delicious mais surtout pour deacutecouvrir quels
sont les sites dinfluence et populaires dans un secteur On peut eacutegalement observer
la correacutelation ou non entre nombre de tags et donneacutees de freacutequentation Alexa
Cocircteacute moteur de recherche les mashups Molu et Gnosh fournissent des
meacutetamoteurs reacutealiseacutes agrave partir du mixage de dizaines doutils de recherche121
Des ressources
Comment trouver des mashups Comme pour de nombreuses informations sur le
web des annuaires speacutecialiseacutes 122 sont apparus Ils reacutepertorient aussi bien des API agrave
destination des deacuteveloppeurs que des mashups WebMashup auto-proclameacute Open
Directory for Mashups et Web 20 APIs en liste des centaines ProgrammableWeb
lun de sites de reacutefeacuterence dans le domaine en propose plus de 1800 sous la forme
dun reacutepertoire et eacutegalement dune matrice permettant de visualiser clairement le
croisement de deux applications ou plus Mashup Feed liste aussi des mixages
populaires
Des blogs sont eacutegalement centreacutes sur ces pratiques Google Maps Mania123 recense
de nombreux Mashups cartographiques
Ces Mashups sont un beau symbole de ce web nouvelle geacuteneacuteration on ne lit plus
seulement de linformation statique de maniegravere passive Deacutesormais on est agrave la fois
fournisseur et spectateur en temps reacuteel des contributions de communauteacutes Le tout
copy Digimind Digimind Services ndash White Paper |71
Le Web 20 pour la veille et recherche dinformation DIGIMIND
gracircce agrave des interfaces reacutealiseacutees par des deacuteveloppeurs agrave partir de code ouverts de
grandes socieacuteteacutes Le succegraves est notamment provoqueacute par la possibiliteacute de mixage
entre des donneacutees du monde reacuteel et des informations ou fichiers posteacutes sur le net
Les internautes peuvent donc maintenant se rassembler par centres dinteacuterecirct mais
eacutegalement par proximiteacute geacuteographique Je recherche un speacutecialiste de linformation
sur les biocarburants situeacutes agrave moins de 10 km de chez moi
Par ailleurs on peut imaginer agrave terme des applications meacutelangeant les donneacutees de
centaines de fichiers et bases de donneacutees On en est certes aux preacutemisses mais le
mashup Alkemis 124 en est deacutejagrave un bon exemple il affiche sur une carte de New
York des donneacutees provenant dA9 OpenSearch Delicious Flickr Google Maps et
Yahoo Traffic Reacutesultat la possibiliteacute de visualiser en une seule interface un eacutetat du
trafic routier via des cameacuteras de surveillance la meacuteteacuteo les actualiteacutes locales ou les
liens Delicious en rapport avec la villehellip
copy Digimind Digimind Services ndash White Paper |72
Le Web 20 pour la veille et recherche dinformation DIGIMIND
III Diffuser
Avec lapparition des applications collaboratives et des plateformes de blogs la
faciliteacute de publication sur le web sest accrue Tout individu mecircme sans
connaissances techniques peut publier et diffuser son propre contenu sur un blog
un wiki et via des fils RSS
a Les Blogs et le flux RSS
Il suffit de 5 minutes pour sinscrire agrave une plateforme de blogs et commencer agrave
eacutecrire Ces plateformes proposent des services de bases gratuits et des
fonctionnaliteacutes plus avanceacutees neacutecessitant un abonnement Ces services qui
permettent de creacuteer maintenir et heacuteberger votre blog sont nombreux Parmi les
prestataires de qualiteacute on peut citer Blogger (qui appartient agrave Google) TypePad et
Vox (de la socieacuteteacute SixApart) Overblog Viablog Haut et Fort ou BlogSpirit 125 Bien
dautres socieacuteteacutes proposent des services de creacuteation et dheacutebergement126 Des
comparatifs sont disponibles en ligne127
Nous lavons vu le format RSS permet de diffuser tregraves facilement le contenu de son
blog utilisant le XML (un html eacutepureacute) langage natif du blog chaque carnet web
comporte un fils RSS permettant aux visiteurs de sabonner agrave vote blog et de
recevoir instantaneacutement toute nouvelle publication actualiteacutes billets podcast ou
videacuteos Par ailleurs des services comme Feedburner128 permettent de rendre
compatibles vos flux RSS avec la majoriteacute des lecteurs RSS outils dont nous
reparlerons plus loin
La creacuteation de sites internet classiques sest elle aussi consideacuterablement simplifieacutee
un outil tel que Google Page Creator129 permet de creacuteer un site simple en 1 heure
Des sites plus sophistiqueacutes sont eacutegalement abordables sans avoir agrave connaicirctre une
ligne de programmation de html gracircce au perfectionnement des eacutediteurs dits
WYSIWYG ce que vous voyez quand vous construisez votre page est ce que vous
obtiendrez en ligne
Les outils Web 20 permettent agrave des speacutecialistes journalistes ou salarieacutes de diffuser
leur contenu Il y a encore 2 ans ils eacutetaient pour la plupart eacutecarteacutes de la publication
web faute de bagage technique
copy Digimind Digimind Services ndash White Paper |73
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Depuis le deacuteveloppement des blogs agrave partir de lautomne 2001 il est possible pour
tout internaute de diffuser sa propre information Au-delagrave des blogs dadolescents
et autres carnets intimes le web regorge de blogs agrave tendance professionnelle
corporate produits marketing experts politiques ressources humaines Cest
autant de sources potentielles quil faut exploiter afin de capter des sources
primaires de qualiteacute Le volume des blogs publieacutes et maintenus chaque jour est lui
aussi en constante augmentation
Le White Paper Blogs et RSS des outils pour la veille strateacutegique deacuteveloppe les
aspects inteacuteressants des blogs pour le professionnel de linformation130
b Les Wikis
Le wiki est finalement diffeacuterent du blog de par sa nature et son utilisation Selon
Wikipedia le Wiki est un site Web dynamique permettant agrave tout individu den
modifier les pages agrave volonteacute Il permet de communiquer et diffuser des informations
rapidement de structurer cette information pour permettre dy naviguer
commodeacutement (Wiki vient du terme hawaiien wiki wiki =rapide ou informel)
Lagrave ougrave le blog sera adapteacute agrave la diffusion dactualiteacute et de contenu se renouvelant
freacutequemment le wiki sera davantage deacutedieacute agrave du texte plus statique mais neacutecessitant
ou pouvant senrichir de la collaboration de plusieurs personnes Ainsi les articles
dune encyclopeacutedie ou les fiches correspondants aux diffeacuterentes phases dun projet
impliquant de nombreux collaborateurs pourront ecirctre reacutealiseacutees sous forme de
Wiki
Sur un blog laffichage du contenu est anteacute-chronologique (le plus reacutecent en haut)
sur un wiki il est structureacute en rubriques larchitecture comme le contenu pouvant
ecirctre modifieacutes agrave tout moment par les participants Ceux-ci peuvent beacuteneacuteficier de
droits daccegraves et de modification hieacuterarchiseacutes
Les versions anteacuterieures ainsi que les modifications sont accessibles via une rubrique
Historique Sur un blog le visiteur peut collaborer mais uniquement via ses
commentaires Sur un wiki tout collaborateur autoriseacute peut modifier le texte
comme le titre et lorganisation des rubriques
Par ailleurs la prise en main dun wiki et de ses syntaxes denrichissement et
modification demande un peu de pratique et nest pas aussi simple que le
maniement dun blog Le wiki est un des outils ideacuteaux pour la gestion de projet
Certaines entreprises les utilisent en tant que tel (parfois en parallegravele avec les blogs)
pour eacuteviter des eacutechanges des recherches et un archivage via les mails fastidieux
copy Digimind Digimind Services ndash White Paper |74
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Geacutereacute via des droits daccegraves gradueacutes il peut alors se reacuteveacuteler comme un outil tregraves
simple agrave manier et agrave sapproprier Ces wikis seront eacutevidemment reacuteserveacutes agrave
lentreprise en accegraves priveacute
Exemples de wikis publics
gt Wikipedia131
Le wiki le plus connu est Wikipedia lencyclopeacutedie collaborative gratuite dont le
contenu est creacuteeacute et maintenu par des milliers dinternautes beacuteneacutevoles Chacun est
libre de creacuteer un article modifier ceux des autres ou les commenter En mai 2007
lencyclopeacutedie proposait plus de 7 millions darticles dans 192 langues et dialectes
dont plus de 500 000 en franccedilais Wikipedia jouit dune populariteacute et dun succegraves
tregraves important Google indexe de nombreux articles de Wikipedia agrave tel point quil
est rare deffectuer une recherche sur le moteur sans voir safficher une deacutefinition
issue de lencyclopeacutedie Selon la socieacuteteacute de mesure daudience Comscore en janvier
2007 Wikipedia eacutetait le 9egraveme site US le plus visiteacute (derriegravere les sites Yahoo
premiers puis les sites Time Warner Microsoft Google eBay Fox Interactive
Amazon et Ask) 6 groupes eacuteditant un moteur geacuteneacuteraliste (Google Ask Microsoft
Yahoo Amazon et AOL) occupent le top10 US Mais cest la premiegravere fois quun
site collaboratif truste les premiegraveres places des sites les plus visiteacutes
Wikipedia comme tout service leader est tregraves critiqueacute Notamment sur la
possibiliteacute pour tout un chacun de modifier et de creacuteer des articles pouvant
entraicircner des risques de diffamation ou de vandalisation 132 Mecircme si ces risques
sont reacuteels nous le verrons dans la partie consacreacutee aux limites du Web 20 il ne
faut pas pour autant se focaliser sur ces problegravemes
Par ailleurs on a souvent mis en cause la qualiteacute des articles du contenu eacutemanant
dinternautes pas forceacutement qualifieacutes ou experts et donc par nature douteux Or
une eacutetude commandeacutee par la Revue Nature agrave remis en cause ce type de ressenti
des experts ont compareacute 42 documents publieacutes sur Wikipedia et sur la ceacutelegravebre
Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche133
Seulement 8 erreurs seacuterieuses comme des mauvaises interpreacutetations de concepts
ont eacuteteacute repeacutereacutees dans les articles analyseacutes 4 pour chaque encyclopeacutedie Des
erreurs factuelles omissions ou fausses descriptions ont eacutegalement eacuteteacute deacutetecteacutees
162 dans Wikipedia et 123 dans lEncyclopaedia Britannica
Le succegraves et limportance de Wikipedia nont pas eacutechappeacute aux moteurs de
recherche qui sont plusieurs agrave secirctre speacutecialiseacutes dans la recherche sur lencyclopeacutedie
Ainsi WikiSeek 134 est un moteur lanceacute deacutebut 2007 qui recherche sur le contenu de
Wikipedia Il indexe le contenu en crawlant les pages en profondeur et aspire
eacutegalement le contenu des liens preacutesents sur les pages de lencyclopeacutedie
copy Digimind Digimind Services ndash White Paper |75
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Plus eacutelaboreacute le moteur franccedilais Exalead 135 enrichit consideacuterablement la recherche
dans lencyclopeacutedie en ligne Cette fonctionnaliteacute est accessible en cliquant sur
longlet Wikipedia Il est eacutevidemment possible de rechercher des articles par mots
cleacutes mais aussi daffiner par langue via le nuage de tags dynamique ( les eacutetiquettes
correspondent agrave des emplacements geacuteographiques personnes ceacutelegravebres noms
drsquoorganisations termes lieacutes agrave votre requecircte ou cateacutegories de Wikipedia)
WikiMindmap 136 recherche sur Wikipedia et affiche les reacutesultats sous forme de
MindMap (cartes heuristiques) Il est alors possible de naviguer dans larborescence
des termes
WikiMindMap
gt Citizendium 137 Lanceacute fin 2006 Citizendium est une initiative de Larry Sanger co-fondateur de
Wikipedia avec Jimmy Wales Citizendium est eacutegalement une encyclopeacutedie Mais
jugeant la communauteacute Wikipedia senseacutee srsquoauto-reacuteguler dysfonctionnelle Larry
Singer integravegre dans Citizendium des proceacutedures de seacutelection des articles par des
experts et refuse aux contributeurs la possibiliteacute de lrsquoanonymat misant ainsi sur la
responsabilisation Le collegravege dexperts a le dernier mot concernant la veacuterification
des articles le but eacutetant dobtenir une encyclopeacutedie contenant le moins derreurs
possible Citizendium est structureacutee en grandes cateacutegories acadeacutemiques
correspondant agrave des groupes de travail Sciences naturelles Sciences Humaines
Arts Sciences Humaines Divertissement Arts appliqueacutes et Sciences
copy Digimind Digimind Services ndash White Paper |76
Le Web 20 pour la veille et recherche dinformation DIGIMIND
gt Alacrawiki 138
AlacraWiki est un guide deacutedieacute aux socieacuteteacutes du secteur de linformation eacutediteurs et
bases de donneacutees La rubrique Alacra Industry Spotlights est particuliegraverement
remarquable elle fournit des analyses et commentaires sur les sites dinteacuterecirct pour
une trentaine de secteurs industriels Le wiki offre des informations sur les
agreacutegateurs de contenu les bases de donneacutees et les meilleurs blogs deacutedieacutes au
secteur de linformation on-line Alacra propose aussi un blog et un fils RSS
Alacra Wiki
gt Les fils RSS 139
Sur cette page de wiki vous trouverez agrave peu pregraves tout sur le RSS
La norme comment utiliser les fils RSS des articles une seacutelection dagreacutegateurs
mixer des fils RSS entre eux mesurer lactiviteacute des fils RSS creacuteer un fil RSS
gtWikidweb 140
Wikidweb est un Wiki qui propose un reacutepertoire de sites web (et non de wikis)
Aussi vous pouvez y participer selon les fonctionnaliteacutes courantes du format wiki
vous avez ainsi la possibiliteacute dy ajouter vos propres sites mais eacutegalement de
modifier les entreacutees des autres internautes (urls texte) ou de les commenter
copy Digimind Digimind Services ndash White Paper |77
Le Web 20 pour la veille et recherche dinformation DIGIMIND
IV Surveiller
Nous lavons vu dans la partie Recherche de blogs et de flux RSS les flux RSS sont
preacutesents sur de nombreux formats du net et vont permettre de surveiller les
nouveauteacutes apparaissant sur les blogs les sites corporate les sites de presse dans
les reacutesultats de moteurs de recherche dactualiteacutes de blogs web dans les
newsgroups sur certains forums web sur certaines listes de diffusion les
bookmarks sociaux les sites de partage de photos et de videacuteoshellipbref sur de tregraves
nombreux sites classiques et ressources collaboratives de type 20
Ces flux RSS peuvent ecirctre inteacutegreacutes agrave votre process de veille en deux clics via des
outils simples gratuits ou payants mais plus puissants
a La deacutetection du flux RSS
Pour pouvoir mettre en surveillance le flux RSS (RSS Feed en anglais) il faut dabord
le trouver Or il nest pas toujours aiseacute de mettre la main sur ces petits logos
oranges ou les liens RSS Abonnez-vous Syndiquez ce flux qui pointent vers les
flux RSS parfois cacheacutes dans les meacuteandres des pages web
Des icocircnes signalant la preacutesence de flux RSS
Certains navigateurs permettent de deacutetecter automatiquement les flux lorsquils
sont preacutesents sur une page web Une icocircne vous avertira alors et dans la plupart
des cas affichera ladresse du ou des flux disponibles sur la page Plusieurs formats
de flux peuvent coexister les diffeacuterentes versions du RSS (090 091 092 10 20)
et le format ATOM concurrent mais offrant les mecircmes fonctionnaliteacutes
Internet Explorer 7 Opera Firefox permettent de deacutetecter les flux Cest aussi le cas
de Maxthon une puissante interface de navigation qui vient se greffer sur
larchitecture dInternet Explorer 141
copy Digimind Digimind Services ndash White Paper |78
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b La mise en surveillance
Quelque soit laspect de la page qui contient votre flux RSS (xml rdf interface
Feedburner) il convient de copier et coller ladresse (url) dans loutil qui va vous
servir agrave lire ce flux et agrave ecirctre alerteacute degraves lors quune nouveauteacute apparaicirct
4 grands types doutils peuvent ecirctre utiliseacutes (du plus simple au plus sophistiqueacute)
- Les navigateurs web
Les navigateurs citeacutes preacuteceacutedemment outre la deacutetection du flux RSS permettent de
sy abonner et de les lire Les flux sintegravegrent alors dans un menu lateacuteral ou dans la
page principale Cest simple mais deacutepourvu de fonctions avanceacutees de tri ou
dorganisation
- Les lecteurs (ou agreacutegateurs) de flux RSS
Ce sont les outils deacutedieacutes aux fils RSS Comme de nombreuses applications ces
lecteurs sont soit disponibles en ligne soit agrave installer localement sur votre PC
- Exemples de lecteurs RSS en ligne Bloglines Pluck Newsgator
- Exemples de lecteurs RSS installeacutes RSS Reader Amphetadesk Newsgator (sintegravegre
agrave Outlook) FeedDemon
Le lecteur Bloglines exploite de maniegravere astucieuse la logique communautaire
lorsque vous ecirctes abonneacute agrave un flux RSS vous pouvez visualiser les autres abonneacutes
(ceux qui ont accepteacute de rendre leur abonnement public) Un clic sur leur nom
affiche tous les fils RSS auxquels ils ont souscrits un moyen rapide de deacutecouvrir
dautres ressources pertinentes collecteacutees par des internautes proches de vos
centres dinteacuterecirct
Les lecteurs RSS sont tregraves nombreux Pour mieux les distinguer certains blogs ou
sites proposent des comparatifs142
copy Digimind Digimind Services ndash White Paper |79
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La communauteacute sur Bloglines les abonneacutes au flux RSS du blog Voip Weblog
- Les pages personnalisables
Ce sont des pages web geacuteneacuteralement organiseacutees en onglets et boicirctes permettant
dorganiser et de ranger ses flux par cateacutegories et ce dans un mecircme espace Ces
services sont ergonomiques et ideacuteaux pour lire dun coup doeil le maximum de flux
Les plus connus sont NetVibes PageFlakes ou Webwag
Outre la lecture de flux RSS ces pages offrent la possibiliteacute dinteacutegrer des services
de meacuteteacuteo mail bloc-notes et des flux provenant de service sociaux comme les
bookmarks ou les reacuteseaux damis
Certains blogs fournissent des listes et comparatifs de ces services143
- Les progiciels de veille inteacutegreacutes
Face agrave labondance des flux RSS et blogs des applications de veille inteacutegreacutee comme
Digimind Evolution 144 donnent la possibiliteacute de filtrer les RSS via lapplication de
requecirctes diffeacuterentes sur chaque fils RSS
On peut ainsi seacutelectionner les informations agrave remonter via des requecircte simples ou
plus complexes (booleacuteens parenthegraveses troncatures et opeacuterateurs de proximiteacute) agrave
longueur illimiteacutee En outre il est possible de surveiller jusquagrave 10 000 flux RSS
quotidiennement
Les boutons inteacutegreacutes
Certains sites vont vous simplifier la tacircche ils affichent sur leurs pages agrave coteacute de
leurs flux des boutons qui permettent dajouter directement le flux agrave votre lecteur
copy Digimind Digimind Services ndash White Paper |80
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ainsi le service dactualiteacutes Wikio ou le moteur Ask Blogs amp Flux proposent tous
deux des boutons vers Bloglines MyYahoo Google Reader Newsgator et Ask Blog
Les fichiers OPML
LOPML (Outline Processor Markup Language) est un format deacuteveloppeacute en XML qui
permet leacutechange dinformations structureacutees entre applications fonctionnant sur des
OS et environnement diffeacuterents Exemple les abonnements dun internaute agrave un
ensemble de flux RSS entre un navigateur Firefox et Internet Explorer de MacOS agrave
Windows XP
Des agreacutegateurs RSS comme Bloglines NewsGator ou Rojo offrent la possibiliteacute
dexporter lensemble de vos flux RSS favoris ou ceux dautres abonneacutes au format
OPML pour les importer ensuite dans votre agreacutegateur
Share your OPML145 est comme son nom lindique un portail qui vous permet de
partager vos flux RSS au format OPML Ce service liste des centaines de fichiers
OPML
c Pourquoi une veille via le RSS
Faire une veille via les fils RSS preacutesente des inteacuterecircts notables
- Lhyper-segmentation le choix des fils RSS rend possible une seacutelection fine de
linformation Ainsi sur le site du Figaro on peut choisir lactualiteacute internationale
nationale les sciences et meacutedecine eacutevitant ainsi decirctre submergeacute par linformation
superflue Sur La Tribune on peut seacutelectionner un flux par socieacuteteacute
Certains blogs proposent mecircme des flux RSS permettant aux choix de surveiller les
commentaires ou uniquement les billets
- Un gain de temps inutile de se connecter au site au blog ou au moteur de
recherche pour visualiser ses nouveauteacutes
- Lanonymat labonnement agrave un flux RSS contrairement agrave une newsletter ou agrave une
liste de diffusion est anonyme
- La consultation aiseacutee vos fils RSS via une lecture sur un agreacutegateur en ligne sont
accessibles de nimporte quel PC connecteacute agrave linternet ougrave que vous soyez
copy Digimind Digimind Services ndash White Paper |81
Le Web 2
copy Digimin
0 pour la veille et recherche dinformation DIGIMIND
d Digimind Services ndash White Paper
V Carte des outils et ressources Web 20
gt Page suivante
|82
wwwdigimindcom Digimind Services ndash White Paper|83
Carte des outils et ressources Web 20 - DIGIMIND Services 2007
Le Web 20 pour la veille et recherche dinformation DIGIMIND
EXEMPLE DUNE RECHERCHE ET VEILLE VIA LE WEB 20
Cas drsquoeacutecole Nous avons agrave mener une recherche et une veille sur le
deacuteveloppement des smartphones ou teacuteleacutephones multimeacutedias haut de gamme Des
sites de type 20 pourront se reacuteveacuteler compleacutementaires de sites classiques (sites
drsquoentreprises portails associations professionnelleshellip) pour deacutetecter les tendances
et sujets eacutemergents
Une premiegravere recherche via lrsquoencyclopeacutedie Wikipedia permettra drsquoobtenir une
premiegravere deacutefinition du sujet et drsquoidentifier les principaux mots cleacutes ainsi que des
liens vers des sites pertinents
Etape suivante nous pourrons eacutelargir notre recherche en identifiant des sites
similaires aux sites trouveacutes preacuteceacutedemment via les suggestions fournies par des
moteurs collaboratifs tels que Yoono ou Similicious
Une recherche sur le tag Smartphone dans des sites de social bookmarking
comme Delicious nous permettra eacutegalement drsquoidentifier les pages plus ou moins
populaires taggeacutees par les contributeurs du site ainsi que drsquoautres tags en relation
avec notre sujet
Explorons ensuite les avis drsquoexperts plus ou moins autoriseacutes que lrsquoon trouvera dans
les meacuteandres de la blogosphegravere gracircce agrave des moteurs de blogs comme Technorati
Blogpulse ou Google Blog Search
La recherche pourra srsquoeffectuer via les tags ou le texte inteacutegral des billets On
pourra ensuite parcourir les blogrolls des auteurs les plus pertinents afin drsquoidentifier
drsquoautres sources
La lecture des blogs fournira non seulement des avis de speacutecialistes ou journalistes
mais aussi des avis plus ou moins critiques de consommateurs ou utilisateurs de
smartphoneshellip
Il conviendra toutefois de rester vigilant quant agrave lrsquoeffet pot de miel de certains
blogs ougrave les contributions des internautes se reacutevegravelent ecirctre de simples messages
publicitaires deacuteguiseacutes (voir agrave ce sujet la mise en garde du site UFC Que choisir146)
Pour recueillir les derniegraveres informations drsquoactualiteacute on pourra utiliser un
agreacutegateur tel que Wikio ou Digg et creacuteer un flux RSS agrave partir drsquoune requecircte sur les
copy Digimind Digimind Services ndash White Paper |84
Le Web 20 pour la veille et recherche dinformation DIGIMIND
tags preacuteceacutedemment identifieacutes Wikio propose des raccourcis pour inteacutegrer ce flux
au sein de plusieurs lecteurs RSS du marcheacute (Netvibes Newsgator Google Reader
etc)
Les reacuteseaux sociaux professionnels permettront eacutegalement drsquoidentifier des acteurs
importants du domaine dans les sphegraveres universitaires ou de lrsquoentreprise
La communauteacute 20 srsquoexprimera eacutegalement sur les grands portails consacreacutes aux
nouvelles technologies Crsquoest le cas par exemple du portail ZDNet qui permet aux
utilisateurs de commenter les articles ou de les ajouter directement agrave leur profil
Delicioushellip Les commentaires ou les trackbacks pointant sur un article pourront
constituer un preacutecieux compleacutement drsquoinformations
Afin de mener une veille reacuteguliegravere sur le sujet on syndiquera les flux RSS provenant
des diffeacuterents sites ou blogs identifieacutes Pourquoi ne pas eacutegalement creacuteer agrave partir de
ce bouquet de sources personnaliseacutees un moteur sur mesure conccedilu gracircce agrave Rollyo
ou Yahoo Search Builder
copy Digimind Digimind Services ndash White Paper |85
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les limites du Web 20
LA PARTICIPATION
I Une participation heacuteteacuterogegravene
Nous lavons deacutejagrave eacutevoqueacute tout le monde ne participe pas de la mecircme maniegravere sur
les applications du Web 20
Une minoriteacute participativehellip
Bill Tancer de la socieacuteteacute de mesure daudience Hitwise reacutevegravele dans une eacutetude147
que sur les sites type Web 20 les internautes regardent mais participent peu
Seulement 016 des visiteurs du site YouTube viennent y partager leurs videacuteos
Les 9984 restant ne font que regarder Idem pour le site de partage de photos
de Yahoo Flickr seulement 02 des visites conduisent agrave la publication de photos
Wikipedia est lexception sur lencyclopeacutedie collaborative gratuite 46 des
visites correspondent agrave une modification des articles
Sur ces sites on est donc encore loin de la regravegle de la 11089 eacutedicteacutee par Charles
Arthur dans The Guardian148 Il estime que sur le net sur un groupe de 100
personnes si une creacutee du contenu 10 vont interagir (commentaires
ameacuteliorations) et les 89 restant ne feront que le lire et regarder Le journaliste
lillustre via des exemples quantifieacutes avec YouTube Wikipedia ou Yahoo Groups
Most Web 20 Users Are Really Just Couch Potatoes Bruce Nussbaum compare
mecircme les internautes Web 20 aux spectateurs de TV passifs et affaleacutes dans leurs
canapeacutes149
Mais parallegravelement les sites de type Web 20 ont vu leur audience grimper
de668 en 2 ans reacutevegravele leacutetude Hitwise Cela repreacutesente 12 du trafic web aux
USA contre 2 il y a seulement 2 ans
Les sites de partage de photos sont parmi les plus populaires Flickr bien sucircr mais
aussi PhotoBucket qui repreacutesente agrave lui seul 41 du trafic des sites de photos en
ligne
copy Digimind Digimind Services ndash White Paper |86
Le Web 20 pour la veille et recherche dinformation DIGIMIND
hellipdautant plus que la forme de participation se complexifie
Dapregraves le cabinet Forrester les internautes sont nombreux sur les actions agrave faible
niveau dexigence (lire enregistrer un signet commenter) mais beaucoup moins sur
des participations plus actives (eacutecrire collaborer) 150
Wikipedia un faux modegravele collaboratif
On cite souvent lencyclopeacutedie Wikipedia en exemple cest lun des emblegravemes les
plus forts et les plus lus du Web 20 Son mode de fonctionnement est
caracteacuteristique voire symptomatique du web collaboratif Mais le process de
Wikipedia serait finalement tregraves classique avec une hieacuterarchie de contributeurs
sorte de cadres disposant de nombreux droits eacutecrivant la majoriteacute des articles
Cest lanalyse de Lionel Barbe du CNRS151 Il explique que si le principe de liberteacute
de publication sur Wikipedia reste valable il est de moins en moins commun car
la plupart des entreacutees basiques ne precirctant pas agrave discussion ont deacutejagrave eacuteteacute effectueacutees
Lrsquoeacutetude des laquo logs raquo historiques montre que la creacuteation de nouvelles entreacutees qui
correspondent agrave de nouvelles pages articles dans la Wikipedia Francophone ne
concerne qursquoenviron 3 agrave 4 des opeacuterations Par comparaison cette proportion tombe
agrave 2 pour la version anglaise de Wikipedia qui contient plus de 1 million drsquoarticles A
lrsquoinverse la proportion monte entre 8 et 10 pour des Wikipedias ayant moins de
100 000 articles comme la Wikipedia en Lituanien et bien drsquoautres
Selon lui on assiste agrave un effet de professionnalisation de lencyclopeacutedie [hellip] les
plus gros contributeurs que nous consideacutererons comme eacutetant les 5 des individus
eacuteditant le plus drsquoarticles eacuteditent entre 85 et 95 du contenu total de lrsquoencyclopeacutedie
Au fur et agrave mesure ces gros contributeurs acquiegraverent des privilegraveges comme le statut
drsquoadministrateur qui leur permettent non seulement de participer mais aussi de
surveiller et le cas eacutecheacuteant censurer le contenu eacutediteacute par les autres contributeurs et de
participer aux grandes lignes de lrsquoorganisation de Wikipedia
Cette analyse a toutefois eacuteteacute battue en bregraveche par Aaron Swartz dans une petite
eacutetude 152 En mesurant non pas le nombre drsquointerventions de chaque contributeur
mais la quantiteacute de texte produit par chacun la reacutealiteacute est diffeacuterente les
contributeurs occasionnels eacutecriraient des textes longs en peu dinterventions tandis
que les eacutediteurs actifs reacutealiseraient un travail tenant davantage de la maintenance
(correction veacuterification suppression) mais sans apporter beaucoup de texte
copy Digimind Digimind Services ndash White Paper |87
Le Web 20 pour la veille et recherche dinformation DIGIMIND
II Une participation damateurs
Tout internaute peut-il simproviser journaliste expert commentateurhellip
Michel Fingerhut 153 voit dans le succegraves dune encyclopeacutedie comme Wikipedia une
manifestation du web comme heacutegeacutemonie de lrsquoamateurisme et comme encouragement
agrave lrsquoextreacutemisme ideacuteologique et au communautarisme
Les contenus creacuteeacutes et diffuseacutes sont-ils de qualiteacute Le Web 20 devient une
plateforme qui stimule la creacuteativiteacute et la production de contenu par cela mecircme
qursquoelle en permet la diffusion (avec indice de notorieacuteteacute) On assiste agrave une libeacuteration
de talents qui peuvent enfin se reacuteveacuteler parallegravelement agrave des productions
caracteacuteriseacutees par un certain amateurisme et lrsquoabsence de veacuteritable ambition
creacuteatrice Car comme sur lensemble de linternet sur ce Web 20 le pire cocirctoie le
meilleur
Par ailleurs toujours en prenant lexemple de Wikipedia un certain nombre de
pheacutenomegravenes se reacutevegravelent tout de mecircme preacuteoccupants
Si leacutetude reacutealiseacutee pour le magazine Nature reacutevegravele que la qualiteacute des articles de
lencyclopeacutedie est presque au niveau de celle de lEncyclopaedia Britannica certains
articles de Wikipedia relegravevent de la deacutesinformation ou de la propagande
- larticle Droits de lHomme en Iran154 a ainsi eacuteteacute tregraves controverseacute en effet cet
article tregraves long de plus de 20 pages se preacutesente davantage comme une apologie du
reacutegime iranien quune analyse argumenteacutee des droits de lhomme dans ce pays Or
certainement au nom du principe de neutraliteacute qui reacutegit Wikipedia cet article
tendancieux a eacuteteacute classeacute comme article de qualiteacute 155
- le cas Seigenthaler 156 en mai 2005 un contributeur publie anonymement sur
Wikpedia un article sur John Seigenthaler Sr un eacutecrivain ceacutelegravebre aux USA Or ce
billet mentionne que leacutecrivain a eacuteteacute directement impliqueacute dans les assassinats de
John et Bob Kennedy en preacutecisant toutefois que rien na jamais eacuteteacute prouveacute Cette
information est tout simplement fausse Mais larticle nest deacutecouvert (par un ami de
John Seigenthaler) et corrigeacute que 4 mois plus tard mettant agrave mal la creacutedibiliteacute de
lencyclopeacutedie A la suite de cette affaire largement relayeacutee par les meacutedias
ameacutericains le fondateur de Wikipedia a rigidifieacute les regravegles de publication concernant
les tout nouveaux contributeurs
Certes sur les milliers darticles mis en ligne par Wikipedia ces dysfonctionnements
restent heureusement minoritaires mais ils reacutevegravelent tout de mecircme certaines limites
du tout collaboratif et la neacutecessiteacute de regravegles de publication emprunteacutees aux meacutedias
classiques
copy Digimind Digimind Services ndash White Paper |88
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Lagreacutegation de petites choses faciles
Elles ont tendance agrave dominer le contenu du Web 20 La faciliteacute de publication le
rythme des blogs qursquoil convient drsquoalimenter freacutequemment peut entrer en conflit
avec le temps de la recherche et de la reacuteflexion Souvent les thegravemes traiteacutes ne
peuvent degraves lors ecirctre que des sujets du quotidien des opinions non reacutefleacutechies non
argumenteacuteeshellipOn peut donc craindre agrave linstar du mode de diffusion sur dautres
meacutedias quinteacutegreacute agrave un reacuteseau social noteacute eacutevalueacute agrave la recherche de notorieacuteteacute et de
visibiliteacute le creacuteateur de contenu ait tout inteacuterecirct agrave aller dans le sens de son audience
produire du divertissant plus agrave mecircme de lui garantir un succegraves immeacutediat
Par ailleurs des opinions peuvent-elles se transformer en jugement pertinent par
lrsquoeffet de leur agreacutegation Lrsquoagreacutegation drsquoune quantiteacute importante drsquoavis peut elle
vraiment deacutepasser lrsquoimpreacutecision des avis pris indeacutependamment Peut-on sans une
harmonisation des critegraveres drsquoappreacuteciation atteindre un jugement collectif fiable Les
tendances qui ressortent risquent en effet de se limiter souvent au reflet de
lrsquoopinion majoritaire
Mais leacutevocation de ces limites ne doit pas occulter toutes les contributions matures
produites par des internautes soucieux dapporter un contenu veacuteritablement
constructif Les billets et les commentaires de nombres de blogs politiques franccedilais
en 2007 en sont une parfaite illustration
LE WEB 10 RESTE NECESSAIRE
Le mail reacutesiste
Nous lavons vu au cours de la description des applications pour la veille les services
Web 20 ne sont pas suffisants en soit pour la recherche dinformation De plus
bien que ses possibiliteacutes soient tregraves puissantes lutilisation du Web 20 reste encore
marginale agrave leacutechelle de tous les internautes Une eacutetude du cabinet Pew Internet 157
montre que lactiviteacute internet dominante sur une journeacutee type dun ameacutericain reste
tout simplement le mail 53 des internautes lutilisent Ils sont 38 agrave utiliser un
moteur de recherche Par contre ils ne sont que 8 agrave creacuteer des blogs et 26 agrave
partager des photos et videacuteos cette collaboration multimeacutedia eacutetant de loin lactiviteacute
la plus courante du Web 2
copy Digimind Digimind Services ndash White Paper |89
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une enquecircte en ligne de lUniversiteacute dOxford reacutealiseacutee aupregraves de 1469 personnes
(une majoriteacute deacutetudiants) fin 2006 deacutetaille les usages du Web 20 158 Elle reacutevegravele elle
aussi que les applications de ce web nouvelle geacuteneacuteration sont encore peu connues
et peu utiliseacutees La majoriteacute des reacutepondants na jamais employeacute ou jamais entendu
parleacute des fils RSS ou des applications de Social Bookmarking comme Delicious
Aussi linfluence grandissante du Web 20 ne doit pas masquer les usages
traditionnels du web qui restent majoritaires
Une population souvent isoleacutee et non repreacutesentative
Lage
Si de nombreuses applications sociales apportent un reacuteel progregraves il faut tempeacuterer
la nature de certains contenus issus du mode collaboratif celui-ci nest en effet pas
repreacutesentatif des internautes puisque le public du Web 20 est une population plutocirct
jeune
Ainsi leacutetude Pew Internet reacutevegravele que laudience de Wikipedia aux USA eacutetait en aoucirct
2006 agrave 47 situeacutee dans la tranche des 18-34 ans Les plus de 45 repreacutesentaient
28 Sur le site dEncarta lencyclopeacutedie de Microsoft plus traditionnelle (Web 10)
la part des plus de 45 ans atteint 33
Des communauteacutes isoleacutees structureacutees en icircles Les communauteacutes actuelles du Web 20 sont souvent renfermeacutees sur elles-mecircmes
les statistiques sur les liens pointant vers les blogs et sur les liens preacutesents dans les
billets reacutevegravelent que les blogueurs se lient et se lisent beaucoup entre eux
Lrsquointernaute Web 20 aurait donc tendance agrave senfermer sur lui-mecircme et autour
dindividus feacutedeacutereacutes en communauteacutes focaliseacutes sur les mecircmes centres drsquointeacuterecirct que
lui
Par ailleurs lhyper segmentation et le ciblage des nouvelles rendu possible par le
flux RSS notamment peut conduire agrave favoriser ces microcosmes communautaires
Parcourir un journal papier peut favoriser davantage louverture la prise de recul et
la mise en perspective des diffeacuterentes informations que la lecture de flux aux
theacutematiques tregraves speacutecialiseacutees
Les diffeacuterentes communauteacutes par reacuteflexe et de par la nature des applications Web
20 qui se dupliquent mais ne se connectent pas ont tendance agrave peu communiquer
entre elles Ainsi les liens entre reacuteseaux sociaux sont rares Peu de personnes
copy Digimind Digimind Services ndash White Paper |90
Le Web 20 pour la veille et recherche dinformation DIGIMIND
enregistreacutes sur LinkedIn iront eacutegalement sinscrire sur Viadeo ou FaceBook
Latomisation des donneacutees sur des dizaines dapplications reste eacutegalement un vrai
problegraveme
Des domaines mal couverts
Certaines theacutematiques vont ecirctre surrepreacutesenteacutees au deacutetriment dautres au
traitement beaucoup plus confidentiel car boudeacutees par les internautes producteurs
volontaires dinformation Les ingeacutenieurs techniciens et jeunes eacutetant fortement
repreacutesenteacutes parmi les blogueurs les theacutematiques high tech sont tregraves largement
couvertes par les blogs par exemple dans le domaine de la RFID (Identification par
Radio Freacutequence) on compte plus de 100 blogs idem pour la VoIP (Voix sur IP) A
linverse si vous travaillez dans le secteur des machines outils ou de la plasturgie il
vous sera difficile de trouver du contenu sur la blogosphegravere
Tous les secteurs ne sont donc pas eacutegaux en volume sur le net et davantage encore
sur la blogosphegravere et sur les autres applications collaboratives ougrave tout internaute
peut publier son propre contenu et ougrave certaines tranches dacircges et cateacutegories
professionnelles ne sont pas bien repreacutesenteacutees
copy Digimind Digimind Services ndash White Paper |91
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Conclusion
Le Web 20 ce mot qui geacutenegravere eacutenormeacutement de buzz deacutecrits et de blogs
speacutecialiseacutes nest-il quun terme marketing un courant de mode 159 Il est probable
que bientocirct on ne lemploiera plus pour deacutesigner ces nouvelles applications qui
seront devenues la norme Toutefois ce terme sorte de parapluie conceptuel qui
recouvre les diffeacuterentes tendances du web nouvelle geacuteneacuteration a le meacuterite de
mettre un nom simple sur un courant du net novateur
Le Web 20 nest pas une reacutevolution ou une rupture technologique mais plus
certainement une eacutevolution qui permet de replacer lutilisateur au centre des
reacuteseaux Cela nest certes pas tregraves nouveau Usenet lun des plus anciens
protocoles de linternet bien anteacuterieur au WWWeb offrait du contenu en ligne
creacuteeacute par linternaute via les Newsgroups degraves les anneacutees 1980
Mais les progregraves technologiques ont permis dintensifier cette tendance et de
deacutemocratiser laccegraves agrave la creacuteation de contenu en ligne et agrave sa diffusion au plus grand
nombre Potentiellement tout internaute peut maintenant diffuser ses publications
tant les outils sont devenus simples
Le Web 20 tend agrave sinseacuterer au cœur du quotidien de chacun en lui apportant des
services novateurs reacuteellement utiles et qui rendent possible lrsquoapparition de
nouveaux usages Ainsi les mash-up qui srsquoappuient sur la geacuteolocalisation ouvrent
des possibiliteacutes inenvisageables jusquici On peut mecircme imaginer agrave terme une
superposition de ces cartes dynamiques agrave la vision reacuteelle dun pieacuteton ou dun
automobiliste Le Web 20 est en perpeacutetuelle eacutevolution ses capaciteacutes drsquoinnovation
sont tregraves fortes car elles reposent souvent sur des recombinaisons audacieuses de
lrsquoexistant hybridant applications et services dans un systegraveme de deacuteveloppement
open source hellipLrsquoinnovation est aussi innovation de postures (prendre la parole
consommer du contenu amateurhellip) qui parfois challengent lrsquoordre eacutetabli et
redistribuent les pouvoirs La position des acteurs du Web 10 ou des meacutedias
classiques pourrait se trouver de plus en plus remise en question lagrave ougrave les
internautes tendent agrave se placer en experts
copy Digimind Digimind Services ndash White Paper |92
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La place de lhumain
Si celle-ci est devenue preacutepondeacuterante il est toutefois difficile de saffranchir
dorganisations un tant soit peu hieacuterarchiseacutees lautoreacutegulation voir Wikipedia ayant
ses limites
En outre la question de la consommation de contenu et de sa qualification sur
lrsquointernet devient cruciale La pertinence des votes de tous les internautes est
discutable ou du moins le fait qursquoils puissent agrave eux seuls qualifier et eacutevaluer la
qualiteacute Par ailleurs que repreacutesente exactement un vote une adheacutesion au contenu
agrave la forme aux ideacutees aux eacutecrits dun ami agrave une ideacutee avec laquelle je suis en
deacutesaccord mais qui agrave le meacuterite dexister
Finalement il faut continuer agrave normer organiser coordonner
reacutegulerhellipnotamment pour eacuteviter les diffamations ou la deacutesinformation Pour ce qui
est du contenu et de sa qualiteacute les critiques eacutemises agrave lrsquoencontre de Wikipeacutedia nous
incitent agrave eacutetudier de plus pregraves les initiatives qui hybrident les interventions
drsquoamateurs avec les compeacutetences de professionnels
Nous sommes passeacutes en 10 ans dun contenu geacuteneacutereacute par quelques internautes pour
la masse agrave un contenu de masse agrave destination de la masse (Evertybody to
Everybody) Cela ne peut guegravere se deacutevelopper sans des meacutecanismes qui replacent
les internautes les plus speacutecialiseacutes dans des processus de validation dune
information devenue pleacutethorique
Les donneacutees personnelles
Simpliciteacute reacuteactiviteacute personnalisation souplesse mutualisationhellipfont partie des
avantages les plus appreacuteciables du web 20 Mais cette liberteacute de publication et de
diffusion nrsquoest elle pas parfois illusoire Les utilisateurs doivent rester vigilants face
aux problegravemes de confidentialiteacute seacutecuriteacute et traccedilabiliteacute de lrsquoinformation160 Des voix
srsquoeacutelegravevent pour deacutenoncer les risques lieacutes agrave la maicirctrise des donneacutees personnelles ou
au respect des droits drsquoauteurs A noter que les licences Creative Commons161
permettent de mieux deacutefinir les contours de cette liberteacute agrave partir de contrats
flexibles de droit dauteur Ce systegraveme Creative Commons donne la possibiliteacute
gratuitement et simplement aux titulaires de droits de choisir et drsquoexprimer les
conditions drsquoutilisation de leurs œuvres agrave travers onze possibiliteacutes Quant aux
utilisateurs ils nrsquoont pas agrave neacutegocier systeacutematiquement une autorisation avant toute
utilisation ou reacuteutilisation
copy Digimind Digimind Services ndash White Paper |93
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Un autre problegraveme reacuteside aussi dans lrsquoeacuteparpillement des donneacutees dans des sites
diffeacuterents ou parfois redondants Il srsquoagira donc de deacutefinir les objets (livre
personne CD photoshellip) agrave partir drsquoun identifiant Cette bataille pour savoir qui
geacuterera ces donneacutees de base telles que la position geacuteographique les espaces de noms et
le code unique de chaque produit a deacutejagrave commenceacute estime Tim OReilly 162
Les perspectives deacutevolution vers un Web 3
Le web actuel est destructureacute et la classification et lrsquoorganisation de son contenu
posent problegraveme La recherche de nouveaux modes de recherche et de
structuration est une sorte de quecircte du graal que de nombreux experts et
entreprises poursuivent
La folksonomie repose sur une ideacutee originale qui sous tend toute lrsquoideacuteologie Web
20 celle de lrsquointelligence collective et de la deacutecentralisation Mais les limites de la
folksonomie appeleacutee aussi web seacutemantique du pauvre remettent en question
lrsquoaffirmation selon laquelle lrsquointelligence collective et la libeacuteralisation totale du
fonctionnement du web 20 sont une solution viable
Aussi la neacutecessiteacute drsquoun Web seacutemantique 163 fiable se fait de plus en plus urgente
Cette nouvelle phase de deacuteveloppement du Web permettrait drsquoameacuteliorer
lrsquoexploitation des informations par les utilisateurs en obtenant une information
organiseacutee normaliseacutee de faccedilon agrave rendre le web compreacutehensible aux machines pour
faciliter lrsquoexploitation par les utilisateurs
Dans un article paru dans le New York Times en novembre 2006 John Markoff
imagine un web 30 selon le principe drsquoajout dune couche de sens tout en haut du
web existant pour en faire un guide au lieu drsquoun simple catalogue Pour lrsquoauteur
nous sommes en train de passer dun web de documents connecteacutes agrave un web de
donneacutees connecteacutees
Le web seacutemantique offrira un langage commun permettant aux donneacutees de
renvoyer agrave des objets du monde reacuteel dune faccedilon identique Le projet Freebase
lanceacute par la start up Metaweb illustre cette approche il a pour objectif de faciliter
la recherche et le partage drsquoinformations agrave travers une base de connaissances
communes structureacutees via des meacutetadonneacutees permettant de deacutecrire chaque
eacuteleacutement drsquoinformation Ces eacuteleacutements seraient relieacutes entre eux par un systegraveme de
relations Tim OrsquoReilly deacutefinit le projet comme la machine agrave creacuteer les synapses du
cerveau global
Il srsquoagirait de creacuteer en quelque sorte un Google du web seacutemantique un reacutepertoire global
drsquoinformations structureacutees intelligibles et exploitables autant par des machines que par
copy Digimind Digimind Services ndash White Paper |94
Le Web 20 pour la veille et recherche dinformation DIGIMIND
des humains -et donc capables drsquoextraire et drsquointerpreacuteter les relations entre des donneacutees
pour par exemple reacutepondre agrave des requecirctes par des solutions plutocirct que des listes de
document 164
La veille
Dans cet univers le chercheur dinformations et le veilleur doiventhellipgarder la tecircte
froide la forte meacutediatisation du Web 20 ne doit pas masquer la pertinence doutils
plus traditionnels Les diffeacuterentes applications Web 20 nous lavons vu suffisent
rarement pour mener agrave bien une collecte dinformation Certes les bookmarks
sociaux apportent un contenu seacutelectionneacute par linternaute mais on ne peut se
deacutepartir des moteurs de recherche web classiques La surveillance des flux RSS
permet decirctre alerteacute sur de nombreux sujets mais la majoriteacute des sites web restent
encore deacutepourvus de ces fils Les tags apportent une veacuteritable souplesse agrave
lutilisateur mais la taxonomie des bibliothegraveques ou des reacutepertoires web- pour ne
citer que ces lieux- reste essentielle pour se repeacuterer agrave travers des milliers de
ressources
Le Web 20 pour la recherche et la veille nen est quagrave ses balbutiements Aussi
avant quil ne digegravere complegravetement par enrichissement les ressources et les
applications Web 10 il convient de faire coexister ces 2 web dans les pratiques
Le Web 20 apporte une richesse essentielle lrsquoexpression drsquoindividus porteurs
drsquoideacutees et de faculteacutes susceptibles drsquoapporter des changements de re-questionner
lrsquoordre eacutetabli eacuteleacutements indispensables agrave lrsquoeacutevolution de la culture agrave condition de ne
pas oublier que des volonteacutes ambitieuses doivent intervenir pour canaliser les
initiatives sans les eacutetouffer et leur insuffler une veacuteritable ambition Voilagrave tout
lenjeuhellip
copy Digimind Digimind Services ndash White Paper |95
Le Web 20 pour la veille et recherche dinformation DIGIMIND
A propos des auteurs DIGIMIND SERVICES
Digimind Services accompagne les plus grandes entreprises pour la conception la
mise en œuvre et le deacuteploiement de projets de veille qui reposent sur la solution
Digimind Evolution apportant agrave ses clients un retour sur investissement de plus de
600 et ce degraves la premiegravere anneacutee Les meacutethodologies proprieacutetaires du
deacutepartement conseil ainsi que son expertise des probleacutematiques et sources
drsquoinformations sur plus de 20 secteurs drsquoactiviteacute deacuteveloppeacutee aupregraves de ses clients
depuis de nombreuses anneacutees permet aux entreprises drsquoanticiper les changements
de leur environnement pour prendre les meilleures deacutecisions sur leur marcheacute
Le conseil Digimind porte sur tous les aspects du workflow de veille ciblage
strateacutegique collecte des informations traitement et analyse exploitation et
diffusion gestion de projet conseil organisationnel et gestion du changement
formations et support fonctionnel et technique
CHRISTOPHE ASSELIN
Issu drsquoun cabinet drsquoeacutetudes de marcheacute B2B et speacutecialiseacute depuis 1997 dans la mise en
place de systegravemes de veille (e-Franceorg Ecole Militaire) Christophe Asselin allie
une connaissance approfondie des secteurs eacuteconomiques et une parfaite maicirctrise
des outils de recherche sur internet et des solutions avanceacutees de veille Expert
reconnu il eacutedite le site httpwwwintelligence-centercom et le blog
httpinfluxjouebcom tout deux consacreacutes agrave la recherche dinformation
Speacutecialiste de la veille internet chez Digimind il accompagne les clients dans la mise
en place de leur dispositif de veille (expression des besoins deacutefinition de plans de
veille sourcing architecture parameacutetrage formation accompagnement) Il
intervient ainsi aupregraves de socieacuteteacutes dans diffeacuterents secteurs les teacuteleacutecoms avec
France Telecom RampD lrsquoindustrie pharmaceutique avec Sanofi Aventis Roche
Pharma Expanscience ainsi quAlstom Transport Veolia Environnement et des
reacutefeacuterences confidentielles dans le secteur des biotechnologies de leacutenergie des
teacuteleacutecoms de limprimerie de la deacutefense du conseilhellip
copy Digimind Digimind Services ndash White Paper |96
Le Web 20 pour la veille et recherche dinformation DIGIMIND
[Merci au Service Marketing agrave Malaiac wwwmalaiacnet et agrave Elsa Bonier eacutetudiante
en Master 2 Management des innovations en communication agrave Paris XIII pour leur
fructueuse collaboration]
VERONIQUE MESGUICH
Apregraves avoir fondeacute et co-dirigeacute pendant six ans un cabinet speacutecialiseacute en veille
technologique Veacuteronique Mesguich dirige lrsquoInfothegraveque du Pocircle Universitaire
Leacuteonard de Vinci Elle enseigne eacutegalement la maicirctrise de linformation strateacutegique
dans plusieurs eacutetablissements denseignement supeacuterieur et anime reacuteguliegraverement
des sessions de formation continue autour de la meacutethodologie de recherche
avanceacutee et de veille sur Internet
Veacuteronique Mesguich est lrsquoauteur avec Armelle Thomas de lrsquoouvrage Net
recherche le guide pour trouver lrsquoinformation utile dont la deuxiegraveme eacutedition est
parue en mars 2007 aux eacuteditions de lrsquoADBS
copy Digimind Digimind Services ndash White Paper |97
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Webographie Bibliographie
Sources dinformation sur le Web 20
Sites web wikis et blogs
Reacutepertoires et classement de services et socieacuteteacutes Web 20 - 20 Websites http20websitescom - Web 20 Magazine Top 100 Web 20 Sites httpweb2magazineblogspotcom200701thanks-for-web-2html - Web 20 Magazine The Best Web 20 Software of 2006 httpweb2socialcomputingmagazinecomthe_best_web_20_software_of_2006htm - Complete List of Web 20 Products and Services httpwwwlistiblecomlistcomplete-list-of-web-2-0-products-and-services - The Complete Web 20 Directory httpwwwgo2web20net - FredCavazzanet le meilleur du Web 20 httpwwwfredcavazzanetindexphp20051212986-le-meilleur-du-web-20 - Web 20 Directory 1200+ Web 20 Sites in 50+ categories httpweb2econsultantcomindexhtml
- Top 25 Web 20 Search Engines httpoedborglibraryfeaturestop-25-web20-search-engines
- 25 start-ups Web 20 prometteuses httpmoneycnncom20070221magazinesbusiness2nextnet_introbiz2
copy Digimind Digimind Services ndash White Paper |98
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Blogs et sites speacutecialiseacutes - Le groupe de travail Web20 francophone httpwwwweb20workgroupfr
- Web 20 Work Group httpweb20workgroupcom - Dessine-moi le Web 20 httpwwwdeuxzerocom - FredCavazzanet httpwwwfredcavazzanet
- TechCrunch en franccedilais httpfrtechcrunchcom - TechCrunch httpwwwtechcrunchcom
- Le web 20 cest pas du buzz httpweb2rulesblogspotcom
- Mashable France httpfrmashablecom - Mashable httpmashablecom - AccessoWeb httpblogaccessowebinfo - Web 20 Magazine httpweb2magazineblogspotcom - Reacutevolution Web 20 en Live httpwwwwebdeuxinfo
- ReadWriteWeb httpwwwreadwritewebcom - Web 20 Innovations httpweb2innovationscom - Web 20 Summit httpwwwweb2concom
- Original Signal (agreacutegateur de flux RSS) httpwwworiginalsignalfr - Whats Web 20 (agreacutegateur de flux RSS) httpwwwwhatsweb20comaggregatorfrom=100
- Le blog de Bloxx Communiquons avec le Web 20 httpblogbloxxfr
copy Digimind Digimind Services ndash White Paper |99
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- FrenchWeborg Le blog des professionnels franccedilais du Web 20 httpwwwfrenchweborg
- Blog Web 20 et Marketing httpwwwvincentabrycom - Le Web 20 en Action httpleweb2blogspotcom - aYsoon 20 httpblogaysooncom Emmanuel de Taillac httpemmanueldetaillacfr - NiouMedia httpnioumediacom - 2803 httpwww2803com - Web 2 francophone (Wiki) httpweb2frcomAccueil
Blogs et sites avec un axe Web 20
- Publishing 20 httppublishing2com - Social-Computing httpwwwsocial-computingcom - Ecosphere httpecospherewordpresscom - inFLUX httpinfluxjouebcom - Benoit Descary httpdescarycom - Jean Michel Billaut httpbillauttypepadcomjm - Blog francophone des TIC httpwww2607fr 20Minutes Top 50 tech et meacutedias httpwww20minutesfrarticle15087620070410-Blogs-Top-50-tech-et-mediaphp - Intruderstv httpnewintruderstvintruders_fr
copy Digimind Digimind Services ndash White Paper |100
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- Jeff Clavier Sans Accent httpsansaccentsofttechvccom - Demain tous journalistes httpbenoit-raphaelblogspotcom
- Collectif louvre-boicircte Initiatives sur le partage dinformation httplouvre-boiteviablogacom
- Zero seconde httpzerosecondeblogspotcom
Articles
Introduction au Web 20
- Web 20 lrsquoarticle de OrsquoReilly reacutesumeacute pour les faineacuteantshellip httpwwwexpressionsbe20051101web-20-resume-pour-les-faineants
- Dossiers Web 20 - Journal Du net httpwwwjournaldunetcomdossiersweb20
- Avis des managers le Web 20 agrave la loupe httpwwwjournaldunetcomsolutions0603diaporamaavis-managers-web21shtml
- Les entreprises face aux deacutefis du Web 20 httpwwwjournaldunetcomsolutions0704070413-entreprises-web-201shtml
-The Machine is Using Us Transcription (videacuteo) httpmediatedculturesnetksudiggp=78
- The New Wisdom of the Web httpwwwmsnbcmsncomid12015774sitenewsweek
- Quest-ce que Web 20 httpwww01netcomarticle294819html
- Approaching a definition of Web 20 httpsocialsoftwareweblogsinccom20050929approaching-a-definition-of-web-2-0
- Fonctionnement de lrsquoentreprise classique vs entreprise 20 httpalbancornilletfreefrakwindexphp20061002fonctionnement-de-lentreprise-classique-vs-entreprise-20
- Meacutedias traditionnels et acteurs du Web 20 vers la cohabitation ou la convergence des acteurs de lrsquoinformation et du divertissement httpwwwscribdcomdoc50818These-sur-le-Web-2-Cabanis
copy Digimind Digimind Services ndash White Paper |101
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ajax
- LAjax en 5 questions httpwwwjournaldunetcomsolutions0602060208_qr-ajaxshtml - Ajax et Moteurs 20 httpwwwmoteurzinecomarchives2006moteurzine127html2
Les Mashups
- Les Mashups applications Web composites tregraves Web 20 httpwwwjournaldunetcomsolutions0606060628-qr-mashup-hybrideshtml
- Le modegravele eacuteconomique des Mashups httpwwwinternetactunetp=6285 Bookmarks sociaux Social search
- Le Social Bookmarking au secours de la pertinence de la recherche drsquoinformation httpwwwgillesbalmissecomv2spipphparticle171 - Whats the Big Deal With Social Search httpsearchenginewatchcomshowPagehtmlpage=3623153
- Whos Who in Social Search httpsearchenginewatchcomshowPagehtmlpage=3623173
Ouvrages
- Web 20 - Les internautes au pouvoir - Jean-Franccedilois Gervais httpwwwdunodcompagesouvragesficheouvrageaspid=50701
- Les reacuteseaux sociaux Pivot de lrsquointernet 20 - Alain Lefebvre httpwwwcluster21comfrbookreviewlivre_les_reseaux_sociaux - Web 20 (R)eacutevolutions et nouveaux services dInternet - Jean-Noeumll Anderruthy httpwwwamazonfrWeb-2-0-C3A9volutions-nouveaux-dInternetdp2746034972ref=sr_1_18402-7140143-8118507ie=UTF8amps=booksampqid=1178118687ampsr=8-18 - Web 20 The Future of the Internet and Technology Economy and How Entrepreneurs Investors Executives amp Consumers Can Take Ad httpwwwamazoncomWeb-2-0-Technology-Entrepreneurs-Execenablersdp1587622009ref=sr_1_6103-0331542-4028646ie=UTF8amps=booksampqid=1178118732ampsr=1-6
- La Longue Traicircne La nouvelle eacuteconomie est lagrave - Chris Anderson httpwwwamazonfrLongue-TraC3AEne-nouvelle-C3A9conomie-
copy Digimind Digimind Services ndash White Paper |102
Le Web 20 pour la veille et recherche dinformation DIGIMIND
estdp2744062693ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180542516ampsr=1-1 - The Geospatial Web How Geobrowsers Social Software and the Web 20 are Shaping the Network Society httpwwwamazoncomGeospatial-Web-Geobrowsers-Information-Processingdp1846288266ref=sr_1_28103-0331542-4028646ie=UTF8amps=booksampqid=1178118760ampsr=1-28 - Les Wikis espaces de lintelligence collective - Jeacuterocircme Delacroix httpwwwamazonfrWikis-JC3A9rC3B4me-Delacroixdp2952051445ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180544723ampsr=8-1 - Pro Web 20 Mashups Remixing Data and Web Services httpwwwamazonfrPro-Web-2-0-Mashups-Remixingdp159059858Xref=sr_1_4403-1740173-8750801ie=UTF8amps=english-booksampqid=1180542751ampsr=8-4 - Web 20 et Web avanceacute - Alexandre Boni Nicolas Stemart httpwwwamazonfrWeb-2-0-avancC3A9-Alexandre-Bonidp2742967281
copy Digimind Digimind Services ndash White Paper |103
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Dans la mecircme collection
White Paper Blogs et RSS des outils pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind
White Paper
Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind
White Paper
Cateacutegorisation automatique de textes
White Paper
Benchmark des solutions de veille strateacutegique
White Paper
Evaluer le Retour sur Investissement dun logiciel de veille Edouard Fillias Consultant Veille Strateacutegique Digimind
gt A teacuteleacutecharger sur httpwwwdigimindfrserviceswhite_paperhtm
copy Digimind Digimind Services ndash White Paper |104
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Notes 1 httpwwwguimfrblog200612le_film_autumn_html httpwwwlemondefrwebarticle01-02-65186536-8751060html 2 httpvideogooglefrvideoplaydocid=724218352255575783 3 Map of online communities par Randall Munroe httpwwwxkcdcomc256html 4 httpwwwdeuxzerocom 5 httpwwwpaulgrahamcombiohtml httpfrwikipediaorgwikiPaul_Graham 6 Qursquoest ce que le web 20 Hubert Guillaud Internet Actu 29 mai 2005 httpwwwinternetactunetp=6144 7 httpwwworeillynetcompubaoreillytimnews20050930what-is-web-20html httpweb2rulesblogspotcom200601what-is-web-20-par-tim-oreilly-versionhtml 8 httpwwwzdnetfractualitesinternet0390207743933447900htm 9 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 10 httpwwwinternetactunetp=7035 11 httpwwwhitwisecomdatacenter 12 httprosstypepadcomblog200604power_law_of_pahtml 13 httpblogsforrestercomcharleneli200704forresters_new_html 14 httpwwwtagcrowdcom 15 You Say You Want a Web Revolution httpwwwwiredcomsciencediscoveriesnews20050868403 16 httpsaddonsmozillaorgfrfirefoxaddon748 httpwwwjournaldunetcomdeveloppeurtutorielout050525-greasemonkey-presentationshtml 17 Mashups Google Maps httpwwwmibazaarcomextrasfortune100html httpwwwweatherbonkcomweatherindexjsp httpgmapstommanganusspacecraft_trackinghtml 18 httpwwwgooglecomcalendar 19 httpdocsgooglecom 20 httpwwwmoovementfr 21 httpwwwcooptincomfrWEBhomeaspx httpwwwjobmeeterscomfraccueilindexphp 22 httpwwwzliocom httpshoppingyahoocomshoposphere
copy Digimind Digimind Services ndash White Paper |105
Le Web 20 pour la veille et recherche dinformation DIGIMIND
23 httpwwwciaofr httpwwwwantunocom 24 httpmapsgooglefr httpwwwgeoportailfr httpearthgooglefr httpmapsyahoocom httpwwwflickrcom httpwwwzdnetfractualitesinternet0390207743936635400htm 25 httpwwwcriteocom 26 From Youtube to Youniversities Henry Jenkins 16 feacutevrier 2007 httpwwwhenryjenkinsorg200702from_youtube_to_youniversityhtml 27 httpaffordancetypepadcom 28 httpwwwplosoneorghomeaction 29 Web collaboratif web coopeacuteratif web 20 quelles interrogations pour lrsquoenseignant documentaliste Marie France Blanquet 12 janvier 2007 httpeprofsdocscrdp-aix-marseillefrIMGrtfintervention-MF-Blanquetrtf 30 httpveillepedagogiquebloglemondefr 31 httpbibliobsessionfreefrdotclear 32 httpliblogsalbanyedulibrary20200611a_librarians_20_manifestohtml 33 httpdelicious 34 httpwwwconnoteaorg httpwwwciteulikeorg httpwwwsnipitroncom 35 httpdelicious httpwwwblinklistcom httpblogmarksnet httpwwwfurlnet httpfrbetabookmarksyahoocom httpmyweb2searchyahoocom 36 httpwwwstumbleuponcom httpsimilicious httpwwwyoonocomindexjsp 37 Social bookmarks charts version 35 httpwwwiroxdefile_download3 httpwwwroxomaticde856 Social Bookmarking Services And Tools The Wisdom Of Crowds That Organizes The Web httpwwwmasternewmediaorgnews20061201social_bookmarking_services_and_toolshtm Free Bookmark Managers
copy Digimind Digimind Services ndash White Paper |106
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwfeedbuscombookmarks 38 httpwwwflickrcom 39 httpwwwflickrcomgroupstehipool 40 httpwwwflickrcomphotostagsnorthamericaninternationalautoshow 41 httpphotobucketcom 42 httpwwwsquidoocom 43 httpwwwsquidoocomnanotechRev 44 httpwwwsquidoocomtagsmarketing 45 httpwwwyoutubecom 46 httpwwwdailymotioncom 47 Une seacutelection de moteurs de recherche videacuteo et de services de partage et teacuteleacutechargement de videacuteos httpcasselinfreefrfrenchvideoshtm 48 httpwwwemarketercomArticleaspxid=1004918 49 httpwwwviadeocom 50 httpwwwlinkedincom 51 httpwww6nergiesnet httpwwwxingcom 52 httpwwwfacebookcom 53 httpenwikipediaorgwikiList_of_social_networking_sites 54 httpwwwlinknrankcombusinessphp 55 httpdiggcom 56 httpwwwnuouzcom httpwwwblogmemescom httpwwwscoopeocom httpwwwfuzzfr httpwwwtapemoicom httpmeneamenet httpwwwrojocom httpwwwbetanetscapecom 57 httpwwwwikiofr 58 httpwwwagoravoxfr 59 Carlo Revelli Joeumll de Rosnay httpfrwikipediaorgwikiCarlo_Revelli httpfrwikipediaorgwikiJoC3ABl_de_Rosnay 60 Agoravox politique eacuteditoriale httpwwwagoravoxfrarticlephp3id_article=60 61 httpwwwreadspeakercom 62 httpenglishohmynewscom
copy Digimind Digimind Services ndash White Paper |107
Le Web 20 pour la veille et recherche dinformation DIGIMIND
63 State of the Blogosphere- avril 2007 httpwwwsifrycomalertsarchives000493html 64 Les blogs dans le monde Estimation agrave partir des chiffres produits par Digimind Blog Herald Technorati PewInternet Meacutediameacutetrie Loiumlc le Meur Live Journal Skyblogs Overblogs Terra MSN Spaces Splinder Excite Bloggersit Timblog W3B Skynet Bloghr Overskriftdk Smartlog onetpl Tenbit mylogpl eblogpl Blogpl Blogipl blogcentralis Romandiefr Blogspot timsoftro Globocom Financial Express Prixadi blog Baidu Yahoo Blogs South Korea Planet Weblog Service Cyworld LAtelier et ZDNet Australia 65 httpwwwnaturecomwebfeedsindexhtml httpwwwsciencemagorgrss 66 httpsearchlivecom 67 httpsearchyahoocom 68 httpnewsgooglefr httpfrnewsyahooco httpfrnewsbotmsncom httpwwwtopixnet httpwwwwikiofr 69 httpgroupsgooglefrgrouprectraveleuropefeedshl=fr 70 httpwwwforummobilescomindexphpshowforum=200 71 httpfrgroupsyahoocom 72 httpfrmyweb2searchyahoocom httpblogmarksnet httpdelicious 73 httpwwwflickrcom httpphotobucketcom 74 httpwwwyoutubecom httpwwwdailymotioncomfr 75 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 76 httpblogsearchgooglefr httpfraskcomsubjectbls|pg1 httpwwwfeedstercom httpwwwblogpulsecom httpwwwtechnoraticom httpwwwspherecom 77 httpwwwsifrycomalertsarchives000493html 78 httpfrsearchyahoocomwebadvancedei=UTF-8ampybs=0 httpwwwexaleadfrsearchresultsq=sarkozyamp24mode=allweb 79 httpwwwblogaramacom httpwwwrss-networkcom
copy Digimind Digimind Services ndash White Paper |108
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwrssfeedscom 80 httpwww43thingscom http36trucscom 81 httptrainquecomcodedelicious_lookupphp 82 httptechnoraticomtag 83 httpwwwsearchlescom 84 httptagcentralnet httpwwwkeotagcom httpwwwthagoocom httpwwwzewolnet httpwwwgnoshorg 85 httpwwwzibbcom 86 httpwwwecransfr 87 Google Tag Cloud Maker httpuserscriptsorgscriptsshow6171 88 httpnewzingocom 89 Folksonomies les usagers indexent le web Olivier le Deuff Bulletin des Bibliothegraveques de France ndeg4 2006 90 Folksonomy les tags en deacutelire Cyril Fieacutevet Internetactu 13 octobre 2005 httpwwwinternetactunetp=6166 91 httpwwwzoominfocom 92 httpwwwzikicom 93 httpwwwyonamecom httpwwwstalkeraticom httpwinkcom 94 httpfranswersyahoocom httpanswersyahoocom httpaskyahoocom 95 httpanswersgooglecomanswers 96 httpiqlycosfr httpqnalivecombetaaspx 97 httpwwwexpertscomdirectoryasp 98 httpsearchwikiacomwikiSearch_Wikia 99 httpdeciphocom 100 httpwwwyoonocom 101 httpwwwfooxxcom
copy Digimind Digimind Services ndash White Paper |109
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwwebzzlecom 102 httpinfluxjouebcomnewspowerset-et-xerox-parc-s-attaquent-a-google-naturellement 103 httpwwwmedglecom httpwwwmedwormcom httpwwwmedstorycom httpwwwsearchmedicacouk 104 httpwwwrollyocom httpswickihomeeurekstercom httpgooglecomcoopcseoverview httpbuildersearchyahoocom 105 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 106 Le web invisible (deep web hidden web) deacutesigne la partie du web non accessible aux moteurs de recherche classiques Le web invisible comprend des bases banques de donneacutees et bibliothegraveques en ligne gratuites ou payantesIl est constitueacute de pages web mal ou non indexeacutees par les moteurs Pour plus de preacutecisions voir le White Paper Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique httpwwwdigimindfrserviceswhite_paperhtm 107 httpwwwthelancetcom 108 httpwwwdigimindfrproduitsfinderhtm 109 httpwwwncbinlmnihgoventrezqueryfcgiCMD=searchampDB=pubmed 110 httppminlmnihgovinteractindexphptop httpwwwhubmedorg 111 httpwwwusptogovpatftindexhtml httpwwwwashingtonpostcomwp-dyncontentarticle20070304AR2007030401263html 112 httpwwwgooglecomhistory 113 httpwwwgooglecomhistorytrends httpwwwgooglecomhistoryitems 114 httpfrwikipediaorgwikiApplication_composite 115 httpwwwmibazaarcomextrasfortune100html 116 httptagmapsresearchyahoocomworldexplorerphp 117 httpflickrvisioncom 118 httpgmapstommanganusspacecraft_trackinghtml 119 httpwwwhealthmaporg httpwwwbrevardbiodieselorgmapbdhtml httpkartametroinfokartadefaultaspxhl=EN httpwwwwikimapiaorg httpwwwglobalincidentmapcomhomephp httpdartmapsmackerscom
copy Digimind Digimind Services ndash White Paper |110
Le Web 20 pour la veille et recherche dinformation DIGIMIND
120 httpwwwtagurlscom 121 httpwwwthemolucom httpwwwgnoshorg 122 httpwwwwebmashupcom httpwwwprogrammablewebcommashupsdirectory httpmashupfeedcom 123 httpgooglemapsmaniablogspotcom 124 httplocalalkemiscom 125 httpwwwvoxcom httpwwwover-blogcom httpwwwblogspiritcomfrindexphp httpwwwtypepadcom httpswwwbloggercomstart httpviablogacom httpwwwhautetfortcom 126 httpcasselinfreefrfrenchweblogshtmoutils 127 httpwwwclubiccomarticle-67515-8-comparatif-plateformes-blogshtml httpwwwojrorgojrimagesblog_software_comparisoncfm 128 httpwwwfeedburnercomfbahome 129 httppagesgooglecom 130 httpwwwdigimindfrserviceswhite_paperhtm 131 httpfrwikipediaorgwikiAccueil 132 httpblogouter-courtcomarchive2006-12-05-n22html 133 httpwwwnaturecomnews2005051212full438900ahtml httpwwwnaturecomnaturebritannicaindexhtml httpwwwnaturecomnews2005051212multimedia438900a_m1html 134 httpwwwwikiseekcom 135 httpwwwexaleadfr 136 httpwwwwikimindmaporg 137 httpencitizendiumorgwikiMain_Page 138 httpwwwalacrawikicom 139 httpceclinesxwikicomxwikibinviewMainFils+RSS 140 httpwwwwikidwebcom 141 httpwwwoperacom httpwwwmaxthoncom httpwwwmicrosoftcomfrancewindowsie httpwwwmozilla-europeorgfrproductsfirefox
copy Digimind Digimind Services ndash White Paper |111
Le Web 20 pour la veille et recherche dinformation DIGIMIND
142 httpfrtechcrunchcom20060401analysons-les-lecteurs-rss-en-ligne httpvtechcanalblogcomarchives20051025927489html httpvtechcanalblogcomarchives20050905780635html httpallrsscomrssreadershtml 143 httpinfluxjouebcomnewsles-pages-personnalisables-bookmark-n-1 httpwwwinformationoverlordcouk200603where-to-start-in-search-of-ideal_26 144 httpwwwdigimindfrproduitsindexhtm 145 httpshareopmlorg 146 httpwwwquechoisirorgArticlejspid=RessourcesArticlesEF33CF34D5616AF2C125720D0050E701ampcatcss=TEL000 147 httpweblogshitwisecombill-tancer 148 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 149 httpwwwbusinessweekcominnovateNussbaumOnDesignarchives200704are_most_web_20html 150 httpblogsforrestercomcharleneli200704forresters_new_html httprosstypepadcomblog200604power_law_of_pahtml 151 httpwwwobservatoire-omicorgcolloque-icicpdfBarbe3_1pdf 152 httpwwwaaronswcomweblogwhowriteswikipedia 153 httpaphgcaenfreefrchronique393aphg393htm 154 httpfrwikipediaorgwikiDroits_de_l27homme_en_Iran 155 httpfrwikipediaorgwikiWikipC3A9diaArticles_de_qualitC3A9 156 httpenwikipediaorgwikiJohn_Seigenthaler_Sr_Wikipedia_biography_controversy 157 httppewresearchorgpubs71riding-the-waves-of-web-20 158 httptallblogcontedoxacukwp-contentuploads200703survey-summarypdf 159 httpwwwcafepresscomnerdwideweb 160 httpwwwecransfrspipphprubrique30 161 httpfrcreativecommonsorg 162 httpwwwzdnetfractualitesinternet0390207743933447900htm 163 httpwebsemantiqueorgPagePrincipale httpwwww3orgDesignIssuesSemantichtml httpwwww3org2002Talks1213-lpslide1-0html 164 httpwwwinternetactunetp=6902
copy Digimind Digimind Services ndash White Paper |112
- Digimind Services
- Christophe ASSELIN
- Veronique MESGUICH
-
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Sommaire
AVERTISSEMENT 1
AVANT PROPOS 4 Web 20 4
QUEST-CE QUE LE WEB 20 5
Preacuteambule 5
Deacutefinition du web 20 6
Les 7 principes du Web 20 8
Les eacutevolutions par rapport au Web 10 le rocircle de linternaute 9
GLOSSAIRE DU WEB 20 12
LES TECHNOLOGIES DU WEB 20 15
LES FAMILLES DAPPLICATIONS DU WEB 20 18
Typologie 18
Comment identifier un site Web 20 23
LES APPLICATIONS WEB 20 POUR LA VEILLE ET LA RECHERCHE DINFORMATIONS 24
Les types dapplications 24 I Partager et collaborer 24 a Les Bookmarks sociaux 24 b Le Multimeacutedia photos et videacuteos 30 c Partage de cv et reacuteseaux sociaux35 d Les sites dactualiteacutes collaboratives recommandation et notation38 II Rechercher Collecter 42 a La recherche de blogs et de flux RSS42 b La recherche par tags48 c La recherche de personnes et dinformations entreprises 54 d Les moteurs de recherche humains56 e les moteurs de recherche collaboratifs59 f La verticalisation par la personnalisation du peacuterimegravetre de recherche62 g Lenrichissement de bases de donneacutees faccedilon Web20 65 h Conserver et exploiter lhistorique de vos recherches et navigations67 i Les mash-up 69 III Diffuser73
copy Digimind Digimind Services ndash White Paper |2
Le Web 20 pour la veille et recherche dinformation DIGIMIND
a Les Blogs et le flux RSS 73 b Les Wikis 74 IV Surveiller 78 a La deacutetection du flux RSS 78 b La mise en surveillance79 c Pourquoi une veille via le RSS 81 V Carte des outils et ressources Web 2082
Exemple dune recherche et veille via le Web 20 84
LES LIMITES DU WEB 20 86
La participation 86 I Une participation heacuteteacuterogegravene 86 Une minoriteacute participativehellip 86 Wikipedia un faux modegravele collaboratif 87 II Une participation damateurs 88
Le web 10 reste neacutecessaire 89 Le mail reacutesiste 89 Une population souvent isoleacutee et non repreacutesentative 90 Des domaines mal couverts 91
CONCLUSION 92
A PROPOS DES AUTEURS 96
WEBOGRAPHIE BIBLIOGRAPHIE 98 Sites web wikis et blogs98 Articles 101 Ouvrages 102
DANS LA MEME COLLECTION 104
NOTES 105
copy Digimind Digimind Services ndash White Paper |3
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Avant propos
Web 20
La notion de Web 20 est tregraves souvent employeacutee mais finalement peu de
personnes sont capables de lexpliquer preacuteciseacutement
Lobjectif de ce document est de deacutemocratiser le concept de Web 20 aupregraves des
Knowledge Workers Il sadresse aux diffeacuterents collaborateurs de lentreprise qui
nutilisent pas encore ou peu les diffeacuterentes applications regroupeacutees sous ce
concept Les sensibiliser agrave ces outils pourra ameacuteliorer la pertinence de leur
recherche et de leur veille informationnelle
copy Digimind Digimind Services ndash White Paper |4
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Quest-ce que le Web 20
PREAMBULE
Pour certains le Web 20 nest qun gadget un pur pheacutenomegravene de mode qui ne
meacuterite pas que lon sy attarde Pourtant une eacutevolution importante a bien eu lieu sur
le web quelque soit le nom que lon lui donne
Ainsi en 2006 un metteur en scegravene a choisi de diffuser son long meacutetrage Autumn1
gratuitement et ce uniquement sur internet via le service Google Video2 Il navait
pas trouveacute de distributeur capable dexploiter son film dans plus de 30 salles En mai
2007 plus de 920 000 internautes avaient deacutejagrave vu Autumn sur le service de partage
de videacuteos de Google
Fin 2005 pour le compte de la prestigieuse revue scientifique Nature des experts
ont compareacute des documents publieacutes sur Wikipedia lencyclopeacutedie collaborative en
ligne reacutealiseacutee par des internautes volontaires et beacuteneacutevoles avec ceux de la ceacutelegravebre
Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche
Cette eacutetude a abouti agrave une formidable controverse comment une encyclopeacutedie
reacutealiseacutee par des non-speacutecialistes peut-elle remettre en cause les ouvrages
classiques
Il se passe donc bien quelque chose de nouveau via ce web nouvelle geacuteneacuteration ougrave
linternaute devient actif et collaboratif Mais tellement dacteurs et dapplications se
reacuteclament de ce web 2 que lon a vite limpression de naviguer en Terra Incognita
Certains nheacutesitent dailleurs pas agrave repreacutesenter ce nouveau web via une carte
dexplorateur 3
Aussi agrave travers ce document plongeons dans le Web 20 pour mieux lexploiter
lors de recherche dinformation et de veilles
copy Digimind Digimind Services ndash White Paper |5
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La carte des communauteacutes virtuelles Par Randall Munroe DR
DEFINITION DU WEB 20
Comment deacutefinir de faccedilon preacutecise ce que recouvre cette notion parfois floue
Depuis plusieurs mois le blog collectif Dessine moi le Web 20 4 propose agrave des
universitaires informaticiens philosophes entrepreneurs de donner leur propre
vision du pheacutenomegravene et eacutechanger ideacutees et points de vue La diversiteacute et la richesse
des contributions illustrent la difficulteacute agrave donner une deacutefinition exhaustive de ce
concept agrave geacuteomeacutetrie variable mecirclant agrave la fois des aspects techniques et sociaux
Une vision reacuteductrice du Web 20 consisterait agrave nrsquoy voir que la mutualisation de
contenus produits et mis en ligne par les utilisateurs eux-mecircmes ou agrave reacutesumer
lrsquoengouement actuel agrave un effet de mode passager Depuis la premiegravere confeacuterence
Web 20 en 2004 le concept srsquoest concreacutetiseacute agrave travers de nombreuses
expeacuterimentations ou le deacuteveloppement de nombreux services largement utiliseacutes
Nous tenterons dans ce document de brosser un panorama des enjeux usages et
technologies lieacutes agrave cette notion aussi encenseacutee que controverseacutee
copy Digimind Digimind Services ndash White Paper |6
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Plusieurs auteurs srsquoaccordent sur lrsquoideacutee selon laquelle le web 20 ne constitue pas
une rupture technologique ni hellip sociale Il srsquoagirait plutocirct drsquoun retour aux sources
drsquoune renaissance du web tel qursquoil a eacuteteacute conccedilu agrave lrsquoorigine les utilisateurs srsquoeacutetant
entre temps approprieacutes les modes de creacuteation et de diffusion
Pour Paul Graham5 pionnier de lrsquoInternet et fondateur de la socieacuteteacute Viaweb en
1995 le web 20 est le web comme il a eacuteteacute conccedilu pour ecirctre utiliseacute Les tendances que
nous distinguons sont simplement la nature inheacuterente du web qui eacutemerge des mauvaises
pratiques qui lui ont eacuteteacute imposeacutees pendant la bulle Internet
Le web creacuteeacute au deacutebut des anneacutees 90 par Tim Berners Lee comportait deacutejagrave en
germe bien des eacuteleacutements du web 20 mutualisation des connaissances eacutechange
travail collaboratif interactiviteacute intelligence collective hellip Ce nrsquoest sans doute pas
un hasard si Dale Dougherty lrsquoun des pegraveres fondateurs de la formule 20 fut lui
aussi lrsquoun des pionniers du web et notamment le fondateur de GNN le premier
portail financeacute par la publiciteacute
Naissance du concept
Crsquoest au cours de lrsquoeacuteteacute 2004 que le terme de web 20 apparaicirct pour la premiegravere
fois lors drsquoune seacuteance de brainstorming Dale Dougerthy co-fondateur de la
socieacuteteacute drsquoeacutedition OrsquoReilly et Craig Cline de MediaLive reacutefleacutechissent agrave des thegravemes
eacutemergents en vue drsquoune confeacuterence agrave venir Le journaliste John Battelle co-
fondateur du magazine Wired se joint un peu plus tard au duo et la premiegravere
confeacuterence Web 20 a lieu en octobre 2004 Lrsquoexpression 20 est utiliseacutee agrave ce
propos pour marquer lrsquoeacutemergence drsquoune nouvelle eacutetape dans la courte histoire du
web eacutetape caracteacuteriseacutee par un changement des regravegles et une modification des
modegraveles de revenus Le volet social sera deacuteveloppeacute plus tardivement par Tim
OReilly lors de la deuxiegraveme confeacuterence Web 20 en octobre 2005
Les nouveaux produits et services associeacutes au web 20 vont ainsi repositionner
lrsquointernaute au cœur du systegraveme Des techniques de publications simples et souples
comme les blogs les plates-formes collaboratives de type Wiki offrent des
possibiliteacutes accrues de production diffusion et consommation des contenus
Lrsquointernaute devient ainsi co-creacuteateur de nouvelles applications en ligne initiant
souvent de faccedilon collective ou communautaire de nouvelles formes de relations
numeacuteriques Selon lrsquoexpression drsquoHubert Guillaud6 le web devient non plus une
aventure technologique mais bien une aventure humaine
copy Digimind Digimind Services ndash White Paper |7
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LES 7 PRINCIPES DU WEB 20
Le texte de Tim OrsquoReilly paru en 2005 7 sous le titre Qursquoest ce que le web 20
deacutegage sept principes cleacutes du Web 20 en voici un petit reacutesumeacute
1 Le web vu comme une plate-forme de services
On passe dune collection de sites web agrave une plateforme informatique agrave part
entiegravere fournissant des applications web aux utilisateurs
2 Consideacuterer les internautes comme co-deacuteveloppeurs des applications On passe ainsi
de la notion de logiciel produit agrave celle de logiciel service
3 Le service srsquoameacuteliore quand le nombre drsquoutilisateurs augmente
Le Web 20 met agrave profit lrsquoeffet de la longue traicircne (ou long tail en anglais)
populariseacute par le magazine Wired les produits qui sont lrsquoobjet drsquoune faible
demande ou qui nrsquoont qursquoun faible volume de vente peuvent collectivement
repreacutesenter une part de marcheacute eacutegale ou supeacuterieure agrave celle des best-sellers si les
canaux de distribution peuvent proposer assez de choix Les utilisateurs du Web
20 disposent de donneacutees uniques difficiles agrave recreacuteer et dont la richesse srsquoaccroicirct
avec lrsquoaugmentation du nombre des utilisateurs
4 La richesse est dans les donneacutees Toutes les applications web drsquoimportance sont
lieacutees agrave une base de donneacutees speacutecialiseacutee OrsquoReilly envisage un mouvement des
donneacutees libres srsquoopposant peu agrave peu agrave lrsquounivers des donneacutees proprieacutetaires
5 Tirer parti de lrsquointelligence collective crsquoest le principe mecircme adopteacute par
lencyclopeacutedie en ligne Wikipedia et drsquoautres sites similaires Pour Tim OrsquoReilly
lrsquoimplication des utilisateurs dans le reacuteseau est le facteur-cleacute pour la supreacutematie sur le
marcheacute
6 Mettre en place des interfaces souples et leacutegegraveres fondeacutees sur les nouveaux
standards et protocoles du Web Le logiciel se libegravere du PC Une autre des
caracteacuteristiques du web 20 est le fait qursquoil nrsquoest plus limiteacute agrave la plate-forme PC
mais vise notamment les objets nomades teacuteleacutephone portable PDA ou lecteur
portatif audio
copy Digimind Digimind Services ndash White Paper |8
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LES EVOLUTIONS PAR RAPPORT AU WEB 10 LE ROLE DE LINTERNAUTE
En quoi le Web 20 se distingue-t-il de la vague preacuteceacutedente On a vu que lrsquoune des
caracteacuteristiques majeures du pheacutenomegravene est lrsquoappropriation des contenus et des
modes de diffusion par les internautes eux-mecircmes via des applications souples et
leacutegegraveres
Paul Graham eacutevoque le principe de deacutemocratie du Web 20 cest-agrave-dire la
superposition au reacuteseau technique drsquoun reacuteseau humain qui participe agrave la creacuteation et
agrave lrsquoenrichissement de contenus et services Lrsquointernaute deviendrait ainsi
consommrsquoacteur agrave lui de produire publier diffuser indexer partager des
contenus de tous types
Web 10 Web 20
Leaders du web Entreprises marchands Internautes
Profil de linternaute Passif Actif
Interactiviteacute perccedilue Seacutelection et lecture dinformation
Seacutelection lecture et publication de donneacutees
Uniteacute de recherche Mot-cleacute Tag
Du Web 1 vers le Web 2 Source ZDNet 8
Pour autant les internautes vont-ils devenir tous acteurs de ce processus Selon un
article de Charles Arthur dans The Guardian 9 pour un groupe de 100 personnes si
lrsquoune creacutee du contenu 10 seulement vont interagir en apportant commentaires et
ameacuteliorations les autres se contentant drsquoune consommation passive Ce constat
obtenu via des retours drsquoexpeacuterience sur des sites collaboratifs illustre la regravegle des
11089 selon laquelle plus de 80 des contenus produits proviennent drsquoun
nombre tregraves restreint drsquoutilisateurs
Tendance confirmeacutee par les chiffres preacutesenteacutes lors de la Web 20 Expo en avril 2007
et repris dans Internetactu 10 selon la socieacuteteacute de mesure drsquoaudience Hitwise11
016 des internautes qui passent sur YouTube y placent des films - alors qursquoils
eacutetaient encore 05 agrave le faire en juillet 2006 seulement 02 des visiteurs de
Flickr y publient des photos La seule exception agrave cette faible participation provient
copy Digimind Digimind Services ndash White Paper |9
Le Web 20 pour la veille et recherche dinformation DIGIMIND
de Wikipedia ougrave 46 des visiteurs contribuent agrave lrsquoenrichissement de
semblent en effet
voir eacutecrit des textes longs (en un nombre reacuteduit drsquointerventions) tandis que les
eacutediteursrdquo les plus actifs qui forment le noyau des wikipeacutediens nettoient corrigent
lective fondeacutee sur des actions agrave faible niveau drsquoexigence
(lire enregistrer un signet tagger commenter) de lrsquointelligence collaborative
caracteacuteriseacutee par des formes de participations plus actives et intenses eacutecrire
collaborer modeacutererhellip
lrsquoencyclopeacutedie
Jimmy Wales fondateur de Wikipedia estime qursquoun nombre restreint de
contributeurs et eacutediteurs font lrsquoessentiel du travail alors qursquoun nombre consideacuterable
de lecteurs apportent peu de modifications Le wikipeacutedien Aaron Swartz nuance
ce point de vue un grand nombre de contributeurs occasionnels
a
ldquo
mais sans apporter eacutenormeacutement de texte
Le Web 20 et tout particuliegraverement la blogosphegravere semble suivre la loi de la
participation eacutedicteacutee par Ross Mayfield preacutesident de la socieacuteteacute Social Text sous le
nom de Power law of participation12 Cette loi baseacutee sur lrsquoobservation des
pratiques et des seuils de participation aux dispositifs communautaires constate que
la participation srsquoamenuise agrave mesure que les formes de participation se
complexifient Le scheacutema ci-dessous qui rappelle celui de la Longue Traicircne
distingue lrsquointelligence col
Power Law of Participation par Ross Mayfield CC
copy Digimind Digimind Services ndash White Paper |10
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Le cabinet Forrester deacutetaille enc
de la participation figurant dans son eacutetude Social Technographics 13 la grille compte
6 eacutechelons correspondant aux niveaux de particip
les inactifs (52 )
les spectateurs (33 ) consommateurs de contenus texte ou multimeacutedia (blogs
videacuteos mis en ligne par les utilisateurs podcasts)
ore davantage les niveaux drsquoimplication dans la grille
ation
les menuisiers (19 ) utilisateurs de reacuteseaux sociaux
es collecteurs (15 ) utilisent des flux RSS et taggent les pages web
les critiques (19 ) postent des commentaires sur les blogs des avis et critiques
les creacuteateurs (13 ) publient des contenus en ligne (blogs videacuteos)
l
copy Digimind Digimind Services ndash White Paper |11
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Glossaire du Web 20
Pour mieux comprendre les concepts utiliseacutes dans lunivers du Web 20 nous vous
proposons ce glossaire des termes essentiels
Tags mot clef sous forme drsquo eacutetiquette que les utilisateurs peuvent apposer sur
un document numeacuterique (texte photo videacuteo) de faccedilon agrave en deacutecrire le contenu Le
tagging introduit une part de subjectiviteacute par rapport agrave lrsquoindexation automatique
effectueacutee par les moteurs Les tags peuvent eacutegalement ecirctre extraits
automatiquement drsquoun texte en fonction de leur freacutequence drsquooccurrence
Nuage de tags preacutesente les tags correspondant agrave un site (ou agrave plusieurs) en les
regroupant sur un mecircme espace et leur attribuant une taille variable suivant la
freacutequence dutilisation ou drsquooccurrence Cela donne une vision drsquoensemble des
principales theacutematiques Le site Tagcrowdcom14 permet de geacuteneacuterer un nuage de
tags agrave partir drsquoun texte
Folksonomie (traduit eacutegalement parfois par potonomie peuplonomiehellip)
Ce mot valise contraction de folk (peuple) et taxonomie deacutesigne une forme de
classification collaborative deacutecentraliseacutee spontaneacutee baseacutee non pas sur un
vocabulaire controcircleacute et standardiseacute mais sur des termes choisis par les utilisateurs
eux-mecircmes intituleacutes tags Lrsquoobjectif eacutetant de faciliter lrsquoindexation des contenus
ainsi que la recherche drsquoinformation
Blogs journal personnel disponible sur le web Peut ecirctre tenu par un particulier
un chercheur un journaliste un salarieacute drsquoentreprise ou plus rarement par un groupe
de personne (entreprise collectiviteacutehellip) Le blog a pour objet de diffuser des billets
geacuteneacuteralement lieacutes agrave lrsquoactualiteacute et preacutesenteacutes par ordre chronologique alors qursquoun
wiki est destineacute agrave la mutualisation des connaissances Un blog peut preacutesenter des
contenus multimeacutedias photo (photoblog) son ou videacuteo (vblog vlog)hellip
Blogosphegravere la biosphegravere des blogs Ce mot valise deacutesigne la communauteacute
des blogs ou encore lrsquoensemble des auteurs de blogs La blogosphegravere est largement
interconnecteacutee les trackbacks situeacutes sur la plupart des blogs permettant de lier
copy Digimind Digimind Services ndash White Paper |12
Le Web 20 pour la veille et recherche dinformation DIGIMIND
deux articles traitant de sujets connexes Lrsquoeacutelite des blogueurs particuliegraverement
influents peut ecirctre qualifieacutee ironiquement de blogeoisie
Blogroll ou blogoliste liste de liens vers drsquoautres blogs preacutesenteacutes par lrsquoauteur
drsquoun blog On peut syndiquer sur une mecircme page des billets venant de ces blogs via
les formats RSS
RSS lrsquoacronyme signifie selon les versions Really Simple Syndication (RSS 20) RDF
Site Summary (RSS 09 10 et 11) ou encore Rich Site Summary (RSS 091) Ce
format de syndication permet drsquoextraire automatiquement dun site web ou drsquoun
blog du contenu reacuteguliegraverement mis agrave jour Un fichier RSS est un simple fichier texte
au format XML comportant la description syntheacutetique du contenu Ce format a eacuteteacute
creacuteeacute en 1999 par Netscape On peut srsquoabonner gratuitement agrave plusieurs flux RSS agrave
partir drsquoun lecteur on-line ou installeacute sur le PC
Atom Format normaliseacute de syndication de contenu Web baseacute sur le XML qui
permet la syndication de contenu entre diffeacuterentes ressources Web Concurrent
de RSS Le format Atom a eacuteteacute creacuteeacute dans le but de simplifier les diffeacuterents formats
RSS existants La diffeacuterence entre les deux formats reacuteside surtout dans lemploi de
balises XML diffeacuterentes Les deux formats sont geacuteneacuteralement lus par les
agreacutegateurs
Wiki Site web dynamique dont tout visiteur peut modifier les pages agrave loisir Le
terme vient la langue hawaiumlenne (wikiwiki = rapide) Un wiki a pour objectif de
mutualiser des connaissances et est organiseacute autour drsquoun plan de classement Les
contributeurs drsquoun wiki sont geacuteneacuteralement anonymes
Crowdsourcing Litteacuteralement approvisionnement par la foule Le
crowdsourcing consiste agrave utiliser la creacuteativiteacute lintelligence et le savoir-faire dun
grand nombre dinternautes pour creacuteer des contenus participer agrave lrsquoalimentation
drsquoun site Cette participation des utilisateurs agrave la creacuteation des contenus repreacutesente
une forme drsquoexternalisation (outsourcing) et permet de reacuteduire les coucircts en se
basant sur un systegraveme de beacuteneacutevolat ou de micropaiement
Reacuteseaux sociaux de nombreux sites de social networking ou reacuteseautage social
sont apparus avec la vague du Web 20 Ils permettent de mettre en relation des
personnes partageant les mecircmes centres drsquointeacuterecirct personnels ou professionnels
Ces reacuteseaux peuvent devenir de veacuteritables communauteacutes en ligne les plus fameux
eacutetant les sites Friendster ou Myspace ou bien dans la sphegravere professionnelle
copy Digimind Digimind Services ndash White Paper |13
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Linkedin ViadeohellipLa plupart des reacuteseaux sont ouverts certains fonctionnent sur le
mode de la cooptation
Podcasts issu de la combinaison des termes iPod (dApple) et broadcasting ce
terme deacutesigne le fait de rendre disponible en ligne un fichier audio au format
numeacuterique Ce fichier peut-ecirctre teacuteleacutechargeacute directement sur un ordinateur ou un
peacuteripheacuterique via un flux de diffusion Equivalent franccedilais baladodiffusion
Lrsquoutilisateur peut ainsi se composer une liste de lecture agrave la carte Pour les fichiers
videacuteo on emploi le terme de videacuteocast
AJAX (Asynchronous JavaScript And XML) meacutethode informatique de
deacuteveloppement dapplications Web permettant deacuteconomiser de la bande passante
en ne rechargeant pas une page entiegravere alors que seuls certains eacuteleacutements ont besoin
de lecirctre mais en ne rafraicircchissant que ces eacuteleacutements de la page Cela permet de
produire des contenus dynamiques et reacuteactifs en ne neacutecessitant que peu drsquoappels au
serveur heacutebergeant la page AJAX est une combinaison de plusieurs technologies
HTML CSS Javascript XMLhellipDe nombreux sites web 20 sont deacuteveloppeacutes en
AJAX
API Interface de programmation permettant agrave un utilisateur de deacutevelopper des
applications conviviales De nombreux sites classiques ou Web 20 proposent des
API pour inteacutegrer automatiquement leur contenu agrave dautres sites
Mashup ou Mash up application web composite mixant plusieurs sources ou
plusieurs contenus pour fournir un nouveau produit ou service Le terme se traduit
en franccedilais par remixage ou mosaiumlque Exemple de mashup la visualisation des
reacutesultats des eacutelections preacutesidentielles franccedilaises via Google Earth qui mixe les cartes
Google et les chiffres du Ministegravere de lInteacuterieur
Long tail (longue traicircne) Cette expression est utiliseacutee en statistiques et peut
srsquoappliquer au marketing Des produits rares ou qui font lrsquoobjet drsquoune faible
demande peuvent collectivement repreacutesenter une part de marcheacute eacutegale ou
supeacuterieure agrave celle des best-sellers si les canaux de distribution peuvent proposer
assez de choix Le caractegravere virtuel du web permet de geacuteneacuterer une longue seacuterie de
marcheacutes de niche heacuteteacuterogegravenes (exemple e-bay) par opposition aux grands
marcheacutes homogegravenes et grand public du monde reacuteel
copy Digimind Digimind Services ndash White Paper |14
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les technologies du Web 20
Mettons dabord les choses au point le Web 20 nest pas une (r)eacutevolution ou un
concept de dimension technologique
Ses applications sappuient sur des technologies deacutejagrave existantes reacutepondant aux doux
noms dAjax Soap REST RSS Perl Python PHP Ruby ou GreaseMonkey Lobjectif de
ce document nest pas de deacutevelopper ce volet technologique Nous en eacutevoquerons
seulement les grandes caracteacuteristiques pour mieux comprendre les enjeux
Le Web 2 repose notamment sur les interfaces utilisateurs dites riches qui
permettent des possibiliteacutes daffichage de configuration et de maniement plus
puissantes que les pages html classiques du Web 1 que ce soit pour le
deacuteveloppeur ou lutilisateur final
Tim Berners Lee co-inventeur du web remarque en fait ce Web 20 utilise les
standards qursquoont produit tous ces gens qui travaillent sur le Web 10 le Document
object model HTML et SVG (Scalable Vector Graphics) HTTPhellip Le Web 20
construit des services en srsquoappuyant sur les standards du web ainsi que sur JavaScript
(hellip)
Pour se structurer en reacuteseau de bases de donneacutees et services collaboratifs le web
20 utilise donc des technologies matures acircgeacutees de 5 agrave 10 ans pour la plupart
Leacutevolution nest pas tant dans la technologie elle-mecircme que dans la faccedilon de mixer
ces technologies pour apporter des services et une ergonomie nouvelle agrave
lutilisateur
Ainsi lAjax (voir glossaire) que lon cite souvent agrave propos des technologies phares
du Web 2 nest pas un nouveau langage mais un nouveau concept qui utilise les
standards XHTML et CSS DOM (Document Object Model) pour laffichage
dynamique XML et XSLT pour leacutechange de donneacutees ainsi que la reacutecupeacuteration de
donneacutees asynchrones via XMLHttpRequest JavaScript integravegre et combine tout ces
langages Le terme Ajax a eacuteteacute apporteacute par Jesse James Garrett de lrsquoagence web
Adaptive Path
copy Digimind Digimind Services ndash White Paper |15
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LAjax permet notamment de ne recharger que certains eacuteleacutements dune page plutocirct
que la page entiegravere Lors de modifications sur une page seuls les nouveaux
eacuteleacutements se rafraicircchissent eacuteconomisant ainsi des ressources du temps et de la
bande passante Lun des preacutecurseurs grand public dans lutilisation de cette
technologie fut A9 le moteur de recherche dAmazon il neacutetait pas neacutecessaire de
recharger la page agrave chaque fois que lon ajoutait de nouvelles sources et moteurs agrave
interroger 15
Greasemonkey est eacutegalement baseacute sur des scripts Cette extension pour le
navigateur Mozilla Firefox va encore plus loin dans le pouvoir accordeacute agrave linternaute
en exeacutecutant des scripts ce plug-in 16 permet de modifier lapparence des pages
web visiteacutees dy ajouter des fonctions (boutons case agrave cocher suppression des
publiciteacutes) Lutilisateur avanceacute peut mecircme eacutecrire ses propres scripts ou
teacuteleacutecharger des scripts mis agrave la disposition de tous
Le Web 2 est en fait une sorte de web lego qui permet dinnover via lassemblage
de briques les technologies de base sont multiples il est possible de creacuteer de
nouvelles applications agrave valeur ajouteacutee en les assemblant diffeacuteremment ou plus
rationnellement
Les mash-up un mixage de plusieurs applications (voir glossaire) en est une des
illustrations les plus visibles avec les mashups on agreacutege le contenu eacutemanant de
plusieurs sites afin de creacuteer un site nouveau On utilise alors souvent lobjet XML
lAJAX du cocircteacute de linternaute les RSS et les API (Web Services) des sites mixeacutes
LAPI nest donc pas seulement un dieu eacutegyptien Pour faire simple on peut dire
que cest une interface de programmation mise agrave disposition des internautes
(avertis) pour deacutevelopper des applications Une application pourra alors acceacuteder agrave
des programmes systegraveme pour envoyer recevoir ou extraire des donneacutees Ainsi
Google publie lAPI de Google Maps qui est utiliseacute par de nombreux deacuteveloppeurs
pour creacuteer des applications deacuteriveacutees du service de cartographie de Google par
exemple la carte de suivi du teacutelescope spatial Hubble la meacuteteacuteo dans le monde 17
Le rocircle du RSS (voir glossaire) est par ailleurs preacutepondeacuterant Ce format qui
permet dexporter et lire des donneacutees dactualiteacutes au format XML se retrouve dans
quasiment toutes les applications dites Web 2 et peut en constituer lemblegraveme sinon
la caracteacuteristique majeure avec les tags Il permet de surveiller les flux de nouvelles
informations issues de sites dactualiteacutes de blogs de moteurs de recherchehellipbref
de tout site web qui propose un contenu qui se renouvelle Le RSS va aussi servir agrave
exporter des bookmarks sociaux que sont les tags ou les favoris par exemple
copy Digimind Digimind Services ndash White Paper |16
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Si le Web 2 nest pas une reacutevolution technologique en soit la relative simpliciteacute de
mise en place de ces techniques et leurs coucircts de programmation reacuteduits expliquent
le tregraves fort deacuteveloppement que connaissent toutes ces applications Par ailleurs la
baisse constante du coucirct dheacutebergement et de bande passante a faciliteacute la diffusion
de ce web nouvelle geacuteneacuteration
Mais il subsiste des effets de seuil Des applications gigantesques comme Flickr de
Yahoo offrant lheacutebergement et le partage de photos impliquent la gestion de
vastes bases de donneacutees et des infrastructures de stockage importantes Seules de
grandes firmes comme Yahoo Inc Google Microsoft ou AOL par exemple peuvent
se deacutepartir efficacement de ce type de contraintes
copy Digimind Digimind Services ndash White Paper |17
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les familles dapplications du Web 20
TYPOLOGIE
Les familles drsquoapplications Web 20 sont nombreuses et diverses de nouveaux
services apparaissent quotidiennement (sans garantie de peacuterenniteacutehellipet bien souvent
de faccedilon redondante) Sans preacutetendre dresser une liste exhaustive des nombreuses
possibiliteacutes on peut deacutegager une typologie des applications selon diffeacuterents
domaines drsquoactiviteacute Les applications speacutecifiquement deacutedieacutees agrave la veille et agrave la
recherche dinformation seront deacuteveloppeacutees dans la partie suivante
Bureautique en ligne
Courant 2006 Google a lanceacute successivement plusieurs logiciels collaboratifs en
ligne un outil de gestion drsquoagendas (Google Calendar 18) un tableur (Google
Spreadsheet) et enfin apregraves le rachat de la socieacuteteacute Writely un traitement de texte
(Google Docs) 19 Ces logiciels permettent de creacuteer modifier partager et publier en
ligne des documents sur un espace de stockage Depuis plusieurs mois on assiste agrave
une veacuteritable deacuteferlante de logiciels de bureautique en ligne deacutesigneacutes parfois sous le
terme de web office RallyPoint AjaxWrite (pour Firefox uniquement) ZohoWriter
ThinkfreehellipOutre la gratuiteacute lrsquointeacuterecirct de ces logiciels concurrents de la suite
Microsoft Office est leur disponibiliteacute sur toute machine connecteacutee au reacuteseau et tout
systegraveme drsquoexploitation Attention toutefois aux questions de sauvegarde de
compatibiliteacute de synchronisation des donneacutees et enfin de confidentialiteacutehellip
Emploi
Les blogs constituent un bon moyen pour promouvoir son CV mettre en avant
expeacuterience et compeacutetences et faciliter les eacutechanges Des jobblogs verticaux
speacutecialiseacutes par secteur ou reacutegion connaissent un grand succegraves (voir par exemple
ceux du site et moteur Moovement20) Le networking professionnel est eacutegalement agrave
la mode agrave travers des sites comme Linkedin (creacuteeacute en 2003 aux Etats-Unis) Viadeo
(ex Viaduc drsquoorigine franccedilaise) ou Xing (ex OpenBC agrave vocation europeacuteenne) Le
principe est de tirer parti des reacuteseaux de connexions sociales virtuelles afin
copy Digimind Digimind Services ndash White Paper |18
Le Web 20 pour la veille et recherche dinformation DIGIMIND
drsquoidentifier des salarieacutes ou employeurs potentiels mais aussi drsquoeacutetoffer son reacuteseau de
clients partenaires fournisseurshellip
Lrsquoe-cooptation (Cooptin Jobmeeters 21) met le reacuteseau au cœur de la deacutemarche de
recrutement via un systegraveme de prime de cooptation et peut aider les demandeurs
agrave identifier les offres du marcheacute cacheacute
Commerce en ligne
Le client est roi et le Web 20 permet de rehausser son niveau de participation sur
les sites marchands On peut ainsi tagger ou annoter des reacutefeacuterences drsquoouvrages dans
le catalogue Amazon Gracircce agrave des sites comme Zlio ou la Shoposphegravere de Yahoo22
les internautes peuvent recommander agrave leur entourage des produits et
serviceshellipen touchant une commission sur les ventes reacutealiseacutees Des guides drsquoachat
et comparateurs de prix comme Ciao integravegrent les avis de consommateurs et
drsquoexperts Le site Wantuno (inspireacute de lrsquoameacutericain Woot) innove dans le domaine
de la vente eacuteveacutenementielle en vendant un seul produit nouveau high tech par jour
annonceacute en podcast videacuteo agrave des internautes preacutevenus par flux RSS23 Certains
analystes voient lrsquoavenir du commerce eacutelectronique dans le concept de CtoB
(Consumer to Business) inverse du BtoChellip
Geacuteolocalisation
Google Maps a eacuteteacute lrsquoun des premiers services de geacuteolocalisation en srsquoappuyant sur
lrsquooutil de recherche pour localiser sur des cartes des services de proximiteacute
(commerces station servicehellip) La version 2 du site Geacuteoportail de lrsquoIGN disponible
depuis fin mai 2007 srsquoenrichit de nouveaux services pratiques et citoyens (accegraves au
cadastre visualisation des zones agrave risquehellip) Google Earth fait lrsquoobjet de partenariats
avec la NASA ou le programme des Nations Unies pour lrsquoenvironnement La
geacuteolocalisation peut srsquoadapter eacutegalement au partage de photos (Yahoo Maps et
Flickr ou le projet Pikeo chez Orange)24
Recherche drsquoinformations
Des agreacutegateurs de meacutedia comme Digg ou Wikio laissent une large place agrave
lrsquointernaute pour tagger ou recommander par vote les articles issus de meacutedias
classiques ou blogs On suivra eacutegalement lrsquoactualiteacute en syndiquant des flux RSS agrave
travers des agreacutegateurs comme Netvibes ou Newsgator Les grands moteurs (Google
Custom Search Yahoo Search Builder MSN Live search Macros) offrent des options de
copy Digimind Digimind Services ndash White Paper |19
Le Web 20 pour la veille et recherche dinformation DIGIMIND
creacuteation de moteurs personnalisables effectuant des recherches sur des bouquets
de sources preacuteseacutelectionneacutees par lrsquoutilisateur On peut mutualiser les connaissances agrave
travers des wikis collaboratifs geacuteneacuteralistes (Wikipedia) ou speacutecialiseacutes Enfin le projet
de moteur collaboratif Wikiasari qui doit aboutir courant 2007 aura recours aux
mecircmes technologies libres que la ceacutelegravebre encyclopeacutedie ainsi qursquoagrave un reacuteseau humain
ou communauteacute de confiance qui validera les reacutesultats de la recherche
Les actualiteacutes sur Wikio sites de presse blogs et navigation par tags (agrave droite)
Diffusion drsquoactualiteacutes
Pour Pierre Chappaz fondateur du site Wikio les blogueurs ne sont pas journalistes
mais ils peuvent apporter une vraie expertise sur certains sujets quils connaissent et il
serait dommage de sen priver Selon lui les meacutedias 20 ne seront plus des canaux
exclusifs de diffusion mais producteurs de contenu et des marques Deacutesormais le
scoop nrsquoest plus lrsquoapanage des seuls journalistes aux Etats-Unis une jurisprudence
donne droit depuis 2006 aux blogueurs de proteacuteger leurs sources au mecircme titre
que les journalistes professionnels Des centaines de blogs politiques ont fleuri sur le
web certains drsquoentre eux se reacuteveacutelant particuliegraverement influents On parlera de
journalisme citoyen agrave propos de sites comme Agoravox ou de lrsquo alleacutee
numeacuterique Rue 89 lanceacutee en mai 2007 par drsquoanciens journalistes du quotidien
Libeacuteration Ces nouveaux meacutedias en ligne marient les communications venant de
journalistes professionnels experts et internautes
copy Digimind Digimind Services ndash White Paper |20
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Loisirs
On retrouve ici la notion de filtrage collaboratif baseacute sur un systegraveme de
recommandations et drsquoeacutevaluations par les utilisateurs Ces recommandations
peuvent concerner les livres les destinations de voyage la musique la videacuteohellipet
proviennent de lrsquoanalyse de comportements drsquoachats des internautes et de leurs
eacutevaluations de produits Le moteur drsquoanalyse preacutedictive Criteo 25 a ainsi lanceacute en
feacutevrier 2007 un service de recommandations automatique de blogs apregraves avoir
utiliseacute sa technologie pour lrsquoeacutevaluation de videacuteos
La participation des internautes peut aller jusqursquoau financement et agrave la production
drsquoœuvres artistiques le projet A swarm of angels permet drsquoaider agrave la creacuteation de
films qui seront distribueacutes sous licence creative commons et diffuseacutes via les reacuteseaux
peer-to-peer
Partage de documents multimeacutedia
Il srsquoagit sans doute drsquoune des applications les plus reacutepandues du Web 20 Les grands
acteurs du web ont largement investi ce domaine Google a racheteacute en 2006 le site
de partage de videacuteo Youtube Yahoo de son cocircteacute avait racheteacute le site de partage de
photos Flickr Les favoris peuvent eacutegalement ecirctre mutualiseacutes via des services en
ligne comme Delicious (groupe Yahoo) ou Blogmarks De nombreux services de
partages de photos videacuteo ou podcasts se sont deacuteveloppeacutes reacutecemment on peut
citer parmi eux les sites franccedilais DailyMotion ou la banque drsquoimages Fotolia Podemus
ou Radioblog figurent parmi les sites communautaires de podcasts
Enseignement et recherche
Henry Jenkins26 professeur au MIT imagine des uniteacutes drsquoenseignement conccedilues
sur les modegraveles YouTube ou Wikipedia des deacutepartements qui ldquopermettraient le
deacuteploiement rapide drsquoexpertises disperseacutees et la reconfiguration des champsrdquo De
nouveaux usages apparaissent dans le paysage eacuteducatif mais attention lagrave encore agrave
lrsquoillusion de faciliteacute selon le philosophe Fernando Savater laquo Internet neacuteduque pas il
neacutecessite mecircme une eacuteducation preacutealable raquo Olivier Ertzcheid dans son blog Affordance 27 distingue plusieurs eacuteleacutements caracteacuteristiques drsquoune science 20 et notamment
la possibiliteacute drsquoannoter et commenter des publications scientifiques (notamment les
collections Open Acess Plos One28) ou de nouveaux modes drsquointerrogation des
bases de donneacutees (interface Hubmed sur la base meacutedicale Medline)
copy Digimind Digimind Services ndash White Paper |21
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Marie France Blanquet29 maicirctre de confeacuterence en sciences de lrsquoinformation
distingue le travail coopeacuteratif du travail collaboratif En matiegravere drsquoapprentissage le
travail coopeacuteratif reacutealiseacute par chaque eacutequipe contribue agrave une œuvre collective ougrave le
rocircle de chacun est deacutefini de faccedilon claire Lrsquoapprentissage collaboratif reacutesulte du
travail individuel soutenu par des activiteacutes de groupe ou drsquoeacutequipes de faccedilon souple
et ouverte Ce type de travail se base sur les capaciteacutes de communication et
drsquointeraction de chacun Lrsquoeacutecriture collective des articles composant lrsquoencyclopeacutedie
Wikipeacutedia en est un exemple
Plusieurs expeacuterimentations drsquousage des blogs et podcasts ont eacuteteacute tenteacutees agrave
lrsquoUniversiteacute A Lyon II des eacutetudiants ont pu enregistrer des cours sur un Ipod pour
diffusion en podcast sur leurs blogs A lrsquoUniversiteacute Catholique de Lille les eacutetudiants
de Jean-Paul Pinte30 chargeacute de lrsquoinnovation peacutedagogique doivent alimenter
reacuteguliegraverement un blog Pour ce chercheur speacutecialiste de la veille en eacuteducation le
renouveau des meacutethodes drsquoenseignement se traduit par le rocircles des Enseignants
Connecteurs et eacutetudiants proneacutetaires
Bibliothegraveques
La bibliothegraveque 20 place elle aussi lrsquoutilisateur au centre et ce agrave travers plusieurs
types drsquoexpeacuterimentations de lrsquoutilisation des logiciels de messagerie instantaneacutee
pour eacutechanger avec les utilisateurs agrave lrsquointeacutegration de tags pour enrichir les
catalogues en passant par des interfaces de consultation simplifieacuteeshellip De
nombreux blogs de bibliotheacutecaires (Bibliobsession 31) permettent de suivre lrsquoeacutetat de
lrsquoart La bibliothegraveque de lrsquoUniversiteacute drsquoAlbany est alleacutee jusqursquoagrave publier un manifeste
du bibliotheacutecaire 20 32
copy Digimind Digimind Services ndash White Paper |22
Le Web 20 pour la veille et recherche dinformation DIGIMIND
COMMENT IDENTIFIER UN SITE WEB 20
Est-ce que le site sur lequel vous naviguez ou lapplication que vous utilisez est
Web 20 Quelle importance pourrait-on reacutepondrehellipToutefois un site de cette
geacuteneacuteration offrira plus de possibiliteacutes agrave vous lutilisateur Pour reconnaicirctre un tel
site quelques caracteacuteristiques sont agrave retenir
- le type de site il appartiendra agrave lune des grandes familles citeacutees plus haut il sera
blog bookmark ou reacuteseau social mashup ou page personnalisable bref il permet
de partager et de diffuser du contenu aiseacutement Le site peut ecirctre lui-mecircme une
application Web 2 ou en inteacutegrer des briques Exemple un site Corporate qui
heacuteberge des blogs de ses salarieacutes etou diffuse son actualiteacute via un fils RSS
- le rocircle de lutilisateur le site Web 2 vous permet de participer de personnaliser
et de collaborer vous pouvez en effet ajouter des commentaires eacutecrire un billet
lire un flux RSS noter (voter) ou annoter un article teacuteleacutecharger ou uploader des
images des videacuteos eacutecouter un podcast Ces sites proposent souvent des interfaces
personnalisables couleurs style organisation de laffichage du contenuhellip
- la navigation elle est plutocirct simplifieacutee par rapport aux sites de premiegravere
geacuteneacuteration Les menus sont plus leacutegers un flux RSS est toujours proposeacute et un
nuage de tags est souvent preacutesent
- le testeur cest vous non content de faire apporter une partie de son contenu par
linternaute un service Web 20 fait en plus souvent tester ses applications agrave ses
utilisateurs et est donc freacutequemment en version becircta (voire alpha) une becircta
publique ou priveacutee (linternaute fait alors partie dun petit cercle dinitieacutes dans le
secret des dieux)
copy Digimind Digimind Services ndash White Paper |23
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les applications Web 20
pour la veille et la
recherche dinformations
LES TYPES DAPPLICATIONS
Pour le veilleur et le chercheur dinformation les applications du Web 20 sont
riches tant dans les possibiliteacutes offertes par leurs interfaces que dans le contenu
diffuseacute Mieux connaicirctre ces services permettra de trouver davantage dinformation
(ou autrement) de gagner du temps de mieux partager voire decirctre plus visible sur
le web
Vous laurez compris le web 20 se fonde essentiellement sur la notion de partage
de participation et de collaboration entre les individus Ce nest pas forceacutement
toujours facile possible voire autoriseacute dans le monde professionnel Mais partager
cest aussi agrave terme pouvoir recevoirhellip
I Partager et collaborer
a Les Bookmarks sociaux
Les bookmarks sociaux sont une des applications les plus caracteacuteristiques du Web 2
et en sont preacutecurseurs Apparus en 2004 ces services vous offrent la possibiliteacute de
partager vos bookmarks cest-agrave-dire vos favoris Ainsi apregraves enregistrement le plus
souvent gratuit vous pouvez mettre en ligne tout ou partie de vos favoris (titre
copy Digimind Digimind Services ndash White Paper |24
Le Web 20 pour la veille et recherche dinformation DIGIMIND
adresse et description dune page ou site) et les rendre potentiellement accessibles
aux internautes du monde entier et du moins aux utilisateurs de ce service Vous
avez la possibiliteacute de garder ces favoris priveacutes en ne les partageant quavec vos
proches ou seulementhellipvous-mecircme
Ces applications sont au deacutepart tregraves simples et proposent ensuite suivant les sites
plus ou moins de perfectionnements il suffit dajouter le nom et ladresse (url) de la
page web qui vous inteacuteresse assortis des commentaires de votre choix Ces
adresses web sont rattacheacutees agrave un espace qui vous est personnel auquel vous
acceacutedez en vous identifiant Cet espace personnel est identifiable via une adresse
preacutecise Par exemple sur Delicious33 (de Yahoo) lun des services de bookmarks
sociaux les plus utiliseacutes lurl deacutesignant mes favoris est httpdeliciousslide68 En
naviguant sur Delicious vous pouvez acceacuteder aux favoris mis en ligne par des
collaborateurs amis ou inconnus qui partagent les mecircmes inteacuterecircts et passions que
vous Leurs pages sont eacutegalement identifieacutees par une url unique
Lajout dadresse
Lajout dadresse seffectue en se connectant directement sur le site de
bookmarking social ou plus pratique via une barre ou un bouton deacutedieacutes qui
inteacutegreacutes agrave votre navigateur facilitent lajout du site que vous ecirctes en train de visiter
Vous pouvez eacutegalement trouver des icocircnes sur des pages web vous proposant
dajouter un contenu un site agrave votre service de social bookmaking Peut-ecirctre avez-
vous deacutejagrave rencontreacute ces icocircnes agrave la fin dun billet de blog par exemple (voir
illustration ci-dessous) Ils permettent alors dajouter ladresse du billet agrave un ou
plusieurs services de bookmarks sociaux ainsi quagrave des services dactualiteacutes
collaboratives (nous en reparlerons plus bas)
copy Digimind Digimind Services ndash White Paper |25
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ce blog propose via des icocircnes lajout de ce billet dans les favoris de Delicious ou les services sociaux dactualiteacutes
Lorsque vous ajoutez une adresse vous lui attribuez des tags (voir glossaire) cest-agrave-
dire un ou plusieurs mots cleacutes de votre choix qui vont caracteacuteriser expliquer
contextualiser eacutetiqueter le favori et donc lidentifier de maniegravere simple pour vous et
tous les visiteurs Cest une information qui vient sajouter agrave la traditionnelle
description du site Cest donc vous qui choisissez votre propre mode de
classement de hieacuterarchisation et de labellisation (et non plus un service qui vous
propose de ranger vos ressources dans des cateacutegories preacutedeacutefinies) Cette possibiliteacute
fait partie de ce que lon appelle la folksonomie agrave savoir une taxonomie (science du
classement) populaire en quelque sorte
Ainsi vous pouvez ajouter ladresse du site portail NanotechNow
httpwwwnanotech-nowcom consacreacute aux nanotechnologies et y adjoindre les
tags nano nanotehnologies sciences science research mais aussi pourquoi
pas qualiteacute excellent pour donner votre opinion
copy Digimind Digimind Services ndash White Paper |26
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Des favoris consacreacutes agrave la Chine dans Delicious A droite les tags associeacutes agrave ces bookmarks Les tags
Sur une application typique de social bookmarking (type delicious) il est possible
de rechercher sur le titre des favoris de tous les autres utilisateurs et aussi sur
leurs tags Ainsi en cliquant sur le tag Nanotech vous obtiendrez la liste de tous
les favoris que les internautes ont classeacutes sous ce label Cest lagrave lun des principaux
inteacuterecircts la possibiliteacute de rechercher sur le nom des eacutetiquettes textuelles deacutefinies
par les internautes eux-mecircmes Mais tous les internautes nont pas la mecircme logique
de classement et il est fort possible de passer agrave coteacute de favoris inteacuteressants mais
eacutetiqueteacutes selon un mot auquel vous nauriez jamais penseacute De plus un mecircme mot
peut avoir plusieurs sens ou ecirctre employeacute diffeacuteremment selon les individus
Delicious a reacutesolu ndashpartiellement- ce problegraveme en offrant la possibiliteacute de deacutecrire
ses tags cest agrave dire de les expliquer (par orange je parle de la couleur ou de la
production dagrumes en Floride) Cest donc un deacutebut de seacutemantique appliqueacute agrave
cette folksonomie Quoiquil en soit le problegraveme du sens des mots employeacutes par
les creacuteateurs de contenu concerne lensemble du web Lorsque vous ne trouvez
pas un site via une requecircte sur un outil de recherche et que ce site existe pourtant
bel et bien cest souvent parce que vous nemployez pas les mecircmes mots cleacutes que
ceux utiliseacutes par le creacuteateur du site dans son texte
Les tags peuvent eacutegalement sappliquer agrave des photos (Flickr) agrave des projets
(43Things) ou des videacuteos (YouTube DailyMotion) Ils peuvent servir aussi agrave eacutetiqueter
et cateacutegoriser les billets dun blog
copy Digimind Digimind Services ndash White Paper |27
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les communauteacutes
Lautre atout des bookmarks sociaux pouvoir constituer et se connecter avec
une communauteacute de speacutecialistes Par speacutecialiste on deacutesignera simplement un
internaute qui centre ses recherches sur les mecircmes sujets que vous quil soit
amateur ou professionnel
Exemple Votre domaine ce sont les biotechnologies En entrant la requecircte
Biotechnologies sur le moteur de recherche de Delicious vous obtenez une liste
de plusieurs milliers de favoris Pour chacun dentre eux est indiqueacute le nombre de
personnes qui ont sauvegardeacute cette mecircme adresse En seacutelectionnant lun de ces
utilisateurs vous pouvez deacutecouvrir un internaute qui comme vous reacuteguliegraverement
ajoute des adresses de sites deacutedieacutes ou connexes aux biotech Il ne vous reste plus
quagrave mettre en surveillance ce membre de delicious Il disposera en effet de sa
propre adresse XML Exemple httpdeliciousrssvantive98 Vous serez alors
averti degraves lors que cet utilisateur ajoute un favori agrave sa page
La valeur des outils de social bookmarking est encore plus probante lorsquils sont
deacutedieacutes agrave des communauteacutes de pratiques ou agrave des secteurs dactiviteacutes bien preacutecis
Plusieurs initiatives ont deacutejagrave eacuteteacute mises en ligne34 On peut citer Connotea eacutediteacute par
la ceacutelegravebre revue Nature et donc destineacute agrave un public scientifique Lors de la mise en
favoris ce service extrait automatiquement les reacutefeacuterences bibliographiques
lorsquelles sont issues de sites tels que Nature Science ou PubMed Plus ancien
CiteUlike est baseacute sur le mecircme principe mais est compatible avec davantage de
revues scientifiques encore Snipitron est lui deacutedieacute aux chercheurs eacutetudiants et
professionnels Ici vos bookmarks font partie dun projet qui seacutecoule dans le temps
concernant une recherche ou une tacircche preacutecise
Linteacuterecirct des bookmarks sociaux est donc dabord dans lutilisation de la
communauteacute afin de trouver des sources pertinentes Ce type doutil reacutevegravele toute
sa puissance lorsquun utilisateur proche de vous en terme de domaines de veille a
eacuteteacute identifieacute Vous pouvez donc alors lutiliser comme collaborateur virtuel mais
aussi rechercher parmi les sources jugeacutees pertinentes par un groupe dutilisateurs
identifier des leaders de veille ou juger de la populariteacute dune source (combien de
fois a-t-elle eacuteteacute mise en favoris Ce nombre de sauvegardes neacutetant quun indicateur
parmi dautres) Si vous ne partagez pas ces outils restent toutefois un tregraves bon
moyen de meacutemoriser et cateacutegoriser vos favoris en un point unique daccegraves
copy Digimind Digimind Services ndash White Paper |28
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Quel service
Il existe plusieurs dizaines de services de bookmarks sociaux Ils proposent des
fonctionnaliteacutes plus ou moins sophistiqueacutees Un des critegraveres essentiels de choix est
leur succegraves En effet leur force repose en grande partie sur le nombre de favoris
dutilisateurs partageacutes agrave moins de freacutequenter des bookmarks deacutedieacutes agrave des
communauteacutes tregraves cibleacutees Dautre part la rapiditeacute du service et la pertinence de
son moteur de recherche sont aussi des paramegravetres importants
Delicious qui appartient agrave Yahoo est lun des plus connus et des plus utiliseacutes Yahoo
MyWeb2 rassemble eacutegalement une grande communauteacute ainsi que Furl ou encore
Blogmarks et Blinklist35 Certains de ces sites au-delagrave de larchivage de ladresse
proposent de conserver une copie inteacutegrale dune page web Dautres vous
suggegraverent des sites similaires agrave ceux que vous avez mis dans vos favoris Cette
similariteacute se base notamment sur les favoris ajouteacutes par les autres utilisateurs La
recherche par similariteacute (ou par suggestion en fonction de vos habitudes de
navigation) offerte par des services comme Yoono StumbleUpon ou Similicious 36 est
une meacutethodologie de recherche particuliegraverement inteacuteressante Nous en reparlerons
plus loin
Pour choisir preacuteciseacutement votre service de bookmarks sociaux vous pouvez vous
aider de ces ressources 37
- le site Irox propose un tableau comparatif de pregraves de 20 services
- le blog de Robin Good offre une seacutelection inteacuteressante de bookmarks sociaux
- la page Free Bookmark Managers affiche une liste dune quarantaine de logiciels et
utilitaires deacutedieacutes au partage et agrave la gestion de vos favoris (bookmarks) en ligne via
accegraves distant en local ou sur serveur Attention tous ne sont pas sociaux cest-agrave-
dire baseacutes sur le partage
copy Digimind Digimind Services ndash White Paper |29
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b Le Multimeacutedia photos et videacuteos
Le partage de vos ressources ne se limite pas au texte et adresse de sites Il est
eacutegalement possible de partager vos photos et videacuteos
Les images
Flickr 38 racheteacute par Yahoo Inc en 2005 est lapplication type de partage dimages
voire mecircme larcheacutetype du service Web 20 ce site permet de mettre en ligne ses
photos de les partager avec ses proches ses collegravegues ou de les laisser en accegraves
priveacute
Il est possible dutiliser un moteur pour rechercher agrave travers les millions de photos
mises en ligne par les autres utilisateurs
Flickr na pas de points communs avec les nombreuses applications Web 2 en becircta agrave
linterface artisanale Sur le service de Yahoo la puissante interface en fait un outil
tregraves simple agrave utiliser Ainsi via le menu Organize vous pouvez acceacuteder agrave une
veacuteritable table de montage virtuelle pour organiser vos photos
copy Digimind Digimind Services ndash White Paper |30
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche sur Flickr A droite les noms dutilisateurs et les tags associeacutes aux photos
Comme sur les bookmarks sociaux la recherche peut seffectuer sur le titre ou la
description mais aussi sur les tags chaque internaute qui partage ses photos leur
attribue des mots cleacutes pour les deacutefinir les expliquer les contextualiser voire donner
son opinion
Chaque liste de reacutesultats chaque photo est accompagneacutee par ses tags Ceux-ci
permettent aussi daffiner ou deacutelargir votre recherche lorsque vous en seacutelectionnez
un Il est possible de rechercher sur les photos les utilisateurs mais aussi sur les
groupes En effet la notion de communauteacute est eacutegalement importante Les
groupes rassemblent les utilisateurs qui partagent les mecircmes centres dinteacuterecirct
photographiques Des forums de discussions sont inteacutegreacutes agrave ces groupes
permettant dentrer en contact direct avec certains membres
copy Digimind Digimind Services ndash White Paper |31
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Par exemple le groupe The Eyes Have It 39 rassemble les utilisateurs (et donc leurs
photos) autour du thegraveme de la communication visuelle des secteurs pharmacie et
biotech
Que peut trouver le veilleur sur un service de photos tel que Flickr
Finalement la mecircme chose que sur les bookmarks sociaux tout ce que les
membres ont voulu partager des photos du dernier salon automobile de Detroit 40
ou de la convention annuelle des industries cosmeacutetiques dAmeacuterique du Nord La
veille concurrentielle ou la veille image sur votre propre socieacuteteacute est eacutegalement
inteacuteressante Ainsi une recherche (full text) sur la socieacuteteacute peacutetroliegravere Exxon affiche
plus de 1400 photos relatives aux stations services aux puits de peacutetrole aux
raffineries aux employeacutes aux manifestions de contestataires ou aux publiciteacutes
deacutetourneacutees
Comme avec le social bookmarking vous pouvez vous attacher agrave suivre les
membres qui partagent les mecircmes centres dinteacuterecirct que vous ou votre organisation
apregraves seacutelection de la page de lutilisateur la mise en surveillance de son flux RSS
permet decirctre averti degraves que cette personne ajoute de nouvelles photos
Dautres services permettant le partage de photos existent Toutefois ils ne vont
pas aussi loin que Flickr dans la logique Web 20 Le service PhotoBucket 41 est le
grand concurrent de Flickr mais avec une approche plus grand public Flickr est
davantage freacutequenteacute par des internautes avertis des professionnels et des
passionneacutes de photographie En ce sens le service de Yahoo sera donc plus
inteacuteressant pour le veilleur
Squidoo 42 est en quelque sorte un annuaire de bookmarks perfectionneacute une
rencontre de services sociaux comme Delicious et Flickr Squidoo vous permet en
effet de creacuteer une page de liens dans un domaine qui vous passionne et de la
structurer en rubriques agreacutementeacutees de photos
Linterface simple rend possible la creacuteation rapide de pages speacutecialiseacutees (appeleacutees
lensgtobjectifs lentilles) et de les rendre visible agrave tout un chacun On trouve par
exemple plusieurs lens consacreacutees aux nanotechnologies43 Chaque lens est
accompagneacutee de tags connexes agrave son sujet
Vous pouvez rechercher ces pages gracircce agrave un moteur de recherche un reacutepertoire
par cateacutegories un nuage de tags (exemple le tag Marketing 44) ou mecircme parcourir
le Top100
copy Digimind Digimind Services ndash White Paper |32
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La videacuteo
Via les services YouTube ou DailyMotion le partage de videacuteos en ligne est plus
meacutediatiseacute que les services de photos Notamment parce que le leader Google a
racheteacute YouTube en octobre 2006 geacuteneacuterant un buzz sans preacutecegravedent au sein des
blogs et de la presse traditionnelle (Mainstream medias)
YouTube 45 et ses concurrents Web 20 fonctionnent agrave peu pregraves de maniegravere
eacutequivalente agrave Flickr sans en atteindre toutefois sa clarteacute ergonomique
Tout ces sites de videacuteos vont permettre drsquouploader (charger vers le site) et
partager vos videacuteos (converties automatiquement au format FlashVideo) et aussi
bien sucircr de rechercher parmi les videacuteos des autres utilisateurs
Sur ces applications on retrouve de nombreuses caracteacuteristiques du Web 2 les
videacuteos classeacutees par cateacutegories sont accompagneacutees de tags qui aident agrave les
contextualiser et les deacutecrire en plus du titre et de la description renseigneacutes par
lutilisateur Un fils RSS permet de surveiller lajout de videacuteos dans une cateacutegorie ou
par un utilisateur deacutefini A linstar des billets dun blog les internautes peuvent
commenter les videacuteos De plus les videacuteos sont noteacutees ce qui impacte ensuite leur
place dans le classement et donc leur visibiliteacute
Ces services contiennent des favoris inteacutegreacutes ougrave lon peut sauvegarder ses videacuteos
preacutefeacutereacutees Il est possible de partager sa videacuteo par mail ou messagerie instantaneacutee
de la poster sur son blog Dailleurs de nombreux blogueurs utilisent les services de
type YouTube (ou Flickr pour la photo) pour stocker leurs fichiers multimeacutedias trop
volumineux pour les heacutebergeurs de blogs La notion de groupe comme sur Flickr
est preacutesente des communauteacutes rassemblent des utilisateurs autour de grandes
theacutematiques lieacutees par exemple agrave la politique aux sports et aux voyages
YouTube a de nombreux concurrents aux fonctions tregraves proches Impossible de
tous les mentionner Mais on peut retenir cependant le franccedilais DailyMotion 46 tregraves
populaire dailleurs neacute quelques semaines avant YouTube Citons eacutegalement Yahoo
Videos AOL Videos Revver Grouper (de Sony) Metacafe SoapBox (de Microsoft)
Zudeo Wideo MySpace Vimeo 47Certains de ces services proposent du contenu
amateur ainsi que des films professionnels issus des networks de TV et de cineacutema
Mais les plus petits services se cantonnent aux videacuteos envoyeacutees par linternaute que
celles-ci aient dailleurs eacuteteacute copieacutees ou non
copy Digimind Digimind Services ndash White Paper |33
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche sur DailyMotion
Quel contenu agrave usage professionnel le veilleur peut espeacuterer trouver sur ces
plateformes Essentiellement des videacuteos consacreacutees agrave des socieacuteteacutes et individus
Ainsi si je reacuteitegravere ma recherche sur la socieacuteteacute peacutetroliegravere Exxon jobtiens des videacuteos
sur des manifestations des mareacutees noires le reacutechauffement climatique des
actualiteacutes boursiegraveres des retransmissions de procegraves des deacutetournements de
publiciteacutehellipLa recherche de videacuteos saverra particuliegraverement utile pour une veille
Image Produits ou concurrentielle Le contenu de videacuteos est eacutegalement souvent
tregraves politique agrave partir de la campagne des eacutelections preacutesidentielles franccedilaises de
2007 la diffusion de videacuteos sur les hommes et femmes politiques est devenue une
veacuteritable arme Autre aspect inteacuteressant la possibiliteacute de deacutecouvrir de nombreux
extraits de videacuteos de documentaires sur des sujets extrecircmement varieacutes eacutecologie
industrie socieacuteteacute consommation
Le contenu de ces services de videacuteos est donc agrave limage du net heacuteteacuterogegravene mais
potentiellement riche
copy Digimind Digimind Services ndash White Paper |34
Le Web 20 pour la veille et recherche dinformation DIGIMIND
c Partage de CV et reacuteseaux sociaux
Termineacute le temps ou seules les personnes agrave qui vous transmettiez votre CV ou
votre carte de visite pouvaient prendre connaissance de votre identiteacute et de votre
parcours professionnel Via les plateformes de reacuteseaux sociaux le push fait place au
pull de plus dans une optique de cooptation et de recommandation il y est
possible de mettre son CV en ligne sous format hypertexte et de demander agrave
rentrer en relation avec des proches de votre reacuteseau immeacutediat Les plateformes de
reacuteseaux sociaux sont nombreuses certaines sont agrave vocation geacuteneacuteraliste dautres
uniquement deacutedieacutees aux actifs dautres encore reacuteserveacutees agrave une communauteacute
(eacutetudiants lyceacuteens anciens eacutelegraveves passionneacutes de voyages)
Ces applications repreacutesentent un marcheacute conseacutequent puisque pour les seuls USA
on preacutevoit un chiffre daffaires des reacuteseaux sociaux de 25 milliards de dollars agrave
lhorizon 2011 contre 350 millions en 200648 La France est domineacutee par la
plateforme Viadeo (ex-Viaduc)49 Ce service leader lanceacute en 2004 compte plus de
750 000 profils Dans les autres pays cest LinkedIn 50 qui domine geacuteneacuteralement
avec plus de 9 millions dutilisateurs dans 135 pays
Une recherche sur Viadeo
copy Digimind Digimind Services ndash White Paper |35
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les fonctionnaliteacutes
Que trouve-t-on sur ces sites Notamment des profils de personnes en activiteacute ou
en recherche demploi ainsi que des hubs regroupant des utilisateurs autour dun
mecircme centre dinteacuterecirct toujours la notion de communauteacutes de pratiques propre au
Web 20 Sur ces services tout est penseacute pour creacuteer du lien social Le profil
individuel se constitue dun CV enrichi de nombreux liens vers ses employeurs ses
amis ses reacuteseaux professionnels et associatifs ses travaux et publications Les hubs
regroupent les personnes autour de secteurs meacutetiers associations danciens eacutelegraveves
pays reacutegions Par exemple sur Viadeo saffichent les hubs Analyse Veille
Strateacutegique amp Concurrentielle Intelligence Eco Blogs amp Bloggers Editeurs de
Logiciels Profession documentaliste and co mais aussi Grande distribution
Oceacuteanie ou Normes meacutethodes et outils Dans ces hubs des forums organisent les
discussions des membres autour de theacutematiques deacutefinies Un moteur de recherche
permet de trouver des profils selon un secteur une fonction une reacutegion Une fois
un profil identifieacute il faut demander agrave entrer en relation avec lui Cela sera dautant
plus facile et rapide sil est peu eacuteloigneacute de votre propre reacuteseau de contacts
La veille
Linteacuterecirct pour le professionnel de linformation est double il peut augmenter sa
visibiliteacute et celle de certains de ses projets services publications thegraveses ou articles
Dautre part il peut rechercher des donneacutees sur des personnes et entreprises ou
identifier un expert Comme sur dautres services Web 20 il est facile de se
constituer une communauteacute dutilisateurs partageant ses centres dinteacuterecirct que lon
visitera reacuteguliegraverement Ainsi sur Viadeo une recherche sur le secteur Agro-
alimentaire avec le mot cleacute veilleur 1 affiche plus de 50 reacutesultats avec les fonctions
entreprises et synthegraveses de parcours des membres Vous pouvez alors entrer en
relation avec ces personnes ou tout simplement collecter des donneacutees sur celles-ci
et leurs reacuteseaux Ces sites sont dailleurs devenus un outil essentiel pour certaines
fonctions commerciaux pour la prospection recruteurs journalistes
ethellipresponsables de casting pour eacutemissions TV
1 Certaines fonctionnaliteacutes avanceacutees sont payantes
copy Digimind Digimind Services ndash White Paper |36
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les autres reacuteseaux
Parmi les autres services de reacuteseaux sociaux outre LinkedIn davantage tourneacute agrave
linternational il existe assez utiliseacutes en France 6nergiesnet et Xing (ex Open BC)51
Les reacuteseaux ciblant plus particuliegraverement les jeunes (FaceBook MySpace) peuvent
eacutegalement ecirctre utiliseacutes MySpace feacutedegravere plus particuliegraverement des professions de la
communication de la publiciteacute et des meacutetiers multimeacutedias
Le reacuteseau FaceBook52 est original ce site nord-ameacutericain est preacutecurseur dun social
networking tregraves segmenteacute reacuteserveacute aux eacutetudiants et aux lyceacuteens Au deacutepart les
membres devaient sinscrire obligatoirement via lemail de leur universiteacute afin de
garantir lauthenticiteacute des profils et donc le seacuterieux de la communauteacute Depuis
FaceBook sest ouvert aussi aux entreprises Ainsi ce site capte tregraves tocirct les futurs
actifs et les fideacutelise
Des ressources
Certaines ressources peuvent vous aider agrave identifier les plateformes de reacuteseaux
sociaux professionnels utiles pour vos recherches Le wiki List of social networking
websites liste de nombreuses plateformes de reacuteseaux sociaux 53 et le site Link n
Rank cateacutegorise des sites de social networking 54
copy Digimind Digimind Services ndash White Paper |37
Le Web 20 pour la veille et recherche dinformation DIGIMIND
d Les sites dactualiteacutes collaboratives recommandation et notation
Ces sites recouvrent en fait diffeacuterents types dapplications
- Les Digg Like Ces services qui sinspirent tous du preacutecurseur Digg55 recueillent des actualiteacutes
proposeacutees par les internautes Le principe apregraves enregistrement un formulaire
simple vous permet de poster lactualiteacute de votre choix susceptible dinteacuteresser les
autres internautes son titre son url sa description Il faut aussi choisir une
cateacutegorie Par exemple Technologies Sciences Monde Affaires Divertissement Ces
cateacutegories peuvent ecirctre subdiviseacutees en theacutematiques plus fines Lactualiteacute si elle est
valideacutee par les modeacuterateurs apparaicirctra alors en ligne Elle sera noteacutee par les autres
internautes qui votent pour elle selon son inteacuterecirct Les actualiteacutes disposant du plus
grand nombre de points se placent alors en haut du classement
La cateacutegorie Sciences sur Digg A gauche les nombres de votes
Ces sites affichent les principales caracteacuteristiques du Web 20 interface eacutepureacutee
possibiliteacute de laisser des commentaires fils RSS pour surveiller les nouvelles
actualiteacutes classement des articles les plus lus les mieux noteacutes possibiliteacute denvoyer
par mail ou de bloguer un article et bien sucircr forte contribution de linternaute Sur
certains sites leacutetiquetage des articles via le systegraveme de tags est proposeacute
copy Digimind Digimind Services ndash White Paper |38
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Linteacuterecirct est de pouvoir positionner certaines informations les unes par rapport aux
autres et connaicirctre la populariteacute dune actualiteacute ou dun sujet (entreprise personne)
abordeacute (la critique de mon produit est-elle tregraves populaire ) Cest une approche
alternative aux agreacutegateurs de news de type Google Actualiteacutes ou Yahoo Actualiteacutes
qui hieacuterarchisent les news avec de puissants algorithmes mais sans recourir agrave
lhumain Ainsi Google Actualiteacutes preacutecise La seacutelection et le positionnement des
articles de cette page ont eacuteteacute reacutealiseacutes automatiquement par un programme
informatique
En outre sur ces services de type Digg linformation nest pas brute linternaute
qui poste lactualiteacute peut selon son expertise y apporter un commentaire de
valeur Linformation peut ecirctre commenteacutee (en plus du vote) par les autres
internautes Comme de nombreux blogueurs les utilisateurs des Digg Like jouent
aux journalistes ou tout simplement donnent leur opinion
Lorsquil sagit dactualiteacutes concernant le produit ou le service dune socieacuteteacute ces
commentaires positifs ou non sont une veacuteritable manne pour de nombreux
professionnels de linformation veilleurs marketeurs chargeacutes deacutetudes et autres
analystes qui vont pouvoir recueillir agrave moindre frais des informations sur leur
nouveau produit leurs clients ou ceux de la concurrence
Digg est lun des sites les plus copieacutes du Web 20 Sil reste la reacutefeacuterence dautres
applications tregraves largement inspireacutees tirent leur eacutepingle du jeu En France Scoopeo
Fuzz et TapeMoi offrent eux aussi des services dactualiteacutes collaboratives On peut
eacutegalement citer Rojo le canadien Niouz lespagnol Meneames le reacuteseau de sites
BlogMemes 56 Mecircme Netscape pionnier du navigateur web a lanceacute un portail
sinspirant du systegraveme de notation de Digg
On peut reprocher agrave ce type de site de favoriser les cateacutegories techniques et
scientifiques faisant la part belle aux contributions des geeks et autres accrocs du
net grands utilisateurs de services Web 2 Toutefois les sites comme Blogmemes ou
Netscape diffusent davantage dactualiteacutes agrave teneur eacuteconomique et sociale
- Les mix actualiteacutes contributions des internautes
Wikio57 est un service dorigine franccedilaise (creacuteeacute par le fondateur de Kelkoo) agrave
lintersection de Google Actualiteacutes et de Digg En effet Wikio mixe les articles issus
de sites dactualiteacutes de blogs avec des contributions des internautes On peut
prendre connaissance des informations de diffeacuterentes maniegraveres
copy Digimind Digimind Services ndash White Paper |39
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- En naviguant via les theacutematiques (France International Politique Economie
Finance Santeacute Science hellip) ou via le nuage de tags dynamiques qui se modifient en
fonction de la rubrique ou vous vous situez
- En recherchant via le moteur
- En sabonnant aux flux RSS agrave chaque cateacutegorie et agrave chaque tag correspond son
flux RSS De mecircme lorsque vous lancez une requecircte via le moteur vous pourrez
surveiller ces reacutesultats via un flux RSS
- les plateformes de contributeurs indeacutependants
La deacutefiance et la volonteacute dindeacutependance vis-agrave-vis des grands meacutedias traditionnels de
la presse eacutecrite et audio-visuelle se sont traduites degraves 2001 par la creacuteation massive
de blogs Les blogueurs sont-ils et peuvent-ils simproviser journalistes Ce deacutebat
qui promet decirctre sans fin est inteacuteressant De nombreux blogueurs (mais pas la
majoriteacute) sont devenus de veacuteritables experts dans leur domaine agrave force deacutecriture
de lecture et danalyses quotidiennes Ainsi les mainstream medias invitent
maintenant dans leurs colonnes et plateaux les blogueurs les plus talentueux
Ces blogueurs experts ou professionnels ne constituent pas les seuls creacuteateurs
dactualiteacutes alternatives
Des initiatives de plateformes dactualiteacutes eacutecrites par des non professionnels ont
aussi vu le jour Agoravox58 est lun des premiers portails de journalisme citoyen
lanceacute par Joeumll de Rosnay et Carlo Revelli 59 en mai 2005 Agoravox permet aux
internautes de proposer leurs articles pour commenter reacutefleacutechir agrave des sujets
dactualiteacutes si possible avec une approche et un regard diffeacuterents des meacutedias
traditionnels Le format des contributions est multimeacutedia Le site explique Tout le
monde peut devenir reacutedacteur drsquoAgoraVox Il nrsquoest pas neacutecessaire de savoir eacutecrire avec
un style journalistique affirmeacute Chacun drsquoentre nous peut devenir une sorte de capteur
en temps reacuteel de ce qui se passe dans notre entourage en fournissant des articles des
images des extraits videacuteo ou audio Ce qui est important crsquoest de pouvoir teacutemoigner
drsquoun eacuteveacutenement auquel vous avez assisteacute ou que vous avez deacutecouvert en faisant des
recherches Il poursuit Pourquoi devenir reacutedacteur Tout simplement pour faire
entendre votre voix et pour relater des faits que vous avez identifieacutes et qui ne vous
paraissent pas ecirctre suffisamment repris dans les meacutedias traditionnels voire ignoreacutes ou
censureacutes
Agoravox encourage donc agrave utiliser son style personnel Il convient de sinscrire pour
devenir reacutedacteur Les articles doivent toutefois obeacuteir agrave une politique eacuteditoriale60
Un comiteacute de reacutedaction valide ensuite les contributions
copy Digimind Digimind Services ndash White Paper |40
Le Web 20 pour la veille et recherche dinformation DIGIMIND
En quelques mois Agoravox a prouveacute que de simples internautes pouvaient ecirctre
aussi bon reacutedacteurs et experts en fonction de leurs profession passion et
centres dinteacuterecirct agrave linstar des blogueurs professionnels
Agoravox na pas la vocation dun agreacutegateur dactualiteacutes de type Digg Wikio ou
Google News Cest une sorte de quotidien qui privileacutegie les articles de fond et
lanalyse Bien sucircr des reacutedacteurs stars eacutecrivent reacuteguliegraverement et leurs articles
sont attendus Mais ce ne sont pas les rubriqueurs traditionnels des autres meacutedias
Comme sur les autres sites Web 20 le lecteur peut attribuer une note dinteacuterecirct agrave
chaque article et poster un commentaire Enfin leacutetonnante technologie
ReadSpeaker 61 permet de retranscrire automatiquement tous les textes en version
audio
Agoravox nest pas le seul exemple de site de journalisme citoyen Le portail
OhMyNews 62 initiative coreacuteenne est baseacute sur le mecircme principe Lanceacute en feacutevrier
2000 le reacuteseau international OhMyNews reacuteunit plus de 40 000 reacutedacteurs
Pour le veilleur ces sites dactualiteacutes collaboratives constituent des sources
dinformations alternatives avec une partie de lactualiteacute issue des organes et
agences de presse et lautre partie provenant des internautes Dautre part ces
nouveaux meacutedias permettent de deacutecouvrir et surveiller des experts voire des
leaders dopinion
Un article sur Agoravox A droite une preacutesentation de son auteur En haut la possibiliteacute de voter et
commenter larticle
copy Digimind Digimind Services ndash White Paper |41
Le Web 20 pour la veille et recherche dinformation DIGIMIND
II Rechercher Collecter
Doreacutenavant tout internaute peut creacuteer et publier sa propre information
Lidentification des sources dinformation et de linformation elle-mecircme est devenue
complexe car elles sont de plus en plus morceleacutees et atomiseacutees Il convient
dutiliser une large palette doutils de recherche pour collecter les donneacutees en
provenance des blogs des bookmarks et reacuteseaux sociaux Pour faciliter la
collecte il est en outre possible de verticaliser la recherche et de faire appel agrave des
humains Par ailleurs dautres outils permettent darchiver ses deacutemarches de
requecirctes et de navigation
a La recherche de blogs et de flux RSS
Le volume de blogs est en constante croissance sur le net Le nombre de blogs a
litteacuteralement exploseacute sur toute la planegravete Estimeacute agrave 70 millions agrave leacuteteacute 2005 ils sont
eacutevalueacutes agrave plus de 120 millions en mars 2007 Technorati lun des moteurs de
recherche de blogs les plus utiliseacutes mesure en 2007 un doublement du nombre de
blogs tous les 320 jours 120 000 blogs seraient ainsi creacuteeacutes chaque jour 63
Europe
33
Afrique 15 000
Ameacuterique du Nord
33
Ameacuterique du Sud
1
Asie
55
5 Australie 790 000
copy Digimind Digimind Services ndash White Paper |42
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Nombre de blogs en milliers et millions (la Russie est inteacutegreacutee dans lAsie) Estimation DIGIMIND Services 64
Les fils RSS omnipreacutesents A chaque blog correspond son flux RSS ce format qui permet dextraire et de
surveiller tout nouveau contenu qui parait sur le blog Si un vrai blog implique
toujours un flux RSS un flux RSS ninduit pas forceacutement un blog En effet le RSS et
son concurrent Atom sont preacutesents sur de plus en plus de type de meacutedias et outils
internet degraves lors que leur contenu est appeleacute agrave se modifier reacuteguliegraverement
On pourra donc trouver des flux RSS sur
-les blogs
-les sites de presse et dactualiteacute Exemple Les Echos Libeacuteration La Tribune Le
Figaro)
-les sites de revues et magazines speacutecialiseacutes Exemple La revue Nature propose ses
fils RSS concernant ses publications speacutecialiseacutees par domaines Science fait de
mecircme65
-les sites corporate des entreprises page dactualiteacutes catalogues produits (Ex Air
Liquide)
-les reacutesultats de moteurs de recherche de blogs Tous proposent des flux RSS
permettant de surveiller une requecircte (Technorati Google Blog Search Feedster
IceRockethellip)
-les pages de reacutesultats de moteur de recherche web Certains de ces moteurs
geacutenegraverent un flux RSS permettant de surveiller lapparition de nouveaux reacutesultats
pour une requecircte donneacutee
MSN Search (devenu Live Search66) le proposait depuis janvier 2005 et chaque page
de reacutesultats offrait une icocircne orange en bas de page permettant dobtenir des fils
RSS Cette icocircne RSS a disparu sur Live Search mais les flux RSS sont toujours lagrave (ils
sont deacutetectables automatiquement avec un navigateur Firefox Maxthon IE7 ou
votre lecteur RSS Attensa ou RSS Bandit par exemple)
Depuis peu Yahoo Search Web 67 offre lui aussi un fils RSS sur ses reacutesultats lagrave
encore deacutetectable via un lecteur ou navigateur (cela fonctionne uniquement pour le
Yahoo US)
copy Digimind Digimind Services ndash White Paper |43
Le Web 20 pour la veille et recherche dinformation DIGIMIND
-les moteurs dactualiteacutes La majoriteacute des portails qui agregravegent des flux dactualiteacutes
proposent des flux RSS Exemple Google Actualiteacutes Yahoo Actualiteacutes Topix MSN
Actualiteacutes Wikiohellip 68
-les Newsgroups Usenet (groupes de discussion) Les fils RSS sont en effet aussi
preacutesents sur Google Groupes (ou Google Groups) ce qui rend plus aiseacute la surveillance
des discussions Chaque groupe (Google ou Usenet) affiche un fils RSS ou Atom 69
(et ce quelque soit la langue) signaleacute par le logo orange RSS en bas de page
-certains forums web Exemple Forum Mobiles 70
-certaines listes de diffusion elles peuvent ecirctre surveilleacutees via labonnement agrave leur
flux RSS Cela eacutevite lengorgement de votre boicircte mail Exemple la liste Veille sur
Yahoo Groupes 71 dispose dun flux RSS
-les bookmarks sociaux Delicious Yahoo MyWeb2 Blogmarks 72hellipLe fils RSS
permet decirctre alerteacute de lajout de nouveaux favoris pour un tag ou un utilisateur
deacutefinis
-les plateformes de partage de photos Exemple Flickr PhotoBucket 73
-les services de partage de videacuteos comme YouTube DailyMotion 74 pour ecirctre alerteacutes
des nouveauteacutes
-de tregraves nombreux sites offrant un contenu qui se renouvelle
copy Digimind Digimind Services ndash White Paper |44
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Veille Corporate La Tribune propose des flux RSS segmenteacutes par socieacuteteacutes
Le veilleur via ces flux RSS pourra surveiller de nombreuses sources
dinformations Par ailleurs au-delagrave des blogs introspectifs dadolescents dont peu
preacutesentent un inteacuterecirct pour les professionnels certains types de blogs peuvent se
reacuteveacuteler utiles
-Le blog dactualiteacute et dopinion preacutesentant reacuteflexions et critiques de journalistes et
internautes
-Le blog theacutematique eacutediteacute par des passionneacutes experts professionnels consultants
et techniciens
-Le blog dentreprise outil de communication externe ou interne agrave linitiative des
salarieacutes ou des dirigeants
copy Digimind Digimind Services ndash White Paper |45
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les outils pour trouver des blogs et flux RSS Sur ces moteurs la recherche seffectue par mots cleacutes classiques ou par tags comme
sur Technorati par exemple Le contenu indexeacute (blogs et flux) est tregraves heacuteteacuterogegravene
Aussi lutilisation de la recherche avanceacutee sur ces outils est souvent neacutecessaire En
effet un blog peut avoir abordeacute la theacutematique deacuteveloppement durable 1 seule fois
parmi ses 4500 billets Il conviendra donc alors de centrer sa recherche sur le titre
du blog ou son url
Les moteurs
Certains moteurs sont deacutedieacutes agrave la recherche de blogs Cest en fait un abus de
langage Ces moteurs se focalisent sur la recherche de flux RSS mais ne peuvent
faire la diffeacuterence entre un flux provenant dun grand journal et celui dun blog
Ainsi le moteur Technorati classe parmi les blogs les plus populaireshellipLe Figaro
Pour mener une recherche efficace il conviendra dutiliser plusieurs moteurs Car
comme pour la recherche web ougrave il ne faut pas se limiter agrave Google au risque de
manquer pregraves de 85 des reacutesultats75 la recherche sur les blogs neacutecessite lemploi
de plusieurs outils76 En voici quelques-uns
gt Google Blog Search Recherche de blogs Google applique sa technologie puissante
aux flux RSS et blogs Linterface est notamment disponible en franccedilais et en anglais
Le moteur est doteacute de fonctions de recherche avanceacutee (recherche sur le titre le
billet recherche par ancienneteacutehellip)
gt Ask Blog amp Flux Ce moteur permet de rechercher parmi les blogs les flux XML
(RSS ou Atom) Et aussi de sabonner agrave un blog ou un flux RSS
gt Feedster Ce moteur recense plus de 900 000 sources et 5000 sont rajouteacutees
chaque jour
gt BlogPulse Indexe plus de 46 millions de blogs
gt Technorati Ce moteur rafraicircchit son index toutes les 5 agrave 15 minutes et
recherche parmi plus de 70 millions de blogs (en avril 2007 77) ou sites proposant
des flux RSS Il est possible de rechercher par mots cleacutes ou par tags
gt Sphere va prendre en compte plusieurs variables pour mieux chercher parmi la
blogosphegravere
- comme pour le contenu web classique les reacuteseaux de liens entrants et sortants
- la qualiteacute de ces liens
copy Digimind Digimind Services ndash White Paper |46
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- les internautes agrave lorigine de ces liens (simple commentateurs ou leaders dopinion)
3 moteurs web integravegrent la recherche sur les blogs au sein de leur recherche
avanceacutee 78
gt Yahoo Search
Pour centrer sa recherche sur les flux RSS et les blogs il convient drsquoaller dans la
recherche avanceacutee (agrave droite de la boite de requecircte) puis dans le menu deacuteroulant
Format de fichiers et de seacutelectionner le format RSSXML
gt Exalead
Apregraves avoir effectueacute votre recherche il suffit de cliquer sur le bouton RSS jaune
dans la fenecirctre Preacuteciser la recherche Au sein des reacutesultats de recherche le flux
RSS est disponible via licocircne RSS Simple et propre
gt Microsoft MSN Live Search
MSN a ameacutelioreacute les interfaces de son moteur pour restreindre la recherche sur les
fils RSS Apregraves laffichage de votre page de reacutesultats vous pouvez affiner votre
recherche gracircce au bouton Flux (ou Feed en anglais) Ce bouton est accessible via
le menu Plus Au sein des reacutesultats de recherche sont alors disponibles lurl du flux
le cache et un lien pour sinscrire au fils RSS
Au-delagrave de ces moteurs speacutecialiseacutes il peut ecirctre beacuteneacutefique de tenter une recherche
sur un moteur Web (Google ou Yahoo Search par exemple) de type blog OR RSS
[votre sujet] Exemple blogs sur les teacuteleacutecoms Cela vous permettra non pas de
chercher au sein des blogs mais de trouver dautres blogs
Les reacutepertoires 79
Comme pour le web un certain nombre dannuaires entendent recenser les blogs
et fils RSS Attention comme la blogosphegravere est tregraves mouvante et en constante
croissance ces guides sont par nature non exhaustifs et leur mise agrave jour reacuteguliegravere
est difficile
gt Blogarama Ce reacutepertoire recense plus de 49 000 blogs classeacutes par cateacutegories
gt RSS Network indexe plus de 150 000 fils RSS
gt RSSFeeds Reacutepertorie plus de 119 000 fils organiseacutes en cateacutegories
copy Digimind Digimind Services ndash White Paper |47
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b La recherche par tags
Nous lavons vu avec la Folksonomie linternaute peut deacutesormais mettre en place et
partager sa propre classification via les tags Lutilisateur affecte leacutetiquette de son
choix agrave ses favoris images videacuteos Lavantage est indeacuteniable cest linternaute qui
deacutefinit son eacutetiquette et non plus un organisme Mais les inconveacutenients sont
nombreux difficile gestion des singulierspluriels problegraveme de synonymes de
signification (que deacutesigne cet internaute par ce tag) dhomonymes de polyseacutemie
dheacuteteacuterogeacuteneacuteiteacute plusieurs tags peuvent designer les mecircmes documents
Toutefois lapproche par tag facilite la recherche dune part en ajoutant une couche
seacutemantique aux documents web et dautre part en permettant une navigation par
concepts de plus en plus abandonneacutee compte tenu de la deacutesertion progressive des
cateacutegories des grands reacutepertoires web par les internautes
De plus on peut tagger pratiquement tout type de contenu web Ainsi les sites 43
Things et son eacutequivalent franccedilais 36 Trucs 80 proposent aux internautes de lister
leurs objectifs expeacuteriences ou projets Chacun de ces projets est taggeacute via un ou
plusieurs mots cleacutes
Les moteurs et meacutetamoteurs de tags
Les moteurs
La plupart des applications de social bookmarking ou de partage de fichiers images
ou videacuteos permettent donc de tagger leur contenu Sur certaines le moteur de
recherche interne rend possible en plus de la recherche sur le full text une
recherche centreacutee sur les tags Cest le cas sur Flickr vous pouvez rechercher au
choix sur le titre et la description des images ou sur les tags associeacutes deacutefinis par les
utilisateurs qui ont placeacute leurs photos
Un outil comme Delicious tag search 81 va vous permettre deffectuer des
recherches via un ou plusieurs tags sur le service de social bookmarking Delicious
Pour la recherche de blogs ou flux RSS le moteur Technorati propose une
recherche classique sur les mots cleacutes contenus dans les billets mais aussi une
copy Digimind Digimind Services ndash White Paper |48
Le Web 20 pour la veille et recherche dinformation DIGIMIND
recherche par tags82 En effet leacutediteur dun blog peut tagger chacun de ses billets
via des mots cleacutes qui les cateacutegorisent Ces mots ou tags seront repris par lindex du
moteur Ainsi la recherche du mot pollution parmi les tags affiche un billet sur le
reacutechauffement climatique Si ce billet est bien cateacutegoriseacute par son auteur dans une
rubriquepollution (parmi dautres) il ne contient pas ce mot dans son texte
toutefois en relation avec le concept de pollution Clairement une recherche
classique sur le seul texte des billets naurait pas rameneacute ce billet ou du moins pas
dans les premiers reacutesultats Autre inteacuterecirct Technorati vous propose des tags
associeacutes Ainsi pour pollution il affiche environment politics global warming science
china energy news air climate climate change autant de mots cleacutes pour eacutelargir ou
affiner vos requecirctes
Le moteur SearchLess 83 offre une approche originale il associe la recherche par
mots cleacutes agrave la recherche par tags Ainsi si vous effectuez une requecircte avec le mot
intelligence vous pouvez preacuteciser par le tag CIA Les reacutesultats seacutelectionneront
donc le mot intelligence sur des contenus (billets de blogs par exemple) taggeacutes CIA
par lutilisateur lui-mecircme on est alors sucircr que les 2 concepts sont intimement lieacutes
Meacutetamoteurs
Des meacutetamoteurs 84 permettent de rechercher sur les diffeacuterents types de contenu
sociaux bookmarks images videacuteos
Ainsi Tag Central agreacutege de nombreux formats web taggeacutes En lui indiquant un
tag il affiche des reacutesultats provenant agrave la fois de Flickr Smugmug (photos)
Technorati (blogs) Blogmarks Connotea Furl delirious (bookmarks sociaux) ou
encore 43Things (listes de projets)
Zewol outil de meacuteta syndication francophone permet de rechercher parmi les tags
(Flickr delicious) mais aussi sur les actualiteacutes (Google News Ask Actualiteacutes
Yahoo Actualiteacutes) les blogs (Technorati IceRocket Google Blog Search Ask
Blogshellip) le buzz (Tapemoi Scoopeo Wikipedia) les videacuteos (Google Videos
Podscope Video Daily Motion) et un mix (Furl Echonimo actualiteacutes Plazoo
Feed24) Concregravetement cest une bonne approche de recherche globale sur de
nombreuses ressources de type Web 20
Il est toujours possible de traquer la preacutesence ou lapparition dun mot clef sur le
web via la mise en surveillance du flux RSS de la requecircte
Ketoag est un outil qui permet dinterroger de nombreux services sociaux
copy Digimind Digimind Services ndash White Paper |49
Le Web 20 pour la veille et recherche dinformation DIGIMIND
(Delicious Furl Diig Wikio Blinklist) mais eacutegalement des moteurs de recherche
(Google Blog Search) Par ailleurs vous pouvez geacuteneacuterer pour chaque requecircte un
flux RSS mais aussi un fichier OPML (format permettant lagreacutegation et leacutechange de
listes de flux RSS)
Gnosh est un meacutetamoteur qui recherche parmi les moteurs web les moteurs de
blogs et les outils de partage de favoris De plus une recherche sur longlet People
vous permet de rechercher parmi les favoris des internautes inscrits agrave la
communauteacute Gnosh
Exalead recherche sur Wikipedia A droite le nuage de tags
Les nuages de tags
Ces nuages regroupent un ensemble de tags dans un mecircme espace en affectant agrave
chacun une taille variant selon leur populariteacute (freacutequence dutilisation ou de requecircte
sur ces mots) ou la densiteacute darticles auxquels ils se reacutefeacuterent (deacutepecircches dactualiteacutes
par exemple)
Les nuages de tags sont devenus agrave la mode car ils permettent une navigation facile
tregraves visuelle au sein dun site dune base de donneacutee ou des reacutesultats dun moteur
Ils apportent une grille de lecture suppleacutementaire agrave des sites dont les menus sont
souvent surchargeacutes ou le contenu atomiseacute
copy Digimind Digimind Services ndash White Paper |50
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Nombreuses sont les applications qui utilisent le nuage de tags pour optimiser la
navigation et mettre en valeur leur contenu le partage de videacuteos (DailyMotion) les
bookmarks sociaux (Delicious MyWeb2 de Yahoo) ou les services dactualiteacutes
collaboratives comme Wikio Certains moteurs comme Exalead ont eacutegalement
choisis dafficher des nuages de tags au sein de leurs pages de reacutesultats Dans ce cas
il sagit dune aide agrave laffinage des requecirctes un clic sur un tag va afficher une
nouvelle page de reacutesultat prenant ce mot en compte
Zibb85 moteur de recherche vertical deacutedieacute au Business to Business utilise aussi le
nuage de tags pour visualiser clairement les mots cleacutes de theacutematiques connexes les
plus freacutequents agrave votre requecircte
Dautres sites plus classiques ont eacutegalement choisi lapproche du nuage de tag pour
rendre leur navigation plus attractive et leurs rubriques plus visibles Ainsi le site
Ecrans 86(du journal Libeacuteration) affiche en bas agrave droite un nuage de tags mettant en
valeur son contenu tregraves touffu
Certains outils proposent de geacuteneacuterer des nuages de tags pour des sites ou moteurs
nen disposant pas
Google Tag Cloud Maker 87 est un script pour Firefox qui permet dafficher un nuage
de tags agrave droite des reacutesultats de Google plus un mot est freacutequent dans les reacutesultats
de votre recherche plus la taille dun tag est importante
Newzingo 88 extrait des mots de Google News pour constituer un nuage
doccurrences parmi les termes de lactualiteacute Plus le terme est gros plus les articles
relatifs agrave ce terme sont nombreux Techzingo reacutealise le mecircme process mais cette
fois les cibles sont des meacutedias de reacutefeacuterence dans le High Tech et le logiciel
Slashdot Diggcom et TheRegister
Un nuage de tags sur lInternet Movie Database une maniegravere de naviguer parmi tous les mots cleacutes associeacutes aux films
copy Digimind Digimind Services ndash White Paper |51
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La qualification du contenu par les utilisateurs (rdquofolksonomierdquo) est une reacuteelle valeur
ajouteacutee Les moteurs de recherche font reposer une grande part de lrsquoeffort sur
lrsquoutilisateur final une page de reacutesultats de Google doit ecirctre eacutevalueacutee souvent
interpreacuteteacutee par linternaute La folksonomie fait elle reposer lrsquoeffort de filtrage sur
lrsquoutilisateur initial celui qui va rechercher et appliquer ses propres ldquotagsrdquo Parce
quen amont 1743 personnes ont taggeacute une page avec un groupe de mots cleacutes
lrsquoutilisateur final lors de sa requecircte reccediloit une page de reacutesultats souvent tregraves
pertinente
Sur un moteur classique cest agrave lutilisateur dimaginer ses mots cleacutes pour affiner sa
recherche Sur les bookmarks sociaux de type Delicious les internautes qui
partagent leurs ressources ont deacutejagrave preacutepareacute ce travail daffinage via leurs tags
Prenons le cas dune recherche extrecircme car geacuteneacuterant de la synonymie la requecircte
Jaguar Sur Googlecom on me propose certes des mots cleacutes connexes pour
affiner mais tous sont lieacutes agrave la voiture Sur Delicious les tags afficheacutes sont relatifs agrave
la voiture mais aussi au systegraveme dexploitation agrave un groupe de musique et agrave lanimal
Pouvoir rechercher parmi les tags classifications eacutemanant de lutilisateur peut ecirctre
particuliegraverement inteacuteressant lorsquune recherche classique par mots cleacutes sur le
contenu des documents sest aveacutereacutee infructueuse ou geacutenegravere des reacutesultats peu
pertinents
Le tagging une pratique quotidienne
Selon une enquecircte meneacutee en deacutecembre 2006 par le Pew Internet amp American Life
Project 28 dutilisateurs des internautes ameacutericains ont taggeacute ou cateacutegoriseacute en
ligne des contenus tels que des photos des billets dans des blogs des articles
drsquoactualiteacutehellipSur une base journaliegravere 7 des utilisateurs drsquoInternet pratiquent le
tag en ligne
Ce systegraveme de laquo taxonomie populaire raquo pourrait-il constituer une alternative aux
outils de recherche traditionnels par mots cleacutes Il convient de distinguer les
usages professionnels des usages grand public Olivier Le Deuff 89 reprend dans
son eacutetude sur les Folksonomies la distinction effectueacutee par Thomas Vander
Wal entre les folksonomies eacutetroites (narrow folksonomies) et geacuteneacuterales (broad
folksonomies) Selon Olivier Le Deuff cette distinction est importante car les
premiegraveres sont surtout utiliseacutees dans un objectif individuel tandis que les secondes
privileacutegient lrsquoaspect collectif et collaboratif du partage drsquoinformation Ainsi les sites
de partages de favoris comme delicious ou Connotea sont plutocirct des
folksonomies geacuteneacuterales puisqursquoun mecircme site peut ecirctre partageacute par plusieurs
utilisateurs et recevoir le mecircme tag Ce type de folksonomies srsquoappuyant sur des
copy Digimind Digimind Services ndash White Paper |52
Le Web 20 pour la veille et recherche dinformation DIGIMIND
reacuteseaux sociaux ne fait pas que classer de lrsquoinformation et la partager Il met en
relation des usagers qui partagent les mecircmes centres drsquointeacuterecirct Lrsquousager indexeur
devient agrave son tour un peu indexeacute et mis en relation agrave la fois avec drsquoautres mots-
cleacutes drsquoautres sites et drsquoautres usagers
Il est clair que dans le domaine de lrsquoinformation professionnelle ou speacutecialiseacutee le
manque duniformisation des folksonomies qursquoelles soient geacuteneacuterales ou agrave vocation
plus eacutetroite pose les limites de ce systegraveme Les outils drsquoindexation et de
classification traditionnels ont en effet eacuteteacute creacuteeacutes pour des corpus structureacutes aux
limites clairement deacutefinies et srsquoadressent agrave des utilisateurs experts drsquoun domaine
ou de la recherche drsquoinformation Lrsquoabsence de hieacuterarchisation et de controcircle
constitue agrave la fois le point fort et le point faible de la folksonomie La barriegravere des
langues pourra constituer eacutegalement un obstacle les tags eacutetant parfois meacutelangeacutes
dans un mecircme site sans distinction De plus comme le note Cyril Fievet 90 la
pratique du tagging nrsquoest pas uniforme drsquoun site agrave lrsquoautre Sur Technorati les tags
indexeacutes sont ceux choisis par les blogueurs et fonction du contenu qursquoils ont eux-
mecircmes publieacute Sur delicious en revanche ce sont les internautes qui taguent le
contenu des pages qursquoils conservent dans leurs signets raquo
Il convient eacutegalement drsquoecirctre vigilant quant agrave une utilisation laquo frauduleuse raquo des
tags destineacutee uniquement agrave garantir la populariteacute drsquoun blog comme cela a pu
ecirctre le cas avec les meacuteta-donneacutees incorporeacutees dans le code source drsquoune page
html
Eacutelie Francis et Odile Quesnel preacutesentent dans la revue Documentaliste Sciences
de lrsquoinformation les quatre modes drsquoindexation et de classification sur le web la
classification personnelle lrsquoindexation par lrsquoauteur lrsquoindexation par lrsquoutilisateur et la
classification globale Et srsquointerrogent sur lrsquoavenir de lrsquoindexation collaborative agrave la
croiseacutee de la qualiteacute (liberteacute diversiteacute enrichissement) et de la deacutesinformation
(subjectiviteacute manque de coheacuterence)
Il nrsquoen reste pas moins que folksonomie et indexation classique ne srsquoopposent pas
neacutecessairement et constituent des moyens de description de contenus adapteacutes agrave
des contextes diffeacuterents Stephen Lee creacuteateur du site Guten Tag voit dans la
folksonomie une sorte de web seacutemantique du pauvre peu oneacutereux agrave mettre en
place mais dont le succegraves reposera sur une seacuterie de bonnes pratiques collectives
Lrsquointeacuterecirct de ce systegraveme reacutesidera non pas dans la capaciteacute agrave trouver une reacuteponse agrave
une question preacutecise mais plutocirct agrave deacutecouvrir des sources originales et peu connues
ou de localiser des experts drsquoun domaine pointu Les tags les plus rares et preacutecis
pourront entre autres trouver leur application dans le domaine de la veille mettant
copy Digimind Digimind Services ndash White Paper |53
Le Web 20 pour la veille et recherche dinformation DIGIMIND
en œuvre la seacuterendipiteacute ou lrsquoart de favoriser le hasard pour des deacutecouvertes
heureuses
Laissons la conclusion sur ce point agrave lrsquoAssociation des Professionnels de
lrsquoInformation et de la Documentation (ADBS) qui estime dans sa newsletter que
Le foisonnement des propositions de mots-cleacutes aboutirait agrave un reacutesultat plus efficace
quune indexation reacutealiseacutee par un vocabulaire contraint Cette affirmation semble
ecirctre deacutemontreacuteehellip pour linstant
c La recherche de personnes et dinformations entreprises
La recherche de donneacutees sur les personnes physiques ou morales seffectuait
jusquici principalement en interrogeant les bases de donneacutees dinformations leacutegales
et financiegraveres gratuites ou payantes Linterrogation de service tel que Societecom
Infogreffe ou Yahoo Finance est bien sucircr encore neacutecessaire Mais il faut compter
maintenant avec les reacuteseaux sociaux professionnels qui eux aussi rassemblent des
donneacutees sur les entreprises ou les individus
Linteacuterecirct des reacuteseaux sociaux
Que peuvent-il apporter par rapport aux services classiques dinformations
dentreprises Dabord comme expliqueacute preacuteceacutedemment ils sont ouverts agrave tous
Les informations y figurant ne sont plus le seul fait de leacutediteur du site et ne sont pas
uniquement constitueacutees par les fichiers de donneacutees leacutegales publieacutees par les
organismes officiels comme le Greffe du Tribunal de Commerce en France Sur les
reacuteseaux sociaux centreacutes sur les personnes le contenu est inteacutegralement ameneacute par
linternaute qui affiche son CV deacutetailleacute ses publications ses oeuvres (textes ou
multimeacutedias) Linteacuterecirct est eacutevident des personnes peu visibles auparavant parce
que ne faisant pas partie des dirigeants dentreprises (geacuterant fondateur membre du
conseil) sont maintenant accessibles et donc requecirctables par les internautes On
peut donc collecter des informations sur un cadre de RampD dune socieacuteteacute de
teacuteleacutecoms concurrente ou sur le management eacutetonnant de telle entreprise de
plasturgie citeacutee dans le CV dun employeacute de passagehellip
A linstar des blogs linformation preacutesente sur les reacuteseaux sociaux ne tient plus du
discours ou des donneacutees officielles puisque cest linternaute qui communique sur sa
vie et son entreprise
copy Digimind Digimind Services ndash White Paper |54
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Geacuterer leacuteparpillement de linformation
Dautres plateformes de social networking mixent linformation collecteacutee sur le web
avec les contributions des utilisateurs (agrave linstar de Wikio pour les actualiteacutes) Ainsi
le service ZoomInfo 91 permet de rechercher des socieacuteteacutes et des personnes en
parcourant des milliers de donneacutees extraites du web mais aussi en provenance de
profils dindividus et dentreprises renseigneacutes par les socieacuteteacutes ou les employeacutes eux-
mecircmes Aussi cohabitent des informations sur des entreprises coteacutees avec des
donneacutees de firmes non coteacutees des fiches de cadres du top management et des
conseils dadministration avec des CV demployeacutes plus fonctionnels
Le franccedilais Ziki 92 utilise aussi des informations collecteacutees sur le web cest une
sorte dannuaire perfectionneacute qui indexe et archive non pas les donneacutees
signaleacutetiques mais les contenus produits par une personne agrave partir du moment ougrave ils
disposent dun flux RSS (billets de blogs photo Flickr favoris Delicioushellip) Ziki ne
permet pas de creacuteer du contenu propre mais agregravege des donneacutees eacutelaboreacutees par un
mecircme individu auparavant eacuteparpilleacutees sur linternet Bref vous ameacuteliorez votre
visibiliteacute et facilitez la recherche de vos productions sur le net en creacuteant un point
unique daccegraves
La recherche sur tous ces reacuteseaux sociaux implique souvent linterrogation
fastidieuse apregraves inscription de plusieurs dizaines de sites
Aussi certains outils 93 proposent une meacutetarecherche en lanccedilant une mecircme
requecircte sur plusieurs services de social networking Stalkerati recherche le nom
dune personne sur les reacuteseaux Friendster et FaceBook Plus complet et ciblant
davantage les reacuteseaux professionnels YoName recherche les noms sur MySpace
LinkedIn Friendster Windows Live Spaces Bebo Digg ou Xanga
Le moteur de recherche de personnes Wink scrute les reacuteseaux sociaux MySpace
Bebo Friendster LinkedIn Live Spaces et autres De plus avec cet outil il est
possible de creacuteer son propre profil et de le connecter agrave des reacuteseaux sociaux
Attention toutefois si vous ecirctes un utilisateur recherchant des donneacutees en franccedilais
la nature des reacutesultats est plutocirct tourneacutee vers le monde anglophone
Ces reacuteseaux sociaux ne sont pas suffisants pour une recherche professionnelle
complegravete A linstar des blogs face agrave la presse traditionnelle ils constituent un
compleacutement inteacuteressant aux bases de donneacutees officielles
copy Digimind Digimind Services ndash White Paper |55
Le Web 20 pour la veille et recherche dinformation DIGIMIND
d Les moteurs de recherche humains
Apregraves ecirctre apparus sur le net agrave la fin des anneacutees 90 les services de questions-
reacuteponses avaient laisseacute la place aux algorithmes tout puissants des moteurs de
recherche de type Google Mais les robots et programmes ont tous besoin dune
intervention humaine pour geacuterer la qualiteacute et la pertinence des reacutesultats
Ainsi tous les grands moteurs majeurs ne font pas confiance agrave leurs seuls
algorithmes Les employeacutes de Yahoo sont mis agrave contribution pour surveiller la
qualiteacute des reacutesultats fournis par le moteur Chez Google et MSN Search des
process deacutevaluation humaine avaient eacuteteacute identifieacutes agrave travers les sites
EvalGooglecom et MSN HRS notamment
La revanche de lhumain
Au-delagrave de ce rating humain sur les reacutesultats de moteurs de recherche de
nombreux services depuis 2 ans mettent agrave disposition des experts en chair et en
os Cest alors un veacuteritable mode collaboratif qui se met en place lorsque le produit
est bien penseacute Cest la cas de Yahoo Answers (Yahoo Questions Reacuteponses en
France) 94 Ce service gratuit de questions reacuteponses lanceacute fin 2005 permet agrave
linternaute de poser une question dans un formulaire Chaque membre de la
communauteacute Yahoo (agrave savoir tout ceux qui disposent dun compte Yahoo) peut
jouer le rocircle dexpert Yahoo propose aussi le service (eacutegalement gratuit) Ask
Yahoo qui propose de reacutepondre agrave vos questions mais cette fois via un groupe
dexperts seacutelectionneacutes par Yahoo Inc Yahoo Answers a certes une orientation
initiale grand public mais des questions un peu techniques voire scientifiques
trouvent reacuteponse En effet parmi tous les contributeurs agrave Yahoo Answers figurent
des meacutetiers et expertises tregraves diverses du fait de son audience importante Il y
cohabite des types de questions varieacutes Quels sont les groupes strateacutegiques de
lindustrie mondiale du jouet Quelles sont les donneacutees eacuteconomiques du marcheacute de
lassurance vie collective en France
Autre point inteacuteressant le service est deacuteployeacute dans de nombreux pays (Etats-Unis
Royaume-Uni Canada Australie Inde Espagne Breacutesil Argentine Mexique Italie
Allemagne Singapour Taiwan Coreacutee du Sud Hong Kong Japon Chinehellip) Aussi il
est possible de localiser certaines questions et de beacuteneacuteficier parfois dune
expertise pays
Lune des raisons du succegraves du service de Yahoo tient au fait de baser les questions
et reacuteponses sur la contribution dinternautes volontaires Chacun participe
constitue un vrai reacuteseau et peut surtout se valoriser en devenant expert dans son
copy Digimind Digimind Services ndash White Paper |56
Le Web 20 pour la veille et recherche dinformation DIGIMIND
domaine de compeacutetences ou sa passion Il est mecircme possible de creacuteer sa propre
communauteacute qui rassemblera vos amis mais aussi vos experts preacutefeacutereacutes qui
reacutepondent agrave vos questions et centres dinteacuterecirct Le pool de reacutepondants nest donc
pas limiteacute agrave une liste restreinte et il sauto-entretient Dautre part les experts
seacutevaluent entre eux et seacutelectionnent parmi une liste si neacutecessaire ce quils
considegraverent comme la meilleure reacuteponse agrave une question
Une question sur Yahoo Answers
Sur ce marcheacute des Questions-Reacuteponses Google a eacutechoueacute notamment parce quil a
seacutepareacute formellement demandeurs et contributeurs limitant ainsi fortement laspect
collaboratif Le Service Google Answers 95 permettait de poser des questions agrave des
experts Mais lagrave ougrave des services concurrents comme Yahoo Answsers Lycos IQ
copy Digimind Digimind Services ndash White Paper |57
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Windows Live QnA96 sont gratuits Google Answers eacutetait un service payant faisant
appel agrave un reacuteseau de 800 experts Aussi Google Answers apregraves 4 ans dactiviteacute a
fermeacute Les questions ne sont deacutesormais plus accepteacutees mais laccegraves aux archives des
questions-reacuteponses est maintenu
Par ailleurs les reacuteseaux sociaux eacutevoqueacutes plus haut ont bien compris la puissance des
communauteacutes pour faire office de speacutecialistes Ainsi avec LinkedIn Answers la
plateforme de reacuteseaux sociaux LinkedIn sest lanceacutee elle aussi dans le service de
QuestionsReacuteponses
Ne pas oublier les services Web 10
Lorsque lon parle de Web 20 on eacutevoque rarement ces services de Questions-
Reacuteponses au profit de sites plus technologiques Pourtant nous sommes ici dans la
logique des bookmarks sociaux partager ses connaissances faire beacuteneacuteficier les
autres de son savoir et en retour profiter de lexpertise de la communauteacute
Comme la plupart des applications Web 2 la seule utilisation des services QR ne
suffit pas Elle doit venir en compleacutement de recherches parallegraveles via dautres outils
Ainsi pour la veille linscription agrave des listes de diffusion permet aussi de poser des
questions agrave des experts ou passionneacutes De plus il subsiste des services dexpert
traditionnels qui sils ne mettent pas laccent sur la collaboration permettent
didentifier des compeacutetences parfois tregraves pointues Certaines ressources
reacutepertorient des milliers dexperts quil faudra ensuite contacter personnellement
pour beacuteneacuteficier de leur conseil Cest le cas du site Expertscom qui identifie des
experts dans des domaines allant de lacoustique agrave la biochimie en passant par
lindustrie peacutetroliegravere97
copy Digimind Digimind Services ndash White Paper |58
Le Web 20 pour la veille et recherche dinformation DIGIMIND
e les moteurs de recherche collaboratifs
Nous lavons vu certains services dactualiteacutes collaboratives proposent des reacutesultats
issus dun mixage entre contribution des internautes et collecte de nouvelles sur le
web Cette approche de mixiteacute se met peu agrave peu en place pour les moteurs de
recherche web En effet les modegraveles algorithmiques ou humains preacutesentent tout 2
leurs limites en terme de pertinence de fiabiliteacute et dexhaustiviteacute
Aussi de plus en plus de projet de moteur mixtes agrave savoir proposant des reacutesultats
web conjointement agrave des reacutesultats etou seacutelections issus dhumains voient le jour
Du web donc mais avec une forte dose de cerveaux humains
Wikiasari
Celui qui fait le plus parler de lui est le projet de Jimmy Wales le co-fondateur de
lencyclopeacutedie Wikipedia Baptiseacute Wikiasari 98 (combinaison de wiki rapide en
hawaiumlen et asari recherche fouilleacutee en japonais) le projet vise agrave creacuteer un outil de
recherche ougrave les internautes pourront influer sur les reacutesultats en notant leur
pertinence etou en en proposant de nouveaux selon leur expertise
Ce type de moteur sinscrit donc agrave lopposeacute doutils comme Google aux algorithmes
automatiques dont les robots sont souvent trompeacutes par des manipulations de
webmasters (spamdexing par exemple)
Cet outil qui devrait voir le jour courant 2007 sappuie sur des infrastructures Open
Source existantes comme Nutch ou Lucent
Cest un projet particuliegraverement inteacuteressant Comme sur lencyclopeacutedie ouverte
Wikipedia ougrave des milliers de contributeurs construisent et alimentent louvrage sur
ce moteur des reacuteseaux de centaines dinternautes pourront apporter leur savoir
pour ameacuteliorer la pertinence des reacutesultats Ce nest plus seulement la puissance de
calcul de machines qui sera mise agrave contribution mais aussi la puissance de la
communauteacute
Derriegravere le projet Wikiasari il y a de gros moyens financiers et humains
lexpeacuterience de la fondation Wikipedia et le potentiel de trafic que pourra apporter
lencyclopeacutedie ouverte Fin 2006 Comscore a en effet classeacute Wikipedia comme le
6egraveme site le plus visiteacute au monde avec 1719 millions de visiteurs uniques au mois
de novembre On peut donc y croire
copy Digimind Digimind Services ndash White Paper |59
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche de sites similaires sur Yoono
Decipho Yoono
Certes lideacutee dun moteur de recherche collaboratif nest pas nouvelle Reacutecemment
on peut citer le lancement du moteur Decipho ou en mars 2006 celui de Yoono
Mecircme si les approches diffegraverent ces outils font tous la part belle agrave lrsquoapport de
chaque utilisateur dans le traitement des reacutesultats
Decipho 99 est un moteur baseacute sur la technologie de Askcom lun des 4 moteurs les
plus utiliseacutes aux USA Linternaute creacuteeacute ses propres cateacutegories de reacutesultats
partageables avec les autres Il peut eacutegalement tagger les reacutesultats afin deacutetiqueter
un site Aussi lors dune requecircte on peut preacuteciser les mots cleacutes classiques avec des
tags On beacuteneacuteficie alors de tous les tags mis en place par la communauteacute des
utilisateurs Un curseur permet de deacutefinir la proportion de cateacutegorisation des
autres utilisateurs agrave prendre en compte dans sa recherche
Le franccedilais Yoono 100 propose une autre deacutemarche encore loutil fonde ses reacutesultats
sur la mutualisation des connaissances des internautes par le partage des favoris Le
copy Digimind Digimind Services ndash White Paper |60
Le Web 20 pour la veille et recherche dinformation DIGIMIND
moteur utilise les favoris que sa communauteacute dutilisateurs a accepteacute de partager
Lors dune requecircte les reacutesultats sont classeacutes par populariteacute agrave savoir selon le
nombre de fois ougrave une page a eacuteteacute mise en favoris par les utilisateurs Une logique
proche de Delicious mais avec Yoono lajout de favoris est automatique De plus
loutil affiche les utilisateurs qui comme vous ont reacutefeacuterenceacute des sites sur la
politique veacuteneacutezuelienne par exemple De cette maniegravere vous pouvez identifier des
passionneacutes ou experts partageant vos domaines de preacutedilections Les reacutesultats ne
sont plus baseacutes sur les seuls algorithmes mais sur lexpeacuterience et la capacitation des
autres utilisateurs
Les initiatives de moteurs collaboratifs plus ou moins inteacuteressantes sont multiples
Foox est un moteur baseacute sur des communauteacutes dinteacuterecirct et sur Webzzle lutilisateur
preacutecise les concepts qui linteacuteressent afin de contextualiser les mots-cleacutes choisis 101
Humains ou algorithmes
Certes le mode collaboratif ne remplacera pas totalement la recherche
algorithmique Les 2 sont compleacutementaires Lune permet dameacuteliorer la pertinence
de prendre en compte des concepts des contextes du sens et non plus simplement
des chaicircnes de caractegraveres Lautre vise lexhaustiviteacute en indexant des milliards de
pages Web Aujourdhui et en attendant le Web seacutemantique ainsi que la recherche
dite naturelle 102 toutes deux grandes quecirctes du monde de linternet seul lapport
de communauteacutes dhumains permet dinjecter un peu de sens agrave une recherche
Mais de son cocircteacute la recherche coopeacuterative comporte bien entendu des risques de
subjectiviteacute
Sur les moteurs de recherche la coopeacuteration peut prendre une autre forme via le
peacuterimeacutetrage des sites agrave interroger la construction dun moteur sur mesure en
quelque sorte Cest la verticalisation de la recherche
copy Digimind Digimind Services ndash White Paper |61
Le Web 20 pour la veille et recherche dinformation DIGIMIND
f La verticalisation par la personnalisation du peacuterimegravetre de recherche
Lune des grandes faiblesses des moteurs de recherche web agrave large eacutechelle (Google
Exalead Yahoo MSNhellip) est le bruit geacuteneacutereacute par certaines requecirctes Lorsque vous
tapez puma le moteur ne sait pas agrave priori si vous vous inteacuteressez aux vecirctements
de sport agrave lanimal ou aux heacutelicoptegraveres Or si vous ne reacutealisez des recherches que
dans laeacuterospatiale vous devrez souvent deacutesambiguiumlser par vos mots cleacutes ce qui
engendre une perte de temps voire de reacutesultats si vos requecirctes deviennent trop
restrictives
Certains moteurs ou meacutetamoteurs clusteacuterisent (cateacutegorisent) les reacutesultats en les
rassemblant par groupes (grappes) dans de petits dossiers Cette deacutemarche avait
eacuteteacute initieacutee par le moteur Northern Light en 1998 Ainsi tous les reacutesultats relatifs aux
chaussures Puma sont regroupeacutes dans une mecircme valise ceux eacutevoquant lanimal
dans une autre Mais cette solution nest pas complegravetement satisfaisante car elle
seffectue agrave posteriori une fois votre requecircte lanceacutee Le bruit nest pas eacutelimineacute mais
simplement circonscrit dans des sortes de cateacutegories poubelle
Pour beacuteneacuteficier dune deacutemarche agrave priori il convient dutiliser des outils de
recherche verticaux cest-agrave-dire speacutecialiseacutes dans un secteur dactiviteacute une fonction
un type dinformation ou de meacutedias
Face aux problegravemes de pertinence des moteurs geacuteneacuteralistes de plus en plus de
moteurs verticaux voient le jour Ainsi le seul domaine meacutedical a vu apparaicirctre ces
20 derniers mois les moteurs SearchMedica Medstory MedWorm ou encore Medgle 103
Mais si votre secteur de preacutedilection nest pas couvert par un moteur speacutecialiseacute
Cest lagrave quintervient un autre type de moteur collaboratif agrave qui lon peut indiquer le
peacuterimegravetre des sites sur lesquels effectuer la recherche Sur les moteurs classiques
les algorithmes peuvent placer en prioriteacute des reacutesultats sans inteacuterecirct pour vous A
force de navigation et de veille dans votre secteur vous connaissez certainement
10 20 100 sites que vous jugez incontournables et indispensables pour vos
recherches
2 solutions techniques existent
- les outils agrave peacuterimegravetre de recherche personnalisable (adaptable scope)
Ils utilisent les index des moteurs geacuteneacuteralistes (Yahoo ou Google) et restreignent le
scope de leur recherche aux pages des sites que vous avez choisis Ainsi des outils
comme Rollyo Swicki Yahoo Search Builder Google Custom Search 104 vous
demandent dindiquer une liste de sites sur lesquels vous allez limiter votre
recherche Lors dune requecircte les reacutesultats proviendront uniquement des sites de
votre choix Pratique
copy Digimind Digimind Services ndash White Paper |62
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Mais ces outils preacutesentent une limite de taille ils ne prennent en compte que les
pages indexeacutees par Google ou Yahoo Conseacutequence si la reacuteponse pertinente agrave
votre requecircte figure au sein dune page non indexeacutee par le moteur geacuteneacuteraliste vous
nobtenez pas de reacutesultats
De plus en ninterrogeant que lindex dun ou 2 moteurs vous manquerez
obligatoirement de nombreuses informations puisque le nombre de reacutesultats
communs entre les moteurs diminue constamment105
Les pages non indexeacutees par les moteurs geacuteneacuteralistes constituent une part du web
invisible106 et sont plus nombreuses que lon ne croit Ainsi si jinterroge le moteur
interne du site de la prestigieuse revue scientifique The Lancet 107 avec la requecircte
Diabetes jobtiens plus de 2800 reacutesultats Si jeffectue cette mecircme requecircte sur
Google en restreignant ma recherche au site The Lancet (via la syntaxe
sitehttpwwwthelancetcom) jobtienshellip1 reacutesultat Sur Yahoo Search guegravere
mieux 9 reacutesultats Pourquoi Parce que les technologies de ces moteurs ne
permettent pas dindexer correctement tous les sites
La constitution de bouquets de moteurs speacutecialiseacutes sur Digimind Finder
- les outils agrave moteurs personnalisables
La solution pour beacuteneacuteficier des reacutesultats de moteurs internes non indexeacutes par des
Google ou Yahoo est dutiliser un outil permettant dexploiter directement les
moteurs des sites qui vous inteacuteressent et ce sans avoir agrave passer par les index de
moteurs geacuteneacuteralistes Cest le cas du Finder108 mis au point par Digimind un
copy Digimind Digimind Services ndash White Paper |63
Le Web 20 pour la veille et recherche dinformation DIGIMIND
meacutetamoteur qui permet de plugger nimporte quel moteur de son choix et de
linterroger ensuite Il est donc alors simple de se constituer des bouquets de
moteurs speacutecialiseacutes dans votre secteur dactiviteacute De plus cet outil indexe en temps
reacuteel les reacutesultats et les documents retourneacutes par les moteurs interrogeacutes Cela
permet daffiner ensuite vos reacutesultats en interrogeant cet index au contenu
speacutecialiseacute via une recherche avanceacutee Avec le Finder cest donc lutilisateur final qui
constitue sa propre seacutelection de moteurs
copy Digimind Digimind Services ndash White Paper |64
Le Web 20 pour la veille et recherche dinformation DIGIMIND
g Lenrichissement de bases de donneacutees faccedilon Web20
Nous avons vu que les bookmarks sociaux permettaient de mutualiser les
ressources et pour certains autour de communauteacutes deacutedieacutees comme les
scientifiques Avant lapparition des applications Web 20 ont eacuteteacute constitueacutees de
nombreuses bases de donneacutees professionnelles Celles-ci jusquici noffraient pas
aux groupes dutilisateurs la possibiliteacute dinteragir de commenter et deacutechanger
Aussi de plus en plus de grandes bases de donneacutees se dotent dinterfaces
collaboratives et ergonomiques pour laisser plus de place agrave la contribution
PubMed
Cest le cas de lune des plus grandes bases du domaine meacutedical PubMed 109 Cette
immense base bibliographique a vu naicirctre deux initiatives110 pour ameacuteliorer son
interface de recherche
- Avec PubMed Interact la recherche integravegre de lAjax et permet de pondeacuterer via
des curseurs les critegraveres de sources dancienneteacute de nombre de reacutesultats de date
de publication de liens avec le mapping du MeSH (le theacutesaurus de la base) de
filtrage via des cateacutegories Vous pouvez ensuite annoter et attribuer une note de
pertinence agrave vos reacutesultats afficher labstract des articles ou leur texte complet
supprimer des reacutesultats ou encore afficher les articles lieacutes On retrouve donc
lessentiel des fonctionnaliteacutes de lactuel PubMed mais avec une convivialiteacute et
ergonomie Web 20 et donc une plus grande accessibiliteacute
-Hubmed est une autre interface alternative qui ajoute des fonctionnaliteacutes agrave PubMed
application de ses propres tags aux reacutesultats de recherche historique des recherches
clusteacuterisation des reacutesultats visualisation sous forme graphique creacuteation simplifieacutee
de fils RSS avec les mots de votre requecircte suggestion de termes connexes
visualisation de vos mots cleacutes dans larborescence Mesh Le tout est deacuteveloppeacute en
Ajax notamment permettant une navigation plus fluide et plus rapide Parmi toutes
ces fonctions la possibiliteacute de tagger les reacutesultats est tregraves novatrice on peut ainsi se
deacutepartir de la taxonomie de la base via sa propre folksonomie
copy Digimind Digimind Services ndash White Paper |65
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les nombreux reacuteglages de filtres sur linterface PubMed Interact
LUSPTO
LUSPTO 111 est la base des brevets ameacutericains (United States Patent and Trademark
Office)
Cette veacuteneacuterable institution a en projet une plateforme de brevets sociale agrave la
maniegravere dun Digg (cf les services dactualiteacutes collaboratives) les internautes
pourront commenter les brevets en ligne et les eacutevaluer via un systegraveme de notation
Les brevets les mieux noteacutes remonteront alors en haut de classement
copy Digimind Digimind Services ndash White Paper |66
Le Web 20 pour la veille et recherche dinformation DIGIMIND
h Conserver et exploiter lhistorique de vos recherches et navigations
Le chercheur dinformation sur le net perd souvent ses nerfs quand il ne retrouve
plus ce quil a deacutejagrave collecteacute quelque semaines auparavant ou lorsquil lui est
impossible de se souvenir quelle requecircte agrave geacuteneacutereacute ce fameux reacutesultat remarquable
cette veacuteritable peacutepitehellip
Google a reacutesolu partiellement ces problegravemes de meacutemoire Mais comme souvent
cela ne va pas sans certains sacrifices
Via son service Historique Web112 (ex Historique de recherche) vous pouvez apregraves
enregistrement gratuit
- meacutemoriser les requecirctes effectueacutees sur le moteur ainsi que les reacutesultats cliqueacutes
- enregistrer votre navigation sur les pages web
Il est alors possible deffectuer des requecirctes sur et agrave linteacuterieur des pages que vous
avez visiteacutees dans le passeacute (sur le texte les images les videacuteos)
Google affiche donc deacutesormais vos requecirctes la date et lheure de la recherche les
reacutesultats cliqueacutes mais aussi les reacutesultats de recherches qui nrsquoont pas geacuteneacutereacute de clics
Par ailleurs ce service va encore plus loin dans la personnalisation et lanalyse de
votre recherche
Avec la fonction Tendances saffichent vos requecirctes les plus courantes vos sites les
plus visiteacutes les reacutesultats que vous avez le plus cliqueacutes
Plus puissante la fonction Eleacutements inteacuteressants ougrave Google vous propose des
requecirctes et des pages web en relation avec vos habitudes de recherche113
En outre si vous activez cet historique Google lutilisera aussi pour agrave moyen
terme personnaliser vos recherches en fonction de vos centres dinteacuterecirct Le
moteur explique
Vos reacutesultats personnaliseacutes seront baseacutes sur vos recherches preacuteceacutedentes ainsi que les
reacutesultats de recherche et les titres agrave la une sur lesquels vous avez cliqueacute
Dans les premiers temps la diffeacuterence ne sera peut-ecirctre pas notable mais agrave mesure
que votre historique de recherches seacutetoffera les reacutesultats obtenus seront de plus en plus
personnaliseacutes
Dailleurs si vous reacutealisez de nombreuses recherches sur Google avec une
connexion agrave votre compte Google activeacutee vous devriez voir safficher de temps agrave
autre ce type de message Nouveau activez votre historique de recherche pour
personnaliser vos reacutesultats
copy Digimind Digimind Services ndash White Paper |67
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ces reacutesultats personnaliseacutes apprenant selon vos inteacuterecircts permettent de reacutepondre
en partie agrave la probleacutematique de deacutesambiguiumlsation lors de requecirctes sur des
homonymes Ce sont les exemples classiques de lavocat (fruit ou juriste ) de
jaguar (voiture ou animal ) ou de puma (articles de sports animal ou heacutelicoptegravere
)
Cocircteacute vie priveacutee tout votre surf part sur les serveurs de Google Aussi vous
pouvez (devez) mettre en pause lenregistrement de votre navigation lorsque cela
vous apparaicirct adeacutequat
Lhistorique de vos requecirctes et de vos reacutesultats sur Google
copy Digimind Digimind Services ndash White Paper |68
Le Web 20 pour la veille et recherche dinformation DIGIMIND
i Les mash-up
Les mash-up sont certainement les nouveauteacutes engendreacutees par les technologies
dites Web 20 les plus spectaculaires Mixage de plusieurs applications provenant
de plusieurs sites (souvent deux) ils permettent de creacuteer un service nouveau et ce
agrave partir de la mise en relation voire du croisement des donneacutees des applications
dorigines En franccedilais Wikipedia parle dapplications composites 114 Ainsi en
mixant la liste des socieacuteteacutes ougrave il fait bon travailler eacutetablie par le magazine Fortune et
une carte des USA issue de Google Maps on obtient une carte qui localise toutes
ces entreprises De mecircme si on meacutelange les donneacutees dun site de meacuteteacuteo agrave une
carte de France le reacutesultat est une carte des tempeacuteratures et des neacutebulositeacutes en
quasi temps reacuteel 115
Concregravetement comment cela fonctionne-t-il Chacune des applications
communique et eacutechange des informations via des API (voir glossaire) Ainsi Yahoo
Maps ou Google Maps ont ouvert leurs interfaces de programmation agrave tous les
deacuteveloppeurs
Les exemples sont tregraves nombreux car les Mashups ont rapidement connu un vif
succegraves aupregraves des deacuteveloppeurs et internautes avertis qui parviennent agrave maicirctriser le
code et les API Les Mashups de cartographie ne sont pas les seules possibiliteacutes mais
ce sont les plus freacutequents tant la geacuteolocalisation est attrayante pour les
professionnels comme pour linternaute novice Nous allons explorer quelques
mashups pour mieux comprendre leur inteacuterecirct
Les mashups cartographiques les plus courants mixent des cartes et des donneacutees
provenant de services sociaux comme Flickr le service de partage de photo de
Yahoo Inc Cest le cas de Tagmaps116 qui affiche en temps reacuteel sur une carte les tags
associeacutes aux photos de lieux mise en ligne sur Flickr Le Mashup Flickrvision 117 fait
encore plus simple il affiche les photos agrave lemplacement de la ville dorigine de
linternaute qui a posteacute limage lagrave aussi en temps reacuteel
Donneacutees statiques et temps reacuteel
Au-delagrave de certains mixages un peu gadget certains Mashups sont vraiment
inteacuteressants pour la surveillance de donneacutees ou la collecte dinformations En effet
on peut trouver deux grands types de visualisation celle de donneacutees statiques (une
liste dadresse dentreprises geacuteolocaliseacutees) et celle dinformations eacutevoluant en
temps reacuteel Cest le cas par exemple du Mashup SpaceCraft Tracking 118 qui permet
copy Digimind Digimind Services ndash White Paper |69
Le Web 20 pour la veille et recherche dinformation DIGIMIND
de visualiser la trajectoire sur le globe terrestre de la navette spatiale ou du
teacutelescope Hubble
Souvent le Mashup exploite des donneacutees de reacutepertoires douvrages de services
publics pour les rendre plus compreacutehensives attrayantes bref plus accessibles 119
- HealthMap rassemble des donneacutees de santeacute publique et des actualiteacutes issues de
plusieurs sources (Google News OMS European Centre for Disease Prevention and
Controlhellip) afin de reacutealiser une carte des maladies infectieuses dans le monde Cette
carte se met agrave jour au fur et agrave mesure de lactualisation des informations
Linteractiviteacute permet de zoomer sur un pays et de seacutelectionner des pathologies en
particulier
-BioDiesel Station Maps affiche sur une carte les stations services ameacutericaines qui
deacutelivrent des biocarburants
-Kartametro superpose le reacuteseau du meacutetro moscovite agrave la carte de la ville On y
visualise aussi les correspondances avec les bus
-Wikimapia mixe les informations relatives agrave des lieux de Wikipedia agrave une carte
Google Maps Reacutesultat la plupart des noms de villes sites ou monuments sont
cliquables et pointent vers les articles de lencyclopeacutedie
Le Mashup HealthMap ici des actualiteacutes sur les maladies infectieuses en Asie geacuteolocaliseacutees
copy Digimind Digimind Services ndash White Paper |70
Le Web 20 pour la veille et recherche dinformation DIGIMIND
-GlobaI Incident Maps affiche sur un planisphegravere les eacuteveacutenements lieacutes au terrorisme
ou les risques agrave partir des informations de sites speacutecialiseacutees mises agrave jour en continu
-Enfin un parfait exemple de visualisation et de surveillance deacuteveacutenements en temps
reacuteel DartMaps indique lemplacement des trains de banlieue de Dublin
Mais certains Mashup en minoriteacute certes nexploitent pas de donneacutees
cartographiques Cest le cas de Delexaorg 120 un outil qui mixe les bookmarks
sociaux de Delicious aux donneacutees statistiques dAlexa Delexa va en effet afficher les
tags de Delicious associeacutes aux statistiques de freacutequentation des 50 000 premiers
sites web US fournis par Alexa (agrave partir des donneacutees transmises par les barres
doutils Alexa installeacutees par les internautes) Un tel outil est inteacuteressant notamment
pour se familiariser avec les tags et Delicious mais surtout pour deacutecouvrir quels
sont les sites dinfluence et populaires dans un secteur On peut eacutegalement observer
la correacutelation ou non entre nombre de tags et donneacutees de freacutequentation Alexa
Cocircteacute moteur de recherche les mashups Molu et Gnosh fournissent des
meacutetamoteurs reacutealiseacutes agrave partir du mixage de dizaines doutils de recherche121
Des ressources
Comment trouver des mashups Comme pour de nombreuses informations sur le
web des annuaires speacutecialiseacutes 122 sont apparus Ils reacutepertorient aussi bien des API agrave
destination des deacuteveloppeurs que des mashups WebMashup auto-proclameacute Open
Directory for Mashups et Web 20 APIs en liste des centaines ProgrammableWeb
lun de sites de reacutefeacuterence dans le domaine en propose plus de 1800 sous la forme
dun reacutepertoire et eacutegalement dune matrice permettant de visualiser clairement le
croisement de deux applications ou plus Mashup Feed liste aussi des mixages
populaires
Des blogs sont eacutegalement centreacutes sur ces pratiques Google Maps Mania123 recense
de nombreux Mashups cartographiques
Ces Mashups sont un beau symbole de ce web nouvelle geacuteneacuteration on ne lit plus
seulement de linformation statique de maniegravere passive Deacutesormais on est agrave la fois
fournisseur et spectateur en temps reacuteel des contributions de communauteacutes Le tout
copy Digimind Digimind Services ndash White Paper |71
Le Web 20 pour la veille et recherche dinformation DIGIMIND
gracircce agrave des interfaces reacutealiseacutees par des deacuteveloppeurs agrave partir de code ouverts de
grandes socieacuteteacutes Le succegraves est notamment provoqueacute par la possibiliteacute de mixage
entre des donneacutees du monde reacuteel et des informations ou fichiers posteacutes sur le net
Les internautes peuvent donc maintenant se rassembler par centres dinteacuterecirct mais
eacutegalement par proximiteacute geacuteographique Je recherche un speacutecialiste de linformation
sur les biocarburants situeacutes agrave moins de 10 km de chez moi
Par ailleurs on peut imaginer agrave terme des applications meacutelangeant les donneacutees de
centaines de fichiers et bases de donneacutees On en est certes aux preacutemisses mais le
mashup Alkemis 124 en est deacutejagrave un bon exemple il affiche sur une carte de New
York des donneacutees provenant dA9 OpenSearch Delicious Flickr Google Maps et
Yahoo Traffic Reacutesultat la possibiliteacute de visualiser en une seule interface un eacutetat du
trafic routier via des cameacuteras de surveillance la meacuteteacuteo les actualiteacutes locales ou les
liens Delicious en rapport avec la villehellip
copy Digimind Digimind Services ndash White Paper |72
Le Web 20 pour la veille et recherche dinformation DIGIMIND
III Diffuser
Avec lapparition des applications collaboratives et des plateformes de blogs la
faciliteacute de publication sur le web sest accrue Tout individu mecircme sans
connaissances techniques peut publier et diffuser son propre contenu sur un blog
un wiki et via des fils RSS
a Les Blogs et le flux RSS
Il suffit de 5 minutes pour sinscrire agrave une plateforme de blogs et commencer agrave
eacutecrire Ces plateformes proposent des services de bases gratuits et des
fonctionnaliteacutes plus avanceacutees neacutecessitant un abonnement Ces services qui
permettent de creacuteer maintenir et heacuteberger votre blog sont nombreux Parmi les
prestataires de qualiteacute on peut citer Blogger (qui appartient agrave Google) TypePad et
Vox (de la socieacuteteacute SixApart) Overblog Viablog Haut et Fort ou BlogSpirit 125 Bien
dautres socieacuteteacutes proposent des services de creacuteation et dheacutebergement126 Des
comparatifs sont disponibles en ligne127
Nous lavons vu le format RSS permet de diffuser tregraves facilement le contenu de son
blog utilisant le XML (un html eacutepureacute) langage natif du blog chaque carnet web
comporte un fils RSS permettant aux visiteurs de sabonner agrave vote blog et de
recevoir instantaneacutement toute nouvelle publication actualiteacutes billets podcast ou
videacuteos Par ailleurs des services comme Feedburner128 permettent de rendre
compatibles vos flux RSS avec la majoriteacute des lecteurs RSS outils dont nous
reparlerons plus loin
La creacuteation de sites internet classiques sest elle aussi consideacuterablement simplifieacutee
un outil tel que Google Page Creator129 permet de creacuteer un site simple en 1 heure
Des sites plus sophistiqueacutes sont eacutegalement abordables sans avoir agrave connaicirctre une
ligne de programmation de html gracircce au perfectionnement des eacutediteurs dits
WYSIWYG ce que vous voyez quand vous construisez votre page est ce que vous
obtiendrez en ligne
Les outils Web 20 permettent agrave des speacutecialistes journalistes ou salarieacutes de diffuser
leur contenu Il y a encore 2 ans ils eacutetaient pour la plupart eacutecarteacutes de la publication
web faute de bagage technique
copy Digimind Digimind Services ndash White Paper |73
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Depuis le deacuteveloppement des blogs agrave partir de lautomne 2001 il est possible pour
tout internaute de diffuser sa propre information Au-delagrave des blogs dadolescents
et autres carnets intimes le web regorge de blogs agrave tendance professionnelle
corporate produits marketing experts politiques ressources humaines Cest
autant de sources potentielles quil faut exploiter afin de capter des sources
primaires de qualiteacute Le volume des blogs publieacutes et maintenus chaque jour est lui
aussi en constante augmentation
Le White Paper Blogs et RSS des outils pour la veille strateacutegique deacuteveloppe les
aspects inteacuteressants des blogs pour le professionnel de linformation130
b Les Wikis
Le wiki est finalement diffeacuterent du blog de par sa nature et son utilisation Selon
Wikipedia le Wiki est un site Web dynamique permettant agrave tout individu den
modifier les pages agrave volonteacute Il permet de communiquer et diffuser des informations
rapidement de structurer cette information pour permettre dy naviguer
commodeacutement (Wiki vient du terme hawaiien wiki wiki =rapide ou informel)
Lagrave ougrave le blog sera adapteacute agrave la diffusion dactualiteacute et de contenu se renouvelant
freacutequemment le wiki sera davantage deacutedieacute agrave du texte plus statique mais neacutecessitant
ou pouvant senrichir de la collaboration de plusieurs personnes Ainsi les articles
dune encyclopeacutedie ou les fiches correspondants aux diffeacuterentes phases dun projet
impliquant de nombreux collaborateurs pourront ecirctre reacutealiseacutees sous forme de
Wiki
Sur un blog laffichage du contenu est anteacute-chronologique (le plus reacutecent en haut)
sur un wiki il est structureacute en rubriques larchitecture comme le contenu pouvant
ecirctre modifieacutes agrave tout moment par les participants Ceux-ci peuvent beacuteneacuteficier de
droits daccegraves et de modification hieacuterarchiseacutes
Les versions anteacuterieures ainsi que les modifications sont accessibles via une rubrique
Historique Sur un blog le visiteur peut collaborer mais uniquement via ses
commentaires Sur un wiki tout collaborateur autoriseacute peut modifier le texte
comme le titre et lorganisation des rubriques
Par ailleurs la prise en main dun wiki et de ses syntaxes denrichissement et
modification demande un peu de pratique et nest pas aussi simple que le
maniement dun blog Le wiki est un des outils ideacuteaux pour la gestion de projet
Certaines entreprises les utilisent en tant que tel (parfois en parallegravele avec les blogs)
pour eacuteviter des eacutechanges des recherches et un archivage via les mails fastidieux
copy Digimind Digimind Services ndash White Paper |74
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Geacutereacute via des droits daccegraves gradueacutes il peut alors se reacuteveacuteler comme un outil tregraves
simple agrave manier et agrave sapproprier Ces wikis seront eacutevidemment reacuteserveacutes agrave
lentreprise en accegraves priveacute
Exemples de wikis publics
gt Wikipedia131
Le wiki le plus connu est Wikipedia lencyclopeacutedie collaborative gratuite dont le
contenu est creacuteeacute et maintenu par des milliers dinternautes beacuteneacutevoles Chacun est
libre de creacuteer un article modifier ceux des autres ou les commenter En mai 2007
lencyclopeacutedie proposait plus de 7 millions darticles dans 192 langues et dialectes
dont plus de 500 000 en franccedilais Wikipedia jouit dune populariteacute et dun succegraves
tregraves important Google indexe de nombreux articles de Wikipedia agrave tel point quil
est rare deffectuer une recherche sur le moteur sans voir safficher une deacutefinition
issue de lencyclopeacutedie Selon la socieacuteteacute de mesure daudience Comscore en janvier
2007 Wikipedia eacutetait le 9egraveme site US le plus visiteacute (derriegravere les sites Yahoo
premiers puis les sites Time Warner Microsoft Google eBay Fox Interactive
Amazon et Ask) 6 groupes eacuteditant un moteur geacuteneacuteraliste (Google Ask Microsoft
Yahoo Amazon et AOL) occupent le top10 US Mais cest la premiegravere fois quun
site collaboratif truste les premiegraveres places des sites les plus visiteacutes
Wikipedia comme tout service leader est tregraves critiqueacute Notamment sur la
possibiliteacute pour tout un chacun de modifier et de creacuteer des articles pouvant
entraicircner des risques de diffamation ou de vandalisation 132 Mecircme si ces risques
sont reacuteels nous le verrons dans la partie consacreacutee aux limites du Web 20 il ne
faut pas pour autant se focaliser sur ces problegravemes
Par ailleurs on a souvent mis en cause la qualiteacute des articles du contenu eacutemanant
dinternautes pas forceacutement qualifieacutes ou experts et donc par nature douteux Or
une eacutetude commandeacutee par la Revue Nature agrave remis en cause ce type de ressenti
des experts ont compareacute 42 documents publieacutes sur Wikipedia et sur la ceacutelegravebre
Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche133
Seulement 8 erreurs seacuterieuses comme des mauvaises interpreacutetations de concepts
ont eacuteteacute repeacutereacutees dans les articles analyseacutes 4 pour chaque encyclopeacutedie Des
erreurs factuelles omissions ou fausses descriptions ont eacutegalement eacuteteacute deacutetecteacutees
162 dans Wikipedia et 123 dans lEncyclopaedia Britannica
Le succegraves et limportance de Wikipedia nont pas eacutechappeacute aux moteurs de
recherche qui sont plusieurs agrave secirctre speacutecialiseacutes dans la recherche sur lencyclopeacutedie
Ainsi WikiSeek 134 est un moteur lanceacute deacutebut 2007 qui recherche sur le contenu de
Wikipedia Il indexe le contenu en crawlant les pages en profondeur et aspire
eacutegalement le contenu des liens preacutesents sur les pages de lencyclopeacutedie
copy Digimind Digimind Services ndash White Paper |75
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Plus eacutelaboreacute le moteur franccedilais Exalead 135 enrichit consideacuterablement la recherche
dans lencyclopeacutedie en ligne Cette fonctionnaliteacute est accessible en cliquant sur
longlet Wikipedia Il est eacutevidemment possible de rechercher des articles par mots
cleacutes mais aussi daffiner par langue via le nuage de tags dynamique ( les eacutetiquettes
correspondent agrave des emplacements geacuteographiques personnes ceacutelegravebres noms
drsquoorganisations termes lieacutes agrave votre requecircte ou cateacutegories de Wikipedia)
WikiMindmap 136 recherche sur Wikipedia et affiche les reacutesultats sous forme de
MindMap (cartes heuristiques) Il est alors possible de naviguer dans larborescence
des termes
WikiMindMap
gt Citizendium 137 Lanceacute fin 2006 Citizendium est une initiative de Larry Sanger co-fondateur de
Wikipedia avec Jimmy Wales Citizendium est eacutegalement une encyclopeacutedie Mais
jugeant la communauteacute Wikipedia senseacutee srsquoauto-reacuteguler dysfonctionnelle Larry
Singer integravegre dans Citizendium des proceacutedures de seacutelection des articles par des
experts et refuse aux contributeurs la possibiliteacute de lrsquoanonymat misant ainsi sur la
responsabilisation Le collegravege dexperts a le dernier mot concernant la veacuterification
des articles le but eacutetant dobtenir une encyclopeacutedie contenant le moins derreurs
possible Citizendium est structureacutee en grandes cateacutegories acadeacutemiques
correspondant agrave des groupes de travail Sciences naturelles Sciences Humaines
Arts Sciences Humaines Divertissement Arts appliqueacutes et Sciences
copy Digimind Digimind Services ndash White Paper |76
Le Web 20 pour la veille et recherche dinformation DIGIMIND
gt Alacrawiki 138
AlacraWiki est un guide deacutedieacute aux socieacuteteacutes du secteur de linformation eacutediteurs et
bases de donneacutees La rubrique Alacra Industry Spotlights est particuliegraverement
remarquable elle fournit des analyses et commentaires sur les sites dinteacuterecirct pour
une trentaine de secteurs industriels Le wiki offre des informations sur les
agreacutegateurs de contenu les bases de donneacutees et les meilleurs blogs deacutedieacutes au
secteur de linformation on-line Alacra propose aussi un blog et un fils RSS
Alacra Wiki
gt Les fils RSS 139
Sur cette page de wiki vous trouverez agrave peu pregraves tout sur le RSS
La norme comment utiliser les fils RSS des articles une seacutelection dagreacutegateurs
mixer des fils RSS entre eux mesurer lactiviteacute des fils RSS creacuteer un fil RSS
gtWikidweb 140
Wikidweb est un Wiki qui propose un reacutepertoire de sites web (et non de wikis)
Aussi vous pouvez y participer selon les fonctionnaliteacutes courantes du format wiki
vous avez ainsi la possibiliteacute dy ajouter vos propres sites mais eacutegalement de
modifier les entreacutees des autres internautes (urls texte) ou de les commenter
copy Digimind Digimind Services ndash White Paper |77
Le Web 20 pour la veille et recherche dinformation DIGIMIND
IV Surveiller
Nous lavons vu dans la partie Recherche de blogs et de flux RSS les flux RSS sont
preacutesents sur de nombreux formats du net et vont permettre de surveiller les
nouveauteacutes apparaissant sur les blogs les sites corporate les sites de presse dans
les reacutesultats de moteurs de recherche dactualiteacutes de blogs web dans les
newsgroups sur certains forums web sur certaines listes de diffusion les
bookmarks sociaux les sites de partage de photos et de videacuteoshellipbref sur de tregraves
nombreux sites classiques et ressources collaboratives de type 20
Ces flux RSS peuvent ecirctre inteacutegreacutes agrave votre process de veille en deux clics via des
outils simples gratuits ou payants mais plus puissants
a La deacutetection du flux RSS
Pour pouvoir mettre en surveillance le flux RSS (RSS Feed en anglais) il faut dabord
le trouver Or il nest pas toujours aiseacute de mettre la main sur ces petits logos
oranges ou les liens RSS Abonnez-vous Syndiquez ce flux qui pointent vers les
flux RSS parfois cacheacutes dans les meacuteandres des pages web
Des icocircnes signalant la preacutesence de flux RSS
Certains navigateurs permettent de deacutetecter automatiquement les flux lorsquils
sont preacutesents sur une page web Une icocircne vous avertira alors et dans la plupart
des cas affichera ladresse du ou des flux disponibles sur la page Plusieurs formats
de flux peuvent coexister les diffeacuterentes versions du RSS (090 091 092 10 20)
et le format ATOM concurrent mais offrant les mecircmes fonctionnaliteacutes
Internet Explorer 7 Opera Firefox permettent de deacutetecter les flux Cest aussi le cas
de Maxthon une puissante interface de navigation qui vient se greffer sur
larchitecture dInternet Explorer 141
copy Digimind Digimind Services ndash White Paper |78
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b La mise en surveillance
Quelque soit laspect de la page qui contient votre flux RSS (xml rdf interface
Feedburner) il convient de copier et coller ladresse (url) dans loutil qui va vous
servir agrave lire ce flux et agrave ecirctre alerteacute degraves lors quune nouveauteacute apparaicirct
4 grands types doutils peuvent ecirctre utiliseacutes (du plus simple au plus sophistiqueacute)
- Les navigateurs web
Les navigateurs citeacutes preacuteceacutedemment outre la deacutetection du flux RSS permettent de
sy abonner et de les lire Les flux sintegravegrent alors dans un menu lateacuteral ou dans la
page principale Cest simple mais deacutepourvu de fonctions avanceacutees de tri ou
dorganisation
- Les lecteurs (ou agreacutegateurs) de flux RSS
Ce sont les outils deacutedieacutes aux fils RSS Comme de nombreuses applications ces
lecteurs sont soit disponibles en ligne soit agrave installer localement sur votre PC
- Exemples de lecteurs RSS en ligne Bloglines Pluck Newsgator
- Exemples de lecteurs RSS installeacutes RSS Reader Amphetadesk Newsgator (sintegravegre
agrave Outlook) FeedDemon
Le lecteur Bloglines exploite de maniegravere astucieuse la logique communautaire
lorsque vous ecirctes abonneacute agrave un flux RSS vous pouvez visualiser les autres abonneacutes
(ceux qui ont accepteacute de rendre leur abonnement public) Un clic sur leur nom
affiche tous les fils RSS auxquels ils ont souscrits un moyen rapide de deacutecouvrir
dautres ressources pertinentes collecteacutees par des internautes proches de vos
centres dinteacuterecirct
Les lecteurs RSS sont tregraves nombreux Pour mieux les distinguer certains blogs ou
sites proposent des comparatifs142
copy Digimind Digimind Services ndash White Paper |79
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La communauteacute sur Bloglines les abonneacutes au flux RSS du blog Voip Weblog
- Les pages personnalisables
Ce sont des pages web geacuteneacuteralement organiseacutees en onglets et boicirctes permettant
dorganiser et de ranger ses flux par cateacutegories et ce dans un mecircme espace Ces
services sont ergonomiques et ideacuteaux pour lire dun coup doeil le maximum de flux
Les plus connus sont NetVibes PageFlakes ou Webwag
Outre la lecture de flux RSS ces pages offrent la possibiliteacute dinteacutegrer des services
de meacuteteacuteo mail bloc-notes et des flux provenant de service sociaux comme les
bookmarks ou les reacuteseaux damis
Certains blogs fournissent des listes et comparatifs de ces services143
- Les progiciels de veille inteacutegreacutes
Face agrave labondance des flux RSS et blogs des applications de veille inteacutegreacutee comme
Digimind Evolution 144 donnent la possibiliteacute de filtrer les RSS via lapplication de
requecirctes diffeacuterentes sur chaque fils RSS
On peut ainsi seacutelectionner les informations agrave remonter via des requecircte simples ou
plus complexes (booleacuteens parenthegraveses troncatures et opeacuterateurs de proximiteacute) agrave
longueur illimiteacutee En outre il est possible de surveiller jusquagrave 10 000 flux RSS
quotidiennement
Les boutons inteacutegreacutes
Certains sites vont vous simplifier la tacircche ils affichent sur leurs pages agrave coteacute de
leurs flux des boutons qui permettent dajouter directement le flux agrave votre lecteur
copy Digimind Digimind Services ndash White Paper |80
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ainsi le service dactualiteacutes Wikio ou le moteur Ask Blogs amp Flux proposent tous
deux des boutons vers Bloglines MyYahoo Google Reader Newsgator et Ask Blog
Les fichiers OPML
LOPML (Outline Processor Markup Language) est un format deacuteveloppeacute en XML qui
permet leacutechange dinformations structureacutees entre applications fonctionnant sur des
OS et environnement diffeacuterents Exemple les abonnements dun internaute agrave un
ensemble de flux RSS entre un navigateur Firefox et Internet Explorer de MacOS agrave
Windows XP
Des agreacutegateurs RSS comme Bloglines NewsGator ou Rojo offrent la possibiliteacute
dexporter lensemble de vos flux RSS favoris ou ceux dautres abonneacutes au format
OPML pour les importer ensuite dans votre agreacutegateur
Share your OPML145 est comme son nom lindique un portail qui vous permet de
partager vos flux RSS au format OPML Ce service liste des centaines de fichiers
OPML
c Pourquoi une veille via le RSS
Faire une veille via les fils RSS preacutesente des inteacuterecircts notables
- Lhyper-segmentation le choix des fils RSS rend possible une seacutelection fine de
linformation Ainsi sur le site du Figaro on peut choisir lactualiteacute internationale
nationale les sciences et meacutedecine eacutevitant ainsi decirctre submergeacute par linformation
superflue Sur La Tribune on peut seacutelectionner un flux par socieacuteteacute
Certains blogs proposent mecircme des flux RSS permettant aux choix de surveiller les
commentaires ou uniquement les billets
- Un gain de temps inutile de se connecter au site au blog ou au moteur de
recherche pour visualiser ses nouveauteacutes
- Lanonymat labonnement agrave un flux RSS contrairement agrave une newsletter ou agrave une
liste de diffusion est anonyme
- La consultation aiseacutee vos fils RSS via une lecture sur un agreacutegateur en ligne sont
accessibles de nimporte quel PC connecteacute agrave linternet ougrave que vous soyez
copy Digimind Digimind Services ndash White Paper |81
Le Web 2
copy Digimin
0 pour la veille et recherche dinformation DIGIMIND
d Digimind Services ndash White Paper
V Carte des outils et ressources Web 20
gt Page suivante
|82
wwwdigimindcom Digimind Services ndash White Paper|83
Carte des outils et ressources Web 20 - DIGIMIND Services 2007
Le Web 20 pour la veille et recherche dinformation DIGIMIND
EXEMPLE DUNE RECHERCHE ET VEILLE VIA LE WEB 20
Cas drsquoeacutecole Nous avons agrave mener une recherche et une veille sur le
deacuteveloppement des smartphones ou teacuteleacutephones multimeacutedias haut de gamme Des
sites de type 20 pourront se reacuteveacuteler compleacutementaires de sites classiques (sites
drsquoentreprises portails associations professionnelleshellip) pour deacutetecter les tendances
et sujets eacutemergents
Une premiegravere recherche via lrsquoencyclopeacutedie Wikipedia permettra drsquoobtenir une
premiegravere deacutefinition du sujet et drsquoidentifier les principaux mots cleacutes ainsi que des
liens vers des sites pertinents
Etape suivante nous pourrons eacutelargir notre recherche en identifiant des sites
similaires aux sites trouveacutes preacuteceacutedemment via les suggestions fournies par des
moteurs collaboratifs tels que Yoono ou Similicious
Une recherche sur le tag Smartphone dans des sites de social bookmarking
comme Delicious nous permettra eacutegalement drsquoidentifier les pages plus ou moins
populaires taggeacutees par les contributeurs du site ainsi que drsquoautres tags en relation
avec notre sujet
Explorons ensuite les avis drsquoexperts plus ou moins autoriseacutes que lrsquoon trouvera dans
les meacuteandres de la blogosphegravere gracircce agrave des moteurs de blogs comme Technorati
Blogpulse ou Google Blog Search
La recherche pourra srsquoeffectuer via les tags ou le texte inteacutegral des billets On
pourra ensuite parcourir les blogrolls des auteurs les plus pertinents afin drsquoidentifier
drsquoautres sources
La lecture des blogs fournira non seulement des avis de speacutecialistes ou journalistes
mais aussi des avis plus ou moins critiques de consommateurs ou utilisateurs de
smartphoneshellip
Il conviendra toutefois de rester vigilant quant agrave lrsquoeffet pot de miel de certains
blogs ougrave les contributions des internautes se reacutevegravelent ecirctre de simples messages
publicitaires deacuteguiseacutes (voir agrave ce sujet la mise en garde du site UFC Que choisir146)
Pour recueillir les derniegraveres informations drsquoactualiteacute on pourra utiliser un
agreacutegateur tel que Wikio ou Digg et creacuteer un flux RSS agrave partir drsquoune requecircte sur les
copy Digimind Digimind Services ndash White Paper |84
Le Web 20 pour la veille et recherche dinformation DIGIMIND
tags preacuteceacutedemment identifieacutes Wikio propose des raccourcis pour inteacutegrer ce flux
au sein de plusieurs lecteurs RSS du marcheacute (Netvibes Newsgator Google Reader
etc)
Les reacuteseaux sociaux professionnels permettront eacutegalement drsquoidentifier des acteurs
importants du domaine dans les sphegraveres universitaires ou de lrsquoentreprise
La communauteacute 20 srsquoexprimera eacutegalement sur les grands portails consacreacutes aux
nouvelles technologies Crsquoest le cas par exemple du portail ZDNet qui permet aux
utilisateurs de commenter les articles ou de les ajouter directement agrave leur profil
Delicioushellip Les commentaires ou les trackbacks pointant sur un article pourront
constituer un preacutecieux compleacutement drsquoinformations
Afin de mener une veille reacuteguliegravere sur le sujet on syndiquera les flux RSS provenant
des diffeacuterents sites ou blogs identifieacutes Pourquoi ne pas eacutegalement creacuteer agrave partir de
ce bouquet de sources personnaliseacutees un moteur sur mesure conccedilu gracircce agrave Rollyo
ou Yahoo Search Builder
copy Digimind Digimind Services ndash White Paper |85
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les limites du Web 20
LA PARTICIPATION
I Une participation heacuteteacuterogegravene
Nous lavons deacutejagrave eacutevoqueacute tout le monde ne participe pas de la mecircme maniegravere sur
les applications du Web 20
Une minoriteacute participativehellip
Bill Tancer de la socieacuteteacute de mesure daudience Hitwise reacutevegravele dans une eacutetude147
que sur les sites type Web 20 les internautes regardent mais participent peu
Seulement 016 des visiteurs du site YouTube viennent y partager leurs videacuteos
Les 9984 restant ne font que regarder Idem pour le site de partage de photos
de Yahoo Flickr seulement 02 des visites conduisent agrave la publication de photos
Wikipedia est lexception sur lencyclopeacutedie collaborative gratuite 46 des
visites correspondent agrave une modification des articles
Sur ces sites on est donc encore loin de la regravegle de la 11089 eacutedicteacutee par Charles
Arthur dans The Guardian148 Il estime que sur le net sur un groupe de 100
personnes si une creacutee du contenu 10 vont interagir (commentaires
ameacuteliorations) et les 89 restant ne feront que le lire et regarder Le journaliste
lillustre via des exemples quantifieacutes avec YouTube Wikipedia ou Yahoo Groups
Most Web 20 Users Are Really Just Couch Potatoes Bruce Nussbaum compare
mecircme les internautes Web 20 aux spectateurs de TV passifs et affaleacutes dans leurs
canapeacutes149
Mais parallegravelement les sites de type Web 20 ont vu leur audience grimper
de668 en 2 ans reacutevegravele leacutetude Hitwise Cela repreacutesente 12 du trafic web aux
USA contre 2 il y a seulement 2 ans
Les sites de partage de photos sont parmi les plus populaires Flickr bien sucircr mais
aussi PhotoBucket qui repreacutesente agrave lui seul 41 du trafic des sites de photos en
ligne
copy Digimind Digimind Services ndash White Paper |86
Le Web 20 pour la veille et recherche dinformation DIGIMIND
hellipdautant plus que la forme de participation se complexifie
Dapregraves le cabinet Forrester les internautes sont nombreux sur les actions agrave faible
niveau dexigence (lire enregistrer un signet commenter) mais beaucoup moins sur
des participations plus actives (eacutecrire collaborer) 150
Wikipedia un faux modegravele collaboratif
On cite souvent lencyclopeacutedie Wikipedia en exemple cest lun des emblegravemes les
plus forts et les plus lus du Web 20 Son mode de fonctionnement est
caracteacuteristique voire symptomatique du web collaboratif Mais le process de
Wikipedia serait finalement tregraves classique avec une hieacuterarchie de contributeurs
sorte de cadres disposant de nombreux droits eacutecrivant la majoriteacute des articles
Cest lanalyse de Lionel Barbe du CNRS151 Il explique que si le principe de liberteacute
de publication sur Wikipedia reste valable il est de moins en moins commun car
la plupart des entreacutees basiques ne precirctant pas agrave discussion ont deacutejagrave eacuteteacute effectueacutees
Lrsquoeacutetude des laquo logs raquo historiques montre que la creacuteation de nouvelles entreacutees qui
correspondent agrave de nouvelles pages articles dans la Wikipedia Francophone ne
concerne qursquoenviron 3 agrave 4 des opeacuterations Par comparaison cette proportion tombe
agrave 2 pour la version anglaise de Wikipedia qui contient plus de 1 million drsquoarticles A
lrsquoinverse la proportion monte entre 8 et 10 pour des Wikipedias ayant moins de
100 000 articles comme la Wikipedia en Lituanien et bien drsquoautres
Selon lui on assiste agrave un effet de professionnalisation de lencyclopeacutedie [hellip] les
plus gros contributeurs que nous consideacutererons comme eacutetant les 5 des individus
eacuteditant le plus drsquoarticles eacuteditent entre 85 et 95 du contenu total de lrsquoencyclopeacutedie
Au fur et agrave mesure ces gros contributeurs acquiegraverent des privilegraveges comme le statut
drsquoadministrateur qui leur permettent non seulement de participer mais aussi de
surveiller et le cas eacutecheacuteant censurer le contenu eacutediteacute par les autres contributeurs et de
participer aux grandes lignes de lrsquoorganisation de Wikipedia
Cette analyse a toutefois eacuteteacute battue en bregraveche par Aaron Swartz dans une petite
eacutetude 152 En mesurant non pas le nombre drsquointerventions de chaque contributeur
mais la quantiteacute de texte produit par chacun la reacutealiteacute est diffeacuterente les
contributeurs occasionnels eacutecriraient des textes longs en peu dinterventions tandis
que les eacutediteurs actifs reacutealiseraient un travail tenant davantage de la maintenance
(correction veacuterification suppression) mais sans apporter beaucoup de texte
copy Digimind Digimind Services ndash White Paper |87
Le Web 20 pour la veille et recherche dinformation DIGIMIND
II Une participation damateurs
Tout internaute peut-il simproviser journaliste expert commentateurhellip
Michel Fingerhut 153 voit dans le succegraves dune encyclopeacutedie comme Wikipedia une
manifestation du web comme heacutegeacutemonie de lrsquoamateurisme et comme encouragement
agrave lrsquoextreacutemisme ideacuteologique et au communautarisme
Les contenus creacuteeacutes et diffuseacutes sont-ils de qualiteacute Le Web 20 devient une
plateforme qui stimule la creacuteativiteacute et la production de contenu par cela mecircme
qursquoelle en permet la diffusion (avec indice de notorieacuteteacute) On assiste agrave une libeacuteration
de talents qui peuvent enfin se reacuteveacuteler parallegravelement agrave des productions
caracteacuteriseacutees par un certain amateurisme et lrsquoabsence de veacuteritable ambition
creacuteatrice Car comme sur lensemble de linternet sur ce Web 20 le pire cocirctoie le
meilleur
Par ailleurs toujours en prenant lexemple de Wikipedia un certain nombre de
pheacutenomegravenes se reacutevegravelent tout de mecircme preacuteoccupants
Si leacutetude reacutealiseacutee pour le magazine Nature reacutevegravele que la qualiteacute des articles de
lencyclopeacutedie est presque au niveau de celle de lEncyclopaedia Britannica certains
articles de Wikipedia relegravevent de la deacutesinformation ou de la propagande
- larticle Droits de lHomme en Iran154 a ainsi eacuteteacute tregraves controverseacute en effet cet
article tregraves long de plus de 20 pages se preacutesente davantage comme une apologie du
reacutegime iranien quune analyse argumenteacutee des droits de lhomme dans ce pays Or
certainement au nom du principe de neutraliteacute qui reacutegit Wikipedia cet article
tendancieux a eacuteteacute classeacute comme article de qualiteacute 155
- le cas Seigenthaler 156 en mai 2005 un contributeur publie anonymement sur
Wikpedia un article sur John Seigenthaler Sr un eacutecrivain ceacutelegravebre aux USA Or ce
billet mentionne que leacutecrivain a eacuteteacute directement impliqueacute dans les assassinats de
John et Bob Kennedy en preacutecisant toutefois que rien na jamais eacuteteacute prouveacute Cette
information est tout simplement fausse Mais larticle nest deacutecouvert (par un ami de
John Seigenthaler) et corrigeacute que 4 mois plus tard mettant agrave mal la creacutedibiliteacute de
lencyclopeacutedie A la suite de cette affaire largement relayeacutee par les meacutedias
ameacutericains le fondateur de Wikipedia a rigidifieacute les regravegles de publication concernant
les tout nouveaux contributeurs
Certes sur les milliers darticles mis en ligne par Wikipedia ces dysfonctionnements
restent heureusement minoritaires mais ils reacutevegravelent tout de mecircme certaines limites
du tout collaboratif et la neacutecessiteacute de regravegles de publication emprunteacutees aux meacutedias
classiques
copy Digimind Digimind Services ndash White Paper |88
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Lagreacutegation de petites choses faciles
Elles ont tendance agrave dominer le contenu du Web 20 La faciliteacute de publication le
rythme des blogs qursquoil convient drsquoalimenter freacutequemment peut entrer en conflit
avec le temps de la recherche et de la reacuteflexion Souvent les thegravemes traiteacutes ne
peuvent degraves lors ecirctre que des sujets du quotidien des opinions non reacutefleacutechies non
argumenteacuteeshellipOn peut donc craindre agrave linstar du mode de diffusion sur dautres
meacutedias quinteacutegreacute agrave un reacuteseau social noteacute eacutevalueacute agrave la recherche de notorieacuteteacute et de
visibiliteacute le creacuteateur de contenu ait tout inteacuterecirct agrave aller dans le sens de son audience
produire du divertissant plus agrave mecircme de lui garantir un succegraves immeacutediat
Par ailleurs des opinions peuvent-elles se transformer en jugement pertinent par
lrsquoeffet de leur agreacutegation Lrsquoagreacutegation drsquoune quantiteacute importante drsquoavis peut elle
vraiment deacutepasser lrsquoimpreacutecision des avis pris indeacutependamment Peut-on sans une
harmonisation des critegraveres drsquoappreacuteciation atteindre un jugement collectif fiable Les
tendances qui ressortent risquent en effet de se limiter souvent au reflet de
lrsquoopinion majoritaire
Mais leacutevocation de ces limites ne doit pas occulter toutes les contributions matures
produites par des internautes soucieux dapporter un contenu veacuteritablement
constructif Les billets et les commentaires de nombres de blogs politiques franccedilais
en 2007 en sont une parfaite illustration
LE WEB 10 RESTE NECESSAIRE
Le mail reacutesiste
Nous lavons vu au cours de la description des applications pour la veille les services
Web 20 ne sont pas suffisants en soit pour la recherche dinformation De plus
bien que ses possibiliteacutes soient tregraves puissantes lutilisation du Web 20 reste encore
marginale agrave leacutechelle de tous les internautes Une eacutetude du cabinet Pew Internet 157
montre que lactiviteacute internet dominante sur une journeacutee type dun ameacutericain reste
tout simplement le mail 53 des internautes lutilisent Ils sont 38 agrave utiliser un
moteur de recherche Par contre ils ne sont que 8 agrave creacuteer des blogs et 26 agrave
partager des photos et videacuteos cette collaboration multimeacutedia eacutetant de loin lactiviteacute
la plus courante du Web 2
copy Digimind Digimind Services ndash White Paper |89
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une enquecircte en ligne de lUniversiteacute dOxford reacutealiseacutee aupregraves de 1469 personnes
(une majoriteacute deacutetudiants) fin 2006 deacutetaille les usages du Web 20 158 Elle reacutevegravele elle
aussi que les applications de ce web nouvelle geacuteneacuteration sont encore peu connues
et peu utiliseacutees La majoriteacute des reacutepondants na jamais employeacute ou jamais entendu
parleacute des fils RSS ou des applications de Social Bookmarking comme Delicious
Aussi linfluence grandissante du Web 20 ne doit pas masquer les usages
traditionnels du web qui restent majoritaires
Une population souvent isoleacutee et non repreacutesentative
Lage
Si de nombreuses applications sociales apportent un reacuteel progregraves il faut tempeacuterer
la nature de certains contenus issus du mode collaboratif celui-ci nest en effet pas
repreacutesentatif des internautes puisque le public du Web 20 est une population plutocirct
jeune
Ainsi leacutetude Pew Internet reacutevegravele que laudience de Wikipedia aux USA eacutetait en aoucirct
2006 agrave 47 situeacutee dans la tranche des 18-34 ans Les plus de 45 repreacutesentaient
28 Sur le site dEncarta lencyclopeacutedie de Microsoft plus traditionnelle (Web 10)
la part des plus de 45 ans atteint 33
Des communauteacutes isoleacutees structureacutees en icircles Les communauteacutes actuelles du Web 20 sont souvent renfermeacutees sur elles-mecircmes
les statistiques sur les liens pointant vers les blogs et sur les liens preacutesents dans les
billets reacutevegravelent que les blogueurs se lient et se lisent beaucoup entre eux
Lrsquointernaute Web 20 aurait donc tendance agrave senfermer sur lui-mecircme et autour
dindividus feacutedeacutereacutes en communauteacutes focaliseacutes sur les mecircmes centres drsquointeacuterecirct que
lui
Par ailleurs lhyper segmentation et le ciblage des nouvelles rendu possible par le
flux RSS notamment peut conduire agrave favoriser ces microcosmes communautaires
Parcourir un journal papier peut favoriser davantage louverture la prise de recul et
la mise en perspective des diffeacuterentes informations que la lecture de flux aux
theacutematiques tregraves speacutecialiseacutees
Les diffeacuterentes communauteacutes par reacuteflexe et de par la nature des applications Web
20 qui se dupliquent mais ne se connectent pas ont tendance agrave peu communiquer
entre elles Ainsi les liens entre reacuteseaux sociaux sont rares Peu de personnes
copy Digimind Digimind Services ndash White Paper |90
Le Web 20 pour la veille et recherche dinformation DIGIMIND
enregistreacutes sur LinkedIn iront eacutegalement sinscrire sur Viadeo ou FaceBook
Latomisation des donneacutees sur des dizaines dapplications reste eacutegalement un vrai
problegraveme
Des domaines mal couverts
Certaines theacutematiques vont ecirctre surrepreacutesenteacutees au deacutetriment dautres au
traitement beaucoup plus confidentiel car boudeacutees par les internautes producteurs
volontaires dinformation Les ingeacutenieurs techniciens et jeunes eacutetant fortement
repreacutesenteacutes parmi les blogueurs les theacutematiques high tech sont tregraves largement
couvertes par les blogs par exemple dans le domaine de la RFID (Identification par
Radio Freacutequence) on compte plus de 100 blogs idem pour la VoIP (Voix sur IP) A
linverse si vous travaillez dans le secteur des machines outils ou de la plasturgie il
vous sera difficile de trouver du contenu sur la blogosphegravere
Tous les secteurs ne sont donc pas eacutegaux en volume sur le net et davantage encore
sur la blogosphegravere et sur les autres applications collaboratives ougrave tout internaute
peut publier son propre contenu et ougrave certaines tranches dacircges et cateacutegories
professionnelles ne sont pas bien repreacutesenteacutees
copy Digimind Digimind Services ndash White Paper |91
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Conclusion
Le Web 20 ce mot qui geacutenegravere eacutenormeacutement de buzz deacutecrits et de blogs
speacutecialiseacutes nest-il quun terme marketing un courant de mode 159 Il est probable
que bientocirct on ne lemploiera plus pour deacutesigner ces nouvelles applications qui
seront devenues la norme Toutefois ce terme sorte de parapluie conceptuel qui
recouvre les diffeacuterentes tendances du web nouvelle geacuteneacuteration a le meacuterite de
mettre un nom simple sur un courant du net novateur
Le Web 20 nest pas une reacutevolution ou une rupture technologique mais plus
certainement une eacutevolution qui permet de replacer lutilisateur au centre des
reacuteseaux Cela nest certes pas tregraves nouveau Usenet lun des plus anciens
protocoles de linternet bien anteacuterieur au WWWeb offrait du contenu en ligne
creacuteeacute par linternaute via les Newsgroups degraves les anneacutees 1980
Mais les progregraves technologiques ont permis dintensifier cette tendance et de
deacutemocratiser laccegraves agrave la creacuteation de contenu en ligne et agrave sa diffusion au plus grand
nombre Potentiellement tout internaute peut maintenant diffuser ses publications
tant les outils sont devenus simples
Le Web 20 tend agrave sinseacuterer au cœur du quotidien de chacun en lui apportant des
services novateurs reacuteellement utiles et qui rendent possible lrsquoapparition de
nouveaux usages Ainsi les mash-up qui srsquoappuient sur la geacuteolocalisation ouvrent
des possibiliteacutes inenvisageables jusquici On peut mecircme imaginer agrave terme une
superposition de ces cartes dynamiques agrave la vision reacuteelle dun pieacuteton ou dun
automobiliste Le Web 20 est en perpeacutetuelle eacutevolution ses capaciteacutes drsquoinnovation
sont tregraves fortes car elles reposent souvent sur des recombinaisons audacieuses de
lrsquoexistant hybridant applications et services dans un systegraveme de deacuteveloppement
open source hellipLrsquoinnovation est aussi innovation de postures (prendre la parole
consommer du contenu amateurhellip) qui parfois challengent lrsquoordre eacutetabli et
redistribuent les pouvoirs La position des acteurs du Web 10 ou des meacutedias
classiques pourrait se trouver de plus en plus remise en question lagrave ougrave les
internautes tendent agrave se placer en experts
copy Digimind Digimind Services ndash White Paper |92
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La place de lhumain
Si celle-ci est devenue preacutepondeacuterante il est toutefois difficile de saffranchir
dorganisations un tant soit peu hieacuterarchiseacutees lautoreacutegulation voir Wikipedia ayant
ses limites
En outre la question de la consommation de contenu et de sa qualification sur
lrsquointernet devient cruciale La pertinence des votes de tous les internautes est
discutable ou du moins le fait qursquoils puissent agrave eux seuls qualifier et eacutevaluer la
qualiteacute Par ailleurs que repreacutesente exactement un vote une adheacutesion au contenu
agrave la forme aux ideacutees aux eacutecrits dun ami agrave une ideacutee avec laquelle je suis en
deacutesaccord mais qui agrave le meacuterite dexister
Finalement il faut continuer agrave normer organiser coordonner
reacutegulerhellipnotamment pour eacuteviter les diffamations ou la deacutesinformation Pour ce qui
est du contenu et de sa qualiteacute les critiques eacutemises agrave lrsquoencontre de Wikipeacutedia nous
incitent agrave eacutetudier de plus pregraves les initiatives qui hybrident les interventions
drsquoamateurs avec les compeacutetences de professionnels
Nous sommes passeacutes en 10 ans dun contenu geacuteneacutereacute par quelques internautes pour
la masse agrave un contenu de masse agrave destination de la masse (Evertybody to
Everybody) Cela ne peut guegravere se deacutevelopper sans des meacutecanismes qui replacent
les internautes les plus speacutecialiseacutes dans des processus de validation dune
information devenue pleacutethorique
Les donneacutees personnelles
Simpliciteacute reacuteactiviteacute personnalisation souplesse mutualisationhellipfont partie des
avantages les plus appreacuteciables du web 20 Mais cette liberteacute de publication et de
diffusion nrsquoest elle pas parfois illusoire Les utilisateurs doivent rester vigilants face
aux problegravemes de confidentialiteacute seacutecuriteacute et traccedilabiliteacute de lrsquoinformation160 Des voix
srsquoeacutelegravevent pour deacutenoncer les risques lieacutes agrave la maicirctrise des donneacutees personnelles ou
au respect des droits drsquoauteurs A noter que les licences Creative Commons161
permettent de mieux deacutefinir les contours de cette liberteacute agrave partir de contrats
flexibles de droit dauteur Ce systegraveme Creative Commons donne la possibiliteacute
gratuitement et simplement aux titulaires de droits de choisir et drsquoexprimer les
conditions drsquoutilisation de leurs œuvres agrave travers onze possibiliteacutes Quant aux
utilisateurs ils nrsquoont pas agrave neacutegocier systeacutematiquement une autorisation avant toute
utilisation ou reacuteutilisation
copy Digimind Digimind Services ndash White Paper |93
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Un autre problegraveme reacuteside aussi dans lrsquoeacuteparpillement des donneacutees dans des sites
diffeacuterents ou parfois redondants Il srsquoagira donc de deacutefinir les objets (livre
personne CD photoshellip) agrave partir drsquoun identifiant Cette bataille pour savoir qui
geacuterera ces donneacutees de base telles que la position geacuteographique les espaces de noms et
le code unique de chaque produit a deacutejagrave commenceacute estime Tim OReilly 162
Les perspectives deacutevolution vers un Web 3
Le web actuel est destructureacute et la classification et lrsquoorganisation de son contenu
posent problegraveme La recherche de nouveaux modes de recherche et de
structuration est une sorte de quecircte du graal que de nombreux experts et
entreprises poursuivent
La folksonomie repose sur une ideacutee originale qui sous tend toute lrsquoideacuteologie Web
20 celle de lrsquointelligence collective et de la deacutecentralisation Mais les limites de la
folksonomie appeleacutee aussi web seacutemantique du pauvre remettent en question
lrsquoaffirmation selon laquelle lrsquointelligence collective et la libeacuteralisation totale du
fonctionnement du web 20 sont une solution viable
Aussi la neacutecessiteacute drsquoun Web seacutemantique 163 fiable se fait de plus en plus urgente
Cette nouvelle phase de deacuteveloppement du Web permettrait drsquoameacuteliorer
lrsquoexploitation des informations par les utilisateurs en obtenant une information
organiseacutee normaliseacutee de faccedilon agrave rendre le web compreacutehensible aux machines pour
faciliter lrsquoexploitation par les utilisateurs
Dans un article paru dans le New York Times en novembre 2006 John Markoff
imagine un web 30 selon le principe drsquoajout dune couche de sens tout en haut du
web existant pour en faire un guide au lieu drsquoun simple catalogue Pour lrsquoauteur
nous sommes en train de passer dun web de documents connecteacutes agrave un web de
donneacutees connecteacutees
Le web seacutemantique offrira un langage commun permettant aux donneacutees de
renvoyer agrave des objets du monde reacuteel dune faccedilon identique Le projet Freebase
lanceacute par la start up Metaweb illustre cette approche il a pour objectif de faciliter
la recherche et le partage drsquoinformations agrave travers une base de connaissances
communes structureacutees via des meacutetadonneacutees permettant de deacutecrire chaque
eacuteleacutement drsquoinformation Ces eacuteleacutements seraient relieacutes entre eux par un systegraveme de
relations Tim OrsquoReilly deacutefinit le projet comme la machine agrave creacuteer les synapses du
cerveau global
Il srsquoagirait de creacuteer en quelque sorte un Google du web seacutemantique un reacutepertoire global
drsquoinformations structureacutees intelligibles et exploitables autant par des machines que par
copy Digimind Digimind Services ndash White Paper |94
Le Web 20 pour la veille et recherche dinformation DIGIMIND
des humains -et donc capables drsquoextraire et drsquointerpreacuteter les relations entre des donneacutees
pour par exemple reacutepondre agrave des requecirctes par des solutions plutocirct que des listes de
document 164
La veille
Dans cet univers le chercheur dinformations et le veilleur doiventhellipgarder la tecircte
froide la forte meacutediatisation du Web 20 ne doit pas masquer la pertinence doutils
plus traditionnels Les diffeacuterentes applications Web 20 nous lavons vu suffisent
rarement pour mener agrave bien une collecte dinformation Certes les bookmarks
sociaux apportent un contenu seacutelectionneacute par linternaute mais on ne peut se
deacutepartir des moteurs de recherche web classiques La surveillance des flux RSS
permet decirctre alerteacute sur de nombreux sujets mais la majoriteacute des sites web restent
encore deacutepourvus de ces fils Les tags apportent une veacuteritable souplesse agrave
lutilisateur mais la taxonomie des bibliothegraveques ou des reacutepertoires web- pour ne
citer que ces lieux- reste essentielle pour se repeacuterer agrave travers des milliers de
ressources
Le Web 20 pour la recherche et la veille nen est quagrave ses balbutiements Aussi
avant quil ne digegravere complegravetement par enrichissement les ressources et les
applications Web 10 il convient de faire coexister ces 2 web dans les pratiques
Le Web 20 apporte une richesse essentielle lrsquoexpression drsquoindividus porteurs
drsquoideacutees et de faculteacutes susceptibles drsquoapporter des changements de re-questionner
lrsquoordre eacutetabli eacuteleacutements indispensables agrave lrsquoeacutevolution de la culture agrave condition de ne
pas oublier que des volonteacutes ambitieuses doivent intervenir pour canaliser les
initiatives sans les eacutetouffer et leur insuffler une veacuteritable ambition Voilagrave tout
lenjeuhellip
copy Digimind Digimind Services ndash White Paper |95
Le Web 20 pour la veille et recherche dinformation DIGIMIND
A propos des auteurs DIGIMIND SERVICES
Digimind Services accompagne les plus grandes entreprises pour la conception la
mise en œuvre et le deacuteploiement de projets de veille qui reposent sur la solution
Digimind Evolution apportant agrave ses clients un retour sur investissement de plus de
600 et ce degraves la premiegravere anneacutee Les meacutethodologies proprieacutetaires du
deacutepartement conseil ainsi que son expertise des probleacutematiques et sources
drsquoinformations sur plus de 20 secteurs drsquoactiviteacute deacuteveloppeacutee aupregraves de ses clients
depuis de nombreuses anneacutees permet aux entreprises drsquoanticiper les changements
de leur environnement pour prendre les meilleures deacutecisions sur leur marcheacute
Le conseil Digimind porte sur tous les aspects du workflow de veille ciblage
strateacutegique collecte des informations traitement et analyse exploitation et
diffusion gestion de projet conseil organisationnel et gestion du changement
formations et support fonctionnel et technique
CHRISTOPHE ASSELIN
Issu drsquoun cabinet drsquoeacutetudes de marcheacute B2B et speacutecialiseacute depuis 1997 dans la mise en
place de systegravemes de veille (e-Franceorg Ecole Militaire) Christophe Asselin allie
une connaissance approfondie des secteurs eacuteconomiques et une parfaite maicirctrise
des outils de recherche sur internet et des solutions avanceacutees de veille Expert
reconnu il eacutedite le site httpwwwintelligence-centercom et le blog
httpinfluxjouebcom tout deux consacreacutes agrave la recherche dinformation
Speacutecialiste de la veille internet chez Digimind il accompagne les clients dans la mise
en place de leur dispositif de veille (expression des besoins deacutefinition de plans de
veille sourcing architecture parameacutetrage formation accompagnement) Il
intervient ainsi aupregraves de socieacuteteacutes dans diffeacuterents secteurs les teacuteleacutecoms avec
France Telecom RampD lrsquoindustrie pharmaceutique avec Sanofi Aventis Roche
Pharma Expanscience ainsi quAlstom Transport Veolia Environnement et des
reacutefeacuterences confidentielles dans le secteur des biotechnologies de leacutenergie des
teacuteleacutecoms de limprimerie de la deacutefense du conseilhellip
copy Digimind Digimind Services ndash White Paper |96
Le Web 20 pour la veille et recherche dinformation DIGIMIND
[Merci au Service Marketing agrave Malaiac wwwmalaiacnet et agrave Elsa Bonier eacutetudiante
en Master 2 Management des innovations en communication agrave Paris XIII pour leur
fructueuse collaboration]
VERONIQUE MESGUICH
Apregraves avoir fondeacute et co-dirigeacute pendant six ans un cabinet speacutecialiseacute en veille
technologique Veacuteronique Mesguich dirige lrsquoInfothegraveque du Pocircle Universitaire
Leacuteonard de Vinci Elle enseigne eacutegalement la maicirctrise de linformation strateacutegique
dans plusieurs eacutetablissements denseignement supeacuterieur et anime reacuteguliegraverement
des sessions de formation continue autour de la meacutethodologie de recherche
avanceacutee et de veille sur Internet
Veacuteronique Mesguich est lrsquoauteur avec Armelle Thomas de lrsquoouvrage Net
recherche le guide pour trouver lrsquoinformation utile dont la deuxiegraveme eacutedition est
parue en mars 2007 aux eacuteditions de lrsquoADBS
copy Digimind Digimind Services ndash White Paper |97
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Webographie Bibliographie
Sources dinformation sur le Web 20
Sites web wikis et blogs
Reacutepertoires et classement de services et socieacuteteacutes Web 20 - 20 Websites http20websitescom - Web 20 Magazine Top 100 Web 20 Sites httpweb2magazineblogspotcom200701thanks-for-web-2html - Web 20 Magazine The Best Web 20 Software of 2006 httpweb2socialcomputingmagazinecomthe_best_web_20_software_of_2006htm - Complete List of Web 20 Products and Services httpwwwlistiblecomlistcomplete-list-of-web-2-0-products-and-services - The Complete Web 20 Directory httpwwwgo2web20net - FredCavazzanet le meilleur du Web 20 httpwwwfredcavazzanetindexphp20051212986-le-meilleur-du-web-20 - Web 20 Directory 1200+ Web 20 Sites in 50+ categories httpweb2econsultantcomindexhtml
- Top 25 Web 20 Search Engines httpoedborglibraryfeaturestop-25-web20-search-engines
- 25 start-ups Web 20 prometteuses httpmoneycnncom20070221magazinesbusiness2nextnet_introbiz2
copy Digimind Digimind Services ndash White Paper |98
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Blogs et sites speacutecialiseacutes - Le groupe de travail Web20 francophone httpwwwweb20workgroupfr
- Web 20 Work Group httpweb20workgroupcom - Dessine-moi le Web 20 httpwwwdeuxzerocom - FredCavazzanet httpwwwfredcavazzanet
- TechCrunch en franccedilais httpfrtechcrunchcom - TechCrunch httpwwwtechcrunchcom
- Le web 20 cest pas du buzz httpweb2rulesblogspotcom
- Mashable France httpfrmashablecom - Mashable httpmashablecom - AccessoWeb httpblogaccessowebinfo - Web 20 Magazine httpweb2magazineblogspotcom - Reacutevolution Web 20 en Live httpwwwwebdeuxinfo
- ReadWriteWeb httpwwwreadwritewebcom - Web 20 Innovations httpweb2innovationscom - Web 20 Summit httpwwwweb2concom
- Original Signal (agreacutegateur de flux RSS) httpwwworiginalsignalfr - Whats Web 20 (agreacutegateur de flux RSS) httpwwwwhatsweb20comaggregatorfrom=100
- Le blog de Bloxx Communiquons avec le Web 20 httpblogbloxxfr
copy Digimind Digimind Services ndash White Paper |99
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- FrenchWeborg Le blog des professionnels franccedilais du Web 20 httpwwwfrenchweborg
- Blog Web 20 et Marketing httpwwwvincentabrycom - Le Web 20 en Action httpleweb2blogspotcom - aYsoon 20 httpblogaysooncom Emmanuel de Taillac httpemmanueldetaillacfr - NiouMedia httpnioumediacom - 2803 httpwww2803com - Web 2 francophone (Wiki) httpweb2frcomAccueil
Blogs et sites avec un axe Web 20
- Publishing 20 httppublishing2com - Social-Computing httpwwwsocial-computingcom - Ecosphere httpecospherewordpresscom - inFLUX httpinfluxjouebcom - Benoit Descary httpdescarycom - Jean Michel Billaut httpbillauttypepadcomjm - Blog francophone des TIC httpwww2607fr 20Minutes Top 50 tech et meacutedias httpwww20minutesfrarticle15087620070410-Blogs-Top-50-tech-et-mediaphp - Intruderstv httpnewintruderstvintruders_fr
copy Digimind Digimind Services ndash White Paper |100
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- Jeff Clavier Sans Accent httpsansaccentsofttechvccom - Demain tous journalistes httpbenoit-raphaelblogspotcom
- Collectif louvre-boicircte Initiatives sur le partage dinformation httplouvre-boiteviablogacom
- Zero seconde httpzerosecondeblogspotcom
Articles
Introduction au Web 20
- Web 20 lrsquoarticle de OrsquoReilly reacutesumeacute pour les faineacuteantshellip httpwwwexpressionsbe20051101web-20-resume-pour-les-faineants
- Dossiers Web 20 - Journal Du net httpwwwjournaldunetcomdossiersweb20
- Avis des managers le Web 20 agrave la loupe httpwwwjournaldunetcomsolutions0603diaporamaavis-managers-web21shtml
- Les entreprises face aux deacutefis du Web 20 httpwwwjournaldunetcomsolutions0704070413-entreprises-web-201shtml
-The Machine is Using Us Transcription (videacuteo) httpmediatedculturesnetksudiggp=78
- The New Wisdom of the Web httpwwwmsnbcmsncomid12015774sitenewsweek
- Quest-ce que Web 20 httpwww01netcomarticle294819html
- Approaching a definition of Web 20 httpsocialsoftwareweblogsinccom20050929approaching-a-definition-of-web-2-0
- Fonctionnement de lrsquoentreprise classique vs entreprise 20 httpalbancornilletfreefrakwindexphp20061002fonctionnement-de-lentreprise-classique-vs-entreprise-20
- Meacutedias traditionnels et acteurs du Web 20 vers la cohabitation ou la convergence des acteurs de lrsquoinformation et du divertissement httpwwwscribdcomdoc50818These-sur-le-Web-2-Cabanis
copy Digimind Digimind Services ndash White Paper |101
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ajax
- LAjax en 5 questions httpwwwjournaldunetcomsolutions0602060208_qr-ajaxshtml - Ajax et Moteurs 20 httpwwwmoteurzinecomarchives2006moteurzine127html2
Les Mashups
- Les Mashups applications Web composites tregraves Web 20 httpwwwjournaldunetcomsolutions0606060628-qr-mashup-hybrideshtml
- Le modegravele eacuteconomique des Mashups httpwwwinternetactunetp=6285 Bookmarks sociaux Social search
- Le Social Bookmarking au secours de la pertinence de la recherche drsquoinformation httpwwwgillesbalmissecomv2spipphparticle171 - Whats the Big Deal With Social Search httpsearchenginewatchcomshowPagehtmlpage=3623153
- Whos Who in Social Search httpsearchenginewatchcomshowPagehtmlpage=3623173
Ouvrages
- Web 20 - Les internautes au pouvoir - Jean-Franccedilois Gervais httpwwwdunodcompagesouvragesficheouvrageaspid=50701
- Les reacuteseaux sociaux Pivot de lrsquointernet 20 - Alain Lefebvre httpwwwcluster21comfrbookreviewlivre_les_reseaux_sociaux - Web 20 (R)eacutevolutions et nouveaux services dInternet - Jean-Noeumll Anderruthy httpwwwamazonfrWeb-2-0-C3A9volutions-nouveaux-dInternetdp2746034972ref=sr_1_18402-7140143-8118507ie=UTF8amps=booksampqid=1178118687ampsr=8-18 - Web 20 The Future of the Internet and Technology Economy and How Entrepreneurs Investors Executives amp Consumers Can Take Ad httpwwwamazoncomWeb-2-0-Technology-Entrepreneurs-Execenablersdp1587622009ref=sr_1_6103-0331542-4028646ie=UTF8amps=booksampqid=1178118732ampsr=1-6
- La Longue Traicircne La nouvelle eacuteconomie est lagrave - Chris Anderson httpwwwamazonfrLongue-TraC3AEne-nouvelle-C3A9conomie-
copy Digimind Digimind Services ndash White Paper |102
Le Web 20 pour la veille et recherche dinformation DIGIMIND
estdp2744062693ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180542516ampsr=1-1 - The Geospatial Web How Geobrowsers Social Software and the Web 20 are Shaping the Network Society httpwwwamazoncomGeospatial-Web-Geobrowsers-Information-Processingdp1846288266ref=sr_1_28103-0331542-4028646ie=UTF8amps=booksampqid=1178118760ampsr=1-28 - Les Wikis espaces de lintelligence collective - Jeacuterocircme Delacroix httpwwwamazonfrWikis-JC3A9rC3B4me-Delacroixdp2952051445ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180544723ampsr=8-1 - Pro Web 20 Mashups Remixing Data and Web Services httpwwwamazonfrPro-Web-2-0-Mashups-Remixingdp159059858Xref=sr_1_4403-1740173-8750801ie=UTF8amps=english-booksampqid=1180542751ampsr=8-4 - Web 20 et Web avanceacute - Alexandre Boni Nicolas Stemart httpwwwamazonfrWeb-2-0-avancC3A9-Alexandre-Bonidp2742967281
copy Digimind Digimind Services ndash White Paper |103
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Dans la mecircme collection
White Paper Blogs et RSS des outils pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind
White Paper
Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind
White Paper
Cateacutegorisation automatique de textes
White Paper
Benchmark des solutions de veille strateacutegique
White Paper
Evaluer le Retour sur Investissement dun logiciel de veille Edouard Fillias Consultant Veille Strateacutegique Digimind
gt A teacuteleacutecharger sur httpwwwdigimindfrserviceswhite_paperhtm
copy Digimind Digimind Services ndash White Paper |104
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Notes 1 httpwwwguimfrblog200612le_film_autumn_html httpwwwlemondefrwebarticle01-02-65186536-8751060html 2 httpvideogooglefrvideoplaydocid=724218352255575783 3 Map of online communities par Randall Munroe httpwwwxkcdcomc256html 4 httpwwwdeuxzerocom 5 httpwwwpaulgrahamcombiohtml httpfrwikipediaorgwikiPaul_Graham 6 Qursquoest ce que le web 20 Hubert Guillaud Internet Actu 29 mai 2005 httpwwwinternetactunetp=6144 7 httpwwworeillynetcompubaoreillytimnews20050930what-is-web-20html httpweb2rulesblogspotcom200601what-is-web-20-par-tim-oreilly-versionhtml 8 httpwwwzdnetfractualitesinternet0390207743933447900htm 9 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 10 httpwwwinternetactunetp=7035 11 httpwwwhitwisecomdatacenter 12 httprosstypepadcomblog200604power_law_of_pahtml 13 httpblogsforrestercomcharleneli200704forresters_new_html 14 httpwwwtagcrowdcom 15 You Say You Want a Web Revolution httpwwwwiredcomsciencediscoveriesnews20050868403 16 httpsaddonsmozillaorgfrfirefoxaddon748 httpwwwjournaldunetcomdeveloppeurtutorielout050525-greasemonkey-presentationshtml 17 Mashups Google Maps httpwwwmibazaarcomextrasfortune100html httpwwwweatherbonkcomweatherindexjsp httpgmapstommanganusspacecraft_trackinghtml 18 httpwwwgooglecomcalendar 19 httpdocsgooglecom 20 httpwwwmoovementfr 21 httpwwwcooptincomfrWEBhomeaspx httpwwwjobmeeterscomfraccueilindexphp 22 httpwwwzliocom httpshoppingyahoocomshoposphere
copy Digimind Digimind Services ndash White Paper |105
Le Web 20 pour la veille et recherche dinformation DIGIMIND
23 httpwwwciaofr httpwwwwantunocom 24 httpmapsgooglefr httpwwwgeoportailfr httpearthgooglefr httpmapsyahoocom httpwwwflickrcom httpwwwzdnetfractualitesinternet0390207743936635400htm 25 httpwwwcriteocom 26 From Youtube to Youniversities Henry Jenkins 16 feacutevrier 2007 httpwwwhenryjenkinsorg200702from_youtube_to_youniversityhtml 27 httpaffordancetypepadcom 28 httpwwwplosoneorghomeaction 29 Web collaboratif web coopeacuteratif web 20 quelles interrogations pour lrsquoenseignant documentaliste Marie France Blanquet 12 janvier 2007 httpeprofsdocscrdp-aix-marseillefrIMGrtfintervention-MF-Blanquetrtf 30 httpveillepedagogiquebloglemondefr 31 httpbibliobsessionfreefrdotclear 32 httpliblogsalbanyedulibrary20200611a_librarians_20_manifestohtml 33 httpdelicious 34 httpwwwconnoteaorg httpwwwciteulikeorg httpwwwsnipitroncom 35 httpdelicious httpwwwblinklistcom httpblogmarksnet httpwwwfurlnet httpfrbetabookmarksyahoocom httpmyweb2searchyahoocom 36 httpwwwstumbleuponcom httpsimilicious httpwwwyoonocomindexjsp 37 Social bookmarks charts version 35 httpwwwiroxdefile_download3 httpwwwroxomaticde856 Social Bookmarking Services And Tools The Wisdom Of Crowds That Organizes The Web httpwwwmasternewmediaorgnews20061201social_bookmarking_services_and_toolshtm Free Bookmark Managers
copy Digimind Digimind Services ndash White Paper |106
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwfeedbuscombookmarks 38 httpwwwflickrcom 39 httpwwwflickrcomgroupstehipool 40 httpwwwflickrcomphotostagsnorthamericaninternationalautoshow 41 httpphotobucketcom 42 httpwwwsquidoocom 43 httpwwwsquidoocomnanotechRev 44 httpwwwsquidoocomtagsmarketing 45 httpwwwyoutubecom 46 httpwwwdailymotioncom 47 Une seacutelection de moteurs de recherche videacuteo et de services de partage et teacuteleacutechargement de videacuteos httpcasselinfreefrfrenchvideoshtm 48 httpwwwemarketercomArticleaspxid=1004918 49 httpwwwviadeocom 50 httpwwwlinkedincom 51 httpwww6nergiesnet httpwwwxingcom 52 httpwwwfacebookcom 53 httpenwikipediaorgwikiList_of_social_networking_sites 54 httpwwwlinknrankcombusinessphp 55 httpdiggcom 56 httpwwwnuouzcom httpwwwblogmemescom httpwwwscoopeocom httpwwwfuzzfr httpwwwtapemoicom httpmeneamenet httpwwwrojocom httpwwwbetanetscapecom 57 httpwwwwikiofr 58 httpwwwagoravoxfr 59 Carlo Revelli Joeumll de Rosnay httpfrwikipediaorgwikiCarlo_Revelli httpfrwikipediaorgwikiJoC3ABl_de_Rosnay 60 Agoravox politique eacuteditoriale httpwwwagoravoxfrarticlephp3id_article=60 61 httpwwwreadspeakercom 62 httpenglishohmynewscom
copy Digimind Digimind Services ndash White Paper |107
Le Web 20 pour la veille et recherche dinformation DIGIMIND
63 State of the Blogosphere- avril 2007 httpwwwsifrycomalertsarchives000493html 64 Les blogs dans le monde Estimation agrave partir des chiffres produits par Digimind Blog Herald Technorati PewInternet Meacutediameacutetrie Loiumlc le Meur Live Journal Skyblogs Overblogs Terra MSN Spaces Splinder Excite Bloggersit Timblog W3B Skynet Bloghr Overskriftdk Smartlog onetpl Tenbit mylogpl eblogpl Blogpl Blogipl blogcentralis Romandiefr Blogspot timsoftro Globocom Financial Express Prixadi blog Baidu Yahoo Blogs South Korea Planet Weblog Service Cyworld LAtelier et ZDNet Australia 65 httpwwwnaturecomwebfeedsindexhtml httpwwwsciencemagorgrss 66 httpsearchlivecom 67 httpsearchyahoocom 68 httpnewsgooglefr httpfrnewsyahooco httpfrnewsbotmsncom httpwwwtopixnet httpwwwwikiofr 69 httpgroupsgooglefrgrouprectraveleuropefeedshl=fr 70 httpwwwforummobilescomindexphpshowforum=200 71 httpfrgroupsyahoocom 72 httpfrmyweb2searchyahoocom httpblogmarksnet httpdelicious 73 httpwwwflickrcom httpphotobucketcom 74 httpwwwyoutubecom httpwwwdailymotioncomfr 75 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 76 httpblogsearchgooglefr httpfraskcomsubjectbls|pg1 httpwwwfeedstercom httpwwwblogpulsecom httpwwwtechnoraticom httpwwwspherecom 77 httpwwwsifrycomalertsarchives000493html 78 httpfrsearchyahoocomwebadvancedei=UTF-8ampybs=0 httpwwwexaleadfrsearchresultsq=sarkozyamp24mode=allweb 79 httpwwwblogaramacom httpwwwrss-networkcom
copy Digimind Digimind Services ndash White Paper |108
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwrssfeedscom 80 httpwww43thingscom http36trucscom 81 httptrainquecomcodedelicious_lookupphp 82 httptechnoraticomtag 83 httpwwwsearchlescom 84 httptagcentralnet httpwwwkeotagcom httpwwwthagoocom httpwwwzewolnet httpwwwgnoshorg 85 httpwwwzibbcom 86 httpwwwecransfr 87 Google Tag Cloud Maker httpuserscriptsorgscriptsshow6171 88 httpnewzingocom 89 Folksonomies les usagers indexent le web Olivier le Deuff Bulletin des Bibliothegraveques de France ndeg4 2006 90 Folksonomy les tags en deacutelire Cyril Fieacutevet Internetactu 13 octobre 2005 httpwwwinternetactunetp=6166 91 httpwwwzoominfocom 92 httpwwwzikicom 93 httpwwwyonamecom httpwwwstalkeraticom httpwinkcom 94 httpfranswersyahoocom httpanswersyahoocom httpaskyahoocom 95 httpanswersgooglecomanswers 96 httpiqlycosfr httpqnalivecombetaaspx 97 httpwwwexpertscomdirectoryasp 98 httpsearchwikiacomwikiSearch_Wikia 99 httpdeciphocom 100 httpwwwyoonocom 101 httpwwwfooxxcom
copy Digimind Digimind Services ndash White Paper |109
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwwebzzlecom 102 httpinfluxjouebcomnewspowerset-et-xerox-parc-s-attaquent-a-google-naturellement 103 httpwwwmedglecom httpwwwmedwormcom httpwwwmedstorycom httpwwwsearchmedicacouk 104 httpwwwrollyocom httpswickihomeeurekstercom httpgooglecomcoopcseoverview httpbuildersearchyahoocom 105 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 106 Le web invisible (deep web hidden web) deacutesigne la partie du web non accessible aux moteurs de recherche classiques Le web invisible comprend des bases banques de donneacutees et bibliothegraveques en ligne gratuites ou payantesIl est constitueacute de pages web mal ou non indexeacutees par les moteurs Pour plus de preacutecisions voir le White Paper Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique httpwwwdigimindfrserviceswhite_paperhtm 107 httpwwwthelancetcom 108 httpwwwdigimindfrproduitsfinderhtm 109 httpwwwncbinlmnihgoventrezqueryfcgiCMD=searchampDB=pubmed 110 httppminlmnihgovinteractindexphptop httpwwwhubmedorg 111 httpwwwusptogovpatftindexhtml httpwwwwashingtonpostcomwp-dyncontentarticle20070304AR2007030401263html 112 httpwwwgooglecomhistory 113 httpwwwgooglecomhistorytrends httpwwwgooglecomhistoryitems 114 httpfrwikipediaorgwikiApplication_composite 115 httpwwwmibazaarcomextrasfortune100html 116 httptagmapsresearchyahoocomworldexplorerphp 117 httpflickrvisioncom 118 httpgmapstommanganusspacecraft_trackinghtml 119 httpwwwhealthmaporg httpwwwbrevardbiodieselorgmapbdhtml httpkartametroinfokartadefaultaspxhl=EN httpwwwwikimapiaorg httpwwwglobalincidentmapcomhomephp httpdartmapsmackerscom
copy Digimind Digimind Services ndash White Paper |110
Le Web 20 pour la veille et recherche dinformation DIGIMIND
120 httpwwwtagurlscom 121 httpwwwthemolucom httpwwwgnoshorg 122 httpwwwwebmashupcom httpwwwprogrammablewebcommashupsdirectory httpmashupfeedcom 123 httpgooglemapsmaniablogspotcom 124 httplocalalkemiscom 125 httpwwwvoxcom httpwwwover-blogcom httpwwwblogspiritcomfrindexphp httpwwwtypepadcom httpswwwbloggercomstart httpviablogacom httpwwwhautetfortcom 126 httpcasselinfreefrfrenchweblogshtmoutils 127 httpwwwclubiccomarticle-67515-8-comparatif-plateformes-blogshtml httpwwwojrorgojrimagesblog_software_comparisoncfm 128 httpwwwfeedburnercomfbahome 129 httppagesgooglecom 130 httpwwwdigimindfrserviceswhite_paperhtm 131 httpfrwikipediaorgwikiAccueil 132 httpblogouter-courtcomarchive2006-12-05-n22html 133 httpwwwnaturecomnews2005051212full438900ahtml httpwwwnaturecomnaturebritannicaindexhtml httpwwwnaturecomnews2005051212multimedia438900a_m1html 134 httpwwwwikiseekcom 135 httpwwwexaleadfr 136 httpwwwwikimindmaporg 137 httpencitizendiumorgwikiMain_Page 138 httpwwwalacrawikicom 139 httpceclinesxwikicomxwikibinviewMainFils+RSS 140 httpwwwwikidwebcom 141 httpwwwoperacom httpwwwmaxthoncom httpwwwmicrosoftcomfrancewindowsie httpwwwmozilla-europeorgfrproductsfirefox
copy Digimind Digimind Services ndash White Paper |111
Le Web 20 pour la veille et recherche dinformation DIGIMIND
142 httpfrtechcrunchcom20060401analysons-les-lecteurs-rss-en-ligne httpvtechcanalblogcomarchives20051025927489html httpvtechcanalblogcomarchives20050905780635html httpallrsscomrssreadershtml 143 httpinfluxjouebcomnewsles-pages-personnalisables-bookmark-n-1 httpwwwinformationoverlordcouk200603where-to-start-in-search-of-ideal_26 144 httpwwwdigimindfrproduitsindexhtm 145 httpshareopmlorg 146 httpwwwquechoisirorgArticlejspid=RessourcesArticlesEF33CF34D5616AF2C125720D0050E701ampcatcss=TEL000 147 httpweblogshitwisecombill-tancer 148 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 149 httpwwwbusinessweekcominnovateNussbaumOnDesignarchives200704are_most_web_20html 150 httpblogsforrestercomcharleneli200704forresters_new_html httprosstypepadcomblog200604power_law_of_pahtml 151 httpwwwobservatoire-omicorgcolloque-icicpdfBarbe3_1pdf 152 httpwwwaaronswcomweblogwhowriteswikipedia 153 httpaphgcaenfreefrchronique393aphg393htm 154 httpfrwikipediaorgwikiDroits_de_l27homme_en_Iran 155 httpfrwikipediaorgwikiWikipC3A9diaArticles_de_qualitC3A9 156 httpenwikipediaorgwikiJohn_Seigenthaler_Sr_Wikipedia_biography_controversy 157 httppewresearchorgpubs71riding-the-waves-of-web-20 158 httptallblogcontedoxacukwp-contentuploads200703survey-summarypdf 159 httpwwwcafepresscomnerdwideweb 160 httpwwwecransfrspipphprubrique30 161 httpfrcreativecommonsorg 162 httpwwwzdnetfractualitesinternet0390207743933447900htm 163 httpwebsemantiqueorgPagePrincipale httpwwww3orgDesignIssuesSemantichtml httpwwww3org2002Talks1213-lpslide1-0html 164 httpwwwinternetactunetp=6902
copy Digimind Digimind Services ndash White Paper |112
- Digimind Services
- Christophe ASSELIN
- Veronique MESGUICH
-
Le Web 20 pour la veille et recherche dinformation DIGIMIND
a Les Blogs et le flux RSS 73 b Les Wikis 74 IV Surveiller 78 a La deacutetection du flux RSS 78 b La mise en surveillance79 c Pourquoi une veille via le RSS 81 V Carte des outils et ressources Web 2082
Exemple dune recherche et veille via le Web 20 84
LES LIMITES DU WEB 20 86
La participation 86 I Une participation heacuteteacuterogegravene 86 Une minoriteacute participativehellip 86 Wikipedia un faux modegravele collaboratif 87 II Une participation damateurs 88
Le web 10 reste neacutecessaire 89 Le mail reacutesiste 89 Une population souvent isoleacutee et non repreacutesentative 90 Des domaines mal couverts 91
CONCLUSION 92
A PROPOS DES AUTEURS 96
WEBOGRAPHIE BIBLIOGRAPHIE 98 Sites web wikis et blogs98 Articles 101 Ouvrages 102
DANS LA MEME COLLECTION 104
NOTES 105
copy Digimind Digimind Services ndash White Paper |3
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Avant propos
Web 20
La notion de Web 20 est tregraves souvent employeacutee mais finalement peu de
personnes sont capables de lexpliquer preacuteciseacutement
Lobjectif de ce document est de deacutemocratiser le concept de Web 20 aupregraves des
Knowledge Workers Il sadresse aux diffeacuterents collaborateurs de lentreprise qui
nutilisent pas encore ou peu les diffeacuterentes applications regroupeacutees sous ce
concept Les sensibiliser agrave ces outils pourra ameacuteliorer la pertinence de leur
recherche et de leur veille informationnelle
copy Digimind Digimind Services ndash White Paper |4
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Quest-ce que le Web 20
PREAMBULE
Pour certains le Web 20 nest qun gadget un pur pheacutenomegravene de mode qui ne
meacuterite pas que lon sy attarde Pourtant une eacutevolution importante a bien eu lieu sur
le web quelque soit le nom que lon lui donne
Ainsi en 2006 un metteur en scegravene a choisi de diffuser son long meacutetrage Autumn1
gratuitement et ce uniquement sur internet via le service Google Video2 Il navait
pas trouveacute de distributeur capable dexploiter son film dans plus de 30 salles En mai
2007 plus de 920 000 internautes avaient deacutejagrave vu Autumn sur le service de partage
de videacuteos de Google
Fin 2005 pour le compte de la prestigieuse revue scientifique Nature des experts
ont compareacute des documents publieacutes sur Wikipedia lencyclopeacutedie collaborative en
ligne reacutealiseacutee par des internautes volontaires et beacuteneacutevoles avec ceux de la ceacutelegravebre
Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche
Cette eacutetude a abouti agrave une formidable controverse comment une encyclopeacutedie
reacutealiseacutee par des non-speacutecialistes peut-elle remettre en cause les ouvrages
classiques
Il se passe donc bien quelque chose de nouveau via ce web nouvelle geacuteneacuteration ougrave
linternaute devient actif et collaboratif Mais tellement dacteurs et dapplications se
reacuteclament de ce web 2 que lon a vite limpression de naviguer en Terra Incognita
Certains nheacutesitent dailleurs pas agrave repreacutesenter ce nouveau web via une carte
dexplorateur 3
Aussi agrave travers ce document plongeons dans le Web 20 pour mieux lexploiter
lors de recherche dinformation et de veilles
copy Digimind Digimind Services ndash White Paper |5
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La carte des communauteacutes virtuelles Par Randall Munroe DR
DEFINITION DU WEB 20
Comment deacutefinir de faccedilon preacutecise ce que recouvre cette notion parfois floue
Depuis plusieurs mois le blog collectif Dessine moi le Web 20 4 propose agrave des
universitaires informaticiens philosophes entrepreneurs de donner leur propre
vision du pheacutenomegravene et eacutechanger ideacutees et points de vue La diversiteacute et la richesse
des contributions illustrent la difficulteacute agrave donner une deacutefinition exhaustive de ce
concept agrave geacuteomeacutetrie variable mecirclant agrave la fois des aspects techniques et sociaux
Une vision reacuteductrice du Web 20 consisterait agrave nrsquoy voir que la mutualisation de
contenus produits et mis en ligne par les utilisateurs eux-mecircmes ou agrave reacutesumer
lrsquoengouement actuel agrave un effet de mode passager Depuis la premiegravere confeacuterence
Web 20 en 2004 le concept srsquoest concreacutetiseacute agrave travers de nombreuses
expeacuterimentations ou le deacuteveloppement de nombreux services largement utiliseacutes
Nous tenterons dans ce document de brosser un panorama des enjeux usages et
technologies lieacutes agrave cette notion aussi encenseacutee que controverseacutee
copy Digimind Digimind Services ndash White Paper |6
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Plusieurs auteurs srsquoaccordent sur lrsquoideacutee selon laquelle le web 20 ne constitue pas
une rupture technologique ni hellip sociale Il srsquoagirait plutocirct drsquoun retour aux sources
drsquoune renaissance du web tel qursquoil a eacuteteacute conccedilu agrave lrsquoorigine les utilisateurs srsquoeacutetant
entre temps approprieacutes les modes de creacuteation et de diffusion
Pour Paul Graham5 pionnier de lrsquoInternet et fondateur de la socieacuteteacute Viaweb en
1995 le web 20 est le web comme il a eacuteteacute conccedilu pour ecirctre utiliseacute Les tendances que
nous distinguons sont simplement la nature inheacuterente du web qui eacutemerge des mauvaises
pratiques qui lui ont eacuteteacute imposeacutees pendant la bulle Internet
Le web creacuteeacute au deacutebut des anneacutees 90 par Tim Berners Lee comportait deacutejagrave en
germe bien des eacuteleacutements du web 20 mutualisation des connaissances eacutechange
travail collaboratif interactiviteacute intelligence collective hellip Ce nrsquoest sans doute pas
un hasard si Dale Dougherty lrsquoun des pegraveres fondateurs de la formule 20 fut lui
aussi lrsquoun des pionniers du web et notamment le fondateur de GNN le premier
portail financeacute par la publiciteacute
Naissance du concept
Crsquoest au cours de lrsquoeacuteteacute 2004 que le terme de web 20 apparaicirct pour la premiegravere
fois lors drsquoune seacuteance de brainstorming Dale Dougerthy co-fondateur de la
socieacuteteacute drsquoeacutedition OrsquoReilly et Craig Cline de MediaLive reacutefleacutechissent agrave des thegravemes
eacutemergents en vue drsquoune confeacuterence agrave venir Le journaliste John Battelle co-
fondateur du magazine Wired se joint un peu plus tard au duo et la premiegravere
confeacuterence Web 20 a lieu en octobre 2004 Lrsquoexpression 20 est utiliseacutee agrave ce
propos pour marquer lrsquoeacutemergence drsquoune nouvelle eacutetape dans la courte histoire du
web eacutetape caracteacuteriseacutee par un changement des regravegles et une modification des
modegraveles de revenus Le volet social sera deacuteveloppeacute plus tardivement par Tim
OReilly lors de la deuxiegraveme confeacuterence Web 20 en octobre 2005
Les nouveaux produits et services associeacutes au web 20 vont ainsi repositionner
lrsquointernaute au cœur du systegraveme Des techniques de publications simples et souples
comme les blogs les plates-formes collaboratives de type Wiki offrent des
possibiliteacutes accrues de production diffusion et consommation des contenus
Lrsquointernaute devient ainsi co-creacuteateur de nouvelles applications en ligne initiant
souvent de faccedilon collective ou communautaire de nouvelles formes de relations
numeacuteriques Selon lrsquoexpression drsquoHubert Guillaud6 le web devient non plus une
aventure technologique mais bien une aventure humaine
copy Digimind Digimind Services ndash White Paper |7
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LES 7 PRINCIPES DU WEB 20
Le texte de Tim OrsquoReilly paru en 2005 7 sous le titre Qursquoest ce que le web 20
deacutegage sept principes cleacutes du Web 20 en voici un petit reacutesumeacute
1 Le web vu comme une plate-forme de services
On passe dune collection de sites web agrave une plateforme informatique agrave part
entiegravere fournissant des applications web aux utilisateurs
2 Consideacuterer les internautes comme co-deacuteveloppeurs des applications On passe ainsi
de la notion de logiciel produit agrave celle de logiciel service
3 Le service srsquoameacuteliore quand le nombre drsquoutilisateurs augmente
Le Web 20 met agrave profit lrsquoeffet de la longue traicircne (ou long tail en anglais)
populariseacute par le magazine Wired les produits qui sont lrsquoobjet drsquoune faible
demande ou qui nrsquoont qursquoun faible volume de vente peuvent collectivement
repreacutesenter une part de marcheacute eacutegale ou supeacuterieure agrave celle des best-sellers si les
canaux de distribution peuvent proposer assez de choix Les utilisateurs du Web
20 disposent de donneacutees uniques difficiles agrave recreacuteer et dont la richesse srsquoaccroicirct
avec lrsquoaugmentation du nombre des utilisateurs
4 La richesse est dans les donneacutees Toutes les applications web drsquoimportance sont
lieacutees agrave une base de donneacutees speacutecialiseacutee OrsquoReilly envisage un mouvement des
donneacutees libres srsquoopposant peu agrave peu agrave lrsquounivers des donneacutees proprieacutetaires
5 Tirer parti de lrsquointelligence collective crsquoest le principe mecircme adopteacute par
lencyclopeacutedie en ligne Wikipedia et drsquoautres sites similaires Pour Tim OrsquoReilly
lrsquoimplication des utilisateurs dans le reacuteseau est le facteur-cleacute pour la supreacutematie sur le
marcheacute
6 Mettre en place des interfaces souples et leacutegegraveres fondeacutees sur les nouveaux
standards et protocoles du Web Le logiciel se libegravere du PC Une autre des
caracteacuteristiques du web 20 est le fait qursquoil nrsquoest plus limiteacute agrave la plate-forme PC
mais vise notamment les objets nomades teacuteleacutephone portable PDA ou lecteur
portatif audio
copy Digimind Digimind Services ndash White Paper |8
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LES EVOLUTIONS PAR RAPPORT AU WEB 10 LE ROLE DE LINTERNAUTE
En quoi le Web 20 se distingue-t-il de la vague preacuteceacutedente On a vu que lrsquoune des
caracteacuteristiques majeures du pheacutenomegravene est lrsquoappropriation des contenus et des
modes de diffusion par les internautes eux-mecircmes via des applications souples et
leacutegegraveres
Paul Graham eacutevoque le principe de deacutemocratie du Web 20 cest-agrave-dire la
superposition au reacuteseau technique drsquoun reacuteseau humain qui participe agrave la creacuteation et
agrave lrsquoenrichissement de contenus et services Lrsquointernaute deviendrait ainsi
consommrsquoacteur agrave lui de produire publier diffuser indexer partager des
contenus de tous types
Web 10 Web 20
Leaders du web Entreprises marchands Internautes
Profil de linternaute Passif Actif
Interactiviteacute perccedilue Seacutelection et lecture dinformation
Seacutelection lecture et publication de donneacutees
Uniteacute de recherche Mot-cleacute Tag
Du Web 1 vers le Web 2 Source ZDNet 8
Pour autant les internautes vont-ils devenir tous acteurs de ce processus Selon un
article de Charles Arthur dans The Guardian 9 pour un groupe de 100 personnes si
lrsquoune creacutee du contenu 10 seulement vont interagir en apportant commentaires et
ameacuteliorations les autres se contentant drsquoune consommation passive Ce constat
obtenu via des retours drsquoexpeacuterience sur des sites collaboratifs illustre la regravegle des
11089 selon laquelle plus de 80 des contenus produits proviennent drsquoun
nombre tregraves restreint drsquoutilisateurs
Tendance confirmeacutee par les chiffres preacutesenteacutes lors de la Web 20 Expo en avril 2007
et repris dans Internetactu 10 selon la socieacuteteacute de mesure drsquoaudience Hitwise11
016 des internautes qui passent sur YouTube y placent des films - alors qursquoils
eacutetaient encore 05 agrave le faire en juillet 2006 seulement 02 des visiteurs de
Flickr y publient des photos La seule exception agrave cette faible participation provient
copy Digimind Digimind Services ndash White Paper |9
Le Web 20 pour la veille et recherche dinformation DIGIMIND
de Wikipedia ougrave 46 des visiteurs contribuent agrave lrsquoenrichissement de
semblent en effet
voir eacutecrit des textes longs (en un nombre reacuteduit drsquointerventions) tandis que les
eacutediteursrdquo les plus actifs qui forment le noyau des wikipeacutediens nettoient corrigent
lective fondeacutee sur des actions agrave faible niveau drsquoexigence
(lire enregistrer un signet tagger commenter) de lrsquointelligence collaborative
caracteacuteriseacutee par des formes de participations plus actives et intenses eacutecrire
collaborer modeacutererhellip
lrsquoencyclopeacutedie
Jimmy Wales fondateur de Wikipedia estime qursquoun nombre restreint de
contributeurs et eacutediteurs font lrsquoessentiel du travail alors qursquoun nombre consideacuterable
de lecteurs apportent peu de modifications Le wikipeacutedien Aaron Swartz nuance
ce point de vue un grand nombre de contributeurs occasionnels
a
ldquo
mais sans apporter eacutenormeacutement de texte
Le Web 20 et tout particuliegraverement la blogosphegravere semble suivre la loi de la
participation eacutedicteacutee par Ross Mayfield preacutesident de la socieacuteteacute Social Text sous le
nom de Power law of participation12 Cette loi baseacutee sur lrsquoobservation des
pratiques et des seuils de participation aux dispositifs communautaires constate que
la participation srsquoamenuise agrave mesure que les formes de participation se
complexifient Le scheacutema ci-dessous qui rappelle celui de la Longue Traicircne
distingue lrsquointelligence col
Power Law of Participation par Ross Mayfield CC
copy Digimind Digimind Services ndash White Paper |10
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Le cabinet Forrester deacutetaille enc
de la participation figurant dans son eacutetude Social Technographics 13 la grille compte
6 eacutechelons correspondant aux niveaux de particip
les inactifs (52 )
les spectateurs (33 ) consommateurs de contenus texte ou multimeacutedia (blogs
videacuteos mis en ligne par les utilisateurs podcasts)
ore davantage les niveaux drsquoimplication dans la grille
ation
les menuisiers (19 ) utilisateurs de reacuteseaux sociaux
es collecteurs (15 ) utilisent des flux RSS et taggent les pages web
les critiques (19 ) postent des commentaires sur les blogs des avis et critiques
les creacuteateurs (13 ) publient des contenus en ligne (blogs videacuteos)
l
copy Digimind Digimind Services ndash White Paper |11
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Glossaire du Web 20
Pour mieux comprendre les concepts utiliseacutes dans lunivers du Web 20 nous vous
proposons ce glossaire des termes essentiels
Tags mot clef sous forme drsquo eacutetiquette que les utilisateurs peuvent apposer sur
un document numeacuterique (texte photo videacuteo) de faccedilon agrave en deacutecrire le contenu Le
tagging introduit une part de subjectiviteacute par rapport agrave lrsquoindexation automatique
effectueacutee par les moteurs Les tags peuvent eacutegalement ecirctre extraits
automatiquement drsquoun texte en fonction de leur freacutequence drsquooccurrence
Nuage de tags preacutesente les tags correspondant agrave un site (ou agrave plusieurs) en les
regroupant sur un mecircme espace et leur attribuant une taille variable suivant la
freacutequence dutilisation ou drsquooccurrence Cela donne une vision drsquoensemble des
principales theacutematiques Le site Tagcrowdcom14 permet de geacuteneacuterer un nuage de
tags agrave partir drsquoun texte
Folksonomie (traduit eacutegalement parfois par potonomie peuplonomiehellip)
Ce mot valise contraction de folk (peuple) et taxonomie deacutesigne une forme de
classification collaborative deacutecentraliseacutee spontaneacutee baseacutee non pas sur un
vocabulaire controcircleacute et standardiseacute mais sur des termes choisis par les utilisateurs
eux-mecircmes intituleacutes tags Lrsquoobjectif eacutetant de faciliter lrsquoindexation des contenus
ainsi que la recherche drsquoinformation
Blogs journal personnel disponible sur le web Peut ecirctre tenu par un particulier
un chercheur un journaliste un salarieacute drsquoentreprise ou plus rarement par un groupe
de personne (entreprise collectiviteacutehellip) Le blog a pour objet de diffuser des billets
geacuteneacuteralement lieacutes agrave lrsquoactualiteacute et preacutesenteacutes par ordre chronologique alors qursquoun
wiki est destineacute agrave la mutualisation des connaissances Un blog peut preacutesenter des
contenus multimeacutedias photo (photoblog) son ou videacuteo (vblog vlog)hellip
Blogosphegravere la biosphegravere des blogs Ce mot valise deacutesigne la communauteacute
des blogs ou encore lrsquoensemble des auteurs de blogs La blogosphegravere est largement
interconnecteacutee les trackbacks situeacutes sur la plupart des blogs permettant de lier
copy Digimind Digimind Services ndash White Paper |12
Le Web 20 pour la veille et recherche dinformation DIGIMIND
deux articles traitant de sujets connexes Lrsquoeacutelite des blogueurs particuliegraverement
influents peut ecirctre qualifieacutee ironiquement de blogeoisie
Blogroll ou blogoliste liste de liens vers drsquoautres blogs preacutesenteacutes par lrsquoauteur
drsquoun blog On peut syndiquer sur une mecircme page des billets venant de ces blogs via
les formats RSS
RSS lrsquoacronyme signifie selon les versions Really Simple Syndication (RSS 20) RDF
Site Summary (RSS 09 10 et 11) ou encore Rich Site Summary (RSS 091) Ce
format de syndication permet drsquoextraire automatiquement dun site web ou drsquoun
blog du contenu reacuteguliegraverement mis agrave jour Un fichier RSS est un simple fichier texte
au format XML comportant la description syntheacutetique du contenu Ce format a eacuteteacute
creacuteeacute en 1999 par Netscape On peut srsquoabonner gratuitement agrave plusieurs flux RSS agrave
partir drsquoun lecteur on-line ou installeacute sur le PC
Atom Format normaliseacute de syndication de contenu Web baseacute sur le XML qui
permet la syndication de contenu entre diffeacuterentes ressources Web Concurrent
de RSS Le format Atom a eacuteteacute creacuteeacute dans le but de simplifier les diffeacuterents formats
RSS existants La diffeacuterence entre les deux formats reacuteside surtout dans lemploi de
balises XML diffeacuterentes Les deux formats sont geacuteneacuteralement lus par les
agreacutegateurs
Wiki Site web dynamique dont tout visiteur peut modifier les pages agrave loisir Le
terme vient la langue hawaiumlenne (wikiwiki = rapide) Un wiki a pour objectif de
mutualiser des connaissances et est organiseacute autour drsquoun plan de classement Les
contributeurs drsquoun wiki sont geacuteneacuteralement anonymes
Crowdsourcing Litteacuteralement approvisionnement par la foule Le
crowdsourcing consiste agrave utiliser la creacuteativiteacute lintelligence et le savoir-faire dun
grand nombre dinternautes pour creacuteer des contenus participer agrave lrsquoalimentation
drsquoun site Cette participation des utilisateurs agrave la creacuteation des contenus repreacutesente
une forme drsquoexternalisation (outsourcing) et permet de reacuteduire les coucircts en se
basant sur un systegraveme de beacuteneacutevolat ou de micropaiement
Reacuteseaux sociaux de nombreux sites de social networking ou reacuteseautage social
sont apparus avec la vague du Web 20 Ils permettent de mettre en relation des
personnes partageant les mecircmes centres drsquointeacuterecirct personnels ou professionnels
Ces reacuteseaux peuvent devenir de veacuteritables communauteacutes en ligne les plus fameux
eacutetant les sites Friendster ou Myspace ou bien dans la sphegravere professionnelle
copy Digimind Digimind Services ndash White Paper |13
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Linkedin ViadeohellipLa plupart des reacuteseaux sont ouverts certains fonctionnent sur le
mode de la cooptation
Podcasts issu de la combinaison des termes iPod (dApple) et broadcasting ce
terme deacutesigne le fait de rendre disponible en ligne un fichier audio au format
numeacuterique Ce fichier peut-ecirctre teacuteleacutechargeacute directement sur un ordinateur ou un
peacuteripheacuterique via un flux de diffusion Equivalent franccedilais baladodiffusion
Lrsquoutilisateur peut ainsi se composer une liste de lecture agrave la carte Pour les fichiers
videacuteo on emploi le terme de videacuteocast
AJAX (Asynchronous JavaScript And XML) meacutethode informatique de
deacuteveloppement dapplications Web permettant deacuteconomiser de la bande passante
en ne rechargeant pas une page entiegravere alors que seuls certains eacuteleacutements ont besoin
de lecirctre mais en ne rafraicircchissant que ces eacuteleacutements de la page Cela permet de
produire des contenus dynamiques et reacuteactifs en ne neacutecessitant que peu drsquoappels au
serveur heacutebergeant la page AJAX est une combinaison de plusieurs technologies
HTML CSS Javascript XMLhellipDe nombreux sites web 20 sont deacuteveloppeacutes en
AJAX
API Interface de programmation permettant agrave un utilisateur de deacutevelopper des
applications conviviales De nombreux sites classiques ou Web 20 proposent des
API pour inteacutegrer automatiquement leur contenu agrave dautres sites
Mashup ou Mash up application web composite mixant plusieurs sources ou
plusieurs contenus pour fournir un nouveau produit ou service Le terme se traduit
en franccedilais par remixage ou mosaiumlque Exemple de mashup la visualisation des
reacutesultats des eacutelections preacutesidentielles franccedilaises via Google Earth qui mixe les cartes
Google et les chiffres du Ministegravere de lInteacuterieur
Long tail (longue traicircne) Cette expression est utiliseacutee en statistiques et peut
srsquoappliquer au marketing Des produits rares ou qui font lrsquoobjet drsquoune faible
demande peuvent collectivement repreacutesenter une part de marcheacute eacutegale ou
supeacuterieure agrave celle des best-sellers si les canaux de distribution peuvent proposer
assez de choix Le caractegravere virtuel du web permet de geacuteneacuterer une longue seacuterie de
marcheacutes de niche heacuteteacuterogegravenes (exemple e-bay) par opposition aux grands
marcheacutes homogegravenes et grand public du monde reacuteel
copy Digimind Digimind Services ndash White Paper |14
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les technologies du Web 20
Mettons dabord les choses au point le Web 20 nest pas une (r)eacutevolution ou un
concept de dimension technologique
Ses applications sappuient sur des technologies deacutejagrave existantes reacutepondant aux doux
noms dAjax Soap REST RSS Perl Python PHP Ruby ou GreaseMonkey Lobjectif de
ce document nest pas de deacutevelopper ce volet technologique Nous en eacutevoquerons
seulement les grandes caracteacuteristiques pour mieux comprendre les enjeux
Le Web 2 repose notamment sur les interfaces utilisateurs dites riches qui
permettent des possibiliteacutes daffichage de configuration et de maniement plus
puissantes que les pages html classiques du Web 1 que ce soit pour le
deacuteveloppeur ou lutilisateur final
Tim Berners Lee co-inventeur du web remarque en fait ce Web 20 utilise les
standards qursquoont produit tous ces gens qui travaillent sur le Web 10 le Document
object model HTML et SVG (Scalable Vector Graphics) HTTPhellip Le Web 20
construit des services en srsquoappuyant sur les standards du web ainsi que sur JavaScript
(hellip)
Pour se structurer en reacuteseau de bases de donneacutees et services collaboratifs le web
20 utilise donc des technologies matures acircgeacutees de 5 agrave 10 ans pour la plupart
Leacutevolution nest pas tant dans la technologie elle-mecircme que dans la faccedilon de mixer
ces technologies pour apporter des services et une ergonomie nouvelle agrave
lutilisateur
Ainsi lAjax (voir glossaire) que lon cite souvent agrave propos des technologies phares
du Web 2 nest pas un nouveau langage mais un nouveau concept qui utilise les
standards XHTML et CSS DOM (Document Object Model) pour laffichage
dynamique XML et XSLT pour leacutechange de donneacutees ainsi que la reacutecupeacuteration de
donneacutees asynchrones via XMLHttpRequest JavaScript integravegre et combine tout ces
langages Le terme Ajax a eacuteteacute apporteacute par Jesse James Garrett de lrsquoagence web
Adaptive Path
copy Digimind Digimind Services ndash White Paper |15
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LAjax permet notamment de ne recharger que certains eacuteleacutements dune page plutocirct
que la page entiegravere Lors de modifications sur une page seuls les nouveaux
eacuteleacutements se rafraicircchissent eacuteconomisant ainsi des ressources du temps et de la
bande passante Lun des preacutecurseurs grand public dans lutilisation de cette
technologie fut A9 le moteur de recherche dAmazon il neacutetait pas neacutecessaire de
recharger la page agrave chaque fois que lon ajoutait de nouvelles sources et moteurs agrave
interroger 15
Greasemonkey est eacutegalement baseacute sur des scripts Cette extension pour le
navigateur Mozilla Firefox va encore plus loin dans le pouvoir accordeacute agrave linternaute
en exeacutecutant des scripts ce plug-in 16 permet de modifier lapparence des pages
web visiteacutees dy ajouter des fonctions (boutons case agrave cocher suppression des
publiciteacutes) Lutilisateur avanceacute peut mecircme eacutecrire ses propres scripts ou
teacuteleacutecharger des scripts mis agrave la disposition de tous
Le Web 2 est en fait une sorte de web lego qui permet dinnover via lassemblage
de briques les technologies de base sont multiples il est possible de creacuteer de
nouvelles applications agrave valeur ajouteacutee en les assemblant diffeacuteremment ou plus
rationnellement
Les mash-up un mixage de plusieurs applications (voir glossaire) en est une des
illustrations les plus visibles avec les mashups on agreacutege le contenu eacutemanant de
plusieurs sites afin de creacuteer un site nouveau On utilise alors souvent lobjet XML
lAJAX du cocircteacute de linternaute les RSS et les API (Web Services) des sites mixeacutes
LAPI nest donc pas seulement un dieu eacutegyptien Pour faire simple on peut dire
que cest une interface de programmation mise agrave disposition des internautes
(avertis) pour deacutevelopper des applications Une application pourra alors acceacuteder agrave
des programmes systegraveme pour envoyer recevoir ou extraire des donneacutees Ainsi
Google publie lAPI de Google Maps qui est utiliseacute par de nombreux deacuteveloppeurs
pour creacuteer des applications deacuteriveacutees du service de cartographie de Google par
exemple la carte de suivi du teacutelescope spatial Hubble la meacuteteacuteo dans le monde 17
Le rocircle du RSS (voir glossaire) est par ailleurs preacutepondeacuterant Ce format qui
permet dexporter et lire des donneacutees dactualiteacutes au format XML se retrouve dans
quasiment toutes les applications dites Web 2 et peut en constituer lemblegraveme sinon
la caracteacuteristique majeure avec les tags Il permet de surveiller les flux de nouvelles
informations issues de sites dactualiteacutes de blogs de moteurs de recherchehellipbref
de tout site web qui propose un contenu qui se renouvelle Le RSS va aussi servir agrave
exporter des bookmarks sociaux que sont les tags ou les favoris par exemple
copy Digimind Digimind Services ndash White Paper |16
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Si le Web 2 nest pas une reacutevolution technologique en soit la relative simpliciteacute de
mise en place de ces techniques et leurs coucircts de programmation reacuteduits expliquent
le tregraves fort deacuteveloppement que connaissent toutes ces applications Par ailleurs la
baisse constante du coucirct dheacutebergement et de bande passante a faciliteacute la diffusion
de ce web nouvelle geacuteneacuteration
Mais il subsiste des effets de seuil Des applications gigantesques comme Flickr de
Yahoo offrant lheacutebergement et le partage de photos impliquent la gestion de
vastes bases de donneacutees et des infrastructures de stockage importantes Seules de
grandes firmes comme Yahoo Inc Google Microsoft ou AOL par exemple peuvent
se deacutepartir efficacement de ce type de contraintes
copy Digimind Digimind Services ndash White Paper |17
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les familles dapplications du Web 20
TYPOLOGIE
Les familles drsquoapplications Web 20 sont nombreuses et diverses de nouveaux
services apparaissent quotidiennement (sans garantie de peacuterenniteacutehellipet bien souvent
de faccedilon redondante) Sans preacutetendre dresser une liste exhaustive des nombreuses
possibiliteacutes on peut deacutegager une typologie des applications selon diffeacuterents
domaines drsquoactiviteacute Les applications speacutecifiquement deacutedieacutees agrave la veille et agrave la
recherche dinformation seront deacuteveloppeacutees dans la partie suivante
Bureautique en ligne
Courant 2006 Google a lanceacute successivement plusieurs logiciels collaboratifs en
ligne un outil de gestion drsquoagendas (Google Calendar 18) un tableur (Google
Spreadsheet) et enfin apregraves le rachat de la socieacuteteacute Writely un traitement de texte
(Google Docs) 19 Ces logiciels permettent de creacuteer modifier partager et publier en
ligne des documents sur un espace de stockage Depuis plusieurs mois on assiste agrave
une veacuteritable deacuteferlante de logiciels de bureautique en ligne deacutesigneacutes parfois sous le
terme de web office RallyPoint AjaxWrite (pour Firefox uniquement) ZohoWriter
ThinkfreehellipOutre la gratuiteacute lrsquointeacuterecirct de ces logiciels concurrents de la suite
Microsoft Office est leur disponibiliteacute sur toute machine connecteacutee au reacuteseau et tout
systegraveme drsquoexploitation Attention toutefois aux questions de sauvegarde de
compatibiliteacute de synchronisation des donneacutees et enfin de confidentialiteacutehellip
Emploi
Les blogs constituent un bon moyen pour promouvoir son CV mettre en avant
expeacuterience et compeacutetences et faciliter les eacutechanges Des jobblogs verticaux
speacutecialiseacutes par secteur ou reacutegion connaissent un grand succegraves (voir par exemple
ceux du site et moteur Moovement20) Le networking professionnel est eacutegalement agrave
la mode agrave travers des sites comme Linkedin (creacuteeacute en 2003 aux Etats-Unis) Viadeo
(ex Viaduc drsquoorigine franccedilaise) ou Xing (ex OpenBC agrave vocation europeacuteenne) Le
principe est de tirer parti des reacuteseaux de connexions sociales virtuelles afin
copy Digimind Digimind Services ndash White Paper |18
Le Web 20 pour la veille et recherche dinformation DIGIMIND
drsquoidentifier des salarieacutes ou employeurs potentiels mais aussi drsquoeacutetoffer son reacuteseau de
clients partenaires fournisseurshellip
Lrsquoe-cooptation (Cooptin Jobmeeters 21) met le reacuteseau au cœur de la deacutemarche de
recrutement via un systegraveme de prime de cooptation et peut aider les demandeurs
agrave identifier les offres du marcheacute cacheacute
Commerce en ligne
Le client est roi et le Web 20 permet de rehausser son niveau de participation sur
les sites marchands On peut ainsi tagger ou annoter des reacutefeacuterences drsquoouvrages dans
le catalogue Amazon Gracircce agrave des sites comme Zlio ou la Shoposphegravere de Yahoo22
les internautes peuvent recommander agrave leur entourage des produits et
serviceshellipen touchant une commission sur les ventes reacutealiseacutees Des guides drsquoachat
et comparateurs de prix comme Ciao integravegrent les avis de consommateurs et
drsquoexperts Le site Wantuno (inspireacute de lrsquoameacutericain Woot) innove dans le domaine
de la vente eacuteveacutenementielle en vendant un seul produit nouveau high tech par jour
annonceacute en podcast videacuteo agrave des internautes preacutevenus par flux RSS23 Certains
analystes voient lrsquoavenir du commerce eacutelectronique dans le concept de CtoB
(Consumer to Business) inverse du BtoChellip
Geacuteolocalisation
Google Maps a eacuteteacute lrsquoun des premiers services de geacuteolocalisation en srsquoappuyant sur
lrsquooutil de recherche pour localiser sur des cartes des services de proximiteacute
(commerces station servicehellip) La version 2 du site Geacuteoportail de lrsquoIGN disponible
depuis fin mai 2007 srsquoenrichit de nouveaux services pratiques et citoyens (accegraves au
cadastre visualisation des zones agrave risquehellip) Google Earth fait lrsquoobjet de partenariats
avec la NASA ou le programme des Nations Unies pour lrsquoenvironnement La
geacuteolocalisation peut srsquoadapter eacutegalement au partage de photos (Yahoo Maps et
Flickr ou le projet Pikeo chez Orange)24
Recherche drsquoinformations
Des agreacutegateurs de meacutedia comme Digg ou Wikio laissent une large place agrave
lrsquointernaute pour tagger ou recommander par vote les articles issus de meacutedias
classiques ou blogs On suivra eacutegalement lrsquoactualiteacute en syndiquant des flux RSS agrave
travers des agreacutegateurs comme Netvibes ou Newsgator Les grands moteurs (Google
Custom Search Yahoo Search Builder MSN Live search Macros) offrent des options de
copy Digimind Digimind Services ndash White Paper |19
Le Web 20 pour la veille et recherche dinformation DIGIMIND
creacuteation de moteurs personnalisables effectuant des recherches sur des bouquets
de sources preacuteseacutelectionneacutees par lrsquoutilisateur On peut mutualiser les connaissances agrave
travers des wikis collaboratifs geacuteneacuteralistes (Wikipedia) ou speacutecialiseacutes Enfin le projet
de moteur collaboratif Wikiasari qui doit aboutir courant 2007 aura recours aux
mecircmes technologies libres que la ceacutelegravebre encyclopeacutedie ainsi qursquoagrave un reacuteseau humain
ou communauteacute de confiance qui validera les reacutesultats de la recherche
Les actualiteacutes sur Wikio sites de presse blogs et navigation par tags (agrave droite)
Diffusion drsquoactualiteacutes
Pour Pierre Chappaz fondateur du site Wikio les blogueurs ne sont pas journalistes
mais ils peuvent apporter une vraie expertise sur certains sujets quils connaissent et il
serait dommage de sen priver Selon lui les meacutedias 20 ne seront plus des canaux
exclusifs de diffusion mais producteurs de contenu et des marques Deacutesormais le
scoop nrsquoest plus lrsquoapanage des seuls journalistes aux Etats-Unis une jurisprudence
donne droit depuis 2006 aux blogueurs de proteacuteger leurs sources au mecircme titre
que les journalistes professionnels Des centaines de blogs politiques ont fleuri sur le
web certains drsquoentre eux se reacuteveacutelant particuliegraverement influents On parlera de
journalisme citoyen agrave propos de sites comme Agoravox ou de lrsquo alleacutee
numeacuterique Rue 89 lanceacutee en mai 2007 par drsquoanciens journalistes du quotidien
Libeacuteration Ces nouveaux meacutedias en ligne marient les communications venant de
journalistes professionnels experts et internautes
copy Digimind Digimind Services ndash White Paper |20
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Loisirs
On retrouve ici la notion de filtrage collaboratif baseacute sur un systegraveme de
recommandations et drsquoeacutevaluations par les utilisateurs Ces recommandations
peuvent concerner les livres les destinations de voyage la musique la videacuteohellipet
proviennent de lrsquoanalyse de comportements drsquoachats des internautes et de leurs
eacutevaluations de produits Le moteur drsquoanalyse preacutedictive Criteo 25 a ainsi lanceacute en
feacutevrier 2007 un service de recommandations automatique de blogs apregraves avoir
utiliseacute sa technologie pour lrsquoeacutevaluation de videacuteos
La participation des internautes peut aller jusqursquoau financement et agrave la production
drsquoœuvres artistiques le projet A swarm of angels permet drsquoaider agrave la creacuteation de
films qui seront distribueacutes sous licence creative commons et diffuseacutes via les reacuteseaux
peer-to-peer
Partage de documents multimeacutedia
Il srsquoagit sans doute drsquoune des applications les plus reacutepandues du Web 20 Les grands
acteurs du web ont largement investi ce domaine Google a racheteacute en 2006 le site
de partage de videacuteo Youtube Yahoo de son cocircteacute avait racheteacute le site de partage de
photos Flickr Les favoris peuvent eacutegalement ecirctre mutualiseacutes via des services en
ligne comme Delicious (groupe Yahoo) ou Blogmarks De nombreux services de
partages de photos videacuteo ou podcasts se sont deacuteveloppeacutes reacutecemment on peut
citer parmi eux les sites franccedilais DailyMotion ou la banque drsquoimages Fotolia Podemus
ou Radioblog figurent parmi les sites communautaires de podcasts
Enseignement et recherche
Henry Jenkins26 professeur au MIT imagine des uniteacutes drsquoenseignement conccedilues
sur les modegraveles YouTube ou Wikipedia des deacutepartements qui ldquopermettraient le
deacuteploiement rapide drsquoexpertises disperseacutees et la reconfiguration des champsrdquo De
nouveaux usages apparaissent dans le paysage eacuteducatif mais attention lagrave encore agrave
lrsquoillusion de faciliteacute selon le philosophe Fernando Savater laquo Internet neacuteduque pas il
neacutecessite mecircme une eacuteducation preacutealable raquo Olivier Ertzcheid dans son blog Affordance 27 distingue plusieurs eacuteleacutements caracteacuteristiques drsquoune science 20 et notamment
la possibiliteacute drsquoannoter et commenter des publications scientifiques (notamment les
collections Open Acess Plos One28) ou de nouveaux modes drsquointerrogation des
bases de donneacutees (interface Hubmed sur la base meacutedicale Medline)
copy Digimind Digimind Services ndash White Paper |21
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Marie France Blanquet29 maicirctre de confeacuterence en sciences de lrsquoinformation
distingue le travail coopeacuteratif du travail collaboratif En matiegravere drsquoapprentissage le
travail coopeacuteratif reacutealiseacute par chaque eacutequipe contribue agrave une œuvre collective ougrave le
rocircle de chacun est deacutefini de faccedilon claire Lrsquoapprentissage collaboratif reacutesulte du
travail individuel soutenu par des activiteacutes de groupe ou drsquoeacutequipes de faccedilon souple
et ouverte Ce type de travail se base sur les capaciteacutes de communication et
drsquointeraction de chacun Lrsquoeacutecriture collective des articles composant lrsquoencyclopeacutedie
Wikipeacutedia en est un exemple
Plusieurs expeacuterimentations drsquousage des blogs et podcasts ont eacuteteacute tenteacutees agrave
lrsquoUniversiteacute A Lyon II des eacutetudiants ont pu enregistrer des cours sur un Ipod pour
diffusion en podcast sur leurs blogs A lrsquoUniversiteacute Catholique de Lille les eacutetudiants
de Jean-Paul Pinte30 chargeacute de lrsquoinnovation peacutedagogique doivent alimenter
reacuteguliegraverement un blog Pour ce chercheur speacutecialiste de la veille en eacuteducation le
renouveau des meacutethodes drsquoenseignement se traduit par le rocircles des Enseignants
Connecteurs et eacutetudiants proneacutetaires
Bibliothegraveques
La bibliothegraveque 20 place elle aussi lrsquoutilisateur au centre et ce agrave travers plusieurs
types drsquoexpeacuterimentations de lrsquoutilisation des logiciels de messagerie instantaneacutee
pour eacutechanger avec les utilisateurs agrave lrsquointeacutegration de tags pour enrichir les
catalogues en passant par des interfaces de consultation simplifieacuteeshellip De
nombreux blogs de bibliotheacutecaires (Bibliobsession 31) permettent de suivre lrsquoeacutetat de
lrsquoart La bibliothegraveque de lrsquoUniversiteacute drsquoAlbany est alleacutee jusqursquoagrave publier un manifeste
du bibliotheacutecaire 20 32
copy Digimind Digimind Services ndash White Paper |22
Le Web 20 pour la veille et recherche dinformation DIGIMIND
COMMENT IDENTIFIER UN SITE WEB 20
Est-ce que le site sur lequel vous naviguez ou lapplication que vous utilisez est
Web 20 Quelle importance pourrait-on reacutepondrehellipToutefois un site de cette
geacuteneacuteration offrira plus de possibiliteacutes agrave vous lutilisateur Pour reconnaicirctre un tel
site quelques caracteacuteristiques sont agrave retenir
- le type de site il appartiendra agrave lune des grandes familles citeacutees plus haut il sera
blog bookmark ou reacuteseau social mashup ou page personnalisable bref il permet
de partager et de diffuser du contenu aiseacutement Le site peut ecirctre lui-mecircme une
application Web 2 ou en inteacutegrer des briques Exemple un site Corporate qui
heacuteberge des blogs de ses salarieacutes etou diffuse son actualiteacute via un fils RSS
- le rocircle de lutilisateur le site Web 2 vous permet de participer de personnaliser
et de collaborer vous pouvez en effet ajouter des commentaires eacutecrire un billet
lire un flux RSS noter (voter) ou annoter un article teacuteleacutecharger ou uploader des
images des videacuteos eacutecouter un podcast Ces sites proposent souvent des interfaces
personnalisables couleurs style organisation de laffichage du contenuhellip
- la navigation elle est plutocirct simplifieacutee par rapport aux sites de premiegravere
geacuteneacuteration Les menus sont plus leacutegers un flux RSS est toujours proposeacute et un
nuage de tags est souvent preacutesent
- le testeur cest vous non content de faire apporter une partie de son contenu par
linternaute un service Web 20 fait en plus souvent tester ses applications agrave ses
utilisateurs et est donc freacutequemment en version becircta (voire alpha) une becircta
publique ou priveacutee (linternaute fait alors partie dun petit cercle dinitieacutes dans le
secret des dieux)
copy Digimind Digimind Services ndash White Paper |23
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les applications Web 20
pour la veille et la
recherche dinformations
LES TYPES DAPPLICATIONS
Pour le veilleur et le chercheur dinformation les applications du Web 20 sont
riches tant dans les possibiliteacutes offertes par leurs interfaces que dans le contenu
diffuseacute Mieux connaicirctre ces services permettra de trouver davantage dinformation
(ou autrement) de gagner du temps de mieux partager voire decirctre plus visible sur
le web
Vous laurez compris le web 20 se fonde essentiellement sur la notion de partage
de participation et de collaboration entre les individus Ce nest pas forceacutement
toujours facile possible voire autoriseacute dans le monde professionnel Mais partager
cest aussi agrave terme pouvoir recevoirhellip
I Partager et collaborer
a Les Bookmarks sociaux
Les bookmarks sociaux sont une des applications les plus caracteacuteristiques du Web 2
et en sont preacutecurseurs Apparus en 2004 ces services vous offrent la possibiliteacute de
partager vos bookmarks cest-agrave-dire vos favoris Ainsi apregraves enregistrement le plus
souvent gratuit vous pouvez mettre en ligne tout ou partie de vos favoris (titre
copy Digimind Digimind Services ndash White Paper |24
Le Web 20 pour la veille et recherche dinformation DIGIMIND
adresse et description dune page ou site) et les rendre potentiellement accessibles
aux internautes du monde entier et du moins aux utilisateurs de ce service Vous
avez la possibiliteacute de garder ces favoris priveacutes en ne les partageant quavec vos
proches ou seulementhellipvous-mecircme
Ces applications sont au deacutepart tregraves simples et proposent ensuite suivant les sites
plus ou moins de perfectionnements il suffit dajouter le nom et ladresse (url) de la
page web qui vous inteacuteresse assortis des commentaires de votre choix Ces
adresses web sont rattacheacutees agrave un espace qui vous est personnel auquel vous
acceacutedez en vous identifiant Cet espace personnel est identifiable via une adresse
preacutecise Par exemple sur Delicious33 (de Yahoo) lun des services de bookmarks
sociaux les plus utiliseacutes lurl deacutesignant mes favoris est httpdeliciousslide68 En
naviguant sur Delicious vous pouvez acceacuteder aux favoris mis en ligne par des
collaborateurs amis ou inconnus qui partagent les mecircmes inteacuterecircts et passions que
vous Leurs pages sont eacutegalement identifieacutees par une url unique
Lajout dadresse
Lajout dadresse seffectue en se connectant directement sur le site de
bookmarking social ou plus pratique via une barre ou un bouton deacutedieacutes qui
inteacutegreacutes agrave votre navigateur facilitent lajout du site que vous ecirctes en train de visiter
Vous pouvez eacutegalement trouver des icocircnes sur des pages web vous proposant
dajouter un contenu un site agrave votre service de social bookmaking Peut-ecirctre avez-
vous deacutejagrave rencontreacute ces icocircnes agrave la fin dun billet de blog par exemple (voir
illustration ci-dessous) Ils permettent alors dajouter ladresse du billet agrave un ou
plusieurs services de bookmarks sociaux ainsi quagrave des services dactualiteacutes
collaboratives (nous en reparlerons plus bas)
copy Digimind Digimind Services ndash White Paper |25
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ce blog propose via des icocircnes lajout de ce billet dans les favoris de Delicious ou les services sociaux dactualiteacutes
Lorsque vous ajoutez une adresse vous lui attribuez des tags (voir glossaire) cest-agrave-
dire un ou plusieurs mots cleacutes de votre choix qui vont caracteacuteriser expliquer
contextualiser eacutetiqueter le favori et donc lidentifier de maniegravere simple pour vous et
tous les visiteurs Cest une information qui vient sajouter agrave la traditionnelle
description du site Cest donc vous qui choisissez votre propre mode de
classement de hieacuterarchisation et de labellisation (et non plus un service qui vous
propose de ranger vos ressources dans des cateacutegories preacutedeacutefinies) Cette possibiliteacute
fait partie de ce que lon appelle la folksonomie agrave savoir une taxonomie (science du
classement) populaire en quelque sorte
Ainsi vous pouvez ajouter ladresse du site portail NanotechNow
httpwwwnanotech-nowcom consacreacute aux nanotechnologies et y adjoindre les
tags nano nanotehnologies sciences science research mais aussi pourquoi
pas qualiteacute excellent pour donner votre opinion
copy Digimind Digimind Services ndash White Paper |26
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Des favoris consacreacutes agrave la Chine dans Delicious A droite les tags associeacutes agrave ces bookmarks Les tags
Sur une application typique de social bookmarking (type delicious) il est possible
de rechercher sur le titre des favoris de tous les autres utilisateurs et aussi sur
leurs tags Ainsi en cliquant sur le tag Nanotech vous obtiendrez la liste de tous
les favoris que les internautes ont classeacutes sous ce label Cest lagrave lun des principaux
inteacuterecircts la possibiliteacute de rechercher sur le nom des eacutetiquettes textuelles deacutefinies
par les internautes eux-mecircmes Mais tous les internautes nont pas la mecircme logique
de classement et il est fort possible de passer agrave coteacute de favoris inteacuteressants mais
eacutetiqueteacutes selon un mot auquel vous nauriez jamais penseacute De plus un mecircme mot
peut avoir plusieurs sens ou ecirctre employeacute diffeacuteremment selon les individus
Delicious a reacutesolu ndashpartiellement- ce problegraveme en offrant la possibiliteacute de deacutecrire
ses tags cest agrave dire de les expliquer (par orange je parle de la couleur ou de la
production dagrumes en Floride) Cest donc un deacutebut de seacutemantique appliqueacute agrave
cette folksonomie Quoiquil en soit le problegraveme du sens des mots employeacutes par
les creacuteateurs de contenu concerne lensemble du web Lorsque vous ne trouvez
pas un site via une requecircte sur un outil de recherche et que ce site existe pourtant
bel et bien cest souvent parce que vous nemployez pas les mecircmes mots cleacutes que
ceux utiliseacutes par le creacuteateur du site dans son texte
Les tags peuvent eacutegalement sappliquer agrave des photos (Flickr) agrave des projets
(43Things) ou des videacuteos (YouTube DailyMotion) Ils peuvent servir aussi agrave eacutetiqueter
et cateacutegoriser les billets dun blog
copy Digimind Digimind Services ndash White Paper |27
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les communauteacutes
Lautre atout des bookmarks sociaux pouvoir constituer et se connecter avec
une communauteacute de speacutecialistes Par speacutecialiste on deacutesignera simplement un
internaute qui centre ses recherches sur les mecircmes sujets que vous quil soit
amateur ou professionnel
Exemple Votre domaine ce sont les biotechnologies En entrant la requecircte
Biotechnologies sur le moteur de recherche de Delicious vous obtenez une liste
de plusieurs milliers de favoris Pour chacun dentre eux est indiqueacute le nombre de
personnes qui ont sauvegardeacute cette mecircme adresse En seacutelectionnant lun de ces
utilisateurs vous pouvez deacutecouvrir un internaute qui comme vous reacuteguliegraverement
ajoute des adresses de sites deacutedieacutes ou connexes aux biotech Il ne vous reste plus
quagrave mettre en surveillance ce membre de delicious Il disposera en effet de sa
propre adresse XML Exemple httpdeliciousrssvantive98 Vous serez alors
averti degraves lors que cet utilisateur ajoute un favori agrave sa page
La valeur des outils de social bookmarking est encore plus probante lorsquils sont
deacutedieacutes agrave des communauteacutes de pratiques ou agrave des secteurs dactiviteacutes bien preacutecis
Plusieurs initiatives ont deacutejagrave eacuteteacute mises en ligne34 On peut citer Connotea eacutediteacute par
la ceacutelegravebre revue Nature et donc destineacute agrave un public scientifique Lors de la mise en
favoris ce service extrait automatiquement les reacutefeacuterences bibliographiques
lorsquelles sont issues de sites tels que Nature Science ou PubMed Plus ancien
CiteUlike est baseacute sur le mecircme principe mais est compatible avec davantage de
revues scientifiques encore Snipitron est lui deacutedieacute aux chercheurs eacutetudiants et
professionnels Ici vos bookmarks font partie dun projet qui seacutecoule dans le temps
concernant une recherche ou une tacircche preacutecise
Linteacuterecirct des bookmarks sociaux est donc dabord dans lutilisation de la
communauteacute afin de trouver des sources pertinentes Ce type doutil reacutevegravele toute
sa puissance lorsquun utilisateur proche de vous en terme de domaines de veille a
eacuteteacute identifieacute Vous pouvez donc alors lutiliser comme collaborateur virtuel mais
aussi rechercher parmi les sources jugeacutees pertinentes par un groupe dutilisateurs
identifier des leaders de veille ou juger de la populariteacute dune source (combien de
fois a-t-elle eacuteteacute mise en favoris Ce nombre de sauvegardes neacutetant quun indicateur
parmi dautres) Si vous ne partagez pas ces outils restent toutefois un tregraves bon
moyen de meacutemoriser et cateacutegoriser vos favoris en un point unique daccegraves
copy Digimind Digimind Services ndash White Paper |28
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Quel service
Il existe plusieurs dizaines de services de bookmarks sociaux Ils proposent des
fonctionnaliteacutes plus ou moins sophistiqueacutees Un des critegraveres essentiels de choix est
leur succegraves En effet leur force repose en grande partie sur le nombre de favoris
dutilisateurs partageacutes agrave moins de freacutequenter des bookmarks deacutedieacutes agrave des
communauteacutes tregraves cibleacutees Dautre part la rapiditeacute du service et la pertinence de
son moteur de recherche sont aussi des paramegravetres importants
Delicious qui appartient agrave Yahoo est lun des plus connus et des plus utiliseacutes Yahoo
MyWeb2 rassemble eacutegalement une grande communauteacute ainsi que Furl ou encore
Blogmarks et Blinklist35 Certains de ces sites au-delagrave de larchivage de ladresse
proposent de conserver une copie inteacutegrale dune page web Dautres vous
suggegraverent des sites similaires agrave ceux que vous avez mis dans vos favoris Cette
similariteacute se base notamment sur les favoris ajouteacutes par les autres utilisateurs La
recherche par similariteacute (ou par suggestion en fonction de vos habitudes de
navigation) offerte par des services comme Yoono StumbleUpon ou Similicious 36 est
une meacutethodologie de recherche particuliegraverement inteacuteressante Nous en reparlerons
plus loin
Pour choisir preacuteciseacutement votre service de bookmarks sociaux vous pouvez vous
aider de ces ressources 37
- le site Irox propose un tableau comparatif de pregraves de 20 services
- le blog de Robin Good offre une seacutelection inteacuteressante de bookmarks sociaux
- la page Free Bookmark Managers affiche une liste dune quarantaine de logiciels et
utilitaires deacutedieacutes au partage et agrave la gestion de vos favoris (bookmarks) en ligne via
accegraves distant en local ou sur serveur Attention tous ne sont pas sociaux cest-agrave-
dire baseacutes sur le partage
copy Digimind Digimind Services ndash White Paper |29
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b Le Multimeacutedia photos et videacuteos
Le partage de vos ressources ne se limite pas au texte et adresse de sites Il est
eacutegalement possible de partager vos photos et videacuteos
Les images
Flickr 38 racheteacute par Yahoo Inc en 2005 est lapplication type de partage dimages
voire mecircme larcheacutetype du service Web 20 ce site permet de mettre en ligne ses
photos de les partager avec ses proches ses collegravegues ou de les laisser en accegraves
priveacute
Il est possible dutiliser un moteur pour rechercher agrave travers les millions de photos
mises en ligne par les autres utilisateurs
Flickr na pas de points communs avec les nombreuses applications Web 2 en becircta agrave
linterface artisanale Sur le service de Yahoo la puissante interface en fait un outil
tregraves simple agrave utiliser Ainsi via le menu Organize vous pouvez acceacuteder agrave une
veacuteritable table de montage virtuelle pour organiser vos photos
copy Digimind Digimind Services ndash White Paper |30
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche sur Flickr A droite les noms dutilisateurs et les tags associeacutes aux photos
Comme sur les bookmarks sociaux la recherche peut seffectuer sur le titre ou la
description mais aussi sur les tags chaque internaute qui partage ses photos leur
attribue des mots cleacutes pour les deacutefinir les expliquer les contextualiser voire donner
son opinion
Chaque liste de reacutesultats chaque photo est accompagneacutee par ses tags Ceux-ci
permettent aussi daffiner ou deacutelargir votre recherche lorsque vous en seacutelectionnez
un Il est possible de rechercher sur les photos les utilisateurs mais aussi sur les
groupes En effet la notion de communauteacute est eacutegalement importante Les
groupes rassemblent les utilisateurs qui partagent les mecircmes centres dinteacuterecirct
photographiques Des forums de discussions sont inteacutegreacutes agrave ces groupes
permettant dentrer en contact direct avec certains membres
copy Digimind Digimind Services ndash White Paper |31
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Par exemple le groupe The Eyes Have It 39 rassemble les utilisateurs (et donc leurs
photos) autour du thegraveme de la communication visuelle des secteurs pharmacie et
biotech
Que peut trouver le veilleur sur un service de photos tel que Flickr
Finalement la mecircme chose que sur les bookmarks sociaux tout ce que les
membres ont voulu partager des photos du dernier salon automobile de Detroit 40
ou de la convention annuelle des industries cosmeacutetiques dAmeacuterique du Nord La
veille concurrentielle ou la veille image sur votre propre socieacuteteacute est eacutegalement
inteacuteressante Ainsi une recherche (full text) sur la socieacuteteacute peacutetroliegravere Exxon affiche
plus de 1400 photos relatives aux stations services aux puits de peacutetrole aux
raffineries aux employeacutes aux manifestions de contestataires ou aux publiciteacutes
deacutetourneacutees
Comme avec le social bookmarking vous pouvez vous attacher agrave suivre les
membres qui partagent les mecircmes centres dinteacuterecirct que vous ou votre organisation
apregraves seacutelection de la page de lutilisateur la mise en surveillance de son flux RSS
permet decirctre averti degraves que cette personne ajoute de nouvelles photos
Dautres services permettant le partage de photos existent Toutefois ils ne vont
pas aussi loin que Flickr dans la logique Web 20 Le service PhotoBucket 41 est le
grand concurrent de Flickr mais avec une approche plus grand public Flickr est
davantage freacutequenteacute par des internautes avertis des professionnels et des
passionneacutes de photographie En ce sens le service de Yahoo sera donc plus
inteacuteressant pour le veilleur
Squidoo 42 est en quelque sorte un annuaire de bookmarks perfectionneacute une
rencontre de services sociaux comme Delicious et Flickr Squidoo vous permet en
effet de creacuteer une page de liens dans un domaine qui vous passionne et de la
structurer en rubriques agreacutementeacutees de photos
Linterface simple rend possible la creacuteation rapide de pages speacutecialiseacutees (appeleacutees
lensgtobjectifs lentilles) et de les rendre visible agrave tout un chacun On trouve par
exemple plusieurs lens consacreacutees aux nanotechnologies43 Chaque lens est
accompagneacutee de tags connexes agrave son sujet
Vous pouvez rechercher ces pages gracircce agrave un moteur de recherche un reacutepertoire
par cateacutegories un nuage de tags (exemple le tag Marketing 44) ou mecircme parcourir
le Top100
copy Digimind Digimind Services ndash White Paper |32
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La videacuteo
Via les services YouTube ou DailyMotion le partage de videacuteos en ligne est plus
meacutediatiseacute que les services de photos Notamment parce que le leader Google a
racheteacute YouTube en octobre 2006 geacuteneacuterant un buzz sans preacutecegravedent au sein des
blogs et de la presse traditionnelle (Mainstream medias)
YouTube 45 et ses concurrents Web 20 fonctionnent agrave peu pregraves de maniegravere
eacutequivalente agrave Flickr sans en atteindre toutefois sa clarteacute ergonomique
Tout ces sites de videacuteos vont permettre drsquouploader (charger vers le site) et
partager vos videacuteos (converties automatiquement au format FlashVideo) et aussi
bien sucircr de rechercher parmi les videacuteos des autres utilisateurs
Sur ces applications on retrouve de nombreuses caracteacuteristiques du Web 2 les
videacuteos classeacutees par cateacutegories sont accompagneacutees de tags qui aident agrave les
contextualiser et les deacutecrire en plus du titre et de la description renseigneacutes par
lutilisateur Un fils RSS permet de surveiller lajout de videacuteos dans une cateacutegorie ou
par un utilisateur deacutefini A linstar des billets dun blog les internautes peuvent
commenter les videacuteos De plus les videacuteos sont noteacutees ce qui impacte ensuite leur
place dans le classement et donc leur visibiliteacute
Ces services contiennent des favoris inteacutegreacutes ougrave lon peut sauvegarder ses videacuteos
preacutefeacutereacutees Il est possible de partager sa videacuteo par mail ou messagerie instantaneacutee
de la poster sur son blog Dailleurs de nombreux blogueurs utilisent les services de
type YouTube (ou Flickr pour la photo) pour stocker leurs fichiers multimeacutedias trop
volumineux pour les heacutebergeurs de blogs La notion de groupe comme sur Flickr
est preacutesente des communauteacutes rassemblent des utilisateurs autour de grandes
theacutematiques lieacutees par exemple agrave la politique aux sports et aux voyages
YouTube a de nombreux concurrents aux fonctions tregraves proches Impossible de
tous les mentionner Mais on peut retenir cependant le franccedilais DailyMotion 46 tregraves
populaire dailleurs neacute quelques semaines avant YouTube Citons eacutegalement Yahoo
Videos AOL Videos Revver Grouper (de Sony) Metacafe SoapBox (de Microsoft)
Zudeo Wideo MySpace Vimeo 47Certains de ces services proposent du contenu
amateur ainsi que des films professionnels issus des networks de TV et de cineacutema
Mais les plus petits services se cantonnent aux videacuteos envoyeacutees par linternaute que
celles-ci aient dailleurs eacuteteacute copieacutees ou non
copy Digimind Digimind Services ndash White Paper |33
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche sur DailyMotion
Quel contenu agrave usage professionnel le veilleur peut espeacuterer trouver sur ces
plateformes Essentiellement des videacuteos consacreacutees agrave des socieacuteteacutes et individus
Ainsi si je reacuteitegravere ma recherche sur la socieacuteteacute peacutetroliegravere Exxon jobtiens des videacuteos
sur des manifestations des mareacutees noires le reacutechauffement climatique des
actualiteacutes boursiegraveres des retransmissions de procegraves des deacutetournements de
publiciteacutehellipLa recherche de videacuteos saverra particuliegraverement utile pour une veille
Image Produits ou concurrentielle Le contenu de videacuteos est eacutegalement souvent
tregraves politique agrave partir de la campagne des eacutelections preacutesidentielles franccedilaises de
2007 la diffusion de videacuteos sur les hommes et femmes politiques est devenue une
veacuteritable arme Autre aspect inteacuteressant la possibiliteacute de deacutecouvrir de nombreux
extraits de videacuteos de documentaires sur des sujets extrecircmement varieacutes eacutecologie
industrie socieacuteteacute consommation
Le contenu de ces services de videacuteos est donc agrave limage du net heacuteteacuterogegravene mais
potentiellement riche
copy Digimind Digimind Services ndash White Paper |34
Le Web 20 pour la veille et recherche dinformation DIGIMIND
c Partage de CV et reacuteseaux sociaux
Termineacute le temps ou seules les personnes agrave qui vous transmettiez votre CV ou
votre carte de visite pouvaient prendre connaissance de votre identiteacute et de votre
parcours professionnel Via les plateformes de reacuteseaux sociaux le push fait place au
pull de plus dans une optique de cooptation et de recommandation il y est
possible de mettre son CV en ligne sous format hypertexte et de demander agrave
rentrer en relation avec des proches de votre reacuteseau immeacutediat Les plateformes de
reacuteseaux sociaux sont nombreuses certaines sont agrave vocation geacuteneacuteraliste dautres
uniquement deacutedieacutees aux actifs dautres encore reacuteserveacutees agrave une communauteacute
(eacutetudiants lyceacuteens anciens eacutelegraveves passionneacutes de voyages)
Ces applications repreacutesentent un marcheacute conseacutequent puisque pour les seuls USA
on preacutevoit un chiffre daffaires des reacuteseaux sociaux de 25 milliards de dollars agrave
lhorizon 2011 contre 350 millions en 200648 La France est domineacutee par la
plateforme Viadeo (ex-Viaduc)49 Ce service leader lanceacute en 2004 compte plus de
750 000 profils Dans les autres pays cest LinkedIn 50 qui domine geacuteneacuteralement
avec plus de 9 millions dutilisateurs dans 135 pays
Une recherche sur Viadeo
copy Digimind Digimind Services ndash White Paper |35
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les fonctionnaliteacutes
Que trouve-t-on sur ces sites Notamment des profils de personnes en activiteacute ou
en recherche demploi ainsi que des hubs regroupant des utilisateurs autour dun
mecircme centre dinteacuterecirct toujours la notion de communauteacutes de pratiques propre au
Web 20 Sur ces services tout est penseacute pour creacuteer du lien social Le profil
individuel se constitue dun CV enrichi de nombreux liens vers ses employeurs ses
amis ses reacuteseaux professionnels et associatifs ses travaux et publications Les hubs
regroupent les personnes autour de secteurs meacutetiers associations danciens eacutelegraveves
pays reacutegions Par exemple sur Viadeo saffichent les hubs Analyse Veille
Strateacutegique amp Concurrentielle Intelligence Eco Blogs amp Bloggers Editeurs de
Logiciels Profession documentaliste and co mais aussi Grande distribution
Oceacuteanie ou Normes meacutethodes et outils Dans ces hubs des forums organisent les
discussions des membres autour de theacutematiques deacutefinies Un moteur de recherche
permet de trouver des profils selon un secteur une fonction une reacutegion Une fois
un profil identifieacute il faut demander agrave entrer en relation avec lui Cela sera dautant
plus facile et rapide sil est peu eacuteloigneacute de votre propre reacuteseau de contacts
La veille
Linteacuterecirct pour le professionnel de linformation est double il peut augmenter sa
visibiliteacute et celle de certains de ses projets services publications thegraveses ou articles
Dautre part il peut rechercher des donneacutees sur des personnes et entreprises ou
identifier un expert Comme sur dautres services Web 20 il est facile de se
constituer une communauteacute dutilisateurs partageant ses centres dinteacuterecirct que lon
visitera reacuteguliegraverement Ainsi sur Viadeo une recherche sur le secteur Agro-
alimentaire avec le mot cleacute veilleur 1 affiche plus de 50 reacutesultats avec les fonctions
entreprises et synthegraveses de parcours des membres Vous pouvez alors entrer en
relation avec ces personnes ou tout simplement collecter des donneacutees sur celles-ci
et leurs reacuteseaux Ces sites sont dailleurs devenus un outil essentiel pour certaines
fonctions commerciaux pour la prospection recruteurs journalistes
ethellipresponsables de casting pour eacutemissions TV
1 Certaines fonctionnaliteacutes avanceacutees sont payantes
copy Digimind Digimind Services ndash White Paper |36
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les autres reacuteseaux
Parmi les autres services de reacuteseaux sociaux outre LinkedIn davantage tourneacute agrave
linternational il existe assez utiliseacutes en France 6nergiesnet et Xing (ex Open BC)51
Les reacuteseaux ciblant plus particuliegraverement les jeunes (FaceBook MySpace) peuvent
eacutegalement ecirctre utiliseacutes MySpace feacutedegravere plus particuliegraverement des professions de la
communication de la publiciteacute et des meacutetiers multimeacutedias
Le reacuteseau FaceBook52 est original ce site nord-ameacutericain est preacutecurseur dun social
networking tregraves segmenteacute reacuteserveacute aux eacutetudiants et aux lyceacuteens Au deacutepart les
membres devaient sinscrire obligatoirement via lemail de leur universiteacute afin de
garantir lauthenticiteacute des profils et donc le seacuterieux de la communauteacute Depuis
FaceBook sest ouvert aussi aux entreprises Ainsi ce site capte tregraves tocirct les futurs
actifs et les fideacutelise
Des ressources
Certaines ressources peuvent vous aider agrave identifier les plateformes de reacuteseaux
sociaux professionnels utiles pour vos recherches Le wiki List of social networking
websites liste de nombreuses plateformes de reacuteseaux sociaux 53 et le site Link n
Rank cateacutegorise des sites de social networking 54
copy Digimind Digimind Services ndash White Paper |37
Le Web 20 pour la veille et recherche dinformation DIGIMIND
d Les sites dactualiteacutes collaboratives recommandation et notation
Ces sites recouvrent en fait diffeacuterents types dapplications
- Les Digg Like Ces services qui sinspirent tous du preacutecurseur Digg55 recueillent des actualiteacutes
proposeacutees par les internautes Le principe apregraves enregistrement un formulaire
simple vous permet de poster lactualiteacute de votre choix susceptible dinteacuteresser les
autres internautes son titre son url sa description Il faut aussi choisir une
cateacutegorie Par exemple Technologies Sciences Monde Affaires Divertissement Ces
cateacutegories peuvent ecirctre subdiviseacutees en theacutematiques plus fines Lactualiteacute si elle est
valideacutee par les modeacuterateurs apparaicirctra alors en ligne Elle sera noteacutee par les autres
internautes qui votent pour elle selon son inteacuterecirct Les actualiteacutes disposant du plus
grand nombre de points se placent alors en haut du classement
La cateacutegorie Sciences sur Digg A gauche les nombres de votes
Ces sites affichent les principales caracteacuteristiques du Web 20 interface eacutepureacutee
possibiliteacute de laisser des commentaires fils RSS pour surveiller les nouvelles
actualiteacutes classement des articles les plus lus les mieux noteacutes possibiliteacute denvoyer
par mail ou de bloguer un article et bien sucircr forte contribution de linternaute Sur
certains sites leacutetiquetage des articles via le systegraveme de tags est proposeacute
copy Digimind Digimind Services ndash White Paper |38
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Linteacuterecirct est de pouvoir positionner certaines informations les unes par rapport aux
autres et connaicirctre la populariteacute dune actualiteacute ou dun sujet (entreprise personne)
abordeacute (la critique de mon produit est-elle tregraves populaire ) Cest une approche
alternative aux agreacutegateurs de news de type Google Actualiteacutes ou Yahoo Actualiteacutes
qui hieacuterarchisent les news avec de puissants algorithmes mais sans recourir agrave
lhumain Ainsi Google Actualiteacutes preacutecise La seacutelection et le positionnement des
articles de cette page ont eacuteteacute reacutealiseacutes automatiquement par un programme
informatique
En outre sur ces services de type Digg linformation nest pas brute linternaute
qui poste lactualiteacute peut selon son expertise y apporter un commentaire de
valeur Linformation peut ecirctre commenteacutee (en plus du vote) par les autres
internautes Comme de nombreux blogueurs les utilisateurs des Digg Like jouent
aux journalistes ou tout simplement donnent leur opinion
Lorsquil sagit dactualiteacutes concernant le produit ou le service dune socieacuteteacute ces
commentaires positifs ou non sont une veacuteritable manne pour de nombreux
professionnels de linformation veilleurs marketeurs chargeacutes deacutetudes et autres
analystes qui vont pouvoir recueillir agrave moindre frais des informations sur leur
nouveau produit leurs clients ou ceux de la concurrence
Digg est lun des sites les plus copieacutes du Web 20 Sil reste la reacutefeacuterence dautres
applications tregraves largement inspireacutees tirent leur eacutepingle du jeu En France Scoopeo
Fuzz et TapeMoi offrent eux aussi des services dactualiteacutes collaboratives On peut
eacutegalement citer Rojo le canadien Niouz lespagnol Meneames le reacuteseau de sites
BlogMemes 56 Mecircme Netscape pionnier du navigateur web a lanceacute un portail
sinspirant du systegraveme de notation de Digg
On peut reprocher agrave ce type de site de favoriser les cateacutegories techniques et
scientifiques faisant la part belle aux contributions des geeks et autres accrocs du
net grands utilisateurs de services Web 2 Toutefois les sites comme Blogmemes ou
Netscape diffusent davantage dactualiteacutes agrave teneur eacuteconomique et sociale
- Les mix actualiteacutes contributions des internautes
Wikio57 est un service dorigine franccedilaise (creacuteeacute par le fondateur de Kelkoo) agrave
lintersection de Google Actualiteacutes et de Digg En effet Wikio mixe les articles issus
de sites dactualiteacutes de blogs avec des contributions des internautes On peut
prendre connaissance des informations de diffeacuterentes maniegraveres
copy Digimind Digimind Services ndash White Paper |39
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- En naviguant via les theacutematiques (France International Politique Economie
Finance Santeacute Science hellip) ou via le nuage de tags dynamiques qui se modifient en
fonction de la rubrique ou vous vous situez
- En recherchant via le moteur
- En sabonnant aux flux RSS agrave chaque cateacutegorie et agrave chaque tag correspond son
flux RSS De mecircme lorsque vous lancez une requecircte via le moteur vous pourrez
surveiller ces reacutesultats via un flux RSS
- les plateformes de contributeurs indeacutependants
La deacutefiance et la volonteacute dindeacutependance vis-agrave-vis des grands meacutedias traditionnels de
la presse eacutecrite et audio-visuelle se sont traduites degraves 2001 par la creacuteation massive
de blogs Les blogueurs sont-ils et peuvent-ils simproviser journalistes Ce deacutebat
qui promet decirctre sans fin est inteacuteressant De nombreux blogueurs (mais pas la
majoriteacute) sont devenus de veacuteritables experts dans leur domaine agrave force deacutecriture
de lecture et danalyses quotidiennes Ainsi les mainstream medias invitent
maintenant dans leurs colonnes et plateaux les blogueurs les plus talentueux
Ces blogueurs experts ou professionnels ne constituent pas les seuls creacuteateurs
dactualiteacutes alternatives
Des initiatives de plateformes dactualiteacutes eacutecrites par des non professionnels ont
aussi vu le jour Agoravox58 est lun des premiers portails de journalisme citoyen
lanceacute par Joeumll de Rosnay et Carlo Revelli 59 en mai 2005 Agoravox permet aux
internautes de proposer leurs articles pour commenter reacutefleacutechir agrave des sujets
dactualiteacutes si possible avec une approche et un regard diffeacuterents des meacutedias
traditionnels Le format des contributions est multimeacutedia Le site explique Tout le
monde peut devenir reacutedacteur drsquoAgoraVox Il nrsquoest pas neacutecessaire de savoir eacutecrire avec
un style journalistique affirmeacute Chacun drsquoentre nous peut devenir une sorte de capteur
en temps reacuteel de ce qui se passe dans notre entourage en fournissant des articles des
images des extraits videacuteo ou audio Ce qui est important crsquoest de pouvoir teacutemoigner
drsquoun eacuteveacutenement auquel vous avez assisteacute ou que vous avez deacutecouvert en faisant des
recherches Il poursuit Pourquoi devenir reacutedacteur Tout simplement pour faire
entendre votre voix et pour relater des faits que vous avez identifieacutes et qui ne vous
paraissent pas ecirctre suffisamment repris dans les meacutedias traditionnels voire ignoreacutes ou
censureacutes
Agoravox encourage donc agrave utiliser son style personnel Il convient de sinscrire pour
devenir reacutedacteur Les articles doivent toutefois obeacuteir agrave une politique eacuteditoriale60
Un comiteacute de reacutedaction valide ensuite les contributions
copy Digimind Digimind Services ndash White Paper |40
Le Web 20 pour la veille et recherche dinformation DIGIMIND
En quelques mois Agoravox a prouveacute que de simples internautes pouvaient ecirctre
aussi bon reacutedacteurs et experts en fonction de leurs profession passion et
centres dinteacuterecirct agrave linstar des blogueurs professionnels
Agoravox na pas la vocation dun agreacutegateur dactualiteacutes de type Digg Wikio ou
Google News Cest une sorte de quotidien qui privileacutegie les articles de fond et
lanalyse Bien sucircr des reacutedacteurs stars eacutecrivent reacuteguliegraverement et leurs articles
sont attendus Mais ce ne sont pas les rubriqueurs traditionnels des autres meacutedias
Comme sur les autres sites Web 20 le lecteur peut attribuer une note dinteacuterecirct agrave
chaque article et poster un commentaire Enfin leacutetonnante technologie
ReadSpeaker 61 permet de retranscrire automatiquement tous les textes en version
audio
Agoravox nest pas le seul exemple de site de journalisme citoyen Le portail
OhMyNews 62 initiative coreacuteenne est baseacute sur le mecircme principe Lanceacute en feacutevrier
2000 le reacuteseau international OhMyNews reacuteunit plus de 40 000 reacutedacteurs
Pour le veilleur ces sites dactualiteacutes collaboratives constituent des sources
dinformations alternatives avec une partie de lactualiteacute issue des organes et
agences de presse et lautre partie provenant des internautes Dautre part ces
nouveaux meacutedias permettent de deacutecouvrir et surveiller des experts voire des
leaders dopinion
Un article sur Agoravox A droite une preacutesentation de son auteur En haut la possibiliteacute de voter et
commenter larticle
copy Digimind Digimind Services ndash White Paper |41
Le Web 20 pour la veille et recherche dinformation DIGIMIND
II Rechercher Collecter
Doreacutenavant tout internaute peut creacuteer et publier sa propre information
Lidentification des sources dinformation et de linformation elle-mecircme est devenue
complexe car elles sont de plus en plus morceleacutees et atomiseacutees Il convient
dutiliser une large palette doutils de recherche pour collecter les donneacutees en
provenance des blogs des bookmarks et reacuteseaux sociaux Pour faciliter la
collecte il est en outre possible de verticaliser la recherche et de faire appel agrave des
humains Par ailleurs dautres outils permettent darchiver ses deacutemarches de
requecirctes et de navigation
a La recherche de blogs et de flux RSS
Le volume de blogs est en constante croissance sur le net Le nombre de blogs a
litteacuteralement exploseacute sur toute la planegravete Estimeacute agrave 70 millions agrave leacuteteacute 2005 ils sont
eacutevalueacutes agrave plus de 120 millions en mars 2007 Technorati lun des moteurs de
recherche de blogs les plus utiliseacutes mesure en 2007 un doublement du nombre de
blogs tous les 320 jours 120 000 blogs seraient ainsi creacuteeacutes chaque jour 63
Europe
33
Afrique 15 000
Ameacuterique du Nord
33
Ameacuterique du Sud
1
Asie
55
5 Australie 790 000
copy Digimind Digimind Services ndash White Paper |42
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Nombre de blogs en milliers et millions (la Russie est inteacutegreacutee dans lAsie) Estimation DIGIMIND Services 64
Les fils RSS omnipreacutesents A chaque blog correspond son flux RSS ce format qui permet dextraire et de
surveiller tout nouveau contenu qui parait sur le blog Si un vrai blog implique
toujours un flux RSS un flux RSS ninduit pas forceacutement un blog En effet le RSS et
son concurrent Atom sont preacutesents sur de plus en plus de type de meacutedias et outils
internet degraves lors que leur contenu est appeleacute agrave se modifier reacuteguliegraverement
On pourra donc trouver des flux RSS sur
-les blogs
-les sites de presse et dactualiteacute Exemple Les Echos Libeacuteration La Tribune Le
Figaro)
-les sites de revues et magazines speacutecialiseacutes Exemple La revue Nature propose ses
fils RSS concernant ses publications speacutecialiseacutees par domaines Science fait de
mecircme65
-les sites corporate des entreprises page dactualiteacutes catalogues produits (Ex Air
Liquide)
-les reacutesultats de moteurs de recherche de blogs Tous proposent des flux RSS
permettant de surveiller une requecircte (Technorati Google Blog Search Feedster
IceRockethellip)
-les pages de reacutesultats de moteur de recherche web Certains de ces moteurs
geacutenegraverent un flux RSS permettant de surveiller lapparition de nouveaux reacutesultats
pour une requecircte donneacutee
MSN Search (devenu Live Search66) le proposait depuis janvier 2005 et chaque page
de reacutesultats offrait une icocircne orange en bas de page permettant dobtenir des fils
RSS Cette icocircne RSS a disparu sur Live Search mais les flux RSS sont toujours lagrave (ils
sont deacutetectables automatiquement avec un navigateur Firefox Maxthon IE7 ou
votre lecteur RSS Attensa ou RSS Bandit par exemple)
Depuis peu Yahoo Search Web 67 offre lui aussi un fils RSS sur ses reacutesultats lagrave
encore deacutetectable via un lecteur ou navigateur (cela fonctionne uniquement pour le
Yahoo US)
copy Digimind Digimind Services ndash White Paper |43
Le Web 20 pour la veille et recherche dinformation DIGIMIND
-les moteurs dactualiteacutes La majoriteacute des portails qui agregravegent des flux dactualiteacutes
proposent des flux RSS Exemple Google Actualiteacutes Yahoo Actualiteacutes Topix MSN
Actualiteacutes Wikiohellip 68
-les Newsgroups Usenet (groupes de discussion) Les fils RSS sont en effet aussi
preacutesents sur Google Groupes (ou Google Groups) ce qui rend plus aiseacute la surveillance
des discussions Chaque groupe (Google ou Usenet) affiche un fils RSS ou Atom 69
(et ce quelque soit la langue) signaleacute par le logo orange RSS en bas de page
-certains forums web Exemple Forum Mobiles 70
-certaines listes de diffusion elles peuvent ecirctre surveilleacutees via labonnement agrave leur
flux RSS Cela eacutevite lengorgement de votre boicircte mail Exemple la liste Veille sur
Yahoo Groupes 71 dispose dun flux RSS
-les bookmarks sociaux Delicious Yahoo MyWeb2 Blogmarks 72hellipLe fils RSS
permet decirctre alerteacute de lajout de nouveaux favoris pour un tag ou un utilisateur
deacutefinis
-les plateformes de partage de photos Exemple Flickr PhotoBucket 73
-les services de partage de videacuteos comme YouTube DailyMotion 74 pour ecirctre alerteacutes
des nouveauteacutes
-de tregraves nombreux sites offrant un contenu qui se renouvelle
copy Digimind Digimind Services ndash White Paper |44
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Veille Corporate La Tribune propose des flux RSS segmenteacutes par socieacuteteacutes
Le veilleur via ces flux RSS pourra surveiller de nombreuses sources
dinformations Par ailleurs au-delagrave des blogs introspectifs dadolescents dont peu
preacutesentent un inteacuterecirct pour les professionnels certains types de blogs peuvent se
reacuteveacuteler utiles
-Le blog dactualiteacute et dopinion preacutesentant reacuteflexions et critiques de journalistes et
internautes
-Le blog theacutematique eacutediteacute par des passionneacutes experts professionnels consultants
et techniciens
-Le blog dentreprise outil de communication externe ou interne agrave linitiative des
salarieacutes ou des dirigeants
copy Digimind Digimind Services ndash White Paper |45
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les outils pour trouver des blogs et flux RSS Sur ces moteurs la recherche seffectue par mots cleacutes classiques ou par tags comme
sur Technorati par exemple Le contenu indexeacute (blogs et flux) est tregraves heacuteteacuterogegravene
Aussi lutilisation de la recherche avanceacutee sur ces outils est souvent neacutecessaire En
effet un blog peut avoir abordeacute la theacutematique deacuteveloppement durable 1 seule fois
parmi ses 4500 billets Il conviendra donc alors de centrer sa recherche sur le titre
du blog ou son url
Les moteurs
Certains moteurs sont deacutedieacutes agrave la recherche de blogs Cest en fait un abus de
langage Ces moteurs se focalisent sur la recherche de flux RSS mais ne peuvent
faire la diffeacuterence entre un flux provenant dun grand journal et celui dun blog
Ainsi le moteur Technorati classe parmi les blogs les plus populaireshellipLe Figaro
Pour mener une recherche efficace il conviendra dutiliser plusieurs moteurs Car
comme pour la recherche web ougrave il ne faut pas se limiter agrave Google au risque de
manquer pregraves de 85 des reacutesultats75 la recherche sur les blogs neacutecessite lemploi
de plusieurs outils76 En voici quelques-uns
gt Google Blog Search Recherche de blogs Google applique sa technologie puissante
aux flux RSS et blogs Linterface est notamment disponible en franccedilais et en anglais
Le moteur est doteacute de fonctions de recherche avanceacutee (recherche sur le titre le
billet recherche par ancienneteacutehellip)
gt Ask Blog amp Flux Ce moteur permet de rechercher parmi les blogs les flux XML
(RSS ou Atom) Et aussi de sabonner agrave un blog ou un flux RSS
gt Feedster Ce moteur recense plus de 900 000 sources et 5000 sont rajouteacutees
chaque jour
gt BlogPulse Indexe plus de 46 millions de blogs
gt Technorati Ce moteur rafraicircchit son index toutes les 5 agrave 15 minutes et
recherche parmi plus de 70 millions de blogs (en avril 2007 77) ou sites proposant
des flux RSS Il est possible de rechercher par mots cleacutes ou par tags
gt Sphere va prendre en compte plusieurs variables pour mieux chercher parmi la
blogosphegravere
- comme pour le contenu web classique les reacuteseaux de liens entrants et sortants
- la qualiteacute de ces liens
copy Digimind Digimind Services ndash White Paper |46
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- les internautes agrave lorigine de ces liens (simple commentateurs ou leaders dopinion)
3 moteurs web integravegrent la recherche sur les blogs au sein de leur recherche
avanceacutee 78
gt Yahoo Search
Pour centrer sa recherche sur les flux RSS et les blogs il convient drsquoaller dans la
recherche avanceacutee (agrave droite de la boite de requecircte) puis dans le menu deacuteroulant
Format de fichiers et de seacutelectionner le format RSSXML
gt Exalead
Apregraves avoir effectueacute votre recherche il suffit de cliquer sur le bouton RSS jaune
dans la fenecirctre Preacuteciser la recherche Au sein des reacutesultats de recherche le flux
RSS est disponible via licocircne RSS Simple et propre
gt Microsoft MSN Live Search
MSN a ameacutelioreacute les interfaces de son moteur pour restreindre la recherche sur les
fils RSS Apregraves laffichage de votre page de reacutesultats vous pouvez affiner votre
recherche gracircce au bouton Flux (ou Feed en anglais) Ce bouton est accessible via
le menu Plus Au sein des reacutesultats de recherche sont alors disponibles lurl du flux
le cache et un lien pour sinscrire au fils RSS
Au-delagrave de ces moteurs speacutecialiseacutes il peut ecirctre beacuteneacutefique de tenter une recherche
sur un moteur Web (Google ou Yahoo Search par exemple) de type blog OR RSS
[votre sujet] Exemple blogs sur les teacuteleacutecoms Cela vous permettra non pas de
chercher au sein des blogs mais de trouver dautres blogs
Les reacutepertoires 79
Comme pour le web un certain nombre dannuaires entendent recenser les blogs
et fils RSS Attention comme la blogosphegravere est tregraves mouvante et en constante
croissance ces guides sont par nature non exhaustifs et leur mise agrave jour reacuteguliegravere
est difficile
gt Blogarama Ce reacutepertoire recense plus de 49 000 blogs classeacutes par cateacutegories
gt RSS Network indexe plus de 150 000 fils RSS
gt RSSFeeds Reacutepertorie plus de 119 000 fils organiseacutes en cateacutegories
copy Digimind Digimind Services ndash White Paper |47
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b La recherche par tags
Nous lavons vu avec la Folksonomie linternaute peut deacutesormais mettre en place et
partager sa propre classification via les tags Lutilisateur affecte leacutetiquette de son
choix agrave ses favoris images videacuteos Lavantage est indeacuteniable cest linternaute qui
deacutefinit son eacutetiquette et non plus un organisme Mais les inconveacutenients sont
nombreux difficile gestion des singulierspluriels problegraveme de synonymes de
signification (que deacutesigne cet internaute par ce tag) dhomonymes de polyseacutemie
dheacuteteacuterogeacuteneacuteiteacute plusieurs tags peuvent designer les mecircmes documents
Toutefois lapproche par tag facilite la recherche dune part en ajoutant une couche
seacutemantique aux documents web et dautre part en permettant une navigation par
concepts de plus en plus abandonneacutee compte tenu de la deacutesertion progressive des
cateacutegories des grands reacutepertoires web par les internautes
De plus on peut tagger pratiquement tout type de contenu web Ainsi les sites 43
Things et son eacutequivalent franccedilais 36 Trucs 80 proposent aux internautes de lister
leurs objectifs expeacuteriences ou projets Chacun de ces projets est taggeacute via un ou
plusieurs mots cleacutes
Les moteurs et meacutetamoteurs de tags
Les moteurs
La plupart des applications de social bookmarking ou de partage de fichiers images
ou videacuteos permettent donc de tagger leur contenu Sur certaines le moteur de
recherche interne rend possible en plus de la recherche sur le full text une
recherche centreacutee sur les tags Cest le cas sur Flickr vous pouvez rechercher au
choix sur le titre et la description des images ou sur les tags associeacutes deacutefinis par les
utilisateurs qui ont placeacute leurs photos
Un outil comme Delicious tag search 81 va vous permettre deffectuer des
recherches via un ou plusieurs tags sur le service de social bookmarking Delicious
Pour la recherche de blogs ou flux RSS le moteur Technorati propose une
recherche classique sur les mots cleacutes contenus dans les billets mais aussi une
copy Digimind Digimind Services ndash White Paper |48
Le Web 20 pour la veille et recherche dinformation DIGIMIND
recherche par tags82 En effet leacutediteur dun blog peut tagger chacun de ses billets
via des mots cleacutes qui les cateacutegorisent Ces mots ou tags seront repris par lindex du
moteur Ainsi la recherche du mot pollution parmi les tags affiche un billet sur le
reacutechauffement climatique Si ce billet est bien cateacutegoriseacute par son auteur dans une
rubriquepollution (parmi dautres) il ne contient pas ce mot dans son texte
toutefois en relation avec le concept de pollution Clairement une recherche
classique sur le seul texte des billets naurait pas rameneacute ce billet ou du moins pas
dans les premiers reacutesultats Autre inteacuterecirct Technorati vous propose des tags
associeacutes Ainsi pour pollution il affiche environment politics global warming science
china energy news air climate climate change autant de mots cleacutes pour eacutelargir ou
affiner vos requecirctes
Le moteur SearchLess 83 offre une approche originale il associe la recherche par
mots cleacutes agrave la recherche par tags Ainsi si vous effectuez une requecircte avec le mot
intelligence vous pouvez preacuteciser par le tag CIA Les reacutesultats seacutelectionneront
donc le mot intelligence sur des contenus (billets de blogs par exemple) taggeacutes CIA
par lutilisateur lui-mecircme on est alors sucircr que les 2 concepts sont intimement lieacutes
Meacutetamoteurs
Des meacutetamoteurs 84 permettent de rechercher sur les diffeacuterents types de contenu
sociaux bookmarks images videacuteos
Ainsi Tag Central agreacutege de nombreux formats web taggeacutes En lui indiquant un
tag il affiche des reacutesultats provenant agrave la fois de Flickr Smugmug (photos)
Technorati (blogs) Blogmarks Connotea Furl delirious (bookmarks sociaux) ou
encore 43Things (listes de projets)
Zewol outil de meacuteta syndication francophone permet de rechercher parmi les tags
(Flickr delicious) mais aussi sur les actualiteacutes (Google News Ask Actualiteacutes
Yahoo Actualiteacutes) les blogs (Technorati IceRocket Google Blog Search Ask
Blogshellip) le buzz (Tapemoi Scoopeo Wikipedia) les videacuteos (Google Videos
Podscope Video Daily Motion) et un mix (Furl Echonimo actualiteacutes Plazoo
Feed24) Concregravetement cest une bonne approche de recherche globale sur de
nombreuses ressources de type Web 20
Il est toujours possible de traquer la preacutesence ou lapparition dun mot clef sur le
web via la mise en surveillance du flux RSS de la requecircte
Ketoag est un outil qui permet dinterroger de nombreux services sociaux
copy Digimind Digimind Services ndash White Paper |49
Le Web 20 pour la veille et recherche dinformation DIGIMIND
(Delicious Furl Diig Wikio Blinklist) mais eacutegalement des moteurs de recherche
(Google Blog Search) Par ailleurs vous pouvez geacuteneacuterer pour chaque requecircte un
flux RSS mais aussi un fichier OPML (format permettant lagreacutegation et leacutechange de
listes de flux RSS)
Gnosh est un meacutetamoteur qui recherche parmi les moteurs web les moteurs de
blogs et les outils de partage de favoris De plus une recherche sur longlet People
vous permet de rechercher parmi les favoris des internautes inscrits agrave la
communauteacute Gnosh
Exalead recherche sur Wikipedia A droite le nuage de tags
Les nuages de tags
Ces nuages regroupent un ensemble de tags dans un mecircme espace en affectant agrave
chacun une taille variant selon leur populariteacute (freacutequence dutilisation ou de requecircte
sur ces mots) ou la densiteacute darticles auxquels ils se reacutefeacuterent (deacutepecircches dactualiteacutes
par exemple)
Les nuages de tags sont devenus agrave la mode car ils permettent une navigation facile
tregraves visuelle au sein dun site dune base de donneacutee ou des reacutesultats dun moteur
Ils apportent une grille de lecture suppleacutementaire agrave des sites dont les menus sont
souvent surchargeacutes ou le contenu atomiseacute
copy Digimind Digimind Services ndash White Paper |50
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Nombreuses sont les applications qui utilisent le nuage de tags pour optimiser la
navigation et mettre en valeur leur contenu le partage de videacuteos (DailyMotion) les
bookmarks sociaux (Delicious MyWeb2 de Yahoo) ou les services dactualiteacutes
collaboratives comme Wikio Certains moteurs comme Exalead ont eacutegalement
choisis dafficher des nuages de tags au sein de leurs pages de reacutesultats Dans ce cas
il sagit dune aide agrave laffinage des requecirctes un clic sur un tag va afficher une
nouvelle page de reacutesultat prenant ce mot en compte
Zibb85 moteur de recherche vertical deacutedieacute au Business to Business utilise aussi le
nuage de tags pour visualiser clairement les mots cleacutes de theacutematiques connexes les
plus freacutequents agrave votre requecircte
Dautres sites plus classiques ont eacutegalement choisi lapproche du nuage de tag pour
rendre leur navigation plus attractive et leurs rubriques plus visibles Ainsi le site
Ecrans 86(du journal Libeacuteration) affiche en bas agrave droite un nuage de tags mettant en
valeur son contenu tregraves touffu
Certains outils proposent de geacuteneacuterer des nuages de tags pour des sites ou moteurs
nen disposant pas
Google Tag Cloud Maker 87 est un script pour Firefox qui permet dafficher un nuage
de tags agrave droite des reacutesultats de Google plus un mot est freacutequent dans les reacutesultats
de votre recherche plus la taille dun tag est importante
Newzingo 88 extrait des mots de Google News pour constituer un nuage
doccurrences parmi les termes de lactualiteacute Plus le terme est gros plus les articles
relatifs agrave ce terme sont nombreux Techzingo reacutealise le mecircme process mais cette
fois les cibles sont des meacutedias de reacutefeacuterence dans le High Tech et le logiciel
Slashdot Diggcom et TheRegister
Un nuage de tags sur lInternet Movie Database une maniegravere de naviguer parmi tous les mots cleacutes associeacutes aux films
copy Digimind Digimind Services ndash White Paper |51
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La qualification du contenu par les utilisateurs (rdquofolksonomierdquo) est une reacuteelle valeur
ajouteacutee Les moteurs de recherche font reposer une grande part de lrsquoeffort sur
lrsquoutilisateur final une page de reacutesultats de Google doit ecirctre eacutevalueacutee souvent
interpreacuteteacutee par linternaute La folksonomie fait elle reposer lrsquoeffort de filtrage sur
lrsquoutilisateur initial celui qui va rechercher et appliquer ses propres ldquotagsrdquo Parce
quen amont 1743 personnes ont taggeacute une page avec un groupe de mots cleacutes
lrsquoutilisateur final lors de sa requecircte reccediloit une page de reacutesultats souvent tregraves
pertinente
Sur un moteur classique cest agrave lutilisateur dimaginer ses mots cleacutes pour affiner sa
recherche Sur les bookmarks sociaux de type Delicious les internautes qui
partagent leurs ressources ont deacutejagrave preacutepareacute ce travail daffinage via leurs tags
Prenons le cas dune recherche extrecircme car geacuteneacuterant de la synonymie la requecircte
Jaguar Sur Googlecom on me propose certes des mots cleacutes connexes pour
affiner mais tous sont lieacutes agrave la voiture Sur Delicious les tags afficheacutes sont relatifs agrave
la voiture mais aussi au systegraveme dexploitation agrave un groupe de musique et agrave lanimal
Pouvoir rechercher parmi les tags classifications eacutemanant de lutilisateur peut ecirctre
particuliegraverement inteacuteressant lorsquune recherche classique par mots cleacutes sur le
contenu des documents sest aveacutereacutee infructueuse ou geacutenegravere des reacutesultats peu
pertinents
Le tagging une pratique quotidienne
Selon une enquecircte meneacutee en deacutecembre 2006 par le Pew Internet amp American Life
Project 28 dutilisateurs des internautes ameacutericains ont taggeacute ou cateacutegoriseacute en
ligne des contenus tels que des photos des billets dans des blogs des articles
drsquoactualiteacutehellipSur une base journaliegravere 7 des utilisateurs drsquoInternet pratiquent le
tag en ligne
Ce systegraveme de laquo taxonomie populaire raquo pourrait-il constituer une alternative aux
outils de recherche traditionnels par mots cleacutes Il convient de distinguer les
usages professionnels des usages grand public Olivier Le Deuff 89 reprend dans
son eacutetude sur les Folksonomies la distinction effectueacutee par Thomas Vander
Wal entre les folksonomies eacutetroites (narrow folksonomies) et geacuteneacuterales (broad
folksonomies) Selon Olivier Le Deuff cette distinction est importante car les
premiegraveres sont surtout utiliseacutees dans un objectif individuel tandis que les secondes
privileacutegient lrsquoaspect collectif et collaboratif du partage drsquoinformation Ainsi les sites
de partages de favoris comme delicious ou Connotea sont plutocirct des
folksonomies geacuteneacuterales puisqursquoun mecircme site peut ecirctre partageacute par plusieurs
utilisateurs et recevoir le mecircme tag Ce type de folksonomies srsquoappuyant sur des
copy Digimind Digimind Services ndash White Paper |52
Le Web 20 pour la veille et recherche dinformation DIGIMIND
reacuteseaux sociaux ne fait pas que classer de lrsquoinformation et la partager Il met en
relation des usagers qui partagent les mecircmes centres drsquointeacuterecirct Lrsquousager indexeur
devient agrave son tour un peu indexeacute et mis en relation agrave la fois avec drsquoautres mots-
cleacutes drsquoautres sites et drsquoautres usagers
Il est clair que dans le domaine de lrsquoinformation professionnelle ou speacutecialiseacutee le
manque duniformisation des folksonomies qursquoelles soient geacuteneacuterales ou agrave vocation
plus eacutetroite pose les limites de ce systegraveme Les outils drsquoindexation et de
classification traditionnels ont en effet eacuteteacute creacuteeacutes pour des corpus structureacutes aux
limites clairement deacutefinies et srsquoadressent agrave des utilisateurs experts drsquoun domaine
ou de la recherche drsquoinformation Lrsquoabsence de hieacuterarchisation et de controcircle
constitue agrave la fois le point fort et le point faible de la folksonomie La barriegravere des
langues pourra constituer eacutegalement un obstacle les tags eacutetant parfois meacutelangeacutes
dans un mecircme site sans distinction De plus comme le note Cyril Fievet 90 la
pratique du tagging nrsquoest pas uniforme drsquoun site agrave lrsquoautre Sur Technorati les tags
indexeacutes sont ceux choisis par les blogueurs et fonction du contenu qursquoils ont eux-
mecircmes publieacute Sur delicious en revanche ce sont les internautes qui taguent le
contenu des pages qursquoils conservent dans leurs signets raquo
Il convient eacutegalement drsquoecirctre vigilant quant agrave une utilisation laquo frauduleuse raquo des
tags destineacutee uniquement agrave garantir la populariteacute drsquoun blog comme cela a pu
ecirctre le cas avec les meacuteta-donneacutees incorporeacutees dans le code source drsquoune page
html
Eacutelie Francis et Odile Quesnel preacutesentent dans la revue Documentaliste Sciences
de lrsquoinformation les quatre modes drsquoindexation et de classification sur le web la
classification personnelle lrsquoindexation par lrsquoauteur lrsquoindexation par lrsquoutilisateur et la
classification globale Et srsquointerrogent sur lrsquoavenir de lrsquoindexation collaborative agrave la
croiseacutee de la qualiteacute (liberteacute diversiteacute enrichissement) et de la deacutesinformation
(subjectiviteacute manque de coheacuterence)
Il nrsquoen reste pas moins que folksonomie et indexation classique ne srsquoopposent pas
neacutecessairement et constituent des moyens de description de contenus adapteacutes agrave
des contextes diffeacuterents Stephen Lee creacuteateur du site Guten Tag voit dans la
folksonomie une sorte de web seacutemantique du pauvre peu oneacutereux agrave mettre en
place mais dont le succegraves reposera sur une seacuterie de bonnes pratiques collectives
Lrsquointeacuterecirct de ce systegraveme reacutesidera non pas dans la capaciteacute agrave trouver une reacuteponse agrave
une question preacutecise mais plutocirct agrave deacutecouvrir des sources originales et peu connues
ou de localiser des experts drsquoun domaine pointu Les tags les plus rares et preacutecis
pourront entre autres trouver leur application dans le domaine de la veille mettant
copy Digimind Digimind Services ndash White Paper |53
Le Web 20 pour la veille et recherche dinformation DIGIMIND
en œuvre la seacuterendipiteacute ou lrsquoart de favoriser le hasard pour des deacutecouvertes
heureuses
Laissons la conclusion sur ce point agrave lrsquoAssociation des Professionnels de
lrsquoInformation et de la Documentation (ADBS) qui estime dans sa newsletter que
Le foisonnement des propositions de mots-cleacutes aboutirait agrave un reacutesultat plus efficace
quune indexation reacutealiseacutee par un vocabulaire contraint Cette affirmation semble
ecirctre deacutemontreacuteehellip pour linstant
c La recherche de personnes et dinformations entreprises
La recherche de donneacutees sur les personnes physiques ou morales seffectuait
jusquici principalement en interrogeant les bases de donneacutees dinformations leacutegales
et financiegraveres gratuites ou payantes Linterrogation de service tel que Societecom
Infogreffe ou Yahoo Finance est bien sucircr encore neacutecessaire Mais il faut compter
maintenant avec les reacuteseaux sociaux professionnels qui eux aussi rassemblent des
donneacutees sur les entreprises ou les individus
Linteacuterecirct des reacuteseaux sociaux
Que peuvent-il apporter par rapport aux services classiques dinformations
dentreprises Dabord comme expliqueacute preacuteceacutedemment ils sont ouverts agrave tous
Les informations y figurant ne sont plus le seul fait de leacutediteur du site et ne sont pas
uniquement constitueacutees par les fichiers de donneacutees leacutegales publieacutees par les
organismes officiels comme le Greffe du Tribunal de Commerce en France Sur les
reacuteseaux sociaux centreacutes sur les personnes le contenu est inteacutegralement ameneacute par
linternaute qui affiche son CV deacutetailleacute ses publications ses oeuvres (textes ou
multimeacutedias) Linteacuterecirct est eacutevident des personnes peu visibles auparavant parce
que ne faisant pas partie des dirigeants dentreprises (geacuterant fondateur membre du
conseil) sont maintenant accessibles et donc requecirctables par les internautes On
peut donc collecter des informations sur un cadre de RampD dune socieacuteteacute de
teacuteleacutecoms concurrente ou sur le management eacutetonnant de telle entreprise de
plasturgie citeacutee dans le CV dun employeacute de passagehellip
A linstar des blogs linformation preacutesente sur les reacuteseaux sociaux ne tient plus du
discours ou des donneacutees officielles puisque cest linternaute qui communique sur sa
vie et son entreprise
copy Digimind Digimind Services ndash White Paper |54
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Geacuterer leacuteparpillement de linformation
Dautres plateformes de social networking mixent linformation collecteacutee sur le web
avec les contributions des utilisateurs (agrave linstar de Wikio pour les actualiteacutes) Ainsi
le service ZoomInfo 91 permet de rechercher des socieacuteteacutes et des personnes en
parcourant des milliers de donneacutees extraites du web mais aussi en provenance de
profils dindividus et dentreprises renseigneacutes par les socieacuteteacutes ou les employeacutes eux-
mecircmes Aussi cohabitent des informations sur des entreprises coteacutees avec des
donneacutees de firmes non coteacutees des fiches de cadres du top management et des
conseils dadministration avec des CV demployeacutes plus fonctionnels
Le franccedilais Ziki 92 utilise aussi des informations collecteacutees sur le web cest une
sorte dannuaire perfectionneacute qui indexe et archive non pas les donneacutees
signaleacutetiques mais les contenus produits par une personne agrave partir du moment ougrave ils
disposent dun flux RSS (billets de blogs photo Flickr favoris Delicioushellip) Ziki ne
permet pas de creacuteer du contenu propre mais agregravege des donneacutees eacutelaboreacutees par un
mecircme individu auparavant eacuteparpilleacutees sur linternet Bref vous ameacuteliorez votre
visibiliteacute et facilitez la recherche de vos productions sur le net en creacuteant un point
unique daccegraves
La recherche sur tous ces reacuteseaux sociaux implique souvent linterrogation
fastidieuse apregraves inscription de plusieurs dizaines de sites
Aussi certains outils 93 proposent une meacutetarecherche en lanccedilant une mecircme
requecircte sur plusieurs services de social networking Stalkerati recherche le nom
dune personne sur les reacuteseaux Friendster et FaceBook Plus complet et ciblant
davantage les reacuteseaux professionnels YoName recherche les noms sur MySpace
LinkedIn Friendster Windows Live Spaces Bebo Digg ou Xanga
Le moteur de recherche de personnes Wink scrute les reacuteseaux sociaux MySpace
Bebo Friendster LinkedIn Live Spaces et autres De plus avec cet outil il est
possible de creacuteer son propre profil et de le connecter agrave des reacuteseaux sociaux
Attention toutefois si vous ecirctes un utilisateur recherchant des donneacutees en franccedilais
la nature des reacutesultats est plutocirct tourneacutee vers le monde anglophone
Ces reacuteseaux sociaux ne sont pas suffisants pour une recherche professionnelle
complegravete A linstar des blogs face agrave la presse traditionnelle ils constituent un
compleacutement inteacuteressant aux bases de donneacutees officielles
copy Digimind Digimind Services ndash White Paper |55
Le Web 20 pour la veille et recherche dinformation DIGIMIND
d Les moteurs de recherche humains
Apregraves ecirctre apparus sur le net agrave la fin des anneacutees 90 les services de questions-
reacuteponses avaient laisseacute la place aux algorithmes tout puissants des moteurs de
recherche de type Google Mais les robots et programmes ont tous besoin dune
intervention humaine pour geacuterer la qualiteacute et la pertinence des reacutesultats
Ainsi tous les grands moteurs majeurs ne font pas confiance agrave leurs seuls
algorithmes Les employeacutes de Yahoo sont mis agrave contribution pour surveiller la
qualiteacute des reacutesultats fournis par le moteur Chez Google et MSN Search des
process deacutevaluation humaine avaient eacuteteacute identifieacutes agrave travers les sites
EvalGooglecom et MSN HRS notamment
La revanche de lhumain
Au-delagrave de ce rating humain sur les reacutesultats de moteurs de recherche de
nombreux services depuis 2 ans mettent agrave disposition des experts en chair et en
os Cest alors un veacuteritable mode collaboratif qui se met en place lorsque le produit
est bien penseacute Cest la cas de Yahoo Answers (Yahoo Questions Reacuteponses en
France) 94 Ce service gratuit de questions reacuteponses lanceacute fin 2005 permet agrave
linternaute de poser une question dans un formulaire Chaque membre de la
communauteacute Yahoo (agrave savoir tout ceux qui disposent dun compte Yahoo) peut
jouer le rocircle dexpert Yahoo propose aussi le service (eacutegalement gratuit) Ask
Yahoo qui propose de reacutepondre agrave vos questions mais cette fois via un groupe
dexperts seacutelectionneacutes par Yahoo Inc Yahoo Answers a certes une orientation
initiale grand public mais des questions un peu techniques voire scientifiques
trouvent reacuteponse En effet parmi tous les contributeurs agrave Yahoo Answers figurent
des meacutetiers et expertises tregraves diverses du fait de son audience importante Il y
cohabite des types de questions varieacutes Quels sont les groupes strateacutegiques de
lindustrie mondiale du jouet Quelles sont les donneacutees eacuteconomiques du marcheacute de
lassurance vie collective en France
Autre point inteacuteressant le service est deacuteployeacute dans de nombreux pays (Etats-Unis
Royaume-Uni Canada Australie Inde Espagne Breacutesil Argentine Mexique Italie
Allemagne Singapour Taiwan Coreacutee du Sud Hong Kong Japon Chinehellip) Aussi il
est possible de localiser certaines questions et de beacuteneacuteficier parfois dune
expertise pays
Lune des raisons du succegraves du service de Yahoo tient au fait de baser les questions
et reacuteponses sur la contribution dinternautes volontaires Chacun participe
constitue un vrai reacuteseau et peut surtout se valoriser en devenant expert dans son
copy Digimind Digimind Services ndash White Paper |56
Le Web 20 pour la veille et recherche dinformation DIGIMIND
domaine de compeacutetences ou sa passion Il est mecircme possible de creacuteer sa propre
communauteacute qui rassemblera vos amis mais aussi vos experts preacutefeacutereacutes qui
reacutepondent agrave vos questions et centres dinteacuterecirct Le pool de reacutepondants nest donc
pas limiteacute agrave une liste restreinte et il sauto-entretient Dautre part les experts
seacutevaluent entre eux et seacutelectionnent parmi une liste si neacutecessaire ce quils
considegraverent comme la meilleure reacuteponse agrave une question
Une question sur Yahoo Answers
Sur ce marcheacute des Questions-Reacuteponses Google a eacutechoueacute notamment parce quil a
seacutepareacute formellement demandeurs et contributeurs limitant ainsi fortement laspect
collaboratif Le Service Google Answers 95 permettait de poser des questions agrave des
experts Mais lagrave ougrave des services concurrents comme Yahoo Answsers Lycos IQ
copy Digimind Digimind Services ndash White Paper |57
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Windows Live QnA96 sont gratuits Google Answers eacutetait un service payant faisant
appel agrave un reacuteseau de 800 experts Aussi Google Answers apregraves 4 ans dactiviteacute a
fermeacute Les questions ne sont deacutesormais plus accepteacutees mais laccegraves aux archives des
questions-reacuteponses est maintenu
Par ailleurs les reacuteseaux sociaux eacutevoqueacutes plus haut ont bien compris la puissance des
communauteacutes pour faire office de speacutecialistes Ainsi avec LinkedIn Answers la
plateforme de reacuteseaux sociaux LinkedIn sest lanceacutee elle aussi dans le service de
QuestionsReacuteponses
Ne pas oublier les services Web 10
Lorsque lon parle de Web 20 on eacutevoque rarement ces services de Questions-
Reacuteponses au profit de sites plus technologiques Pourtant nous sommes ici dans la
logique des bookmarks sociaux partager ses connaissances faire beacuteneacuteficier les
autres de son savoir et en retour profiter de lexpertise de la communauteacute
Comme la plupart des applications Web 2 la seule utilisation des services QR ne
suffit pas Elle doit venir en compleacutement de recherches parallegraveles via dautres outils
Ainsi pour la veille linscription agrave des listes de diffusion permet aussi de poser des
questions agrave des experts ou passionneacutes De plus il subsiste des services dexpert
traditionnels qui sils ne mettent pas laccent sur la collaboration permettent
didentifier des compeacutetences parfois tregraves pointues Certaines ressources
reacutepertorient des milliers dexperts quil faudra ensuite contacter personnellement
pour beacuteneacuteficier de leur conseil Cest le cas du site Expertscom qui identifie des
experts dans des domaines allant de lacoustique agrave la biochimie en passant par
lindustrie peacutetroliegravere97
copy Digimind Digimind Services ndash White Paper |58
Le Web 20 pour la veille et recherche dinformation DIGIMIND
e les moteurs de recherche collaboratifs
Nous lavons vu certains services dactualiteacutes collaboratives proposent des reacutesultats
issus dun mixage entre contribution des internautes et collecte de nouvelles sur le
web Cette approche de mixiteacute se met peu agrave peu en place pour les moteurs de
recherche web En effet les modegraveles algorithmiques ou humains preacutesentent tout 2
leurs limites en terme de pertinence de fiabiliteacute et dexhaustiviteacute
Aussi de plus en plus de projet de moteur mixtes agrave savoir proposant des reacutesultats
web conjointement agrave des reacutesultats etou seacutelections issus dhumains voient le jour
Du web donc mais avec une forte dose de cerveaux humains
Wikiasari
Celui qui fait le plus parler de lui est le projet de Jimmy Wales le co-fondateur de
lencyclopeacutedie Wikipedia Baptiseacute Wikiasari 98 (combinaison de wiki rapide en
hawaiumlen et asari recherche fouilleacutee en japonais) le projet vise agrave creacuteer un outil de
recherche ougrave les internautes pourront influer sur les reacutesultats en notant leur
pertinence etou en en proposant de nouveaux selon leur expertise
Ce type de moteur sinscrit donc agrave lopposeacute doutils comme Google aux algorithmes
automatiques dont les robots sont souvent trompeacutes par des manipulations de
webmasters (spamdexing par exemple)
Cet outil qui devrait voir le jour courant 2007 sappuie sur des infrastructures Open
Source existantes comme Nutch ou Lucent
Cest un projet particuliegraverement inteacuteressant Comme sur lencyclopeacutedie ouverte
Wikipedia ougrave des milliers de contributeurs construisent et alimentent louvrage sur
ce moteur des reacuteseaux de centaines dinternautes pourront apporter leur savoir
pour ameacuteliorer la pertinence des reacutesultats Ce nest plus seulement la puissance de
calcul de machines qui sera mise agrave contribution mais aussi la puissance de la
communauteacute
Derriegravere le projet Wikiasari il y a de gros moyens financiers et humains
lexpeacuterience de la fondation Wikipedia et le potentiel de trafic que pourra apporter
lencyclopeacutedie ouverte Fin 2006 Comscore a en effet classeacute Wikipedia comme le
6egraveme site le plus visiteacute au monde avec 1719 millions de visiteurs uniques au mois
de novembre On peut donc y croire
copy Digimind Digimind Services ndash White Paper |59
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche de sites similaires sur Yoono
Decipho Yoono
Certes lideacutee dun moteur de recherche collaboratif nest pas nouvelle Reacutecemment
on peut citer le lancement du moteur Decipho ou en mars 2006 celui de Yoono
Mecircme si les approches diffegraverent ces outils font tous la part belle agrave lrsquoapport de
chaque utilisateur dans le traitement des reacutesultats
Decipho 99 est un moteur baseacute sur la technologie de Askcom lun des 4 moteurs les
plus utiliseacutes aux USA Linternaute creacuteeacute ses propres cateacutegories de reacutesultats
partageables avec les autres Il peut eacutegalement tagger les reacutesultats afin deacutetiqueter
un site Aussi lors dune requecircte on peut preacuteciser les mots cleacutes classiques avec des
tags On beacuteneacuteficie alors de tous les tags mis en place par la communauteacute des
utilisateurs Un curseur permet de deacutefinir la proportion de cateacutegorisation des
autres utilisateurs agrave prendre en compte dans sa recherche
Le franccedilais Yoono 100 propose une autre deacutemarche encore loutil fonde ses reacutesultats
sur la mutualisation des connaissances des internautes par le partage des favoris Le
copy Digimind Digimind Services ndash White Paper |60
Le Web 20 pour la veille et recherche dinformation DIGIMIND
moteur utilise les favoris que sa communauteacute dutilisateurs a accepteacute de partager
Lors dune requecircte les reacutesultats sont classeacutes par populariteacute agrave savoir selon le
nombre de fois ougrave une page a eacuteteacute mise en favoris par les utilisateurs Une logique
proche de Delicious mais avec Yoono lajout de favoris est automatique De plus
loutil affiche les utilisateurs qui comme vous ont reacutefeacuterenceacute des sites sur la
politique veacuteneacutezuelienne par exemple De cette maniegravere vous pouvez identifier des
passionneacutes ou experts partageant vos domaines de preacutedilections Les reacutesultats ne
sont plus baseacutes sur les seuls algorithmes mais sur lexpeacuterience et la capacitation des
autres utilisateurs
Les initiatives de moteurs collaboratifs plus ou moins inteacuteressantes sont multiples
Foox est un moteur baseacute sur des communauteacutes dinteacuterecirct et sur Webzzle lutilisateur
preacutecise les concepts qui linteacuteressent afin de contextualiser les mots-cleacutes choisis 101
Humains ou algorithmes
Certes le mode collaboratif ne remplacera pas totalement la recherche
algorithmique Les 2 sont compleacutementaires Lune permet dameacuteliorer la pertinence
de prendre en compte des concepts des contextes du sens et non plus simplement
des chaicircnes de caractegraveres Lautre vise lexhaustiviteacute en indexant des milliards de
pages Web Aujourdhui et en attendant le Web seacutemantique ainsi que la recherche
dite naturelle 102 toutes deux grandes quecirctes du monde de linternet seul lapport
de communauteacutes dhumains permet dinjecter un peu de sens agrave une recherche
Mais de son cocircteacute la recherche coopeacuterative comporte bien entendu des risques de
subjectiviteacute
Sur les moteurs de recherche la coopeacuteration peut prendre une autre forme via le
peacuterimeacutetrage des sites agrave interroger la construction dun moteur sur mesure en
quelque sorte Cest la verticalisation de la recherche
copy Digimind Digimind Services ndash White Paper |61
Le Web 20 pour la veille et recherche dinformation DIGIMIND
f La verticalisation par la personnalisation du peacuterimegravetre de recherche
Lune des grandes faiblesses des moteurs de recherche web agrave large eacutechelle (Google
Exalead Yahoo MSNhellip) est le bruit geacuteneacutereacute par certaines requecirctes Lorsque vous
tapez puma le moteur ne sait pas agrave priori si vous vous inteacuteressez aux vecirctements
de sport agrave lanimal ou aux heacutelicoptegraveres Or si vous ne reacutealisez des recherches que
dans laeacuterospatiale vous devrez souvent deacutesambiguiumlser par vos mots cleacutes ce qui
engendre une perte de temps voire de reacutesultats si vos requecirctes deviennent trop
restrictives
Certains moteurs ou meacutetamoteurs clusteacuterisent (cateacutegorisent) les reacutesultats en les
rassemblant par groupes (grappes) dans de petits dossiers Cette deacutemarche avait
eacuteteacute initieacutee par le moteur Northern Light en 1998 Ainsi tous les reacutesultats relatifs aux
chaussures Puma sont regroupeacutes dans une mecircme valise ceux eacutevoquant lanimal
dans une autre Mais cette solution nest pas complegravetement satisfaisante car elle
seffectue agrave posteriori une fois votre requecircte lanceacutee Le bruit nest pas eacutelimineacute mais
simplement circonscrit dans des sortes de cateacutegories poubelle
Pour beacuteneacuteficier dune deacutemarche agrave priori il convient dutiliser des outils de
recherche verticaux cest-agrave-dire speacutecialiseacutes dans un secteur dactiviteacute une fonction
un type dinformation ou de meacutedias
Face aux problegravemes de pertinence des moteurs geacuteneacuteralistes de plus en plus de
moteurs verticaux voient le jour Ainsi le seul domaine meacutedical a vu apparaicirctre ces
20 derniers mois les moteurs SearchMedica Medstory MedWorm ou encore Medgle 103
Mais si votre secteur de preacutedilection nest pas couvert par un moteur speacutecialiseacute
Cest lagrave quintervient un autre type de moteur collaboratif agrave qui lon peut indiquer le
peacuterimegravetre des sites sur lesquels effectuer la recherche Sur les moteurs classiques
les algorithmes peuvent placer en prioriteacute des reacutesultats sans inteacuterecirct pour vous A
force de navigation et de veille dans votre secteur vous connaissez certainement
10 20 100 sites que vous jugez incontournables et indispensables pour vos
recherches
2 solutions techniques existent
- les outils agrave peacuterimegravetre de recherche personnalisable (adaptable scope)
Ils utilisent les index des moteurs geacuteneacuteralistes (Yahoo ou Google) et restreignent le
scope de leur recherche aux pages des sites que vous avez choisis Ainsi des outils
comme Rollyo Swicki Yahoo Search Builder Google Custom Search 104 vous
demandent dindiquer une liste de sites sur lesquels vous allez limiter votre
recherche Lors dune requecircte les reacutesultats proviendront uniquement des sites de
votre choix Pratique
copy Digimind Digimind Services ndash White Paper |62
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Mais ces outils preacutesentent une limite de taille ils ne prennent en compte que les
pages indexeacutees par Google ou Yahoo Conseacutequence si la reacuteponse pertinente agrave
votre requecircte figure au sein dune page non indexeacutee par le moteur geacuteneacuteraliste vous
nobtenez pas de reacutesultats
De plus en ninterrogeant que lindex dun ou 2 moteurs vous manquerez
obligatoirement de nombreuses informations puisque le nombre de reacutesultats
communs entre les moteurs diminue constamment105
Les pages non indexeacutees par les moteurs geacuteneacuteralistes constituent une part du web
invisible106 et sont plus nombreuses que lon ne croit Ainsi si jinterroge le moteur
interne du site de la prestigieuse revue scientifique The Lancet 107 avec la requecircte
Diabetes jobtiens plus de 2800 reacutesultats Si jeffectue cette mecircme requecircte sur
Google en restreignant ma recherche au site The Lancet (via la syntaxe
sitehttpwwwthelancetcom) jobtienshellip1 reacutesultat Sur Yahoo Search guegravere
mieux 9 reacutesultats Pourquoi Parce que les technologies de ces moteurs ne
permettent pas dindexer correctement tous les sites
La constitution de bouquets de moteurs speacutecialiseacutes sur Digimind Finder
- les outils agrave moteurs personnalisables
La solution pour beacuteneacuteficier des reacutesultats de moteurs internes non indexeacutes par des
Google ou Yahoo est dutiliser un outil permettant dexploiter directement les
moteurs des sites qui vous inteacuteressent et ce sans avoir agrave passer par les index de
moteurs geacuteneacuteralistes Cest le cas du Finder108 mis au point par Digimind un
copy Digimind Digimind Services ndash White Paper |63
Le Web 20 pour la veille et recherche dinformation DIGIMIND
meacutetamoteur qui permet de plugger nimporte quel moteur de son choix et de
linterroger ensuite Il est donc alors simple de se constituer des bouquets de
moteurs speacutecialiseacutes dans votre secteur dactiviteacute De plus cet outil indexe en temps
reacuteel les reacutesultats et les documents retourneacutes par les moteurs interrogeacutes Cela
permet daffiner ensuite vos reacutesultats en interrogeant cet index au contenu
speacutecialiseacute via une recherche avanceacutee Avec le Finder cest donc lutilisateur final qui
constitue sa propre seacutelection de moteurs
copy Digimind Digimind Services ndash White Paper |64
Le Web 20 pour la veille et recherche dinformation DIGIMIND
g Lenrichissement de bases de donneacutees faccedilon Web20
Nous avons vu que les bookmarks sociaux permettaient de mutualiser les
ressources et pour certains autour de communauteacutes deacutedieacutees comme les
scientifiques Avant lapparition des applications Web 20 ont eacuteteacute constitueacutees de
nombreuses bases de donneacutees professionnelles Celles-ci jusquici noffraient pas
aux groupes dutilisateurs la possibiliteacute dinteragir de commenter et deacutechanger
Aussi de plus en plus de grandes bases de donneacutees se dotent dinterfaces
collaboratives et ergonomiques pour laisser plus de place agrave la contribution
PubMed
Cest le cas de lune des plus grandes bases du domaine meacutedical PubMed 109 Cette
immense base bibliographique a vu naicirctre deux initiatives110 pour ameacuteliorer son
interface de recherche
- Avec PubMed Interact la recherche integravegre de lAjax et permet de pondeacuterer via
des curseurs les critegraveres de sources dancienneteacute de nombre de reacutesultats de date
de publication de liens avec le mapping du MeSH (le theacutesaurus de la base) de
filtrage via des cateacutegories Vous pouvez ensuite annoter et attribuer une note de
pertinence agrave vos reacutesultats afficher labstract des articles ou leur texte complet
supprimer des reacutesultats ou encore afficher les articles lieacutes On retrouve donc
lessentiel des fonctionnaliteacutes de lactuel PubMed mais avec une convivialiteacute et
ergonomie Web 20 et donc une plus grande accessibiliteacute
-Hubmed est une autre interface alternative qui ajoute des fonctionnaliteacutes agrave PubMed
application de ses propres tags aux reacutesultats de recherche historique des recherches
clusteacuterisation des reacutesultats visualisation sous forme graphique creacuteation simplifieacutee
de fils RSS avec les mots de votre requecircte suggestion de termes connexes
visualisation de vos mots cleacutes dans larborescence Mesh Le tout est deacuteveloppeacute en
Ajax notamment permettant une navigation plus fluide et plus rapide Parmi toutes
ces fonctions la possibiliteacute de tagger les reacutesultats est tregraves novatrice on peut ainsi se
deacutepartir de la taxonomie de la base via sa propre folksonomie
copy Digimind Digimind Services ndash White Paper |65
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les nombreux reacuteglages de filtres sur linterface PubMed Interact
LUSPTO
LUSPTO 111 est la base des brevets ameacutericains (United States Patent and Trademark
Office)
Cette veacuteneacuterable institution a en projet une plateforme de brevets sociale agrave la
maniegravere dun Digg (cf les services dactualiteacutes collaboratives) les internautes
pourront commenter les brevets en ligne et les eacutevaluer via un systegraveme de notation
Les brevets les mieux noteacutes remonteront alors en haut de classement
copy Digimind Digimind Services ndash White Paper |66
Le Web 20 pour la veille et recherche dinformation DIGIMIND
h Conserver et exploiter lhistorique de vos recherches et navigations
Le chercheur dinformation sur le net perd souvent ses nerfs quand il ne retrouve
plus ce quil a deacutejagrave collecteacute quelque semaines auparavant ou lorsquil lui est
impossible de se souvenir quelle requecircte agrave geacuteneacutereacute ce fameux reacutesultat remarquable
cette veacuteritable peacutepitehellip
Google a reacutesolu partiellement ces problegravemes de meacutemoire Mais comme souvent
cela ne va pas sans certains sacrifices
Via son service Historique Web112 (ex Historique de recherche) vous pouvez apregraves
enregistrement gratuit
- meacutemoriser les requecirctes effectueacutees sur le moteur ainsi que les reacutesultats cliqueacutes
- enregistrer votre navigation sur les pages web
Il est alors possible deffectuer des requecirctes sur et agrave linteacuterieur des pages que vous
avez visiteacutees dans le passeacute (sur le texte les images les videacuteos)
Google affiche donc deacutesormais vos requecirctes la date et lheure de la recherche les
reacutesultats cliqueacutes mais aussi les reacutesultats de recherches qui nrsquoont pas geacuteneacutereacute de clics
Par ailleurs ce service va encore plus loin dans la personnalisation et lanalyse de
votre recherche
Avec la fonction Tendances saffichent vos requecirctes les plus courantes vos sites les
plus visiteacutes les reacutesultats que vous avez le plus cliqueacutes
Plus puissante la fonction Eleacutements inteacuteressants ougrave Google vous propose des
requecirctes et des pages web en relation avec vos habitudes de recherche113
En outre si vous activez cet historique Google lutilisera aussi pour agrave moyen
terme personnaliser vos recherches en fonction de vos centres dinteacuterecirct Le
moteur explique
Vos reacutesultats personnaliseacutes seront baseacutes sur vos recherches preacuteceacutedentes ainsi que les
reacutesultats de recherche et les titres agrave la une sur lesquels vous avez cliqueacute
Dans les premiers temps la diffeacuterence ne sera peut-ecirctre pas notable mais agrave mesure
que votre historique de recherches seacutetoffera les reacutesultats obtenus seront de plus en plus
personnaliseacutes
Dailleurs si vous reacutealisez de nombreuses recherches sur Google avec une
connexion agrave votre compte Google activeacutee vous devriez voir safficher de temps agrave
autre ce type de message Nouveau activez votre historique de recherche pour
personnaliser vos reacutesultats
copy Digimind Digimind Services ndash White Paper |67
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ces reacutesultats personnaliseacutes apprenant selon vos inteacuterecircts permettent de reacutepondre
en partie agrave la probleacutematique de deacutesambiguiumlsation lors de requecirctes sur des
homonymes Ce sont les exemples classiques de lavocat (fruit ou juriste ) de
jaguar (voiture ou animal ) ou de puma (articles de sports animal ou heacutelicoptegravere
)
Cocircteacute vie priveacutee tout votre surf part sur les serveurs de Google Aussi vous
pouvez (devez) mettre en pause lenregistrement de votre navigation lorsque cela
vous apparaicirct adeacutequat
Lhistorique de vos requecirctes et de vos reacutesultats sur Google
copy Digimind Digimind Services ndash White Paper |68
Le Web 20 pour la veille et recherche dinformation DIGIMIND
i Les mash-up
Les mash-up sont certainement les nouveauteacutes engendreacutees par les technologies
dites Web 20 les plus spectaculaires Mixage de plusieurs applications provenant
de plusieurs sites (souvent deux) ils permettent de creacuteer un service nouveau et ce
agrave partir de la mise en relation voire du croisement des donneacutees des applications
dorigines En franccedilais Wikipedia parle dapplications composites 114 Ainsi en
mixant la liste des socieacuteteacutes ougrave il fait bon travailler eacutetablie par le magazine Fortune et
une carte des USA issue de Google Maps on obtient une carte qui localise toutes
ces entreprises De mecircme si on meacutelange les donneacutees dun site de meacuteteacuteo agrave une
carte de France le reacutesultat est une carte des tempeacuteratures et des neacutebulositeacutes en
quasi temps reacuteel 115
Concregravetement comment cela fonctionne-t-il Chacune des applications
communique et eacutechange des informations via des API (voir glossaire) Ainsi Yahoo
Maps ou Google Maps ont ouvert leurs interfaces de programmation agrave tous les
deacuteveloppeurs
Les exemples sont tregraves nombreux car les Mashups ont rapidement connu un vif
succegraves aupregraves des deacuteveloppeurs et internautes avertis qui parviennent agrave maicirctriser le
code et les API Les Mashups de cartographie ne sont pas les seules possibiliteacutes mais
ce sont les plus freacutequents tant la geacuteolocalisation est attrayante pour les
professionnels comme pour linternaute novice Nous allons explorer quelques
mashups pour mieux comprendre leur inteacuterecirct
Les mashups cartographiques les plus courants mixent des cartes et des donneacutees
provenant de services sociaux comme Flickr le service de partage de photo de
Yahoo Inc Cest le cas de Tagmaps116 qui affiche en temps reacuteel sur une carte les tags
associeacutes aux photos de lieux mise en ligne sur Flickr Le Mashup Flickrvision 117 fait
encore plus simple il affiche les photos agrave lemplacement de la ville dorigine de
linternaute qui a posteacute limage lagrave aussi en temps reacuteel
Donneacutees statiques et temps reacuteel
Au-delagrave de certains mixages un peu gadget certains Mashups sont vraiment
inteacuteressants pour la surveillance de donneacutees ou la collecte dinformations En effet
on peut trouver deux grands types de visualisation celle de donneacutees statiques (une
liste dadresse dentreprises geacuteolocaliseacutees) et celle dinformations eacutevoluant en
temps reacuteel Cest le cas par exemple du Mashup SpaceCraft Tracking 118 qui permet
copy Digimind Digimind Services ndash White Paper |69
Le Web 20 pour la veille et recherche dinformation DIGIMIND
de visualiser la trajectoire sur le globe terrestre de la navette spatiale ou du
teacutelescope Hubble
Souvent le Mashup exploite des donneacutees de reacutepertoires douvrages de services
publics pour les rendre plus compreacutehensives attrayantes bref plus accessibles 119
- HealthMap rassemble des donneacutees de santeacute publique et des actualiteacutes issues de
plusieurs sources (Google News OMS European Centre for Disease Prevention and
Controlhellip) afin de reacutealiser une carte des maladies infectieuses dans le monde Cette
carte se met agrave jour au fur et agrave mesure de lactualisation des informations
Linteractiviteacute permet de zoomer sur un pays et de seacutelectionner des pathologies en
particulier
-BioDiesel Station Maps affiche sur une carte les stations services ameacutericaines qui
deacutelivrent des biocarburants
-Kartametro superpose le reacuteseau du meacutetro moscovite agrave la carte de la ville On y
visualise aussi les correspondances avec les bus
-Wikimapia mixe les informations relatives agrave des lieux de Wikipedia agrave une carte
Google Maps Reacutesultat la plupart des noms de villes sites ou monuments sont
cliquables et pointent vers les articles de lencyclopeacutedie
Le Mashup HealthMap ici des actualiteacutes sur les maladies infectieuses en Asie geacuteolocaliseacutees
copy Digimind Digimind Services ndash White Paper |70
Le Web 20 pour la veille et recherche dinformation DIGIMIND
-GlobaI Incident Maps affiche sur un planisphegravere les eacuteveacutenements lieacutes au terrorisme
ou les risques agrave partir des informations de sites speacutecialiseacutees mises agrave jour en continu
-Enfin un parfait exemple de visualisation et de surveillance deacuteveacutenements en temps
reacuteel DartMaps indique lemplacement des trains de banlieue de Dublin
Mais certains Mashup en minoriteacute certes nexploitent pas de donneacutees
cartographiques Cest le cas de Delexaorg 120 un outil qui mixe les bookmarks
sociaux de Delicious aux donneacutees statistiques dAlexa Delexa va en effet afficher les
tags de Delicious associeacutes aux statistiques de freacutequentation des 50 000 premiers
sites web US fournis par Alexa (agrave partir des donneacutees transmises par les barres
doutils Alexa installeacutees par les internautes) Un tel outil est inteacuteressant notamment
pour se familiariser avec les tags et Delicious mais surtout pour deacutecouvrir quels
sont les sites dinfluence et populaires dans un secteur On peut eacutegalement observer
la correacutelation ou non entre nombre de tags et donneacutees de freacutequentation Alexa
Cocircteacute moteur de recherche les mashups Molu et Gnosh fournissent des
meacutetamoteurs reacutealiseacutes agrave partir du mixage de dizaines doutils de recherche121
Des ressources
Comment trouver des mashups Comme pour de nombreuses informations sur le
web des annuaires speacutecialiseacutes 122 sont apparus Ils reacutepertorient aussi bien des API agrave
destination des deacuteveloppeurs que des mashups WebMashup auto-proclameacute Open
Directory for Mashups et Web 20 APIs en liste des centaines ProgrammableWeb
lun de sites de reacutefeacuterence dans le domaine en propose plus de 1800 sous la forme
dun reacutepertoire et eacutegalement dune matrice permettant de visualiser clairement le
croisement de deux applications ou plus Mashup Feed liste aussi des mixages
populaires
Des blogs sont eacutegalement centreacutes sur ces pratiques Google Maps Mania123 recense
de nombreux Mashups cartographiques
Ces Mashups sont un beau symbole de ce web nouvelle geacuteneacuteration on ne lit plus
seulement de linformation statique de maniegravere passive Deacutesormais on est agrave la fois
fournisseur et spectateur en temps reacuteel des contributions de communauteacutes Le tout
copy Digimind Digimind Services ndash White Paper |71
Le Web 20 pour la veille et recherche dinformation DIGIMIND
gracircce agrave des interfaces reacutealiseacutees par des deacuteveloppeurs agrave partir de code ouverts de
grandes socieacuteteacutes Le succegraves est notamment provoqueacute par la possibiliteacute de mixage
entre des donneacutees du monde reacuteel et des informations ou fichiers posteacutes sur le net
Les internautes peuvent donc maintenant se rassembler par centres dinteacuterecirct mais
eacutegalement par proximiteacute geacuteographique Je recherche un speacutecialiste de linformation
sur les biocarburants situeacutes agrave moins de 10 km de chez moi
Par ailleurs on peut imaginer agrave terme des applications meacutelangeant les donneacutees de
centaines de fichiers et bases de donneacutees On en est certes aux preacutemisses mais le
mashup Alkemis 124 en est deacutejagrave un bon exemple il affiche sur une carte de New
York des donneacutees provenant dA9 OpenSearch Delicious Flickr Google Maps et
Yahoo Traffic Reacutesultat la possibiliteacute de visualiser en une seule interface un eacutetat du
trafic routier via des cameacuteras de surveillance la meacuteteacuteo les actualiteacutes locales ou les
liens Delicious en rapport avec la villehellip
copy Digimind Digimind Services ndash White Paper |72
Le Web 20 pour la veille et recherche dinformation DIGIMIND
III Diffuser
Avec lapparition des applications collaboratives et des plateformes de blogs la
faciliteacute de publication sur le web sest accrue Tout individu mecircme sans
connaissances techniques peut publier et diffuser son propre contenu sur un blog
un wiki et via des fils RSS
a Les Blogs et le flux RSS
Il suffit de 5 minutes pour sinscrire agrave une plateforme de blogs et commencer agrave
eacutecrire Ces plateformes proposent des services de bases gratuits et des
fonctionnaliteacutes plus avanceacutees neacutecessitant un abonnement Ces services qui
permettent de creacuteer maintenir et heacuteberger votre blog sont nombreux Parmi les
prestataires de qualiteacute on peut citer Blogger (qui appartient agrave Google) TypePad et
Vox (de la socieacuteteacute SixApart) Overblog Viablog Haut et Fort ou BlogSpirit 125 Bien
dautres socieacuteteacutes proposent des services de creacuteation et dheacutebergement126 Des
comparatifs sont disponibles en ligne127
Nous lavons vu le format RSS permet de diffuser tregraves facilement le contenu de son
blog utilisant le XML (un html eacutepureacute) langage natif du blog chaque carnet web
comporte un fils RSS permettant aux visiteurs de sabonner agrave vote blog et de
recevoir instantaneacutement toute nouvelle publication actualiteacutes billets podcast ou
videacuteos Par ailleurs des services comme Feedburner128 permettent de rendre
compatibles vos flux RSS avec la majoriteacute des lecteurs RSS outils dont nous
reparlerons plus loin
La creacuteation de sites internet classiques sest elle aussi consideacuterablement simplifieacutee
un outil tel que Google Page Creator129 permet de creacuteer un site simple en 1 heure
Des sites plus sophistiqueacutes sont eacutegalement abordables sans avoir agrave connaicirctre une
ligne de programmation de html gracircce au perfectionnement des eacutediteurs dits
WYSIWYG ce que vous voyez quand vous construisez votre page est ce que vous
obtiendrez en ligne
Les outils Web 20 permettent agrave des speacutecialistes journalistes ou salarieacutes de diffuser
leur contenu Il y a encore 2 ans ils eacutetaient pour la plupart eacutecarteacutes de la publication
web faute de bagage technique
copy Digimind Digimind Services ndash White Paper |73
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Depuis le deacuteveloppement des blogs agrave partir de lautomne 2001 il est possible pour
tout internaute de diffuser sa propre information Au-delagrave des blogs dadolescents
et autres carnets intimes le web regorge de blogs agrave tendance professionnelle
corporate produits marketing experts politiques ressources humaines Cest
autant de sources potentielles quil faut exploiter afin de capter des sources
primaires de qualiteacute Le volume des blogs publieacutes et maintenus chaque jour est lui
aussi en constante augmentation
Le White Paper Blogs et RSS des outils pour la veille strateacutegique deacuteveloppe les
aspects inteacuteressants des blogs pour le professionnel de linformation130
b Les Wikis
Le wiki est finalement diffeacuterent du blog de par sa nature et son utilisation Selon
Wikipedia le Wiki est un site Web dynamique permettant agrave tout individu den
modifier les pages agrave volonteacute Il permet de communiquer et diffuser des informations
rapidement de structurer cette information pour permettre dy naviguer
commodeacutement (Wiki vient du terme hawaiien wiki wiki =rapide ou informel)
Lagrave ougrave le blog sera adapteacute agrave la diffusion dactualiteacute et de contenu se renouvelant
freacutequemment le wiki sera davantage deacutedieacute agrave du texte plus statique mais neacutecessitant
ou pouvant senrichir de la collaboration de plusieurs personnes Ainsi les articles
dune encyclopeacutedie ou les fiches correspondants aux diffeacuterentes phases dun projet
impliquant de nombreux collaborateurs pourront ecirctre reacutealiseacutees sous forme de
Wiki
Sur un blog laffichage du contenu est anteacute-chronologique (le plus reacutecent en haut)
sur un wiki il est structureacute en rubriques larchitecture comme le contenu pouvant
ecirctre modifieacutes agrave tout moment par les participants Ceux-ci peuvent beacuteneacuteficier de
droits daccegraves et de modification hieacuterarchiseacutes
Les versions anteacuterieures ainsi que les modifications sont accessibles via une rubrique
Historique Sur un blog le visiteur peut collaborer mais uniquement via ses
commentaires Sur un wiki tout collaborateur autoriseacute peut modifier le texte
comme le titre et lorganisation des rubriques
Par ailleurs la prise en main dun wiki et de ses syntaxes denrichissement et
modification demande un peu de pratique et nest pas aussi simple que le
maniement dun blog Le wiki est un des outils ideacuteaux pour la gestion de projet
Certaines entreprises les utilisent en tant que tel (parfois en parallegravele avec les blogs)
pour eacuteviter des eacutechanges des recherches et un archivage via les mails fastidieux
copy Digimind Digimind Services ndash White Paper |74
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Geacutereacute via des droits daccegraves gradueacutes il peut alors se reacuteveacuteler comme un outil tregraves
simple agrave manier et agrave sapproprier Ces wikis seront eacutevidemment reacuteserveacutes agrave
lentreprise en accegraves priveacute
Exemples de wikis publics
gt Wikipedia131
Le wiki le plus connu est Wikipedia lencyclopeacutedie collaborative gratuite dont le
contenu est creacuteeacute et maintenu par des milliers dinternautes beacuteneacutevoles Chacun est
libre de creacuteer un article modifier ceux des autres ou les commenter En mai 2007
lencyclopeacutedie proposait plus de 7 millions darticles dans 192 langues et dialectes
dont plus de 500 000 en franccedilais Wikipedia jouit dune populariteacute et dun succegraves
tregraves important Google indexe de nombreux articles de Wikipedia agrave tel point quil
est rare deffectuer une recherche sur le moteur sans voir safficher une deacutefinition
issue de lencyclopeacutedie Selon la socieacuteteacute de mesure daudience Comscore en janvier
2007 Wikipedia eacutetait le 9egraveme site US le plus visiteacute (derriegravere les sites Yahoo
premiers puis les sites Time Warner Microsoft Google eBay Fox Interactive
Amazon et Ask) 6 groupes eacuteditant un moteur geacuteneacuteraliste (Google Ask Microsoft
Yahoo Amazon et AOL) occupent le top10 US Mais cest la premiegravere fois quun
site collaboratif truste les premiegraveres places des sites les plus visiteacutes
Wikipedia comme tout service leader est tregraves critiqueacute Notamment sur la
possibiliteacute pour tout un chacun de modifier et de creacuteer des articles pouvant
entraicircner des risques de diffamation ou de vandalisation 132 Mecircme si ces risques
sont reacuteels nous le verrons dans la partie consacreacutee aux limites du Web 20 il ne
faut pas pour autant se focaliser sur ces problegravemes
Par ailleurs on a souvent mis en cause la qualiteacute des articles du contenu eacutemanant
dinternautes pas forceacutement qualifieacutes ou experts et donc par nature douteux Or
une eacutetude commandeacutee par la Revue Nature agrave remis en cause ce type de ressenti
des experts ont compareacute 42 documents publieacutes sur Wikipedia et sur la ceacutelegravebre
Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche133
Seulement 8 erreurs seacuterieuses comme des mauvaises interpreacutetations de concepts
ont eacuteteacute repeacutereacutees dans les articles analyseacutes 4 pour chaque encyclopeacutedie Des
erreurs factuelles omissions ou fausses descriptions ont eacutegalement eacuteteacute deacutetecteacutees
162 dans Wikipedia et 123 dans lEncyclopaedia Britannica
Le succegraves et limportance de Wikipedia nont pas eacutechappeacute aux moteurs de
recherche qui sont plusieurs agrave secirctre speacutecialiseacutes dans la recherche sur lencyclopeacutedie
Ainsi WikiSeek 134 est un moteur lanceacute deacutebut 2007 qui recherche sur le contenu de
Wikipedia Il indexe le contenu en crawlant les pages en profondeur et aspire
eacutegalement le contenu des liens preacutesents sur les pages de lencyclopeacutedie
copy Digimind Digimind Services ndash White Paper |75
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Plus eacutelaboreacute le moteur franccedilais Exalead 135 enrichit consideacuterablement la recherche
dans lencyclopeacutedie en ligne Cette fonctionnaliteacute est accessible en cliquant sur
longlet Wikipedia Il est eacutevidemment possible de rechercher des articles par mots
cleacutes mais aussi daffiner par langue via le nuage de tags dynamique ( les eacutetiquettes
correspondent agrave des emplacements geacuteographiques personnes ceacutelegravebres noms
drsquoorganisations termes lieacutes agrave votre requecircte ou cateacutegories de Wikipedia)
WikiMindmap 136 recherche sur Wikipedia et affiche les reacutesultats sous forme de
MindMap (cartes heuristiques) Il est alors possible de naviguer dans larborescence
des termes
WikiMindMap
gt Citizendium 137 Lanceacute fin 2006 Citizendium est une initiative de Larry Sanger co-fondateur de
Wikipedia avec Jimmy Wales Citizendium est eacutegalement une encyclopeacutedie Mais
jugeant la communauteacute Wikipedia senseacutee srsquoauto-reacuteguler dysfonctionnelle Larry
Singer integravegre dans Citizendium des proceacutedures de seacutelection des articles par des
experts et refuse aux contributeurs la possibiliteacute de lrsquoanonymat misant ainsi sur la
responsabilisation Le collegravege dexperts a le dernier mot concernant la veacuterification
des articles le but eacutetant dobtenir une encyclopeacutedie contenant le moins derreurs
possible Citizendium est structureacutee en grandes cateacutegories acadeacutemiques
correspondant agrave des groupes de travail Sciences naturelles Sciences Humaines
Arts Sciences Humaines Divertissement Arts appliqueacutes et Sciences
copy Digimind Digimind Services ndash White Paper |76
Le Web 20 pour la veille et recherche dinformation DIGIMIND
gt Alacrawiki 138
AlacraWiki est un guide deacutedieacute aux socieacuteteacutes du secteur de linformation eacutediteurs et
bases de donneacutees La rubrique Alacra Industry Spotlights est particuliegraverement
remarquable elle fournit des analyses et commentaires sur les sites dinteacuterecirct pour
une trentaine de secteurs industriels Le wiki offre des informations sur les
agreacutegateurs de contenu les bases de donneacutees et les meilleurs blogs deacutedieacutes au
secteur de linformation on-line Alacra propose aussi un blog et un fils RSS
Alacra Wiki
gt Les fils RSS 139
Sur cette page de wiki vous trouverez agrave peu pregraves tout sur le RSS
La norme comment utiliser les fils RSS des articles une seacutelection dagreacutegateurs
mixer des fils RSS entre eux mesurer lactiviteacute des fils RSS creacuteer un fil RSS
gtWikidweb 140
Wikidweb est un Wiki qui propose un reacutepertoire de sites web (et non de wikis)
Aussi vous pouvez y participer selon les fonctionnaliteacutes courantes du format wiki
vous avez ainsi la possibiliteacute dy ajouter vos propres sites mais eacutegalement de
modifier les entreacutees des autres internautes (urls texte) ou de les commenter
copy Digimind Digimind Services ndash White Paper |77
Le Web 20 pour la veille et recherche dinformation DIGIMIND
IV Surveiller
Nous lavons vu dans la partie Recherche de blogs et de flux RSS les flux RSS sont
preacutesents sur de nombreux formats du net et vont permettre de surveiller les
nouveauteacutes apparaissant sur les blogs les sites corporate les sites de presse dans
les reacutesultats de moteurs de recherche dactualiteacutes de blogs web dans les
newsgroups sur certains forums web sur certaines listes de diffusion les
bookmarks sociaux les sites de partage de photos et de videacuteoshellipbref sur de tregraves
nombreux sites classiques et ressources collaboratives de type 20
Ces flux RSS peuvent ecirctre inteacutegreacutes agrave votre process de veille en deux clics via des
outils simples gratuits ou payants mais plus puissants
a La deacutetection du flux RSS
Pour pouvoir mettre en surveillance le flux RSS (RSS Feed en anglais) il faut dabord
le trouver Or il nest pas toujours aiseacute de mettre la main sur ces petits logos
oranges ou les liens RSS Abonnez-vous Syndiquez ce flux qui pointent vers les
flux RSS parfois cacheacutes dans les meacuteandres des pages web
Des icocircnes signalant la preacutesence de flux RSS
Certains navigateurs permettent de deacutetecter automatiquement les flux lorsquils
sont preacutesents sur une page web Une icocircne vous avertira alors et dans la plupart
des cas affichera ladresse du ou des flux disponibles sur la page Plusieurs formats
de flux peuvent coexister les diffeacuterentes versions du RSS (090 091 092 10 20)
et le format ATOM concurrent mais offrant les mecircmes fonctionnaliteacutes
Internet Explorer 7 Opera Firefox permettent de deacutetecter les flux Cest aussi le cas
de Maxthon une puissante interface de navigation qui vient se greffer sur
larchitecture dInternet Explorer 141
copy Digimind Digimind Services ndash White Paper |78
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b La mise en surveillance
Quelque soit laspect de la page qui contient votre flux RSS (xml rdf interface
Feedburner) il convient de copier et coller ladresse (url) dans loutil qui va vous
servir agrave lire ce flux et agrave ecirctre alerteacute degraves lors quune nouveauteacute apparaicirct
4 grands types doutils peuvent ecirctre utiliseacutes (du plus simple au plus sophistiqueacute)
- Les navigateurs web
Les navigateurs citeacutes preacuteceacutedemment outre la deacutetection du flux RSS permettent de
sy abonner et de les lire Les flux sintegravegrent alors dans un menu lateacuteral ou dans la
page principale Cest simple mais deacutepourvu de fonctions avanceacutees de tri ou
dorganisation
- Les lecteurs (ou agreacutegateurs) de flux RSS
Ce sont les outils deacutedieacutes aux fils RSS Comme de nombreuses applications ces
lecteurs sont soit disponibles en ligne soit agrave installer localement sur votre PC
- Exemples de lecteurs RSS en ligne Bloglines Pluck Newsgator
- Exemples de lecteurs RSS installeacutes RSS Reader Amphetadesk Newsgator (sintegravegre
agrave Outlook) FeedDemon
Le lecteur Bloglines exploite de maniegravere astucieuse la logique communautaire
lorsque vous ecirctes abonneacute agrave un flux RSS vous pouvez visualiser les autres abonneacutes
(ceux qui ont accepteacute de rendre leur abonnement public) Un clic sur leur nom
affiche tous les fils RSS auxquels ils ont souscrits un moyen rapide de deacutecouvrir
dautres ressources pertinentes collecteacutees par des internautes proches de vos
centres dinteacuterecirct
Les lecteurs RSS sont tregraves nombreux Pour mieux les distinguer certains blogs ou
sites proposent des comparatifs142
copy Digimind Digimind Services ndash White Paper |79
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La communauteacute sur Bloglines les abonneacutes au flux RSS du blog Voip Weblog
- Les pages personnalisables
Ce sont des pages web geacuteneacuteralement organiseacutees en onglets et boicirctes permettant
dorganiser et de ranger ses flux par cateacutegories et ce dans un mecircme espace Ces
services sont ergonomiques et ideacuteaux pour lire dun coup doeil le maximum de flux
Les plus connus sont NetVibes PageFlakes ou Webwag
Outre la lecture de flux RSS ces pages offrent la possibiliteacute dinteacutegrer des services
de meacuteteacuteo mail bloc-notes et des flux provenant de service sociaux comme les
bookmarks ou les reacuteseaux damis
Certains blogs fournissent des listes et comparatifs de ces services143
- Les progiciels de veille inteacutegreacutes
Face agrave labondance des flux RSS et blogs des applications de veille inteacutegreacutee comme
Digimind Evolution 144 donnent la possibiliteacute de filtrer les RSS via lapplication de
requecirctes diffeacuterentes sur chaque fils RSS
On peut ainsi seacutelectionner les informations agrave remonter via des requecircte simples ou
plus complexes (booleacuteens parenthegraveses troncatures et opeacuterateurs de proximiteacute) agrave
longueur illimiteacutee En outre il est possible de surveiller jusquagrave 10 000 flux RSS
quotidiennement
Les boutons inteacutegreacutes
Certains sites vont vous simplifier la tacircche ils affichent sur leurs pages agrave coteacute de
leurs flux des boutons qui permettent dajouter directement le flux agrave votre lecteur
copy Digimind Digimind Services ndash White Paper |80
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ainsi le service dactualiteacutes Wikio ou le moteur Ask Blogs amp Flux proposent tous
deux des boutons vers Bloglines MyYahoo Google Reader Newsgator et Ask Blog
Les fichiers OPML
LOPML (Outline Processor Markup Language) est un format deacuteveloppeacute en XML qui
permet leacutechange dinformations structureacutees entre applications fonctionnant sur des
OS et environnement diffeacuterents Exemple les abonnements dun internaute agrave un
ensemble de flux RSS entre un navigateur Firefox et Internet Explorer de MacOS agrave
Windows XP
Des agreacutegateurs RSS comme Bloglines NewsGator ou Rojo offrent la possibiliteacute
dexporter lensemble de vos flux RSS favoris ou ceux dautres abonneacutes au format
OPML pour les importer ensuite dans votre agreacutegateur
Share your OPML145 est comme son nom lindique un portail qui vous permet de
partager vos flux RSS au format OPML Ce service liste des centaines de fichiers
OPML
c Pourquoi une veille via le RSS
Faire une veille via les fils RSS preacutesente des inteacuterecircts notables
- Lhyper-segmentation le choix des fils RSS rend possible une seacutelection fine de
linformation Ainsi sur le site du Figaro on peut choisir lactualiteacute internationale
nationale les sciences et meacutedecine eacutevitant ainsi decirctre submergeacute par linformation
superflue Sur La Tribune on peut seacutelectionner un flux par socieacuteteacute
Certains blogs proposent mecircme des flux RSS permettant aux choix de surveiller les
commentaires ou uniquement les billets
- Un gain de temps inutile de se connecter au site au blog ou au moteur de
recherche pour visualiser ses nouveauteacutes
- Lanonymat labonnement agrave un flux RSS contrairement agrave une newsletter ou agrave une
liste de diffusion est anonyme
- La consultation aiseacutee vos fils RSS via une lecture sur un agreacutegateur en ligne sont
accessibles de nimporte quel PC connecteacute agrave linternet ougrave que vous soyez
copy Digimind Digimind Services ndash White Paper |81
Le Web 2
copy Digimin
0 pour la veille et recherche dinformation DIGIMIND
d Digimind Services ndash White Paper
V Carte des outils et ressources Web 20
gt Page suivante
|82
wwwdigimindcom Digimind Services ndash White Paper|83
Carte des outils et ressources Web 20 - DIGIMIND Services 2007
Le Web 20 pour la veille et recherche dinformation DIGIMIND
EXEMPLE DUNE RECHERCHE ET VEILLE VIA LE WEB 20
Cas drsquoeacutecole Nous avons agrave mener une recherche et une veille sur le
deacuteveloppement des smartphones ou teacuteleacutephones multimeacutedias haut de gamme Des
sites de type 20 pourront se reacuteveacuteler compleacutementaires de sites classiques (sites
drsquoentreprises portails associations professionnelleshellip) pour deacutetecter les tendances
et sujets eacutemergents
Une premiegravere recherche via lrsquoencyclopeacutedie Wikipedia permettra drsquoobtenir une
premiegravere deacutefinition du sujet et drsquoidentifier les principaux mots cleacutes ainsi que des
liens vers des sites pertinents
Etape suivante nous pourrons eacutelargir notre recherche en identifiant des sites
similaires aux sites trouveacutes preacuteceacutedemment via les suggestions fournies par des
moteurs collaboratifs tels que Yoono ou Similicious
Une recherche sur le tag Smartphone dans des sites de social bookmarking
comme Delicious nous permettra eacutegalement drsquoidentifier les pages plus ou moins
populaires taggeacutees par les contributeurs du site ainsi que drsquoautres tags en relation
avec notre sujet
Explorons ensuite les avis drsquoexperts plus ou moins autoriseacutes que lrsquoon trouvera dans
les meacuteandres de la blogosphegravere gracircce agrave des moteurs de blogs comme Technorati
Blogpulse ou Google Blog Search
La recherche pourra srsquoeffectuer via les tags ou le texte inteacutegral des billets On
pourra ensuite parcourir les blogrolls des auteurs les plus pertinents afin drsquoidentifier
drsquoautres sources
La lecture des blogs fournira non seulement des avis de speacutecialistes ou journalistes
mais aussi des avis plus ou moins critiques de consommateurs ou utilisateurs de
smartphoneshellip
Il conviendra toutefois de rester vigilant quant agrave lrsquoeffet pot de miel de certains
blogs ougrave les contributions des internautes se reacutevegravelent ecirctre de simples messages
publicitaires deacuteguiseacutes (voir agrave ce sujet la mise en garde du site UFC Que choisir146)
Pour recueillir les derniegraveres informations drsquoactualiteacute on pourra utiliser un
agreacutegateur tel que Wikio ou Digg et creacuteer un flux RSS agrave partir drsquoune requecircte sur les
copy Digimind Digimind Services ndash White Paper |84
Le Web 20 pour la veille et recherche dinformation DIGIMIND
tags preacuteceacutedemment identifieacutes Wikio propose des raccourcis pour inteacutegrer ce flux
au sein de plusieurs lecteurs RSS du marcheacute (Netvibes Newsgator Google Reader
etc)
Les reacuteseaux sociaux professionnels permettront eacutegalement drsquoidentifier des acteurs
importants du domaine dans les sphegraveres universitaires ou de lrsquoentreprise
La communauteacute 20 srsquoexprimera eacutegalement sur les grands portails consacreacutes aux
nouvelles technologies Crsquoest le cas par exemple du portail ZDNet qui permet aux
utilisateurs de commenter les articles ou de les ajouter directement agrave leur profil
Delicioushellip Les commentaires ou les trackbacks pointant sur un article pourront
constituer un preacutecieux compleacutement drsquoinformations
Afin de mener une veille reacuteguliegravere sur le sujet on syndiquera les flux RSS provenant
des diffeacuterents sites ou blogs identifieacutes Pourquoi ne pas eacutegalement creacuteer agrave partir de
ce bouquet de sources personnaliseacutees un moteur sur mesure conccedilu gracircce agrave Rollyo
ou Yahoo Search Builder
copy Digimind Digimind Services ndash White Paper |85
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les limites du Web 20
LA PARTICIPATION
I Une participation heacuteteacuterogegravene
Nous lavons deacutejagrave eacutevoqueacute tout le monde ne participe pas de la mecircme maniegravere sur
les applications du Web 20
Une minoriteacute participativehellip
Bill Tancer de la socieacuteteacute de mesure daudience Hitwise reacutevegravele dans une eacutetude147
que sur les sites type Web 20 les internautes regardent mais participent peu
Seulement 016 des visiteurs du site YouTube viennent y partager leurs videacuteos
Les 9984 restant ne font que regarder Idem pour le site de partage de photos
de Yahoo Flickr seulement 02 des visites conduisent agrave la publication de photos
Wikipedia est lexception sur lencyclopeacutedie collaborative gratuite 46 des
visites correspondent agrave une modification des articles
Sur ces sites on est donc encore loin de la regravegle de la 11089 eacutedicteacutee par Charles
Arthur dans The Guardian148 Il estime que sur le net sur un groupe de 100
personnes si une creacutee du contenu 10 vont interagir (commentaires
ameacuteliorations) et les 89 restant ne feront que le lire et regarder Le journaliste
lillustre via des exemples quantifieacutes avec YouTube Wikipedia ou Yahoo Groups
Most Web 20 Users Are Really Just Couch Potatoes Bruce Nussbaum compare
mecircme les internautes Web 20 aux spectateurs de TV passifs et affaleacutes dans leurs
canapeacutes149
Mais parallegravelement les sites de type Web 20 ont vu leur audience grimper
de668 en 2 ans reacutevegravele leacutetude Hitwise Cela repreacutesente 12 du trafic web aux
USA contre 2 il y a seulement 2 ans
Les sites de partage de photos sont parmi les plus populaires Flickr bien sucircr mais
aussi PhotoBucket qui repreacutesente agrave lui seul 41 du trafic des sites de photos en
ligne
copy Digimind Digimind Services ndash White Paper |86
Le Web 20 pour la veille et recherche dinformation DIGIMIND
hellipdautant plus que la forme de participation se complexifie
Dapregraves le cabinet Forrester les internautes sont nombreux sur les actions agrave faible
niveau dexigence (lire enregistrer un signet commenter) mais beaucoup moins sur
des participations plus actives (eacutecrire collaborer) 150
Wikipedia un faux modegravele collaboratif
On cite souvent lencyclopeacutedie Wikipedia en exemple cest lun des emblegravemes les
plus forts et les plus lus du Web 20 Son mode de fonctionnement est
caracteacuteristique voire symptomatique du web collaboratif Mais le process de
Wikipedia serait finalement tregraves classique avec une hieacuterarchie de contributeurs
sorte de cadres disposant de nombreux droits eacutecrivant la majoriteacute des articles
Cest lanalyse de Lionel Barbe du CNRS151 Il explique que si le principe de liberteacute
de publication sur Wikipedia reste valable il est de moins en moins commun car
la plupart des entreacutees basiques ne precirctant pas agrave discussion ont deacutejagrave eacuteteacute effectueacutees
Lrsquoeacutetude des laquo logs raquo historiques montre que la creacuteation de nouvelles entreacutees qui
correspondent agrave de nouvelles pages articles dans la Wikipedia Francophone ne
concerne qursquoenviron 3 agrave 4 des opeacuterations Par comparaison cette proportion tombe
agrave 2 pour la version anglaise de Wikipedia qui contient plus de 1 million drsquoarticles A
lrsquoinverse la proportion monte entre 8 et 10 pour des Wikipedias ayant moins de
100 000 articles comme la Wikipedia en Lituanien et bien drsquoautres
Selon lui on assiste agrave un effet de professionnalisation de lencyclopeacutedie [hellip] les
plus gros contributeurs que nous consideacutererons comme eacutetant les 5 des individus
eacuteditant le plus drsquoarticles eacuteditent entre 85 et 95 du contenu total de lrsquoencyclopeacutedie
Au fur et agrave mesure ces gros contributeurs acquiegraverent des privilegraveges comme le statut
drsquoadministrateur qui leur permettent non seulement de participer mais aussi de
surveiller et le cas eacutecheacuteant censurer le contenu eacutediteacute par les autres contributeurs et de
participer aux grandes lignes de lrsquoorganisation de Wikipedia
Cette analyse a toutefois eacuteteacute battue en bregraveche par Aaron Swartz dans une petite
eacutetude 152 En mesurant non pas le nombre drsquointerventions de chaque contributeur
mais la quantiteacute de texte produit par chacun la reacutealiteacute est diffeacuterente les
contributeurs occasionnels eacutecriraient des textes longs en peu dinterventions tandis
que les eacutediteurs actifs reacutealiseraient un travail tenant davantage de la maintenance
(correction veacuterification suppression) mais sans apporter beaucoup de texte
copy Digimind Digimind Services ndash White Paper |87
Le Web 20 pour la veille et recherche dinformation DIGIMIND
II Une participation damateurs
Tout internaute peut-il simproviser journaliste expert commentateurhellip
Michel Fingerhut 153 voit dans le succegraves dune encyclopeacutedie comme Wikipedia une
manifestation du web comme heacutegeacutemonie de lrsquoamateurisme et comme encouragement
agrave lrsquoextreacutemisme ideacuteologique et au communautarisme
Les contenus creacuteeacutes et diffuseacutes sont-ils de qualiteacute Le Web 20 devient une
plateforme qui stimule la creacuteativiteacute et la production de contenu par cela mecircme
qursquoelle en permet la diffusion (avec indice de notorieacuteteacute) On assiste agrave une libeacuteration
de talents qui peuvent enfin se reacuteveacuteler parallegravelement agrave des productions
caracteacuteriseacutees par un certain amateurisme et lrsquoabsence de veacuteritable ambition
creacuteatrice Car comme sur lensemble de linternet sur ce Web 20 le pire cocirctoie le
meilleur
Par ailleurs toujours en prenant lexemple de Wikipedia un certain nombre de
pheacutenomegravenes se reacutevegravelent tout de mecircme preacuteoccupants
Si leacutetude reacutealiseacutee pour le magazine Nature reacutevegravele que la qualiteacute des articles de
lencyclopeacutedie est presque au niveau de celle de lEncyclopaedia Britannica certains
articles de Wikipedia relegravevent de la deacutesinformation ou de la propagande
- larticle Droits de lHomme en Iran154 a ainsi eacuteteacute tregraves controverseacute en effet cet
article tregraves long de plus de 20 pages se preacutesente davantage comme une apologie du
reacutegime iranien quune analyse argumenteacutee des droits de lhomme dans ce pays Or
certainement au nom du principe de neutraliteacute qui reacutegit Wikipedia cet article
tendancieux a eacuteteacute classeacute comme article de qualiteacute 155
- le cas Seigenthaler 156 en mai 2005 un contributeur publie anonymement sur
Wikpedia un article sur John Seigenthaler Sr un eacutecrivain ceacutelegravebre aux USA Or ce
billet mentionne que leacutecrivain a eacuteteacute directement impliqueacute dans les assassinats de
John et Bob Kennedy en preacutecisant toutefois que rien na jamais eacuteteacute prouveacute Cette
information est tout simplement fausse Mais larticle nest deacutecouvert (par un ami de
John Seigenthaler) et corrigeacute que 4 mois plus tard mettant agrave mal la creacutedibiliteacute de
lencyclopeacutedie A la suite de cette affaire largement relayeacutee par les meacutedias
ameacutericains le fondateur de Wikipedia a rigidifieacute les regravegles de publication concernant
les tout nouveaux contributeurs
Certes sur les milliers darticles mis en ligne par Wikipedia ces dysfonctionnements
restent heureusement minoritaires mais ils reacutevegravelent tout de mecircme certaines limites
du tout collaboratif et la neacutecessiteacute de regravegles de publication emprunteacutees aux meacutedias
classiques
copy Digimind Digimind Services ndash White Paper |88
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Lagreacutegation de petites choses faciles
Elles ont tendance agrave dominer le contenu du Web 20 La faciliteacute de publication le
rythme des blogs qursquoil convient drsquoalimenter freacutequemment peut entrer en conflit
avec le temps de la recherche et de la reacuteflexion Souvent les thegravemes traiteacutes ne
peuvent degraves lors ecirctre que des sujets du quotidien des opinions non reacutefleacutechies non
argumenteacuteeshellipOn peut donc craindre agrave linstar du mode de diffusion sur dautres
meacutedias quinteacutegreacute agrave un reacuteseau social noteacute eacutevalueacute agrave la recherche de notorieacuteteacute et de
visibiliteacute le creacuteateur de contenu ait tout inteacuterecirct agrave aller dans le sens de son audience
produire du divertissant plus agrave mecircme de lui garantir un succegraves immeacutediat
Par ailleurs des opinions peuvent-elles se transformer en jugement pertinent par
lrsquoeffet de leur agreacutegation Lrsquoagreacutegation drsquoune quantiteacute importante drsquoavis peut elle
vraiment deacutepasser lrsquoimpreacutecision des avis pris indeacutependamment Peut-on sans une
harmonisation des critegraveres drsquoappreacuteciation atteindre un jugement collectif fiable Les
tendances qui ressortent risquent en effet de se limiter souvent au reflet de
lrsquoopinion majoritaire
Mais leacutevocation de ces limites ne doit pas occulter toutes les contributions matures
produites par des internautes soucieux dapporter un contenu veacuteritablement
constructif Les billets et les commentaires de nombres de blogs politiques franccedilais
en 2007 en sont une parfaite illustration
LE WEB 10 RESTE NECESSAIRE
Le mail reacutesiste
Nous lavons vu au cours de la description des applications pour la veille les services
Web 20 ne sont pas suffisants en soit pour la recherche dinformation De plus
bien que ses possibiliteacutes soient tregraves puissantes lutilisation du Web 20 reste encore
marginale agrave leacutechelle de tous les internautes Une eacutetude du cabinet Pew Internet 157
montre que lactiviteacute internet dominante sur une journeacutee type dun ameacutericain reste
tout simplement le mail 53 des internautes lutilisent Ils sont 38 agrave utiliser un
moteur de recherche Par contre ils ne sont que 8 agrave creacuteer des blogs et 26 agrave
partager des photos et videacuteos cette collaboration multimeacutedia eacutetant de loin lactiviteacute
la plus courante du Web 2
copy Digimind Digimind Services ndash White Paper |89
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une enquecircte en ligne de lUniversiteacute dOxford reacutealiseacutee aupregraves de 1469 personnes
(une majoriteacute deacutetudiants) fin 2006 deacutetaille les usages du Web 20 158 Elle reacutevegravele elle
aussi que les applications de ce web nouvelle geacuteneacuteration sont encore peu connues
et peu utiliseacutees La majoriteacute des reacutepondants na jamais employeacute ou jamais entendu
parleacute des fils RSS ou des applications de Social Bookmarking comme Delicious
Aussi linfluence grandissante du Web 20 ne doit pas masquer les usages
traditionnels du web qui restent majoritaires
Une population souvent isoleacutee et non repreacutesentative
Lage
Si de nombreuses applications sociales apportent un reacuteel progregraves il faut tempeacuterer
la nature de certains contenus issus du mode collaboratif celui-ci nest en effet pas
repreacutesentatif des internautes puisque le public du Web 20 est une population plutocirct
jeune
Ainsi leacutetude Pew Internet reacutevegravele que laudience de Wikipedia aux USA eacutetait en aoucirct
2006 agrave 47 situeacutee dans la tranche des 18-34 ans Les plus de 45 repreacutesentaient
28 Sur le site dEncarta lencyclopeacutedie de Microsoft plus traditionnelle (Web 10)
la part des plus de 45 ans atteint 33
Des communauteacutes isoleacutees structureacutees en icircles Les communauteacutes actuelles du Web 20 sont souvent renfermeacutees sur elles-mecircmes
les statistiques sur les liens pointant vers les blogs et sur les liens preacutesents dans les
billets reacutevegravelent que les blogueurs se lient et se lisent beaucoup entre eux
Lrsquointernaute Web 20 aurait donc tendance agrave senfermer sur lui-mecircme et autour
dindividus feacutedeacutereacutes en communauteacutes focaliseacutes sur les mecircmes centres drsquointeacuterecirct que
lui
Par ailleurs lhyper segmentation et le ciblage des nouvelles rendu possible par le
flux RSS notamment peut conduire agrave favoriser ces microcosmes communautaires
Parcourir un journal papier peut favoriser davantage louverture la prise de recul et
la mise en perspective des diffeacuterentes informations que la lecture de flux aux
theacutematiques tregraves speacutecialiseacutees
Les diffeacuterentes communauteacutes par reacuteflexe et de par la nature des applications Web
20 qui se dupliquent mais ne se connectent pas ont tendance agrave peu communiquer
entre elles Ainsi les liens entre reacuteseaux sociaux sont rares Peu de personnes
copy Digimind Digimind Services ndash White Paper |90
Le Web 20 pour la veille et recherche dinformation DIGIMIND
enregistreacutes sur LinkedIn iront eacutegalement sinscrire sur Viadeo ou FaceBook
Latomisation des donneacutees sur des dizaines dapplications reste eacutegalement un vrai
problegraveme
Des domaines mal couverts
Certaines theacutematiques vont ecirctre surrepreacutesenteacutees au deacutetriment dautres au
traitement beaucoup plus confidentiel car boudeacutees par les internautes producteurs
volontaires dinformation Les ingeacutenieurs techniciens et jeunes eacutetant fortement
repreacutesenteacutes parmi les blogueurs les theacutematiques high tech sont tregraves largement
couvertes par les blogs par exemple dans le domaine de la RFID (Identification par
Radio Freacutequence) on compte plus de 100 blogs idem pour la VoIP (Voix sur IP) A
linverse si vous travaillez dans le secteur des machines outils ou de la plasturgie il
vous sera difficile de trouver du contenu sur la blogosphegravere
Tous les secteurs ne sont donc pas eacutegaux en volume sur le net et davantage encore
sur la blogosphegravere et sur les autres applications collaboratives ougrave tout internaute
peut publier son propre contenu et ougrave certaines tranches dacircges et cateacutegories
professionnelles ne sont pas bien repreacutesenteacutees
copy Digimind Digimind Services ndash White Paper |91
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Conclusion
Le Web 20 ce mot qui geacutenegravere eacutenormeacutement de buzz deacutecrits et de blogs
speacutecialiseacutes nest-il quun terme marketing un courant de mode 159 Il est probable
que bientocirct on ne lemploiera plus pour deacutesigner ces nouvelles applications qui
seront devenues la norme Toutefois ce terme sorte de parapluie conceptuel qui
recouvre les diffeacuterentes tendances du web nouvelle geacuteneacuteration a le meacuterite de
mettre un nom simple sur un courant du net novateur
Le Web 20 nest pas une reacutevolution ou une rupture technologique mais plus
certainement une eacutevolution qui permet de replacer lutilisateur au centre des
reacuteseaux Cela nest certes pas tregraves nouveau Usenet lun des plus anciens
protocoles de linternet bien anteacuterieur au WWWeb offrait du contenu en ligne
creacuteeacute par linternaute via les Newsgroups degraves les anneacutees 1980
Mais les progregraves technologiques ont permis dintensifier cette tendance et de
deacutemocratiser laccegraves agrave la creacuteation de contenu en ligne et agrave sa diffusion au plus grand
nombre Potentiellement tout internaute peut maintenant diffuser ses publications
tant les outils sont devenus simples
Le Web 20 tend agrave sinseacuterer au cœur du quotidien de chacun en lui apportant des
services novateurs reacuteellement utiles et qui rendent possible lrsquoapparition de
nouveaux usages Ainsi les mash-up qui srsquoappuient sur la geacuteolocalisation ouvrent
des possibiliteacutes inenvisageables jusquici On peut mecircme imaginer agrave terme une
superposition de ces cartes dynamiques agrave la vision reacuteelle dun pieacuteton ou dun
automobiliste Le Web 20 est en perpeacutetuelle eacutevolution ses capaciteacutes drsquoinnovation
sont tregraves fortes car elles reposent souvent sur des recombinaisons audacieuses de
lrsquoexistant hybridant applications et services dans un systegraveme de deacuteveloppement
open source hellipLrsquoinnovation est aussi innovation de postures (prendre la parole
consommer du contenu amateurhellip) qui parfois challengent lrsquoordre eacutetabli et
redistribuent les pouvoirs La position des acteurs du Web 10 ou des meacutedias
classiques pourrait se trouver de plus en plus remise en question lagrave ougrave les
internautes tendent agrave se placer en experts
copy Digimind Digimind Services ndash White Paper |92
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La place de lhumain
Si celle-ci est devenue preacutepondeacuterante il est toutefois difficile de saffranchir
dorganisations un tant soit peu hieacuterarchiseacutees lautoreacutegulation voir Wikipedia ayant
ses limites
En outre la question de la consommation de contenu et de sa qualification sur
lrsquointernet devient cruciale La pertinence des votes de tous les internautes est
discutable ou du moins le fait qursquoils puissent agrave eux seuls qualifier et eacutevaluer la
qualiteacute Par ailleurs que repreacutesente exactement un vote une adheacutesion au contenu
agrave la forme aux ideacutees aux eacutecrits dun ami agrave une ideacutee avec laquelle je suis en
deacutesaccord mais qui agrave le meacuterite dexister
Finalement il faut continuer agrave normer organiser coordonner
reacutegulerhellipnotamment pour eacuteviter les diffamations ou la deacutesinformation Pour ce qui
est du contenu et de sa qualiteacute les critiques eacutemises agrave lrsquoencontre de Wikipeacutedia nous
incitent agrave eacutetudier de plus pregraves les initiatives qui hybrident les interventions
drsquoamateurs avec les compeacutetences de professionnels
Nous sommes passeacutes en 10 ans dun contenu geacuteneacutereacute par quelques internautes pour
la masse agrave un contenu de masse agrave destination de la masse (Evertybody to
Everybody) Cela ne peut guegravere se deacutevelopper sans des meacutecanismes qui replacent
les internautes les plus speacutecialiseacutes dans des processus de validation dune
information devenue pleacutethorique
Les donneacutees personnelles
Simpliciteacute reacuteactiviteacute personnalisation souplesse mutualisationhellipfont partie des
avantages les plus appreacuteciables du web 20 Mais cette liberteacute de publication et de
diffusion nrsquoest elle pas parfois illusoire Les utilisateurs doivent rester vigilants face
aux problegravemes de confidentialiteacute seacutecuriteacute et traccedilabiliteacute de lrsquoinformation160 Des voix
srsquoeacutelegravevent pour deacutenoncer les risques lieacutes agrave la maicirctrise des donneacutees personnelles ou
au respect des droits drsquoauteurs A noter que les licences Creative Commons161
permettent de mieux deacutefinir les contours de cette liberteacute agrave partir de contrats
flexibles de droit dauteur Ce systegraveme Creative Commons donne la possibiliteacute
gratuitement et simplement aux titulaires de droits de choisir et drsquoexprimer les
conditions drsquoutilisation de leurs œuvres agrave travers onze possibiliteacutes Quant aux
utilisateurs ils nrsquoont pas agrave neacutegocier systeacutematiquement une autorisation avant toute
utilisation ou reacuteutilisation
copy Digimind Digimind Services ndash White Paper |93
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Un autre problegraveme reacuteside aussi dans lrsquoeacuteparpillement des donneacutees dans des sites
diffeacuterents ou parfois redondants Il srsquoagira donc de deacutefinir les objets (livre
personne CD photoshellip) agrave partir drsquoun identifiant Cette bataille pour savoir qui
geacuterera ces donneacutees de base telles que la position geacuteographique les espaces de noms et
le code unique de chaque produit a deacutejagrave commenceacute estime Tim OReilly 162
Les perspectives deacutevolution vers un Web 3
Le web actuel est destructureacute et la classification et lrsquoorganisation de son contenu
posent problegraveme La recherche de nouveaux modes de recherche et de
structuration est une sorte de quecircte du graal que de nombreux experts et
entreprises poursuivent
La folksonomie repose sur une ideacutee originale qui sous tend toute lrsquoideacuteologie Web
20 celle de lrsquointelligence collective et de la deacutecentralisation Mais les limites de la
folksonomie appeleacutee aussi web seacutemantique du pauvre remettent en question
lrsquoaffirmation selon laquelle lrsquointelligence collective et la libeacuteralisation totale du
fonctionnement du web 20 sont une solution viable
Aussi la neacutecessiteacute drsquoun Web seacutemantique 163 fiable se fait de plus en plus urgente
Cette nouvelle phase de deacuteveloppement du Web permettrait drsquoameacuteliorer
lrsquoexploitation des informations par les utilisateurs en obtenant une information
organiseacutee normaliseacutee de faccedilon agrave rendre le web compreacutehensible aux machines pour
faciliter lrsquoexploitation par les utilisateurs
Dans un article paru dans le New York Times en novembre 2006 John Markoff
imagine un web 30 selon le principe drsquoajout dune couche de sens tout en haut du
web existant pour en faire un guide au lieu drsquoun simple catalogue Pour lrsquoauteur
nous sommes en train de passer dun web de documents connecteacutes agrave un web de
donneacutees connecteacutees
Le web seacutemantique offrira un langage commun permettant aux donneacutees de
renvoyer agrave des objets du monde reacuteel dune faccedilon identique Le projet Freebase
lanceacute par la start up Metaweb illustre cette approche il a pour objectif de faciliter
la recherche et le partage drsquoinformations agrave travers une base de connaissances
communes structureacutees via des meacutetadonneacutees permettant de deacutecrire chaque
eacuteleacutement drsquoinformation Ces eacuteleacutements seraient relieacutes entre eux par un systegraveme de
relations Tim OrsquoReilly deacutefinit le projet comme la machine agrave creacuteer les synapses du
cerveau global
Il srsquoagirait de creacuteer en quelque sorte un Google du web seacutemantique un reacutepertoire global
drsquoinformations structureacutees intelligibles et exploitables autant par des machines que par
copy Digimind Digimind Services ndash White Paper |94
Le Web 20 pour la veille et recherche dinformation DIGIMIND
des humains -et donc capables drsquoextraire et drsquointerpreacuteter les relations entre des donneacutees
pour par exemple reacutepondre agrave des requecirctes par des solutions plutocirct que des listes de
document 164
La veille
Dans cet univers le chercheur dinformations et le veilleur doiventhellipgarder la tecircte
froide la forte meacutediatisation du Web 20 ne doit pas masquer la pertinence doutils
plus traditionnels Les diffeacuterentes applications Web 20 nous lavons vu suffisent
rarement pour mener agrave bien une collecte dinformation Certes les bookmarks
sociaux apportent un contenu seacutelectionneacute par linternaute mais on ne peut se
deacutepartir des moteurs de recherche web classiques La surveillance des flux RSS
permet decirctre alerteacute sur de nombreux sujets mais la majoriteacute des sites web restent
encore deacutepourvus de ces fils Les tags apportent une veacuteritable souplesse agrave
lutilisateur mais la taxonomie des bibliothegraveques ou des reacutepertoires web- pour ne
citer que ces lieux- reste essentielle pour se repeacuterer agrave travers des milliers de
ressources
Le Web 20 pour la recherche et la veille nen est quagrave ses balbutiements Aussi
avant quil ne digegravere complegravetement par enrichissement les ressources et les
applications Web 10 il convient de faire coexister ces 2 web dans les pratiques
Le Web 20 apporte une richesse essentielle lrsquoexpression drsquoindividus porteurs
drsquoideacutees et de faculteacutes susceptibles drsquoapporter des changements de re-questionner
lrsquoordre eacutetabli eacuteleacutements indispensables agrave lrsquoeacutevolution de la culture agrave condition de ne
pas oublier que des volonteacutes ambitieuses doivent intervenir pour canaliser les
initiatives sans les eacutetouffer et leur insuffler une veacuteritable ambition Voilagrave tout
lenjeuhellip
copy Digimind Digimind Services ndash White Paper |95
Le Web 20 pour la veille et recherche dinformation DIGIMIND
A propos des auteurs DIGIMIND SERVICES
Digimind Services accompagne les plus grandes entreprises pour la conception la
mise en œuvre et le deacuteploiement de projets de veille qui reposent sur la solution
Digimind Evolution apportant agrave ses clients un retour sur investissement de plus de
600 et ce degraves la premiegravere anneacutee Les meacutethodologies proprieacutetaires du
deacutepartement conseil ainsi que son expertise des probleacutematiques et sources
drsquoinformations sur plus de 20 secteurs drsquoactiviteacute deacuteveloppeacutee aupregraves de ses clients
depuis de nombreuses anneacutees permet aux entreprises drsquoanticiper les changements
de leur environnement pour prendre les meilleures deacutecisions sur leur marcheacute
Le conseil Digimind porte sur tous les aspects du workflow de veille ciblage
strateacutegique collecte des informations traitement et analyse exploitation et
diffusion gestion de projet conseil organisationnel et gestion du changement
formations et support fonctionnel et technique
CHRISTOPHE ASSELIN
Issu drsquoun cabinet drsquoeacutetudes de marcheacute B2B et speacutecialiseacute depuis 1997 dans la mise en
place de systegravemes de veille (e-Franceorg Ecole Militaire) Christophe Asselin allie
une connaissance approfondie des secteurs eacuteconomiques et une parfaite maicirctrise
des outils de recherche sur internet et des solutions avanceacutees de veille Expert
reconnu il eacutedite le site httpwwwintelligence-centercom et le blog
httpinfluxjouebcom tout deux consacreacutes agrave la recherche dinformation
Speacutecialiste de la veille internet chez Digimind il accompagne les clients dans la mise
en place de leur dispositif de veille (expression des besoins deacutefinition de plans de
veille sourcing architecture parameacutetrage formation accompagnement) Il
intervient ainsi aupregraves de socieacuteteacutes dans diffeacuterents secteurs les teacuteleacutecoms avec
France Telecom RampD lrsquoindustrie pharmaceutique avec Sanofi Aventis Roche
Pharma Expanscience ainsi quAlstom Transport Veolia Environnement et des
reacutefeacuterences confidentielles dans le secteur des biotechnologies de leacutenergie des
teacuteleacutecoms de limprimerie de la deacutefense du conseilhellip
copy Digimind Digimind Services ndash White Paper |96
Le Web 20 pour la veille et recherche dinformation DIGIMIND
[Merci au Service Marketing agrave Malaiac wwwmalaiacnet et agrave Elsa Bonier eacutetudiante
en Master 2 Management des innovations en communication agrave Paris XIII pour leur
fructueuse collaboration]
VERONIQUE MESGUICH
Apregraves avoir fondeacute et co-dirigeacute pendant six ans un cabinet speacutecialiseacute en veille
technologique Veacuteronique Mesguich dirige lrsquoInfothegraveque du Pocircle Universitaire
Leacuteonard de Vinci Elle enseigne eacutegalement la maicirctrise de linformation strateacutegique
dans plusieurs eacutetablissements denseignement supeacuterieur et anime reacuteguliegraverement
des sessions de formation continue autour de la meacutethodologie de recherche
avanceacutee et de veille sur Internet
Veacuteronique Mesguich est lrsquoauteur avec Armelle Thomas de lrsquoouvrage Net
recherche le guide pour trouver lrsquoinformation utile dont la deuxiegraveme eacutedition est
parue en mars 2007 aux eacuteditions de lrsquoADBS
copy Digimind Digimind Services ndash White Paper |97
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Webographie Bibliographie
Sources dinformation sur le Web 20
Sites web wikis et blogs
Reacutepertoires et classement de services et socieacuteteacutes Web 20 - 20 Websites http20websitescom - Web 20 Magazine Top 100 Web 20 Sites httpweb2magazineblogspotcom200701thanks-for-web-2html - Web 20 Magazine The Best Web 20 Software of 2006 httpweb2socialcomputingmagazinecomthe_best_web_20_software_of_2006htm - Complete List of Web 20 Products and Services httpwwwlistiblecomlistcomplete-list-of-web-2-0-products-and-services - The Complete Web 20 Directory httpwwwgo2web20net - FredCavazzanet le meilleur du Web 20 httpwwwfredcavazzanetindexphp20051212986-le-meilleur-du-web-20 - Web 20 Directory 1200+ Web 20 Sites in 50+ categories httpweb2econsultantcomindexhtml
- Top 25 Web 20 Search Engines httpoedborglibraryfeaturestop-25-web20-search-engines
- 25 start-ups Web 20 prometteuses httpmoneycnncom20070221magazinesbusiness2nextnet_introbiz2
copy Digimind Digimind Services ndash White Paper |98
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Blogs et sites speacutecialiseacutes - Le groupe de travail Web20 francophone httpwwwweb20workgroupfr
- Web 20 Work Group httpweb20workgroupcom - Dessine-moi le Web 20 httpwwwdeuxzerocom - FredCavazzanet httpwwwfredcavazzanet
- TechCrunch en franccedilais httpfrtechcrunchcom - TechCrunch httpwwwtechcrunchcom
- Le web 20 cest pas du buzz httpweb2rulesblogspotcom
- Mashable France httpfrmashablecom - Mashable httpmashablecom - AccessoWeb httpblogaccessowebinfo - Web 20 Magazine httpweb2magazineblogspotcom - Reacutevolution Web 20 en Live httpwwwwebdeuxinfo
- ReadWriteWeb httpwwwreadwritewebcom - Web 20 Innovations httpweb2innovationscom - Web 20 Summit httpwwwweb2concom
- Original Signal (agreacutegateur de flux RSS) httpwwworiginalsignalfr - Whats Web 20 (agreacutegateur de flux RSS) httpwwwwhatsweb20comaggregatorfrom=100
- Le blog de Bloxx Communiquons avec le Web 20 httpblogbloxxfr
copy Digimind Digimind Services ndash White Paper |99
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- FrenchWeborg Le blog des professionnels franccedilais du Web 20 httpwwwfrenchweborg
- Blog Web 20 et Marketing httpwwwvincentabrycom - Le Web 20 en Action httpleweb2blogspotcom - aYsoon 20 httpblogaysooncom Emmanuel de Taillac httpemmanueldetaillacfr - NiouMedia httpnioumediacom - 2803 httpwww2803com - Web 2 francophone (Wiki) httpweb2frcomAccueil
Blogs et sites avec un axe Web 20
- Publishing 20 httppublishing2com - Social-Computing httpwwwsocial-computingcom - Ecosphere httpecospherewordpresscom - inFLUX httpinfluxjouebcom - Benoit Descary httpdescarycom - Jean Michel Billaut httpbillauttypepadcomjm - Blog francophone des TIC httpwww2607fr 20Minutes Top 50 tech et meacutedias httpwww20minutesfrarticle15087620070410-Blogs-Top-50-tech-et-mediaphp - Intruderstv httpnewintruderstvintruders_fr
copy Digimind Digimind Services ndash White Paper |100
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- Jeff Clavier Sans Accent httpsansaccentsofttechvccom - Demain tous journalistes httpbenoit-raphaelblogspotcom
- Collectif louvre-boicircte Initiatives sur le partage dinformation httplouvre-boiteviablogacom
- Zero seconde httpzerosecondeblogspotcom
Articles
Introduction au Web 20
- Web 20 lrsquoarticle de OrsquoReilly reacutesumeacute pour les faineacuteantshellip httpwwwexpressionsbe20051101web-20-resume-pour-les-faineants
- Dossiers Web 20 - Journal Du net httpwwwjournaldunetcomdossiersweb20
- Avis des managers le Web 20 agrave la loupe httpwwwjournaldunetcomsolutions0603diaporamaavis-managers-web21shtml
- Les entreprises face aux deacutefis du Web 20 httpwwwjournaldunetcomsolutions0704070413-entreprises-web-201shtml
-The Machine is Using Us Transcription (videacuteo) httpmediatedculturesnetksudiggp=78
- The New Wisdom of the Web httpwwwmsnbcmsncomid12015774sitenewsweek
- Quest-ce que Web 20 httpwww01netcomarticle294819html
- Approaching a definition of Web 20 httpsocialsoftwareweblogsinccom20050929approaching-a-definition-of-web-2-0
- Fonctionnement de lrsquoentreprise classique vs entreprise 20 httpalbancornilletfreefrakwindexphp20061002fonctionnement-de-lentreprise-classique-vs-entreprise-20
- Meacutedias traditionnels et acteurs du Web 20 vers la cohabitation ou la convergence des acteurs de lrsquoinformation et du divertissement httpwwwscribdcomdoc50818These-sur-le-Web-2-Cabanis
copy Digimind Digimind Services ndash White Paper |101
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ajax
- LAjax en 5 questions httpwwwjournaldunetcomsolutions0602060208_qr-ajaxshtml - Ajax et Moteurs 20 httpwwwmoteurzinecomarchives2006moteurzine127html2
Les Mashups
- Les Mashups applications Web composites tregraves Web 20 httpwwwjournaldunetcomsolutions0606060628-qr-mashup-hybrideshtml
- Le modegravele eacuteconomique des Mashups httpwwwinternetactunetp=6285 Bookmarks sociaux Social search
- Le Social Bookmarking au secours de la pertinence de la recherche drsquoinformation httpwwwgillesbalmissecomv2spipphparticle171 - Whats the Big Deal With Social Search httpsearchenginewatchcomshowPagehtmlpage=3623153
- Whos Who in Social Search httpsearchenginewatchcomshowPagehtmlpage=3623173
Ouvrages
- Web 20 - Les internautes au pouvoir - Jean-Franccedilois Gervais httpwwwdunodcompagesouvragesficheouvrageaspid=50701
- Les reacuteseaux sociaux Pivot de lrsquointernet 20 - Alain Lefebvre httpwwwcluster21comfrbookreviewlivre_les_reseaux_sociaux - Web 20 (R)eacutevolutions et nouveaux services dInternet - Jean-Noeumll Anderruthy httpwwwamazonfrWeb-2-0-C3A9volutions-nouveaux-dInternetdp2746034972ref=sr_1_18402-7140143-8118507ie=UTF8amps=booksampqid=1178118687ampsr=8-18 - Web 20 The Future of the Internet and Technology Economy and How Entrepreneurs Investors Executives amp Consumers Can Take Ad httpwwwamazoncomWeb-2-0-Technology-Entrepreneurs-Execenablersdp1587622009ref=sr_1_6103-0331542-4028646ie=UTF8amps=booksampqid=1178118732ampsr=1-6
- La Longue Traicircne La nouvelle eacuteconomie est lagrave - Chris Anderson httpwwwamazonfrLongue-TraC3AEne-nouvelle-C3A9conomie-
copy Digimind Digimind Services ndash White Paper |102
Le Web 20 pour la veille et recherche dinformation DIGIMIND
estdp2744062693ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180542516ampsr=1-1 - The Geospatial Web How Geobrowsers Social Software and the Web 20 are Shaping the Network Society httpwwwamazoncomGeospatial-Web-Geobrowsers-Information-Processingdp1846288266ref=sr_1_28103-0331542-4028646ie=UTF8amps=booksampqid=1178118760ampsr=1-28 - Les Wikis espaces de lintelligence collective - Jeacuterocircme Delacroix httpwwwamazonfrWikis-JC3A9rC3B4me-Delacroixdp2952051445ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180544723ampsr=8-1 - Pro Web 20 Mashups Remixing Data and Web Services httpwwwamazonfrPro-Web-2-0-Mashups-Remixingdp159059858Xref=sr_1_4403-1740173-8750801ie=UTF8amps=english-booksampqid=1180542751ampsr=8-4 - Web 20 et Web avanceacute - Alexandre Boni Nicolas Stemart httpwwwamazonfrWeb-2-0-avancC3A9-Alexandre-Bonidp2742967281
copy Digimind Digimind Services ndash White Paper |103
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Dans la mecircme collection
White Paper Blogs et RSS des outils pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind
White Paper
Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind
White Paper
Cateacutegorisation automatique de textes
White Paper
Benchmark des solutions de veille strateacutegique
White Paper
Evaluer le Retour sur Investissement dun logiciel de veille Edouard Fillias Consultant Veille Strateacutegique Digimind
gt A teacuteleacutecharger sur httpwwwdigimindfrserviceswhite_paperhtm
copy Digimind Digimind Services ndash White Paper |104
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Notes 1 httpwwwguimfrblog200612le_film_autumn_html httpwwwlemondefrwebarticle01-02-65186536-8751060html 2 httpvideogooglefrvideoplaydocid=724218352255575783 3 Map of online communities par Randall Munroe httpwwwxkcdcomc256html 4 httpwwwdeuxzerocom 5 httpwwwpaulgrahamcombiohtml httpfrwikipediaorgwikiPaul_Graham 6 Qursquoest ce que le web 20 Hubert Guillaud Internet Actu 29 mai 2005 httpwwwinternetactunetp=6144 7 httpwwworeillynetcompubaoreillytimnews20050930what-is-web-20html httpweb2rulesblogspotcom200601what-is-web-20-par-tim-oreilly-versionhtml 8 httpwwwzdnetfractualitesinternet0390207743933447900htm 9 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 10 httpwwwinternetactunetp=7035 11 httpwwwhitwisecomdatacenter 12 httprosstypepadcomblog200604power_law_of_pahtml 13 httpblogsforrestercomcharleneli200704forresters_new_html 14 httpwwwtagcrowdcom 15 You Say You Want a Web Revolution httpwwwwiredcomsciencediscoveriesnews20050868403 16 httpsaddonsmozillaorgfrfirefoxaddon748 httpwwwjournaldunetcomdeveloppeurtutorielout050525-greasemonkey-presentationshtml 17 Mashups Google Maps httpwwwmibazaarcomextrasfortune100html httpwwwweatherbonkcomweatherindexjsp httpgmapstommanganusspacecraft_trackinghtml 18 httpwwwgooglecomcalendar 19 httpdocsgooglecom 20 httpwwwmoovementfr 21 httpwwwcooptincomfrWEBhomeaspx httpwwwjobmeeterscomfraccueilindexphp 22 httpwwwzliocom httpshoppingyahoocomshoposphere
copy Digimind Digimind Services ndash White Paper |105
Le Web 20 pour la veille et recherche dinformation DIGIMIND
23 httpwwwciaofr httpwwwwantunocom 24 httpmapsgooglefr httpwwwgeoportailfr httpearthgooglefr httpmapsyahoocom httpwwwflickrcom httpwwwzdnetfractualitesinternet0390207743936635400htm 25 httpwwwcriteocom 26 From Youtube to Youniversities Henry Jenkins 16 feacutevrier 2007 httpwwwhenryjenkinsorg200702from_youtube_to_youniversityhtml 27 httpaffordancetypepadcom 28 httpwwwplosoneorghomeaction 29 Web collaboratif web coopeacuteratif web 20 quelles interrogations pour lrsquoenseignant documentaliste Marie France Blanquet 12 janvier 2007 httpeprofsdocscrdp-aix-marseillefrIMGrtfintervention-MF-Blanquetrtf 30 httpveillepedagogiquebloglemondefr 31 httpbibliobsessionfreefrdotclear 32 httpliblogsalbanyedulibrary20200611a_librarians_20_manifestohtml 33 httpdelicious 34 httpwwwconnoteaorg httpwwwciteulikeorg httpwwwsnipitroncom 35 httpdelicious httpwwwblinklistcom httpblogmarksnet httpwwwfurlnet httpfrbetabookmarksyahoocom httpmyweb2searchyahoocom 36 httpwwwstumbleuponcom httpsimilicious httpwwwyoonocomindexjsp 37 Social bookmarks charts version 35 httpwwwiroxdefile_download3 httpwwwroxomaticde856 Social Bookmarking Services And Tools The Wisdom Of Crowds That Organizes The Web httpwwwmasternewmediaorgnews20061201social_bookmarking_services_and_toolshtm Free Bookmark Managers
copy Digimind Digimind Services ndash White Paper |106
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwfeedbuscombookmarks 38 httpwwwflickrcom 39 httpwwwflickrcomgroupstehipool 40 httpwwwflickrcomphotostagsnorthamericaninternationalautoshow 41 httpphotobucketcom 42 httpwwwsquidoocom 43 httpwwwsquidoocomnanotechRev 44 httpwwwsquidoocomtagsmarketing 45 httpwwwyoutubecom 46 httpwwwdailymotioncom 47 Une seacutelection de moteurs de recherche videacuteo et de services de partage et teacuteleacutechargement de videacuteos httpcasselinfreefrfrenchvideoshtm 48 httpwwwemarketercomArticleaspxid=1004918 49 httpwwwviadeocom 50 httpwwwlinkedincom 51 httpwww6nergiesnet httpwwwxingcom 52 httpwwwfacebookcom 53 httpenwikipediaorgwikiList_of_social_networking_sites 54 httpwwwlinknrankcombusinessphp 55 httpdiggcom 56 httpwwwnuouzcom httpwwwblogmemescom httpwwwscoopeocom httpwwwfuzzfr httpwwwtapemoicom httpmeneamenet httpwwwrojocom httpwwwbetanetscapecom 57 httpwwwwikiofr 58 httpwwwagoravoxfr 59 Carlo Revelli Joeumll de Rosnay httpfrwikipediaorgwikiCarlo_Revelli httpfrwikipediaorgwikiJoC3ABl_de_Rosnay 60 Agoravox politique eacuteditoriale httpwwwagoravoxfrarticlephp3id_article=60 61 httpwwwreadspeakercom 62 httpenglishohmynewscom
copy Digimind Digimind Services ndash White Paper |107
Le Web 20 pour la veille et recherche dinformation DIGIMIND
63 State of the Blogosphere- avril 2007 httpwwwsifrycomalertsarchives000493html 64 Les blogs dans le monde Estimation agrave partir des chiffres produits par Digimind Blog Herald Technorati PewInternet Meacutediameacutetrie Loiumlc le Meur Live Journal Skyblogs Overblogs Terra MSN Spaces Splinder Excite Bloggersit Timblog W3B Skynet Bloghr Overskriftdk Smartlog onetpl Tenbit mylogpl eblogpl Blogpl Blogipl blogcentralis Romandiefr Blogspot timsoftro Globocom Financial Express Prixadi blog Baidu Yahoo Blogs South Korea Planet Weblog Service Cyworld LAtelier et ZDNet Australia 65 httpwwwnaturecomwebfeedsindexhtml httpwwwsciencemagorgrss 66 httpsearchlivecom 67 httpsearchyahoocom 68 httpnewsgooglefr httpfrnewsyahooco httpfrnewsbotmsncom httpwwwtopixnet httpwwwwikiofr 69 httpgroupsgooglefrgrouprectraveleuropefeedshl=fr 70 httpwwwforummobilescomindexphpshowforum=200 71 httpfrgroupsyahoocom 72 httpfrmyweb2searchyahoocom httpblogmarksnet httpdelicious 73 httpwwwflickrcom httpphotobucketcom 74 httpwwwyoutubecom httpwwwdailymotioncomfr 75 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 76 httpblogsearchgooglefr httpfraskcomsubjectbls|pg1 httpwwwfeedstercom httpwwwblogpulsecom httpwwwtechnoraticom httpwwwspherecom 77 httpwwwsifrycomalertsarchives000493html 78 httpfrsearchyahoocomwebadvancedei=UTF-8ampybs=0 httpwwwexaleadfrsearchresultsq=sarkozyamp24mode=allweb 79 httpwwwblogaramacom httpwwwrss-networkcom
copy Digimind Digimind Services ndash White Paper |108
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwrssfeedscom 80 httpwww43thingscom http36trucscom 81 httptrainquecomcodedelicious_lookupphp 82 httptechnoraticomtag 83 httpwwwsearchlescom 84 httptagcentralnet httpwwwkeotagcom httpwwwthagoocom httpwwwzewolnet httpwwwgnoshorg 85 httpwwwzibbcom 86 httpwwwecransfr 87 Google Tag Cloud Maker httpuserscriptsorgscriptsshow6171 88 httpnewzingocom 89 Folksonomies les usagers indexent le web Olivier le Deuff Bulletin des Bibliothegraveques de France ndeg4 2006 90 Folksonomy les tags en deacutelire Cyril Fieacutevet Internetactu 13 octobre 2005 httpwwwinternetactunetp=6166 91 httpwwwzoominfocom 92 httpwwwzikicom 93 httpwwwyonamecom httpwwwstalkeraticom httpwinkcom 94 httpfranswersyahoocom httpanswersyahoocom httpaskyahoocom 95 httpanswersgooglecomanswers 96 httpiqlycosfr httpqnalivecombetaaspx 97 httpwwwexpertscomdirectoryasp 98 httpsearchwikiacomwikiSearch_Wikia 99 httpdeciphocom 100 httpwwwyoonocom 101 httpwwwfooxxcom
copy Digimind Digimind Services ndash White Paper |109
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwwebzzlecom 102 httpinfluxjouebcomnewspowerset-et-xerox-parc-s-attaquent-a-google-naturellement 103 httpwwwmedglecom httpwwwmedwormcom httpwwwmedstorycom httpwwwsearchmedicacouk 104 httpwwwrollyocom httpswickihomeeurekstercom httpgooglecomcoopcseoverview httpbuildersearchyahoocom 105 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 106 Le web invisible (deep web hidden web) deacutesigne la partie du web non accessible aux moteurs de recherche classiques Le web invisible comprend des bases banques de donneacutees et bibliothegraveques en ligne gratuites ou payantesIl est constitueacute de pages web mal ou non indexeacutees par les moteurs Pour plus de preacutecisions voir le White Paper Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique httpwwwdigimindfrserviceswhite_paperhtm 107 httpwwwthelancetcom 108 httpwwwdigimindfrproduitsfinderhtm 109 httpwwwncbinlmnihgoventrezqueryfcgiCMD=searchampDB=pubmed 110 httppminlmnihgovinteractindexphptop httpwwwhubmedorg 111 httpwwwusptogovpatftindexhtml httpwwwwashingtonpostcomwp-dyncontentarticle20070304AR2007030401263html 112 httpwwwgooglecomhistory 113 httpwwwgooglecomhistorytrends httpwwwgooglecomhistoryitems 114 httpfrwikipediaorgwikiApplication_composite 115 httpwwwmibazaarcomextrasfortune100html 116 httptagmapsresearchyahoocomworldexplorerphp 117 httpflickrvisioncom 118 httpgmapstommanganusspacecraft_trackinghtml 119 httpwwwhealthmaporg httpwwwbrevardbiodieselorgmapbdhtml httpkartametroinfokartadefaultaspxhl=EN httpwwwwikimapiaorg httpwwwglobalincidentmapcomhomephp httpdartmapsmackerscom
copy Digimind Digimind Services ndash White Paper |110
Le Web 20 pour la veille et recherche dinformation DIGIMIND
120 httpwwwtagurlscom 121 httpwwwthemolucom httpwwwgnoshorg 122 httpwwwwebmashupcom httpwwwprogrammablewebcommashupsdirectory httpmashupfeedcom 123 httpgooglemapsmaniablogspotcom 124 httplocalalkemiscom 125 httpwwwvoxcom httpwwwover-blogcom httpwwwblogspiritcomfrindexphp httpwwwtypepadcom httpswwwbloggercomstart httpviablogacom httpwwwhautetfortcom 126 httpcasselinfreefrfrenchweblogshtmoutils 127 httpwwwclubiccomarticle-67515-8-comparatif-plateformes-blogshtml httpwwwojrorgojrimagesblog_software_comparisoncfm 128 httpwwwfeedburnercomfbahome 129 httppagesgooglecom 130 httpwwwdigimindfrserviceswhite_paperhtm 131 httpfrwikipediaorgwikiAccueil 132 httpblogouter-courtcomarchive2006-12-05-n22html 133 httpwwwnaturecomnews2005051212full438900ahtml httpwwwnaturecomnaturebritannicaindexhtml httpwwwnaturecomnews2005051212multimedia438900a_m1html 134 httpwwwwikiseekcom 135 httpwwwexaleadfr 136 httpwwwwikimindmaporg 137 httpencitizendiumorgwikiMain_Page 138 httpwwwalacrawikicom 139 httpceclinesxwikicomxwikibinviewMainFils+RSS 140 httpwwwwikidwebcom 141 httpwwwoperacom httpwwwmaxthoncom httpwwwmicrosoftcomfrancewindowsie httpwwwmozilla-europeorgfrproductsfirefox
copy Digimind Digimind Services ndash White Paper |111
Le Web 20 pour la veille et recherche dinformation DIGIMIND
142 httpfrtechcrunchcom20060401analysons-les-lecteurs-rss-en-ligne httpvtechcanalblogcomarchives20051025927489html httpvtechcanalblogcomarchives20050905780635html httpallrsscomrssreadershtml 143 httpinfluxjouebcomnewsles-pages-personnalisables-bookmark-n-1 httpwwwinformationoverlordcouk200603where-to-start-in-search-of-ideal_26 144 httpwwwdigimindfrproduitsindexhtm 145 httpshareopmlorg 146 httpwwwquechoisirorgArticlejspid=RessourcesArticlesEF33CF34D5616AF2C125720D0050E701ampcatcss=TEL000 147 httpweblogshitwisecombill-tancer 148 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 149 httpwwwbusinessweekcominnovateNussbaumOnDesignarchives200704are_most_web_20html 150 httpblogsforrestercomcharleneli200704forresters_new_html httprosstypepadcomblog200604power_law_of_pahtml 151 httpwwwobservatoire-omicorgcolloque-icicpdfBarbe3_1pdf 152 httpwwwaaronswcomweblogwhowriteswikipedia 153 httpaphgcaenfreefrchronique393aphg393htm 154 httpfrwikipediaorgwikiDroits_de_l27homme_en_Iran 155 httpfrwikipediaorgwikiWikipC3A9diaArticles_de_qualitC3A9 156 httpenwikipediaorgwikiJohn_Seigenthaler_Sr_Wikipedia_biography_controversy 157 httppewresearchorgpubs71riding-the-waves-of-web-20 158 httptallblogcontedoxacukwp-contentuploads200703survey-summarypdf 159 httpwwwcafepresscomnerdwideweb 160 httpwwwecransfrspipphprubrique30 161 httpfrcreativecommonsorg 162 httpwwwzdnetfractualitesinternet0390207743933447900htm 163 httpwebsemantiqueorgPagePrincipale httpwwww3orgDesignIssuesSemantichtml httpwwww3org2002Talks1213-lpslide1-0html 164 httpwwwinternetactunetp=6902
copy Digimind Digimind Services ndash White Paper |112
- Digimind Services
- Christophe ASSELIN
- Veronique MESGUICH
-
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Avant propos
Web 20
La notion de Web 20 est tregraves souvent employeacutee mais finalement peu de
personnes sont capables de lexpliquer preacuteciseacutement
Lobjectif de ce document est de deacutemocratiser le concept de Web 20 aupregraves des
Knowledge Workers Il sadresse aux diffeacuterents collaborateurs de lentreprise qui
nutilisent pas encore ou peu les diffeacuterentes applications regroupeacutees sous ce
concept Les sensibiliser agrave ces outils pourra ameacuteliorer la pertinence de leur
recherche et de leur veille informationnelle
copy Digimind Digimind Services ndash White Paper |4
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Quest-ce que le Web 20
PREAMBULE
Pour certains le Web 20 nest qun gadget un pur pheacutenomegravene de mode qui ne
meacuterite pas que lon sy attarde Pourtant une eacutevolution importante a bien eu lieu sur
le web quelque soit le nom que lon lui donne
Ainsi en 2006 un metteur en scegravene a choisi de diffuser son long meacutetrage Autumn1
gratuitement et ce uniquement sur internet via le service Google Video2 Il navait
pas trouveacute de distributeur capable dexploiter son film dans plus de 30 salles En mai
2007 plus de 920 000 internautes avaient deacutejagrave vu Autumn sur le service de partage
de videacuteos de Google
Fin 2005 pour le compte de la prestigieuse revue scientifique Nature des experts
ont compareacute des documents publieacutes sur Wikipedia lencyclopeacutedie collaborative en
ligne reacutealiseacutee par des internautes volontaires et beacuteneacutevoles avec ceux de la ceacutelegravebre
Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche
Cette eacutetude a abouti agrave une formidable controverse comment une encyclopeacutedie
reacutealiseacutee par des non-speacutecialistes peut-elle remettre en cause les ouvrages
classiques
Il se passe donc bien quelque chose de nouveau via ce web nouvelle geacuteneacuteration ougrave
linternaute devient actif et collaboratif Mais tellement dacteurs et dapplications se
reacuteclament de ce web 2 que lon a vite limpression de naviguer en Terra Incognita
Certains nheacutesitent dailleurs pas agrave repreacutesenter ce nouveau web via une carte
dexplorateur 3
Aussi agrave travers ce document plongeons dans le Web 20 pour mieux lexploiter
lors de recherche dinformation et de veilles
copy Digimind Digimind Services ndash White Paper |5
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La carte des communauteacutes virtuelles Par Randall Munroe DR
DEFINITION DU WEB 20
Comment deacutefinir de faccedilon preacutecise ce que recouvre cette notion parfois floue
Depuis plusieurs mois le blog collectif Dessine moi le Web 20 4 propose agrave des
universitaires informaticiens philosophes entrepreneurs de donner leur propre
vision du pheacutenomegravene et eacutechanger ideacutees et points de vue La diversiteacute et la richesse
des contributions illustrent la difficulteacute agrave donner une deacutefinition exhaustive de ce
concept agrave geacuteomeacutetrie variable mecirclant agrave la fois des aspects techniques et sociaux
Une vision reacuteductrice du Web 20 consisterait agrave nrsquoy voir que la mutualisation de
contenus produits et mis en ligne par les utilisateurs eux-mecircmes ou agrave reacutesumer
lrsquoengouement actuel agrave un effet de mode passager Depuis la premiegravere confeacuterence
Web 20 en 2004 le concept srsquoest concreacutetiseacute agrave travers de nombreuses
expeacuterimentations ou le deacuteveloppement de nombreux services largement utiliseacutes
Nous tenterons dans ce document de brosser un panorama des enjeux usages et
technologies lieacutes agrave cette notion aussi encenseacutee que controverseacutee
copy Digimind Digimind Services ndash White Paper |6
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Plusieurs auteurs srsquoaccordent sur lrsquoideacutee selon laquelle le web 20 ne constitue pas
une rupture technologique ni hellip sociale Il srsquoagirait plutocirct drsquoun retour aux sources
drsquoune renaissance du web tel qursquoil a eacuteteacute conccedilu agrave lrsquoorigine les utilisateurs srsquoeacutetant
entre temps approprieacutes les modes de creacuteation et de diffusion
Pour Paul Graham5 pionnier de lrsquoInternet et fondateur de la socieacuteteacute Viaweb en
1995 le web 20 est le web comme il a eacuteteacute conccedilu pour ecirctre utiliseacute Les tendances que
nous distinguons sont simplement la nature inheacuterente du web qui eacutemerge des mauvaises
pratiques qui lui ont eacuteteacute imposeacutees pendant la bulle Internet
Le web creacuteeacute au deacutebut des anneacutees 90 par Tim Berners Lee comportait deacutejagrave en
germe bien des eacuteleacutements du web 20 mutualisation des connaissances eacutechange
travail collaboratif interactiviteacute intelligence collective hellip Ce nrsquoest sans doute pas
un hasard si Dale Dougherty lrsquoun des pegraveres fondateurs de la formule 20 fut lui
aussi lrsquoun des pionniers du web et notamment le fondateur de GNN le premier
portail financeacute par la publiciteacute
Naissance du concept
Crsquoest au cours de lrsquoeacuteteacute 2004 que le terme de web 20 apparaicirct pour la premiegravere
fois lors drsquoune seacuteance de brainstorming Dale Dougerthy co-fondateur de la
socieacuteteacute drsquoeacutedition OrsquoReilly et Craig Cline de MediaLive reacutefleacutechissent agrave des thegravemes
eacutemergents en vue drsquoune confeacuterence agrave venir Le journaliste John Battelle co-
fondateur du magazine Wired se joint un peu plus tard au duo et la premiegravere
confeacuterence Web 20 a lieu en octobre 2004 Lrsquoexpression 20 est utiliseacutee agrave ce
propos pour marquer lrsquoeacutemergence drsquoune nouvelle eacutetape dans la courte histoire du
web eacutetape caracteacuteriseacutee par un changement des regravegles et une modification des
modegraveles de revenus Le volet social sera deacuteveloppeacute plus tardivement par Tim
OReilly lors de la deuxiegraveme confeacuterence Web 20 en octobre 2005
Les nouveaux produits et services associeacutes au web 20 vont ainsi repositionner
lrsquointernaute au cœur du systegraveme Des techniques de publications simples et souples
comme les blogs les plates-formes collaboratives de type Wiki offrent des
possibiliteacutes accrues de production diffusion et consommation des contenus
Lrsquointernaute devient ainsi co-creacuteateur de nouvelles applications en ligne initiant
souvent de faccedilon collective ou communautaire de nouvelles formes de relations
numeacuteriques Selon lrsquoexpression drsquoHubert Guillaud6 le web devient non plus une
aventure technologique mais bien une aventure humaine
copy Digimind Digimind Services ndash White Paper |7
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LES 7 PRINCIPES DU WEB 20
Le texte de Tim OrsquoReilly paru en 2005 7 sous le titre Qursquoest ce que le web 20
deacutegage sept principes cleacutes du Web 20 en voici un petit reacutesumeacute
1 Le web vu comme une plate-forme de services
On passe dune collection de sites web agrave une plateforme informatique agrave part
entiegravere fournissant des applications web aux utilisateurs
2 Consideacuterer les internautes comme co-deacuteveloppeurs des applications On passe ainsi
de la notion de logiciel produit agrave celle de logiciel service
3 Le service srsquoameacuteliore quand le nombre drsquoutilisateurs augmente
Le Web 20 met agrave profit lrsquoeffet de la longue traicircne (ou long tail en anglais)
populariseacute par le magazine Wired les produits qui sont lrsquoobjet drsquoune faible
demande ou qui nrsquoont qursquoun faible volume de vente peuvent collectivement
repreacutesenter une part de marcheacute eacutegale ou supeacuterieure agrave celle des best-sellers si les
canaux de distribution peuvent proposer assez de choix Les utilisateurs du Web
20 disposent de donneacutees uniques difficiles agrave recreacuteer et dont la richesse srsquoaccroicirct
avec lrsquoaugmentation du nombre des utilisateurs
4 La richesse est dans les donneacutees Toutes les applications web drsquoimportance sont
lieacutees agrave une base de donneacutees speacutecialiseacutee OrsquoReilly envisage un mouvement des
donneacutees libres srsquoopposant peu agrave peu agrave lrsquounivers des donneacutees proprieacutetaires
5 Tirer parti de lrsquointelligence collective crsquoest le principe mecircme adopteacute par
lencyclopeacutedie en ligne Wikipedia et drsquoautres sites similaires Pour Tim OrsquoReilly
lrsquoimplication des utilisateurs dans le reacuteseau est le facteur-cleacute pour la supreacutematie sur le
marcheacute
6 Mettre en place des interfaces souples et leacutegegraveres fondeacutees sur les nouveaux
standards et protocoles du Web Le logiciel se libegravere du PC Une autre des
caracteacuteristiques du web 20 est le fait qursquoil nrsquoest plus limiteacute agrave la plate-forme PC
mais vise notamment les objets nomades teacuteleacutephone portable PDA ou lecteur
portatif audio
copy Digimind Digimind Services ndash White Paper |8
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LES EVOLUTIONS PAR RAPPORT AU WEB 10 LE ROLE DE LINTERNAUTE
En quoi le Web 20 se distingue-t-il de la vague preacuteceacutedente On a vu que lrsquoune des
caracteacuteristiques majeures du pheacutenomegravene est lrsquoappropriation des contenus et des
modes de diffusion par les internautes eux-mecircmes via des applications souples et
leacutegegraveres
Paul Graham eacutevoque le principe de deacutemocratie du Web 20 cest-agrave-dire la
superposition au reacuteseau technique drsquoun reacuteseau humain qui participe agrave la creacuteation et
agrave lrsquoenrichissement de contenus et services Lrsquointernaute deviendrait ainsi
consommrsquoacteur agrave lui de produire publier diffuser indexer partager des
contenus de tous types
Web 10 Web 20
Leaders du web Entreprises marchands Internautes
Profil de linternaute Passif Actif
Interactiviteacute perccedilue Seacutelection et lecture dinformation
Seacutelection lecture et publication de donneacutees
Uniteacute de recherche Mot-cleacute Tag
Du Web 1 vers le Web 2 Source ZDNet 8
Pour autant les internautes vont-ils devenir tous acteurs de ce processus Selon un
article de Charles Arthur dans The Guardian 9 pour un groupe de 100 personnes si
lrsquoune creacutee du contenu 10 seulement vont interagir en apportant commentaires et
ameacuteliorations les autres se contentant drsquoune consommation passive Ce constat
obtenu via des retours drsquoexpeacuterience sur des sites collaboratifs illustre la regravegle des
11089 selon laquelle plus de 80 des contenus produits proviennent drsquoun
nombre tregraves restreint drsquoutilisateurs
Tendance confirmeacutee par les chiffres preacutesenteacutes lors de la Web 20 Expo en avril 2007
et repris dans Internetactu 10 selon la socieacuteteacute de mesure drsquoaudience Hitwise11
016 des internautes qui passent sur YouTube y placent des films - alors qursquoils
eacutetaient encore 05 agrave le faire en juillet 2006 seulement 02 des visiteurs de
Flickr y publient des photos La seule exception agrave cette faible participation provient
copy Digimind Digimind Services ndash White Paper |9
Le Web 20 pour la veille et recherche dinformation DIGIMIND
de Wikipedia ougrave 46 des visiteurs contribuent agrave lrsquoenrichissement de
semblent en effet
voir eacutecrit des textes longs (en un nombre reacuteduit drsquointerventions) tandis que les
eacutediteursrdquo les plus actifs qui forment le noyau des wikipeacutediens nettoient corrigent
lective fondeacutee sur des actions agrave faible niveau drsquoexigence
(lire enregistrer un signet tagger commenter) de lrsquointelligence collaborative
caracteacuteriseacutee par des formes de participations plus actives et intenses eacutecrire
collaborer modeacutererhellip
lrsquoencyclopeacutedie
Jimmy Wales fondateur de Wikipedia estime qursquoun nombre restreint de
contributeurs et eacutediteurs font lrsquoessentiel du travail alors qursquoun nombre consideacuterable
de lecteurs apportent peu de modifications Le wikipeacutedien Aaron Swartz nuance
ce point de vue un grand nombre de contributeurs occasionnels
a
ldquo
mais sans apporter eacutenormeacutement de texte
Le Web 20 et tout particuliegraverement la blogosphegravere semble suivre la loi de la
participation eacutedicteacutee par Ross Mayfield preacutesident de la socieacuteteacute Social Text sous le
nom de Power law of participation12 Cette loi baseacutee sur lrsquoobservation des
pratiques et des seuils de participation aux dispositifs communautaires constate que
la participation srsquoamenuise agrave mesure que les formes de participation se
complexifient Le scheacutema ci-dessous qui rappelle celui de la Longue Traicircne
distingue lrsquointelligence col
Power Law of Participation par Ross Mayfield CC
copy Digimind Digimind Services ndash White Paper |10
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Le cabinet Forrester deacutetaille enc
de la participation figurant dans son eacutetude Social Technographics 13 la grille compte
6 eacutechelons correspondant aux niveaux de particip
les inactifs (52 )
les spectateurs (33 ) consommateurs de contenus texte ou multimeacutedia (blogs
videacuteos mis en ligne par les utilisateurs podcasts)
ore davantage les niveaux drsquoimplication dans la grille
ation
les menuisiers (19 ) utilisateurs de reacuteseaux sociaux
es collecteurs (15 ) utilisent des flux RSS et taggent les pages web
les critiques (19 ) postent des commentaires sur les blogs des avis et critiques
les creacuteateurs (13 ) publient des contenus en ligne (blogs videacuteos)
l
copy Digimind Digimind Services ndash White Paper |11
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Glossaire du Web 20
Pour mieux comprendre les concepts utiliseacutes dans lunivers du Web 20 nous vous
proposons ce glossaire des termes essentiels
Tags mot clef sous forme drsquo eacutetiquette que les utilisateurs peuvent apposer sur
un document numeacuterique (texte photo videacuteo) de faccedilon agrave en deacutecrire le contenu Le
tagging introduit une part de subjectiviteacute par rapport agrave lrsquoindexation automatique
effectueacutee par les moteurs Les tags peuvent eacutegalement ecirctre extraits
automatiquement drsquoun texte en fonction de leur freacutequence drsquooccurrence
Nuage de tags preacutesente les tags correspondant agrave un site (ou agrave plusieurs) en les
regroupant sur un mecircme espace et leur attribuant une taille variable suivant la
freacutequence dutilisation ou drsquooccurrence Cela donne une vision drsquoensemble des
principales theacutematiques Le site Tagcrowdcom14 permet de geacuteneacuterer un nuage de
tags agrave partir drsquoun texte
Folksonomie (traduit eacutegalement parfois par potonomie peuplonomiehellip)
Ce mot valise contraction de folk (peuple) et taxonomie deacutesigne une forme de
classification collaborative deacutecentraliseacutee spontaneacutee baseacutee non pas sur un
vocabulaire controcircleacute et standardiseacute mais sur des termes choisis par les utilisateurs
eux-mecircmes intituleacutes tags Lrsquoobjectif eacutetant de faciliter lrsquoindexation des contenus
ainsi que la recherche drsquoinformation
Blogs journal personnel disponible sur le web Peut ecirctre tenu par un particulier
un chercheur un journaliste un salarieacute drsquoentreprise ou plus rarement par un groupe
de personne (entreprise collectiviteacutehellip) Le blog a pour objet de diffuser des billets
geacuteneacuteralement lieacutes agrave lrsquoactualiteacute et preacutesenteacutes par ordre chronologique alors qursquoun
wiki est destineacute agrave la mutualisation des connaissances Un blog peut preacutesenter des
contenus multimeacutedias photo (photoblog) son ou videacuteo (vblog vlog)hellip
Blogosphegravere la biosphegravere des blogs Ce mot valise deacutesigne la communauteacute
des blogs ou encore lrsquoensemble des auteurs de blogs La blogosphegravere est largement
interconnecteacutee les trackbacks situeacutes sur la plupart des blogs permettant de lier
copy Digimind Digimind Services ndash White Paper |12
Le Web 20 pour la veille et recherche dinformation DIGIMIND
deux articles traitant de sujets connexes Lrsquoeacutelite des blogueurs particuliegraverement
influents peut ecirctre qualifieacutee ironiquement de blogeoisie
Blogroll ou blogoliste liste de liens vers drsquoautres blogs preacutesenteacutes par lrsquoauteur
drsquoun blog On peut syndiquer sur une mecircme page des billets venant de ces blogs via
les formats RSS
RSS lrsquoacronyme signifie selon les versions Really Simple Syndication (RSS 20) RDF
Site Summary (RSS 09 10 et 11) ou encore Rich Site Summary (RSS 091) Ce
format de syndication permet drsquoextraire automatiquement dun site web ou drsquoun
blog du contenu reacuteguliegraverement mis agrave jour Un fichier RSS est un simple fichier texte
au format XML comportant la description syntheacutetique du contenu Ce format a eacuteteacute
creacuteeacute en 1999 par Netscape On peut srsquoabonner gratuitement agrave plusieurs flux RSS agrave
partir drsquoun lecteur on-line ou installeacute sur le PC
Atom Format normaliseacute de syndication de contenu Web baseacute sur le XML qui
permet la syndication de contenu entre diffeacuterentes ressources Web Concurrent
de RSS Le format Atom a eacuteteacute creacuteeacute dans le but de simplifier les diffeacuterents formats
RSS existants La diffeacuterence entre les deux formats reacuteside surtout dans lemploi de
balises XML diffeacuterentes Les deux formats sont geacuteneacuteralement lus par les
agreacutegateurs
Wiki Site web dynamique dont tout visiteur peut modifier les pages agrave loisir Le
terme vient la langue hawaiumlenne (wikiwiki = rapide) Un wiki a pour objectif de
mutualiser des connaissances et est organiseacute autour drsquoun plan de classement Les
contributeurs drsquoun wiki sont geacuteneacuteralement anonymes
Crowdsourcing Litteacuteralement approvisionnement par la foule Le
crowdsourcing consiste agrave utiliser la creacuteativiteacute lintelligence et le savoir-faire dun
grand nombre dinternautes pour creacuteer des contenus participer agrave lrsquoalimentation
drsquoun site Cette participation des utilisateurs agrave la creacuteation des contenus repreacutesente
une forme drsquoexternalisation (outsourcing) et permet de reacuteduire les coucircts en se
basant sur un systegraveme de beacuteneacutevolat ou de micropaiement
Reacuteseaux sociaux de nombreux sites de social networking ou reacuteseautage social
sont apparus avec la vague du Web 20 Ils permettent de mettre en relation des
personnes partageant les mecircmes centres drsquointeacuterecirct personnels ou professionnels
Ces reacuteseaux peuvent devenir de veacuteritables communauteacutes en ligne les plus fameux
eacutetant les sites Friendster ou Myspace ou bien dans la sphegravere professionnelle
copy Digimind Digimind Services ndash White Paper |13
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Linkedin ViadeohellipLa plupart des reacuteseaux sont ouverts certains fonctionnent sur le
mode de la cooptation
Podcasts issu de la combinaison des termes iPod (dApple) et broadcasting ce
terme deacutesigne le fait de rendre disponible en ligne un fichier audio au format
numeacuterique Ce fichier peut-ecirctre teacuteleacutechargeacute directement sur un ordinateur ou un
peacuteripheacuterique via un flux de diffusion Equivalent franccedilais baladodiffusion
Lrsquoutilisateur peut ainsi se composer une liste de lecture agrave la carte Pour les fichiers
videacuteo on emploi le terme de videacuteocast
AJAX (Asynchronous JavaScript And XML) meacutethode informatique de
deacuteveloppement dapplications Web permettant deacuteconomiser de la bande passante
en ne rechargeant pas une page entiegravere alors que seuls certains eacuteleacutements ont besoin
de lecirctre mais en ne rafraicircchissant que ces eacuteleacutements de la page Cela permet de
produire des contenus dynamiques et reacuteactifs en ne neacutecessitant que peu drsquoappels au
serveur heacutebergeant la page AJAX est une combinaison de plusieurs technologies
HTML CSS Javascript XMLhellipDe nombreux sites web 20 sont deacuteveloppeacutes en
AJAX
API Interface de programmation permettant agrave un utilisateur de deacutevelopper des
applications conviviales De nombreux sites classiques ou Web 20 proposent des
API pour inteacutegrer automatiquement leur contenu agrave dautres sites
Mashup ou Mash up application web composite mixant plusieurs sources ou
plusieurs contenus pour fournir un nouveau produit ou service Le terme se traduit
en franccedilais par remixage ou mosaiumlque Exemple de mashup la visualisation des
reacutesultats des eacutelections preacutesidentielles franccedilaises via Google Earth qui mixe les cartes
Google et les chiffres du Ministegravere de lInteacuterieur
Long tail (longue traicircne) Cette expression est utiliseacutee en statistiques et peut
srsquoappliquer au marketing Des produits rares ou qui font lrsquoobjet drsquoune faible
demande peuvent collectivement repreacutesenter une part de marcheacute eacutegale ou
supeacuterieure agrave celle des best-sellers si les canaux de distribution peuvent proposer
assez de choix Le caractegravere virtuel du web permet de geacuteneacuterer une longue seacuterie de
marcheacutes de niche heacuteteacuterogegravenes (exemple e-bay) par opposition aux grands
marcheacutes homogegravenes et grand public du monde reacuteel
copy Digimind Digimind Services ndash White Paper |14
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les technologies du Web 20
Mettons dabord les choses au point le Web 20 nest pas une (r)eacutevolution ou un
concept de dimension technologique
Ses applications sappuient sur des technologies deacutejagrave existantes reacutepondant aux doux
noms dAjax Soap REST RSS Perl Python PHP Ruby ou GreaseMonkey Lobjectif de
ce document nest pas de deacutevelopper ce volet technologique Nous en eacutevoquerons
seulement les grandes caracteacuteristiques pour mieux comprendre les enjeux
Le Web 2 repose notamment sur les interfaces utilisateurs dites riches qui
permettent des possibiliteacutes daffichage de configuration et de maniement plus
puissantes que les pages html classiques du Web 1 que ce soit pour le
deacuteveloppeur ou lutilisateur final
Tim Berners Lee co-inventeur du web remarque en fait ce Web 20 utilise les
standards qursquoont produit tous ces gens qui travaillent sur le Web 10 le Document
object model HTML et SVG (Scalable Vector Graphics) HTTPhellip Le Web 20
construit des services en srsquoappuyant sur les standards du web ainsi que sur JavaScript
(hellip)
Pour se structurer en reacuteseau de bases de donneacutees et services collaboratifs le web
20 utilise donc des technologies matures acircgeacutees de 5 agrave 10 ans pour la plupart
Leacutevolution nest pas tant dans la technologie elle-mecircme que dans la faccedilon de mixer
ces technologies pour apporter des services et une ergonomie nouvelle agrave
lutilisateur
Ainsi lAjax (voir glossaire) que lon cite souvent agrave propos des technologies phares
du Web 2 nest pas un nouveau langage mais un nouveau concept qui utilise les
standards XHTML et CSS DOM (Document Object Model) pour laffichage
dynamique XML et XSLT pour leacutechange de donneacutees ainsi que la reacutecupeacuteration de
donneacutees asynchrones via XMLHttpRequest JavaScript integravegre et combine tout ces
langages Le terme Ajax a eacuteteacute apporteacute par Jesse James Garrett de lrsquoagence web
Adaptive Path
copy Digimind Digimind Services ndash White Paper |15
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LAjax permet notamment de ne recharger que certains eacuteleacutements dune page plutocirct
que la page entiegravere Lors de modifications sur une page seuls les nouveaux
eacuteleacutements se rafraicircchissent eacuteconomisant ainsi des ressources du temps et de la
bande passante Lun des preacutecurseurs grand public dans lutilisation de cette
technologie fut A9 le moteur de recherche dAmazon il neacutetait pas neacutecessaire de
recharger la page agrave chaque fois que lon ajoutait de nouvelles sources et moteurs agrave
interroger 15
Greasemonkey est eacutegalement baseacute sur des scripts Cette extension pour le
navigateur Mozilla Firefox va encore plus loin dans le pouvoir accordeacute agrave linternaute
en exeacutecutant des scripts ce plug-in 16 permet de modifier lapparence des pages
web visiteacutees dy ajouter des fonctions (boutons case agrave cocher suppression des
publiciteacutes) Lutilisateur avanceacute peut mecircme eacutecrire ses propres scripts ou
teacuteleacutecharger des scripts mis agrave la disposition de tous
Le Web 2 est en fait une sorte de web lego qui permet dinnover via lassemblage
de briques les technologies de base sont multiples il est possible de creacuteer de
nouvelles applications agrave valeur ajouteacutee en les assemblant diffeacuteremment ou plus
rationnellement
Les mash-up un mixage de plusieurs applications (voir glossaire) en est une des
illustrations les plus visibles avec les mashups on agreacutege le contenu eacutemanant de
plusieurs sites afin de creacuteer un site nouveau On utilise alors souvent lobjet XML
lAJAX du cocircteacute de linternaute les RSS et les API (Web Services) des sites mixeacutes
LAPI nest donc pas seulement un dieu eacutegyptien Pour faire simple on peut dire
que cest une interface de programmation mise agrave disposition des internautes
(avertis) pour deacutevelopper des applications Une application pourra alors acceacuteder agrave
des programmes systegraveme pour envoyer recevoir ou extraire des donneacutees Ainsi
Google publie lAPI de Google Maps qui est utiliseacute par de nombreux deacuteveloppeurs
pour creacuteer des applications deacuteriveacutees du service de cartographie de Google par
exemple la carte de suivi du teacutelescope spatial Hubble la meacuteteacuteo dans le monde 17
Le rocircle du RSS (voir glossaire) est par ailleurs preacutepondeacuterant Ce format qui
permet dexporter et lire des donneacutees dactualiteacutes au format XML se retrouve dans
quasiment toutes les applications dites Web 2 et peut en constituer lemblegraveme sinon
la caracteacuteristique majeure avec les tags Il permet de surveiller les flux de nouvelles
informations issues de sites dactualiteacutes de blogs de moteurs de recherchehellipbref
de tout site web qui propose un contenu qui se renouvelle Le RSS va aussi servir agrave
exporter des bookmarks sociaux que sont les tags ou les favoris par exemple
copy Digimind Digimind Services ndash White Paper |16
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Si le Web 2 nest pas une reacutevolution technologique en soit la relative simpliciteacute de
mise en place de ces techniques et leurs coucircts de programmation reacuteduits expliquent
le tregraves fort deacuteveloppement que connaissent toutes ces applications Par ailleurs la
baisse constante du coucirct dheacutebergement et de bande passante a faciliteacute la diffusion
de ce web nouvelle geacuteneacuteration
Mais il subsiste des effets de seuil Des applications gigantesques comme Flickr de
Yahoo offrant lheacutebergement et le partage de photos impliquent la gestion de
vastes bases de donneacutees et des infrastructures de stockage importantes Seules de
grandes firmes comme Yahoo Inc Google Microsoft ou AOL par exemple peuvent
se deacutepartir efficacement de ce type de contraintes
copy Digimind Digimind Services ndash White Paper |17
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les familles dapplications du Web 20
TYPOLOGIE
Les familles drsquoapplications Web 20 sont nombreuses et diverses de nouveaux
services apparaissent quotidiennement (sans garantie de peacuterenniteacutehellipet bien souvent
de faccedilon redondante) Sans preacutetendre dresser une liste exhaustive des nombreuses
possibiliteacutes on peut deacutegager une typologie des applications selon diffeacuterents
domaines drsquoactiviteacute Les applications speacutecifiquement deacutedieacutees agrave la veille et agrave la
recherche dinformation seront deacuteveloppeacutees dans la partie suivante
Bureautique en ligne
Courant 2006 Google a lanceacute successivement plusieurs logiciels collaboratifs en
ligne un outil de gestion drsquoagendas (Google Calendar 18) un tableur (Google
Spreadsheet) et enfin apregraves le rachat de la socieacuteteacute Writely un traitement de texte
(Google Docs) 19 Ces logiciels permettent de creacuteer modifier partager et publier en
ligne des documents sur un espace de stockage Depuis plusieurs mois on assiste agrave
une veacuteritable deacuteferlante de logiciels de bureautique en ligne deacutesigneacutes parfois sous le
terme de web office RallyPoint AjaxWrite (pour Firefox uniquement) ZohoWriter
ThinkfreehellipOutre la gratuiteacute lrsquointeacuterecirct de ces logiciels concurrents de la suite
Microsoft Office est leur disponibiliteacute sur toute machine connecteacutee au reacuteseau et tout
systegraveme drsquoexploitation Attention toutefois aux questions de sauvegarde de
compatibiliteacute de synchronisation des donneacutees et enfin de confidentialiteacutehellip
Emploi
Les blogs constituent un bon moyen pour promouvoir son CV mettre en avant
expeacuterience et compeacutetences et faciliter les eacutechanges Des jobblogs verticaux
speacutecialiseacutes par secteur ou reacutegion connaissent un grand succegraves (voir par exemple
ceux du site et moteur Moovement20) Le networking professionnel est eacutegalement agrave
la mode agrave travers des sites comme Linkedin (creacuteeacute en 2003 aux Etats-Unis) Viadeo
(ex Viaduc drsquoorigine franccedilaise) ou Xing (ex OpenBC agrave vocation europeacuteenne) Le
principe est de tirer parti des reacuteseaux de connexions sociales virtuelles afin
copy Digimind Digimind Services ndash White Paper |18
Le Web 20 pour la veille et recherche dinformation DIGIMIND
drsquoidentifier des salarieacutes ou employeurs potentiels mais aussi drsquoeacutetoffer son reacuteseau de
clients partenaires fournisseurshellip
Lrsquoe-cooptation (Cooptin Jobmeeters 21) met le reacuteseau au cœur de la deacutemarche de
recrutement via un systegraveme de prime de cooptation et peut aider les demandeurs
agrave identifier les offres du marcheacute cacheacute
Commerce en ligne
Le client est roi et le Web 20 permet de rehausser son niveau de participation sur
les sites marchands On peut ainsi tagger ou annoter des reacutefeacuterences drsquoouvrages dans
le catalogue Amazon Gracircce agrave des sites comme Zlio ou la Shoposphegravere de Yahoo22
les internautes peuvent recommander agrave leur entourage des produits et
serviceshellipen touchant une commission sur les ventes reacutealiseacutees Des guides drsquoachat
et comparateurs de prix comme Ciao integravegrent les avis de consommateurs et
drsquoexperts Le site Wantuno (inspireacute de lrsquoameacutericain Woot) innove dans le domaine
de la vente eacuteveacutenementielle en vendant un seul produit nouveau high tech par jour
annonceacute en podcast videacuteo agrave des internautes preacutevenus par flux RSS23 Certains
analystes voient lrsquoavenir du commerce eacutelectronique dans le concept de CtoB
(Consumer to Business) inverse du BtoChellip
Geacuteolocalisation
Google Maps a eacuteteacute lrsquoun des premiers services de geacuteolocalisation en srsquoappuyant sur
lrsquooutil de recherche pour localiser sur des cartes des services de proximiteacute
(commerces station servicehellip) La version 2 du site Geacuteoportail de lrsquoIGN disponible
depuis fin mai 2007 srsquoenrichit de nouveaux services pratiques et citoyens (accegraves au
cadastre visualisation des zones agrave risquehellip) Google Earth fait lrsquoobjet de partenariats
avec la NASA ou le programme des Nations Unies pour lrsquoenvironnement La
geacuteolocalisation peut srsquoadapter eacutegalement au partage de photos (Yahoo Maps et
Flickr ou le projet Pikeo chez Orange)24
Recherche drsquoinformations
Des agreacutegateurs de meacutedia comme Digg ou Wikio laissent une large place agrave
lrsquointernaute pour tagger ou recommander par vote les articles issus de meacutedias
classiques ou blogs On suivra eacutegalement lrsquoactualiteacute en syndiquant des flux RSS agrave
travers des agreacutegateurs comme Netvibes ou Newsgator Les grands moteurs (Google
Custom Search Yahoo Search Builder MSN Live search Macros) offrent des options de
copy Digimind Digimind Services ndash White Paper |19
Le Web 20 pour la veille et recherche dinformation DIGIMIND
creacuteation de moteurs personnalisables effectuant des recherches sur des bouquets
de sources preacuteseacutelectionneacutees par lrsquoutilisateur On peut mutualiser les connaissances agrave
travers des wikis collaboratifs geacuteneacuteralistes (Wikipedia) ou speacutecialiseacutes Enfin le projet
de moteur collaboratif Wikiasari qui doit aboutir courant 2007 aura recours aux
mecircmes technologies libres que la ceacutelegravebre encyclopeacutedie ainsi qursquoagrave un reacuteseau humain
ou communauteacute de confiance qui validera les reacutesultats de la recherche
Les actualiteacutes sur Wikio sites de presse blogs et navigation par tags (agrave droite)
Diffusion drsquoactualiteacutes
Pour Pierre Chappaz fondateur du site Wikio les blogueurs ne sont pas journalistes
mais ils peuvent apporter une vraie expertise sur certains sujets quils connaissent et il
serait dommage de sen priver Selon lui les meacutedias 20 ne seront plus des canaux
exclusifs de diffusion mais producteurs de contenu et des marques Deacutesormais le
scoop nrsquoest plus lrsquoapanage des seuls journalistes aux Etats-Unis une jurisprudence
donne droit depuis 2006 aux blogueurs de proteacuteger leurs sources au mecircme titre
que les journalistes professionnels Des centaines de blogs politiques ont fleuri sur le
web certains drsquoentre eux se reacuteveacutelant particuliegraverement influents On parlera de
journalisme citoyen agrave propos de sites comme Agoravox ou de lrsquo alleacutee
numeacuterique Rue 89 lanceacutee en mai 2007 par drsquoanciens journalistes du quotidien
Libeacuteration Ces nouveaux meacutedias en ligne marient les communications venant de
journalistes professionnels experts et internautes
copy Digimind Digimind Services ndash White Paper |20
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Loisirs
On retrouve ici la notion de filtrage collaboratif baseacute sur un systegraveme de
recommandations et drsquoeacutevaluations par les utilisateurs Ces recommandations
peuvent concerner les livres les destinations de voyage la musique la videacuteohellipet
proviennent de lrsquoanalyse de comportements drsquoachats des internautes et de leurs
eacutevaluations de produits Le moteur drsquoanalyse preacutedictive Criteo 25 a ainsi lanceacute en
feacutevrier 2007 un service de recommandations automatique de blogs apregraves avoir
utiliseacute sa technologie pour lrsquoeacutevaluation de videacuteos
La participation des internautes peut aller jusqursquoau financement et agrave la production
drsquoœuvres artistiques le projet A swarm of angels permet drsquoaider agrave la creacuteation de
films qui seront distribueacutes sous licence creative commons et diffuseacutes via les reacuteseaux
peer-to-peer
Partage de documents multimeacutedia
Il srsquoagit sans doute drsquoune des applications les plus reacutepandues du Web 20 Les grands
acteurs du web ont largement investi ce domaine Google a racheteacute en 2006 le site
de partage de videacuteo Youtube Yahoo de son cocircteacute avait racheteacute le site de partage de
photos Flickr Les favoris peuvent eacutegalement ecirctre mutualiseacutes via des services en
ligne comme Delicious (groupe Yahoo) ou Blogmarks De nombreux services de
partages de photos videacuteo ou podcasts se sont deacuteveloppeacutes reacutecemment on peut
citer parmi eux les sites franccedilais DailyMotion ou la banque drsquoimages Fotolia Podemus
ou Radioblog figurent parmi les sites communautaires de podcasts
Enseignement et recherche
Henry Jenkins26 professeur au MIT imagine des uniteacutes drsquoenseignement conccedilues
sur les modegraveles YouTube ou Wikipedia des deacutepartements qui ldquopermettraient le
deacuteploiement rapide drsquoexpertises disperseacutees et la reconfiguration des champsrdquo De
nouveaux usages apparaissent dans le paysage eacuteducatif mais attention lagrave encore agrave
lrsquoillusion de faciliteacute selon le philosophe Fernando Savater laquo Internet neacuteduque pas il
neacutecessite mecircme une eacuteducation preacutealable raquo Olivier Ertzcheid dans son blog Affordance 27 distingue plusieurs eacuteleacutements caracteacuteristiques drsquoune science 20 et notamment
la possibiliteacute drsquoannoter et commenter des publications scientifiques (notamment les
collections Open Acess Plos One28) ou de nouveaux modes drsquointerrogation des
bases de donneacutees (interface Hubmed sur la base meacutedicale Medline)
copy Digimind Digimind Services ndash White Paper |21
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Marie France Blanquet29 maicirctre de confeacuterence en sciences de lrsquoinformation
distingue le travail coopeacuteratif du travail collaboratif En matiegravere drsquoapprentissage le
travail coopeacuteratif reacutealiseacute par chaque eacutequipe contribue agrave une œuvre collective ougrave le
rocircle de chacun est deacutefini de faccedilon claire Lrsquoapprentissage collaboratif reacutesulte du
travail individuel soutenu par des activiteacutes de groupe ou drsquoeacutequipes de faccedilon souple
et ouverte Ce type de travail se base sur les capaciteacutes de communication et
drsquointeraction de chacun Lrsquoeacutecriture collective des articles composant lrsquoencyclopeacutedie
Wikipeacutedia en est un exemple
Plusieurs expeacuterimentations drsquousage des blogs et podcasts ont eacuteteacute tenteacutees agrave
lrsquoUniversiteacute A Lyon II des eacutetudiants ont pu enregistrer des cours sur un Ipod pour
diffusion en podcast sur leurs blogs A lrsquoUniversiteacute Catholique de Lille les eacutetudiants
de Jean-Paul Pinte30 chargeacute de lrsquoinnovation peacutedagogique doivent alimenter
reacuteguliegraverement un blog Pour ce chercheur speacutecialiste de la veille en eacuteducation le
renouveau des meacutethodes drsquoenseignement se traduit par le rocircles des Enseignants
Connecteurs et eacutetudiants proneacutetaires
Bibliothegraveques
La bibliothegraveque 20 place elle aussi lrsquoutilisateur au centre et ce agrave travers plusieurs
types drsquoexpeacuterimentations de lrsquoutilisation des logiciels de messagerie instantaneacutee
pour eacutechanger avec les utilisateurs agrave lrsquointeacutegration de tags pour enrichir les
catalogues en passant par des interfaces de consultation simplifieacuteeshellip De
nombreux blogs de bibliotheacutecaires (Bibliobsession 31) permettent de suivre lrsquoeacutetat de
lrsquoart La bibliothegraveque de lrsquoUniversiteacute drsquoAlbany est alleacutee jusqursquoagrave publier un manifeste
du bibliotheacutecaire 20 32
copy Digimind Digimind Services ndash White Paper |22
Le Web 20 pour la veille et recherche dinformation DIGIMIND
COMMENT IDENTIFIER UN SITE WEB 20
Est-ce que le site sur lequel vous naviguez ou lapplication que vous utilisez est
Web 20 Quelle importance pourrait-on reacutepondrehellipToutefois un site de cette
geacuteneacuteration offrira plus de possibiliteacutes agrave vous lutilisateur Pour reconnaicirctre un tel
site quelques caracteacuteristiques sont agrave retenir
- le type de site il appartiendra agrave lune des grandes familles citeacutees plus haut il sera
blog bookmark ou reacuteseau social mashup ou page personnalisable bref il permet
de partager et de diffuser du contenu aiseacutement Le site peut ecirctre lui-mecircme une
application Web 2 ou en inteacutegrer des briques Exemple un site Corporate qui
heacuteberge des blogs de ses salarieacutes etou diffuse son actualiteacute via un fils RSS
- le rocircle de lutilisateur le site Web 2 vous permet de participer de personnaliser
et de collaborer vous pouvez en effet ajouter des commentaires eacutecrire un billet
lire un flux RSS noter (voter) ou annoter un article teacuteleacutecharger ou uploader des
images des videacuteos eacutecouter un podcast Ces sites proposent souvent des interfaces
personnalisables couleurs style organisation de laffichage du contenuhellip
- la navigation elle est plutocirct simplifieacutee par rapport aux sites de premiegravere
geacuteneacuteration Les menus sont plus leacutegers un flux RSS est toujours proposeacute et un
nuage de tags est souvent preacutesent
- le testeur cest vous non content de faire apporter une partie de son contenu par
linternaute un service Web 20 fait en plus souvent tester ses applications agrave ses
utilisateurs et est donc freacutequemment en version becircta (voire alpha) une becircta
publique ou priveacutee (linternaute fait alors partie dun petit cercle dinitieacutes dans le
secret des dieux)
copy Digimind Digimind Services ndash White Paper |23
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les applications Web 20
pour la veille et la
recherche dinformations
LES TYPES DAPPLICATIONS
Pour le veilleur et le chercheur dinformation les applications du Web 20 sont
riches tant dans les possibiliteacutes offertes par leurs interfaces que dans le contenu
diffuseacute Mieux connaicirctre ces services permettra de trouver davantage dinformation
(ou autrement) de gagner du temps de mieux partager voire decirctre plus visible sur
le web
Vous laurez compris le web 20 se fonde essentiellement sur la notion de partage
de participation et de collaboration entre les individus Ce nest pas forceacutement
toujours facile possible voire autoriseacute dans le monde professionnel Mais partager
cest aussi agrave terme pouvoir recevoirhellip
I Partager et collaborer
a Les Bookmarks sociaux
Les bookmarks sociaux sont une des applications les plus caracteacuteristiques du Web 2
et en sont preacutecurseurs Apparus en 2004 ces services vous offrent la possibiliteacute de
partager vos bookmarks cest-agrave-dire vos favoris Ainsi apregraves enregistrement le plus
souvent gratuit vous pouvez mettre en ligne tout ou partie de vos favoris (titre
copy Digimind Digimind Services ndash White Paper |24
Le Web 20 pour la veille et recherche dinformation DIGIMIND
adresse et description dune page ou site) et les rendre potentiellement accessibles
aux internautes du monde entier et du moins aux utilisateurs de ce service Vous
avez la possibiliteacute de garder ces favoris priveacutes en ne les partageant quavec vos
proches ou seulementhellipvous-mecircme
Ces applications sont au deacutepart tregraves simples et proposent ensuite suivant les sites
plus ou moins de perfectionnements il suffit dajouter le nom et ladresse (url) de la
page web qui vous inteacuteresse assortis des commentaires de votre choix Ces
adresses web sont rattacheacutees agrave un espace qui vous est personnel auquel vous
acceacutedez en vous identifiant Cet espace personnel est identifiable via une adresse
preacutecise Par exemple sur Delicious33 (de Yahoo) lun des services de bookmarks
sociaux les plus utiliseacutes lurl deacutesignant mes favoris est httpdeliciousslide68 En
naviguant sur Delicious vous pouvez acceacuteder aux favoris mis en ligne par des
collaborateurs amis ou inconnus qui partagent les mecircmes inteacuterecircts et passions que
vous Leurs pages sont eacutegalement identifieacutees par une url unique
Lajout dadresse
Lajout dadresse seffectue en se connectant directement sur le site de
bookmarking social ou plus pratique via une barre ou un bouton deacutedieacutes qui
inteacutegreacutes agrave votre navigateur facilitent lajout du site que vous ecirctes en train de visiter
Vous pouvez eacutegalement trouver des icocircnes sur des pages web vous proposant
dajouter un contenu un site agrave votre service de social bookmaking Peut-ecirctre avez-
vous deacutejagrave rencontreacute ces icocircnes agrave la fin dun billet de blog par exemple (voir
illustration ci-dessous) Ils permettent alors dajouter ladresse du billet agrave un ou
plusieurs services de bookmarks sociaux ainsi quagrave des services dactualiteacutes
collaboratives (nous en reparlerons plus bas)
copy Digimind Digimind Services ndash White Paper |25
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ce blog propose via des icocircnes lajout de ce billet dans les favoris de Delicious ou les services sociaux dactualiteacutes
Lorsque vous ajoutez une adresse vous lui attribuez des tags (voir glossaire) cest-agrave-
dire un ou plusieurs mots cleacutes de votre choix qui vont caracteacuteriser expliquer
contextualiser eacutetiqueter le favori et donc lidentifier de maniegravere simple pour vous et
tous les visiteurs Cest une information qui vient sajouter agrave la traditionnelle
description du site Cest donc vous qui choisissez votre propre mode de
classement de hieacuterarchisation et de labellisation (et non plus un service qui vous
propose de ranger vos ressources dans des cateacutegories preacutedeacutefinies) Cette possibiliteacute
fait partie de ce que lon appelle la folksonomie agrave savoir une taxonomie (science du
classement) populaire en quelque sorte
Ainsi vous pouvez ajouter ladresse du site portail NanotechNow
httpwwwnanotech-nowcom consacreacute aux nanotechnologies et y adjoindre les
tags nano nanotehnologies sciences science research mais aussi pourquoi
pas qualiteacute excellent pour donner votre opinion
copy Digimind Digimind Services ndash White Paper |26
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Des favoris consacreacutes agrave la Chine dans Delicious A droite les tags associeacutes agrave ces bookmarks Les tags
Sur une application typique de social bookmarking (type delicious) il est possible
de rechercher sur le titre des favoris de tous les autres utilisateurs et aussi sur
leurs tags Ainsi en cliquant sur le tag Nanotech vous obtiendrez la liste de tous
les favoris que les internautes ont classeacutes sous ce label Cest lagrave lun des principaux
inteacuterecircts la possibiliteacute de rechercher sur le nom des eacutetiquettes textuelles deacutefinies
par les internautes eux-mecircmes Mais tous les internautes nont pas la mecircme logique
de classement et il est fort possible de passer agrave coteacute de favoris inteacuteressants mais
eacutetiqueteacutes selon un mot auquel vous nauriez jamais penseacute De plus un mecircme mot
peut avoir plusieurs sens ou ecirctre employeacute diffeacuteremment selon les individus
Delicious a reacutesolu ndashpartiellement- ce problegraveme en offrant la possibiliteacute de deacutecrire
ses tags cest agrave dire de les expliquer (par orange je parle de la couleur ou de la
production dagrumes en Floride) Cest donc un deacutebut de seacutemantique appliqueacute agrave
cette folksonomie Quoiquil en soit le problegraveme du sens des mots employeacutes par
les creacuteateurs de contenu concerne lensemble du web Lorsque vous ne trouvez
pas un site via une requecircte sur un outil de recherche et que ce site existe pourtant
bel et bien cest souvent parce que vous nemployez pas les mecircmes mots cleacutes que
ceux utiliseacutes par le creacuteateur du site dans son texte
Les tags peuvent eacutegalement sappliquer agrave des photos (Flickr) agrave des projets
(43Things) ou des videacuteos (YouTube DailyMotion) Ils peuvent servir aussi agrave eacutetiqueter
et cateacutegoriser les billets dun blog
copy Digimind Digimind Services ndash White Paper |27
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les communauteacutes
Lautre atout des bookmarks sociaux pouvoir constituer et se connecter avec
une communauteacute de speacutecialistes Par speacutecialiste on deacutesignera simplement un
internaute qui centre ses recherches sur les mecircmes sujets que vous quil soit
amateur ou professionnel
Exemple Votre domaine ce sont les biotechnologies En entrant la requecircte
Biotechnologies sur le moteur de recherche de Delicious vous obtenez une liste
de plusieurs milliers de favoris Pour chacun dentre eux est indiqueacute le nombre de
personnes qui ont sauvegardeacute cette mecircme adresse En seacutelectionnant lun de ces
utilisateurs vous pouvez deacutecouvrir un internaute qui comme vous reacuteguliegraverement
ajoute des adresses de sites deacutedieacutes ou connexes aux biotech Il ne vous reste plus
quagrave mettre en surveillance ce membre de delicious Il disposera en effet de sa
propre adresse XML Exemple httpdeliciousrssvantive98 Vous serez alors
averti degraves lors que cet utilisateur ajoute un favori agrave sa page
La valeur des outils de social bookmarking est encore plus probante lorsquils sont
deacutedieacutes agrave des communauteacutes de pratiques ou agrave des secteurs dactiviteacutes bien preacutecis
Plusieurs initiatives ont deacutejagrave eacuteteacute mises en ligne34 On peut citer Connotea eacutediteacute par
la ceacutelegravebre revue Nature et donc destineacute agrave un public scientifique Lors de la mise en
favoris ce service extrait automatiquement les reacutefeacuterences bibliographiques
lorsquelles sont issues de sites tels que Nature Science ou PubMed Plus ancien
CiteUlike est baseacute sur le mecircme principe mais est compatible avec davantage de
revues scientifiques encore Snipitron est lui deacutedieacute aux chercheurs eacutetudiants et
professionnels Ici vos bookmarks font partie dun projet qui seacutecoule dans le temps
concernant une recherche ou une tacircche preacutecise
Linteacuterecirct des bookmarks sociaux est donc dabord dans lutilisation de la
communauteacute afin de trouver des sources pertinentes Ce type doutil reacutevegravele toute
sa puissance lorsquun utilisateur proche de vous en terme de domaines de veille a
eacuteteacute identifieacute Vous pouvez donc alors lutiliser comme collaborateur virtuel mais
aussi rechercher parmi les sources jugeacutees pertinentes par un groupe dutilisateurs
identifier des leaders de veille ou juger de la populariteacute dune source (combien de
fois a-t-elle eacuteteacute mise en favoris Ce nombre de sauvegardes neacutetant quun indicateur
parmi dautres) Si vous ne partagez pas ces outils restent toutefois un tregraves bon
moyen de meacutemoriser et cateacutegoriser vos favoris en un point unique daccegraves
copy Digimind Digimind Services ndash White Paper |28
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Quel service
Il existe plusieurs dizaines de services de bookmarks sociaux Ils proposent des
fonctionnaliteacutes plus ou moins sophistiqueacutees Un des critegraveres essentiels de choix est
leur succegraves En effet leur force repose en grande partie sur le nombre de favoris
dutilisateurs partageacutes agrave moins de freacutequenter des bookmarks deacutedieacutes agrave des
communauteacutes tregraves cibleacutees Dautre part la rapiditeacute du service et la pertinence de
son moteur de recherche sont aussi des paramegravetres importants
Delicious qui appartient agrave Yahoo est lun des plus connus et des plus utiliseacutes Yahoo
MyWeb2 rassemble eacutegalement une grande communauteacute ainsi que Furl ou encore
Blogmarks et Blinklist35 Certains de ces sites au-delagrave de larchivage de ladresse
proposent de conserver une copie inteacutegrale dune page web Dautres vous
suggegraverent des sites similaires agrave ceux que vous avez mis dans vos favoris Cette
similariteacute se base notamment sur les favoris ajouteacutes par les autres utilisateurs La
recherche par similariteacute (ou par suggestion en fonction de vos habitudes de
navigation) offerte par des services comme Yoono StumbleUpon ou Similicious 36 est
une meacutethodologie de recherche particuliegraverement inteacuteressante Nous en reparlerons
plus loin
Pour choisir preacuteciseacutement votre service de bookmarks sociaux vous pouvez vous
aider de ces ressources 37
- le site Irox propose un tableau comparatif de pregraves de 20 services
- le blog de Robin Good offre une seacutelection inteacuteressante de bookmarks sociaux
- la page Free Bookmark Managers affiche une liste dune quarantaine de logiciels et
utilitaires deacutedieacutes au partage et agrave la gestion de vos favoris (bookmarks) en ligne via
accegraves distant en local ou sur serveur Attention tous ne sont pas sociaux cest-agrave-
dire baseacutes sur le partage
copy Digimind Digimind Services ndash White Paper |29
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b Le Multimeacutedia photos et videacuteos
Le partage de vos ressources ne se limite pas au texte et adresse de sites Il est
eacutegalement possible de partager vos photos et videacuteos
Les images
Flickr 38 racheteacute par Yahoo Inc en 2005 est lapplication type de partage dimages
voire mecircme larcheacutetype du service Web 20 ce site permet de mettre en ligne ses
photos de les partager avec ses proches ses collegravegues ou de les laisser en accegraves
priveacute
Il est possible dutiliser un moteur pour rechercher agrave travers les millions de photos
mises en ligne par les autres utilisateurs
Flickr na pas de points communs avec les nombreuses applications Web 2 en becircta agrave
linterface artisanale Sur le service de Yahoo la puissante interface en fait un outil
tregraves simple agrave utiliser Ainsi via le menu Organize vous pouvez acceacuteder agrave une
veacuteritable table de montage virtuelle pour organiser vos photos
copy Digimind Digimind Services ndash White Paper |30
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche sur Flickr A droite les noms dutilisateurs et les tags associeacutes aux photos
Comme sur les bookmarks sociaux la recherche peut seffectuer sur le titre ou la
description mais aussi sur les tags chaque internaute qui partage ses photos leur
attribue des mots cleacutes pour les deacutefinir les expliquer les contextualiser voire donner
son opinion
Chaque liste de reacutesultats chaque photo est accompagneacutee par ses tags Ceux-ci
permettent aussi daffiner ou deacutelargir votre recherche lorsque vous en seacutelectionnez
un Il est possible de rechercher sur les photos les utilisateurs mais aussi sur les
groupes En effet la notion de communauteacute est eacutegalement importante Les
groupes rassemblent les utilisateurs qui partagent les mecircmes centres dinteacuterecirct
photographiques Des forums de discussions sont inteacutegreacutes agrave ces groupes
permettant dentrer en contact direct avec certains membres
copy Digimind Digimind Services ndash White Paper |31
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Par exemple le groupe The Eyes Have It 39 rassemble les utilisateurs (et donc leurs
photos) autour du thegraveme de la communication visuelle des secteurs pharmacie et
biotech
Que peut trouver le veilleur sur un service de photos tel que Flickr
Finalement la mecircme chose que sur les bookmarks sociaux tout ce que les
membres ont voulu partager des photos du dernier salon automobile de Detroit 40
ou de la convention annuelle des industries cosmeacutetiques dAmeacuterique du Nord La
veille concurrentielle ou la veille image sur votre propre socieacuteteacute est eacutegalement
inteacuteressante Ainsi une recherche (full text) sur la socieacuteteacute peacutetroliegravere Exxon affiche
plus de 1400 photos relatives aux stations services aux puits de peacutetrole aux
raffineries aux employeacutes aux manifestions de contestataires ou aux publiciteacutes
deacutetourneacutees
Comme avec le social bookmarking vous pouvez vous attacher agrave suivre les
membres qui partagent les mecircmes centres dinteacuterecirct que vous ou votre organisation
apregraves seacutelection de la page de lutilisateur la mise en surveillance de son flux RSS
permet decirctre averti degraves que cette personne ajoute de nouvelles photos
Dautres services permettant le partage de photos existent Toutefois ils ne vont
pas aussi loin que Flickr dans la logique Web 20 Le service PhotoBucket 41 est le
grand concurrent de Flickr mais avec une approche plus grand public Flickr est
davantage freacutequenteacute par des internautes avertis des professionnels et des
passionneacutes de photographie En ce sens le service de Yahoo sera donc plus
inteacuteressant pour le veilleur
Squidoo 42 est en quelque sorte un annuaire de bookmarks perfectionneacute une
rencontre de services sociaux comme Delicious et Flickr Squidoo vous permet en
effet de creacuteer une page de liens dans un domaine qui vous passionne et de la
structurer en rubriques agreacutementeacutees de photos
Linterface simple rend possible la creacuteation rapide de pages speacutecialiseacutees (appeleacutees
lensgtobjectifs lentilles) et de les rendre visible agrave tout un chacun On trouve par
exemple plusieurs lens consacreacutees aux nanotechnologies43 Chaque lens est
accompagneacutee de tags connexes agrave son sujet
Vous pouvez rechercher ces pages gracircce agrave un moteur de recherche un reacutepertoire
par cateacutegories un nuage de tags (exemple le tag Marketing 44) ou mecircme parcourir
le Top100
copy Digimind Digimind Services ndash White Paper |32
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La videacuteo
Via les services YouTube ou DailyMotion le partage de videacuteos en ligne est plus
meacutediatiseacute que les services de photos Notamment parce que le leader Google a
racheteacute YouTube en octobre 2006 geacuteneacuterant un buzz sans preacutecegravedent au sein des
blogs et de la presse traditionnelle (Mainstream medias)
YouTube 45 et ses concurrents Web 20 fonctionnent agrave peu pregraves de maniegravere
eacutequivalente agrave Flickr sans en atteindre toutefois sa clarteacute ergonomique
Tout ces sites de videacuteos vont permettre drsquouploader (charger vers le site) et
partager vos videacuteos (converties automatiquement au format FlashVideo) et aussi
bien sucircr de rechercher parmi les videacuteos des autres utilisateurs
Sur ces applications on retrouve de nombreuses caracteacuteristiques du Web 2 les
videacuteos classeacutees par cateacutegories sont accompagneacutees de tags qui aident agrave les
contextualiser et les deacutecrire en plus du titre et de la description renseigneacutes par
lutilisateur Un fils RSS permet de surveiller lajout de videacuteos dans une cateacutegorie ou
par un utilisateur deacutefini A linstar des billets dun blog les internautes peuvent
commenter les videacuteos De plus les videacuteos sont noteacutees ce qui impacte ensuite leur
place dans le classement et donc leur visibiliteacute
Ces services contiennent des favoris inteacutegreacutes ougrave lon peut sauvegarder ses videacuteos
preacutefeacutereacutees Il est possible de partager sa videacuteo par mail ou messagerie instantaneacutee
de la poster sur son blog Dailleurs de nombreux blogueurs utilisent les services de
type YouTube (ou Flickr pour la photo) pour stocker leurs fichiers multimeacutedias trop
volumineux pour les heacutebergeurs de blogs La notion de groupe comme sur Flickr
est preacutesente des communauteacutes rassemblent des utilisateurs autour de grandes
theacutematiques lieacutees par exemple agrave la politique aux sports et aux voyages
YouTube a de nombreux concurrents aux fonctions tregraves proches Impossible de
tous les mentionner Mais on peut retenir cependant le franccedilais DailyMotion 46 tregraves
populaire dailleurs neacute quelques semaines avant YouTube Citons eacutegalement Yahoo
Videos AOL Videos Revver Grouper (de Sony) Metacafe SoapBox (de Microsoft)
Zudeo Wideo MySpace Vimeo 47Certains de ces services proposent du contenu
amateur ainsi que des films professionnels issus des networks de TV et de cineacutema
Mais les plus petits services se cantonnent aux videacuteos envoyeacutees par linternaute que
celles-ci aient dailleurs eacuteteacute copieacutees ou non
copy Digimind Digimind Services ndash White Paper |33
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche sur DailyMotion
Quel contenu agrave usage professionnel le veilleur peut espeacuterer trouver sur ces
plateformes Essentiellement des videacuteos consacreacutees agrave des socieacuteteacutes et individus
Ainsi si je reacuteitegravere ma recherche sur la socieacuteteacute peacutetroliegravere Exxon jobtiens des videacuteos
sur des manifestations des mareacutees noires le reacutechauffement climatique des
actualiteacutes boursiegraveres des retransmissions de procegraves des deacutetournements de
publiciteacutehellipLa recherche de videacuteos saverra particuliegraverement utile pour une veille
Image Produits ou concurrentielle Le contenu de videacuteos est eacutegalement souvent
tregraves politique agrave partir de la campagne des eacutelections preacutesidentielles franccedilaises de
2007 la diffusion de videacuteos sur les hommes et femmes politiques est devenue une
veacuteritable arme Autre aspect inteacuteressant la possibiliteacute de deacutecouvrir de nombreux
extraits de videacuteos de documentaires sur des sujets extrecircmement varieacutes eacutecologie
industrie socieacuteteacute consommation
Le contenu de ces services de videacuteos est donc agrave limage du net heacuteteacuterogegravene mais
potentiellement riche
copy Digimind Digimind Services ndash White Paper |34
Le Web 20 pour la veille et recherche dinformation DIGIMIND
c Partage de CV et reacuteseaux sociaux
Termineacute le temps ou seules les personnes agrave qui vous transmettiez votre CV ou
votre carte de visite pouvaient prendre connaissance de votre identiteacute et de votre
parcours professionnel Via les plateformes de reacuteseaux sociaux le push fait place au
pull de plus dans une optique de cooptation et de recommandation il y est
possible de mettre son CV en ligne sous format hypertexte et de demander agrave
rentrer en relation avec des proches de votre reacuteseau immeacutediat Les plateformes de
reacuteseaux sociaux sont nombreuses certaines sont agrave vocation geacuteneacuteraliste dautres
uniquement deacutedieacutees aux actifs dautres encore reacuteserveacutees agrave une communauteacute
(eacutetudiants lyceacuteens anciens eacutelegraveves passionneacutes de voyages)
Ces applications repreacutesentent un marcheacute conseacutequent puisque pour les seuls USA
on preacutevoit un chiffre daffaires des reacuteseaux sociaux de 25 milliards de dollars agrave
lhorizon 2011 contre 350 millions en 200648 La France est domineacutee par la
plateforme Viadeo (ex-Viaduc)49 Ce service leader lanceacute en 2004 compte plus de
750 000 profils Dans les autres pays cest LinkedIn 50 qui domine geacuteneacuteralement
avec plus de 9 millions dutilisateurs dans 135 pays
Une recherche sur Viadeo
copy Digimind Digimind Services ndash White Paper |35
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les fonctionnaliteacutes
Que trouve-t-on sur ces sites Notamment des profils de personnes en activiteacute ou
en recherche demploi ainsi que des hubs regroupant des utilisateurs autour dun
mecircme centre dinteacuterecirct toujours la notion de communauteacutes de pratiques propre au
Web 20 Sur ces services tout est penseacute pour creacuteer du lien social Le profil
individuel se constitue dun CV enrichi de nombreux liens vers ses employeurs ses
amis ses reacuteseaux professionnels et associatifs ses travaux et publications Les hubs
regroupent les personnes autour de secteurs meacutetiers associations danciens eacutelegraveves
pays reacutegions Par exemple sur Viadeo saffichent les hubs Analyse Veille
Strateacutegique amp Concurrentielle Intelligence Eco Blogs amp Bloggers Editeurs de
Logiciels Profession documentaliste and co mais aussi Grande distribution
Oceacuteanie ou Normes meacutethodes et outils Dans ces hubs des forums organisent les
discussions des membres autour de theacutematiques deacutefinies Un moteur de recherche
permet de trouver des profils selon un secteur une fonction une reacutegion Une fois
un profil identifieacute il faut demander agrave entrer en relation avec lui Cela sera dautant
plus facile et rapide sil est peu eacuteloigneacute de votre propre reacuteseau de contacts
La veille
Linteacuterecirct pour le professionnel de linformation est double il peut augmenter sa
visibiliteacute et celle de certains de ses projets services publications thegraveses ou articles
Dautre part il peut rechercher des donneacutees sur des personnes et entreprises ou
identifier un expert Comme sur dautres services Web 20 il est facile de se
constituer une communauteacute dutilisateurs partageant ses centres dinteacuterecirct que lon
visitera reacuteguliegraverement Ainsi sur Viadeo une recherche sur le secteur Agro-
alimentaire avec le mot cleacute veilleur 1 affiche plus de 50 reacutesultats avec les fonctions
entreprises et synthegraveses de parcours des membres Vous pouvez alors entrer en
relation avec ces personnes ou tout simplement collecter des donneacutees sur celles-ci
et leurs reacuteseaux Ces sites sont dailleurs devenus un outil essentiel pour certaines
fonctions commerciaux pour la prospection recruteurs journalistes
ethellipresponsables de casting pour eacutemissions TV
1 Certaines fonctionnaliteacutes avanceacutees sont payantes
copy Digimind Digimind Services ndash White Paper |36
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les autres reacuteseaux
Parmi les autres services de reacuteseaux sociaux outre LinkedIn davantage tourneacute agrave
linternational il existe assez utiliseacutes en France 6nergiesnet et Xing (ex Open BC)51
Les reacuteseaux ciblant plus particuliegraverement les jeunes (FaceBook MySpace) peuvent
eacutegalement ecirctre utiliseacutes MySpace feacutedegravere plus particuliegraverement des professions de la
communication de la publiciteacute et des meacutetiers multimeacutedias
Le reacuteseau FaceBook52 est original ce site nord-ameacutericain est preacutecurseur dun social
networking tregraves segmenteacute reacuteserveacute aux eacutetudiants et aux lyceacuteens Au deacutepart les
membres devaient sinscrire obligatoirement via lemail de leur universiteacute afin de
garantir lauthenticiteacute des profils et donc le seacuterieux de la communauteacute Depuis
FaceBook sest ouvert aussi aux entreprises Ainsi ce site capte tregraves tocirct les futurs
actifs et les fideacutelise
Des ressources
Certaines ressources peuvent vous aider agrave identifier les plateformes de reacuteseaux
sociaux professionnels utiles pour vos recherches Le wiki List of social networking
websites liste de nombreuses plateformes de reacuteseaux sociaux 53 et le site Link n
Rank cateacutegorise des sites de social networking 54
copy Digimind Digimind Services ndash White Paper |37
Le Web 20 pour la veille et recherche dinformation DIGIMIND
d Les sites dactualiteacutes collaboratives recommandation et notation
Ces sites recouvrent en fait diffeacuterents types dapplications
- Les Digg Like Ces services qui sinspirent tous du preacutecurseur Digg55 recueillent des actualiteacutes
proposeacutees par les internautes Le principe apregraves enregistrement un formulaire
simple vous permet de poster lactualiteacute de votre choix susceptible dinteacuteresser les
autres internautes son titre son url sa description Il faut aussi choisir une
cateacutegorie Par exemple Technologies Sciences Monde Affaires Divertissement Ces
cateacutegories peuvent ecirctre subdiviseacutees en theacutematiques plus fines Lactualiteacute si elle est
valideacutee par les modeacuterateurs apparaicirctra alors en ligne Elle sera noteacutee par les autres
internautes qui votent pour elle selon son inteacuterecirct Les actualiteacutes disposant du plus
grand nombre de points se placent alors en haut du classement
La cateacutegorie Sciences sur Digg A gauche les nombres de votes
Ces sites affichent les principales caracteacuteristiques du Web 20 interface eacutepureacutee
possibiliteacute de laisser des commentaires fils RSS pour surveiller les nouvelles
actualiteacutes classement des articles les plus lus les mieux noteacutes possibiliteacute denvoyer
par mail ou de bloguer un article et bien sucircr forte contribution de linternaute Sur
certains sites leacutetiquetage des articles via le systegraveme de tags est proposeacute
copy Digimind Digimind Services ndash White Paper |38
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Linteacuterecirct est de pouvoir positionner certaines informations les unes par rapport aux
autres et connaicirctre la populariteacute dune actualiteacute ou dun sujet (entreprise personne)
abordeacute (la critique de mon produit est-elle tregraves populaire ) Cest une approche
alternative aux agreacutegateurs de news de type Google Actualiteacutes ou Yahoo Actualiteacutes
qui hieacuterarchisent les news avec de puissants algorithmes mais sans recourir agrave
lhumain Ainsi Google Actualiteacutes preacutecise La seacutelection et le positionnement des
articles de cette page ont eacuteteacute reacutealiseacutes automatiquement par un programme
informatique
En outre sur ces services de type Digg linformation nest pas brute linternaute
qui poste lactualiteacute peut selon son expertise y apporter un commentaire de
valeur Linformation peut ecirctre commenteacutee (en plus du vote) par les autres
internautes Comme de nombreux blogueurs les utilisateurs des Digg Like jouent
aux journalistes ou tout simplement donnent leur opinion
Lorsquil sagit dactualiteacutes concernant le produit ou le service dune socieacuteteacute ces
commentaires positifs ou non sont une veacuteritable manne pour de nombreux
professionnels de linformation veilleurs marketeurs chargeacutes deacutetudes et autres
analystes qui vont pouvoir recueillir agrave moindre frais des informations sur leur
nouveau produit leurs clients ou ceux de la concurrence
Digg est lun des sites les plus copieacutes du Web 20 Sil reste la reacutefeacuterence dautres
applications tregraves largement inspireacutees tirent leur eacutepingle du jeu En France Scoopeo
Fuzz et TapeMoi offrent eux aussi des services dactualiteacutes collaboratives On peut
eacutegalement citer Rojo le canadien Niouz lespagnol Meneames le reacuteseau de sites
BlogMemes 56 Mecircme Netscape pionnier du navigateur web a lanceacute un portail
sinspirant du systegraveme de notation de Digg
On peut reprocher agrave ce type de site de favoriser les cateacutegories techniques et
scientifiques faisant la part belle aux contributions des geeks et autres accrocs du
net grands utilisateurs de services Web 2 Toutefois les sites comme Blogmemes ou
Netscape diffusent davantage dactualiteacutes agrave teneur eacuteconomique et sociale
- Les mix actualiteacutes contributions des internautes
Wikio57 est un service dorigine franccedilaise (creacuteeacute par le fondateur de Kelkoo) agrave
lintersection de Google Actualiteacutes et de Digg En effet Wikio mixe les articles issus
de sites dactualiteacutes de blogs avec des contributions des internautes On peut
prendre connaissance des informations de diffeacuterentes maniegraveres
copy Digimind Digimind Services ndash White Paper |39
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- En naviguant via les theacutematiques (France International Politique Economie
Finance Santeacute Science hellip) ou via le nuage de tags dynamiques qui se modifient en
fonction de la rubrique ou vous vous situez
- En recherchant via le moteur
- En sabonnant aux flux RSS agrave chaque cateacutegorie et agrave chaque tag correspond son
flux RSS De mecircme lorsque vous lancez une requecircte via le moteur vous pourrez
surveiller ces reacutesultats via un flux RSS
- les plateformes de contributeurs indeacutependants
La deacutefiance et la volonteacute dindeacutependance vis-agrave-vis des grands meacutedias traditionnels de
la presse eacutecrite et audio-visuelle se sont traduites degraves 2001 par la creacuteation massive
de blogs Les blogueurs sont-ils et peuvent-ils simproviser journalistes Ce deacutebat
qui promet decirctre sans fin est inteacuteressant De nombreux blogueurs (mais pas la
majoriteacute) sont devenus de veacuteritables experts dans leur domaine agrave force deacutecriture
de lecture et danalyses quotidiennes Ainsi les mainstream medias invitent
maintenant dans leurs colonnes et plateaux les blogueurs les plus talentueux
Ces blogueurs experts ou professionnels ne constituent pas les seuls creacuteateurs
dactualiteacutes alternatives
Des initiatives de plateformes dactualiteacutes eacutecrites par des non professionnels ont
aussi vu le jour Agoravox58 est lun des premiers portails de journalisme citoyen
lanceacute par Joeumll de Rosnay et Carlo Revelli 59 en mai 2005 Agoravox permet aux
internautes de proposer leurs articles pour commenter reacutefleacutechir agrave des sujets
dactualiteacutes si possible avec une approche et un regard diffeacuterents des meacutedias
traditionnels Le format des contributions est multimeacutedia Le site explique Tout le
monde peut devenir reacutedacteur drsquoAgoraVox Il nrsquoest pas neacutecessaire de savoir eacutecrire avec
un style journalistique affirmeacute Chacun drsquoentre nous peut devenir une sorte de capteur
en temps reacuteel de ce qui se passe dans notre entourage en fournissant des articles des
images des extraits videacuteo ou audio Ce qui est important crsquoest de pouvoir teacutemoigner
drsquoun eacuteveacutenement auquel vous avez assisteacute ou que vous avez deacutecouvert en faisant des
recherches Il poursuit Pourquoi devenir reacutedacteur Tout simplement pour faire
entendre votre voix et pour relater des faits que vous avez identifieacutes et qui ne vous
paraissent pas ecirctre suffisamment repris dans les meacutedias traditionnels voire ignoreacutes ou
censureacutes
Agoravox encourage donc agrave utiliser son style personnel Il convient de sinscrire pour
devenir reacutedacteur Les articles doivent toutefois obeacuteir agrave une politique eacuteditoriale60
Un comiteacute de reacutedaction valide ensuite les contributions
copy Digimind Digimind Services ndash White Paper |40
Le Web 20 pour la veille et recherche dinformation DIGIMIND
En quelques mois Agoravox a prouveacute que de simples internautes pouvaient ecirctre
aussi bon reacutedacteurs et experts en fonction de leurs profession passion et
centres dinteacuterecirct agrave linstar des blogueurs professionnels
Agoravox na pas la vocation dun agreacutegateur dactualiteacutes de type Digg Wikio ou
Google News Cest une sorte de quotidien qui privileacutegie les articles de fond et
lanalyse Bien sucircr des reacutedacteurs stars eacutecrivent reacuteguliegraverement et leurs articles
sont attendus Mais ce ne sont pas les rubriqueurs traditionnels des autres meacutedias
Comme sur les autres sites Web 20 le lecteur peut attribuer une note dinteacuterecirct agrave
chaque article et poster un commentaire Enfin leacutetonnante technologie
ReadSpeaker 61 permet de retranscrire automatiquement tous les textes en version
audio
Agoravox nest pas le seul exemple de site de journalisme citoyen Le portail
OhMyNews 62 initiative coreacuteenne est baseacute sur le mecircme principe Lanceacute en feacutevrier
2000 le reacuteseau international OhMyNews reacuteunit plus de 40 000 reacutedacteurs
Pour le veilleur ces sites dactualiteacutes collaboratives constituent des sources
dinformations alternatives avec une partie de lactualiteacute issue des organes et
agences de presse et lautre partie provenant des internautes Dautre part ces
nouveaux meacutedias permettent de deacutecouvrir et surveiller des experts voire des
leaders dopinion
Un article sur Agoravox A droite une preacutesentation de son auteur En haut la possibiliteacute de voter et
commenter larticle
copy Digimind Digimind Services ndash White Paper |41
Le Web 20 pour la veille et recherche dinformation DIGIMIND
II Rechercher Collecter
Doreacutenavant tout internaute peut creacuteer et publier sa propre information
Lidentification des sources dinformation et de linformation elle-mecircme est devenue
complexe car elles sont de plus en plus morceleacutees et atomiseacutees Il convient
dutiliser une large palette doutils de recherche pour collecter les donneacutees en
provenance des blogs des bookmarks et reacuteseaux sociaux Pour faciliter la
collecte il est en outre possible de verticaliser la recherche et de faire appel agrave des
humains Par ailleurs dautres outils permettent darchiver ses deacutemarches de
requecirctes et de navigation
a La recherche de blogs et de flux RSS
Le volume de blogs est en constante croissance sur le net Le nombre de blogs a
litteacuteralement exploseacute sur toute la planegravete Estimeacute agrave 70 millions agrave leacuteteacute 2005 ils sont
eacutevalueacutes agrave plus de 120 millions en mars 2007 Technorati lun des moteurs de
recherche de blogs les plus utiliseacutes mesure en 2007 un doublement du nombre de
blogs tous les 320 jours 120 000 blogs seraient ainsi creacuteeacutes chaque jour 63
Europe
33
Afrique 15 000
Ameacuterique du Nord
33
Ameacuterique du Sud
1
Asie
55
5 Australie 790 000
copy Digimind Digimind Services ndash White Paper |42
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Nombre de blogs en milliers et millions (la Russie est inteacutegreacutee dans lAsie) Estimation DIGIMIND Services 64
Les fils RSS omnipreacutesents A chaque blog correspond son flux RSS ce format qui permet dextraire et de
surveiller tout nouveau contenu qui parait sur le blog Si un vrai blog implique
toujours un flux RSS un flux RSS ninduit pas forceacutement un blog En effet le RSS et
son concurrent Atom sont preacutesents sur de plus en plus de type de meacutedias et outils
internet degraves lors que leur contenu est appeleacute agrave se modifier reacuteguliegraverement
On pourra donc trouver des flux RSS sur
-les blogs
-les sites de presse et dactualiteacute Exemple Les Echos Libeacuteration La Tribune Le
Figaro)
-les sites de revues et magazines speacutecialiseacutes Exemple La revue Nature propose ses
fils RSS concernant ses publications speacutecialiseacutees par domaines Science fait de
mecircme65
-les sites corporate des entreprises page dactualiteacutes catalogues produits (Ex Air
Liquide)
-les reacutesultats de moteurs de recherche de blogs Tous proposent des flux RSS
permettant de surveiller une requecircte (Technorati Google Blog Search Feedster
IceRockethellip)
-les pages de reacutesultats de moteur de recherche web Certains de ces moteurs
geacutenegraverent un flux RSS permettant de surveiller lapparition de nouveaux reacutesultats
pour une requecircte donneacutee
MSN Search (devenu Live Search66) le proposait depuis janvier 2005 et chaque page
de reacutesultats offrait une icocircne orange en bas de page permettant dobtenir des fils
RSS Cette icocircne RSS a disparu sur Live Search mais les flux RSS sont toujours lagrave (ils
sont deacutetectables automatiquement avec un navigateur Firefox Maxthon IE7 ou
votre lecteur RSS Attensa ou RSS Bandit par exemple)
Depuis peu Yahoo Search Web 67 offre lui aussi un fils RSS sur ses reacutesultats lagrave
encore deacutetectable via un lecteur ou navigateur (cela fonctionne uniquement pour le
Yahoo US)
copy Digimind Digimind Services ndash White Paper |43
Le Web 20 pour la veille et recherche dinformation DIGIMIND
-les moteurs dactualiteacutes La majoriteacute des portails qui agregravegent des flux dactualiteacutes
proposent des flux RSS Exemple Google Actualiteacutes Yahoo Actualiteacutes Topix MSN
Actualiteacutes Wikiohellip 68
-les Newsgroups Usenet (groupes de discussion) Les fils RSS sont en effet aussi
preacutesents sur Google Groupes (ou Google Groups) ce qui rend plus aiseacute la surveillance
des discussions Chaque groupe (Google ou Usenet) affiche un fils RSS ou Atom 69
(et ce quelque soit la langue) signaleacute par le logo orange RSS en bas de page
-certains forums web Exemple Forum Mobiles 70
-certaines listes de diffusion elles peuvent ecirctre surveilleacutees via labonnement agrave leur
flux RSS Cela eacutevite lengorgement de votre boicircte mail Exemple la liste Veille sur
Yahoo Groupes 71 dispose dun flux RSS
-les bookmarks sociaux Delicious Yahoo MyWeb2 Blogmarks 72hellipLe fils RSS
permet decirctre alerteacute de lajout de nouveaux favoris pour un tag ou un utilisateur
deacutefinis
-les plateformes de partage de photos Exemple Flickr PhotoBucket 73
-les services de partage de videacuteos comme YouTube DailyMotion 74 pour ecirctre alerteacutes
des nouveauteacutes
-de tregraves nombreux sites offrant un contenu qui se renouvelle
copy Digimind Digimind Services ndash White Paper |44
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Veille Corporate La Tribune propose des flux RSS segmenteacutes par socieacuteteacutes
Le veilleur via ces flux RSS pourra surveiller de nombreuses sources
dinformations Par ailleurs au-delagrave des blogs introspectifs dadolescents dont peu
preacutesentent un inteacuterecirct pour les professionnels certains types de blogs peuvent se
reacuteveacuteler utiles
-Le blog dactualiteacute et dopinion preacutesentant reacuteflexions et critiques de journalistes et
internautes
-Le blog theacutematique eacutediteacute par des passionneacutes experts professionnels consultants
et techniciens
-Le blog dentreprise outil de communication externe ou interne agrave linitiative des
salarieacutes ou des dirigeants
copy Digimind Digimind Services ndash White Paper |45
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les outils pour trouver des blogs et flux RSS Sur ces moteurs la recherche seffectue par mots cleacutes classiques ou par tags comme
sur Technorati par exemple Le contenu indexeacute (blogs et flux) est tregraves heacuteteacuterogegravene
Aussi lutilisation de la recherche avanceacutee sur ces outils est souvent neacutecessaire En
effet un blog peut avoir abordeacute la theacutematique deacuteveloppement durable 1 seule fois
parmi ses 4500 billets Il conviendra donc alors de centrer sa recherche sur le titre
du blog ou son url
Les moteurs
Certains moteurs sont deacutedieacutes agrave la recherche de blogs Cest en fait un abus de
langage Ces moteurs se focalisent sur la recherche de flux RSS mais ne peuvent
faire la diffeacuterence entre un flux provenant dun grand journal et celui dun blog
Ainsi le moteur Technorati classe parmi les blogs les plus populaireshellipLe Figaro
Pour mener une recherche efficace il conviendra dutiliser plusieurs moteurs Car
comme pour la recherche web ougrave il ne faut pas se limiter agrave Google au risque de
manquer pregraves de 85 des reacutesultats75 la recherche sur les blogs neacutecessite lemploi
de plusieurs outils76 En voici quelques-uns
gt Google Blog Search Recherche de blogs Google applique sa technologie puissante
aux flux RSS et blogs Linterface est notamment disponible en franccedilais et en anglais
Le moteur est doteacute de fonctions de recherche avanceacutee (recherche sur le titre le
billet recherche par ancienneteacutehellip)
gt Ask Blog amp Flux Ce moteur permet de rechercher parmi les blogs les flux XML
(RSS ou Atom) Et aussi de sabonner agrave un blog ou un flux RSS
gt Feedster Ce moteur recense plus de 900 000 sources et 5000 sont rajouteacutees
chaque jour
gt BlogPulse Indexe plus de 46 millions de blogs
gt Technorati Ce moteur rafraicircchit son index toutes les 5 agrave 15 minutes et
recherche parmi plus de 70 millions de blogs (en avril 2007 77) ou sites proposant
des flux RSS Il est possible de rechercher par mots cleacutes ou par tags
gt Sphere va prendre en compte plusieurs variables pour mieux chercher parmi la
blogosphegravere
- comme pour le contenu web classique les reacuteseaux de liens entrants et sortants
- la qualiteacute de ces liens
copy Digimind Digimind Services ndash White Paper |46
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- les internautes agrave lorigine de ces liens (simple commentateurs ou leaders dopinion)
3 moteurs web integravegrent la recherche sur les blogs au sein de leur recherche
avanceacutee 78
gt Yahoo Search
Pour centrer sa recherche sur les flux RSS et les blogs il convient drsquoaller dans la
recherche avanceacutee (agrave droite de la boite de requecircte) puis dans le menu deacuteroulant
Format de fichiers et de seacutelectionner le format RSSXML
gt Exalead
Apregraves avoir effectueacute votre recherche il suffit de cliquer sur le bouton RSS jaune
dans la fenecirctre Preacuteciser la recherche Au sein des reacutesultats de recherche le flux
RSS est disponible via licocircne RSS Simple et propre
gt Microsoft MSN Live Search
MSN a ameacutelioreacute les interfaces de son moteur pour restreindre la recherche sur les
fils RSS Apregraves laffichage de votre page de reacutesultats vous pouvez affiner votre
recherche gracircce au bouton Flux (ou Feed en anglais) Ce bouton est accessible via
le menu Plus Au sein des reacutesultats de recherche sont alors disponibles lurl du flux
le cache et un lien pour sinscrire au fils RSS
Au-delagrave de ces moteurs speacutecialiseacutes il peut ecirctre beacuteneacutefique de tenter une recherche
sur un moteur Web (Google ou Yahoo Search par exemple) de type blog OR RSS
[votre sujet] Exemple blogs sur les teacuteleacutecoms Cela vous permettra non pas de
chercher au sein des blogs mais de trouver dautres blogs
Les reacutepertoires 79
Comme pour le web un certain nombre dannuaires entendent recenser les blogs
et fils RSS Attention comme la blogosphegravere est tregraves mouvante et en constante
croissance ces guides sont par nature non exhaustifs et leur mise agrave jour reacuteguliegravere
est difficile
gt Blogarama Ce reacutepertoire recense plus de 49 000 blogs classeacutes par cateacutegories
gt RSS Network indexe plus de 150 000 fils RSS
gt RSSFeeds Reacutepertorie plus de 119 000 fils organiseacutes en cateacutegories
copy Digimind Digimind Services ndash White Paper |47
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b La recherche par tags
Nous lavons vu avec la Folksonomie linternaute peut deacutesormais mettre en place et
partager sa propre classification via les tags Lutilisateur affecte leacutetiquette de son
choix agrave ses favoris images videacuteos Lavantage est indeacuteniable cest linternaute qui
deacutefinit son eacutetiquette et non plus un organisme Mais les inconveacutenients sont
nombreux difficile gestion des singulierspluriels problegraveme de synonymes de
signification (que deacutesigne cet internaute par ce tag) dhomonymes de polyseacutemie
dheacuteteacuterogeacuteneacuteiteacute plusieurs tags peuvent designer les mecircmes documents
Toutefois lapproche par tag facilite la recherche dune part en ajoutant une couche
seacutemantique aux documents web et dautre part en permettant une navigation par
concepts de plus en plus abandonneacutee compte tenu de la deacutesertion progressive des
cateacutegories des grands reacutepertoires web par les internautes
De plus on peut tagger pratiquement tout type de contenu web Ainsi les sites 43
Things et son eacutequivalent franccedilais 36 Trucs 80 proposent aux internautes de lister
leurs objectifs expeacuteriences ou projets Chacun de ces projets est taggeacute via un ou
plusieurs mots cleacutes
Les moteurs et meacutetamoteurs de tags
Les moteurs
La plupart des applications de social bookmarking ou de partage de fichiers images
ou videacuteos permettent donc de tagger leur contenu Sur certaines le moteur de
recherche interne rend possible en plus de la recherche sur le full text une
recherche centreacutee sur les tags Cest le cas sur Flickr vous pouvez rechercher au
choix sur le titre et la description des images ou sur les tags associeacutes deacutefinis par les
utilisateurs qui ont placeacute leurs photos
Un outil comme Delicious tag search 81 va vous permettre deffectuer des
recherches via un ou plusieurs tags sur le service de social bookmarking Delicious
Pour la recherche de blogs ou flux RSS le moteur Technorati propose une
recherche classique sur les mots cleacutes contenus dans les billets mais aussi une
copy Digimind Digimind Services ndash White Paper |48
Le Web 20 pour la veille et recherche dinformation DIGIMIND
recherche par tags82 En effet leacutediteur dun blog peut tagger chacun de ses billets
via des mots cleacutes qui les cateacutegorisent Ces mots ou tags seront repris par lindex du
moteur Ainsi la recherche du mot pollution parmi les tags affiche un billet sur le
reacutechauffement climatique Si ce billet est bien cateacutegoriseacute par son auteur dans une
rubriquepollution (parmi dautres) il ne contient pas ce mot dans son texte
toutefois en relation avec le concept de pollution Clairement une recherche
classique sur le seul texte des billets naurait pas rameneacute ce billet ou du moins pas
dans les premiers reacutesultats Autre inteacuterecirct Technorati vous propose des tags
associeacutes Ainsi pour pollution il affiche environment politics global warming science
china energy news air climate climate change autant de mots cleacutes pour eacutelargir ou
affiner vos requecirctes
Le moteur SearchLess 83 offre une approche originale il associe la recherche par
mots cleacutes agrave la recherche par tags Ainsi si vous effectuez une requecircte avec le mot
intelligence vous pouvez preacuteciser par le tag CIA Les reacutesultats seacutelectionneront
donc le mot intelligence sur des contenus (billets de blogs par exemple) taggeacutes CIA
par lutilisateur lui-mecircme on est alors sucircr que les 2 concepts sont intimement lieacutes
Meacutetamoteurs
Des meacutetamoteurs 84 permettent de rechercher sur les diffeacuterents types de contenu
sociaux bookmarks images videacuteos
Ainsi Tag Central agreacutege de nombreux formats web taggeacutes En lui indiquant un
tag il affiche des reacutesultats provenant agrave la fois de Flickr Smugmug (photos)
Technorati (blogs) Blogmarks Connotea Furl delirious (bookmarks sociaux) ou
encore 43Things (listes de projets)
Zewol outil de meacuteta syndication francophone permet de rechercher parmi les tags
(Flickr delicious) mais aussi sur les actualiteacutes (Google News Ask Actualiteacutes
Yahoo Actualiteacutes) les blogs (Technorati IceRocket Google Blog Search Ask
Blogshellip) le buzz (Tapemoi Scoopeo Wikipedia) les videacuteos (Google Videos
Podscope Video Daily Motion) et un mix (Furl Echonimo actualiteacutes Plazoo
Feed24) Concregravetement cest une bonne approche de recherche globale sur de
nombreuses ressources de type Web 20
Il est toujours possible de traquer la preacutesence ou lapparition dun mot clef sur le
web via la mise en surveillance du flux RSS de la requecircte
Ketoag est un outil qui permet dinterroger de nombreux services sociaux
copy Digimind Digimind Services ndash White Paper |49
Le Web 20 pour la veille et recherche dinformation DIGIMIND
(Delicious Furl Diig Wikio Blinklist) mais eacutegalement des moteurs de recherche
(Google Blog Search) Par ailleurs vous pouvez geacuteneacuterer pour chaque requecircte un
flux RSS mais aussi un fichier OPML (format permettant lagreacutegation et leacutechange de
listes de flux RSS)
Gnosh est un meacutetamoteur qui recherche parmi les moteurs web les moteurs de
blogs et les outils de partage de favoris De plus une recherche sur longlet People
vous permet de rechercher parmi les favoris des internautes inscrits agrave la
communauteacute Gnosh
Exalead recherche sur Wikipedia A droite le nuage de tags
Les nuages de tags
Ces nuages regroupent un ensemble de tags dans un mecircme espace en affectant agrave
chacun une taille variant selon leur populariteacute (freacutequence dutilisation ou de requecircte
sur ces mots) ou la densiteacute darticles auxquels ils se reacutefeacuterent (deacutepecircches dactualiteacutes
par exemple)
Les nuages de tags sont devenus agrave la mode car ils permettent une navigation facile
tregraves visuelle au sein dun site dune base de donneacutee ou des reacutesultats dun moteur
Ils apportent une grille de lecture suppleacutementaire agrave des sites dont les menus sont
souvent surchargeacutes ou le contenu atomiseacute
copy Digimind Digimind Services ndash White Paper |50
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Nombreuses sont les applications qui utilisent le nuage de tags pour optimiser la
navigation et mettre en valeur leur contenu le partage de videacuteos (DailyMotion) les
bookmarks sociaux (Delicious MyWeb2 de Yahoo) ou les services dactualiteacutes
collaboratives comme Wikio Certains moteurs comme Exalead ont eacutegalement
choisis dafficher des nuages de tags au sein de leurs pages de reacutesultats Dans ce cas
il sagit dune aide agrave laffinage des requecirctes un clic sur un tag va afficher une
nouvelle page de reacutesultat prenant ce mot en compte
Zibb85 moteur de recherche vertical deacutedieacute au Business to Business utilise aussi le
nuage de tags pour visualiser clairement les mots cleacutes de theacutematiques connexes les
plus freacutequents agrave votre requecircte
Dautres sites plus classiques ont eacutegalement choisi lapproche du nuage de tag pour
rendre leur navigation plus attractive et leurs rubriques plus visibles Ainsi le site
Ecrans 86(du journal Libeacuteration) affiche en bas agrave droite un nuage de tags mettant en
valeur son contenu tregraves touffu
Certains outils proposent de geacuteneacuterer des nuages de tags pour des sites ou moteurs
nen disposant pas
Google Tag Cloud Maker 87 est un script pour Firefox qui permet dafficher un nuage
de tags agrave droite des reacutesultats de Google plus un mot est freacutequent dans les reacutesultats
de votre recherche plus la taille dun tag est importante
Newzingo 88 extrait des mots de Google News pour constituer un nuage
doccurrences parmi les termes de lactualiteacute Plus le terme est gros plus les articles
relatifs agrave ce terme sont nombreux Techzingo reacutealise le mecircme process mais cette
fois les cibles sont des meacutedias de reacutefeacuterence dans le High Tech et le logiciel
Slashdot Diggcom et TheRegister
Un nuage de tags sur lInternet Movie Database une maniegravere de naviguer parmi tous les mots cleacutes associeacutes aux films
copy Digimind Digimind Services ndash White Paper |51
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La qualification du contenu par les utilisateurs (rdquofolksonomierdquo) est une reacuteelle valeur
ajouteacutee Les moteurs de recherche font reposer une grande part de lrsquoeffort sur
lrsquoutilisateur final une page de reacutesultats de Google doit ecirctre eacutevalueacutee souvent
interpreacuteteacutee par linternaute La folksonomie fait elle reposer lrsquoeffort de filtrage sur
lrsquoutilisateur initial celui qui va rechercher et appliquer ses propres ldquotagsrdquo Parce
quen amont 1743 personnes ont taggeacute une page avec un groupe de mots cleacutes
lrsquoutilisateur final lors de sa requecircte reccediloit une page de reacutesultats souvent tregraves
pertinente
Sur un moteur classique cest agrave lutilisateur dimaginer ses mots cleacutes pour affiner sa
recherche Sur les bookmarks sociaux de type Delicious les internautes qui
partagent leurs ressources ont deacutejagrave preacutepareacute ce travail daffinage via leurs tags
Prenons le cas dune recherche extrecircme car geacuteneacuterant de la synonymie la requecircte
Jaguar Sur Googlecom on me propose certes des mots cleacutes connexes pour
affiner mais tous sont lieacutes agrave la voiture Sur Delicious les tags afficheacutes sont relatifs agrave
la voiture mais aussi au systegraveme dexploitation agrave un groupe de musique et agrave lanimal
Pouvoir rechercher parmi les tags classifications eacutemanant de lutilisateur peut ecirctre
particuliegraverement inteacuteressant lorsquune recherche classique par mots cleacutes sur le
contenu des documents sest aveacutereacutee infructueuse ou geacutenegravere des reacutesultats peu
pertinents
Le tagging une pratique quotidienne
Selon une enquecircte meneacutee en deacutecembre 2006 par le Pew Internet amp American Life
Project 28 dutilisateurs des internautes ameacutericains ont taggeacute ou cateacutegoriseacute en
ligne des contenus tels que des photos des billets dans des blogs des articles
drsquoactualiteacutehellipSur une base journaliegravere 7 des utilisateurs drsquoInternet pratiquent le
tag en ligne
Ce systegraveme de laquo taxonomie populaire raquo pourrait-il constituer une alternative aux
outils de recherche traditionnels par mots cleacutes Il convient de distinguer les
usages professionnels des usages grand public Olivier Le Deuff 89 reprend dans
son eacutetude sur les Folksonomies la distinction effectueacutee par Thomas Vander
Wal entre les folksonomies eacutetroites (narrow folksonomies) et geacuteneacuterales (broad
folksonomies) Selon Olivier Le Deuff cette distinction est importante car les
premiegraveres sont surtout utiliseacutees dans un objectif individuel tandis que les secondes
privileacutegient lrsquoaspect collectif et collaboratif du partage drsquoinformation Ainsi les sites
de partages de favoris comme delicious ou Connotea sont plutocirct des
folksonomies geacuteneacuterales puisqursquoun mecircme site peut ecirctre partageacute par plusieurs
utilisateurs et recevoir le mecircme tag Ce type de folksonomies srsquoappuyant sur des
copy Digimind Digimind Services ndash White Paper |52
Le Web 20 pour la veille et recherche dinformation DIGIMIND
reacuteseaux sociaux ne fait pas que classer de lrsquoinformation et la partager Il met en
relation des usagers qui partagent les mecircmes centres drsquointeacuterecirct Lrsquousager indexeur
devient agrave son tour un peu indexeacute et mis en relation agrave la fois avec drsquoautres mots-
cleacutes drsquoautres sites et drsquoautres usagers
Il est clair que dans le domaine de lrsquoinformation professionnelle ou speacutecialiseacutee le
manque duniformisation des folksonomies qursquoelles soient geacuteneacuterales ou agrave vocation
plus eacutetroite pose les limites de ce systegraveme Les outils drsquoindexation et de
classification traditionnels ont en effet eacuteteacute creacuteeacutes pour des corpus structureacutes aux
limites clairement deacutefinies et srsquoadressent agrave des utilisateurs experts drsquoun domaine
ou de la recherche drsquoinformation Lrsquoabsence de hieacuterarchisation et de controcircle
constitue agrave la fois le point fort et le point faible de la folksonomie La barriegravere des
langues pourra constituer eacutegalement un obstacle les tags eacutetant parfois meacutelangeacutes
dans un mecircme site sans distinction De plus comme le note Cyril Fievet 90 la
pratique du tagging nrsquoest pas uniforme drsquoun site agrave lrsquoautre Sur Technorati les tags
indexeacutes sont ceux choisis par les blogueurs et fonction du contenu qursquoils ont eux-
mecircmes publieacute Sur delicious en revanche ce sont les internautes qui taguent le
contenu des pages qursquoils conservent dans leurs signets raquo
Il convient eacutegalement drsquoecirctre vigilant quant agrave une utilisation laquo frauduleuse raquo des
tags destineacutee uniquement agrave garantir la populariteacute drsquoun blog comme cela a pu
ecirctre le cas avec les meacuteta-donneacutees incorporeacutees dans le code source drsquoune page
html
Eacutelie Francis et Odile Quesnel preacutesentent dans la revue Documentaliste Sciences
de lrsquoinformation les quatre modes drsquoindexation et de classification sur le web la
classification personnelle lrsquoindexation par lrsquoauteur lrsquoindexation par lrsquoutilisateur et la
classification globale Et srsquointerrogent sur lrsquoavenir de lrsquoindexation collaborative agrave la
croiseacutee de la qualiteacute (liberteacute diversiteacute enrichissement) et de la deacutesinformation
(subjectiviteacute manque de coheacuterence)
Il nrsquoen reste pas moins que folksonomie et indexation classique ne srsquoopposent pas
neacutecessairement et constituent des moyens de description de contenus adapteacutes agrave
des contextes diffeacuterents Stephen Lee creacuteateur du site Guten Tag voit dans la
folksonomie une sorte de web seacutemantique du pauvre peu oneacutereux agrave mettre en
place mais dont le succegraves reposera sur une seacuterie de bonnes pratiques collectives
Lrsquointeacuterecirct de ce systegraveme reacutesidera non pas dans la capaciteacute agrave trouver une reacuteponse agrave
une question preacutecise mais plutocirct agrave deacutecouvrir des sources originales et peu connues
ou de localiser des experts drsquoun domaine pointu Les tags les plus rares et preacutecis
pourront entre autres trouver leur application dans le domaine de la veille mettant
copy Digimind Digimind Services ndash White Paper |53
Le Web 20 pour la veille et recherche dinformation DIGIMIND
en œuvre la seacuterendipiteacute ou lrsquoart de favoriser le hasard pour des deacutecouvertes
heureuses
Laissons la conclusion sur ce point agrave lrsquoAssociation des Professionnels de
lrsquoInformation et de la Documentation (ADBS) qui estime dans sa newsletter que
Le foisonnement des propositions de mots-cleacutes aboutirait agrave un reacutesultat plus efficace
quune indexation reacutealiseacutee par un vocabulaire contraint Cette affirmation semble
ecirctre deacutemontreacuteehellip pour linstant
c La recherche de personnes et dinformations entreprises
La recherche de donneacutees sur les personnes physiques ou morales seffectuait
jusquici principalement en interrogeant les bases de donneacutees dinformations leacutegales
et financiegraveres gratuites ou payantes Linterrogation de service tel que Societecom
Infogreffe ou Yahoo Finance est bien sucircr encore neacutecessaire Mais il faut compter
maintenant avec les reacuteseaux sociaux professionnels qui eux aussi rassemblent des
donneacutees sur les entreprises ou les individus
Linteacuterecirct des reacuteseaux sociaux
Que peuvent-il apporter par rapport aux services classiques dinformations
dentreprises Dabord comme expliqueacute preacuteceacutedemment ils sont ouverts agrave tous
Les informations y figurant ne sont plus le seul fait de leacutediteur du site et ne sont pas
uniquement constitueacutees par les fichiers de donneacutees leacutegales publieacutees par les
organismes officiels comme le Greffe du Tribunal de Commerce en France Sur les
reacuteseaux sociaux centreacutes sur les personnes le contenu est inteacutegralement ameneacute par
linternaute qui affiche son CV deacutetailleacute ses publications ses oeuvres (textes ou
multimeacutedias) Linteacuterecirct est eacutevident des personnes peu visibles auparavant parce
que ne faisant pas partie des dirigeants dentreprises (geacuterant fondateur membre du
conseil) sont maintenant accessibles et donc requecirctables par les internautes On
peut donc collecter des informations sur un cadre de RampD dune socieacuteteacute de
teacuteleacutecoms concurrente ou sur le management eacutetonnant de telle entreprise de
plasturgie citeacutee dans le CV dun employeacute de passagehellip
A linstar des blogs linformation preacutesente sur les reacuteseaux sociaux ne tient plus du
discours ou des donneacutees officielles puisque cest linternaute qui communique sur sa
vie et son entreprise
copy Digimind Digimind Services ndash White Paper |54
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Geacuterer leacuteparpillement de linformation
Dautres plateformes de social networking mixent linformation collecteacutee sur le web
avec les contributions des utilisateurs (agrave linstar de Wikio pour les actualiteacutes) Ainsi
le service ZoomInfo 91 permet de rechercher des socieacuteteacutes et des personnes en
parcourant des milliers de donneacutees extraites du web mais aussi en provenance de
profils dindividus et dentreprises renseigneacutes par les socieacuteteacutes ou les employeacutes eux-
mecircmes Aussi cohabitent des informations sur des entreprises coteacutees avec des
donneacutees de firmes non coteacutees des fiches de cadres du top management et des
conseils dadministration avec des CV demployeacutes plus fonctionnels
Le franccedilais Ziki 92 utilise aussi des informations collecteacutees sur le web cest une
sorte dannuaire perfectionneacute qui indexe et archive non pas les donneacutees
signaleacutetiques mais les contenus produits par une personne agrave partir du moment ougrave ils
disposent dun flux RSS (billets de blogs photo Flickr favoris Delicioushellip) Ziki ne
permet pas de creacuteer du contenu propre mais agregravege des donneacutees eacutelaboreacutees par un
mecircme individu auparavant eacuteparpilleacutees sur linternet Bref vous ameacuteliorez votre
visibiliteacute et facilitez la recherche de vos productions sur le net en creacuteant un point
unique daccegraves
La recherche sur tous ces reacuteseaux sociaux implique souvent linterrogation
fastidieuse apregraves inscription de plusieurs dizaines de sites
Aussi certains outils 93 proposent une meacutetarecherche en lanccedilant une mecircme
requecircte sur plusieurs services de social networking Stalkerati recherche le nom
dune personne sur les reacuteseaux Friendster et FaceBook Plus complet et ciblant
davantage les reacuteseaux professionnels YoName recherche les noms sur MySpace
LinkedIn Friendster Windows Live Spaces Bebo Digg ou Xanga
Le moteur de recherche de personnes Wink scrute les reacuteseaux sociaux MySpace
Bebo Friendster LinkedIn Live Spaces et autres De plus avec cet outil il est
possible de creacuteer son propre profil et de le connecter agrave des reacuteseaux sociaux
Attention toutefois si vous ecirctes un utilisateur recherchant des donneacutees en franccedilais
la nature des reacutesultats est plutocirct tourneacutee vers le monde anglophone
Ces reacuteseaux sociaux ne sont pas suffisants pour une recherche professionnelle
complegravete A linstar des blogs face agrave la presse traditionnelle ils constituent un
compleacutement inteacuteressant aux bases de donneacutees officielles
copy Digimind Digimind Services ndash White Paper |55
Le Web 20 pour la veille et recherche dinformation DIGIMIND
d Les moteurs de recherche humains
Apregraves ecirctre apparus sur le net agrave la fin des anneacutees 90 les services de questions-
reacuteponses avaient laisseacute la place aux algorithmes tout puissants des moteurs de
recherche de type Google Mais les robots et programmes ont tous besoin dune
intervention humaine pour geacuterer la qualiteacute et la pertinence des reacutesultats
Ainsi tous les grands moteurs majeurs ne font pas confiance agrave leurs seuls
algorithmes Les employeacutes de Yahoo sont mis agrave contribution pour surveiller la
qualiteacute des reacutesultats fournis par le moteur Chez Google et MSN Search des
process deacutevaluation humaine avaient eacuteteacute identifieacutes agrave travers les sites
EvalGooglecom et MSN HRS notamment
La revanche de lhumain
Au-delagrave de ce rating humain sur les reacutesultats de moteurs de recherche de
nombreux services depuis 2 ans mettent agrave disposition des experts en chair et en
os Cest alors un veacuteritable mode collaboratif qui se met en place lorsque le produit
est bien penseacute Cest la cas de Yahoo Answers (Yahoo Questions Reacuteponses en
France) 94 Ce service gratuit de questions reacuteponses lanceacute fin 2005 permet agrave
linternaute de poser une question dans un formulaire Chaque membre de la
communauteacute Yahoo (agrave savoir tout ceux qui disposent dun compte Yahoo) peut
jouer le rocircle dexpert Yahoo propose aussi le service (eacutegalement gratuit) Ask
Yahoo qui propose de reacutepondre agrave vos questions mais cette fois via un groupe
dexperts seacutelectionneacutes par Yahoo Inc Yahoo Answers a certes une orientation
initiale grand public mais des questions un peu techniques voire scientifiques
trouvent reacuteponse En effet parmi tous les contributeurs agrave Yahoo Answers figurent
des meacutetiers et expertises tregraves diverses du fait de son audience importante Il y
cohabite des types de questions varieacutes Quels sont les groupes strateacutegiques de
lindustrie mondiale du jouet Quelles sont les donneacutees eacuteconomiques du marcheacute de
lassurance vie collective en France
Autre point inteacuteressant le service est deacuteployeacute dans de nombreux pays (Etats-Unis
Royaume-Uni Canada Australie Inde Espagne Breacutesil Argentine Mexique Italie
Allemagne Singapour Taiwan Coreacutee du Sud Hong Kong Japon Chinehellip) Aussi il
est possible de localiser certaines questions et de beacuteneacuteficier parfois dune
expertise pays
Lune des raisons du succegraves du service de Yahoo tient au fait de baser les questions
et reacuteponses sur la contribution dinternautes volontaires Chacun participe
constitue un vrai reacuteseau et peut surtout se valoriser en devenant expert dans son
copy Digimind Digimind Services ndash White Paper |56
Le Web 20 pour la veille et recherche dinformation DIGIMIND
domaine de compeacutetences ou sa passion Il est mecircme possible de creacuteer sa propre
communauteacute qui rassemblera vos amis mais aussi vos experts preacutefeacutereacutes qui
reacutepondent agrave vos questions et centres dinteacuterecirct Le pool de reacutepondants nest donc
pas limiteacute agrave une liste restreinte et il sauto-entretient Dautre part les experts
seacutevaluent entre eux et seacutelectionnent parmi une liste si neacutecessaire ce quils
considegraverent comme la meilleure reacuteponse agrave une question
Une question sur Yahoo Answers
Sur ce marcheacute des Questions-Reacuteponses Google a eacutechoueacute notamment parce quil a
seacutepareacute formellement demandeurs et contributeurs limitant ainsi fortement laspect
collaboratif Le Service Google Answers 95 permettait de poser des questions agrave des
experts Mais lagrave ougrave des services concurrents comme Yahoo Answsers Lycos IQ
copy Digimind Digimind Services ndash White Paper |57
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Windows Live QnA96 sont gratuits Google Answers eacutetait un service payant faisant
appel agrave un reacuteseau de 800 experts Aussi Google Answers apregraves 4 ans dactiviteacute a
fermeacute Les questions ne sont deacutesormais plus accepteacutees mais laccegraves aux archives des
questions-reacuteponses est maintenu
Par ailleurs les reacuteseaux sociaux eacutevoqueacutes plus haut ont bien compris la puissance des
communauteacutes pour faire office de speacutecialistes Ainsi avec LinkedIn Answers la
plateforme de reacuteseaux sociaux LinkedIn sest lanceacutee elle aussi dans le service de
QuestionsReacuteponses
Ne pas oublier les services Web 10
Lorsque lon parle de Web 20 on eacutevoque rarement ces services de Questions-
Reacuteponses au profit de sites plus technologiques Pourtant nous sommes ici dans la
logique des bookmarks sociaux partager ses connaissances faire beacuteneacuteficier les
autres de son savoir et en retour profiter de lexpertise de la communauteacute
Comme la plupart des applications Web 2 la seule utilisation des services QR ne
suffit pas Elle doit venir en compleacutement de recherches parallegraveles via dautres outils
Ainsi pour la veille linscription agrave des listes de diffusion permet aussi de poser des
questions agrave des experts ou passionneacutes De plus il subsiste des services dexpert
traditionnels qui sils ne mettent pas laccent sur la collaboration permettent
didentifier des compeacutetences parfois tregraves pointues Certaines ressources
reacutepertorient des milliers dexperts quil faudra ensuite contacter personnellement
pour beacuteneacuteficier de leur conseil Cest le cas du site Expertscom qui identifie des
experts dans des domaines allant de lacoustique agrave la biochimie en passant par
lindustrie peacutetroliegravere97
copy Digimind Digimind Services ndash White Paper |58
Le Web 20 pour la veille et recherche dinformation DIGIMIND
e les moteurs de recherche collaboratifs
Nous lavons vu certains services dactualiteacutes collaboratives proposent des reacutesultats
issus dun mixage entre contribution des internautes et collecte de nouvelles sur le
web Cette approche de mixiteacute se met peu agrave peu en place pour les moteurs de
recherche web En effet les modegraveles algorithmiques ou humains preacutesentent tout 2
leurs limites en terme de pertinence de fiabiliteacute et dexhaustiviteacute
Aussi de plus en plus de projet de moteur mixtes agrave savoir proposant des reacutesultats
web conjointement agrave des reacutesultats etou seacutelections issus dhumains voient le jour
Du web donc mais avec une forte dose de cerveaux humains
Wikiasari
Celui qui fait le plus parler de lui est le projet de Jimmy Wales le co-fondateur de
lencyclopeacutedie Wikipedia Baptiseacute Wikiasari 98 (combinaison de wiki rapide en
hawaiumlen et asari recherche fouilleacutee en japonais) le projet vise agrave creacuteer un outil de
recherche ougrave les internautes pourront influer sur les reacutesultats en notant leur
pertinence etou en en proposant de nouveaux selon leur expertise
Ce type de moteur sinscrit donc agrave lopposeacute doutils comme Google aux algorithmes
automatiques dont les robots sont souvent trompeacutes par des manipulations de
webmasters (spamdexing par exemple)
Cet outil qui devrait voir le jour courant 2007 sappuie sur des infrastructures Open
Source existantes comme Nutch ou Lucent
Cest un projet particuliegraverement inteacuteressant Comme sur lencyclopeacutedie ouverte
Wikipedia ougrave des milliers de contributeurs construisent et alimentent louvrage sur
ce moteur des reacuteseaux de centaines dinternautes pourront apporter leur savoir
pour ameacuteliorer la pertinence des reacutesultats Ce nest plus seulement la puissance de
calcul de machines qui sera mise agrave contribution mais aussi la puissance de la
communauteacute
Derriegravere le projet Wikiasari il y a de gros moyens financiers et humains
lexpeacuterience de la fondation Wikipedia et le potentiel de trafic que pourra apporter
lencyclopeacutedie ouverte Fin 2006 Comscore a en effet classeacute Wikipedia comme le
6egraveme site le plus visiteacute au monde avec 1719 millions de visiteurs uniques au mois
de novembre On peut donc y croire
copy Digimind Digimind Services ndash White Paper |59
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche de sites similaires sur Yoono
Decipho Yoono
Certes lideacutee dun moteur de recherche collaboratif nest pas nouvelle Reacutecemment
on peut citer le lancement du moteur Decipho ou en mars 2006 celui de Yoono
Mecircme si les approches diffegraverent ces outils font tous la part belle agrave lrsquoapport de
chaque utilisateur dans le traitement des reacutesultats
Decipho 99 est un moteur baseacute sur la technologie de Askcom lun des 4 moteurs les
plus utiliseacutes aux USA Linternaute creacuteeacute ses propres cateacutegories de reacutesultats
partageables avec les autres Il peut eacutegalement tagger les reacutesultats afin deacutetiqueter
un site Aussi lors dune requecircte on peut preacuteciser les mots cleacutes classiques avec des
tags On beacuteneacuteficie alors de tous les tags mis en place par la communauteacute des
utilisateurs Un curseur permet de deacutefinir la proportion de cateacutegorisation des
autres utilisateurs agrave prendre en compte dans sa recherche
Le franccedilais Yoono 100 propose une autre deacutemarche encore loutil fonde ses reacutesultats
sur la mutualisation des connaissances des internautes par le partage des favoris Le
copy Digimind Digimind Services ndash White Paper |60
Le Web 20 pour la veille et recherche dinformation DIGIMIND
moteur utilise les favoris que sa communauteacute dutilisateurs a accepteacute de partager
Lors dune requecircte les reacutesultats sont classeacutes par populariteacute agrave savoir selon le
nombre de fois ougrave une page a eacuteteacute mise en favoris par les utilisateurs Une logique
proche de Delicious mais avec Yoono lajout de favoris est automatique De plus
loutil affiche les utilisateurs qui comme vous ont reacutefeacuterenceacute des sites sur la
politique veacuteneacutezuelienne par exemple De cette maniegravere vous pouvez identifier des
passionneacutes ou experts partageant vos domaines de preacutedilections Les reacutesultats ne
sont plus baseacutes sur les seuls algorithmes mais sur lexpeacuterience et la capacitation des
autres utilisateurs
Les initiatives de moteurs collaboratifs plus ou moins inteacuteressantes sont multiples
Foox est un moteur baseacute sur des communauteacutes dinteacuterecirct et sur Webzzle lutilisateur
preacutecise les concepts qui linteacuteressent afin de contextualiser les mots-cleacutes choisis 101
Humains ou algorithmes
Certes le mode collaboratif ne remplacera pas totalement la recherche
algorithmique Les 2 sont compleacutementaires Lune permet dameacuteliorer la pertinence
de prendre en compte des concepts des contextes du sens et non plus simplement
des chaicircnes de caractegraveres Lautre vise lexhaustiviteacute en indexant des milliards de
pages Web Aujourdhui et en attendant le Web seacutemantique ainsi que la recherche
dite naturelle 102 toutes deux grandes quecirctes du monde de linternet seul lapport
de communauteacutes dhumains permet dinjecter un peu de sens agrave une recherche
Mais de son cocircteacute la recherche coopeacuterative comporte bien entendu des risques de
subjectiviteacute
Sur les moteurs de recherche la coopeacuteration peut prendre une autre forme via le
peacuterimeacutetrage des sites agrave interroger la construction dun moteur sur mesure en
quelque sorte Cest la verticalisation de la recherche
copy Digimind Digimind Services ndash White Paper |61
Le Web 20 pour la veille et recherche dinformation DIGIMIND
f La verticalisation par la personnalisation du peacuterimegravetre de recherche
Lune des grandes faiblesses des moteurs de recherche web agrave large eacutechelle (Google
Exalead Yahoo MSNhellip) est le bruit geacuteneacutereacute par certaines requecirctes Lorsque vous
tapez puma le moteur ne sait pas agrave priori si vous vous inteacuteressez aux vecirctements
de sport agrave lanimal ou aux heacutelicoptegraveres Or si vous ne reacutealisez des recherches que
dans laeacuterospatiale vous devrez souvent deacutesambiguiumlser par vos mots cleacutes ce qui
engendre une perte de temps voire de reacutesultats si vos requecirctes deviennent trop
restrictives
Certains moteurs ou meacutetamoteurs clusteacuterisent (cateacutegorisent) les reacutesultats en les
rassemblant par groupes (grappes) dans de petits dossiers Cette deacutemarche avait
eacuteteacute initieacutee par le moteur Northern Light en 1998 Ainsi tous les reacutesultats relatifs aux
chaussures Puma sont regroupeacutes dans une mecircme valise ceux eacutevoquant lanimal
dans une autre Mais cette solution nest pas complegravetement satisfaisante car elle
seffectue agrave posteriori une fois votre requecircte lanceacutee Le bruit nest pas eacutelimineacute mais
simplement circonscrit dans des sortes de cateacutegories poubelle
Pour beacuteneacuteficier dune deacutemarche agrave priori il convient dutiliser des outils de
recherche verticaux cest-agrave-dire speacutecialiseacutes dans un secteur dactiviteacute une fonction
un type dinformation ou de meacutedias
Face aux problegravemes de pertinence des moteurs geacuteneacuteralistes de plus en plus de
moteurs verticaux voient le jour Ainsi le seul domaine meacutedical a vu apparaicirctre ces
20 derniers mois les moteurs SearchMedica Medstory MedWorm ou encore Medgle 103
Mais si votre secteur de preacutedilection nest pas couvert par un moteur speacutecialiseacute
Cest lagrave quintervient un autre type de moteur collaboratif agrave qui lon peut indiquer le
peacuterimegravetre des sites sur lesquels effectuer la recherche Sur les moteurs classiques
les algorithmes peuvent placer en prioriteacute des reacutesultats sans inteacuterecirct pour vous A
force de navigation et de veille dans votre secteur vous connaissez certainement
10 20 100 sites que vous jugez incontournables et indispensables pour vos
recherches
2 solutions techniques existent
- les outils agrave peacuterimegravetre de recherche personnalisable (adaptable scope)
Ils utilisent les index des moteurs geacuteneacuteralistes (Yahoo ou Google) et restreignent le
scope de leur recherche aux pages des sites que vous avez choisis Ainsi des outils
comme Rollyo Swicki Yahoo Search Builder Google Custom Search 104 vous
demandent dindiquer une liste de sites sur lesquels vous allez limiter votre
recherche Lors dune requecircte les reacutesultats proviendront uniquement des sites de
votre choix Pratique
copy Digimind Digimind Services ndash White Paper |62
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Mais ces outils preacutesentent une limite de taille ils ne prennent en compte que les
pages indexeacutees par Google ou Yahoo Conseacutequence si la reacuteponse pertinente agrave
votre requecircte figure au sein dune page non indexeacutee par le moteur geacuteneacuteraliste vous
nobtenez pas de reacutesultats
De plus en ninterrogeant que lindex dun ou 2 moteurs vous manquerez
obligatoirement de nombreuses informations puisque le nombre de reacutesultats
communs entre les moteurs diminue constamment105
Les pages non indexeacutees par les moteurs geacuteneacuteralistes constituent une part du web
invisible106 et sont plus nombreuses que lon ne croit Ainsi si jinterroge le moteur
interne du site de la prestigieuse revue scientifique The Lancet 107 avec la requecircte
Diabetes jobtiens plus de 2800 reacutesultats Si jeffectue cette mecircme requecircte sur
Google en restreignant ma recherche au site The Lancet (via la syntaxe
sitehttpwwwthelancetcom) jobtienshellip1 reacutesultat Sur Yahoo Search guegravere
mieux 9 reacutesultats Pourquoi Parce que les technologies de ces moteurs ne
permettent pas dindexer correctement tous les sites
La constitution de bouquets de moteurs speacutecialiseacutes sur Digimind Finder
- les outils agrave moteurs personnalisables
La solution pour beacuteneacuteficier des reacutesultats de moteurs internes non indexeacutes par des
Google ou Yahoo est dutiliser un outil permettant dexploiter directement les
moteurs des sites qui vous inteacuteressent et ce sans avoir agrave passer par les index de
moteurs geacuteneacuteralistes Cest le cas du Finder108 mis au point par Digimind un
copy Digimind Digimind Services ndash White Paper |63
Le Web 20 pour la veille et recherche dinformation DIGIMIND
meacutetamoteur qui permet de plugger nimporte quel moteur de son choix et de
linterroger ensuite Il est donc alors simple de se constituer des bouquets de
moteurs speacutecialiseacutes dans votre secteur dactiviteacute De plus cet outil indexe en temps
reacuteel les reacutesultats et les documents retourneacutes par les moteurs interrogeacutes Cela
permet daffiner ensuite vos reacutesultats en interrogeant cet index au contenu
speacutecialiseacute via une recherche avanceacutee Avec le Finder cest donc lutilisateur final qui
constitue sa propre seacutelection de moteurs
copy Digimind Digimind Services ndash White Paper |64
Le Web 20 pour la veille et recherche dinformation DIGIMIND
g Lenrichissement de bases de donneacutees faccedilon Web20
Nous avons vu que les bookmarks sociaux permettaient de mutualiser les
ressources et pour certains autour de communauteacutes deacutedieacutees comme les
scientifiques Avant lapparition des applications Web 20 ont eacuteteacute constitueacutees de
nombreuses bases de donneacutees professionnelles Celles-ci jusquici noffraient pas
aux groupes dutilisateurs la possibiliteacute dinteragir de commenter et deacutechanger
Aussi de plus en plus de grandes bases de donneacutees se dotent dinterfaces
collaboratives et ergonomiques pour laisser plus de place agrave la contribution
PubMed
Cest le cas de lune des plus grandes bases du domaine meacutedical PubMed 109 Cette
immense base bibliographique a vu naicirctre deux initiatives110 pour ameacuteliorer son
interface de recherche
- Avec PubMed Interact la recherche integravegre de lAjax et permet de pondeacuterer via
des curseurs les critegraveres de sources dancienneteacute de nombre de reacutesultats de date
de publication de liens avec le mapping du MeSH (le theacutesaurus de la base) de
filtrage via des cateacutegories Vous pouvez ensuite annoter et attribuer une note de
pertinence agrave vos reacutesultats afficher labstract des articles ou leur texte complet
supprimer des reacutesultats ou encore afficher les articles lieacutes On retrouve donc
lessentiel des fonctionnaliteacutes de lactuel PubMed mais avec une convivialiteacute et
ergonomie Web 20 et donc une plus grande accessibiliteacute
-Hubmed est une autre interface alternative qui ajoute des fonctionnaliteacutes agrave PubMed
application de ses propres tags aux reacutesultats de recherche historique des recherches
clusteacuterisation des reacutesultats visualisation sous forme graphique creacuteation simplifieacutee
de fils RSS avec les mots de votre requecircte suggestion de termes connexes
visualisation de vos mots cleacutes dans larborescence Mesh Le tout est deacuteveloppeacute en
Ajax notamment permettant une navigation plus fluide et plus rapide Parmi toutes
ces fonctions la possibiliteacute de tagger les reacutesultats est tregraves novatrice on peut ainsi se
deacutepartir de la taxonomie de la base via sa propre folksonomie
copy Digimind Digimind Services ndash White Paper |65
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les nombreux reacuteglages de filtres sur linterface PubMed Interact
LUSPTO
LUSPTO 111 est la base des brevets ameacutericains (United States Patent and Trademark
Office)
Cette veacuteneacuterable institution a en projet une plateforme de brevets sociale agrave la
maniegravere dun Digg (cf les services dactualiteacutes collaboratives) les internautes
pourront commenter les brevets en ligne et les eacutevaluer via un systegraveme de notation
Les brevets les mieux noteacutes remonteront alors en haut de classement
copy Digimind Digimind Services ndash White Paper |66
Le Web 20 pour la veille et recherche dinformation DIGIMIND
h Conserver et exploiter lhistorique de vos recherches et navigations
Le chercheur dinformation sur le net perd souvent ses nerfs quand il ne retrouve
plus ce quil a deacutejagrave collecteacute quelque semaines auparavant ou lorsquil lui est
impossible de se souvenir quelle requecircte agrave geacuteneacutereacute ce fameux reacutesultat remarquable
cette veacuteritable peacutepitehellip
Google a reacutesolu partiellement ces problegravemes de meacutemoire Mais comme souvent
cela ne va pas sans certains sacrifices
Via son service Historique Web112 (ex Historique de recherche) vous pouvez apregraves
enregistrement gratuit
- meacutemoriser les requecirctes effectueacutees sur le moteur ainsi que les reacutesultats cliqueacutes
- enregistrer votre navigation sur les pages web
Il est alors possible deffectuer des requecirctes sur et agrave linteacuterieur des pages que vous
avez visiteacutees dans le passeacute (sur le texte les images les videacuteos)
Google affiche donc deacutesormais vos requecirctes la date et lheure de la recherche les
reacutesultats cliqueacutes mais aussi les reacutesultats de recherches qui nrsquoont pas geacuteneacutereacute de clics
Par ailleurs ce service va encore plus loin dans la personnalisation et lanalyse de
votre recherche
Avec la fonction Tendances saffichent vos requecirctes les plus courantes vos sites les
plus visiteacutes les reacutesultats que vous avez le plus cliqueacutes
Plus puissante la fonction Eleacutements inteacuteressants ougrave Google vous propose des
requecirctes et des pages web en relation avec vos habitudes de recherche113
En outre si vous activez cet historique Google lutilisera aussi pour agrave moyen
terme personnaliser vos recherches en fonction de vos centres dinteacuterecirct Le
moteur explique
Vos reacutesultats personnaliseacutes seront baseacutes sur vos recherches preacuteceacutedentes ainsi que les
reacutesultats de recherche et les titres agrave la une sur lesquels vous avez cliqueacute
Dans les premiers temps la diffeacuterence ne sera peut-ecirctre pas notable mais agrave mesure
que votre historique de recherches seacutetoffera les reacutesultats obtenus seront de plus en plus
personnaliseacutes
Dailleurs si vous reacutealisez de nombreuses recherches sur Google avec une
connexion agrave votre compte Google activeacutee vous devriez voir safficher de temps agrave
autre ce type de message Nouveau activez votre historique de recherche pour
personnaliser vos reacutesultats
copy Digimind Digimind Services ndash White Paper |67
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ces reacutesultats personnaliseacutes apprenant selon vos inteacuterecircts permettent de reacutepondre
en partie agrave la probleacutematique de deacutesambiguiumlsation lors de requecirctes sur des
homonymes Ce sont les exemples classiques de lavocat (fruit ou juriste ) de
jaguar (voiture ou animal ) ou de puma (articles de sports animal ou heacutelicoptegravere
)
Cocircteacute vie priveacutee tout votre surf part sur les serveurs de Google Aussi vous
pouvez (devez) mettre en pause lenregistrement de votre navigation lorsque cela
vous apparaicirct adeacutequat
Lhistorique de vos requecirctes et de vos reacutesultats sur Google
copy Digimind Digimind Services ndash White Paper |68
Le Web 20 pour la veille et recherche dinformation DIGIMIND
i Les mash-up
Les mash-up sont certainement les nouveauteacutes engendreacutees par les technologies
dites Web 20 les plus spectaculaires Mixage de plusieurs applications provenant
de plusieurs sites (souvent deux) ils permettent de creacuteer un service nouveau et ce
agrave partir de la mise en relation voire du croisement des donneacutees des applications
dorigines En franccedilais Wikipedia parle dapplications composites 114 Ainsi en
mixant la liste des socieacuteteacutes ougrave il fait bon travailler eacutetablie par le magazine Fortune et
une carte des USA issue de Google Maps on obtient une carte qui localise toutes
ces entreprises De mecircme si on meacutelange les donneacutees dun site de meacuteteacuteo agrave une
carte de France le reacutesultat est une carte des tempeacuteratures et des neacutebulositeacutes en
quasi temps reacuteel 115
Concregravetement comment cela fonctionne-t-il Chacune des applications
communique et eacutechange des informations via des API (voir glossaire) Ainsi Yahoo
Maps ou Google Maps ont ouvert leurs interfaces de programmation agrave tous les
deacuteveloppeurs
Les exemples sont tregraves nombreux car les Mashups ont rapidement connu un vif
succegraves aupregraves des deacuteveloppeurs et internautes avertis qui parviennent agrave maicirctriser le
code et les API Les Mashups de cartographie ne sont pas les seules possibiliteacutes mais
ce sont les plus freacutequents tant la geacuteolocalisation est attrayante pour les
professionnels comme pour linternaute novice Nous allons explorer quelques
mashups pour mieux comprendre leur inteacuterecirct
Les mashups cartographiques les plus courants mixent des cartes et des donneacutees
provenant de services sociaux comme Flickr le service de partage de photo de
Yahoo Inc Cest le cas de Tagmaps116 qui affiche en temps reacuteel sur une carte les tags
associeacutes aux photos de lieux mise en ligne sur Flickr Le Mashup Flickrvision 117 fait
encore plus simple il affiche les photos agrave lemplacement de la ville dorigine de
linternaute qui a posteacute limage lagrave aussi en temps reacuteel
Donneacutees statiques et temps reacuteel
Au-delagrave de certains mixages un peu gadget certains Mashups sont vraiment
inteacuteressants pour la surveillance de donneacutees ou la collecte dinformations En effet
on peut trouver deux grands types de visualisation celle de donneacutees statiques (une
liste dadresse dentreprises geacuteolocaliseacutees) et celle dinformations eacutevoluant en
temps reacuteel Cest le cas par exemple du Mashup SpaceCraft Tracking 118 qui permet
copy Digimind Digimind Services ndash White Paper |69
Le Web 20 pour la veille et recherche dinformation DIGIMIND
de visualiser la trajectoire sur le globe terrestre de la navette spatiale ou du
teacutelescope Hubble
Souvent le Mashup exploite des donneacutees de reacutepertoires douvrages de services
publics pour les rendre plus compreacutehensives attrayantes bref plus accessibles 119
- HealthMap rassemble des donneacutees de santeacute publique et des actualiteacutes issues de
plusieurs sources (Google News OMS European Centre for Disease Prevention and
Controlhellip) afin de reacutealiser une carte des maladies infectieuses dans le monde Cette
carte se met agrave jour au fur et agrave mesure de lactualisation des informations
Linteractiviteacute permet de zoomer sur un pays et de seacutelectionner des pathologies en
particulier
-BioDiesel Station Maps affiche sur une carte les stations services ameacutericaines qui
deacutelivrent des biocarburants
-Kartametro superpose le reacuteseau du meacutetro moscovite agrave la carte de la ville On y
visualise aussi les correspondances avec les bus
-Wikimapia mixe les informations relatives agrave des lieux de Wikipedia agrave une carte
Google Maps Reacutesultat la plupart des noms de villes sites ou monuments sont
cliquables et pointent vers les articles de lencyclopeacutedie
Le Mashup HealthMap ici des actualiteacutes sur les maladies infectieuses en Asie geacuteolocaliseacutees
copy Digimind Digimind Services ndash White Paper |70
Le Web 20 pour la veille et recherche dinformation DIGIMIND
-GlobaI Incident Maps affiche sur un planisphegravere les eacuteveacutenements lieacutes au terrorisme
ou les risques agrave partir des informations de sites speacutecialiseacutees mises agrave jour en continu
-Enfin un parfait exemple de visualisation et de surveillance deacuteveacutenements en temps
reacuteel DartMaps indique lemplacement des trains de banlieue de Dublin
Mais certains Mashup en minoriteacute certes nexploitent pas de donneacutees
cartographiques Cest le cas de Delexaorg 120 un outil qui mixe les bookmarks
sociaux de Delicious aux donneacutees statistiques dAlexa Delexa va en effet afficher les
tags de Delicious associeacutes aux statistiques de freacutequentation des 50 000 premiers
sites web US fournis par Alexa (agrave partir des donneacutees transmises par les barres
doutils Alexa installeacutees par les internautes) Un tel outil est inteacuteressant notamment
pour se familiariser avec les tags et Delicious mais surtout pour deacutecouvrir quels
sont les sites dinfluence et populaires dans un secteur On peut eacutegalement observer
la correacutelation ou non entre nombre de tags et donneacutees de freacutequentation Alexa
Cocircteacute moteur de recherche les mashups Molu et Gnosh fournissent des
meacutetamoteurs reacutealiseacutes agrave partir du mixage de dizaines doutils de recherche121
Des ressources
Comment trouver des mashups Comme pour de nombreuses informations sur le
web des annuaires speacutecialiseacutes 122 sont apparus Ils reacutepertorient aussi bien des API agrave
destination des deacuteveloppeurs que des mashups WebMashup auto-proclameacute Open
Directory for Mashups et Web 20 APIs en liste des centaines ProgrammableWeb
lun de sites de reacutefeacuterence dans le domaine en propose plus de 1800 sous la forme
dun reacutepertoire et eacutegalement dune matrice permettant de visualiser clairement le
croisement de deux applications ou plus Mashup Feed liste aussi des mixages
populaires
Des blogs sont eacutegalement centreacutes sur ces pratiques Google Maps Mania123 recense
de nombreux Mashups cartographiques
Ces Mashups sont un beau symbole de ce web nouvelle geacuteneacuteration on ne lit plus
seulement de linformation statique de maniegravere passive Deacutesormais on est agrave la fois
fournisseur et spectateur en temps reacuteel des contributions de communauteacutes Le tout
copy Digimind Digimind Services ndash White Paper |71
Le Web 20 pour la veille et recherche dinformation DIGIMIND
gracircce agrave des interfaces reacutealiseacutees par des deacuteveloppeurs agrave partir de code ouverts de
grandes socieacuteteacutes Le succegraves est notamment provoqueacute par la possibiliteacute de mixage
entre des donneacutees du monde reacuteel et des informations ou fichiers posteacutes sur le net
Les internautes peuvent donc maintenant se rassembler par centres dinteacuterecirct mais
eacutegalement par proximiteacute geacuteographique Je recherche un speacutecialiste de linformation
sur les biocarburants situeacutes agrave moins de 10 km de chez moi
Par ailleurs on peut imaginer agrave terme des applications meacutelangeant les donneacutees de
centaines de fichiers et bases de donneacutees On en est certes aux preacutemisses mais le
mashup Alkemis 124 en est deacutejagrave un bon exemple il affiche sur une carte de New
York des donneacutees provenant dA9 OpenSearch Delicious Flickr Google Maps et
Yahoo Traffic Reacutesultat la possibiliteacute de visualiser en une seule interface un eacutetat du
trafic routier via des cameacuteras de surveillance la meacuteteacuteo les actualiteacutes locales ou les
liens Delicious en rapport avec la villehellip
copy Digimind Digimind Services ndash White Paper |72
Le Web 20 pour la veille et recherche dinformation DIGIMIND
III Diffuser
Avec lapparition des applications collaboratives et des plateformes de blogs la
faciliteacute de publication sur le web sest accrue Tout individu mecircme sans
connaissances techniques peut publier et diffuser son propre contenu sur un blog
un wiki et via des fils RSS
a Les Blogs et le flux RSS
Il suffit de 5 minutes pour sinscrire agrave une plateforme de blogs et commencer agrave
eacutecrire Ces plateformes proposent des services de bases gratuits et des
fonctionnaliteacutes plus avanceacutees neacutecessitant un abonnement Ces services qui
permettent de creacuteer maintenir et heacuteberger votre blog sont nombreux Parmi les
prestataires de qualiteacute on peut citer Blogger (qui appartient agrave Google) TypePad et
Vox (de la socieacuteteacute SixApart) Overblog Viablog Haut et Fort ou BlogSpirit 125 Bien
dautres socieacuteteacutes proposent des services de creacuteation et dheacutebergement126 Des
comparatifs sont disponibles en ligne127
Nous lavons vu le format RSS permet de diffuser tregraves facilement le contenu de son
blog utilisant le XML (un html eacutepureacute) langage natif du blog chaque carnet web
comporte un fils RSS permettant aux visiteurs de sabonner agrave vote blog et de
recevoir instantaneacutement toute nouvelle publication actualiteacutes billets podcast ou
videacuteos Par ailleurs des services comme Feedburner128 permettent de rendre
compatibles vos flux RSS avec la majoriteacute des lecteurs RSS outils dont nous
reparlerons plus loin
La creacuteation de sites internet classiques sest elle aussi consideacuterablement simplifieacutee
un outil tel que Google Page Creator129 permet de creacuteer un site simple en 1 heure
Des sites plus sophistiqueacutes sont eacutegalement abordables sans avoir agrave connaicirctre une
ligne de programmation de html gracircce au perfectionnement des eacutediteurs dits
WYSIWYG ce que vous voyez quand vous construisez votre page est ce que vous
obtiendrez en ligne
Les outils Web 20 permettent agrave des speacutecialistes journalistes ou salarieacutes de diffuser
leur contenu Il y a encore 2 ans ils eacutetaient pour la plupart eacutecarteacutes de la publication
web faute de bagage technique
copy Digimind Digimind Services ndash White Paper |73
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Depuis le deacuteveloppement des blogs agrave partir de lautomne 2001 il est possible pour
tout internaute de diffuser sa propre information Au-delagrave des blogs dadolescents
et autres carnets intimes le web regorge de blogs agrave tendance professionnelle
corporate produits marketing experts politiques ressources humaines Cest
autant de sources potentielles quil faut exploiter afin de capter des sources
primaires de qualiteacute Le volume des blogs publieacutes et maintenus chaque jour est lui
aussi en constante augmentation
Le White Paper Blogs et RSS des outils pour la veille strateacutegique deacuteveloppe les
aspects inteacuteressants des blogs pour le professionnel de linformation130
b Les Wikis
Le wiki est finalement diffeacuterent du blog de par sa nature et son utilisation Selon
Wikipedia le Wiki est un site Web dynamique permettant agrave tout individu den
modifier les pages agrave volonteacute Il permet de communiquer et diffuser des informations
rapidement de structurer cette information pour permettre dy naviguer
commodeacutement (Wiki vient du terme hawaiien wiki wiki =rapide ou informel)
Lagrave ougrave le blog sera adapteacute agrave la diffusion dactualiteacute et de contenu se renouvelant
freacutequemment le wiki sera davantage deacutedieacute agrave du texte plus statique mais neacutecessitant
ou pouvant senrichir de la collaboration de plusieurs personnes Ainsi les articles
dune encyclopeacutedie ou les fiches correspondants aux diffeacuterentes phases dun projet
impliquant de nombreux collaborateurs pourront ecirctre reacutealiseacutees sous forme de
Wiki
Sur un blog laffichage du contenu est anteacute-chronologique (le plus reacutecent en haut)
sur un wiki il est structureacute en rubriques larchitecture comme le contenu pouvant
ecirctre modifieacutes agrave tout moment par les participants Ceux-ci peuvent beacuteneacuteficier de
droits daccegraves et de modification hieacuterarchiseacutes
Les versions anteacuterieures ainsi que les modifications sont accessibles via une rubrique
Historique Sur un blog le visiteur peut collaborer mais uniquement via ses
commentaires Sur un wiki tout collaborateur autoriseacute peut modifier le texte
comme le titre et lorganisation des rubriques
Par ailleurs la prise en main dun wiki et de ses syntaxes denrichissement et
modification demande un peu de pratique et nest pas aussi simple que le
maniement dun blog Le wiki est un des outils ideacuteaux pour la gestion de projet
Certaines entreprises les utilisent en tant que tel (parfois en parallegravele avec les blogs)
pour eacuteviter des eacutechanges des recherches et un archivage via les mails fastidieux
copy Digimind Digimind Services ndash White Paper |74
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Geacutereacute via des droits daccegraves gradueacutes il peut alors se reacuteveacuteler comme un outil tregraves
simple agrave manier et agrave sapproprier Ces wikis seront eacutevidemment reacuteserveacutes agrave
lentreprise en accegraves priveacute
Exemples de wikis publics
gt Wikipedia131
Le wiki le plus connu est Wikipedia lencyclopeacutedie collaborative gratuite dont le
contenu est creacuteeacute et maintenu par des milliers dinternautes beacuteneacutevoles Chacun est
libre de creacuteer un article modifier ceux des autres ou les commenter En mai 2007
lencyclopeacutedie proposait plus de 7 millions darticles dans 192 langues et dialectes
dont plus de 500 000 en franccedilais Wikipedia jouit dune populariteacute et dun succegraves
tregraves important Google indexe de nombreux articles de Wikipedia agrave tel point quil
est rare deffectuer une recherche sur le moteur sans voir safficher une deacutefinition
issue de lencyclopeacutedie Selon la socieacuteteacute de mesure daudience Comscore en janvier
2007 Wikipedia eacutetait le 9egraveme site US le plus visiteacute (derriegravere les sites Yahoo
premiers puis les sites Time Warner Microsoft Google eBay Fox Interactive
Amazon et Ask) 6 groupes eacuteditant un moteur geacuteneacuteraliste (Google Ask Microsoft
Yahoo Amazon et AOL) occupent le top10 US Mais cest la premiegravere fois quun
site collaboratif truste les premiegraveres places des sites les plus visiteacutes
Wikipedia comme tout service leader est tregraves critiqueacute Notamment sur la
possibiliteacute pour tout un chacun de modifier et de creacuteer des articles pouvant
entraicircner des risques de diffamation ou de vandalisation 132 Mecircme si ces risques
sont reacuteels nous le verrons dans la partie consacreacutee aux limites du Web 20 il ne
faut pas pour autant se focaliser sur ces problegravemes
Par ailleurs on a souvent mis en cause la qualiteacute des articles du contenu eacutemanant
dinternautes pas forceacutement qualifieacutes ou experts et donc par nature douteux Or
une eacutetude commandeacutee par la Revue Nature agrave remis en cause ce type de ressenti
des experts ont compareacute 42 documents publieacutes sur Wikipedia et sur la ceacutelegravebre
Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche133
Seulement 8 erreurs seacuterieuses comme des mauvaises interpreacutetations de concepts
ont eacuteteacute repeacutereacutees dans les articles analyseacutes 4 pour chaque encyclopeacutedie Des
erreurs factuelles omissions ou fausses descriptions ont eacutegalement eacuteteacute deacutetecteacutees
162 dans Wikipedia et 123 dans lEncyclopaedia Britannica
Le succegraves et limportance de Wikipedia nont pas eacutechappeacute aux moteurs de
recherche qui sont plusieurs agrave secirctre speacutecialiseacutes dans la recherche sur lencyclopeacutedie
Ainsi WikiSeek 134 est un moteur lanceacute deacutebut 2007 qui recherche sur le contenu de
Wikipedia Il indexe le contenu en crawlant les pages en profondeur et aspire
eacutegalement le contenu des liens preacutesents sur les pages de lencyclopeacutedie
copy Digimind Digimind Services ndash White Paper |75
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Plus eacutelaboreacute le moteur franccedilais Exalead 135 enrichit consideacuterablement la recherche
dans lencyclopeacutedie en ligne Cette fonctionnaliteacute est accessible en cliquant sur
longlet Wikipedia Il est eacutevidemment possible de rechercher des articles par mots
cleacutes mais aussi daffiner par langue via le nuage de tags dynamique ( les eacutetiquettes
correspondent agrave des emplacements geacuteographiques personnes ceacutelegravebres noms
drsquoorganisations termes lieacutes agrave votre requecircte ou cateacutegories de Wikipedia)
WikiMindmap 136 recherche sur Wikipedia et affiche les reacutesultats sous forme de
MindMap (cartes heuristiques) Il est alors possible de naviguer dans larborescence
des termes
WikiMindMap
gt Citizendium 137 Lanceacute fin 2006 Citizendium est une initiative de Larry Sanger co-fondateur de
Wikipedia avec Jimmy Wales Citizendium est eacutegalement une encyclopeacutedie Mais
jugeant la communauteacute Wikipedia senseacutee srsquoauto-reacuteguler dysfonctionnelle Larry
Singer integravegre dans Citizendium des proceacutedures de seacutelection des articles par des
experts et refuse aux contributeurs la possibiliteacute de lrsquoanonymat misant ainsi sur la
responsabilisation Le collegravege dexperts a le dernier mot concernant la veacuterification
des articles le but eacutetant dobtenir une encyclopeacutedie contenant le moins derreurs
possible Citizendium est structureacutee en grandes cateacutegories acadeacutemiques
correspondant agrave des groupes de travail Sciences naturelles Sciences Humaines
Arts Sciences Humaines Divertissement Arts appliqueacutes et Sciences
copy Digimind Digimind Services ndash White Paper |76
Le Web 20 pour la veille et recherche dinformation DIGIMIND
gt Alacrawiki 138
AlacraWiki est un guide deacutedieacute aux socieacuteteacutes du secteur de linformation eacutediteurs et
bases de donneacutees La rubrique Alacra Industry Spotlights est particuliegraverement
remarquable elle fournit des analyses et commentaires sur les sites dinteacuterecirct pour
une trentaine de secteurs industriels Le wiki offre des informations sur les
agreacutegateurs de contenu les bases de donneacutees et les meilleurs blogs deacutedieacutes au
secteur de linformation on-line Alacra propose aussi un blog et un fils RSS
Alacra Wiki
gt Les fils RSS 139
Sur cette page de wiki vous trouverez agrave peu pregraves tout sur le RSS
La norme comment utiliser les fils RSS des articles une seacutelection dagreacutegateurs
mixer des fils RSS entre eux mesurer lactiviteacute des fils RSS creacuteer un fil RSS
gtWikidweb 140
Wikidweb est un Wiki qui propose un reacutepertoire de sites web (et non de wikis)
Aussi vous pouvez y participer selon les fonctionnaliteacutes courantes du format wiki
vous avez ainsi la possibiliteacute dy ajouter vos propres sites mais eacutegalement de
modifier les entreacutees des autres internautes (urls texte) ou de les commenter
copy Digimind Digimind Services ndash White Paper |77
Le Web 20 pour la veille et recherche dinformation DIGIMIND
IV Surveiller
Nous lavons vu dans la partie Recherche de blogs et de flux RSS les flux RSS sont
preacutesents sur de nombreux formats du net et vont permettre de surveiller les
nouveauteacutes apparaissant sur les blogs les sites corporate les sites de presse dans
les reacutesultats de moteurs de recherche dactualiteacutes de blogs web dans les
newsgroups sur certains forums web sur certaines listes de diffusion les
bookmarks sociaux les sites de partage de photos et de videacuteoshellipbref sur de tregraves
nombreux sites classiques et ressources collaboratives de type 20
Ces flux RSS peuvent ecirctre inteacutegreacutes agrave votre process de veille en deux clics via des
outils simples gratuits ou payants mais plus puissants
a La deacutetection du flux RSS
Pour pouvoir mettre en surveillance le flux RSS (RSS Feed en anglais) il faut dabord
le trouver Or il nest pas toujours aiseacute de mettre la main sur ces petits logos
oranges ou les liens RSS Abonnez-vous Syndiquez ce flux qui pointent vers les
flux RSS parfois cacheacutes dans les meacuteandres des pages web
Des icocircnes signalant la preacutesence de flux RSS
Certains navigateurs permettent de deacutetecter automatiquement les flux lorsquils
sont preacutesents sur une page web Une icocircne vous avertira alors et dans la plupart
des cas affichera ladresse du ou des flux disponibles sur la page Plusieurs formats
de flux peuvent coexister les diffeacuterentes versions du RSS (090 091 092 10 20)
et le format ATOM concurrent mais offrant les mecircmes fonctionnaliteacutes
Internet Explorer 7 Opera Firefox permettent de deacutetecter les flux Cest aussi le cas
de Maxthon une puissante interface de navigation qui vient se greffer sur
larchitecture dInternet Explorer 141
copy Digimind Digimind Services ndash White Paper |78
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b La mise en surveillance
Quelque soit laspect de la page qui contient votre flux RSS (xml rdf interface
Feedburner) il convient de copier et coller ladresse (url) dans loutil qui va vous
servir agrave lire ce flux et agrave ecirctre alerteacute degraves lors quune nouveauteacute apparaicirct
4 grands types doutils peuvent ecirctre utiliseacutes (du plus simple au plus sophistiqueacute)
- Les navigateurs web
Les navigateurs citeacutes preacuteceacutedemment outre la deacutetection du flux RSS permettent de
sy abonner et de les lire Les flux sintegravegrent alors dans un menu lateacuteral ou dans la
page principale Cest simple mais deacutepourvu de fonctions avanceacutees de tri ou
dorganisation
- Les lecteurs (ou agreacutegateurs) de flux RSS
Ce sont les outils deacutedieacutes aux fils RSS Comme de nombreuses applications ces
lecteurs sont soit disponibles en ligne soit agrave installer localement sur votre PC
- Exemples de lecteurs RSS en ligne Bloglines Pluck Newsgator
- Exemples de lecteurs RSS installeacutes RSS Reader Amphetadesk Newsgator (sintegravegre
agrave Outlook) FeedDemon
Le lecteur Bloglines exploite de maniegravere astucieuse la logique communautaire
lorsque vous ecirctes abonneacute agrave un flux RSS vous pouvez visualiser les autres abonneacutes
(ceux qui ont accepteacute de rendre leur abonnement public) Un clic sur leur nom
affiche tous les fils RSS auxquels ils ont souscrits un moyen rapide de deacutecouvrir
dautres ressources pertinentes collecteacutees par des internautes proches de vos
centres dinteacuterecirct
Les lecteurs RSS sont tregraves nombreux Pour mieux les distinguer certains blogs ou
sites proposent des comparatifs142
copy Digimind Digimind Services ndash White Paper |79
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La communauteacute sur Bloglines les abonneacutes au flux RSS du blog Voip Weblog
- Les pages personnalisables
Ce sont des pages web geacuteneacuteralement organiseacutees en onglets et boicirctes permettant
dorganiser et de ranger ses flux par cateacutegories et ce dans un mecircme espace Ces
services sont ergonomiques et ideacuteaux pour lire dun coup doeil le maximum de flux
Les plus connus sont NetVibes PageFlakes ou Webwag
Outre la lecture de flux RSS ces pages offrent la possibiliteacute dinteacutegrer des services
de meacuteteacuteo mail bloc-notes et des flux provenant de service sociaux comme les
bookmarks ou les reacuteseaux damis
Certains blogs fournissent des listes et comparatifs de ces services143
- Les progiciels de veille inteacutegreacutes
Face agrave labondance des flux RSS et blogs des applications de veille inteacutegreacutee comme
Digimind Evolution 144 donnent la possibiliteacute de filtrer les RSS via lapplication de
requecirctes diffeacuterentes sur chaque fils RSS
On peut ainsi seacutelectionner les informations agrave remonter via des requecircte simples ou
plus complexes (booleacuteens parenthegraveses troncatures et opeacuterateurs de proximiteacute) agrave
longueur illimiteacutee En outre il est possible de surveiller jusquagrave 10 000 flux RSS
quotidiennement
Les boutons inteacutegreacutes
Certains sites vont vous simplifier la tacircche ils affichent sur leurs pages agrave coteacute de
leurs flux des boutons qui permettent dajouter directement le flux agrave votre lecteur
copy Digimind Digimind Services ndash White Paper |80
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ainsi le service dactualiteacutes Wikio ou le moteur Ask Blogs amp Flux proposent tous
deux des boutons vers Bloglines MyYahoo Google Reader Newsgator et Ask Blog
Les fichiers OPML
LOPML (Outline Processor Markup Language) est un format deacuteveloppeacute en XML qui
permet leacutechange dinformations structureacutees entre applications fonctionnant sur des
OS et environnement diffeacuterents Exemple les abonnements dun internaute agrave un
ensemble de flux RSS entre un navigateur Firefox et Internet Explorer de MacOS agrave
Windows XP
Des agreacutegateurs RSS comme Bloglines NewsGator ou Rojo offrent la possibiliteacute
dexporter lensemble de vos flux RSS favoris ou ceux dautres abonneacutes au format
OPML pour les importer ensuite dans votre agreacutegateur
Share your OPML145 est comme son nom lindique un portail qui vous permet de
partager vos flux RSS au format OPML Ce service liste des centaines de fichiers
OPML
c Pourquoi une veille via le RSS
Faire une veille via les fils RSS preacutesente des inteacuterecircts notables
- Lhyper-segmentation le choix des fils RSS rend possible une seacutelection fine de
linformation Ainsi sur le site du Figaro on peut choisir lactualiteacute internationale
nationale les sciences et meacutedecine eacutevitant ainsi decirctre submergeacute par linformation
superflue Sur La Tribune on peut seacutelectionner un flux par socieacuteteacute
Certains blogs proposent mecircme des flux RSS permettant aux choix de surveiller les
commentaires ou uniquement les billets
- Un gain de temps inutile de se connecter au site au blog ou au moteur de
recherche pour visualiser ses nouveauteacutes
- Lanonymat labonnement agrave un flux RSS contrairement agrave une newsletter ou agrave une
liste de diffusion est anonyme
- La consultation aiseacutee vos fils RSS via une lecture sur un agreacutegateur en ligne sont
accessibles de nimporte quel PC connecteacute agrave linternet ougrave que vous soyez
copy Digimind Digimind Services ndash White Paper |81
Le Web 2
copy Digimin
0 pour la veille et recherche dinformation DIGIMIND
d Digimind Services ndash White Paper
V Carte des outils et ressources Web 20
gt Page suivante
|82
wwwdigimindcom Digimind Services ndash White Paper|83
Carte des outils et ressources Web 20 - DIGIMIND Services 2007
Le Web 20 pour la veille et recherche dinformation DIGIMIND
EXEMPLE DUNE RECHERCHE ET VEILLE VIA LE WEB 20
Cas drsquoeacutecole Nous avons agrave mener une recherche et une veille sur le
deacuteveloppement des smartphones ou teacuteleacutephones multimeacutedias haut de gamme Des
sites de type 20 pourront se reacuteveacuteler compleacutementaires de sites classiques (sites
drsquoentreprises portails associations professionnelleshellip) pour deacutetecter les tendances
et sujets eacutemergents
Une premiegravere recherche via lrsquoencyclopeacutedie Wikipedia permettra drsquoobtenir une
premiegravere deacutefinition du sujet et drsquoidentifier les principaux mots cleacutes ainsi que des
liens vers des sites pertinents
Etape suivante nous pourrons eacutelargir notre recherche en identifiant des sites
similaires aux sites trouveacutes preacuteceacutedemment via les suggestions fournies par des
moteurs collaboratifs tels que Yoono ou Similicious
Une recherche sur le tag Smartphone dans des sites de social bookmarking
comme Delicious nous permettra eacutegalement drsquoidentifier les pages plus ou moins
populaires taggeacutees par les contributeurs du site ainsi que drsquoautres tags en relation
avec notre sujet
Explorons ensuite les avis drsquoexperts plus ou moins autoriseacutes que lrsquoon trouvera dans
les meacuteandres de la blogosphegravere gracircce agrave des moteurs de blogs comme Technorati
Blogpulse ou Google Blog Search
La recherche pourra srsquoeffectuer via les tags ou le texte inteacutegral des billets On
pourra ensuite parcourir les blogrolls des auteurs les plus pertinents afin drsquoidentifier
drsquoautres sources
La lecture des blogs fournira non seulement des avis de speacutecialistes ou journalistes
mais aussi des avis plus ou moins critiques de consommateurs ou utilisateurs de
smartphoneshellip
Il conviendra toutefois de rester vigilant quant agrave lrsquoeffet pot de miel de certains
blogs ougrave les contributions des internautes se reacutevegravelent ecirctre de simples messages
publicitaires deacuteguiseacutes (voir agrave ce sujet la mise en garde du site UFC Que choisir146)
Pour recueillir les derniegraveres informations drsquoactualiteacute on pourra utiliser un
agreacutegateur tel que Wikio ou Digg et creacuteer un flux RSS agrave partir drsquoune requecircte sur les
copy Digimind Digimind Services ndash White Paper |84
Le Web 20 pour la veille et recherche dinformation DIGIMIND
tags preacuteceacutedemment identifieacutes Wikio propose des raccourcis pour inteacutegrer ce flux
au sein de plusieurs lecteurs RSS du marcheacute (Netvibes Newsgator Google Reader
etc)
Les reacuteseaux sociaux professionnels permettront eacutegalement drsquoidentifier des acteurs
importants du domaine dans les sphegraveres universitaires ou de lrsquoentreprise
La communauteacute 20 srsquoexprimera eacutegalement sur les grands portails consacreacutes aux
nouvelles technologies Crsquoest le cas par exemple du portail ZDNet qui permet aux
utilisateurs de commenter les articles ou de les ajouter directement agrave leur profil
Delicioushellip Les commentaires ou les trackbacks pointant sur un article pourront
constituer un preacutecieux compleacutement drsquoinformations
Afin de mener une veille reacuteguliegravere sur le sujet on syndiquera les flux RSS provenant
des diffeacuterents sites ou blogs identifieacutes Pourquoi ne pas eacutegalement creacuteer agrave partir de
ce bouquet de sources personnaliseacutees un moteur sur mesure conccedilu gracircce agrave Rollyo
ou Yahoo Search Builder
copy Digimind Digimind Services ndash White Paper |85
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les limites du Web 20
LA PARTICIPATION
I Une participation heacuteteacuterogegravene
Nous lavons deacutejagrave eacutevoqueacute tout le monde ne participe pas de la mecircme maniegravere sur
les applications du Web 20
Une minoriteacute participativehellip
Bill Tancer de la socieacuteteacute de mesure daudience Hitwise reacutevegravele dans une eacutetude147
que sur les sites type Web 20 les internautes regardent mais participent peu
Seulement 016 des visiteurs du site YouTube viennent y partager leurs videacuteos
Les 9984 restant ne font que regarder Idem pour le site de partage de photos
de Yahoo Flickr seulement 02 des visites conduisent agrave la publication de photos
Wikipedia est lexception sur lencyclopeacutedie collaborative gratuite 46 des
visites correspondent agrave une modification des articles
Sur ces sites on est donc encore loin de la regravegle de la 11089 eacutedicteacutee par Charles
Arthur dans The Guardian148 Il estime que sur le net sur un groupe de 100
personnes si une creacutee du contenu 10 vont interagir (commentaires
ameacuteliorations) et les 89 restant ne feront que le lire et regarder Le journaliste
lillustre via des exemples quantifieacutes avec YouTube Wikipedia ou Yahoo Groups
Most Web 20 Users Are Really Just Couch Potatoes Bruce Nussbaum compare
mecircme les internautes Web 20 aux spectateurs de TV passifs et affaleacutes dans leurs
canapeacutes149
Mais parallegravelement les sites de type Web 20 ont vu leur audience grimper
de668 en 2 ans reacutevegravele leacutetude Hitwise Cela repreacutesente 12 du trafic web aux
USA contre 2 il y a seulement 2 ans
Les sites de partage de photos sont parmi les plus populaires Flickr bien sucircr mais
aussi PhotoBucket qui repreacutesente agrave lui seul 41 du trafic des sites de photos en
ligne
copy Digimind Digimind Services ndash White Paper |86
Le Web 20 pour la veille et recherche dinformation DIGIMIND
hellipdautant plus que la forme de participation se complexifie
Dapregraves le cabinet Forrester les internautes sont nombreux sur les actions agrave faible
niveau dexigence (lire enregistrer un signet commenter) mais beaucoup moins sur
des participations plus actives (eacutecrire collaborer) 150
Wikipedia un faux modegravele collaboratif
On cite souvent lencyclopeacutedie Wikipedia en exemple cest lun des emblegravemes les
plus forts et les plus lus du Web 20 Son mode de fonctionnement est
caracteacuteristique voire symptomatique du web collaboratif Mais le process de
Wikipedia serait finalement tregraves classique avec une hieacuterarchie de contributeurs
sorte de cadres disposant de nombreux droits eacutecrivant la majoriteacute des articles
Cest lanalyse de Lionel Barbe du CNRS151 Il explique que si le principe de liberteacute
de publication sur Wikipedia reste valable il est de moins en moins commun car
la plupart des entreacutees basiques ne precirctant pas agrave discussion ont deacutejagrave eacuteteacute effectueacutees
Lrsquoeacutetude des laquo logs raquo historiques montre que la creacuteation de nouvelles entreacutees qui
correspondent agrave de nouvelles pages articles dans la Wikipedia Francophone ne
concerne qursquoenviron 3 agrave 4 des opeacuterations Par comparaison cette proportion tombe
agrave 2 pour la version anglaise de Wikipedia qui contient plus de 1 million drsquoarticles A
lrsquoinverse la proportion monte entre 8 et 10 pour des Wikipedias ayant moins de
100 000 articles comme la Wikipedia en Lituanien et bien drsquoautres
Selon lui on assiste agrave un effet de professionnalisation de lencyclopeacutedie [hellip] les
plus gros contributeurs que nous consideacutererons comme eacutetant les 5 des individus
eacuteditant le plus drsquoarticles eacuteditent entre 85 et 95 du contenu total de lrsquoencyclopeacutedie
Au fur et agrave mesure ces gros contributeurs acquiegraverent des privilegraveges comme le statut
drsquoadministrateur qui leur permettent non seulement de participer mais aussi de
surveiller et le cas eacutecheacuteant censurer le contenu eacutediteacute par les autres contributeurs et de
participer aux grandes lignes de lrsquoorganisation de Wikipedia
Cette analyse a toutefois eacuteteacute battue en bregraveche par Aaron Swartz dans une petite
eacutetude 152 En mesurant non pas le nombre drsquointerventions de chaque contributeur
mais la quantiteacute de texte produit par chacun la reacutealiteacute est diffeacuterente les
contributeurs occasionnels eacutecriraient des textes longs en peu dinterventions tandis
que les eacutediteurs actifs reacutealiseraient un travail tenant davantage de la maintenance
(correction veacuterification suppression) mais sans apporter beaucoup de texte
copy Digimind Digimind Services ndash White Paper |87
Le Web 20 pour la veille et recherche dinformation DIGIMIND
II Une participation damateurs
Tout internaute peut-il simproviser journaliste expert commentateurhellip
Michel Fingerhut 153 voit dans le succegraves dune encyclopeacutedie comme Wikipedia une
manifestation du web comme heacutegeacutemonie de lrsquoamateurisme et comme encouragement
agrave lrsquoextreacutemisme ideacuteologique et au communautarisme
Les contenus creacuteeacutes et diffuseacutes sont-ils de qualiteacute Le Web 20 devient une
plateforme qui stimule la creacuteativiteacute et la production de contenu par cela mecircme
qursquoelle en permet la diffusion (avec indice de notorieacuteteacute) On assiste agrave une libeacuteration
de talents qui peuvent enfin se reacuteveacuteler parallegravelement agrave des productions
caracteacuteriseacutees par un certain amateurisme et lrsquoabsence de veacuteritable ambition
creacuteatrice Car comme sur lensemble de linternet sur ce Web 20 le pire cocirctoie le
meilleur
Par ailleurs toujours en prenant lexemple de Wikipedia un certain nombre de
pheacutenomegravenes se reacutevegravelent tout de mecircme preacuteoccupants
Si leacutetude reacutealiseacutee pour le magazine Nature reacutevegravele que la qualiteacute des articles de
lencyclopeacutedie est presque au niveau de celle de lEncyclopaedia Britannica certains
articles de Wikipedia relegravevent de la deacutesinformation ou de la propagande
- larticle Droits de lHomme en Iran154 a ainsi eacuteteacute tregraves controverseacute en effet cet
article tregraves long de plus de 20 pages se preacutesente davantage comme une apologie du
reacutegime iranien quune analyse argumenteacutee des droits de lhomme dans ce pays Or
certainement au nom du principe de neutraliteacute qui reacutegit Wikipedia cet article
tendancieux a eacuteteacute classeacute comme article de qualiteacute 155
- le cas Seigenthaler 156 en mai 2005 un contributeur publie anonymement sur
Wikpedia un article sur John Seigenthaler Sr un eacutecrivain ceacutelegravebre aux USA Or ce
billet mentionne que leacutecrivain a eacuteteacute directement impliqueacute dans les assassinats de
John et Bob Kennedy en preacutecisant toutefois que rien na jamais eacuteteacute prouveacute Cette
information est tout simplement fausse Mais larticle nest deacutecouvert (par un ami de
John Seigenthaler) et corrigeacute que 4 mois plus tard mettant agrave mal la creacutedibiliteacute de
lencyclopeacutedie A la suite de cette affaire largement relayeacutee par les meacutedias
ameacutericains le fondateur de Wikipedia a rigidifieacute les regravegles de publication concernant
les tout nouveaux contributeurs
Certes sur les milliers darticles mis en ligne par Wikipedia ces dysfonctionnements
restent heureusement minoritaires mais ils reacutevegravelent tout de mecircme certaines limites
du tout collaboratif et la neacutecessiteacute de regravegles de publication emprunteacutees aux meacutedias
classiques
copy Digimind Digimind Services ndash White Paper |88
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Lagreacutegation de petites choses faciles
Elles ont tendance agrave dominer le contenu du Web 20 La faciliteacute de publication le
rythme des blogs qursquoil convient drsquoalimenter freacutequemment peut entrer en conflit
avec le temps de la recherche et de la reacuteflexion Souvent les thegravemes traiteacutes ne
peuvent degraves lors ecirctre que des sujets du quotidien des opinions non reacutefleacutechies non
argumenteacuteeshellipOn peut donc craindre agrave linstar du mode de diffusion sur dautres
meacutedias quinteacutegreacute agrave un reacuteseau social noteacute eacutevalueacute agrave la recherche de notorieacuteteacute et de
visibiliteacute le creacuteateur de contenu ait tout inteacuterecirct agrave aller dans le sens de son audience
produire du divertissant plus agrave mecircme de lui garantir un succegraves immeacutediat
Par ailleurs des opinions peuvent-elles se transformer en jugement pertinent par
lrsquoeffet de leur agreacutegation Lrsquoagreacutegation drsquoune quantiteacute importante drsquoavis peut elle
vraiment deacutepasser lrsquoimpreacutecision des avis pris indeacutependamment Peut-on sans une
harmonisation des critegraveres drsquoappreacuteciation atteindre un jugement collectif fiable Les
tendances qui ressortent risquent en effet de se limiter souvent au reflet de
lrsquoopinion majoritaire
Mais leacutevocation de ces limites ne doit pas occulter toutes les contributions matures
produites par des internautes soucieux dapporter un contenu veacuteritablement
constructif Les billets et les commentaires de nombres de blogs politiques franccedilais
en 2007 en sont une parfaite illustration
LE WEB 10 RESTE NECESSAIRE
Le mail reacutesiste
Nous lavons vu au cours de la description des applications pour la veille les services
Web 20 ne sont pas suffisants en soit pour la recherche dinformation De plus
bien que ses possibiliteacutes soient tregraves puissantes lutilisation du Web 20 reste encore
marginale agrave leacutechelle de tous les internautes Une eacutetude du cabinet Pew Internet 157
montre que lactiviteacute internet dominante sur une journeacutee type dun ameacutericain reste
tout simplement le mail 53 des internautes lutilisent Ils sont 38 agrave utiliser un
moteur de recherche Par contre ils ne sont que 8 agrave creacuteer des blogs et 26 agrave
partager des photos et videacuteos cette collaboration multimeacutedia eacutetant de loin lactiviteacute
la plus courante du Web 2
copy Digimind Digimind Services ndash White Paper |89
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une enquecircte en ligne de lUniversiteacute dOxford reacutealiseacutee aupregraves de 1469 personnes
(une majoriteacute deacutetudiants) fin 2006 deacutetaille les usages du Web 20 158 Elle reacutevegravele elle
aussi que les applications de ce web nouvelle geacuteneacuteration sont encore peu connues
et peu utiliseacutees La majoriteacute des reacutepondants na jamais employeacute ou jamais entendu
parleacute des fils RSS ou des applications de Social Bookmarking comme Delicious
Aussi linfluence grandissante du Web 20 ne doit pas masquer les usages
traditionnels du web qui restent majoritaires
Une population souvent isoleacutee et non repreacutesentative
Lage
Si de nombreuses applications sociales apportent un reacuteel progregraves il faut tempeacuterer
la nature de certains contenus issus du mode collaboratif celui-ci nest en effet pas
repreacutesentatif des internautes puisque le public du Web 20 est une population plutocirct
jeune
Ainsi leacutetude Pew Internet reacutevegravele que laudience de Wikipedia aux USA eacutetait en aoucirct
2006 agrave 47 situeacutee dans la tranche des 18-34 ans Les plus de 45 repreacutesentaient
28 Sur le site dEncarta lencyclopeacutedie de Microsoft plus traditionnelle (Web 10)
la part des plus de 45 ans atteint 33
Des communauteacutes isoleacutees structureacutees en icircles Les communauteacutes actuelles du Web 20 sont souvent renfermeacutees sur elles-mecircmes
les statistiques sur les liens pointant vers les blogs et sur les liens preacutesents dans les
billets reacutevegravelent que les blogueurs se lient et se lisent beaucoup entre eux
Lrsquointernaute Web 20 aurait donc tendance agrave senfermer sur lui-mecircme et autour
dindividus feacutedeacutereacutes en communauteacutes focaliseacutes sur les mecircmes centres drsquointeacuterecirct que
lui
Par ailleurs lhyper segmentation et le ciblage des nouvelles rendu possible par le
flux RSS notamment peut conduire agrave favoriser ces microcosmes communautaires
Parcourir un journal papier peut favoriser davantage louverture la prise de recul et
la mise en perspective des diffeacuterentes informations que la lecture de flux aux
theacutematiques tregraves speacutecialiseacutees
Les diffeacuterentes communauteacutes par reacuteflexe et de par la nature des applications Web
20 qui se dupliquent mais ne se connectent pas ont tendance agrave peu communiquer
entre elles Ainsi les liens entre reacuteseaux sociaux sont rares Peu de personnes
copy Digimind Digimind Services ndash White Paper |90
Le Web 20 pour la veille et recherche dinformation DIGIMIND
enregistreacutes sur LinkedIn iront eacutegalement sinscrire sur Viadeo ou FaceBook
Latomisation des donneacutees sur des dizaines dapplications reste eacutegalement un vrai
problegraveme
Des domaines mal couverts
Certaines theacutematiques vont ecirctre surrepreacutesenteacutees au deacutetriment dautres au
traitement beaucoup plus confidentiel car boudeacutees par les internautes producteurs
volontaires dinformation Les ingeacutenieurs techniciens et jeunes eacutetant fortement
repreacutesenteacutes parmi les blogueurs les theacutematiques high tech sont tregraves largement
couvertes par les blogs par exemple dans le domaine de la RFID (Identification par
Radio Freacutequence) on compte plus de 100 blogs idem pour la VoIP (Voix sur IP) A
linverse si vous travaillez dans le secteur des machines outils ou de la plasturgie il
vous sera difficile de trouver du contenu sur la blogosphegravere
Tous les secteurs ne sont donc pas eacutegaux en volume sur le net et davantage encore
sur la blogosphegravere et sur les autres applications collaboratives ougrave tout internaute
peut publier son propre contenu et ougrave certaines tranches dacircges et cateacutegories
professionnelles ne sont pas bien repreacutesenteacutees
copy Digimind Digimind Services ndash White Paper |91
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Conclusion
Le Web 20 ce mot qui geacutenegravere eacutenormeacutement de buzz deacutecrits et de blogs
speacutecialiseacutes nest-il quun terme marketing un courant de mode 159 Il est probable
que bientocirct on ne lemploiera plus pour deacutesigner ces nouvelles applications qui
seront devenues la norme Toutefois ce terme sorte de parapluie conceptuel qui
recouvre les diffeacuterentes tendances du web nouvelle geacuteneacuteration a le meacuterite de
mettre un nom simple sur un courant du net novateur
Le Web 20 nest pas une reacutevolution ou une rupture technologique mais plus
certainement une eacutevolution qui permet de replacer lutilisateur au centre des
reacuteseaux Cela nest certes pas tregraves nouveau Usenet lun des plus anciens
protocoles de linternet bien anteacuterieur au WWWeb offrait du contenu en ligne
creacuteeacute par linternaute via les Newsgroups degraves les anneacutees 1980
Mais les progregraves technologiques ont permis dintensifier cette tendance et de
deacutemocratiser laccegraves agrave la creacuteation de contenu en ligne et agrave sa diffusion au plus grand
nombre Potentiellement tout internaute peut maintenant diffuser ses publications
tant les outils sont devenus simples
Le Web 20 tend agrave sinseacuterer au cœur du quotidien de chacun en lui apportant des
services novateurs reacuteellement utiles et qui rendent possible lrsquoapparition de
nouveaux usages Ainsi les mash-up qui srsquoappuient sur la geacuteolocalisation ouvrent
des possibiliteacutes inenvisageables jusquici On peut mecircme imaginer agrave terme une
superposition de ces cartes dynamiques agrave la vision reacuteelle dun pieacuteton ou dun
automobiliste Le Web 20 est en perpeacutetuelle eacutevolution ses capaciteacutes drsquoinnovation
sont tregraves fortes car elles reposent souvent sur des recombinaisons audacieuses de
lrsquoexistant hybridant applications et services dans un systegraveme de deacuteveloppement
open source hellipLrsquoinnovation est aussi innovation de postures (prendre la parole
consommer du contenu amateurhellip) qui parfois challengent lrsquoordre eacutetabli et
redistribuent les pouvoirs La position des acteurs du Web 10 ou des meacutedias
classiques pourrait se trouver de plus en plus remise en question lagrave ougrave les
internautes tendent agrave se placer en experts
copy Digimind Digimind Services ndash White Paper |92
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La place de lhumain
Si celle-ci est devenue preacutepondeacuterante il est toutefois difficile de saffranchir
dorganisations un tant soit peu hieacuterarchiseacutees lautoreacutegulation voir Wikipedia ayant
ses limites
En outre la question de la consommation de contenu et de sa qualification sur
lrsquointernet devient cruciale La pertinence des votes de tous les internautes est
discutable ou du moins le fait qursquoils puissent agrave eux seuls qualifier et eacutevaluer la
qualiteacute Par ailleurs que repreacutesente exactement un vote une adheacutesion au contenu
agrave la forme aux ideacutees aux eacutecrits dun ami agrave une ideacutee avec laquelle je suis en
deacutesaccord mais qui agrave le meacuterite dexister
Finalement il faut continuer agrave normer organiser coordonner
reacutegulerhellipnotamment pour eacuteviter les diffamations ou la deacutesinformation Pour ce qui
est du contenu et de sa qualiteacute les critiques eacutemises agrave lrsquoencontre de Wikipeacutedia nous
incitent agrave eacutetudier de plus pregraves les initiatives qui hybrident les interventions
drsquoamateurs avec les compeacutetences de professionnels
Nous sommes passeacutes en 10 ans dun contenu geacuteneacutereacute par quelques internautes pour
la masse agrave un contenu de masse agrave destination de la masse (Evertybody to
Everybody) Cela ne peut guegravere se deacutevelopper sans des meacutecanismes qui replacent
les internautes les plus speacutecialiseacutes dans des processus de validation dune
information devenue pleacutethorique
Les donneacutees personnelles
Simpliciteacute reacuteactiviteacute personnalisation souplesse mutualisationhellipfont partie des
avantages les plus appreacuteciables du web 20 Mais cette liberteacute de publication et de
diffusion nrsquoest elle pas parfois illusoire Les utilisateurs doivent rester vigilants face
aux problegravemes de confidentialiteacute seacutecuriteacute et traccedilabiliteacute de lrsquoinformation160 Des voix
srsquoeacutelegravevent pour deacutenoncer les risques lieacutes agrave la maicirctrise des donneacutees personnelles ou
au respect des droits drsquoauteurs A noter que les licences Creative Commons161
permettent de mieux deacutefinir les contours de cette liberteacute agrave partir de contrats
flexibles de droit dauteur Ce systegraveme Creative Commons donne la possibiliteacute
gratuitement et simplement aux titulaires de droits de choisir et drsquoexprimer les
conditions drsquoutilisation de leurs œuvres agrave travers onze possibiliteacutes Quant aux
utilisateurs ils nrsquoont pas agrave neacutegocier systeacutematiquement une autorisation avant toute
utilisation ou reacuteutilisation
copy Digimind Digimind Services ndash White Paper |93
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Un autre problegraveme reacuteside aussi dans lrsquoeacuteparpillement des donneacutees dans des sites
diffeacuterents ou parfois redondants Il srsquoagira donc de deacutefinir les objets (livre
personne CD photoshellip) agrave partir drsquoun identifiant Cette bataille pour savoir qui
geacuterera ces donneacutees de base telles que la position geacuteographique les espaces de noms et
le code unique de chaque produit a deacutejagrave commenceacute estime Tim OReilly 162
Les perspectives deacutevolution vers un Web 3
Le web actuel est destructureacute et la classification et lrsquoorganisation de son contenu
posent problegraveme La recherche de nouveaux modes de recherche et de
structuration est une sorte de quecircte du graal que de nombreux experts et
entreprises poursuivent
La folksonomie repose sur une ideacutee originale qui sous tend toute lrsquoideacuteologie Web
20 celle de lrsquointelligence collective et de la deacutecentralisation Mais les limites de la
folksonomie appeleacutee aussi web seacutemantique du pauvre remettent en question
lrsquoaffirmation selon laquelle lrsquointelligence collective et la libeacuteralisation totale du
fonctionnement du web 20 sont une solution viable
Aussi la neacutecessiteacute drsquoun Web seacutemantique 163 fiable se fait de plus en plus urgente
Cette nouvelle phase de deacuteveloppement du Web permettrait drsquoameacuteliorer
lrsquoexploitation des informations par les utilisateurs en obtenant une information
organiseacutee normaliseacutee de faccedilon agrave rendre le web compreacutehensible aux machines pour
faciliter lrsquoexploitation par les utilisateurs
Dans un article paru dans le New York Times en novembre 2006 John Markoff
imagine un web 30 selon le principe drsquoajout dune couche de sens tout en haut du
web existant pour en faire un guide au lieu drsquoun simple catalogue Pour lrsquoauteur
nous sommes en train de passer dun web de documents connecteacutes agrave un web de
donneacutees connecteacutees
Le web seacutemantique offrira un langage commun permettant aux donneacutees de
renvoyer agrave des objets du monde reacuteel dune faccedilon identique Le projet Freebase
lanceacute par la start up Metaweb illustre cette approche il a pour objectif de faciliter
la recherche et le partage drsquoinformations agrave travers une base de connaissances
communes structureacutees via des meacutetadonneacutees permettant de deacutecrire chaque
eacuteleacutement drsquoinformation Ces eacuteleacutements seraient relieacutes entre eux par un systegraveme de
relations Tim OrsquoReilly deacutefinit le projet comme la machine agrave creacuteer les synapses du
cerveau global
Il srsquoagirait de creacuteer en quelque sorte un Google du web seacutemantique un reacutepertoire global
drsquoinformations structureacutees intelligibles et exploitables autant par des machines que par
copy Digimind Digimind Services ndash White Paper |94
Le Web 20 pour la veille et recherche dinformation DIGIMIND
des humains -et donc capables drsquoextraire et drsquointerpreacuteter les relations entre des donneacutees
pour par exemple reacutepondre agrave des requecirctes par des solutions plutocirct que des listes de
document 164
La veille
Dans cet univers le chercheur dinformations et le veilleur doiventhellipgarder la tecircte
froide la forte meacutediatisation du Web 20 ne doit pas masquer la pertinence doutils
plus traditionnels Les diffeacuterentes applications Web 20 nous lavons vu suffisent
rarement pour mener agrave bien une collecte dinformation Certes les bookmarks
sociaux apportent un contenu seacutelectionneacute par linternaute mais on ne peut se
deacutepartir des moteurs de recherche web classiques La surveillance des flux RSS
permet decirctre alerteacute sur de nombreux sujets mais la majoriteacute des sites web restent
encore deacutepourvus de ces fils Les tags apportent une veacuteritable souplesse agrave
lutilisateur mais la taxonomie des bibliothegraveques ou des reacutepertoires web- pour ne
citer que ces lieux- reste essentielle pour se repeacuterer agrave travers des milliers de
ressources
Le Web 20 pour la recherche et la veille nen est quagrave ses balbutiements Aussi
avant quil ne digegravere complegravetement par enrichissement les ressources et les
applications Web 10 il convient de faire coexister ces 2 web dans les pratiques
Le Web 20 apporte une richesse essentielle lrsquoexpression drsquoindividus porteurs
drsquoideacutees et de faculteacutes susceptibles drsquoapporter des changements de re-questionner
lrsquoordre eacutetabli eacuteleacutements indispensables agrave lrsquoeacutevolution de la culture agrave condition de ne
pas oublier que des volonteacutes ambitieuses doivent intervenir pour canaliser les
initiatives sans les eacutetouffer et leur insuffler une veacuteritable ambition Voilagrave tout
lenjeuhellip
copy Digimind Digimind Services ndash White Paper |95
Le Web 20 pour la veille et recherche dinformation DIGIMIND
A propos des auteurs DIGIMIND SERVICES
Digimind Services accompagne les plus grandes entreprises pour la conception la
mise en œuvre et le deacuteploiement de projets de veille qui reposent sur la solution
Digimind Evolution apportant agrave ses clients un retour sur investissement de plus de
600 et ce degraves la premiegravere anneacutee Les meacutethodologies proprieacutetaires du
deacutepartement conseil ainsi que son expertise des probleacutematiques et sources
drsquoinformations sur plus de 20 secteurs drsquoactiviteacute deacuteveloppeacutee aupregraves de ses clients
depuis de nombreuses anneacutees permet aux entreprises drsquoanticiper les changements
de leur environnement pour prendre les meilleures deacutecisions sur leur marcheacute
Le conseil Digimind porte sur tous les aspects du workflow de veille ciblage
strateacutegique collecte des informations traitement et analyse exploitation et
diffusion gestion de projet conseil organisationnel et gestion du changement
formations et support fonctionnel et technique
CHRISTOPHE ASSELIN
Issu drsquoun cabinet drsquoeacutetudes de marcheacute B2B et speacutecialiseacute depuis 1997 dans la mise en
place de systegravemes de veille (e-Franceorg Ecole Militaire) Christophe Asselin allie
une connaissance approfondie des secteurs eacuteconomiques et une parfaite maicirctrise
des outils de recherche sur internet et des solutions avanceacutees de veille Expert
reconnu il eacutedite le site httpwwwintelligence-centercom et le blog
httpinfluxjouebcom tout deux consacreacutes agrave la recherche dinformation
Speacutecialiste de la veille internet chez Digimind il accompagne les clients dans la mise
en place de leur dispositif de veille (expression des besoins deacutefinition de plans de
veille sourcing architecture parameacutetrage formation accompagnement) Il
intervient ainsi aupregraves de socieacuteteacutes dans diffeacuterents secteurs les teacuteleacutecoms avec
France Telecom RampD lrsquoindustrie pharmaceutique avec Sanofi Aventis Roche
Pharma Expanscience ainsi quAlstom Transport Veolia Environnement et des
reacutefeacuterences confidentielles dans le secteur des biotechnologies de leacutenergie des
teacuteleacutecoms de limprimerie de la deacutefense du conseilhellip
copy Digimind Digimind Services ndash White Paper |96
Le Web 20 pour la veille et recherche dinformation DIGIMIND
[Merci au Service Marketing agrave Malaiac wwwmalaiacnet et agrave Elsa Bonier eacutetudiante
en Master 2 Management des innovations en communication agrave Paris XIII pour leur
fructueuse collaboration]
VERONIQUE MESGUICH
Apregraves avoir fondeacute et co-dirigeacute pendant six ans un cabinet speacutecialiseacute en veille
technologique Veacuteronique Mesguich dirige lrsquoInfothegraveque du Pocircle Universitaire
Leacuteonard de Vinci Elle enseigne eacutegalement la maicirctrise de linformation strateacutegique
dans plusieurs eacutetablissements denseignement supeacuterieur et anime reacuteguliegraverement
des sessions de formation continue autour de la meacutethodologie de recherche
avanceacutee et de veille sur Internet
Veacuteronique Mesguich est lrsquoauteur avec Armelle Thomas de lrsquoouvrage Net
recherche le guide pour trouver lrsquoinformation utile dont la deuxiegraveme eacutedition est
parue en mars 2007 aux eacuteditions de lrsquoADBS
copy Digimind Digimind Services ndash White Paper |97
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Webographie Bibliographie
Sources dinformation sur le Web 20
Sites web wikis et blogs
Reacutepertoires et classement de services et socieacuteteacutes Web 20 - 20 Websites http20websitescom - Web 20 Magazine Top 100 Web 20 Sites httpweb2magazineblogspotcom200701thanks-for-web-2html - Web 20 Magazine The Best Web 20 Software of 2006 httpweb2socialcomputingmagazinecomthe_best_web_20_software_of_2006htm - Complete List of Web 20 Products and Services httpwwwlistiblecomlistcomplete-list-of-web-2-0-products-and-services - The Complete Web 20 Directory httpwwwgo2web20net - FredCavazzanet le meilleur du Web 20 httpwwwfredcavazzanetindexphp20051212986-le-meilleur-du-web-20 - Web 20 Directory 1200+ Web 20 Sites in 50+ categories httpweb2econsultantcomindexhtml
- Top 25 Web 20 Search Engines httpoedborglibraryfeaturestop-25-web20-search-engines
- 25 start-ups Web 20 prometteuses httpmoneycnncom20070221magazinesbusiness2nextnet_introbiz2
copy Digimind Digimind Services ndash White Paper |98
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Blogs et sites speacutecialiseacutes - Le groupe de travail Web20 francophone httpwwwweb20workgroupfr
- Web 20 Work Group httpweb20workgroupcom - Dessine-moi le Web 20 httpwwwdeuxzerocom - FredCavazzanet httpwwwfredcavazzanet
- TechCrunch en franccedilais httpfrtechcrunchcom - TechCrunch httpwwwtechcrunchcom
- Le web 20 cest pas du buzz httpweb2rulesblogspotcom
- Mashable France httpfrmashablecom - Mashable httpmashablecom - AccessoWeb httpblogaccessowebinfo - Web 20 Magazine httpweb2magazineblogspotcom - Reacutevolution Web 20 en Live httpwwwwebdeuxinfo
- ReadWriteWeb httpwwwreadwritewebcom - Web 20 Innovations httpweb2innovationscom - Web 20 Summit httpwwwweb2concom
- Original Signal (agreacutegateur de flux RSS) httpwwworiginalsignalfr - Whats Web 20 (agreacutegateur de flux RSS) httpwwwwhatsweb20comaggregatorfrom=100
- Le blog de Bloxx Communiquons avec le Web 20 httpblogbloxxfr
copy Digimind Digimind Services ndash White Paper |99
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- FrenchWeborg Le blog des professionnels franccedilais du Web 20 httpwwwfrenchweborg
- Blog Web 20 et Marketing httpwwwvincentabrycom - Le Web 20 en Action httpleweb2blogspotcom - aYsoon 20 httpblogaysooncom Emmanuel de Taillac httpemmanueldetaillacfr - NiouMedia httpnioumediacom - 2803 httpwww2803com - Web 2 francophone (Wiki) httpweb2frcomAccueil
Blogs et sites avec un axe Web 20
- Publishing 20 httppublishing2com - Social-Computing httpwwwsocial-computingcom - Ecosphere httpecospherewordpresscom - inFLUX httpinfluxjouebcom - Benoit Descary httpdescarycom - Jean Michel Billaut httpbillauttypepadcomjm - Blog francophone des TIC httpwww2607fr 20Minutes Top 50 tech et meacutedias httpwww20minutesfrarticle15087620070410-Blogs-Top-50-tech-et-mediaphp - Intruderstv httpnewintruderstvintruders_fr
copy Digimind Digimind Services ndash White Paper |100
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- Jeff Clavier Sans Accent httpsansaccentsofttechvccom - Demain tous journalistes httpbenoit-raphaelblogspotcom
- Collectif louvre-boicircte Initiatives sur le partage dinformation httplouvre-boiteviablogacom
- Zero seconde httpzerosecondeblogspotcom
Articles
Introduction au Web 20
- Web 20 lrsquoarticle de OrsquoReilly reacutesumeacute pour les faineacuteantshellip httpwwwexpressionsbe20051101web-20-resume-pour-les-faineants
- Dossiers Web 20 - Journal Du net httpwwwjournaldunetcomdossiersweb20
- Avis des managers le Web 20 agrave la loupe httpwwwjournaldunetcomsolutions0603diaporamaavis-managers-web21shtml
- Les entreprises face aux deacutefis du Web 20 httpwwwjournaldunetcomsolutions0704070413-entreprises-web-201shtml
-The Machine is Using Us Transcription (videacuteo) httpmediatedculturesnetksudiggp=78
- The New Wisdom of the Web httpwwwmsnbcmsncomid12015774sitenewsweek
- Quest-ce que Web 20 httpwww01netcomarticle294819html
- Approaching a definition of Web 20 httpsocialsoftwareweblogsinccom20050929approaching-a-definition-of-web-2-0
- Fonctionnement de lrsquoentreprise classique vs entreprise 20 httpalbancornilletfreefrakwindexphp20061002fonctionnement-de-lentreprise-classique-vs-entreprise-20
- Meacutedias traditionnels et acteurs du Web 20 vers la cohabitation ou la convergence des acteurs de lrsquoinformation et du divertissement httpwwwscribdcomdoc50818These-sur-le-Web-2-Cabanis
copy Digimind Digimind Services ndash White Paper |101
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ajax
- LAjax en 5 questions httpwwwjournaldunetcomsolutions0602060208_qr-ajaxshtml - Ajax et Moteurs 20 httpwwwmoteurzinecomarchives2006moteurzine127html2
Les Mashups
- Les Mashups applications Web composites tregraves Web 20 httpwwwjournaldunetcomsolutions0606060628-qr-mashup-hybrideshtml
- Le modegravele eacuteconomique des Mashups httpwwwinternetactunetp=6285 Bookmarks sociaux Social search
- Le Social Bookmarking au secours de la pertinence de la recherche drsquoinformation httpwwwgillesbalmissecomv2spipphparticle171 - Whats the Big Deal With Social Search httpsearchenginewatchcomshowPagehtmlpage=3623153
- Whos Who in Social Search httpsearchenginewatchcomshowPagehtmlpage=3623173
Ouvrages
- Web 20 - Les internautes au pouvoir - Jean-Franccedilois Gervais httpwwwdunodcompagesouvragesficheouvrageaspid=50701
- Les reacuteseaux sociaux Pivot de lrsquointernet 20 - Alain Lefebvre httpwwwcluster21comfrbookreviewlivre_les_reseaux_sociaux - Web 20 (R)eacutevolutions et nouveaux services dInternet - Jean-Noeumll Anderruthy httpwwwamazonfrWeb-2-0-C3A9volutions-nouveaux-dInternetdp2746034972ref=sr_1_18402-7140143-8118507ie=UTF8amps=booksampqid=1178118687ampsr=8-18 - Web 20 The Future of the Internet and Technology Economy and How Entrepreneurs Investors Executives amp Consumers Can Take Ad httpwwwamazoncomWeb-2-0-Technology-Entrepreneurs-Execenablersdp1587622009ref=sr_1_6103-0331542-4028646ie=UTF8amps=booksampqid=1178118732ampsr=1-6
- La Longue Traicircne La nouvelle eacuteconomie est lagrave - Chris Anderson httpwwwamazonfrLongue-TraC3AEne-nouvelle-C3A9conomie-
copy Digimind Digimind Services ndash White Paper |102
Le Web 20 pour la veille et recherche dinformation DIGIMIND
estdp2744062693ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180542516ampsr=1-1 - The Geospatial Web How Geobrowsers Social Software and the Web 20 are Shaping the Network Society httpwwwamazoncomGeospatial-Web-Geobrowsers-Information-Processingdp1846288266ref=sr_1_28103-0331542-4028646ie=UTF8amps=booksampqid=1178118760ampsr=1-28 - Les Wikis espaces de lintelligence collective - Jeacuterocircme Delacroix httpwwwamazonfrWikis-JC3A9rC3B4me-Delacroixdp2952051445ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180544723ampsr=8-1 - Pro Web 20 Mashups Remixing Data and Web Services httpwwwamazonfrPro-Web-2-0-Mashups-Remixingdp159059858Xref=sr_1_4403-1740173-8750801ie=UTF8amps=english-booksampqid=1180542751ampsr=8-4 - Web 20 et Web avanceacute - Alexandre Boni Nicolas Stemart httpwwwamazonfrWeb-2-0-avancC3A9-Alexandre-Bonidp2742967281
copy Digimind Digimind Services ndash White Paper |103
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Dans la mecircme collection
White Paper Blogs et RSS des outils pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind
White Paper
Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind
White Paper
Cateacutegorisation automatique de textes
White Paper
Benchmark des solutions de veille strateacutegique
White Paper
Evaluer le Retour sur Investissement dun logiciel de veille Edouard Fillias Consultant Veille Strateacutegique Digimind
gt A teacuteleacutecharger sur httpwwwdigimindfrserviceswhite_paperhtm
copy Digimind Digimind Services ndash White Paper |104
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Notes 1 httpwwwguimfrblog200612le_film_autumn_html httpwwwlemondefrwebarticle01-02-65186536-8751060html 2 httpvideogooglefrvideoplaydocid=724218352255575783 3 Map of online communities par Randall Munroe httpwwwxkcdcomc256html 4 httpwwwdeuxzerocom 5 httpwwwpaulgrahamcombiohtml httpfrwikipediaorgwikiPaul_Graham 6 Qursquoest ce que le web 20 Hubert Guillaud Internet Actu 29 mai 2005 httpwwwinternetactunetp=6144 7 httpwwworeillynetcompubaoreillytimnews20050930what-is-web-20html httpweb2rulesblogspotcom200601what-is-web-20-par-tim-oreilly-versionhtml 8 httpwwwzdnetfractualitesinternet0390207743933447900htm 9 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 10 httpwwwinternetactunetp=7035 11 httpwwwhitwisecomdatacenter 12 httprosstypepadcomblog200604power_law_of_pahtml 13 httpblogsforrestercomcharleneli200704forresters_new_html 14 httpwwwtagcrowdcom 15 You Say You Want a Web Revolution httpwwwwiredcomsciencediscoveriesnews20050868403 16 httpsaddonsmozillaorgfrfirefoxaddon748 httpwwwjournaldunetcomdeveloppeurtutorielout050525-greasemonkey-presentationshtml 17 Mashups Google Maps httpwwwmibazaarcomextrasfortune100html httpwwwweatherbonkcomweatherindexjsp httpgmapstommanganusspacecraft_trackinghtml 18 httpwwwgooglecomcalendar 19 httpdocsgooglecom 20 httpwwwmoovementfr 21 httpwwwcooptincomfrWEBhomeaspx httpwwwjobmeeterscomfraccueilindexphp 22 httpwwwzliocom httpshoppingyahoocomshoposphere
copy Digimind Digimind Services ndash White Paper |105
Le Web 20 pour la veille et recherche dinformation DIGIMIND
23 httpwwwciaofr httpwwwwantunocom 24 httpmapsgooglefr httpwwwgeoportailfr httpearthgooglefr httpmapsyahoocom httpwwwflickrcom httpwwwzdnetfractualitesinternet0390207743936635400htm 25 httpwwwcriteocom 26 From Youtube to Youniversities Henry Jenkins 16 feacutevrier 2007 httpwwwhenryjenkinsorg200702from_youtube_to_youniversityhtml 27 httpaffordancetypepadcom 28 httpwwwplosoneorghomeaction 29 Web collaboratif web coopeacuteratif web 20 quelles interrogations pour lrsquoenseignant documentaliste Marie France Blanquet 12 janvier 2007 httpeprofsdocscrdp-aix-marseillefrIMGrtfintervention-MF-Blanquetrtf 30 httpveillepedagogiquebloglemondefr 31 httpbibliobsessionfreefrdotclear 32 httpliblogsalbanyedulibrary20200611a_librarians_20_manifestohtml 33 httpdelicious 34 httpwwwconnoteaorg httpwwwciteulikeorg httpwwwsnipitroncom 35 httpdelicious httpwwwblinklistcom httpblogmarksnet httpwwwfurlnet httpfrbetabookmarksyahoocom httpmyweb2searchyahoocom 36 httpwwwstumbleuponcom httpsimilicious httpwwwyoonocomindexjsp 37 Social bookmarks charts version 35 httpwwwiroxdefile_download3 httpwwwroxomaticde856 Social Bookmarking Services And Tools The Wisdom Of Crowds That Organizes The Web httpwwwmasternewmediaorgnews20061201social_bookmarking_services_and_toolshtm Free Bookmark Managers
copy Digimind Digimind Services ndash White Paper |106
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwfeedbuscombookmarks 38 httpwwwflickrcom 39 httpwwwflickrcomgroupstehipool 40 httpwwwflickrcomphotostagsnorthamericaninternationalautoshow 41 httpphotobucketcom 42 httpwwwsquidoocom 43 httpwwwsquidoocomnanotechRev 44 httpwwwsquidoocomtagsmarketing 45 httpwwwyoutubecom 46 httpwwwdailymotioncom 47 Une seacutelection de moteurs de recherche videacuteo et de services de partage et teacuteleacutechargement de videacuteos httpcasselinfreefrfrenchvideoshtm 48 httpwwwemarketercomArticleaspxid=1004918 49 httpwwwviadeocom 50 httpwwwlinkedincom 51 httpwww6nergiesnet httpwwwxingcom 52 httpwwwfacebookcom 53 httpenwikipediaorgwikiList_of_social_networking_sites 54 httpwwwlinknrankcombusinessphp 55 httpdiggcom 56 httpwwwnuouzcom httpwwwblogmemescom httpwwwscoopeocom httpwwwfuzzfr httpwwwtapemoicom httpmeneamenet httpwwwrojocom httpwwwbetanetscapecom 57 httpwwwwikiofr 58 httpwwwagoravoxfr 59 Carlo Revelli Joeumll de Rosnay httpfrwikipediaorgwikiCarlo_Revelli httpfrwikipediaorgwikiJoC3ABl_de_Rosnay 60 Agoravox politique eacuteditoriale httpwwwagoravoxfrarticlephp3id_article=60 61 httpwwwreadspeakercom 62 httpenglishohmynewscom
copy Digimind Digimind Services ndash White Paper |107
Le Web 20 pour la veille et recherche dinformation DIGIMIND
63 State of the Blogosphere- avril 2007 httpwwwsifrycomalertsarchives000493html 64 Les blogs dans le monde Estimation agrave partir des chiffres produits par Digimind Blog Herald Technorati PewInternet Meacutediameacutetrie Loiumlc le Meur Live Journal Skyblogs Overblogs Terra MSN Spaces Splinder Excite Bloggersit Timblog W3B Skynet Bloghr Overskriftdk Smartlog onetpl Tenbit mylogpl eblogpl Blogpl Blogipl blogcentralis Romandiefr Blogspot timsoftro Globocom Financial Express Prixadi blog Baidu Yahoo Blogs South Korea Planet Weblog Service Cyworld LAtelier et ZDNet Australia 65 httpwwwnaturecomwebfeedsindexhtml httpwwwsciencemagorgrss 66 httpsearchlivecom 67 httpsearchyahoocom 68 httpnewsgooglefr httpfrnewsyahooco httpfrnewsbotmsncom httpwwwtopixnet httpwwwwikiofr 69 httpgroupsgooglefrgrouprectraveleuropefeedshl=fr 70 httpwwwforummobilescomindexphpshowforum=200 71 httpfrgroupsyahoocom 72 httpfrmyweb2searchyahoocom httpblogmarksnet httpdelicious 73 httpwwwflickrcom httpphotobucketcom 74 httpwwwyoutubecom httpwwwdailymotioncomfr 75 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 76 httpblogsearchgooglefr httpfraskcomsubjectbls|pg1 httpwwwfeedstercom httpwwwblogpulsecom httpwwwtechnoraticom httpwwwspherecom 77 httpwwwsifrycomalertsarchives000493html 78 httpfrsearchyahoocomwebadvancedei=UTF-8ampybs=0 httpwwwexaleadfrsearchresultsq=sarkozyamp24mode=allweb 79 httpwwwblogaramacom httpwwwrss-networkcom
copy Digimind Digimind Services ndash White Paper |108
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwrssfeedscom 80 httpwww43thingscom http36trucscom 81 httptrainquecomcodedelicious_lookupphp 82 httptechnoraticomtag 83 httpwwwsearchlescom 84 httptagcentralnet httpwwwkeotagcom httpwwwthagoocom httpwwwzewolnet httpwwwgnoshorg 85 httpwwwzibbcom 86 httpwwwecransfr 87 Google Tag Cloud Maker httpuserscriptsorgscriptsshow6171 88 httpnewzingocom 89 Folksonomies les usagers indexent le web Olivier le Deuff Bulletin des Bibliothegraveques de France ndeg4 2006 90 Folksonomy les tags en deacutelire Cyril Fieacutevet Internetactu 13 octobre 2005 httpwwwinternetactunetp=6166 91 httpwwwzoominfocom 92 httpwwwzikicom 93 httpwwwyonamecom httpwwwstalkeraticom httpwinkcom 94 httpfranswersyahoocom httpanswersyahoocom httpaskyahoocom 95 httpanswersgooglecomanswers 96 httpiqlycosfr httpqnalivecombetaaspx 97 httpwwwexpertscomdirectoryasp 98 httpsearchwikiacomwikiSearch_Wikia 99 httpdeciphocom 100 httpwwwyoonocom 101 httpwwwfooxxcom
copy Digimind Digimind Services ndash White Paper |109
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwwebzzlecom 102 httpinfluxjouebcomnewspowerset-et-xerox-parc-s-attaquent-a-google-naturellement 103 httpwwwmedglecom httpwwwmedwormcom httpwwwmedstorycom httpwwwsearchmedicacouk 104 httpwwwrollyocom httpswickihomeeurekstercom httpgooglecomcoopcseoverview httpbuildersearchyahoocom 105 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 106 Le web invisible (deep web hidden web) deacutesigne la partie du web non accessible aux moteurs de recherche classiques Le web invisible comprend des bases banques de donneacutees et bibliothegraveques en ligne gratuites ou payantesIl est constitueacute de pages web mal ou non indexeacutees par les moteurs Pour plus de preacutecisions voir le White Paper Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique httpwwwdigimindfrserviceswhite_paperhtm 107 httpwwwthelancetcom 108 httpwwwdigimindfrproduitsfinderhtm 109 httpwwwncbinlmnihgoventrezqueryfcgiCMD=searchampDB=pubmed 110 httppminlmnihgovinteractindexphptop httpwwwhubmedorg 111 httpwwwusptogovpatftindexhtml httpwwwwashingtonpostcomwp-dyncontentarticle20070304AR2007030401263html 112 httpwwwgooglecomhistory 113 httpwwwgooglecomhistorytrends httpwwwgooglecomhistoryitems 114 httpfrwikipediaorgwikiApplication_composite 115 httpwwwmibazaarcomextrasfortune100html 116 httptagmapsresearchyahoocomworldexplorerphp 117 httpflickrvisioncom 118 httpgmapstommanganusspacecraft_trackinghtml 119 httpwwwhealthmaporg httpwwwbrevardbiodieselorgmapbdhtml httpkartametroinfokartadefaultaspxhl=EN httpwwwwikimapiaorg httpwwwglobalincidentmapcomhomephp httpdartmapsmackerscom
copy Digimind Digimind Services ndash White Paper |110
Le Web 20 pour la veille et recherche dinformation DIGIMIND
120 httpwwwtagurlscom 121 httpwwwthemolucom httpwwwgnoshorg 122 httpwwwwebmashupcom httpwwwprogrammablewebcommashupsdirectory httpmashupfeedcom 123 httpgooglemapsmaniablogspotcom 124 httplocalalkemiscom 125 httpwwwvoxcom httpwwwover-blogcom httpwwwblogspiritcomfrindexphp httpwwwtypepadcom httpswwwbloggercomstart httpviablogacom httpwwwhautetfortcom 126 httpcasselinfreefrfrenchweblogshtmoutils 127 httpwwwclubiccomarticle-67515-8-comparatif-plateformes-blogshtml httpwwwojrorgojrimagesblog_software_comparisoncfm 128 httpwwwfeedburnercomfbahome 129 httppagesgooglecom 130 httpwwwdigimindfrserviceswhite_paperhtm 131 httpfrwikipediaorgwikiAccueil 132 httpblogouter-courtcomarchive2006-12-05-n22html 133 httpwwwnaturecomnews2005051212full438900ahtml httpwwwnaturecomnaturebritannicaindexhtml httpwwwnaturecomnews2005051212multimedia438900a_m1html 134 httpwwwwikiseekcom 135 httpwwwexaleadfr 136 httpwwwwikimindmaporg 137 httpencitizendiumorgwikiMain_Page 138 httpwwwalacrawikicom 139 httpceclinesxwikicomxwikibinviewMainFils+RSS 140 httpwwwwikidwebcom 141 httpwwwoperacom httpwwwmaxthoncom httpwwwmicrosoftcomfrancewindowsie httpwwwmozilla-europeorgfrproductsfirefox
copy Digimind Digimind Services ndash White Paper |111
Le Web 20 pour la veille et recherche dinformation DIGIMIND
142 httpfrtechcrunchcom20060401analysons-les-lecteurs-rss-en-ligne httpvtechcanalblogcomarchives20051025927489html httpvtechcanalblogcomarchives20050905780635html httpallrsscomrssreadershtml 143 httpinfluxjouebcomnewsles-pages-personnalisables-bookmark-n-1 httpwwwinformationoverlordcouk200603where-to-start-in-search-of-ideal_26 144 httpwwwdigimindfrproduitsindexhtm 145 httpshareopmlorg 146 httpwwwquechoisirorgArticlejspid=RessourcesArticlesEF33CF34D5616AF2C125720D0050E701ampcatcss=TEL000 147 httpweblogshitwisecombill-tancer 148 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 149 httpwwwbusinessweekcominnovateNussbaumOnDesignarchives200704are_most_web_20html 150 httpblogsforrestercomcharleneli200704forresters_new_html httprosstypepadcomblog200604power_law_of_pahtml 151 httpwwwobservatoire-omicorgcolloque-icicpdfBarbe3_1pdf 152 httpwwwaaronswcomweblogwhowriteswikipedia 153 httpaphgcaenfreefrchronique393aphg393htm 154 httpfrwikipediaorgwikiDroits_de_l27homme_en_Iran 155 httpfrwikipediaorgwikiWikipC3A9diaArticles_de_qualitC3A9 156 httpenwikipediaorgwikiJohn_Seigenthaler_Sr_Wikipedia_biography_controversy 157 httppewresearchorgpubs71riding-the-waves-of-web-20 158 httptallblogcontedoxacukwp-contentuploads200703survey-summarypdf 159 httpwwwcafepresscomnerdwideweb 160 httpwwwecransfrspipphprubrique30 161 httpfrcreativecommonsorg 162 httpwwwzdnetfractualitesinternet0390207743933447900htm 163 httpwebsemantiqueorgPagePrincipale httpwwww3orgDesignIssuesSemantichtml httpwwww3org2002Talks1213-lpslide1-0html 164 httpwwwinternetactunetp=6902
copy Digimind Digimind Services ndash White Paper |112
- Digimind Services
- Christophe ASSELIN
- Veronique MESGUICH
-
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Quest-ce que le Web 20
PREAMBULE
Pour certains le Web 20 nest qun gadget un pur pheacutenomegravene de mode qui ne
meacuterite pas que lon sy attarde Pourtant une eacutevolution importante a bien eu lieu sur
le web quelque soit le nom que lon lui donne
Ainsi en 2006 un metteur en scegravene a choisi de diffuser son long meacutetrage Autumn1
gratuitement et ce uniquement sur internet via le service Google Video2 Il navait
pas trouveacute de distributeur capable dexploiter son film dans plus de 30 salles En mai
2007 plus de 920 000 internautes avaient deacutejagrave vu Autumn sur le service de partage
de videacuteos de Google
Fin 2005 pour le compte de la prestigieuse revue scientifique Nature des experts
ont compareacute des documents publieacutes sur Wikipedia lencyclopeacutedie collaborative en
ligne reacutealiseacutee par des internautes volontaires et beacuteneacutevoles avec ceux de la ceacutelegravebre
Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche
Cette eacutetude a abouti agrave une formidable controverse comment une encyclopeacutedie
reacutealiseacutee par des non-speacutecialistes peut-elle remettre en cause les ouvrages
classiques
Il se passe donc bien quelque chose de nouveau via ce web nouvelle geacuteneacuteration ougrave
linternaute devient actif et collaboratif Mais tellement dacteurs et dapplications se
reacuteclament de ce web 2 que lon a vite limpression de naviguer en Terra Incognita
Certains nheacutesitent dailleurs pas agrave repreacutesenter ce nouveau web via une carte
dexplorateur 3
Aussi agrave travers ce document plongeons dans le Web 20 pour mieux lexploiter
lors de recherche dinformation et de veilles
copy Digimind Digimind Services ndash White Paper |5
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La carte des communauteacutes virtuelles Par Randall Munroe DR
DEFINITION DU WEB 20
Comment deacutefinir de faccedilon preacutecise ce que recouvre cette notion parfois floue
Depuis plusieurs mois le blog collectif Dessine moi le Web 20 4 propose agrave des
universitaires informaticiens philosophes entrepreneurs de donner leur propre
vision du pheacutenomegravene et eacutechanger ideacutees et points de vue La diversiteacute et la richesse
des contributions illustrent la difficulteacute agrave donner une deacutefinition exhaustive de ce
concept agrave geacuteomeacutetrie variable mecirclant agrave la fois des aspects techniques et sociaux
Une vision reacuteductrice du Web 20 consisterait agrave nrsquoy voir que la mutualisation de
contenus produits et mis en ligne par les utilisateurs eux-mecircmes ou agrave reacutesumer
lrsquoengouement actuel agrave un effet de mode passager Depuis la premiegravere confeacuterence
Web 20 en 2004 le concept srsquoest concreacutetiseacute agrave travers de nombreuses
expeacuterimentations ou le deacuteveloppement de nombreux services largement utiliseacutes
Nous tenterons dans ce document de brosser un panorama des enjeux usages et
technologies lieacutes agrave cette notion aussi encenseacutee que controverseacutee
copy Digimind Digimind Services ndash White Paper |6
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Plusieurs auteurs srsquoaccordent sur lrsquoideacutee selon laquelle le web 20 ne constitue pas
une rupture technologique ni hellip sociale Il srsquoagirait plutocirct drsquoun retour aux sources
drsquoune renaissance du web tel qursquoil a eacuteteacute conccedilu agrave lrsquoorigine les utilisateurs srsquoeacutetant
entre temps approprieacutes les modes de creacuteation et de diffusion
Pour Paul Graham5 pionnier de lrsquoInternet et fondateur de la socieacuteteacute Viaweb en
1995 le web 20 est le web comme il a eacuteteacute conccedilu pour ecirctre utiliseacute Les tendances que
nous distinguons sont simplement la nature inheacuterente du web qui eacutemerge des mauvaises
pratiques qui lui ont eacuteteacute imposeacutees pendant la bulle Internet
Le web creacuteeacute au deacutebut des anneacutees 90 par Tim Berners Lee comportait deacutejagrave en
germe bien des eacuteleacutements du web 20 mutualisation des connaissances eacutechange
travail collaboratif interactiviteacute intelligence collective hellip Ce nrsquoest sans doute pas
un hasard si Dale Dougherty lrsquoun des pegraveres fondateurs de la formule 20 fut lui
aussi lrsquoun des pionniers du web et notamment le fondateur de GNN le premier
portail financeacute par la publiciteacute
Naissance du concept
Crsquoest au cours de lrsquoeacuteteacute 2004 que le terme de web 20 apparaicirct pour la premiegravere
fois lors drsquoune seacuteance de brainstorming Dale Dougerthy co-fondateur de la
socieacuteteacute drsquoeacutedition OrsquoReilly et Craig Cline de MediaLive reacutefleacutechissent agrave des thegravemes
eacutemergents en vue drsquoune confeacuterence agrave venir Le journaliste John Battelle co-
fondateur du magazine Wired se joint un peu plus tard au duo et la premiegravere
confeacuterence Web 20 a lieu en octobre 2004 Lrsquoexpression 20 est utiliseacutee agrave ce
propos pour marquer lrsquoeacutemergence drsquoune nouvelle eacutetape dans la courte histoire du
web eacutetape caracteacuteriseacutee par un changement des regravegles et une modification des
modegraveles de revenus Le volet social sera deacuteveloppeacute plus tardivement par Tim
OReilly lors de la deuxiegraveme confeacuterence Web 20 en octobre 2005
Les nouveaux produits et services associeacutes au web 20 vont ainsi repositionner
lrsquointernaute au cœur du systegraveme Des techniques de publications simples et souples
comme les blogs les plates-formes collaboratives de type Wiki offrent des
possibiliteacutes accrues de production diffusion et consommation des contenus
Lrsquointernaute devient ainsi co-creacuteateur de nouvelles applications en ligne initiant
souvent de faccedilon collective ou communautaire de nouvelles formes de relations
numeacuteriques Selon lrsquoexpression drsquoHubert Guillaud6 le web devient non plus une
aventure technologique mais bien une aventure humaine
copy Digimind Digimind Services ndash White Paper |7
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LES 7 PRINCIPES DU WEB 20
Le texte de Tim OrsquoReilly paru en 2005 7 sous le titre Qursquoest ce que le web 20
deacutegage sept principes cleacutes du Web 20 en voici un petit reacutesumeacute
1 Le web vu comme une plate-forme de services
On passe dune collection de sites web agrave une plateforme informatique agrave part
entiegravere fournissant des applications web aux utilisateurs
2 Consideacuterer les internautes comme co-deacuteveloppeurs des applications On passe ainsi
de la notion de logiciel produit agrave celle de logiciel service
3 Le service srsquoameacuteliore quand le nombre drsquoutilisateurs augmente
Le Web 20 met agrave profit lrsquoeffet de la longue traicircne (ou long tail en anglais)
populariseacute par le magazine Wired les produits qui sont lrsquoobjet drsquoune faible
demande ou qui nrsquoont qursquoun faible volume de vente peuvent collectivement
repreacutesenter une part de marcheacute eacutegale ou supeacuterieure agrave celle des best-sellers si les
canaux de distribution peuvent proposer assez de choix Les utilisateurs du Web
20 disposent de donneacutees uniques difficiles agrave recreacuteer et dont la richesse srsquoaccroicirct
avec lrsquoaugmentation du nombre des utilisateurs
4 La richesse est dans les donneacutees Toutes les applications web drsquoimportance sont
lieacutees agrave une base de donneacutees speacutecialiseacutee OrsquoReilly envisage un mouvement des
donneacutees libres srsquoopposant peu agrave peu agrave lrsquounivers des donneacutees proprieacutetaires
5 Tirer parti de lrsquointelligence collective crsquoest le principe mecircme adopteacute par
lencyclopeacutedie en ligne Wikipedia et drsquoautres sites similaires Pour Tim OrsquoReilly
lrsquoimplication des utilisateurs dans le reacuteseau est le facteur-cleacute pour la supreacutematie sur le
marcheacute
6 Mettre en place des interfaces souples et leacutegegraveres fondeacutees sur les nouveaux
standards et protocoles du Web Le logiciel se libegravere du PC Une autre des
caracteacuteristiques du web 20 est le fait qursquoil nrsquoest plus limiteacute agrave la plate-forme PC
mais vise notamment les objets nomades teacuteleacutephone portable PDA ou lecteur
portatif audio
copy Digimind Digimind Services ndash White Paper |8
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LES EVOLUTIONS PAR RAPPORT AU WEB 10 LE ROLE DE LINTERNAUTE
En quoi le Web 20 se distingue-t-il de la vague preacuteceacutedente On a vu que lrsquoune des
caracteacuteristiques majeures du pheacutenomegravene est lrsquoappropriation des contenus et des
modes de diffusion par les internautes eux-mecircmes via des applications souples et
leacutegegraveres
Paul Graham eacutevoque le principe de deacutemocratie du Web 20 cest-agrave-dire la
superposition au reacuteseau technique drsquoun reacuteseau humain qui participe agrave la creacuteation et
agrave lrsquoenrichissement de contenus et services Lrsquointernaute deviendrait ainsi
consommrsquoacteur agrave lui de produire publier diffuser indexer partager des
contenus de tous types
Web 10 Web 20
Leaders du web Entreprises marchands Internautes
Profil de linternaute Passif Actif
Interactiviteacute perccedilue Seacutelection et lecture dinformation
Seacutelection lecture et publication de donneacutees
Uniteacute de recherche Mot-cleacute Tag
Du Web 1 vers le Web 2 Source ZDNet 8
Pour autant les internautes vont-ils devenir tous acteurs de ce processus Selon un
article de Charles Arthur dans The Guardian 9 pour un groupe de 100 personnes si
lrsquoune creacutee du contenu 10 seulement vont interagir en apportant commentaires et
ameacuteliorations les autres se contentant drsquoune consommation passive Ce constat
obtenu via des retours drsquoexpeacuterience sur des sites collaboratifs illustre la regravegle des
11089 selon laquelle plus de 80 des contenus produits proviennent drsquoun
nombre tregraves restreint drsquoutilisateurs
Tendance confirmeacutee par les chiffres preacutesenteacutes lors de la Web 20 Expo en avril 2007
et repris dans Internetactu 10 selon la socieacuteteacute de mesure drsquoaudience Hitwise11
016 des internautes qui passent sur YouTube y placent des films - alors qursquoils
eacutetaient encore 05 agrave le faire en juillet 2006 seulement 02 des visiteurs de
Flickr y publient des photos La seule exception agrave cette faible participation provient
copy Digimind Digimind Services ndash White Paper |9
Le Web 20 pour la veille et recherche dinformation DIGIMIND
de Wikipedia ougrave 46 des visiteurs contribuent agrave lrsquoenrichissement de
semblent en effet
voir eacutecrit des textes longs (en un nombre reacuteduit drsquointerventions) tandis que les
eacutediteursrdquo les plus actifs qui forment le noyau des wikipeacutediens nettoient corrigent
lective fondeacutee sur des actions agrave faible niveau drsquoexigence
(lire enregistrer un signet tagger commenter) de lrsquointelligence collaborative
caracteacuteriseacutee par des formes de participations plus actives et intenses eacutecrire
collaborer modeacutererhellip
lrsquoencyclopeacutedie
Jimmy Wales fondateur de Wikipedia estime qursquoun nombre restreint de
contributeurs et eacutediteurs font lrsquoessentiel du travail alors qursquoun nombre consideacuterable
de lecteurs apportent peu de modifications Le wikipeacutedien Aaron Swartz nuance
ce point de vue un grand nombre de contributeurs occasionnels
a
ldquo
mais sans apporter eacutenormeacutement de texte
Le Web 20 et tout particuliegraverement la blogosphegravere semble suivre la loi de la
participation eacutedicteacutee par Ross Mayfield preacutesident de la socieacuteteacute Social Text sous le
nom de Power law of participation12 Cette loi baseacutee sur lrsquoobservation des
pratiques et des seuils de participation aux dispositifs communautaires constate que
la participation srsquoamenuise agrave mesure que les formes de participation se
complexifient Le scheacutema ci-dessous qui rappelle celui de la Longue Traicircne
distingue lrsquointelligence col
Power Law of Participation par Ross Mayfield CC
copy Digimind Digimind Services ndash White Paper |10
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Le cabinet Forrester deacutetaille enc
de la participation figurant dans son eacutetude Social Technographics 13 la grille compte
6 eacutechelons correspondant aux niveaux de particip
les inactifs (52 )
les spectateurs (33 ) consommateurs de contenus texte ou multimeacutedia (blogs
videacuteos mis en ligne par les utilisateurs podcasts)
ore davantage les niveaux drsquoimplication dans la grille
ation
les menuisiers (19 ) utilisateurs de reacuteseaux sociaux
es collecteurs (15 ) utilisent des flux RSS et taggent les pages web
les critiques (19 ) postent des commentaires sur les blogs des avis et critiques
les creacuteateurs (13 ) publient des contenus en ligne (blogs videacuteos)
l
copy Digimind Digimind Services ndash White Paper |11
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Glossaire du Web 20
Pour mieux comprendre les concepts utiliseacutes dans lunivers du Web 20 nous vous
proposons ce glossaire des termes essentiels
Tags mot clef sous forme drsquo eacutetiquette que les utilisateurs peuvent apposer sur
un document numeacuterique (texte photo videacuteo) de faccedilon agrave en deacutecrire le contenu Le
tagging introduit une part de subjectiviteacute par rapport agrave lrsquoindexation automatique
effectueacutee par les moteurs Les tags peuvent eacutegalement ecirctre extraits
automatiquement drsquoun texte en fonction de leur freacutequence drsquooccurrence
Nuage de tags preacutesente les tags correspondant agrave un site (ou agrave plusieurs) en les
regroupant sur un mecircme espace et leur attribuant une taille variable suivant la
freacutequence dutilisation ou drsquooccurrence Cela donne une vision drsquoensemble des
principales theacutematiques Le site Tagcrowdcom14 permet de geacuteneacuterer un nuage de
tags agrave partir drsquoun texte
Folksonomie (traduit eacutegalement parfois par potonomie peuplonomiehellip)
Ce mot valise contraction de folk (peuple) et taxonomie deacutesigne une forme de
classification collaborative deacutecentraliseacutee spontaneacutee baseacutee non pas sur un
vocabulaire controcircleacute et standardiseacute mais sur des termes choisis par les utilisateurs
eux-mecircmes intituleacutes tags Lrsquoobjectif eacutetant de faciliter lrsquoindexation des contenus
ainsi que la recherche drsquoinformation
Blogs journal personnel disponible sur le web Peut ecirctre tenu par un particulier
un chercheur un journaliste un salarieacute drsquoentreprise ou plus rarement par un groupe
de personne (entreprise collectiviteacutehellip) Le blog a pour objet de diffuser des billets
geacuteneacuteralement lieacutes agrave lrsquoactualiteacute et preacutesenteacutes par ordre chronologique alors qursquoun
wiki est destineacute agrave la mutualisation des connaissances Un blog peut preacutesenter des
contenus multimeacutedias photo (photoblog) son ou videacuteo (vblog vlog)hellip
Blogosphegravere la biosphegravere des blogs Ce mot valise deacutesigne la communauteacute
des blogs ou encore lrsquoensemble des auteurs de blogs La blogosphegravere est largement
interconnecteacutee les trackbacks situeacutes sur la plupart des blogs permettant de lier
copy Digimind Digimind Services ndash White Paper |12
Le Web 20 pour la veille et recherche dinformation DIGIMIND
deux articles traitant de sujets connexes Lrsquoeacutelite des blogueurs particuliegraverement
influents peut ecirctre qualifieacutee ironiquement de blogeoisie
Blogroll ou blogoliste liste de liens vers drsquoautres blogs preacutesenteacutes par lrsquoauteur
drsquoun blog On peut syndiquer sur une mecircme page des billets venant de ces blogs via
les formats RSS
RSS lrsquoacronyme signifie selon les versions Really Simple Syndication (RSS 20) RDF
Site Summary (RSS 09 10 et 11) ou encore Rich Site Summary (RSS 091) Ce
format de syndication permet drsquoextraire automatiquement dun site web ou drsquoun
blog du contenu reacuteguliegraverement mis agrave jour Un fichier RSS est un simple fichier texte
au format XML comportant la description syntheacutetique du contenu Ce format a eacuteteacute
creacuteeacute en 1999 par Netscape On peut srsquoabonner gratuitement agrave plusieurs flux RSS agrave
partir drsquoun lecteur on-line ou installeacute sur le PC
Atom Format normaliseacute de syndication de contenu Web baseacute sur le XML qui
permet la syndication de contenu entre diffeacuterentes ressources Web Concurrent
de RSS Le format Atom a eacuteteacute creacuteeacute dans le but de simplifier les diffeacuterents formats
RSS existants La diffeacuterence entre les deux formats reacuteside surtout dans lemploi de
balises XML diffeacuterentes Les deux formats sont geacuteneacuteralement lus par les
agreacutegateurs
Wiki Site web dynamique dont tout visiteur peut modifier les pages agrave loisir Le
terme vient la langue hawaiumlenne (wikiwiki = rapide) Un wiki a pour objectif de
mutualiser des connaissances et est organiseacute autour drsquoun plan de classement Les
contributeurs drsquoun wiki sont geacuteneacuteralement anonymes
Crowdsourcing Litteacuteralement approvisionnement par la foule Le
crowdsourcing consiste agrave utiliser la creacuteativiteacute lintelligence et le savoir-faire dun
grand nombre dinternautes pour creacuteer des contenus participer agrave lrsquoalimentation
drsquoun site Cette participation des utilisateurs agrave la creacuteation des contenus repreacutesente
une forme drsquoexternalisation (outsourcing) et permet de reacuteduire les coucircts en se
basant sur un systegraveme de beacuteneacutevolat ou de micropaiement
Reacuteseaux sociaux de nombreux sites de social networking ou reacuteseautage social
sont apparus avec la vague du Web 20 Ils permettent de mettre en relation des
personnes partageant les mecircmes centres drsquointeacuterecirct personnels ou professionnels
Ces reacuteseaux peuvent devenir de veacuteritables communauteacutes en ligne les plus fameux
eacutetant les sites Friendster ou Myspace ou bien dans la sphegravere professionnelle
copy Digimind Digimind Services ndash White Paper |13
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Linkedin ViadeohellipLa plupart des reacuteseaux sont ouverts certains fonctionnent sur le
mode de la cooptation
Podcasts issu de la combinaison des termes iPod (dApple) et broadcasting ce
terme deacutesigne le fait de rendre disponible en ligne un fichier audio au format
numeacuterique Ce fichier peut-ecirctre teacuteleacutechargeacute directement sur un ordinateur ou un
peacuteripheacuterique via un flux de diffusion Equivalent franccedilais baladodiffusion
Lrsquoutilisateur peut ainsi se composer une liste de lecture agrave la carte Pour les fichiers
videacuteo on emploi le terme de videacuteocast
AJAX (Asynchronous JavaScript And XML) meacutethode informatique de
deacuteveloppement dapplications Web permettant deacuteconomiser de la bande passante
en ne rechargeant pas une page entiegravere alors que seuls certains eacuteleacutements ont besoin
de lecirctre mais en ne rafraicircchissant que ces eacuteleacutements de la page Cela permet de
produire des contenus dynamiques et reacuteactifs en ne neacutecessitant que peu drsquoappels au
serveur heacutebergeant la page AJAX est une combinaison de plusieurs technologies
HTML CSS Javascript XMLhellipDe nombreux sites web 20 sont deacuteveloppeacutes en
AJAX
API Interface de programmation permettant agrave un utilisateur de deacutevelopper des
applications conviviales De nombreux sites classiques ou Web 20 proposent des
API pour inteacutegrer automatiquement leur contenu agrave dautres sites
Mashup ou Mash up application web composite mixant plusieurs sources ou
plusieurs contenus pour fournir un nouveau produit ou service Le terme se traduit
en franccedilais par remixage ou mosaiumlque Exemple de mashup la visualisation des
reacutesultats des eacutelections preacutesidentielles franccedilaises via Google Earth qui mixe les cartes
Google et les chiffres du Ministegravere de lInteacuterieur
Long tail (longue traicircne) Cette expression est utiliseacutee en statistiques et peut
srsquoappliquer au marketing Des produits rares ou qui font lrsquoobjet drsquoune faible
demande peuvent collectivement repreacutesenter une part de marcheacute eacutegale ou
supeacuterieure agrave celle des best-sellers si les canaux de distribution peuvent proposer
assez de choix Le caractegravere virtuel du web permet de geacuteneacuterer une longue seacuterie de
marcheacutes de niche heacuteteacuterogegravenes (exemple e-bay) par opposition aux grands
marcheacutes homogegravenes et grand public du monde reacuteel
copy Digimind Digimind Services ndash White Paper |14
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les technologies du Web 20
Mettons dabord les choses au point le Web 20 nest pas une (r)eacutevolution ou un
concept de dimension technologique
Ses applications sappuient sur des technologies deacutejagrave existantes reacutepondant aux doux
noms dAjax Soap REST RSS Perl Python PHP Ruby ou GreaseMonkey Lobjectif de
ce document nest pas de deacutevelopper ce volet technologique Nous en eacutevoquerons
seulement les grandes caracteacuteristiques pour mieux comprendre les enjeux
Le Web 2 repose notamment sur les interfaces utilisateurs dites riches qui
permettent des possibiliteacutes daffichage de configuration et de maniement plus
puissantes que les pages html classiques du Web 1 que ce soit pour le
deacuteveloppeur ou lutilisateur final
Tim Berners Lee co-inventeur du web remarque en fait ce Web 20 utilise les
standards qursquoont produit tous ces gens qui travaillent sur le Web 10 le Document
object model HTML et SVG (Scalable Vector Graphics) HTTPhellip Le Web 20
construit des services en srsquoappuyant sur les standards du web ainsi que sur JavaScript
(hellip)
Pour se structurer en reacuteseau de bases de donneacutees et services collaboratifs le web
20 utilise donc des technologies matures acircgeacutees de 5 agrave 10 ans pour la plupart
Leacutevolution nest pas tant dans la technologie elle-mecircme que dans la faccedilon de mixer
ces technologies pour apporter des services et une ergonomie nouvelle agrave
lutilisateur
Ainsi lAjax (voir glossaire) que lon cite souvent agrave propos des technologies phares
du Web 2 nest pas un nouveau langage mais un nouveau concept qui utilise les
standards XHTML et CSS DOM (Document Object Model) pour laffichage
dynamique XML et XSLT pour leacutechange de donneacutees ainsi que la reacutecupeacuteration de
donneacutees asynchrones via XMLHttpRequest JavaScript integravegre et combine tout ces
langages Le terme Ajax a eacuteteacute apporteacute par Jesse James Garrett de lrsquoagence web
Adaptive Path
copy Digimind Digimind Services ndash White Paper |15
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LAjax permet notamment de ne recharger que certains eacuteleacutements dune page plutocirct
que la page entiegravere Lors de modifications sur une page seuls les nouveaux
eacuteleacutements se rafraicircchissent eacuteconomisant ainsi des ressources du temps et de la
bande passante Lun des preacutecurseurs grand public dans lutilisation de cette
technologie fut A9 le moteur de recherche dAmazon il neacutetait pas neacutecessaire de
recharger la page agrave chaque fois que lon ajoutait de nouvelles sources et moteurs agrave
interroger 15
Greasemonkey est eacutegalement baseacute sur des scripts Cette extension pour le
navigateur Mozilla Firefox va encore plus loin dans le pouvoir accordeacute agrave linternaute
en exeacutecutant des scripts ce plug-in 16 permet de modifier lapparence des pages
web visiteacutees dy ajouter des fonctions (boutons case agrave cocher suppression des
publiciteacutes) Lutilisateur avanceacute peut mecircme eacutecrire ses propres scripts ou
teacuteleacutecharger des scripts mis agrave la disposition de tous
Le Web 2 est en fait une sorte de web lego qui permet dinnover via lassemblage
de briques les technologies de base sont multiples il est possible de creacuteer de
nouvelles applications agrave valeur ajouteacutee en les assemblant diffeacuteremment ou plus
rationnellement
Les mash-up un mixage de plusieurs applications (voir glossaire) en est une des
illustrations les plus visibles avec les mashups on agreacutege le contenu eacutemanant de
plusieurs sites afin de creacuteer un site nouveau On utilise alors souvent lobjet XML
lAJAX du cocircteacute de linternaute les RSS et les API (Web Services) des sites mixeacutes
LAPI nest donc pas seulement un dieu eacutegyptien Pour faire simple on peut dire
que cest une interface de programmation mise agrave disposition des internautes
(avertis) pour deacutevelopper des applications Une application pourra alors acceacuteder agrave
des programmes systegraveme pour envoyer recevoir ou extraire des donneacutees Ainsi
Google publie lAPI de Google Maps qui est utiliseacute par de nombreux deacuteveloppeurs
pour creacuteer des applications deacuteriveacutees du service de cartographie de Google par
exemple la carte de suivi du teacutelescope spatial Hubble la meacuteteacuteo dans le monde 17
Le rocircle du RSS (voir glossaire) est par ailleurs preacutepondeacuterant Ce format qui
permet dexporter et lire des donneacutees dactualiteacutes au format XML se retrouve dans
quasiment toutes les applications dites Web 2 et peut en constituer lemblegraveme sinon
la caracteacuteristique majeure avec les tags Il permet de surveiller les flux de nouvelles
informations issues de sites dactualiteacutes de blogs de moteurs de recherchehellipbref
de tout site web qui propose un contenu qui se renouvelle Le RSS va aussi servir agrave
exporter des bookmarks sociaux que sont les tags ou les favoris par exemple
copy Digimind Digimind Services ndash White Paper |16
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Si le Web 2 nest pas une reacutevolution technologique en soit la relative simpliciteacute de
mise en place de ces techniques et leurs coucircts de programmation reacuteduits expliquent
le tregraves fort deacuteveloppement que connaissent toutes ces applications Par ailleurs la
baisse constante du coucirct dheacutebergement et de bande passante a faciliteacute la diffusion
de ce web nouvelle geacuteneacuteration
Mais il subsiste des effets de seuil Des applications gigantesques comme Flickr de
Yahoo offrant lheacutebergement et le partage de photos impliquent la gestion de
vastes bases de donneacutees et des infrastructures de stockage importantes Seules de
grandes firmes comme Yahoo Inc Google Microsoft ou AOL par exemple peuvent
se deacutepartir efficacement de ce type de contraintes
copy Digimind Digimind Services ndash White Paper |17
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les familles dapplications du Web 20
TYPOLOGIE
Les familles drsquoapplications Web 20 sont nombreuses et diverses de nouveaux
services apparaissent quotidiennement (sans garantie de peacuterenniteacutehellipet bien souvent
de faccedilon redondante) Sans preacutetendre dresser une liste exhaustive des nombreuses
possibiliteacutes on peut deacutegager une typologie des applications selon diffeacuterents
domaines drsquoactiviteacute Les applications speacutecifiquement deacutedieacutees agrave la veille et agrave la
recherche dinformation seront deacuteveloppeacutees dans la partie suivante
Bureautique en ligne
Courant 2006 Google a lanceacute successivement plusieurs logiciels collaboratifs en
ligne un outil de gestion drsquoagendas (Google Calendar 18) un tableur (Google
Spreadsheet) et enfin apregraves le rachat de la socieacuteteacute Writely un traitement de texte
(Google Docs) 19 Ces logiciels permettent de creacuteer modifier partager et publier en
ligne des documents sur un espace de stockage Depuis plusieurs mois on assiste agrave
une veacuteritable deacuteferlante de logiciels de bureautique en ligne deacutesigneacutes parfois sous le
terme de web office RallyPoint AjaxWrite (pour Firefox uniquement) ZohoWriter
ThinkfreehellipOutre la gratuiteacute lrsquointeacuterecirct de ces logiciels concurrents de la suite
Microsoft Office est leur disponibiliteacute sur toute machine connecteacutee au reacuteseau et tout
systegraveme drsquoexploitation Attention toutefois aux questions de sauvegarde de
compatibiliteacute de synchronisation des donneacutees et enfin de confidentialiteacutehellip
Emploi
Les blogs constituent un bon moyen pour promouvoir son CV mettre en avant
expeacuterience et compeacutetences et faciliter les eacutechanges Des jobblogs verticaux
speacutecialiseacutes par secteur ou reacutegion connaissent un grand succegraves (voir par exemple
ceux du site et moteur Moovement20) Le networking professionnel est eacutegalement agrave
la mode agrave travers des sites comme Linkedin (creacuteeacute en 2003 aux Etats-Unis) Viadeo
(ex Viaduc drsquoorigine franccedilaise) ou Xing (ex OpenBC agrave vocation europeacuteenne) Le
principe est de tirer parti des reacuteseaux de connexions sociales virtuelles afin
copy Digimind Digimind Services ndash White Paper |18
Le Web 20 pour la veille et recherche dinformation DIGIMIND
drsquoidentifier des salarieacutes ou employeurs potentiels mais aussi drsquoeacutetoffer son reacuteseau de
clients partenaires fournisseurshellip
Lrsquoe-cooptation (Cooptin Jobmeeters 21) met le reacuteseau au cœur de la deacutemarche de
recrutement via un systegraveme de prime de cooptation et peut aider les demandeurs
agrave identifier les offres du marcheacute cacheacute
Commerce en ligne
Le client est roi et le Web 20 permet de rehausser son niveau de participation sur
les sites marchands On peut ainsi tagger ou annoter des reacutefeacuterences drsquoouvrages dans
le catalogue Amazon Gracircce agrave des sites comme Zlio ou la Shoposphegravere de Yahoo22
les internautes peuvent recommander agrave leur entourage des produits et
serviceshellipen touchant une commission sur les ventes reacutealiseacutees Des guides drsquoachat
et comparateurs de prix comme Ciao integravegrent les avis de consommateurs et
drsquoexperts Le site Wantuno (inspireacute de lrsquoameacutericain Woot) innove dans le domaine
de la vente eacuteveacutenementielle en vendant un seul produit nouveau high tech par jour
annonceacute en podcast videacuteo agrave des internautes preacutevenus par flux RSS23 Certains
analystes voient lrsquoavenir du commerce eacutelectronique dans le concept de CtoB
(Consumer to Business) inverse du BtoChellip
Geacuteolocalisation
Google Maps a eacuteteacute lrsquoun des premiers services de geacuteolocalisation en srsquoappuyant sur
lrsquooutil de recherche pour localiser sur des cartes des services de proximiteacute
(commerces station servicehellip) La version 2 du site Geacuteoportail de lrsquoIGN disponible
depuis fin mai 2007 srsquoenrichit de nouveaux services pratiques et citoyens (accegraves au
cadastre visualisation des zones agrave risquehellip) Google Earth fait lrsquoobjet de partenariats
avec la NASA ou le programme des Nations Unies pour lrsquoenvironnement La
geacuteolocalisation peut srsquoadapter eacutegalement au partage de photos (Yahoo Maps et
Flickr ou le projet Pikeo chez Orange)24
Recherche drsquoinformations
Des agreacutegateurs de meacutedia comme Digg ou Wikio laissent une large place agrave
lrsquointernaute pour tagger ou recommander par vote les articles issus de meacutedias
classiques ou blogs On suivra eacutegalement lrsquoactualiteacute en syndiquant des flux RSS agrave
travers des agreacutegateurs comme Netvibes ou Newsgator Les grands moteurs (Google
Custom Search Yahoo Search Builder MSN Live search Macros) offrent des options de
copy Digimind Digimind Services ndash White Paper |19
Le Web 20 pour la veille et recherche dinformation DIGIMIND
creacuteation de moteurs personnalisables effectuant des recherches sur des bouquets
de sources preacuteseacutelectionneacutees par lrsquoutilisateur On peut mutualiser les connaissances agrave
travers des wikis collaboratifs geacuteneacuteralistes (Wikipedia) ou speacutecialiseacutes Enfin le projet
de moteur collaboratif Wikiasari qui doit aboutir courant 2007 aura recours aux
mecircmes technologies libres que la ceacutelegravebre encyclopeacutedie ainsi qursquoagrave un reacuteseau humain
ou communauteacute de confiance qui validera les reacutesultats de la recherche
Les actualiteacutes sur Wikio sites de presse blogs et navigation par tags (agrave droite)
Diffusion drsquoactualiteacutes
Pour Pierre Chappaz fondateur du site Wikio les blogueurs ne sont pas journalistes
mais ils peuvent apporter une vraie expertise sur certains sujets quils connaissent et il
serait dommage de sen priver Selon lui les meacutedias 20 ne seront plus des canaux
exclusifs de diffusion mais producteurs de contenu et des marques Deacutesormais le
scoop nrsquoest plus lrsquoapanage des seuls journalistes aux Etats-Unis une jurisprudence
donne droit depuis 2006 aux blogueurs de proteacuteger leurs sources au mecircme titre
que les journalistes professionnels Des centaines de blogs politiques ont fleuri sur le
web certains drsquoentre eux se reacuteveacutelant particuliegraverement influents On parlera de
journalisme citoyen agrave propos de sites comme Agoravox ou de lrsquo alleacutee
numeacuterique Rue 89 lanceacutee en mai 2007 par drsquoanciens journalistes du quotidien
Libeacuteration Ces nouveaux meacutedias en ligne marient les communications venant de
journalistes professionnels experts et internautes
copy Digimind Digimind Services ndash White Paper |20
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Loisirs
On retrouve ici la notion de filtrage collaboratif baseacute sur un systegraveme de
recommandations et drsquoeacutevaluations par les utilisateurs Ces recommandations
peuvent concerner les livres les destinations de voyage la musique la videacuteohellipet
proviennent de lrsquoanalyse de comportements drsquoachats des internautes et de leurs
eacutevaluations de produits Le moteur drsquoanalyse preacutedictive Criteo 25 a ainsi lanceacute en
feacutevrier 2007 un service de recommandations automatique de blogs apregraves avoir
utiliseacute sa technologie pour lrsquoeacutevaluation de videacuteos
La participation des internautes peut aller jusqursquoau financement et agrave la production
drsquoœuvres artistiques le projet A swarm of angels permet drsquoaider agrave la creacuteation de
films qui seront distribueacutes sous licence creative commons et diffuseacutes via les reacuteseaux
peer-to-peer
Partage de documents multimeacutedia
Il srsquoagit sans doute drsquoune des applications les plus reacutepandues du Web 20 Les grands
acteurs du web ont largement investi ce domaine Google a racheteacute en 2006 le site
de partage de videacuteo Youtube Yahoo de son cocircteacute avait racheteacute le site de partage de
photos Flickr Les favoris peuvent eacutegalement ecirctre mutualiseacutes via des services en
ligne comme Delicious (groupe Yahoo) ou Blogmarks De nombreux services de
partages de photos videacuteo ou podcasts se sont deacuteveloppeacutes reacutecemment on peut
citer parmi eux les sites franccedilais DailyMotion ou la banque drsquoimages Fotolia Podemus
ou Radioblog figurent parmi les sites communautaires de podcasts
Enseignement et recherche
Henry Jenkins26 professeur au MIT imagine des uniteacutes drsquoenseignement conccedilues
sur les modegraveles YouTube ou Wikipedia des deacutepartements qui ldquopermettraient le
deacuteploiement rapide drsquoexpertises disperseacutees et la reconfiguration des champsrdquo De
nouveaux usages apparaissent dans le paysage eacuteducatif mais attention lagrave encore agrave
lrsquoillusion de faciliteacute selon le philosophe Fernando Savater laquo Internet neacuteduque pas il
neacutecessite mecircme une eacuteducation preacutealable raquo Olivier Ertzcheid dans son blog Affordance 27 distingue plusieurs eacuteleacutements caracteacuteristiques drsquoune science 20 et notamment
la possibiliteacute drsquoannoter et commenter des publications scientifiques (notamment les
collections Open Acess Plos One28) ou de nouveaux modes drsquointerrogation des
bases de donneacutees (interface Hubmed sur la base meacutedicale Medline)
copy Digimind Digimind Services ndash White Paper |21
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Marie France Blanquet29 maicirctre de confeacuterence en sciences de lrsquoinformation
distingue le travail coopeacuteratif du travail collaboratif En matiegravere drsquoapprentissage le
travail coopeacuteratif reacutealiseacute par chaque eacutequipe contribue agrave une œuvre collective ougrave le
rocircle de chacun est deacutefini de faccedilon claire Lrsquoapprentissage collaboratif reacutesulte du
travail individuel soutenu par des activiteacutes de groupe ou drsquoeacutequipes de faccedilon souple
et ouverte Ce type de travail se base sur les capaciteacutes de communication et
drsquointeraction de chacun Lrsquoeacutecriture collective des articles composant lrsquoencyclopeacutedie
Wikipeacutedia en est un exemple
Plusieurs expeacuterimentations drsquousage des blogs et podcasts ont eacuteteacute tenteacutees agrave
lrsquoUniversiteacute A Lyon II des eacutetudiants ont pu enregistrer des cours sur un Ipod pour
diffusion en podcast sur leurs blogs A lrsquoUniversiteacute Catholique de Lille les eacutetudiants
de Jean-Paul Pinte30 chargeacute de lrsquoinnovation peacutedagogique doivent alimenter
reacuteguliegraverement un blog Pour ce chercheur speacutecialiste de la veille en eacuteducation le
renouveau des meacutethodes drsquoenseignement se traduit par le rocircles des Enseignants
Connecteurs et eacutetudiants proneacutetaires
Bibliothegraveques
La bibliothegraveque 20 place elle aussi lrsquoutilisateur au centre et ce agrave travers plusieurs
types drsquoexpeacuterimentations de lrsquoutilisation des logiciels de messagerie instantaneacutee
pour eacutechanger avec les utilisateurs agrave lrsquointeacutegration de tags pour enrichir les
catalogues en passant par des interfaces de consultation simplifieacuteeshellip De
nombreux blogs de bibliotheacutecaires (Bibliobsession 31) permettent de suivre lrsquoeacutetat de
lrsquoart La bibliothegraveque de lrsquoUniversiteacute drsquoAlbany est alleacutee jusqursquoagrave publier un manifeste
du bibliotheacutecaire 20 32
copy Digimind Digimind Services ndash White Paper |22
Le Web 20 pour la veille et recherche dinformation DIGIMIND
COMMENT IDENTIFIER UN SITE WEB 20
Est-ce que le site sur lequel vous naviguez ou lapplication que vous utilisez est
Web 20 Quelle importance pourrait-on reacutepondrehellipToutefois un site de cette
geacuteneacuteration offrira plus de possibiliteacutes agrave vous lutilisateur Pour reconnaicirctre un tel
site quelques caracteacuteristiques sont agrave retenir
- le type de site il appartiendra agrave lune des grandes familles citeacutees plus haut il sera
blog bookmark ou reacuteseau social mashup ou page personnalisable bref il permet
de partager et de diffuser du contenu aiseacutement Le site peut ecirctre lui-mecircme une
application Web 2 ou en inteacutegrer des briques Exemple un site Corporate qui
heacuteberge des blogs de ses salarieacutes etou diffuse son actualiteacute via un fils RSS
- le rocircle de lutilisateur le site Web 2 vous permet de participer de personnaliser
et de collaborer vous pouvez en effet ajouter des commentaires eacutecrire un billet
lire un flux RSS noter (voter) ou annoter un article teacuteleacutecharger ou uploader des
images des videacuteos eacutecouter un podcast Ces sites proposent souvent des interfaces
personnalisables couleurs style organisation de laffichage du contenuhellip
- la navigation elle est plutocirct simplifieacutee par rapport aux sites de premiegravere
geacuteneacuteration Les menus sont plus leacutegers un flux RSS est toujours proposeacute et un
nuage de tags est souvent preacutesent
- le testeur cest vous non content de faire apporter une partie de son contenu par
linternaute un service Web 20 fait en plus souvent tester ses applications agrave ses
utilisateurs et est donc freacutequemment en version becircta (voire alpha) une becircta
publique ou priveacutee (linternaute fait alors partie dun petit cercle dinitieacutes dans le
secret des dieux)
copy Digimind Digimind Services ndash White Paper |23
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les applications Web 20
pour la veille et la
recherche dinformations
LES TYPES DAPPLICATIONS
Pour le veilleur et le chercheur dinformation les applications du Web 20 sont
riches tant dans les possibiliteacutes offertes par leurs interfaces que dans le contenu
diffuseacute Mieux connaicirctre ces services permettra de trouver davantage dinformation
(ou autrement) de gagner du temps de mieux partager voire decirctre plus visible sur
le web
Vous laurez compris le web 20 se fonde essentiellement sur la notion de partage
de participation et de collaboration entre les individus Ce nest pas forceacutement
toujours facile possible voire autoriseacute dans le monde professionnel Mais partager
cest aussi agrave terme pouvoir recevoirhellip
I Partager et collaborer
a Les Bookmarks sociaux
Les bookmarks sociaux sont une des applications les plus caracteacuteristiques du Web 2
et en sont preacutecurseurs Apparus en 2004 ces services vous offrent la possibiliteacute de
partager vos bookmarks cest-agrave-dire vos favoris Ainsi apregraves enregistrement le plus
souvent gratuit vous pouvez mettre en ligne tout ou partie de vos favoris (titre
copy Digimind Digimind Services ndash White Paper |24
Le Web 20 pour la veille et recherche dinformation DIGIMIND
adresse et description dune page ou site) et les rendre potentiellement accessibles
aux internautes du monde entier et du moins aux utilisateurs de ce service Vous
avez la possibiliteacute de garder ces favoris priveacutes en ne les partageant quavec vos
proches ou seulementhellipvous-mecircme
Ces applications sont au deacutepart tregraves simples et proposent ensuite suivant les sites
plus ou moins de perfectionnements il suffit dajouter le nom et ladresse (url) de la
page web qui vous inteacuteresse assortis des commentaires de votre choix Ces
adresses web sont rattacheacutees agrave un espace qui vous est personnel auquel vous
acceacutedez en vous identifiant Cet espace personnel est identifiable via une adresse
preacutecise Par exemple sur Delicious33 (de Yahoo) lun des services de bookmarks
sociaux les plus utiliseacutes lurl deacutesignant mes favoris est httpdeliciousslide68 En
naviguant sur Delicious vous pouvez acceacuteder aux favoris mis en ligne par des
collaborateurs amis ou inconnus qui partagent les mecircmes inteacuterecircts et passions que
vous Leurs pages sont eacutegalement identifieacutees par une url unique
Lajout dadresse
Lajout dadresse seffectue en se connectant directement sur le site de
bookmarking social ou plus pratique via une barre ou un bouton deacutedieacutes qui
inteacutegreacutes agrave votre navigateur facilitent lajout du site que vous ecirctes en train de visiter
Vous pouvez eacutegalement trouver des icocircnes sur des pages web vous proposant
dajouter un contenu un site agrave votre service de social bookmaking Peut-ecirctre avez-
vous deacutejagrave rencontreacute ces icocircnes agrave la fin dun billet de blog par exemple (voir
illustration ci-dessous) Ils permettent alors dajouter ladresse du billet agrave un ou
plusieurs services de bookmarks sociaux ainsi quagrave des services dactualiteacutes
collaboratives (nous en reparlerons plus bas)
copy Digimind Digimind Services ndash White Paper |25
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ce blog propose via des icocircnes lajout de ce billet dans les favoris de Delicious ou les services sociaux dactualiteacutes
Lorsque vous ajoutez une adresse vous lui attribuez des tags (voir glossaire) cest-agrave-
dire un ou plusieurs mots cleacutes de votre choix qui vont caracteacuteriser expliquer
contextualiser eacutetiqueter le favori et donc lidentifier de maniegravere simple pour vous et
tous les visiteurs Cest une information qui vient sajouter agrave la traditionnelle
description du site Cest donc vous qui choisissez votre propre mode de
classement de hieacuterarchisation et de labellisation (et non plus un service qui vous
propose de ranger vos ressources dans des cateacutegories preacutedeacutefinies) Cette possibiliteacute
fait partie de ce que lon appelle la folksonomie agrave savoir une taxonomie (science du
classement) populaire en quelque sorte
Ainsi vous pouvez ajouter ladresse du site portail NanotechNow
httpwwwnanotech-nowcom consacreacute aux nanotechnologies et y adjoindre les
tags nano nanotehnologies sciences science research mais aussi pourquoi
pas qualiteacute excellent pour donner votre opinion
copy Digimind Digimind Services ndash White Paper |26
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Des favoris consacreacutes agrave la Chine dans Delicious A droite les tags associeacutes agrave ces bookmarks Les tags
Sur une application typique de social bookmarking (type delicious) il est possible
de rechercher sur le titre des favoris de tous les autres utilisateurs et aussi sur
leurs tags Ainsi en cliquant sur le tag Nanotech vous obtiendrez la liste de tous
les favoris que les internautes ont classeacutes sous ce label Cest lagrave lun des principaux
inteacuterecircts la possibiliteacute de rechercher sur le nom des eacutetiquettes textuelles deacutefinies
par les internautes eux-mecircmes Mais tous les internautes nont pas la mecircme logique
de classement et il est fort possible de passer agrave coteacute de favoris inteacuteressants mais
eacutetiqueteacutes selon un mot auquel vous nauriez jamais penseacute De plus un mecircme mot
peut avoir plusieurs sens ou ecirctre employeacute diffeacuteremment selon les individus
Delicious a reacutesolu ndashpartiellement- ce problegraveme en offrant la possibiliteacute de deacutecrire
ses tags cest agrave dire de les expliquer (par orange je parle de la couleur ou de la
production dagrumes en Floride) Cest donc un deacutebut de seacutemantique appliqueacute agrave
cette folksonomie Quoiquil en soit le problegraveme du sens des mots employeacutes par
les creacuteateurs de contenu concerne lensemble du web Lorsque vous ne trouvez
pas un site via une requecircte sur un outil de recherche et que ce site existe pourtant
bel et bien cest souvent parce que vous nemployez pas les mecircmes mots cleacutes que
ceux utiliseacutes par le creacuteateur du site dans son texte
Les tags peuvent eacutegalement sappliquer agrave des photos (Flickr) agrave des projets
(43Things) ou des videacuteos (YouTube DailyMotion) Ils peuvent servir aussi agrave eacutetiqueter
et cateacutegoriser les billets dun blog
copy Digimind Digimind Services ndash White Paper |27
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les communauteacutes
Lautre atout des bookmarks sociaux pouvoir constituer et se connecter avec
une communauteacute de speacutecialistes Par speacutecialiste on deacutesignera simplement un
internaute qui centre ses recherches sur les mecircmes sujets que vous quil soit
amateur ou professionnel
Exemple Votre domaine ce sont les biotechnologies En entrant la requecircte
Biotechnologies sur le moteur de recherche de Delicious vous obtenez une liste
de plusieurs milliers de favoris Pour chacun dentre eux est indiqueacute le nombre de
personnes qui ont sauvegardeacute cette mecircme adresse En seacutelectionnant lun de ces
utilisateurs vous pouvez deacutecouvrir un internaute qui comme vous reacuteguliegraverement
ajoute des adresses de sites deacutedieacutes ou connexes aux biotech Il ne vous reste plus
quagrave mettre en surveillance ce membre de delicious Il disposera en effet de sa
propre adresse XML Exemple httpdeliciousrssvantive98 Vous serez alors
averti degraves lors que cet utilisateur ajoute un favori agrave sa page
La valeur des outils de social bookmarking est encore plus probante lorsquils sont
deacutedieacutes agrave des communauteacutes de pratiques ou agrave des secteurs dactiviteacutes bien preacutecis
Plusieurs initiatives ont deacutejagrave eacuteteacute mises en ligne34 On peut citer Connotea eacutediteacute par
la ceacutelegravebre revue Nature et donc destineacute agrave un public scientifique Lors de la mise en
favoris ce service extrait automatiquement les reacutefeacuterences bibliographiques
lorsquelles sont issues de sites tels que Nature Science ou PubMed Plus ancien
CiteUlike est baseacute sur le mecircme principe mais est compatible avec davantage de
revues scientifiques encore Snipitron est lui deacutedieacute aux chercheurs eacutetudiants et
professionnels Ici vos bookmarks font partie dun projet qui seacutecoule dans le temps
concernant une recherche ou une tacircche preacutecise
Linteacuterecirct des bookmarks sociaux est donc dabord dans lutilisation de la
communauteacute afin de trouver des sources pertinentes Ce type doutil reacutevegravele toute
sa puissance lorsquun utilisateur proche de vous en terme de domaines de veille a
eacuteteacute identifieacute Vous pouvez donc alors lutiliser comme collaborateur virtuel mais
aussi rechercher parmi les sources jugeacutees pertinentes par un groupe dutilisateurs
identifier des leaders de veille ou juger de la populariteacute dune source (combien de
fois a-t-elle eacuteteacute mise en favoris Ce nombre de sauvegardes neacutetant quun indicateur
parmi dautres) Si vous ne partagez pas ces outils restent toutefois un tregraves bon
moyen de meacutemoriser et cateacutegoriser vos favoris en un point unique daccegraves
copy Digimind Digimind Services ndash White Paper |28
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Quel service
Il existe plusieurs dizaines de services de bookmarks sociaux Ils proposent des
fonctionnaliteacutes plus ou moins sophistiqueacutees Un des critegraveres essentiels de choix est
leur succegraves En effet leur force repose en grande partie sur le nombre de favoris
dutilisateurs partageacutes agrave moins de freacutequenter des bookmarks deacutedieacutes agrave des
communauteacutes tregraves cibleacutees Dautre part la rapiditeacute du service et la pertinence de
son moteur de recherche sont aussi des paramegravetres importants
Delicious qui appartient agrave Yahoo est lun des plus connus et des plus utiliseacutes Yahoo
MyWeb2 rassemble eacutegalement une grande communauteacute ainsi que Furl ou encore
Blogmarks et Blinklist35 Certains de ces sites au-delagrave de larchivage de ladresse
proposent de conserver une copie inteacutegrale dune page web Dautres vous
suggegraverent des sites similaires agrave ceux que vous avez mis dans vos favoris Cette
similariteacute se base notamment sur les favoris ajouteacutes par les autres utilisateurs La
recherche par similariteacute (ou par suggestion en fonction de vos habitudes de
navigation) offerte par des services comme Yoono StumbleUpon ou Similicious 36 est
une meacutethodologie de recherche particuliegraverement inteacuteressante Nous en reparlerons
plus loin
Pour choisir preacuteciseacutement votre service de bookmarks sociaux vous pouvez vous
aider de ces ressources 37
- le site Irox propose un tableau comparatif de pregraves de 20 services
- le blog de Robin Good offre une seacutelection inteacuteressante de bookmarks sociaux
- la page Free Bookmark Managers affiche une liste dune quarantaine de logiciels et
utilitaires deacutedieacutes au partage et agrave la gestion de vos favoris (bookmarks) en ligne via
accegraves distant en local ou sur serveur Attention tous ne sont pas sociaux cest-agrave-
dire baseacutes sur le partage
copy Digimind Digimind Services ndash White Paper |29
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b Le Multimeacutedia photos et videacuteos
Le partage de vos ressources ne se limite pas au texte et adresse de sites Il est
eacutegalement possible de partager vos photos et videacuteos
Les images
Flickr 38 racheteacute par Yahoo Inc en 2005 est lapplication type de partage dimages
voire mecircme larcheacutetype du service Web 20 ce site permet de mettre en ligne ses
photos de les partager avec ses proches ses collegravegues ou de les laisser en accegraves
priveacute
Il est possible dutiliser un moteur pour rechercher agrave travers les millions de photos
mises en ligne par les autres utilisateurs
Flickr na pas de points communs avec les nombreuses applications Web 2 en becircta agrave
linterface artisanale Sur le service de Yahoo la puissante interface en fait un outil
tregraves simple agrave utiliser Ainsi via le menu Organize vous pouvez acceacuteder agrave une
veacuteritable table de montage virtuelle pour organiser vos photos
copy Digimind Digimind Services ndash White Paper |30
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche sur Flickr A droite les noms dutilisateurs et les tags associeacutes aux photos
Comme sur les bookmarks sociaux la recherche peut seffectuer sur le titre ou la
description mais aussi sur les tags chaque internaute qui partage ses photos leur
attribue des mots cleacutes pour les deacutefinir les expliquer les contextualiser voire donner
son opinion
Chaque liste de reacutesultats chaque photo est accompagneacutee par ses tags Ceux-ci
permettent aussi daffiner ou deacutelargir votre recherche lorsque vous en seacutelectionnez
un Il est possible de rechercher sur les photos les utilisateurs mais aussi sur les
groupes En effet la notion de communauteacute est eacutegalement importante Les
groupes rassemblent les utilisateurs qui partagent les mecircmes centres dinteacuterecirct
photographiques Des forums de discussions sont inteacutegreacutes agrave ces groupes
permettant dentrer en contact direct avec certains membres
copy Digimind Digimind Services ndash White Paper |31
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Par exemple le groupe The Eyes Have It 39 rassemble les utilisateurs (et donc leurs
photos) autour du thegraveme de la communication visuelle des secteurs pharmacie et
biotech
Que peut trouver le veilleur sur un service de photos tel que Flickr
Finalement la mecircme chose que sur les bookmarks sociaux tout ce que les
membres ont voulu partager des photos du dernier salon automobile de Detroit 40
ou de la convention annuelle des industries cosmeacutetiques dAmeacuterique du Nord La
veille concurrentielle ou la veille image sur votre propre socieacuteteacute est eacutegalement
inteacuteressante Ainsi une recherche (full text) sur la socieacuteteacute peacutetroliegravere Exxon affiche
plus de 1400 photos relatives aux stations services aux puits de peacutetrole aux
raffineries aux employeacutes aux manifestions de contestataires ou aux publiciteacutes
deacutetourneacutees
Comme avec le social bookmarking vous pouvez vous attacher agrave suivre les
membres qui partagent les mecircmes centres dinteacuterecirct que vous ou votre organisation
apregraves seacutelection de la page de lutilisateur la mise en surveillance de son flux RSS
permet decirctre averti degraves que cette personne ajoute de nouvelles photos
Dautres services permettant le partage de photos existent Toutefois ils ne vont
pas aussi loin que Flickr dans la logique Web 20 Le service PhotoBucket 41 est le
grand concurrent de Flickr mais avec une approche plus grand public Flickr est
davantage freacutequenteacute par des internautes avertis des professionnels et des
passionneacutes de photographie En ce sens le service de Yahoo sera donc plus
inteacuteressant pour le veilleur
Squidoo 42 est en quelque sorte un annuaire de bookmarks perfectionneacute une
rencontre de services sociaux comme Delicious et Flickr Squidoo vous permet en
effet de creacuteer une page de liens dans un domaine qui vous passionne et de la
structurer en rubriques agreacutementeacutees de photos
Linterface simple rend possible la creacuteation rapide de pages speacutecialiseacutees (appeleacutees
lensgtobjectifs lentilles) et de les rendre visible agrave tout un chacun On trouve par
exemple plusieurs lens consacreacutees aux nanotechnologies43 Chaque lens est
accompagneacutee de tags connexes agrave son sujet
Vous pouvez rechercher ces pages gracircce agrave un moteur de recherche un reacutepertoire
par cateacutegories un nuage de tags (exemple le tag Marketing 44) ou mecircme parcourir
le Top100
copy Digimind Digimind Services ndash White Paper |32
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La videacuteo
Via les services YouTube ou DailyMotion le partage de videacuteos en ligne est plus
meacutediatiseacute que les services de photos Notamment parce que le leader Google a
racheteacute YouTube en octobre 2006 geacuteneacuterant un buzz sans preacutecegravedent au sein des
blogs et de la presse traditionnelle (Mainstream medias)
YouTube 45 et ses concurrents Web 20 fonctionnent agrave peu pregraves de maniegravere
eacutequivalente agrave Flickr sans en atteindre toutefois sa clarteacute ergonomique
Tout ces sites de videacuteos vont permettre drsquouploader (charger vers le site) et
partager vos videacuteos (converties automatiquement au format FlashVideo) et aussi
bien sucircr de rechercher parmi les videacuteos des autres utilisateurs
Sur ces applications on retrouve de nombreuses caracteacuteristiques du Web 2 les
videacuteos classeacutees par cateacutegories sont accompagneacutees de tags qui aident agrave les
contextualiser et les deacutecrire en plus du titre et de la description renseigneacutes par
lutilisateur Un fils RSS permet de surveiller lajout de videacuteos dans une cateacutegorie ou
par un utilisateur deacutefini A linstar des billets dun blog les internautes peuvent
commenter les videacuteos De plus les videacuteos sont noteacutees ce qui impacte ensuite leur
place dans le classement et donc leur visibiliteacute
Ces services contiennent des favoris inteacutegreacutes ougrave lon peut sauvegarder ses videacuteos
preacutefeacutereacutees Il est possible de partager sa videacuteo par mail ou messagerie instantaneacutee
de la poster sur son blog Dailleurs de nombreux blogueurs utilisent les services de
type YouTube (ou Flickr pour la photo) pour stocker leurs fichiers multimeacutedias trop
volumineux pour les heacutebergeurs de blogs La notion de groupe comme sur Flickr
est preacutesente des communauteacutes rassemblent des utilisateurs autour de grandes
theacutematiques lieacutees par exemple agrave la politique aux sports et aux voyages
YouTube a de nombreux concurrents aux fonctions tregraves proches Impossible de
tous les mentionner Mais on peut retenir cependant le franccedilais DailyMotion 46 tregraves
populaire dailleurs neacute quelques semaines avant YouTube Citons eacutegalement Yahoo
Videos AOL Videos Revver Grouper (de Sony) Metacafe SoapBox (de Microsoft)
Zudeo Wideo MySpace Vimeo 47Certains de ces services proposent du contenu
amateur ainsi que des films professionnels issus des networks de TV et de cineacutema
Mais les plus petits services se cantonnent aux videacuteos envoyeacutees par linternaute que
celles-ci aient dailleurs eacuteteacute copieacutees ou non
copy Digimind Digimind Services ndash White Paper |33
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche sur DailyMotion
Quel contenu agrave usage professionnel le veilleur peut espeacuterer trouver sur ces
plateformes Essentiellement des videacuteos consacreacutees agrave des socieacuteteacutes et individus
Ainsi si je reacuteitegravere ma recherche sur la socieacuteteacute peacutetroliegravere Exxon jobtiens des videacuteos
sur des manifestations des mareacutees noires le reacutechauffement climatique des
actualiteacutes boursiegraveres des retransmissions de procegraves des deacutetournements de
publiciteacutehellipLa recherche de videacuteos saverra particuliegraverement utile pour une veille
Image Produits ou concurrentielle Le contenu de videacuteos est eacutegalement souvent
tregraves politique agrave partir de la campagne des eacutelections preacutesidentielles franccedilaises de
2007 la diffusion de videacuteos sur les hommes et femmes politiques est devenue une
veacuteritable arme Autre aspect inteacuteressant la possibiliteacute de deacutecouvrir de nombreux
extraits de videacuteos de documentaires sur des sujets extrecircmement varieacutes eacutecologie
industrie socieacuteteacute consommation
Le contenu de ces services de videacuteos est donc agrave limage du net heacuteteacuterogegravene mais
potentiellement riche
copy Digimind Digimind Services ndash White Paper |34
Le Web 20 pour la veille et recherche dinformation DIGIMIND
c Partage de CV et reacuteseaux sociaux
Termineacute le temps ou seules les personnes agrave qui vous transmettiez votre CV ou
votre carte de visite pouvaient prendre connaissance de votre identiteacute et de votre
parcours professionnel Via les plateformes de reacuteseaux sociaux le push fait place au
pull de plus dans une optique de cooptation et de recommandation il y est
possible de mettre son CV en ligne sous format hypertexte et de demander agrave
rentrer en relation avec des proches de votre reacuteseau immeacutediat Les plateformes de
reacuteseaux sociaux sont nombreuses certaines sont agrave vocation geacuteneacuteraliste dautres
uniquement deacutedieacutees aux actifs dautres encore reacuteserveacutees agrave une communauteacute
(eacutetudiants lyceacuteens anciens eacutelegraveves passionneacutes de voyages)
Ces applications repreacutesentent un marcheacute conseacutequent puisque pour les seuls USA
on preacutevoit un chiffre daffaires des reacuteseaux sociaux de 25 milliards de dollars agrave
lhorizon 2011 contre 350 millions en 200648 La France est domineacutee par la
plateforme Viadeo (ex-Viaduc)49 Ce service leader lanceacute en 2004 compte plus de
750 000 profils Dans les autres pays cest LinkedIn 50 qui domine geacuteneacuteralement
avec plus de 9 millions dutilisateurs dans 135 pays
Une recherche sur Viadeo
copy Digimind Digimind Services ndash White Paper |35
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les fonctionnaliteacutes
Que trouve-t-on sur ces sites Notamment des profils de personnes en activiteacute ou
en recherche demploi ainsi que des hubs regroupant des utilisateurs autour dun
mecircme centre dinteacuterecirct toujours la notion de communauteacutes de pratiques propre au
Web 20 Sur ces services tout est penseacute pour creacuteer du lien social Le profil
individuel se constitue dun CV enrichi de nombreux liens vers ses employeurs ses
amis ses reacuteseaux professionnels et associatifs ses travaux et publications Les hubs
regroupent les personnes autour de secteurs meacutetiers associations danciens eacutelegraveves
pays reacutegions Par exemple sur Viadeo saffichent les hubs Analyse Veille
Strateacutegique amp Concurrentielle Intelligence Eco Blogs amp Bloggers Editeurs de
Logiciels Profession documentaliste and co mais aussi Grande distribution
Oceacuteanie ou Normes meacutethodes et outils Dans ces hubs des forums organisent les
discussions des membres autour de theacutematiques deacutefinies Un moteur de recherche
permet de trouver des profils selon un secteur une fonction une reacutegion Une fois
un profil identifieacute il faut demander agrave entrer en relation avec lui Cela sera dautant
plus facile et rapide sil est peu eacuteloigneacute de votre propre reacuteseau de contacts
La veille
Linteacuterecirct pour le professionnel de linformation est double il peut augmenter sa
visibiliteacute et celle de certains de ses projets services publications thegraveses ou articles
Dautre part il peut rechercher des donneacutees sur des personnes et entreprises ou
identifier un expert Comme sur dautres services Web 20 il est facile de se
constituer une communauteacute dutilisateurs partageant ses centres dinteacuterecirct que lon
visitera reacuteguliegraverement Ainsi sur Viadeo une recherche sur le secteur Agro-
alimentaire avec le mot cleacute veilleur 1 affiche plus de 50 reacutesultats avec les fonctions
entreprises et synthegraveses de parcours des membres Vous pouvez alors entrer en
relation avec ces personnes ou tout simplement collecter des donneacutees sur celles-ci
et leurs reacuteseaux Ces sites sont dailleurs devenus un outil essentiel pour certaines
fonctions commerciaux pour la prospection recruteurs journalistes
ethellipresponsables de casting pour eacutemissions TV
1 Certaines fonctionnaliteacutes avanceacutees sont payantes
copy Digimind Digimind Services ndash White Paper |36
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les autres reacuteseaux
Parmi les autres services de reacuteseaux sociaux outre LinkedIn davantage tourneacute agrave
linternational il existe assez utiliseacutes en France 6nergiesnet et Xing (ex Open BC)51
Les reacuteseaux ciblant plus particuliegraverement les jeunes (FaceBook MySpace) peuvent
eacutegalement ecirctre utiliseacutes MySpace feacutedegravere plus particuliegraverement des professions de la
communication de la publiciteacute et des meacutetiers multimeacutedias
Le reacuteseau FaceBook52 est original ce site nord-ameacutericain est preacutecurseur dun social
networking tregraves segmenteacute reacuteserveacute aux eacutetudiants et aux lyceacuteens Au deacutepart les
membres devaient sinscrire obligatoirement via lemail de leur universiteacute afin de
garantir lauthenticiteacute des profils et donc le seacuterieux de la communauteacute Depuis
FaceBook sest ouvert aussi aux entreprises Ainsi ce site capte tregraves tocirct les futurs
actifs et les fideacutelise
Des ressources
Certaines ressources peuvent vous aider agrave identifier les plateformes de reacuteseaux
sociaux professionnels utiles pour vos recherches Le wiki List of social networking
websites liste de nombreuses plateformes de reacuteseaux sociaux 53 et le site Link n
Rank cateacutegorise des sites de social networking 54
copy Digimind Digimind Services ndash White Paper |37
Le Web 20 pour la veille et recherche dinformation DIGIMIND
d Les sites dactualiteacutes collaboratives recommandation et notation
Ces sites recouvrent en fait diffeacuterents types dapplications
- Les Digg Like Ces services qui sinspirent tous du preacutecurseur Digg55 recueillent des actualiteacutes
proposeacutees par les internautes Le principe apregraves enregistrement un formulaire
simple vous permet de poster lactualiteacute de votre choix susceptible dinteacuteresser les
autres internautes son titre son url sa description Il faut aussi choisir une
cateacutegorie Par exemple Technologies Sciences Monde Affaires Divertissement Ces
cateacutegories peuvent ecirctre subdiviseacutees en theacutematiques plus fines Lactualiteacute si elle est
valideacutee par les modeacuterateurs apparaicirctra alors en ligne Elle sera noteacutee par les autres
internautes qui votent pour elle selon son inteacuterecirct Les actualiteacutes disposant du plus
grand nombre de points se placent alors en haut du classement
La cateacutegorie Sciences sur Digg A gauche les nombres de votes
Ces sites affichent les principales caracteacuteristiques du Web 20 interface eacutepureacutee
possibiliteacute de laisser des commentaires fils RSS pour surveiller les nouvelles
actualiteacutes classement des articles les plus lus les mieux noteacutes possibiliteacute denvoyer
par mail ou de bloguer un article et bien sucircr forte contribution de linternaute Sur
certains sites leacutetiquetage des articles via le systegraveme de tags est proposeacute
copy Digimind Digimind Services ndash White Paper |38
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Linteacuterecirct est de pouvoir positionner certaines informations les unes par rapport aux
autres et connaicirctre la populariteacute dune actualiteacute ou dun sujet (entreprise personne)
abordeacute (la critique de mon produit est-elle tregraves populaire ) Cest une approche
alternative aux agreacutegateurs de news de type Google Actualiteacutes ou Yahoo Actualiteacutes
qui hieacuterarchisent les news avec de puissants algorithmes mais sans recourir agrave
lhumain Ainsi Google Actualiteacutes preacutecise La seacutelection et le positionnement des
articles de cette page ont eacuteteacute reacutealiseacutes automatiquement par un programme
informatique
En outre sur ces services de type Digg linformation nest pas brute linternaute
qui poste lactualiteacute peut selon son expertise y apporter un commentaire de
valeur Linformation peut ecirctre commenteacutee (en plus du vote) par les autres
internautes Comme de nombreux blogueurs les utilisateurs des Digg Like jouent
aux journalistes ou tout simplement donnent leur opinion
Lorsquil sagit dactualiteacutes concernant le produit ou le service dune socieacuteteacute ces
commentaires positifs ou non sont une veacuteritable manne pour de nombreux
professionnels de linformation veilleurs marketeurs chargeacutes deacutetudes et autres
analystes qui vont pouvoir recueillir agrave moindre frais des informations sur leur
nouveau produit leurs clients ou ceux de la concurrence
Digg est lun des sites les plus copieacutes du Web 20 Sil reste la reacutefeacuterence dautres
applications tregraves largement inspireacutees tirent leur eacutepingle du jeu En France Scoopeo
Fuzz et TapeMoi offrent eux aussi des services dactualiteacutes collaboratives On peut
eacutegalement citer Rojo le canadien Niouz lespagnol Meneames le reacuteseau de sites
BlogMemes 56 Mecircme Netscape pionnier du navigateur web a lanceacute un portail
sinspirant du systegraveme de notation de Digg
On peut reprocher agrave ce type de site de favoriser les cateacutegories techniques et
scientifiques faisant la part belle aux contributions des geeks et autres accrocs du
net grands utilisateurs de services Web 2 Toutefois les sites comme Blogmemes ou
Netscape diffusent davantage dactualiteacutes agrave teneur eacuteconomique et sociale
- Les mix actualiteacutes contributions des internautes
Wikio57 est un service dorigine franccedilaise (creacuteeacute par le fondateur de Kelkoo) agrave
lintersection de Google Actualiteacutes et de Digg En effet Wikio mixe les articles issus
de sites dactualiteacutes de blogs avec des contributions des internautes On peut
prendre connaissance des informations de diffeacuterentes maniegraveres
copy Digimind Digimind Services ndash White Paper |39
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- En naviguant via les theacutematiques (France International Politique Economie
Finance Santeacute Science hellip) ou via le nuage de tags dynamiques qui se modifient en
fonction de la rubrique ou vous vous situez
- En recherchant via le moteur
- En sabonnant aux flux RSS agrave chaque cateacutegorie et agrave chaque tag correspond son
flux RSS De mecircme lorsque vous lancez une requecircte via le moteur vous pourrez
surveiller ces reacutesultats via un flux RSS
- les plateformes de contributeurs indeacutependants
La deacutefiance et la volonteacute dindeacutependance vis-agrave-vis des grands meacutedias traditionnels de
la presse eacutecrite et audio-visuelle se sont traduites degraves 2001 par la creacuteation massive
de blogs Les blogueurs sont-ils et peuvent-ils simproviser journalistes Ce deacutebat
qui promet decirctre sans fin est inteacuteressant De nombreux blogueurs (mais pas la
majoriteacute) sont devenus de veacuteritables experts dans leur domaine agrave force deacutecriture
de lecture et danalyses quotidiennes Ainsi les mainstream medias invitent
maintenant dans leurs colonnes et plateaux les blogueurs les plus talentueux
Ces blogueurs experts ou professionnels ne constituent pas les seuls creacuteateurs
dactualiteacutes alternatives
Des initiatives de plateformes dactualiteacutes eacutecrites par des non professionnels ont
aussi vu le jour Agoravox58 est lun des premiers portails de journalisme citoyen
lanceacute par Joeumll de Rosnay et Carlo Revelli 59 en mai 2005 Agoravox permet aux
internautes de proposer leurs articles pour commenter reacutefleacutechir agrave des sujets
dactualiteacutes si possible avec une approche et un regard diffeacuterents des meacutedias
traditionnels Le format des contributions est multimeacutedia Le site explique Tout le
monde peut devenir reacutedacteur drsquoAgoraVox Il nrsquoest pas neacutecessaire de savoir eacutecrire avec
un style journalistique affirmeacute Chacun drsquoentre nous peut devenir une sorte de capteur
en temps reacuteel de ce qui se passe dans notre entourage en fournissant des articles des
images des extraits videacuteo ou audio Ce qui est important crsquoest de pouvoir teacutemoigner
drsquoun eacuteveacutenement auquel vous avez assisteacute ou que vous avez deacutecouvert en faisant des
recherches Il poursuit Pourquoi devenir reacutedacteur Tout simplement pour faire
entendre votre voix et pour relater des faits que vous avez identifieacutes et qui ne vous
paraissent pas ecirctre suffisamment repris dans les meacutedias traditionnels voire ignoreacutes ou
censureacutes
Agoravox encourage donc agrave utiliser son style personnel Il convient de sinscrire pour
devenir reacutedacteur Les articles doivent toutefois obeacuteir agrave une politique eacuteditoriale60
Un comiteacute de reacutedaction valide ensuite les contributions
copy Digimind Digimind Services ndash White Paper |40
Le Web 20 pour la veille et recherche dinformation DIGIMIND
En quelques mois Agoravox a prouveacute que de simples internautes pouvaient ecirctre
aussi bon reacutedacteurs et experts en fonction de leurs profession passion et
centres dinteacuterecirct agrave linstar des blogueurs professionnels
Agoravox na pas la vocation dun agreacutegateur dactualiteacutes de type Digg Wikio ou
Google News Cest une sorte de quotidien qui privileacutegie les articles de fond et
lanalyse Bien sucircr des reacutedacteurs stars eacutecrivent reacuteguliegraverement et leurs articles
sont attendus Mais ce ne sont pas les rubriqueurs traditionnels des autres meacutedias
Comme sur les autres sites Web 20 le lecteur peut attribuer une note dinteacuterecirct agrave
chaque article et poster un commentaire Enfin leacutetonnante technologie
ReadSpeaker 61 permet de retranscrire automatiquement tous les textes en version
audio
Agoravox nest pas le seul exemple de site de journalisme citoyen Le portail
OhMyNews 62 initiative coreacuteenne est baseacute sur le mecircme principe Lanceacute en feacutevrier
2000 le reacuteseau international OhMyNews reacuteunit plus de 40 000 reacutedacteurs
Pour le veilleur ces sites dactualiteacutes collaboratives constituent des sources
dinformations alternatives avec une partie de lactualiteacute issue des organes et
agences de presse et lautre partie provenant des internautes Dautre part ces
nouveaux meacutedias permettent de deacutecouvrir et surveiller des experts voire des
leaders dopinion
Un article sur Agoravox A droite une preacutesentation de son auteur En haut la possibiliteacute de voter et
commenter larticle
copy Digimind Digimind Services ndash White Paper |41
Le Web 20 pour la veille et recherche dinformation DIGIMIND
II Rechercher Collecter
Doreacutenavant tout internaute peut creacuteer et publier sa propre information
Lidentification des sources dinformation et de linformation elle-mecircme est devenue
complexe car elles sont de plus en plus morceleacutees et atomiseacutees Il convient
dutiliser une large palette doutils de recherche pour collecter les donneacutees en
provenance des blogs des bookmarks et reacuteseaux sociaux Pour faciliter la
collecte il est en outre possible de verticaliser la recherche et de faire appel agrave des
humains Par ailleurs dautres outils permettent darchiver ses deacutemarches de
requecirctes et de navigation
a La recherche de blogs et de flux RSS
Le volume de blogs est en constante croissance sur le net Le nombre de blogs a
litteacuteralement exploseacute sur toute la planegravete Estimeacute agrave 70 millions agrave leacuteteacute 2005 ils sont
eacutevalueacutes agrave plus de 120 millions en mars 2007 Technorati lun des moteurs de
recherche de blogs les plus utiliseacutes mesure en 2007 un doublement du nombre de
blogs tous les 320 jours 120 000 blogs seraient ainsi creacuteeacutes chaque jour 63
Europe
33
Afrique 15 000
Ameacuterique du Nord
33
Ameacuterique du Sud
1
Asie
55
5 Australie 790 000
copy Digimind Digimind Services ndash White Paper |42
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Nombre de blogs en milliers et millions (la Russie est inteacutegreacutee dans lAsie) Estimation DIGIMIND Services 64
Les fils RSS omnipreacutesents A chaque blog correspond son flux RSS ce format qui permet dextraire et de
surveiller tout nouveau contenu qui parait sur le blog Si un vrai blog implique
toujours un flux RSS un flux RSS ninduit pas forceacutement un blog En effet le RSS et
son concurrent Atom sont preacutesents sur de plus en plus de type de meacutedias et outils
internet degraves lors que leur contenu est appeleacute agrave se modifier reacuteguliegraverement
On pourra donc trouver des flux RSS sur
-les blogs
-les sites de presse et dactualiteacute Exemple Les Echos Libeacuteration La Tribune Le
Figaro)
-les sites de revues et magazines speacutecialiseacutes Exemple La revue Nature propose ses
fils RSS concernant ses publications speacutecialiseacutees par domaines Science fait de
mecircme65
-les sites corporate des entreprises page dactualiteacutes catalogues produits (Ex Air
Liquide)
-les reacutesultats de moteurs de recherche de blogs Tous proposent des flux RSS
permettant de surveiller une requecircte (Technorati Google Blog Search Feedster
IceRockethellip)
-les pages de reacutesultats de moteur de recherche web Certains de ces moteurs
geacutenegraverent un flux RSS permettant de surveiller lapparition de nouveaux reacutesultats
pour une requecircte donneacutee
MSN Search (devenu Live Search66) le proposait depuis janvier 2005 et chaque page
de reacutesultats offrait une icocircne orange en bas de page permettant dobtenir des fils
RSS Cette icocircne RSS a disparu sur Live Search mais les flux RSS sont toujours lagrave (ils
sont deacutetectables automatiquement avec un navigateur Firefox Maxthon IE7 ou
votre lecteur RSS Attensa ou RSS Bandit par exemple)
Depuis peu Yahoo Search Web 67 offre lui aussi un fils RSS sur ses reacutesultats lagrave
encore deacutetectable via un lecteur ou navigateur (cela fonctionne uniquement pour le
Yahoo US)
copy Digimind Digimind Services ndash White Paper |43
Le Web 20 pour la veille et recherche dinformation DIGIMIND
-les moteurs dactualiteacutes La majoriteacute des portails qui agregravegent des flux dactualiteacutes
proposent des flux RSS Exemple Google Actualiteacutes Yahoo Actualiteacutes Topix MSN
Actualiteacutes Wikiohellip 68
-les Newsgroups Usenet (groupes de discussion) Les fils RSS sont en effet aussi
preacutesents sur Google Groupes (ou Google Groups) ce qui rend plus aiseacute la surveillance
des discussions Chaque groupe (Google ou Usenet) affiche un fils RSS ou Atom 69
(et ce quelque soit la langue) signaleacute par le logo orange RSS en bas de page
-certains forums web Exemple Forum Mobiles 70
-certaines listes de diffusion elles peuvent ecirctre surveilleacutees via labonnement agrave leur
flux RSS Cela eacutevite lengorgement de votre boicircte mail Exemple la liste Veille sur
Yahoo Groupes 71 dispose dun flux RSS
-les bookmarks sociaux Delicious Yahoo MyWeb2 Blogmarks 72hellipLe fils RSS
permet decirctre alerteacute de lajout de nouveaux favoris pour un tag ou un utilisateur
deacutefinis
-les plateformes de partage de photos Exemple Flickr PhotoBucket 73
-les services de partage de videacuteos comme YouTube DailyMotion 74 pour ecirctre alerteacutes
des nouveauteacutes
-de tregraves nombreux sites offrant un contenu qui se renouvelle
copy Digimind Digimind Services ndash White Paper |44
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Veille Corporate La Tribune propose des flux RSS segmenteacutes par socieacuteteacutes
Le veilleur via ces flux RSS pourra surveiller de nombreuses sources
dinformations Par ailleurs au-delagrave des blogs introspectifs dadolescents dont peu
preacutesentent un inteacuterecirct pour les professionnels certains types de blogs peuvent se
reacuteveacuteler utiles
-Le blog dactualiteacute et dopinion preacutesentant reacuteflexions et critiques de journalistes et
internautes
-Le blog theacutematique eacutediteacute par des passionneacutes experts professionnels consultants
et techniciens
-Le blog dentreprise outil de communication externe ou interne agrave linitiative des
salarieacutes ou des dirigeants
copy Digimind Digimind Services ndash White Paper |45
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les outils pour trouver des blogs et flux RSS Sur ces moteurs la recherche seffectue par mots cleacutes classiques ou par tags comme
sur Technorati par exemple Le contenu indexeacute (blogs et flux) est tregraves heacuteteacuterogegravene
Aussi lutilisation de la recherche avanceacutee sur ces outils est souvent neacutecessaire En
effet un blog peut avoir abordeacute la theacutematique deacuteveloppement durable 1 seule fois
parmi ses 4500 billets Il conviendra donc alors de centrer sa recherche sur le titre
du blog ou son url
Les moteurs
Certains moteurs sont deacutedieacutes agrave la recherche de blogs Cest en fait un abus de
langage Ces moteurs se focalisent sur la recherche de flux RSS mais ne peuvent
faire la diffeacuterence entre un flux provenant dun grand journal et celui dun blog
Ainsi le moteur Technorati classe parmi les blogs les plus populaireshellipLe Figaro
Pour mener une recherche efficace il conviendra dutiliser plusieurs moteurs Car
comme pour la recherche web ougrave il ne faut pas se limiter agrave Google au risque de
manquer pregraves de 85 des reacutesultats75 la recherche sur les blogs neacutecessite lemploi
de plusieurs outils76 En voici quelques-uns
gt Google Blog Search Recherche de blogs Google applique sa technologie puissante
aux flux RSS et blogs Linterface est notamment disponible en franccedilais et en anglais
Le moteur est doteacute de fonctions de recherche avanceacutee (recherche sur le titre le
billet recherche par ancienneteacutehellip)
gt Ask Blog amp Flux Ce moteur permet de rechercher parmi les blogs les flux XML
(RSS ou Atom) Et aussi de sabonner agrave un blog ou un flux RSS
gt Feedster Ce moteur recense plus de 900 000 sources et 5000 sont rajouteacutees
chaque jour
gt BlogPulse Indexe plus de 46 millions de blogs
gt Technorati Ce moteur rafraicircchit son index toutes les 5 agrave 15 minutes et
recherche parmi plus de 70 millions de blogs (en avril 2007 77) ou sites proposant
des flux RSS Il est possible de rechercher par mots cleacutes ou par tags
gt Sphere va prendre en compte plusieurs variables pour mieux chercher parmi la
blogosphegravere
- comme pour le contenu web classique les reacuteseaux de liens entrants et sortants
- la qualiteacute de ces liens
copy Digimind Digimind Services ndash White Paper |46
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- les internautes agrave lorigine de ces liens (simple commentateurs ou leaders dopinion)
3 moteurs web integravegrent la recherche sur les blogs au sein de leur recherche
avanceacutee 78
gt Yahoo Search
Pour centrer sa recherche sur les flux RSS et les blogs il convient drsquoaller dans la
recherche avanceacutee (agrave droite de la boite de requecircte) puis dans le menu deacuteroulant
Format de fichiers et de seacutelectionner le format RSSXML
gt Exalead
Apregraves avoir effectueacute votre recherche il suffit de cliquer sur le bouton RSS jaune
dans la fenecirctre Preacuteciser la recherche Au sein des reacutesultats de recherche le flux
RSS est disponible via licocircne RSS Simple et propre
gt Microsoft MSN Live Search
MSN a ameacutelioreacute les interfaces de son moteur pour restreindre la recherche sur les
fils RSS Apregraves laffichage de votre page de reacutesultats vous pouvez affiner votre
recherche gracircce au bouton Flux (ou Feed en anglais) Ce bouton est accessible via
le menu Plus Au sein des reacutesultats de recherche sont alors disponibles lurl du flux
le cache et un lien pour sinscrire au fils RSS
Au-delagrave de ces moteurs speacutecialiseacutes il peut ecirctre beacuteneacutefique de tenter une recherche
sur un moteur Web (Google ou Yahoo Search par exemple) de type blog OR RSS
[votre sujet] Exemple blogs sur les teacuteleacutecoms Cela vous permettra non pas de
chercher au sein des blogs mais de trouver dautres blogs
Les reacutepertoires 79
Comme pour le web un certain nombre dannuaires entendent recenser les blogs
et fils RSS Attention comme la blogosphegravere est tregraves mouvante et en constante
croissance ces guides sont par nature non exhaustifs et leur mise agrave jour reacuteguliegravere
est difficile
gt Blogarama Ce reacutepertoire recense plus de 49 000 blogs classeacutes par cateacutegories
gt RSS Network indexe plus de 150 000 fils RSS
gt RSSFeeds Reacutepertorie plus de 119 000 fils organiseacutes en cateacutegories
copy Digimind Digimind Services ndash White Paper |47
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b La recherche par tags
Nous lavons vu avec la Folksonomie linternaute peut deacutesormais mettre en place et
partager sa propre classification via les tags Lutilisateur affecte leacutetiquette de son
choix agrave ses favoris images videacuteos Lavantage est indeacuteniable cest linternaute qui
deacutefinit son eacutetiquette et non plus un organisme Mais les inconveacutenients sont
nombreux difficile gestion des singulierspluriels problegraveme de synonymes de
signification (que deacutesigne cet internaute par ce tag) dhomonymes de polyseacutemie
dheacuteteacuterogeacuteneacuteiteacute plusieurs tags peuvent designer les mecircmes documents
Toutefois lapproche par tag facilite la recherche dune part en ajoutant une couche
seacutemantique aux documents web et dautre part en permettant une navigation par
concepts de plus en plus abandonneacutee compte tenu de la deacutesertion progressive des
cateacutegories des grands reacutepertoires web par les internautes
De plus on peut tagger pratiquement tout type de contenu web Ainsi les sites 43
Things et son eacutequivalent franccedilais 36 Trucs 80 proposent aux internautes de lister
leurs objectifs expeacuteriences ou projets Chacun de ces projets est taggeacute via un ou
plusieurs mots cleacutes
Les moteurs et meacutetamoteurs de tags
Les moteurs
La plupart des applications de social bookmarking ou de partage de fichiers images
ou videacuteos permettent donc de tagger leur contenu Sur certaines le moteur de
recherche interne rend possible en plus de la recherche sur le full text une
recherche centreacutee sur les tags Cest le cas sur Flickr vous pouvez rechercher au
choix sur le titre et la description des images ou sur les tags associeacutes deacutefinis par les
utilisateurs qui ont placeacute leurs photos
Un outil comme Delicious tag search 81 va vous permettre deffectuer des
recherches via un ou plusieurs tags sur le service de social bookmarking Delicious
Pour la recherche de blogs ou flux RSS le moteur Technorati propose une
recherche classique sur les mots cleacutes contenus dans les billets mais aussi une
copy Digimind Digimind Services ndash White Paper |48
Le Web 20 pour la veille et recherche dinformation DIGIMIND
recherche par tags82 En effet leacutediteur dun blog peut tagger chacun de ses billets
via des mots cleacutes qui les cateacutegorisent Ces mots ou tags seront repris par lindex du
moteur Ainsi la recherche du mot pollution parmi les tags affiche un billet sur le
reacutechauffement climatique Si ce billet est bien cateacutegoriseacute par son auteur dans une
rubriquepollution (parmi dautres) il ne contient pas ce mot dans son texte
toutefois en relation avec le concept de pollution Clairement une recherche
classique sur le seul texte des billets naurait pas rameneacute ce billet ou du moins pas
dans les premiers reacutesultats Autre inteacuterecirct Technorati vous propose des tags
associeacutes Ainsi pour pollution il affiche environment politics global warming science
china energy news air climate climate change autant de mots cleacutes pour eacutelargir ou
affiner vos requecirctes
Le moteur SearchLess 83 offre une approche originale il associe la recherche par
mots cleacutes agrave la recherche par tags Ainsi si vous effectuez une requecircte avec le mot
intelligence vous pouvez preacuteciser par le tag CIA Les reacutesultats seacutelectionneront
donc le mot intelligence sur des contenus (billets de blogs par exemple) taggeacutes CIA
par lutilisateur lui-mecircme on est alors sucircr que les 2 concepts sont intimement lieacutes
Meacutetamoteurs
Des meacutetamoteurs 84 permettent de rechercher sur les diffeacuterents types de contenu
sociaux bookmarks images videacuteos
Ainsi Tag Central agreacutege de nombreux formats web taggeacutes En lui indiquant un
tag il affiche des reacutesultats provenant agrave la fois de Flickr Smugmug (photos)
Technorati (blogs) Blogmarks Connotea Furl delirious (bookmarks sociaux) ou
encore 43Things (listes de projets)
Zewol outil de meacuteta syndication francophone permet de rechercher parmi les tags
(Flickr delicious) mais aussi sur les actualiteacutes (Google News Ask Actualiteacutes
Yahoo Actualiteacutes) les blogs (Technorati IceRocket Google Blog Search Ask
Blogshellip) le buzz (Tapemoi Scoopeo Wikipedia) les videacuteos (Google Videos
Podscope Video Daily Motion) et un mix (Furl Echonimo actualiteacutes Plazoo
Feed24) Concregravetement cest une bonne approche de recherche globale sur de
nombreuses ressources de type Web 20
Il est toujours possible de traquer la preacutesence ou lapparition dun mot clef sur le
web via la mise en surveillance du flux RSS de la requecircte
Ketoag est un outil qui permet dinterroger de nombreux services sociaux
copy Digimind Digimind Services ndash White Paper |49
Le Web 20 pour la veille et recherche dinformation DIGIMIND
(Delicious Furl Diig Wikio Blinklist) mais eacutegalement des moteurs de recherche
(Google Blog Search) Par ailleurs vous pouvez geacuteneacuterer pour chaque requecircte un
flux RSS mais aussi un fichier OPML (format permettant lagreacutegation et leacutechange de
listes de flux RSS)
Gnosh est un meacutetamoteur qui recherche parmi les moteurs web les moteurs de
blogs et les outils de partage de favoris De plus une recherche sur longlet People
vous permet de rechercher parmi les favoris des internautes inscrits agrave la
communauteacute Gnosh
Exalead recherche sur Wikipedia A droite le nuage de tags
Les nuages de tags
Ces nuages regroupent un ensemble de tags dans un mecircme espace en affectant agrave
chacun une taille variant selon leur populariteacute (freacutequence dutilisation ou de requecircte
sur ces mots) ou la densiteacute darticles auxquels ils se reacutefeacuterent (deacutepecircches dactualiteacutes
par exemple)
Les nuages de tags sont devenus agrave la mode car ils permettent une navigation facile
tregraves visuelle au sein dun site dune base de donneacutee ou des reacutesultats dun moteur
Ils apportent une grille de lecture suppleacutementaire agrave des sites dont les menus sont
souvent surchargeacutes ou le contenu atomiseacute
copy Digimind Digimind Services ndash White Paper |50
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Nombreuses sont les applications qui utilisent le nuage de tags pour optimiser la
navigation et mettre en valeur leur contenu le partage de videacuteos (DailyMotion) les
bookmarks sociaux (Delicious MyWeb2 de Yahoo) ou les services dactualiteacutes
collaboratives comme Wikio Certains moteurs comme Exalead ont eacutegalement
choisis dafficher des nuages de tags au sein de leurs pages de reacutesultats Dans ce cas
il sagit dune aide agrave laffinage des requecirctes un clic sur un tag va afficher une
nouvelle page de reacutesultat prenant ce mot en compte
Zibb85 moteur de recherche vertical deacutedieacute au Business to Business utilise aussi le
nuage de tags pour visualiser clairement les mots cleacutes de theacutematiques connexes les
plus freacutequents agrave votre requecircte
Dautres sites plus classiques ont eacutegalement choisi lapproche du nuage de tag pour
rendre leur navigation plus attractive et leurs rubriques plus visibles Ainsi le site
Ecrans 86(du journal Libeacuteration) affiche en bas agrave droite un nuage de tags mettant en
valeur son contenu tregraves touffu
Certains outils proposent de geacuteneacuterer des nuages de tags pour des sites ou moteurs
nen disposant pas
Google Tag Cloud Maker 87 est un script pour Firefox qui permet dafficher un nuage
de tags agrave droite des reacutesultats de Google plus un mot est freacutequent dans les reacutesultats
de votre recherche plus la taille dun tag est importante
Newzingo 88 extrait des mots de Google News pour constituer un nuage
doccurrences parmi les termes de lactualiteacute Plus le terme est gros plus les articles
relatifs agrave ce terme sont nombreux Techzingo reacutealise le mecircme process mais cette
fois les cibles sont des meacutedias de reacutefeacuterence dans le High Tech et le logiciel
Slashdot Diggcom et TheRegister
Un nuage de tags sur lInternet Movie Database une maniegravere de naviguer parmi tous les mots cleacutes associeacutes aux films
copy Digimind Digimind Services ndash White Paper |51
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La qualification du contenu par les utilisateurs (rdquofolksonomierdquo) est une reacuteelle valeur
ajouteacutee Les moteurs de recherche font reposer une grande part de lrsquoeffort sur
lrsquoutilisateur final une page de reacutesultats de Google doit ecirctre eacutevalueacutee souvent
interpreacuteteacutee par linternaute La folksonomie fait elle reposer lrsquoeffort de filtrage sur
lrsquoutilisateur initial celui qui va rechercher et appliquer ses propres ldquotagsrdquo Parce
quen amont 1743 personnes ont taggeacute une page avec un groupe de mots cleacutes
lrsquoutilisateur final lors de sa requecircte reccediloit une page de reacutesultats souvent tregraves
pertinente
Sur un moteur classique cest agrave lutilisateur dimaginer ses mots cleacutes pour affiner sa
recherche Sur les bookmarks sociaux de type Delicious les internautes qui
partagent leurs ressources ont deacutejagrave preacutepareacute ce travail daffinage via leurs tags
Prenons le cas dune recherche extrecircme car geacuteneacuterant de la synonymie la requecircte
Jaguar Sur Googlecom on me propose certes des mots cleacutes connexes pour
affiner mais tous sont lieacutes agrave la voiture Sur Delicious les tags afficheacutes sont relatifs agrave
la voiture mais aussi au systegraveme dexploitation agrave un groupe de musique et agrave lanimal
Pouvoir rechercher parmi les tags classifications eacutemanant de lutilisateur peut ecirctre
particuliegraverement inteacuteressant lorsquune recherche classique par mots cleacutes sur le
contenu des documents sest aveacutereacutee infructueuse ou geacutenegravere des reacutesultats peu
pertinents
Le tagging une pratique quotidienne
Selon une enquecircte meneacutee en deacutecembre 2006 par le Pew Internet amp American Life
Project 28 dutilisateurs des internautes ameacutericains ont taggeacute ou cateacutegoriseacute en
ligne des contenus tels que des photos des billets dans des blogs des articles
drsquoactualiteacutehellipSur une base journaliegravere 7 des utilisateurs drsquoInternet pratiquent le
tag en ligne
Ce systegraveme de laquo taxonomie populaire raquo pourrait-il constituer une alternative aux
outils de recherche traditionnels par mots cleacutes Il convient de distinguer les
usages professionnels des usages grand public Olivier Le Deuff 89 reprend dans
son eacutetude sur les Folksonomies la distinction effectueacutee par Thomas Vander
Wal entre les folksonomies eacutetroites (narrow folksonomies) et geacuteneacuterales (broad
folksonomies) Selon Olivier Le Deuff cette distinction est importante car les
premiegraveres sont surtout utiliseacutees dans un objectif individuel tandis que les secondes
privileacutegient lrsquoaspect collectif et collaboratif du partage drsquoinformation Ainsi les sites
de partages de favoris comme delicious ou Connotea sont plutocirct des
folksonomies geacuteneacuterales puisqursquoun mecircme site peut ecirctre partageacute par plusieurs
utilisateurs et recevoir le mecircme tag Ce type de folksonomies srsquoappuyant sur des
copy Digimind Digimind Services ndash White Paper |52
Le Web 20 pour la veille et recherche dinformation DIGIMIND
reacuteseaux sociaux ne fait pas que classer de lrsquoinformation et la partager Il met en
relation des usagers qui partagent les mecircmes centres drsquointeacuterecirct Lrsquousager indexeur
devient agrave son tour un peu indexeacute et mis en relation agrave la fois avec drsquoautres mots-
cleacutes drsquoautres sites et drsquoautres usagers
Il est clair que dans le domaine de lrsquoinformation professionnelle ou speacutecialiseacutee le
manque duniformisation des folksonomies qursquoelles soient geacuteneacuterales ou agrave vocation
plus eacutetroite pose les limites de ce systegraveme Les outils drsquoindexation et de
classification traditionnels ont en effet eacuteteacute creacuteeacutes pour des corpus structureacutes aux
limites clairement deacutefinies et srsquoadressent agrave des utilisateurs experts drsquoun domaine
ou de la recherche drsquoinformation Lrsquoabsence de hieacuterarchisation et de controcircle
constitue agrave la fois le point fort et le point faible de la folksonomie La barriegravere des
langues pourra constituer eacutegalement un obstacle les tags eacutetant parfois meacutelangeacutes
dans un mecircme site sans distinction De plus comme le note Cyril Fievet 90 la
pratique du tagging nrsquoest pas uniforme drsquoun site agrave lrsquoautre Sur Technorati les tags
indexeacutes sont ceux choisis par les blogueurs et fonction du contenu qursquoils ont eux-
mecircmes publieacute Sur delicious en revanche ce sont les internautes qui taguent le
contenu des pages qursquoils conservent dans leurs signets raquo
Il convient eacutegalement drsquoecirctre vigilant quant agrave une utilisation laquo frauduleuse raquo des
tags destineacutee uniquement agrave garantir la populariteacute drsquoun blog comme cela a pu
ecirctre le cas avec les meacuteta-donneacutees incorporeacutees dans le code source drsquoune page
html
Eacutelie Francis et Odile Quesnel preacutesentent dans la revue Documentaliste Sciences
de lrsquoinformation les quatre modes drsquoindexation et de classification sur le web la
classification personnelle lrsquoindexation par lrsquoauteur lrsquoindexation par lrsquoutilisateur et la
classification globale Et srsquointerrogent sur lrsquoavenir de lrsquoindexation collaborative agrave la
croiseacutee de la qualiteacute (liberteacute diversiteacute enrichissement) et de la deacutesinformation
(subjectiviteacute manque de coheacuterence)
Il nrsquoen reste pas moins que folksonomie et indexation classique ne srsquoopposent pas
neacutecessairement et constituent des moyens de description de contenus adapteacutes agrave
des contextes diffeacuterents Stephen Lee creacuteateur du site Guten Tag voit dans la
folksonomie une sorte de web seacutemantique du pauvre peu oneacutereux agrave mettre en
place mais dont le succegraves reposera sur une seacuterie de bonnes pratiques collectives
Lrsquointeacuterecirct de ce systegraveme reacutesidera non pas dans la capaciteacute agrave trouver une reacuteponse agrave
une question preacutecise mais plutocirct agrave deacutecouvrir des sources originales et peu connues
ou de localiser des experts drsquoun domaine pointu Les tags les plus rares et preacutecis
pourront entre autres trouver leur application dans le domaine de la veille mettant
copy Digimind Digimind Services ndash White Paper |53
Le Web 20 pour la veille et recherche dinformation DIGIMIND
en œuvre la seacuterendipiteacute ou lrsquoart de favoriser le hasard pour des deacutecouvertes
heureuses
Laissons la conclusion sur ce point agrave lrsquoAssociation des Professionnels de
lrsquoInformation et de la Documentation (ADBS) qui estime dans sa newsletter que
Le foisonnement des propositions de mots-cleacutes aboutirait agrave un reacutesultat plus efficace
quune indexation reacutealiseacutee par un vocabulaire contraint Cette affirmation semble
ecirctre deacutemontreacuteehellip pour linstant
c La recherche de personnes et dinformations entreprises
La recherche de donneacutees sur les personnes physiques ou morales seffectuait
jusquici principalement en interrogeant les bases de donneacutees dinformations leacutegales
et financiegraveres gratuites ou payantes Linterrogation de service tel que Societecom
Infogreffe ou Yahoo Finance est bien sucircr encore neacutecessaire Mais il faut compter
maintenant avec les reacuteseaux sociaux professionnels qui eux aussi rassemblent des
donneacutees sur les entreprises ou les individus
Linteacuterecirct des reacuteseaux sociaux
Que peuvent-il apporter par rapport aux services classiques dinformations
dentreprises Dabord comme expliqueacute preacuteceacutedemment ils sont ouverts agrave tous
Les informations y figurant ne sont plus le seul fait de leacutediteur du site et ne sont pas
uniquement constitueacutees par les fichiers de donneacutees leacutegales publieacutees par les
organismes officiels comme le Greffe du Tribunal de Commerce en France Sur les
reacuteseaux sociaux centreacutes sur les personnes le contenu est inteacutegralement ameneacute par
linternaute qui affiche son CV deacutetailleacute ses publications ses oeuvres (textes ou
multimeacutedias) Linteacuterecirct est eacutevident des personnes peu visibles auparavant parce
que ne faisant pas partie des dirigeants dentreprises (geacuterant fondateur membre du
conseil) sont maintenant accessibles et donc requecirctables par les internautes On
peut donc collecter des informations sur un cadre de RampD dune socieacuteteacute de
teacuteleacutecoms concurrente ou sur le management eacutetonnant de telle entreprise de
plasturgie citeacutee dans le CV dun employeacute de passagehellip
A linstar des blogs linformation preacutesente sur les reacuteseaux sociaux ne tient plus du
discours ou des donneacutees officielles puisque cest linternaute qui communique sur sa
vie et son entreprise
copy Digimind Digimind Services ndash White Paper |54
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Geacuterer leacuteparpillement de linformation
Dautres plateformes de social networking mixent linformation collecteacutee sur le web
avec les contributions des utilisateurs (agrave linstar de Wikio pour les actualiteacutes) Ainsi
le service ZoomInfo 91 permet de rechercher des socieacuteteacutes et des personnes en
parcourant des milliers de donneacutees extraites du web mais aussi en provenance de
profils dindividus et dentreprises renseigneacutes par les socieacuteteacutes ou les employeacutes eux-
mecircmes Aussi cohabitent des informations sur des entreprises coteacutees avec des
donneacutees de firmes non coteacutees des fiches de cadres du top management et des
conseils dadministration avec des CV demployeacutes plus fonctionnels
Le franccedilais Ziki 92 utilise aussi des informations collecteacutees sur le web cest une
sorte dannuaire perfectionneacute qui indexe et archive non pas les donneacutees
signaleacutetiques mais les contenus produits par une personne agrave partir du moment ougrave ils
disposent dun flux RSS (billets de blogs photo Flickr favoris Delicioushellip) Ziki ne
permet pas de creacuteer du contenu propre mais agregravege des donneacutees eacutelaboreacutees par un
mecircme individu auparavant eacuteparpilleacutees sur linternet Bref vous ameacuteliorez votre
visibiliteacute et facilitez la recherche de vos productions sur le net en creacuteant un point
unique daccegraves
La recherche sur tous ces reacuteseaux sociaux implique souvent linterrogation
fastidieuse apregraves inscription de plusieurs dizaines de sites
Aussi certains outils 93 proposent une meacutetarecherche en lanccedilant une mecircme
requecircte sur plusieurs services de social networking Stalkerati recherche le nom
dune personne sur les reacuteseaux Friendster et FaceBook Plus complet et ciblant
davantage les reacuteseaux professionnels YoName recherche les noms sur MySpace
LinkedIn Friendster Windows Live Spaces Bebo Digg ou Xanga
Le moteur de recherche de personnes Wink scrute les reacuteseaux sociaux MySpace
Bebo Friendster LinkedIn Live Spaces et autres De plus avec cet outil il est
possible de creacuteer son propre profil et de le connecter agrave des reacuteseaux sociaux
Attention toutefois si vous ecirctes un utilisateur recherchant des donneacutees en franccedilais
la nature des reacutesultats est plutocirct tourneacutee vers le monde anglophone
Ces reacuteseaux sociaux ne sont pas suffisants pour une recherche professionnelle
complegravete A linstar des blogs face agrave la presse traditionnelle ils constituent un
compleacutement inteacuteressant aux bases de donneacutees officielles
copy Digimind Digimind Services ndash White Paper |55
Le Web 20 pour la veille et recherche dinformation DIGIMIND
d Les moteurs de recherche humains
Apregraves ecirctre apparus sur le net agrave la fin des anneacutees 90 les services de questions-
reacuteponses avaient laisseacute la place aux algorithmes tout puissants des moteurs de
recherche de type Google Mais les robots et programmes ont tous besoin dune
intervention humaine pour geacuterer la qualiteacute et la pertinence des reacutesultats
Ainsi tous les grands moteurs majeurs ne font pas confiance agrave leurs seuls
algorithmes Les employeacutes de Yahoo sont mis agrave contribution pour surveiller la
qualiteacute des reacutesultats fournis par le moteur Chez Google et MSN Search des
process deacutevaluation humaine avaient eacuteteacute identifieacutes agrave travers les sites
EvalGooglecom et MSN HRS notamment
La revanche de lhumain
Au-delagrave de ce rating humain sur les reacutesultats de moteurs de recherche de
nombreux services depuis 2 ans mettent agrave disposition des experts en chair et en
os Cest alors un veacuteritable mode collaboratif qui se met en place lorsque le produit
est bien penseacute Cest la cas de Yahoo Answers (Yahoo Questions Reacuteponses en
France) 94 Ce service gratuit de questions reacuteponses lanceacute fin 2005 permet agrave
linternaute de poser une question dans un formulaire Chaque membre de la
communauteacute Yahoo (agrave savoir tout ceux qui disposent dun compte Yahoo) peut
jouer le rocircle dexpert Yahoo propose aussi le service (eacutegalement gratuit) Ask
Yahoo qui propose de reacutepondre agrave vos questions mais cette fois via un groupe
dexperts seacutelectionneacutes par Yahoo Inc Yahoo Answers a certes une orientation
initiale grand public mais des questions un peu techniques voire scientifiques
trouvent reacuteponse En effet parmi tous les contributeurs agrave Yahoo Answers figurent
des meacutetiers et expertises tregraves diverses du fait de son audience importante Il y
cohabite des types de questions varieacutes Quels sont les groupes strateacutegiques de
lindustrie mondiale du jouet Quelles sont les donneacutees eacuteconomiques du marcheacute de
lassurance vie collective en France
Autre point inteacuteressant le service est deacuteployeacute dans de nombreux pays (Etats-Unis
Royaume-Uni Canada Australie Inde Espagne Breacutesil Argentine Mexique Italie
Allemagne Singapour Taiwan Coreacutee du Sud Hong Kong Japon Chinehellip) Aussi il
est possible de localiser certaines questions et de beacuteneacuteficier parfois dune
expertise pays
Lune des raisons du succegraves du service de Yahoo tient au fait de baser les questions
et reacuteponses sur la contribution dinternautes volontaires Chacun participe
constitue un vrai reacuteseau et peut surtout se valoriser en devenant expert dans son
copy Digimind Digimind Services ndash White Paper |56
Le Web 20 pour la veille et recherche dinformation DIGIMIND
domaine de compeacutetences ou sa passion Il est mecircme possible de creacuteer sa propre
communauteacute qui rassemblera vos amis mais aussi vos experts preacutefeacutereacutes qui
reacutepondent agrave vos questions et centres dinteacuterecirct Le pool de reacutepondants nest donc
pas limiteacute agrave une liste restreinte et il sauto-entretient Dautre part les experts
seacutevaluent entre eux et seacutelectionnent parmi une liste si neacutecessaire ce quils
considegraverent comme la meilleure reacuteponse agrave une question
Une question sur Yahoo Answers
Sur ce marcheacute des Questions-Reacuteponses Google a eacutechoueacute notamment parce quil a
seacutepareacute formellement demandeurs et contributeurs limitant ainsi fortement laspect
collaboratif Le Service Google Answers 95 permettait de poser des questions agrave des
experts Mais lagrave ougrave des services concurrents comme Yahoo Answsers Lycos IQ
copy Digimind Digimind Services ndash White Paper |57
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Windows Live QnA96 sont gratuits Google Answers eacutetait un service payant faisant
appel agrave un reacuteseau de 800 experts Aussi Google Answers apregraves 4 ans dactiviteacute a
fermeacute Les questions ne sont deacutesormais plus accepteacutees mais laccegraves aux archives des
questions-reacuteponses est maintenu
Par ailleurs les reacuteseaux sociaux eacutevoqueacutes plus haut ont bien compris la puissance des
communauteacutes pour faire office de speacutecialistes Ainsi avec LinkedIn Answers la
plateforme de reacuteseaux sociaux LinkedIn sest lanceacutee elle aussi dans le service de
QuestionsReacuteponses
Ne pas oublier les services Web 10
Lorsque lon parle de Web 20 on eacutevoque rarement ces services de Questions-
Reacuteponses au profit de sites plus technologiques Pourtant nous sommes ici dans la
logique des bookmarks sociaux partager ses connaissances faire beacuteneacuteficier les
autres de son savoir et en retour profiter de lexpertise de la communauteacute
Comme la plupart des applications Web 2 la seule utilisation des services QR ne
suffit pas Elle doit venir en compleacutement de recherches parallegraveles via dautres outils
Ainsi pour la veille linscription agrave des listes de diffusion permet aussi de poser des
questions agrave des experts ou passionneacutes De plus il subsiste des services dexpert
traditionnels qui sils ne mettent pas laccent sur la collaboration permettent
didentifier des compeacutetences parfois tregraves pointues Certaines ressources
reacutepertorient des milliers dexperts quil faudra ensuite contacter personnellement
pour beacuteneacuteficier de leur conseil Cest le cas du site Expertscom qui identifie des
experts dans des domaines allant de lacoustique agrave la biochimie en passant par
lindustrie peacutetroliegravere97
copy Digimind Digimind Services ndash White Paper |58
Le Web 20 pour la veille et recherche dinformation DIGIMIND
e les moteurs de recherche collaboratifs
Nous lavons vu certains services dactualiteacutes collaboratives proposent des reacutesultats
issus dun mixage entre contribution des internautes et collecte de nouvelles sur le
web Cette approche de mixiteacute se met peu agrave peu en place pour les moteurs de
recherche web En effet les modegraveles algorithmiques ou humains preacutesentent tout 2
leurs limites en terme de pertinence de fiabiliteacute et dexhaustiviteacute
Aussi de plus en plus de projet de moteur mixtes agrave savoir proposant des reacutesultats
web conjointement agrave des reacutesultats etou seacutelections issus dhumains voient le jour
Du web donc mais avec une forte dose de cerveaux humains
Wikiasari
Celui qui fait le plus parler de lui est le projet de Jimmy Wales le co-fondateur de
lencyclopeacutedie Wikipedia Baptiseacute Wikiasari 98 (combinaison de wiki rapide en
hawaiumlen et asari recherche fouilleacutee en japonais) le projet vise agrave creacuteer un outil de
recherche ougrave les internautes pourront influer sur les reacutesultats en notant leur
pertinence etou en en proposant de nouveaux selon leur expertise
Ce type de moteur sinscrit donc agrave lopposeacute doutils comme Google aux algorithmes
automatiques dont les robots sont souvent trompeacutes par des manipulations de
webmasters (spamdexing par exemple)
Cet outil qui devrait voir le jour courant 2007 sappuie sur des infrastructures Open
Source existantes comme Nutch ou Lucent
Cest un projet particuliegraverement inteacuteressant Comme sur lencyclopeacutedie ouverte
Wikipedia ougrave des milliers de contributeurs construisent et alimentent louvrage sur
ce moteur des reacuteseaux de centaines dinternautes pourront apporter leur savoir
pour ameacuteliorer la pertinence des reacutesultats Ce nest plus seulement la puissance de
calcul de machines qui sera mise agrave contribution mais aussi la puissance de la
communauteacute
Derriegravere le projet Wikiasari il y a de gros moyens financiers et humains
lexpeacuterience de la fondation Wikipedia et le potentiel de trafic que pourra apporter
lencyclopeacutedie ouverte Fin 2006 Comscore a en effet classeacute Wikipedia comme le
6egraveme site le plus visiteacute au monde avec 1719 millions de visiteurs uniques au mois
de novembre On peut donc y croire
copy Digimind Digimind Services ndash White Paper |59
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche de sites similaires sur Yoono
Decipho Yoono
Certes lideacutee dun moteur de recherche collaboratif nest pas nouvelle Reacutecemment
on peut citer le lancement du moteur Decipho ou en mars 2006 celui de Yoono
Mecircme si les approches diffegraverent ces outils font tous la part belle agrave lrsquoapport de
chaque utilisateur dans le traitement des reacutesultats
Decipho 99 est un moteur baseacute sur la technologie de Askcom lun des 4 moteurs les
plus utiliseacutes aux USA Linternaute creacuteeacute ses propres cateacutegories de reacutesultats
partageables avec les autres Il peut eacutegalement tagger les reacutesultats afin deacutetiqueter
un site Aussi lors dune requecircte on peut preacuteciser les mots cleacutes classiques avec des
tags On beacuteneacuteficie alors de tous les tags mis en place par la communauteacute des
utilisateurs Un curseur permet de deacutefinir la proportion de cateacutegorisation des
autres utilisateurs agrave prendre en compte dans sa recherche
Le franccedilais Yoono 100 propose une autre deacutemarche encore loutil fonde ses reacutesultats
sur la mutualisation des connaissances des internautes par le partage des favoris Le
copy Digimind Digimind Services ndash White Paper |60
Le Web 20 pour la veille et recherche dinformation DIGIMIND
moteur utilise les favoris que sa communauteacute dutilisateurs a accepteacute de partager
Lors dune requecircte les reacutesultats sont classeacutes par populariteacute agrave savoir selon le
nombre de fois ougrave une page a eacuteteacute mise en favoris par les utilisateurs Une logique
proche de Delicious mais avec Yoono lajout de favoris est automatique De plus
loutil affiche les utilisateurs qui comme vous ont reacutefeacuterenceacute des sites sur la
politique veacuteneacutezuelienne par exemple De cette maniegravere vous pouvez identifier des
passionneacutes ou experts partageant vos domaines de preacutedilections Les reacutesultats ne
sont plus baseacutes sur les seuls algorithmes mais sur lexpeacuterience et la capacitation des
autres utilisateurs
Les initiatives de moteurs collaboratifs plus ou moins inteacuteressantes sont multiples
Foox est un moteur baseacute sur des communauteacutes dinteacuterecirct et sur Webzzle lutilisateur
preacutecise les concepts qui linteacuteressent afin de contextualiser les mots-cleacutes choisis 101
Humains ou algorithmes
Certes le mode collaboratif ne remplacera pas totalement la recherche
algorithmique Les 2 sont compleacutementaires Lune permet dameacuteliorer la pertinence
de prendre en compte des concepts des contextes du sens et non plus simplement
des chaicircnes de caractegraveres Lautre vise lexhaustiviteacute en indexant des milliards de
pages Web Aujourdhui et en attendant le Web seacutemantique ainsi que la recherche
dite naturelle 102 toutes deux grandes quecirctes du monde de linternet seul lapport
de communauteacutes dhumains permet dinjecter un peu de sens agrave une recherche
Mais de son cocircteacute la recherche coopeacuterative comporte bien entendu des risques de
subjectiviteacute
Sur les moteurs de recherche la coopeacuteration peut prendre une autre forme via le
peacuterimeacutetrage des sites agrave interroger la construction dun moteur sur mesure en
quelque sorte Cest la verticalisation de la recherche
copy Digimind Digimind Services ndash White Paper |61
Le Web 20 pour la veille et recherche dinformation DIGIMIND
f La verticalisation par la personnalisation du peacuterimegravetre de recherche
Lune des grandes faiblesses des moteurs de recherche web agrave large eacutechelle (Google
Exalead Yahoo MSNhellip) est le bruit geacuteneacutereacute par certaines requecirctes Lorsque vous
tapez puma le moteur ne sait pas agrave priori si vous vous inteacuteressez aux vecirctements
de sport agrave lanimal ou aux heacutelicoptegraveres Or si vous ne reacutealisez des recherches que
dans laeacuterospatiale vous devrez souvent deacutesambiguiumlser par vos mots cleacutes ce qui
engendre une perte de temps voire de reacutesultats si vos requecirctes deviennent trop
restrictives
Certains moteurs ou meacutetamoteurs clusteacuterisent (cateacutegorisent) les reacutesultats en les
rassemblant par groupes (grappes) dans de petits dossiers Cette deacutemarche avait
eacuteteacute initieacutee par le moteur Northern Light en 1998 Ainsi tous les reacutesultats relatifs aux
chaussures Puma sont regroupeacutes dans une mecircme valise ceux eacutevoquant lanimal
dans une autre Mais cette solution nest pas complegravetement satisfaisante car elle
seffectue agrave posteriori une fois votre requecircte lanceacutee Le bruit nest pas eacutelimineacute mais
simplement circonscrit dans des sortes de cateacutegories poubelle
Pour beacuteneacuteficier dune deacutemarche agrave priori il convient dutiliser des outils de
recherche verticaux cest-agrave-dire speacutecialiseacutes dans un secteur dactiviteacute une fonction
un type dinformation ou de meacutedias
Face aux problegravemes de pertinence des moteurs geacuteneacuteralistes de plus en plus de
moteurs verticaux voient le jour Ainsi le seul domaine meacutedical a vu apparaicirctre ces
20 derniers mois les moteurs SearchMedica Medstory MedWorm ou encore Medgle 103
Mais si votre secteur de preacutedilection nest pas couvert par un moteur speacutecialiseacute
Cest lagrave quintervient un autre type de moteur collaboratif agrave qui lon peut indiquer le
peacuterimegravetre des sites sur lesquels effectuer la recherche Sur les moteurs classiques
les algorithmes peuvent placer en prioriteacute des reacutesultats sans inteacuterecirct pour vous A
force de navigation et de veille dans votre secteur vous connaissez certainement
10 20 100 sites que vous jugez incontournables et indispensables pour vos
recherches
2 solutions techniques existent
- les outils agrave peacuterimegravetre de recherche personnalisable (adaptable scope)
Ils utilisent les index des moteurs geacuteneacuteralistes (Yahoo ou Google) et restreignent le
scope de leur recherche aux pages des sites que vous avez choisis Ainsi des outils
comme Rollyo Swicki Yahoo Search Builder Google Custom Search 104 vous
demandent dindiquer une liste de sites sur lesquels vous allez limiter votre
recherche Lors dune requecircte les reacutesultats proviendront uniquement des sites de
votre choix Pratique
copy Digimind Digimind Services ndash White Paper |62
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Mais ces outils preacutesentent une limite de taille ils ne prennent en compte que les
pages indexeacutees par Google ou Yahoo Conseacutequence si la reacuteponse pertinente agrave
votre requecircte figure au sein dune page non indexeacutee par le moteur geacuteneacuteraliste vous
nobtenez pas de reacutesultats
De plus en ninterrogeant que lindex dun ou 2 moteurs vous manquerez
obligatoirement de nombreuses informations puisque le nombre de reacutesultats
communs entre les moteurs diminue constamment105
Les pages non indexeacutees par les moteurs geacuteneacuteralistes constituent une part du web
invisible106 et sont plus nombreuses que lon ne croit Ainsi si jinterroge le moteur
interne du site de la prestigieuse revue scientifique The Lancet 107 avec la requecircte
Diabetes jobtiens plus de 2800 reacutesultats Si jeffectue cette mecircme requecircte sur
Google en restreignant ma recherche au site The Lancet (via la syntaxe
sitehttpwwwthelancetcom) jobtienshellip1 reacutesultat Sur Yahoo Search guegravere
mieux 9 reacutesultats Pourquoi Parce que les technologies de ces moteurs ne
permettent pas dindexer correctement tous les sites
La constitution de bouquets de moteurs speacutecialiseacutes sur Digimind Finder
- les outils agrave moteurs personnalisables
La solution pour beacuteneacuteficier des reacutesultats de moteurs internes non indexeacutes par des
Google ou Yahoo est dutiliser un outil permettant dexploiter directement les
moteurs des sites qui vous inteacuteressent et ce sans avoir agrave passer par les index de
moteurs geacuteneacuteralistes Cest le cas du Finder108 mis au point par Digimind un
copy Digimind Digimind Services ndash White Paper |63
Le Web 20 pour la veille et recherche dinformation DIGIMIND
meacutetamoteur qui permet de plugger nimporte quel moteur de son choix et de
linterroger ensuite Il est donc alors simple de se constituer des bouquets de
moteurs speacutecialiseacutes dans votre secteur dactiviteacute De plus cet outil indexe en temps
reacuteel les reacutesultats et les documents retourneacutes par les moteurs interrogeacutes Cela
permet daffiner ensuite vos reacutesultats en interrogeant cet index au contenu
speacutecialiseacute via une recherche avanceacutee Avec le Finder cest donc lutilisateur final qui
constitue sa propre seacutelection de moteurs
copy Digimind Digimind Services ndash White Paper |64
Le Web 20 pour la veille et recherche dinformation DIGIMIND
g Lenrichissement de bases de donneacutees faccedilon Web20
Nous avons vu que les bookmarks sociaux permettaient de mutualiser les
ressources et pour certains autour de communauteacutes deacutedieacutees comme les
scientifiques Avant lapparition des applications Web 20 ont eacuteteacute constitueacutees de
nombreuses bases de donneacutees professionnelles Celles-ci jusquici noffraient pas
aux groupes dutilisateurs la possibiliteacute dinteragir de commenter et deacutechanger
Aussi de plus en plus de grandes bases de donneacutees se dotent dinterfaces
collaboratives et ergonomiques pour laisser plus de place agrave la contribution
PubMed
Cest le cas de lune des plus grandes bases du domaine meacutedical PubMed 109 Cette
immense base bibliographique a vu naicirctre deux initiatives110 pour ameacuteliorer son
interface de recherche
- Avec PubMed Interact la recherche integravegre de lAjax et permet de pondeacuterer via
des curseurs les critegraveres de sources dancienneteacute de nombre de reacutesultats de date
de publication de liens avec le mapping du MeSH (le theacutesaurus de la base) de
filtrage via des cateacutegories Vous pouvez ensuite annoter et attribuer une note de
pertinence agrave vos reacutesultats afficher labstract des articles ou leur texte complet
supprimer des reacutesultats ou encore afficher les articles lieacutes On retrouve donc
lessentiel des fonctionnaliteacutes de lactuel PubMed mais avec une convivialiteacute et
ergonomie Web 20 et donc une plus grande accessibiliteacute
-Hubmed est une autre interface alternative qui ajoute des fonctionnaliteacutes agrave PubMed
application de ses propres tags aux reacutesultats de recherche historique des recherches
clusteacuterisation des reacutesultats visualisation sous forme graphique creacuteation simplifieacutee
de fils RSS avec les mots de votre requecircte suggestion de termes connexes
visualisation de vos mots cleacutes dans larborescence Mesh Le tout est deacuteveloppeacute en
Ajax notamment permettant une navigation plus fluide et plus rapide Parmi toutes
ces fonctions la possibiliteacute de tagger les reacutesultats est tregraves novatrice on peut ainsi se
deacutepartir de la taxonomie de la base via sa propre folksonomie
copy Digimind Digimind Services ndash White Paper |65
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les nombreux reacuteglages de filtres sur linterface PubMed Interact
LUSPTO
LUSPTO 111 est la base des brevets ameacutericains (United States Patent and Trademark
Office)
Cette veacuteneacuterable institution a en projet une plateforme de brevets sociale agrave la
maniegravere dun Digg (cf les services dactualiteacutes collaboratives) les internautes
pourront commenter les brevets en ligne et les eacutevaluer via un systegraveme de notation
Les brevets les mieux noteacutes remonteront alors en haut de classement
copy Digimind Digimind Services ndash White Paper |66
Le Web 20 pour la veille et recherche dinformation DIGIMIND
h Conserver et exploiter lhistorique de vos recherches et navigations
Le chercheur dinformation sur le net perd souvent ses nerfs quand il ne retrouve
plus ce quil a deacutejagrave collecteacute quelque semaines auparavant ou lorsquil lui est
impossible de se souvenir quelle requecircte agrave geacuteneacutereacute ce fameux reacutesultat remarquable
cette veacuteritable peacutepitehellip
Google a reacutesolu partiellement ces problegravemes de meacutemoire Mais comme souvent
cela ne va pas sans certains sacrifices
Via son service Historique Web112 (ex Historique de recherche) vous pouvez apregraves
enregistrement gratuit
- meacutemoriser les requecirctes effectueacutees sur le moteur ainsi que les reacutesultats cliqueacutes
- enregistrer votre navigation sur les pages web
Il est alors possible deffectuer des requecirctes sur et agrave linteacuterieur des pages que vous
avez visiteacutees dans le passeacute (sur le texte les images les videacuteos)
Google affiche donc deacutesormais vos requecirctes la date et lheure de la recherche les
reacutesultats cliqueacutes mais aussi les reacutesultats de recherches qui nrsquoont pas geacuteneacutereacute de clics
Par ailleurs ce service va encore plus loin dans la personnalisation et lanalyse de
votre recherche
Avec la fonction Tendances saffichent vos requecirctes les plus courantes vos sites les
plus visiteacutes les reacutesultats que vous avez le plus cliqueacutes
Plus puissante la fonction Eleacutements inteacuteressants ougrave Google vous propose des
requecirctes et des pages web en relation avec vos habitudes de recherche113
En outre si vous activez cet historique Google lutilisera aussi pour agrave moyen
terme personnaliser vos recherches en fonction de vos centres dinteacuterecirct Le
moteur explique
Vos reacutesultats personnaliseacutes seront baseacutes sur vos recherches preacuteceacutedentes ainsi que les
reacutesultats de recherche et les titres agrave la une sur lesquels vous avez cliqueacute
Dans les premiers temps la diffeacuterence ne sera peut-ecirctre pas notable mais agrave mesure
que votre historique de recherches seacutetoffera les reacutesultats obtenus seront de plus en plus
personnaliseacutes
Dailleurs si vous reacutealisez de nombreuses recherches sur Google avec une
connexion agrave votre compte Google activeacutee vous devriez voir safficher de temps agrave
autre ce type de message Nouveau activez votre historique de recherche pour
personnaliser vos reacutesultats
copy Digimind Digimind Services ndash White Paper |67
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ces reacutesultats personnaliseacutes apprenant selon vos inteacuterecircts permettent de reacutepondre
en partie agrave la probleacutematique de deacutesambiguiumlsation lors de requecirctes sur des
homonymes Ce sont les exemples classiques de lavocat (fruit ou juriste ) de
jaguar (voiture ou animal ) ou de puma (articles de sports animal ou heacutelicoptegravere
)
Cocircteacute vie priveacutee tout votre surf part sur les serveurs de Google Aussi vous
pouvez (devez) mettre en pause lenregistrement de votre navigation lorsque cela
vous apparaicirct adeacutequat
Lhistorique de vos requecirctes et de vos reacutesultats sur Google
copy Digimind Digimind Services ndash White Paper |68
Le Web 20 pour la veille et recherche dinformation DIGIMIND
i Les mash-up
Les mash-up sont certainement les nouveauteacutes engendreacutees par les technologies
dites Web 20 les plus spectaculaires Mixage de plusieurs applications provenant
de plusieurs sites (souvent deux) ils permettent de creacuteer un service nouveau et ce
agrave partir de la mise en relation voire du croisement des donneacutees des applications
dorigines En franccedilais Wikipedia parle dapplications composites 114 Ainsi en
mixant la liste des socieacuteteacutes ougrave il fait bon travailler eacutetablie par le magazine Fortune et
une carte des USA issue de Google Maps on obtient une carte qui localise toutes
ces entreprises De mecircme si on meacutelange les donneacutees dun site de meacuteteacuteo agrave une
carte de France le reacutesultat est une carte des tempeacuteratures et des neacutebulositeacutes en
quasi temps reacuteel 115
Concregravetement comment cela fonctionne-t-il Chacune des applications
communique et eacutechange des informations via des API (voir glossaire) Ainsi Yahoo
Maps ou Google Maps ont ouvert leurs interfaces de programmation agrave tous les
deacuteveloppeurs
Les exemples sont tregraves nombreux car les Mashups ont rapidement connu un vif
succegraves aupregraves des deacuteveloppeurs et internautes avertis qui parviennent agrave maicirctriser le
code et les API Les Mashups de cartographie ne sont pas les seules possibiliteacutes mais
ce sont les plus freacutequents tant la geacuteolocalisation est attrayante pour les
professionnels comme pour linternaute novice Nous allons explorer quelques
mashups pour mieux comprendre leur inteacuterecirct
Les mashups cartographiques les plus courants mixent des cartes et des donneacutees
provenant de services sociaux comme Flickr le service de partage de photo de
Yahoo Inc Cest le cas de Tagmaps116 qui affiche en temps reacuteel sur une carte les tags
associeacutes aux photos de lieux mise en ligne sur Flickr Le Mashup Flickrvision 117 fait
encore plus simple il affiche les photos agrave lemplacement de la ville dorigine de
linternaute qui a posteacute limage lagrave aussi en temps reacuteel
Donneacutees statiques et temps reacuteel
Au-delagrave de certains mixages un peu gadget certains Mashups sont vraiment
inteacuteressants pour la surveillance de donneacutees ou la collecte dinformations En effet
on peut trouver deux grands types de visualisation celle de donneacutees statiques (une
liste dadresse dentreprises geacuteolocaliseacutees) et celle dinformations eacutevoluant en
temps reacuteel Cest le cas par exemple du Mashup SpaceCraft Tracking 118 qui permet
copy Digimind Digimind Services ndash White Paper |69
Le Web 20 pour la veille et recherche dinformation DIGIMIND
de visualiser la trajectoire sur le globe terrestre de la navette spatiale ou du
teacutelescope Hubble
Souvent le Mashup exploite des donneacutees de reacutepertoires douvrages de services
publics pour les rendre plus compreacutehensives attrayantes bref plus accessibles 119
- HealthMap rassemble des donneacutees de santeacute publique et des actualiteacutes issues de
plusieurs sources (Google News OMS European Centre for Disease Prevention and
Controlhellip) afin de reacutealiser une carte des maladies infectieuses dans le monde Cette
carte se met agrave jour au fur et agrave mesure de lactualisation des informations
Linteractiviteacute permet de zoomer sur un pays et de seacutelectionner des pathologies en
particulier
-BioDiesel Station Maps affiche sur une carte les stations services ameacutericaines qui
deacutelivrent des biocarburants
-Kartametro superpose le reacuteseau du meacutetro moscovite agrave la carte de la ville On y
visualise aussi les correspondances avec les bus
-Wikimapia mixe les informations relatives agrave des lieux de Wikipedia agrave une carte
Google Maps Reacutesultat la plupart des noms de villes sites ou monuments sont
cliquables et pointent vers les articles de lencyclopeacutedie
Le Mashup HealthMap ici des actualiteacutes sur les maladies infectieuses en Asie geacuteolocaliseacutees
copy Digimind Digimind Services ndash White Paper |70
Le Web 20 pour la veille et recherche dinformation DIGIMIND
-GlobaI Incident Maps affiche sur un planisphegravere les eacuteveacutenements lieacutes au terrorisme
ou les risques agrave partir des informations de sites speacutecialiseacutees mises agrave jour en continu
-Enfin un parfait exemple de visualisation et de surveillance deacuteveacutenements en temps
reacuteel DartMaps indique lemplacement des trains de banlieue de Dublin
Mais certains Mashup en minoriteacute certes nexploitent pas de donneacutees
cartographiques Cest le cas de Delexaorg 120 un outil qui mixe les bookmarks
sociaux de Delicious aux donneacutees statistiques dAlexa Delexa va en effet afficher les
tags de Delicious associeacutes aux statistiques de freacutequentation des 50 000 premiers
sites web US fournis par Alexa (agrave partir des donneacutees transmises par les barres
doutils Alexa installeacutees par les internautes) Un tel outil est inteacuteressant notamment
pour se familiariser avec les tags et Delicious mais surtout pour deacutecouvrir quels
sont les sites dinfluence et populaires dans un secteur On peut eacutegalement observer
la correacutelation ou non entre nombre de tags et donneacutees de freacutequentation Alexa
Cocircteacute moteur de recherche les mashups Molu et Gnosh fournissent des
meacutetamoteurs reacutealiseacutes agrave partir du mixage de dizaines doutils de recherche121
Des ressources
Comment trouver des mashups Comme pour de nombreuses informations sur le
web des annuaires speacutecialiseacutes 122 sont apparus Ils reacutepertorient aussi bien des API agrave
destination des deacuteveloppeurs que des mashups WebMashup auto-proclameacute Open
Directory for Mashups et Web 20 APIs en liste des centaines ProgrammableWeb
lun de sites de reacutefeacuterence dans le domaine en propose plus de 1800 sous la forme
dun reacutepertoire et eacutegalement dune matrice permettant de visualiser clairement le
croisement de deux applications ou plus Mashup Feed liste aussi des mixages
populaires
Des blogs sont eacutegalement centreacutes sur ces pratiques Google Maps Mania123 recense
de nombreux Mashups cartographiques
Ces Mashups sont un beau symbole de ce web nouvelle geacuteneacuteration on ne lit plus
seulement de linformation statique de maniegravere passive Deacutesormais on est agrave la fois
fournisseur et spectateur en temps reacuteel des contributions de communauteacutes Le tout
copy Digimind Digimind Services ndash White Paper |71
Le Web 20 pour la veille et recherche dinformation DIGIMIND
gracircce agrave des interfaces reacutealiseacutees par des deacuteveloppeurs agrave partir de code ouverts de
grandes socieacuteteacutes Le succegraves est notamment provoqueacute par la possibiliteacute de mixage
entre des donneacutees du monde reacuteel et des informations ou fichiers posteacutes sur le net
Les internautes peuvent donc maintenant se rassembler par centres dinteacuterecirct mais
eacutegalement par proximiteacute geacuteographique Je recherche un speacutecialiste de linformation
sur les biocarburants situeacutes agrave moins de 10 km de chez moi
Par ailleurs on peut imaginer agrave terme des applications meacutelangeant les donneacutees de
centaines de fichiers et bases de donneacutees On en est certes aux preacutemisses mais le
mashup Alkemis 124 en est deacutejagrave un bon exemple il affiche sur une carte de New
York des donneacutees provenant dA9 OpenSearch Delicious Flickr Google Maps et
Yahoo Traffic Reacutesultat la possibiliteacute de visualiser en une seule interface un eacutetat du
trafic routier via des cameacuteras de surveillance la meacuteteacuteo les actualiteacutes locales ou les
liens Delicious en rapport avec la villehellip
copy Digimind Digimind Services ndash White Paper |72
Le Web 20 pour la veille et recherche dinformation DIGIMIND
III Diffuser
Avec lapparition des applications collaboratives et des plateformes de blogs la
faciliteacute de publication sur le web sest accrue Tout individu mecircme sans
connaissances techniques peut publier et diffuser son propre contenu sur un blog
un wiki et via des fils RSS
a Les Blogs et le flux RSS
Il suffit de 5 minutes pour sinscrire agrave une plateforme de blogs et commencer agrave
eacutecrire Ces plateformes proposent des services de bases gratuits et des
fonctionnaliteacutes plus avanceacutees neacutecessitant un abonnement Ces services qui
permettent de creacuteer maintenir et heacuteberger votre blog sont nombreux Parmi les
prestataires de qualiteacute on peut citer Blogger (qui appartient agrave Google) TypePad et
Vox (de la socieacuteteacute SixApart) Overblog Viablog Haut et Fort ou BlogSpirit 125 Bien
dautres socieacuteteacutes proposent des services de creacuteation et dheacutebergement126 Des
comparatifs sont disponibles en ligne127
Nous lavons vu le format RSS permet de diffuser tregraves facilement le contenu de son
blog utilisant le XML (un html eacutepureacute) langage natif du blog chaque carnet web
comporte un fils RSS permettant aux visiteurs de sabonner agrave vote blog et de
recevoir instantaneacutement toute nouvelle publication actualiteacutes billets podcast ou
videacuteos Par ailleurs des services comme Feedburner128 permettent de rendre
compatibles vos flux RSS avec la majoriteacute des lecteurs RSS outils dont nous
reparlerons plus loin
La creacuteation de sites internet classiques sest elle aussi consideacuterablement simplifieacutee
un outil tel que Google Page Creator129 permet de creacuteer un site simple en 1 heure
Des sites plus sophistiqueacutes sont eacutegalement abordables sans avoir agrave connaicirctre une
ligne de programmation de html gracircce au perfectionnement des eacutediteurs dits
WYSIWYG ce que vous voyez quand vous construisez votre page est ce que vous
obtiendrez en ligne
Les outils Web 20 permettent agrave des speacutecialistes journalistes ou salarieacutes de diffuser
leur contenu Il y a encore 2 ans ils eacutetaient pour la plupart eacutecarteacutes de la publication
web faute de bagage technique
copy Digimind Digimind Services ndash White Paper |73
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Depuis le deacuteveloppement des blogs agrave partir de lautomne 2001 il est possible pour
tout internaute de diffuser sa propre information Au-delagrave des blogs dadolescents
et autres carnets intimes le web regorge de blogs agrave tendance professionnelle
corporate produits marketing experts politiques ressources humaines Cest
autant de sources potentielles quil faut exploiter afin de capter des sources
primaires de qualiteacute Le volume des blogs publieacutes et maintenus chaque jour est lui
aussi en constante augmentation
Le White Paper Blogs et RSS des outils pour la veille strateacutegique deacuteveloppe les
aspects inteacuteressants des blogs pour le professionnel de linformation130
b Les Wikis
Le wiki est finalement diffeacuterent du blog de par sa nature et son utilisation Selon
Wikipedia le Wiki est un site Web dynamique permettant agrave tout individu den
modifier les pages agrave volonteacute Il permet de communiquer et diffuser des informations
rapidement de structurer cette information pour permettre dy naviguer
commodeacutement (Wiki vient du terme hawaiien wiki wiki =rapide ou informel)
Lagrave ougrave le blog sera adapteacute agrave la diffusion dactualiteacute et de contenu se renouvelant
freacutequemment le wiki sera davantage deacutedieacute agrave du texte plus statique mais neacutecessitant
ou pouvant senrichir de la collaboration de plusieurs personnes Ainsi les articles
dune encyclopeacutedie ou les fiches correspondants aux diffeacuterentes phases dun projet
impliquant de nombreux collaborateurs pourront ecirctre reacutealiseacutees sous forme de
Wiki
Sur un blog laffichage du contenu est anteacute-chronologique (le plus reacutecent en haut)
sur un wiki il est structureacute en rubriques larchitecture comme le contenu pouvant
ecirctre modifieacutes agrave tout moment par les participants Ceux-ci peuvent beacuteneacuteficier de
droits daccegraves et de modification hieacuterarchiseacutes
Les versions anteacuterieures ainsi que les modifications sont accessibles via une rubrique
Historique Sur un blog le visiteur peut collaborer mais uniquement via ses
commentaires Sur un wiki tout collaborateur autoriseacute peut modifier le texte
comme le titre et lorganisation des rubriques
Par ailleurs la prise en main dun wiki et de ses syntaxes denrichissement et
modification demande un peu de pratique et nest pas aussi simple que le
maniement dun blog Le wiki est un des outils ideacuteaux pour la gestion de projet
Certaines entreprises les utilisent en tant que tel (parfois en parallegravele avec les blogs)
pour eacuteviter des eacutechanges des recherches et un archivage via les mails fastidieux
copy Digimind Digimind Services ndash White Paper |74
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Geacutereacute via des droits daccegraves gradueacutes il peut alors se reacuteveacuteler comme un outil tregraves
simple agrave manier et agrave sapproprier Ces wikis seront eacutevidemment reacuteserveacutes agrave
lentreprise en accegraves priveacute
Exemples de wikis publics
gt Wikipedia131
Le wiki le plus connu est Wikipedia lencyclopeacutedie collaborative gratuite dont le
contenu est creacuteeacute et maintenu par des milliers dinternautes beacuteneacutevoles Chacun est
libre de creacuteer un article modifier ceux des autres ou les commenter En mai 2007
lencyclopeacutedie proposait plus de 7 millions darticles dans 192 langues et dialectes
dont plus de 500 000 en franccedilais Wikipedia jouit dune populariteacute et dun succegraves
tregraves important Google indexe de nombreux articles de Wikipedia agrave tel point quil
est rare deffectuer une recherche sur le moteur sans voir safficher une deacutefinition
issue de lencyclopeacutedie Selon la socieacuteteacute de mesure daudience Comscore en janvier
2007 Wikipedia eacutetait le 9egraveme site US le plus visiteacute (derriegravere les sites Yahoo
premiers puis les sites Time Warner Microsoft Google eBay Fox Interactive
Amazon et Ask) 6 groupes eacuteditant un moteur geacuteneacuteraliste (Google Ask Microsoft
Yahoo Amazon et AOL) occupent le top10 US Mais cest la premiegravere fois quun
site collaboratif truste les premiegraveres places des sites les plus visiteacutes
Wikipedia comme tout service leader est tregraves critiqueacute Notamment sur la
possibiliteacute pour tout un chacun de modifier et de creacuteer des articles pouvant
entraicircner des risques de diffamation ou de vandalisation 132 Mecircme si ces risques
sont reacuteels nous le verrons dans la partie consacreacutee aux limites du Web 20 il ne
faut pas pour autant se focaliser sur ces problegravemes
Par ailleurs on a souvent mis en cause la qualiteacute des articles du contenu eacutemanant
dinternautes pas forceacutement qualifieacutes ou experts et donc par nature douteux Or
une eacutetude commandeacutee par la Revue Nature agrave remis en cause ce type de ressenti
des experts ont compareacute 42 documents publieacutes sur Wikipedia et sur la ceacutelegravebre
Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche133
Seulement 8 erreurs seacuterieuses comme des mauvaises interpreacutetations de concepts
ont eacuteteacute repeacutereacutees dans les articles analyseacutes 4 pour chaque encyclopeacutedie Des
erreurs factuelles omissions ou fausses descriptions ont eacutegalement eacuteteacute deacutetecteacutees
162 dans Wikipedia et 123 dans lEncyclopaedia Britannica
Le succegraves et limportance de Wikipedia nont pas eacutechappeacute aux moteurs de
recherche qui sont plusieurs agrave secirctre speacutecialiseacutes dans la recherche sur lencyclopeacutedie
Ainsi WikiSeek 134 est un moteur lanceacute deacutebut 2007 qui recherche sur le contenu de
Wikipedia Il indexe le contenu en crawlant les pages en profondeur et aspire
eacutegalement le contenu des liens preacutesents sur les pages de lencyclopeacutedie
copy Digimind Digimind Services ndash White Paper |75
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Plus eacutelaboreacute le moteur franccedilais Exalead 135 enrichit consideacuterablement la recherche
dans lencyclopeacutedie en ligne Cette fonctionnaliteacute est accessible en cliquant sur
longlet Wikipedia Il est eacutevidemment possible de rechercher des articles par mots
cleacutes mais aussi daffiner par langue via le nuage de tags dynamique ( les eacutetiquettes
correspondent agrave des emplacements geacuteographiques personnes ceacutelegravebres noms
drsquoorganisations termes lieacutes agrave votre requecircte ou cateacutegories de Wikipedia)
WikiMindmap 136 recherche sur Wikipedia et affiche les reacutesultats sous forme de
MindMap (cartes heuristiques) Il est alors possible de naviguer dans larborescence
des termes
WikiMindMap
gt Citizendium 137 Lanceacute fin 2006 Citizendium est une initiative de Larry Sanger co-fondateur de
Wikipedia avec Jimmy Wales Citizendium est eacutegalement une encyclopeacutedie Mais
jugeant la communauteacute Wikipedia senseacutee srsquoauto-reacuteguler dysfonctionnelle Larry
Singer integravegre dans Citizendium des proceacutedures de seacutelection des articles par des
experts et refuse aux contributeurs la possibiliteacute de lrsquoanonymat misant ainsi sur la
responsabilisation Le collegravege dexperts a le dernier mot concernant la veacuterification
des articles le but eacutetant dobtenir une encyclopeacutedie contenant le moins derreurs
possible Citizendium est structureacutee en grandes cateacutegories acadeacutemiques
correspondant agrave des groupes de travail Sciences naturelles Sciences Humaines
Arts Sciences Humaines Divertissement Arts appliqueacutes et Sciences
copy Digimind Digimind Services ndash White Paper |76
Le Web 20 pour la veille et recherche dinformation DIGIMIND
gt Alacrawiki 138
AlacraWiki est un guide deacutedieacute aux socieacuteteacutes du secteur de linformation eacutediteurs et
bases de donneacutees La rubrique Alacra Industry Spotlights est particuliegraverement
remarquable elle fournit des analyses et commentaires sur les sites dinteacuterecirct pour
une trentaine de secteurs industriels Le wiki offre des informations sur les
agreacutegateurs de contenu les bases de donneacutees et les meilleurs blogs deacutedieacutes au
secteur de linformation on-line Alacra propose aussi un blog et un fils RSS
Alacra Wiki
gt Les fils RSS 139
Sur cette page de wiki vous trouverez agrave peu pregraves tout sur le RSS
La norme comment utiliser les fils RSS des articles une seacutelection dagreacutegateurs
mixer des fils RSS entre eux mesurer lactiviteacute des fils RSS creacuteer un fil RSS
gtWikidweb 140
Wikidweb est un Wiki qui propose un reacutepertoire de sites web (et non de wikis)
Aussi vous pouvez y participer selon les fonctionnaliteacutes courantes du format wiki
vous avez ainsi la possibiliteacute dy ajouter vos propres sites mais eacutegalement de
modifier les entreacutees des autres internautes (urls texte) ou de les commenter
copy Digimind Digimind Services ndash White Paper |77
Le Web 20 pour la veille et recherche dinformation DIGIMIND
IV Surveiller
Nous lavons vu dans la partie Recherche de blogs et de flux RSS les flux RSS sont
preacutesents sur de nombreux formats du net et vont permettre de surveiller les
nouveauteacutes apparaissant sur les blogs les sites corporate les sites de presse dans
les reacutesultats de moteurs de recherche dactualiteacutes de blogs web dans les
newsgroups sur certains forums web sur certaines listes de diffusion les
bookmarks sociaux les sites de partage de photos et de videacuteoshellipbref sur de tregraves
nombreux sites classiques et ressources collaboratives de type 20
Ces flux RSS peuvent ecirctre inteacutegreacutes agrave votre process de veille en deux clics via des
outils simples gratuits ou payants mais plus puissants
a La deacutetection du flux RSS
Pour pouvoir mettre en surveillance le flux RSS (RSS Feed en anglais) il faut dabord
le trouver Or il nest pas toujours aiseacute de mettre la main sur ces petits logos
oranges ou les liens RSS Abonnez-vous Syndiquez ce flux qui pointent vers les
flux RSS parfois cacheacutes dans les meacuteandres des pages web
Des icocircnes signalant la preacutesence de flux RSS
Certains navigateurs permettent de deacutetecter automatiquement les flux lorsquils
sont preacutesents sur une page web Une icocircne vous avertira alors et dans la plupart
des cas affichera ladresse du ou des flux disponibles sur la page Plusieurs formats
de flux peuvent coexister les diffeacuterentes versions du RSS (090 091 092 10 20)
et le format ATOM concurrent mais offrant les mecircmes fonctionnaliteacutes
Internet Explorer 7 Opera Firefox permettent de deacutetecter les flux Cest aussi le cas
de Maxthon une puissante interface de navigation qui vient se greffer sur
larchitecture dInternet Explorer 141
copy Digimind Digimind Services ndash White Paper |78
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b La mise en surveillance
Quelque soit laspect de la page qui contient votre flux RSS (xml rdf interface
Feedburner) il convient de copier et coller ladresse (url) dans loutil qui va vous
servir agrave lire ce flux et agrave ecirctre alerteacute degraves lors quune nouveauteacute apparaicirct
4 grands types doutils peuvent ecirctre utiliseacutes (du plus simple au plus sophistiqueacute)
- Les navigateurs web
Les navigateurs citeacutes preacuteceacutedemment outre la deacutetection du flux RSS permettent de
sy abonner et de les lire Les flux sintegravegrent alors dans un menu lateacuteral ou dans la
page principale Cest simple mais deacutepourvu de fonctions avanceacutees de tri ou
dorganisation
- Les lecteurs (ou agreacutegateurs) de flux RSS
Ce sont les outils deacutedieacutes aux fils RSS Comme de nombreuses applications ces
lecteurs sont soit disponibles en ligne soit agrave installer localement sur votre PC
- Exemples de lecteurs RSS en ligne Bloglines Pluck Newsgator
- Exemples de lecteurs RSS installeacutes RSS Reader Amphetadesk Newsgator (sintegravegre
agrave Outlook) FeedDemon
Le lecteur Bloglines exploite de maniegravere astucieuse la logique communautaire
lorsque vous ecirctes abonneacute agrave un flux RSS vous pouvez visualiser les autres abonneacutes
(ceux qui ont accepteacute de rendre leur abonnement public) Un clic sur leur nom
affiche tous les fils RSS auxquels ils ont souscrits un moyen rapide de deacutecouvrir
dautres ressources pertinentes collecteacutees par des internautes proches de vos
centres dinteacuterecirct
Les lecteurs RSS sont tregraves nombreux Pour mieux les distinguer certains blogs ou
sites proposent des comparatifs142
copy Digimind Digimind Services ndash White Paper |79
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La communauteacute sur Bloglines les abonneacutes au flux RSS du blog Voip Weblog
- Les pages personnalisables
Ce sont des pages web geacuteneacuteralement organiseacutees en onglets et boicirctes permettant
dorganiser et de ranger ses flux par cateacutegories et ce dans un mecircme espace Ces
services sont ergonomiques et ideacuteaux pour lire dun coup doeil le maximum de flux
Les plus connus sont NetVibes PageFlakes ou Webwag
Outre la lecture de flux RSS ces pages offrent la possibiliteacute dinteacutegrer des services
de meacuteteacuteo mail bloc-notes et des flux provenant de service sociaux comme les
bookmarks ou les reacuteseaux damis
Certains blogs fournissent des listes et comparatifs de ces services143
- Les progiciels de veille inteacutegreacutes
Face agrave labondance des flux RSS et blogs des applications de veille inteacutegreacutee comme
Digimind Evolution 144 donnent la possibiliteacute de filtrer les RSS via lapplication de
requecirctes diffeacuterentes sur chaque fils RSS
On peut ainsi seacutelectionner les informations agrave remonter via des requecircte simples ou
plus complexes (booleacuteens parenthegraveses troncatures et opeacuterateurs de proximiteacute) agrave
longueur illimiteacutee En outre il est possible de surveiller jusquagrave 10 000 flux RSS
quotidiennement
Les boutons inteacutegreacutes
Certains sites vont vous simplifier la tacircche ils affichent sur leurs pages agrave coteacute de
leurs flux des boutons qui permettent dajouter directement le flux agrave votre lecteur
copy Digimind Digimind Services ndash White Paper |80
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ainsi le service dactualiteacutes Wikio ou le moteur Ask Blogs amp Flux proposent tous
deux des boutons vers Bloglines MyYahoo Google Reader Newsgator et Ask Blog
Les fichiers OPML
LOPML (Outline Processor Markup Language) est un format deacuteveloppeacute en XML qui
permet leacutechange dinformations structureacutees entre applications fonctionnant sur des
OS et environnement diffeacuterents Exemple les abonnements dun internaute agrave un
ensemble de flux RSS entre un navigateur Firefox et Internet Explorer de MacOS agrave
Windows XP
Des agreacutegateurs RSS comme Bloglines NewsGator ou Rojo offrent la possibiliteacute
dexporter lensemble de vos flux RSS favoris ou ceux dautres abonneacutes au format
OPML pour les importer ensuite dans votre agreacutegateur
Share your OPML145 est comme son nom lindique un portail qui vous permet de
partager vos flux RSS au format OPML Ce service liste des centaines de fichiers
OPML
c Pourquoi une veille via le RSS
Faire une veille via les fils RSS preacutesente des inteacuterecircts notables
- Lhyper-segmentation le choix des fils RSS rend possible une seacutelection fine de
linformation Ainsi sur le site du Figaro on peut choisir lactualiteacute internationale
nationale les sciences et meacutedecine eacutevitant ainsi decirctre submergeacute par linformation
superflue Sur La Tribune on peut seacutelectionner un flux par socieacuteteacute
Certains blogs proposent mecircme des flux RSS permettant aux choix de surveiller les
commentaires ou uniquement les billets
- Un gain de temps inutile de se connecter au site au blog ou au moteur de
recherche pour visualiser ses nouveauteacutes
- Lanonymat labonnement agrave un flux RSS contrairement agrave une newsletter ou agrave une
liste de diffusion est anonyme
- La consultation aiseacutee vos fils RSS via une lecture sur un agreacutegateur en ligne sont
accessibles de nimporte quel PC connecteacute agrave linternet ougrave que vous soyez
copy Digimind Digimind Services ndash White Paper |81
Le Web 2
copy Digimin
0 pour la veille et recherche dinformation DIGIMIND
d Digimind Services ndash White Paper
V Carte des outils et ressources Web 20
gt Page suivante
|82
wwwdigimindcom Digimind Services ndash White Paper|83
Carte des outils et ressources Web 20 - DIGIMIND Services 2007
Le Web 20 pour la veille et recherche dinformation DIGIMIND
EXEMPLE DUNE RECHERCHE ET VEILLE VIA LE WEB 20
Cas drsquoeacutecole Nous avons agrave mener une recherche et une veille sur le
deacuteveloppement des smartphones ou teacuteleacutephones multimeacutedias haut de gamme Des
sites de type 20 pourront se reacuteveacuteler compleacutementaires de sites classiques (sites
drsquoentreprises portails associations professionnelleshellip) pour deacutetecter les tendances
et sujets eacutemergents
Une premiegravere recherche via lrsquoencyclopeacutedie Wikipedia permettra drsquoobtenir une
premiegravere deacutefinition du sujet et drsquoidentifier les principaux mots cleacutes ainsi que des
liens vers des sites pertinents
Etape suivante nous pourrons eacutelargir notre recherche en identifiant des sites
similaires aux sites trouveacutes preacuteceacutedemment via les suggestions fournies par des
moteurs collaboratifs tels que Yoono ou Similicious
Une recherche sur le tag Smartphone dans des sites de social bookmarking
comme Delicious nous permettra eacutegalement drsquoidentifier les pages plus ou moins
populaires taggeacutees par les contributeurs du site ainsi que drsquoautres tags en relation
avec notre sujet
Explorons ensuite les avis drsquoexperts plus ou moins autoriseacutes que lrsquoon trouvera dans
les meacuteandres de la blogosphegravere gracircce agrave des moteurs de blogs comme Technorati
Blogpulse ou Google Blog Search
La recherche pourra srsquoeffectuer via les tags ou le texte inteacutegral des billets On
pourra ensuite parcourir les blogrolls des auteurs les plus pertinents afin drsquoidentifier
drsquoautres sources
La lecture des blogs fournira non seulement des avis de speacutecialistes ou journalistes
mais aussi des avis plus ou moins critiques de consommateurs ou utilisateurs de
smartphoneshellip
Il conviendra toutefois de rester vigilant quant agrave lrsquoeffet pot de miel de certains
blogs ougrave les contributions des internautes se reacutevegravelent ecirctre de simples messages
publicitaires deacuteguiseacutes (voir agrave ce sujet la mise en garde du site UFC Que choisir146)
Pour recueillir les derniegraveres informations drsquoactualiteacute on pourra utiliser un
agreacutegateur tel que Wikio ou Digg et creacuteer un flux RSS agrave partir drsquoune requecircte sur les
copy Digimind Digimind Services ndash White Paper |84
Le Web 20 pour la veille et recherche dinformation DIGIMIND
tags preacuteceacutedemment identifieacutes Wikio propose des raccourcis pour inteacutegrer ce flux
au sein de plusieurs lecteurs RSS du marcheacute (Netvibes Newsgator Google Reader
etc)
Les reacuteseaux sociaux professionnels permettront eacutegalement drsquoidentifier des acteurs
importants du domaine dans les sphegraveres universitaires ou de lrsquoentreprise
La communauteacute 20 srsquoexprimera eacutegalement sur les grands portails consacreacutes aux
nouvelles technologies Crsquoest le cas par exemple du portail ZDNet qui permet aux
utilisateurs de commenter les articles ou de les ajouter directement agrave leur profil
Delicioushellip Les commentaires ou les trackbacks pointant sur un article pourront
constituer un preacutecieux compleacutement drsquoinformations
Afin de mener une veille reacuteguliegravere sur le sujet on syndiquera les flux RSS provenant
des diffeacuterents sites ou blogs identifieacutes Pourquoi ne pas eacutegalement creacuteer agrave partir de
ce bouquet de sources personnaliseacutees un moteur sur mesure conccedilu gracircce agrave Rollyo
ou Yahoo Search Builder
copy Digimind Digimind Services ndash White Paper |85
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les limites du Web 20
LA PARTICIPATION
I Une participation heacuteteacuterogegravene
Nous lavons deacutejagrave eacutevoqueacute tout le monde ne participe pas de la mecircme maniegravere sur
les applications du Web 20
Une minoriteacute participativehellip
Bill Tancer de la socieacuteteacute de mesure daudience Hitwise reacutevegravele dans une eacutetude147
que sur les sites type Web 20 les internautes regardent mais participent peu
Seulement 016 des visiteurs du site YouTube viennent y partager leurs videacuteos
Les 9984 restant ne font que regarder Idem pour le site de partage de photos
de Yahoo Flickr seulement 02 des visites conduisent agrave la publication de photos
Wikipedia est lexception sur lencyclopeacutedie collaborative gratuite 46 des
visites correspondent agrave une modification des articles
Sur ces sites on est donc encore loin de la regravegle de la 11089 eacutedicteacutee par Charles
Arthur dans The Guardian148 Il estime que sur le net sur un groupe de 100
personnes si une creacutee du contenu 10 vont interagir (commentaires
ameacuteliorations) et les 89 restant ne feront que le lire et regarder Le journaliste
lillustre via des exemples quantifieacutes avec YouTube Wikipedia ou Yahoo Groups
Most Web 20 Users Are Really Just Couch Potatoes Bruce Nussbaum compare
mecircme les internautes Web 20 aux spectateurs de TV passifs et affaleacutes dans leurs
canapeacutes149
Mais parallegravelement les sites de type Web 20 ont vu leur audience grimper
de668 en 2 ans reacutevegravele leacutetude Hitwise Cela repreacutesente 12 du trafic web aux
USA contre 2 il y a seulement 2 ans
Les sites de partage de photos sont parmi les plus populaires Flickr bien sucircr mais
aussi PhotoBucket qui repreacutesente agrave lui seul 41 du trafic des sites de photos en
ligne
copy Digimind Digimind Services ndash White Paper |86
Le Web 20 pour la veille et recherche dinformation DIGIMIND
hellipdautant plus que la forme de participation se complexifie
Dapregraves le cabinet Forrester les internautes sont nombreux sur les actions agrave faible
niveau dexigence (lire enregistrer un signet commenter) mais beaucoup moins sur
des participations plus actives (eacutecrire collaborer) 150
Wikipedia un faux modegravele collaboratif
On cite souvent lencyclopeacutedie Wikipedia en exemple cest lun des emblegravemes les
plus forts et les plus lus du Web 20 Son mode de fonctionnement est
caracteacuteristique voire symptomatique du web collaboratif Mais le process de
Wikipedia serait finalement tregraves classique avec une hieacuterarchie de contributeurs
sorte de cadres disposant de nombreux droits eacutecrivant la majoriteacute des articles
Cest lanalyse de Lionel Barbe du CNRS151 Il explique que si le principe de liberteacute
de publication sur Wikipedia reste valable il est de moins en moins commun car
la plupart des entreacutees basiques ne precirctant pas agrave discussion ont deacutejagrave eacuteteacute effectueacutees
Lrsquoeacutetude des laquo logs raquo historiques montre que la creacuteation de nouvelles entreacutees qui
correspondent agrave de nouvelles pages articles dans la Wikipedia Francophone ne
concerne qursquoenviron 3 agrave 4 des opeacuterations Par comparaison cette proportion tombe
agrave 2 pour la version anglaise de Wikipedia qui contient plus de 1 million drsquoarticles A
lrsquoinverse la proportion monte entre 8 et 10 pour des Wikipedias ayant moins de
100 000 articles comme la Wikipedia en Lituanien et bien drsquoautres
Selon lui on assiste agrave un effet de professionnalisation de lencyclopeacutedie [hellip] les
plus gros contributeurs que nous consideacutererons comme eacutetant les 5 des individus
eacuteditant le plus drsquoarticles eacuteditent entre 85 et 95 du contenu total de lrsquoencyclopeacutedie
Au fur et agrave mesure ces gros contributeurs acquiegraverent des privilegraveges comme le statut
drsquoadministrateur qui leur permettent non seulement de participer mais aussi de
surveiller et le cas eacutecheacuteant censurer le contenu eacutediteacute par les autres contributeurs et de
participer aux grandes lignes de lrsquoorganisation de Wikipedia
Cette analyse a toutefois eacuteteacute battue en bregraveche par Aaron Swartz dans une petite
eacutetude 152 En mesurant non pas le nombre drsquointerventions de chaque contributeur
mais la quantiteacute de texte produit par chacun la reacutealiteacute est diffeacuterente les
contributeurs occasionnels eacutecriraient des textes longs en peu dinterventions tandis
que les eacutediteurs actifs reacutealiseraient un travail tenant davantage de la maintenance
(correction veacuterification suppression) mais sans apporter beaucoup de texte
copy Digimind Digimind Services ndash White Paper |87
Le Web 20 pour la veille et recherche dinformation DIGIMIND
II Une participation damateurs
Tout internaute peut-il simproviser journaliste expert commentateurhellip
Michel Fingerhut 153 voit dans le succegraves dune encyclopeacutedie comme Wikipedia une
manifestation du web comme heacutegeacutemonie de lrsquoamateurisme et comme encouragement
agrave lrsquoextreacutemisme ideacuteologique et au communautarisme
Les contenus creacuteeacutes et diffuseacutes sont-ils de qualiteacute Le Web 20 devient une
plateforme qui stimule la creacuteativiteacute et la production de contenu par cela mecircme
qursquoelle en permet la diffusion (avec indice de notorieacuteteacute) On assiste agrave une libeacuteration
de talents qui peuvent enfin se reacuteveacuteler parallegravelement agrave des productions
caracteacuteriseacutees par un certain amateurisme et lrsquoabsence de veacuteritable ambition
creacuteatrice Car comme sur lensemble de linternet sur ce Web 20 le pire cocirctoie le
meilleur
Par ailleurs toujours en prenant lexemple de Wikipedia un certain nombre de
pheacutenomegravenes se reacutevegravelent tout de mecircme preacuteoccupants
Si leacutetude reacutealiseacutee pour le magazine Nature reacutevegravele que la qualiteacute des articles de
lencyclopeacutedie est presque au niveau de celle de lEncyclopaedia Britannica certains
articles de Wikipedia relegravevent de la deacutesinformation ou de la propagande
- larticle Droits de lHomme en Iran154 a ainsi eacuteteacute tregraves controverseacute en effet cet
article tregraves long de plus de 20 pages se preacutesente davantage comme une apologie du
reacutegime iranien quune analyse argumenteacutee des droits de lhomme dans ce pays Or
certainement au nom du principe de neutraliteacute qui reacutegit Wikipedia cet article
tendancieux a eacuteteacute classeacute comme article de qualiteacute 155
- le cas Seigenthaler 156 en mai 2005 un contributeur publie anonymement sur
Wikpedia un article sur John Seigenthaler Sr un eacutecrivain ceacutelegravebre aux USA Or ce
billet mentionne que leacutecrivain a eacuteteacute directement impliqueacute dans les assassinats de
John et Bob Kennedy en preacutecisant toutefois que rien na jamais eacuteteacute prouveacute Cette
information est tout simplement fausse Mais larticle nest deacutecouvert (par un ami de
John Seigenthaler) et corrigeacute que 4 mois plus tard mettant agrave mal la creacutedibiliteacute de
lencyclopeacutedie A la suite de cette affaire largement relayeacutee par les meacutedias
ameacutericains le fondateur de Wikipedia a rigidifieacute les regravegles de publication concernant
les tout nouveaux contributeurs
Certes sur les milliers darticles mis en ligne par Wikipedia ces dysfonctionnements
restent heureusement minoritaires mais ils reacutevegravelent tout de mecircme certaines limites
du tout collaboratif et la neacutecessiteacute de regravegles de publication emprunteacutees aux meacutedias
classiques
copy Digimind Digimind Services ndash White Paper |88
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Lagreacutegation de petites choses faciles
Elles ont tendance agrave dominer le contenu du Web 20 La faciliteacute de publication le
rythme des blogs qursquoil convient drsquoalimenter freacutequemment peut entrer en conflit
avec le temps de la recherche et de la reacuteflexion Souvent les thegravemes traiteacutes ne
peuvent degraves lors ecirctre que des sujets du quotidien des opinions non reacutefleacutechies non
argumenteacuteeshellipOn peut donc craindre agrave linstar du mode de diffusion sur dautres
meacutedias quinteacutegreacute agrave un reacuteseau social noteacute eacutevalueacute agrave la recherche de notorieacuteteacute et de
visibiliteacute le creacuteateur de contenu ait tout inteacuterecirct agrave aller dans le sens de son audience
produire du divertissant plus agrave mecircme de lui garantir un succegraves immeacutediat
Par ailleurs des opinions peuvent-elles se transformer en jugement pertinent par
lrsquoeffet de leur agreacutegation Lrsquoagreacutegation drsquoune quantiteacute importante drsquoavis peut elle
vraiment deacutepasser lrsquoimpreacutecision des avis pris indeacutependamment Peut-on sans une
harmonisation des critegraveres drsquoappreacuteciation atteindre un jugement collectif fiable Les
tendances qui ressortent risquent en effet de se limiter souvent au reflet de
lrsquoopinion majoritaire
Mais leacutevocation de ces limites ne doit pas occulter toutes les contributions matures
produites par des internautes soucieux dapporter un contenu veacuteritablement
constructif Les billets et les commentaires de nombres de blogs politiques franccedilais
en 2007 en sont une parfaite illustration
LE WEB 10 RESTE NECESSAIRE
Le mail reacutesiste
Nous lavons vu au cours de la description des applications pour la veille les services
Web 20 ne sont pas suffisants en soit pour la recherche dinformation De plus
bien que ses possibiliteacutes soient tregraves puissantes lutilisation du Web 20 reste encore
marginale agrave leacutechelle de tous les internautes Une eacutetude du cabinet Pew Internet 157
montre que lactiviteacute internet dominante sur une journeacutee type dun ameacutericain reste
tout simplement le mail 53 des internautes lutilisent Ils sont 38 agrave utiliser un
moteur de recherche Par contre ils ne sont que 8 agrave creacuteer des blogs et 26 agrave
partager des photos et videacuteos cette collaboration multimeacutedia eacutetant de loin lactiviteacute
la plus courante du Web 2
copy Digimind Digimind Services ndash White Paper |89
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une enquecircte en ligne de lUniversiteacute dOxford reacutealiseacutee aupregraves de 1469 personnes
(une majoriteacute deacutetudiants) fin 2006 deacutetaille les usages du Web 20 158 Elle reacutevegravele elle
aussi que les applications de ce web nouvelle geacuteneacuteration sont encore peu connues
et peu utiliseacutees La majoriteacute des reacutepondants na jamais employeacute ou jamais entendu
parleacute des fils RSS ou des applications de Social Bookmarking comme Delicious
Aussi linfluence grandissante du Web 20 ne doit pas masquer les usages
traditionnels du web qui restent majoritaires
Une population souvent isoleacutee et non repreacutesentative
Lage
Si de nombreuses applications sociales apportent un reacuteel progregraves il faut tempeacuterer
la nature de certains contenus issus du mode collaboratif celui-ci nest en effet pas
repreacutesentatif des internautes puisque le public du Web 20 est une population plutocirct
jeune
Ainsi leacutetude Pew Internet reacutevegravele que laudience de Wikipedia aux USA eacutetait en aoucirct
2006 agrave 47 situeacutee dans la tranche des 18-34 ans Les plus de 45 repreacutesentaient
28 Sur le site dEncarta lencyclopeacutedie de Microsoft plus traditionnelle (Web 10)
la part des plus de 45 ans atteint 33
Des communauteacutes isoleacutees structureacutees en icircles Les communauteacutes actuelles du Web 20 sont souvent renfermeacutees sur elles-mecircmes
les statistiques sur les liens pointant vers les blogs et sur les liens preacutesents dans les
billets reacutevegravelent que les blogueurs se lient et se lisent beaucoup entre eux
Lrsquointernaute Web 20 aurait donc tendance agrave senfermer sur lui-mecircme et autour
dindividus feacutedeacutereacutes en communauteacutes focaliseacutes sur les mecircmes centres drsquointeacuterecirct que
lui
Par ailleurs lhyper segmentation et le ciblage des nouvelles rendu possible par le
flux RSS notamment peut conduire agrave favoriser ces microcosmes communautaires
Parcourir un journal papier peut favoriser davantage louverture la prise de recul et
la mise en perspective des diffeacuterentes informations que la lecture de flux aux
theacutematiques tregraves speacutecialiseacutees
Les diffeacuterentes communauteacutes par reacuteflexe et de par la nature des applications Web
20 qui se dupliquent mais ne se connectent pas ont tendance agrave peu communiquer
entre elles Ainsi les liens entre reacuteseaux sociaux sont rares Peu de personnes
copy Digimind Digimind Services ndash White Paper |90
Le Web 20 pour la veille et recherche dinformation DIGIMIND
enregistreacutes sur LinkedIn iront eacutegalement sinscrire sur Viadeo ou FaceBook
Latomisation des donneacutees sur des dizaines dapplications reste eacutegalement un vrai
problegraveme
Des domaines mal couverts
Certaines theacutematiques vont ecirctre surrepreacutesenteacutees au deacutetriment dautres au
traitement beaucoup plus confidentiel car boudeacutees par les internautes producteurs
volontaires dinformation Les ingeacutenieurs techniciens et jeunes eacutetant fortement
repreacutesenteacutes parmi les blogueurs les theacutematiques high tech sont tregraves largement
couvertes par les blogs par exemple dans le domaine de la RFID (Identification par
Radio Freacutequence) on compte plus de 100 blogs idem pour la VoIP (Voix sur IP) A
linverse si vous travaillez dans le secteur des machines outils ou de la plasturgie il
vous sera difficile de trouver du contenu sur la blogosphegravere
Tous les secteurs ne sont donc pas eacutegaux en volume sur le net et davantage encore
sur la blogosphegravere et sur les autres applications collaboratives ougrave tout internaute
peut publier son propre contenu et ougrave certaines tranches dacircges et cateacutegories
professionnelles ne sont pas bien repreacutesenteacutees
copy Digimind Digimind Services ndash White Paper |91
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Conclusion
Le Web 20 ce mot qui geacutenegravere eacutenormeacutement de buzz deacutecrits et de blogs
speacutecialiseacutes nest-il quun terme marketing un courant de mode 159 Il est probable
que bientocirct on ne lemploiera plus pour deacutesigner ces nouvelles applications qui
seront devenues la norme Toutefois ce terme sorte de parapluie conceptuel qui
recouvre les diffeacuterentes tendances du web nouvelle geacuteneacuteration a le meacuterite de
mettre un nom simple sur un courant du net novateur
Le Web 20 nest pas une reacutevolution ou une rupture technologique mais plus
certainement une eacutevolution qui permet de replacer lutilisateur au centre des
reacuteseaux Cela nest certes pas tregraves nouveau Usenet lun des plus anciens
protocoles de linternet bien anteacuterieur au WWWeb offrait du contenu en ligne
creacuteeacute par linternaute via les Newsgroups degraves les anneacutees 1980
Mais les progregraves technologiques ont permis dintensifier cette tendance et de
deacutemocratiser laccegraves agrave la creacuteation de contenu en ligne et agrave sa diffusion au plus grand
nombre Potentiellement tout internaute peut maintenant diffuser ses publications
tant les outils sont devenus simples
Le Web 20 tend agrave sinseacuterer au cœur du quotidien de chacun en lui apportant des
services novateurs reacuteellement utiles et qui rendent possible lrsquoapparition de
nouveaux usages Ainsi les mash-up qui srsquoappuient sur la geacuteolocalisation ouvrent
des possibiliteacutes inenvisageables jusquici On peut mecircme imaginer agrave terme une
superposition de ces cartes dynamiques agrave la vision reacuteelle dun pieacuteton ou dun
automobiliste Le Web 20 est en perpeacutetuelle eacutevolution ses capaciteacutes drsquoinnovation
sont tregraves fortes car elles reposent souvent sur des recombinaisons audacieuses de
lrsquoexistant hybridant applications et services dans un systegraveme de deacuteveloppement
open source hellipLrsquoinnovation est aussi innovation de postures (prendre la parole
consommer du contenu amateurhellip) qui parfois challengent lrsquoordre eacutetabli et
redistribuent les pouvoirs La position des acteurs du Web 10 ou des meacutedias
classiques pourrait se trouver de plus en plus remise en question lagrave ougrave les
internautes tendent agrave se placer en experts
copy Digimind Digimind Services ndash White Paper |92
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La place de lhumain
Si celle-ci est devenue preacutepondeacuterante il est toutefois difficile de saffranchir
dorganisations un tant soit peu hieacuterarchiseacutees lautoreacutegulation voir Wikipedia ayant
ses limites
En outre la question de la consommation de contenu et de sa qualification sur
lrsquointernet devient cruciale La pertinence des votes de tous les internautes est
discutable ou du moins le fait qursquoils puissent agrave eux seuls qualifier et eacutevaluer la
qualiteacute Par ailleurs que repreacutesente exactement un vote une adheacutesion au contenu
agrave la forme aux ideacutees aux eacutecrits dun ami agrave une ideacutee avec laquelle je suis en
deacutesaccord mais qui agrave le meacuterite dexister
Finalement il faut continuer agrave normer organiser coordonner
reacutegulerhellipnotamment pour eacuteviter les diffamations ou la deacutesinformation Pour ce qui
est du contenu et de sa qualiteacute les critiques eacutemises agrave lrsquoencontre de Wikipeacutedia nous
incitent agrave eacutetudier de plus pregraves les initiatives qui hybrident les interventions
drsquoamateurs avec les compeacutetences de professionnels
Nous sommes passeacutes en 10 ans dun contenu geacuteneacutereacute par quelques internautes pour
la masse agrave un contenu de masse agrave destination de la masse (Evertybody to
Everybody) Cela ne peut guegravere se deacutevelopper sans des meacutecanismes qui replacent
les internautes les plus speacutecialiseacutes dans des processus de validation dune
information devenue pleacutethorique
Les donneacutees personnelles
Simpliciteacute reacuteactiviteacute personnalisation souplesse mutualisationhellipfont partie des
avantages les plus appreacuteciables du web 20 Mais cette liberteacute de publication et de
diffusion nrsquoest elle pas parfois illusoire Les utilisateurs doivent rester vigilants face
aux problegravemes de confidentialiteacute seacutecuriteacute et traccedilabiliteacute de lrsquoinformation160 Des voix
srsquoeacutelegravevent pour deacutenoncer les risques lieacutes agrave la maicirctrise des donneacutees personnelles ou
au respect des droits drsquoauteurs A noter que les licences Creative Commons161
permettent de mieux deacutefinir les contours de cette liberteacute agrave partir de contrats
flexibles de droit dauteur Ce systegraveme Creative Commons donne la possibiliteacute
gratuitement et simplement aux titulaires de droits de choisir et drsquoexprimer les
conditions drsquoutilisation de leurs œuvres agrave travers onze possibiliteacutes Quant aux
utilisateurs ils nrsquoont pas agrave neacutegocier systeacutematiquement une autorisation avant toute
utilisation ou reacuteutilisation
copy Digimind Digimind Services ndash White Paper |93
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Un autre problegraveme reacuteside aussi dans lrsquoeacuteparpillement des donneacutees dans des sites
diffeacuterents ou parfois redondants Il srsquoagira donc de deacutefinir les objets (livre
personne CD photoshellip) agrave partir drsquoun identifiant Cette bataille pour savoir qui
geacuterera ces donneacutees de base telles que la position geacuteographique les espaces de noms et
le code unique de chaque produit a deacutejagrave commenceacute estime Tim OReilly 162
Les perspectives deacutevolution vers un Web 3
Le web actuel est destructureacute et la classification et lrsquoorganisation de son contenu
posent problegraveme La recherche de nouveaux modes de recherche et de
structuration est une sorte de quecircte du graal que de nombreux experts et
entreprises poursuivent
La folksonomie repose sur une ideacutee originale qui sous tend toute lrsquoideacuteologie Web
20 celle de lrsquointelligence collective et de la deacutecentralisation Mais les limites de la
folksonomie appeleacutee aussi web seacutemantique du pauvre remettent en question
lrsquoaffirmation selon laquelle lrsquointelligence collective et la libeacuteralisation totale du
fonctionnement du web 20 sont une solution viable
Aussi la neacutecessiteacute drsquoun Web seacutemantique 163 fiable se fait de plus en plus urgente
Cette nouvelle phase de deacuteveloppement du Web permettrait drsquoameacuteliorer
lrsquoexploitation des informations par les utilisateurs en obtenant une information
organiseacutee normaliseacutee de faccedilon agrave rendre le web compreacutehensible aux machines pour
faciliter lrsquoexploitation par les utilisateurs
Dans un article paru dans le New York Times en novembre 2006 John Markoff
imagine un web 30 selon le principe drsquoajout dune couche de sens tout en haut du
web existant pour en faire un guide au lieu drsquoun simple catalogue Pour lrsquoauteur
nous sommes en train de passer dun web de documents connecteacutes agrave un web de
donneacutees connecteacutees
Le web seacutemantique offrira un langage commun permettant aux donneacutees de
renvoyer agrave des objets du monde reacuteel dune faccedilon identique Le projet Freebase
lanceacute par la start up Metaweb illustre cette approche il a pour objectif de faciliter
la recherche et le partage drsquoinformations agrave travers une base de connaissances
communes structureacutees via des meacutetadonneacutees permettant de deacutecrire chaque
eacuteleacutement drsquoinformation Ces eacuteleacutements seraient relieacutes entre eux par un systegraveme de
relations Tim OrsquoReilly deacutefinit le projet comme la machine agrave creacuteer les synapses du
cerveau global
Il srsquoagirait de creacuteer en quelque sorte un Google du web seacutemantique un reacutepertoire global
drsquoinformations structureacutees intelligibles et exploitables autant par des machines que par
copy Digimind Digimind Services ndash White Paper |94
Le Web 20 pour la veille et recherche dinformation DIGIMIND
des humains -et donc capables drsquoextraire et drsquointerpreacuteter les relations entre des donneacutees
pour par exemple reacutepondre agrave des requecirctes par des solutions plutocirct que des listes de
document 164
La veille
Dans cet univers le chercheur dinformations et le veilleur doiventhellipgarder la tecircte
froide la forte meacutediatisation du Web 20 ne doit pas masquer la pertinence doutils
plus traditionnels Les diffeacuterentes applications Web 20 nous lavons vu suffisent
rarement pour mener agrave bien une collecte dinformation Certes les bookmarks
sociaux apportent un contenu seacutelectionneacute par linternaute mais on ne peut se
deacutepartir des moteurs de recherche web classiques La surveillance des flux RSS
permet decirctre alerteacute sur de nombreux sujets mais la majoriteacute des sites web restent
encore deacutepourvus de ces fils Les tags apportent une veacuteritable souplesse agrave
lutilisateur mais la taxonomie des bibliothegraveques ou des reacutepertoires web- pour ne
citer que ces lieux- reste essentielle pour se repeacuterer agrave travers des milliers de
ressources
Le Web 20 pour la recherche et la veille nen est quagrave ses balbutiements Aussi
avant quil ne digegravere complegravetement par enrichissement les ressources et les
applications Web 10 il convient de faire coexister ces 2 web dans les pratiques
Le Web 20 apporte une richesse essentielle lrsquoexpression drsquoindividus porteurs
drsquoideacutees et de faculteacutes susceptibles drsquoapporter des changements de re-questionner
lrsquoordre eacutetabli eacuteleacutements indispensables agrave lrsquoeacutevolution de la culture agrave condition de ne
pas oublier que des volonteacutes ambitieuses doivent intervenir pour canaliser les
initiatives sans les eacutetouffer et leur insuffler une veacuteritable ambition Voilagrave tout
lenjeuhellip
copy Digimind Digimind Services ndash White Paper |95
Le Web 20 pour la veille et recherche dinformation DIGIMIND
A propos des auteurs DIGIMIND SERVICES
Digimind Services accompagne les plus grandes entreprises pour la conception la
mise en œuvre et le deacuteploiement de projets de veille qui reposent sur la solution
Digimind Evolution apportant agrave ses clients un retour sur investissement de plus de
600 et ce degraves la premiegravere anneacutee Les meacutethodologies proprieacutetaires du
deacutepartement conseil ainsi que son expertise des probleacutematiques et sources
drsquoinformations sur plus de 20 secteurs drsquoactiviteacute deacuteveloppeacutee aupregraves de ses clients
depuis de nombreuses anneacutees permet aux entreprises drsquoanticiper les changements
de leur environnement pour prendre les meilleures deacutecisions sur leur marcheacute
Le conseil Digimind porte sur tous les aspects du workflow de veille ciblage
strateacutegique collecte des informations traitement et analyse exploitation et
diffusion gestion de projet conseil organisationnel et gestion du changement
formations et support fonctionnel et technique
CHRISTOPHE ASSELIN
Issu drsquoun cabinet drsquoeacutetudes de marcheacute B2B et speacutecialiseacute depuis 1997 dans la mise en
place de systegravemes de veille (e-Franceorg Ecole Militaire) Christophe Asselin allie
une connaissance approfondie des secteurs eacuteconomiques et une parfaite maicirctrise
des outils de recherche sur internet et des solutions avanceacutees de veille Expert
reconnu il eacutedite le site httpwwwintelligence-centercom et le blog
httpinfluxjouebcom tout deux consacreacutes agrave la recherche dinformation
Speacutecialiste de la veille internet chez Digimind il accompagne les clients dans la mise
en place de leur dispositif de veille (expression des besoins deacutefinition de plans de
veille sourcing architecture parameacutetrage formation accompagnement) Il
intervient ainsi aupregraves de socieacuteteacutes dans diffeacuterents secteurs les teacuteleacutecoms avec
France Telecom RampD lrsquoindustrie pharmaceutique avec Sanofi Aventis Roche
Pharma Expanscience ainsi quAlstom Transport Veolia Environnement et des
reacutefeacuterences confidentielles dans le secteur des biotechnologies de leacutenergie des
teacuteleacutecoms de limprimerie de la deacutefense du conseilhellip
copy Digimind Digimind Services ndash White Paper |96
Le Web 20 pour la veille et recherche dinformation DIGIMIND
[Merci au Service Marketing agrave Malaiac wwwmalaiacnet et agrave Elsa Bonier eacutetudiante
en Master 2 Management des innovations en communication agrave Paris XIII pour leur
fructueuse collaboration]
VERONIQUE MESGUICH
Apregraves avoir fondeacute et co-dirigeacute pendant six ans un cabinet speacutecialiseacute en veille
technologique Veacuteronique Mesguich dirige lrsquoInfothegraveque du Pocircle Universitaire
Leacuteonard de Vinci Elle enseigne eacutegalement la maicirctrise de linformation strateacutegique
dans plusieurs eacutetablissements denseignement supeacuterieur et anime reacuteguliegraverement
des sessions de formation continue autour de la meacutethodologie de recherche
avanceacutee et de veille sur Internet
Veacuteronique Mesguich est lrsquoauteur avec Armelle Thomas de lrsquoouvrage Net
recherche le guide pour trouver lrsquoinformation utile dont la deuxiegraveme eacutedition est
parue en mars 2007 aux eacuteditions de lrsquoADBS
copy Digimind Digimind Services ndash White Paper |97
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Webographie Bibliographie
Sources dinformation sur le Web 20
Sites web wikis et blogs
Reacutepertoires et classement de services et socieacuteteacutes Web 20 - 20 Websites http20websitescom - Web 20 Magazine Top 100 Web 20 Sites httpweb2magazineblogspotcom200701thanks-for-web-2html - Web 20 Magazine The Best Web 20 Software of 2006 httpweb2socialcomputingmagazinecomthe_best_web_20_software_of_2006htm - Complete List of Web 20 Products and Services httpwwwlistiblecomlistcomplete-list-of-web-2-0-products-and-services - The Complete Web 20 Directory httpwwwgo2web20net - FredCavazzanet le meilleur du Web 20 httpwwwfredcavazzanetindexphp20051212986-le-meilleur-du-web-20 - Web 20 Directory 1200+ Web 20 Sites in 50+ categories httpweb2econsultantcomindexhtml
- Top 25 Web 20 Search Engines httpoedborglibraryfeaturestop-25-web20-search-engines
- 25 start-ups Web 20 prometteuses httpmoneycnncom20070221magazinesbusiness2nextnet_introbiz2
copy Digimind Digimind Services ndash White Paper |98
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Blogs et sites speacutecialiseacutes - Le groupe de travail Web20 francophone httpwwwweb20workgroupfr
- Web 20 Work Group httpweb20workgroupcom - Dessine-moi le Web 20 httpwwwdeuxzerocom - FredCavazzanet httpwwwfredcavazzanet
- TechCrunch en franccedilais httpfrtechcrunchcom - TechCrunch httpwwwtechcrunchcom
- Le web 20 cest pas du buzz httpweb2rulesblogspotcom
- Mashable France httpfrmashablecom - Mashable httpmashablecom - AccessoWeb httpblogaccessowebinfo - Web 20 Magazine httpweb2magazineblogspotcom - Reacutevolution Web 20 en Live httpwwwwebdeuxinfo
- ReadWriteWeb httpwwwreadwritewebcom - Web 20 Innovations httpweb2innovationscom - Web 20 Summit httpwwwweb2concom
- Original Signal (agreacutegateur de flux RSS) httpwwworiginalsignalfr - Whats Web 20 (agreacutegateur de flux RSS) httpwwwwhatsweb20comaggregatorfrom=100
- Le blog de Bloxx Communiquons avec le Web 20 httpblogbloxxfr
copy Digimind Digimind Services ndash White Paper |99
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- FrenchWeborg Le blog des professionnels franccedilais du Web 20 httpwwwfrenchweborg
- Blog Web 20 et Marketing httpwwwvincentabrycom - Le Web 20 en Action httpleweb2blogspotcom - aYsoon 20 httpblogaysooncom Emmanuel de Taillac httpemmanueldetaillacfr - NiouMedia httpnioumediacom - 2803 httpwww2803com - Web 2 francophone (Wiki) httpweb2frcomAccueil
Blogs et sites avec un axe Web 20
- Publishing 20 httppublishing2com - Social-Computing httpwwwsocial-computingcom - Ecosphere httpecospherewordpresscom - inFLUX httpinfluxjouebcom - Benoit Descary httpdescarycom - Jean Michel Billaut httpbillauttypepadcomjm - Blog francophone des TIC httpwww2607fr 20Minutes Top 50 tech et meacutedias httpwww20minutesfrarticle15087620070410-Blogs-Top-50-tech-et-mediaphp - Intruderstv httpnewintruderstvintruders_fr
copy Digimind Digimind Services ndash White Paper |100
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- Jeff Clavier Sans Accent httpsansaccentsofttechvccom - Demain tous journalistes httpbenoit-raphaelblogspotcom
- Collectif louvre-boicircte Initiatives sur le partage dinformation httplouvre-boiteviablogacom
- Zero seconde httpzerosecondeblogspotcom
Articles
Introduction au Web 20
- Web 20 lrsquoarticle de OrsquoReilly reacutesumeacute pour les faineacuteantshellip httpwwwexpressionsbe20051101web-20-resume-pour-les-faineants
- Dossiers Web 20 - Journal Du net httpwwwjournaldunetcomdossiersweb20
- Avis des managers le Web 20 agrave la loupe httpwwwjournaldunetcomsolutions0603diaporamaavis-managers-web21shtml
- Les entreprises face aux deacutefis du Web 20 httpwwwjournaldunetcomsolutions0704070413-entreprises-web-201shtml
-The Machine is Using Us Transcription (videacuteo) httpmediatedculturesnetksudiggp=78
- The New Wisdom of the Web httpwwwmsnbcmsncomid12015774sitenewsweek
- Quest-ce que Web 20 httpwww01netcomarticle294819html
- Approaching a definition of Web 20 httpsocialsoftwareweblogsinccom20050929approaching-a-definition-of-web-2-0
- Fonctionnement de lrsquoentreprise classique vs entreprise 20 httpalbancornilletfreefrakwindexphp20061002fonctionnement-de-lentreprise-classique-vs-entreprise-20
- Meacutedias traditionnels et acteurs du Web 20 vers la cohabitation ou la convergence des acteurs de lrsquoinformation et du divertissement httpwwwscribdcomdoc50818These-sur-le-Web-2-Cabanis
copy Digimind Digimind Services ndash White Paper |101
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ajax
- LAjax en 5 questions httpwwwjournaldunetcomsolutions0602060208_qr-ajaxshtml - Ajax et Moteurs 20 httpwwwmoteurzinecomarchives2006moteurzine127html2
Les Mashups
- Les Mashups applications Web composites tregraves Web 20 httpwwwjournaldunetcomsolutions0606060628-qr-mashup-hybrideshtml
- Le modegravele eacuteconomique des Mashups httpwwwinternetactunetp=6285 Bookmarks sociaux Social search
- Le Social Bookmarking au secours de la pertinence de la recherche drsquoinformation httpwwwgillesbalmissecomv2spipphparticle171 - Whats the Big Deal With Social Search httpsearchenginewatchcomshowPagehtmlpage=3623153
- Whos Who in Social Search httpsearchenginewatchcomshowPagehtmlpage=3623173
Ouvrages
- Web 20 - Les internautes au pouvoir - Jean-Franccedilois Gervais httpwwwdunodcompagesouvragesficheouvrageaspid=50701
- Les reacuteseaux sociaux Pivot de lrsquointernet 20 - Alain Lefebvre httpwwwcluster21comfrbookreviewlivre_les_reseaux_sociaux - Web 20 (R)eacutevolutions et nouveaux services dInternet - Jean-Noeumll Anderruthy httpwwwamazonfrWeb-2-0-C3A9volutions-nouveaux-dInternetdp2746034972ref=sr_1_18402-7140143-8118507ie=UTF8amps=booksampqid=1178118687ampsr=8-18 - Web 20 The Future of the Internet and Technology Economy and How Entrepreneurs Investors Executives amp Consumers Can Take Ad httpwwwamazoncomWeb-2-0-Technology-Entrepreneurs-Execenablersdp1587622009ref=sr_1_6103-0331542-4028646ie=UTF8amps=booksampqid=1178118732ampsr=1-6
- La Longue Traicircne La nouvelle eacuteconomie est lagrave - Chris Anderson httpwwwamazonfrLongue-TraC3AEne-nouvelle-C3A9conomie-
copy Digimind Digimind Services ndash White Paper |102
Le Web 20 pour la veille et recherche dinformation DIGIMIND
estdp2744062693ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180542516ampsr=1-1 - The Geospatial Web How Geobrowsers Social Software and the Web 20 are Shaping the Network Society httpwwwamazoncomGeospatial-Web-Geobrowsers-Information-Processingdp1846288266ref=sr_1_28103-0331542-4028646ie=UTF8amps=booksampqid=1178118760ampsr=1-28 - Les Wikis espaces de lintelligence collective - Jeacuterocircme Delacroix httpwwwamazonfrWikis-JC3A9rC3B4me-Delacroixdp2952051445ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180544723ampsr=8-1 - Pro Web 20 Mashups Remixing Data and Web Services httpwwwamazonfrPro-Web-2-0-Mashups-Remixingdp159059858Xref=sr_1_4403-1740173-8750801ie=UTF8amps=english-booksampqid=1180542751ampsr=8-4 - Web 20 et Web avanceacute - Alexandre Boni Nicolas Stemart httpwwwamazonfrWeb-2-0-avancC3A9-Alexandre-Bonidp2742967281
copy Digimind Digimind Services ndash White Paper |103
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Dans la mecircme collection
White Paper Blogs et RSS des outils pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind
White Paper
Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind
White Paper
Cateacutegorisation automatique de textes
White Paper
Benchmark des solutions de veille strateacutegique
White Paper
Evaluer le Retour sur Investissement dun logiciel de veille Edouard Fillias Consultant Veille Strateacutegique Digimind
gt A teacuteleacutecharger sur httpwwwdigimindfrserviceswhite_paperhtm
copy Digimind Digimind Services ndash White Paper |104
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Notes 1 httpwwwguimfrblog200612le_film_autumn_html httpwwwlemondefrwebarticle01-02-65186536-8751060html 2 httpvideogooglefrvideoplaydocid=724218352255575783 3 Map of online communities par Randall Munroe httpwwwxkcdcomc256html 4 httpwwwdeuxzerocom 5 httpwwwpaulgrahamcombiohtml httpfrwikipediaorgwikiPaul_Graham 6 Qursquoest ce que le web 20 Hubert Guillaud Internet Actu 29 mai 2005 httpwwwinternetactunetp=6144 7 httpwwworeillynetcompubaoreillytimnews20050930what-is-web-20html httpweb2rulesblogspotcom200601what-is-web-20-par-tim-oreilly-versionhtml 8 httpwwwzdnetfractualitesinternet0390207743933447900htm 9 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 10 httpwwwinternetactunetp=7035 11 httpwwwhitwisecomdatacenter 12 httprosstypepadcomblog200604power_law_of_pahtml 13 httpblogsforrestercomcharleneli200704forresters_new_html 14 httpwwwtagcrowdcom 15 You Say You Want a Web Revolution httpwwwwiredcomsciencediscoveriesnews20050868403 16 httpsaddonsmozillaorgfrfirefoxaddon748 httpwwwjournaldunetcomdeveloppeurtutorielout050525-greasemonkey-presentationshtml 17 Mashups Google Maps httpwwwmibazaarcomextrasfortune100html httpwwwweatherbonkcomweatherindexjsp httpgmapstommanganusspacecraft_trackinghtml 18 httpwwwgooglecomcalendar 19 httpdocsgooglecom 20 httpwwwmoovementfr 21 httpwwwcooptincomfrWEBhomeaspx httpwwwjobmeeterscomfraccueilindexphp 22 httpwwwzliocom httpshoppingyahoocomshoposphere
copy Digimind Digimind Services ndash White Paper |105
Le Web 20 pour la veille et recherche dinformation DIGIMIND
23 httpwwwciaofr httpwwwwantunocom 24 httpmapsgooglefr httpwwwgeoportailfr httpearthgooglefr httpmapsyahoocom httpwwwflickrcom httpwwwzdnetfractualitesinternet0390207743936635400htm 25 httpwwwcriteocom 26 From Youtube to Youniversities Henry Jenkins 16 feacutevrier 2007 httpwwwhenryjenkinsorg200702from_youtube_to_youniversityhtml 27 httpaffordancetypepadcom 28 httpwwwplosoneorghomeaction 29 Web collaboratif web coopeacuteratif web 20 quelles interrogations pour lrsquoenseignant documentaliste Marie France Blanquet 12 janvier 2007 httpeprofsdocscrdp-aix-marseillefrIMGrtfintervention-MF-Blanquetrtf 30 httpveillepedagogiquebloglemondefr 31 httpbibliobsessionfreefrdotclear 32 httpliblogsalbanyedulibrary20200611a_librarians_20_manifestohtml 33 httpdelicious 34 httpwwwconnoteaorg httpwwwciteulikeorg httpwwwsnipitroncom 35 httpdelicious httpwwwblinklistcom httpblogmarksnet httpwwwfurlnet httpfrbetabookmarksyahoocom httpmyweb2searchyahoocom 36 httpwwwstumbleuponcom httpsimilicious httpwwwyoonocomindexjsp 37 Social bookmarks charts version 35 httpwwwiroxdefile_download3 httpwwwroxomaticde856 Social Bookmarking Services And Tools The Wisdom Of Crowds That Organizes The Web httpwwwmasternewmediaorgnews20061201social_bookmarking_services_and_toolshtm Free Bookmark Managers
copy Digimind Digimind Services ndash White Paper |106
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwfeedbuscombookmarks 38 httpwwwflickrcom 39 httpwwwflickrcomgroupstehipool 40 httpwwwflickrcomphotostagsnorthamericaninternationalautoshow 41 httpphotobucketcom 42 httpwwwsquidoocom 43 httpwwwsquidoocomnanotechRev 44 httpwwwsquidoocomtagsmarketing 45 httpwwwyoutubecom 46 httpwwwdailymotioncom 47 Une seacutelection de moteurs de recherche videacuteo et de services de partage et teacuteleacutechargement de videacuteos httpcasselinfreefrfrenchvideoshtm 48 httpwwwemarketercomArticleaspxid=1004918 49 httpwwwviadeocom 50 httpwwwlinkedincom 51 httpwww6nergiesnet httpwwwxingcom 52 httpwwwfacebookcom 53 httpenwikipediaorgwikiList_of_social_networking_sites 54 httpwwwlinknrankcombusinessphp 55 httpdiggcom 56 httpwwwnuouzcom httpwwwblogmemescom httpwwwscoopeocom httpwwwfuzzfr httpwwwtapemoicom httpmeneamenet httpwwwrojocom httpwwwbetanetscapecom 57 httpwwwwikiofr 58 httpwwwagoravoxfr 59 Carlo Revelli Joeumll de Rosnay httpfrwikipediaorgwikiCarlo_Revelli httpfrwikipediaorgwikiJoC3ABl_de_Rosnay 60 Agoravox politique eacuteditoriale httpwwwagoravoxfrarticlephp3id_article=60 61 httpwwwreadspeakercom 62 httpenglishohmynewscom
copy Digimind Digimind Services ndash White Paper |107
Le Web 20 pour la veille et recherche dinformation DIGIMIND
63 State of the Blogosphere- avril 2007 httpwwwsifrycomalertsarchives000493html 64 Les blogs dans le monde Estimation agrave partir des chiffres produits par Digimind Blog Herald Technorati PewInternet Meacutediameacutetrie Loiumlc le Meur Live Journal Skyblogs Overblogs Terra MSN Spaces Splinder Excite Bloggersit Timblog W3B Skynet Bloghr Overskriftdk Smartlog onetpl Tenbit mylogpl eblogpl Blogpl Blogipl blogcentralis Romandiefr Blogspot timsoftro Globocom Financial Express Prixadi blog Baidu Yahoo Blogs South Korea Planet Weblog Service Cyworld LAtelier et ZDNet Australia 65 httpwwwnaturecomwebfeedsindexhtml httpwwwsciencemagorgrss 66 httpsearchlivecom 67 httpsearchyahoocom 68 httpnewsgooglefr httpfrnewsyahooco httpfrnewsbotmsncom httpwwwtopixnet httpwwwwikiofr 69 httpgroupsgooglefrgrouprectraveleuropefeedshl=fr 70 httpwwwforummobilescomindexphpshowforum=200 71 httpfrgroupsyahoocom 72 httpfrmyweb2searchyahoocom httpblogmarksnet httpdelicious 73 httpwwwflickrcom httpphotobucketcom 74 httpwwwyoutubecom httpwwwdailymotioncomfr 75 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 76 httpblogsearchgooglefr httpfraskcomsubjectbls|pg1 httpwwwfeedstercom httpwwwblogpulsecom httpwwwtechnoraticom httpwwwspherecom 77 httpwwwsifrycomalertsarchives000493html 78 httpfrsearchyahoocomwebadvancedei=UTF-8ampybs=0 httpwwwexaleadfrsearchresultsq=sarkozyamp24mode=allweb 79 httpwwwblogaramacom httpwwwrss-networkcom
copy Digimind Digimind Services ndash White Paper |108
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwrssfeedscom 80 httpwww43thingscom http36trucscom 81 httptrainquecomcodedelicious_lookupphp 82 httptechnoraticomtag 83 httpwwwsearchlescom 84 httptagcentralnet httpwwwkeotagcom httpwwwthagoocom httpwwwzewolnet httpwwwgnoshorg 85 httpwwwzibbcom 86 httpwwwecransfr 87 Google Tag Cloud Maker httpuserscriptsorgscriptsshow6171 88 httpnewzingocom 89 Folksonomies les usagers indexent le web Olivier le Deuff Bulletin des Bibliothegraveques de France ndeg4 2006 90 Folksonomy les tags en deacutelire Cyril Fieacutevet Internetactu 13 octobre 2005 httpwwwinternetactunetp=6166 91 httpwwwzoominfocom 92 httpwwwzikicom 93 httpwwwyonamecom httpwwwstalkeraticom httpwinkcom 94 httpfranswersyahoocom httpanswersyahoocom httpaskyahoocom 95 httpanswersgooglecomanswers 96 httpiqlycosfr httpqnalivecombetaaspx 97 httpwwwexpertscomdirectoryasp 98 httpsearchwikiacomwikiSearch_Wikia 99 httpdeciphocom 100 httpwwwyoonocom 101 httpwwwfooxxcom
copy Digimind Digimind Services ndash White Paper |109
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwwebzzlecom 102 httpinfluxjouebcomnewspowerset-et-xerox-parc-s-attaquent-a-google-naturellement 103 httpwwwmedglecom httpwwwmedwormcom httpwwwmedstorycom httpwwwsearchmedicacouk 104 httpwwwrollyocom httpswickihomeeurekstercom httpgooglecomcoopcseoverview httpbuildersearchyahoocom 105 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 106 Le web invisible (deep web hidden web) deacutesigne la partie du web non accessible aux moteurs de recherche classiques Le web invisible comprend des bases banques de donneacutees et bibliothegraveques en ligne gratuites ou payantesIl est constitueacute de pages web mal ou non indexeacutees par les moteurs Pour plus de preacutecisions voir le White Paper Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique httpwwwdigimindfrserviceswhite_paperhtm 107 httpwwwthelancetcom 108 httpwwwdigimindfrproduitsfinderhtm 109 httpwwwncbinlmnihgoventrezqueryfcgiCMD=searchampDB=pubmed 110 httppminlmnihgovinteractindexphptop httpwwwhubmedorg 111 httpwwwusptogovpatftindexhtml httpwwwwashingtonpostcomwp-dyncontentarticle20070304AR2007030401263html 112 httpwwwgooglecomhistory 113 httpwwwgooglecomhistorytrends httpwwwgooglecomhistoryitems 114 httpfrwikipediaorgwikiApplication_composite 115 httpwwwmibazaarcomextrasfortune100html 116 httptagmapsresearchyahoocomworldexplorerphp 117 httpflickrvisioncom 118 httpgmapstommanganusspacecraft_trackinghtml 119 httpwwwhealthmaporg httpwwwbrevardbiodieselorgmapbdhtml httpkartametroinfokartadefaultaspxhl=EN httpwwwwikimapiaorg httpwwwglobalincidentmapcomhomephp httpdartmapsmackerscom
copy Digimind Digimind Services ndash White Paper |110
Le Web 20 pour la veille et recherche dinformation DIGIMIND
120 httpwwwtagurlscom 121 httpwwwthemolucom httpwwwgnoshorg 122 httpwwwwebmashupcom httpwwwprogrammablewebcommashupsdirectory httpmashupfeedcom 123 httpgooglemapsmaniablogspotcom 124 httplocalalkemiscom 125 httpwwwvoxcom httpwwwover-blogcom httpwwwblogspiritcomfrindexphp httpwwwtypepadcom httpswwwbloggercomstart httpviablogacom httpwwwhautetfortcom 126 httpcasselinfreefrfrenchweblogshtmoutils 127 httpwwwclubiccomarticle-67515-8-comparatif-plateformes-blogshtml httpwwwojrorgojrimagesblog_software_comparisoncfm 128 httpwwwfeedburnercomfbahome 129 httppagesgooglecom 130 httpwwwdigimindfrserviceswhite_paperhtm 131 httpfrwikipediaorgwikiAccueil 132 httpblogouter-courtcomarchive2006-12-05-n22html 133 httpwwwnaturecomnews2005051212full438900ahtml httpwwwnaturecomnaturebritannicaindexhtml httpwwwnaturecomnews2005051212multimedia438900a_m1html 134 httpwwwwikiseekcom 135 httpwwwexaleadfr 136 httpwwwwikimindmaporg 137 httpencitizendiumorgwikiMain_Page 138 httpwwwalacrawikicom 139 httpceclinesxwikicomxwikibinviewMainFils+RSS 140 httpwwwwikidwebcom 141 httpwwwoperacom httpwwwmaxthoncom httpwwwmicrosoftcomfrancewindowsie httpwwwmozilla-europeorgfrproductsfirefox
copy Digimind Digimind Services ndash White Paper |111
Le Web 20 pour la veille et recherche dinformation DIGIMIND
142 httpfrtechcrunchcom20060401analysons-les-lecteurs-rss-en-ligne httpvtechcanalblogcomarchives20051025927489html httpvtechcanalblogcomarchives20050905780635html httpallrsscomrssreadershtml 143 httpinfluxjouebcomnewsles-pages-personnalisables-bookmark-n-1 httpwwwinformationoverlordcouk200603where-to-start-in-search-of-ideal_26 144 httpwwwdigimindfrproduitsindexhtm 145 httpshareopmlorg 146 httpwwwquechoisirorgArticlejspid=RessourcesArticlesEF33CF34D5616AF2C125720D0050E701ampcatcss=TEL000 147 httpweblogshitwisecombill-tancer 148 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 149 httpwwwbusinessweekcominnovateNussbaumOnDesignarchives200704are_most_web_20html 150 httpblogsforrestercomcharleneli200704forresters_new_html httprosstypepadcomblog200604power_law_of_pahtml 151 httpwwwobservatoire-omicorgcolloque-icicpdfBarbe3_1pdf 152 httpwwwaaronswcomweblogwhowriteswikipedia 153 httpaphgcaenfreefrchronique393aphg393htm 154 httpfrwikipediaorgwikiDroits_de_l27homme_en_Iran 155 httpfrwikipediaorgwikiWikipC3A9diaArticles_de_qualitC3A9 156 httpenwikipediaorgwikiJohn_Seigenthaler_Sr_Wikipedia_biography_controversy 157 httppewresearchorgpubs71riding-the-waves-of-web-20 158 httptallblogcontedoxacukwp-contentuploads200703survey-summarypdf 159 httpwwwcafepresscomnerdwideweb 160 httpwwwecransfrspipphprubrique30 161 httpfrcreativecommonsorg 162 httpwwwzdnetfractualitesinternet0390207743933447900htm 163 httpwebsemantiqueorgPagePrincipale httpwwww3orgDesignIssuesSemantichtml httpwwww3org2002Talks1213-lpslide1-0html 164 httpwwwinternetactunetp=6902
copy Digimind Digimind Services ndash White Paper |112
- Digimind Services
- Christophe ASSELIN
- Veronique MESGUICH
-
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La carte des communauteacutes virtuelles Par Randall Munroe DR
DEFINITION DU WEB 20
Comment deacutefinir de faccedilon preacutecise ce que recouvre cette notion parfois floue
Depuis plusieurs mois le blog collectif Dessine moi le Web 20 4 propose agrave des
universitaires informaticiens philosophes entrepreneurs de donner leur propre
vision du pheacutenomegravene et eacutechanger ideacutees et points de vue La diversiteacute et la richesse
des contributions illustrent la difficulteacute agrave donner une deacutefinition exhaustive de ce
concept agrave geacuteomeacutetrie variable mecirclant agrave la fois des aspects techniques et sociaux
Une vision reacuteductrice du Web 20 consisterait agrave nrsquoy voir que la mutualisation de
contenus produits et mis en ligne par les utilisateurs eux-mecircmes ou agrave reacutesumer
lrsquoengouement actuel agrave un effet de mode passager Depuis la premiegravere confeacuterence
Web 20 en 2004 le concept srsquoest concreacutetiseacute agrave travers de nombreuses
expeacuterimentations ou le deacuteveloppement de nombreux services largement utiliseacutes
Nous tenterons dans ce document de brosser un panorama des enjeux usages et
technologies lieacutes agrave cette notion aussi encenseacutee que controverseacutee
copy Digimind Digimind Services ndash White Paper |6
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Plusieurs auteurs srsquoaccordent sur lrsquoideacutee selon laquelle le web 20 ne constitue pas
une rupture technologique ni hellip sociale Il srsquoagirait plutocirct drsquoun retour aux sources
drsquoune renaissance du web tel qursquoil a eacuteteacute conccedilu agrave lrsquoorigine les utilisateurs srsquoeacutetant
entre temps approprieacutes les modes de creacuteation et de diffusion
Pour Paul Graham5 pionnier de lrsquoInternet et fondateur de la socieacuteteacute Viaweb en
1995 le web 20 est le web comme il a eacuteteacute conccedilu pour ecirctre utiliseacute Les tendances que
nous distinguons sont simplement la nature inheacuterente du web qui eacutemerge des mauvaises
pratiques qui lui ont eacuteteacute imposeacutees pendant la bulle Internet
Le web creacuteeacute au deacutebut des anneacutees 90 par Tim Berners Lee comportait deacutejagrave en
germe bien des eacuteleacutements du web 20 mutualisation des connaissances eacutechange
travail collaboratif interactiviteacute intelligence collective hellip Ce nrsquoest sans doute pas
un hasard si Dale Dougherty lrsquoun des pegraveres fondateurs de la formule 20 fut lui
aussi lrsquoun des pionniers du web et notamment le fondateur de GNN le premier
portail financeacute par la publiciteacute
Naissance du concept
Crsquoest au cours de lrsquoeacuteteacute 2004 que le terme de web 20 apparaicirct pour la premiegravere
fois lors drsquoune seacuteance de brainstorming Dale Dougerthy co-fondateur de la
socieacuteteacute drsquoeacutedition OrsquoReilly et Craig Cline de MediaLive reacutefleacutechissent agrave des thegravemes
eacutemergents en vue drsquoune confeacuterence agrave venir Le journaliste John Battelle co-
fondateur du magazine Wired se joint un peu plus tard au duo et la premiegravere
confeacuterence Web 20 a lieu en octobre 2004 Lrsquoexpression 20 est utiliseacutee agrave ce
propos pour marquer lrsquoeacutemergence drsquoune nouvelle eacutetape dans la courte histoire du
web eacutetape caracteacuteriseacutee par un changement des regravegles et une modification des
modegraveles de revenus Le volet social sera deacuteveloppeacute plus tardivement par Tim
OReilly lors de la deuxiegraveme confeacuterence Web 20 en octobre 2005
Les nouveaux produits et services associeacutes au web 20 vont ainsi repositionner
lrsquointernaute au cœur du systegraveme Des techniques de publications simples et souples
comme les blogs les plates-formes collaboratives de type Wiki offrent des
possibiliteacutes accrues de production diffusion et consommation des contenus
Lrsquointernaute devient ainsi co-creacuteateur de nouvelles applications en ligne initiant
souvent de faccedilon collective ou communautaire de nouvelles formes de relations
numeacuteriques Selon lrsquoexpression drsquoHubert Guillaud6 le web devient non plus une
aventure technologique mais bien une aventure humaine
copy Digimind Digimind Services ndash White Paper |7
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LES 7 PRINCIPES DU WEB 20
Le texte de Tim OrsquoReilly paru en 2005 7 sous le titre Qursquoest ce que le web 20
deacutegage sept principes cleacutes du Web 20 en voici un petit reacutesumeacute
1 Le web vu comme une plate-forme de services
On passe dune collection de sites web agrave une plateforme informatique agrave part
entiegravere fournissant des applications web aux utilisateurs
2 Consideacuterer les internautes comme co-deacuteveloppeurs des applications On passe ainsi
de la notion de logiciel produit agrave celle de logiciel service
3 Le service srsquoameacuteliore quand le nombre drsquoutilisateurs augmente
Le Web 20 met agrave profit lrsquoeffet de la longue traicircne (ou long tail en anglais)
populariseacute par le magazine Wired les produits qui sont lrsquoobjet drsquoune faible
demande ou qui nrsquoont qursquoun faible volume de vente peuvent collectivement
repreacutesenter une part de marcheacute eacutegale ou supeacuterieure agrave celle des best-sellers si les
canaux de distribution peuvent proposer assez de choix Les utilisateurs du Web
20 disposent de donneacutees uniques difficiles agrave recreacuteer et dont la richesse srsquoaccroicirct
avec lrsquoaugmentation du nombre des utilisateurs
4 La richesse est dans les donneacutees Toutes les applications web drsquoimportance sont
lieacutees agrave une base de donneacutees speacutecialiseacutee OrsquoReilly envisage un mouvement des
donneacutees libres srsquoopposant peu agrave peu agrave lrsquounivers des donneacutees proprieacutetaires
5 Tirer parti de lrsquointelligence collective crsquoest le principe mecircme adopteacute par
lencyclopeacutedie en ligne Wikipedia et drsquoautres sites similaires Pour Tim OrsquoReilly
lrsquoimplication des utilisateurs dans le reacuteseau est le facteur-cleacute pour la supreacutematie sur le
marcheacute
6 Mettre en place des interfaces souples et leacutegegraveres fondeacutees sur les nouveaux
standards et protocoles du Web Le logiciel se libegravere du PC Une autre des
caracteacuteristiques du web 20 est le fait qursquoil nrsquoest plus limiteacute agrave la plate-forme PC
mais vise notamment les objets nomades teacuteleacutephone portable PDA ou lecteur
portatif audio
copy Digimind Digimind Services ndash White Paper |8
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LES EVOLUTIONS PAR RAPPORT AU WEB 10 LE ROLE DE LINTERNAUTE
En quoi le Web 20 se distingue-t-il de la vague preacuteceacutedente On a vu que lrsquoune des
caracteacuteristiques majeures du pheacutenomegravene est lrsquoappropriation des contenus et des
modes de diffusion par les internautes eux-mecircmes via des applications souples et
leacutegegraveres
Paul Graham eacutevoque le principe de deacutemocratie du Web 20 cest-agrave-dire la
superposition au reacuteseau technique drsquoun reacuteseau humain qui participe agrave la creacuteation et
agrave lrsquoenrichissement de contenus et services Lrsquointernaute deviendrait ainsi
consommrsquoacteur agrave lui de produire publier diffuser indexer partager des
contenus de tous types
Web 10 Web 20
Leaders du web Entreprises marchands Internautes
Profil de linternaute Passif Actif
Interactiviteacute perccedilue Seacutelection et lecture dinformation
Seacutelection lecture et publication de donneacutees
Uniteacute de recherche Mot-cleacute Tag
Du Web 1 vers le Web 2 Source ZDNet 8
Pour autant les internautes vont-ils devenir tous acteurs de ce processus Selon un
article de Charles Arthur dans The Guardian 9 pour un groupe de 100 personnes si
lrsquoune creacutee du contenu 10 seulement vont interagir en apportant commentaires et
ameacuteliorations les autres se contentant drsquoune consommation passive Ce constat
obtenu via des retours drsquoexpeacuterience sur des sites collaboratifs illustre la regravegle des
11089 selon laquelle plus de 80 des contenus produits proviennent drsquoun
nombre tregraves restreint drsquoutilisateurs
Tendance confirmeacutee par les chiffres preacutesenteacutes lors de la Web 20 Expo en avril 2007
et repris dans Internetactu 10 selon la socieacuteteacute de mesure drsquoaudience Hitwise11
016 des internautes qui passent sur YouTube y placent des films - alors qursquoils
eacutetaient encore 05 agrave le faire en juillet 2006 seulement 02 des visiteurs de
Flickr y publient des photos La seule exception agrave cette faible participation provient
copy Digimind Digimind Services ndash White Paper |9
Le Web 20 pour la veille et recherche dinformation DIGIMIND
de Wikipedia ougrave 46 des visiteurs contribuent agrave lrsquoenrichissement de
semblent en effet
voir eacutecrit des textes longs (en un nombre reacuteduit drsquointerventions) tandis que les
eacutediteursrdquo les plus actifs qui forment le noyau des wikipeacutediens nettoient corrigent
lective fondeacutee sur des actions agrave faible niveau drsquoexigence
(lire enregistrer un signet tagger commenter) de lrsquointelligence collaborative
caracteacuteriseacutee par des formes de participations plus actives et intenses eacutecrire
collaborer modeacutererhellip
lrsquoencyclopeacutedie
Jimmy Wales fondateur de Wikipedia estime qursquoun nombre restreint de
contributeurs et eacutediteurs font lrsquoessentiel du travail alors qursquoun nombre consideacuterable
de lecteurs apportent peu de modifications Le wikipeacutedien Aaron Swartz nuance
ce point de vue un grand nombre de contributeurs occasionnels
a
ldquo
mais sans apporter eacutenormeacutement de texte
Le Web 20 et tout particuliegraverement la blogosphegravere semble suivre la loi de la
participation eacutedicteacutee par Ross Mayfield preacutesident de la socieacuteteacute Social Text sous le
nom de Power law of participation12 Cette loi baseacutee sur lrsquoobservation des
pratiques et des seuils de participation aux dispositifs communautaires constate que
la participation srsquoamenuise agrave mesure que les formes de participation se
complexifient Le scheacutema ci-dessous qui rappelle celui de la Longue Traicircne
distingue lrsquointelligence col
Power Law of Participation par Ross Mayfield CC
copy Digimind Digimind Services ndash White Paper |10
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Le cabinet Forrester deacutetaille enc
de la participation figurant dans son eacutetude Social Technographics 13 la grille compte
6 eacutechelons correspondant aux niveaux de particip
les inactifs (52 )
les spectateurs (33 ) consommateurs de contenus texte ou multimeacutedia (blogs
videacuteos mis en ligne par les utilisateurs podcasts)
ore davantage les niveaux drsquoimplication dans la grille
ation
les menuisiers (19 ) utilisateurs de reacuteseaux sociaux
es collecteurs (15 ) utilisent des flux RSS et taggent les pages web
les critiques (19 ) postent des commentaires sur les blogs des avis et critiques
les creacuteateurs (13 ) publient des contenus en ligne (blogs videacuteos)
l
copy Digimind Digimind Services ndash White Paper |11
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Glossaire du Web 20
Pour mieux comprendre les concepts utiliseacutes dans lunivers du Web 20 nous vous
proposons ce glossaire des termes essentiels
Tags mot clef sous forme drsquo eacutetiquette que les utilisateurs peuvent apposer sur
un document numeacuterique (texte photo videacuteo) de faccedilon agrave en deacutecrire le contenu Le
tagging introduit une part de subjectiviteacute par rapport agrave lrsquoindexation automatique
effectueacutee par les moteurs Les tags peuvent eacutegalement ecirctre extraits
automatiquement drsquoun texte en fonction de leur freacutequence drsquooccurrence
Nuage de tags preacutesente les tags correspondant agrave un site (ou agrave plusieurs) en les
regroupant sur un mecircme espace et leur attribuant une taille variable suivant la
freacutequence dutilisation ou drsquooccurrence Cela donne une vision drsquoensemble des
principales theacutematiques Le site Tagcrowdcom14 permet de geacuteneacuterer un nuage de
tags agrave partir drsquoun texte
Folksonomie (traduit eacutegalement parfois par potonomie peuplonomiehellip)
Ce mot valise contraction de folk (peuple) et taxonomie deacutesigne une forme de
classification collaborative deacutecentraliseacutee spontaneacutee baseacutee non pas sur un
vocabulaire controcircleacute et standardiseacute mais sur des termes choisis par les utilisateurs
eux-mecircmes intituleacutes tags Lrsquoobjectif eacutetant de faciliter lrsquoindexation des contenus
ainsi que la recherche drsquoinformation
Blogs journal personnel disponible sur le web Peut ecirctre tenu par un particulier
un chercheur un journaliste un salarieacute drsquoentreprise ou plus rarement par un groupe
de personne (entreprise collectiviteacutehellip) Le blog a pour objet de diffuser des billets
geacuteneacuteralement lieacutes agrave lrsquoactualiteacute et preacutesenteacutes par ordre chronologique alors qursquoun
wiki est destineacute agrave la mutualisation des connaissances Un blog peut preacutesenter des
contenus multimeacutedias photo (photoblog) son ou videacuteo (vblog vlog)hellip
Blogosphegravere la biosphegravere des blogs Ce mot valise deacutesigne la communauteacute
des blogs ou encore lrsquoensemble des auteurs de blogs La blogosphegravere est largement
interconnecteacutee les trackbacks situeacutes sur la plupart des blogs permettant de lier
copy Digimind Digimind Services ndash White Paper |12
Le Web 20 pour la veille et recherche dinformation DIGIMIND
deux articles traitant de sujets connexes Lrsquoeacutelite des blogueurs particuliegraverement
influents peut ecirctre qualifieacutee ironiquement de blogeoisie
Blogroll ou blogoliste liste de liens vers drsquoautres blogs preacutesenteacutes par lrsquoauteur
drsquoun blog On peut syndiquer sur une mecircme page des billets venant de ces blogs via
les formats RSS
RSS lrsquoacronyme signifie selon les versions Really Simple Syndication (RSS 20) RDF
Site Summary (RSS 09 10 et 11) ou encore Rich Site Summary (RSS 091) Ce
format de syndication permet drsquoextraire automatiquement dun site web ou drsquoun
blog du contenu reacuteguliegraverement mis agrave jour Un fichier RSS est un simple fichier texte
au format XML comportant la description syntheacutetique du contenu Ce format a eacuteteacute
creacuteeacute en 1999 par Netscape On peut srsquoabonner gratuitement agrave plusieurs flux RSS agrave
partir drsquoun lecteur on-line ou installeacute sur le PC
Atom Format normaliseacute de syndication de contenu Web baseacute sur le XML qui
permet la syndication de contenu entre diffeacuterentes ressources Web Concurrent
de RSS Le format Atom a eacuteteacute creacuteeacute dans le but de simplifier les diffeacuterents formats
RSS existants La diffeacuterence entre les deux formats reacuteside surtout dans lemploi de
balises XML diffeacuterentes Les deux formats sont geacuteneacuteralement lus par les
agreacutegateurs
Wiki Site web dynamique dont tout visiteur peut modifier les pages agrave loisir Le
terme vient la langue hawaiumlenne (wikiwiki = rapide) Un wiki a pour objectif de
mutualiser des connaissances et est organiseacute autour drsquoun plan de classement Les
contributeurs drsquoun wiki sont geacuteneacuteralement anonymes
Crowdsourcing Litteacuteralement approvisionnement par la foule Le
crowdsourcing consiste agrave utiliser la creacuteativiteacute lintelligence et le savoir-faire dun
grand nombre dinternautes pour creacuteer des contenus participer agrave lrsquoalimentation
drsquoun site Cette participation des utilisateurs agrave la creacuteation des contenus repreacutesente
une forme drsquoexternalisation (outsourcing) et permet de reacuteduire les coucircts en se
basant sur un systegraveme de beacuteneacutevolat ou de micropaiement
Reacuteseaux sociaux de nombreux sites de social networking ou reacuteseautage social
sont apparus avec la vague du Web 20 Ils permettent de mettre en relation des
personnes partageant les mecircmes centres drsquointeacuterecirct personnels ou professionnels
Ces reacuteseaux peuvent devenir de veacuteritables communauteacutes en ligne les plus fameux
eacutetant les sites Friendster ou Myspace ou bien dans la sphegravere professionnelle
copy Digimind Digimind Services ndash White Paper |13
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Linkedin ViadeohellipLa plupart des reacuteseaux sont ouverts certains fonctionnent sur le
mode de la cooptation
Podcasts issu de la combinaison des termes iPod (dApple) et broadcasting ce
terme deacutesigne le fait de rendre disponible en ligne un fichier audio au format
numeacuterique Ce fichier peut-ecirctre teacuteleacutechargeacute directement sur un ordinateur ou un
peacuteripheacuterique via un flux de diffusion Equivalent franccedilais baladodiffusion
Lrsquoutilisateur peut ainsi se composer une liste de lecture agrave la carte Pour les fichiers
videacuteo on emploi le terme de videacuteocast
AJAX (Asynchronous JavaScript And XML) meacutethode informatique de
deacuteveloppement dapplications Web permettant deacuteconomiser de la bande passante
en ne rechargeant pas une page entiegravere alors que seuls certains eacuteleacutements ont besoin
de lecirctre mais en ne rafraicircchissant que ces eacuteleacutements de la page Cela permet de
produire des contenus dynamiques et reacuteactifs en ne neacutecessitant que peu drsquoappels au
serveur heacutebergeant la page AJAX est une combinaison de plusieurs technologies
HTML CSS Javascript XMLhellipDe nombreux sites web 20 sont deacuteveloppeacutes en
AJAX
API Interface de programmation permettant agrave un utilisateur de deacutevelopper des
applications conviviales De nombreux sites classiques ou Web 20 proposent des
API pour inteacutegrer automatiquement leur contenu agrave dautres sites
Mashup ou Mash up application web composite mixant plusieurs sources ou
plusieurs contenus pour fournir un nouveau produit ou service Le terme se traduit
en franccedilais par remixage ou mosaiumlque Exemple de mashup la visualisation des
reacutesultats des eacutelections preacutesidentielles franccedilaises via Google Earth qui mixe les cartes
Google et les chiffres du Ministegravere de lInteacuterieur
Long tail (longue traicircne) Cette expression est utiliseacutee en statistiques et peut
srsquoappliquer au marketing Des produits rares ou qui font lrsquoobjet drsquoune faible
demande peuvent collectivement repreacutesenter une part de marcheacute eacutegale ou
supeacuterieure agrave celle des best-sellers si les canaux de distribution peuvent proposer
assez de choix Le caractegravere virtuel du web permet de geacuteneacuterer une longue seacuterie de
marcheacutes de niche heacuteteacuterogegravenes (exemple e-bay) par opposition aux grands
marcheacutes homogegravenes et grand public du monde reacuteel
copy Digimind Digimind Services ndash White Paper |14
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les technologies du Web 20
Mettons dabord les choses au point le Web 20 nest pas une (r)eacutevolution ou un
concept de dimension technologique
Ses applications sappuient sur des technologies deacutejagrave existantes reacutepondant aux doux
noms dAjax Soap REST RSS Perl Python PHP Ruby ou GreaseMonkey Lobjectif de
ce document nest pas de deacutevelopper ce volet technologique Nous en eacutevoquerons
seulement les grandes caracteacuteristiques pour mieux comprendre les enjeux
Le Web 2 repose notamment sur les interfaces utilisateurs dites riches qui
permettent des possibiliteacutes daffichage de configuration et de maniement plus
puissantes que les pages html classiques du Web 1 que ce soit pour le
deacuteveloppeur ou lutilisateur final
Tim Berners Lee co-inventeur du web remarque en fait ce Web 20 utilise les
standards qursquoont produit tous ces gens qui travaillent sur le Web 10 le Document
object model HTML et SVG (Scalable Vector Graphics) HTTPhellip Le Web 20
construit des services en srsquoappuyant sur les standards du web ainsi que sur JavaScript
(hellip)
Pour se structurer en reacuteseau de bases de donneacutees et services collaboratifs le web
20 utilise donc des technologies matures acircgeacutees de 5 agrave 10 ans pour la plupart
Leacutevolution nest pas tant dans la technologie elle-mecircme que dans la faccedilon de mixer
ces technologies pour apporter des services et une ergonomie nouvelle agrave
lutilisateur
Ainsi lAjax (voir glossaire) que lon cite souvent agrave propos des technologies phares
du Web 2 nest pas un nouveau langage mais un nouveau concept qui utilise les
standards XHTML et CSS DOM (Document Object Model) pour laffichage
dynamique XML et XSLT pour leacutechange de donneacutees ainsi que la reacutecupeacuteration de
donneacutees asynchrones via XMLHttpRequest JavaScript integravegre et combine tout ces
langages Le terme Ajax a eacuteteacute apporteacute par Jesse James Garrett de lrsquoagence web
Adaptive Path
copy Digimind Digimind Services ndash White Paper |15
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LAjax permet notamment de ne recharger que certains eacuteleacutements dune page plutocirct
que la page entiegravere Lors de modifications sur une page seuls les nouveaux
eacuteleacutements se rafraicircchissent eacuteconomisant ainsi des ressources du temps et de la
bande passante Lun des preacutecurseurs grand public dans lutilisation de cette
technologie fut A9 le moteur de recherche dAmazon il neacutetait pas neacutecessaire de
recharger la page agrave chaque fois que lon ajoutait de nouvelles sources et moteurs agrave
interroger 15
Greasemonkey est eacutegalement baseacute sur des scripts Cette extension pour le
navigateur Mozilla Firefox va encore plus loin dans le pouvoir accordeacute agrave linternaute
en exeacutecutant des scripts ce plug-in 16 permet de modifier lapparence des pages
web visiteacutees dy ajouter des fonctions (boutons case agrave cocher suppression des
publiciteacutes) Lutilisateur avanceacute peut mecircme eacutecrire ses propres scripts ou
teacuteleacutecharger des scripts mis agrave la disposition de tous
Le Web 2 est en fait une sorte de web lego qui permet dinnover via lassemblage
de briques les technologies de base sont multiples il est possible de creacuteer de
nouvelles applications agrave valeur ajouteacutee en les assemblant diffeacuteremment ou plus
rationnellement
Les mash-up un mixage de plusieurs applications (voir glossaire) en est une des
illustrations les plus visibles avec les mashups on agreacutege le contenu eacutemanant de
plusieurs sites afin de creacuteer un site nouveau On utilise alors souvent lobjet XML
lAJAX du cocircteacute de linternaute les RSS et les API (Web Services) des sites mixeacutes
LAPI nest donc pas seulement un dieu eacutegyptien Pour faire simple on peut dire
que cest une interface de programmation mise agrave disposition des internautes
(avertis) pour deacutevelopper des applications Une application pourra alors acceacuteder agrave
des programmes systegraveme pour envoyer recevoir ou extraire des donneacutees Ainsi
Google publie lAPI de Google Maps qui est utiliseacute par de nombreux deacuteveloppeurs
pour creacuteer des applications deacuteriveacutees du service de cartographie de Google par
exemple la carte de suivi du teacutelescope spatial Hubble la meacuteteacuteo dans le monde 17
Le rocircle du RSS (voir glossaire) est par ailleurs preacutepondeacuterant Ce format qui
permet dexporter et lire des donneacutees dactualiteacutes au format XML se retrouve dans
quasiment toutes les applications dites Web 2 et peut en constituer lemblegraveme sinon
la caracteacuteristique majeure avec les tags Il permet de surveiller les flux de nouvelles
informations issues de sites dactualiteacutes de blogs de moteurs de recherchehellipbref
de tout site web qui propose un contenu qui se renouvelle Le RSS va aussi servir agrave
exporter des bookmarks sociaux que sont les tags ou les favoris par exemple
copy Digimind Digimind Services ndash White Paper |16
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Si le Web 2 nest pas une reacutevolution technologique en soit la relative simpliciteacute de
mise en place de ces techniques et leurs coucircts de programmation reacuteduits expliquent
le tregraves fort deacuteveloppement que connaissent toutes ces applications Par ailleurs la
baisse constante du coucirct dheacutebergement et de bande passante a faciliteacute la diffusion
de ce web nouvelle geacuteneacuteration
Mais il subsiste des effets de seuil Des applications gigantesques comme Flickr de
Yahoo offrant lheacutebergement et le partage de photos impliquent la gestion de
vastes bases de donneacutees et des infrastructures de stockage importantes Seules de
grandes firmes comme Yahoo Inc Google Microsoft ou AOL par exemple peuvent
se deacutepartir efficacement de ce type de contraintes
copy Digimind Digimind Services ndash White Paper |17
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les familles dapplications du Web 20
TYPOLOGIE
Les familles drsquoapplications Web 20 sont nombreuses et diverses de nouveaux
services apparaissent quotidiennement (sans garantie de peacuterenniteacutehellipet bien souvent
de faccedilon redondante) Sans preacutetendre dresser une liste exhaustive des nombreuses
possibiliteacutes on peut deacutegager une typologie des applications selon diffeacuterents
domaines drsquoactiviteacute Les applications speacutecifiquement deacutedieacutees agrave la veille et agrave la
recherche dinformation seront deacuteveloppeacutees dans la partie suivante
Bureautique en ligne
Courant 2006 Google a lanceacute successivement plusieurs logiciels collaboratifs en
ligne un outil de gestion drsquoagendas (Google Calendar 18) un tableur (Google
Spreadsheet) et enfin apregraves le rachat de la socieacuteteacute Writely un traitement de texte
(Google Docs) 19 Ces logiciels permettent de creacuteer modifier partager et publier en
ligne des documents sur un espace de stockage Depuis plusieurs mois on assiste agrave
une veacuteritable deacuteferlante de logiciels de bureautique en ligne deacutesigneacutes parfois sous le
terme de web office RallyPoint AjaxWrite (pour Firefox uniquement) ZohoWriter
ThinkfreehellipOutre la gratuiteacute lrsquointeacuterecirct de ces logiciels concurrents de la suite
Microsoft Office est leur disponibiliteacute sur toute machine connecteacutee au reacuteseau et tout
systegraveme drsquoexploitation Attention toutefois aux questions de sauvegarde de
compatibiliteacute de synchronisation des donneacutees et enfin de confidentialiteacutehellip
Emploi
Les blogs constituent un bon moyen pour promouvoir son CV mettre en avant
expeacuterience et compeacutetences et faciliter les eacutechanges Des jobblogs verticaux
speacutecialiseacutes par secteur ou reacutegion connaissent un grand succegraves (voir par exemple
ceux du site et moteur Moovement20) Le networking professionnel est eacutegalement agrave
la mode agrave travers des sites comme Linkedin (creacuteeacute en 2003 aux Etats-Unis) Viadeo
(ex Viaduc drsquoorigine franccedilaise) ou Xing (ex OpenBC agrave vocation europeacuteenne) Le
principe est de tirer parti des reacuteseaux de connexions sociales virtuelles afin
copy Digimind Digimind Services ndash White Paper |18
Le Web 20 pour la veille et recherche dinformation DIGIMIND
drsquoidentifier des salarieacutes ou employeurs potentiels mais aussi drsquoeacutetoffer son reacuteseau de
clients partenaires fournisseurshellip
Lrsquoe-cooptation (Cooptin Jobmeeters 21) met le reacuteseau au cœur de la deacutemarche de
recrutement via un systegraveme de prime de cooptation et peut aider les demandeurs
agrave identifier les offres du marcheacute cacheacute
Commerce en ligne
Le client est roi et le Web 20 permet de rehausser son niveau de participation sur
les sites marchands On peut ainsi tagger ou annoter des reacutefeacuterences drsquoouvrages dans
le catalogue Amazon Gracircce agrave des sites comme Zlio ou la Shoposphegravere de Yahoo22
les internautes peuvent recommander agrave leur entourage des produits et
serviceshellipen touchant une commission sur les ventes reacutealiseacutees Des guides drsquoachat
et comparateurs de prix comme Ciao integravegrent les avis de consommateurs et
drsquoexperts Le site Wantuno (inspireacute de lrsquoameacutericain Woot) innove dans le domaine
de la vente eacuteveacutenementielle en vendant un seul produit nouveau high tech par jour
annonceacute en podcast videacuteo agrave des internautes preacutevenus par flux RSS23 Certains
analystes voient lrsquoavenir du commerce eacutelectronique dans le concept de CtoB
(Consumer to Business) inverse du BtoChellip
Geacuteolocalisation
Google Maps a eacuteteacute lrsquoun des premiers services de geacuteolocalisation en srsquoappuyant sur
lrsquooutil de recherche pour localiser sur des cartes des services de proximiteacute
(commerces station servicehellip) La version 2 du site Geacuteoportail de lrsquoIGN disponible
depuis fin mai 2007 srsquoenrichit de nouveaux services pratiques et citoyens (accegraves au
cadastre visualisation des zones agrave risquehellip) Google Earth fait lrsquoobjet de partenariats
avec la NASA ou le programme des Nations Unies pour lrsquoenvironnement La
geacuteolocalisation peut srsquoadapter eacutegalement au partage de photos (Yahoo Maps et
Flickr ou le projet Pikeo chez Orange)24
Recherche drsquoinformations
Des agreacutegateurs de meacutedia comme Digg ou Wikio laissent une large place agrave
lrsquointernaute pour tagger ou recommander par vote les articles issus de meacutedias
classiques ou blogs On suivra eacutegalement lrsquoactualiteacute en syndiquant des flux RSS agrave
travers des agreacutegateurs comme Netvibes ou Newsgator Les grands moteurs (Google
Custom Search Yahoo Search Builder MSN Live search Macros) offrent des options de
copy Digimind Digimind Services ndash White Paper |19
Le Web 20 pour la veille et recherche dinformation DIGIMIND
creacuteation de moteurs personnalisables effectuant des recherches sur des bouquets
de sources preacuteseacutelectionneacutees par lrsquoutilisateur On peut mutualiser les connaissances agrave
travers des wikis collaboratifs geacuteneacuteralistes (Wikipedia) ou speacutecialiseacutes Enfin le projet
de moteur collaboratif Wikiasari qui doit aboutir courant 2007 aura recours aux
mecircmes technologies libres que la ceacutelegravebre encyclopeacutedie ainsi qursquoagrave un reacuteseau humain
ou communauteacute de confiance qui validera les reacutesultats de la recherche
Les actualiteacutes sur Wikio sites de presse blogs et navigation par tags (agrave droite)
Diffusion drsquoactualiteacutes
Pour Pierre Chappaz fondateur du site Wikio les blogueurs ne sont pas journalistes
mais ils peuvent apporter une vraie expertise sur certains sujets quils connaissent et il
serait dommage de sen priver Selon lui les meacutedias 20 ne seront plus des canaux
exclusifs de diffusion mais producteurs de contenu et des marques Deacutesormais le
scoop nrsquoest plus lrsquoapanage des seuls journalistes aux Etats-Unis une jurisprudence
donne droit depuis 2006 aux blogueurs de proteacuteger leurs sources au mecircme titre
que les journalistes professionnels Des centaines de blogs politiques ont fleuri sur le
web certains drsquoentre eux se reacuteveacutelant particuliegraverement influents On parlera de
journalisme citoyen agrave propos de sites comme Agoravox ou de lrsquo alleacutee
numeacuterique Rue 89 lanceacutee en mai 2007 par drsquoanciens journalistes du quotidien
Libeacuteration Ces nouveaux meacutedias en ligne marient les communications venant de
journalistes professionnels experts et internautes
copy Digimind Digimind Services ndash White Paper |20
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Loisirs
On retrouve ici la notion de filtrage collaboratif baseacute sur un systegraveme de
recommandations et drsquoeacutevaluations par les utilisateurs Ces recommandations
peuvent concerner les livres les destinations de voyage la musique la videacuteohellipet
proviennent de lrsquoanalyse de comportements drsquoachats des internautes et de leurs
eacutevaluations de produits Le moteur drsquoanalyse preacutedictive Criteo 25 a ainsi lanceacute en
feacutevrier 2007 un service de recommandations automatique de blogs apregraves avoir
utiliseacute sa technologie pour lrsquoeacutevaluation de videacuteos
La participation des internautes peut aller jusqursquoau financement et agrave la production
drsquoœuvres artistiques le projet A swarm of angels permet drsquoaider agrave la creacuteation de
films qui seront distribueacutes sous licence creative commons et diffuseacutes via les reacuteseaux
peer-to-peer
Partage de documents multimeacutedia
Il srsquoagit sans doute drsquoune des applications les plus reacutepandues du Web 20 Les grands
acteurs du web ont largement investi ce domaine Google a racheteacute en 2006 le site
de partage de videacuteo Youtube Yahoo de son cocircteacute avait racheteacute le site de partage de
photos Flickr Les favoris peuvent eacutegalement ecirctre mutualiseacutes via des services en
ligne comme Delicious (groupe Yahoo) ou Blogmarks De nombreux services de
partages de photos videacuteo ou podcasts se sont deacuteveloppeacutes reacutecemment on peut
citer parmi eux les sites franccedilais DailyMotion ou la banque drsquoimages Fotolia Podemus
ou Radioblog figurent parmi les sites communautaires de podcasts
Enseignement et recherche
Henry Jenkins26 professeur au MIT imagine des uniteacutes drsquoenseignement conccedilues
sur les modegraveles YouTube ou Wikipedia des deacutepartements qui ldquopermettraient le
deacuteploiement rapide drsquoexpertises disperseacutees et la reconfiguration des champsrdquo De
nouveaux usages apparaissent dans le paysage eacuteducatif mais attention lagrave encore agrave
lrsquoillusion de faciliteacute selon le philosophe Fernando Savater laquo Internet neacuteduque pas il
neacutecessite mecircme une eacuteducation preacutealable raquo Olivier Ertzcheid dans son blog Affordance 27 distingue plusieurs eacuteleacutements caracteacuteristiques drsquoune science 20 et notamment
la possibiliteacute drsquoannoter et commenter des publications scientifiques (notamment les
collections Open Acess Plos One28) ou de nouveaux modes drsquointerrogation des
bases de donneacutees (interface Hubmed sur la base meacutedicale Medline)
copy Digimind Digimind Services ndash White Paper |21
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Marie France Blanquet29 maicirctre de confeacuterence en sciences de lrsquoinformation
distingue le travail coopeacuteratif du travail collaboratif En matiegravere drsquoapprentissage le
travail coopeacuteratif reacutealiseacute par chaque eacutequipe contribue agrave une œuvre collective ougrave le
rocircle de chacun est deacutefini de faccedilon claire Lrsquoapprentissage collaboratif reacutesulte du
travail individuel soutenu par des activiteacutes de groupe ou drsquoeacutequipes de faccedilon souple
et ouverte Ce type de travail se base sur les capaciteacutes de communication et
drsquointeraction de chacun Lrsquoeacutecriture collective des articles composant lrsquoencyclopeacutedie
Wikipeacutedia en est un exemple
Plusieurs expeacuterimentations drsquousage des blogs et podcasts ont eacuteteacute tenteacutees agrave
lrsquoUniversiteacute A Lyon II des eacutetudiants ont pu enregistrer des cours sur un Ipod pour
diffusion en podcast sur leurs blogs A lrsquoUniversiteacute Catholique de Lille les eacutetudiants
de Jean-Paul Pinte30 chargeacute de lrsquoinnovation peacutedagogique doivent alimenter
reacuteguliegraverement un blog Pour ce chercheur speacutecialiste de la veille en eacuteducation le
renouveau des meacutethodes drsquoenseignement se traduit par le rocircles des Enseignants
Connecteurs et eacutetudiants proneacutetaires
Bibliothegraveques
La bibliothegraveque 20 place elle aussi lrsquoutilisateur au centre et ce agrave travers plusieurs
types drsquoexpeacuterimentations de lrsquoutilisation des logiciels de messagerie instantaneacutee
pour eacutechanger avec les utilisateurs agrave lrsquointeacutegration de tags pour enrichir les
catalogues en passant par des interfaces de consultation simplifieacuteeshellip De
nombreux blogs de bibliotheacutecaires (Bibliobsession 31) permettent de suivre lrsquoeacutetat de
lrsquoart La bibliothegraveque de lrsquoUniversiteacute drsquoAlbany est alleacutee jusqursquoagrave publier un manifeste
du bibliotheacutecaire 20 32
copy Digimind Digimind Services ndash White Paper |22
Le Web 20 pour la veille et recherche dinformation DIGIMIND
COMMENT IDENTIFIER UN SITE WEB 20
Est-ce que le site sur lequel vous naviguez ou lapplication que vous utilisez est
Web 20 Quelle importance pourrait-on reacutepondrehellipToutefois un site de cette
geacuteneacuteration offrira plus de possibiliteacutes agrave vous lutilisateur Pour reconnaicirctre un tel
site quelques caracteacuteristiques sont agrave retenir
- le type de site il appartiendra agrave lune des grandes familles citeacutees plus haut il sera
blog bookmark ou reacuteseau social mashup ou page personnalisable bref il permet
de partager et de diffuser du contenu aiseacutement Le site peut ecirctre lui-mecircme une
application Web 2 ou en inteacutegrer des briques Exemple un site Corporate qui
heacuteberge des blogs de ses salarieacutes etou diffuse son actualiteacute via un fils RSS
- le rocircle de lutilisateur le site Web 2 vous permet de participer de personnaliser
et de collaborer vous pouvez en effet ajouter des commentaires eacutecrire un billet
lire un flux RSS noter (voter) ou annoter un article teacuteleacutecharger ou uploader des
images des videacuteos eacutecouter un podcast Ces sites proposent souvent des interfaces
personnalisables couleurs style organisation de laffichage du contenuhellip
- la navigation elle est plutocirct simplifieacutee par rapport aux sites de premiegravere
geacuteneacuteration Les menus sont plus leacutegers un flux RSS est toujours proposeacute et un
nuage de tags est souvent preacutesent
- le testeur cest vous non content de faire apporter une partie de son contenu par
linternaute un service Web 20 fait en plus souvent tester ses applications agrave ses
utilisateurs et est donc freacutequemment en version becircta (voire alpha) une becircta
publique ou priveacutee (linternaute fait alors partie dun petit cercle dinitieacutes dans le
secret des dieux)
copy Digimind Digimind Services ndash White Paper |23
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les applications Web 20
pour la veille et la
recherche dinformations
LES TYPES DAPPLICATIONS
Pour le veilleur et le chercheur dinformation les applications du Web 20 sont
riches tant dans les possibiliteacutes offertes par leurs interfaces que dans le contenu
diffuseacute Mieux connaicirctre ces services permettra de trouver davantage dinformation
(ou autrement) de gagner du temps de mieux partager voire decirctre plus visible sur
le web
Vous laurez compris le web 20 se fonde essentiellement sur la notion de partage
de participation et de collaboration entre les individus Ce nest pas forceacutement
toujours facile possible voire autoriseacute dans le monde professionnel Mais partager
cest aussi agrave terme pouvoir recevoirhellip
I Partager et collaborer
a Les Bookmarks sociaux
Les bookmarks sociaux sont une des applications les plus caracteacuteristiques du Web 2
et en sont preacutecurseurs Apparus en 2004 ces services vous offrent la possibiliteacute de
partager vos bookmarks cest-agrave-dire vos favoris Ainsi apregraves enregistrement le plus
souvent gratuit vous pouvez mettre en ligne tout ou partie de vos favoris (titre
copy Digimind Digimind Services ndash White Paper |24
Le Web 20 pour la veille et recherche dinformation DIGIMIND
adresse et description dune page ou site) et les rendre potentiellement accessibles
aux internautes du monde entier et du moins aux utilisateurs de ce service Vous
avez la possibiliteacute de garder ces favoris priveacutes en ne les partageant quavec vos
proches ou seulementhellipvous-mecircme
Ces applications sont au deacutepart tregraves simples et proposent ensuite suivant les sites
plus ou moins de perfectionnements il suffit dajouter le nom et ladresse (url) de la
page web qui vous inteacuteresse assortis des commentaires de votre choix Ces
adresses web sont rattacheacutees agrave un espace qui vous est personnel auquel vous
acceacutedez en vous identifiant Cet espace personnel est identifiable via une adresse
preacutecise Par exemple sur Delicious33 (de Yahoo) lun des services de bookmarks
sociaux les plus utiliseacutes lurl deacutesignant mes favoris est httpdeliciousslide68 En
naviguant sur Delicious vous pouvez acceacuteder aux favoris mis en ligne par des
collaborateurs amis ou inconnus qui partagent les mecircmes inteacuterecircts et passions que
vous Leurs pages sont eacutegalement identifieacutees par une url unique
Lajout dadresse
Lajout dadresse seffectue en se connectant directement sur le site de
bookmarking social ou plus pratique via une barre ou un bouton deacutedieacutes qui
inteacutegreacutes agrave votre navigateur facilitent lajout du site que vous ecirctes en train de visiter
Vous pouvez eacutegalement trouver des icocircnes sur des pages web vous proposant
dajouter un contenu un site agrave votre service de social bookmaking Peut-ecirctre avez-
vous deacutejagrave rencontreacute ces icocircnes agrave la fin dun billet de blog par exemple (voir
illustration ci-dessous) Ils permettent alors dajouter ladresse du billet agrave un ou
plusieurs services de bookmarks sociaux ainsi quagrave des services dactualiteacutes
collaboratives (nous en reparlerons plus bas)
copy Digimind Digimind Services ndash White Paper |25
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ce blog propose via des icocircnes lajout de ce billet dans les favoris de Delicious ou les services sociaux dactualiteacutes
Lorsque vous ajoutez une adresse vous lui attribuez des tags (voir glossaire) cest-agrave-
dire un ou plusieurs mots cleacutes de votre choix qui vont caracteacuteriser expliquer
contextualiser eacutetiqueter le favori et donc lidentifier de maniegravere simple pour vous et
tous les visiteurs Cest une information qui vient sajouter agrave la traditionnelle
description du site Cest donc vous qui choisissez votre propre mode de
classement de hieacuterarchisation et de labellisation (et non plus un service qui vous
propose de ranger vos ressources dans des cateacutegories preacutedeacutefinies) Cette possibiliteacute
fait partie de ce que lon appelle la folksonomie agrave savoir une taxonomie (science du
classement) populaire en quelque sorte
Ainsi vous pouvez ajouter ladresse du site portail NanotechNow
httpwwwnanotech-nowcom consacreacute aux nanotechnologies et y adjoindre les
tags nano nanotehnologies sciences science research mais aussi pourquoi
pas qualiteacute excellent pour donner votre opinion
copy Digimind Digimind Services ndash White Paper |26
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Des favoris consacreacutes agrave la Chine dans Delicious A droite les tags associeacutes agrave ces bookmarks Les tags
Sur une application typique de social bookmarking (type delicious) il est possible
de rechercher sur le titre des favoris de tous les autres utilisateurs et aussi sur
leurs tags Ainsi en cliquant sur le tag Nanotech vous obtiendrez la liste de tous
les favoris que les internautes ont classeacutes sous ce label Cest lagrave lun des principaux
inteacuterecircts la possibiliteacute de rechercher sur le nom des eacutetiquettes textuelles deacutefinies
par les internautes eux-mecircmes Mais tous les internautes nont pas la mecircme logique
de classement et il est fort possible de passer agrave coteacute de favoris inteacuteressants mais
eacutetiqueteacutes selon un mot auquel vous nauriez jamais penseacute De plus un mecircme mot
peut avoir plusieurs sens ou ecirctre employeacute diffeacuteremment selon les individus
Delicious a reacutesolu ndashpartiellement- ce problegraveme en offrant la possibiliteacute de deacutecrire
ses tags cest agrave dire de les expliquer (par orange je parle de la couleur ou de la
production dagrumes en Floride) Cest donc un deacutebut de seacutemantique appliqueacute agrave
cette folksonomie Quoiquil en soit le problegraveme du sens des mots employeacutes par
les creacuteateurs de contenu concerne lensemble du web Lorsque vous ne trouvez
pas un site via une requecircte sur un outil de recherche et que ce site existe pourtant
bel et bien cest souvent parce que vous nemployez pas les mecircmes mots cleacutes que
ceux utiliseacutes par le creacuteateur du site dans son texte
Les tags peuvent eacutegalement sappliquer agrave des photos (Flickr) agrave des projets
(43Things) ou des videacuteos (YouTube DailyMotion) Ils peuvent servir aussi agrave eacutetiqueter
et cateacutegoriser les billets dun blog
copy Digimind Digimind Services ndash White Paper |27
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les communauteacutes
Lautre atout des bookmarks sociaux pouvoir constituer et se connecter avec
une communauteacute de speacutecialistes Par speacutecialiste on deacutesignera simplement un
internaute qui centre ses recherches sur les mecircmes sujets que vous quil soit
amateur ou professionnel
Exemple Votre domaine ce sont les biotechnologies En entrant la requecircte
Biotechnologies sur le moteur de recherche de Delicious vous obtenez une liste
de plusieurs milliers de favoris Pour chacun dentre eux est indiqueacute le nombre de
personnes qui ont sauvegardeacute cette mecircme adresse En seacutelectionnant lun de ces
utilisateurs vous pouvez deacutecouvrir un internaute qui comme vous reacuteguliegraverement
ajoute des adresses de sites deacutedieacutes ou connexes aux biotech Il ne vous reste plus
quagrave mettre en surveillance ce membre de delicious Il disposera en effet de sa
propre adresse XML Exemple httpdeliciousrssvantive98 Vous serez alors
averti degraves lors que cet utilisateur ajoute un favori agrave sa page
La valeur des outils de social bookmarking est encore plus probante lorsquils sont
deacutedieacutes agrave des communauteacutes de pratiques ou agrave des secteurs dactiviteacutes bien preacutecis
Plusieurs initiatives ont deacutejagrave eacuteteacute mises en ligne34 On peut citer Connotea eacutediteacute par
la ceacutelegravebre revue Nature et donc destineacute agrave un public scientifique Lors de la mise en
favoris ce service extrait automatiquement les reacutefeacuterences bibliographiques
lorsquelles sont issues de sites tels que Nature Science ou PubMed Plus ancien
CiteUlike est baseacute sur le mecircme principe mais est compatible avec davantage de
revues scientifiques encore Snipitron est lui deacutedieacute aux chercheurs eacutetudiants et
professionnels Ici vos bookmarks font partie dun projet qui seacutecoule dans le temps
concernant une recherche ou une tacircche preacutecise
Linteacuterecirct des bookmarks sociaux est donc dabord dans lutilisation de la
communauteacute afin de trouver des sources pertinentes Ce type doutil reacutevegravele toute
sa puissance lorsquun utilisateur proche de vous en terme de domaines de veille a
eacuteteacute identifieacute Vous pouvez donc alors lutiliser comme collaborateur virtuel mais
aussi rechercher parmi les sources jugeacutees pertinentes par un groupe dutilisateurs
identifier des leaders de veille ou juger de la populariteacute dune source (combien de
fois a-t-elle eacuteteacute mise en favoris Ce nombre de sauvegardes neacutetant quun indicateur
parmi dautres) Si vous ne partagez pas ces outils restent toutefois un tregraves bon
moyen de meacutemoriser et cateacutegoriser vos favoris en un point unique daccegraves
copy Digimind Digimind Services ndash White Paper |28
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Quel service
Il existe plusieurs dizaines de services de bookmarks sociaux Ils proposent des
fonctionnaliteacutes plus ou moins sophistiqueacutees Un des critegraveres essentiels de choix est
leur succegraves En effet leur force repose en grande partie sur le nombre de favoris
dutilisateurs partageacutes agrave moins de freacutequenter des bookmarks deacutedieacutes agrave des
communauteacutes tregraves cibleacutees Dautre part la rapiditeacute du service et la pertinence de
son moteur de recherche sont aussi des paramegravetres importants
Delicious qui appartient agrave Yahoo est lun des plus connus et des plus utiliseacutes Yahoo
MyWeb2 rassemble eacutegalement une grande communauteacute ainsi que Furl ou encore
Blogmarks et Blinklist35 Certains de ces sites au-delagrave de larchivage de ladresse
proposent de conserver une copie inteacutegrale dune page web Dautres vous
suggegraverent des sites similaires agrave ceux que vous avez mis dans vos favoris Cette
similariteacute se base notamment sur les favoris ajouteacutes par les autres utilisateurs La
recherche par similariteacute (ou par suggestion en fonction de vos habitudes de
navigation) offerte par des services comme Yoono StumbleUpon ou Similicious 36 est
une meacutethodologie de recherche particuliegraverement inteacuteressante Nous en reparlerons
plus loin
Pour choisir preacuteciseacutement votre service de bookmarks sociaux vous pouvez vous
aider de ces ressources 37
- le site Irox propose un tableau comparatif de pregraves de 20 services
- le blog de Robin Good offre une seacutelection inteacuteressante de bookmarks sociaux
- la page Free Bookmark Managers affiche une liste dune quarantaine de logiciels et
utilitaires deacutedieacutes au partage et agrave la gestion de vos favoris (bookmarks) en ligne via
accegraves distant en local ou sur serveur Attention tous ne sont pas sociaux cest-agrave-
dire baseacutes sur le partage
copy Digimind Digimind Services ndash White Paper |29
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b Le Multimeacutedia photos et videacuteos
Le partage de vos ressources ne se limite pas au texte et adresse de sites Il est
eacutegalement possible de partager vos photos et videacuteos
Les images
Flickr 38 racheteacute par Yahoo Inc en 2005 est lapplication type de partage dimages
voire mecircme larcheacutetype du service Web 20 ce site permet de mettre en ligne ses
photos de les partager avec ses proches ses collegravegues ou de les laisser en accegraves
priveacute
Il est possible dutiliser un moteur pour rechercher agrave travers les millions de photos
mises en ligne par les autres utilisateurs
Flickr na pas de points communs avec les nombreuses applications Web 2 en becircta agrave
linterface artisanale Sur le service de Yahoo la puissante interface en fait un outil
tregraves simple agrave utiliser Ainsi via le menu Organize vous pouvez acceacuteder agrave une
veacuteritable table de montage virtuelle pour organiser vos photos
copy Digimind Digimind Services ndash White Paper |30
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche sur Flickr A droite les noms dutilisateurs et les tags associeacutes aux photos
Comme sur les bookmarks sociaux la recherche peut seffectuer sur le titre ou la
description mais aussi sur les tags chaque internaute qui partage ses photos leur
attribue des mots cleacutes pour les deacutefinir les expliquer les contextualiser voire donner
son opinion
Chaque liste de reacutesultats chaque photo est accompagneacutee par ses tags Ceux-ci
permettent aussi daffiner ou deacutelargir votre recherche lorsque vous en seacutelectionnez
un Il est possible de rechercher sur les photos les utilisateurs mais aussi sur les
groupes En effet la notion de communauteacute est eacutegalement importante Les
groupes rassemblent les utilisateurs qui partagent les mecircmes centres dinteacuterecirct
photographiques Des forums de discussions sont inteacutegreacutes agrave ces groupes
permettant dentrer en contact direct avec certains membres
copy Digimind Digimind Services ndash White Paper |31
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Par exemple le groupe The Eyes Have It 39 rassemble les utilisateurs (et donc leurs
photos) autour du thegraveme de la communication visuelle des secteurs pharmacie et
biotech
Que peut trouver le veilleur sur un service de photos tel que Flickr
Finalement la mecircme chose que sur les bookmarks sociaux tout ce que les
membres ont voulu partager des photos du dernier salon automobile de Detroit 40
ou de la convention annuelle des industries cosmeacutetiques dAmeacuterique du Nord La
veille concurrentielle ou la veille image sur votre propre socieacuteteacute est eacutegalement
inteacuteressante Ainsi une recherche (full text) sur la socieacuteteacute peacutetroliegravere Exxon affiche
plus de 1400 photos relatives aux stations services aux puits de peacutetrole aux
raffineries aux employeacutes aux manifestions de contestataires ou aux publiciteacutes
deacutetourneacutees
Comme avec le social bookmarking vous pouvez vous attacher agrave suivre les
membres qui partagent les mecircmes centres dinteacuterecirct que vous ou votre organisation
apregraves seacutelection de la page de lutilisateur la mise en surveillance de son flux RSS
permet decirctre averti degraves que cette personne ajoute de nouvelles photos
Dautres services permettant le partage de photos existent Toutefois ils ne vont
pas aussi loin que Flickr dans la logique Web 20 Le service PhotoBucket 41 est le
grand concurrent de Flickr mais avec une approche plus grand public Flickr est
davantage freacutequenteacute par des internautes avertis des professionnels et des
passionneacutes de photographie En ce sens le service de Yahoo sera donc plus
inteacuteressant pour le veilleur
Squidoo 42 est en quelque sorte un annuaire de bookmarks perfectionneacute une
rencontre de services sociaux comme Delicious et Flickr Squidoo vous permet en
effet de creacuteer une page de liens dans un domaine qui vous passionne et de la
structurer en rubriques agreacutementeacutees de photos
Linterface simple rend possible la creacuteation rapide de pages speacutecialiseacutees (appeleacutees
lensgtobjectifs lentilles) et de les rendre visible agrave tout un chacun On trouve par
exemple plusieurs lens consacreacutees aux nanotechnologies43 Chaque lens est
accompagneacutee de tags connexes agrave son sujet
Vous pouvez rechercher ces pages gracircce agrave un moteur de recherche un reacutepertoire
par cateacutegories un nuage de tags (exemple le tag Marketing 44) ou mecircme parcourir
le Top100
copy Digimind Digimind Services ndash White Paper |32
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La videacuteo
Via les services YouTube ou DailyMotion le partage de videacuteos en ligne est plus
meacutediatiseacute que les services de photos Notamment parce que le leader Google a
racheteacute YouTube en octobre 2006 geacuteneacuterant un buzz sans preacutecegravedent au sein des
blogs et de la presse traditionnelle (Mainstream medias)
YouTube 45 et ses concurrents Web 20 fonctionnent agrave peu pregraves de maniegravere
eacutequivalente agrave Flickr sans en atteindre toutefois sa clarteacute ergonomique
Tout ces sites de videacuteos vont permettre drsquouploader (charger vers le site) et
partager vos videacuteos (converties automatiquement au format FlashVideo) et aussi
bien sucircr de rechercher parmi les videacuteos des autres utilisateurs
Sur ces applications on retrouve de nombreuses caracteacuteristiques du Web 2 les
videacuteos classeacutees par cateacutegories sont accompagneacutees de tags qui aident agrave les
contextualiser et les deacutecrire en plus du titre et de la description renseigneacutes par
lutilisateur Un fils RSS permet de surveiller lajout de videacuteos dans une cateacutegorie ou
par un utilisateur deacutefini A linstar des billets dun blog les internautes peuvent
commenter les videacuteos De plus les videacuteos sont noteacutees ce qui impacte ensuite leur
place dans le classement et donc leur visibiliteacute
Ces services contiennent des favoris inteacutegreacutes ougrave lon peut sauvegarder ses videacuteos
preacutefeacutereacutees Il est possible de partager sa videacuteo par mail ou messagerie instantaneacutee
de la poster sur son blog Dailleurs de nombreux blogueurs utilisent les services de
type YouTube (ou Flickr pour la photo) pour stocker leurs fichiers multimeacutedias trop
volumineux pour les heacutebergeurs de blogs La notion de groupe comme sur Flickr
est preacutesente des communauteacutes rassemblent des utilisateurs autour de grandes
theacutematiques lieacutees par exemple agrave la politique aux sports et aux voyages
YouTube a de nombreux concurrents aux fonctions tregraves proches Impossible de
tous les mentionner Mais on peut retenir cependant le franccedilais DailyMotion 46 tregraves
populaire dailleurs neacute quelques semaines avant YouTube Citons eacutegalement Yahoo
Videos AOL Videos Revver Grouper (de Sony) Metacafe SoapBox (de Microsoft)
Zudeo Wideo MySpace Vimeo 47Certains de ces services proposent du contenu
amateur ainsi que des films professionnels issus des networks de TV et de cineacutema
Mais les plus petits services se cantonnent aux videacuteos envoyeacutees par linternaute que
celles-ci aient dailleurs eacuteteacute copieacutees ou non
copy Digimind Digimind Services ndash White Paper |33
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche sur DailyMotion
Quel contenu agrave usage professionnel le veilleur peut espeacuterer trouver sur ces
plateformes Essentiellement des videacuteos consacreacutees agrave des socieacuteteacutes et individus
Ainsi si je reacuteitegravere ma recherche sur la socieacuteteacute peacutetroliegravere Exxon jobtiens des videacuteos
sur des manifestations des mareacutees noires le reacutechauffement climatique des
actualiteacutes boursiegraveres des retransmissions de procegraves des deacutetournements de
publiciteacutehellipLa recherche de videacuteos saverra particuliegraverement utile pour une veille
Image Produits ou concurrentielle Le contenu de videacuteos est eacutegalement souvent
tregraves politique agrave partir de la campagne des eacutelections preacutesidentielles franccedilaises de
2007 la diffusion de videacuteos sur les hommes et femmes politiques est devenue une
veacuteritable arme Autre aspect inteacuteressant la possibiliteacute de deacutecouvrir de nombreux
extraits de videacuteos de documentaires sur des sujets extrecircmement varieacutes eacutecologie
industrie socieacuteteacute consommation
Le contenu de ces services de videacuteos est donc agrave limage du net heacuteteacuterogegravene mais
potentiellement riche
copy Digimind Digimind Services ndash White Paper |34
Le Web 20 pour la veille et recherche dinformation DIGIMIND
c Partage de CV et reacuteseaux sociaux
Termineacute le temps ou seules les personnes agrave qui vous transmettiez votre CV ou
votre carte de visite pouvaient prendre connaissance de votre identiteacute et de votre
parcours professionnel Via les plateformes de reacuteseaux sociaux le push fait place au
pull de plus dans une optique de cooptation et de recommandation il y est
possible de mettre son CV en ligne sous format hypertexte et de demander agrave
rentrer en relation avec des proches de votre reacuteseau immeacutediat Les plateformes de
reacuteseaux sociaux sont nombreuses certaines sont agrave vocation geacuteneacuteraliste dautres
uniquement deacutedieacutees aux actifs dautres encore reacuteserveacutees agrave une communauteacute
(eacutetudiants lyceacuteens anciens eacutelegraveves passionneacutes de voyages)
Ces applications repreacutesentent un marcheacute conseacutequent puisque pour les seuls USA
on preacutevoit un chiffre daffaires des reacuteseaux sociaux de 25 milliards de dollars agrave
lhorizon 2011 contre 350 millions en 200648 La France est domineacutee par la
plateforme Viadeo (ex-Viaduc)49 Ce service leader lanceacute en 2004 compte plus de
750 000 profils Dans les autres pays cest LinkedIn 50 qui domine geacuteneacuteralement
avec plus de 9 millions dutilisateurs dans 135 pays
Une recherche sur Viadeo
copy Digimind Digimind Services ndash White Paper |35
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les fonctionnaliteacutes
Que trouve-t-on sur ces sites Notamment des profils de personnes en activiteacute ou
en recherche demploi ainsi que des hubs regroupant des utilisateurs autour dun
mecircme centre dinteacuterecirct toujours la notion de communauteacutes de pratiques propre au
Web 20 Sur ces services tout est penseacute pour creacuteer du lien social Le profil
individuel se constitue dun CV enrichi de nombreux liens vers ses employeurs ses
amis ses reacuteseaux professionnels et associatifs ses travaux et publications Les hubs
regroupent les personnes autour de secteurs meacutetiers associations danciens eacutelegraveves
pays reacutegions Par exemple sur Viadeo saffichent les hubs Analyse Veille
Strateacutegique amp Concurrentielle Intelligence Eco Blogs amp Bloggers Editeurs de
Logiciels Profession documentaliste and co mais aussi Grande distribution
Oceacuteanie ou Normes meacutethodes et outils Dans ces hubs des forums organisent les
discussions des membres autour de theacutematiques deacutefinies Un moteur de recherche
permet de trouver des profils selon un secteur une fonction une reacutegion Une fois
un profil identifieacute il faut demander agrave entrer en relation avec lui Cela sera dautant
plus facile et rapide sil est peu eacuteloigneacute de votre propre reacuteseau de contacts
La veille
Linteacuterecirct pour le professionnel de linformation est double il peut augmenter sa
visibiliteacute et celle de certains de ses projets services publications thegraveses ou articles
Dautre part il peut rechercher des donneacutees sur des personnes et entreprises ou
identifier un expert Comme sur dautres services Web 20 il est facile de se
constituer une communauteacute dutilisateurs partageant ses centres dinteacuterecirct que lon
visitera reacuteguliegraverement Ainsi sur Viadeo une recherche sur le secteur Agro-
alimentaire avec le mot cleacute veilleur 1 affiche plus de 50 reacutesultats avec les fonctions
entreprises et synthegraveses de parcours des membres Vous pouvez alors entrer en
relation avec ces personnes ou tout simplement collecter des donneacutees sur celles-ci
et leurs reacuteseaux Ces sites sont dailleurs devenus un outil essentiel pour certaines
fonctions commerciaux pour la prospection recruteurs journalistes
ethellipresponsables de casting pour eacutemissions TV
1 Certaines fonctionnaliteacutes avanceacutees sont payantes
copy Digimind Digimind Services ndash White Paper |36
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les autres reacuteseaux
Parmi les autres services de reacuteseaux sociaux outre LinkedIn davantage tourneacute agrave
linternational il existe assez utiliseacutes en France 6nergiesnet et Xing (ex Open BC)51
Les reacuteseaux ciblant plus particuliegraverement les jeunes (FaceBook MySpace) peuvent
eacutegalement ecirctre utiliseacutes MySpace feacutedegravere plus particuliegraverement des professions de la
communication de la publiciteacute et des meacutetiers multimeacutedias
Le reacuteseau FaceBook52 est original ce site nord-ameacutericain est preacutecurseur dun social
networking tregraves segmenteacute reacuteserveacute aux eacutetudiants et aux lyceacuteens Au deacutepart les
membres devaient sinscrire obligatoirement via lemail de leur universiteacute afin de
garantir lauthenticiteacute des profils et donc le seacuterieux de la communauteacute Depuis
FaceBook sest ouvert aussi aux entreprises Ainsi ce site capte tregraves tocirct les futurs
actifs et les fideacutelise
Des ressources
Certaines ressources peuvent vous aider agrave identifier les plateformes de reacuteseaux
sociaux professionnels utiles pour vos recherches Le wiki List of social networking
websites liste de nombreuses plateformes de reacuteseaux sociaux 53 et le site Link n
Rank cateacutegorise des sites de social networking 54
copy Digimind Digimind Services ndash White Paper |37
Le Web 20 pour la veille et recherche dinformation DIGIMIND
d Les sites dactualiteacutes collaboratives recommandation et notation
Ces sites recouvrent en fait diffeacuterents types dapplications
- Les Digg Like Ces services qui sinspirent tous du preacutecurseur Digg55 recueillent des actualiteacutes
proposeacutees par les internautes Le principe apregraves enregistrement un formulaire
simple vous permet de poster lactualiteacute de votre choix susceptible dinteacuteresser les
autres internautes son titre son url sa description Il faut aussi choisir une
cateacutegorie Par exemple Technologies Sciences Monde Affaires Divertissement Ces
cateacutegories peuvent ecirctre subdiviseacutees en theacutematiques plus fines Lactualiteacute si elle est
valideacutee par les modeacuterateurs apparaicirctra alors en ligne Elle sera noteacutee par les autres
internautes qui votent pour elle selon son inteacuterecirct Les actualiteacutes disposant du plus
grand nombre de points se placent alors en haut du classement
La cateacutegorie Sciences sur Digg A gauche les nombres de votes
Ces sites affichent les principales caracteacuteristiques du Web 20 interface eacutepureacutee
possibiliteacute de laisser des commentaires fils RSS pour surveiller les nouvelles
actualiteacutes classement des articles les plus lus les mieux noteacutes possibiliteacute denvoyer
par mail ou de bloguer un article et bien sucircr forte contribution de linternaute Sur
certains sites leacutetiquetage des articles via le systegraveme de tags est proposeacute
copy Digimind Digimind Services ndash White Paper |38
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Linteacuterecirct est de pouvoir positionner certaines informations les unes par rapport aux
autres et connaicirctre la populariteacute dune actualiteacute ou dun sujet (entreprise personne)
abordeacute (la critique de mon produit est-elle tregraves populaire ) Cest une approche
alternative aux agreacutegateurs de news de type Google Actualiteacutes ou Yahoo Actualiteacutes
qui hieacuterarchisent les news avec de puissants algorithmes mais sans recourir agrave
lhumain Ainsi Google Actualiteacutes preacutecise La seacutelection et le positionnement des
articles de cette page ont eacuteteacute reacutealiseacutes automatiquement par un programme
informatique
En outre sur ces services de type Digg linformation nest pas brute linternaute
qui poste lactualiteacute peut selon son expertise y apporter un commentaire de
valeur Linformation peut ecirctre commenteacutee (en plus du vote) par les autres
internautes Comme de nombreux blogueurs les utilisateurs des Digg Like jouent
aux journalistes ou tout simplement donnent leur opinion
Lorsquil sagit dactualiteacutes concernant le produit ou le service dune socieacuteteacute ces
commentaires positifs ou non sont une veacuteritable manne pour de nombreux
professionnels de linformation veilleurs marketeurs chargeacutes deacutetudes et autres
analystes qui vont pouvoir recueillir agrave moindre frais des informations sur leur
nouveau produit leurs clients ou ceux de la concurrence
Digg est lun des sites les plus copieacutes du Web 20 Sil reste la reacutefeacuterence dautres
applications tregraves largement inspireacutees tirent leur eacutepingle du jeu En France Scoopeo
Fuzz et TapeMoi offrent eux aussi des services dactualiteacutes collaboratives On peut
eacutegalement citer Rojo le canadien Niouz lespagnol Meneames le reacuteseau de sites
BlogMemes 56 Mecircme Netscape pionnier du navigateur web a lanceacute un portail
sinspirant du systegraveme de notation de Digg
On peut reprocher agrave ce type de site de favoriser les cateacutegories techniques et
scientifiques faisant la part belle aux contributions des geeks et autres accrocs du
net grands utilisateurs de services Web 2 Toutefois les sites comme Blogmemes ou
Netscape diffusent davantage dactualiteacutes agrave teneur eacuteconomique et sociale
- Les mix actualiteacutes contributions des internautes
Wikio57 est un service dorigine franccedilaise (creacuteeacute par le fondateur de Kelkoo) agrave
lintersection de Google Actualiteacutes et de Digg En effet Wikio mixe les articles issus
de sites dactualiteacutes de blogs avec des contributions des internautes On peut
prendre connaissance des informations de diffeacuterentes maniegraveres
copy Digimind Digimind Services ndash White Paper |39
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- En naviguant via les theacutematiques (France International Politique Economie
Finance Santeacute Science hellip) ou via le nuage de tags dynamiques qui se modifient en
fonction de la rubrique ou vous vous situez
- En recherchant via le moteur
- En sabonnant aux flux RSS agrave chaque cateacutegorie et agrave chaque tag correspond son
flux RSS De mecircme lorsque vous lancez une requecircte via le moteur vous pourrez
surveiller ces reacutesultats via un flux RSS
- les plateformes de contributeurs indeacutependants
La deacutefiance et la volonteacute dindeacutependance vis-agrave-vis des grands meacutedias traditionnels de
la presse eacutecrite et audio-visuelle se sont traduites degraves 2001 par la creacuteation massive
de blogs Les blogueurs sont-ils et peuvent-ils simproviser journalistes Ce deacutebat
qui promet decirctre sans fin est inteacuteressant De nombreux blogueurs (mais pas la
majoriteacute) sont devenus de veacuteritables experts dans leur domaine agrave force deacutecriture
de lecture et danalyses quotidiennes Ainsi les mainstream medias invitent
maintenant dans leurs colonnes et plateaux les blogueurs les plus talentueux
Ces blogueurs experts ou professionnels ne constituent pas les seuls creacuteateurs
dactualiteacutes alternatives
Des initiatives de plateformes dactualiteacutes eacutecrites par des non professionnels ont
aussi vu le jour Agoravox58 est lun des premiers portails de journalisme citoyen
lanceacute par Joeumll de Rosnay et Carlo Revelli 59 en mai 2005 Agoravox permet aux
internautes de proposer leurs articles pour commenter reacutefleacutechir agrave des sujets
dactualiteacutes si possible avec une approche et un regard diffeacuterents des meacutedias
traditionnels Le format des contributions est multimeacutedia Le site explique Tout le
monde peut devenir reacutedacteur drsquoAgoraVox Il nrsquoest pas neacutecessaire de savoir eacutecrire avec
un style journalistique affirmeacute Chacun drsquoentre nous peut devenir une sorte de capteur
en temps reacuteel de ce qui se passe dans notre entourage en fournissant des articles des
images des extraits videacuteo ou audio Ce qui est important crsquoest de pouvoir teacutemoigner
drsquoun eacuteveacutenement auquel vous avez assisteacute ou que vous avez deacutecouvert en faisant des
recherches Il poursuit Pourquoi devenir reacutedacteur Tout simplement pour faire
entendre votre voix et pour relater des faits que vous avez identifieacutes et qui ne vous
paraissent pas ecirctre suffisamment repris dans les meacutedias traditionnels voire ignoreacutes ou
censureacutes
Agoravox encourage donc agrave utiliser son style personnel Il convient de sinscrire pour
devenir reacutedacteur Les articles doivent toutefois obeacuteir agrave une politique eacuteditoriale60
Un comiteacute de reacutedaction valide ensuite les contributions
copy Digimind Digimind Services ndash White Paper |40
Le Web 20 pour la veille et recherche dinformation DIGIMIND
En quelques mois Agoravox a prouveacute que de simples internautes pouvaient ecirctre
aussi bon reacutedacteurs et experts en fonction de leurs profession passion et
centres dinteacuterecirct agrave linstar des blogueurs professionnels
Agoravox na pas la vocation dun agreacutegateur dactualiteacutes de type Digg Wikio ou
Google News Cest une sorte de quotidien qui privileacutegie les articles de fond et
lanalyse Bien sucircr des reacutedacteurs stars eacutecrivent reacuteguliegraverement et leurs articles
sont attendus Mais ce ne sont pas les rubriqueurs traditionnels des autres meacutedias
Comme sur les autres sites Web 20 le lecteur peut attribuer une note dinteacuterecirct agrave
chaque article et poster un commentaire Enfin leacutetonnante technologie
ReadSpeaker 61 permet de retranscrire automatiquement tous les textes en version
audio
Agoravox nest pas le seul exemple de site de journalisme citoyen Le portail
OhMyNews 62 initiative coreacuteenne est baseacute sur le mecircme principe Lanceacute en feacutevrier
2000 le reacuteseau international OhMyNews reacuteunit plus de 40 000 reacutedacteurs
Pour le veilleur ces sites dactualiteacutes collaboratives constituent des sources
dinformations alternatives avec une partie de lactualiteacute issue des organes et
agences de presse et lautre partie provenant des internautes Dautre part ces
nouveaux meacutedias permettent de deacutecouvrir et surveiller des experts voire des
leaders dopinion
Un article sur Agoravox A droite une preacutesentation de son auteur En haut la possibiliteacute de voter et
commenter larticle
copy Digimind Digimind Services ndash White Paper |41
Le Web 20 pour la veille et recherche dinformation DIGIMIND
II Rechercher Collecter
Doreacutenavant tout internaute peut creacuteer et publier sa propre information
Lidentification des sources dinformation et de linformation elle-mecircme est devenue
complexe car elles sont de plus en plus morceleacutees et atomiseacutees Il convient
dutiliser une large palette doutils de recherche pour collecter les donneacutees en
provenance des blogs des bookmarks et reacuteseaux sociaux Pour faciliter la
collecte il est en outre possible de verticaliser la recherche et de faire appel agrave des
humains Par ailleurs dautres outils permettent darchiver ses deacutemarches de
requecirctes et de navigation
a La recherche de blogs et de flux RSS
Le volume de blogs est en constante croissance sur le net Le nombre de blogs a
litteacuteralement exploseacute sur toute la planegravete Estimeacute agrave 70 millions agrave leacuteteacute 2005 ils sont
eacutevalueacutes agrave plus de 120 millions en mars 2007 Technorati lun des moteurs de
recherche de blogs les plus utiliseacutes mesure en 2007 un doublement du nombre de
blogs tous les 320 jours 120 000 blogs seraient ainsi creacuteeacutes chaque jour 63
Europe
33
Afrique 15 000
Ameacuterique du Nord
33
Ameacuterique du Sud
1
Asie
55
5 Australie 790 000
copy Digimind Digimind Services ndash White Paper |42
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Nombre de blogs en milliers et millions (la Russie est inteacutegreacutee dans lAsie) Estimation DIGIMIND Services 64
Les fils RSS omnipreacutesents A chaque blog correspond son flux RSS ce format qui permet dextraire et de
surveiller tout nouveau contenu qui parait sur le blog Si un vrai blog implique
toujours un flux RSS un flux RSS ninduit pas forceacutement un blog En effet le RSS et
son concurrent Atom sont preacutesents sur de plus en plus de type de meacutedias et outils
internet degraves lors que leur contenu est appeleacute agrave se modifier reacuteguliegraverement
On pourra donc trouver des flux RSS sur
-les blogs
-les sites de presse et dactualiteacute Exemple Les Echos Libeacuteration La Tribune Le
Figaro)
-les sites de revues et magazines speacutecialiseacutes Exemple La revue Nature propose ses
fils RSS concernant ses publications speacutecialiseacutees par domaines Science fait de
mecircme65
-les sites corporate des entreprises page dactualiteacutes catalogues produits (Ex Air
Liquide)
-les reacutesultats de moteurs de recherche de blogs Tous proposent des flux RSS
permettant de surveiller une requecircte (Technorati Google Blog Search Feedster
IceRockethellip)
-les pages de reacutesultats de moteur de recherche web Certains de ces moteurs
geacutenegraverent un flux RSS permettant de surveiller lapparition de nouveaux reacutesultats
pour une requecircte donneacutee
MSN Search (devenu Live Search66) le proposait depuis janvier 2005 et chaque page
de reacutesultats offrait une icocircne orange en bas de page permettant dobtenir des fils
RSS Cette icocircne RSS a disparu sur Live Search mais les flux RSS sont toujours lagrave (ils
sont deacutetectables automatiquement avec un navigateur Firefox Maxthon IE7 ou
votre lecteur RSS Attensa ou RSS Bandit par exemple)
Depuis peu Yahoo Search Web 67 offre lui aussi un fils RSS sur ses reacutesultats lagrave
encore deacutetectable via un lecteur ou navigateur (cela fonctionne uniquement pour le
Yahoo US)
copy Digimind Digimind Services ndash White Paper |43
Le Web 20 pour la veille et recherche dinformation DIGIMIND
-les moteurs dactualiteacutes La majoriteacute des portails qui agregravegent des flux dactualiteacutes
proposent des flux RSS Exemple Google Actualiteacutes Yahoo Actualiteacutes Topix MSN
Actualiteacutes Wikiohellip 68
-les Newsgroups Usenet (groupes de discussion) Les fils RSS sont en effet aussi
preacutesents sur Google Groupes (ou Google Groups) ce qui rend plus aiseacute la surveillance
des discussions Chaque groupe (Google ou Usenet) affiche un fils RSS ou Atom 69
(et ce quelque soit la langue) signaleacute par le logo orange RSS en bas de page
-certains forums web Exemple Forum Mobiles 70
-certaines listes de diffusion elles peuvent ecirctre surveilleacutees via labonnement agrave leur
flux RSS Cela eacutevite lengorgement de votre boicircte mail Exemple la liste Veille sur
Yahoo Groupes 71 dispose dun flux RSS
-les bookmarks sociaux Delicious Yahoo MyWeb2 Blogmarks 72hellipLe fils RSS
permet decirctre alerteacute de lajout de nouveaux favoris pour un tag ou un utilisateur
deacutefinis
-les plateformes de partage de photos Exemple Flickr PhotoBucket 73
-les services de partage de videacuteos comme YouTube DailyMotion 74 pour ecirctre alerteacutes
des nouveauteacutes
-de tregraves nombreux sites offrant un contenu qui se renouvelle
copy Digimind Digimind Services ndash White Paper |44
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Veille Corporate La Tribune propose des flux RSS segmenteacutes par socieacuteteacutes
Le veilleur via ces flux RSS pourra surveiller de nombreuses sources
dinformations Par ailleurs au-delagrave des blogs introspectifs dadolescents dont peu
preacutesentent un inteacuterecirct pour les professionnels certains types de blogs peuvent se
reacuteveacuteler utiles
-Le blog dactualiteacute et dopinion preacutesentant reacuteflexions et critiques de journalistes et
internautes
-Le blog theacutematique eacutediteacute par des passionneacutes experts professionnels consultants
et techniciens
-Le blog dentreprise outil de communication externe ou interne agrave linitiative des
salarieacutes ou des dirigeants
copy Digimind Digimind Services ndash White Paper |45
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les outils pour trouver des blogs et flux RSS Sur ces moteurs la recherche seffectue par mots cleacutes classiques ou par tags comme
sur Technorati par exemple Le contenu indexeacute (blogs et flux) est tregraves heacuteteacuterogegravene
Aussi lutilisation de la recherche avanceacutee sur ces outils est souvent neacutecessaire En
effet un blog peut avoir abordeacute la theacutematique deacuteveloppement durable 1 seule fois
parmi ses 4500 billets Il conviendra donc alors de centrer sa recherche sur le titre
du blog ou son url
Les moteurs
Certains moteurs sont deacutedieacutes agrave la recherche de blogs Cest en fait un abus de
langage Ces moteurs se focalisent sur la recherche de flux RSS mais ne peuvent
faire la diffeacuterence entre un flux provenant dun grand journal et celui dun blog
Ainsi le moteur Technorati classe parmi les blogs les plus populaireshellipLe Figaro
Pour mener une recherche efficace il conviendra dutiliser plusieurs moteurs Car
comme pour la recherche web ougrave il ne faut pas se limiter agrave Google au risque de
manquer pregraves de 85 des reacutesultats75 la recherche sur les blogs neacutecessite lemploi
de plusieurs outils76 En voici quelques-uns
gt Google Blog Search Recherche de blogs Google applique sa technologie puissante
aux flux RSS et blogs Linterface est notamment disponible en franccedilais et en anglais
Le moteur est doteacute de fonctions de recherche avanceacutee (recherche sur le titre le
billet recherche par ancienneteacutehellip)
gt Ask Blog amp Flux Ce moteur permet de rechercher parmi les blogs les flux XML
(RSS ou Atom) Et aussi de sabonner agrave un blog ou un flux RSS
gt Feedster Ce moteur recense plus de 900 000 sources et 5000 sont rajouteacutees
chaque jour
gt BlogPulse Indexe plus de 46 millions de blogs
gt Technorati Ce moteur rafraicircchit son index toutes les 5 agrave 15 minutes et
recherche parmi plus de 70 millions de blogs (en avril 2007 77) ou sites proposant
des flux RSS Il est possible de rechercher par mots cleacutes ou par tags
gt Sphere va prendre en compte plusieurs variables pour mieux chercher parmi la
blogosphegravere
- comme pour le contenu web classique les reacuteseaux de liens entrants et sortants
- la qualiteacute de ces liens
copy Digimind Digimind Services ndash White Paper |46
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- les internautes agrave lorigine de ces liens (simple commentateurs ou leaders dopinion)
3 moteurs web integravegrent la recherche sur les blogs au sein de leur recherche
avanceacutee 78
gt Yahoo Search
Pour centrer sa recherche sur les flux RSS et les blogs il convient drsquoaller dans la
recherche avanceacutee (agrave droite de la boite de requecircte) puis dans le menu deacuteroulant
Format de fichiers et de seacutelectionner le format RSSXML
gt Exalead
Apregraves avoir effectueacute votre recherche il suffit de cliquer sur le bouton RSS jaune
dans la fenecirctre Preacuteciser la recherche Au sein des reacutesultats de recherche le flux
RSS est disponible via licocircne RSS Simple et propre
gt Microsoft MSN Live Search
MSN a ameacutelioreacute les interfaces de son moteur pour restreindre la recherche sur les
fils RSS Apregraves laffichage de votre page de reacutesultats vous pouvez affiner votre
recherche gracircce au bouton Flux (ou Feed en anglais) Ce bouton est accessible via
le menu Plus Au sein des reacutesultats de recherche sont alors disponibles lurl du flux
le cache et un lien pour sinscrire au fils RSS
Au-delagrave de ces moteurs speacutecialiseacutes il peut ecirctre beacuteneacutefique de tenter une recherche
sur un moteur Web (Google ou Yahoo Search par exemple) de type blog OR RSS
[votre sujet] Exemple blogs sur les teacuteleacutecoms Cela vous permettra non pas de
chercher au sein des blogs mais de trouver dautres blogs
Les reacutepertoires 79
Comme pour le web un certain nombre dannuaires entendent recenser les blogs
et fils RSS Attention comme la blogosphegravere est tregraves mouvante et en constante
croissance ces guides sont par nature non exhaustifs et leur mise agrave jour reacuteguliegravere
est difficile
gt Blogarama Ce reacutepertoire recense plus de 49 000 blogs classeacutes par cateacutegories
gt RSS Network indexe plus de 150 000 fils RSS
gt RSSFeeds Reacutepertorie plus de 119 000 fils organiseacutes en cateacutegories
copy Digimind Digimind Services ndash White Paper |47
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b La recherche par tags
Nous lavons vu avec la Folksonomie linternaute peut deacutesormais mettre en place et
partager sa propre classification via les tags Lutilisateur affecte leacutetiquette de son
choix agrave ses favoris images videacuteos Lavantage est indeacuteniable cest linternaute qui
deacutefinit son eacutetiquette et non plus un organisme Mais les inconveacutenients sont
nombreux difficile gestion des singulierspluriels problegraveme de synonymes de
signification (que deacutesigne cet internaute par ce tag) dhomonymes de polyseacutemie
dheacuteteacuterogeacuteneacuteiteacute plusieurs tags peuvent designer les mecircmes documents
Toutefois lapproche par tag facilite la recherche dune part en ajoutant une couche
seacutemantique aux documents web et dautre part en permettant une navigation par
concepts de plus en plus abandonneacutee compte tenu de la deacutesertion progressive des
cateacutegories des grands reacutepertoires web par les internautes
De plus on peut tagger pratiquement tout type de contenu web Ainsi les sites 43
Things et son eacutequivalent franccedilais 36 Trucs 80 proposent aux internautes de lister
leurs objectifs expeacuteriences ou projets Chacun de ces projets est taggeacute via un ou
plusieurs mots cleacutes
Les moteurs et meacutetamoteurs de tags
Les moteurs
La plupart des applications de social bookmarking ou de partage de fichiers images
ou videacuteos permettent donc de tagger leur contenu Sur certaines le moteur de
recherche interne rend possible en plus de la recherche sur le full text une
recherche centreacutee sur les tags Cest le cas sur Flickr vous pouvez rechercher au
choix sur le titre et la description des images ou sur les tags associeacutes deacutefinis par les
utilisateurs qui ont placeacute leurs photos
Un outil comme Delicious tag search 81 va vous permettre deffectuer des
recherches via un ou plusieurs tags sur le service de social bookmarking Delicious
Pour la recherche de blogs ou flux RSS le moteur Technorati propose une
recherche classique sur les mots cleacutes contenus dans les billets mais aussi une
copy Digimind Digimind Services ndash White Paper |48
Le Web 20 pour la veille et recherche dinformation DIGIMIND
recherche par tags82 En effet leacutediteur dun blog peut tagger chacun de ses billets
via des mots cleacutes qui les cateacutegorisent Ces mots ou tags seront repris par lindex du
moteur Ainsi la recherche du mot pollution parmi les tags affiche un billet sur le
reacutechauffement climatique Si ce billet est bien cateacutegoriseacute par son auteur dans une
rubriquepollution (parmi dautres) il ne contient pas ce mot dans son texte
toutefois en relation avec le concept de pollution Clairement une recherche
classique sur le seul texte des billets naurait pas rameneacute ce billet ou du moins pas
dans les premiers reacutesultats Autre inteacuterecirct Technorati vous propose des tags
associeacutes Ainsi pour pollution il affiche environment politics global warming science
china energy news air climate climate change autant de mots cleacutes pour eacutelargir ou
affiner vos requecirctes
Le moteur SearchLess 83 offre une approche originale il associe la recherche par
mots cleacutes agrave la recherche par tags Ainsi si vous effectuez une requecircte avec le mot
intelligence vous pouvez preacuteciser par le tag CIA Les reacutesultats seacutelectionneront
donc le mot intelligence sur des contenus (billets de blogs par exemple) taggeacutes CIA
par lutilisateur lui-mecircme on est alors sucircr que les 2 concepts sont intimement lieacutes
Meacutetamoteurs
Des meacutetamoteurs 84 permettent de rechercher sur les diffeacuterents types de contenu
sociaux bookmarks images videacuteos
Ainsi Tag Central agreacutege de nombreux formats web taggeacutes En lui indiquant un
tag il affiche des reacutesultats provenant agrave la fois de Flickr Smugmug (photos)
Technorati (blogs) Blogmarks Connotea Furl delirious (bookmarks sociaux) ou
encore 43Things (listes de projets)
Zewol outil de meacuteta syndication francophone permet de rechercher parmi les tags
(Flickr delicious) mais aussi sur les actualiteacutes (Google News Ask Actualiteacutes
Yahoo Actualiteacutes) les blogs (Technorati IceRocket Google Blog Search Ask
Blogshellip) le buzz (Tapemoi Scoopeo Wikipedia) les videacuteos (Google Videos
Podscope Video Daily Motion) et un mix (Furl Echonimo actualiteacutes Plazoo
Feed24) Concregravetement cest une bonne approche de recherche globale sur de
nombreuses ressources de type Web 20
Il est toujours possible de traquer la preacutesence ou lapparition dun mot clef sur le
web via la mise en surveillance du flux RSS de la requecircte
Ketoag est un outil qui permet dinterroger de nombreux services sociaux
copy Digimind Digimind Services ndash White Paper |49
Le Web 20 pour la veille et recherche dinformation DIGIMIND
(Delicious Furl Diig Wikio Blinklist) mais eacutegalement des moteurs de recherche
(Google Blog Search) Par ailleurs vous pouvez geacuteneacuterer pour chaque requecircte un
flux RSS mais aussi un fichier OPML (format permettant lagreacutegation et leacutechange de
listes de flux RSS)
Gnosh est un meacutetamoteur qui recherche parmi les moteurs web les moteurs de
blogs et les outils de partage de favoris De plus une recherche sur longlet People
vous permet de rechercher parmi les favoris des internautes inscrits agrave la
communauteacute Gnosh
Exalead recherche sur Wikipedia A droite le nuage de tags
Les nuages de tags
Ces nuages regroupent un ensemble de tags dans un mecircme espace en affectant agrave
chacun une taille variant selon leur populariteacute (freacutequence dutilisation ou de requecircte
sur ces mots) ou la densiteacute darticles auxquels ils se reacutefeacuterent (deacutepecircches dactualiteacutes
par exemple)
Les nuages de tags sont devenus agrave la mode car ils permettent une navigation facile
tregraves visuelle au sein dun site dune base de donneacutee ou des reacutesultats dun moteur
Ils apportent une grille de lecture suppleacutementaire agrave des sites dont les menus sont
souvent surchargeacutes ou le contenu atomiseacute
copy Digimind Digimind Services ndash White Paper |50
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Nombreuses sont les applications qui utilisent le nuage de tags pour optimiser la
navigation et mettre en valeur leur contenu le partage de videacuteos (DailyMotion) les
bookmarks sociaux (Delicious MyWeb2 de Yahoo) ou les services dactualiteacutes
collaboratives comme Wikio Certains moteurs comme Exalead ont eacutegalement
choisis dafficher des nuages de tags au sein de leurs pages de reacutesultats Dans ce cas
il sagit dune aide agrave laffinage des requecirctes un clic sur un tag va afficher une
nouvelle page de reacutesultat prenant ce mot en compte
Zibb85 moteur de recherche vertical deacutedieacute au Business to Business utilise aussi le
nuage de tags pour visualiser clairement les mots cleacutes de theacutematiques connexes les
plus freacutequents agrave votre requecircte
Dautres sites plus classiques ont eacutegalement choisi lapproche du nuage de tag pour
rendre leur navigation plus attractive et leurs rubriques plus visibles Ainsi le site
Ecrans 86(du journal Libeacuteration) affiche en bas agrave droite un nuage de tags mettant en
valeur son contenu tregraves touffu
Certains outils proposent de geacuteneacuterer des nuages de tags pour des sites ou moteurs
nen disposant pas
Google Tag Cloud Maker 87 est un script pour Firefox qui permet dafficher un nuage
de tags agrave droite des reacutesultats de Google plus un mot est freacutequent dans les reacutesultats
de votre recherche plus la taille dun tag est importante
Newzingo 88 extrait des mots de Google News pour constituer un nuage
doccurrences parmi les termes de lactualiteacute Plus le terme est gros plus les articles
relatifs agrave ce terme sont nombreux Techzingo reacutealise le mecircme process mais cette
fois les cibles sont des meacutedias de reacutefeacuterence dans le High Tech et le logiciel
Slashdot Diggcom et TheRegister
Un nuage de tags sur lInternet Movie Database une maniegravere de naviguer parmi tous les mots cleacutes associeacutes aux films
copy Digimind Digimind Services ndash White Paper |51
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La qualification du contenu par les utilisateurs (rdquofolksonomierdquo) est une reacuteelle valeur
ajouteacutee Les moteurs de recherche font reposer une grande part de lrsquoeffort sur
lrsquoutilisateur final une page de reacutesultats de Google doit ecirctre eacutevalueacutee souvent
interpreacuteteacutee par linternaute La folksonomie fait elle reposer lrsquoeffort de filtrage sur
lrsquoutilisateur initial celui qui va rechercher et appliquer ses propres ldquotagsrdquo Parce
quen amont 1743 personnes ont taggeacute une page avec un groupe de mots cleacutes
lrsquoutilisateur final lors de sa requecircte reccediloit une page de reacutesultats souvent tregraves
pertinente
Sur un moteur classique cest agrave lutilisateur dimaginer ses mots cleacutes pour affiner sa
recherche Sur les bookmarks sociaux de type Delicious les internautes qui
partagent leurs ressources ont deacutejagrave preacutepareacute ce travail daffinage via leurs tags
Prenons le cas dune recherche extrecircme car geacuteneacuterant de la synonymie la requecircte
Jaguar Sur Googlecom on me propose certes des mots cleacutes connexes pour
affiner mais tous sont lieacutes agrave la voiture Sur Delicious les tags afficheacutes sont relatifs agrave
la voiture mais aussi au systegraveme dexploitation agrave un groupe de musique et agrave lanimal
Pouvoir rechercher parmi les tags classifications eacutemanant de lutilisateur peut ecirctre
particuliegraverement inteacuteressant lorsquune recherche classique par mots cleacutes sur le
contenu des documents sest aveacutereacutee infructueuse ou geacutenegravere des reacutesultats peu
pertinents
Le tagging une pratique quotidienne
Selon une enquecircte meneacutee en deacutecembre 2006 par le Pew Internet amp American Life
Project 28 dutilisateurs des internautes ameacutericains ont taggeacute ou cateacutegoriseacute en
ligne des contenus tels que des photos des billets dans des blogs des articles
drsquoactualiteacutehellipSur une base journaliegravere 7 des utilisateurs drsquoInternet pratiquent le
tag en ligne
Ce systegraveme de laquo taxonomie populaire raquo pourrait-il constituer une alternative aux
outils de recherche traditionnels par mots cleacutes Il convient de distinguer les
usages professionnels des usages grand public Olivier Le Deuff 89 reprend dans
son eacutetude sur les Folksonomies la distinction effectueacutee par Thomas Vander
Wal entre les folksonomies eacutetroites (narrow folksonomies) et geacuteneacuterales (broad
folksonomies) Selon Olivier Le Deuff cette distinction est importante car les
premiegraveres sont surtout utiliseacutees dans un objectif individuel tandis que les secondes
privileacutegient lrsquoaspect collectif et collaboratif du partage drsquoinformation Ainsi les sites
de partages de favoris comme delicious ou Connotea sont plutocirct des
folksonomies geacuteneacuterales puisqursquoun mecircme site peut ecirctre partageacute par plusieurs
utilisateurs et recevoir le mecircme tag Ce type de folksonomies srsquoappuyant sur des
copy Digimind Digimind Services ndash White Paper |52
Le Web 20 pour la veille et recherche dinformation DIGIMIND
reacuteseaux sociaux ne fait pas que classer de lrsquoinformation et la partager Il met en
relation des usagers qui partagent les mecircmes centres drsquointeacuterecirct Lrsquousager indexeur
devient agrave son tour un peu indexeacute et mis en relation agrave la fois avec drsquoautres mots-
cleacutes drsquoautres sites et drsquoautres usagers
Il est clair que dans le domaine de lrsquoinformation professionnelle ou speacutecialiseacutee le
manque duniformisation des folksonomies qursquoelles soient geacuteneacuterales ou agrave vocation
plus eacutetroite pose les limites de ce systegraveme Les outils drsquoindexation et de
classification traditionnels ont en effet eacuteteacute creacuteeacutes pour des corpus structureacutes aux
limites clairement deacutefinies et srsquoadressent agrave des utilisateurs experts drsquoun domaine
ou de la recherche drsquoinformation Lrsquoabsence de hieacuterarchisation et de controcircle
constitue agrave la fois le point fort et le point faible de la folksonomie La barriegravere des
langues pourra constituer eacutegalement un obstacle les tags eacutetant parfois meacutelangeacutes
dans un mecircme site sans distinction De plus comme le note Cyril Fievet 90 la
pratique du tagging nrsquoest pas uniforme drsquoun site agrave lrsquoautre Sur Technorati les tags
indexeacutes sont ceux choisis par les blogueurs et fonction du contenu qursquoils ont eux-
mecircmes publieacute Sur delicious en revanche ce sont les internautes qui taguent le
contenu des pages qursquoils conservent dans leurs signets raquo
Il convient eacutegalement drsquoecirctre vigilant quant agrave une utilisation laquo frauduleuse raquo des
tags destineacutee uniquement agrave garantir la populariteacute drsquoun blog comme cela a pu
ecirctre le cas avec les meacuteta-donneacutees incorporeacutees dans le code source drsquoune page
html
Eacutelie Francis et Odile Quesnel preacutesentent dans la revue Documentaliste Sciences
de lrsquoinformation les quatre modes drsquoindexation et de classification sur le web la
classification personnelle lrsquoindexation par lrsquoauteur lrsquoindexation par lrsquoutilisateur et la
classification globale Et srsquointerrogent sur lrsquoavenir de lrsquoindexation collaborative agrave la
croiseacutee de la qualiteacute (liberteacute diversiteacute enrichissement) et de la deacutesinformation
(subjectiviteacute manque de coheacuterence)
Il nrsquoen reste pas moins que folksonomie et indexation classique ne srsquoopposent pas
neacutecessairement et constituent des moyens de description de contenus adapteacutes agrave
des contextes diffeacuterents Stephen Lee creacuteateur du site Guten Tag voit dans la
folksonomie une sorte de web seacutemantique du pauvre peu oneacutereux agrave mettre en
place mais dont le succegraves reposera sur une seacuterie de bonnes pratiques collectives
Lrsquointeacuterecirct de ce systegraveme reacutesidera non pas dans la capaciteacute agrave trouver une reacuteponse agrave
une question preacutecise mais plutocirct agrave deacutecouvrir des sources originales et peu connues
ou de localiser des experts drsquoun domaine pointu Les tags les plus rares et preacutecis
pourront entre autres trouver leur application dans le domaine de la veille mettant
copy Digimind Digimind Services ndash White Paper |53
Le Web 20 pour la veille et recherche dinformation DIGIMIND
en œuvre la seacuterendipiteacute ou lrsquoart de favoriser le hasard pour des deacutecouvertes
heureuses
Laissons la conclusion sur ce point agrave lrsquoAssociation des Professionnels de
lrsquoInformation et de la Documentation (ADBS) qui estime dans sa newsletter que
Le foisonnement des propositions de mots-cleacutes aboutirait agrave un reacutesultat plus efficace
quune indexation reacutealiseacutee par un vocabulaire contraint Cette affirmation semble
ecirctre deacutemontreacuteehellip pour linstant
c La recherche de personnes et dinformations entreprises
La recherche de donneacutees sur les personnes physiques ou morales seffectuait
jusquici principalement en interrogeant les bases de donneacutees dinformations leacutegales
et financiegraveres gratuites ou payantes Linterrogation de service tel que Societecom
Infogreffe ou Yahoo Finance est bien sucircr encore neacutecessaire Mais il faut compter
maintenant avec les reacuteseaux sociaux professionnels qui eux aussi rassemblent des
donneacutees sur les entreprises ou les individus
Linteacuterecirct des reacuteseaux sociaux
Que peuvent-il apporter par rapport aux services classiques dinformations
dentreprises Dabord comme expliqueacute preacuteceacutedemment ils sont ouverts agrave tous
Les informations y figurant ne sont plus le seul fait de leacutediteur du site et ne sont pas
uniquement constitueacutees par les fichiers de donneacutees leacutegales publieacutees par les
organismes officiels comme le Greffe du Tribunal de Commerce en France Sur les
reacuteseaux sociaux centreacutes sur les personnes le contenu est inteacutegralement ameneacute par
linternaute qui affiche son CV deacutetailleacute ses publications ses oeuvres (textes ou
multimeacutedias) Linteacuterecirct est eacutevident des personnes peu visibles auparavant parce
que ne faisant pas partie des dirigeants dentreprises (geacuterant fondateur membre du
conseil) sont maintenant accessibles et donc requecirctables par les internautes On
peut donc collecter des informations sur un cadre de RampD dune socieacuteteacute de
teacuteleacutecoms concurrente ou sur le management eacutetonnant de telle entreprise de
plasturgie citeacutee dans le CV dun employeacute de passagehellip
A linstar des blogs linformation preacutesente sur les reacuteseaux sociaux ne tient plus du
discours ou des donneacutees officielles puisque cest linternaute qui communique sur sa
vie et son entreprise
copy Digimind Digimind Services ndash White Paper |54
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Geacuterer leacuteparpillement de linformation
Dautres plateformes de social networking mixent linformation collecteacutee sur le web
avec les contributions des utilisateurs (agrave linstar de Wikio pour les actualiteacutes) Ainsi
le service ZoomInfo 91 permet de rechercher des socieacuteteacutes et des personnes en
parcourant des milliers de donneacutees extraites du web mais aussi en provenance de
profils dindividus et dentreprises renseigneacutes par les socieacuteteacutes ou les employeacutes eux-
mecircmes Aussi cohabitent des informations sur des entreprises coteacutees avec des
donneacutees de firmes non coteacutees des fiches de cadres du top management et des
conseils dadministration avec des CV demployeacutes plus fonctionnels
Le franccedilais Ziki 92 utilise aussi des informations collecteacutees sur le web cest une
sorte dannuaire perfectionneacute qui indexe et archive non pas les donneacutees
signaleacutetiques mais les contenus produits par une personne agrave partir du moment ougrave ils
disposent dun flux RSS (billets de blogs photo Flickr favoris Delicioushellip) Ziki ne
permet pas de creacuteer du contenu propre mais agregravege des donneacutees eacutelaboreacutees par un
mecircme individu auparavant eacuteparpilleacutees sur linternet Bref vous ameacuteliorez votre
visibiliteacute et facilitez la recherche de vos productions sur le net en creacuteant un point
unique daccegraves
La recherche sur tous ces reacuteseaux sociaux implique souvent linterrogation
fastidieuse apregraves inscription de plusieurs dizaines de sites
Aussi certains outils 93 proposent une meacutetarecherche en lanccedilant une mecircme
requecircte sur plusieurs services de social networking Stalkerati recherche le nom
dune personne sur les reacuteseaux Friendster et FaceBook Plus complet et ciblant
davantage les reacuteseaux professionnels YoName recherche les noms sur MySpace
LinkedIn Friendster Windows Live Spaces Bebo Digg ou Xanga
Le moteur de recherche de personnes Wink scrute les reacuteseaux sociaux MySpace
Bebo Friendster LinkedIn Live Spaces et autres De plus avec cet outil il est
possible de creacuteer son propre profil et de le connecter agrave des reacuteseaux sociaux
Attention toutefois si vous ecirctes un utilisateur recherchant des donneacutees en franccedilais
la nature des reacutesultats est plutocirct tourneacutee vers le monde anglophone
Ces reacuteseaux sociaux ne sont pas suffisants pour une recherche professionnelle
complegravete A linstar des blogs face agrave la presse traditionnelle ils constituent un
compleacutement inteacuteressant aux bases de donneacutees officielles
copy Digimind Digimind Services ndash White Paper |55
Le Web 20 pour la veille et recherche dinformation DIGIMIND
d Les moteurs de recherche humains
Apregraves ecirctre apparus sur le net agrave la fin des anneacutees 90 les services de questions-
reacuteponses avaient laisseacute la place aux algorithmes tout puissants des moteurs de
recherche de type Google Mais les robots et programmes ont tous besoin dune
intervention humaine pour geacuterer la qualiteacute et la pertinence des reacutesultats
Ainsi tous les grands moteurs majeurs ne font pas confiance agrave leurs seuls
algorithmes Les employeacutes de Yahoo sont mis agrave contribution pour surveiller la
qualiteacute des reacutesultats fournis par le moteur Chez Google et MSN Search des
process deacutevaluation humaine avaient eacuteteacute identifieacutes agrave travers les sites
EvalGooglecom et MSN HRS notamment
La revanche de lhumain
Au-delagrave de ce rating humain sur les reacutesultats de moteurs de recherche de
nombreux services depuis 2 ans mettent agrave disposition des experts en chair et en
os Cest alors un veacuteritable mode collaboratif qui se met en place lorsque le produit
est bien penseacute Cest la cas de Yahoo Answers (Yahoo Questions Reacuteponses en
France) 94 Ce service gratuit de questions reacuteponses lanceacute fin 2005 permet agrave
linternaute de poser une question dans un formulaire Chaque membre de la
communauteacute Yahoo (agrave savoir tout ceux qui disposent dun compte Yahoo) peut
jouer le rocircle dexpert Yahoo propose aussi le service (eacutegalement gratuit) Ask
Yahoo qui propose de reacutepondre agrave vos questions mais cette fois via un groupe
dexperts seacutelectionneacutes par Yahoo Inc Yahoo Answers a certes une orientation
initiale grand public mais des questions un peu techniques voire scientifiques
trouvent reacuteponse En effet parmi tous les contributeurs agrave Yahoo Answers figurent
des meacutetiers et expertises tregraves diverses du fait de son audience importante Il y
cohabite des types de questions varieacutes Quels sont les groupes strateacutegiques de
lindustrie mondiale du jouet Quelles sont les donneacutees eacuteconomiques du marcheacute de
lassurance vie collective en France
Autre point inteacuteressant le service est deacuteployeacute dans de nombreux pays (Etats-Unis
Royaume-Uni Canada Australie Inde Espagne Breacutesil Argentine Mexique Italie
Allemagne Singapour Taiwan Coreacutee du Sud Hong Kong Japon Chinehellip) Aussi il
est possible de localiser certaines questions et de beacuteneacuteficier parfois dune
expertise pays
Lune des raisons du succegraves du service de Yahoo tient au fait de baser les questions
et reacuteponses sur la contribution dinternautes volontaires Chacun participe
constitue un vrai reacuteseau et peut surtout se valoriser en devenant expert dans son
copy Digimind Digimind Services ndash White Paper |56
Le Web 20 pour la veille et recherche dinformation DIGIMIND
domaine de compeacutetences ou sa passion Il est mecircme possible de creacuteer sa propre
communauteacute qui rassemblera vos amis mais aussi vos experts preacutefeacutereacutes qui
reacutepondent agrave vos questions et centres dinteacuterecirct Le pool de reacutepondants nest donc
pas limiteacute agrave une liste restreinte et il sauto-entretient Dautre part les experts
seacutevaluent entre eux et seacutelectionnent parmi une liste si neacutecessaire ce quils
considegraverent comme la meilleure reacuteponse agrave une question
Une question sur Yahoo Answers
Sur ce marcheacute des Questions-Reacuteponses Google a eacutechoueacute notamment parce quil a
seacutepareacute formellement demandeurs et contributeurs limitant ainsi fortement laspect
collaboratif Le Service Google Answers 95 permettait de poser des questions agrave des
experts Mais lagrave ougrave des services concurrents comme Yahoo Answsers Lycos IQ
copy Digimind Digimind Services ndash White Paper |57
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Windows Live QnA96 sont gratuits Google Answers eacutetait un service payant faisant
appel agrave un reacuteseau de 800 experts Aussi Google Answers apregraves 4 ans dactiviteacute a
fermeacute Les questions ne sont deacutesormais plus accepteacutees mais laccegraves aux archives des
questions-reacuteponses est maintenu
Par ailleurs les reacuteseaux sociaux eacutevoqueacutes plus haut ont bien compris la puissance des
communauteacutes pour faire office de speacutecialistes Ainsi avec LinkedIn Answers la
plateforme de reacuteseaux sociaux LinkedIn sest lanceacutee elle aussi dans le service de
QuestionsReacuteponses
Ne pas oublier les services Web 10
Lorsque lon parle de Web 20 on eacutevoque rarement ces services de Questions-
Reacuteponses au profit de sites plus technologiques Pourtant nous sommes ici dans la
logique des bookmarks sociaux partager ses connaissances faire beacuteneacuteficier les
autres de son savoir et en retour profiter de lexpertise de la communauteacute
Comme la plupart des applications Web 2 la seule utilisation des services QR ne
suffit pas Elle doit venir en compleacutement de recherches parallegraveles via dautres outils
Ainsi pour la veille linscription agrave des listes de diffusion permet aussi de poser des
questions agrave des experts ou passionneacutes De plus il subsiste des services dexpert
traditionnels qui sils ne mettent pas laccent sur la collaboration permettent
didentifier des compeacutetences parfois tregraves pointues Certaines ressources
reacutepertorient des milliers dexperts quil faudra ensuite contacter personnellement
pour beacuteneacuteficier de leur conseil Cest le cas du site Expertscom qui identifie des
experts dans des domaines allant de lacoustique agrave la biochimie en passant par
lindustrie peacutetroliegravere97
copy Digimind Digimind Services ndash White Paper |58
Le Web 20 pour la veille et recherche dinformation DIGIMIND
e les moteurs de recherche collaboratifs
Nous lavons vu certains services dactualiteacutes collaboratives proposent des reacutesultats
issus dun mixage entre contribution des internautes et collecte de nouvelles sur le
web Cette approche de mixiteacute se met peu agrave peu en place pour les moteurs de
recherche web En effet les modegraveles algorithmiques ou humains preacutesentent tout 2
leurs limites en terme de pertinence de fiabiliteacute et dexhaustiviteacute
Aussi de plus en plus de projet de moteur mixtes agrave savoir proposant des reacutesultats
web conjointement agrave des reacutesultats etou seacutelections issus dhumains voient le jour
Du web donc mais avec une forte dose de cerveaux humains
Wikiasari
Celui qui fait le plus parler de lui est le projet de Jimmy Wales le co-fondateur de
lencyclopeacutedie Wikipedia Baptiseacute Wikiasari 98 (combinaison de wiki rapide en
hawaiumlen et asari recherche fouilleacutee en japonais) le projet vise agrave creacuteer un outil de
recherche ougrave les internautes pourront influer sur les reacutesultats en notant leur
pertinence etou en en proposant de nouveaux selon leur expertise
Ce type de moteur sinscrit donc agrave lopposeacute doutils comme Google aux algorithmes
automatiques dont les robots sont souvent trompeacutes par des manipulations de
webmasters (spamdexing par exemple)
Cet outil qui devrait voir le jour courant 2007 sappuie sur des infrastructures Open
Source existantes comme Nutch ou Lucent
Cest un projet particuliegraverement inteacuteressant Comme sur lencyclopeacutedie ouverte
Wikipedia ougrave des milliers de contributeurs construisent et alimentent louvrage sur
ce moteur des reacuteseaux de centaines dinternautes pourront apporter leur savoir
pour ameacuteliorer la pertinence des reacutesultats Ce nest plus seulement la puissance de
calcul de machines qui sera mise agrave contribution mais aussi la puissance de la
communauteacute
Derriegravere le projet Wikiasari il y a de gros moyens financiers et humains
lexpeacuterience de la fondation Wikipedia et le potentiel de trafic que pourra apporter
lencyclopeacutedie ouverte Fin 2006 Comscore a en effet classeacute Wikipedia comme le
6egraveme site le plus visiteacute au monde avec 1719 millions de visiteurs uniques au mois
de novembre On peut donc y croire
copy Digimind Digimind Services ndash White Paper |59
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche de sites similaires sur Yoono
Decipho Yoono
Certes lideacutee dun moteur de recherche collaboratif nest pas nouvelle Reacutecemment
on peut citer le lancement du moteur Decipho ou en mars 2006 celui de Yoono
Mecircme si les approches diffegraverent ces outils font tous la part belle agrave lrsquoapport de
chaque utilisateur dans le traitement des reacutesultats
Decipho 99 est un moteur baseacute sur la technologie de Askcom lun des 4 moteurs les
plus utiliseacutes aux USA Linternaute creacuteeacute ses propres cateacutegories de reacutesultats
partageables avec les autres Il peut eacutegalement tagger les reacutesultats afin deacutetiqueter
un site Aussi lors dune requecircte on peut preacuteciser les mots cleacutes classiques avec des
tags On beacuteneacuteficie alors de tous les tags mis en place par la communauteacute des
utilisateurs Un curseur permet de deacutefinir la proportion de cateacutegorisation des
autres utilisateurs agrave prendre en compte dans sa recherche
Le franccedilais Yoono 100 propose une autre deacutemarche encore loutil fonde ses reacutesultats
sur la mutualisation des connaissances des internautes par le partage des favoris Le
copy Digimind Digimind Services ndash White Paper |60
Le Web 20 pour la veille et recherche dinformation DIGIMIND
moteur utilise les favoris que sa communauteacute dutilisateurs a accepteacute de partager
Lors dune requecircte les reacutesultats sont classeacutes par populariteacute agrave savoir selon le
nombre de fois ougrave une page a eacuteteacute mise en favoris par les utilisateurs Une logique
proche de Delicious mais avec Yoono lajout de favoris est automatique De plus
loutil affiche les utilisateurs qui comme vous ont reacutefeacuterenceacute des sites sur la
politique veacuteneacutezuelienne par exemple De cette maniegravere vous pouvez identifier des
passionneacutes ou experts partageant vos domaines de preacutedilections Les reacutesultats ne
sont plus baseacutes sur les seuls algorithmes mais sur lexpeacuterience et la capacitation des
autres utilisateurs
Les initiatives de moteurs collaboratifs plus ou moins inteacuteressantes sont multiples
Foox est un moteur baseacute sur des communauteacutes dinteacuterecirct et sur Webzzle lutilisateur
preacutecise les concepts qui linteacuteressent afin de contextualiser les mots-cleacutes choisis 101
Humains ou algorithmes
Certes le mode collaboratif ne remplacera pas totalement la recherche
algorithmique Les 2 sont compleacutementaires Lune permet dameacuteliorer la pertinence
de prendre en compte des concepts des contextes du sens et non plus simplement
des chaicircnes de caractegraveres Lautre vise lexhaustiviteacute en indexant des milliards de
pages Web Aujourdhui et en attendant le Web seacutemantique ainsi que la recherche
dite naturelle 102 toutes deux grandes quecirctes du monde de linternet seul lapport
de communauteacutes dhumains permet dinjecter un peu de sens agrave une recherche
Mais de son cocircteacute la recherche coopeacuterative comporte bien entendu des risques de
subjectiviteacute
Sur les moteurs de recherche la coopeacuteration peut prendre une autre forme via le
peacuterimeacutetrage des sites agrave interroger la construction dun moteur sur mesure en
quelque sorte Cest la verticalisation de la recherche
copy Digimind Digimind Services ndash White Paper |61
Le Web 20 pour la veille et recherche dinformation DIGIMIND
f La verticalisation par la personnalisation du peacuterimegravetre de recherche
Lune des grandes faiblesses des moteurs de recherche web agrave large eacutechelle (Google
Exalead Yahoo MSNhellip) est le bruit geacuteneacutereacute par certaines requecirctes Lorsque vous
tapez puma le moteur ne sait pas agrave priori si vous vous inteacuteressez aux vecirctements
de sport agrave lanimal ou aux heacutelicoptegraveres Or si vous ne reacutealisez des recherches que
dans laeacuterospatiale vous devrez souvent deacutesambiguiumlser par vos mots cleacutes ce qui
engendre une perte de temps voire de reacutesultats si vos requecirctes deviennent trop
restrictives
Certains moteurs ou meacutetamoteurs clusteacuterisent (cateacutegorisent) les reacutesultats en les
rassemblant par groupes (grappes) dans de petits dossiers Cette deacutemarche avait
eacuteteacute initieacutee par le moteur Northern Light en 1998 Ainsi tous les reacutesultats relatifs aux
chaussures Puma sont regroupeacutes dans une mecircme valise ceux eacutevoquant lanimal
dans une autre Mais cette solution nest pas complegravetement satisfaisante car elle
seffectue agrave posteriori une fois votre requecircte lanceacutee Le bruit nest pas eacutelimineacute mais
simplement circonscrit dans des sortes de cateacutegories poubelle
Pour beacuteneacuteficier dune deacutemarche agrave priori il convient dutiliser des outils de
recherche verticaux cest-agrave-dire speacutecialiseacutes dans un secteur dactiviteacute une fonction
un type dinformation ou de meacutedias
Face aux problegravemes de pertinence des moteurs geacuteneacuteralistes de plus en plus de
moteurs verticaux voient le jour Ainsi le seul domaine meacutedical a vu apparaicirctre ces
20 derniers mois les moteurs SearchMedica Medstory MedWorm ou encore Medgle 103
Mais si votre secteur de preacutedilection nest pas couvert par un moteur speacutecialiseacute
Cest lagrave quintervient un autre type de moteur collaboratif agrave qui lon peut indiquer le
peacuterimegravetre des sites sur lesquels effectuer la recherche Sur les moteurs classiques
les algorithmes peuvent placer en prioriteacute des reacutesultats sans inteacuterecirct pour vous A
force de navigation et de veille dans votre secteur vous connaissez certainement
10 20 100 sites que vous jugez incontournables et indispensables pour vos
recherches
2 solutions techniques existent
- les outils agrave peacuterimegravetre de recherche personnalisable (adaptable scope)
Ils utilisent les index des moteurs geacuteneacuteralistes (Yahoo ou Google) et restreignent le
scope de leur recherche aux pages des sites que vous avez choisis Ainsi des outils
comme Rollyo Swicki Yahoo Search Builder Google Custom Search 104 vous
demandent dindiquer une liste de sites sur lesquels vous allez limiter votre
recherche Lors dune requecircte les reacutesultats proviendront uniquement des sites de
votre choix Pratique
copy Digimind Digimind Services ndash White Paper |62
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Mais ces outils preacutesentent une limite de taille ils ne prennent en compte que les
pages indexeacutees par Google ou Yahoo Conseacutequence si la reacuteponse pertinente agrave
votre requecircte figure au sein dune page non indexeacutee par le moteur geacuteneacuteraliste vous
nobtenez pas de reacutesultats
De plus en ninterrogeant que lindex dun ou 2 moteurs vous manquerez
obligatoirement de nombreuses informations puisque le nombre de reacutesultats
communs entre les moteurs diminue constamment105
Les pages non indexeacutees par les moteurs geacuteneacuteralistes constituent une part du web
invisible106 et sont plus nombreuses que lon ne croit Ainsi si jinterroge le moteur
interne du site de la prestigieuse revue scientifique The Lancet 107 avec la requecircte
Diabetes jobtiens plus de 2800 reacutesultats Si jeffectue cette mecircme requecircte sur
Google en restreignant ma recherche au site The Lancet (via la syntaxe
sitehttpwwwthelancetcom) jobtienshellip1 reacutesultat Sur Yahoo Search guegravere
mieux 9 reacutesultats Pourquoi Parce que les technologies de ces moteurs ne
permettent pas dindexer correctement tous les sites
La constitution de bouquets de moteurs speacutecialiseacutes sur Digimind Finder
- les outils agrave moteurs personnalisables
La solution pour beacuteneacuteficier des reacutesultats de moteurs internes non indexeacutes par des
Google ou Yahoo est dutiliser un outil permettant dexploiter directement les
moteurs des sites qui vous inteacuteressent et ce sans avoir agrave passer par les index de
moteurs geacuteneacuteralistes Cest le cas du Finder108 mis au point par Digimind un
copy Digimind Digimind Services ndash White Paper |63
Le Web 20 pour la veille et recherche dinformation DIGIMIND
meacutetamoteur qui permet de plugger nimporte quel moteur de son choix et de
linterroger ensuite Il est donc alors simple de se constituer des bouquets de
moteurs speacutecialiseacutes dans votre secteur dactiviteacute De plus cet outil indexe en temps
reacuteel les reacutesultats et les documents retourneacutes par les moteurs interrogeacutes Cela
permet daffiner ensuite vos reacutesultats en interrogeant cet index au contenu
speacutecialiseacute via une recherche avanceacutee Avec le Finder cest donc lutilisateur final qui
constitue sa propre seacutelection de moteurs
copy Digimind Digimind Services ndash White Paper |64
Le Web 20 pour la veille et recherche dinformation DIGIMIND
g Lenrichissement de bases de donneacutees faccedilon Web20
Nous avons vu que les bookmarks sociaux permettaient de mutualiser les
ressources et pour certains autour de communauteacutes deacutedieacutees comme les
scientifiques Avant lapparition des applications Web 20 ont eacuteteacute constitueacutees de
nombreuses bases de donneacutees professionnelles Celles-ci jusquici noffraient pas
aux groupes dutilisateurs la possibiliteacute dinteragir de commenter et deacutechanger
Aussi de plus en plus de grandes bases de donneacutees se dotent dinterfaces
collaboratives et ergonomiques pour laisser plus de place agrave la contribution
PubMed
Cest le cas de lune des plus grandes bases du domaine meacutedical PubMed 109 Cette
immense base bibliographique a vu naicirctre deux initiatives110 pour ameacuteliorer son
interface de recherche
- Avec PubMed Interact la recherche integravegre de lAjax et permet de pondeacuterer via
des curseurs les critegraveres de sources dancienneteacute de nombre de reacutesultats de date
de publication de liens avec le mapping du MeSH (le theacutesaurus de la base) de
filtrage via des cateacutegories Vous pouvez ensuite annoter et attribuer une note de
pertinence agrave vos reacutesultats afficher labstract des articles ou leur texte complet
supprimer des reacutesultats ou encore afficher les articles lieacutes On retrouve donc
lessentiel des fonctionnaliteacutes de lactuel PubMed mais avec une convivialiteacute et
ergonomie Web 20 et donc une plus grande accessibiliteacute
-Hubmed est une autre interface alternative qui ajoute des fonctionnaliteacutes agrave PubMed
application de ses propres tags aux reacutesultats de recherche historique des recherches
clusteacuterisation des reacutesultats visualisation sous forme graphique creacuteation simplifieacutee
de fils RSS avec les mots de votre requecircte suggestion de termes connexes
visualisation de vos mots cleacutes dans larborescence Mesh Le tout est deacuteveloppeacute en
Ajax notamment permettant une navigation plus fluide et plus rapide Parmi toutes
ces fonctions la possibiliteacute de tagger les reacutesultats est tregraves novatrice on peut ainsi se
deacutepartir de la taxonomie de la base via sa propre folksonomie
copy Digimind Digimind Services ndash White Paper |65
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les nombreux reacuteglages de filtres sur linterface PubMed Interact
LUSPTO
LUSPTO 111 est la base des brevets ameacutericains (United States Patent and Trademark
Office)
Cette veacuteneacuterable institution a en projet une plateforme de brevets sociale agrave la
maniegravere dun Digg (cf les services dactualiteacutes collaboratives) les internautes
pourront commenter les brevets en ligne et les eacutevaluer via un systegraveme de notation
Les brevets les mieux noteacutes remonteront alors en haut de classement
copy Digimind Digimind Services ndash White Paper |66
Le Web 20 pour la veille et recherche dinformation DIGIMIND
h Conserver et exploiter lhistorique de vos recherches et navigations
Le chercheur dinformation sur le net perd souvent ses nerfs quand il ne retrouve
plus ce quil a deacutejagrave collecteacute quelque semaines auparavant ou lorsquil lui est
impossible de se souvenir quelle requecircte agrave geacuteneacutereacute ce fameux reacutesultat remarquable
cette veacuteritable peacutepitehellip
Google a reacutesolu partiellement ces problegravemes de meacutemoire Mais comme souvent
cela ne va pas sans certains sacrifices
Via son service Historique Web112 (ex Historique de recherche) vous pouvez apregraves
enregistrement gratuit
- meacutemoriser les requecirctes effectueacutees sur le moteur ainsi que les reacutesultats cliqueacutes
- enregistrer votre navigation sur les pages web
Il est alors possible deffectuer des requecirctes sur et agrave linteacuterieur des pages que vous
avez visiteacutees dans le passeacute (sur le texte les images les videacuteos)
Google affiche donc deacutesormais vos requecirctes la date et lheure de la recherche les
reacutesultats cliqueacutes mais aussi les reacutesultats de recherches qui nrsquoont pas geacuteneacutereacute de clics
Par ailleurs ce service va encore plus loin dans la personnalisation et lanalyse de
votre recherche
Avec la fonction Tendances saffichent vos requecirctes les plus courantes vos sites les
plus visiteacutes les reacutesultats que vous avez le plus cliqueacutes
Plus puissante la fonction Eleacutements inteacuteressants ougrave Google vous propose des
requecirctes et des pages web en relation avec vos habitudes de recherche113
En outre si vous activez cet historique Google lutilisera aussi pour agrave moyen
terme personnaliser vos recherches en fonction de vos centres dinteacuterecirct Le
moteur explique
Vos reacutesultats personnaliseacutes seront baseacutes sur vos recherches preacuteceacutedentes ainsi que les
reacutesultats de recherche et les titres agrave la une sur lesquels vous avez cliqueacute
Dans les premiers temps la diffeacuterence ne sera peut-ecirctre pas notable mais agrave mesure
que votre historique de recherches seacutetoffera les reacutesultats obtenus seront de plus en plus
personnaliseacutes
Dailleurs si vous reacutealisez de nombreuses recherches sur Google avec une
connexion agrave votre compte Google activeacutee vous devriez voir safficher de temps agrave
autre ce type de message Nouveau activez votre historique de recherche pour
personnaliser vos reacutesultats
copy Digimind Digimind Services ndash White Paper |67
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ces reacutesultats personnaliseacutes apprenant selon vos inteacuterecircts permettent de reacutepondre
en partie agrave la probleacutematique de deacutesambiguiumlsation lors de requecirctes sur des
homonymes Ce sont les exemples classiques de lavocat (fruit ou juriste ) de
jaguar (voiture ou animal ) ou de puma (articles de sports animal ou heacutelicoptegravere
)
Cocircteacute vie priveacutee tout votre surf part sur les serveurs de Google Aussi vous
pouvez (devez) mettre en pause lenregistrement de votre navigation lorsque cela
vous apparaicirct adeacutequat
Lhistorique de vos requecirctes et de vos reacutesultats sur Google
copy Digimind Digimind Services ndash White Paper |68
Le Web 20 pour la veille et recherche dinformation DIGIMIND
i Les mash-up
Les mash-up sont certainement les nouveauteacutes engendreacutees par les technologies
dites Web 20 les plus spectaculaires Mixage de plusieurs applications provenant
de plusieurs sites (souvent deux) ils permettent de creacuteer un service nouveau et ce
agrave partir de la mise en relation voire du croisement des donneacutees des applications
dorigines En franccedilais Wikipedia parle dapplications composites 114 Ainsi en
mixant la liste des socieacuteteacutes ougrave il fait bon travailler eacutetablie par le magazine Fortune et
une carte des USA issue de Google Maps on obtient une carte qui localise toutes
ces entreprises De mecircme si on meacutelange les donneacutees dun site de meacuteteacuteo agrave une
carte de France le reacutesultat est une carte des tempeacuteratures et des neacutebulositeacutes en
quasi temps reacuteel 115
Concregravetement comment cela fonctionne-t-il Chacune des applications
communique et eacutechange des informations via des API (voir glossaire) Ainsi Yahoo
Maps ou Google Maps ont ouvert leurs interfaces de programmation agrave tous les
deacuteveloppeurs
Les exemples sont tregraves nombreux car les Mashups ont rapidement connu un vif
succegraves aupregraves des deacuteveloppeurs et internautes avertis qui parviennent agrave maicirctriser le
code et les API Les Mashups de cartographie ne sont pas les seules possibiliteacutes mais
ce sont les plus freacutequents tant la geacuteolocalisation est attrayante pour les
professionnels comme pour linternaute novice Nous allons explorer quelques
mashups pour mieux comprendre leur inteacuterecirct
Les mashups cartographiques les plus courants mixent des cartes et des donneacutees
provenant de services sociaux comme Flickr le service de partage de photo de
Yahoo Inc Cest le cas de Tagmaps116 qui affiche en temps reacuteel sur une carte les tags
associeacutes aux photos de lieux mise en ligne sur Flickr Le Mashup Flickrvision 117 fait
encore plus simple il affiche les photos agrave lemplacement de la ville dorigine de
linternaute qui a posteacute limage lagrave aussi en temps reacuteel
Donneacutees statiques et temps reacuteel
Au-delagrave de certains mixages un peu gadget certains Mashups sont vraiment
inteacuteressants pour la surveillance de donneacutees ou la collecte dinformations En effet
on peut trouver deux grands types de visualisation celle de donneacutees statiques (une
liste dadresse dentreprises geacuteolocaliseacutees) et celle dinformations eacutevoluant en
temps reacuteel Cest le cas par exemple du Mashup SpaceCraft Tracking 118 qui permet
copy Digimind Digimind Services ndash White Paper |69
Le Web 20 pour la veille et recherche dinformation DIGIMIND
de visualiser la trajectoire sur le globe terrestre de la navette spatiale ou du
teacutelescope Hubble
Souvent le Mashup exploite des donneacutees de reacutepertoires douvrages de services
publics pour les rendre plus compreacutehensives attrayantes bref plus accessibles 119
- HealthMap rassemble des donneacutees de santeacute publique et des actualiteacutes issues de
plusieurs sources (Google News OMS European Centre for Disease Prevention and
Controlhellip) afin de reacutealiser une carte des maladies infectieuses dans le monde Cette
carte se met agrave jour au fur et agrave mesure de lactualisation des informations
Linteractiviteacute permet de zoomer sur un pays et de seacutelectionner des pathologies en
particulier
-BioDiesel Station Maps affiche sur une carte les stations services ameacutericaines qui
deacutelivrent des biocarburants
-Kartametro superpose le reacuteseau du meacutetro moscovite agrave la carte de la ville On y
visualise aussi les correspondances avec les bus
-Wikimapia mixe les informations relatives agrave des lieux de Wikipedia agrave une carte
Google Maps Reacutesultat la plupart des noms de villes sites ou monuments sont
cliquables et pointent vers les articles de lencyclopeacutedie
Le Mashup HealthMap ici des actualiteacutes sur les maladies infectieuses en Asie geacuteolocaliseacutees
copy Digimind Digimind Services ndash White Paper |70
Le Web 20 pour la veille et recherche dinformation DIGIMIND
-GlobaI Incident Maps affiche sur un planisphegravere les eacuteveacutenements lieacutes au terrorisme
ou les risques agrave partir des informations de sites speacutecialiseacutees mises agrave jour en continu
-Enfin un parfait exemple de visualisation et de surveillance deacuteveacutenements en temps
reacuteel DartMaps indique lemplacement des trains de banlieue de Dublin
Mais certains Mashup en minoriteacute certes nexploitent pas de donneacutees
cartographiques Cest le cas de Delexaorg 120 un outil qui mixe les bookmarks
sociaux de Delicious aux donneacutees statistiques dAlexa Delexa va en effet afficher les
tags de Delicious associeacutes aux statistiques de freacutequentation des 50 000 premiers
sites web US fournis par Alexa (agrave partir des donneacutees transmises par les barres
doutils Alexa installeacutees par les internautes) Un tel outil est inteacuteressant notamment
pour se familiariser avec les tags et Delicious mais surtout pour deacutecouvrir quels
sont les sites dinfluence et populaires dans un secteur On peut eacutegalement observer
la correacutelation ou non entre nombre de tags et donneacutees de freacutequentation Alexa
Cocircteacute moteur de recherche les mashups Molu et Gnosh fournissent des
meacutetamoteurs reacutealiseacutes agrave partir du mixage de dizaines doutils de recherche121
Des ressources
Comment trouver des mashups Comme pour de nombreuses informations sur le
web des annuaires speacutecialiseacutes 122 sont apparus Ils reacutepertorient aussi bien des API agrave
destination des deacuteveloppeurs que des mashups WebMashup auto-proclameacute Open
Directory for Mashups et Web 20 APIs en liste des centaines ProgrammableWeb
lun de sites de reacutefeacuterence dans le domaine en propose plus de 1800 sous la forme
dun reacutepertoire et eacutegalement dune matrice permettant de visualiser clairement le
croisement de deux applications ou plus Mashup Feed liste aussi des mixages
populaires
Des blogs sont eacutegalement centreacutes sur ces pratiques Google Maps Mania123 recense
de nombreux Mashups cartographiques
Ces Mashups sont un beau symbole de ce web nouvelle geacuteneacuteration on ne lit plus
seulement de linformation statique de maniegravere passive Deacutesormais on est agrave la fois
fournisseur et spectateur en temps reacuteel des contributions de communauteacutes Le tout
copy Digimind Digimind Services ndash White Paper |71
Le Web 20 pour la veille et recherche dinformation DIGIMIND
gracircce agrave des interfaces reacutealiseacutees par des deacuteveloppeurs agrave partir de code ouverts de
grandes socieacuteteacutes Le succegraves est notamment provoqueacute par la possibiliteacute de mixage
entre des donneacutees du monde reacuteel et des informations ou fichiers posteacutes sur le net
Les internautes peuvent donc maintenant se rassembler par centres dinteacuterecirct mais
eacutegalement par proximiteacute geacuteographique Je recherche un speacutecialiste de linformation
sur les biocarburants situeacutes agrave moins de 10 km de chez moi
Par ailleurs on peut imaginer agrave terme des applications meacutelangeant les donneacutees de
centaines de fichiers et bases de donneacutees On en est certes aux preacutemisses mais le
mashup Alkemis 124 en est deacutejagrave un bon exemple il affiche sur une carte de New
York des donneacutees provenant dA9 OpenSearch Delicious Flickr Google Maps et
Yahoo Traffic Reacutesultat la possibiliteacute de visualiser en une seule interface un eacutetat du
trafic routier via des cameacuteras de surveillance la meacuteteacuteo les actualiteacutes locales ou les
liens Delicious en rapport avec la villehellip
copy Digimind Digimind Services ndash White Paper |72
Le Web 20 pour la veille et recherche dinformation DIGIMIND
III Diffuser
Avec lapparition des applications collaboratives et des plateformes de blogs la
faciliteacute de publication sur le web sest accrue Tout individu mecircme sans
connaissances techniques peut publier et diffuser son propre contenu sur un blog
un wiki et via des fils RSS
a Les Blogs et le flux RSS
Il suffit de 5 minutes pour sinscrire agrave une plateforme de blogs et commencer agrave
eacutecrire Ces plateformes proposent des services de bases gratuits et des
fonctionnaliteacutes plus avanceacutees neacutecessitant un abonnement Ces services qui
permettent de creacuteer maintenir et heacuteberger votre blog sont nombreux Parmi les
prestataires de qualiteacute on peut citer Blogger (qui appartient agrave Google) TypePad et
Vox (de la socieacuteteacute SixApart) Overblog Viablog Haut et Fort ou BlogSpirit 125 Bien
dautres socieacuteteacutes proposent des services de creacuteation et dheacutebergement126 Des
comparatifs sont disponibles en ligne127
Nous lavons vu le format RSS permet de diffuser tregraves facilement le contenu de son
blog utilisant le XML (un html eacutepureacute) langage natif du blog chaque carnet web
comporte un fils RSS permettant aux visiteurs de sabonner agrave vote blog et de
recevoir instantaneacutement toute nouvelle publication actualiteacutes billets podcast ou
videacuteos Par ailleurs des services comme Feedburner128 permettent de rendre
compatibles vos flux RSS avec la majoriteacute des lecteurs RSS outils dont nous
reparlerons plus loin
La creacuteation de sites internet classiques sest elle aussi consideacuterablement simplifieacutee
un outil tel que Google Page Creator129 permet de creacuteer un site simple en 1 heure
Des sites plus sophistiqueacutes sont eacutegalement abordables sans avoir agrave connaicirctre une
ligne de programmation de html gracircce au perfectionnement des eacutediteurs dits
WYSIWYG ce que vous voyez quand vous construisez votre page est ce que vous
obtiendrez en ligne
Les outils Web 20 permettent agrave des speacutecialistes journalistes ou salarieacutes de diffuser
leur contenu Il y a encore 2 ans ils eacutetaient pour la plupart eacutecarteacutes de la publication
web faute de bagage technique
copy Digimind Digimind Services ndash White Paper |73
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Depuis le deacuteveloppement des blogs agrave partir de lautomne 2001 il est possible pour
tout internaute de diffuser sa propre information Au-delagrave des blogs dadolescents
et autres carnets intimes le web regorge de blogs agrave tendance professionnelle
corporate produits marketing experts politiques ressources humaines Cest
autant de sources potentielles quil faut exploiter afin de capter des sources
primaires de qualiteacute Le volume des blogs publieacutes et maintenus chaque jour est lui
aussi en constante augmentation
Le White Paper Blogs et RSS des outils pour la veille strateacutegique deacuteveloppe les
aspects inteacuteressants des blogs pour le professionnel de linformation130
b Les Wikis
Le wiki est finalement diffeacuterent du blog de par sa nature et son utilisation Selon
Wikipedia le Wiki est un site Web dynamique permettant agrave tout individu den
modifier les pages agrave volonteacute Il permet de communiquer et diffuser des informations
rapidement de structurer cette information pour permettre dy naviguer
commodeacutement (Wiki vient du terme hawaiien wiki wiki =rapide ou informel)
Lagrave ougrave le blog sera adapteacute agrave la diffusion dactualiteacute et de contenu se renouvelant
freacutequemment le wiki sera davantage deacutedieacute agrave du texte plus statique mais neacutecessitant
ou pouvant senrichir de la collaboration de plusieurs personnes Ainsi les articles
dune encyclopeacutedie ou les fiches correspondants aux diffeacuterentes phases dun projet
impliquant de nombreux collaborateurs pourront ecirctre reacutealiseacutees sous forme de
Wiki
Sur un blog laffichage du contenu est anteacute-chronologique (le plus reacutecent en haut)
sur un wiki il est structureacute en rubriques larchitecture comme le contenu pouvant
ecirctre modifieacutes agrave tout moment par les participants Ceux-ci peuvent beacuteneacuteficier de
droits daccegraves et de modification hieacuterarchiseacutes
Les versions anteacuterieures ainsi que les modifications sont accessibles via une rubrique
Historique Sur un blog le visiteur peut collaborer mais uniquement via ses
commentaires Sur un wiki tout collaborateur autoriseacute peut modifier le texte
comme le titre et lorganisation des rubriques
Par ailleurs la prise en main dun wiki et de ses syntaxes denrichissement et
modification demande un peu de pratique et nest pas aussi simple que le
maniement dun blog Le wiki est un des outils ideacuteaux pour la gestion de projet
Certaines entreprises les utilisent en tant que tel (parfois en parallegravele avec les blogs)
pour eacuteviter des eacutechanges des recherches et un archivage via les mails fastidieux
copy Digimind Digimind Services ndash White Paper |74
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Geacutereacute via des droits daccegraves gradueacutes il peut alors se reacuteveacuteler comme un outil tregraves
simple agrave manier et agrave sapproprier Ces wikis seront eacutevidemment reacuteserveacutes agrave
lentreprise en accegraves priveacute
Exemples de wikis publics
gt Wikipedia131
Le wiki le plus connu est Wikipedia lencyclopeacutedie collaborative gratuite dont le
contenu est creacuteeacute et maintenu par des milliers dinternautes beacuteneacutevoles Chacun est
libre de creacuteer un article modifier ceux des autres ou les commenter En mai 2007
lencyclopeacutedie proposait plus de 7 millions darticles dans 192 langues et dialectes
dont plus de 500 000 en franccedilais Wikipedia jouit dune populariteacute et dun succegraves
tregraves important Google indexe de nombreux articles de Wikipedia agrave tel point quil
est rare deffectuer une recherche sur le moteur sans voir safficher une deacutefinition
issue de lencyclopeacutedie Selon la socieacuteteacute de mesure daudience Comscore en janvier
2007 Wikipedia eacutetait le 9egraveme site US le plus visiteacute (derriegravere les sites Yahoo
premiers puis les sites Time Warner Microsoft Google eBay Fox Interactive
Amazon et Ask) 6 groupes eacuteditant un moteur geacuteneacuteraliste (Google Ask Microsoft
Yahoo Amazon et AOL) occupent le top10 US Mais cest la premiegravere fois quun
site collaboratif truste les premiegraveres places des sites les plus visiteacutes
Wikipedia comme tout service leader est tregraves critiqueacute Notamment sur la
possibiliteacute pour tout un chacun de modifier et de creacuteer des articles pouvant
entraicircner des risques de diffamation ou de vandalisation 132 Mecircme si ces risques
sont reacuteels nous le verrons dans la partie consacreacutee aux limites du Web 20 il ne
faut pas pour autant se focaliser sur ces problegravemes
Par ailleurs on a souvent mis en cause la qualiteacute des articles du contenu eacutemanant
dinternautes pas forceacutement qualifieacutes ou experts et donc par nature douteux Or
une eacutetude commandeacutee par la Revue Nature agrave remis en cause ce type de ressenti
des experts ont compareacute 42 documents publieacutes sur Wikipedia et sur la ceacutelegravebre
Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche133
Seulement 8 erreurs seacuterieuses comme des mauvaises interpreacutetations de concepts
ont eacuteteacute repeacutereacutees dans les articles analyseacutes 4 pour chaque encyclopeacutedie Des
erreurs factuelles omissions ou fausses descriptions ont eacutegalement eacuteteacute deacutetecteacutees
162 dans Wikipedia et 123 dans lEncyclopaedia Britannica
Le succegraves et limportance de Wikipedia nont pas eacutechappeacute aux moteurs de
recherche qui sont plusieurs agrave secirctre speacutecialiseacutes dans la recherche sur lencyclopeacutedie
Ainsi WikiSeek 134 est un moteur lanceacute deacutebut 2007 qui recherche sur le contenu de
Wikipedia Il indexe le contenu en crawlant les pages en profondeur et aspire
eacutegalement le contenu des liens preacutesents sur les pages de lencyclopeacutedie
copy Digimind Digimind Services ndash White Paper |75
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Plus eacutelaboreacute le moteur franccedilais Exalead 135 enrichit consideacuterablement la recherche
dans lencyclopeacutedie en ligne Cette fonctionnaliteacute est accessible en cliquant sur
longlet Wikipedia Il est eacutevidemment possible de rechercher des articles par mots
cleacutes mais aussi daffiner par langue via le nuage de tags dynamique ( les eacutetiquettes
correspondent agrave des emplacements geacuteographiques personnes ceacutelegravebres noms
drsquoorganisations termes lieacutes agrave votre requecircte ou cateacutegories de Wikipedia)
WikiMindmap 136 recherche sur Wikipedia et affiche les reacutesultats sous forme de
MindMap (cartes heuristiques) Il est alors possible de naviguer dans larborescence
des termes
WikiMindMap
gt Citizendium 137 Lanceacute fin 2006 Citizendium est une initiative de Larry Sanger co-fondateur de
Wikipedia avec Jimmy Wales Citizendium est eacutegalement une encyclopeacutedie Mais
jugeant la communauteacute Wikipedia senseacutee srsquoauto-reacuteguler dysfonctionnelle Larry
Singer integravegre dans Citizendium des proceacutedures de seacutelection des articles par des
experts et refuse aux contributeurs la possibiliteacute de lrsquoanonymat misant ainsi sur la
responsabilisation Le collegravege dexperts a le dernier mot concernant la veacuterification
des articles le but eacutetant dobtenir une encyclopeacutedie contenant le moins derreurs
possible Citizendium est structureacutee en grandes cateacutegories acadeacutemiques
correspondant agrave des groupes de travail Sciences naturelles Sciences Humaines
Arts Sciences Humaines Divertissement Arts appliqueacutes et Sciences
copy Digimind Digimind Services ndash White Paper |76
Le Web 20 pour la veille et recherche dinformation DIGIMIND
gt Alacrawiki 138
AlacraWiki est un guide deacutedieacute aux socieacuteteacutes du secteur de linformation eacutediteurs et
bases de donneacutees La rubrique Alacra Industry Spotlights est particuliegraverement
remarquable elle fournit des analyses et commentaires sur les sites dinteacuterecirct pour
une trentaine de secteurs industriels Le wiki offre des informations sur les
agreacutegateurs de contenu les bases de donneacutees et les meilleurs blogs deacutedieacutes au
secteur de linformation on-line Alacra propose aussi un blog et un fils RSS
Alacra Wiki
gt Les fils RSS 139
Sur cette page de wiki vous trouverez agrave peu pregraves tout sur le RSS
La norme comment utiliser les fils RSS des articles une seacutelection dagreacutegateurs
mixer des fils RSS entre eux mesurer lactiviteacute des fils RSS creacuteer un fil RSS
gtWikidweb 140
Wikidweb est un Wiki qui propose un reacutepertoire de sites web (et non de wikis)
Aussi vous pouvez y participer selon les fonctionnaliteacutes courantes du format wiki
vous avez ainsi la possibiliteacute dy ajouter vos propres sites mais eacutegalement de
modifier les entreacutees des autres internautes (urls texte) ou de les commenter
copy Digimind Digimind Services ndash White Paper |77
Le Web 20 pour la veille et recherche dinformation DIGIMIND
IV Surveiller
Nous lavons vu dans la partie Recherche de blogs et de flux RSS les flux RSS sont
preacutesents sur de nombreux formats du net et vont permettre de surveiller les
nouveauteacutes apparaissant sur les blogs les sites corporate les sites de presse dans
les reacutesultats de moteurs de recherche dactualiteacutes de blogs web dans les
newsgroups sur certains forums web sur certaines listes de diffusion les
bookmarks sociaux les sites de partage de photos et de videacuteoshellipbref sur de tregraves
nombreux sites classiques et ressources collaboratives de type 20
Ces flux RSS peuvent ecirctre inteacutegreacutes agrave votre process de veille en deux clics via des
outils simples gratuits ou payants mais plus puissants
a La deacutetection du flux RSS
Pour pouvoir mettre en surveillance le flux RSS (RSS Feed en anglais) il faut dabord
le trouver Or il nest pas toujours aiseacute de mettre la main sur ces petits logos
oranges ou les liens RSS Abonnez-vous Syndiquez ce flux qui pointent vers les
flux RSS parfois cacheacutes dans les meacuteandres des pages web
Des icocircnes signalant la preacutesence de flux RSS
Certains navigateurs permettent de deacutetecter automatiquement les flux lorsquils
sont preacutesents sur une page web Une icocircne vous avertira alors et dans la plupart
des cas affichera ladresse du ou des flux disponibles sur la page Plusieurs formats
de flux peuvent coexister les diffeacuterentes versions du RSS (090 091 092 10 20)
et le format ATOM concurrent mais offrant les mecircmes fonctionnaliteacutes
Internet Explorer 7 Opera Firefox permettent de deacutetecter les flux Cest aussi le cas
de Maxthon une puissante interface de navigation qui vient se greffer sur
larchitecture dInternet Explorer 141
copy Digimind Digimind Services ndash White Paper |78
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b La mise en surveillance
Quelque soit laspect de la page qui contient votre flux RSS (xml rdf interface
Feedburner) il convient de copier et coller ladresse (url) dans loutil qui va vous
servir agrave lire ce flux et agrave ecirctre alerteacute degraves lors quune nouveauteacute apparaicirct
4 grands types doutils peuvent ecirctre utiliseacutes (du plus simple au plus sophistiqueacute)
- Les navigateurs web
Les navigateurs citeacutes preacuteceacutedemment outre la deacutetection du flux RSS permettent de
sy abonner et de les lire Les flux sintegravegrent alors dans un menu lateacuteral ou dans la
page principale Cest simple mais deacutepourvu de fonctions avanceacutees de tri ou
dorganisation
- Les lecteurs (ou agreacutegateurs) de flux RSS
Ce sont les outils deacutedieacutes aux fils RSS Comme de nombreuses applications ces
lecteurs sont soit disponibles en ligne soit agrave installer localement sur votre PC
- Exemples de lecteurs RSS en ligne Bloglines Pluck Newsgator
- Exemples de lecteurs RSS installeacutes RSS Reader Amphetadesk Newsgator (sintegravegre
agrave Outlook) FeedDemon
Le lecteur Bloglines exploite de maniegravere astucieuse la logique communautaire
lorsque vous ecirctes abonneacute agrave un flux RSS vous pouvez visualiser les autres abonneacutes
(ceux qui ont accepteacute de rendre leur abonnement public) Un clic sur leur nom
affiche tous les fils RSS auxquels ils ont souscrits un moyen rapide de deacutecouvrir
dautres ressources pertinentes collecteacutees par des internautes proches de vos
centres dinteacuterecirct
Les lecteurs RSS sont tregraves nombreux Pour mieux les distinguer certains blogs ou
sites proposent des comparatifs142
copy Digimind Digimind Services ndash White Paper |79
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La communauteacute sur Bloglines les abonneacutes au flux RSS du blog Voip Weblog
- Les pages personnalisables
Ce sont des pages web geacuteneacuteralement organiseacutees en onglets et boicirctes permettant
dorganiser et de ranger ses flux par cateacutegories et ce dans un mecircme espace Ces
services sont ergonomiques et ideacuteaux pour lire dun coup doeil le maximum de flux
Les plus connus sont NetVibes PageFlakes ou Webwag
Outre la lecture de flux RSS ces pages offrent la possibiliteacute dinteacutegrer des services
de meacuteteacuteo mail bloc-notes et des flux provenant de service sociaux comme les
bookmarks ou les reacuteseaux damis
Certains blogs fournissent des listes et comparatifs de ces services143
- Les progiciels de veille inteacutegreacutes
Face agrave labondance des flux RSS et blogs des applications de veille inteacutegreacutee comme
Digimind Evolution 144 donnent la possibiliteacute de filtrer les RSS via lapplication de
requecirctes diffeacuterentes sur chaque fils RSS
On peut ainsi seacutelectionner les informations agrave remonter via des requecircte simples ou
plus complexes (booleacuteens parenthegraveses troncatures et opeacuterateurs de proximiteacute) agrave
longueur illimiteacutee En outre il est possible de surveiller jusquagrave 10 000 flux RSS
quotidiennement
Les boutons inteacutegreacutes
Certains sites vont vous simplifier la tacircche ils affichent sur leurs pages agrave coteacute de
leurs flux des boutons qui permettent dajouter directement le flux agrave votre lecteur
copy Digimind Digimind Services ndash White Paper |80
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ainsi le service dactualiteacutes Wikio ou le moteur Ask Blogs amp Flux proposent tous
deux des boutons vers Bloglines MyYahoo Google Reader Newsgator et Ask Blog
Les fichiers OPML
LOPML (Outline Processor Markup Language) est un format deacuteveloppeacute en XML qui
permet leacutechange dinformations structureacutees entre applications fonctionnant sur des
OS et environnement diffeacuterents Exemple les abonnements dun internaute agrave un
ensemble de flux RSS entre un navigateur Firefox et Internet Explorer de MacOS agrave
Windows XP
Des agreacutegateurs RSS comme Bloglines NewsGator ou Rojo offrent la possibiliteacute
dexporter lensemble de vos flux RSS favoris ou ceux dautres abonneacutes au format
OPML pour les importer ensuite dans votre agreacutegateur
Share your OPML145 est comme son nom lindique un portail qui vous permet de
partager vos flux RSS au format OPML Ce service liste des centaines de fichiers
OPML
c Pourquoi une veille via le RSS
Faire une veille via les fils RSS preacutesente des inteacuterecircts notables
- Lhyper-segmentation le choix des fils RSS rend possible une seacutelection fine de
linformation Ainsi sur le site du Figaro on peut choisir lactualiteacute internationale
nationale les sciences et meacutedecine eacutevitant ainsi decirctre submergeacute par linformation
superflue Sur La Tribune on peut seacutelectionner un flux par socieacuteteacute
Certains blogs proposent mecircme des flux RSS permettant aux choix de surveiller les
commentaires ou uniquement les billets
- Un gain de temps inutile de se connecter au site au blog ou au moteur de
recherche pour visualiser ses nouveauteacutes
- Lanonymat labonnement agrave un flux RSS contrairement agrave une newsletter ou agrave une
liste de diffusion est anonyme
- La consultation aiseacutee vos fils RSS via une lecture sur un agreacutegateur en ligne sont
accessibles de nimporte quel PC connecteacute agrave linternet ougrave que vous soyez
copy Digimind Digimind Services ndash White Paper |81
Le Web 2
copy Digimin
0 pour la veille et recherche dinformation DIGIMIND
d Digimind Services ndash White Paper
V Carte des outils et ressources Web 20
gt Page suivante
|82
wwwdigimindcom Digimind Services ndash White Paper|83
Carte des outils et ressources Web 20 - DIGIMIND Services 2007
Le Web 20 pour la veille et recherche dinformation DIGIMIND
EXEMPLE DUNE RECHERCHE ET VEILLE VIA LE WEB 20
Cas drsquoeacutecole Nous avons agrave mener une recherche et une veille sur le
deacuteveloppement des smartphones ou teacuteleacutephones multimeacutedias haut de gamme Des
sites de type 20 pourront se reacuteveacuteler compleacutementaires de sites classiques (sites
drsquoentreprises portails associations professionnelleshellip) pour deacutetecter les tendances
et sujets eacutemergents
Une premiegravere recherche via lrsquoencyclopeacutedie Wikipedia permettra drsquoobtenir une
premiegravere deacutefinition du sujet et drsquoidentifier les principaux mots cleacutes ainsi que des
liens vers des sites pertinents
Etape suivante nous pourrons eacutelargir notre recherche en identifiant des sites
similaires aux sites trouveacutes preacuteceacutedemment via les suggestions fournies par des
moteurs collaboratifs tels que Yoono ou Similicious
Une recherche sur le tag Smartphone dans des sites de social bookmarking
comme Delicious nous permettra eacutegalement drsquoidentifier les pages plus ou moins
populaires taggeacutees par les contributeurs du site ainsi que drsquoautres tags en relation
avec notre sujet
Explorons ensuite les avis drsquoexperts plus ou moins autoriseacutes que lrsquoon trouvera dans
les meacuteandres de la blogosphegravere gracircce agrave des moteurs de blogs comme Technorati
Blogpulse ou Google Blog Search
La recherche pourra srsquoeffectuer via les tags ou le texte inteacutegral des billets On
pourra ensuite parcourir les blogrolls des auteurs les plus pertinents afin drsquoidentifier
drsquoautres sources
La lecture des blogs fournira non seulement des avis de speacutecialistes ou journalistes
mais aussi des avis plus ou moins critiques de consommateurs ou utilisateurs de
smartphoneshellip
Il conviendra toutefois de rester vigilant quant agrave lrsquoeffet pot de miel de certains
blogs ougrave les contributions des internautes se reacutevegravelent ecirctre de simples messages
publicitaires deacuteguiseacutes (voir agrave ce sujet la mise en garde du site UFC Que choisir146)
Pour recueillir les derniegraveres informations drsquoactualiteacute on pourra utiliser un
agreacutegateur tel que Wikio ou Digg et creacuteer un flux RSS agrave partir drsquoune requecircte sur les
copy Digimind Digimind Services ndash White Paper |84
Le Web 20 pour la veille et recherche dinformation DIGIMIND
tags preacuteceacutedemment identifieacutes Wikio propose des raccourcis pour inteacutegrer ce flux
au sein de plusieurs lecteurs RSS du marcheacute (Netvibes Newsgator Google Reader
etc)
Les reacuteseaux sociaux professionnels permettront eacutegalement drsquoidentifier des acteurs
importants du domaine dans les sphegraveres universitaires ou de lrsquoentreprise
La communauteacute 20 srsquoexprimera eacutegalement sur les grands portails consacreacutes aux
nouvelles technologies Crsquoest le cas par exemple du portail ZDNet qui permet aux
utilisateurs de commenter les articles ou de les ajouter directement agrave leur profil
Delicioushellip Les commentaires ou les trackbacks pointant sur un article pourront
constituer un preacutecieux compleacutement drsquoinformations
Afin de mener une veille reacuteguliegravere sur le sujet on syndiquera les flux RSS provenant
des diffeacuterents sites ou blogs identifieacutes Pourquoi ne pas eacutegalement creacuteer agrave partir de
ce bouquet de sources personnaliseacutees un moteur sur mesure conccedilu gracircce agrave Rollyo
ou Yahoo Search Builder
copy Digimind Digimind Services ndash White Paper |85
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les limites du Web 20
LA PARTICIPATION
I Une participation heacuteteacuterogegravene
Nous lavons deacutejagrave eacutevoqueacute tout le monde ne participe pas de la mecircme maniegravere sur
les applications du Web 20
Une minoriteacute participativehellip
Bill Tancer de la socieacuteteacute de mesure daudience Hitwise reacutevegravele dans une eacutetude147
que sur les sites type Web 20 les internautes regardent mais participent peu
Seulement 016 des visiteurs du site YouTube viennent y partager leurs videacuteos
Les 9984 restant ne font que regarder Idem pour le site de partage de photos
de Yahoo Flickr seulement 02 des visites conduisent agrave la publication de photos
Wikipedia est lexception sur lencyclopeacutedie collaborative gratuite 46 des
visites correspondent agrave une modification des articles
Sur ces sites on est donc encore loin de la regravegle de la 11089 eacutedicteacutee par Charles
Arthur dans The Guardian148 Il estime que sur le net sur un groupe de 100
personnes si une creacutee du contenu 10 vont interagir (commentaires
ameacuteliorations) et les 89 restant ne feront que le lire et regarder Le journaliste
lillustre via des exemples quantifieacutes avec YouTube Wikipedia ou Yahoo Groups
Most Web 20 Users Are Really Just Couch Potatoes Bruce Nussbaum compare
mecircme les internautes Web 20 aux spectateurs de TV passifs et affaleacutes dans leurs
canapeacutes149
Mais parallegravelement les sites de type Web 20 ont vu leur audience grimper
de668 en 2 ans reacutevegravele leacutetude Hitwise Cela repreacutesente 12 du trafic web aux
USA contre 2 il y a seulement 2 ans
Les sites de partage de photos sont parmi les plus populaires Flickr bien sucircr mais
aussi PhotoBucket qui repreacutesente agrave lui seul 41 du trafic des sites de photos en
ligne
copy Digimind Digimind Services ndash White Paper |86
Le Web 20 pour la veille et recherche dinformation DIGIMIND
hellipdautant plus que la forme de participation se complexifie
Dapregraves le cabinet Forrester les internautes sont nombreux sur les actions agrave faible
niveau dexigence (lire enregistrer un signet commenter) mais beaucoup moins sur
des participations plus actives (eacutecrire collaborer) 150
Wikipedia un faux modegravele collaboratif
On cite souvent lencyclopeacutedie Wikipedia en exemple cest lun des emblegravemes les
plus forts et les plus lus du Web 20 Son mode de fonctionnement est
caracteacuteristique voire symptomatique du web collaboratif Mais le process de
Wikipedia serait finalement tregraves classique avec une hieacuterarchie de contributeurs
sorte de cadres disposant de nombreux droits eacutecrivant la majoriteacute des articles
Cest lanalyse de Lionel Barbe du CNRS151 Il explique que si le principe de liberteacute
de publication sur Wikipedia reste valable il est de moins en moins commun car
la plupart des entreacutees basiques ne precirctant pas agrave discussion ont deacutejagrave eacuteteacute effectueacutees
Lrsquoeacutetude des laquo logs raquo historiques montre que la creacuteation de nouvelles entreacutees qui
correspondent agrave de nouvelles pages articles dans la Wikipedia Francophone ne
concerne qursquoenviron 3 agrave 4 des opeacuterations Par comparaison cette proportion tombe
agrave 2 pour la version anglaise de Wikipedia qui contient plus de 1 million drsquoarticles A
lrsquoinverse la proportion monte entre 8 et 10 pour des Wikipedias ayant moins de
100 000 articles comme la Wikipedia en Lituanien et bien drsquoautres
Selon lui on assiste agrave un effet de professionnalisation de lencyclopeacutedie [hellip] les
plus gros contributeurs que nous consideacutererons comme eacutetant les 5 des individus
eacuteditant le plus drsquoarticles eacuteditent entre 85 et 95 du contenu total de lrsquoencyclopeacutedie
Au fur et agrave mesure ces gros contributeurs acquiegraverent des privilegraveges comme le statut
drsquoadministrateur qui leur permettent non seulement de participer mais aussi de
surveiller et le cas eacutecheacuteant censurer le contenu eacutediteacute par les autres contributeurs et de
participer aux grandes lignes de lrsquoorganisation de Wikipedia
Cette analyse a toutefois eacuteteacute battue en bregraveche par Aaron Swartz dans une petite
eacutetude 152 En mesurant non pas le nombre drsquointerventions de chaque contributeur
mais la quantiteacute de texte produit par chacun la reacutealiteacute est diffeacuterente les
contributeurs occasionnels eacutecriraient des textes longs en peu dinterventions tandis
que les eacutediteurs actifs reacutealiseraient un travail tenant davantage de la maintenance
(correction veacuterification suppression) mais sans apporter beaucoup de texte
copy Digimind Digimind Services ndash White Paper |87
Le Web 20 pour la veille et recherche dinformation DIGIMIND
II Une participation damateurs
Tout internaute peut-il simproviser journaliste expert commentateurhellip
Michel Fingerhut 153 voit dans le succegraves dune encyclopeacutedie comme Wikipedia une
manifestation du web comme heacutegeacutemonie de lrsquoamateurisme et comme encouragement
agrave lrsquoextreacutemisme ideacuteologique et au communautarisme
Les contenus creacuteeacutes et diffuseacutes sont-ils de qualiteacute Le Web 20 devient une
plateforme qui stimule la creacuteativiteacute et la production de contenu par cela mecircme
qursquoelle en permet la diffusion (avec indice de notorieacuteteacute) On assiste agrave une libeacuteration
de talents qui peuvent enfin se reacuteveacuteler parallegravelement agrave des productions
caracteacuteriseacutees par un certain amateurisme et lrsquoabsence de veacuteritable ambition
creacuteatrice Car comme sur lensemble de linternet sur ce Web 20 le pire cocirctoie le
meilleur
Par ailleurs toujours en prenant lexemple de Wikipedia un certain nombre de
pheacutenomegravenes se reacutevegravelent tout de mecircme preacuteoccupants
Si leacutetude reacutealiseacutee pour le magazine Nature reacutevegravele que la qualiteacute des articles de
lencyclopeacutedie est presque au niveau de celle de lEncyclopaedia Britannica certains
articles de Wikipedia relegravevent de la deacutesinformation ou de la propagande
- larticle Droits de lHomme en Iran154 a ainsi eacuteteacute tregraves controverseacute en effet cet
article tregraves long de plus de 20 pages se preacutesente davantage comme une apologie du
reacutegime iranien quune analyse argumenteacutee des droits de lhomme dans ce pays Or
certainement au nom du principe de neutraliteacute qui reacutegit Wikipedia cet article
tendancieux a eacuteteacute classeacute comme article de qualiteacute 155
- le cas Seigenthaler 156 en mai 2005 un contributeur publie anonymement sur
Wikpedia un article sur John Seigenthaler Sr un eacutecrivain ceacutelegravebre aux USA Or ce
billet mentionne que leacutecrivain a eacuteteacute directement impliqueacute dans les assassinats de
John et Bob Kennedy en preacutecisant toutefois que rien na jamais eacuteteacute prouveacute Cette
information est tout simplement fausse Mais larticle nest deacutecouvert (par un ami de
John Seigenthaler) et corrigeacute que 4 mois plus tard mettant agrave mal la creacutedibiliteacute de
lencyclopeacutedie A la suite de cette affaire largement relayeacutee par les meacutedias
ameacutericains le fondateur de Wikipedia a rigidifieacute les regravegles de publication concernant
les tout nouveaux contributeurs
Certes sur les milliers darticles mis en ligne par Wikipedia ces dysfonctionnements
restent heureusement minoritaires mais ils reacutevegravelent tout de mecircme certaines limites
du tout collaboratif et la neacutecessiteacute de regravegles de publication emprunteacutees aux meacutedias
classiques
copy Digimind Digimind Services ndash White Paper |88
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Lagreacutegation de petites choses faciles
Elles ont tendance agrave dominer le contenu du Web 20 La faciliteacute de publication le
rythme des blogs qursquoil convient drsquoalimenter freacutequemment peut entrer en conflit
avec le temps de la recherche et de la reacuteflexion Souvent les thegravemes traiteacutes ne
peuvent degraves lors ecirctre que des sujets du quotidien des opinions non reacutefleacutechies non
argumenteacuteeshellipOn peut donc craindre agrave linstar du mode de diffusion sur dautres
meacutedias quinteacutegreacute agrave un reacuteseau social noteacute eacutevalueacute agrave la recherche de notorieacuteteacute et de
visibiliteacute le creacuteateur de contenu ait tout inteacuterecirct agrave aller dans le sens de son audience
produire du divertissant plus agrave mecircme de lui garantir un succegraves immeacutediat
Par ailleurs des opinions peuvent-elles se transformer en jugement pertinent par
lrsquoeffet de leur agreacutegation Lrsquoagreacutegation drsquoune quantiteacute importante drsquoavis peut elle
vraiment deacutepasser lrsquoimpreacutecision des avis pris indeacutependamment Peut-on sans une
harmonisation des critegraveres drsquoappreacuteciation atteindre un jugement collectif fiable Les
tendances qui ressortent risquent en effet de se limiter souvent au reflet de
lrsquoopinion majoritaire
Mais leacutevocation de ces limites ne doit pas occulter toutes les contributions matures
produites par des internautes soucieux dapporter un contenu veacuteritablement
constructif Les billets et les commentaires de nombres de blogs politiques franccedilais
en 2007 en sont une parfaite illustration
LE WEB 10 RESTE NECESSAIRE
Le mail reacutesiste
Nous lavons vu au cours de la description des applications pour la veille les services
Web 20 ne sont pas suffisants en soit pour la recherche dinformation De plus
bien que ses possibiliteacutes soient tregraves puissantes lutilisation du Web 20 reste encore
marginale agrave leacutechelle de tous les internautes Une eacutetude du cabinet Pew Internet 157
montre que lactiviteacute internet dominante sur une journeacutee type dun ameacutericain reste
tout simplement le mail 53 des internautes lutilisent Ils sont 38 agrave utiliser un
moteur de recherche Par contre ils ne sont que 8 agrave creacuteer des blogs et 26 agrave
partager des photos et videacuteos cette collaboration multimeacutedia eacutetant de loin lactiviteacute
la plus courante du Web 2
copy Digimind Digimind Services ndash White Paper |89
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une enquecircte en ligne de lUniversiteacute dOxford reacutealiseacutee aupregraves de 1469 personnes
(une majoriteacute deacutetudiants) fin 2006 deacutetaille les usages du Web 20 158 Elle reacutevegravele elle
aussi que les applications de ce web nouvelle geacuteneacuteration sont encore peu connues
et peu utiliseacutees La majoriteacute des reacutepondants na jamais employeacute ou jamais entendu
parleacute des fils RSS ou des applications de Social Bookmarking comme Delicious
Aussi linfluence grandissante du Web 20 ne doit pas masquer les usages
traditionnels du web qui restent majoritaires
Une population souvent isoleacutee et non repreacutesentative
Lage
Si de nombreuses applications sociales apportent un reacuteel progregraves il faut tempeacuterer
la nature de certains contenus issus du mode collaboratif celui-ci nest en effet pas
repreacutesentatif des internautes puisque le public du Web 20 est une population plutocirct
jeune
Ainsi leacutetude Pew Internet reacutevegravele que laudience de Wikipedia aux USA eacutetait en aoucirct
2006 agrave 47 situeacutee dans la tranche des 18-34 ans Les plus de 45 repreacutesentaient
28 Sur le site dEncarta lencyclopeacutedie de Microsoft plus traditionnelle (Web 10)
la part des plus de 45 ans atteint 33
Des communauteacutes isoleacutees structureacutees en icircles Les communauteacutes actuelles du Web 20 sont souvent renfermeacutees sur elles-mecircmes
les statistiques sur les liens pointant vers les blogs et sur les liens preacutesents dans les
billets reacutevegravelent que les blogueurs se lient et se lisent beaucoup entre eux
Lrsquointernaute Web 20 aurait donc tendance agrave senfermer sur lui-mecircme et autour
dindividus feacutedeacutereacutes en communauteacutes focaliseacutes sur les mecircmes centres drsquointeacuterecirct que
lui
Par ailleurs lhyper segmentation et le ciblage des nouvelles rendu possible par le
flux RSS notamment peut conduire agrave favoriser ces microcosmes communautaires
Parcourir un journal papier peut favoriser davantage louverture la prise de recul et
la mise en perspective des diffeacuterentes informations que la lecture de flux aux
theacutematiques tregraves speacutecialiseacutees
Les diffeacuterentes communauteacutes par reacuteflexe et de par la nature des applications Web
20 qui se dupliquent mais ne se connectent pas ont tendance agrave peu communiquer
entre elles Ainsi les liens entre reacuteseaux sociaux sont rares Peu de personnes
copy Digimind Digimind Services ndash White Paper |90
Le Web 20 pour la veille et recherche dinformation DIGIMIND
enregistreacutes sur LinkedIn iront eacutegalement sinscrire sur Viadeo ou FaceBook
Latomisation des donneacutees sur des dizaines dapplications reste eacutegalement un vrai
problegraveme
Des domaines mal couverts
Certaines theacutematiques vont ecirctre surrepreacutesenteacutees au deacutetriment dautres au
traitement beaucoup plus confidentiel car boudeacutees par les internautes producteurs
volontaires dinformation Les ingeacutenieurs techniciens et jeunes eacutetant fortement
repreacutesenteacutes parmi les blogueurs les theacutematiques high tech sont tregraves largement
couvertes par les blogs par exemple dans le domaine de la RFID (Identification par
Radio Freacutequence) on compte plus de 100 blogs idem pour la VoIP (Voix sur IP) A
linverse si vous travaillez dans le secteur des machines outils ou de la plasturgie il
vous sera difficile de trouver du contenu sur la blogosphegravere
Tous les secteurs ne sont donc pas eacutegaux en volume sur le net et davantage encore
sur la blogosphegravere et sur les autres applications collaboratives ougrave tout internaute
peut publier son propre contenu et ougrave certaines tranches dacircges et cateacutegories
professionnelles ne sont pas bien repreacutesenteacutees
copy Digimind Digimind Services ndash White Paper |91
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Conclusion
Le Web 20 ce mot qui geacutenegravere eacutenormeacutement de buzz deacutecrits et de blogs
speacutecialiseacutes nest-il quun terme marketing un courant de mode 159 Il est probable
que bientocirct on ne lemploiera plus pour deacutesigner ces nouvelles applications qui
seront devenues la norme Toutefois ce terme sorte de parapluie conceptuel qui
recouvre les diffeacuterentes tendances du web nouvelle geacuteneacuteration a le meacuterite de
mettre un nom simple sur un courant du net novateur
Le Web 20 nest pas une reacutevolution ou une rupture technologique mais plus
certainement une eacutevolution qui permet de replacer lutilisateur au centre des
reacuteseaux Cela nest certes pas tregraves nouveau Usenet lun des plus anciens
protocoles de linternet bien anteacuterieur au WWWeb offrait du contenu en ligne
creacuteeacute par linternaute via les Newsgroups degraves les anneacutees 1980
Mais les progregraves technologiques ont permis dintensifier cette tendance et de
deacutemocratiser laccegraves agrave la creacuteation de contenu en ligne et agrave sa diffusion au plus grand
nombre Potentiellement tout internaute peut maintenant diffuser ses publications
tant les outils sont devenus simples
Le Web 20 tend agrave sinseacuterer au cœur du quotidien de chacun en lui apportant des
services novateurs reacuteellement utiles et qui rendent possible lrsquoapparition de
nouveaux usages Ainsi les mash-up qui srsquoappuient sur la geacuteolocalisation ouvrent
des possibiliteacutes inenvisageables jusquici On peut mecircme imaginer agrave terme une
superposition de ces cartes dynamiques agrave la vision reacuteelle dun pieacuteton ou dun
automobiliste Le Web 20 est en perpeacutetuelle eacutevolution ses capaciteacutes drsquoinnovation
sont tregraves fortes car elles reposent souvent sur des recombinaisons audacieuses de
lrsquoexistant hybridant applications et services dans un systegraveme de deacuteveloppement
open source hellipLrsquoinnovation est aussi innovation de postures (prendre la parole
consommer du contenu amateurhellip) qui parfois challengent lrsquoordre eacutetabli et
redistribuent les pouvoirs La position des acteurs du Web 10 ou des meacutedias
classiques pourrait se trouver de plus en plus remise en question lagrave ougrave les
internautes tendent agrave se placer en experts
copy Digimind Digimind Services ndash White Paper |92
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La place de lhumain
Si celle-ci est devenue preacutepondeacuterante il est toutefois difficile de saffranchir
dorganisations un tant soit peu hieacuterarchiseacutees lautoreacutegulation voir Wikipedia ayant
ses limites
En outre la question de la consommation de contenu et de sa qualification sur
lrsquointernet devient cruciale La pertinence des votes de tous les internautes est
discutable ou du moins le fait qursquoils puissent agrave eux seuls qualifier et eacutevaluer la
qualiteacute Par ailleurs que repreacutesente exactement un vote une adheacutesion au contenu
agrave la forme aux ideacutees aux eacutecrits dun ami agrave une ideacutee avec laquelle je suis en
deacutesaccord mais qui agrave le meacuterite dexister
Finalement il faut continuer agrave normer organiser coordonner
reacutegulerhellipnotamment pour eacuteviter les diffamations ou la deacutesinformation Pour ce qui
est du contenu et de sa qualiteacute les critiques eacutemises agrave lrsquoencontre de Wikipeacutedia nous
incitent agrave eacutetudier de plus pregraves les initiatives qui hybrident les interventions
drsquoamateurs avec les compeacutetences de professionnels
Nous sommes passeacutes en 10 ans dun contenu geacuteneacutereacute par quelques internautes pour
la masse agrave un contenu de masse agrave destination de la masse (Evertybody to
Everybody) Cela ne peut guegravere se deacutevelopper sans des meacutecanismes qui replacent
les internautes les plus speacutecialiseacutes dans des processus de validation dune
information devenue pleacutethorique
Les donneacutees personnelles
Simpliciteacute reacuteactiviteacute personnalisation souplesse mutualisationhellipfont partie des
avantages les plus appreacuteciables du web 20 Mais cette liberteacute de publication et de
diffusion nrsquoest elle pas parfois illusoire Les utilisateurs doivent rester vigilants face
aux problegravemes de confidentialiteacute seacutecuriteacute et traccedilabiliteacute de lrsquoinformation160 Des voix
srsquoeacutelegravevent pour deacutenoncer les risques lieacutes agrave la maicirctrise des donneacutees personnelles ou
au respect des droits drsquoauteurs A noter que les licences Creative Commons161
permettent de mieux deacutefinir les contours de cette liberteacute agrave partir de contrats
flexibles de droit dauteur Ce systegraveme Creative Commons donne la possibiliteacute
gratuitement et simplement aux titulaires de droits de choisir et drsquoexprimer les
conditions drsquoutilisation de leurs œuvres agrave travers onze possibiliteacutes Quant aux
utilisateurs ils nrsquoont pas agrave neacutegocier systeacutematiquement une autorisation avant toute
utilisation ou reacuteutilisation
copy Digimind Digimind Services ndash White Paper |93
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Un autre problegraveme reacuteside aussi dans lrsquoeacuteparpillement des donneacutees dans des sites
diffeacuterents ou parfois redondants Il srsquoagira donc de deacutefinir les objets (livre
personne CD photoshellip) agrave partir drsquoun identifiant Cette bataille pour savoir qui
geacuterera ces donneacutees de base telles que la position geacuteographique les espaces de noms et
le code unique de chaque produit a deacutejagrave commenceacute estime Tim OReilly 162
Les perspectives deacutevolution vers un Web 3
Le web actuel est destructureacute et la classification et lrsquoorganisation de son contenu
posent problegraveme La recherche de nouveaux modes de recherche et de
structuration est une sorte de quecircte du graal que de nombreux experts et
entreprises poursuivent
La folksonomie repose sur une ideacutee originale qui sous tend toute lrsquoideacuteologie Web
20 celle de lrsquointelligence collective et de la deacutecentralisation Mais les limites de la
folksonomie appeleacutee aussi web seacutemantique du pauvre remettent en question
lrsquoaffirmation selon laquelle lrsquointelligence collective et la libeacuteralisation totale du
fonctionnement du web 20 sont une solution viable
Aussi la neacutecessiteacute drsquoun Web seacutemantique 163 fiable se fait de plus en plus urgente
Cette nouvelle phase de deacuteveloppement du Web permettrait drsquoameacuteliorer
lrsquoexploitation des informations par les utilisateurs en obtenant une information
organiseacutee normaliseacutee de faccedilon agrave rendre le web compreacutehensible aux machines pour
faciliter lrsquoexploitation par les utilisateurs
Dans un article paru dans le New York Times en novembre 2006 John Markoff
imagine un web 30 selon le principe drsquoajout dune couche de sens tout en haut du
web existant pour en faire un guide au lieu drsquoun simple catalogue Pour lrsquoauteur
nous sommes en train de passer dun web de documents connecteacutes agrave un web de
donneacutees connecteacutees
Le web seacutemantique offrira un langage commun permettant aux donneacutees de
renvoyer agrave des objets du monde reacuteel dune faccedilon identique Le projet Freebase
lanceacute par la start up Metaweb illustre cette approche il a pour objectif de faciliter
la recherche et le partage drsquoinformations agrave travers une base de connaissances
communes structureacutees via des meacutetadonneacutees permettant de deacutecrire chaque
eacuteleacutement drsquoinformation Ces eacuteleacutements seraient relieacutes entre eux par un systegraveme de
relations Tim OrsquoReilly deacutefinit le projet comme la machine agrave creacuteer les synapses du
cerveau global
Il srsquoagirait de creacuteer en quelque sorte un Google du web seacutemantique un reacutepertoire global
drsquoinformations structureacutees intelligibles et exploitables autant par des machines que par
copy Digimind Digimind Services ndash White Paper |94
Le Web 20 pour la veille et recherche dinformation DIGIMIND
des humains -et donc capables drsquoextraire et drsquointerpreacuteter les relations entre des donneacutees
pour par exemple reacutepondre agrave des requecirctes par des solutions plutocirct que des listes de
document 164
La veille
Dans cet univers le chercheur dinformations et le veilleur doiventhellipgarder la tecircte
froide la forte meacutediatisation du Web 20 ne doit pas masquer la pertinence doutils
plus traditionnels Les diffeacuterentes applications Web 20 nous lavons vu suffisent
rarement pour mener agrave bien une collecte dinformation Certes les bookmarks
sociaux apportent un contenu seacutelectionneacute par linternaute mais on ne peut se
deacutepartir des moteurs de recherche web classiques La surveillance des flux RSS
permet decirctre alerteacute sur de nombreux sujets mais la majoriteacute des sites web restent
encore deacutepourvus de ces fils Les tags apportent une veacuteritable souplesse agrave
lutilisateur mais la taxonomie des bibliothegraveques ou des reacutepertoires web- pour ne
citer que ces lieux- reste essentielle pour se repeacuterer agrave travers des milliers de
ressources
Le Web 20 pour la recherche et la veille nen est quagrave ses balbutiements Aussi
avant quil ne digegravere complegravetement par enrichissement les ressources et les
applications Web 10 il convient de faire coexister ces 2 web dans les pratiques
Le Web 20 apporte une richesse essentielle lrsquoexpression drsquoindividus porteurs
drsquoideacutees et de faculteacutes susceptibles drsquoapporter des changements de re-questionner
lrsquoordre eacutetabli eacuteleacutements indispensables agrave lrsquoeacutevolution de la culture agrave condition de ne
pas oublier que des volonteacutes ambitieuses doivent intervenir pour canaliser les
initiatives sans les eacutetouffer et leur insuffler une veacuteritable ambition Voilagrave tout
lenjeuhellip
copy Digimind Digimind Services ndash White Paper |95
Le Web 20 pour la veille et recherche dinformation DIGIMIND
A propos des auteurs DIGIMIND SERVICES
Digimind Services accompagne les plus grandes entreprises pour la conception la
mise en œuvre et le deacuteploiement de projets de veille qui reposent sur la solution
Digimind Evolution apportant agrave ses clients un retour sur investissement de plus de
600 et ce degraves la premiegravere anneacutee Les meacutethodologies proprieacutetaires du
deacutepartement conseil ainsi que son expertise des probleacutematiques et sources
drsquoinformations sur plus de 20 secteurs drsquoactiviteacute deacuteveloppeacutee aupregraves de ses clients
depuis de nombreuses anneacutees permet aux entreprises drsquoanticiper les changements
de leur environnement pour prendre les meilleures deacutecisions sur leur marcheacute
Le conseil Digimind porte sur tous les aspects du workflow de veille ciblage
strateacutegique collecte des informations traitement et analyse exploitation et
diffusion gestion de projet conseil organisationnel et gestion du changement
formations et support fonctionnel et technique
CHRISTOPHE ASSELIN
Issu drsquoun cabinet drsquoeacutetudes de marcheacute B2B et speacutecialiseacute depuis 1997 dans la mise en
place de systegravemes de veille (e-Franceorg Ecole Militaire) Christophe Asselin allie
une connaissance approfondie des secteurs eacuteconomiques et une parfaite maicirctrise
des outils de recherche sur internet et des solutions avanceacutees de veille Expert
reconnu il eacutedite le site httpwwwintelligence-centercom et le blog
httpinfluxjouebcom tout deux consacreacutes agrave la recherche dinformation
Speacutecialiste de la veille internet chez Digimind il accompagne les clients dans la mise
en place de leur dispositif de veille (expression des besoins deacutefinition de plans de
veille sourcing architecture parameacutetrage formation accompagnement) Il
intervient ainsi aupregraves de socieacuteteacutes dans diffeacuterents secteurs les teacuteleacutecoms avec
France Telecom RampD lrsquoindustrie pharmaceutique avec Sanofi Aventis Roche
Pharma Expanscience ainsi quAlstom Transport Veolia Environnement et des
reacutefeacuterences confidentielles dans le secteur des biotechnologies de leacutenergie des
teacuteleacutecoms de limprimerie de la deacutefense du conseilhellip
copy Digimind Digimind Services ndash White Paper |96
Le Web 20 pour la veille et recherche dinformation DIGIMIND
[Merci au Service Marketing agrave Malaiac wwwmalaiacnet et agrave Elsa Bonier eacutetudiante
en Master 2 Management des innovations en communication agrave Paris XIII pour leur
fructueuse collaboration]
VERONIQUE MESGUICH
Apregraves avoir fondeacute et co-dirigeacute pendant six ans un cabinet speacutecialiseacute en veille
technologique Veacuteronique Mesguich dirige lrsquoInfothegraveque du Pocircle Universitaire
Leacuteonard de Vinci Elle enseigne eacutegalement la maicirctrise de linformation strateacutegique
dans plusieurs eacutetablissements denseignement supeacuterieur et anime reacuteguliegraverement
des sessions de formation continue autour de la meacutethodologie de recherche
avanceacutee et de veille sur Internet
Veacuteronique Mesguich est lrsquoauteur avec Armelle Thomas de lrsquoouvrage Net
recherche le guide pour trouver lrsquoinformation utile dont la deuxiegraveme eacutedition est
parue en mars 2007 aux eacuteditions de lrsquoADBS
copy Digimind Digimind Services ndash White Paper |97
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Webographie Bibliographie
Sources dinformation sur le Web 20
Sites web wikis et blogs
Reacutepertoires et classement de services et socieacuteteacutes Web 20 - 20 Websites http20websitescom - Web 20 Magazine Top 100 Web 20 Sites httpweb2magazineblogspotcom200701thanks-for-web-2html - Web 20 Magazine The Best Web 20 Software of 2006 httpweb2socialcomputingmagazinecomthe_best_web_20_software_of_2006htm - Complete List of Web 20 Products and Services httpwwwlistiblecomlistcomplete-list-of-web-2-0-products-and-services - The Complete Web 20 Directory httpwwwgo2web20net - FredCavazzanet le meilleur du Web 20 httpwwwfredcavazzanetindexphp20051212986-le-meilleur-du-web-20 - Web 20 Directory 1200+ Web 20 Sites in 50+ categories httpweb2econsultantcomindexhtml
- Top 25 Web 20 Search Engines httpoedborglibraryfeaturestop-25-web20-search-engines
- 25 start-ups Web 20 prometteuses httpmoneycnncom20070221magazinesbusiness2nextnet_introbiz2
copy Digimind Digimind Services ndash White Paper |98
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Blogs et sites speacutecialiseacutes - Le groupe de travail Web20 francophone httpwwwweb20workgroupfr
- Web 20 Work Group httpweb20workgroupcom - Dessine-moi le Web 20 httpwwwdeuxzerocom - FredCavazzanet httpwwwfredcavazzanet
- TechCrunch en franccedilais httpfrtechcrunchcom - TechCrunch httpwwwtechcrunchcom
- Le web 20 cest pas du buzz httpweb2rulesblogspotcom
- Mashable France httpfrmashablecom - Mashable httpmashablecom - AccessoWeb httpblogaccessowebinfo - Web 20 Magazine httpweb2magazineblogspotcom - Reacutevolution Web 20 en Live httpwwwwebdeuxinfo
- ReadWriteWeb httpwwwreadwritewebcom - Web 20 Innovations httpweb2innovationscom - Web 20 Summit httpwwwweb2concom
- Original Signal (agreacutegateur de flux RSS) httpwwworiginalsignalfr - Whats Web 20 (agreacutegateur de flux RSS) httpwwwwhatsweb20comaggregatorfrom=100
- Le blog de Bloxx Communiquons avec le Web 20 httpblogbloxxfr
copy Digimind Digimind Services ndash White Paper |99
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- FrenchWeborg Le blog des professionnels franccedilais du Web 20 httpwwwfrenchweborg
- Blog Web 20 et Marketing httpwwwvincentabrycom - Le Web 20 en Action httpleweb2blogspotcom - aYsoon 20 httpblogaysooncom Emmanuel de Taillac httpemmanueldetaillacfr - NiouMedia httpnioumediacom - 2803 httpwww2803com - Web 2 francophone (Wiki) httpweb2frcomAccueil
Blogs et sites avec un axe Web 20
- Publishing 20 httppublishing2com - Social-Computing httpwwwsocial-computingcom - Ecosphere httpecospherewordpresscom - inFLUX httpinfluxjouebcom - Benoit Descary httpdescarycom - Jean Michel Billaut httpbillauttypepadcomjm - Blog francophone des TIC httpwww2607fr 20Minutes Top 50 tech et meacutedias httpwww20minutesfrarticle15087620070410-Blogs-Top-50-tech-et-mediaphp - Intruderstv httpnewintruderstvintruders_fr
copy Digimind Digimind Services ndash White Paper |100
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- Jeff Clavier Sans Accent httpsansaccentsofttechvccom - Demain tous journalistes httpbenoit-raphaelblogspotcom
- Collectif louvre-boicircte Initiatives sur le partage dinformation httplouvre-boiteviablogacom
- Zero seconde httpzerosecondeblogspotcom
Articles
Introduction au Web 20
- Web 20 lrsquoarticle de OrsquoReilly reacutesumeacute pour les faineacuteantshellip httpwwwexpressionsbe20051101web-20-resume-pour-les-faineants
- Dossiers Web 20 - Journal Du net httpwwwjournaldunetcomdossiersweb20
- Avis des managers le Web 20 agrave la loupe httpwwwjournaldunetcomsolutions0603diaporamaavis-managers-web21shtml
- Les entreprises face aux deacutefis du Web 20 httpwwwjournaldunetcomsolutions0704070413-entreprises-web-201shtml
-The Machine is Using Us Transcription (videacuteo) httpmediatedculturesnetksudiggp=78
- The New Wisdom of the Web httpwwwmsnbcmsncomid12015774sitenewsweek
- Quest-ce que Web 20 httpwww01netcomarticle294819html
- Approaching a definition of Web 20 httpsocialsoftwareweblogsinccom20050929approaching-a-definition-of-web-2-0
- Fonctionnement de lrsquoentreprise classique vs entreprise 20 httpalbancornilletfreefrakwindexphp20061002fonctionnement-de-lentreprise-classique-vs-entreprise-20
- Meacutedias traditionnels et acteurs du Web 20 vers la cohabitation ou la convergence des acteurs de lrsquoinformation et du divertissement httpwwwscribdcomdoc50818These-sur-le-Web-2-Cabanis
copy Digimind Digimind Services ndash White Paper |101
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ajax
- LAjax en 5 questions httpwwwjournaldunetcomsolutions0602060208_qr-ajaxshtml - Ajax et Moteurs 20 httpwwwmoteurzinecomarchives2006moteurzine127html2
Les Mashups
- Les Mashups applications Web composites tregraves Web 20 httpwwwjournaldunetcomsolutions0606060628-qr-mashup-hybrideshtml
- Le modegravele eacuteconomique des Mashups httpwwwinternetactunetp=6285 Bookmarks sociaux Social search
- Le Social Bookmarking au secours de la pertinence de la recherche drsquoinformation httpwwwgillesbalmissecomv2spipphparticle171 - Whats the Big Deal With Social Search httpsearchenginewatchcomshowPagehtmlpage=3623153
- Whos Who in Social Search httpsearchenginewatchcomshowPagehtmlpage=3623173
Ouvrages
- Web 20 - Les internautes au pouvoir - Jean-Franccedilois Gervais httpwwwdunodcompagesouvragesficheouvrageaspid=50701
- Les reacuteseaux sociaux Pivot de lrsquointernet 20 - Alain Lefebvre httpwwwcluster21comfrbookreviewlivre_les_reseaux_sociaux - Web 20 (R)eacutevolutions et nouveaux services dInternet - Jean-Noeumll Anderruthy httpwwwamazonfrWeb-2-0-C3A9volutions-nouveaux-dInternetdp2746034972ref=sr_1_18402-7140143-8118507ie=UTF8amps=booksampqid=1178118687ampsr=8-18 - Web 20 The Future of the Internet and Technology Economy and How Entrepreneurs Investors Executives amp Consumers Can Take Ad httpwwwamazoncomWeb-2-0-Technology-Entrepreneurs-Execenablersdp1587622009ref=sr_1_6103-0331542-4028646ie=UTF8amps=booksampqid=1178118732ampsr=1-6
- La Longue Traicircne La nouvelle eacuteconomie est lagrave - Chris Anderson httpwwwamazonfrLongue-TraC3AEne-nouvelle-C3A9conomie-
copy Digimind Digimind Services ndash White Paper |102
Le Web 20 pour la veille et recherche dinformation DIGIMIND
estdp2744062693ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180542516ampsr=1-1 - The Geospatial Web How Geobrowsers Social Software and the Web 20 are Shaping the Network Society httpwwwamazoncomGeospatial-Web-Geobrowsers-Information-Processingdp1846288266ref=sr_1_28103-0331542-4028646ie=UTF8amps=booksampqid=1178118760ampsr=1-28 - Les Wikis espaces de lintelligence collective - Jeacuterocircme Delacroix httpwwwamazonfrWikis-JC3A9rC3B4me-Delacroixdp2952051445ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180544723ampsr=8-1 - Pro Web 20 Mashups Remixing Data and Web Services httpwwwamazonfrPro-Web-2-0-Mashups-Remixingdp159059858Xref=sr_1_4403-1740173-8750801ie=UTF8amps=english-booksampqid=1180542751ampsr=8-4 - Web 20 et Web avanceacute - Alexandre Boni Nicolas Stemart httpwwwamazonfrWeb-2-0-avancC3A9-Alexandre-Bonidp2742967281
copy Digimind Digimind Services ndash White Paper |103
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Dans la mecircme collection
White Paper Blogs et RSS des outils pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind
White Paper
Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind
White Paper
Cateacutegorisation automatique de textes
White Paper
Benchmark des solutions de veille strateacutegique
White Paper
Evaluer le Retour sur Investissement dun logiciel de veille Edouard Fillias Consultant Veille Strateacutegique Digimind
gt A teacuteleacutecharger sur httpwwwdigimindfrserviceswhite_paperhtm
copy Digimind Digimind Services ndash White Paper |104
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Notes 1 httpwwwguimfrblog200612le_film_autumn_html httpwwwlemondefrwebarticle01-02-65186536-8751060html 2 httpvideogooglefrvideoplaydocid=724218352255575783 3 Map of online communities par Randall Munroe httpwwwxkcdcomc256html 4 httpwwwdeuxzerocom 5 httpwwwpaulgrahamcombiohtml httpfrwikipediaorgwikiPaul_Graham 6 Qursquoest ce que le web 20 Hubert Guillaud Internet Actu 29 mai 2005 httpwwwinternetactunetp=6144 7 httpwwworeillynetcompubaoreillytimnews20050930what-is-web-20html httpweb2rulesblogspotcom200601what-is-web-20-par-tim-oreilly-versionhtml 8 httpwwwzdnetfractualitesinternet0390207743933447900htm 9 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 10 httpwwwinternetactunetp=7035 11 httpwwwhitwisecomdatacenter 12 httprosstypepadcomblog200604power_law_of_pahtml 13 httpblogsforrestercomcharleneli200704forresters_new_html 14 httpwwwtagcrowdcom 15 You Say You Want a Web Revolution httpwwwwiredcomsciencediscoveriesnews20050868403 16 httpsaddonsmozillaorgfrfirefoxaddon748 httpwwwjournaldunetcomdeveloppeurtutorielout050525-greasemonkey-presentationshtml 17 Mashups Google Maps httpwwwmibazaarcomextrasfortune100html httpwwwweatherbonkcomweatherindexjsp httpgmapstommanganusspacecraft_trackinghtml 18 httpwwwgooglecomcalendar 19 httpdocsgooglecom 20 httpwwwmoovementfr 21 httpwwwcooptincomfrWEBhomeaspx httpwwwjobmeeterscomfraccueilindexphp 22 httpwwwzliocom httpshoppingyahoocomshoposphere
copy Digimind Digimind Services ndash White Paper |105
Le Web 20 pour la veille et recherche dinformation DIGIMIND
23 httpwwwciaofr httpwwwwantunocom 24 httpmapsgooglefr httpwwwgeoportailfr httpearthgooglefr httpmapsyahoocom httpwwwflickrcom httpwwwzdnetfractualitesinternet0390207743936635400htm 25 httpwwwcriteocom 26 From Youtube to Youniversities Henry Jenkins 16 feacutevrier 2007 httpwwwhenryjenkinsorg200702from_youtube_to_youniversityhtml 27 httpaffordancetypepadcom 28 httpwwwplosoneorghomeaction 29 Web collaboratif web coopeacuteratif web 20 quelles interrogations pour lrsquoenseignant documentaliste Marie France Blanquet 12 janvier 2007 httpeprofsdocscrdp-aix-marseillefrIMGrtfintervention-MF-Blanquetrtf 30 httpveillepedagogiquebloglemondefr 31 httpbibliobsessionfreefrdotclear 32 httpliblogsalbanyedulibrary20200611a_librarians_20_manifestohtml 33 httpdelicious 34 httpwwwconnoteaorg httpwwwciteulikeorg httpwwwsnipitroncom 35 httpdelicious httpwwwblinklistcom httpblogmarksnet httpwwwfurlnet httpfrbetabookmarksyahoocom httpmyweb2searchyahoocom 36 httpwwwstumbleuponcom httpsimilicious httpwwwyoonocomindexjsp 37 Social bookmarks charts version 35 httpwwwiroxdefile_download3 httpwwwroxomaticde856 Social Bookmarking Services And Tools The Wisdom Of Crowds That Organizes The Web httpwwwmasternewmediaorgnews20061201social_bookmarking_services_and_toolshtm Free Bookmark Managers
copy Digimind Digimind Services ndash White Paper |106
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwfeedbuscombookmarks 38 httpwwwflickrcom 39 httpwwwflickrcomgroupstehipool 40 httpwwwflickrcomphotostagsnorthamericaninternationalautoshow 41 httpphotobucketcom 42 httpwwwsquidoocom 43 httpwwwsquidoocomnanotechRev 44 httpwwwsquidoocomtagsmarketing 45 httpwwwyoutubecom 46 httpwwwdailymotioncom 47 Une seacutelection de moteurs de recherche videacuteo et de services de partage et teacuteleacutechargement de videacuteos httpcasselinfreefrfrenchvideoshtm 48 httpwwwemarketercomArticleaspxid=1004918 49 httpwwwviadeocom 50 httpwwwlinkedincom 51 httpwww6nergiesnet httpwwwxingcom 52 httpwwwfacebookcom 53 httpenwikipediaorgwikiList_of_social_networking_sites 54 httpwwwlinknrankcombusinessphp 55 httpdiggcom 56 httpwwwnuouzcom httpwwwblogmemescom httpwwwscoopeocom httpwwwfuzzfr httpwwwtapemoicom httpmeneamenet httpwwwrojocom httpwwwbetanetscapecom 57 httpwwwwikiofr 58 httpwwwagoravoxfr 59 Carlo Revelli Joeumll de Rosnay httpfrwikipediaorgwikiCarlo_Revelli httpfrwikipediaorgwikiJoC3ABl_de_Rosnay 60 Agoravox politique eacuteditoriale httpwwwagoravoxfrarticlephp3id_article=60 61 httpwwwreadspeakercom 62 httpenglishohmynewscom
copy Digimind Digimind Services ndash White Paper |107
Le Web 20 pour la veille et recherche dinformation DIGIMIND
63 State of the Blogosphere- avril 2007 httpwwwsifrycomalertsarchives000493html 64 Les blogs dans le monde Estimation agrave partir des chiffres produits par Digimind Blog Herald Technorati PewInternet Meacutediameacutetrie Loiumlc le Meur Live Journal Skyblogs Overblogs Terra MSN Spaces Splinder Excite Bloggersit Timblog W3B Skynet Bloghr Overskriftdk Smartlog onetpl Tenbit mylogpl eblogpl Blogpl Blogipl blogcentralis Romandiefr Blogspot timsoftro Globocom Financial Express Prixadi blog Baidu Yahoo Blogs South Korea Planet Weblog Service Cyworld LAtelier et ZDNet Australia 65 httpwwwnaturecomwebfeedsindexhtml httpwwwsciencemagorgrss 66 httpsearchlivecom 67 httpsearchyahoocom 68 httpnewsgooglefr httpfrnewsyahooco httpfrnewsbotmsncom httpwwwtopixnet httpwwwwikiofr 69 httpgroupsgooglefrgrouprectraveleuropefeedshl=fr 70 httpwwwforummobilescomindexphpshowforum=200 71 httpfrgroupsyahoocom 72 httpfrmyweb2searchyahoocom httpblogmarksnet httpdelicious 73 httpwwwflickrcom httpphotobucketcom 74 httpwwwyoutubecom httpwwwdailymotioncomfr 75 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 76 httpblogsearchgooglefr httpfraskcomsubjectbls|pg1 httpwwwfeedstercom httpwwwblogpulsecom httpwwwtechnoraticom httpwwwspherecom 77 httpwwwsifrycomalertsarchives000493html 78 httpfrsearchyahoocomwebadvancedei=UTF-8ampybs=0 httpwwwexaleadfrsearchresultsq=sarkozyamp24mode=allweb 79 httpwwwblogaramacom httpwwwrss-networkcom
copy Digimind Digimind Services ndash White Paper |108
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwrssfeedscom 80 httpwww43thingscom http36trucscom 81 httptrainquecomcodedelicious_lookupphp 82 httptechnoraticomtag 83 httpwwwsearchlescom 84 httptagcentralnet httpwwwkeotagcom httpwwwthagoocom httpwwwzewolnet httpwwwgnoshorg 85 httpwwwzibbcom 86 httpwwwecransfr 87 Google Tag Cloud Maker httpuserscriptsorgscriptsshow6171 88 httpnewzingocom 89 Folksonomies les usagers indexent le web Olivier le Deuff Bulletin des Bibliothegraveques de France ndeg4 2006 90 Folksonomy les tags en deacutelire Cyril Fieacutevet Internetactu 13 octobre 2005 httpwwwinternetactunetp=6166 91 httpwwwzoominfocom 92 httpwwwzikicom 93 httpwwwyonamecom httpwwwstalkeraticom httpwinkcom 94 httpfranswersyahoocom httpanswersyahoocom httpaskyahoocom 95 httpanswersgooglecomanswers 96 httpiqlycosfr httpqnalivecombetaaspx 97 httpwwwexpertscomdirectoryasp 98 httpsearchwikiacomwikiSearch_Wikia 99 httpdeciphocom 100 httpwwwyoonocom 101 httpwwwfooxxcom
copy Digimind Digimind Services ndash White Paper |109
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwwebzzlecom 102 httpinfluxjouebcomnewspowerset-et-xerox-parc-s-attaquent-a-google-naturellement 103 httpwwwmedglecom httpwwwmedwormcom httpwwwmedstorycom httpwwwsearchmedicacouk 104 httpwwwrollyocom httpswickihomeeurekstercom httpgooglecomcoopcseoverview httpbuildersearchyahoocom 105 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 106 Le web invisible (deep web hidden web) deacutesigne la partie du web non accessible aux moteurs de recherche classiques Le web invisible comprend des bases banques de donneacutees et bibliothegraveques en ligne gratuites ou payantesIl est constitueacute de pages web mal ou non indexeacutees par les moteurs Pour plus de preacutecisions voir le White Paper Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique httpwwwdigimindfrserviceswhite_paperhtm 107 httpwwwthelancetcom 108 httpwwwdigimindfrproduitsfinderhtm 109 httpwwwncbinlmnihgoventrezqueryfcgiCMD=searchampDB=pubmed 110 httppminlmnihgovinteractindexphptop httpwwwhubmedorg 111 httpwwwusptogovpatftindexhtml httpwwwwashingtonpostcomwp-dyncontentarticle20070304AR2007030401263html 112 httpwwwgooglecomhistory 113 httpwwwgooglecomhistorytrends httpwwwgooglecomhistoryitems 114 httpfrwikipediaorgwikiApplication_composite 115 httpwwwmibazaarcomextrasfortune100html 116 httptagmapsresearchyahoocomworldexplorerphp 117 httpflickrvisioncom 118 httpgmapstommanganusspacecraft_trackinghtml 119 httpwwwhealthmaporg httpwwwbrevardbiodieselorgmapbdhtml httpkartametroinfokartadefaultaspxhl=EN httpwwwwikimapiaorg httpwwwglobalincidentmapcomhomephp httpdartmapsmackerscom
copy Digimind Digimind Services ndash White Paper |110
Le Web 20 pour la veille et recherche dinformation DIGIMIND
120 httpwwwtagurlscom 121 httpwwwthemolucom httpwwwgnoshorg 122 httpwwwwebmashupcom httpwwwprogrammablewebcommashupsdirectory httpmashupfeedcom 123 httpgooglemapsmaniablogspotcom 124 httplocalalkemiscom 125 httpwwwvoxcom httpwwwover-blogcom httpwwwblogspiritcomfrindexphp httpwwwtypepadcom httpswwwbloggercomstart httpviablogacom httpwwwhautetfortcom 126 httpcasselinfreefrfrenchweblogshtmoutils 127 httpwwwclubiccomarticle-67515-8-comparatif-plateformes-blogshtml httpwwwojrorgojrimagesblog_software_comparisoncfm 128 httpwwwfeedburnercomfbahome 129 httppagesgooglecom 130 httpwwwdigimindfrserviceswhite_paperhtm 131 httpfrwikipediaorgwikiAccueil 132 httpblogouter-courtcomarchive2006-12-05-n22html 133 httpwwwnaturecomnews2005051212full438900ahtml httpwwwnaturecomnaturebritannicaindexhtml httpwwwnaturecomnews2005051212multimedia438900a_m1html 134 httpwwwwikiseekcom 135 httpwwwexaleadfr 136 httpwwwwikimindmaporg 137 httpencitizendiumorgwikiMain_Page 138 httpwwwalacrawikicom 139 httpceclinesxwikicomxwikibinviewMainFils+RSS 140 httpwwwwikidwebcom 141 httpwwwoperacom httpwwwmaxthoncom httpwwwmicrosoftcomfrancewindowsie httpwwwmozilla-europeorgfrproductsfirefox
copy Digimind Digimind Services ndash White Paper |111
Le Web 20 pour la veille et recherche dinformation DIGIMIND
142 httpfrtechcrunchcom20060401analysons-les-lecteurs-rss-en-ligne httpvtechcanalblogcomarchives20051025927489html httpvtechcanalblogcomarchives20050905780635html httpallrsscomrssreadershtml 143 httpinfluxjouebcomnewsles-pages-personnalisables-bookmark-n-1 httpwwwinformationoverlordcouk200603where-to-start-in-search-of-ideal_26 144 httpwwwdigimindfrproduitsindexhtm 145 httpshareopmlorg 146 httpwwwquechoisirorgArticlejspid=RessourcesArticlesEF33CF34D5616AF2C125720D0050E701ampcatcss=TEL000 147 httpweblogshitwisecombill-tancer 148 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 149 httpwwwbusinessweekcominnovateNussbaumOnDesignarchives200704are_most_web_20html 150 httpblogsforrestercomcharleneli200704forresters_new_html httprosstypepadcomblog200604power_law_of_pahtml 151 httpwwwobservatoire-omicorgcolloque-icicpdfBarbe3_1pdf 152 httpwwwaaronswcomweblogwhowriteswikipedia 153 httpaphgcaenfreefrchronique393aphg393htm 154 httpfrwikipediaorgwikiDroits_de_l27homme_en_Iran 155 httpfrwikipediaorgwikiWikipC3A9diaArticles_de_qualitC3A9 156 httpenwikipediaorgwikiJohn_Seigenthaler_Sr_Wikipedia_biography_controversy 157 httppewresearchorgpubs71riding-the-waves-of-web-20 158 httptallblogcontedoxacukwp-contentuploads200703survey-summarypdf 159 httpwwwcafepresscomnerdwideweb 160 httpwwwecransfrspipphprubrique30 161 httpfrcreativecommonsorg 162 httpwwwzdnetfractualitesinternet0390207743933447900htm 163 httpwebsemantiqueorgPagePrincipale httpwwww3orgDesignIssuesSemantichtml httpwwww3org2002Talks1213-lpslide1-0html 164 httpwwwinternetactunetp=6902
copy Digimind Digimind Services ndash White Paper |112
- Digimind Services
- Christophe ASSELIN
- Veronique MESGUICH
-
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Plusieurs auteurs srsquoaccordent sur lrsquoideacutee selon laquelle le web 20 ne constitue pas
une rupture technologique ni hellip sociale Il srsquoagirait plutocirct drsquoun retour aux sources
drsquoune renaissance du web tel qursquoil a eacuteteacute conccedilu agrave lrsquoorigine les utilisateurs srsquoeacutetant
entre temps approprieacutes les modes de creacuteation et de diffusion
Pour Paul Graham5 pionnier de lrsquoInternet et fondateur de la socieacuteteacute Viaweb en
1995 le web 20 est le web comme il a eacuteteacute conccedilu pour ecirctre utiliseacute Les tendances que
nous distinguons sont simplement la nature inheacuterente du web qui eacutemerge des mauvaises
pratiques qui lui ont eacuteteacute imposeacutees pendant la bulle Internet
Le web creacuteeacute au deacutebut des anneacutees 90 par Tim Berners Lee comportait deacutejagrave en
germe bien des eacuteleacutements du web 20 mutualisation des connaissances eacutechange
travail collaboratif interactiviteacute intelligence collective hellip Ce nrsquoest sans doute pas
un hasard si Dale Dougherty lrsquoun des pegraveres fondateurs de la formule 20 fut lui
aussi lrsquoun des pionniers du web et notamment le fondateur de GNN le premier
portail financeacute par la publiciteacute
Naissance du concept
Crsquoest au cours de lrsquoeacuteteacute 2004 que le terme de web 20 apparaicirct pour la premiegravere
fois lors drsquoune seacuteance de brainstorming Dale Dougerthy co-fondateur de la
socieacuteteacute drsquoeacutedition OrsquoReilly et Craig Cline de MediaLive reacutefleacutechissent agrave des thegravemes
eacutemergents en vue drsquoune confeacuterence agrave venir Le journaliste John Battelle co-
fondateur du magazine Wired se joint un peu plus tard au duo et la premiegravere
confeacuterence Web 20 a lieu en octobre 2004 Lrsquoexpression 20 est utiliseacutee agrave ce
propos pour marquer lrsquoeacutemergence drsquoune nouvelle eacutetape dans la courte histoire du
web eacutetape caracteacuteriseacutee par un changement des regravegles et une modification des
modegraveles de revenus Le volet social sera deacuteveloppeacute plus tardivement par Tim
OReilly lors de la deuxiegraveme confeacuterence Web 20 en octobre 2005
Les nouveaux produits et services associeacutes au web 20 vont ainsi repositionner
lrsquointernaute au cœur du systegraveme Des techniques de publications simples et souples
comme les blogs les plates-formes collaboratives de type Wiki offrent des
possibiliteacutes accrues de production diffusion et consommation des contenus
Lrsquointernaute devient ainsi co-creacuteateur de nouvelles applications en ligne initiant
souvent de faccedilon collective ou communautaire de nouvelles formes de relations
numeacuteriques Selon lrsquoexpression drsquoHubert Guillaud6 le web devient non plus une
aventure technologique mais bien une aventure humaine
copy Digimind Digimind Services ndash White Paper |7
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LES 7 PRINCIPES DU WEB 20
Le texte de Tim OrsquoReilly paru en 2005 7 sous le titre Qursquoest ce que le web 20
deacutegage sept principes cleacutes du Web 20 en voici un petit reacutesumeacute
1 Le web vu comme une plate-forme de services
On passe dune collection de sites web agrave une plateforme informatique agrave part
entiegravere fournissant des applications web aux utilisateurs
2 Consideacuterer les internautes comme co-deacuteveloppeurs des applications On passe ainsi
de la notion de logiciel produit agrave celle de logiciel service
3 Le service srsquoameacuteliore quand le nombre drsquoutilisateurs augmente
Le Web 20 met agrave profit lrsquoeffet de la longue traicircne (ou long tail en anglais)
populariseacute par le magazine Wired les produits qui sont lrsquoobjet drsquoune faible
demande ou qui nrsquoont qursquoun faible volume de vente peuvent collectivement
repreacutesenter une part de marcheacute eacutegale ou supeacuterieure agrave celle des best-sellers si les
canaux de distribution peuvent proposer assez de choix Les utilisateurs du Web
20 disposent de donneacutees uniques difficiles agrave recreacuteer et dont la richesse srsquoaccroicirct
avec lrsquoaugmentation du nombre des utilisateurs
4 La richesse est dans les donneacutees Toutes les applications web drsquoimportance sont
lieacutees agrave une base de donneacutees speacutecialiseacutee OrsquoReilly envisage un mouvement des
donneacutees libres srsquoopposant peu agrave peu agrave lrsquounivers des donneacutees proprieacutetaires
5 Tirer parti de lrsquointelligence collective crsquoest le principe mecircme adopteacute par
lencyclopeacutedie en ligne Wikipedia et drsquoautres sites similaires Pour Tim OrsquoReilly
lrsquoimplication des utilisateurs dans le reacuteseau est le facteur-cleacute pour la supreacutematie sur le
marcheacute
6 Mettre en place des interfaces souples et leacutegegraveres fondeacutees sur les nouveaux
standards et protocoles du Web Le logiciel se libegravere du PC Une autre des
caracteacuteristiques du web 20 est le fait qursquoil nrsquoest plus limiteacute agrave la plate-forme PC
mais vise notamment les objets nomades teacuteleacutephone portable PDA ou lecteur
portatif audio
copy Digimind Digimind Services ndash White Paper |8
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LES EVOLUTIONS PAR RAPPORT AU WEB 10 LE ROLE DE LINTERNAUTE
En quoi le Web 20 se distingue-t-il de la vague preacuteceacutedente On a vu que lrsquoune des
caracteacuteristiques majeures du pheacutenomegravene est lrsquoappropriation des contenus et des
modes de diffusion par les internautes eux-mecircmes via des applications souples et
leacutegegraveres
Paul Graham eacutevoque le principe de deacutemocratie du Web 20 cest-agrave-dire la
superposition au reacuteseau technique drsquoun reacuteseau humain qui participe agrave la creacuteation et
agrave lrsquoenrichissement de contenus et services Lrsquointernaute deviendrait ainsi
consommrsquoacteur agrave lui de produire publier diffuser indexer partager des
contenus de tous types
Web 10 Web 20
Leaders du web Entreprises marchands Internautes
Profil de linternaute Passif Actif
Interactiviteacute perccedilue Seacutelection et lecture dinformation
Seacutelection lecture et publication de donneacutees
Uniteacute de recherche Mot-cleacute Tag
Du Web 1 vers le Web 2 Source ZDNet 8
Pour autant les internautes vont-ils devenir tous acteurs de ce processus Selon un
article de Charles Arthur dans The Guardian 9 pour un groupe de 100 personnes si
lrsquoune creacutee du contenu 10 seulement vont interagir en apportant commentaires et
ameacuteliorations les autres se contentant drsquoune consommation passive Ce constat
obtenu via des retours drsquoexpeacuterience sur des sites collaboratifs illustre la regravegle des
11089 selon laquelle plus de 80 des contenus produits proviennent drsquoun
nombre tregraves restreint drsquoutilisateurs
Tendance confirmeacutee par les chiffres preacutesenteacutes lors de la Web 20 Expo en avril 2007
et repris dans Internetactu 10 selon la socieacuteteacute de mesure drsquoaudience Hitwise11
016 des internautes qui passent sur YouTube y placent des films - alors qursquoils
eacutetaient encore 05 agrave le faire en juillet 2006 seulement 02 des visiteurs de
Flickr y publient des photos La seule exception agrave cette faible participation provient
copy Digimind Digimind Services ndash White Paper |9
Le Web 20 pour la veille et recherche dinformation DIGIMIND
de Wikipedia ougrave 46 des visiteurs contribuent agrave lrsquoenrichissement de
semblent en effet
voir eacutecrit des textes longs (en un nombre reacuteduit drsquointerventions) tandis que les
eacutediteursrdquo les plus actifs qui forment le noyau des wikipeacutediens nettoient corrigent
lective fondeacutee sur des actions agrave faible niveau drsquoexigence
(lire enregistrer un signet tagger commenter) de lrsquointelligence collaborative
caracteacuteriseacutee par des formes de participations plus actives et intenses eacutecrire
collaborer modeacutererhellip
lrsquoencyclopeacutedie
Jimmy Wales fondateur de Wikipedia estime qursquoun nombre restreint de
contributeurs et eacutediteurs font lrsquoessentiel du travail alors qursquoun nombre consideacuterable
de lecteurs apportent peu de modifications Le wikipeacutedien Aaron Swartz nuance
ce point de vue un grand nombre de contributeurs occasionnels
a
ldquo
mais sans apporter eacutenormeacutement de texte
Le Web 20 et tout particuliegraverement la blogosphegravere semble suivre la loi de la
participation eacutedicteacutee par Ross Mayfield preacutesident de la socieacuteteacute Social Text sous le
nom de Power law of participation12 Cette loi baseacutee sur lrsquoobservation des
pratiques et des seuils de participation aux dispositifs communautaires constate que
la participation srsquoamenuise agrave mesure que les formes de participation se
complexifient Le scheacutema ci-dessous qui rappelle celui de la Longue Traicircne
distingue lrsquointelligence col
Power Law of Participation par Ross Mayfield CC
copy Digimind Digimind Services ndash White Paper |10
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Le cabinet Forrester deacutetaille enc
de la participation figurant dans son eacutetude Social Technographics 13 la grille compte
6 eacutechelons correspondant aux niveaux de particip
les inactifs (52 )
les spectateurs (33 ) consommateurs de contenus texte ou multimeacutedia (blogs
videacuteos mis en ligne par les utilisateurs podcasts)
ore davantage les niveaux drsquoimplication dans la grille
ation
les menuisiers (19 ) utilisateurs de reacuteseaux sociaux
es collecteurs (15 ) utilisent des flux RSS et taggent les pages web
les critiques (19 ) postent des commentaires sur les blogs des avis et critiques
les creacuteateurs (13 ) publient des contenus en ligne (blogs videacuteos)
l
copy Digimind Digimind Services ndash White Paper |11
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Glossaire du Web 20
Pour mieux comprendre les concepts utiliseacutes dans lunivers du Web 20 nous vous
proposons ce glossaire des termes essentiels
Tags mot clef sous forme drsquo eacutetiquette que les utilisateurs peuvent apposer sur
un document numeacuterique (texte photo videacuteo) de faccedilon agrave en deacutecrire le contenu Le
tagging introduit une part de subjectiviteacute par rapport agrave lrsquoindexation automatique
effectueacutee par les moteurs Les tags peuvent eacutegalement ecirctre extraits
automatiquement drsquoun texte en fonction de leur freacutequence drsquooccurrence
Nuage de tags preacutesente les tags correspondant agrave un site (ou agrave plusieurs) en les
regroupant sur un mecircme espace et leur attribuant une taille variable suivant la
freacutequence dutilisation ou drsquooccurrence Cela donne une vision drsquoensemble des
principales theacutematiques Le site Tagcrowdcom14 permet de geacuteneacuterer un nuage de
tags agrave partir drsquoun texte
Folksonomie (traduit eacutegalement parfois par potonomie peuplonomiehellip)
Ce mot valise contraction de folk (peuple) et taxonomie deacutesigne une forme de
classification collaborative deacutecentraliseacutee spontaneacutee baseacutee non pas sur un
vocabulaire controcircleacute et standardiseacute mais sur des termes choisis par les utilisateurs
eux-mecircmes intituleacutes tags Lrsquoobjectif eacutetant de faciliter lrsquoindexation des contenus
ainsi que la recherche drsquoinformation
Blogs journal personnel disponible sur le web Peut ecirctre tenu par un particulier
un chercheur un journaliste un salarieacute drsquoentreprise ou plus rarement par un groupe
de personne (entreprise collectiviteacutehellip) Le blog a pour objet de diffuser des billets
geacuteneacuteralement lieacutes agrave lrsquoactualiteacute et preacutesenteacutes par ordre chronologique alors qursquoun
wiki est destineacute agrave la mutualisation des connaissances Un blog peut preacutesenter des
contenus multimeacutedias photo (photoblog) son ou videacuteo (vblog vlog)hellip
Blogosphegravere la biosphegravere des blogs Ce mot valise deacutesigne la communauteacute
des blogs ou encore lrsquoensemble des auteurs de blogs La blogosphegravere est largement
interconnecteacutee les trackbacks situeacutes sur la plupart des blogs permettant de lier
copy Digimind Digimind Services ndash White Paper |12
Le Web 20 pour la veille et recherche dinformation DIGIMIND
deux articles traitant de sujets connexes Lrsquoeacutelite des blogueurs particuliegraverement
influents peut ecirctre qualifieacutee ironiquement de blogeoisie
Blogroll ou blogoliste liste de liens vers drsquoautres blogs preacutesenteacutes par lrsquoauteur
drsquoun blog On peut syndiquer sur une mecircme page des billets venant de ces blogs via
les formats RSS
RSS lrsquoacronyme signifie selon les versions Really Simple Syndication (RSS 20) RDF
Site Summary (RSS 09 10 et 11) ou encore Rich Site Summary (RSS 091) Ce
format de syndication permet drsquoextraire automatiquement dun site web ou drsquoun
blog du contenu reacuteguliegraverement mis agrave jour Un fichier RSS est un simple fichier texte
au format XML comportant la description syntheacutetique du contenu Ce format a eacuteteacute
creacuteeacute en 1999 par Netscape On peut srsquoabonner gratuitement agrave plusieurs flux RSS agrave
partir drsquoun lecteur on-line ou installeacute sur le PC
Atom Format normaliseacute de syndication de contenu Web baseacute sur le XML qui
permet la syndication de contenu entre diffeacuterentes ressources Web Concurrent
de RSS Le format Atom a eacuteteacute creacuteeacute dans le but de simplifier les diffeacuterents formats
RSS existants La diffeacuterence entre les deux formats reacuteside surtout dans lemploi de
balises XML diffeacuterentes Les deux formats sont geacuteneacuteralement lus par les
agreacutegateurs
Wiki Site web dynamique dont tout visiteur peut modifier les pages agrave loisir Le
terme vient la langue hawaiumlenne (wikiwiki = rapide) Un wiki a pour objectif de
mutualiser des connaissances et est organiseacute autour drsquoun plan de classement Les
contributeurs drsquoun wiki sont geacuteneacuteralement anonymes
Crowdsourcing Litteacuteralement approvisionnement par la foule Le
crowdsourcing consiste agrave utiliser la creacuteativiteacute lintelligence et le savoir-faire dun
grand nombre dinternautes pour creacuteer des contenus participer agrave lrsquoalimentation
drsquoun site Cette participation des utilisateurs agrave la creacuteation des contenus repreacutesente
une forme drsquoexternalisation (outsourcing) et permet de reacuteduire les coucircts en se
basant sur un systegraveme de beacuteneacutevolat ou de micropaiement
Reacuteseaux sociaux de nombreux sites de social networking ou reacuteseautage social
sont apparus avec la vague du Web 20 Ils permettent de mettre en relation des
personnes partageant les mecircmes centres drsquointeacuterecirct personnels ou professionnels
Ces reacuteseaux peuvent devenir de veacuteritables communauteacutes en ligne les plus fameux
eacutetant les sites Friendster ou Myspace ou bien dans la sphegravere professionnelle
copy Digimind Digimind Services ndash White Paper |13
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Linkedin ViadeohellipLa plupart des reacuteseaux sont ouverts certains fonctionnent sur le
mode de la cooptation
Podcasts issu de la combinaison des termes iPod (dApple) et broadcasting ce
terme deacutesigne le fait de rendre disponible en ligne un fichier audio au format
numeacuterique Ce fichier peut-ecirctre teacuteleacutechargeacute directement sur un ordinateur ou un
peacuteripheacuterique via un flux de diffusion Equivalent franccedilais baladodiffusion
Lrsquoutilisateur peut ainsi se composer une liste de lecture agrave la carte Pour les fichiers
videacuteo on emploi le terme de videacuteocast
AJAX (Asynchronous JavaScript And XML) meacutethode informatique de
deacuteveloppement dapplications Web permettant deacuteconomiser de la bande passante
en ne rechargeant pas une page entiegravere alors que seuls certains eacuteleacutements ont besoin
de lecirctre mais en ne rafraicircchissant que ces eacuteleacutements de la page Cela permet de
produire des contenus dynamiques et reacuteactifs en ne neacutecessitant que peu drsquoappels au
serveur heacutebergeant la page AJAX est une combinaison de plusieurs technologies
HTML CSS Javascript XMLhellipDe nombreux sites web 20 sont deacuteveloppeacutes en
AJAX
API Interface de programmation permettant agrave un utilisateur de deacutevelopper des
applications conviviales De nombreux sites classiques ou Web 20 proposent des
API pour inteacutegrer automatiquement leur contenu agrave dautres sites
Mashup ou Mash up application web composite mixant plusieurs sources ou
plusieurs contenus pour fournir un nouveau produit ou service Le terme se traduit
en franccedilais par remixage ou mosaiumlque Exemple de mashup la visualisation des
reacutesultats des eacutelections preacutesidentielles franccedilaises via Google Earth qui mixe les cartes
Google et les chiffres du Ministegravere de lInteacuterieur
Long tail (longue traicircne) Cette expression est utiliseacutee en statistiques et peut
srsquoappliquer au marketing Des produits rares ou qui font lrsquoobjet drsquoune faible
demande peuvent collectivement repreacutesenter une part de marcheacute eacutegale ou
supeacuterieure agrave celle des best-sellers si les canaux de distribution peuvent proposer
assez de choix Le caractegravere virtuel du web permet de geacuteneacuterer une longue seacuterie de
marcheacutes de niche heacuteteacuterogegravenes (exemple e-bay) par opposition aux grands
marcheacutes homogegravenes et grand public du monde reacuteel
copy Digimind Digimind Services ndash White Paper |14
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les technologies du Web 20
Mettons dabord les choses au point le Web 20 nest pas une (r)eacutevolution ou un
concept de dimension technologique
Ses applications sappuient sur des technologies deacutejagrave existantes reacutepondant aux doux
noms dAjax Soap REST RSS Perl Python PHP Ruby ou GreaseMonkey Lobjectif de
ce document nest pas de deacutevelopper ce volet technologique Nous en eacutevoquerons
seulement les grandes caracteacuteristiques pour mieux comprendre les enjeux
Le Web 2 repose notamment sur les interfaces utilisateurs dites riches qui
permettent des possibiliteacutes daffichage de configuration et de maniement plus
puissantes que les pages html classiques du Web 1 que ce soit pour le
deacuteveloppeur ou lutilisateur final
Tim Berners Lee co-inventeur du web remarque en fait ce Web 20 utilise les
standards qursquoont produit tous ces gens qui travaillent sur le Web 10 le Document
object model HTML et SVG (Scalable Vector Graphics) HTTPhellip Le Web 20
construit des services en srsquoappuyant sur les standards du web ainsi que sur JavaScript
(hellip)
Pour se structurer en reacuteseau de bases de donneacutees et services collaboratifs le web
20 utilise donc des technologies matures acircgeacutees de 5 agrave 10 ans pour la plupart
Leacutevolution nest pas tant dans la technologie elle-mecircme que dans la faccedilon de mixer
ces technologies pour apporter des services et une ergonomie nouvelle agrave
lutilisateur
Ainsi lAjax (voir glossaire) que lon cite souvent agrave propos des technologies phares
du Web 2 nest pas un nouveau langage mais un nouveau concept qui utilise les
standards XHTML et CSS DOM (Document Object Model) pour laffichage
dynamique XML et XSLT pour leacutechange de donneacutees ainsi que la reacutecupeacuteration de
donneacutees asynchrones via XMLHttpRequest JavaScript integravegre et combine tout ces
langages Le terme Ajax a eacuteteacute apporteacute par Jesse James Garrett de lrsquoagence web
Adaptive Path
copy Digimind Digimind Services ndash White Paper |15
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LAjax permet notamment de ne recharger que certains eacuteleacutements dune page plutocirct
que la page entiegravere Lors de modifications sur une page seuls les nouveaux
eacuteleacutements se rafraicircchissent eacuteconomisant ainsi des ressources du temps et de la
bande passante Lun des preacutecurseurs grand public dans lutilisation de cette
technologie fut A9 le moteur de recherche dAmazon il neacutetait pas neacutecessaire de
recharger la page agrave chaque fois que lon ajoutait de nouvelles sources et moteurs agrave
interroger 15
Greasemonkey est eacutegalement baseacute sur des scripts Cette extension pour le
navigateur Mozilla Firefox va encore plus loin dans le pouvoir accordeacute agrave linternaute
en exeacutecutant des scripts ce plug-in 16 permet de modifier lapparence des pages
web visiteacutees dy ajouter des fonctions (boutons case agrave cocher suppression des
publiciteacutes) Lutilisateur avanceacute peut mecircme eacutecrire ses propres scripts ou
teacuteleacutecharger des scripts mis agrave la disposition de tous
Le Web 2 est en fait une sorte de web lego qui permet dinnover via lassemblage
de briques les technologies de base sont multiples il est possible de creacuteer de
nouvelles applications agrave valeur ajouteacutee en les assemblant diffeacuteremment ou plus
rationnellement
Les mash-up un mixage de plusieurs applications (voir glossaire) en est une des
illustrations les plus visibles avec les mashups on agreacutege le contenu eacutemanant de
plusieurs sites afin de creacuteer un site nouveau On utilise alors souvent lobjet XML
lAJAX du cocircteacute de linternaute les RSS et les API (Web Services) des sites mixeacutes
LAPI nest donc pas seulement un dieu eacutegyptien Pour faire simple on peut dire
que cest une interface de programmation mise agrave disposition des internautes
(avertis) pour deacutevelopper des applications Une application pourra alors acceacuteder agrave
des programmes systegraveme pour envoyer recevoir ou extraire des donneacutees Ainsi
Google publie lAPI de Google Maps qui est utiliseacute par de nombreux deacuteveloppeurs
pour creacuteer des applications deacuteriveacutees du service de cartographie de Google par
exemple la carte de suivi du teacutelescope spatial Hubble la meacuteteacuteo dans le monde 17
Le rocircle du RSS (voir glossaire) est par ailleurs preacutepondeacuterant Ce format qui
permet dexporter et lire des donneacutees dactualiteacutes au format XML se retrouve dans
quasiment toutes les applications dites Web 2 et peut en constituer lemblegraveme sinon
la caracteacuteristique majeure avec les tags Il permet de surveiller les flux de nouvelles
informations issues de sites dactualiteacutes de blogs de moteurs de recherchehellipbref
de tout site web qui propose un contenu qui se renouvelle Le RSS va aussi servir agrave
exporter des bookmarks sociaux que sont les tags ou les favoris par exemple
copy Digimind Digimind Services ndash White Paper |16
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Si le Web 2 nest pas une reacutevolution technologique en soit la relative simpliciteacute de
mise en place de ces techniques et leurs coucircts de programmation reacuteduits expliquent
le tregraves fort deacuteveloppement que connaissent toutes ces applications Par ailleurs la
baisse constante du coucirct dheacutebergement et de bande passante a faciliteacute la diffusion
de ce web nouvelle geacuteneacuteration
Mais il subsiste des effets de seuil Des applications gigantesques comme Flickr de
Yahoo offrant lheacutebergement et le partage de photos impliquent la gestion de
vastes bases de donneacutees et des infrastructures de stockage importantes Seules de
grandes firmes comme Yahoo Inc Google Microsoft ou AOL par exemple peuvent
se deacutepartir efficacement de ce type de contraintes
copy Digimind Digimind Services ndash White Paper |17
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les familles dapplications du Web 20
TYPOLOGIE
Les familles drsquoapplications Web 20 sont nombreuses et diverses de nouveaux
services apparaissent quotidiennement (sans garantie de peacuterenniteacutehellipet bien souvent
de faccedilon redondante) Sans preacutetendre dresser une liste exhaustive des nombreuses
possibiliteacutes on peut deacutegager une typologie des applications selon diffeacuterents
domaines drsquoactiviteacute Les applications speacutecifiquement deacutedieacutees agrave la veille et agrave la
recherche dinformation seront deacuteveloppeacutees dans la partie suivante
Bureautique en ligne
Courant 2006 Google a lanceacute successivement plusieurs logiciels collaboratifs en
ligne un outil de gestion drsquoagendas (Google Calendar 18) un tableur (Google
Spreadsheet) et enfin apregraves le rachat de la socieacuteteacute Writely un traitement de texte
(Google Docs) 19 Ces logiciels permettent de creacuteer modifier partager et publier en
ligne des documents sur un espace de stockage Depuis plusieurs mois on assiste agrave
une veacuteritable deacuteferlante de logiciels de bureautique en ligne deacutesigneacutes parfois sous le
terme de web office RallyPoint AjaxWrite (pour Firefox uniquement) ZohoWriter
ThinkfreehellipOutre la gratuiteacute lrsquointeacuterecirct de ces logiciels concurrents de la suite
Microsoft Office est leur disponibiliteacute sur toute machine connecteacutee au reacuteseau et tout
systegraveme drsquoexploitation Attention toutefois aux questions de sauvegarde de
compatibiliteacute de synchronisation des donneacutees et enfin de confidentialiteacutehellip
Emploi
Les blogs constituent un bon moyen pour promouvoir son CV mettre en avant
expeacuterience et compeacutetences et faciliter les eacutechanges Des jobblogs verticaux
speacutecialiseacutes par secteur ou reacutegion connaissent un grand succegraves (voir par exemple
ceux du site et moteur Moovement20) Le networking professionnel est eacutegalement agrave
la mode agrave travers des sites comme Linkedin (creacuteeacute en 2003 aux Etats-Unis) Viadeo
(ex Viaduc drsquoorigine franccedilaise) ou Xing (ex OpenBC agrave vocation europeacuteenne) Le
principe est de tirer parti des reacuteseaux de connexions sociales virtuelles afin
copy Digimind Digimind Services ndash White Paper |18
Le Web 20 pour la veille et recherche dinformation DIGIMIND
drsquoidentifier des salarieacutes ou employeurs potentiels mais aussi drsquoeacutetoffer son reacuteseau de
clients partenaires fournisseurshellip
Lrsquoe-cooptation (Cooptin Jobmeeters 21) met le reacuteseau au cœur de la deacutemarche de
recrutement via un systegraveme de prime de cooptation et peut aider les demandeurs
agrave identifier les offres du marcheacute cacheacute
Commerce en ligne
Le client est roi et le Web 20 permet de rehausser son niveau de participation sur
les sites marchands On peut ainsi tagger ou annoter des reacutefeacuterences drsquoouvrages dans
le catalogue Amazon Gracircce agrave des sites comme Zlio ou la Shoposphegravere de Yahoo22
les internautes peuvent recommander agrave leur entourage des produits et
serviceshellipen touchant une commission sur les ventes reacutealiseacutees Des guides drsquoachat
et comparateurs de prix comme Ciao integravegrent les avis de consommateurs et
drsquoexperts Le site Wantuno (inspireacute de lrsquoameacutericain Woot) innove dans le domaine
de la vente eacuteveacutenementielle en vendant un seul produit nouveau high tech par jour
annonceacute en podcast videacuteo agrave des internautes preacutevenus par flux RSS23 Certains
analystes voient lrsquoavenir du commerce eacutelectronique dans le concept de CtoB
(Consumer to Business) inverse du BtoChellip
Geacuteolocalisation
Google Maps a eacuteteacute lrsquoun des premiers services de geacuteolocalisation en srsquoappuyant sur
lrsquooutil de recherche pour localiser sur des cartes des services de proximiteacute
(commerces station servicehellip) La version 2 du site Geacuteoportail de lrsquoIGN disponible
depuis fin mai 2007 srsquoenrichit de nouveaux services pratiques et citoyens (accegraves au
cadastre visualisation des zones agrave risquehellip) Google Earth fait lrsquoobjet de partenariats
avec la NASA ou le programme des Nations Unies pour lrsquoenvironnement La
geacuteolocalisation peut srsquoadapter eacutegalement au partage de photos (Yahoo Maps et
Flickr ou le projet Pikeo chez Orange)24
Recherche drsquoinformations
Des agreacutegateurs de meacutedia comme Digg ou Wikio laissent une large place agrave
lrsquointernaute pour tagger ou recommander par vote les articles issus de meacutedias
classiques ou blogs On suivra eacutegalement lrsquoactualiteacute en syndiquant des flux RSS agrave
travers des agreacutegateurs comme Netvibes ou Newsgator Les grands moteurs (Google
Custom Search Yahoo Search Builder MSN Live search Macros) offrent des options de
copy Digimind Digimind Services ndash White Paper |19
Le Web 20 pour la veille et recherche dinformation DIGIMIND
creacuteation de moteurs personnalisables effectuant des recherches sur des bouquets
de sources preacuteseacutelectionneacutees par lrsquoutilisateur On peut mutualiser les connaissances agrave
travers des wikis collaboratifs geacuteneacuteralistes (Wikipedia) ou speacutecialiseacutes Enfin le projet
de moteur collaboratif Wikiasari qui doit aboutir courant 2007 aura recours aux
mecircmes technologies libres que la ceacutelegravebre encyclopeacutedie ainsi qursquoagrave un reacuteseau humain
ou communauteacute de confiance qui validera les reacutesultats de la recherche
Les actualiteacutes sur Wikio sites de presse blogs et navigation par tags (agrave droite)
Diffusion drsquoactualiteacutes
Pour Pierre Chappaz fondateur du site Wikio les blogueurs ne sont pas journalistes
mais ils peuvent apporter une vraie expertise sur certains sujets quils connaissent et il
serait dommage de sen priver Selon lui les meacutedias 20 ne seront plus des canaux
exclusifs de diffusion mais producteurs de contenu et des marques Deacutesormais le
scoop nrsquoest plus lrsquoapanage des seuls journalistes aux Etats-Unis une jurisprudence
donne droit depuis 2006 aux blogueurs de proteacuteger leurs sources au mecircme titre
que les journalistes professionnels Des centaines de blogs politiques ont fleuri sur le
web certains drsquoentre eux se reacuteveacutelant particuliegraverement influents On parlera de
journalisme citoyen agrave propos de sites comme Agoravox ou de lrsquo alleacutee
numeacuterique Rue 89 lanceacutee en mai 2007 par drsquoanciens journalistes du quotidien
Libeacuteration Ces nouveaux meacutedias en ligne marient les communications venant de
journalistes professionnels experts et internautes
copy Digimind Digimind Services ndash White Paper |20
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Loisirs
On retrouve ici la notion de filtrage collaboratif baseacute sur un systegraveme de
recommandations et drsquoeacutevaluations par les utilisateurs Ces recommandations
peuvent concerner les livres les destinations de voyage la musique la videacuteohellipet
proviennent de lrsquoanalyse de comportements drsquoachats des internautes et de leurs
eacutevaluations de produits Le moteur drsquoanalyse preacutedictive Criteo 25 a ainsi lanceacute en
feacutevrier 2007 un service de recommandations automatique de blogs apregraves avoir
utiliseacute sa technologie pour lrsquoeacutevaluation de videacuteos
La participation des internautes peut aller jusqursquoau financement et agrave la production
drsquoœuvres artistiques le projet A swarm of angels permet drsquoaider agrave la creacuteation de
films qui seront distribueacutes sous licence creative commons et diffuseacutes via les reacuteseaux
peer-to-peer
Partage de documents multimeacutedia
Il srsquoagit sans doute drsquoune des applications les plus reacutepandues du Web 20 Les grands
acteurs du web ont largement investi ce domaine Google a racheteacute en 2006 le site
de partage de videacuteo Youtube Yahoo de son cocircteacute avait racheteacute le site de partage de
photos Flickr Les favoris peuvent eacutegalement ecirctre mutualiseacutes via des services en
ligne comme Delicious (groupe Yahoo) ou Blogmarks De nombreux services de
partages de photos videacuteo ou podcasts se sont deacuteveloppeacutes reacutecemment on peut
citer parmi eux les sites franccedilais DailyMotion ou la banque drsquoimages Fotolia Podemus
ou Radioblog figurent parmi les sites communautaires de podcasts
Enseignement et recherche
Henry Jenkins26 professeur au MIT imagine des uniteacutes drsquoenseignement conccedilues
sur les modegraveles YouTube ou Wikipedia des deacutepartements qui ldquopermettraient le
deacuteploiement rapide drsquoexpertises disperseacutees et la reconfiguration des champsrdquo De
nouveaux usages apparaissent dans le paysage eacuteducatif mais attention lagrave encore agrave
lrsquoillusion de faciliteacute selon le philosophe Fernando Savater laquo Internet neacuteduque pas il
neacutecessite mecircme une eacuteducation preacutealable raquo Olivier Ertzcheid dans son blog Affordance 27 distingue plusieurs eacuteleacutements caracteacuteristiques drsquoune science 20 et notamment
la possibiliteacute drsquoannoter et commenter des publications scientifiques (notamment les
collections Open Acess Plos One28) ou de nouveaux modes drsquointerrogation des
bases de donneacutees (interface Hubmed sur la base meacutedicale Medline)
copy Digimind Digimind Services ndash White Paper |21
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Marie France Blanquet29 maicirctre de confeacuterence en sciences de lrsquoinformation
distingue le travail coopeacuteratif du travail collaboratif En matiegravere drsquoapprentissage le
travail coopeacuteratif reacutealiseacute par chaque eacutequipe contribue agrave une œuvre collective ougrave le
rocircle de chacun est deacutefini de faccedilon claire Lrsquoapprentissage collaboratif reacutesulte du
travail individuel soutenu par des activiteacutes de groupe ou drsquoeacutequipes de faccedilon souple
et ouverte Ce type de travail se base sur les capaciteacutes de communication et
drsquointeraction de chacun Lrsquoeacutecriture collective des articles composant lrsquoencyclopeacutedie
Wikipeacutedia en est un exemple
Plusieurs expeacuterimentations drsquousage des blogs et podcasts ont eacuteteacute tenteacutees agrave
lrsquoUniversiteacute A Lyon II des eacutetudiants ont pu enregistrer des cours sur un Ipod pour
diffusion en podcast sur leurs blogs A lrsquoUniversiteacute Catholique de Lille les eacutetudiants
de Jean-Paul Pinte30 chargeacute de lrsquoinnovation peacutedagogique doivent alimenter
reacuteguliegraverement un blog Pour ce chercheur speacutecialiste de la veille en eacuteducation le
renouveau des meacutethodes drsquoenseignement se traduit par le rocircles des Enseignants
Connecteurs et eacutetudiants proneacutetaires
Bibliothegraveques
La bibliothegraveque 20 place elle aussi lrsquoutilisateur au centre et ce agrave travers plusieurs
types drsquoexpeacuterimentations de lrsquoutilisation des logiciels de messagerie instantaneacutee
pour eacutechanger avec les utilisateurs agrave lrsquointeacutegration de tags pour enrichir les
catalogues en passant par des interfaces de consultation simplifieacuteeshellip De
nombreux blogs de bibliotheacutecaires (Bibliobsession 31) permettent de suivre lrsquoeacutetat de
lrsquoart La bibliothegraveque de lrsquoUniversiteacute drsquoAlbany est alleacutee jusqursquoagrave publier un manifeste
du bibliotheacutecaire 20 32
copy Digimind Digimind Services ndash White Paper |22
Le Web 20 pour la veille et recherche dinformation DIGIMIND
COMMENT IDENTIFIER UN SITE WEB 20
Est-ce que le site sur lequel vous naviguez ou lapplication que vous utilisez est
Web 20 Quelle importance pourrait-on reacutepondrehellipToutefois un site de cette
geacuteneacuteration offrira plus de possibiliteacutes agrave vous lutilisateur Pour reconnaicirctre un tel
site quelques caracteacuteristiques sont agrave retenir
- le type de site il appartiendra agrave lune des grandes familles citeacutees plus haut il sera
blog bookmark ou reacuteseau social mashup ou page personnalisable bref il permet
de partager et de diffuser du contenu aiseacutement Le site peut ecirctre lui-mecircme une
application Web 2 ou en inteacutegrer des briques Exemple un site Corporate qui
heacuteberge des blogs de ses salarieacutes etou diffuse son actualiteacute via un fils RSS
- le rocircle de lutilisateur le site Web 2 vous permet de participer de personnaliser
et de collaborer vous pouvez en effet ajouter des commentaires eacutecrire un billet
lire un flux RSS noter (voter) ou annoter un article teacuteleacutecharger ou uploader des
images des videacuteos eacutecouter un podcast Ces sites proposent souvent des interfaces
personnalisables couleurs style organisation de laffichage du contenuhellip
- la navigation elle est plutocirct simplifieacutee par rapport aux sites de premiegravere
geacuteneacuteration Les menus sont plus leacutegers un flux RSS est toujours proposeacute et un
nuage de tags est souvent preacutesent
- le testeur cest vous non content de faire apporter une partie de son contenu par
linternaute un service Web 20 fait en plus souvent tester ses applications agrave ses
utilisateurs et est donc freacutequemment en version becircta (voire alpha) une becircta
publique ou priveacutee (linternaute fait alors partie dun petit cercle dinitieacutes dans le
secret des dieux)
copy Digimind Digimind Services ndash White Paper |23
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les applications Web 20
pour la veille et la
recherche dinformations
LES TYPES DAPPLICATIONS
Pour le veilleur et le chercheur dinformation les applications du Web 20 sont
riches tant dans les possibiliteacutes offertes par leurs interfaces que dans le contenu
diffuseacute Mieux connaicirctre ces services permettra de trouver davantage dinformation
(ou autrement) de gagner du temps de mieux partager voire decirctre plus visible sur
le web
Vous laurez compris le web 20 se fonde essentiellement sur la notion de partage
de participation et de collaboration entre les individus Ce nest pas forceacutement
toujours facile possible voire autoriseacute dans le monde professionnel Mais partager
cest aussi agrave terme pouvoir recevoirhellip
I Partager et collaborer
a Les Bookmarks sociaux
Les bookmarks sociaux sont une des applications les plus caracteacuteristiques du Web 2
et en sont preacutecurseurs Apparus en 2004 ces services vous offrent la possibiliteacute de
partager vos bookmarks cest-agrave-dire vos favoris Ainsi apregraves enregistrement le plus
souvent gratuit vous pouvez mettre en ligne tout ou partie de vos favoris (titre
copy Digimind Digimind Services ndash White Paper |24
Le Web 20 pour la veille et recherche dinformation DIGIMIND
adresse et description dune page ou site) et les rendre potentiellement accessibles
aux internautes du monde entier et du moins aux utilisateurs de ce service Vous
avez la possibiliteacute de garder ces favoris priveacutes en ne les partageant quavec vos
proches ou seulementhellipvous-mecircme
Ces applications sont au deacutepart tregraves simples et proposent ensuite suivant les sites
plus ou moins de perfectionnements il suffit dajouter le nom et ladresse (url) de la
page web qui vous inteacuteresse assortis des commentaires de votre choix Ces
adresses web sont rattacheacutees agrave un espace qui vous est personnel auquel vous
acceacutedez en vous identifiant Cet espace personnel est identifiable via une adresse
preacutecise Par exemple sur Delicious33 (de Yahoo) lun des services de bookmarks
sociaux les plus utiliseacutes lurl deacutesignant mes favoris est httpdeliciousslide68 En
naviguant sur Delicious vous pouvez acceacuteder aux favoris mis en ligne par des
collaborateurs amis ou inconnus qui partagent les mecircmes inteacuterecircts et passions que
vous Leurs pages sont eacutegalement identifieacutees par une url unique
Lajout dadresse
Lajout dadresse seffectue en se connectant directement sur le site de
bookmarking social ou plus pratique via une barre ou un bouton deacutedieacutes qui
inteacutegreacutes agrave votre navigateur facilitent lajout du site que vous ecirctes en train de visiter
Vous pouvez eacutegalement trouver des icocircnes sur des pages web vous proposant
dajouter un contenu un site agrave votre service de social bookmaking Peut-ecirctre avez-
vous deacutejagrave rencontreacute ces icocircnes agrave la fin dun billet de blog par exemple (voir
illustration ci-dessous) Ils permettent alors dajouter ladresse du billet agrave un ou
plusieurs services de bookmarks sociaux ainsi quagrave des services dactualiteacutes
collaboratives (nous en reparlerons plus bas)
copy Digimind Digimind Services ndash White Paper |25
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ce blog propose via des icocircnes lajout de ce billet dans les favoris de Delicious ou les services sociaux dactualiteacutes
Lorsque vous ajoutez une adresse vous lui attribuez des tags (voir glossaire) cest-agrave-
dire un ou plusieurs mots cleacutes de votre choix qui vont caracteacuteriser expliquer
contextualiser eacutetiqueter le favori et donc lidentifier de maniegravere simple pour vous et
tous les visiteurs Cest une information qui vient sajouter agrave la traditionnelle
description du site Cest donc vous qui choisissez votre propre mode de
classement de hieacuterarchisation et de labellisation (et non plus un service qui vous
propose de ranger vos ressources dans des cateacutegories preacutedeacutefinies) Cette possibiliteacute
fait partie de ce que lon appelle la folksonomie agrave savoir une taxonomie (science du
classement) populaire en quelque sorte
Ainsi vous pouvez ajouter ladresse du site portail NanotechNow
httpwwwnanotech-nowcom consacreacute aux nanotechnologies et y adjoindre les
tags nano nanotehnologies sciences science research mais aussi pourquoi
pas qualiteacute excellent pour donner votre opinion
copy Digimind Digimind Services ndash White Paper |26
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Des favoris consacreacutes agrave la Chine dans Delicious A droite les tags associeacutes agrave ces bookmarks Les tags
Sur une application typique de social bookmarking (type delicious) il est possible
de rechercher sur le titre des favoris de tous les autres utilisateurs et aussi sur
leurs tags Ainsi en cliquant sur le tag Nanotech vous obtiendrez la liste de tous
les favoris que les internautes ont classeacutes sous ce label Cest lagrave lun des principaux
inteacuterecircts la possibiliteacute de rechercher sur le nom des eacutetiquettes textuelles deacutefinies
par les internautes eux-mecircmes Mais tous les internautes nont pas la mecircme logique
de classement et il est fort possible de passer agrave coteacute de favoris inteacuteressants mais
eacutetiqueteacutes selon un mot auquel vous nauriez jamais penseacute De plus un mecircme mot
peut avoir plusieurs sens ou ecirctre employeacute diffeacuteremment selon les individus
Delicious a reacutesolu ndashpartiellement- ce problegraveme en offrant la possibiliteacute de deacutecrire
ses tags cest agrave dire de les expliquer (par orange je parle de la couleur ou de la
production dagrumes en Floride) Cest donc un deacutebut de seacutemantique appliqueacute agrave
cette folksonomie Quoiquil en soit le problegraveme du sens des mots employeacutes par
les creacuteateurs de contenu concerne lensemble du web Lorsque vous ne trouvez
pas un site via une requecircte sur un outil de recherche et que ce site existe pourtant
bel et bien cest souvent parce que vous nemployez pas les mecircmes mots cleacutes que
ceux utiliseacutes par le creacuteateur du site dans son texte
Les tags peuvent eacutegalement sappliquer agrave des photos (Flickr) agrave des projets
(43Things) ou des videacuteos (YouTube DailyMotion) Ils peuvent servir aussi agrave eacutetiqueter
et cateacutegoriser les billets dun blog
copy Digimind Digimind Services ndash White Paper |27
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les communauteacutes
Lautre atout des bookmarks sociaux pouvoir constituer et se connecter avec
une communauteacute de speacutecialistes Par speacutecialiste on deacutesignera simplement un
internaute qui centre ses recherches sur les mecircmes sujets que vous quil soit
amateur ou professionnel
Exemple Votre domaine ce sont les biotechnologies En entrant la requecircte
Biotechnologies sur le moteur de recherche de Delicious vous obtenez une liste
de plusieurs milliers de favoris Pour chacun dentre eux est indiqueacute le nombre de
personnes qui ont sauvegardeacute cette mecircme adresse En seacutelectionnant lun de ces
utilisateurs vous pouvez deacutecouvrir un internaute qui comme vous reacuteguliegraverement
ajoute des adresses de sites deacutedieacutes ou connexes aux biotech Il ne vous reste plus
quagrave mettre en surveillance ce membre de delicious Il disposera en effet de sa
propre adresse XML Exemple httpdeliciousrssvantive98 Vous serez alors
averti degraves lors que cet utilisateur ajoute un favori agrave sa page
La valeur des outils de social bookmarking est encore plus probante lorsquils sont
deacutedieacutes agrave des communauteacutes de pratiques ou agrave des secteurs dactiviteacutes bien preacutecis
Plusieurs initiatives ont deacutejagrave eacuteteacute mises en ligne34 On peut citer Connotea eacutediteacute par
la ceacutelegravebre revue Nature et donc destineacute agrave un public scientifique Lors de la mise en
favoris ce service extrait automatiquement les reacutefeacuterences bibliographiques
lorsquelles sont issues de sites tels que Nature Science ou PubMed Plus ancien
CiteUlike est baseacute sur le mecircme principe mais est compatible avec davantage de
revues scientifiques encore Snipitron est lui deacutedieacute aux chercheurs eacutetudiants et
professionnels Ici vos bookmarks font partie dun projet qui seacutecoule dans le temps
concernant une recherche ou une tacircche preacutecise
Linteacuterecirct des bookmarks sociaux est donc dabord dans lutilisation de la
communauteacute afin de trouver des sources pertinentes Ce type doutil reacutevegravele toute
sa puissance lorsquun utilisateur proche de vous en terme de domaines de veille a
eacuteteacute identifieacute Vous pouvez donc alors lutiliser comme collaborateur virtuel mais
aussi rechercher parmi les sources jugeacutees pertinentes par un groupe dutilisateurs
identifier des leaders de veille ou juger de la populariteacute dune source (combien de
fois a-t-elle eacuteteacute mise en favoris Ce nombre de sauvegardes neacutetant quun indicateur
parmi dautres) Si vous ne partagez pas ces outils restent toutefois un tregraves bon
moyen de meacutemoriser et cateacutegoriser vos favoris en un point unique daccegraves
copy Digimind Digimind Services ndash White Paper |28
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Quel service
Il existe plusieurs dizaines de services de bookmarks sociaux Ils proposent des
fonctionnaliteacutes plus ou moins sophistiqueacutees Un des critegraveres essentiels de choix est
leur succegraves En effet leur force repose en grande partie sur le nombre de favoris
dutilisateurs partageacutes agrave moins de freacutequenter des bookmarks deacutedieacutes agrave des
communauteacutes tregraves cibleacutees Dautre part la rapiditeacute du service et la pertinence de
son moteur de recherche sont aussi des paramegravetres importants
Delicious qui appartient agrave Yahoo est lun des plus connus et des plus utiliseacutes Yahoo
MyWeb2 rassemble eacutegalement une grande communauteacute ainsi que Furl ou encore
Blogmarks et Blinklist35 Certains de ces sites au-delagrave de larchivage de ladresse
proposent de conserver une copie inteacutegrale dune page web Dautres vous
suggegraverent des sites similaires agrave ceux que vous avez mis dans vos favoris Cette
similariteacute se base notamment sur les favoris ajouteacutes par les autres utilisateurs La
recherche par similariteacute (ou par suggestion en fonction de vos habitudes de
navigation) offerte par des services comme Yoono StumbleUpon ou Similicious 36 est
une meacutethodologie de recherche particuliegraverement inteacuteressante Nous en reparlerons
plus loin
Pour choisir preacuteciseacutement votre service de bookmarks sociaux vous pouvez vous
aider de ces ressources 37
- le site Irox propose un tableau comparatif de pregraves de 20 services
- le blog de Robin Good offre une seacutelection inteacuteressante de bookmarks sociaux
- la page Free Bookmark Managers affiche une liste dune quarantaine de logiciels et
utilitaires deacutedieacutes au partage et agrave la gestion de vos favoris (bookmarks) en ligne via
accegraves distant en local ou sur serveur Attention tous ne sont pas sociaux cest-agrave-
dire baseacutes sur le partage
copy Digimind Digimind Services ndash White Paper |29
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b Le Multimeacutedia photos et videacuteos
Le partage de vos ressources ne se limite pas au texte et adresse de sites Il est
eacutegalement possible de partager vos photos et videacuteos
Les images
Flickr 38 racheteacute par Yahoo Inc en 2005 est lapplication type de partage dimages
voire mecircme larcheacutetype du service Web 20 ce site permet de mettre en ligne ses
photos de les partager avec ses proches ses collegravegues ou de les laisser en accegraves
priveacute
Il est possible dutiliser un moteur pour rechercher agrave travers les millions de photos
mises en ligne par les autres utilisateurs
Flickr na pas de points communs avec les nombreuses applications Web 2 en becircta agrave
linterface artisanale Sur le service de Yahoo la puissante interface en fait un outil
tregraves simple agrave utiliser Ainsi via le menu Organize vous pouvez acceacuteder agrave une
veacuteritable table de montage virtuelle pour organiser vos photos
copy Digimind Digimind Services ndash White Paper |30
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche sur Flickr A droite les noms dutilisateurs et les tags associeacutes aux photos
Comme sur les bookmarks sociaux la recherche peut seffectuer sur le titre ou la
description mais aussi sur les tags chaque internaute qui partage ses photos leur
attribue des mots cleacutes pour les deacutefinir les expliquer les contextualiser voire donner
son opinion
Chaque liste de reacutesultats chaque photo est accompagneacutee par ses tags Ceux-ci
permettent aussi daffiner ou deacutelargir votre recherche lorsque vous en seacutelectionnez
un Il est possible de rechercher sur les photos les utilisateurs mais aussi sur les
groupes En effet la notion de communauteacute est eacutegalement importante Les
groupes rassemblent les utilisateurs qui partagent les mecircmes centres dinteacuterecirct
photographiques Des forums de discussions sont inteacutegreacutes agrave ces groupes
permettant dentrer en contact direct avec certains membres
copy Digimind Digimind Services ndash White Paper |31
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Par exemple le groupe The Eyes Have It 39 rassemble les utilisateurs (et donc leurs
photos) autour du thegraveme de la communication visuelle des secteurs pharmacie et
biotech
Que peut trouver le veilleur sur un service de photos tel que Flickr
Finalement la mecircme chose que sur les bookmarks sociaux tout ce que les
membres ont voulu partager des photos du dernier salon automobile de Detroit 40
ou de la convention annuelle des industries cosmeacutetiques dAmeacuterique du Nord La
veille concurrentielle ou la veille image sur votre propre socieacuteteacute est eacutegalement
inteacuteressante Ainsi une recherche (full text) sur la socieacuteteacute peacutetroliegravere Exxon affiche
plus de 1400 photos relatives aux stations services aux puits de peacutetrole aux
raffineries aux employeacutes aux manifestions de contestataires ou aux publiciteacutes
deacutetourneacutees
Comme avec le social bookmarking vous pouvez vous attacher agrave suivre les
membres qui partagent les mecircmes centres dinteacuterecirct que vous ou votre organisation
apregraves seacutelection de la page de lutilisateur la mise en surveillance de son flux RSS
permet decirctre averti degraves que cette personne ajoute de nouvelles photos
Dautres services permettant le partage de photos existent Toutefois ils ne vont
pas aussi loin que Flickr dans la logique Web 20 Le service PhotoBucket 41 est le
grand concurrent de Flickr mais avec une approche plus grand public Flickr est
davantage freacutequenteacute par des internautes avertis des professionnels et des
passionneacutes de photographie En ce sens le service de Yahoo sera donc plus
inteacuteressant pour le veilleur
Squidoo 42 est en quelque sorte un annuaire de bookmarks perfectionneacute une
rencontre de services sociaux comme Delicious et Flickr Squidoo vous permet en
effet de creacuteer une page de liens dans un domaine qui vous passionne et de la
structurer en rubriques agreacutementeacutees de photos
Linterface simple rend possible la creacuteation rapide de pages speacutecialiseacutees (appeleacutees
lensgtobjectifs lentilles) et de les rendre visible agrave tout un chacun On trouve par
exemple plusieurs lens consacreacutees aux nanotechnologies43 Chaque lens est
accompagneacutee de tags connexes agrave son sujet
Vous pouvez rechercher ces pages gracircce agrave un moteur de recherche un reacutepertoire
par cateacutegories un nuage de tags (exemple le tag Marketing 44) ou mecircme parcourir
le Top100
copy Digimind Digimind Services ndash White Paper |32
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La videacuteo
Via les services YouTube ou DailyMotion le partage de videacuteos en ligne est plus
meacutediatiseacute que les services de photos Notamment parce que le leader Google a
racheteacute YouTube en octobre 2006 geacuteneacuterant un buzz sans preacutecegravedent au sein des
blogs et de la presse traditionnelle (Mainstream medias)
YouTube 45 et ses concurrents Web 20 fonctionnent agrave peu pregraves de maniegravere
eacutequivalente agrave Flickr sans en atteindre toutefois sa clarteacute ergonomique
Tout ces sites de videacuteos vont permettre drsquouploader (charger vers le site) et
partager vos videacuteos (converties automatiquement au format FlashVideo) et aussi
bien sucircr de rechercher parmi les videacuteos des autres utilisateurs
Sur ces applications on retrouve de nombreuses caracteacuteristiques du Web 2 les
videacuteos classeacutees par cateacutegories sont accompagneacutees de tags qui aident agrave les
contextualiser et les deacutecrire en plus du titre et de la description renseigneacutes par
lutilisateur Un fils RSS permet de surveiller lajout de videacuteos dans une cateacutegorie ou
par un utilisateur deacutefini A linstar des billets dun blog les internautes peuvent
commenter les videacuteos De plus les videacuteos sont noteacutees ce qui impacte ensuite leur
place dans le classement et donc leur visibiliteacute
Ces services contiennent des favoris inteacutegreacutes ougrave lon peut sauvegarder ses videacuteos
preacutefeacutereacutees Il est possible de partager sa videacuteo par mail ou messagerie instantaneacutee
de la poster sur son blog Dailleurs de nombreux blogueurs utilisent les services de
type YouTube (ou Flickr pour la photo) pour stocker leurs fichiers multimeacutedias trop
volumineux pour les heacutebergeurs de blogs La notion de groupe comme sur Flickr
est preacutesente des communauteacutes rassemblent des utilisateurs autour de grandes
theacutematiques lieacutees par exemple agrave la politique aux sports et aux voyages
YouTube a de nombreux concurrents aux fonctions tregraves proches Impossible de
tous les mentionner Mais on peut retenir cependant le franccedilais DailyMotion 46 tregraves
populaire dailleurs neacute quelques semaines avant YouTube Citons eacutegalement Yahoo
Videos AOL Videos Revver Grouper (de Sony) Metacafe SoapBox (de Microsoft)
Zudeo Wideo MySpace Vimeo 47Certains de ces services proposent du contenu
amateur ainsi que des films professionnels issus des networks de TV et de cineacutema
Mais les plus petits services se cantonnent aux videacuteos envoyeacutees par linternaute que
celles-ci aient dailleurs eacuteteacute copieacutees ou non
copy Digimind Digimind Services ndash White Paper |33
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche sur DailyMotion
Quel contenu agrave usage professionnel le veilleur peut espeacuterer trouver sur ces
plateformes Essentiellement des videacuteos consacreacutees agrave des socieacuteteacutes et individus
Ainsi si je reacuteitegravere ma recherche sur la socieacuteteacute peacutetroliegravere Exxon jobtiens des videacuteos
sur des manifestations des mareacutees noires le reacutechauffement climatique des
actualiteacutes boursiegraveres des retransmissions de procegraves des deacutetournements de
publiciteacutehellipLa recherche de videacuteos saverra particuliegraverement utile pour une veille
Image Produits ou concurrentielle Le contenu de videacuteos est eacutegalement souvent
tregraves politique agrave partir de la campagne des eacutelections preacutesidentielles franccedilaises de
2007 la diffusion de videacuteos sur les hommes et femmes politiques est devenue une
veacuteritable arme Autre aspect inteacuteressant la possibiliteacute de deacutecouvrir de nombreux
extraits de videacuteos de documentaires sur des sujets extrecircmement varieacutes eacutecologie
industrie socieacuteteacute consommation
Le contenu de ces services de videacuteos est donc agrave limage du net heacuteteacuterogegravene mais
potentiellement riche
copy Digimind Digimind Services ndash White Paper |34
Le Web 20 pour la veille et recherche dinformation DIGIMIND
c Partage de CV et reacuteseaux sociaux
Termineacute le temps ou seules les personnes agrave qui vous transmettiez votre CV ou
votre carte de visite pouvaient prendre connaissance de votre identiteacute et de votre
parcours professionnel Via les plateformes de reacuteseaux sociaux le push fait place au
pull de plus dans une optique de cooptation et de recommandation il y est
possible de mettre son CV en ligne sous format hypertexte et de demander agrave
rentrer en relation avec des proches de votre reacuteseau immeacutediat Les plateformes de
reacuteseaux sociaux sont nombreuses certaines sont agrave vocation geacuteneacuteraliste dautres
uniquement deacutedieacutees aux actifs dautres encore reacuteserveacutees agrave une communauteacute
(eacutetudiants lyceacuteens anciens eacutelegraveves passionneacutes de voyages)
Ces applications repreacutesentent un marcheacute conseacutequent puisque pour les seuls USA
on preacutevoit un chiffre daffaires des reacuteseaux sociaux de 25 milliards de dollars agrave
lhorizon 2011 contre 350 millions en 200648 La France est domineacutee par la
plateforme Viadeo (ex-Viaduc)49 Ce service leader lanceacute en 2004 compte plus de
750 000 profils Dans les autres pays cest LinkedIn 50 qui domine geacuteneacuteralement
avec plus de 9 millions dutilisateurs dans 135 pays
Une recherche sur Viadeo
copy Digimind Digimind Services ndash White Paper |35
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les fonctionnaliteacutes
Que trouve-t-on sur ces sites Notamment des profils de personnes en activiteacute ou
en recherche demploi ainsi que des hubs regroupant des utilisateurs autour dun
mecircme centre dinteacuterecirct toujours la notion de communauteacutes de pratiques propre au
Web 20 Sur ces services tout est penseacute pour creacuteer du lien social Le profil
individuel se constitue dun CV enrichi de nombreux liens vers ses employeurs ses
amis ses reacuteseaux professionnels et associatifs ses travaux et publications Les hubs
regroupent les personnes autour de secteurs meacutetiers associations danciens eacutelegraveves
pays reacutegions Par exemple sur Viadeo saffichent les hubs Analyse Veille
Strateacutegique amp Concurrentielle Intelligence Eco Blogs amp Bloggers Editeurs de
Logiciels Profession documentaliste and co mais aussi Grande distribution
Oceacuteanie ou Normes meacutethodes et outils Dans ces hubs des forums organisent les
discussions des membres autour de theacutematiques deacutefinies Un moteur de recherche
permet de trouver des profils selon un secteur une fonction une reacutegion Une fois
un profil identifieacute il faut demander agrave entrer en relation avec lui Cela sera dautant
plus facile et rapide sil est peu eacuteloigneacute de votre propre reacuteseau de contacts
La veille
Linteacuterecirct pour le professionnel de linformation est double il peut augmenter sa
visibiliteacute et celle de certains de ses projets services publications thegraveses ou articles
Dautre part il peut rechercher des donneacutees sur des personnes et entreprises ou
identifier un expert Comme sur dautres services Web 20 il est facile de se
constituer une communauteacute dutilisateurs partageant ses centres dinteacuterecirct que lon
visitera reacuteguliegraverement Ainsi sur Viadeo une recherche sur le secteur Agro-
alimentaire avec le mot cleacute veilleur 1 affiche plus de 50 reacutesultats avec les fonctions
entreprises et synthegraveses de parcours des membres Vous pouvez alors entrer en
relation avec ces personnes ou tout simplement collecter des donneacutees sur celles-ci
et leurs reacuteseaux Ces sites sont dailleurs devenus un outil essentiel pour certaines
fonctions commerciaux pour la prospection recruteurs journalistes
ethellipresponsables de casting pour eacutemissions TV
1 Certaines fonctionnaliteacutes avanceacutees sont payantes
copy Digimind Digimind Services ndash White Paper |36
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les autres reacuteseaux
Parmi les autres services de reacuteseaux sociaux outre LinkedIn davantage tourneacute agrave
linternational il existe assez utiliseacutes en France 6nergiesnet et Xing (ex Open BC)51
Les reacuteseaux ciblant plus particuliegraverement les jeunes (FaceBook MySpace) peuvent
eacutegalement ecirctre utiliseacutes MySpace feacutedegravere plus particuliegraverement des professions de la
communication de la publiciteacute et des meacutetiers multimeacutedias
Le reacuteseau FaceBook52 est original ce site nord-ameacutericain est preacutecurseur dun social
networking tregraves segmenteacute reacuteserveacute aux eacutetudiants et aux lyceacuteens Au deacutepart les
membres devaient sinscrire obligatoirement via lemail de leur universiteacute afin de
garantir lauthenticiteacute des profils et donc le seacuterieux de la communauteacute Depuis
FaceBook sest ouvert aussi aux entreprises Ainsi ce site capte tregraves tocirct les futurs
actifs et les fideacutelise
Des ressources
Certaines ressources peuvent vous aider agrave identifier les plateformes de reacuteseaux
sociaux professionnels utiles pour vos recherches Le wiki List of social networking
websites liste de nombreuses plateformes de reacuteseaux sociaux 53 et le site Link n
Rank cateacutegorise des sites de social networking 54
copy Digimind Digimind Services ndash White Paper |37
Le Web 20 pour la veille et recherche dinformation DIGIMIND
d Les sites dactualiteacutes collaboratives recommandation et notation
Ces sites recouvrent en fait diffeacuterents types dapplications
- Les Digg Like Ces services qui sinspirent tous du preacutecurseur Digg55 recueillent des actualiteacutes
proposeacutees par les internautes Le principe apregraves enregistrement un formulaire
simple vous permet de poster lactualiteacute de votre choix susceptible dinteacuteresser les
autres internautes son titre son url sa description Il faut aussi choisir une
cateacutegorie Par exemple Technologies Sciences Monde Affaires Divertissement Ces
cateacutegories peuvent ecirctre subdiviseacutees en theacutematiques plus fines Lactualiteacute si elle est
valideacutee par les modeacuterateurs apparaicirctra alors en ligne Elle sera noteacutee par les autres
internautes qui votent pour elle selon son inteacuterecirct Les actualiteacutes disposant du plus
grand nombre de points se placent alors en haut du classement
La cateacutegorie Sciences sur Digg A gauche les nombres de votes
Ces sites affichent les principales caracteacuteristiques du Web 20 interface eacutepureacutee
possibiliteacute de laisser des commentaires fils RSS pour surveiller les nouvelles
actualiteacutes classement des articles les plus lus les mieux noteacutes possibiliteacute denvoyer
par mail ou de bloguer un article et bien sucircr forte contribution de linternaute Sur
certains sites leacutetiquetage des articles via le systegraveme de tags est proposeacute
copy Digimind Digimind Services ndash White Paper |38
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Linteacuterecirct est de pouvoir positionner certaines informations les unes par rapport aux
autres et connaicirctre la populariteacute dune actualiteacute ou dun sujet (entreprise personne)
abordeacute (la critique de mon produit est-elle tregraves populaire ) Cest une approche
alternative aux agreacutegateurs de news de type Google Actualiteacutes ou Yahoo Actualiteacutes
qui hieacuterarchisent les news avec de puissants algorithmes mais sans recourir agrave
lhumain Ainsi Google Actualiteacutes preacutecise La seacutelection et le positionnement des
articles de cette page ont eacuteteacute reacutealiseacutes automatiquement par un programme
informatique
En outre sur ces services de type Digg linformation nest pas brute linternaute
qui poste lactualiteacute peut selon son expertise y apporter un commentaire de
valeur Linformation peut ecirctre commenteacutee (en plus du vote) par les autres
internautes Comme de nombreux blogueurs les utilisateurs des Digg Like jouent
aux journalistes ou tout simplement donnent leur opinion
Lorsquil sagit dactualiteacutes concernant le produit ou le service dune socieacuteteacute ces
commentaires positifs ou non sont une veacuteritable manne pour de nombreux
professionnels de linformation veilleurs marketeurs chargeacutes deacutetudes et autres
analystes qui vont pouvoir recueillir agrave moindre frais des informations sur leur
nouveau produit leurs clients ou ceux de la concurrence
Digg est lun des sites les plus copieacutes du Web 20 Sil reste la reacutefeacuterence dautres
applications tregraves largement inspireacutees tirent leur eacutepingle du jeu En France Scoopeo
Fuzz et TapeMoi offrent eux aussi des services dactualiteacutes collaboratives On peut
eacutegalement citer Rojo le canadien Niouz lespagnol Meneames le reacuteseau de sites
BlogMemes 56 Mecircme Netscape pionnier du navigateur web a lanceacute un portail
sinspirant du systegraveme de notation de Digg
On peut reprocher agrave ce type de site de favoriser les cateacutegories techniques et
scientifiques faisant la part belle aux contributions des geeks et autres accrocs du
net grands utilisateurs de services Web 2 Toutefois les sites comme Blogmemes ou
Netscape diffusent davantage dactualiteacutes agrave teneur eacuteconomique et sociale
- Les mix actualiteacutes contributions des internautes
Wikio57 est un service dorigine franccedilaise (creacuteeacute par le fondateur de Kelkoo) agrave
lintersection de Google Actualiteacutes et de Digg En effet Wikio mixe les articles issus
de sites dactualiteacutes de blogs avec des contributions des internautes On peut
prendre connaissance des informations de diffeacuterentes maniegraveres
copy Digimind Digimind Services ndash White Paper |39
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- En naviguant via les theacutematiques (France International Politique Economie
Finance Santeacute Science hellip) ou via le nuage de tags dynamiques qui se modifient en
fonction de la rubrique ou vous vous situez
- En recherchant via le moteur
- En sabonnant aux flux RSS agrave chaque cateacutegorie et agrave chaque tag correspond son
flux RSS De mecircme lorsque vous lancez une requecircte via le moteur vous pourrez
surveiller ces reacutesultats via un flux RSS
- les plateformes de contributeurs indeacutependants
La deacutefiance et la volonteacute dindeacutependance vis-agrave-vis des grands meacutedias traditionnels de
la presse eacutecrite et audio-visuelle se sont traduites degraves 2001 par la creacuteation massive
de blogs Les blogueurs sont-ils et peuvent-ils simproviser journalistes Ce deacutebat
qui promet decirctre sans fin est inteacuteressant De nombreux blogueurs (mais pas la
majoriteacute) sont devenus de veacuteritables experts dans leur domaine agrave force deacutecriture
de lecture et danalyses quotidiennes Ainsi les mainstream medias invitent
maintenant dans leurs colonnes et plateaux les blogueurs les plus talentueux
Ces blogueurs experts ou professionnels ne constituent pas les seuls creacuteateurs
dactualiteacutes alternatives
Des initiatives de plateformes dactualiteacutes eacutecrites par des non professionnels ont
aussi vu le jour Agoravox58 est lun des premiers portails de journalisme citoyen
lanceacute par Joeumll de Rosnay et Carlo Revelli 59 en mai 2005 Agoravox permet aux
internautes de proposer leurs articles pour commenter reacutefleacutechir agrave des sujets
dactualiteacutes si possible avec une approche et un regard diffeacuterents des meacutedias
traditionnels Le format des contributions est multimeacutedia Le site explique Tout le
monde peut devenir reacutedacteur drsquoAgoraVox Il nrsquoest pas neacutecessaire de savoir eacutecrire avec
un style journalistique affirmeacute Chacun drsquoentre nous peut devenir une sorte de capteur
en temps reacuteel de ce qui se passe dans notre entourage en fournissant des articles des
images des extraits videacuteo ou audio Ce qui est important crsquoest de pouvoir teacutemoigner
drsquoun eacuteveacutenement auquel vous avez assisteacute ou que vous avez deacutecouvert en faisant des
recherches Il poursuit Pourquoi devenir reacutedacteur Tout simplement pour faire
entendre votre voix et pour relater des faits que vous avez identifieacutes et qui ne vous
paraissent pas ecirctre suffisamment repris dans les meacutedias traditionnels voire ignoreacutes ou
censureacutes
Agoravox encourage donc agrave utiliser son style personnel Il convient de sinscrire pour
devenir reacutedacteur Les articles doivent toutefois obeacuteir agrave une politique eacuteditoriale60
Un comiteacute de reacutedaction valide ensuite les contributions
copy Digimind Digimind Services ndash White Paper |40
Le Web 20 pour la veille et recherche dinformation DIGIMIND
En quelques mois Agoravox a prouveacute que de simples internautes pouvaient ecirctre
aussi bon reacutedacteurs et experts en fonction de leurs profession passion et
centres dinteacuterecirct agrave linstar des blogueurs professionnels
Agoravox na pas la vocation dun agreacutegateur dactualiteacutes de type Digg Wikio ou
Google News Cest une sorte de quotidien qui privileacutegie les articles de fond et
lanalyse Bien sucircr des reacutedacteurs stars eacutecrivent reacuteguliegraverement et leurs articles
sont attendus Mais ce ne sont pas les rubriqueurs traditionnels des autres meacutedias
Comme sur les autres sites Web 20 le lecteur peut attribuer une note dinteacuterecirct agrave
chaque article et poster un commentaire Enfin leacutetonnante technologie
ReadSpeaker 61 permet de retranscrire automatiquement tous les textes en version
audio
Agoravox nest pas le seul exemple de site de journalisme citoyen Le portail
OhMyNews 62 initiative coreacuteenne est baseacute sur le mecircme principe Lanceacute en feacutevrier
2000 le reacuteseau international OhMyNews reacuteunit plus de 40 000 reacutedacteurs
Pour le veilleur ces sites dactualiteacutes collaboratives constituent des sources
dinformations alternatives avec une partie de lactualiteacute issue des organes et
agences de presse et lautre partie provenant des internautes Dautre part ces
nouveaux meacutedias permettent de deacutecouvrir et surveiller des experts voire des
leaders dopinion
Un article sur Agoravox A droite une preacutesentation de son auteur En haut la possibiliteacute de voter et
commenter larticle
copy Digimind Digimind Services ndash White Paper |41
Le Web 20 pour la veille et recherche dinformation DIGIMIND
II Rechercher Collecter
Doreacutenavant tout internaute peut creacuteer et publier sa propre information
Lidentification des sources dinformation et de linformation elle-mecircme est devenue
complexe car elles sont de plus en plus morceleacutees et atomiseacutees Il convient
dutiliser une large palette doutils de recherche pour collecter les donneacutees en
provenance des blogs des bookmarks et reacuteseaux sociaux Pour faciliter la
collecte il est en outre possible de verticaliser la recherche et de faire appel agrave des
humains Par ailleurs dautres outils permettent darchiver ses deacutemarches de
requecirctes et de navigation
a La recherche de blogs et de flux RSS
Le volume de blogs est en constante croissance sur le net Le nombre de blogs a
litteacuteralement exploseacute sur toute la planegravete Estimeacute agrave 70 millions agrave leacuteteacute 2005 ils sont
eacutevalueacutes agrave plus de 120 millions en mars 2007 Technorati lun des moteurs de
recherche de blogs les plus utiliseacutes mesure en 2007 un doublement du nombre de
blogs tous les 320 jours 120 000 blogs seraient ainsi creacuteeacutes chaque jour 63
Europe
33
Afrique 15 000
Ameacuterique du Nord
33
Ameacuterique du Sud
1
Asie
55
5 Australie 790 000
copy Digimind Digimind Services ndash White Paper |42
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Nombre de blogs en milliers et millions (la Russie est inteacutegreacutee dans lAsie) Estimation DIGIMIND Services 64
Les fils RSS omnipreacutesents A chaque blog correspond son flux RSS ce format qui permet dextraire et de
surveiller tout nouveau contenu qui parait sur le blog Si un vrai blog implique
toujours un flux RSS un flux RSS ninduit pas forceacutement un blog En effet le RSS et
son concurrent Atom sont preacutesents sur de plus en plus de type de meacutedias et outils
internet degraves lors que leur contenu est appeleacute agrave se modifier reacuteguliegraverement
On pourra donc trouver des flux RSS sur
-les blogs
-les sites de presse et dactualiteacute Exemple Les Echos Libeacuteration La Tribune Le
Figaro)
-les sites de revues et magazines speacutecialiseacutes Exemple La revue Nature propose ses
fils RSS concernant ses publications speacutecialiseacutees par domaines Science fait de
mecircme65
-les sites corporate des entreprises page dactualiteacutes catalogues produits (Ex Air
Liquide)
-les reacutesultats de moteurs de recherche de blogs Tous proposent des flux RSS
permettant de surveiller une requecircte (Technorati Google Blog Search Feedster
IceRockethellip)
-les pages de reacutesultats de moteur de recherche web Certains de ces moteurs
geacutenegraverent un flux RSS permettant de surveiller lapparition de nouveaux reacutesultats
pour une requecircte donneacutee
MSN Search (devenu Live Search66) le proposait depuis janvier 2005 et chaque page
de reacutesultats offrait une icocircne orange en bas de page permettant dobtenir des fils
RSS Cette icocircne RSS a disparu sur Live Search mais les flux RSS sont toujours lagrave (ils
sont deacutetectables automatiquement avec un navigateur Firefox Maxthon IE7 ou
votre lecteur RSS Attensa ou RSS Bandit par exemple)
Depuis peu Yahoo Search Web 67 offre lui aussi un fils RSS sur ses reacutesultats lagrave
encore deacutetectable via un lecteur ou navigateur (cela fonctionne uniquement pour le
Yahoo US)
copy Digimind Digimind Services ndash White Paper |43
Le Web 20 pour la veille et recherche dinformation DIGIMIND
-les moteurs dactualiteacutes La majoriteacute des portails qui agregravegent des flux dactualiteacutes
proposent des flux RSS Exemple Google Actualiteacutes Yahoo Actualiteacutes Topix MSN
Actualiteacutes Wikiohellip 68
-les Newsgroups Usenet (groupes de discussion) Les fils RSS sont en effet aussi
preacutesents sur Google Groupes (ou Google Groups) ce qui rend plus aiseacute la surveillance
des discussions Chaque groupe (Google ou Usenet) affiche un fils RSS ou Atom 69
(et ce quelque soit la langue) signaleacute par le logo orange RSS en bas de page
-certains forums web Exemple Forum Mobiles 70
-certaines listes de diffusion elles peuvent ecirctre surveilleacutees via labonnement agrave leur
flux RSS Cela eacutevite lengorgement de votre boicircte mail Exemple la liste Veille sur
Yahoo Groupes 71 dispose dun flux RSS
-les bookmarks sociaux Delicious Yahoo MyWeb2 Blogmarks 72hellipLe fils RSS
permet decirctre alerteacute de lajout de nouveaux favoris pour un tag ou un utilisateur
deacutefinis
-les plateformes de partage de photos Exemple Flickr PhotoBucket 73
-les services de partage de videacuteos comme YouTube DailyMotion 74 pour ecirctre alerteacutes
des nouveauteacutes
-de tregraves nombreux sites offrant un contenu qui se renouvelle
copy Digimind Digimind Services ndash White Paper |44
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Veille Corporate La Tribune propose des flux RSS segmenteacutes par socieacuteteacutes
Le veilleur via ces flux RSS pourra surveiller de nombreuses sources
dinformations Par ailleurs au-delagrave des blogs introspectifs dadolescents dont peu
preacutesentent un inteacuterecirct pour les professionnels certains types de blogs peuvent se
reacuteveacuteler utiles
-Le blog dactualiteacute et dopinion preacutesentant reacuteflexions et critiques de journalistes et
internautes
-Le blog theacutematique eacutediteacute par des passionneacutes experts professionnels consultants
et techniciens
-Le blog dentreprise outil de communication externe ou interne agrave linitiative des
salarieacutes ou des dirigeants
copy Digimind Digimind Services ndash White Paper |45
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les outils pour trouver des blogs et flux RSS Sur ces moteurs la recherche seffectue par mots cleacutes classiques ou par tags comme
sur Technorati par exemple Le contenu indexeacute (blogs et flux) est tregraves heacuteteacuterogegravene
Aussi lutilisation de la recherche avanceacutee sur ces outils est souvent neacutecessaire En
effet un blog peut avoir abordeacute la theacutematique deacuteveloppement durable 1 seule fois
parmi ses 4500 billets Il conviendra donc alors de centrer sa recherche sur le titre
du blog ou son url
Les moteurs
Certains moteurs sont deacutedieacutes agrave la recherche de blogs Cest en fait un abus de
langage Ces moteurs se focalisent sur la recherche de flux RSS mais ne peuvent
faire la diffeacuterence entre un flux provenant dun grand journal et celui dun blog
Ainsi le moteur Technorati classe parmi les blogs les plus populaireshellipLe Figaro
Pour mener une recherche efficace il conviendra dutiliser plusieurs moteurs Car
comme pour la recherche web ougrave il ne faut pas se limiter agrave Google au risque de
manquer pregraves de 85 des reacutesultats75 la recherche sur les blogs neacutecessite lemploi
de plusieurs outils76 En voici quelques-uns
gt Google Blog Search Recherche de blogs Google applique sa technologie puissante
aux flux RSS et blogs Linterface est notamment disponible en franccedilais et en anglais
Le moteur est doteacute de fonctions de recherche avanceacutee (recherche sur le titre le
billet recherche par ancienneteacutehellip)
gt Ask Blog amp Flux Ce moteur permet de rechercher parmi les blogs les flux XML
(RSS ou Atom) Et aussi de sabonner agrave un blog ou un flux RSS
gt Feedster Ce moteur recense plus de 900 000 sources et 5000 sont rajouteacutees
chaque jour
gt BlogPulse Indexe plus de 46 millions de blogs
gt Technorati Ce moteur rafraicircchit son index toutes les 5 agrave 15 minutes et
recherche parmi plus de 70 millions de blogs (en avril 2007 77) ou sites proposant
des flux RSS Il est possible de rechercher par mots cleacutes ou par tags
gt Sphere va prendre en compte plusieurs variables pour mieux chercher parmi la
blogosphegravere
- comme pour le contenu web classique les reacuteseaux de liens entrants et sortants
- la qualiteacute de ces liens
copy Digimind Digimind Services ndash White Paper |46
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- les internautes agrave lorigine de ces liens (simple commentateurs ou leaders dopinion)
3 moteurs web integravegrent la recherche sur les blogs au sein de leur recherche
avanceacutee 78
gt Yahoo Search
Pour centrer sa recherche sur les flux RSS et les blogs il convient drsquoaller dans la
recherche avanceacutee (agrave droite de la boite de requecircte) puis dans le menu deacuteroulant
Format de fichiers et de seacutelectionner le format RSSXML
gt Exalead
Apregraves avoir effectueacute votre recherche il suffit de cliquer sur le bouton RSS jaune
dans la fenecirctre Preacuteciser la recherche Au sein des reacutesultats de recherche le flux
RSS est disponible via licocircne RSS Simple et propre
gt Microsoft MSN Live Search
MSN a ameacutelioreacute les interfaces de son moteur pour restreindre la recherche sur les
fils RSS Apregraves laffichage de votre page de reacutesultats vous pouvez affiner votre
recherche gracircce au bouton Flux (ou Feed en anglais) Ce bouton est accessible via
le menu Plus Au sein des reacutesultats de recherche sont alors disponibles lurl du flux
le cache et un lien pour sinscrire au fils RSS
Au-delagrave de ces moteurs speacutecialiseacutes il peut ecirctre beacuteneacutefique de tenter une recherche
sur un moteur Web (Google ou Yahoo Search par exemple) de type blog OR RSS
[votre sujet] Exemple blogs sur les teacuteleacutecoms Cela vous permettra non pas de
chercher au sein des blogs mais de trouver dautres blogs
Les reacutepertoires 79
Comme pour le web un certain nombre dannuaires entendent recenser les blogs
et fils RSS Attention comme la blogosphegravere est tregraves mouvante et en constante
croissance ces guides sont par nature non exhaustifs et leur mise agrave jour reacuteguliegravere
est difficile
gt Blogarama Ce reacutepertoire recense plus de 49 000 blogs classeacutes par cateacutegories
gt RSS Network indexe plus de 150 000 fils RSS
gt RSSFeeds Reacutepertorie plus de 119 000 fils organiseacutes en cateacutegories
copy Digimind Digimind Services ndash White Paper |47
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b La recherche par tags
Nous lavons vu avec la Folksonomie linternaute peut deacutesormais mettre en place et
partager sa propre classification via les tags Lutilisateur affecte leacutetiquette de son
choix agrave ses favoris images videacuteos Lavantage est indeacuteniable cest linternaute qui
deacutefinit son eacutetiquette et non plus un organisme Mais les inconveacutenients sont
nombreux difficile gestion des singulierspluriels problegraveme de synonymes de
signification (que deacutesigne cet internaute par ce tag) dhomonymes de polyseacutemie
dheacuteteacuterogeacuteneacuteiteacute plusieurs tags peuvent designer les mecircmes documents
Toutefois lapproche par tag facilite la recherche dune part en ajoutant une couche
seacutemantique aux documents web et dautre part en permettant une navigation par
concepts de plus en plus abandonneacutee compte tenu de la deacutesertion progressive des
cateacutegories des grands reacutepertoires web par les internautes
De plus on peut tagger pratiquement tout type de contenu web Ainsi les sites 43
Things et son eacutequivalent franccedilais 36 Trucs 80 proposent aux internautes de lister
leurs objectifs expeacuteriences ou projets Chacun de ces projets est taggeacute via un ou
plusieurs mots cleacutes
Les moteurs et meacutetamoteurs de tags
Les moteurs
La plupart des applications de social bookmarking ou de partage de fichiers images
ou videacuteos permettent donc de tagger leur contenu Sur certaines le moteur de
recherche interne rend possible en plus de la recherche sur le full text une
recherche centreacutee sur les tags Cest le cas sur Flickr vous pouvez rechercher au
choix sur le titre et la description des images ou sur les tags associeacutes deacutefinis par les
utilisateurs qui ont placeacute leurs photos
Un outil comme Delicious tag search 81 va vous permettre deffectuer des
recherches via un ou plusieurs tags sur le service de social bookmarking Delicious
Pour la recherche de blogs ou flux RSS le moteur Technorati propose une
recherche classique sur les mots cleacutes contenus dans les billets mais aussi une
copy Digimind Digimind Services ndash White Paper |48
Le Web 20 pour la veille et recherche dinformation DIGIMIND
recherche par tags82 En effet leacutediteur dun blog peut tagger chacun de ses billets
via des mots cleacutes qui les cateacutegorisent Ces mots ou tags seront repris par lindex du
moteur Ainsi la recherche du mot pollution parmi les tags affiche un billet sur le
reacutechauffement climatique Si ce billet est bien cateacutegoriseacute par son auteur dans une
rubriquepollution (parmi dautres) il ne contient pas ce mot dans son texte
toutefois en relation avec le concept de pollution Clairement une recherche
classique sur le seul texte des billets naurait pas rameneacute ce billet ou du moins pas
dans les premiers reacutesultats Autre inteacuterecirct Technorati vous propose des tags
associeacutes Ainsi pour pollution il affiche environment politics global warming science
china energy news air climate climate change autant de mots cleacutes pour eacutelargir ou
affiner vos requecirctes
Le moteur SearchLess 83 offre une approche originale il associe la recherche par
mots cleacutes agrave la recherche par tags Ainsi si vous effectuez une requecircte avec le mot
intelligence vous pouvez preacuteciser par le tag CIA Les reacutesultats seacutelectionneront
donc le mot intelligence sur des contenus (billets de blogs par exemple) taggeacutes CIA
par lutilisateur lui-mecircme on est alors sucircr que les 2 concepts sont intimement lieacutes
Meacutetamoteurs
Des meacutetamoteurs 84 permettent de rechercher sur les diffeacuterents types de contenu
sociaux bookmarks images videacuteos
Ainsi Tag Central agreacutege de nombreux formats web taggeacutes En lui indiquant un
tag il affiche des reacutesultats provenant agrave la fois de Flickr Smugmug (photos)
Technorati (blogs) Blogmarks Connotea Furl delirious (bookmarks sociaux) ou
encore 43Things (listes de projets)
Zewol outil de meacuteta syndication francophone permet de rechercher parmi les tags
(Flickr delicious) mais aussi sur les actualiteacutes (Google News Ask Actualiteacutes
Yahoo Actualiteacutes) les blogs (Technorati IceRocket Google Blog Search Ask
Blogshellip) le buzz (Tapemoi Scoopeo Wikipedia) les videacuteos (Google Videos
Podscope Video Daily Motion) et un mix (Furl Echonimo actualiteacutes Plazoo
Feed24) Concregravetement cest une bonne approche de recherche globale sur de
nombreuses ressources de type Web 20
Il est toujours possible de traquer la preacutesence ou lapparition dun mot clef sur le
web via la mise en surveillance du flux RSS de la requecircte
Ketoag est un outil qui permet dinterroger de nombreux services sociaux
copy Digimind Digimind Services ndash White Paper |49
Le Web 20 pour la veille et recherche dinformation DIGIMIND
(Delicious Furl Diig Wikio Blinklist) mais eacutegalement des moteurs de recherche
(Google Blog Search) Par ailleurs vous pouvez geacuteneacuterer pour chaque requecircte un
flux RSS mais aussi un fichier OPML (format permettant lagreacutegation et leacutechange de
listes de flux RSS)
Gnosh est un meacutetamoteur qui recherche parmi les moteurs web les moteurs de
blogs et les outils de partage de favoris De plus une recherche sur longlet People
vous permet de rechercher parmi les favoris des internautes inscrits agrave la
communauteacute Gnosh
Exalead recherche sur Wikipedia A droite le nuage de tags
Les nuages de tags
Ces nuages regroupent un ensemble de tags dans un mecircme espace en affectant agrave
chacun une taille variant selon leur populariteacute (freacutequence dutilisation ou de requecircte
sur ces mots) ou la densiteacute darticles auxquels ils se reacutefeacuterent (deacutepecircches dactualiteacutes
par exemple)
Les nuages de tags sont devenus agrave la mode car ils permettent une navigation facile
tregraves visuelle au sein dun site dune base de donneacutee ou des reacutesultats dun moteur
Ils apportent une grille de lecture suppleacutementaire agrave des sites dont les menus sont
souvent surchargeacutes ou le contenu atomiseacute
copy Digimind Digimind Services ndash White Paper |50
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Nombreuses sont les applications qui utilisent le nuage de tags pour optimiser la
navigation et mettre en valeur leur contenu le partage de videacuteos (DailyMotion) les
bookmarks sociaux (Delicious MyWeb2 de Yahoo) ou les services dactualiteacutes
collaboratives comme Wikio Certains moteurs comme Exalead ont eacutegalement
choisis dafficher des nuages de tags au sein de leurs pages de reacutesultats Dans ce cas
il sagit dune aide agrave laffinage des requecirctes un clic sur un tag va afficher une
nouvelle page de reacutesultat prenant ce mot en compte
Zibb85 moteur de recherche vertical deacutedieacute au Business to Business utilise aussi le
nuage de tags pour visualiser clairement les mots cleacutes de theacutematiques connexes les
plus freacutequents agrave votre requecircte
Dautres sites plus classiques ont eacutegalement choisi lapproche du nuage de tag pour
rendre leur navigation plus attractive et leurs rubriques plus visibles Ainsi le site
Ecrans 86(du journal Libeacuteration) affiche en bas agrave droite un nuage de tags mettant en
valeur son contenu tregraves touffu
Certains outils proposent de geacuteneacuterer des nuages de tags pour des sites ou moteurs
nen disposant pas
Google Tag Cloud Maker 87 est un script pour Firefox qui permet dafficher un nuage
de tags agrave droite des reacutesultats de Google plus un mot est freacutequent dans les reacutesultats
de votre recherche plus la taille dun tag est importante
Newzingo 88 extrait des mots de Google News pour constituer un nuage
doccurrences parmi les termes de lactualiteacute Plus le terme est gros plus les articles
relatifs agrave ce terme sont nombreux Techzingo reacutealise le mecircme process mais cette
fois les cibles sont des meacutedias de reacutefeacuterence dans le High Tech et le logiciel
Slashdot Diggcom et TheRegister
Un nuage de tags sur lInternet Movie Database une maniegravere de naviguer parmi tous les mots cleacutes associeacutes aux films
copy Digimind Digimind Services ndash White Paper |51
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La qualification du contenu par les utilisateurs (rdquofolksonomierdquo) est une reacuteelle valeur
ajouteacutee Les moteurs de recherche font reposer une grande part de lrsquoeffort sur
lrsquoutilisateur final une page de reacutesultats de Google doit ecirctre eacutevalueacutee souvent
interpreacuteteacutee par linternaute La folksonomie fait elle reposer lrsquoeffort de filtrage sur
lrsquoutilisateur initial celui qui va rechercher et appliquer ses propres ldquotagsrdquo Parce
quen amont 1743 personnes ont taggeacute une page avec un groupe de mots cleacutes
lrsquoutilisateur final lors de sa requecircte reccediloit une page de reacutesultats souvent tregraves
pertinente
Sur un moteur classique cest agrave lutilisateur dimaginer ses mots cleacutes pour affiner sa
recherche Sur les bookmarks sociaux de type Delicious les internautes qui
partagent leurs ressources ont deacutejagrave preacutepareacute ce travail daffinage via leurs tags
Prenons le cas dune recherche extrecircme car geacuteneacuterant de la synonymie la requecircte
Jaguar Sur Googlecom on me propose certes des mots cleacutes connexes pour
affiner mais tous sont lieacutes agrave la voiture Sur Delicious les tags afficheacutes sont relatifs agrave
la voiture mais aussi au systegraveme dexploitation agrave un groupe de musique et agrave lanimal
Pouvoir rechercher parmi les tags classifications eacutemanant de lutilisateur peut ecirctre
particuliegraverement inteacuteressant lorsquune recherche classique par mots cleacutes sur le
contenu des documents sest aveacutereacutee infructueuse ou geacutenegravere des reacutesultats peu
pertinents
Le tagging une pratique quotidienne
Selon une enquecircte meneacutee en deacutecembre 2006 par le Pew Internet amp American Life
Project 28 dutilisateurs des internautes ameacutericains ont taggeacute ou cateacutegoriseacute en
ligne des contenus tels que des photos des billets dans des blogs des articles
drsquoactualiteacutehellipSur une base journaliegravere 7 des utilisateurs drsquoInternet pratiquent le
tag en ligne
Ce systegraveme de laquo taxonomie populaire raquo pourrait-il constituer une alternative aux
outils de recherche traditionnels par mots cleacutes Il convient de distinguer les
usages professionnels des usages grand public Olivier Le Deuff 89 reprend dans
son eacutetude sur les Folksonomies la distinction effectueacutee par Thomas Vander
Wal entre les folksonomies eacutetroites (narrow folksonomies) et geacuteneacuterales (broad
folksonomies) Selon Olivier Le Deuff cette distinction est importante car les
premiegraveres sont surtout utiliseacutees dans un objectif individuel tandis que les secondes
privileacutegient lrsquoaspect collectif et collaboratif du partage drsquoinformation Ainsi les sites
de partages de favoris comme delicious ou Connotea sont plutocirct des
folksonomies geacuteneacuterales puisqursquoun mecircme site peut ecirctre partageacute par plusieurs
utilisateurs et recevoir le mecircme tag Ce type de folksonomies srsquoappuyant sur des
copy Digimind Digimind Services ndash White Paper |52
Le Web 20 pour la veille et recherche dinformation DIGIMIND
reacuteseaux sociaux ne fait pas que classer de lrsquoinformation et la partager Il met en
relation des usagers qui partagent les mecircmes centres drsquointeacuterecirct Lrsquousager indexeur
devient agrave son tour un peu indexeacute et mis en relation agrave la fois avec drsquoautres mots-
cleacutes drsquoautres sites et drsquoautres usagers
Il est clair que dans le domaine de lrsquoinformation professionnelle ou speacutecialiseacutee le
manque duniformisation des folksonomies qursquoelles soient geacuteneacuterales ou agrave vocation
plus eacutetroite pose les limites de ce systegraveme Les outils drsquoindexation et de
classification traditionnels ont en effet eacuteteacute creacuteeacutes pour des corpus structureacutes aux
limites clairement deacutefinies et srsquoadressent agrave des utilisateurs experts drsquoun domaine
ou de la recherche drsquoinformation Lrsquoabsence de hieacuterarchisation et de controcircle
constitue agrave la fois le point fort et le point faible de la folksonomie La barriegravere des
langues pourra constituer eacutegalement un obstacle les tags eacutetant parfois meacutelangeacutes
dans un mecircme site sans distinction De plus comme le note Cyril Fievet 90 la
pratique du tagging nrsquoest pas uniforme drsquoun site agrave lrsquoautre Sur Technorati les tags
indexeacutes sont ceux choisis par les blogueurs et fonction du contenu qursquoils ont eux-
mecircmes publieacute Sur delicious en revanche ce sont les internautes qui taguent le
contenu des pages qursquoils conservent dans leurs signets raquo
Il convient eacutegalement drsquoecirctre vigilant quant agrave une utilisation laquo frauduleuse raquo des
tags destineacutee uniquement agrave garantir la populariteacute drsquoun blog comme cela a pu
ecirctre le cas avec les meacuteta-donneacutees incorporeacutees dans le code source drsquoune page
html
Eacutelie Francis et Odile Quesnel preacutesentent dans la revue Documentaliste Sciences
de lrsquoinformation les quatre modes drsquoindexation et de classification sur le web la
classification personnelle lrsquoindexation par lrsquoauteur lrsquoindexation par lrsquoutilisateur et la
classification globale Et srsquointerrogent sur lrsquoavenir de lrsquoindexation collaborative agrave la
croiseacutee de la qualiteacute (liberteacute diversiteacute enrichissement) et de la deacutesinformation
(subjectiviteacute manque de coheacuterence)
Il nrsquoen reste pas moins que folksonomie et indexation classique ne srsquoopposent pas
neacutecessairement et constituent des moyens de description de contenus adapteacutes agrave
des contextes diffeacuterents Stephen Lee creacuteateur du site Guten Tag voit dans la
folksonomie une sorte de web seacutemantique du pauvre peu oneacutereux agrave mettre en
place mais dont le succegraves reposera sur une seacuterie de bonnes pratiques collectives
Lrsquointeacuterecirct de ce systegraveme reacutesidera non pas dans la capaciteacute agrave trouver une reacuteponse agrave
une question preacutecise mais plutocirct agrave deacutecouvrir des sources originales et peu connues
ou de localiser des experts drsquoun domaine pointu Les tags les plus rares et preacutecis
pourront entre autres trouver leur application dans le domaine de la veille mettant
copy Digimind Digimind Services ndash White Paper |53
Le Web 20 pour la veille et recherche dinformation DIGIMIND
en œuvre la seacuterendipiteacute ou lrsquoart de favoriser le hasard pour des deacutecouvertes
heureuses
Laissons la conclusion sur ce point agrave lrsquoAssociation des Professionnels de
lrsquoInformation et de la Documentation (ADBS) qui estime dans sa newsletter que
Le foisonnement des propositions de mots-cleacutes aboutirait agrave un reacutesultat plus efficace
quune indexation reacutealiseacutee par un vocabulaire contraint Cette affirmation semble
ecirctre deacutemontreacuteehellip pour linstant
c La recherche de personnes et dinformations entreprises
La recherche de donneacutees sur les personnes physiques ou morales seffectuait
jusquici principalement en interrogeant les bases de donneacutees dinformations leacutegales
et financiegraveres gratuites ou payantes Linterrogation de service tel que Societecom
Infogreffe ou Yahoo Finance est bien sucircr encore neacutecessaire Mais il faut compter
maintenant avec les reacuteseaux sociaux professionnels qui eux aussi rassemblent des
donneacutees sur les entreprises ou les individus
Linteacuterecirct des reacuteseaux sociaux
Que peuvent-il apporter par rapport aux services classiques dinformations
dentreprises Dabord comme expliqueacute preacuteceacutedemment ils sont ouverts agrave tous
Les informations y figurant ne sont plus le seul fait de leacutediteur du site et ne sont pas
uniquement constitueacutees par les fichiers de donneacutees leacutegales publieacutees par les
organismes officiels comme le Greffe du Tribunal de Commerce en France Sur les
reacuteseaux sociaux centreacutes sur les personnes le contenu est inteacutegralement ameneacute par
linternaute qui affiche son CV deacutetailleacute ses publications ses oeuvres (textes ou
multimeacutedias) Linteacuterecirct est eacutevident des personnes peu visibles auparavant parce
que ne faisant pas partie des dirigeants dentreprises (geacuterant fondateur membre du
conseil) sont maintenant accessibles et donc requecirctables par les internautes On
peut donc collecter des informations sur un cadre de RampD dune socieacuteteacute de
teacuteleacutecoms concurrente ou sur le management eacutetonnant de telle entreprise de
plasturgie citeacutee dans le CV dun employeacute de passagehellip
A linstar des blogs linformation preacutesente sur les reacuteseaux sociaux ne tient plus du
discours ou des donneacutees officielles puisque cest linternaute qui communique sur sa
vie et son entreprise
copy Digimind Digimind Services ndash White Paper |54
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Geacuterer leacuteparpillement de linformation
Dautres plateformes de social networking mixent linformation collecteacutee sur le web
avec les contributions des utilisateurs (agrave linstar de Wikio pour les actualiteacutes) Ainsi
le service ZoomInfo 91 permet de rechercher des socieacuteteacutes et des personnes en
parcourant des milliers de donneacutees extraites du web mais aussi en provenance de
profils dindividus et dentreprises renseigneacutes par les socieacuteteacutes ou les employeacutes eux-
mecircmes Aussi cohabitent des informations sur des entreprises coteacutees avec des
donneacutees de firmes non coteacutees des fiches de cadres du top management et des
conseils dadministration avec des CV demployeacutes plus fonctionnels
Le franccedilais Ziki 92 utilise aussi des informations collecteacutees sur le web cest une
sorte dannuaire perfectionneacute qui indexe et archive non pas les donneacutees
signaleacutetiques mais les contenus produits par une personne agrave partir du moment ougrave ils
disposent dun flux RSS (billets de blogs photo Flickr favoris Delicioushellip) Ziki ne
permet pas de creacuteer du contenu propre mais agregravege des donneacutees eacutelaboreacutees par un
mecircme individu auparavant eacuteparpilleacutees sur linternet Bref vous ameacuteliorez votre
visibiliteacute et facilitez la recherche de vos productions sur le net en creacuteant un point
unique daccegraves
La recherche sur tous ces reacuteseaux sociaux implique souvent linterrogation
fastidieuse apregraves inscription de plusieurs dizaines de sites
Aussi certains outils 93 proposent une meacutetarecherche en lanccedilant une mecircme
requecircte sur plusieurs services de social networking Stalkerati recherche le nom
dune personne sur les reacuteseaux Friendster et FaceBook Plus complet et ciblant
davantage les reacuteseaux professionnels YoName recherche les noms sur MySpace
LinkedIn Friendster Windows Live Spaces Bebo Digg ou Xanga
Le moteur de recherche de personnes Wink scrute les reacuteseaux sociaux MySpace
Bebo Friendster LinkedIn Live Spaces et autres De plus avec cet outil il est
possible de creacuteer son propre profil et de le connecter agrave des reacuteseaux sociaux
Attention toutefois si vous ecirctes un utilisateur recherchant des donneacutees en franccedilais
la nature des reacutesultats est plutocirct tourneacutee vers le monde anglophone
Ces reacuteseaux sociaux ne sont pas suffisants pour une recherche professionnelle
complegravete A linstar des blogs face agrave la presse traditionnelle ils constituent un
compleacutement inteacuteressant aux bases de donneacutees officielles
copy Digimind Digimind Services ndash White Paper |55
Le Web 20 pour la veille et recherche dinformation DIGIMIND
d Les moteurs de recherche humains
Apregraves ecirctre apparus sur le net agrave la fin des anneacutees 90 les services de questions-
reacuteponses avaient laisseacute la place aux algorithmes tout puissants des moteurs de
recherche de type Google Mais les robots et programmes ont tous besoin dune
intervention humaine pour geacuterer la qualiteacute et la pertinence des reacutesultats
Ainsi tous les grands moteurs majeurs ne font pas confiance agrave leurs seuls
algorithmes Les employeacutes de Yahoo sont mis agrave contribution pour surveiller la
qualiteacute des reacutesultats fournis par le moteur Chez Google et MSN Search des
process deacutevaluation humaine avaient eacuteteacute identifieacutes agrave travers les sites
EvalGooglecom et MSN HRS notamment
La revanche de lhumain
Au-delagrave de ce rating humain sur les reacutesultats de moteurs de recherche de
nombreux services depuis 2 ans mettent agrave disposition des experts en chair et en
os Cest alors un veacuteritable mode collaboratif qui se met en place lorsque le produit
est bien penseacute Cest la cas de Yahoo Answers (Yahoo Questions Reacuteponses en
France) 94 Ce service gratuit de questions reacuteponses lanceacute fin 2005 permet agrave
linternaute de poser une question dans un formulaire Chaque membre de la
communauteacute Yahoo (agrave savoir tout ceux qui disposent dun compte Yahoo) peut
jouer le rocircle dexpert Yahoo propose aussi le service (eacutegalement gratuit) Ask
Yahoo qui propose de reacutepondre agrave vos questions mais cette fois via un groupe
dexperts seacutelectionneacutes par Yahoo Inc Yahoo Answers a certes une orientation
initiale grand public mais des questions un peu techniques voire scientifiques
trouvent reacuteponse En effet parmi tous les contributeurs agrave Yahoo Answers figurent
des meacutetiers et expertises tregraves diverses du fait de son audience importante Il y
cohabite des types de questions varieacutes Quels sont les groupes strateacutegiques de
lindustrie mondiale du jouet Quelles sont les donneacutees eacuteconomiques du marcheacute de
lassurance vie collective en France
Autre point inteacuteressant le service est deacuteployeacute dans de nombreux pays (Etats-Unis
Royaume-Uni Canada Australie Inde Espagne Breacutesil Argentine Mexique Italie
Allemagne Singapour Taiwan Coreacutee du Sud Hong Kong Japon Chinehellip) Aussi il
est possible de localiser certaines questions et de beacuteneacuteficier parfois dune
expertise pays
Lune des raisons du succegraves du service de Yahoo tient au fait de baser les questions
et reacuteponses sur la contribution dinternautes volontaires Chacun participe
constitue un vrai reacuteseau et peut surtout se valoriser en devenant expert dans son
copy Digimind Digimind Services ndash White Paper |56
Le Web 20 pour la veille et recherche dinformation DIGIMIND
domaine de compeacutetences ou sa passion Il est mecircme possible de creacuteer sa propre
communauteacute qui rassemblera vos amis mais aussi vos experts preacutefeacutereacutes qui
reacutepondent agrave vos questions et centres dinteacuterecirct Le pool de reacutepondants nest donc
pas limiteacute agrave une liste restreinte et il sauto-entretient Dautre part les experts
seacutevaluent entre eux et seacutelectionnent parmi une liste si neacutecessaire ce quils
considegraverent comme la meilleure reacuteponse agrave une question
Une question sur Yahoo Answers
Sur ce marcheacute des Questions-Reacuteponses Google a eacutechoueacute notamment parce quil a
seacutepareacute formellement demandeurs et contributeurs limitant ainsi fortement laspect
collaboratif Le Service Google Answers 95 permettait de poser des questions agrave des
experts Mais lagrave ougrave des services concurrents comme Yahoo Answsers Lycos IQ
copy Digimind Digimind Services ndash White Paper |57
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Windows Live QnA96 sont gratuits Google Answers eacutetait un service payant faisant
appel agrave un reacuteseau de 800 experts Aussi Google Answers apregraves 4 ans dactiviteacute a
fermeacute Les questions ne sont deacutesormais plus accepteacutees mais laccegraves aux archives des
questions-reacuteponses est maintenu
Par ailleurs les reacuteseaux sociaux eacutevoqueacutes plus haut ont bien compris la puissance des
communauteacutes pour faire office de speacutecialistes Ainsi avec LinkedIn Answers la
plateforme de reacuteseaux sociaux LinkedIn sest lanceacutee elle aussi dans le service de
QuestionsReacuteponses
Ne pas oublier les services Web 10
Lorsque lon parle de Web 20 on eacutevoque rarement ces services de Questions-
Reacuteponses au profit de sites plus technologiques Pourtant nous sommes ici dans la
logique des bookmarks sociaux partager ses connaissances faire beacuteneacuteficier les
autres de son savoir et en retour profiter de lexpertise de la communauteacute
Comme la plupart des applications Web 2 la seule utilisation des services QR ne
suffit pas Elle doit venir en compleacutement de recherches parallegraveles via dautres outils
Ainsi pour la veille linscription agrave des listes de diffusion permet aussi de poser des
questions agrave des experts ou passionneacutes De plus il subsiste des services dexpert
traditionnels qui sils ne mettent pas laccent sur la collaboration permettent
didentifier des compeacutetences parfois tregraves pointues Certaines ressources
reacutepertorient des milliers dexperts quil faudra ensuite contacter personnellement
pour beacuteneacuteficier de leur conseil Cest le cas du site Expertscom qui identifie des
experts dans des domaines allant de lacoustique agrave la biochimie en passant par
lindustrie peacutetroliegravere97
copy Digimind Digimind Services ndash White Paper |58
Le Web 20 pour la veille et recherche dinformation DIGIMIND
e les moteurs de recherche collaboratifs
Nous lavons vu certains services dactualiteacutes collaboratives proposent des reacutesultats
issus dun mixage entre contribution des internautes et collecte de nouvelles sur le
web Cette approche de mixiteacute se met peu agrave peu en place pour les moteurs de
recherche web En effet les modegraveles algorithmiques ou humains preacutesentent tout 2
leurs limites en terme de pertinence de fiabiliteacute et dexhaustiviteacute
Aussi de plus en plus de projet de moteur mixtes agrave savoir proposant des reacutesultats
web conjointement agrave des reacutesultats etou seacutelections issus dhumains voient le jour
Du web donc mais avec une forte dose de cerveaux humains
Wikiasari
Celui qui fait le plus parler de lui est le projet de Jimmy Wales le co-fondateur de
lencyclopeacutedie Wikipedia Baptiseacute Wikiasari 98 (combinaison de wiki rapide en
hawaiumlen et asari recherche fouilleacutee en japonais) le projet vise agrave creacuteer un outil de
recherche ougrave les internautes pourront influer sur les reacutesultats en notant leur
pertinence etou en en proposant de nouveaux selon leur expertise
Ce type de moteur sinscrit donc agrave lopposeacute doutils comme Google aux algorithmes
automatiques dont les robots sont souvent trompeacutes par des manipulations de
webmasters (spamdexing par exemple)
Cet outil qui devrait voir le jour courant 2007 sappuie sur des infrastructures Open
Source existantes comme Nutch ou Lucent
Cest un projet particuliegraverement inteacuteressant Comme sur lencyclopeacutedie ouverte
Wikipedia ougrave des milliers de contributeurs construisent et alimentent louvrage sur
ce moteur des reacuteseaux de centaines dinternautes pourront apporter leur savoir
pour ameacuteliorer la pertinence des reacutesultats Ce nest plus seulement la puissance de
calcul de machines qui sera mise agrave contribution mais aussi la puissance de la
communauteacute
Derriegravere le projet Wikiasari il y a de gros moyens financiers et humains
lexpeacuterience de la fondation Wikipedia et le potentiel de trafic que pourra apporter
lencyclopeacutedie ouverte Fin 2006 Comscore a en effet classeacute Wikipedia comme le
6egraveme site le plus visiteacute au monde avec 1719 millions de visiteurs uniques au mois
de novembre On peut donc y croire
copy Digimind Digimind Services ndash White Paper |59
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche de sites similaires sur Yoono
Decipho Yoono
Certes lideacutee dun moteur de recherche collaboratif nest pas nouvelle Reacutecemment
on peut citer le lancement du moteur Decipho ou en mars 2006 celui de Yoono
Mecircme si les approches diffegraverent ces outils font tous la part belle agrave lrsquoapport de
chaque utilisateur dans le traitement des reacutesultats
Decipho 99 est un moteur baseacute sur la technologie de Askcom lun des 4 moteurs les
plus utiliseacutes aux USA Linternaute creacuteeacute ses propres cateacutegories de reacutesultats
partageables avec les autres Il peut eacutegalement tagger les reacutesultats afin deacutetiqueter
un site Aussi lors dune requecircte on peut preacuteciser les mots cleacutes classiques avec des
tags On beacuteneacuteficie alors de tous les tags mis en place par la communauteacute des
utilisateurs Un curseur permet de deacutefinir la proportion de cateacutegorisation des
autres utilisateurs agrave prendre en compte dans sa recherche
Le franccedilais Yoono 100 propose une autre deacutemarche encore loutil fonde ses reacutesultats
sur la mutualisation des connaissances des internautes par le partage des favoris Le
copy Digimind Digimind Services ndash White Paper |60
Le Web 20 pour la veille et recherche dinformation DIGIMIND
moteur utilise les favoris que sa communauteacute dutilisateurs a accepteacute de partager
Lors dune requecircte les reacutesultats sont classeacutes par populariteacute agrave savoir selon le
nombre de fois ougrave une page a eacuteteacute mise en favoris par les utilisateurs Une logique
proche de Delicious mais avec Yoono lajout de favoris est automatique De plus
loutil affiche les utilisateurs qui comme vous ont reacutefeacuterenceacute des sites sur la
politique veacuteneacutezuelienne par exemple De cette maniegravere vous pouvez identifier des
passionneacutes ou experts partageant vos domaines de preacutedilections Les reacutesultats ne
sont plus baseacutes sur les seuls algorithmes mais sur lexpeacuterience et la capacitation des
autres utilisateurs
Les initiatives de moteurs collaboratifs plus ou moins inteacuteressantes sont multiples
Foox est un moteur baseacute sur des communauteacutes dinteacuterecirct et sur Webzzle lutilisateur
preacutecise les concepts qui linteacuteressent afin de contextualiser les mots-cleacutes choisis 101
Humains ou algorithmes
Certes le mode collaboratif ne remplacera pas totalement la recherche
algorithmique Les 2 sont compleacutementaires Lune permet dameacuteliorer la pertinence
de prendre en compte des concepts des contextes du sens et non plus simplement
des chaicircnes de caractegraveres Lautre vise lexhaustiviteacute en indexant des milliards de
pages Web Aujourdhui et en attendant le Web seacutemantique ainsi que la recherche
dite naturelle 102 toutes deux grandes quecirctes du monde de linternet seul lapport
de communauteacutes dhumains permet dinjecter un peu de sens agrave une recherche
Mais de son cocircteacute la recherche coopeacuterative comporte bien entendu des risques de
subjectiviteacute
Sur les moteurs de recherche la coopeacuteration peut prendre une autre forme via le
peacuterimeacutetrage des sites agrave interroger la construction dun moteur sur mesure en
quelque sorte Cest la verticalisation de la recherche
copy Digimind Digimind Services ndash White Paper |61
Le Web 20 pour la veille et recherche dinformation DIGIMIND
f La verticalisation par la personnalisation du peacuterimegravetre de recherche
Lune des grandes faiblesses des moteurs de recherche web agrave large eacutechelle (Google
Exalead Yahoo MSNhellip) est le bruit geacuteneacutereacute par certaines requecirctes Lorsque vous
tapez puma le moteur ne sait pas agrave priori si vous vous inteacuteressez aux vecirctements
de sport agrave lanimal ou aux heacutelicoptegraveres Or si vous ne reacutealisez des recherches que
dans laeacuterospatiale vous devrez souvent deacutesambiguiumlser par vos mots cleacutes ce qui
engendre une perte de temps voire de reacutesultats si vos requecirctes deviennent trop
restrictives
Certains moteurs ou meacutetamoteurs clusteacuterisent (cateacutegorisent) les reacutesultats en les
rassemblant par groupes (grappes) dans de petits dossiers Cette deacutemarche avait
eacuteteacute initieacutee par le moteur Northern Light en 1998 Ainsi tous les reacutesultats relatifs aux
chaussures Puma sont regroupeacutes dans une mecircme valise ceux eacutevoquant lanimal
dans une autre Mais cette solution nest pas complegravetement satisfaisante car elle
seffectue agrave posteriori une fois votre requecircte lanceacutee Le bruit nest pas eacutelimineacute mais
simplement circonscrit dans des sortes de cateacutegories poubelle
Pour beacuteneacuteficier dune deacutemarche agrave priori il convient dutiliser des outils de
recherche verticaux cest-agrave-dire speacutecialiseacutes dans un secteur dactiviteacute une fonction
un type dinformation ou de meacutedias
Face aux problegravemes de pertinence des moteurs geacuteneacuteralistes de plus en plus de
moteurs verticaux voient le jour Ainsi le seul domaine meacutedical a vu apparaicirctre ces
20 derniers mois les moteurs SearchMedica Medstory MedWorm ou encore Medgle 103
Mais si votre secteur de preacutedilection nest pas couvert par un moteur speacutecialiseacute
Cest lagrave quintervient un autre type de moteur collaboratif agrave qui lon peut indiquer le
peacuterimegravetre des sites sur lesquels effectuer la recherche Sur les moteurs classiques
les algorithmes peuvent placer en prioriteacute des reacutesultats sans inteacuterecirct pour vous A
force de navigation et de veille dans votre secteur vous connaissez certainement
10 20 100 sites que vous jugez incontournables et indispensables pour vos
recherches
2 solutions techniques existent
- les outils agrave peacuterimegravetre de recherche personnalisable (adaptable scope)
Ils utilisent les index des moteurs geacuteneacuteralistes (Yahoo ou Google) et restreignent le
scope de leur recherche aux pages des sites que vous avez choisis Ainsi des outils
comme Rollyo Swicki Yahoo Search Builder Google Custom Search 104 vous
demandent dindiquer une liste de sites sur lesquels vous allez limiter votre
recherche Lors dune requecircte les reacutesultats proviendront uniquement des sites de
votre choix Pratique
copy Digimind Digimind Services ndash White Paper |62
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Mais ces outils preacutesentent une limite de taille ils ne prennent en compte que les
pages indexeacutees par Google ou Yahoo Conseacutequence si la reacuteponse pertinente agrave
votre requecircte figure au sein dune page non indexeacutee par le moteur geacuteneacuteraliste vous
nobtenez pas de reacutesultats
De plus en ninterrogeant que lindex dun ou 2 moteurs vous manquerez
obligatoirement de nombreuses informations puisque le nombre de reacutesultats
communs entre les moteurs diminue constamment105
Les pages non indexeacutees par les moteurs geacuteneacuteralistes constituent une part du web
invisible106 et sont plus nombreuses que lon ne croit Ainsi si jinterroge le moteur
interne du site de la prestigieuse revue scientifique The Lancet 107 avec la requecircte
Diabetes jobtiens plus de 2800 reacutesultats Si jeffectue cette mecircme requecircte sur
Google en restreignant ma recherche au site The Lancet (via la syntaxe
sitehttpwwwthelancetcom) jobtienshellip1 reacutesultat Sur Yahoo Search guegravere
mieux 9 reacutesultats Pourquoi Parce que les technologies de ces moteurs ne
permettent pas dindexer correctement tous les sites
La constitution de bouquets de moteurs speacutecialiseacutes sur Digimind Finder
- les outils agrave moteurs personnalisables
La solution pour beacuteneacuteficier des reacutesultats de moteurs internes non indexeacutes par des
Google ou Yahoo est dutiliser un outil permettant dexploiter directement les
moteurs des sites qui vous inteacuteressent et ce sans avoir agrave passer par les index de
moteurs geacuteneacuteralistes Cest le cas du Finder108 mis au point par Digimind un
copy Digimind Digimind Services ndash White Paper |63
Le Web 20 pour la veille et recherche dinformation DIGIMIND
meacutetamoteur qui permet de plugger nimporte quel moteur de son choix et de
linterroger ensuite Il est donc alors simple de se constituer des bouquets de
moteurs speacutecialiseacutes dans votre secteur dactiviteacute De plus cet outil indexe en temps
reacuteel les reacutesultats et les documents retourneacutes par les moteurs interrogeacutes Cela
permet daffiner ensuite vos reacutesultats en interrogeant cet index au contenu
speacutecialiseacute via une recherche avanceacutee Avec le Finder cest donc lutilisateur final qui
constitue sa propre seacutelection de moteurs
copy Digimind Digimind Services ndash White Paper |64
Le Web 20 pour la veille et recherche dinformation DIGIMIND
g Lenrichissement de bases de donneacutees faccedilon Web20
Nous avons vu que les bookmarks sociaux permettaient de mutualiser les
ressources et pour certains autour de communauteacutes deacutedieacutees comme les
scientifiques Avant lapparition des applications Web 20 ont eacuteteacute constitueacutees de
nombreuses bases de donneacutees professionnelles Celles-ci jusquici noffraient pas
aux groupes dutilisateurs la possibiliteacute dinteragir de commenter et deacutechanger
Aussi de plus en plus de grandes bases de donneacutees se dotent dinterfaces
collaboratives et ergonomiques pour laisser plus de place agrave la contribution
PubMed
Cest le cas de lune des plus grandes bases du domaine meacutedical PubMed 109 Cette
immense base bibliographique a vu naicirctre deux initiatives110 pour ameacuteliorer son
interface de recherche
- Avec PubMed Interact la recherche integravegre de lAjax et permet de pondeacuterer via
des curseurs les critegraveres de sources dancienneteacute de nombre de reacutesultats de date
de publication de liens avec le mapping du MeSH (le theacutesaurus de la base) de
filtrage via des cateacutegories Vous pouvez ensuite annoter et attribuer une note de
pertinence agrave vos reacutesultats afficher labstract des articles ou leur texte complet
supprimer des reacutesultats ou encore afficher les articles lieacutes On retrouve donc
lessentiel des fonctionnaliteacutes de lactuel PubMed mais avec une convivialiteacute et
ergonomie Web 20 et donc une plus grande accessibiliteacute
-Hubmed est une autre interface alternative qui ajoute des fonctionnaliteacutes agrave PubMed
application de ses propres tags aux reacutesultats de recherche historique des recherches
clusteacuterisation des reacutesultats visualisation sous forme graphique creacuteation simplifieacutee
de fils RSS avec les mots de votre requecircte suggestion de termes connexes
visualisation de vos mots cleacutes dans larborescence Mesh Le tout est deacuteveloppeacute en
Ajax notamment permettant une navigation plus fluide et plus rapide Parmi toutes
ces fonctions la possibiliteacute de tagger les reacutesultats est tregraves novatrice on peut ainsi se
deacutepartir de la taxonomie de la base via sa propre folksonomie
copy Digimind Digimind Services ndash White Paper |65
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les nombreux reacuteglages de filtres sur linterface PubMed Interact
LUSPTO
LUSPTO 111 est la base des brevets ameacutericains (United States Patent and Trademark
Office)
Cette veacuteneacuterable institution a en projet une plateforme de brevets sociale agrave la
maniegravere dun Digg (cf les services dactualiteacutes collaboratives) les internautes
pourront commenter les brevets en ligne et les eacutevaluer via un systegraveme de notation
Les brevets les mieux noteacutes remonteront alors en haut de classement
copy Digimind Digimind Services ndash White Paper |66
Le Web 20 pour la veille et recherche dinformation DIGIMIND
h Conserver et exploiter lhistorique de vos recherches et navigations
Le chercheur dinformation sur le net perd souvent ses nerfs quand il ne retrouve
plus ce quil a deacutejagrave collecteacute quelque semaines auparavant ou lorsquil lui est
impossible de se souvenir quelle requecircte agrave geacuteneacutereacute ce fameux reacutesultat remarquable
cette veacuteritable peacutepitehellip
Google a reacutesolu partiellement ces problegravemes de meacutemoire Mais comme souvent
cela ne va pas sans certains sacrifices
Via son service Historique Web112 (ex Historique de recherche) vous pouvez apregraves
enregistrement gratuit
- meacutemoriser les requecirctes effectueacutees sur le moteur ainsi que les reacutesultats cliqueacutes
- enregistrer votre navigation sur les pages web
Il est alors possible deffectuer des requecirctes sur et agrave linteacuterieur des pages que vous
avez visiteacutees dans le passeacute (sur le texte les images les videacuteos)
Google affiche donc deacutesormais vos requecirctes la date et lheure de la recherche les
reacutesultats cliqueacutes mais aussi les reacutesultats de recherches qui nrsquoont pas geacuteneacutereacute de clics
Par ailleurs ce service va encore plus loin dans la personnalisation et lanalyse de
votre recherche
Avec la fonction Tendances saffichent vos requecirctes les plus courantes vos sites les
plus visiteacutes les reacutesultats que vous avez le plus cliqueacutes
Plus puissante la fonction Eleacutements inteacuteressants ougrave Google vous propose des
requecirctes et des pages web en relation avec vos habitudes de recherche113
En outre si vous activez cet historique Google lutilisera aussi pour agrave moyen
terme personnaliser vos recherches en fonction de vos centres dinteacuterecirct Le
moteur explique
Vos reacutesultats personnaliseacutes seront baseacutes sur vos recherches preacuteceacutedentes ainsi que les
reacutesultats de recherche et les titres agrave la une sur lesquels vous avez cliqueacute
Dans les premiers temps la diffeacuterence ne sera peut-ecirctre pas notable mais agrave mesure
que votre historique de recherches seacutetoffera les reacutesultats obtenus seront de plus en plus
personnaliseacutes
Dailleurs si vous reacutealisez de nombreuses recherches sur Google avec une
connexion agrave votre compte Google activeacutee vous devriez voir safficher de temps agrave
autre ce type de message Nouveau activez votre historique de recherche pour
personnaliser vos reacutesultats
copy Digimind Digimind Services ndash White Paper |67
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ces reacutesultats personnaliseacutes apprenant selon vos inteacuterecircts permettent de reacutepondre
en partie agrave la probleacutematique de deacutesambiguiumlsation lors de requecirctes sur des
homonymes Ce sont les exemples classiques de lavocat (fruit ou juriste ) de
jaguar (voiture ou animal ) ou de puma (articles de sports animal ou heacutelicoptegravere
)
Cocircteacute vie priveacutee tout votre surf part sur les serveurs de Google Aussi vous
pouvez (devez) mettre en pause lenregistrement de votre navigation lorsque cela
vous apparaicirct adeacutequat
Lhistorique de vos requecirctes et de vos reacutesultats sur Google
copy Digimind Digimind Services ndash White Paper |68
Le Web 20 pour la veille et recherche dinformation DIGIMIND
i Les mash-up
Les mash-up sont certainement les nouveauteacutes engendreacutees par les technologies
dites Web 20 les plus spectaculaires Mixage de plusieurs applications provenant
de plusieurs sites (souvent deux) ils permettent de creacuteer un service nouveau et ce
agrave partir de la mise en relation voire du croisement des donneacutees des applications
dorigines En franccedilais Wikipedia parle dapplications composites 114 Ainsi en
mixant la liste des socieacuteteacutes ougrave il fait bon travailler eacutetablie par le magazine Fortune et
une carte des USA issue de Google Maps on obtient une carte qui localise toutes
ces entreprises De mecircme si on meacutelange les donneacutees dun site de meacuteteacuteo agrave une
carte de France le reacutesultat est une carte des tempeacuteratures et des neacutebulositeacutes en
quasi temps reacuteel 115
Concregravetement comment cela fonctionne-t-il Chacune des applications
communique et eacutechange des informations via des API (voir glossaire) Ainsi Yahoo
Maps ou Google Maps ont ouvert leurs interfaces de programmation agrave tous les
deacuteveloppeurs
Les exemples sont tregraves nombreux car les Mashups ont rapidement connu un vif
succegraves aupregraves des deacuteveloppeurs et internautes avertis qui parviennent agrave maicirctriser le
code et les API Les Mashups de cartographie ne sont pas les seules possibiliteacutes mais
ce sont les plus freacutequents tant la geacuteolocalisation est attrayante pour les
professionnels comme pour linternaute novice Nous allons explorer quelques
mashups pour mieux comprendre leur inteacuterecirct
Les mashups cartographiques les plus courants mixent des cartes et des donneacutees
provenant de services sociaux comme Flickr le service de partage de photo de
Yahoo Inc Cest le cas de Tagmaps116 qui affiche en temps reacuteel sur une carte les tags
associeacutes aux photos de lieux mise en ligne sur Flickr Le Mashup Flickrvision 117 fait
encore plus simple il affiche les photos agrave lemplacement de la ville dorigine de
linternaute qui a posteacute limage lagrave aussi en temps reacuteel
Donneacutees statiques et temps reacuteel
Au-delagrave de certains mixages un peu gadget certains Mashups sont vraiment
inteacuteressants pour la surveillance de donneacutees ou la collecte dinformations En effet
on peut trouver deux grands types de visualisation celle de donneacutees statiques (une
liste dadresse dentreprises geacuteolocaliseacutees) et celle dinformations eacutevoluant en
temps reacuteel Cest le cas par exemple du Mashup SpaceCraft Tracking 118 qui permet
copy Digimind Digimind Services ndash White Paper |69
Le Web 20 pour la veille et recherche dinformation DIGIMIND
de visualiser la trajectoire sur le globe terrestre de la navette spatiale ou du
teacutelescope Hubble
Souvent le Mashup exploite des donneacutees de reacutepertoires douvrages de services
publics pour les rendre plus compreacutehensives attrayantes bref plus accessibles 119
- HealthMap rassemble des donneacutees de santeacute publique et des actualiteacutes issues de
plusieurs sources (Google News OMS European Centre for Disease Prevention and
Controlhellip) afin de reacutealiser une carte des maladies infectieuses dans le monde Cette
carte se met agrave jour au fur et agrave mesure de lactualisation des informations
Linteractiviteacute permet de zoomer sur un pays et de seacutelectionner des pathologies en
particulier
-BioDiesel Station Maps affiche sur une carte les stations services ameacutericaines qui
deacutelivrent des biocarburants
-Kartametro superpose le reacuteseau du meacutetro moscovite agrave la carte de la ville On y
visualise aussi les correspondances avec les bus
-Wikimapia mixe les informations relatives agrave des lieux de Wikipedia agrave une carte
Google Maps Reacutesultat la plupart des noms de villes sites ou monuments sont
cliquables et pointent vers les articles de lencyclopeacutedie
Le Mashup HealthMap ici des actualiteacutes sur les maladies infectieuses en Asie geacuteolocaliseacutees
copy Digimind Digimind Services ndash White Paper |70
Le Web 20 pour la veille et recherche dinformation DIGIMIND
-GlobaI Incident Maps affiche sur un planisphegravere les eacuteveacutenements lieacutes au terrorisme
ou les risques agrave partir des informations de sites speacutecialiseacutees mises agrave jour en continu
-Enfin un parfait exemple de visualisation et de surveillance deacuteveacutenements en temps
reacuteel DartMaps indique lemplacement des trains de banlieue de Dublin
Mais certains Mashup en minoriteacute certes nexploitent pas de donneacutees
cartographiques Cest le cas de Delexaorg 120 un outil qui mixe les bookmarks
sociaux de Delicious aux donneacutees statistiques dAlexa Delexa va en effet afficher les
tags de Delicious associeacutes aux statistiques de freacutequentation des 50 000 premiers
sites web US fournis par Alexa (agrave partir des donneacutees transmises par les barres
doutils Alexa installeacutees par les internautes) Un tel outil est inteacuteressant notamment
pour se familiariser avec les tags et Delicious mais surtout pour deacutecouvrir quels
sont les sites dinfluence et populaires dans un secteur On peut eacutegalement observer
la correacutelation ou non entre nombre de tags et donneacutees de freacutequentation Alexa
Cocircteacute moteur de recherche les mashups Molu et Gnosh fournissent des
meacutetamoteurs reacutealiseacutes agrave partir du mixage de dizaines doutils de recherche121
Des ressources
Comment trouver des mashups Comme pour de nombreuses informations sur le
web des annuaires speacutecialiseacutes 122 sont apparus Ils reacutepertorient aussi bien des API agrave
destination des deacuteveloppeurs que des mashups WebMashup auto-proclameacute Open
Directory for Mashups et Web 20 APIs en liste des centaines ProgrammableWeb
lun de sites de reacutefeacuterence dans le domaine en propose plus de 1800 sous la forme
dun reacutepertoire et eacutegalement dune matrice permettant de visualiser clairement le
croisement de deux applications ou plus Mashup Feed liste aussi des mixages
populaires
Des blogs sont eacutegalement centreacutes sur ces pratiques Google Maps Mania123 recense
de nombreux Mashups cartographiques
Ces Mashups sont un beau symbole de ce web nouvelle geacuteneacuteration on ne lit plus
seulement de linformation statique de maniegravere passive Deacutesormais on est agrave la fois
fournisseur et spectateur en temps reacuteel des contributions de communauteacutes Le tout
copy Digimind Digimind Services ndash White Paper |71
Le Web 20 pour la veille et recherche dinformation DIGIMIND
gracircce agrave des interfaces reacutealiseacutees par des deacuteveloppeurs agrave partir de code ouverts de
grandes socieacuteteacutes Le succegraves est notamment provoqueacute par la possibiliteacute de mixage
entre des donneacutees du monde reacuteel et des informations ou fichiers posteacutes sur le net
Les internautes peuvent donc maintenant se rassembler par centres dinteacuterecirct mais
eacutegalement par proximiteacute geacuteographique Je recherche un speacutecialiste de linformation
sur les biocarburants situeacutes agrave moins de 10 km de chez moi
Par ailleurs on peut imaginer agrave terme des applications meacutelangeant les donneacutees de
centaines de fichiers et bases de donneacutees On en est certes aux preacutemisses mais le
mashup Alkemis 124 en est deacutejagrave un bon exemple il affiche sur une carte de New
York des donneacutees provenant dA9 OpenSearch Delicious Flickr Google Maps et
Yahoo Traffic Reacutesultat la possibiliteacute de visualiser en une seule interface un eacutetat du
trafic routier via des cameacuteras de surveillance la meacuteteacuteo les actualiteacutes locales ou les
liens Delicious en rapport avec la villehellip
copy Digimind Digimind Services ndash White Paper |72
Le Web 20 pour la veille et recherche dinformation DIGIMIND
III Diffuser
Avec lapparition des applications collaboratives et des plateformes de blogs la
faciliteacute de publication sur le web sest accrue Tout individu mecircme sans
connaissances techniques peut publier et diffuser son propre contenu sur un blog
un wiki et via des fils RSS
a Les Blogs et le flux RSS
Il suffit de 5 minutes pour sinscrire agrave une plateforme de blogs et commencer agrave
eacutecrire Ces plateformes proposent des services de bases gratuits et des
fonctionnaliteacutes plus avanceacutees neacutecessitant un abonnement Ces services qui
permettent de creacuteer maintenir et heacuteberger votre blog sont nombreux Parmi les
prestataires de qualiteacute on peut citer Blogger (qui appartient agrave Google) TypePad et
Vox (de la socieacuteteacute SixApart) Overblog Viablog Haut et Fort ou BlogSpirit 125 Bien
dautres socieacuteteacutes proposent des services de creacuteation et dheacutebergement126 Des
comparatifs sont disponibles en ligne127
Nous lavons vu le format RSS permet de diffuser tregraves facilement le contenu de son
blog utilisant le XML (un html eacutepureacute) langage natif du blog chaque carnet web
comporte un fils RSS permettant aux visiteurs de sabonner agrave vote blog et de
recevoir instantaneacutement toute nouvelle publication actualiteacutes billets podcast ou
videacuteos Par ailleurs des services comme Feedburner128 permettent de rendre
compatibles vos flux RSS avec la majoriteacute des lecteurs RSS outils dont nous
reparlerons plus loin
La creacuteation de sites internet classiques sest elle aussi consideacuterablement simplifieacutee
un outil tel que Google Page Creator129 permet de creacuteer un site simple en 1 heure
Des sites plus sophistiqueacutes sont eacutegalement abordables sans avoir agrave connaicirctre une
ligne de programmation de html gracircce au perfectionnement des eacutediteurs dits
WYSIWYG ce que vous voyez quand vous construisez votre page est ce que vous
obtiendrez en ligne
Les outils Web 20 permettent agrave des speacutecialistes journalistes ou salarieacutes de diffuser
leur contenu Il y a encore 2 ans ils eacutetaient pour la plupart eacutecarteacutes de la publication
web faute de bagage technique
copy Digimind Digimind Services ndash White Paper |73
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Depuis le deacuteveloppement des blogs agrave partir de lautomne 2001 il est possible pour
tout internaute de diffuser sa propre information Au-delagrave des blogs dadolescents
et autres carnets intimes le web regorge de blogs agrave tendance professionnelle
corporate produits marketing experts politiques ressources humaines Cest
autant de sources potentielles quil faut exploiter afin de capter des sources
primaires de qualiteacute Le volume des blogs publieacutes et maintenus chaque jour est lui
aussi en constante augmentation
Le White Paper Blogs et RSS des outils pour la veille strateacutegique deacuteveloppe les
aspects inteacuteressants des blogs pour le professionnel de linformation130
b Les Wikis
Le wiki est finalement diffeacuterent du blog de par sa nature et son utilisation Selon
Wikipedia le Wiki est un site Web dynamique permettant agrave tout individu den
modifier les pages agrave volonteacute Il permet de communiquer et diffuser des informations
rapidement de structurer cette information pour permettre dy naviguer
commodeacutement (Wiki vient du terme hawaiien wiki wiki =rapide ou informel)
Lagrave ougrave le blog sera adapteacute agrave la diffusion dactualiteacute et de contenu se renouvelant
freacutequemment le wiki sera davantage deacutedieacute agrave du texte plus statique mais neacutecessitant
ou pouvant senrichir de la collaboration de plusieurs personnes Ainsi les articles
dune encyclopeacutedie ou les fiches correspondants aux diffeacuterentes phases dun projet
impliquant de nombreux collaborateurs pourront ecirctre reacutealiseacutees sous forme de
Wiki
Sur un blog laffichage du contenu est anteacute-chronologique (le plus reacutecent en haut)
sur un wiki il est structureacute en rubriques larchitecture comme le contenu pouvant
ecirctre modifieacutes agrave tout moment par les participants Ceux-ci peuvent beacuteneacuteficier de
droits daccegraves et de modification hieacuterarchiseacutes
Les versions anteacuterieures ainsi que les modifications sont accessibles via une rubrique
Historique Sur un blog le visiteur peut collaborer mais uniquement via ses
commentaires Sur un wiki tout collaborateur autoriseacute peut modifier le texte
comme le titre et lorganisation des rubriques
Par ailleurs la prise en main dun wiki et de ses syntaxes denrichissement et
modification demande un peu de pratique et nest pas aussi simple que le
maniement dun blog Le wiki est un des outils ideacuteaux pour la gestion de projet
Certaines entreprises les utilisent en tant que tel (parfois en parallegravele avec les blogs)
pour eacuteviter des eacutechanges des recherches et un archivage via les mails fastidieux
copy Digimind Digimind Services ndash White Paper |74
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Geacutereacute via des droits daccegraves gradueacutes il peut alors se reacuteveacuteler comme un outil tregraves
simple agrave manier et agrave sapproprier Ces wikis seront eacutevidemment reacuteserveacutes agrave
lentreprise en accegraves priveacute
Exemples de wikis publics
gt Wikipedia131
Le wiki le plus connu est Wikipedia lencyclopeacutedie collaborative gratuite dont le
contenu est creacuteeacute et maintenu par des milliers dinternautes beacuteneacutevoles Chacun est
libre de creacuteer un article modifier ceux des autres ou les commenter En mai 2007
lencyclopeacutedie proposait plus de 7 millions darticles dans 192 langues et dialectes
dont plus de 500 000 en franccedilais Wikipedia jouit dune populariteacute et dun succegraves
tregraves important Google indexe de nombreux articles de Wikipedia agrave tel point quil
est rare deffectuer une recherche sur le moteur sans voir safficher une deacutefinition
issue de lencyclopeacutedie Selon la socieacuteteacute de mesure daudience Comscore en janvier
2007 Wikipedia eacutetait le 9egraveme site US le plus visiteacute (derriegravere les sites Yahoo
premiers puis les sites Time Warner Microsoft Google eBay Fox Interactive
Amazon et Ask) 6 groupes eacuteditant un moteur geacuteneacuteraliste (Google Ask Microsoft
Yahoo Amazon et AOL) occupent le top10 US Mais cest la premiegravere fois quun
site collaboratif truste les premiegraveres places des sites les plus visiteacutes
Wikipedia comme tout service leader est tregraves critiqueacute Notamment sur la
possibiliteacute pour tout un chacun de modifier et de creacuteer des articles pouvant
entraicircner des risques de diffamation ou de vandalisation 132 Mecircme si ces risques
sont reacuteels nous le verrons dans la partie consacreacutee aux limites du Web 20 il ne
faut pas pour autant se focaliser sur ces problegravemes
Par ailleurs on a souvent mis en cause la qualiteacute des articles du contenu eacutemanant
dinternautes pas forceacutement qualifieacutes ou experts et donc par nature douteux Or
une eacutetude commandeacutee par la Revue Nature agrave remis en cause ce type de ressenti
des experts ont compareacute 42 documents publieacutes sur Wikipedia et sur la ceacutelegravebre
Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche133
Seulement 8 erreurs seacuterieuses comme des mauvaises interpreacutetations de concepts
ont eacuteteacute repeacutereacutees dans les articles analyseacutes 4 pour chaque encyclopeacutedie Des
erreurs factuelles omissions ou fausses descriptions ont eacutegalement eacuteteacute deacutetecteacutees
162 dans Wikipedia et 123 dans lEncyclopaedia Britannica
Le succegraves et limportance de Wikipedia nont pas eacutechappeacute aux moteurs de
recherche qui sont plusieurs agrave secirctre speacutecialiseacutes dans la recherche sur lencyclopeacutedie
Ainsi WikiSeek 134 est un moteur lanceacute deacutebut 2007 qui recherche sur le contenu de
Wikipedia Il indexe le contenu en crawlant les pages en profondeur et aspire
eacutegalement le contenu des liens preacutesents sur les pages de lencyclopeacutedie
copy Digimind Digimind Services ndash White Paper |75
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Plus eacutelaboreacute le moteur franccedilais Exalead 135 enrichit consideacuterablement la recherche
dans lencyclopeacutedie en ligne Cette fonctionnaliteacute est accessible en cliquant sur
longlet Wikipedia Il est eacutevidemment possible de rechercher des articles par mots
cleacutes mais aussi daffiner par langue via le nuage de tags dynamique ( les eacutetiquettes
correspondent agrave des emplacements geacuteographiques personnes ceacutelegravebres noms
drsquoorganisations termes lieacutes agrave votre requecircte ou cateacutegories de Wikipedia)
WikiMindmap 136 recherche sur Wikipedia et affiche les reacutesultats sous forme de
MindMap (cartes heuristiques) Il est alors possible de naviguer dans larborescence
des termes
WikiMindMap
gt Citizendium 137 Lanceacute fin 2006 Citizendium est une initiative de Larry Sanger co-fondateur de
Wikipedia avec Jimmy Wales Citizendium est eacutegalement une encyclopeacutedie Mais
jugeant la communauteacute Wikipedia senseacutee srsquoauto-reacuteguler dysfonctionnelle Larry
Singer integravegre dans Citizendium des proceacutedures de seacutelection des articles par des
experts et refuse aux contributeurs la possibiliteacute de lrsquoanonymat misant ainsi sur la
responsabilisation Le collegravege dexperts a le dernier mot concernant la veacuterification
des articles le but eacutetant dobtenir une encyclopeacutedie contenant le moins derreurs
possible Citizendium est structureacutee en grandes cateacutegories acadeacutemiques
correspondant agrave des groupes de travail Sciences naturelles Sciences Humaines
Arts Sciences Humaines Divertissement Arts appliqueacutes et Sciences
copy Digimind Digimind Services ndash White Paper |76
Le Web 20 pour la veille et recherche dinformation DIGIMIND
gt Alacrawiki 138
AlacraWiki est un guide deacutedieacute aux socieacuteteacutes du secteur de linformation eacutediteurs et
bases de donneacutees La rubrique Alacra Industry Spotlights est particuliegraverement
remarquable elle fournit des analyses et commentaires sur les sites dinteacuterecirct pour
une trentaine de secteurs industriels Le wiki offre des informations sur les
agreacutegateurs de contenu les bases de donneacutees et les meilleurs blogs deacutedieacutes au
secteur de linformation on-line Alacra propose aussi un blog et un fils RSS
Alacra Wiki
gt Les fils RSS 139
Sur cette page de wiki vous trouverez agrave peu pregraves tout sur le RSS
La norme comment utiliser les fils RSS des articles une seacutelection dagreacutegateurs
mixer des fils RSS entre eux mesurer lactiviteacute des fils RSS creacuteer un fil RSS
gtWikidweb 140
Wikidweb est un Wiki qui propose un reacutepertoire de sites web (et non de wikis)
Aussi vous pouvez y participer selon les fonctionnaliteacutes courantes du format wiki
vous avez ainsi la possibiliteacute dy ajouter vos propres sites mais eacutegalement de
modifier les entreacutees des autres internautes (urls texte) ou de les commenter
copy Digimind Digimind Services ndash White Paper |77
Le Web 20 pour la veille et recherche dinformation DIGIMIND
IV Surveiller
Nous lavons vu dans la partie Recherche de blogs et de flux RSS les flux RSS sont
preacutesents sur de nombreux formats du net et vont permettre de surveiller les
nouveauteacutes apparaissant sur les blogs les sites corporate les sites de presse dans
les reacutesultats de moteurs de recherche dactualiteacutes de blogs web dans les
newsgroups sur certains forums web sur certaines listes de diffusion les
bookmarks sociaux les sites de partage de photos et de videacuteoshellipbref sur de tregraves
nombreux sites classiques et ressources collaboratives de type 20
Ces flux RSS peuvent ecirctre inteacutegreacutes agrave votre process de veille en deux clics via des
outils simples gratuits ou payants mais plus puissants
a La deacutetection du flux RSS
Pour pouvoir mettre en surveillance le flux RSS (RSS Feed en anglais) il faut dabord
le trouver Or il nest pas toujours aiseacute de mettre la main sur ces petits logos
oranges ou les liens RSS Abonnez-vous Syndiquez ce flux qui pointent vers les
flux RSS parfois cacheacutes dans les meacuteandres des pages web
Des icocircnes signalant la preacutesence de flux RSS
Certains navigateurs permettent de deacutetecter automatiquement les flux lorsquils
sont preacutesents sur une page web Une icocircne vous avertira alors et dans la plupart
des cas affichera ladresse du ou des flux disponibles sur la page Plusieurs formats
de flux peuvent coexister les diffeacuterentes versions du RSS (090 091 092 10 20)
et le format ATOM concurrent mais offrant les mecircmes fonctionnaliteacutes
Internet Explorer 7 Opera Firefox permettent de deacutetecter les flux Cest aussi le cas
de Maxthon une puissante interface de navigation qui vient se greffer sur
larchitecture dInternet Explorer 141
copy Digimind Digimind Services ndash White Paper |78
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b La mise en surveillance
Quelque soit laspect de la page qui contient votre flux RSS (xml rdf interface
Feedburner) il convient de copier et coller ladresse (url) dans loutil qui va vous
servir agrave lire ce flux et agrave ecirctre alerteacute degraves lors quune nouveauteacute apparaicirct
4 grands types doutils peuvent ecirctre utiliseacutes (du plus simple au plus sophistiqueacute)
- Les navigateurs web
Les navigateurs citeacutes preacuteceacutedemment outre la deacutetection du flux RSS permettent de
sy abonner et de les lire Les flux sintegravegrent alors dans un menu lateacuteral ou dans la
page principale Cest simple mais deacutepourvu de fonctions avanceacutees de tri ou
dorganisation
- Les lecteurs (ou agreacutegateurs) de flux RSS
Ce sont les outils deacutedieacutes aux fils RSS Comme de nombreuses applications ces
lecteurs sont soit disponibles en ligne soit agrave installer localement sur votre PC
- Exemples de lecteurs RSS en ligne Bloglines Pluck Newsgator
- Exemples de lecteurs RSS installeacutes RSS Reader Amphetadesk Newsgator (sintegravegre
agrave Outlook) FeedDemon
Le lecteur Bloglines exploite de maniegravere astucieuse la logique communautaire
lorsque vous ecirctes abonneacute agrave un flux RSS vous pouvez visualiser les autres abonneacutes
(ceux qui ont accepteacute de rendre leur abonnement public) Un clic sur leur nom
affiche tous les fils RSS auxquels ils ont souscrits un moyen rapide de deacutecouvrir
dautres ressources pertinentes collecteacutees par des internautes proches de vos
centres dinteacuterecirct
Les lecteurs RSS sont tregraves nombreux Pour mieux les distinguer certains blogs ou
sites proposent des comparatifs142
copy Digimind Digimind Services ndash White Paper |79
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La communauteacute sur Bloglines les abonneacutes au flux RSS du blog Voip Weblog
- Les pages personnalisables
Ce sont des pages web geacuteneacuteralement organiseacutees en onglets et boicirctes permettant
dorganiser et de ranger ses flux par cateacutegories et ce dans un mecircme espace Ces
services sont ergonomiques et ideacuteaux pour lire dun coup doeil le maximum de flux
Les plus connus sont NetVibes PageFlakes ou Webwag
Outre la lecture de flux RSS ces pages offrent la possibiliteacute dinteacutegrer des services
de meacuteteacuteo mail bloc-notes et des flux provenant de service sociaux comme les
bookmarks ou les reacuteseaux damis
Certains blogs fournissent des listes et comparatifs de ces services143
- Les progiciels de veille inteacutegreacutes
Face agrave labondance des flux RSS et blogs des applications de veille inteacutegreacutee comme
Digimind Evolution 144 donnent la possibiliteacute de filtrer les RSS via lapplication de
requecirctes diffeacuterentes sur chaque fils RSS
On peut ainsi seacutelectionner les informations agrave remonter via des requecircte simples ou
plus complexes (booleacuteens parenthegraveses troncatures et opeacuterateurs de proximiteacute) agrave
longueur illimiteacutee En outre il est possible de surveiller jusquagrave 10 000 flux RSS
quotidiennement
Les boutons inteacutegreacutes
Certains sites vont vous simplifier la tacircche ils affichent sur leurs pages agrave coteacute de
leurs flux des boutons qui permettent dajouter directement le flux agrave votre lecteur
copy Digimind Digimind Services ndash White Paper |80
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ainsi le service dactualiteacutes Wikio ou le moteur Ask Blogs amp Flux proposent tous
deux des boutons vers Bloglines MyYahoo Google Reader Newsgator et Ask Blog
Les fichiers OPML
LOPML (Outline Processor Markup Language) est un format deacuteveloppeacute en XML qui
permet leacutechange dinformations structureacutees entre applications fonctionnant sur des
OS et environnement diffeacuterents Exemple les abonnements dun internaute agrave un
ensemble de flux RSS entre un navigateur Firefox et Internet Explorer de MacOS agrave
Windows XP
Des agreacutegateurs RSS comme Bloglines NewsGator ou Rojo offrent la possibiliteacute
dexporter lensemble de vos flux RSS favoris ou ceux dautres abonneacutes au format
OPML pour les importer ensuite dans votre agreacutegateur
Share your OPML145 est comme son nom lindique un portail qui vous permet de
partager vos flux RSS au format OPML Ce service liste des centaines de fichiers
OPML
c Pourquoi une veille via le RSS
Faire une veille via les fils RSS preacutesente des inteacuterecircts notables
- Lhyper-segmentation le choix des fils RSS rend possible une seacutelection fine de
linformation Ainsi sur le site du Figaro on peut choisir lactualiteacute internationale
nationale les sciences et meacutedecine eacutevitant ainsi decirctre submergeacute par linformation
superflue Sur La Tribune on peut seacutelectionner un flux par socieacuteteacute
Certains blogs proposent mecircme des flux RSS permettant aux choix de surveiller les
commentaires ou uniquement les billets
- Un gain de temps inutile de se connecter au site au blog ou au moteur de
recherche pour visualiser ses nouveauteacutes
- Lanonymat labonnement agrave un flux RSS contrairement agrave une newsletter ou agrave une
liste de diffusion est anonyme
- La consultation aiseacutee vos fils RSS via une lecture sur un agreacutegateur en ligne sont
accessibles de nimporte quel PC connecteacute agrave linternet ougrave que vous soyez
copy Digimind Digimind Services ndash White Paper |81
Le Web 2
copy Digimin
0 pour la veille et recherche dinformation DIGIMIND
d Digimind Services ndash White Paper
V Carte des outils et ressources Web 20
gt Page suivante
|82
wwwdigimindcom Digimind Services ndash White Paper|83
Carte des outils et ressources Web 20 - DIGIMIND Services 2007
Le Web 20 pour la veille et recherche dinformation DIGIMIND
EXEMPLE DUNE RECHERCHE ET VEILLE VIA LE WEB 20
Cas drsquoeacutecole Nous avons agrave mener une recherche et une veille sur le
deacuteveloppement des smartphones ou teacuteleacutephones multimeacutedias haut de gamme Des
sites de type 20 pourront se reacuteveacuteler compleacutementaires de sites classiques (sites
drsquoentreprises portails associations professionnelleshellip) pour deacutetecter les tendances
et sujets eacutemergents
Une premiegravere recherche via lrsquoencyclopeacutedie Wikipedia permettra drsquoobtenir une
premiegravere deacutefinition du sujet et drsquoidentifier les principaux mots cleacutes ainsi que des
liens vers des sites pertinents
Etape suivante nous pourrons eacutelargir notre recherche en identifiant des sites
similaires aux sites trouveacutes preacuteceacutedemment via les suggestions fournies par des
moteurs collaboratifs tels que Yoono ou Similicious
Une recherche sur le tag Smartphone dans des sites de social bookmarking
comme Delicious nous permettra eacutegalement drsquoidentifier les pages plus ou moins
populaires taggeacutees par les contributeurs du site ainsi que drsquoautres tags en relation
avec notre sujet
Explorons ensuite les avis drsquoexperts plus ou moins autoriseacutes que lrsquoon trouvera dans
les meacuteandres de la blogosphegravere gracircce agrave des moteurs de blogs comme Technorati
Blogpulse ou Google Blog Search
La recherche pourra srsquoeffectuer via les tags ou le texte inteacutegral des billets On
pourra ensuite parcourir les blogrolls des auteurs les plus pertinents afin drsquoidentifier
drsquoautres sources
La lecture des blogs fournira non seulement des avis de speacutecialistes ou journalistes
mais aussi des avis plus ou moins critiques de consommateurs ou utilisateurs de
smartphoneshellip
Il conviendra toutefois de rester vigilant quant agrave lrsquoeffet pot de miel de certains
blogs ougrave les contributions des internautes se reacutevegravelent ecirctre de simples messages
publicitaires deacuteguiseacutes (voir agrave ce sujet la mise en garde du site UFC Que choisir146)
Pour recueillir les derniegraveres informations drsquoactualiteacute on pourra utiliser un
agreacutegateur tel que Wikio ou Digg et creacuteer un flux RSS agrave partir drsquoune requecircte sur les
copy Digimind Digimind Services ndash White Paper |84
Le Web 20 pour la veille et recherche dinformation DIGIMIND
tags preacuteceacutedemment identifieacutes Wikio propose des raccourcis pour inteacutegrer ce flux
au sein de plusieurs lecteurs RSS du marcheacute (Netvibes Newsgator Google Reader
etc)
Les reacuteseaux sociaux professionnels permettront eacutegalement drsquoidentifier des acteurs
importants du domaine dans les sphegraveres universitaires ou de lrsquoentreprise
La communauteacute 20 srsquoexprimera eacutegalement sur les grands portails consacreacutes aux
nouvelles technologies Crsquoest le cas par exemple du portail ZDNet qui permet aux
utilisateurs de commenter les articles ou de les ajouter directement agrave leur profil
Delicioushellip Les commentaires ou les trackbacks pointant sur un article pourront
constituer un preacutecieux compleacutement drsquoinformations
Afin de mener une veille reacuteguliegravere sur le sujet on syndiquera les flux RSS provenant
des diffeacuterents sites ou blogs identifieacutes Pourquoi ne pas eacutegalement creacuteer agrave partir de
ce bouquet de sources personnaliseacutees un moteur sur mesure conccedilu gracircce agrave Rollyo
ou Yahoo Search Builder
copy Digimind Digimind Services ndash White Paper |85
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les limites du Web 20
LA PARTICIPATION
I Une participation heacuteteacuterogegravene
Nous lavons deacutejagrave eacutevoqueacute tout le monde ne participe pas de la mecircme maniegravere sur
les applications du Web 20
Une minoriteacute participativehellip
Bill Tancer de la socieacuteteacute de mesure daudience Hitwise reacutevegravele dans une eacutetude147
que sur les sites type Web 20 les internautes regardent mais participent peu
Seulement 016 des visiteurs du site YouTube viennent y partager leurs videacuteos
Les 9984 restant ne font que regarder Idem pour le site de partage de photos
de Yahoo Flickr seulement 02 des visites conduisent agrave la publication de photos
Wikipedia est lexception sur lencyclopeacutedie collaborative gratuite 46 des
visites correspondent agrave une modification des articles
Sur ces sites on est donc encore loin de la regravegle de la 11089 eacutedicteacutee par Charles
Arthur dans The Guardian148 Il estime que sur le net sur un groupe de 100
personnes si une creacutee du contenu 10 vont interagir (commentaires
ameacuteliorations) et les 89 restant ne feront que le lire et regarder Le journaliste
lillustre via des exemples quantifieacutes avec YouTube Wikipedia ou Yahoo Groups
Most Web 20 Users Are Really Just Couch Potatoes Bruce Nussbaum compare
mecircme les internautes Web 20 aux spectateurs de TV passifs et affaleacutes dans leurs
canapeacutes149
Mais parallegravelement les sites de type Web 20 ont vu leur audience grimper
de668 en 2 ans reacutevegravele leacutetude Hitwise Cela repreacutesente 12 du trafic web aux
USA contre 2 il y a seulement 2 ans
Les sites de partage de photos sont parmi les plus populaires Flickr bien sucircr mais
aussi PhotoBucket qui repreacutesente agrave lui seul 41 du trafic des sites de photos en
ligne
copy Digimind Digimind Services ndash White Paper |86
Le Web 20 pour la veille et recherche dinformation DIGIMIND
hellipdautant plus que la forme de participation se complexifie
Dapregraves le cabinet Forrester les internautes sont nombreux sur les actions agrave faible
niveau dexigence (lire enregistrer un signet commenter) mais beaucoup moins sur
des participations plus actives (eacutecrire collaborer) 150
Wikipedia un faux modegravele collaboratif
On cite souvent lencyclopeacutedie Wikipedia en exemple cest lun des emblegravemes les
plus forts et les plus lus du Web 20 Son mode de fonctionnement est
caracteacuteristique voire symptomatique du web collaboratif Mais le process de
Wikipedia serait finalement tregraves classique avec une hieacuterarchie de contributeurs
sorte de cadres disposant de nombreux droits eacutecrivant la majoriteacute des articles
Cest lanalyse de Lionel Barbe du CNRS151 Il explique que si le principe de liberteacute
de publication sur Wikipedia reste valable il est de moins en moins commun car
la plupart des entreacutees basiques ne precirctant pas agrave discussion ont deacutejagrave eacuteteacute effectueacutees
Lrsquoeacutetude des laquo logs raquo historiques montre que la creacuteation de nouvelles entreacutees qui
correspondent agrave de nouvelles pages articles dans la Wikipedia Francophone ne
concerne qursquoenviron 3 agrave 4 des opeacuterations Par comparaison cette proportion tombe
agrave 2 pour la version anglaise de Wikipedia qui contient plus de 1 million drsquoarticles A
lrsquoinverse la proportion monte entre 8 et 10 pour des Wikipedias ayant moins de
100 000 articles comme la Wikipedia en Lituanien et bien drsquoautres
Selon lui on assiste agrave un effet de professionnalisation de lencyclopeacutedie [hellip] les
plus gros contributeurs que nous consideacutererons comme eacutetant les 5 des individus
eacuteditant le plus drsquoarticles eacuteditent entre 85 et 95 du contenu total de lrsquoencyclopeacutedie
Au fur et agrave mesure ces gros contributeurs acquiegraverent des privilegraveges comme le statut
drsquoadministrateur qui leur permettent non seulement de participer mais aussi de
surveiller et le cas eacutecheacuteant censurer le contenu eacutediteacute par les autres contributeurs et de
participer aux grandes lignes de lrsquoorganisation de Wikipedia
Cette analyse a toutefois eacuteteacute battue en bregraveche par Aaron Swartz dans une petite
eacutetude 152 En mesurant non pas le nombre drsquointerventions de chaque contributeur
mais la quantiteacute de texte produit par chacun la reacutealiteacute est diffeacuterente les
contributeurs occasionnels eacutecriraient des textes longs en peu dinterventions tandis
que les eacutediteurs actifs reacutealiseraient un travail tenant davantage de la maintenance
(correction veacuterification suppression) mais sans apporter beaucoup de texte
copy Digimind Digimind Services ndash White Paper |87
Le Web 20 pour la veille et recherche dinformation DIGIMIND
II Une participation damateurs
Tout internaute peut-il simproviser journaliste expert commentateurhellip
Michel Fingerhut 153 voit dans le succegraves dune encyclopeacutedie comme Wikipedia une
manifestation du web comme heacutegeacutemonie de lrsquoamateurisme et comme encouragement
agrave lrsquoextreacutemisme ideacuteologique et au communautarisme
Les contenus creacuteeacutes et diffuseacutes sont-ils de qualiteacute Le Web 20 devient une
plateforme qui stimule la creacuteativiteacute et la production de contenu par cela mecircme
qursquoelle en permet la diffusion (avec indice de notorieacuteteacute) On assiste agrave une libeacuteration
de talents qui peuvent enfin se reacuteveacuteler parallegravelement agrave des productions
caracteacuteriseacutees par un certain amateurisme et lrsquoabsence de veacuteritable ambition
creacuteatrice Car comme sur lensemble de linternet sur ce Web 20 le pire cocirctoie le
meilleur
Par ailleurs toujours en prenant lexemple de Wikipedia un certain nombre de
pheacutenomegravenes se reacutevegravelent tout de mecircme preacuteoccupants
Si leacutetude reacutealiseacutee pour le magazine Nature reacutevegravele que la qualiteacute des articles de
lencyclopeacutedie est presque au niveau de celle de lEncyclopaedia Britannica certains
articles de Wikipedia relegravevent de la deacutesinformation ou de la propagande
- larticle Droits de lHomme en Iran154 a ainsi eacuteteacute tregraves controverseacute en effet cet
article tregraves long de plus de 20 pages se preacutesente davantage comme une apologie du
reacutegime iranien quune analyse argumenteacutee des droits de lhomme dans ce pays Or
certainement au nom du principe de neutraliteacute qui reacutegit Wikipedia cet article
tendancieux a eacuteteacute classeacute comme article de qualiteacute 155
- le cas Seigenthaler 156 en mai 2005 un contributeur publie anonymement sur
Wikpedia un article sur John Seigenthaler Sr un eacutecrivain ceacutelegravebre aux USA Or ce
billet mentionne que leacutecrivain a eacuteteacute directement impliqueacute dans les assassinats de
John et Bob Kennedy en preacutecisant toutefois que rien na jamais eacuteteacute prouveacute Cette
information est tout simplement fausse Mais larticle nest deacutecouvert (par un ami de
John Seigenthaler) et corrigeacute que 4 mois plus tard mettant agrave mal la creacutedibiliteacute de
lencyclopeacutedie A la suite de cette affaire largement relayeacutee par les meacutedias
ameacutericains le fondateur de Wikipedia a rigidifieacute les regravegles de publication concernant
les tout nouveaux contributeurs
Certes sur les milliers darticles mis en ligne par Wikipedia ces dysfonctionnements
restent heureusement minoritaires mais ils reacutevegravelent tout de mecircme certaines limites
du tout collaboratif et la neacutecessiteacute de regravegles de publication emprunteacutees aux meacutedias
classiques
copy Digimind Digimind Services ndash White Paper |88
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Lagreacutegation de petites choses faciles
Elles ont tendance agrave dominer le contenu du Web 20 La faciliteacute de publication le
rythme des blogs qursquoil convient drsquoalimenter freacutequemment peut entrer en conflit
avec le temps de la recherche et de la reacuteflexion Souvent les thegravemes traiteacutes ne
peuvent degraves lors ecirctre que des sujets du quotidien des opinions non reacutefleacutechies non
argumenteacuteeshellipOn peut donc craindre agrave linstar du mode de diffusion sur dautres
meacutedias quinteacutegreacute agrave un reacuteseau social noteacute eacutevalueacute agrave la recherche de notorieacuteteacute et de
visibiliteacute le creacuteateur de contenu ait tout inteacuterecirct agrave aller dans le sens de son audience
produire du divertissant plus agrave mecircme de lui garantir un succegraves immeacutediat
Par ailleurs des opinions peuvent-elles se transformer en jugement pertinent par
lrsquoeffet de leur agreacutegation Lrsquoagreacutegation drsquoune quantiteacute importante drsquoavis peut elle
vraiment deacutepasser lrsquoimpreacutecision des avis pris indeacutependamment Peut-on sans une
harmonisation des critegraveres drsquoappreacuteciation atteindre un jugement collectif fiable Les
tendances qui ressortent risquent en effet de se limiter souvent au reflet de
lrsquoopinion majoritaire
Mais leacutevocation de ces limites ne doit pas occulter toutes les contributions matures
produites par des internautes soucieux dapporter un contenu veacuteritablement
constructif Les billets et les commentaires de nombres de blogs politiques franccedilais
en 2007 en sont une parfaite illustration
LE WEB 10 RESTE NECESSAIRE
Le mail reacutesiste
Nous lavons vu au cours de la description des applications pour la veille les services
Web 20 ne sont pas suffisants en soit pour la recherche dinformation De plus
bien que ses possibiliteacutes soient tregraves puissantes lutilisation du Web 20 reste encore
marginale agrave leacutechelle de tous les internautes Une eacutetude du cabinet Pew Internet 157
montre que lactiviteacute internet dominante sur une journeacutee type dun ameacutericain reste
tout simplement le mail 53 des internautes lutilisent Ils sont 38 agrave utiliser un
moteur de recherche Par contre ils ne sont que 8 agrave creacuteer des blogs et 26 agrave
partager des photos et videacuteos cette collaboration multimeacutedia eacutetant de loin lactiviteacute
la plus courante du Web 2
copy Digimind Digimind Services ndash White Paper |89
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une enquecircte en ligne de lUniversiteacute dOxford reacutealiseacutee aupregraves de 1469 personnes
(une majoriteacute deacutetudiants) fin 2006 deacutetaille les usages du Web 20 158 Elle reacutevegravele elle
aussi que les applications de ce web nouvelle geacuteneacuteration sont encore peu connues
et peu utiliseacutees La majoriteacute des reacutepondants na jamais employeacute ou jamais entendu
parleacute des fils RSS ou des applications de Social Bookmarking comme Delicious
Aussi linfluence grandissante du Web 20 ne doit pas masquer les usages
traditionnels du web qui restent majoritaires
Une population souvent isoleacutee et non repreacutesentative
Lage
Si de nombreuses applications sociales apportent un reacuteel progregraves il faut tempeacuterer
la nature de certains contenus issus du mode collaboratif celui-ci nest en effet pas
repreacutesentatif des internautes puisque le public du Web 20 est une population plutocirct
jeune
Ainsi leacutetude Pew Internet reacutevegravele que laudience de Wikipedia aux USA eacutetait en aoucirct
2006 agrave 47 situeacutee dans la tranche des 18-34 ans Les plus de 45 repreacutesentaient
28 Sur le site dEncarta lencyclopeacutedie de Microsoft plus traditionnelle (Web 10)
la part des plus de 45 ans atteint 33
Des communauteacutes isoleacutees structureacutees en icircles Les communauteacutes actuelles du Web 20 sont souvent renfermeacutees sur elles-mecircmes
les statistiques sur les liens pointant vers les blogs et sur les liens preacutesents dans les
billets reacutevegravelent que les blogueurs se lient et se lisent beaucoup entre eux
Lrsquointernaute Web 20 aurait donc tendance agrave senfermer sur lui-mecircme et autour
dindividus feacutedeacutereacutes en communauteacutes focaliseacutes sur les mecircmes centres drsquointeacuterecirct que
lui
Par ailleurs lhyper segmentation et le ciblage des nouvelles rendu possible par le
flux RSS notamment peut conduire agrave favoriser ces microcosmes communautaires
Parcourir un journal papier peut favoriser davantage louverture la prise de recul et
la mise en perspective des diffeacuterentes informations que la lecture de flux aux
theacutematiques tregraves speacutecialiseacutees
Les diffeacuterentes communauteacutes par reacuteflexe et de par la nature des applications Web
20 qui se dupliquent mais ne se connectent pas ont tendance agrave peu communiquer
entre elles Ainsi les liens entre reacuteseaux sociaux sont rares Peu de personnes
copy Digimind Digimind Services ndash White Paper |90
Le Web 20 pour la veille et recherche dinformation DIGIMIND
enregistreacutes sur LinkedIn iront eacutegalement sinscrire sur Viadeo ou FaceBook
Latomisation des donneacutees sur des dizaines dapplications reste eacutegalement un vrai
problegraveme
Des domaines mal couverts
Certaines theacutematiques vont ecirctre surrepreacutesenteacutees au deacutetriment dautres au
traitement beaucoup plus confidentiel car boudeacutees par les internautes producteurs
volontaires dinformation Les ingeacutenieurs techniciens et jeunes eacutetant fortement
repreacutesenteacutes parmi les blogueurs les theacutematiques high tech sont tregraves largement
couvertes par les blogs par exemple dans le domaine de la RFID (Identification par
Radio Freacutequence) on compte plus de 100 blogs idem pour la VoIP (Voix sur IP) A
linverse si vous travaillez dans le secteur des machines outils ou de la plasturgie il
vous sera difficile de trouver du contenu sur la blogosphegravere
Tous les secteurs ne sont donc pas eacutegaux en volume sur le net et davantage encore
sur la blogosphegravere et sur les autres applications collaboratives ougrave tout internaute
peut publier son propre contenu et ougrave certaines tranches dacircges et cateacutegories
professionnelles ne sont pas bien repreacutesenteacutees
copy Digimind Digimind Services ndash White Paper |91
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Conclusion
Le Web 20 ce mot qui geacutenegravere eacutenormeacutement de buzz deacutecrits et de blogs
speacutecialiseacutes nest-il quun terme marketing un courant de mode 159 Il est probable
que bientocirct on ne lemploiera plus pour deacutesigner ces nouvelles applications qui
seront devenues la norme Toutefois ce terme sorte de parapluie conceptuel qui
recouvre les diffeacuterentes tendances du web nouvelle geacuteneacuteration a le meacuterite de
mettre un nom simple sur un courant du net novateur
Le Web 20 nest pas une reacutevolution ou une rupture technologique mais plus
certainement une eacutevolution qui permet de replacer lutilisateur au centre des
reacuteseaux Cela nest certes pas tregraves nouveau Usenet lun des plus anciens
protocoles de linternet bien anteacuterieur au WWWeb offrait du contenu en ligne
creacuteeacute par linternaute via les Newsgroups degraves les anneacutees 1980
Mais les progregraves technologiques ont permis dintensifier cette tendance et de
deacutemocratiser laccegraves agrave la creacuteation de contenu en ligne et agrave sa diffusion au plus grand
nombre Potentiellement tout internaute peut maintenant diffuser ses publications
tant les outils sont devenus simples
Le Web 20 tend agrave sinseacuterer au cœur du quotidien de chacun en lui apportant des
services novateurs reacuteellement utiles et qui rendent possible lrsquoapparition de
nouveaux usages Ainsi les mash-up qui srsquoappuient sur la geacuteolocalisation ouvrent
des possibiliteacutes inenvisageables jusquici On peut mecircme imaginer agrave terme une
superposition de ces cartes dynamiques agrave la vision reacuteelle dun pieacuteton ou dun
automobiliste Le Web 20 est en perpeacutetuelle eacutevolution ses capaciteacutes drsquoinnovation
sont tregraves fortes car elles reposent souvent sur des recombinaisons audacieuses de
lrsquoexistant hybridant applications et services dans un systegraveme de deacuteveloppement
open source hellipLrsquoinnovation est aussi innovation de postures (prendre la parole
consommer du contenu amateurhellip) qui parfois challengent lrsquoordre eacutetabli et
redistribuent les pouvoirs La position des acteurs du Web 10 ou des meacutedias
classiques pourrait se trouver de plus en plus remise en question lagrave ougrave les
internautes tendent agrave se placer en experts
copy Digimind Digimind Services ndash White Paper |92
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La place de lhumain
Si celle-ci est devenue preacutepondeacuterante il est toutefois difficile de saffranchir
dorganisations un tant soit peu hieacuterarchiseacutees lautoreacutegulation voir Wikipedia ayant
ses limites
En outre la question de la consommation de contenu et de sa qualification sur
lrsquointernet devient cruciale La pertinence des votes de tous les internautes est
discutable ou du moins le fait qursquoils puissent agrave eux seuls qualifier et eacutevaluer la
qualiteacute Par ailleurs que repreacutesente exactement un vote une adheacutesion au contenu
agrave la forme aux ideacutees aux eacutecrits dun ami agrave une ideacutee avec laquelle je suis en
deacutesaccord mais qui agrave le meacuterite dexister
Finalement il faut continuer agrave normer organiser coordonner
reacutegulerhellipnotamment pour eacuteviter les diffamations ou la deacutesinformation Pour ce qui
est du contenu et de sa qualiteacute les critiques eacutemises agrave lrsquoencontre de Wikipeacutedia nous
incitent agrave eacutetudier de plus pregraves les initiatives qui hybrident les interventions
drsquoamateurs avec les compeacutetences de professionnels
Nous sommes passeacutes en 10 ans dun contenu geacuteneacutereacute par quelques internautes pour
la masse agrave un contenu de masse agrave destination de la masse (Evertybody to
Everybody) Cela ne peut guegravere se deacutevelopper sans des meacutecanismes qui replacent
les internautes les plus speacutecialiseacutes dans des processus de validation dune
information devenue pleacutethorique
Les donneacutees personnelles
Simpliciteacute reacuteactiviteacute personnalisation souplesse mutualisationhellipfont partie des
avantages les plus appreacuteciables du web 20 Mais cette liberteacute de publication et de
diffusion nrsquoest elle pas parfois illusoire Les utilisateurs doivent rester vigilants face
aux problegravemes de confidentialiteacute seacutecuriteacute et traccedilabiliteacute de lrsquoinformation160 Des voix
srsquoeacutelegravevent pour deacutenoncer les risques lieacutes agrave la maicirctrise des donneacutees personnelles ou
au respect des droits drsquoauteurs A noter que les licences Creative Commons161
permettent de mieux deacutefinir les contours de cette liberteacute agrave partir de contrats
flexibles de droit dauteur Ce systegraveme Creative Commons donne la possibiliteacute
gratuitement et simplement aux titulaires de droits de choisir et drsquoexprimer les
conditions drsquoutilisation de leurs œuvres agrave travers onze possibiliteacutes Quant aux
utilisateurs ils nrsquoont pas agrave neacutegocier systeacutematiquement une autorisation avant toute
utilisation ou reacuteutilisation
copy Digimind Digimind Services ndash White Paper |93
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Un autre problegraveme reacuteside aussi dans lrsquoeacuteparpillement des donneacutees dans des sites
diffeacuterents ou parfois redondants Il srsquoagira donc de deacutefinir les objets (livre
personne CD photoshellip) agrave partir drsquoun identifiant Cette bataille pour savoir qui
geacuterera ces donneacutees de base telles que la position geacuteographique les espaces de noms et
le code unique de chaque produit a deacutejagrave commenceacute estime Tim OReilly 162
Les perspectives deacutevolution vers un Web 3
Le web actuel est destructureacute et la classification et lrsquoorganisation de son contenu
posent problegraveme La recherche de nouveaux modes de recherche et de
structuration est une sorte de quecircte du graal que de nombreux experts et
entreprises poursuivent
La folksonomie repose sur une ideacutee originale qui sous tend toute lrsquoideacuteologie Web
20 celle de lrsquointelligence collective et de la deacutecentralisation Mais les limites de la
folksonomie appeleacutee aussi web seacutemantique du pauvre remettent en question
lrsquoaffirmation selon laquelle lrsquointelligence collective et la libeacuteralisation totale du
fonctionnement du web 20 sont une solution viable
Aussi la neacutecessiteacute drsquoun Web seacutemantique 163 fiable se fait de plus en plus urgente
Cette nouvelle phase de deacuteveloppement du Web permettrait drsquoameacuteliorer
lrsquoexploitation des informations par les utilisateurs en obtenant une information
organiseacutee normaliseacutee de faccedilon agrave rendre le web compreacutehensible aux machines pour
faciliter lrsquoexploitation par les utilisateurs
Dans un article paru dans le New York Times en novembre 2006 John Markoff
imagine un web 30 selon le principe drsquoajout dune couche de sens tout en haut du
web existant pour en faire un guide au lieu drsquoun simple catalogue Pour lrsquoauteur
nous sommes en train de passer dun web de documents connecteacutes agrave un web de
donneacutees connecteacutees
Le web seacutemantique offrira un langage commun permettant aux donneacutees de
renvoyer agrave des objets du monde reacuteel dune faccedilon identique Le projet Freebase
lanceacute par la start up Metaweb illustre cette approche il a pour objectif de faciliter
la recherche et le partage drsquoinformations agrave travers une base de connaissances
communes structureacutees via des meacutetadonneacutees permettant de deacutecrire chaque
eacuteleacutement drsquoinformation Ces eacuteleacutements seraient relieacutes entre eux par un systegraveme de
relations Tim OrsquoReilly deacutefinit le projet comme la machine agrave creacuteer les synapses du
cerveau global
Il srsquoagirait de creacuteer en quelque sorte un Google du web seacutemantique un reacutepertoire global
drsquoinformations structureacutees intelligibles et exploitables autant par des machines que par
copy Digimind Digimind Services ndash White Paper |94
Le Web 20 pour la veille et recherche dinformation DIGIMIND
des humains -et donc capables drsquoextraire et drsquointerpreacuteter les relations entre des donneacutees
pour par exemple reacutepondre agrave des requecirctes par des solutions plutocirct que des listes de
document 164
La veille
Dans cet univers le chercheur dinformations et le veilleur doiventhellipgarder la tecircte
froide la forte meacutediatisation du Web 20 ne doit pas masquer la pertinence doutils
plus traditionnels Les diffeacuterentes applications Web 20 nous lavons vu suffisent
rarement pour mener agrave bien une collecte dinformation Certes les bookmarks
sociaux apportent un contenu seacutelectionneacute par linternaute mais on ne peut se
deacutepartir des moteurs de recherche web classiques La surveillance des flux RSS
permet decirctre alerteacute sur de nombreux sujets mais la majoriteacute des sites web restent
encore deacutepourvus de ces fils Les tags apportent une veacuteritable souplesse agrave
lutilisateur mais la taxonomie des bibliothegraveques ou des reacutepertoires web- pour ne
citer que ces lieux- reste essentielle pour se repeacuterer agrave travers des milliers de
ressources
Le Web 20 pour la recherche et la veille nen est quagrave ses balbutiements Aussi
avant quil ne digegravere complegravetement par enrichissement les ressources et les
applications Web 10 il convient de faire coexister ces 2 web dans les pratiques
Le Web 20 apporte une richesse essentielle lrsquoexpression drsquoindividus porteurs
drsquoideacutees et de faculteacutes susceptibles drsquoapporter des changements de re-questionner
lrsquoordre eacutetabli eacuteleacutements indispensables agrave lrsquoeacutevolution de la culture agrave condition de ne
pas oublier que des volonteacutes ambitieuses doivent intervenir pour canaliser les
initiatives sans les eacutetouffer et leur insuffler une veacuteritable ambition Voilagrave tout
lenjeuhellip
copy Digimind Digimind Services ndash White Paper |95
Le Web 20 pour la veille et recherche dinformation DIGIMIND
A propos des auteurs DIGIMIND SERVICES
Digimind Services accompagne les plus grandes entreprises pour la conception la
mise en œuvre et le deacuteploiement de projets de veille qui reposent sur la solution
Digimind Evolution apportant agrave ses clients un retour sur investissement de plus de
600 et ce degraves la premiegravere anneacutee Les meacutethodologies proprieacutetaires du
deacutepartement conseil ainsi que son expertise des probleacutematiques et sources
drsquoinformations sur plus de 20 secteurs drsquoactiviteacute deacuteveloppeacutee aupregraves de ses clients
depuis de nombreuses anneacutees permet aux entreprises drsquoanticiper les changements
de leur environnement pour prendre les meilleures deacutecisions sur leur marcheacute
Le conseil Digimind porte sur tous les aspects du workflow de veille ciblage
strateacutegique collecte des informations traitement et analyse exploitation et
diffusion gestion de projet conseil organisationnel et gestion du changement
formations et support fonctionnel et technique
CHRISTOPHE ASSELIN
Issu drsquoun cabinet drsquoeacutetudes de marcheacute B2B et speacutecialiseacute depuis 1997 dans la mise en
place de systegravemes de veille (e-Franceorg Ecole Militaire) Christophe Asselin allie
une connaissance approfondie des secteurs eacuteconomiques et une parfaite maicirctrise
des outils de recherche sur internet et des solutions avanceacutees de veille Expert
reconnu il eacutedite le site httpwwwintelligence-centercom et le blog
httpinfluxjouebcom tout deux consacreacutes agrave la recherche dinformation
Speacutecialiste de la veille internet chez Digimind il accompagne les clients dans la mise
en place de leur dispositif de veille (expression des besoins deacutefinition de plans de
veille sourcing architecture parameacutetrage formation accompagnement) Il
intervient ainsi aupregraves de socieacuteteacutes dans diffeacuterents secteurs les teacuteleacutecoms avec
France Telecom RampD lrsquoindustrie pharmaceutique avec Sanofi Aventis Roche
Pharma Expanscience ainsi quAlstom Transport Veolia Environnement et des
reacutefeacuterences confidentielles dans le secteur des biotechnologies de leacutenergie des
teacuteleacutecoms de limprimerie de la deacutefense du conseilhellip
copy Digimind Digimind Services ndash White Paper |96
Le Web 20 pour la veille et recherche dinformation DIGIMIND
[Merci au Service Marketing agrave Malaiac wwwmalaiacnet et agrave Elsa Bonier eacutetudiante
en Master 2 Management des innovations en communication agrave Paris XIII pour leur
fructueuse collaboration]
VERONIQUE MESGUICH
Apregraves avoir fondeacute et co-dirigeacute pendant six ans un cabinet speacutecialiseacute en veille
technologique Veacuteronique Mesguich dirige lrsquoInfothegraveque du Pocircle Universitaire
Leacuteonard de Vinci Elle enseigne eacutegalement la maicirctrise de linformation strateacutegique
dans plusieurs eacutetablissements denseignement supeacuterieur et anime reacuteguliegraverement
des sessions de formation continue autour de la meacutethodologie de recherche
avanceacutee et de veille sur Internet
Veacuteronique Mesguich est lrsquoauteur avec Armelle Thomas de lrsquoouvrage Net
recherche le guide pour trouver lrsquoinformation utile dont la deuxiegraveme eacutedition est
parue en mars 2007 aux eacuteditions de lrsquoADBS
copy Digimind Digimind Services ndash White Paper |97
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Webographie Bibliographie
Sources dinformation sur le Web 20
Sites web wikis et blogs
Reacutepertoires et classement de services et socieacuteteacutes Web 20 - 20 Websites http20websitescom - Web 20 Magazine Top 100 Web 20 Sites httpweb2magazineblogspotcom200701thanks-for-web-2html - Web 20 Magazine The Best Web 20 Software of 2006 httpweb2socialcomputingmagazinecomthe_best_web_20_software_of_2006htm - Complete List of Web 20 Products and Services httpwwwlistiblecomlistcomplete-list-of-web-2-0-products-and-services - The Complete Web 20 Directory httpwwwgo2web20net - FredCavazzanet le meilleur du Web 20 httpwwwfredcavazzanetindexphp20051212986-le-meilleur-du-web-20 - Web 20 Directory 1200+ Web 20 Sites in 50+ categories httpweb2econsultantcomindexhtml
- Top 25 Web 20 Search Engines httpoedborglibraryfeaturestop-25-web20-search-engines
- 25 start-ups Web 20 prometteuses httpmoneycnncom20070221magazinesbusiness2nextnet_introbiz2
copy Digimind Digimind Services ndash White Paper |98
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Blogs et sites speacutecialiseacutes - Le groupe de travail Web20 francophone httpwwwweb20workgroupfr
- Web 20 Work Group httpweb20workgroupcom - Dessine-moi le Web 20 httpwwwdeuxzerocom - FredCavazzanet httpwwwfredcavazzanet
- TechCrunch en franccedilais httpfrtechcrunchcom - TechCrunch httpwwwtechcrunchcom
- Le web 20 cest pas du buzz httpweb2rulesblogspotcom
- Mashable France httpfrmashablecom - Mashable httpmashablecom - AccessoWeb httpblogaccessowebinfo - Web 20 Magazine httpweb2magazineblogspotcom - Reacutevolution Web 20 en Live httpwwwwebdeuxinfo
- ReadWriteWeb httpwwwreadwritewebcom - Web 20 Innovations httpweb2innovationscom - Web 20 Summit httpwwwweb2concom
- Original Signal (agreacutegateur de flux RSS) httpwwworiginalsignalfr - Whats Web 20 (agreacutegateur de flux RSS) httpwwwwhatsweb20comaggregatorfrom=100
- Le blog de Bloxx Communiquons avec le Web 20 httpblogbloxxfr
copy Digimind Digimind Services ndash White Paper |99
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- FrenchWeborg Le blog des professionnels franccedilais du Web 20 httpwwwfrenchweborg
- Blog Web 20 et Marketing httpwwwvincentabrycom - Le Web 20 en Action httpleweb2blogspotcom - aYsoon 20 httpblogaysooncom Emmanuel de Taillac httpemmanueldetaillacfr - NiouMedia httpnioumediacom - 2803 httpwww2803com - Web 2 francophone (Wiki) httpweb2frcomAccueil
Blogs et sites avec un axe Web 20
- Publishing 20 httppublishing2com - Social-Computing httpwwwsocial-computingcom - Ecosphere httpecospherewordpresscom - inFLUX httpinfluxjouebcom - Benoit Descary httpdescarycom - Jean Michel Billaut httpbillauttypepadcomjm - Blog francophone des TIC httpwww2607fr 20Minutes Top 50 tech et meacutedias httpwww20minutesfrarticle15087620070410-Blogs-Top-50-tech-et-mediaphp - Intruderstv httpnewintruderstvintruders_fr
copy Digimind Digimind Services ndash White Paper |100
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- Jeff Clavier Sans Accent httpsansaccentsofttechvccom - Demain tous journalistes httpbenoit-raphaelblogspotcom
- Collectif louvre-boicircte Initiatives sur le partage dinformation httplouvre-boiteviablogacom
- Zero seconde httpzerosecondeblogspotcom
Articles
Introduction au Web 20
- Web 20 lrsquoarticle de OrsquoReilly reacutesumeacute pour les faineacuteantshellip httpwwwexpressionsbe20051101web-20-resume-pour-les-faineants
- Dossiers Web 20 - Journal Du net httpwwwjournaldunetcomdossiersweb20
- Avis des managers le Web 20 agrave la loupe httpwwwjournaldunetcomsolutions0603diaporamaavis-managers-web21shtml
- Les entreprises face aux deacutefis du Web 20 httpwwwjournaldunetcomsolutions0704070413-entreprises-web-201shtml
-The Machine is Using Us Transcription (videacuteo) httpmediatedculturesnetksudiggp=78
- The New Wisdom of the Web httpwwwmsnbcmsncomid12015774sitenewsweek
- Quest-ce que Web 20 httpwww01netcomarticle294819html
- Approaching a definition of Web 20 httpsocialsoftwareweblogsinccom20050929approaching-a-definition-of-web-2-0
- Fonctionnement de lrsquoentreprise classique vs entreprise 20 httpalbancornilletfreefrakwindexphp20061002fonctionnement-de-lentreprise-classique-vs-entreprise-20
- Meacutedias traditionnels et acteurs du Web 20 vers la cohabitation ou la convergence des acteurs de lrsquoinformation et du divertissement httpwwwscribdcomdoc50818These-sur-le-Web-2-Cabanis
copy Digimind Digimind Services ndash White Paper |101
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ajax
- LAjax en 5 questions httpwwwjournaldunetcomsolutions0602060208_qr-ajaxshtml - Ajax et Moteurs 20 httpwwwmoteurzinecomarchives2006moteurzine127html2
Les Mashups
- Les Mashups applications Web composites tregraves Web 20 httpwwwjournaldunetcomsolutions0606060628-qr-mashup-hybrideshtml
- Le modegravele eacuteconomique des Mashups httpwwwinternetactunetp=6285 Bookmarks sociaux Social search
- Le Social Bookmarking au secours de la pertinence de la recherche drsquoinformation httpwwwgillesbalmissecomv2spipphparticle171 - Whats the Big Deal With Social Search httpsearchenginewatchcomshowPagehtmlpage=3623153
- Whos Who in Social Search httpsearchenginewatchcomshowPagehtmlpage=3623173
Ouvrages
- Web 20 - Les internautes au pouvoir - Jean-Franccedilois Gervais httpwwwdunodcompagesouvragesficheouvrageaspid=50701
- Les reacuteseaux sociaux Pivot de lrsquointernet 20 - Alain Lefebvre httpwwwcluster21comfrbookreviewlivre_les_reseaux_sociaux - Web 20 (R)eacutevolutions et nouveaux services dInternet - Jean-Noeumll Anderruthy httpwwwamazonfrWeb-2-0-C3A9volutions-nouveaux-dInternetdp2746034972ref=sr_1_18402-7140143-8118507ie=UTF8amps=booksampqid=1178118687ampsr=8-18 - Web 20 The Future of the Internet and Technology Economy and How Entrepreneurs Investors Executives amp Consumers Can Take Ad httpwwwamazoncomWeb-2-0-Technology-Entrepreneurs-Execenablersdp1587622009ref=sr_1_6103-0331542-4028646ie=UTF8amps=booksampqid=1178118732ampsr=1-6
- La Longue Traicircne La nouvelle eacuteconomie est lagrave - Chris Anderson httpwwwamazonfrLongue-TraC3AEne-nouvelle-C3A9conomie-
copy Digimind Digimind Services ndash White Paper |102
Le Web 20 pour la veille et recherche dinformation DIGIMIND
estdp2744062693ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180542516ampsr=1-1 - The Geospatial Web How Geobrowsers Social Software and the Web 20 are Shaping the Network Society httpwwwamazoncomGeospatial-Web-Geobrowsers-Information-Processingdp1846288266ref=sr_1_28103-0331542-4028646ie=UTF8amps=booksampqid=1178118760ampsr=1-28 - Les Wikis espaces de lintelligence collective - Jeacuterocircme Delacroix httpwwwamazonfrWikis-JC3A9rC3B4me-Delacroixdp2952051445ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180544723ampsr=8-1 - Pro Web 20 Mashups Remixing Data and Web Services httpwwwamazonfrPro-Web-2-0-Mashups-Remixingdp159059858Xref=sr_1_4403-1740173-8750801ie=UTF8amps=english-booksampqid=1180542751ampsr=8-4 - Web 20 et Web avanceacute - Alexandre Boni Nicolas Stemart httpwwwamazonfrWeb-2-0-avancC3A9-Alexandre-Bonidp2742967281
copy Digimind Digimind Services ndash White Paper |103
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Dans la mecircme collection
White Paper Blogs et RSS des outils pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind
White Paper
Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind
White Paper
Cateacutegorisation automatique de textes
White Paper
Benchmark des solutions de veille strateacutegique
White Paper
Evaluer le Retour sur Investissement dun logiciel de veille Edouard Fillias Consultant Veille Strateacutegique Digimind
gt A teacuteleacutecharger sur httpwwwdigimindfrserviceswhite_paperhtm
copy Digimind Digimind Services ndash White Paper |104
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Notes 1 httpwwwguimfrblog200612le_film_autumn_html httpwwwlemondefrwebarticle01-02-65186536-8751060html 2 httpvideogooglefrvideoplaydocid=724218352255575783 3 Map of online communities par Randall Munroe httpwwwxkcdcomc256html 4 httpwwwdeuxzerocom 5 httpwwwpaulgrahamcombiohtml httpfrwikipediaorgwikiPaul_Graham 6 Qursquoest ce que le web 20 Hubert Guillaud Internet Actu 29 mai 2005 httpwwwinternetactunetp=6144 7 httpwwworeillynetcompubaoreillytimnews20050930what-is-web-20html httpweb2rulesblogspotcom200601what-is-web-20-par-tim-oreilly-versionhtml 8 httpwwwzdnetfractualitesinternet0390207743933447900htm 9 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 10 httpwwwinternetactunetp=7035 11 httpwwwhitwisecomdatacenter 12 httprosstypepadcomblog200604power_law_of_pahtml 13 httpblogsforrestercomcharleneli200704forresters_new_html 14 httpwwwtagcrowdcom 15 You Say You Want a Web Revolution httpwwwwiredcomsciencediscoveriesnews20050868403 16 httpsaddonsmozillaorgfrfirefoxaddon748 httpwwwjournaldunetcomdeveloppeurtutorielout050525-greasemonkey-presentationshtml 17 Mashups Google Maps httpwwwmibazaarcomextrasfortune100html httpwwwweatherbonkcomweatherindexjsp httpgmapstommanganusspacecraft_trackinghtml 18 httpwwwgooglecomcalendar 19 httpdocsgooglecom 20 httpwwwmoovementfr 21 httpwwwcooptincomfrWEBhomeaspx httpwwwjobmeeterscomfraccueilindexphp 22 httpwwwzliocom httpshoppingyahoocomshoposphere
copy Digimind Digimind Services ndash White Paper |105
Le Web 20 pour la veille et recherche dinformation DIGIMIND
23 httpwwwciaofr httpwwwwantunocom 24 httpmapsgooglefr httpwwwgeoportailfr httpearthgooglefr httpmapsyahoocom httpwwwflickrcom httpwwwzdnetfractualitesinternet0390207743936635400htm 25 httpwwwcriteocom 26 From Youtube to Youniversities Henry Jenkins 16 feacutevrier 2007 httpwwwhenryjenkinsorg200702from_youtube_to_youniversityhtml 27 httpaffordancetypepadcom 28 httpwwwplosoneorghomeaction 29 Web collaboratif web coopeacuteratif web 20 quelles interrogations pour lrsquoenseignant documentaliste Marie France Blanquet 12 janvier 2007 httpeprofsdocscrdp-aix-marseillefrIMGrtfintervention-MF-Blanquetrtf 30 httpveillepedagogiquebloglemondefr 31 httpbibliobsessionfreefrdotclear 32 httpliblogsalbanyedulibrary20200611a_librarians_20_manifestohtml 33 httpdelicious 34 httpwwwconnoteaorg httpwwwciteulikeorg httpwwwsnipitroncom 35 httpdelicious httpwwwblinklistcom httpblogmarksnet httpwwwfurlnet httpfrbetabookmarksyahoocom httpmyweb2searchyahoocom 36 httpwwwstumbleuponcom httpsimilicious httpwwwyoonocomindexjsp 37 Social bookmarks charts version 35 httpwwwiroxdefile_download3 httpwwwroxomaticde856 Social Bookmarking Services And Tools The Wisdom Of Crowds That Organizes The Web httpwwwmasternewmediaorgnews20061201social_bookmarking_services_and_toolshtm Free Bookmark Managers
copy Digimind Digimind Services ndash White Paper |106
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwfeedbuscombookmarks 38 httpwwwflickrcom 39 httpwwwflickrcomgroupstehipool 40 httpwwwflickrcomphotostagsnorthamericaninternationalautoshow 41 httpphotobucketcom 42 httpwwwsquidoocom 43 httpwwwsquidoocomnanotechRev 44 httpwwwsquidoocomtagsmarketing 45 httpwwwyoutubecom 46 httpwwwdailymotioncom 47 Une seacutelection de moteurs de recherche videacuteo et de services de partage et teacuteleacutechargement de videacuteos httpcasselinfreefrfrenchvideoshtm 48 httpwwwemarketercomArticleaspxid=1004918 49 httpwwwviadeocom 50 httpwwwlinkedincom 51 httpwww6nergiesnet httpwwwxingcom 52 httpwwwfacebookcom 53 httpenwikipediaorgwikiList_of_social_networking_sites 54 httpwwwlinknrankcombusinessphp 55 httpdiggcom 56 httpwwwnuouzcom httpwwwblogmemescom httpwwwscoopeocom httpwwwfuzzfr httpwwwtapemoicom httpmeneamenet httpwwwrojocom httpwwwbetanetscapecom 57 httpwwwwikiofr 58 httpwwwagoravoxfr 59 Carlo Revelli Joeumll de Rosnay httpfrwikipediaorgwikiCarlo_Revelli httpfrwikipediaorgwikiJoC3ABl_de_Rosnay 60 Agoravox politique eacuteditoriale httpwwwagoravoxfrarticlephp3id_article=60 61 httpwwwreadspeakercom 62 httpenglishohmynewscom
copy Digimind Digimind Services ndash White Paper |107
Le Web 20 pour la veille et recherche dinformation DIGIMIND
63 State of the Blogosphere- avril 2007 httpwwwsifrycomalertsarchives000493html 64 Les blogs dans le monde Estimation agrave partir des chiffres produits par Digimind Blog Herald Technorati PewInternet Meacutediameacutetrie Loiumlc le Meur Live Journal Skyblogs Overblogs Terra MSN Spaces Splinder Excite Bloggersit Timblog W3B Skynet Bloghr Overskriftdk Smartlog onetpl Tenbit mylogpl eblogpl Blogpl Blogipl blogcentralis Romandiefr Blogspot timsoftro Globocom Financial Express Prixadi blog Baidu Yahoo Blogs South Korea Planet Weblog Service Cyworld LAtelier et ZDNet Australia 65 httpwwwnaturecomwebfeedsindexhtml httpwwwsciencemagorgrss 66 httpsearchlivecom 67 httpsearchyahoocom 68 httpnewsgooglefr httpfrnewsyahooco httpfrnewsbotmsncom httpwwwtopixnet httpwwwwikiofr 69 httpgroupsgooglefrgrouprectraveleuropefeedshl=fr 70 httpwwwforummobilescomindexphpshowforum=200 71 httpfrgroupsyahoocom 72 httpfrmyweb2searchyahoocom httpblogmarksnet httpdelicious 73 httpwwwflickrcom httpphotobucketcom 74 httpwwwyoutubecom httpwwwdailymotioncomfr 75 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 76 httpblogsearchgooglefr httpfraskcomsubjectbls|pg1 httpwwwfeedstercom httpwwwblogpulsecom httpwwwtechnoraticom httpwwwspherecom 77 httpwwwsifrycomalertsarchives000493html 78 httpfrsearchyahoocomwebadvancedei=UTF-8ampybs=0 httpwwwexaleadfrsearchresultsq=sarkozyamp24mode=allweb 79 httpwwwblogaramacom httpwwwrss-networkcom
copy Digimind Digimind Services ndash White Paper |108
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwrssfeedscom 80 httpwww43thingscom http36trucscom 81 httptrainquecomcodedelicious_lookupphp 82 httptechnoraticomtag 83 httpwwwsearchlescom 84 httptagcentralnet httpwwwkeotagcom httpwwwthagoocom httpwwwzewolnet httpwwwgnoshorg 85 httpwwwzibbcom 86 httpwwwecransfr 87 Google Tag Cloud Maker httpuserscriptsorgscriptsshow6171 88 httpnewzingocom 89 Folksonomies les usagers indexent le web Olivier le Deuff Bulletin des Bibliothegraveques de France ndeg4 2006 90 Folksonomy les tags en deacutelire Cyril Fieacutevet Internetactu 13 octobre 2005 httpwwwinternetactunetp=6166 91 httpwwwzoominfocom 92 httpwwwzikicom 93 httpwwwyonamecom httpwwwstalkeraticom httpwinkcom 94 httpfranswersyahoocom httpanswersyahoocom httpaskyahoocom 95 httpanswersgooglecomanswers 96 httpiqlycosfr httpqnalivecombetaaspx 97 httpwwwexpertscomdirectoryasp 98 httpsearchwikiacomwikiSearch_Wikia 99 httpdeciphocom 100 httpwwwyoonocom 101 httpwwwfooxxcom
copy Digimind Digimind Services ndash White Paper |109
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwwebzzlecom 102 httpinfluxjouebcomnewspowerset-et-xerox-parc-s-attaquent-a-google-naturellement 103 httpwwwmedglecom httpwwwmedwormcom httpwwwmedstorycom httpwwwsearchmedicacouk 104 httpwwwrollyocom httpswickihomeeurekstercom httpgooglecomcoopcseoverview httpbuildersearchyahoocom 105 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 106 Le web invisible (deep web hidden web) deacutesigne la partie du web non accessible aux moteurs de recherche classiques Le web invisible comprend des bases banques de donneacutees et bibliothegraveques en ligne gratuites ou payantesIl est constitueacute de pages web mal ou non indexeacutees par les moteurs Pour plus de preacutecisions voir le White Paper Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique httpwwwdigimindfrserviceswhite_paperhtm 107 httpwwwthelancetcom 108 httpwwwdigimindfrproduitsfinderhtm 109 httpwwwncbinlmnihgoventrezqueryfcgiCMD=searchampDB=pubmed 110 httppminlmnihgovinteractindexphptop httpwwwhubmedorg 111 httpwwwusptogovpatftindexhtml httpwwwwashingtonpostcomwp-dyncontentarticle20070304AR2007030401263html 112 httpwwwgooglecomhistory 113 httpwwwgooglecomhistorytrends httpwwwgooglecomhistoryitems 114 httpfrwikipediaorgwikiApplication_composite 115 httpwwwmibazaarcomextrasfortune100html 116 httptagmapsresearchyahoocomworldexplorerphp 117 httpflickrvisioncom 118 httpgmapstommanganusspacecraft_trackinghtml 119 httpwwwhealthmaporg httpwwwbrevardbiodieselorgmapbdhtml httpkartametroinfokartadefaultaspxhl=EN httpwwwwikimapiaorg httpwwwglobalincidentmapcomhomephp httpdartmapsmackerscom
copy Digimind Digimind Services ndash White Paper |110
Le Web 20 pour la veille et recherche dinformation DIGIMIND
120 httpwwwtagurlscom 121 httpwwwthemolucom httpwwwgnoshorg 122 httpwwwwebmashupcom httpwwwprogrammablewebcommashupsdirectory httpmashupfeedcom 123 httpgooglemapsmaniablogspotcom 124 httplocalalkemiscom 125 httpwwwvoxcom httpwwwover-blogcom httpwwwblogspiritcomfrindexphp httpwwwtypepadcom httpswwwbloggercomstart httpviablogacom httpwwwhautetfortcom 126 httpcasselinfreefrfrenchweblogshtmoutils 127 httpwwwclubiccomarticle-67515-8-comparatif-plateformes-blogshtml httpwwwojrorgojrimagesblog_software_comparisoncfm 128 httpwwwfeedburnercomfbahome 129 httppagesgooglecom 130 httpwwwdigimindfrserviceswhite_paperhtm 131 httpfrwikipediaorgwikiAccueil 132 httpblogouter-courtcomarchive2006-12-05-n22html 133 httpwwwnaturecomnews2005051212full438900ahtml httpwwwnaturecomnaturebritannicaindexhtml httpwwwnaturecomnews2005051212multimedia438900a_m1html 134 httpwwwwikiseekcom 135 httpwwwexaleadfr 136 httpwwwwikimindmaporg 137 httpencitizendiumorgwikiMain_Page 138 httpwwwalacrawikicom 139 httpceclinesxwikicomxwikibinviewMainFils+RSS 140 httpwwwwikidwebcom 141 httpwwwoperacom httpwwwmaxthoncom httpwwwmicrosoftcomfrancewindowsie httpwwwmozilla-europeorgfrproductsfirefox
copy Digimind Digimind Services ndash White Paper |111
Le Web 20 pour la veille et recherche dinformation DIGIMIND
142 httpfrtechcrunchcom20060401analysons-les-lecteurs-rss-en-ligne httpvtechcanalblogcomarchives20051025927489html httpvtechcanalblogcomarchives20050905780635html httpallrsscomrssreadershtml 143 httpinfluxjouebcomnewsles-pages-personnalisables-bookmark-n-1 httpwwwinformationoverlordcouk200603where-to-start-in-search-of-ideal_26 144 httpwwwdigimindfrproduitsindexhtm 145 httpshareopmlorg 146 httpwwwquechoisirorgArticlejspid=RessourcesArticlesEF33CF34D5616AF2C125720D0050E701ampcatcss=TEL000 147 httpweblogshitwisecombill-tancer 148 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 149 httpwwwbusinessweekcominnovateNussbaumOnDesignarchives200704are_most_web_20html 150 httpblogsforrestercomcharleneli200704forresters_new_html httprosstypepadcomblog200604power_law_of_pahtml 151 httpwwwobservatoire-omicorgcolloque-icicpdfBarbe3_1pdf 152 httpwwwaaronswcomweblogwhowriteswikipedia 153 httpaphgcaenfreefrchronique393aphg393htm 154 httpfrwikipediaorgwikiDroits_de_l27homme_en_Iran 155 httpfrwikipediaorgwikiWikipC3A9diaArticles_de_qualitC3A9 156 httpenwikipediaorgwikiJohn_Seigenthaler_Sr_Wikipedia_biography_controversy 157 httppewresearchorgpubs71riding-the-waves-of-web-20 158 httptallblogcontedoxacukwp-contentuploads200703survey-summarypdf 159 httpwwwcafepresscomnerdwideweb 160 httpwwwecransfrspipphprubrique30 161 httpfrcreativecommonsorg 162 httpwwwzdnetfractualitesinternet0390207743933447900htm 163 httpwebsemantiqueorgPagePrincipale httpwwww3orgDesignIssuesSemantichtml httpwwww3org2002Talks1213-lpslide1-0html 164 httpwwwinternetactunetp=6902
copy Digimind Digimind Services ndash White Paper |112
- Digimind Services
- Christophe ASSELIN
- Veronique MESGUICH
-
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LES 7 PRINCIPES DU WEB 20
Le texte de Tim OrsquoReilly paru en 2005 7 sous le titre Qursquoest ce que le web 20
deacutegage sept principes cleacutes du Web 20 en voici un petit reacutesumeacute
1 Le web vu comme une plate-forme de services
On passe dune collection de sites web agrave une plateforme informatique agrave part
entiegravere fournissant des applications web aux utilisateurs
2 Consideacuterer les internautes comme co-deacuteveloppeurs des applications On passe ainsi
de la notion de logiciel produit agrave celle de logiciel service
3 Le service srsquoameacuteliore quand le nombre drsquoutilisateurs augmente
Le Web 20 met agrave profit lrsquoeffet de la longue traicircne (ou long tail en anglais)
populariseacute par le magazine Wired les produits qui sont lrsquoobjet drsquoune faible
demande ou qui nrsquoont qursquoun faible volume de vente peuvent collectivement
repreacutesenter une part de marcheacute eacutegale ou supeacuterieure agrave celle des best-sellers si les
canaux de distribution peuvent proposer assez de choix Les utilisateurs du Web
20 disposent de donneacutees uniques difficiles agrave recreacuteer et dont la richesse srsquoaccroicirct
avec lrsquoaugmentation du nombre des utilisateurs
4 La richesse est dans les donneacutees Toutes les applications web drsquoimportance sont
lieacutees agrave une base de donneacutees speacutecialiseacutee OrsquoReilly envisage un mouvement des
donneacutees libres srsquoopposant peu agrave peu agrave lrsquounivers des donneacutees proprieacutetaires
5 Tirer parti de lrsquointelligence collective crsquoest le principe mecircme adopteacute par
lencyclopeacutedie en ligne Wikipedia et drsquoautres sites similaires Pour Tim OrsquoReilly
lrsquoimplication des utilisateurs dans le reacuteseau est le facteur-cleacute pour la supreacutematie sur le
marcheacute
6 Mettre en place des interfaces souples et leacutegegraveres fondeacutees sur les nouveaux
standards et protocoles du Web Le logiciel se libegravere du PC Une autre des
caracteacuteristiques du web 20 est le fait qursquoil nrsquoest plus limiteacute agrave la plate-forme PC
mais vise notamment les objets nomades teacuteleacutephone portable PDA ou lecteur
portatif audio
copy Digimind Digimind Services ndash White Paper |8
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LES EVOLUTIONS PAR RAPPORT AU WEB 10 LE ROLE DE LINTERNAUTE
En quoi le Web 20 se distingue-t-il de la vague preacuteceacutedente On a vu que lrsquoune des
caracteacuteristiques majeures du pheacutenomegravene est lrsquoappropriation des contenus et des
modes de diffusion par les internautes eux-mecircmes via des applications souples et
leacutegegraveres
Paul Graham eacutevoque le principe de deacutemocratie du Web 20 cest-agrave-dire la
superposition au reacuteseau technique drsquoun reacuteseau humain qui participe agrave la creacuteation et
agrave lrsquoenrichissement de contenus et services Lrsquointernaute deviendrait ainsi
consommrsquoacteur agrave lui de produire publier diffuser indexer partager des
contenus de tous types
Web 10 Web 20
Leaders du web Entreprises marchands Internautes
Profil de linternaute Passif Actif
Interactiviteacute perccedilue Seacutelection et lecture dinformation
Seacutelection lecture et publication de donneacutees
Uniteacute de recherche Mot-cleacute Tag
Du Web 1 vers le Web 2 Source ZDNet 8
Pour autant les internautes vont-ils devenir tous acteurs de ce processus Selon un
article de Charles Arthur dans The Guardian 9 pour un groupe de 100 personnes si
lrsquoune creacutee du contenu 10 seulement vont interagir en apportant commentaires et
ameacuteliorations les autres se contentant drsquoune consommation passive Ce constat
obtenu via des retours drsquoexpeacuterience sur des sites collaboratifs illustre la regravegle des
11089 selon laquelle plus de 80 des contenus produits proviennent drsquoun
nombre tregraves restreint drsquoutilisateurs
Tendance confirmeacutee par les chiffres preacutesenteacutes lors de la Web 20 Expo en avril 2007
et repris dans Internetactu 10 selon la socieacuteteacute de mesure drsquoaudience Hitwise11
016 des internautes qui passent sur YouTube y placent des films - alors qursquoils
eacutetaient encore 05 agrave le faire en juillet 2006 seulement 02 des visiteurs de
Flickr y publient des photos La seule exception agrave cette faible participation provient
copy Digimind Digimind Services ndash White Paper |9
Le Web 20 pour la veille et recherche dinformation DIGIMIND
de Wikipedia ougrave 46 des visiteurs contribuent agrave lrsquoenrichissement de
semblent en effet
voir eacutecrit des textes longs (en un nombre reacuteduit drsquointerventions) tandis que les
eacutediteursrdquo les plus actifs qui forment le noyau des wikipeacutediens nettoient corrigent
lective fondeacutee sur des actions agrave faible niveau drsquoexigence
(lire enregistrer un signet tagger commenter) de lrsquointelligence collaborative
caracteacuteriseacutee par des formes de participations plus actives et intenses eacutecrire
collaborer modeacutererhellip
lrsquoencyclopeacutedie
Jimmy Wales fondateur de Wikipedia estime qursquoun nombre restreint de
contributeurs et eacutediteurs font lrsquoessentiel du travail alors qursquoun nombre consideacuterable
de lecteurs apportent peu de modifications Le wikipeacutedien Aaron Swartz nuance
ce point de vue un grand nombre de contributeurs occasionnels
a
ldquo
mais sans apporter eacutenormeacutement de texte
Le Web 20 et tout particuliegraverement la blogosphegravere semble suivre la loi de la
participation eacutedicteacutee par Ross Mayfield preacutesident de la socieacuteteacute Social Text sous le
nom de Power law of participation12 Cette loi baseacutee sur lrsquoobservation des
pratiques et des seuils de participation aux dispositifs communautaires constate que
la participation srsquoamenuise agrave mesure que les formes de participation se
complexifient Le scheacutema ci-dessous qui rappelle celui de la Longue Traicircne
distingue lrsquointelligence col
Power Law of Participation par Ross Mayfield CC
copy Digimind Digimind Services ndash White Paper |10
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Le cabinet Forrester deacutetaille enc
de la participation figurant dans son eacutetude Social Technographics 13 la grille compte
6 eacutechelons correspondant aux niveaux de particip
les inactifs (52 )
les spectateurs (33 ) consommateurs de contenus texte ou multimeacutedia (blogs
videacuteos mis en ligne par les utilisateurs podcasts)
ore davantage les niveaux drsquoimplication dans la grille
ation
les menuisiers (19 ) utilisateurs de reacuteseaux sociaux
es collecteurs (15 ) utilisent des flux RSS et taggent les pages web
les critiques (19 ) postent des commentaires sur les blogs des avis et critiques
les creacuteateurs (13 ) publient des contenus en ligne (blogs videacuteos)
l
copy Digimind Digimind Services ndash White Paper |11
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Glossaire du Web 20
Pour mieux comprendre les concepts utiliseacutes dans lunivers du Web 20 nous vous
proposons ce glossaire des termes essentiels
Tags mot clef sous forme drsquo eacutetiquette que les utilisateurs peuvent apposer sur
un document numeacuterique (texte photo videacuteo) de faccedilon agrave en deacutecrire le contenu Le
tagging introduit une part de subjectiviteacute par rapport agrave lrsquoindexation automatique
effectueacutee par les moteurs Les tags peuvent eacutegalement ecirctre extraits
automatiquement drsquoun texte en fonction de leur freacutequence drsquooccurrence
Nuage de tags preacutesente les tags correspondant agrave un site (ou agrave plusieurs) en les
regroupant sur un mecircme espace et leur attribuant une taille variable suivant la
freacutequence dutilisation ou drsquooccurrence Cela donne une vision drsquoensemble des
principales theacutematiques Le site Tagcrowdcom14 permet de geacuteneacuterer un nuage de
tags agrave partir drsquoun texte
Folksonomie (traduit eacutegalement parfois par potonomie peuplonomiehellip)
Ce mot valise contraction de folk (peuple) et taxonomie deacutesigne une forme de
classification collaborative deacutecentraliseacutee spontaneacutee baseacutee non pas sur un
vocabulaire controcircleacute et standardiseacute mais sur des termes choisis par les utilisateurs
eux-mecircmes intituleacutes tags Lrsquoobjectif eacutetant de faciliter lrsquoindexation des contenus
ainsi que la recherche drsquoinformation
Blogs journal personnel disponible sur le web Peut ecirctre tenu par un particulier
un chercheur un journaliste un salarieacute drsquoentreprise ou plus rarement par un groupe
de personne (entreprise collectiviteacutehellip) Le blog a pour objet de diffuser des billets
geacuteneacuteralement lieacutes agrave lrsquoactualiteacute et preacutesenteacutes par ordre chronologique alors qursquoun
wiki est destineacute agrave la mutualisation des connaissances Un blog peut preacutesenter des
contenus multimeacutedias photo (photoblog) son ou videacuteo (vblog vlog)hellip
Blogosphegravere la biosphegravere des blogs Ce mot valise deacutesigne la communauteacute
des blogs ou encore lrsquoensemble des auteurs de blogs La blogosphegravere est largement
interconnecteacutee les trackbacks situeacutes sur la plupart des blogs permettant de lier
copy Digimind Digimind Services ndash White Paper |12
Le Web 20 pour la veille et recherche dinformation DIGIMIND
deux articles traitant de sujets connexes Lrsquoeacutelite des blogueurs particuliegraverement
influents peut ecirctre qualifieacutee ironiquement de blogeoisie
Blogroll ou blogoliste liste de liens vers drsquoautres blogs preacutesenteacutes par lrsquoauteur
drsquoun blog On peut syndiquer sur une mecircme page des billets venant de ces blogs via
les formats RSS
RSS lrsquoacronyme signifie selon les versions Really Simple Syndication (RSS 20) RDF
Site Summary (RSS 09 10 et 11) ou encore Rich Site Summary (RSS 091) Ce
format de syndication permet drsquoextraire automatiquement dun site web ou drsquoun
blog du contenu reacuteguliegraverement mis agrave jour Un fichier RSS est un simple fichier texte
au format XML comportant la description syntheacutetique du contenu Ce format a eacuteteacute
creacuteeacute en 1999 par Netscape On peut srsquoabonner gratuitement agrave plusieurs flux RSS agrave
partir drsquoun lecteur on-line ou installeacute sur le PC
Atom Format normaliseacute de syndication de contenu Web baseacute sur le XML qui
permet la syndication de contenu entre diffeacuterentes ressources Web Concurrent
de RSS Le format Atom a eacuteteacute creacuteeacute dans le but de simplifier les diffeacuterents formats
RSS existants La diffeacuterence entre les deux formats reacuteside surtout dans lemploi de
balises XML diffeacuterentes Les deux formats sont geacuteneacuteralement lus par les
agreacutegateurs
Wiki Site web dynamique dont tout visiteur peut modifier les pages agrave loisir Le
terme vient la langue hawaiumlenne (wikiwiki = rapide) Un wiki a pour objectif de
mutualiser des connaissances et est organiseacute autour drsquoun plan de classement Les
contributeurs drsquoun wiki sont geacuteneacuteralement anonymes
Crowdsourcing Litteacuteralement approvisionnement par la foule Le
crowdsourcing consiste agrave utiliser la creacuteativiteacute lintelligence et le savoir-faire dun
grand nombre dinternautes pour creacuteer des contenus participer agrave lrsquoalimentation
drsquoun site Cette participation des utilisateurs agrave la creacuteation des contenus repreacutesente
une forme drsquoexternalisation (outsourcing) et permet de reacuteduire les coucircts en se
basant sur un systegraveme de beacuteneacutevolat ou de micropaiement
Reacuteseaux sociaux de nombreux sites de social networking ou reacuteseautage social
sont apparus avec la vague du Web 20 Ils permettent de mettre en relation des
personnes partageant les mecircmes centres drsquointeacuterecirct personnels ou professionnels
Ces reacuteseaux peuvent devenir de veacuteritables communauteacutes en ligne les plus fameux
eacutetant les sites Friendster ou Myspace ou bien dans la sphegravere professionnelle
copy Digimind Digimind Services ndash White Paper |13
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Linkedin ViadeohellipLa plupart des reacuteseaux sont ouverts certains fonctionnent sur le
mode de la cooptation
Podcasts issu de la combinaison des termes iPod (dApple) et broadcasting ce
terme deacutesigne le fait de rendre disponible en ligne un fichier audio au format
numeacuterique Ce fichier peut-ecirctre teacuteleacutechargeacute directement sur un ordinateur ou un
peacuteripheacuterique via un flux de diffusion Equivalent franccedilais baladodiffusion
Lrsquoutilisateur peut ainsi se composer une liste de lecture agrave la carte Pour les fichiers
videacuteo on emploi le terme de videacuteocast
AJAX (Asynchronous JavaScript And XML) meacutethode informatique de
deacuteveloppement dapplications Web permettant deacuteconomiser de la bande passante
en ne rechargeant pas une page entiegravere alors que seuls certains eacuteleacutements ont besoin
de lecirctre mais en ne rafraicircchissant que ces eacuteleacutements de la page Cela permet de
produire des contenus dynamiques et reacuteactifs en ne neacutecessitant que peu drsquoappels au
serveur heacutebergeant la page AJAX est une combinaison de plusieurs technologies
HTML CSS Javascript XMLhellipDe nombreux sites web 20 sont deacuteveloppeacutes en
AJAX
API Interface de programmation permettant agrave un utilisateur de deacutevelopper des
applications conviviales De nombreux sites classiques ou Web 20 proposent des
API pour inteacutegrer automatiquement leur contenu agrave dautres sites
Mashup ou Mash up application web composite mixant plusieurs sources ou
plusieurs contenus pour fournir un nouveau produit ou service Le terme se traduit
en franccedilais par remixage ou mosaiumlque Exemple de mashup la visualisation des
reacutesultats des eacutelections preacutesidentielles franccedilaises via Google Earth qui mixe les cartes
Google et les chiffres du Ministegravere de lInteacuterieur
Long tail (longue traicircne) Cette expression est utiliseacutee en statistiques et peut
srsquoappliquer au marketing Des produits rares ou qui font lrsquoobjet drsquoune faible
demande peuvent collectivement repreacutesenter une part de marcheacute eacutegale ou
supeacuterieure agrave celle des best-sellers si les canaux de distribution peuvent proposer
assez de choix Le caractegravere virtuel du web permet de geacuteneacuterer une longue seacuterie de
marcheacutes de niche heacuteteacuterogegravenes (exemple e-bay) par opposition aux grands
marcheacutes homogegravenes et grand public du monde reacuteel
copy Digimind Digimind Services ndash White Paper |14
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les technologies du Web 20
Mettons dabord les choses au point le Web 20 nest pas une (r)eacutevolution ou un
concept de dimension technologique
Ses applications sappuient sur des technologies deacutejagrave existantes reacutepondant aux doux
noms dAjax Soap REST RSS Perl Python PHP Ruby ou GreaseMonkey Lobjectif de
ce document nest pas de deacutevelopper ce volet technologique Nous en eacutevoquerons
seulement les grandes caracteacuteristiques pour mieux comprendre les enjeux
Le Web 2 repose notamment sur les interfaces utilisateurs dites riches qui
permettent des possibiliteacutes daffichage de configuration et de maniement plus
puissantes que les pages html classiques du Web 1 que ce soit pour le
deacuteveloppeur ou lutilisateur final
Tim Berners Lee co-inventeur du web remarque en fait ce Web 20 utilise les
standards qursquoont produit tous ces gens qui travaillent sur le Web 10 le Document
object model HTML et SVG (Scalable Vector Graphics) HTTPhellip Le Web 20
construit des services en srsquoappuyant sur les standards du web ainsi que sur JavaScript
(hellip)
Pour se structurer en reacuteseau de bases de donneacutees et services collaboratifs le web
20 utilise donc des technologies matures acircgeacutees de 5 agrave 10 ans pour la plupart
Leacutevolution nest pas tant dans la technologie elle-mecircme que dans la faccedilon de mixer
ces technologies pour apporter des services et une ergonomie nouvelle agrave
lutilisateur
Ainsi lAjax (voir glossaire) que lon cite souvent agrave propos des technologies phares
du Web 2 nest pas un nouveau langage mais un nouveau concept qui utilise les
standards XHTML et CSS DOM (Document Object Model) pour laffichage
dynamique XML et XSLT pour leacutechange de donneacutees ainsi que la reacutecupeacuteration de
donneacutees asynchrones via XMLHttpRequest JavaScript integravegre et combine tout ces
langages Le terme Ajax a eacuteteacute apporteacute par Jesse James Garrett de lrsquoagence web
Adaptive Path
copy Digimind Digimind Services ndash White Paper |15
Le Web 20 pour la veille et recherche dinformation DIGIMIND
LAjax permet notamment de ne recharger que certains eacuteleacutements dune page plutocirct
que la page entiegravere Lors de modifications sur une page seuls les nouveaux
eacuteleacutements se rafraicircchissent eacuteconomisant ainsi des ressources du temps et de la
bande passante Lun des preacutecurseurs grand public dans lutilisation de cette
technologie fut A9 le moteur de recherche dAmazon il neacutetait pas neacutecessaire de
recharger la page agrave chaque fois que lon ajoutait de nouvelles sources et moteurs agrave
interroger 15
Greasemonkey est eacutegalement baseacute sur des scripts Cette extension pour le
navigateur Mozilla Firefox va encore plus loin dans le pouvoir accordeacute agrave linternaute
en exeacutecutant des scripts ce plug-in 16 permet de modifier lapparence des pages
web visiteacutees dy ajouter des fonctions (boutons case agrave cocher suppression des
publiciteacutes) Lutilisateur avanceacute peut mecircme eacutecrire ses propres scripts ou
teacuteleacutecharger des scripts mis agrave la disposition de tous
Le Web 2 est en fait une sorte de web lego qui permet dinnover via lassemblage
de briques les technologies de base sont multiples il est possible de creacuteer de
nouvelles applications agrave valeur ajouteacutee en les assemblant diffeacuteremment ou plus
rationnellement
Les mash-up un mixage de plusieurs applications (voir glossaire) en est une des
illustrations les plus visibles avec les mashups on agreacutege le contenu eacutemanant de
plusieurs sites afin de creacuteer un site nouveau On utilise alors souvent lobjet XML
lAJAX du cocircteacute de linternaute les RSS et les API (Web Services) des sites mixeacutes
LAPI nest donc pas seulement un dieu eacutegyptien Pour faire simple on peut dire
que cest une interface de programmation mise agrave disposition des internautes
(avertis) pour deacutevelopper des applications Une application pourra alors acceacuteder agrave
des programmes systegraveme pour envoyer recevoir ou extraire des donneacutees Ainsi
Google publie lAPI de Google Maps qui est utiliseacute par de nombreux deacuteveloppeurs
pour creacuteer des applications deacuteriveacutees du service de cartographie de Google par
exemple la carte de suivi du teacutelescope spatial Hubble la meacuteteacuteo dans le monde 17
Le rocircle du RSS (voir glossaire) est par ailleurs preacutepondeacuterant Ce format qui
permet dexporter et lire des donneacutees dactualiteacutes au format XML se retrouve dans
quasiment toutes les applications dites Web 2 et peut en constituer lemblegraveme sinon
la caracteacuteristique majeure avec les tags Il permet de surveiller les flux de nouvelles
informations issues de sites dactualiteacutes de blogs de moteurs de recherchehellipbref
de tout site web qui propose un contenu qui se renouvelle Le RSS va aussi servir agrave
exporter des bookmarks sociaux que sont les tags ou les favoris par exemple
copy Digimind Digimind Services ndash White Paper |16
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Si le Web 2 nest pas une reacutevolution technologique en soit la relative simpliciteacute de
mise en place de ces techniques et leurs coucircts de programmation reacuteduits expliquent
le tregraves fort deacuteveloppement que connaissent toutes ces applications Par ailleurs la
baisse constante du coucirct dheacutebergement et de bande passante a faciliteacute la diffusion
de ce web nouvelle geacuteneacuteration
Mais il subsiste des effets de seuil Des applications gigantesques comme Flickr de
Yahoo offrant lheacutebergement et le partage de photos impliquent la gestion de
vastes bases de donneacutees et des infrastructures de stockage importantes Seules de
grandes firmes comme Yahoo Inc Google Microsoft ou AOL par exemple peuvent
se deacutepartir efficacement de ce type de contraintes
copy Digimind Digimind Services ndash White Paper |17
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les familles dapplications du Web 20
TYPOLOGIE
Les familles drsquoapplications Web 20 sont nombreuses et diverses de nouveaux
services apparaissent quotidiennement (sans garantie de peacuterenniteacutehellipet bien souvent
de faccedilon redondante) Sans preacutetendre dresser une liste exhaustive des nombreuses
possibiliteacutes on peut deacutegager une typologie des applications selon diffeacuterents
domaines drsquoactiviteacute Les applications speacutecifiquement deacutedieacutees agrave la veille et agrave la
recherche dinformation seront deacuteveloppeacutees dans la partie suivante
Bureautique en ligne
Courant 2006 Google a lanceacute successivement plusieurs logiciels collaboratifs en
ligne un outil de gestion drsquoagendas (Google Calendar 18) un tableur (Google
Spreadsheet) et enfin apregraves le rachat de la socieacuteteacute Writely un traitement de texte
(Google Docs) 19 Ces logiciels permettent de creacuteer modifier partager et publier en
ligne des documents sur un espace de stockage Depuis plusieurs mois on assiste agrave
une veacuteritable deacuteferlante de logiciels de bureautique en ligne deacutesigneacutes parfois sous le
terme de web office RallyPoint AjaxWrite (pour Firefox uniquement) ZohoWriter
ThinkfreehellipOutre la gratuiteacute lrsquointeacuterecirct de ces logiciels concurrents de la suite
Microsoft Office est leur disponibiliteacute sur toute machine connecteacutee au reacuteseau et tout
systegraveme drsquoexploitation Attention toutefois aux questions de sauvegarde de
compatibiliteacute de synchronisation des donneacutees et enfin de confidentialiteacutehellip
Emploi
Les blogs constituent un bon moyen pour promouvoir son CV mettre en avant
expeacuterience et compeacutetences et faciliter les eacutechanges Des jobblogs verticaux
speacutecialiseacutes par secteur ou reacutegion connaissent un grand succegraves (voir par exemple
ceux du site et moteur Moovement20) Le networking professionnel est eacutegalement agrave
la mode agrave travers des sites comme Linkedin (creacuteeacute en 2003 aux Etats-Unis) Viadeo
(ex Viaduc drsquoorigine franccedilaise) ou Xing (ex OpenBC agrave vocation europeacuteenne) Le
principe est de tirer parti des reacuteseaux de connexions sociales virtuelles afin
copy Digimind Digimind Services ndash White Paper |18
Le Web 20 pour la veille et recherche dinformation DIGIMIND
drsquoidentifier des salarieacutes ou employeurs potentiels mais aussi drsquoeacutetoffer son reacuteseau de
clients partenaires fournisseurshellip
Lrsquoe-cooptation (Cooptin Jobmeeters 21) met le reacuteseau au cœur de la deacutemarche de
recrutement via un systegraveme de prime de cooptation et peut aider les demandeurs
agrave identifier les offres du marcheacute cacheacute
Commerce en ligne
Le client est roi et le Web 20 permet de rehausser son niveau de participation sur
les sites marchands On peut ainsi tagger ou annoter des reacutefeacuterences drsquoouvrages dans
le catalogue Amazon Gracircce agrave des sites comme Zlio ou la Shoposphegravere de Yahoo22
les internautes peuvent recommander agrave leur entourage des produits et
serviceshellipen touchant une commission sur les ventes reacutealiseacutees Des guides drsquoachat
et comparateurs de prix comme Ciao integravegrent les avis de consommateurs et
drsquoexperts Le site Wantuno (inspireacute de lrsquoameacutericain Woot) innove dans le domaine
de la vente eacuteveacutenementielle en vendant un seul produit nouveau high tech par jour
annonceacute en podcast videacuteo agrave des internautes preacutevenus par flux RSS23 Certains
analystes voient lrsquoavenir du commerce eacutelectronique dans le concept de CtoB
(Consumer to Business) inverse du BtoChellip
Geacuteolocalisation
Google Maps a eacuteteacute lrsquoun des premiers services de geacuteolocalisation en srsquoappuyant sur
lrsquooutil de recherche pour localiser sur des cartes des services de proximiteacute
(commerces station servicehellip) La version 2 du site Geacuteoportail de lrsquoIGN disponible
depuis fin mai 2007 srsquoenrichit de nouveaux services pratiques et citoyens (accegraves au
cadastre visualisation des zones agrave risquehellip) Google Earth fait lrsquoobjet de partenariats
avec la NASA ou le programme des Nations Unies pour lrsquoenvironnement La
geacuteolocalisation peut srsquoadapter eacutegalement au partage de photos (Yahoo Maps et
Flickr ou le projet Pikeo chez Orange)24
Recherche drsquoinformations
Des agreacutegateurs de meacutedia comme Digg ou Wikio laissent une large place agrave
lrsquointernaute pour tagger ou recommander par vote les articles issus de meacutedias
classiques ou blogs On suivra eacutegalement lrsquoactualiteacute en syndiquant des flux RSS agrave
travers des agreacutegateurs comme Netvibes ou Newsgator Les grands moteurs (Google
Custom Search Yahoo Search Builder MSN Live search Macros) offrent des options de
copy Digimind Digimind Services ndash White Paper |19
Le Web 20 pour la veille et recherche dinformation DIGIMIND
creacuteation de moteurs personnalisables effectuant des recherches sur des bouquets
de sources preacuteseacutelectionneacutees par lrsquoutilisateur On peut mutualiser les connaissances agrave
travers des wikis collaboratifs geacuteneacuteralistes (Wikipedia) ou speacutecialiseacutes Enfin le projet
de moteur collaboratif Wikiasari qui doit aboutir courant 2007 aura recours aux
mecircmes technologies libres que la ceacutelegravebre encyclopeacutedie ainsi qursquoagrave un reacuteseau humain
ou communauteacute de confiance qui validera les reacutesultats de la recherche
Les actualiteacutes sur Wikio sites de presse blogs et navigation par tags (agrave droite)
Diffusion drsquoactualiteacutes
Pour Pierre Chappaz fondateur du site Wikio les blogueurs ne sont pas journalistes
mais ils peuvent apporter une vraie expertise sur certains sujets quils connaissent et il
serait dommage de sen priver Selon lui les meacutedias 20 ne seront plus des canaux
exclusifs de diffusion mais producteurs de contenu et des marques Deacutesormais le
scoop nrsquoest plus lrsquoapanage des seuls journalistes aux Etats-Unis une jurisprudence
donne droit depuis 2006 aux blogueurs de proteacuteger leurs sources au mecircme titre
que les journalistes professionnels Des centaines de blogs politiques ont fleuri sur le
web certains drsquoentre eux se reacuteveacutelant particuliegraverement influents On parlera de
journalisme citoyen agrave propos de sites comme Agoravox ou de lrsquo alleacutee
numeacuterique Rue 89 lanceacutee en mai 2007 par drsquoanciens journalistes du quotidien
Libeacuteration Ces nouveaux meacutedias en ligne marient les communications venant de
journalistes professionnels experts et internautes
copy Digimind Digimind Services ndash White Paper |20
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Loisirs
On retrouve ici la notion de filtrage collaboratif baseacute sur un systegraveme de
recommandations et drsquoeacutevaluations par les utilisateurs Ces recommandations
peuvent concerner les livres les destinations de voyage la musique la videacuteohellipet
proviennent de lrsquoanalyse de comportements drsquoachats des internautes et de leurs
eacutevaluations de produits Le moteur drsquoanalyse preacutedictive Criteo 25 a ainsi lanceacute en
feacutevrier 2007 un service de recommandations automatique de blogs apregraves avoir
utiliseacute sa technologie pour lrsquoeacutevaluation de videacuteos
La participation des internautes peut aller jusqursquoau financement et agrave la production
drsquoœuvres artistiques le projet A swarm of angels permet drsquoaider agrave la creacuteation de
films qui seront distribueacutes sous licence creative commons et diffuseacutes via les reacuteseaux
peer-to-peer
Partage de documents multimeacutedia
Il srsquoagit sans doute drsquoune des applications les plus reacutepandues du Web 20 Les grands
acteurs du web ont largement investi ce domaine Google a racheteacute en 2006 le site
de partage de videacuteo Youtube Yahoo de son cocircteacute avait racheteacute le site de partage de
photos Flickr Les favoris peuvent eacutegalement ecirctre mutualiseacutes via des services en
ligne comme Delicious (groupe Yahoo) ou Blogmarks De nombreux services de
partages de photos videacuteo ou podcasts se sont deacuteveloppeacutes reacutecemment on peut
citer parmi eux les sites franccedilais DailyMotion ou la banque drsquoimages Fotolia Podemus
ou Radioblog figurent parmi les sites communautaires de podcasts
Enseignement et recherche
Henry Jenkins26 professeur au MIT imagine des uniteacutes drsquoenseignement conccedilues
sur les modegraveles YouTube ou Wikipedia des deacutepartements qui ldquopermettraient le
deacuteploiement rapide drsquoexpertises disperseacutees et la reconfiguration des champsrdquo De
nouveaux usages apparaissent dans le paysage eacuteducatif mais attention lagrave encore agrave
lrsquoillusion de faciliteacute selon le philosophe Fernando Savater laquo Internet neacuteduque pas il
neacutecessite mecircme une eacuteducation preacutealable raquo Olivier Ertzcheid dans son blog Affordance 27 distingue plusieurs eacuteleacutements caracteacuteristiques drsquoune science 20 et notamment
la possibiliteacute drsquoannoter et commenter des publications scientifiques (notamment les
collections Open Acess Plos One28) ou de nouveaux modes drsquointerrogation des
bases de donneacutees (interface Hubmed sur la base meacutedicale Medline)
copy Digimind Digimind Services ndash White Paper |21
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Marie France Blanquet29 maicirctre de confeacuterence en sciences de lrsquoinformation
distingue le travail coopeacuteratif du travail collaboratif En matiegravere drsquoapprentissage le
travail coopeacuteratif reacutealiseacute par chaque eacutequipe contribue agrave une œuvre collective ougrave le
rocircle de chacun est deacutefini de faccedilon claire Lrsquoapprentissage collaboratif reacutesulte du
travail individuel soutenu par des activiteacutes de groupe ou drsquoeacutequipes de faccedilon souple
et ouverte Ce type de travail se base sur les capaciteacutes de communication et
drsquointeraction de chacun Lrsquoeacutecriture collective des articles composant lrsquoencyclopeacutedie
Wikipeacutedia en est un exemple
Plusieurs expeacuterimentations drsquousage des blogs et podcasts ont eacuteteacute tenteacutees agrave
lrsquoUniversiteacute A Lyon II des eacutetudiants ont pu enregistrer des cours sur un Ipod pour
diffusion en podcast sur leurs blogs A lrsquoUniversiteacute Catholique de Lille les eacutetudiants
de Jean-Paul Pinte30 chargeacute de lrsquoinnovation peacutedagogique doivent alimenter
reacuteguliegraverement un blog Pour ce chercheur speacutecialiste de la veille en eacuteducation le
renouveau des meacutethodes drsquoenseignement se traduit par le rocircles des Enseignants
Connecteurs et eacutetudiants proneacutetaires
Bibliothegraveques
La bibliothegraveque 20 place elle aussi lrsquoutilisateur au centre et ce agrave travers plusieurs
types drsquoexpeacuterimentations de lrsquoutilisation des logiciels de messagerie instantaneacutee
pour eacutechanger avec les utilisateurs agrave lrsquointeacutegration de tags pour enrichir les
catalogues en passant par des interfaces de consultation simplifieacuteeshellip De
nombreux blogs de bibliotheacutecaires (Bibliobsession 31) permettent de suivre lrsquoeacutetat de
lrsquoart La bibliothegraveque de lrsquoUniversiteacute drsquoAlbany est alleacutee jusqursquoagrave publier un manifeste
du bibliotheacutecaire 20 32
copy Digimind Digimind Services ndash White Paper |22
Le Web 20 pour la veille et recherche dinformation DIGIMIND
COMMENT IDENTIFIER UN SITE WEB 20
Est-ce que le site sur lequel vous naviguez ou lapplication que vous utilisez est
Web 20 Quelle importance pourrait-on reacutepondrehellipToutefois un site de cette
geacuteneacuteration offrira plus de possibiliteacutes agrave vous lutilisateur Pour reconnaicirctre un tel
site quelques caracteacuteristiques sont agrave retenir
- le type de site il appartiendra agrave lune des grandes familles citeacutees plus haut il sera
blog bookmark ou reacuteseau social mashup ou page personnalisable bref il permet
de partager et de diffuser du contenu aiseacutement Le site peut ecirctre lui-mecircme une
application Web 2 ou en inteacutegrer des briques Exemple un site Corporate qui
heacuteberge des blogs de ses salarieacutes etou diffuse son actualiteacute via un fils RSS
- le rocircle de lutilisateur le site Web 2 vous permet de participer de personnaliser
et de collaborer vous pouvez en effet ajouter des commentaires eacutecrire un billet
lire un flux RSS noter (voter) ou annoter un article teacuteleacutecharger ou uploader des
images des videacuteos eacutecouter un podcast Ces sites proposent souvent des interfaces
personnalisables couleurs style organisation de laffichage du contenuhellip
- la navigation elle est plutocirct simplifieacutee par rapport aux sites de premiegravere
geacuteneacuteration Les menus sont plus leacutegers un flux RSS est toujours proposeacute et un
nuage de tags est souvent preacutesent
- le testeur cest vous non content de faire apporter une partie de son contenu par
linternaute un service Web 20 fait en plus souvent tester ses applications agrave ses
utilisateurs et est donc freacutequemment en version becircta (voire alpha) une becircta
publique ou priveacutee (linternaute fait alors partie dun petit cercle dinitieacutes dans le
secret des dieux)
copy Digimind Digimind Services ndash White Paper |23
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les applications Web 20
pour la veille et la
recherche dinformations
LES TYPES DAPPLICATIONS
Pour le veilleur et le chercheur dinformation les applications du Web 20 sont
riches tant dans les possibiliteacutes offertes par leurs interfaces que dans le contenu
diffuseacute Mieux connaicirctre ces services permettra de trouver davantage dinformation
(ou autrement) de gagner du temps de mieux partager voire decirctre plus visible sur
le web
Vous laurez compris le web 20 se fonde essentiellement sur la notion de partage
de participation et de collaboration entre les individus Ce nest pas forceacutement
toujours facile possible voire autoriseacute dans le monde professionnel Mais partager
cest aussi agrave terme pouvoir recevoirhellip
I Partager et collaborer
a Les Bookmarks sociaux
Les bookmarks sociaux sont une des applications les plus caracteacuteristiques du Web 2
et en sont preacutecurseurs Apparus en 2004 ces services vous offrent la possibiliteacute de
partager vos bookmarks cest-agrave-dire vos favoris Ainsi apregraves enregistrement le plus
souvent gratuit vous pouvez mettre en ligne tout ou partie de vos favoris (titre
copy Digimind Digimind Services ndash White Paper |24
Le Web 20 pour la veille et recherche dinformation DIGIMIND
adresse et description dune page ou site) et les rendre potentiellement accessibles
aux internautes du monde entier et du moins aux utilisateurs de ce service Vous
avez la possibiliteacute de garder ces favoris priveacutes en ne les partageant quavec vos
proches ou seulementhellipvous-mecircme
Ces applications sont au deacutepart tregraves simples et proposent ensuite suivant les sites
plus ou moins de perfectionnements il suffit dajouter le nom et ladresse (url) de la
page web qui vous inteacuteresse assortis des commentaires de votre choix Ces
adresses web sont rattacheacutees agrave un espace qui vous est personnel auquel vous
acceacutedez en vous identifiant Cet espace personnel est identifiable via une adresse
preacutecise Par exemple sur Delicious33 (de Yahoo) lun des services de bookmarks
sociaux les plus utiliseacutes lurl deacutesignant mes favoris est httpdeliciousslide68 En
naviguant sur Delicious vous pouvez acceacuteder aux favoris mis en ligne par des
collaborateurs amis ou inconnus qui partagent les mecircmes inteacuterecircts et passions que
vous Leurs pages sont eacutegalement identifieacutees par une url unique
Lajout dadresse
Lajout dadresse seffectue en se connectant directement sur le site de
bookmarking social ou plus pratique via une barre ou un bouton deacutedieacutes qui
inteacutegreacutes agrave votre navigateur facilitent lajout du site que vous ecirctes en train de visiter
Vous pouvez eacutegalement trouver des icocircnes sur des pages web vous proposant
dajouter un contenu un site agrave votre service de social bookmaking Peut-ecirctre avez-
vous deacutejagrave rencontreacute ces icocircnes agrave la fin dun billet de blog par exemple (voir
illustration ci-dessous) Ils permettent alors dajouter ladresse du billet agrave un ou
plusieurs services de bookmarks sociaux ainsi quagrave des services dactualiteacutes
collaboratives (nous en reparlerons plus bas)
copy Digimind Digimind Services ndash White Paper |25
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ce blog propose via des icocircnes lajout de ce billet dans les favoris de Delicious ou les services sociaux dactualiteacutes
Lorsque vous ajoutez une adresse vous lui attribuez des tags (voir glossaire) cest-agrave-
dire un ou plusieurs mots cleacutes de votre choix qui vont caracteacuteriser expliquer
contextualiser eacutetiqueter le favori et donc lidentifier de maniegravere simple pour vous et
tous les visiteurs Cest une information qui vient sajouter agrave la traditionnelle
description du site Cest donc vous qui choisissez votre propre mode de
classement de hieacuterarchisation et de labellisation (et non plus un service qui vous
propose de ranger vos ressources dans des cateacutegories preacutedeacutefinies) Cette possibiliteacute
fait partie de ce que lon appelle la folksonomie agrave savoir une taxonomie (science du
classement) populaire en quelque sorte
Ainsi vous pouvez ajouter ladresse du site portail NanotechNow
httpwwwnanotech-nowcom consacreacute aux nanotechnologies et y adjoindre les
tags nano nanotehnologies sciences science research mais aussi pourquoi
pas qualiteacute excellent pour donner votre opinion
copy Digimind Digimind Services ndash White Paper |26
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Des favoris consacreacutes agrave la Chine dans Delicious A droite les tags associeacutes agrave ces bookmarks Les tags
Sur une application typique de social bookmarking (type delicious) il est possible
de rechercher sur le titre des favoris de tous les autres utilisateurs et aussi sur
leurs tags Ainsi en cliquant sur le tag Nanotech vous obtiendrez la liste de tous
les favoris que les internautes ont classeacutes sous ce label Cest lagrave lun des principaux
inteacuterecircts la possibiliteacute de rechercher sur le nom des eacutetiquettes textuelles deacutefinies
par les internautes eux-mecircmes Mais tous les internautes nont pas la mecircme logique
de classement et il est fort possible de passer agrave coteacute de favoris inteacuteressants mais
eacutetiqueteacutes selon un mot auquel vous nauriez jamais penseacute De plus un mecircme mot
peut avoir plusieurs sens ou ecirctre employeacute diffeacuteremment selon les individus
Delicious a reacutesolu ndashpartiellement- ce problegraveme en offrant la possibiliteacute de deacutecrire
ses tags cest agrave dire de les expliquer (par orange je parle de la couleur ou de la
production dagrumes en Floride) Cest donc un deacutebut de seacutemantique appliqueacute agrave
cette folksonomie Quoiquil en soit le problegraveme du sens des mots employeacutes par
les creacuteateurs de contenu concerne lensemble du web Lorsque vous ne trouvez
pas un site via une requecircte sur un outil de recherche et que ce site existe pourtant
bel et bien cest souvent parce que vous nemployez pas les mecircmes mots cleacutes que
ceux utiliseacutes par le creacuteateur du site dans son texte
Les tags peuvent eacutegalement sappliquer agrave des photos (Flickr) agrave des projets
(43Things) ou des videacuteos (YouTube DailyMotion) Ils peuvent servir aussi agrave eacutetiqueter
et cateacutegoriser les billets dun blog
copy Digimind Digimind Services ndash White Paper |27
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les communauteacutes
Lautre atout des bookmarks sociaux pouvoir constituer et se connecter avec
une communauteacute de speacutecialistes Par speacutecialiste on deacutesignera simplement un
internaute qui centre ses recherches sur les mecircmes sujets que vous quil soit
amateur ou professionnel
Exemple Votre domaine ce sont les biotechnologies En entrant la requecircte
Biotechnologies sur le moteur de recherche de Delicious vous obtenez une liste
de plusieurs milliers de favoris Pour chacun dentre eux est indiqueacute le nombre de
personnes qui ont sauvegardeacute cette mecircme adresse En seacutelectionnant lun de ces
utilisateurs vous pouvez deacutecouvrir un internaute qui comme vous reacuteguliegraverement
ajoute des adresses de sites deacutedieacutes ou connexes aux biotech Il ne vous reste plus
quagrave mettre en surveillance ce membre de delicious Il disposera en effet de sa
propre adresse XML Exemple httpdeliciousrssvantive98 Vous serez alors
averti degraves lors que cet utilisateur ajoute un favori agrave sa page
La valeur des outils de social bookmarking est encore plus probante lorsquils sont
deacutedieacutes agrave des communauteacutes de pratiques ou agrave des secteurs dactiviteacutes bien preacutecis
Plusieurs initiatives ont deacutejagrave eacuteteacute mises en ligne34 On peut citer Connotea eacutediteacute par
la ceacutelegravebre revue Nature et donc destineacute agrave un public scientifique Lors de la mise en
favoris ce service extrait automatiquement les reacutefeacuterences bibliographiques
lorsquelles sont issues de sites tels que Nature Science ou PubMed Plus ancien
CiteUlike est baseacute sur le mecircme principe mais est compatible avec davantage de
revues scientifiques encore Snipitron est lui deacutedieacute aux chercheurs eacutetudiants et
professionnels Ici vos bookmarks font partie dun projet qui seacutecoule dans le temps
concernant une recherche ou une tacircche preacutecise
Linteacuterecirct des bookmarks sociaux est donc dabord dans lutilisation de la
communauteacute afin de trouver des sources pertinentes Ce type doutil reacutevegravele toute
sa puissance lorsquun utilisateur proche de vous en terme de domaines de veille a
eacuteteacute identifieacute Vous pouvez donc alors lutiliser comme collaborateur virtuel mais
aussi rechercher parmi les sources jugeacutees pertinentes par un groupe dutilisateurs
identifier des leaders de veille ou juger de la populariteacute dune source (combien de
fois a-t-elle eacuteteacute mise en favoris Ce nombre de sauvegardes neacutetant quun indicateur
parmi dautres) Si vous ne partagez pas ces outils restent toutefois un tregraves bon
moyen de meacutemoriser et cateacutegoriser vos favoris en un point unique daccegraves
copy Digimind Digimind Services ndash White Paper |28
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Quel service
Il existe plusieurs dizaines de services de bookmarks sociaux Ils proposent des
fonctionnaliteacutes plus ou moins sophistiqueacutees Un des critegraveres essentiels de choix est
leur succegraves En effet leur force repose en grande partie sur le nombre de favoris
dutilisateurs partageacutes agrave moins de freacutequenter des bookmarks deacutedieacutes agrave des
communauteacutes tregraves cibleacutees Dautre part la rapiditeacute du service et la pertinence de
son moteur de recherche sont aussi des paramegravetres importants
Delicious qui appartient agrave Yahoo est lun des plus connus et des plus utiliseacutes Yahoo
MyWeb2 rassemble eacutegalement une grande communauteacute ainsi que Furl ou encore
Blogmarks et Blinklist35 Certains de ces sites au-delagrave de larchivage de ladresse
proposent de conserver une copie inteacutegrale dune page web Dautres vous
suggegraverent des sites similaires agrave ceux que vous avez mis dans vos favoris Cette
similariteacute se base notamment sur les favoris ajouteacutes par les autres utilisateurs La
recherche par similariteacute (ou par suggestion en fonction de vos habitudes de
navigation) offerte par des services comme Yoono StumbleUpon ou Similicious 36 est
une meacutethodologie de recherche particuliegraverement inteacuteressante Nous en reparlerons
plus loin
Pour choisir preacuteciseacutement votre service de bookmarks sociaux vous pouvez vous
aider de ces ressources 37
- le site Irox propose un tableau comparatif de pregraves de 20 services
- le blog de Robin Good offre une seacutelection inteacuteressante de bookmarks sociaux
- la page Free Bookmark Managers affiche une liste dune quarantaine de logiciels et
utilitaires deacutedieacutes au partage et agrave la gestion de vos favoris (bookmarks) en ligne via
accegraves distant en local ou sur serveur Attention tous ne sont pas sociaux cest-agrave-
dire baseacutes sur le partage
copy Digimind Digimind Services ndash White Paper |29
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b Le Multimeacutedia photos et videacuteos
Le partage de vos ressources ne se limite pas au texte et adresse de sites Il est
eacutegalement possible de partager vos photos et videacuteos
Les images
Flickr 38 racheteacute par Yahoo Inc en 2005 est lapplication type de partage dimages
voire mecircme larcheacutetype du service Web 20 ce site permet de mettre en ligne ses
photos de les partager avec ses proches ses collegravegues ou de les laisser en accegraves
priveacute
Il est possible dutiliser un moteur pour rechercher agrave travers les millions de photos
mises en ligne par les autres utilisateurs
Flickr na pas de points communs avec les nombreuses applications Web 2 en becircta agrave
linterface artisanale Sur le service de Yahoo la puissante interface en fait un outil
tregraves simple agrave utiliser Ainsi via le menu Organize vous pouvez acceacuteder agrave une
veacuteritable table de montage virtuelle pour organiser vos photos
copy Digimind Digimind Services ndash White Paper |30
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche sur Flickr A droite les noms dutilisateurs et les tags associeacutes aux photos
Comme sur les bookmarks sociaux la recherche peut seffectuer sur le titre ou la
description mais aussi sur les tags chaque internaute qui partage ses photos leur
attribue des mots cleacutes pour les deacutefinir les expliquer les contextualiser voire donner
son opinion
Chaque liste de reacutesultats chaque photo est accompagneacutee par ses tags Ceux-ci
permettent aussi daffiner ou deacutelargir votre recherche lorsque vous en seacutelectionnez
un Il est possible de rechercher sur les photos les utilisateurs mais aussi sur les
groupes En effet la notion de communauteacute est eacutegalement importante Les
groupes rassemblent les utilisateurs qui partagent les mecircmes centres dinteacuterecirct
photographiques Des forums de discussions sont inteacutegreacutes agrave ces groupes
permettant dentrer en contact direct avec certains membres
copy Digimind Digimind Services ndash White Paper |31
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Par exemple le groupe The Eyes Have It 39 rassemble les utilisateurs (et donc leurs
photos) autour du thegraveme de la communication visuelle des secteurs pharmacie et
biotech
Que peut trouver le veilleur sur un service de photos tel que Flickr
Finalement la mecircme chose que sur les bookmarks sociaux tout ce que les
membres ont voulu partager des photos du dernier salon automobile de Detroit 40
ou de la convention annuelle des industries cosmeacutetiques dAmeacuterique du Nord La
veille concurrentielle ou la veille image sur votre propre socieacuteteacute est eacutegalement
inteacuteressante Ainsi une recherche (full text) sur la socieacuteteacute peacutetroliegravere Exxon affiche
plus de 1400 photos relatives aux stations services aux puits de peacutetrole aux
raffineries aux employeacutes aux manifestions de contestataires ou aux publiciteacutes
deacutetourneacutees
Comme avec le social bookmarking vous pouvez vous attacher agrave suivre les
membres qui partagent les mecircmes centres dinteacuterecirct que vous ou votre organisation
apregraves seacutelection de la page de lutilisateur la mise en surveillance de son flux RSS
permet decirctre averti degraves que cette personne ajoute de nouvelles photos
Dautres services permettant le partage de photos existent Toutefois ils ne vont
pas aussi loin que Flickr dans la logique Web 20 Le service PhotoBucket 41 est le
grand concurrent de Flickr mais avec une approche plus grand public Flickr est
davantage freacutequenteacute par des internautes avertis des professionnels et des
passionneacutes de photographie En ce sens le service de Yahoo sera donc plus
inteacuteressant pour le veilleur
Squidoo 42 est en quelque sorte un annuaire de bookmarks perfectionneacute une
rencontre de services sociaux comme Delicious et Flickr Squidoo vous permet en
effet de creacuteer une page de liens dans un domaine qui vous passionne et de la
structurer en rubriques agreacutementeacutees de photos
Linterface simple rend possible la creacuteation rapide de pages speacutecialiseacutees (appeleacutees
lensgtobjectifs lentilles) et de les rendre visible agrave tout un chacun On trouve par
exemple plusieurs lens consacreacutees aux nanotechnologies43 Chaque lens est
accompagneacutee de tags connexes agrave son sujet
Vous pouvez rechercher ces pages gracircce agrave un moteur de recherche un reacutepertoire
par cateacutegories un nuage de tags (exemple le tag Marketing 44) ou mecircme parcourir
le Top100
copy Digimind Digimind Services ndash White Paper |32
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La videacuteo
Via les services YouTube ou DailyMotion le partage de videacuteos en ligne est plus
meacutediatiseacute que les services de photos Notamment parce que le leader Google a
racheteacute YouTube en octobre 2006 geacuteneacuterant un buzz sans preacutecegravedent au sein des
blogs et de la presse traditionnelle (Mainstream medias)
YouTube 45 et ses concurrents Web 20 fonctionnent agrave peu pregraves de maniegravere
eacutequivalente agrave Flickr sans en atteindre toutefois sa clarteacute ergonomique
Tout ces sites de videacuteos vont permettre drsquouploader (charger vers le site) et
partager vos videacuteos (converties automatiquement au format FlashVideo) et aussi
bien sucircr de rechercher parmi les videacuteos des autres utilisateurs
Sur ces applications on retrouve de nombreuses caracteacuteristiques du Web 2 les
videacuteos classeacutees par cateacutegories sont accompagneacutees de tags qui aident agrave les
contextualiser et les deacutecrire en plus du titre et de la description renseigneacutes par
lutilisateur Un fils RSS permet de surveiller lajout de videacuteos dans une cateacutegorie ou
par un utilisateur deacutefini A linstar des billets dun blog les internautes peuvent
commenter les videacuteos De plus les videacuteos sont noteacutees ce qui impacte ensuite leur
place dans le classement et donc leur visibiliteacute
Ces services contiennent des favoris inteacutegreacutes ougrave lon peut sauvegarder ses videacuteos
preacutefeacutereacutees Il est possible de partager sa videacuteo par mail ou messagerie instantaneacutee
de la poster sur son blog Dailleurs de nombreux blogueurs utilisent les services de
type YouTube (ou Flickr pour la photo) pour stocker leurs fichiers multimeacutedias trop
volumineux pour les heacutebergeurs de blogs La notion de groupe comme sur Flickr
est preacutesente des communauteacutes rassemblent des utilisateurs autour de grandes
theacutematiques lieacutees par exemple agrave la politique aux sports et aux voyages
YouTube a de nombreux concurrents aux fonctions tregraves proches Impossible de
tous les mentionner Mais on peut retenir cependant le franccedilais DailyMotion 46 tregraves
populaire dailleurs neacute quelques semaines avant YouTube Citons eacutegalement Yahoo
Videos AOL Videos Revver Grouper (de Sony) Metacafe SoapBox (de Microsoft)
Zudeo Wideo MySpace Vimeo 47Certains de ces services proposent du contenu
amateur ainsi que des films professionnels issus des networks de TV et de cineacutema
Mais les plus petits services se cantonnent aux videacuteos envoyeacutees par linternaute que
celles-ci aient dailleurs eacuteteacute copieacutees ou non
copy Digimind Digimind Services ndash White Paper |33
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche sur DailyMotion
Quel contenu agrave usage professionnel le veilleur peut espeacuterer trouver sur ces
plateformes Essentiellement des videacuteos consacreacutees agrave des socieacuteteacutes et individus
Ainsi si je reacuteitegravere ma recherche sur la socieacuteteacute peacutetroliegravere Exxon jobtiens des videacuteos
sur des manifestations des mareacutees noires le reacutechauffement climatique des
actualiteacutes boursiegraveres des retransmissions de procegraves des deacutetournements de
publiciteacutehellipLa recherche de videacuteos saverra particuliegraverement utile pour une veille
Image Produits ou concurrentielle Le contenu de videacuteos est eacutegalement souvent
tregraves politique agrave partir de la campagne des eacutelections preacutesidentielles franccedilaises de
2007 la diffusion de videacuteos sur les hommes et femmes politiques est devenue une
veacuteritable arme Autre aspect inteacuteressant la possibiliteacute de deacutecouvrir de nombreux
extraits de videacuteos de documentaires sur des sujets extrecircmement varieacutes eacutecologie
industrie socieacuteteacute consommation
Le contenu de ces services de videacuteos est donc agrave limage du net heacuteteacuterogegravene mais
potentiellement riche
copy Digimind Digimind Services ndash White Paper |34
Le Web 20 pour la veille et recherche dinformation DIGIMIND
c Partage de CV et reacuteseaux sociaux
Termineacute le temps ou seules les personnes agrave qui vous transmettiez votre CV ou
votre carte de visite pouvaient prendre connaissance de votre identiteacute et de votre
parcours professionnel Via les plateformes de reacuteseaux sociaux le push fait place au
pull de plus dans une optique de cooptation et de recommandation il y est
possible de mettre son CV en ligne sous format hypertexte et de demander agrave
rentrer en relation avec des proches de votre reacuteseau immeacutediat Les plateformes de
reacuteseaux sociaux sont nombreuses certaines sont agrave vocation geacuteneacuteraliste dautres
uniquement deacutedieacutees aux actifs dautres encore reacuteserveacutees agrave une communauteacute
(eacutetudiants lyceacuteens anciens eacutelegraveves passionneacutes de voyages)
Ces applications repreacutesentent un marcheacute conseacutequent puisque pour les seuls USA
on preacutevoit un chiffre daffaires des reacuteseaux sociaux de 25 milliards de dollars agrave
lhorizon 2011 contre 350 millions en 200648 La France est domineacutee par la
plateforme Viadeo (ex-Viaduc)49 Ce service leader lanceacute en 2004 compte plus de
750 000 profils Dans les autres pays cest LinkedIn 50 qui domine geacuteneacuteralement
avec plus de 9 millions dutilisateurs dans 135 pays
Une recherche sur Viadeo
copy Digimind Digimind Services ndash White Paper |35
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les fonctionnaliteacutes
Que trouve-t-on sur ces sites Notamment des profils de personnes en activiteacute ou
en recherche demploi ainsi que des hubs regroupant des utilisateurs autour dun
mecircme centre dinteacuterecirct toujours la notion de communauteacutes de pratiques propre au
Web 20 Sur ces services tout est penseacute pour creacuteer du lien social Le profil
individuel se constitue dun CV enrichi de nombreux liens vers ses employeurs ses
amis ses reacuteseaux professionnels et associatifs ses travaux et publications Les hubs
regroupent les personnes autour de secteurs meacutetiers associations danciens eacutelegraveves
pays reacutegions Par exemple sur Viadeo saffichent les hubs Analyse Veille
Strateacutegique amp Concurrentielle Intelligence Eco Blogs amp Bloggers Editeurs de
Logiciels Profession documentaliste and co mais aussi Grande distribution
Oceacuteanie ou Normes meacutethodes et outils Dans ces hubs des forums organisent les
discussions des membres autour de theacutematiques deacutefinies Un moteur de recherche
permet de trouver des profils selon un secteur une fonction une reacutegion Une fois
un profil identifieacute il faut demander agrave entrer en relation avec lui Cela sera dautant
plus facile et rapide sil est peu eacuteloigneacute de votre propre reacuteseau de contacts
La veille
Linteacuterecirct pour le professionnel de linformation est double il peut augmenter sa
visibiliteacute et celle de certains de ses projets services publications thegraveses ou articles
Dautre part il peut rechercher des donneacutees sur des personnes et entreprises ou
identifier un expert Comme sur dautres services Web 20 il est facile de se
constituer une communauteacute dutilisateurs partageant ses centres dinteacuterecirct que lon
visitera reacuteguliegraverement Ainsi sur Viadeo une recherche sur le secteur Agro-
alimentaire avec le mot cleacute veilleur 1 affiche plus de 50 reacutesultats avec les fonctions
entreprises et synthegraveses de parcours des membres Vous pouvez alors entrer en
relation avec ces personnes ou tout simplement collecter des donneacutees sur celles-ci
et leurs reacuteseaux Ces sites sont dailleurs devenus un outil essentiel pour certaines
fonctions commerciaux pour la prospection recruteurs journalistes
ethellipresponsables de casting pour eacutemissions TV
1 Certaines fonctionnaliteacutes avanceacutees sont payantes
copy Digimind Digimind Services ndash White Paper |36
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les autres reacuteseaux
Parmi les autres services de reacuteseaux sociaux outre LinkedIn davantage tourneacute agrave
linternational il existe assez utiliseacutes en France 6nergiesnet et Xing (ex Open BC)51
Les reacuteseaux ciblant plus particuliegraverement les jeunes (FaceBook MySpace) peuvent
eacutegalement ecirctre utiliseacutes MySpace feacutedegravere plus particuliegraverement des professions de la
communication de la publiciteacute et des meacutetiers multimeacutedias
Le reacuteseau FaceBook52 est original ce site nord-ameacutericain est preacutecurseur dun social
networking tregraves segmenteacute reacuteserveacute aux eacutetudiants et aux lyceacuteens Au deacutepart les
membres devaient sinscrire obligatoirement via lemail de leur universiteacute afin de
garantir lauthenticiteacute des profils et donc le seacuterieux de la communauteacute Depuis
FaceBook sest ouvert aussi aux entreprises Ainsi ce site capte tregraves tocirct les futurs
actifs et les fideacutelise
Des ressources
Certaines ressources peuvent vous aider agrave identifier les plateformes de reacuteseaux
sociaux professionnels utiles pour vos recherches Le wiki List of social networking
websites liste de nombreuses plateformes de reacuteseaux sociaux 53 et le site Link n
Rank cateacutegorise des sites de social networking 54
copy Digimind Digimind Services ndash White Paper |37
Le Web 20 pour la veille et recherche dinformation DIGIMIND
d Les sites dactualiteacutes collaboratives recommandation et notation
Ces sites recouvrent en fait diffeacuterents types dapplications
- Les Digg Like Ces services qui sinspirent tous du preacutecurseur Digg55 recueillent des actualiteacutes
proposeacutees par les internautes Le principe apregraves enregistrement un formulaire
simple vous permet de poster lactualiteacute de votre choix susceptible dinteacuteresser les
autres internautes son titre son url sa description Il faut aussi choisir une
cateacutegorie Par exemple Technologies Sciences Monde Affaires Divertissement Ces
cateacutegories peuvent ecirctre subdiviseacutees en theacutematiques plus fines Lactualiteacute si elle est
valideacutee par les modeacuterateurs apparaicirctra alors en ligne Elle sera noteacutee par les autres
internautes qui votent pour elle selon son inteacuterecirct Les actualiteacutes disposant du plus
grand nombre de points se placent alors en haut du classement
La cateacutegorie Sciences sur Digg A gauche les nombres de votes
Ces sites affichent les principales caracteacuteristiques du Web 20 interface eacutepureacutee
possibiliteacute de laisser des commentaires fils RSS pour surveiller les nouvelles
actualiteacutes classement des articles les plus lus les mieux noteacutes possibiliteacute denvoyer
par mail ou de bloguer un article et bien sucircr forte contribution de linternaute Sur
certains sites leacutetiquetage des articles via le systegraveme de tags est proposeacute
copy Digimind Digimind Services ndash White Paper |38
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Linteacuterecirct est de pouvoir positionner certaines informations les unes par rapport aux
autres et connaicirctre la populariteacute dune actualiteacute ou dun sujet (entreprise personne)
abordeacute (la critique de mon produit est-elle tregraves populaire ) Cest une approche
alternative aux agreacutegateurs de news de type Google Actualiteacutes ou Yahoo Actualiteacutes
qui hieacuterarchisent les news avec de puissants algorithmes mais sans recourir agrave
lhumain Ainsi Google Actualiteacutes preacutecise La seacutelection et le positionnement des
articles de cette page ont eacuteteacute reacutealiseacutes automatiquement par un programme
informatique
En outre sur ces services de type Digg linformation nest pas brute linternaute
qui poste lactualiteacute peut selon son expertise y apporter un commentaire de
valeur Linformation peut ecirctre commenteacutee (en plus du vote) par les autres
internautes Comme de nombreux blogueurs les utilisateurs des Digg Like jouent
aux journalistes ou tout simplement donnent leur opinion
Lorsquil sagit dactualiteacutes concernant le produit ou le service dune socieacuteteacute ces
commentaires positifs ou non sont une veacuteritable manne pour de nombreux
professionnels de linformation veilleurs marketeurs chargeacutes deacutetudes et autres
analystes qui vont pouvoir recueillir agrave moindre frais des informations sur leur
nouveau produit leurs clients ou ceux de la concurrence
Digg est lun des sites les plus copieacutes du Web 20 Sil reste la reacutefeacuterence dautres
applications tregraves largement inspireacutees tirent leur eacutepingle du jeu En France Scoopeo
Fuzz et TapeMoi offrent eux aussi des services dactualiteacutes collaboratives On peut
eacutegalement citer Rojo le canadien Niouz lespagnol Meneames le reacuteseau de sites
BlogMemes 56 Mecircme Netscape pionnier du navigateur web a lanceacute un portail
sinspirant du systegraveme de notation de Digg
On peut reprocher agrave ce type de site de favoriser les cateacutegories techniques et
scientifiques faisant la part belle aux contributions des geeks et autres accrocs du
net grands utilisateurs de services Web 2 Toutefois les sites comme Blogmemes ou
Netscape diffusent davantage dactualiteacutes agrave teneur eacuteconomique et sociale
- Les mix actualiteacutes contributions des internautes
Wikio57 est un service dorigine franccedilaise (creacuteeacute par le fondateur de Kelkoo) agrave
lintersection de Google Actualiteacutes et de Digg En effet Wikio mixe les articles issus
de sites dactualiteacutes de blogs avec des contributions des internautes On peut
prendre connaissance des informations de diffeacuterentes maniegraveres
copy Digimind Digimind Services ndash White Paper |39
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- En naviguant via les theacutematiques (France International Politique Economie
Finance Santeacute Science hellip) ou via le nuage de tags dynamiques qui se modifient en
fonction de la rubrique ou vous vous situez
- En recherchant via le moteur
- En sabonnant aux flux RSS agrave chaque cateacutegorie et agrave chaque tag correspond son
flux RSS De mecircme lorsque vous lancez une requecircte via le moteur vous pourrez
surveiller ces reacutesultats via un flux RSS
- les plateformes de contributeurs indeacutependants
La deacutefiance et la volonteacute dindeacutependance vis-agrave-vis des grands meacutedias traditionnels de
la presse eacutecrite et audio-visuelle se sont traduites degraves 2001 par la creacuteation massive
de blogs Les blogueurs sont-ils et peuvent-ils simproviser journalistes Ce deacutebat
qui promet decirctre sans fin est inteacuteressant De nombreux blogueurs (mais pas la
majoriteacute) sont devenus de veacuteritables experts dans leur domaine agrave force deacutecriture
de lecture et danalyses quotidiennes Ainsi les mainstream medias invitent
maintenant dans leurs colonnes et plateaux les blogueurs les plus talentueux
Ces blogueurs experts ou professionnels ne constituent pas les seuls creacuteateurs
dactualiteacutes alternatives
Des initiatives de plateformes dactualiteacutes eacutecrites par des non professionnels ont
aussi vu le jour Agoravox58 est lun des premiers portails de journalisme citoyen
lanceacute par Joeumll de Rosnay et Carlo Revelli 59 en mai 2005 Agoravox permet aux
internautes de proposer leurs articles pour commenter reacutefleacutechir agrave des sujets
dactualiteacutes si possible avec une approche et un regard diffeacuterents des meacutedias
traditionnels Le format des contributions est multimeacutedia Le site explique Tout le
monde peut devenir reacutedacteur drsquoAgoraVox Il nrsquoest pas neacutecessaire de savoir eacutecrire avec
un style journalistique affirmeacute Chacun drsquoentre nous peut devenir une sorte de capteur
en temps reacuteel de ce qui se passe dans notre entourage en fournissant des articles des
images des extraits videacuteo ou audio Ce qui est important crsquoest de pouvoir teacutemoigner
drsquoun eacuteveacutenement auquel vous avez assisteacute ou que vous avez deacutecouvert en faisant des
recherches Il poursuit Pourquoi devenir reacutedacteur Tout simplement pour faire
entendre votre voix et pour relater des faits que vous avez identifieacutes et qui ne vous
paraissent pas ecirctre suffisamment repris dans les meacutedias traditionnels voire ignoreacutes ou
censureacutes
Agoravox encourage donc agrave utiliser son style personnel Il convient de sinscrire pour
devenir reacutedacteur Les articles doivent toutefois obeacuteir agrave une politique eacuteditoriale60
Un comiteacute de reacutedaction valide ensuite les contributions
copy Digimind Digimind Services ndash White Paper |40
Le Web 20 pour la veille et recherche dinformation DIGIMIND
En quelques mois Agoravox a prouveacute que de simples internautes pouvaient ecirctre
aussi bon reacutedacteurs et experts en fonction de leurs profession passion et
centres dinteacuterecirct agrave linstar des blogueurs professionnels
Agoravox na pas la vocation dun agreacutegateur dactualiteacutes de type Digg Wikio ou
Google News Cest une sorte de quotidien qui privileacutegie les articles de fond et
lanalyse Bien sucircr des reacutedacteurs stars eacutecrivent reacuteguliegraverement et leurs articles
sont attendus Mais ce ne sont pas les rubriqueurs traditionnels des autres meacutedias
Comme sur les autres sites Web 20 le lecteur peut attribuer une note dinteacuterecirct agrave
chaque article et poster un commentaire Enfin leacutetonnante technologie
ReadSpeaker 61 permet de retranscrire automatiquement tous les textes en version
audio
Agoravox nest pas le seul exemple de site de journalisme citoyen Le portail
OhMyNews 62 initiative coreacuteenne est baseacute sur le mecircme principe Lanceacute en feacutevrier
2000 le reacuteseau international OhMyNews reacuteunit plus de 40 000 reacutedacteurs
Pour le veilleur ces sites dactualiteacutes collaboratives constituent des sources
dinformations alternatives avec une partie de lactualiteacute issue des organes et
agences de presse et lautre partie provenant des internautes Dautre part ces
nouveaux meacutedias permettent de deacutecouvrir et surveiller des experts voire des
leaders dopinion
Un article sur Agoravox A droite une preacutesentation de son auteur En haut la possibiliteacute de voter et
commenter larticle
copy Digimind Digimind Services ndash White Paper |41
Le Web 20 pour la veille et recherche dinformation DIGIMIND
II Rechercher Collecter
Doreacutenavant tout internaute peut creacuteer et publier sa propre information
Lidentification des sources dinformation et de linformation elle-mecircme est devenue
complexe car elles sont de plus en plus morceleacutees et atomiseacutees Il convient
dutiliser une large palette doutils de recherche pour collecter les donneacutees en
provenance des blogs des bookmarks et reacuteseaux sociaux Pour faciliter la
collecte il est en outre possible de verticaliser la recherche et de faire appel agrave des
humains Par ailleurs dautres outils permettent darchiver ses deacutemarches de
requecirctes et de navigation
a La recherche de blogs et de flux RSS
Le volume de blogs est en constante croissance sur le net Le nombre de blogs a
litteacuteralement exploseacute sur toute la planegravete Estimeacute agrave 70 millions agrave leacuteteacute 2005 ils sont
eacutevalueacutes agrave plus de 120 millions en mars 2007 Technorati lun des moteurs de
recherche de blogs les plus utiliseacutes mesure en 2007 un doublement du nombre de
blogs tous les 320 jours 120 000 blogs seraient ainsi creacuteeacutes chaque jour 63
Europe
33
Afrique 15 000
Ameacuterique du Nord
33
Ameacuterique du Sud
1
Asie
55
5 Australie 790 000
copy Digimind Digimind Services ndash White Paper |42
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Nombre de blogs en milliers et millions (la Russie est inteacutegreacutee dans lAsie) Estimation DIGIMIND Services 64
Les fils RSS omnipreacutesents A chaque blog correspond son flux RSS ce format qui permet dextraire et de
surveiller tout nouveau contenu qui parait sur le blog Si un vrai blog implique
toujours un flux RSS un flux RSS ninduit pas forceacutement un blog En effet le RSS et
son concurrent Atom sont preacutesents sur de plus en plus de type de meacutedias et outils
internet degraves lors que leur contenu est appeleacute agrave se modifier reacuteguliegraverement
On pourra donc trouver des flux RSS sur
-les blogs
-les sites de presse et dactualiteacute Exemple Les Echos Libeacuteration La Tribune Le
Figaro)
-les sites de revues et magazines speacutecialiseacutes Exemple La revue Nature propose ses
fils RSS concernant ses publications speacutecialiseacutees par domaines Science fait de
mecircme65
-les sites corporate des entreprises page dactualiteacutes catalogues produits (Ex Air
Liquide)
-les reacutesultats de moteurs de recherche de blogs Tous proposent des flux RSS
permettant de surveiller une requecircte (Technorati Google Blog Search Feedster
IceRockethellip)
-les pages de reacutesultats de moteur de recherche web Certains de ces moteurs
geacutenegraverent un flux RSS permettant de surveiller lapparition de nouveaux reacutesultats
pour une requecircte donneacutee
MSN Search (devenu Live Search66) le proposait depuis janvier 2005 et chaque page
de reacutesultats offrait une icocircne orange en bas de page permettant dobtenir des fils
RSS Cette icocircne RSS a disparu sur Live Search mais les flux RSS sont toujours lagrave (ils
sont deacutetectables automatiquement avec un navigateur Firefox Maxthon IE7 ou
votre lecteur RSS Attensa ou RSS Bandit par exemple)
Depuis peu Yahoo Search Web 67 offre lui aussi un fils RSS sur ses reacutesultats lagrave
encore deacutetectable via un lecteur ou navigateur (cela fonctionne uniquement pour le
Yahoo US)
copy Digimind Digimind Services ndash White Paper |43
Le Web 20 pour la veille et recherche dinformation DIGIMIND
-les moteurs dactualiteacutes La majoriteacute des portails qui agregravegent des flux dactualiteacutes
proposent des flux RSS Exemple Google Actualiteacutes Yahoo Actualiteacutes Topix MSN
Actualiteacutes Wikiohellip 68
-les Newsgroups Usenet (groupes de discussion) Les fils RSS sont en effet aussi
preacutesents sur Google Groupes (ou Google Groups) ce qui rend plus aiseacute la surveillance
des discussions Chaque groupe (Google ou Usenet) affiche un fils RSS ou Atom 69
(et ce quelque soit la langue) signaleacute par le logo orange RSS en bas de page
-certains forums web Exemple Forum Mobiles 70
-certaines listes de diffusion elles peuvent ecirctre surveilleacutees via labonnement agrave leur
flux RSS Cela eacutevite lengorgement de votre boicircte mail Exemple la liste Veille sur
Yahoo Groupes 71 dispose dun flux RSS
-les bookmarks sociaux Delicious Yahoo MyWeb2 Blogmarks 72hellipLe fils RSS
permet decirctre alerteacute de lajout de nouveaux favoris pour un tag ou un utilisateur
deacutefinis
-les plateformes de partage de photos Exemple Flickr PhotoBucket 73
-les services de partage de videacuteos comme YouTube DailyMotion 74 pour ecirctre alerteacutes
des nouveauteacutes
-de tregraves nombreux sites offrant un contenu qui se renouvelle
copy Digimind Digimind Services ndash White Paper |44
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Veille Corporate La Tribune propose des flux RSS segmenteacutes par socieacuteteacutes
Le veilleur via ces flux RSS pourra surveiller de nombreuses sources
dinformations Par ailleurs au-delagrave des blogs introspectifs dadolescents dont peu
preacutesentent un inteacuterecirct pour les professionnels certains types de blogs peuvent se
reacuteveacuteler utiles
-Le blog dactualiteacute et dopinion preacutesentant reacuteflexions et critiques de journalistes et
internautes
-Le blog theacutematique eacutediteacute par des passionneacutes experts professionnels consultants
et techniciens
-Le blog dentreprise outil de communication externe ou interne agrave linitiative des
salarieacutes ou des dirigeants
copy Digimind Digimind Services ndash White Paper |45
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les outils pour trouver des blogs et flux RSS Sur ces moteurs la recherche seffectue par mots cleacutes classiques ou par tags comme
sur Technorati par exemple Le contenu indexeacute (blogs et flux) est tregraves heacuteteacuterogegravene
Aussi lutilisation de la recherche avanceacutee sur ces outils est souvent neacutecessaire En
effet un blog peut avoir abordeacute la theacutematique deacuteveloppement durable 1 seule fois
parmi ses 4500 billets Il conviendra donc alors de centrer sa recherche sur le titre
du blog ou son url
Les moteurs
Certains moteurs sont deacutedieacutes agrave la recherche de blogs Cest en fait un abus de
langage Ces moteurs se focalisent sur la recherche de flux RSS mais ne peuvent
faire la diffeacuterence entre un flux provenant dun grand journal et celui dun blog
Ainsi le moteur Technorati classe parmi les blogs les plus populaireshellipLe Figaro
Pour mener une recherche efficace il conviendra dutiliser plusieurs moteurs Car
comme pour la recherche web ougrave il ne faut pas se limiter agrave Google au risque de
manquer pregraves de 85 des reacutesultats75 la recherche sur les blogs neacutecessite lemploi
de plusieurs outils76 En voici quelques-uns
gt Google Blog Search Recherche de blogs Google applique sa technologie puissante
aux flux RSS et blogs Linterface est notamment disponible en franccedilais et en anglais
Le moteur est doteacute de fonctions de recherche avanceacutee (recherche sur le titre le
billet recherche par ancienneteacutehellip)
gt Ask Blog amp Flux Ce moteur permet de rechercher parmi les blogs les flux XML
(RSS ou Atom) Et aussi de sabonner agrave un blog ou un flux RSS
gt Feedster Ce moteur recense plus de 900 000 sources et 5000 sont rajouteacutees
chaque jour
gt BlogPulse Indexe plus de 46 millions de blogs
gt Technorati Ce moteur rafraicircchit son index toutes les 5 agrave 15 minutes et
recherche parmi plus de 70 millions de blogs (en avril 2007 77) ou sites proposant
des flux RSS Il est possible de rechercher par mots cleacutes ou par tags
gt Sphere va prendre en compte plusieurs variables pour mieux chercher parmi la
blogosphegravere
- comme pour le contenu web classique les reacuteseaux de liens entrants et sortants
- la qualiteacute de ces liens
copy Digimind Digimind Services ndash White Paper |46
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- les internautes agrave lorigine de ces liens (simple commentateurs ou leaders dopinion)
3 moteurs web integravegrent la recherche sur les blogs au sein de leur recherche
avanceacutee 78
gt Yahoo Search
Pour centrer sa recherche sur les flux RSS et les blogs il convient drsquoaller dans la
recherche avanceacutee (agrave droite de la boite de requecircte) puis dans le menu deacuteroulant
Format de fichiers et de seacutelectionner le format RSSXML
gt Exalead
Apregraves avoir effectueacute votre recherche il suffit de cliquer sur le bouton RSS jaune
dans la fenecirctre Preacuteciser la recherche Au sein des reacutesultats de recherche le flux
RSS est disponible via licocircne RSS Simple et propre
gt Microsoft MSN Live Search
MSN a ameacutelioreacute les interfaces de son moteur pour restreindre la recherche sur les
fils RSS Apregraves laffichage de votre page de reacutesultats vous pouvez affiner votre
recherche gracircce au bouton Flux (ou Feed en anglais) Ce bouton est accessible via
le menu Plus Au sein des reacutesultats de recherche sont alors disponibles lurl du flux
le cache et un lien pour sinscrire au fils RSS
Au-delagrave de ces moteurs speacutecialiseacutes il peut ecirctre beacuteneacutefique de tenter une recherche
sur un moteur Web (Google ou Yahoo Search par exemple) de type blog OR RSS
[votre sujet] Exemple blogs sur les teacuteleacutecoms Cela vous permettra non pas de
chercher au sein des blogs mais de trouver dautres blogs
Les reacutepertoires 79
Comme pour le web un certain nombre dannuaires entendent recenser les blogs
et fils RSS Attention comme la blogosphegravere est tregraves mouvante et en constante
croissance ces guides sont par nature non exhaustifs et leur mise agrave jour reacuteguliegravere
est difficile
gt Blogarama Ce reacutepertoire recense plus de 49 000 blogs classeacutes par cateacutegories
gt RSS Network indexe plus de 150 000 fils RSS
gt RSSFeeds Reacutepertorie plus de 119 000 fils organiseacutes en cateacutegories
copy Digimind Digimind Services ndash White Paper |47
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b La recherche par tags
Nous lavons vu avec la Folksonomie linternaute peut deacutesormais mettre en place et
partager sa propre classification via les tags Lutilisateur affecte leacutetiquette de son
choix agrave ses favoris images videacuteos Lavantage est indeacuteniable cest linternaute qui
deacutefinit son eacutetiquette et non plus un organisme Mais les inconveacutenients sont
nombreux difficile gestion des singulierspluriels problegraveme de synonymes de
signification (que deacutesigne cet internaute par ce tag) dhomonymes de polyseacutemie
dheacuteteacuterogeacuteneacuteiteacute plusieurs tags peuvent designer les mecircmes documents
Toutefois lapproche par tag facilite la recherche dune part en ajoutant une couche
seacutemantique aux documents web et dautre part en permettant une navigation par
concepts de plus en plus abandonneacutee compte tenu de la deacutesertion progressive des
cateacutegories des grands reacutepertoires web par les internautes
De plus on peut tagger pratiquement tout type de contenu web Ainsi les sites 43
Things et son eacutequivalent franccedilais 36 Trucs 80 proposent aux internautes de lister
leurs objectifs expeacuteriences ou projets Chacun de ces projets est taggeacute via un ou
plusieurs mots cleacutes
Les moteurs et meacutetamoteurs de tags
Les moteurs
La plupart des applications de social bookmarking ou de partage de fichiers images
ou videacuteos permettent donc de tagger leur contenu Sur certaines le moteur de
recherche interne rend possible en plus de la recherche sur le full text une
recherche centreacutee sur les tags Cest le cas sur Flickr vous pouvez rechercher au
choix sur le titre et la description des images ou sur les tags associeacutes deacutefinis par les
utilisateurs qui ont placeacute leurs photos
Un outil comme Delicious tag search 81 va vous permettre deffectuer des
recherches via un ou plusieurs tags sur le service de social bookmarking Delicious
Pour la recherche de blogs ou flux RSS le moteur Technorati propose une
recherche classique sur les mots cleacutes contenus dans les billets mais aussi une
copy Digimind Digimind Services ndash White Paper |48
Le Web 20 pour la veille et recherche dinformation DIGIMIND
recherche par tags82 En effet leacutediteur dun blog peut tagger chacun de ses billets
via des mots cleacutes qui les cateacutegorisent Ces mots ou tags seront repris par lindex du
moteur Ainsi la recherche du mot pollution parmi les tags affiche un billet sur le
reacutechauffement climatique Si ce billet est bien cateacutegoriseacute par son auteur dans une
rubriquepollution (parmi dautres) il ne contient pas ce mot dans son texte
toutefois en relation avec le concept de pollution Clairement une recherche
classique sur le seul texte des billets naurait pas rameneacute ce billet ou du moins pas
dans les premiers reacutesultats Autre inteacuterecirct Technorati vous propose des tags
associeacutes Ainsi pour pollution il affiche environment politics global warming science
china energy news air climate climate change autant de mots cleacutes pour eacutelargir ou
affiner vos requecirctes
Le moteur SearchLess 83 offre une approche originale il associe la recherche par
mots cleacutes agrave la recherche par tags Ainsi si vous effectuez une requecircte avec le mot
intelligence vous pouvez preacuteciser par le tag CIA Les reacutesultats seacutelectionneront
donc le mot intelligence sur des contenus (billets de blogs par exemple) taggeacutes CIA
par lutilisateur lui-mecircme on est alors sucircr que les 2 concepts sont intimement lieacutes
Meacutetamoteurs
Des meacutetamoteurs 84 permettent de rechercher sur les diffeacuterents types de contenu
sociaux bookmarks images videacuteos
Ainsi Tag Central agreacutege de nombreux formats web taggeacutes En lui indiquant un
tag il affiche des reacutesultats provenant agrave la fois de Flickr Smugmug (photos)
Technorati (blogs) Blogmarks Connotea Furl delirious (bookmarks sociaux) ou
encore 43Things (listes de projets)
Zewol outil de meacuteta syndication francophone permet de rechercher parmi les tags
(Flickr delicious) mais aussi sur les actualiteacutes (Google News Ask Actualiteacutes
Yahoo Actualiteacutes) les blogs (Technorati IceRocket Google Blog Search Ask
Blogshellip) le buzz (Tapemoi Scoopeo Wikipedia) les videacuteos (Google Videos
Podscope Video Daily Motion) et un mix (Furl Echonimo actualiteacutes Plazoo
Feed24) Concregravetement cest une bonne approche de recherche globale sur de
nombreuses ressources de type Web 20
Il est toujours possible de traquer la preacutesence ou lapparition dun mot clef sur le
web via la mise en surveillance du flux RSS de la requecircte
Ketoag est un outil qui permet dinterroger de nombreux services sociaux
copy Digimind Digimind Services ndash White Paper |49
Le Web 20 pour la veille et recherche dinformation DIGIMIND
(Delicious Furl Diig Wikio Blinklist) mais eacutegalement des moteurs de recherche
(Google Blog Search) Par ailleurs vous pouvez geacuteneacuterer pour chaque requecircte un
flux RSS mais aussi un fichier OPML (format permettant lagreacutegation et leacutechange de
listes de flux RSS)
Gnosh est un meacutetamoteur qui recherche parmi les moteurs web les moteurs de
blogs et les outils de partage de favoris De plus une recherche sur longlet People
vous permet de rechercher parmi les favoris des internautes inscrits agrave la
communauteacute Gnosh
Exalead recherche sur Wikipedia A droite le nuage de tags
Les nuages de tags
Ces nuages regroupent un ensemble de tags dans un mecircme espace en affectant agrave
chacun une taille variant selon leur populariteacute (freacutequence dutilisation ou de requecircte
sur ces mots) ou la densiteacute darticles auxquels ils se reacutefeacuterent (deacutepecircches dactualiteacutes
par exemple)
Les nuages de tags sont devenus agrave la mode car ils permettent une navigation facile
tregraves visuelle au sein dun site dune base de donneacutee ou des reacutesultats dun moteur
Ils apportent une grille de lecture suppleacutementaire agrave des sites dont les menus sont
souvent surchargeacutes ou le contenu atomiseacute
copy Digimind Digimind Services ndash White Paper |50
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Nombreuses sont les applications qui utilisent le nuage de tags pour optimiser la
navigation et mettre en valeur leur contenu le partage de videacuteos (DailyMotion) les
bookmarks sociaux (Delicious MyWeb2 de Yahoo) ou les services dactualiteacutes
collaboratives comme Wikio Certains moteurs comme Exalead ont eacutegalement
choisis dafficher des nuages de tags au sein de leurs pages de reacutesultats Dans ce cas
il sagit dune aide agrave laffinage des requecirctes un clic sur un tag va afficher une
nouvelle page de reacutesultat prenant ce mot en compte
Zibb85 moteur de recherche vertical deacutedieacute au Business to Business utilise aussi le
nuage de tags pour visualiser clairement les mots cleacutes de theacutematiques connexes les
plus freacutequents agrave votre requecircte
Dautres sites plus classiques ont eacutegalement choisi lapproche du nuage de tag pour
rendre leur navigation plus attractive et leurs rubriques plus visibles Ainsi le site
Ecrans 86(du journal Libeacuteration) affiche en bas agrave droite un nuage de tags mettant en
valeur son contenu tregraves touffu
Certains outils proposent de geacuteneacuterer des nuages de tags pour des sites ou moteurs
nen disposant pas
Google Tag Cloud Maker 87 est un script pour Firefox qui permet dafficher un nuage
de tags agrave droite des reacutesultats de Google plus un mot est freacutequent dans les reacutesultats
de votre recherche plus la taille dun tag est importante
Newzingo 88 extrait des mots de Google News pour constituer un nuage
doccurrences parmi les termes de lactualiteacute Plus le terme est gros plus les articles
relatifs agrave ce terme sont nombreux Techzingo reacutealise le mecircme process mais cette
fois les cibles sont des meacutedias de reacutefeacuterence dans le High Tech et le logiciel
Slashdot Diggcom et TheRegister
Un nuage de tags sur lInternet Movie Database une maniegravere de naviguer parmi tous les mots cleacutes associeacutes aux films
copy Digimind Digimind Services ndash White Paper |51
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La qualification du contenu par les utilisateurs (rdquofolksonomierdquo) est une reacuteelle valeur
ajouteacutee Les moteurs de recherche font reposer une grande part de lrsquoeffort sur
lrsquoutilisateur final une page de reacutesultats de Google doit ecirctre eacutevalueacutee souvent
interpreacuteteacutee par linternaute La folksonomie fait elle reposer lrsquoeffort de filtrage sur
lrsquoutilisateur initial celui qui va rechercher et appliquer ses propres ldquotagsrdquo Parce
quen amont 1743 personnes ont taggeacute une page avec un groupe de mots cleacutes
lrsquoutilisateur final lors de sa requecircte reccediloit une page de reacutesultats souvent tregraves
pertinente
Sur un moteur classique cest agrave lutilisateur dimaginer ses mots cleacutes pour affiner sa
recherche Sur les bookmarks sociaux de type Delicious les internautes qui
partagent leurs ressources ont deacutejagrave preacutepareacute ce travail daffinage via leurs tags
Prenons le cas dune recherche extrecircme car geacuteneacuterant de la synonymie la requecircte
Jaguar Sur Googlecom on me propose certes des mots cleacutes connexes pour
affiner mais tous sont lieacutes agrave la voiture Sur Delicious les tags afficheacutes sont relatifs agrave
la voiture mais aussi au systegraveme dexploitation agrave un groupe de musique et agrave lanimal
Pouvoir rechercher parmi les tags classifications eacutemanant de lutilisateur peut ecirctre
particuliegraverement inteacuteressant lorsquune recherche classique par mots cleacutes sur le
contenu des documents sest aveacutereacutee infructueuse ou geacutenegravere des reacutesultats peu
pertinents
Le tagging une pratique quotidienne
Selon une enquecircte meneacutee en deacutecembre 2006 par le Pew Internet amp American Life
Project 28 dutilisateurs des internautes ameacutericains ont taggeacute ou cateacutegoriseacute en
ligne des contenus tels que des photos des billets dans des blogs des articles
drsquoactualiteacutehellipSur une base journaliegravere 7 des utilisateurs drsquoInternet pratiquent le
tag en ligne
Ce systegraveme de laquo taxonomie populaire raquo pourrait-il constituer une alternative aux
outils de recherche traditionnels par mots cleacutes Il convient de distinguer les
usages professionnels des usages grand public Olivier Le Deuff 89 reprend dans
son eacutetude sur les Folksonomies la distinction effectueacutee par Thomas Vander
Wal entre les folksonomies eacutetroites (narrow folksonomies) et geacuteneacuterales (broad
folksonomies) Selon Olivier Le Deuff cette distinction est importante car les
premiegraveres sont surtout utiliseacutees dans un objectif individuel tandis que les secondes
privileacutegient lrsquoaspect collectif et collaboratif du partage drsquoinformation Ainsi les sites
de partages de favoris comme delicious ou Connotea sont plutocirct des
folksonomies geacuteneacuterales puisqursquoun mecircme site peut ecirctre partageacute par plusieurs
utilisateurs et recevoir le mecircme tag Ce type de folksonomies srsquoappuyant sur des
copy Digimind Digimind Services ndash White Paper |52
Le Web 20 pour la veille et recherche dinformation DIGIMIND
reacuteseaux sociaux ne fait pas que classer de lrsquoinformation et la partager Il met en
relation des usagers qui partagent les mecircmes centres drsquointeacuterecirct Lrsquousager indexeur
devient agrave son tour un peu indexeacute et mis en relation agrave la fois avec drsquoautres mots-
cleacutes drsquoautres sites et drsquoautres usagers
Il est clair que dans le domaine de lrsquoinformation professionnelle ou speacutecialiseacutee le
manque duniformisation des folksonomies qursquoelles soient geacuteneacuterales ou agrave vocation
plus eacutetroite pose les limites de ce systegraveme Les outils drsquoindexation et de
classification traditionnels ont en effet eacuteteacute creacuteeacutes pour des corpus structureacutes aux
limites clairement deacutefinies et srsquoadressent agrave des utilisateurs experts drsquoun domaine
ou de la recherche drsquoinformation Lrsquoabsence de hieacuterarchisation et de controcircle
constitue agrave la fois le point fort et le point faible de la folksonomie La barriegravere des
langues pourra constituer eacutegalement un obstacle les tags eacutetant parfois meacutelangeacutes
dans un mecircme site sans distinction De plus comme le note Cyril Fievet 90 la
pratique du tagging nrsquoest pas uniforme drsquoun site agrave lrsquoautre Sur Technorati les tags
indexeacutes sont ceux choisis par les blogueurs et fonction du contenu qursquoils ont eux-
mecircmes publieacute Sur delicious en revanche ce sont les internautes qui taguent le
contenu des pages qursquoils conservent dans leurs signets raquo
Il convient eacutegalement drsquoecirctre vigilant quant agrave une utilisation laquo frauduleuse raquo des
tags destineacutee uniquement agrave garantir la populariteacute drsquoun blog comme cela a pu
ecirctre le cas avec les meacuteta-donneacutees incorporeacutees dans le code source drsquoune page
html
Eacutelie Francis et Odile Quesnel preacutesentent dans la revue Documentaliste Sciences
de lrsquoinformation les quatre modes drsquoindexation et de classification sur le web la
classification personnelle lrsquoindexation par lrsquoauteur lrsquoindexation par lrsquoutilisateur et la
classification globale Et srsquointerrogent sur lrsquoavenir de lrsquoindexation collaborative agrave la
croiseacutee de la qualiteacute (liberteacute diversiteacute enrichissement) et de la deacutesinformation
(subjectiviteacute manque de coheacuterence)
Il nrsquoen reste pas moins que folksonomie et indexation classique ne srsquoopposent pas
neacutecessairement et constituent des moyens de description de contenus adapteacutes agrave
des contextes diffeacuterents Stephen Lee creacuteateur du site Guten Tag voit dans la
folksonomie une sorte de web seacutemantique du pauvre peu oneacutereux agrave mettre en
place mais dont le succegraves reposera sur une seacuterie de bonnes pratiques collectives
Lrsquointeacuterecirct de ce systegraveme reacutesidera non pas dans la capaciteacute agrave trouver une reacuteponse agrave
une question preacutecise mais plutocirct agrave deacutecouvrir des sources originales et peu connues
ou de localiser des experts drsquoun domaine pointu Les tags les plus rares et preacutecis
pourront entre autres trouver leur application dans le domaine de la veille mettant
copy Digimind Digimind Services ndash White Paper |53
Le Web 20 pour la veille et recherche dinformation DIGIMIND
en œuvre la seacuterendipiteacute ou lrsquoart de favoriser le hasard pour des deacutecouvertes
heureuses
Laissons la conclusion sur ce point agrave lrsquoAssociation des Professionnels de
lrsquoInformation et de la Documentation (ADBS) qui estime dans sa newsletter que
Le foisonnement des propositions de mots-cleacutes aboutirait agrave un reacutesultat plus efficace
quune indexation reacutealiseacutee par un vocabulaire contraint Cette affirmation semble
ecirctre deacutemontreacuteehellip pour linstant
c La recherche de personnes et dinformations entreprises
La recherche de donneacutees sur les personnes physiques ou morales seffectuait
jusquici principalement en interrogeant les bases de donneacutees dinformations leacutegales
et financiegraveres gratuites ou payantes Linterrogation de service tel que Societecom
Infogreffe ou Yahoo Finance est bien sucircr encore neacutecessaire Mais il faut compter
maintenant avec les reacuteseaux sociaux professionnels qui eux aussi rassemblent des
donneacutees sur les entreprises ou les individus
Linteacuterecirct des reacuteseaux sociaux
Que peuvent-il apporter par rapport aux services classiques dinformations
dentreprises Dabord comme expliqueacute preacuteceacutedemment ils sont ouverts agrave tous
Les informations y figurant ne sont plus le seul fait de leacutediteur du site et ne sont pas
uniquement constitueacutees par les fichiers de donneacutees leacutegales publieacutees par les
organismes officiels comme le Greffe du Tribunal de Commerce en France Sur les
reacuteseaux sociaux centreacutes sur les personnes le contenu est inteacutegralement ameneacute par
linternaute qui affiche son CV deacutetailleacute ses publications ses oeuvres (textes ou
multimeacutedias) Linteacuterecirct est eacutevident des personnes peu visibles auparavant parce
que ne faisant pas partie des dirigeants dentreprises (geacuterant fondateur membre du
conseil) sont maintenant accessibles et donc requecirctables par les internautes On
peut donc collecter des informations sur un cadre de RampD dune socieacuteteacute de
teacuteleacutecoms concurrente ou sur le management eacutetonnant de telle entreprise de
plasturgie citeacutee dans le CV dun employeacute de passagehellip
A linstar des blogs linformation preacutesente sur les reacuteseaux sociaux ne tient plus du
discours ou des donneacutees officielles puisque cest linternaute qui communique sur sa
vie et son entreprise
copy Digimind Digimind Services ndash White Paper |54
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Geacuterer leacuteparpillement de linformation
Dautres plateformes de social networking mixent linformation collecteacutee sur le web
avec les contributions des utilisateurs (agrave linstar de Wikio pour les actualiteacutes) Ainsi
le service ZoomInfo 91 permet de rechercher des socieacuteteacutes et des personnes en
parcourant des milliers de donneacutees extraites du web mais aussi en provenance de
profils dindividus et dentreprises renseigneacutes par les socieacuteteacutes ou les employeacutes eux-
mecircmes Aussi cohabitent des informations sur des entreprises coteacutees avec des
donneacutees de firmes non coteacutees des fiches de cadres du top management et des
conseils dadministration avec des CV demployeacutes plus fonctionnels
Le franccedilais Ziki 92 utilise aussi des informations collecteacutees sur le web cest une
sorte dannuaire perfectionneacute qui indexe et archive non pas les donneacutees
signaleacutetiques mais les contenus produits par une personne agrave partir du moment ougrave ils
disposent dun flux RSS (billets de blogs photo Flickr favoris Delicioushellip) Ziki ne
permet pas de creacuteer du contenu propre mais agregravege des donneacutees eacutelaboreacutees par un
mecircme individu auparavant eacuteparpilleacutees sur linternet Bref vous ameacuteliorez votre
visibiliteacute et facilitez la recherche de vos productions sur le net en creacuteant un point
unique daccegraves
La recherche sur tous ces reacuteseaux sociaux implique souvent linterrogation
fastidieuse apregraves inscription de plusieurs dizaines de sites
Aussi certains outils 93 proposent une meacutetarecherche en lanccedilant une mecircme
requecircte sur plusieurs services de social networking Stalkerati recherche le nom
dune personne sur les reacuteseaux Friendster et FaceBook Plus complet et ciblant
davantage les reacuteseaux professionnels YoName recherche les noms sur MySpace
LinkedIn Friendster Windows Live Spaces Bebo Digg ou Xanga
Le moteur de recherche de personnes Wink scrute les reacuteseaux sociaux MySpace
Bebo Friendster LinkedIn Live Spaces et autres De plus avec cet outil il est
possible de creacuteer son propre profil et de le connecter agrave des reacuteseaux sociaux
Attention toutefois si vous ecirctes un utilisateur recherchant des donneacutees en franccedilais
la nature des reacutesultats est plutocirct tourneacutee vers le monde anglophone
Ces reacuteseaux sociaux ne sont pas suffisants pour une recherche professionnelle
complegravete A linstar des blogs face agrave la presse traditionnelle ils constituent un
compleacutement inteacuteressant aux bases de donneacutees officielles
copy Digimind Digimind Services ndash White Paper |55
Le Web 20 pour la veille et recherche dinformation DIGIMIND
d Les moteurs de recherche humains
Apregraves ecirctre apparus sur le net agrave la fin des anneacutees 90 les services de questions-
reacuteponses avaient laisseacute la place aux algorithmes tout puissants des moteurs de
recherche de type Google Mais les robots et programmes ont tous besoin dune
intervention humaine pour geacuterer la qualiteacute et la pertinence des reacutesultats
Ainsi tous les grands moteurs majeurs ne font pas confiance agrave leurs seuls
algorithmes Les employeacutes de Yahoo sont mis agrave contribution pour surveiller la
qualiteacute des reacutesultats fournis par le moteur Chez Google et MSN Search des
process deacutevaluation humaine avaient eacuteteacute identifieacutes agrave travers les sites
EvalGooglecom et MSN HRS notamment
La revanche de lhumain
Au-delagrave de ce rating humain sur les reacutesultats de moteurs de recherche de
nombreux services depuis 2 ans mettent agrave disposition des experts en chair et en
os Cest alors un veacuteritable mode collaboratif qui se met en place lorsque le produit
est bien penseacute Cest la cas de Yahoo Answers (Yahoo Questions Reacuteponses en
France) 94 Ce service gratuit de questions reacuteponses lanceacute fin 2005 permet agrave
linternaute de poser une question dans un formulaire Chaque membre de la
communauteacute Yahoo (agrave savoir tout ceux qui disposent dun compte Yahoo) peut
jouer le rocircle dexpert Yahoo propose aussi le service (eacutegalement gratuit) Ask
Yahoo qui propose de reacutepondre agrave vos questions mais cette fois via un groupe
dexperts seacutelectionneacutes par Yahoo Inc Yahoo Answers a certes une orientation
initiale grand public mais des questions un peu techniques voire scientifiques
trouvent reacuteponse En effet parmi tous les contributeurs agrave Yahoo Answers figurent
des meacutetiers et expertises tregraves diverses du fait de son audience importante Il y
cohabite des types de questions varieacutes Quels sont les groupes strateacutegiques de
lindustrie mondiale du jouet Quelles sont les donneacutees eacuteconomiques du marcheacute de
lassurance vie collective en France
Autre point inteacuteressant le service est deacuteployeacute dans de nombreux pays (Etats-Unis
Royaume-Uni Canada Australie Inde Espagne Breacutesil Argentine Mexique Italie
Allemagne Singapour Taiwan Coreacutee du Sud Hong Kong Japon Chinehellip) Aussi il
est possible de localiser certaines questions et de beacuteneacuteficier parfois dune
expertise pays
Lune des raisons du succegraves du service de Yahoo tient au fait de baser les questions
et reacuteponses sur la contribution dinternautes volontaires Chacun participe
constitue un vrai reacuteseau et peut surtout se valoriser en devenant expert dans son
copy Digimind Digimind Services ndash White Paper |56
Le Web 20 pour la veille et recherche dinformation DIGIMIND
domaine de compeacutetences ou sa passion Il est mecircme possible de creacuteer sa propre
communauteacute qui rassemblera vos amis mais aussi vos experts preacutefeacutereacutes qui
reacutepondent agrave vos questions et centres dinteacuterecirct Le pool de reacutepondants nest donc
pas limiteacute agrave une liste restreinte et il sauto-entretient Dautre part les experts
seacutevaluent entre eux et seacutelectionnent parmi une liste si neacutecessaire ce quils
considegraverent comme la meilleure reacuteponse agrave une question
Une question sur Yahoo Answers
Sur ce marcheacute des Questions-Reacuteponses Google a eacutechoueacute notamment parce quil a
seacutepareacute formellement demandeurs et contributeurs limitant ainsi fortement laspect
collaboratif Le Service Google Answers 95 permettait de poser des questions agrave des
experts Mais lagrave ougrave des services concurrents comme Yahoo Answsers Lycos IQ
copy Digimind Digimind Services ndash White Paper |57
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Windows Live QnA96 sont gratuits Google Answers eacutetait un service payant faisant
appel agrave un reacuteseau de 800 experts Aussi Google Answers apregraves 4 ans dactiviteacute a
fermeacute Les questions ne sont deacutesormais plus accepteacutees mais laccegraves aux archives des
questions-reacuteponses est maintenu
Par ailleurs les reacuteseaux sociaux eacutevoqueacutes plus haut ont bien compris la puissance des
communauteacutes pour faire office de speacutecialistes Ainsi avec LinkedIn Answers la
plateforme de reacuteseaux sociaux LinkedIn sest lanceacutee elle aussi dans le service de
QuestionsReacuteponses
Ne pas oublier les services Web 10
Lorsque lon parle de Web 20 on eacutevoque rarement ces services de Questions-
Reacuteponses au profit de sites plus technologiques Pourtant nous sommes ici dans la
logique des bookmarks sociaux partager ses connaissances faire beacuteneacuteficier les
autres de son savoir et en retour profiter de lexpertise de la communauteacute
Comme la plupart des applications Web 2 la seule utilisation des services QR ne
suffit pas Elle doit venir en compleacutement de recherches parallegraveles via dautres outils
Ainsi pour la veille linscription agrave des listes de diffusion permet aussi de poser des
questions agrave des experts ou passionneacutes De plus il subsiste des services dexpert
traditionnels qui sils ne mettent pas laccent sur la collaboration permettent
didentifier des compeacutetences parfois tregraves pointues Certaines ressources
reacutepertorient des milliers dexperts quil faudra ensuite contacter personnellement
pour beacuteneacuteficier de leur conseil Cest le cas du site Expertscom qui identifie des
experts dans des domaines allant de lacoustique agrave la biochimie en passant par
lindustrie peacutetroliegravere97
copy Digimind Digimind Services ndash White Paper |58
Le Web 20 pour la veille et recherche dinformation DIGIMIND
e les moteurs de recherche collaboratifs
Nous lavons vu certains services dactualiteacutes collaboratives proposent des reacutesultats
issus dun mixage entre contribution des internautes et collecte de nouvelles sur le
web Cette approche de mixiteacute se met peu agrave peu en place pour les moteurs de
recherche web En effet les modegraveles algorithmiques ou humains preacutesentent tout 2
leurs limites en terme de pertinence de fiabiliteacute et dexhaustiviteacute
Aussi de plus en plus de projet de moteur mixtes agrave savoir proposant des reacutesultats
web conjointement agrave des reacutesultats etou seacutelections issus dhumains voient le jour
Du web donc mais avec une forte dose de cerveaux humains
Wikiasari
Celui qui fait le plus parler de lui est le projet de Jimmy Wales le co-fondateur de
lencyclopeacutedie Wikipedia Baptiseacute Wikiasari 98 (combinaison de wiki rapide en
hawaiumlen et asari recherche fouilleacutee en japonais) le projet vise agrave creacuteer un outil de
recherche ougrave les internautes pourront influer sur les reacutesultats en notant leur
pertinence etou en en proposant de nouveaux selon leur expertise
Ce type de moteur sinscrit donc agrave lopposeacute doutils comme Google aux algorithmes
automatiques dont les robots sont souvent trompeacutes par des manipulations de
webmasters (spamdexing par exemple)
Cet outil qui devrait voir le jour courant 2007 sappuie sur des infrastructures Open
Source existantes comme Nutch ou Lucent
Cest un projet particuliegraverement inteacuteressant Comme sur lencyclopeacutedie ouverte
Wikipedia ougrave des milliers de contributeurs construisent et alimentent louvrage sur
ce moteur des reacuteseaux de centaines dinternautes pourront apporter leur savoir
pour ameacuteliorer la pertinence des reacutesultats Ce nest plus seulement la puissance de
calcul de machines qui sera mise agrave contribution mais aussi la puissance de la
communauteacute
Derriegravere le projet Wikiasari il y a de gros moyens financiers et humains
lexpeacuterience de la fondation Wikipedia et le potentiel de trafic que pourra apporter
lencyclopeacutedie ouverte Fin 2006 Comscore a en effet classeacute Wikipedia comme le
6egraveme site le plus visiteacute au monde avec 1719 millions de visiteurs uniques au mois
de novembre On peut donc y croire
copy Digimind Digimind Services ndash White Paper |59
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une recherche de sites similaires sur Yoono
Decipho Yoono
Certes lideacutee dun moteur de recherche collaboratif nest pas nouvelle Reacutecemment
on peut citer le lancement du moteur Decipho ou en mars 2006 celui de Yoono
Mecircme si les approches diffegraverent ces outils font tous la part belle agrave lrsquoapport de
chaque utilisateur dans le traitement des reacutesultats
Decipho 99 est un moteur baseacute sur la technologie de Askcom lun des 4 moteurs les
plus utiliseacutes aux USA Linternaute creacuteeacute ses propres cateacutegories de reacutesultats
partageables avec les autres Il peut eacutegalement tagger les reacutesultats afin deacutetiqueter
un site Aussi lors dune requecircte on peut preacuteciser les mots cleacutes classiques avec des
tags On beacuteneacuteficie alors de tous les tags mis en place par la communauteacute des
utilisateurs Un curseur permet de deacutefinir la proportion de cateacutegorisation des
autres utilisateurs agrave prendre en compte dans sa recherche
Le franccedilais Yoono 100 propose une autre deacutemarche encore loutil fonde ses reacutesultats
sur la mutualisation des connaissances des internautes par le partage des favoris Le
copy Digimind Digimind Services ndash White Paper |60
Le Web 20 pour la veille et recherche dinformation DIGIMIND
moteur utilise les favoris que sa communauteacute dutilisateurs a accepteacute de partager
Lors dune requecircte les reacutesultats sont classeacutes par populariteacute agrave savoir selon le
nombre de fois ougrave une page a eacuteteacute mise en favoris par les utilisateurs Une logique
proche de Delicious mais avec Yoono lajout de favoris est automatique De plus
loutil affiche les utilisateurs qui comme vous ont reacutefeacuterenceacute des sites sur la
politique veacuteneacutezuelienne par exemple De cette maniegravere vous pouvez identifier des
passionneacutes ou experts partageant vos domaines de preacutedilections Les reacutesultats ne
sont plus baseacutes sur les seuls algorithmes mais sur lexpeacuterience et la capacitation des
autres utilisateurs
Les initiatives de moteurs collaboratifs plus ou moins inteacuteressantes sont multiples
Foox est un moteur baseacute sur des communauteacutes dinteacuterecirct et sur Webzzle lutilisateur
preacutecise les concepts qui linteacuteressent afin de contextualiser les mots-cleacutes choisis 101
Humains ou algorithmes
Certes le mode collaboratif ne remplacera pas totalement la recherche
algorithmique Les 2 sont compleacutementaires Lune permet dameacuteliorer la pertinence
de prendre en compte des concepts des contextes du sens et non plus simplement
des chaicircnes de caractegraveres Lautre vise lexhaustiviteacute en indexant des milliards de
pages Web Aujourdhui et en attendant le Web seacutemantique ainsi que la recherche
dite naturelle 102 toutes deux grandes quecirctes du monde de linternet seul lapport
de communauteacutes dhumains permet dinjecter un peu de sens agrave une recherche
Mais de son cocircteacute la recherche coopeacuterative comporte bien entendu des risques de
subjectiviteacute
Sur les moteurs de recherche la coopeacuteration peut prendre une autre forme via le
peacuterimeacutetrage des sites agrave interroger la construction dun moteur sur mesure en
quelque sorte Cest la verticalisation de la recherche
copy Digimind Digimind Services ndash White Paper |61
Le Web 20 pour la veille et recherche dinformation DIGIMIND
f La verticalisation par la personnalisation du peacuterimegravetre de recherche
Lune des grandes faiblesses des moteurs de recherche web agrave large eacutechelle (Google
Exalead Yahoo MSNhellip) est le bruit geacuteneacutereacute par certaines requecirctes Lorsque vous
tapez puma le moteur ne sait pas agrave priori si vous vous inteacuteressez aux vecirctements
de sport agrave lanimal ou aux heacutelicoptegraveres Or si vous ne reacutealisez des recherches que
dans laeacuterospatiale vous devrez souvent deacutesambiguiumlser par vos mots cleacutes ce qui
engendre une perte de temps voire de reacutesultats si vos requecirctes deviennent trop
restrictives
Certains moteurs ou meacutetamoteurs clusteacuterisent (cateacutegorisent) les reacutesultats en les
rassemblant par groupes (grappes) dans de petits dossiers Cette deacutemarche avait
eacuteteacute initieacutee par le moteur Northern Light en 1998 Ainsi tous les reacutesultats relatifs aux
chaussures Puma sont regroupeacutes dans une mecircme valise ceux eacutevoquant lanimal
dans une autre Mais cette solution nest pas complegravetement satisfaisante car elle
seffectue agrave posteriori une fois votre requecircte lanceacutee Le bruit nest pas eacutelimineacute mais
simplement circonscrit dans des sortes de cateacutegories poubelle
Pour beacuteneacuteficier dune deacutemarche agrave priori il convient dutiliser des outils de
recherche verticaux cest-agrave-dire speacutecialiseacutes dans un secteur dactiviteacute une fonction
un type dinformation ou de meacutedias
Face aux problegravemes de pertinence des moteurs geacuteneacuteralistes de plus en plus de
moteurs verticaux voient le jour Ainsi le seul domaine meacutedical a vu apparaicirctre ces
20 derniers mois les moteurs SearchMedica Medstory MedWorm ou encore Medgle 103
Mais si votre secteur de preacutedilection nest pas couvert par un moteur speacutecialiseacute
Cest lagrave quintervient un autre type de moteur collaboratif agrave qui lon peut indiquer le
peacuterimegravetre des sites sur lesquels effectuer la recherche Sur les moteurs classiques
les algorithmes peuvent placer en prioriteacute des reacutesultats sans inteacuterecirct pour vous A
force de navigation et de veille dans votre secteur vous connaissez certainement
10 20 100 sites que vous jugez incontournables et indispensables pour vos
recherches
2 solutions techniques existent
- les outils agrave peacuterimegravetre de recherche personnalisable (adaptable scope)
Ils utilisent les index des moteurs geacuteneacuteralistes (Yahoo ou Google) et restreignent le
scope de leur recherche aux pages des sites que vous avez choisis Ainsi des outils
comme Rollyo Swicki Yahoo Search Builder Google Custom Search 104 vous
demandent dindiquer une liste de sites sur lesquels vous allez limiter votre
recherche Lors dune requecircte les reacutesultats proviendront uniquement des sites de
votre choix Pratique
copy Digimind Digimind Services ndash White Paper |62
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Mais ces outils preacutesentent une limite de taille ils ne prennent en compte que les
pages indexeacutees par Google ou Yahoo Conseacutequence si la reacuteponse pertinente agrave
votre requecircte figure au sein dune page non indexeacutee par le moteur geacuteneacuteraliste vous
nobtenez pas de reacutesultats
De plus en ninterrogeant que lindex dun ou 2 moteurs vous manquerez
obligatoirement de nombreuses informations puisque le nombre de reacutesultats
communs entre les moteurs diminue constamment105
Les pages non indexeacutees par les moteurs geacuteneacuteralistes constituent une part du web
invisible106 et sont plus nombreuses que lon ne croit Ainsi si jinterroge le moteur
interne du site de la prestigieuse revue scientifique The Lancet 107 avec la requecircte
Diabetes jobtiens plus de 2800 reacutesultats Si jeffectue cette mecircme requecircte sur
Google en restreignant ma recherche au site The Lancet (via la syntaxe
sitehttpwwwthelancetcom) jobtienshellip1 reacutesultat Sur Yahoo Search guegravere
mieux 9 reacutesultats Pourquoi Parce que les technologies de ces moteurs ne
permettent pas dindexer correctement tous les sites
La constitution de bouquets de moteurs speacutecialiseacutes sur Digimind Finder
- les outils agrave moteurs personnalisables
La solution pour beacuteneacuteficier des reacutesultats de moteurs internes non indexeacutes par des
Google ou Yahoo est dutiliser un outil permettant dexploiter directement les
moteurs des sites qui vous inteacuteressent et ce sans avoir agrave passer par les index de
moteurs geacuteneacuteralistes Cest le cas du Finder108 mis au point par Digimind un
copy Digimind Digimind Services ndash White Paper |63
Le Web 20 pour la veille et recherche dinformation DIGIMIND
meacutetamoteur qui permet de plugger nimporte quel moteur de son choix et de
linterroger ensuite Il est donc alors simple de se constituer des bouquets de
moteurs speacutecialiseacutes dans votre secteur dactiviteacute De plus cet outil indexe en temps
reacuteel les reacutesultats et les documents retourneacutes par les moteurs interrogeacutes Cela
permet daffiner ensuite vos reacutesultats en interrogeant cet index au contenu
speacutecialiseacute via une recherche avanceacutee Avec le Finder cest donc lutilisateur final qui
constitue sa propre seacutelection de moteurs
copy Digimind Digimind Services ndash White Paper |64
Le Web 20 pour la veille et recherche dinformation DIGIMIND
g Lenrichissement de bases de donneacutees faccedilon Web20
Nous avons vu que les bookmarks sociaux permettaient de mutualiser les
ressources et pour certains autour de communauteacutes deacutedieacutees comme les
scientifiques Avant lapparition des applications Web 20 ont eacuteteacute constitueacutees de
nombreuses bases de donneacutees professionnelles Celles-ci jusquici noffraient pas
aux groupes dutilisateurs la possibiliteacute dinteragir de commenter et deacutechanger
Aussi de plus en plus de grandes bases de donneacutees se dotent dinterfaces
collaboratives et ergonomiques pour laisser plus de place agrave la contribution
PubMed
Cest le cas de lune des plus grandes bases du domaine meacutedical PubMed 109 Cette
immense base bibliographique a vu naicirctre deux initiatives110 pour ameacuteliorer son
interface de recherche
- Avec PubMed Interact la recherche integravegre de lAjax et permet de pondeacuterer via
des curseurs les critegraveres de sources dancienneteacute de nombre de reacutesultats de date
de publication de liens avec le mapping du MeSH (le theacutesaurus de la base) de
filtrage via des cateacutegories Vous pouvez ensuite annoter et attribuer une note de
pertinence agrave vos reacutesultats afficher labstract des articles ou leur texte complet
supprimer des reacutesultats ou encore afficher les articles lieacutes On retrouve donc
lessentiel des fonctionnaliteacutes de lactuel PubMed mais avec une convivialiteacute et
ergonomie Web 20 et donc une plus grande accessibiliteacute
-Hubmed est une autre interface alternative qui ajoute des fonctionnaliteacutes agrave PubMed
application de ses propres tags aux reacutesultats de recherche historique des recherches
clusteacuterisation des reacutesultats visualisation sous forme graphique creacuteation simplifieacutee
de fils RSS avec les mots de votre requecircte suggestion de termes connexes
visualisation de vos mots cleacutes dans larborescence Mesh Le tout est deacuteveloppeacute en
Ajax notamment permettant une navigation plus fluide et plus rapide Parmi toutes
ces fonctions la possibiliteacute de tagger les reacutesultats est tregraves novatrice on peut ainsi se
deacutepartir de la taxonomie de la base via sa propre folksonomie
copy Digimind Digimind Services ndash White Paper |65
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les nombreux reacuteglages de filtres sur linterface PubMed Interact
LUSPTO
LUSPTO 111 est la base des brevets ameacutericains (United States Patent and Trademark
Office)
Cette veacuteneacuterable institution a en projet une plateforme de brevets sociale agrave la
maniegravere dun Digg (cf les services dactualiteacutes collaboratives) les internautes
pourront commenter les brevets en ligne et les eacutevaluer via un systegraveme de notation
Les brevets les mieux noteacutes remonteront alors en haut de classement
copy Digimind Digimind Services ndash White Paper |66
Le Web 20 pour la veille et recherche dinformation DIGIMIND
h Conserver et exploiter lhistorique de vos recherches et navigations
Le chercheur dinformation sur le net perd souvent ses nerfs quand il ne retrouve
plus ce quil a deacutejagrave collecteacute quelque semaines auparavant ou lorsquil lui est
impossible de se souvenir quelle requecircte agrave geacuteneacutereacute ce fameux reacutesultat remarquable
cette veacuteritable peacutepitehellip
Google a reacutesolu partiellement ces problegravemes de meacutemoire Mais comme souvent
cela ne va pas sans certains sacrifices
Via son service Historique Web112 (ex Historique de recherche) vous pouvez apregraves
enregistrement gratuit
- meacutemoriser les requecirctes effectueacutees sur le moteur ainsi que les reacutesultats cliqueacutes
- enregistrer votre navigation sur les pages web
Il est alors possible deffectuer des requecirctes sur et agrave linteacuterieur des pages que vous
avez visiteacutees dans le passeacute (sur le texte les images les videacuteos)
Google affiche donc deacutesormais vos requecirctes la date et lheure de la recherche les
reacutesultats cliqueacutes mais aussi les reacutesultats de recherches qui nrsquoont pas geacuteneacutereacute de clics
Par ailleurs ce service va encore plus loin dans la personnalisation et lanalyse de
votre recherche
Avec la fonction Tendances saffichent vos requecirctes les plus courantes vos sites les
plus visiteacutes les reacutesultats que vous avez le plus cliqueacutes
Plus puissante la fonction Eleacutements inteacuteressants ougrave Google vous propose des
requecirctes et des pages web en relation avec vos habitudes de recherche113
En outre si vous activez cet historique Google lutilisera aussi pour agrave moyen
terme personnaliser vos recherches en fonction de vos centres dinteacuterecirct Le
moteur explique
Vos reacutesultats personnaliseacutes seront baseacutes sur vos recherches preacuteceacutedentes ainsi que les
reacutesultats de recherche et les titres agrave la une sur lesquels vous avez cliqueacute
Dans les premiers temps la diffeacuterence ne sera peut-ecirctre pas notable mais agrave mesure
que votre historique de recherches seacutetoffera les reacutesultats obtenus seront de plus en plus
personnaliseacutes
Dailleurs si vous reacutealisez de nombreuses recherches sur Google avec une
connexion agrave votre compte Google activeacutee vous devriez voir safficher de temps agrave
autre ce type de message Nouveau activez votre historique de recherche pour
personnaliser vos reacutesultats
copy Digimind Digimind Services ndash White Paper |67
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ces reacutesultats personnaliseacutes apprenant selon vos inteacuterecircts permettent de reacutepondre
en partie agrave la probleacutematique de deacutesambiguiumlsation lors de requecirctes sur des
homonymes Ce sont les exemples classiques de lavocat (fruit ou juriste ) de
jaguar (voiture ou animal ) ou de puma (articles de sports animal ou heacutelicoptegravere
)
Cocircteacute vie priveacutee tout votre surf part sur les serveurs de Google Aussi vous
pouvez (devez) mettre en pause lenregistrement de votre navigation lorsque cela
vous apparaicirct adeacutequat
Lhistorique de vos requecirctes et de vos reacutesultats sur Google
copy Digimind Digimind Services ndash White Paper |68
Le Web 20 pour la veille et recherche dinformation DIGIMIND
i Les mash-up
Les mash-up sont certainement les nouveauteacutes engendreacutees par les technologies
dites Web 20 les plus spectaculaires Mixage de plusieurs applications provenant
de plusieurs sites (souvent deux) ils permettent de creacuteer un service nouveau et ce
agrave partir de la mise en relation voire du croisement des donneacutees des applications
dorigines En franccedilais Wikipedia parle dapplications composites 114 Ainsi en
mixant la liste des socieacuteteacutes ougrave il fait bon travailler eacutetablie par le magazine Fortune et
une carte des USA issue de Google Maps on obtient une carte qui localise toutes
ces entreprises De mecircme si on meacutelange les donneacutees dun site de meacuteteacuteo agrave une
carte de France le reacutesultat est une carte des tempeacuteratures et des neacutebulositeacutes en
quasi temps reacuteel 115
Concregravetement comment cela fonctionne-t-il Chacune des applications
communique et eacutechange des informations via des API (voir glossaire) Ainsi Yahoo
Maps ou Google Maps ont ouvert leurs interfaces de programmation agrave tous les
deacuteveloppeurs
Les exemples sont tregraves nombreux car les Mashups ont rapidement connu un vif
succegraves aupregraves des deacuteveloppeurs et internautes avertis qui parviennent agrave maicirctriser le
code et les API Les Mashups de cartographie ne sont pas les seules possibiliteacutes mais
ce sont les plus freacutequents tant la geacuteolocalisation est attrayante pour les
professionnels comme pour linternaute novice Nous allons explorer quelques
mashups pour mieux comprendre leur inteacuterecirct
Les mashups cartographiques les plus courants mixent des cartes et des donneacutees
provenant de services sociaux comme Flickr le service de partage de photo de
Yahoo Inc Cest le cas de Tagmaps116 qui affiche en temps reacuteel sur une carte les tags
associeacutes aux photos de lieux mise en ligne sur Flickr Le Mashup Flickrvision 117 fait
encore plus simple il affiche les photos agrave lemplacement de la ville dorigine de
linternaute qui a posteacute limage lagrave aussi en temps reacuteel
Donneacutees statiques et temps reacuteel
Au-delagrave de certains mixages un peu gadget certains Mashups sont vraiment
inteacuteressants pour la surveillance de donneacutees ou la collecte dinformations En effet
on peut trouver deux grands types de visualisation celle de donneacutees statiques (une
liste dadresse dentreprises geacuteolocaliseacutees) et celle dinformations eacutevoluant en
temps reacuteel Cest le cas par exemple du Mashup SpaceCraft Tracking 118 qui permet
copy Digimind Digimind Services ndash White Paper |69
Le Web 20 pour la veille et recherche dinformation DIGIMIND
de visualiser la trajectoire sur le globe terrestre de la navette spatiale ou du
teacutelescope Hubble
Souvent le Mashup exploite des donneacutees de reacutepertoires douvrages de services
publics pour les rendre plus compreacutehensives attrayantes bref plus accessibles 119
- HealthMap rassemble des donneacutees de santeacute publique et des actualiteacutes issues de
plusieurs sources (Google News OMS European Centre for Disease Prevention and
Controlhellip) afin de reacutealiser une carte des maladies infectieuses dans le monde Cette
carte se met agrave jour au fur et agrave mesure de lactualisation des informations
Linteractiviteacute permet de zoomer sur un pays et de seacutelectionner des pathologies en
particulier
-BioDiesel Station Maps affiche sur une carte les stations services ameacutericaines qui
deacutelivrent des biocarburants
-Kartametro superpose le reacuteseau du meacutetro moscovite agrave la carte de la ville On y
visualise aussi les correspondances avec les bus
-Wikimapia mixe les informations relatives agrave des lieux de Wikipedia agrave une carte
Google Maps Reacutesultat la plupart des noms de villes sites ou monuments sont
cliquables et pointent vers les articles de lencyclopeacutedie
Le Mashup HealthMap ici des actualiteacutes sur les maladies infectieuses en Asie geacuteolocaliseacutees
copy Digimind Digimind Services ndash White Paper |70
Le Web 20 pour la veille et recherche dinformation DIGIMIND
-GlobaI Incident Maps affiche sur un planisphegravere les eacuteveacutenements lieacutes au terrorisme
ou les risques agrave partir des informations de sites speacutecialiseacutees mises agrave jour en continu
-Enfin un parfait exemple de visualisation et de surveillance deacuteveacutenements en temps
reacuteel DartMaps indique lemplacement des trains de banlieue de Dublin
Mais certains Mashup en minoriteacute certes nexploitent pas de donneacutees
cartographiques Cest le cas de Delexaorg 120 un outil qui mixe les bookmarks
sociaux de Delicious aux donneacutees statistiques dAlexa Delexa va en effet afficher les
tags de Delicious associeacutes aux statistiques de freacutequentation des 50 000 premiers
sites web US fournis par Alexa (agrave partir des donneacutees transmises par les barres
doutils Alexa installeacutees par les internautes) Un tel outil est inteacuteressant notamment
pour se familiariser avec les tags et Delicious mais surtout pour deacutecouvrir quels
sont les sites dinfluence et populaires dans un secteur On peut eacutegalement observer
la correacutelation ou non entre nombre de tags et donneacutees de freacutequentation Alexa
Cocircteacute moteur de recherche les mashups Molu et Gnosh fournissent des
meacutetamoteurs reacutealiseacutes agrave partir du mixage de dizaines doutils de recherche121
Des ressources
Comment trouver des mashups Comme pour de nombreuses informations sur le
web des annuaires speacutecialiseacutes 122 sont apparus Ils reacutepertorient aussi bien des API agrave
destination des deacuteveloppeurs que des mashups WebMashup auto-proclameacute Open
Directory for Mashups et Web 20 APIs en liste des centaines ProgrammableWeb
lun de sites de reacutefeacuterence dans le domaine en propose plus de 1800 sous la forme
dun reacutepertoire et eacutegalement dune matrice permettant de visualiser clairement le
croisement de deux applications ou plus Mashup Feed liste aussi des mixages
populaires
Des blogs sont eacutegalement centreacutes sur ces pratiques Google Maps Mania123 recense
de nombreux Mashups cartographiques
Ces Mashups sont un beau symbole de ce web nouvelle geacuteneacuteration on ne lit plus
seulement de linformation statique de maniegravere passive Deacutesormais on est agrave la fois
fournisseur et spectateur en temps reacuteel des contributions de communauteacutes Le tout
copy Digimind Digimind Services ndash White Paper |71
Le Web 20 pour la veille et recherche dinformation DIGIMIND
gracircce agrave des interfaces reacutealiseacutees par des deacuteveloppeurs agrave partir de code ouverts de
grandes socieacuteteacutes Le succegraves est notamment provoqueacute par la possibiliteacute de mixage
entre des donneacutees du monde reacuteel et des informations ou fichiers posteacutes sur le net
Les internautes peuvent donc maintenant se rassembler par centres dinteacuterecirct mais
eacutegalement par proximiteacute geacuteographique Je recherche un speacutecialiste de linformation
sur les biocarburants situeacutes agrave moins de 10 km de chez moi
Par ailleurs on peut imaginer agrave terme des applications meacutelangeant les donneacutees de
centaines de fichiers et bases de donneacutees On en est certes aux preacutemisses mais le
mashup Alkemis 124 en est deacutejagrave un bon exemple il affiche sur une carte de New
York des donneacutees provenant dA9 OpenSearch Delicious Flickr Google Maps et
Yahoo Traffic Reacutesultat la possibiliteacute de visualiser en une seule interface un eacutetat du
trafic routier via des cameacuteras de surveillance la meacuteteacuteo les actualiteacutes locales ou les
liens Delicious en rapport avec la villehellip
copy Digimind Digimind Services ndash White Paper |72
Le Web 20 pour la veille et recherche dinformation DIGIMIND
III Diffuser
Avec lapparition des applications collaboratives et des plateformes de blogs la
faciliteacute de publication sur le web sest accrue Tout individu mecircme sans
connaissances techniques peut publier et diffuser son propre contenu sur un blog
un wiki et via des fils RSS
a Les Blogs et le flux RSS
Il suffit de 5 minutes pour sinscrire agrave une plateforme de blogs et commencer agrave
eacutecrire Ces plateformes proposent des services de bases gratuits et des
fonctionnaliteacutes plus avanceacutees neacutecessitant un abonnement Ces services qui
permettent de creacuteer maintenir et heacuteberger votre blog sont nombreux Parmi les
prestataires de qualiteacute on peut citer Blogger (qui appartient agrave Google) TypePad et
Vox (de la socieacuteteacute SixApart) Overblog Viablog Haut et Fort ou BlogSpirit 125 Bien
dautres socieacuteteacutes proposent des services de creacuteation et dheacutebergement126 Des
comparatifs sont disponibles en ligne127
Nous lavons vu le format RSS permet de diffuser tregraves facilement le contenu de son
blog utilisant le XML (un html eacutepureacute) langage natif du blog chaque carnet web
comporte un fils RSS permettant aux visiteurs de sabonner agrave vote blog et de
recevoir instantaneacutement toute nouvelle publication actualiteacutes billets podcast ou
videacuteos Par ailleurs des services comme Feedburner128 permettent de rendre
compatibles vos flux RSS avec la majoriteacute des lecteurs RSS outils dont nous
reparlerons plus loin
La creacuteation de sites internet classiques sest elle aussi consideacuterablement simplifieacutee
un outil tel que Google Page Creator129 permet de creacuteer un site simple en 1 heure
Des sites plus sophistiqueacutes sont eacutegalement abordables sans avoir agrave connaicirctre une
ligne de programmation de html gracircce au perfectionnement des eacutediteurs dits
WYSIWYG ce que vous voyez quand vous construisez votre page est ce que vous
obtiendrez en ligne
Les outils Web 20 permettent agrave des speacutecialistes journalistes ou salarieacutes de diffuser
leur contenu Il y a encore 2 ans ils eacutetaient pour la plupart eacutecarteacutes de la publication
web faute de bagage technique
copy Digimind Digimind Services ndash White Paper |73
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Depuis le deacuteveloppement des blogs agrave partir de lautomne 2001 il est possible pour
tout internaute de diffuser sa propre information Au-delagrave des blogs dadolescents
et autres carnets intimes le web regorge de blogs agrave tendance professionnelle
corporate produits marketing experts politiques ressources humaines Cest
autant de sources potentielles quil faut exploiter afin de capter des sources
primaires de qualiteacute Le volume des blogs publieacutes et maintenus chaque jour est lui
aussi en constante augmentation
Le White Paper Blogs et RSS des outils pour la veille strateacutegique deacuteveloppe les
aspects inteacuteressants des blogs pour le professionnel de linformation130
b Les Wikis
Le wiki est finalement diffeacuterent du blog de par sa nature et son utilisation Selon
Wikipedia le Wiki est un site Web dynamique permettant agrave tout individu den
modifier les pages agrave volonteacute Il permet de communiquer et diffuser des informations
rapidement de structurer cette information pour permettre dy naviguer
commodeacutement (Wiki vient du terme hawaiien wiki wiki =rapide ou informel)
Lagrave ougrave le blog sera adapteacute agrave la diffusion dactualiteacute et de contenu se renouvelant
freacutequemment le wiki sera davantage deacutedieacute agrave du texte plus statique mais neacutecessitant
ou pouvant senrichir de la collaboration de plusieurs personnes Ainsi les articles
dune encyclopeacutedie ou les fiches correspondants aux diffeacuterentes phases dun projet
impliquant de nombreux collaborateurs pourront ecirctre reacutealiseacutees sous forme de
Wiki
Sur un blog laffichage du contenu est anteacute-chronologique (le plus reacutecent en haut)
sur un wiki il est structureacute en rubriques larchitecture comme le contenu pouvant
ecirctre modifieacutes agrave tout moment par les participants Ceux-ci peuvent beacuteneacuteficier de
droits daccegraves et de modification hieacuterarchiseacutes
Les versions anteacuterieures ainsi que les modifications sont accessibles via une rubrique
Historique Sur un blog le visiteur peut collaborer mais uniquement via ses
commentaires Sur un wiki tout collaborateur autoriseacute peut modifier le texte
comme le titre et lorganisation des rubriques
Par ailleurs la prise en main dun wiki et de ses syntaxes denrichissement et
modification demande un peu de pratique et nest pas aussi simple que le
maniement dun blog Le wiki est un des outils ideacuteaux pour la gestion de projet
Certaines entreprises les utilisent en tant que tel (parfois en parallegravele avec les blogs)
pour eacuteviter des eacutechanges des recherches et un archivage via les mails fastidieux
copy Digimind Digimind Services ndash White Paper |74
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Geacutereacute via des droits daccegraves gradueacutes il peut alors se reacuteveacuteler comme un outil tregraves
simple agrave manier et agrave sapproprier Ces wikis seront eacutevidemment reacuteserveacutes agrave
lentreprise en accegraves priveacute
Exemples de wikis publics
gt Wikipedia131
Le wiki le plus connu est Wikipedia lencyclopeacutedie collaborative gratuite dont le
contenu est creacuteeacute et maintenu par des milliers dinternautes beacuteneacutevoles Chacun est
libre de creacuteer un article modifier ceux des autres ou les commenter En mai 2007
lencyclopeacutedie proposait plus de 7 millions darticles dans 192 langues et dialectes
dont plus de 500 000 en franccedilais Wikipedia jouit dune populariteacute et dun succegraves
tregraves important Google indexe de nombreux articles de Wikipedia agrave tel point quil
est rare deffectuer une recherche sur le moteur sans voir safficher une deacutefinition
issue de lencyclopeacutedie Selon la socieacuteteacute de mesure daudience Comscore en janvier
2007 Wikipedia eacutetait le 9egraveme site US le plus visiteacute (derriegravere les sites Yahoo
premiers puis les sites Time Warner Microsoft Google eBay Fox Interactive
Amazon et Ask) 6 groupes eacuteditant un moteur geacuteneacuteraliste (Google Ask Microsoft
Yahoo Amazon et AOL) occupent le top10 US Mais cest la premiegravere fois quun
site collaboratif truste les premiegraveres places des sites les plus visiteacutes
Wikipedia comme tout service leader est tregraves critiqueacute Notamment sur la
possibiliteacute pour tout un chacun de modifier et de creacuteer des articles pouvant
entraicircner des risques de diffamation ou de vandalisation 132 Mecircme si ces risques
sont reacuteels nous le verrons dans la partie consacreacutee aux limites du Web 20 il ne
faut pas pour autant se focaliser sur ces problegravemes
Par ailleurs on a souvent mis en cause la qualiteacute des articles du contenu eacutemanant
dinternautes pas forceacutement qualifieacutes ou experts et donc par nature douteux Or
une eacutetude commandeacutee par la Revue Nature agrave remis en cause ce type de ressenti
des experts ont compareacute 42 documents publieacutes sur Wikipedia et sur la ceacutelegravebre
Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche133
Seulement 8 erreurs seacuterieuses comme des mauvaises interpreacutetations de concepts
ont eacuteteacute repeacutereacutees dans les articles analyseacutes 4 pour chaque encyclopeacutedie Des
erreurs factuelles omissions ou fausses descriptions ont eacutegalement eacuteteacute deacutetecteacutees
162 dans Wikipedia et 123 dans lEncyclopaedia Britannica
Le succegraves et limportance de Wikipedia nont pas eacutechappeacute aux moteurs de
recherche qui sont plusieurs agrave secirctre speacutecialiseacutes dans la recherche sur lencyclopeacutedie
Ainsi WikiSeek 134 est un moteur lanceacute deacutebut 2007 qui recherche sur le contenu de
Wikipedia Il indexe le contenu en crawlant les pages en profondeur et aspire
eacutegalement le contenu des liens preacutesents sur les pages de lencyclopeacutedie
copy Digimind Digimind Services ndash White Paper |75
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Plus eacutelaboreacute le moteur franccedilais Exalead 135 enrichit consideacuterablement la recherche
dans lencyclopeacutedie en ligne Cette fonctionnaliteacute est accessible en cliquant sur
longlet Wikipedia Il est eacutevidemment possible de rechercher des articles par mots
cleacutes mais aussi daffiner par langue via le nuage de tags dynamique ( les eacutetiquettes
correspondent agrave des emplacements geacuteographiques personnes ceacutelegravebres noms
drsquoorganisations termes lieacutes agrave votre requecircte ou cateacutegories de Wikipedia)
WikiMindmap 136 recherche sur Wikipedia et affiche les reacutesultats sous forme de
MindMap (cartes heuristiques) Il est alors possible de naviguer dans larborescence
des termes
WikiMindMap
gt Citizendium 137 Lanceacute fin 2006 Citizendium est une initiative de Larry Sanger co-fondateur de
Wikipedia avec Jimmy Wales Citizendium est eacutegalement une encyclopeacutedie Mais
jugeant la communauteacute Wikipedia senseacutee srsquoauto-reacuteguler dysfonctionnelle Larry
Singer integravegre dans Citizendium des proceacutedures de seacutelection des articles par des
experts et refuse aux contributeurs la possibiliteacute de lrsquoanonymat misant ainsi sur la
responsabilisation Le collegravege dexperts a le dernier mot concernant la veacuterification
des articles le but eacutetant dobtenir une encyclopeacutedie contenant le moins derreurs
possible Citizendium est structureacutee en grandes cateacutegories acadeacutemiques
correspondant agrave des groupes de travail Sciences naturelles Sciences Humaines
Arts Sciences Humaines Divertissement Arts appliqueacutes et Sciences
copy Digimind Digimind Services ndash White Paper |76
Le Web 20 pour la veille et recherche dinformation DIGIMIND
gt Alacrawiki 138
AlacraWiki est un guide deacutedieacute aux socieacuteteacutes du secteur de linformation eacutediteurs et
bases de donneacutees La rubrique Alacra Industry Spotlights est particuliegraverement
remarquable elle fournit des analyses et commentaires sur les sites dinteacuterecirct pour
une trentaine de secteurs industriels Le wiki offre des informations sur les
agreacutegateurs de contenu les bases de donneacutees et les meilleurs blogs deacutedieacutes au
secteur de linformation on-line Alacra propose aussi un blog et un fils RSS
Alacra Wiki
gt Les fils RSS 139
Sur cette page de wiki vous trouverez agrave peu pregraves tout sur le RSS
La norme comment utiliser les fils RSS des articles une seacutelection dagreacutegateurs
mixer des fils RSS entre eux mesurer lactiviteacute des fils RSS creacuteer un fil RSS
gtWikidweb 140
Wikidweb est un Wiki qui propose un reacutepertoire de sites web (et non de wikis)
Aussi vous pouvez y participer selon les fonctionnaliteacutes courantes du format wiki
vous avez ainsi la possibiliteacute dy ajouter vos propres sites mais eacutegalement de
modifier les entreacutees des autres internautes (urls texte) ou de les commenter
copy Digimind Digimind Services ndash White Paper |77
Le Web 20 pour la veille et recherche dinformation DIGIMIND
IV Surveiller
Nous lavons vu dans la partie Recherche de blogs et de flux RSS les flux RSS sont
preacutesents sur de nombreux formats du net et vont permettre de surveiller les
nouveauteacutes apparaissant sur les blogs les sites corporate les sites de presse dans
les reacutesultats de moteurs de recherche dactualiteacutes de blogs web dans les
newsgroups sur certains forums web sur certaines listes de diffusion les
bookmarks sociaux les sites de partage de photos et de videacuteoshellipbref sur de tregraves
nombreux sites classiques et ressources collaboratives de type 20
Ces flux RSS peuvent ecirctre inteacutegreacutes agrave votre process de veille en deux clics via des
outils simples gratuits ou payants mais plus puissants
a La deacutetection du flux RSS
Pour pouvoir mettre en surveillance le flux RSS (RSS Feed en anglais) il faut dabord
le trouver Or il nest pas toujours aiseacute de mettre la main sur ces petits logos
oranges ou les liens RSS Abonnez-vous Syndiquez ce flux qui pointent vers les
flux RSS parfois cacheacutes dans les meacuteandres des pages web
Des icocircnes signalant la preacutesence de flux RSS
Certains navigateurs permettent de deacutetecter automatiquement les flux lorsquils
sont preacutesents sur une page web Une icocircne vous avertira alors et dans la plupart
des cas affichera ladresse du ou des flux disponibles sur la page Plusieurs formats
de flux peuvent coexister les diffeacuterentes versions du RSS (090 091 092 10 20)
et le format ATOM concurrent mais offrant les mecircmes fonctionnaliteacutes
Internet Explorer 7 Opera Firefox permettent de deacutetecter les flux Cest aussi le cas
de Maxthon une puissante interface de navigation qui vient se greffer sur
larchitecture dInternet Explorer 141
copy Digimind Digimind Services ndash White Paper |78
Le Web 20 pour la veille et recherche dinformation DIGIMIND
b La mise en surveillance
Quelque soit laspect de la page qui contient votre flux RSS (xml rdf interface
Feedburner) il convient de copier et coller ladresse (url) dans loutil qui va vous
servir agrave lire ce flux et agrave ecirctre alerteacute degraves lors quune nouveauteacute apparaicirct
4 grands types doutils peuvent ecirctre utiliseacutes (du plus simple au plus sophistiqueacute)
- Les navigateurs web
Les navigateurs citeacutes preacuteceacutedemment outre la deacutetection du flux RSS permettent de
sy abonner et de les lire Les flux sintegravegrent alors dans un menu lateacuteral ou dans la
page principale Cest simple mais deacutepourvu de fonctions avanceacutees de tri ou
dorganisation
- Les lecteurs (ou agreacutegateurs) de flux RSS
Ce sont les outils deacutedieacutes aux fils RSS Comme de nombreuses applications ces
lecteurs sont soit disponibles en ligne soit agrave installer localement sur votre PC
- Exemples de lecteurs RSS en ligne Bloglines Pluck Newsgator
- Exemples de lecteurs RSS installeacutes RSS Reader Amphetadesk Newsgator (sintegravegre
agrave Outlook) FeedDemon
Le lecteur Bloglines exploite de maniegravere astucieuse la logique communautaire
lorsque vous ecirctes abonneacute agrave un flux RSS vous pouvez visualiser les autres abonneacutes
(ceux qui ont accepteacute de rendre leur abonnement public) Un clic sur leur nom
affiche tous les fils RSS auxquels ils ont souscrits un moyen rapide de deacutecouvrir
dautres ressources pertinentes collecteacutees par des internautes proches de vos
centres dinteacuterecirct
Les lecteurs RSS sont tregraves nombreux Pour mieux les distinguer certains blogs ou
sites proposent des comparatifs142
copy Digimind Digimind Services ndash White Paper |79
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La communauteacute sur Bloglines les abonneacutes au flux RSS du blog Voip Weblog
- Les pages personnalisables
Ce sont des pages web geacuteneacuteralement organiseacutees en onglets et boicirctes permettant
dorganiser et de ranger ses flux par cateacutegories et ce dans un mecircme espace Ces
services sont ergonomiques et ideacuteaux pour lire dun coup doeil le maximum de flux
Les plus connus sont NetVibes PageFlakes ou Webwag
Outre la lecture de flux RSS ces pages offrent la possibiliteacute dinteacutegrer des services
de meacuteteacuteo mail bloc-notes et des flux provenant de service sociaux comme les
bookmarks ou les reacuteseaux damis
Certains blogs fournissent des listes et comparatifs de ces services143
- Les progiciels de veille inteacutegreacutes
Face agrave labondance des flux RSS et blogs des applications de veille inteacutegreacutee comme
Digimind Evolution 144 donnent la possibiliteacute de filtrer les RSS via lapplication de
requecirctes diffeacuterentes sur chaque fils RSS
On peut ainsi seacutelectionner les informations agrave remonter via des requecircte simples ou
plus complexes (booleacuteens parenthegraveses troncatures et opeacuterateurs de proximiteacute) agrave
longueur illimiteacutee En outre il est possible de surveiller jusquagrave 10 000 flux RSS
quotidiennement
Les boutons inteacutegreacutes
Certains sites vont vous simplifier la tacircche ils affichent sur leurs pages agrave coteacute de
leurs flux des boutons qui permettent dajouter directement le flux agrave votre lecteur
copy Digimind Digimind Services ndash White Paper |80
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ainsi le service dactualiteacutes Wikio ou le moteur Ask Blogs amp Flux proposent tous
deux des boutons vers Bloglines MyYahoo Google Reader Newsgator et Ask Blog
Les fichiers OPML
LOPML (Outline Processor Markup Language) est un format deacuteveloppeacute en XML qui
permet leacutechange dinformations structureacutees entre applications fonctionnant sur des
OS et environnement diffeacuterents Exemple les abonnements dun internaute agrave un
ensemble de flux RSS entre un navigateur Firefox et Internet Explorer de MacOS agrave
Windows XP
Des agreacutegateurs RSS comme Bloglines NewsGator ou Rojo offrent la possibiliteacute
dexporter lensemble de vos flux RSS favoris ou ceux dautres abonneacutes au format
OPML pour les importer ensuite dans votre agreacutegateur
Share your OPML145 est comme son nom lindique un portail qui vous permet de
partager vos flux RSS au format OPML Ce service liste des centaines de fichiers
OPML
c Pourquoi une veille via le RSS
Faire une veille via les fils RSS preacutesente des inteacuterecircts notables
- Lhyper-segmentation le choix des fils RSS rend possible une seacutelection fine de
linformation Ainsi sur le site du Figaro on peut choisir lactualiteacute internationale
nationale les sciences et meacutedecine eacutevitant ainsi decirctre submergeacute par linformation
superflue Sur La Tribune on peut seacutelectionner un flux par socieacuteteacute
Certains blogs proposent mecircme des flux RSS permettant aux choix de surveiller les
commentaires ou uniquement les billets
- Un gain de temps inutile de se connecter au site au blog ou au moteur de
recherche pour visualiser ses nouveauteacutes
- Lanonymat labonnement agrave un flux RSS contrairement agrave une newsletter ou agrave une
liste de diffusion est anonyme
- La consultation aiseacutee vos fils RSS via une lecture sur un agreacutegateur en ligne sont
accessibles de nimporte quel PC connecteacute agrave linternet ougrave que vous soyez
copy Digimind Digimind Services ndash White Paper |81
Le Web 2
copy Digimin
0 pour la veille et recherche dinformation DIGIMIND
d Digimind Services ndash White Paper
V Carte des outils et ressources Web 20
gt Page suivante
|82
wwwdigimindcom Digimind Services ndash White Paper|83
Carte des outils et ressources Web 20 - DIGIMIND Services 2007
Le Web 20 pour la veille et recherche dinformation DIGIMIND
EXEMPLE DUNE RECHERCHE ET VEILLE VIA LE WEB 20
Cas drsquoeacutecole Nous avons agrave mener une recherche et une veille sur le
deacuteveloppement des smartphones ou teacuteleacutephones multimeacutedias haut de gamme Des
sites de type 20 pourront se reacuteveacuteler compleacutementaires de sites classiques (sites
drsquoentreprises portails associations professionnelleshellip) pour deacutetecter les tendances
et sujets eacutemergents
Une premiegravere recherche via lrsquoencyclopeacutedie Wikipedia permettra drsquoobtenir une
premiegravere deacutefinition du sujet et drsquoidentifier les principaux mots cleacutes ainsi que des
liens vers des sites pertinents
Etape suivante nous pourrons eacutelargir notre recherche en identifiant des sites
similaires aux sites trouveacutes preacuteceacutedemment via les suggestions fournies par des
moteurs collaboratifs tels que Yoono ou Similicious
Une recherche sur le tag Smartphone dans des sites de social bookmarking
comme Delicious nous permettra eacutegalement drsquoidentifier les pages plus ou moins
populaires taggeacutees par les contributeurs du site ainsi que drsquoautres tags en relation
avec notre sujet
Explorons ensuite les avis drsquoexperts plus ou moins autoriseacutes que lrsquoon trouvera dans
les meacuteandres de la blogosphegravere gracircce agrave des moteurs de blogs comme Technorati
Blogpulse ou Google Blog Search
La recherche pourra srsquoeffectuer via les tags ou le texte inteacutegral des billets On
pourra ensuite parcourir les blogrolls des auteurs les plus pertinents afin drsquoidentifier
drsquoautres sources
La lecture des blogs fournira non seulement des avis de speacutecialistes ou journalistes
mais aussi des avis plus ou moins critiques de consommateurs ou utilisateurs de
smartphoneshellip
Il conviendra toutefois de rester vigilant quant agrave lrsquoeffet pot de miel de certains
blogs ougrave les contributions des internautes se reacutevegravelent ecirctre de simples messages
publicitaires deacuteguiseacutes (voir agrave ce sujet la mise en garde du site UFC Que choisir146)
Pour recueillir les derniegraveres informations drsquoactualiteacute on pourra utiliser un
agreacutegateur tel que Wikio ou Digg et creacuteer un flux RSS agrave partir drsquoune requecircte sur les
copy Digimind Digimind Services ndash White Paper |84
Le Web 20 pour la veille et recherche dinformation DIGIMIND
tags preacuteceacutedemment identifieacutes Wikio propose des raccourcis pour inteacutegrer ce flux
au sein de plusieurs lecteurs RSS du marcheacute (Netvibes Newsgator Google Reader
etc)
Les reacuteseaux sociaux professionnels permettront eacutegalement drsquoidentifier des acteurs
importants du domaine dans les sphegraveres universitaires ou de lrsquoentreprise
La communauteacute 20 srsquoexprimera eacutegalement sur les grands portails consacreacutes aux
nouvelles technologies Crsquoest le cas par exemple du portail ZDNet qui permet aux
utilisateurs de commenter les articles ou de les ajouter directement agrave leur profil
Delicioushellip Les commentaires ou les trackbacks pointant sur un article pourront
constituer un preacutecieux compleacutement drsquoinformations
Afin de mener une veille reacuteguliegravere sur le sujet on syndiquera les flux RSS provenant
des diffeacuterents sites ou blogs identifieacutes Pourquoi ne pas eacutegalement creacuteer agrave partir de
ce bouquet de sources personnaliseacutees un moteur sur mesure conccedilu gracircce agrave Rollyo
ou Yahoo Search Builder
copy Digimind Digimind Services ndash White Paper |85
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Les limites du Web 20
LA PARTICIPATION
I Une participation heacuteteacuterogegravene
Nous lavons deacutejagrave eacutevoqueacute tout le monde ne participe pas de la mecircme maniegravere sur
les applications du Web 20
Une minoriteacute participativehellip
Bill Tancer de la socieacuteteacute de mesure daudience Hitwise reacutevegravele dans une eacutetude147
que sur les sites type Web 20 les internautes regardent mais participent peu
Seulement 016 des visiteurs du site YouTube viennent y partager leurs videacuteos
Les 9984 restant ne font que regarder Idem pour le site de partage de photos
de Yahoo Flickr seulement 02 des visites conduisent agrave la publication de photos
Wikipedia est lexception sur lencyclopeacutedie collaborative gratuite 46 des
visites correspondent agrave une modification des articles
Sur ces sites on est donc encore loin de la regravegle de la 11089 eacutedicteacutee par Charles
Arthur dans The Guardian148 Il estime que sur le net sur un groupe de 100
personnes si une creacutee du contenu 10 vont interagir (commentaires
ameacuteliorations) et les 89 restant ne feront que le lire et regarder Le journaliste
lillustre via des exemples quantifieacutes avec YouTube Wikipedia ou Yahoo Groups
Most Web 20 Users Are Really Just Couch Potatoes Bruce Nussbaum compare
mecircme les internautes Web 20 aux spectateurs de TV passifs et affaleacutes dans leurs
canapeacutes149
Mais parallegravelement les sites de type Web 20 ont vu leur audience grimper
de668 en 2 ans reacutevegravele leacutetude Hitwise Cela repreacutesente 12 du trafic web aux
USA contre 2 il y a seulement 2 ans
Les sites de partage de photos sont parmi les plus populaires Flickr bien sucircr mais
aussi PhotoBucket qui repreacutesente agrave lui seul 41 du trafic des sites de photos en
ligne
copy Digimind Digimind Services ndash White Paper |86
Le Web 20 pour la veille et recherche dinformation DIGIMIND
hellipdautant plus que la forme de participation se complexifie
Dapregraves le cabinet Forrester les internautes sont nombreux sur les actions agrave faible
niveau dexigence (lire enregistrer un signet commenter) mais beaucoup moins sur
des participations plus actives (eacutecrire collaborer) 150
Wikipedia un faux modegravele collaboratif
On cite souvent lencyclopeacutedie Wikipedia en exemple cest lun des emblegravemes les
plus forts et les plus lus du Web 20 Son mode de fonctionnement est
caracteacuteristique voire symptomatique du web collaboratif Mais le process de
Wikipedia serait finalement tregraves classique avec une hieacuterarchie de contributeurs
sorte de cadres disposant de nombreux droits eacutecrivant la majoriteacute des articles
Cest lanalyse de Lionel Barbe du CNRS151 Il explique que si le principe de liberteacute
de publication sur Wikipedia reste valable il est de moins en moins commun car
la plupart des entreacutees basiques ne precirctant pas agrave discussion ont deacutejagrave eacuteteacute effectueacutees
Lrsquoeacutetude des laquo logs raquo historiques montre que la creacuteation de nouvelles entreacutees qui
correspondent agrave de nouvelles pages articles dans la Wikipedia Francophone ne
concerne qursquoenviron 3 agrave 4 des opeacuterations Par comparaison cette proportion tombe
agrave 2 pour la version anglaise de Wikipedia qui contient plus de 1 million drsquoarticles A
lrsquoinverse la proportion monte entre 8 et 10 pour des Wikipedias ayant moins de
100 000 articles comme la Wikipedia en Lituanien et bien drsquoautres
Selon lui on assiste agrave un effet de professionnalisation de lencyclopeacutedie [hellip] les
plus gros contributeurs que nous consideacutererons comme eacutetant les 5 des individus
eacuteditant le plus drsquoarticles eacuteditent entre 85 et 95 du contenu total de lrsquoencyclopeacutedie
Au fur et agrave mesure ces gros contributeurs acquiegraverent des privilegraveges comme le statut
drsquoadministrateur qui leur permettent non seulement de participer mais aussi de
surveiller et le cas eacutecheacuteant censurer le contenu eacutediteacute par les autres contributeurs et de
participer aux grandes lignes de lrsquoorganisation de Wikipedia
Cette analyse a toutefois eacuteteacute battue en bregraveche par Aaron Swartz dans une petite
eacutetude 152 En mesurant non pas le nombre drsquointerventions de chaque contributeur
mais la quantiteacute de texte produit par chacun la reacutealiteacute est diffeacuterente les
contributeurs occasionnels eacutecriraient des textes longs en peu dinterventions tandis
que les eacutediteurs actifs reacutealiseraient un travail tenant davantage de la maintenance
(correction veacuterification suppression) mais sans apporter beaucoup de texte
copy Digimind Digimind Services ndash White Paper |87
Le Web 20 pour la veille et recherche dinformation DIGIMIND
II Une participation damateurs
Tout internaute peut-il simproviser journaliste expert commentateurhellip
Michel Fingerhut 153 voit dans le succegraves dune encyclopeacutedie comme Wikipedia une
manifestation du web comme heacutegeacutemonie de lrsquoamateurisme et comme encouragement
agrave lrsquoextreacutemisme ideacuteologique et au communautarisme
Les contenus creacuteeacutes et diffuseacutes sont-ils de qualiteacute Le Web 20 devient une
plateforme qui stimule la creacuteativiteacute et la production de contenu par cela mecircme
qursquoelle en permet la diffusion (avec indice de notorieacuteteacute) On assiste agrave une libeacuteration
de talents qui peuvent enfin se reacuteveacuteler parallegravelement agrave des productions
caracteacuteriseacutees par un certain amateurisme et lrsquoabsence de veacuteritable ambition
creacuteatrice Car comme sur lensemble de linternet sur ce Web 20 le pire cocirctoie le
meilleur
Par ailleurs toujours en prenant lexemple de Wikipedia un certain nombre de
pheacutenomegravenes se reacutevegravelent tout de mecircme preacuteoccupants
Si leacutetude reacutealiseacutee pour le magazine Nature reacutevegravele que la qualiteacute des articles de
lencyclopeacutedie est presque au niveau de celle de lEncyclopaedia Britannica certains
articles de Wikipedia relegravevent de la deacutesinformation ou de la propagande
- larticle Droits de lHomme en Iran154 a ainsi eacuteteacute tregraves controverseacute en effet cet
article tregraves long de plus de 20 pages se preacutesente davantage comme une apologie du
reacutegime iranien quune analyse argumenteacutee des droits de lhomme dans ce pays Or
certainement au nom du principe de neutraliteacute qui reacutegit Wikipedia cet article
tendancieux a eacuteteacute classeacute comme article de qualiteacute 155
- le cas Seigenthaler 156 en mai 2005 un contributeur publie anonymement sur
Wikpedia un article sur John Seigenthaler Sr un eacutecrivain ceacutelegravebre aux USA Or ce
billet mentionne que leacutecrivain a eacuteteacute directement impliqueacute dans les assassinats de
John et Bob Kennedy en preacutecisant toutefois que rien na jamais eacuteteacute prouveacute Cette
information est tout simplement fausse Mais larticle nest deacutecouvert (par un ami de
John Seigenthaler) et corrigeacute que 4 mois plus tard mettant agrave mal la creacutedibiliteacute de
lencyclopeacutedie A la suite de cette affaire largement relayeacutee par les meacutedias
ameacutericains le fondateur de Wikipedia a rigidifieacute les regravegles de publication concernant
les tout nouveaux contributeurs
Certes sur les milliers darticles mis en ligne par Wikipedia ces dysfonctionnements
restent heureusement minoritaires mais ils reacutevegravelent tout de mecircme certaines limites
du tout collaboratif et la neacutecessiteacute de regravegles de publication emprunteacutees aux meacutedias
classiques
copy Digimind Digimind Services ndash White Paper |88
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Lagreacutegation de petites choses faciles
Elles ont tendance agrave dominer le contenu du Web 20 La faciliteacute de publication le
rythme des blogs qursquoil convient drsquoalimenter freacutequemment peut entrer en conflit
avec le temps de la recherche et de la reacuteflexion Souvent les thegravemes traiteacutes ne
peuvent degraves lors ecirctre que des sujets du quotidien des opinions non reacutefleacutechies non
argumenteacuteeshellipOn peut donc craindre agrave linstar du mode de diffusion sur dautres
meacutedias quinteacutegreacute agrave un reacuteseau social noteacute eacutevalueacute agrave la recherche de notorieacuteteacute et de
visibiliteacute le creacuteateur de contenu ait tout inteacuterecirct agrave aller dans le sens de son audience
produire du divertissant plus agrave mecircme de lui garantir un succegraves immeacutediat
Par ailleurs des opinions peuvent-elles se transformer en jugement pertinent par
lrsquoeffet de leur agreacutegation Lrsquoagreacutegation drsquoune quantiteacute importante drsquoavis peut elle
vraiment deacutepasser lrsquoimpreacutecision des avis pris indeacutependamment Peut-on sans une
harmonisation des critegraveres drsquoappreacuteciation atteindre un jugement collectif fiable Les
tendances qui ressortent risquent en effet de se limiter souvent au reflet de
lrsquoopinion majoritaire
Mais leacutevocation de ces limites ne doit pas occulter toutes les contributions matures
produites par des internautes soucieux dapporter un contenu veacuteritablement
constructif Les billets et les commentaires de nombres de blogs politiques franccedilais
en 2007 en sont une parfaite illustration
LE WEB 10 RESTE NECESSAIRE
Le mail reacutesiste
Nous lavons vu au cours de la description des applications pour la veille les services
Web 20 ne sont pas suffisants en soit pour la recherche dinformation De plus
bien que ses possibiliteacutes soient tregraves puissantes lutilisation du Web 20 reste encore
marginale agrave leacutechelle de tous les internautes Une eacutetude du cabinet Pew Internet 157
montre que lactiviteacute internet dominante sur une journeacutee type dun ameacutericain reste
tout simplement le mail 53 des internautes lutilisent Ils sont 38 agrave utiliser un
moteur de recherche Par contre ils ne sont que 8 agrave creacuteer des blogs et 26 agrave
partager des photos et videacuteos cette collaboration multimeacutedia eacutetant de loin lactiviteacute
la plus courante du Web 2
copy Digimind Digimind Services ndash White Paper |89
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Une enquecircte en ligne de lUniversiteacute dOxford reacutealiseacutee aupregraves de 1469 personnes
(une majoriteacute deacutetudiants) fin 2006 deacutetaille les usages du Web 20 158 Elle reacutevegravele elle
aussi que les applications de ce web nouvelle geacuteneacuteration sont encore peu connues
et peu utiliseacutees La majoriteacute des reacutepondants na jamais employeacute ou jamais entendu
parleacute des fils RSS ou des applications de Social Bookmarking comme Delicious
Aussi linfluence grandissante du Web 20 ne doit pas masquer les usages
traditionnels du web qui restent majoritaires
Une population souvent isoleacutee et non repreacutesentative
Lage
Si de nombreuses applications sociales apportent un reacuteel progregraves il faut tempeacuterer
la nature de certains contenus issus du mode collaboratif celui-ci nest en effet pas
repreacutesentatif des internautes puisque le public du Web 20 est une population plutocirct
jeune
Ainsi leacutetude Pew Internet reacutevegravele que laudience de Wikipedia aux USA eacutetait en aoucirct
2006 agrave 47 situeacutee dans la tranche des 18-34 ans Les plus de 45 repreacutesentaient
28 Sur le site dEncarta lencyclopeacutedie de Microsoft plus traditionnelle (Web 10)
la part des plus de 45 ans atteint 33
Des communauteacutes isoleacutees structureacutees en icircles Les communauteacutes actuelles du Web 20 sont souvent renfermeacutees sur elles-mecircmes
les statistiques sur les liens pointant vers les blogs et sur les liens preacutesents dans les
billets reacutevegravelent que les blogueurs se lient et se lisent beaucoup entre eux
Lrsquointernaute Web 20 aurait donc tendance agrave senfermer sur lui-mecircme et autour
dindividus feacutedeacutereacutes en communauteacutes focaliseacutes sur les mecircmes centres drsquointeacuterecirct que
lui
Par ailleurs lhyper segmentation et le ciblage des nouvelles rendu possible par le
flux RSS notamment peut conduire agrave favoriser ces microcosmes communautaires
Parcourir un journal papier peut favoriser davantage louverture la prise de recul et
la mise en perspective des diffeacuterentes informations que la lecture de flux aux
theacutematiques tregraves speacutecialiseacutees
Les diffeacuterentes communauteacutes par reacuteflexe et de par la nature des applications Web
20 qui se dupliquent mais ne se connectent pas ont tendance agrave peu communiquer
entre elles Ainsi les liens entre reacuteseaux sociaux sont rares Peu de personnes
copy Digimind Digimind Services ndash White Paper |90
Le Web 20 pour la veille et recherche dinformation DIGIMIND
enregistreacutes sur LinkedIn iront eacutegalement sinscrire sur Viadeo ou FaceBook
Latomisation des donneacutees sur des dizaines dapplications reste eacutegalement un vrai
problegraveme
Des domaines mal couverts
Certaines theacutematiques vont ecirctre surrepreacutesenteacutees au deacutetriment dautres au
traitement beaucoup plus confidentiel car boudeacutees par les internautes producteurs
volontaires dinformation Les ingeacutenieurs techniciens et jeunes eacutetant fortement
repreacutesenteacutes parmi les blogueurs les theacutematiques high tech sont tregraves largement
couvertes par les blogs par exemple dans le domaine de la RFID (Identification par
Radio Freacutequence) on compte plus de 100 blogs idem pour la VoIP (Voix sur IP) A
linverse si vous travaillez dans le secteur des machines outils ou de la plasturgie il
vous sera difficile de trouver du contenu sur la blogosphegravere
Tous les secteurs ne sont donc pas eacutegaux en volume sur le net et davantage encore
sur la blogosphegravere et sur les autres applications collaboratives ougrave tout internaute
peut publier son propre contenu et ougrave certaines tranches dacircges et cateacutegories
professionnelles ne sont pas bien repreacutesenteacutees
copy Digimind Digimind Services ndash White Paper |91
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Conclusion
Le Web 20 ce mot qui geacutenegravere eacutenormeacutement de buzz deacutecrits et de blogs
speacutecialiseacutes nest-il quun terme marketing un courant de mode 159 Il est probable
que bientocirct on ne lemploiera plus pour deacutesigner ces nouvelles applications qui
seront devenues la norme Toutefois ce terme sorte de parapluie conceptuel qui
recouvre les diffeacuterentes tendances du web nouvelle geacuteneacuteration a le meacuterite de
mettre un nom simple sur un courant du net novateur
Le Web 20 nest pas une reacutevolution ou une rupture technologique mais plus
certainement une eacutevolution qui permet de replacer lutilisateur au centre des
reacuteseaux Cela nest certes pas tregraves nouveau Usenet lun des plus anciens
protocoles de linternet bien anteacuterieur au WWWeb offrait du contenu en ligne
creacuteeacute par linternaute via les Newsgroups degraves les anneacutees 1980
Mais les progregraves technologiques ont permis dintensifier cette tendance et de
deacutemocratiser laccegraves agrave la creacuteation de contenu en ligne et agrave sa diffusion au plus grand
nombre Potentiellement tout internaute peut maintenant diffuser ses publications
tant les outils sont devenus simples
Le Web 20 tend agrave sinseacuterer au cœur du quotidien de chacun en lui apportant des
services novateurs reacuteellement utiles et qui rendent possible lrsquoapparition de
nouveaux usages Ainsi les mash-up qui srsquoappuient sur la geacuteolocalisation ouvrent
des possibiliteacutes inenvisageables jusquici On peut mecircme imaginer agrave terme une
superposition de ces cartes dynamiques agrave la vision reacuteelle dun pieacuteton ou dun
automobiliste Le Web 20 est en perpeacutetuelle eacutevolution ses capaciteacutes drsquoinnovation
sont tregraves fortes car elles reposent souvent sur des recombinaisons audacieuses de
lrsquoexistant hybridant applications et services dans un systegraveme de deacuteveloppement
open source hellipLrsquoinnovation est aussi innovation de postures (prendre la parole
consommer du contenu amateurhellip) qui parfois challengent lrsquoordre eacutetabli et
redistribuent les pouvoirs La position des acteurs du Web 10 ou des meacutedias
classiques pourrait se trouver de plus en plus remise en question lagrave ougrave les
internautes tendent agrave se placer en experts
copy Digimind Digimind Services ndash White Paper |92
Le Web 20 pour la veille et recherche dinformation DIGIMIND
La place de lhumain
Si celle-ci est devenue preacutepondeacuterante il est toutefois difficile de saffranchir
dorganisations un tant soit peu hieacuterarchiseacutees lautoreacutegulation voir Wikipedia ayant
ses limites
En outre la question de la consommation de contenu et de sa qualification sur
lrsquointernet devient cruciale La pertinence des votes de tous les internautes est
discutable ou du moins le fait qursquoils puissent agrave eux seuls qualifier et eacutevaluer la
qualiteacute Par ailleurs que repreacutesente exactement un vote une adheacutesion au contenu
agrave la forme aux ideacutees aux eacutecrits dun ami agrave une ideacutee avec laquelle je suis en
deacutesaccord mais qui agrave le meacuterite dexister
Finalement il faut continuer agrave normer organiser coordonner
reacutegulerhellipnotamment pour eacuteviter les diffamations ou la deacutesinformation Pour ce qui
est du contenu et de sa qualiteacute les critiques eacutemises agrave lrsquoencontre de Wikipeacutedia nous
incitent agrave eacutetudier de plus pregraves les initiatives qui hybrident les interventions
drsquoamateurs avec les compeacutetences de professionnels
Nous sommes passeacutes en 10 ans dun contenu geacuteneacutereacute par quelques internautes pour
la masse agrave un contenu de masse agrave destination de la masse (Evertybody to
Everybody) Cela ne peut guegravere se deacutevelopper sans des meacutecanismes qui replacent
les internautes les plus speacutecialiseacutes dans des processus de validation dune
information devenue pleacutethorique
Les donneacutees personnelles
Simpliciteacute reacuteactiviteacute personnalisation souplesse mutualisationhellipfont partie des
avantages les plus appreacuteciables du web 20 Mais cette liberteacute de publication et de
diffusion nrsquoest elle pas parfois illusoire Les utilisateurs doivent rester vigilants face
aux problegravemes de confidentialiteacute seacutecuriteacute et traccedilabiliteacute de lrsquoinformation160 Des voix
srsquoeacutelegravevent pour deacutenoncer les risques lieacutes agrave la maicirctrise des donneacutees personnelles ou
au respect des droits drsquoauteurs A noter que les licences Creative Commons161
permettent de mieux deacutefinir les contours de cette liberteacute agrave partir de contrats
flexibles de droit dauteur Ce systegraveme Creative Commons donne la possibiliteacute
gratuitement et simplement aux titulaires de droits de choisir et drsquoexprimer les
conditions drsquoutilisation de leurs œuvres agrave travers onze possibiliteacutes Quant aux
utilisateurs ils nrsquoont pas agrave neacutegocier systeacutematiquement une autorisation avant toute
utilisation ou reacuteutilisation
copy Digimind Digimind Services ndash White Paper |93
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Un autre problegraveme reacuteside aussi dans lrsquoeacuteparpillement des donneacutees dans des sites
diffeacuterents ou parfois redondants Il srsquoagira donc de deacutefinir les objets (livre
personne CD photoshellip) agrave partir drsquoun identifiant Cette bataille pour savoir qui
geacuterera ces donneacutees de base telles que la position geacuteographique les espaces de noms et
le code unique de chaque produit a deacutejagrave commenceacute estime Tim OReilly 162
Les perspectives deacutevolution vers un Web 3
Le web actuel est destructureacute et la classification et lrsquoorganisation de son contenu
posent problegraveme La recherche de nouveaux modes de recherche et de
structuration est une sorte de quecircte du graal que de nombreux experts et
entreprises poursuivent
La folksonomie repose sur une ideacutee originale qui sous tend toute lrsquoideacuteologie Web
20 celle de lrsquointelligence collective et de la deacutecentralisation Mais les limites de la
folksonomie appeleacutee aussi web seacutemantique du pauvre remettent en question
lrsquoaffirmation selon laquelle lrsquointelligence collective et la libeacuteralisation totale du
fonctionnement du web 20 sont une solution viable
Aussi la neacutecessiteacute drsquoun Web seacutemantique 163 fiable se fait de plus en plus urgente
Cette nouvelle phase de deacuteveloppement du Web permettrait drsquoameacuteliorer
lrsquoexploitation des informations par les utilisateurs en obtenant une information
organiseacutee normaliseacutee de faccedilon agrave rendre le web compreacutehensible aux machines pour
faciliter lrsquoexploitation par les utilisateurs
Dans un article paru dans le New York Times en novembre 2006 John Markoff
imagine un web 30 selon le principe drsquoajout dune couche de sens tout en haut du
web existant pour en faire un guide au lieu drsquoun simple catalogue Pour lrsquoauteur
nous sommes en train de passer dun web de documents connecteacutes agrave un web de
donneacutees connecteacutees
Le web seacutemantique offrira un langage commun permettant aux donneacutees de
renvoyer agrave des objets du monde reacuteel dune faccedilon identique Le projet Freebase
lanceacute par la start up Metaweb illustre cette approche il a pour objectif de faciliter
la recherche et le partage drsquoinformations agrave travers une base de connaissances
communes structureacutees via des meacutetadonneacutees permettant de deacutecrire chaque
eacuteleacutement drsquoinformation Ces eacuteleacutements seraient relieacutes entre eux par un systegraveme de
relations Tim OrsquoReilly deacutefinit le projet comme la machine agrave creacuteer les synapses du
cerveau global
Il srsquoagirait de creacuteer en quelque sorte un Google du web seacutemantique un reacutepertoire global
drsquoinformations structureacutees intelligibles et exploitables autant par des machines que par
copy Digimind Digimind Services ndash White Paper |94
Le Web 20 pour la veille et recherche dinformation DIGIMIND
des humains -et donc capables drsquoextraire et drsquointerpreacuteter les relations entre des donneacutees
pour par exemple reacutepondre agrave des requecirctes par des solutions plutocirct que des listes de
document 164
La veille
Dans cet univers le chercheur dinformations et le veilleur doiventhellipgarder la tecircte
froide la forte meacutediatisation du Web 20 ne doit pas masquer la pertinence doutils
plus traditionnels Les diffeacuterentes applications Web 20 nous lavons vu suffisent
rarement pour mener agrave bien une collecte dinformation Certes les bookmarks
sociaux apportent un contenu seacutelectionneacute par linternaute mais on ne peut se
deacutepartir des moteurs de recherche web classiques La surveillance des flux RSS
permet decirctre alerteacute sur de nombreux sujets mais la majoriteacute des sites web restent
encore deacutepourvus de ces fils Les tags apportent une veacuteritable souplesse agrave
lutilisateur mais la taxonomie des bibliothegraveques ou des reacutepertoires web- pour ne
citer que ces lieux- reste essentielle pour se repeacuterer agrave travers des milliers de
ressources
Le Web 20 pour la recherche et la veille nen est quagrave ses balbutiements Aussi
avant quil ne digegravere complegravetement par enrichissement les ressources et les
applications Web 10 il convient de faire coexister ces 2 web dans les pratiques
Le Web 20 apporte une richesse essentielle lrsquoexpression drsquoindividus porteurs
drsquoideacutees et de faculteacutes susceptibles drsquoapporter des changements de re-questionner
lrsquoordre eacutetabli eacuteleacutements indispensables agrave lrsquoeacutevolution de la culture agrave condition de ne
pas oublier que des volonteacutes ambitieuses doivent intervenir pour canaliser les
initiatives sans les eacutetouffer et leur insuffler une veacuteritable ambition Voilagrave tout
lenjeuhellip
copy Digimind Digimind Services ndash White Paper |95
Le Web 20 pour la veille et recherche dinformation DIGIMIND
A propos des auteurs DIGIMIND SERVICES
Digimind Services accompagne les plus grandes entreprises pour la conception la
mise en œuvre et le deacuteploiement de projets de veille qui reposent sur la solution
Digimind Evolution apportant agrave ses clients un retour sur investissement de plus de
600 et ce degraves la premiegravere anneacutee Les meacutethodologies proprieacutetaires du
deacutepartement conseil ainsi que son expertise des probleacutematiques et sources
drsquoinformations sur plus de 20 secteurs drsquoactiviteacute deacuteveloppeacutee aupregraves de ses clients
depuis de nombreuses anneacutees permet aux entreprises drsquoanticiper les changements
de leur environnement pour prendre les meilleures deacutecisions sur leur marcheacute
Le conseil Digimind porte sur tous les aspects du workflow de veille ciblage
strateacutegique collecte des informations traitement et analyse exploitation et
diffusion gestion de projet conseil organisationnel et gestion du changement
formations et support fonctionnel et technique
CHRISTOPHE ASSELIN
Issu drsquoun cabinet drsquoeacutetudes de marcheacute B2B et speacutecialiseacute depuis 1997 dans la mise en
place de systegravemes de veille (e-Franceorg Ecole Militaire) Christophe Asselin allie
une connaissance approfondie des secteurs eacuteconomiques et une parfaite maicirctrise
des outils de recherche sur internet et des solutions avanceacutees de veille Expert
reconnu il eacutedite le site httpwwwintelligence-centercom et le blog
httpinfluxjouebcom tout deux consacreacutes agrave la recherche dinformation
Speacutecialiste de la veille internet chez Digimind il accompagne les clients dans la mise
en place de leur dispositif de veille (expression des besoins deacutefinition de plans de
veille sourcing architecture parameacutetrage formation accompagnement) Il
intervient ainsi aupregraves de socieacuteteacutes dans diffeacuterents secteurs les teacuteleacutecoms avec
France Telecom RampD lrsquoindustrie pharmaceutique avec Sanofi Aventis Roche
Pharma Expanscience ainsi quAlstom Transport Veolia Environnement et des
reacutefeacuterences confidentielles dans le secteur des biotechnologies de leacutenergie des
teacuteleacutecoms de limprimerie de la deacutefense du conseilhellip
copy Digimind Digimind Services ndash White Paper |96
Le Web 20 pour la veille et recherche dinformation DIGIMIND
[Merci au Service Marketing agrave Malaiac wwwmalaiacnet et agrave Elsa Bonier eacutetudiante
en Master 2 Management des innovations en communication agrave Paris XIII pour leur
fructueuse collaboration]
VERONIQUE MESGUICH
Apregraves avoir fondeacute et co-dirigeacute pendant six ans un cabinet speacutecialiseacute en veille
technologique Veacuteronique Mesguich dirige lrsquoInfothegraveque du Pocircle Universitaire
Leacuteonard de Vinci Elle enseigne eacutegalement la maicirctrise de linformation strateacutegique
dans plusieurs eacutetablissements denseignement supeacuterieur et anime reacuteguliegraverement
des sessions de formation continue autour de la meacutethodologie de recherche
avanceacutee et de veille sur Internet
Veacuteronique Mesguich est lrsquoauteur avec Armelle Thomas de lrsquoouvrage Net
recherche le guide pour trouver lrsquoinformation utile dont la deuxiegraveme eacutedition est
parue en mars 2007 aux eacuteditions de lrsquoADBS
copy Digimind Digimind Services ndash White Paper |97
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Webographie Bibliographie
Sources dinformation sur le Web 20
Sites web wikis et blogs
Reacutepertoires et classement de services et socieacuteteacutes Web 20 - 20 Websites http20websitescom - Web 20 Magazine Top 100 Web 20 Sites httpweb2magazineblogspotcom200701thanks-for-web-2html - Web 20 Magazine The Best Web 20 Software of 2006 httpweb2socialcomputingmagazinecomthe_best_web_20_software_of_2006htm - Complete List of Web 20 Products and Services httpwwwlistiblecomlistcomplete-list-of-web-2-0-products-and-services - The Complete Web 20 Directory httpwwwgo2web20net - FredCavazzanet le meilleur du Web 20 httpwwwfredcavazzanetindexphp20051212986-le-meilleur-du-web-20 - Web 20 Directory 1200+ Web 20 Sites in 50+ categories httpweb2econsultantcomindexhtml
- Top 25 Web 20 Search Engines httpoedborglibraryfeaturestop-25-web20-search-engines
- 25 start-ups Web 20 prometteuses httpmoneycnncom20070221magazinesbusiness2nextnet_introbiz2
copy Digimind Digimind Services ndash White Paper |98
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Blogs et sites speacutecialiseacutes - Le groupe de travail Web20 francophone httpwwwweb20workgroupfr
- Web 20 Work Group httpweb20workgroupcom - Dessine-moi le Web 20 httpwwwdeuxzerocom - FredCavazzanet httpwwwfredcavazzanet
- TechCrunch en franccedilais httpfrtechcrunchcom - TechCrunch httpwwwtechcrunchcom
- Le web 20 cest pas du buzz httpweb2rulesblogspotcom
- Mashable France httpfrmashablecom - Mashable httpmashablecom - AccessoWeb httpblogaccessowebinfo - Web 20 Magazine httpweb2magazineblogspotcom - Reacutevolution Web 20 en Live httpwwwwebdeuxinfo
- ReadWriteWeb httpwwwreadwritewebcom - Web 20 Innovations httpweb2innovationscom - Web 20 Summit httpwwwweb2concom
- Original Signal (agreacutegateur de flux RSS) httpwwworiginalsignalfr - Whats Web 20 (agreacutegateur de flux RSS) httpwwwwhatsweb20comaggregatorfrom=100
- Le blog de Bloxx Communiquons avec le Web 20 httpblogbloxxfr
copy Digimind Digimind Services ndash White Paper |99
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- FrenchWeborg Le blog des professionnels franccedilais du Web 20 httpwwwfrenchweborg
- Blog Web 20 et Marketing httpwwwvincentabrycom - Le Web 20 en Action httpleweb2blogspotcom - aYsoon 20 httpblogaysooncom Emmanuel de Taillac httpemmanueldetaillacfr - NiouMedia httpnioumediacom - 2803 httpwww2803com - Web 2 francophone (Wiki) httpweb2frcomAccueil
Blogs et sites avec un axe Web 20
- Publishing 20 httppublishing2com - Social-Computing httpwwwsocial-computingcom - Ecosphere httpecospherewordpresscom - inFLUX httpinfluxjouebcom - Benoit Descary httpdescarycom - Jean Michel Billaut httpbillauttypepadcomjm - Blog francophone des TIC httpwww2607fr 20Minutes Top 50 tech et meacutedias httpwww20minutesfrarticle15087620070410-Blogs-Top-50-tech-et-mediaphp - Intruderstv httpnewintruderstvintruders_fr
copy Digimind Digimind Services ndash White Paper |100
Le Web 20 pour la veille et recherche dinformation DIGIMIND
- Jeff Clavier Sans Accent httpsansaccentsofttechvccom - Demain tous journalistes httpbenoit-raphaelblogspotcom
- Collectif louvre-boicircte Initiatives sur le partage dinformation httplouvre-boiteviablogacom
- Zero seconde httpzerosecondeblogspotcom
Articles
Introduction au Web 20
- Web 20 lrsquoarticle de OrsquoReilly reacutesumeacute pour les faineacuteantshellip httpwwwexpressionsbe20051101web-20-resume-pour-les-faineants
- Dossiers Web 20 - Journal Du net httpwwwjournaldunetcomdossiersweb20
- Avis des managers le Web 20 agrave la loupe httpwwwjournaldunetcomsolutions0603diaporamaavis-managers-web21shtml
- Les entreprises face aux deacutefis du Web 20 httpwwwjournaldunetcomsolutions0704070413-entreprises-web-201shtml
-The Machine is Using Us Transcription (videacuteo) httpmediatedculturesnetksudiggp=78
- The New Wisdom of the Web httpwwwmsnbcmsncomid12015774sitenewsweek
- Quest-ce que Web 20 httpwww01netcomarticle294819html
- Approaching a definition of Web 20 httpsocialsoftwareweblogsinccom20050929approaching-a-definition-of-web-2-0
- Fonctionnement de lrsquoentreprise classique vs entreprise 20 httpalbancornilletfreefrakwindexphp20061002fonctionnement-de-lentreprise-classique-vs-entreprise-20
- Meacutedias traditionnels et acteurs du Web 20 vers la cohabitation ou la convergence des acteurs de lrsquoinformation et du divertissement httpwwwscribdcomdoc50818These-sur-le-Web-2-Cabanis
copy Digimind Digimind Services ndash White Paper |101
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Ajax
- LAjax en 5 questions httpwwwjournaldunetcomsolutions0602060208_qr-ajaxshtml - Ajax et Moteurs 20 httpwwwmoteurzinecomarchives2006moteurzine127html2
Les Mashups
- Les Mashups applications Web composites tregraves Web 20 httpwwwjournaldunetcomsolutions0606060628-qr-mashup-hybrideshtml
- Le modegravele eacuteconomique des Mashups httpwwwinternetactunetp=6285 Bookmarks sociaux Social search
- Le Social Bookmarking au secours de la pertinence de la recherche drsquoinformation httpwwwgillesbalmissecomv2spipphparticle171 - Whats the Big Deal With Social Search httpsearchenginewatchcomshowPagehtmlpage=3623153
- Whos Who in Social Search httpsearchenginewatchcomshowPagehtmlpage=3623173
Ouvrages
- Web 20 - Les internautes au pouvoir - Jean-Franccedilois Gervais httpwwwdunodcompagesouvragesficheouvrageaspid=50701
- Les reacuteseaux sociaux Pivot de lrsquointernet 20 - Alain Lefebvre httpwwwcluster21comfrbookreviewlivre_les_reseaux_sociaux - Web 20 (R)eacutevolutions et nouveaux services dInternet - Jean-Noeumll Anderruthy httpwwwamazonfrWeb-2-0-C3A9volutions-nouveaux-dInternetdp2746034972ref=sr_1_18402-7140143-8118507ie=UTF8amps=booksampqid=1178118687ampsr=8-18 - Web 20 The Future of the Internet and Technology Economy and How Entrepreneurs Investors Executives amp Consumers Can Take Ad httpwwwamazoncomWeb-2-0-Technology-Entrepreneurs-Execenablersdp1587622009ref=sr_1_6103-0331542-4028646ie=UTF8amps=booksampqid=1178118732ampsr=1-6
- La Longue Traicircne La nouvelle eacuteconomie est lagrave - Chris Anderson httpwwwamazonfrLongue-TraC3AEne-nouvelle-C3A9conomie-
copy Digimind Digimind Services ndash White Paper |102
Le Web 20 pour la veille et recherche dinformation DIGIMIND
estdp2744062693ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180542516ampsr=1-1 - The Geospatial Web How Geobrowsers Social Software and the Web 20 are Shaping the Network Society httpwwwamazoncomGeospatial-Web-Geobrowsers-Information-Processingdp1846288266ref=sr_1_28103-0331542-4028646ie=UTF8amps=booksampqid=1178118760ampsr=1-28 - Les Wikis espaces de lintelligence collective - Jeacuterocircme Delacroix httpwwwamazonfrWikis-JC3A9rC3B4me-Delacroixdp2952051445ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180544723ampsr=8-1 - Pro Web 20 Mashups Remixing Data and Web Services httpwwwamazonfrPro-Web-2-0-Mashups-Remixingdp159059858Xref=sr_1_4403-1740173-8750801ie=UTF8amps=english-booksampqid=1180542751ampsr=8-4 - Web 20 et Web avanceacute - Alexandre Boni Nicolas Stemart httpwwwamazonfrWeb-2-0-avancC3A9-Alexandre-Bonidp2742967281
copy Digimind Digimind Services ndash White Paper |103
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Dans la mecircme collection
White Paper Blogs et RSS des outils pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind
White Paper
Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind
White Paper
Cateacutegorisation automatique de textes
White Paper
Benchmark des solutions de veille strateacutegique
White Paper
Evaluer le Retour sur Investissement dun logiciel de veille Edouard Fillias Consultant Veille Strateacutegique Digimind
gt A teacuteleacutecharger sur httpwwwdigimindfrserviceswhite_paperhtm
copy Digimind Digimind Services ndash White Paper |104
Le Web 20 pour la veille et recherche dinformation DIGIMIND
Notes 1 httpwwwguimfrblog200612le_film_autumn_html httpwwwlemondefrwebarticle01-02-65186536-8751060html 2 httpvideogooglefrvideoplaydocid=724218352255575783 3 Map of online communities par Randall Munroe httpwwwxkcdcomc256html 4 httpwwwdeuxzerocom 5 httpwwwpaulgrahamcombiohtml httpfrwikipediaorgwikiPaul_Graham 6 Qursquoest ce que le web 20 Hubert Guillaud Internet Actu 29 mai 2005 httpwwwinternetactunetp=6144 7 httpwwworeillynetcompubaoreillytimnews20050930what-is-web-20html httpweb2rulesblogspotcom200601what-is-web-20-par-tim-oreilly-versionhtml 8 httpwwwzdnetfractualitesinternet0390207743933447900htm 9 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 10 httpwwwinternetactunetp=7035 11 httpwwwhitwisecomdatacenter 12 httprosstypepadcomblog200604power_law_of_pahtml 13 httpblogsforrestercomcharleneli200704forresters_new_html 14 httpwwwtagcrowdcom 15 You Say You Want a Web Revolution httpwwwwiredcomsciencediscoveriesnews20050868403 16 httpsaddonsmozillaorgfrfirefoxaddon748 httpwwwjournaldunetcomdeveloppeurtutorielout050525-greasemonkey-presentationshtml 17 Mashups Google Maps httpwwwmibazaarcomextrasfortune100html httpwwwweatherbonkcomweatherindexjsp httpgmapstommanganusspacecraft_trackinghtml 18 httpwwwgooglecomcalendar 19 httpdocsgooglecom 20 httpwwwmoovementfr 21 httpwwwcooptincomfrWEBhomeaspx httpwwwjobmeeterscomfraccueilindexphp 22 httpwwwzliocom httpshoppingyahoocomshoposphere
copy Digimind Digimind Services ndash White Paper |105
Le Web 20 pour la veille et recherche dinformation DIGIMIND
23 httpwwwciaofr httpwwwwantunocom 24 httpmapsgooglefr httpwwwgeoportailfr httpearthgooglefr httpmapsyahoocom httpwwwflickrcom httpwwwzdnetfractualitesinternet0390207743936635400htm 25 httpwwwcriteocom 26 From Youtube to Youniversities Henry Jenkins 16 feacutevrier 2007 httpwwwhenryjenkinsorg200702from_youtube_to_youniversityhtml 27 httpaffordancetypepadcom 28 httpwwwplosoneorghomeaction 29 Web collaboratif web coopeacuteratif web 20 quelles interrogations pour lrsquoenseignant documentaliste Marie France Blanquet 12 janvier 2007 httpeprofsdocscrdp-aix-marseillefrIMGrtfintervention-MF-Blanquetrtf 30 httpveillepedagogiquebloglemondefr 31 httpbibliobsessionfreefrdotclear 32 httpliblogsalbanyedulibrary20200611a_librarians_20_manifestohtml 33 httpdelicious 34 httpwwwconnoteaorg httpwwwciteulikeorg httpwwwsnipitroncom 35 httpdelicious httpwwwblinklistcom httpblogmarksnet httpwwwfurlnet httpfrbetabookmarksyahoocom httpmyweb2searchyahoocom 36 httpwwwstumbleuponcom httpsimilicious httpwwwyoonocomindexjsp 37 Social bookmarks charts version 35 httpwwwiroxdefile_download3 httpwwwroxomaticde856 Social Bookmarking Services And Tools The Wisdom Of Crowds That Organizes The Web httpwwwmasternewmediaorgnews20061201social_bookmarking_services_and_toolshtm Free Bookmark Managers
copy Digimind Digimind Services ndash White Paper |106
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwfeedbuscombookmarks 38 httpwwwflickrcom 39 httpwwwflickrcomgroupstehipool 40 httpwwwflickrcomphotostagsnorthamericaninternationalautoshow 41 httpphotobucketcom 42 httpwwwsquidoocom 43 httpwwwsquidoocomnanotechRev 44 httpwwwsquidoocomtagsmarketing 45 httpwwwyoutubecom 46 httpwwwdailymotioncom 47 Une seacutelection de moteurs de recherche videacuteo et de services de partage et teacuteleacutechargement de videacuteos httpcasselinfreefrfrenchvideoshtm 48 httpwwwemarketercomArticleaspxid=1004918 49 httpwwwviadeocom 50 httpwwwlinkedincom 51 httpwww6nergiesnet httpwwwxingcom 52 httpwwwfacebookcom 53 httpenwikipediaorgwikiList_of_social_networking_sites 54 httpwwwlinknrankcombusinessphp 55 httpdiggcom 56 httpwwwnuouzcom httpwwwblogmemescom httpwwwscoopeocom httpwwwfuzzfr httpwwwtapemoicom httpmeneamenet httpwwwrojocom httpwwwbetanetscapecom 57 httpwwwwikiofr 58 httpwwwagoravoxfr 59 Carlo Revelli Joeumll de Rosnay httpfrwikipediaorgwikiCarlo_Revelli httpfrwikipediaorgwikiJoC3ABl_de_Rosnay 60 Agoravox politique eacuteditoriale httpwwwagoravoxfrarticlephp3id_article=60 61 httpwwwreadspeakercom 62 httpenglishohmynewscom
copy Digimind Digimind Services ndash White Paper |107
Le Web 20 pour la veille et recherche dinformation DIGIMIND
63 State of the Blogosphere- avril 2007 httpwwwsifrycomalertsarchives000493html 64 Les blogs dans le monde Estimation agrave partir des chiffres produits par Digimind Blog Herald Technorati PewInternet Meacutediameacutetrie Loiumlc le Meur Live Journal Skyblogs Overblogs Terra MSN Spaces Splinder Excite Bloggersit Timblog W3B Skynet Bloghr Overskriftdk Smartlog onetpl Tenbit mylogpl eblogpl Blogpl Blogipl blogcentralis Romandiefr Blogspot timsoftro Globocom Financial Express Prixadi blog Baidu Yahoo Blogs South Korea Planet Weblog Service Cyworld LAtelier et ZDNet Australia 65 httpwwwnaturecomwebfeedsindexhtml httpwwwsciencemagorgrss 66 httpsearchlivecom 67 httpsearchyahoocom 68 httpnewsgooglefr httpfrnewsyahooco httpfrnewsbotmsncom httpwwwtopixnet httpwwwwikiofr 69 httpgroupsgooglefrgrouprectraveleuropefeedshl=fr 70 httpwwwforummobilescomindexphpshowforum=200 71 httpfrgroupsyahoocom 72 httpfrmyweb2searchyahoocom httpblogmarksnet httpdelicious 73 httpwwwflickrcom httpphotobucketcom 74 httpwwwyoutubecom httpwwwdailymotioncomfr 75 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 76 httpblogsearchgooglefr httpfraskcomsubjectbls|pg1 httpwwwfeedstercom httpwwwblogpulsecom httpwwwtechnoraticom httpwwwspherecom 77 httpwwwsifrycomalertsarchives000493html 78 httpfrsearchyahoocomwebadvancedei=UTF-8ampybs=0 httpwwwexaleadfrsearchresultsq=sarkozyamp24mode=allweb 79 httpwwwblogaramacom httpwwwrss-networkcom
copy Digimind Digimind Services ndash White Paper |108
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwrssfeedscom 80 httpwww43thingscom http36trucscom 81 httptrainquecomcodedelicious_lookupphp 82 httptechnoraticomtag 83 httpwwwsearchlescom 84 httptagcentralnet httpwwwkeotagcom httpwwwthagoocom httpwwwzewolnet httpwwwgnoshorg 85 httpwwwzibbcom 86 httpwwwecransfr 87 Google Tag Cloud Maker httpuserscriptsorgscriptsshow6171 88 httpnewzingocom 89 Folksonomies les usagers indexent le web Olivier le Deuff Bulletin des Bibliothegraveques de France ndeg4 2006 90 Folksonomy les tags en deacutelire Cyril Fieacutevet Internetactu 13 octobre 2005 httpwwwinternetactunetp=6166 91 httpwwwzoominfocom 92 httpwwwzikicom 93 httpwwwyonamecom httpwwwstalkeraticom httpwinkcom 94 httpfranswersyahoocom httpanswersyahoocom httpaskyahoocom 95 httpanswersgooglecomanswers 96 httpiqlycosfr httpqnalivecombetaaspx 97 httpwwwexpertscomdirectoryasp 98 httpsearchwikiacomwikiSearch_Wikia 99 httpdeciphocom 100 httpwwwyoonocom 101 httpwwwfooxxcom
copy Digimind Digimind Services ndash White Paper |109
Le Web 20 pour la veille et recherche dinformation DIGIMIND
httpwwwwebzzlecom 102 httpinfluxjouebcomnewspowerset-et-xerox-parc-s-attaquent-a-google-naturellement 103 httpwwwmedglecom httpwwwmedwormcom httpwwwmedstorycom httpwwwsearchmedicacouk 104 httpwwwrollyocom httpswickihomeeurekstercom httpgooglecomcoopcseoverview httpbuildersearchyahoocom 105 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 106 Le web invisible (deep web hidden web) deacutesigne la partie du web non accessible aux moteurs de recherche classiques Le web invisible comprend des bases banques de donneacutees et bibliothegraveques en ligne gratuites ou payantesIl est constitueacute de pages web mal ou non indexeacutees par les moteurs Pour plus de preacutecisions voir le White Paper Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique httpwwwdigimindfrserviceswhite_paperhtm 107 httpwwwthelancetcom 108 httpwwwdigimindfrproduitsfinderhtm 109 httpwwwncbinlmnihgoventrezqueryfcgiCMD=searchampDB=pubmed 110 httppminlmnihgovinteractindexphptop httpwwwhubmedorg 111 httpwwwusptogovpatftindexhtml httpwwwwashingtonpostcomwp-dyncontentarticle20070304AR2007030401263html 112 httpwwwgooglecomhistory 113 httpwwwgooglecomhistorytrends httpwwwgooglecomhistoryitems 114 httpfrwikipediaorgwikiApplication_composite 115 httpwwwmibazaarcomextrasfortune100html 116 httptagmapsresearchyahoocomworldexplorerphp 117 httpflickrvisioncom 118 httpgmapstommanganusspacecraft_trackinghtml 119 httpwwwhealthmaporg httpwwwbrevardbiodieselorgmapbdhtml httpkartametroinfokartadefaultaspxhl=EN httpwwwwikimapiaorg httpwwwglobalincidentmapcomhomephp httpdartmapsmackerscom
copy Digimind Digimind Services ndash White Paper |110
Le Web 20 pour la veille et recherche dinformation DIGIMIND
120 httpwwwtagurlscom 121 httpwwwthemolucom httpwwwgnoshorg 122 httpwwwwebmashupcom httpwwwprogrammablewebcommashupsdirectory httpmashupfeedcom 123 httpgooglemapsmaniablogspotcom 124 httplocalalkemiscom 125 httpwwwvoxcom httpwwwover-blogcom httpwwwblogspiritcomfrindexphp httpwwwtypepadcom httpswwwbloggercomstart httpviablogacom httpwwwhautetfortcom 126 httpcasselinfreefrfrenchweblogshtmoutils 127 httpwwwclubiccomarticle-67515-8-comparatif-plateformes-blogshtml httpwwwojrorgojrimagesblog_software_comparisoncfm 128 httpwwwfeedburnercomfbahome 129 httppagesgooglecom 130 httpwwwdigimindfrserviceswhite_paperhtm 131 httpfrwikipediaorgwikiAccueil 132 httpblogouter-courtcomarchive2006-12-05-n22html 133 httpwwwnaturecomnews2005051212full438900ahtml httpwwwnaturecomnaturebritannicaindexhtml httpwwwnaturecomnews2005051212multimedia438900a_m1html 134 httpwwwwikiseekcom 135 httpwwwexaleadfr 136 httpwwwwikimindmaporg 137 httpencitizendiumorgwikiMain_Page 138 httpwwwalacrawikicom 139 httpceclinesxwikicomxwikibinviewMainFils+RSS 140 httpwwwwikidwebcom 141 httpwwwoperacom httpwwwmaxthoncom httpwwwmicrosoftcomfrancewindowsie httpwwwmozilla-europeorgfrproductsfirefox
copy Digimind Digimind Services ndash White Paper |111
Le Web 20 pour la veille et recherche dinformation DIGIMIND
142 httpfrtechcrunchcom20060401analysons-les-lecteurs-rss-en-ligne httpvtechcanalblogcomarchives20051025927489html httpvtechcanalblogcomarchives20050905780635html httpallrsscomrssreadershtml 143 httpinfluxjouebcomnewsles-pages-personnalisables-bookmark-n-1 httpwwwinformationoverlordcouk200603where-to-start-in-search-of-ideal_26 144 httpwwwdigimindfrproduitsindexhtm 145 httpshareopmlorg 146 httpwwwquechoisirorgArticlejspid=RessourcesArticlesEF33CF34D5616AF2C125720D0050E701ampcatcss=TEL000 147 httpweblogshitwisecombill-tancer 148 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 149 httpwwwbusinessweekcominnovateNussbaumOnDesignarchives200704are_most_web_20html 150 httpblogsforrestercomcharleneli200704forresters_new_html httprosstypepadcomblog200604power_law_of_pahtml 151 httpwwwobservatoire-omicorgcolloque-icicpdfBarbe3_1pdf 152 httpwwwaaronswcomweblogwhowriteswikipedia 153 httpaphgcaenfreefrchronique393aphg393htm 154 httpfrwikipediaorgwikiDroits_de_l27homme_en_Iran 155 httpfrwikipediaorgwikiWikipC3A9diaArticles_de_qualitC3A9 156 httpenwikipediaorgwikiJohn_Seigenthaler_Sr_Wikipedia_biography_controversy 157 httppewresearchorgpubs71riding-the-waves-of-web-20 158 httptallblogcontedoxacukwp-contentuploads200703survey-summarypdf 159 httpwwwcafepresscomnerdwideweb 160 httpwwwecransfrspipphprubrique30 161 httpfrcreativecommonsorg 162 httpwwwzdnetfractualitesinternet0390207743933447900htm 163 httpwebsemantiqueorgPagePrincipale httpwwww3orgDesignIssuesSemantichtml httpwwww3org2002Talks1213-lpslide1-0html 164 httpwwwinternetactunetp=6902
copy Digimind Digimind Services ndash White Paper |112
- Digimind Services
- Christophe ASSELIN
- Veronique MESGUICH
-
top related