initiation à la recherche documentaire biologie - niveau ... · zp=zip/postal code il existe 13...
TRANSCRIPT
Initiation à la recherche documentaire
biologie - niveau master
BIBLIOTHEQUE INTERUNIVERSITAIRE SCIENTIFIQUE JUSSIEU
Pour se connecter : à partir de Google « BIUSJ biologie recherche »Ou directement à :
http://bibliotheque.snv.jussieu.fr/
La BIUSJ PUBMED
Chapitre 1
Interroger PUBMED
– via MEDLINEMEDical Literature Analysis and Retrieval
System on LINE
Qu’est ce qu’une base de données ?
• 1.Information validée du point de vue scientifique
• 2.Information indexée = interrogation efficace…… qui suppose l’utilisation d’un vocabulaire particulier
• 3.Pas d’accès systématique au texte intégral (il faut être abonné si c’est un titre payant)
Différence entre une recherche GOOGLE et une recherche sur
une base de données ?L’exemple du résultat n°1
Terme de recherche : « mitochondrie »
GOOGLE « ramène » l’article de l’encyclopédie coopérative
Wipikedia, C’est une encyclopédie …
où chaque visiteur peut ajouter du texte Et modifier l’information
contenue dans les articles !!!
PUBMED vous propose de remplacer le terme Français « mitochondrie » par
« mitochondria »Et vous ramène le résumé d’un ouvrage
à paraître aux Presses de la Brighton and Sussex Medical School, (University of Sussex)
BIOLOGICAL ABSTRACTNe vous propose pas de remplacer
Le terme en français par un terme en anglais et vous donne 2 réponses
Le 1er résultat est un art. de la revue de Biologie-clinique
« Mecanismes proapoptotiques des agents anticancereux: La mitochondrie,une cible Pharmacologique potentielle ? »
Le langage Medline : les mots MESH
• Définition : Medical Subject Headings = mot définissant un sujet / une matière médical(e) à l’exclusion de tout autre synonyme
• Pour 1 concept, il n’existe donc qu’un seul mot, écrit sous une seule forme. On parle de VOCABULAIRE CONTROLE
• Ex : « ribonucleic acids » = INCONNU• En vocabulaire MESH : seul « RNA » ou
« ribonucleic acid » [AU SINGULIER] sont reconnus
Accéder au dictionnaire des mots MeSH
(The MeSH Database)
Une base de données fonctionne donc avec un
vocabulaire contrôlé.Pour Medline, il s’agitdu vocabulaire MeSH
La liste des mots MeSH est accessible dans le dictionnaire en ligne
« MeSH Database »« MeSH »
« Navigate from tree top »« MeSH Browser »
Les 15 branches principales de l’arborescence MeSH
Tous les articles contenus dans PUBMED se rattachent à l’une des 15 branches principales : anatomy, organisms, disease, chemicals and drugs, etc.
Chaque branche est identifiée par une lettre : A pour anatomy, B pour organisms, C pour diseaseChaque branche se subdivise en branches secondaires
identifiées par la lettre de la branche principale + 1 chiffre Ex/ « A » pour la branche ppale « Anatomy » - « A 10 » pour « Anatomy --- Tissues »
Recherchez le terme SIDA dans MeSH Database
• 1ère étape : traduire= chercher « AIDS » ou « Acquired Immunodeficiency Syndrome » ou encore « HIV »
• 2ème étape : parcourir l’arborescence• Résultat : Branche principale DISEASE [C]• Immune System Diseases [C20]• Immunologic Deficiency Syndromes [C20.673]• Agammaglobulinemia [C20.673.088]• […..]• HIV Infections [C20.673.480]• Acquired Immunodeficiency Syndrome [C20.673.480.040]• AIDS-Associated Nephropathy [C20.673.480.050]• AIDS Arteritis, Central Nervous System • […]
Limiter sa recherche : 1. les limitations « habituelles »
• Utiliser un critère proposé par l’onglet limits)
• Jouer sur la différence entre les mots MeSH majeurs et les autres : mettre la mention [MAJR] après le mot permet de réduire le nombre de résultats.
Limiter sa recherche : 2. la notion d’explosion
• Définition = PAR DEFAUT, PUBMED vous ramène l’ensemble des résultats inclus dans le terme que vous entrez dans la fenêtre de recherche
• Autrement dit, l’explosion par défaut permet d’avoir tous les résultats rattachés à toutes branches de l’arborescence
• Pour éviter l’explosion, taper [mh:noexp] ou [majr:noexp] selon que le mot MeSH est majeur ou pas
• Revenons sur l’exemple du SIDA : le nombre de résultats va en décroissant selon que l’on tape…
• AIDS > AIDS [MH:NOEXP] > AIDS [MAJR:NOEXP]
Limiter sa recherche : 3. Qualifier un terme
• Il existe 80 qualificateurs, utilisables pour définir certains aspects de votre sujet (ex. Aspect chimique, Aspect microbiologique, Aspect radiographique).
• En fonction du terme, vous avez un nombre déterminé de qualificateurs attachés. Par exemple : Nucleoprotein peut être qualifié par 25 termes alors que Lung neoplasm peut l’être par + de 45 termes
• Procédure : Aller dans MeSH database [cette fois, à partir de l’écran d’accueil de Pubmed]
• Une fois le mot MeSH obtenu, on choisit un qualificateur et on envoie dans la fenêtre de recherche : « Send to – Search Box with and » OU « Send to –Search Box with OR », etc.
Sauvegarder les résultats :utiliser le bloque-notes (clipboard)
• Sélectionner une référence et faire
« Send to ---CLIPBOARD »
• La référence stockée dans le CLIPBOARD s’affiche en vert
• Les résultats sont conservés 8 h 00
Sauvegarder les équations de recherche : utiliser Cubby
• 1. S’enregistrer dans NCBI Cubby (en créant un compte)
• 2. Cliquer sur SAVE SEARCH
2. Une fois que le compte a été créé dans Cubby,
cliquer sur SAVE SEARCH
1. Création d’un compte dans NCBI Cubby
Envoi automatique (courriel) des nouveaux résultats
• Une fois sauvegardée votre stratégie de recherche, vous pouvez, dans votre compte NCBI –Cubby, paramétrer l’envoi régulier de nouvelles références
Chapitre 2
Le WEB OF SCIENCES©
- Produit du WEB OF KWNOLEDGE©
Le Web of Knowledge • Web of science ©Propriétaire : I.S.I, Institute for Scientific Information Corpus : Indexe 8 700 journaux Contenu : Multidisciplinaire, sciences & techniquesRemonte à : 1994
• Inspec ©Propriétaire : I.E.F. Institution for Electrical EngineersCorpus : 8 millions de références, + 350 000 références / chaque année, dont 2 000
conférencesContenu : Physique, électronique, informatique, sciences de l'informationRemonte à : 1969 (archives bientôt achetées par la BIUSJ)
• J.C.R. ©Propriétaire : I.S.I.Contenu : Statistiques de citation et facteurs d’impact des principales revues en science
Corpus : 7000 revues les plus citées au monde (nombreuses revues françaises absentes)Remonte à : le FI (Facteur d’Impact) d’une revue est publié en juin de l’année n+1On dispose des FI depuis 2002
Une logique différente de celle de PUBMED
• Une « superbase » de données Web of sciences, J.C.R. et Inspect sont liés entre eux
Des liens sont faits vers les abonnements @ de la Bibliothèque Interuniversitaire Jussieu
• Pas de vocabulaire contrôléRecherche moins efficace que dans une base de type PUBMED : il faut chercher plusieurs
termes différents
• L’indexation par la citationUn taux de citation (times cited) est attribué à chaque article
« Times cited : 3 »
Rechercher :1. Par défaut ou avec un seul champ
• Par défaut, une la recherche s’effectue sur le SUJET (TOPIC)
• En recherche avancée, en choisissant un autre champ (FIELD TAG) que le sujet…
TS=TopicTI=TitleAU=AuthorGP=Group AuthorSO=SourceAD=AddressOG=OrganizationSG=SuborganizationSA=Street AddressCI=CityPS=Province/StateCU=CountryZP=Zip/Postal Code
Il existe 13 champs interrogeables.
La syntaxe d’interrogation est la suivante : « XX= »
Rechercher : 2. En partant d’un index
• Index auteursTaper nom de famille + INITIALE prénom
Pour les noms composés / avec article (ex/ DE FROMONT) il faut
interroger de deux manières : en attachant et en détachant le « DE »
• Index groupes d’auteurs
• Index des titres
Rechercher : 3. En utilisant les opérateurs
(BOLEANS) Les OPERATEURS BOLEENS permettent de construire une
équation de recherche
Ils fonctionnent selon un ORDRE DE PRIORITE : ( ) [termes inclus]
SAME [termes dans une même phrase / titre]
NOT
AND
OR
Que va-t-on trouver ?
« ASPIRIN SAME CHILD NOT LIVER »
Réponse : (ASPIRIN SAME CHILD) NOT LIVER 2 ou 3 résultats (Tous les articles dont le titre comporte les mots ASPIRIN et CHILD mais
ne comporte pas le mot LIVER
« ASPIRIN NOT CHILD SAME LIVER »
Réponse : ASPIRINE NOT (CHILD SAME LIVER)+ de 5 000 résultats (tous les art. sur l’aspirine – à l’exception de ceux dont le titre comporte
les mots CHILD et LIVER
Construire une équation
____________Il suffit de combiner : ___________
1.les OPERATEURS ( ) / SAME / NOT / AND / OR
2.les FIELD TAGS TS=Topic, TI=Title, AU=Author, GP=Group Author, SO=Source …
3. les TRONCATURES
$ = remplacer 0 ou 1 caractère
* = remplacer 1 ou plusieurs caractères
Limiter une recherche : Les méthodes disponibles
1. La 1ère étape consiste donc à construire une équation [diapo. précédente]
2. Avant de lancer sa recherche on peut restreindre par langue et / ou par type de document
« Restrict search by languages and document types »
Remarque : limiter au français n’a aucun sens…
Elargir une recherche : Les troncatures
? 1 caractère seulement
* 0 ou plusieurs caractères
$ 1 ou 0 caractères
Gene* >>> Genes, General, Generation
Dosto?evsk* >>> Dostoyevsky, Dostoievskii
Classer les résultats
• Par date (classement par défaut)
• Par nombre de fois où le doc. a été cité dans la base Web of Sciences « Times cited »
• Par le nom du périodique
Accéder au texte intégral
• Les liens sont faits vers les abonnements payés par la BIUS Jussieu
= plusieurs 100aines de revues publiées chez Elsevier, Springer, etc…
• Liens vers des revues en libre-accès = en avril 2004, 240 revues
Sauvegarder
• S’enregistrer sur la page d’accueil du Webof Science « Sign in or register »
Il est possible de créer une
Veille automatique :
vous recevrez par courriel
les nouvelles référence
correspondant à votre requête
(Mise à jour hebdomadaire)
Repérer les références bibliographiques
en amont et en aval
Document principal
Citing references
References cited
Chapitre 3
BIOLOGICAL
ABSTRACTS©
de THOMPSON BIOSIS©
Fiche d’identité des BIOLOGICAL ABSTRACTS
• Propriétaire : Biosis (branche de Thompson) qui produit aussi les ZOOLOGICAL ABSTRACTS
• Contenu : 6500 titres indexés = 3 millions de référencesToutes disciplines en sciences de la vie :
BiochimieBiologie moléculaire et cellulaire BiophysiqueBiomédecine et médecine expérimentaleAnatomieBactériologieCancérologieGénétiqueImmunologieMicrobiologie
• Remonte à 1985• Actualisé tous les trimestres (365 000 nouvelles références / an)
Neurosciences NutritionParasitologiePhysiologie VirologieBiotechnologiesPharmacologieBotanique ZoologieEcologie, Environnement…
Principales fonctionnalités
THESAURUSTrouver et choisir un terme précis
(vocabulaire contrôlé)
INDEXParcourir l’index pour trouver un terme précis et le nombre
d’articles correspondant
FIND CITATIONTrouver à partir d’1 ou plusieurs
Éléments bibliographiques
LIMIT SEARCH TOLimiter la recherche à une période
ou à tout autre élément proposépar la base
E MAILIMPRESSION
SAUVEGARDE
HISTORIQUE DES RECHERCHES
Opérateurs de proximité des Biological Abstracts
En plus des opérateurs habituels
AND, OR, NOT, ( ) :
ADJ (« adjacent ») inclus 2 termes dans l’ordre spécifié (proximité immédiate)
NEAR 2 termes dans le même champ
WITH 2 termes dans la même séquence (phrase) sans précision sur leur proximité
ADJ > NEAR > WITH
Troncatures ? remplace 1 ou 0 caractères
* remplace 1 ou X caractères
Liens vers les abonnements BIUS J et les revues gratuites (onglet « SILVER LINKER »)
Liens au texte intégral
Des champs plus nombreux
En plus de la recherche par titre (TI =), par auteur (AU= ), etc… on peut chercher par :
AB AbstractAD Author AdressBP Book PublisherAUB Book authorDS DiseaseGN Gene NameSD Sequence DateBC Biochemical and Chemical(…)
Afficher la notice complète
• Donne accès au résumé• Permet de voir (en rouge gras) où se situe le terme
utilisé dans votre recherche• Permet surtout de rebondir vers une autre recherche
en cliquant sur les liens hypertextes de certains champs indexés
EX : MAJOR CONCEPTS,BIOCHEMICALS AND CHEMICALS, SYSTEMS OF ORGANISMS
Etre autonome et approfondir…
La rubrique « How do I ?… »
… faire une recherche… obtenir plus / moins de résultats… chercher un numéro de journal
… changer l’affichage des données
GUIDES EN LIGNE1. Guide abrégé des fonctionnalités2. Manuel complet de l’utilisateur
avec un index final qui permet de répondre à des questions précises
par exemple : ENDNOTE
EXPORTING RECORDS EMAILING RECORD
Chapitre 4
Évaluation de la littérature scientifique
L’Institute of Scientific Information (ISI)
• 1960 : Eugène Garfield fonde à Philadelphie une société privée : l'Institute for scientificinformation (ISI)
• = base de données bibliographiques Science citation index (SCI) avec l'objectif de mettre au point des indicateurs mesurant la "consommation" des résultats (donc leur lecture)
Les citations au sens de l’ISI
• Une citation ISI, c’est la référence à l’un de ces documents : – Articles originaux– Editoriaux– « Lettres à la rédaction »– «News »– Résumés de congrès
• Les citations sont prises par l’ISI dans :– Les notes techniques– Les articles
Les indicateurs de lecture : 1. Le facteur d’impact
• EX : I.F. 2004 de BIOMOLECULAR ENGINEERING
• nombres d'articles publiés en 2003 (54) et en 2002 (49) = 103
• nombres de citations des d'articles publiés en 2003 (46) et en 2002 (120) = 166– IF 2004 = 166 / 103 = 1. 612
Nombre de citations pour les années n-1 et n-2
----------------------------------------------------------------
Nombre d’articles publiés pour les années n-1 et n-2I.F. année n =
Les indicateurs de lecture : 2. L’index d’immédiateté
(Immediacy Index)
• EX : I.I. 2004 de BIOMOLECULAR ENGINEERING
• nombres d'articles publiés en 2004 = 15
• nombres de citations des d'articles publiés en 2004 = 7– IF 2004 = 7 / 15 = 0.467
Nombre de citations pour l’année n
----------------------------------------------------------------
Nombre d’articles publiés pour l’année nI.I. année n =
Les indicateurs de lecture : 3. La demi-vie de citation (cited half-life)
• EX : Cited half-life 2004 de BIOMOLECULAR ENGINEERING– 3,3 ans– Dans 3 ans +ou-, au moins la moitié des articles publiés en 2004 ne
sera plus cité.
• En résumé : c’est l’âge moyen de vie d’un article (le temps durant lequel on peut estimer qu’il sera lu)
Temps au bout duquel la moitié des articles de cette année
(ou plus de la moitié)
ne sera plus cité
Demi-vie cit.anné n =
4 problèmes généraux liés au facteur d’impact : décalage…,
• 1.Décalage : le dernier facteur disponible (impact 2004, publié en 2005) est calculésur les articles publiés en 2003 et 2002, et reflète donc la situation des périodiques des deux à quatre années précédentes.
>>> Le facteur d'impact ne rend pas compte des changements récents intervenus dans la politique éditoriale d'un journal
4 problèmes généraux liés au facteur d’impact :… extrapolation abusive,
• 2. Les extrapolationsLe facteur d'impact se rapporte à un périodique et non à un article.
Il est d'abord un indice de visibilité d'une revue. Extrapoler sa signification peut induire en erreur : les articles d'une revue à fort facteur d'impact ne sont pas tous cités de manière identique
La base de données de l’ISI lisse les revues
La qualité du journal citant n'est pas prise en compte. Toutes les citations ont la même valeur = tous les journaux se valent quel que soit… leur valeur réelle
4 problèmes généraux liés au facteur d’impact : l’effet « peloton » …,
• 3. L’effet « peloton »les périodiques semblent se distribuer en quatre groupes :
"bas", "central", "haut" et "extrême".
Le groupe "extrême", qui ne représente que 10 % des périodiques, se caractérise par des indicateurs de valeur "hors standard" et tend à dévaluer exagérément les autres. La plupart des revues (50 %) se retrouvent, en fin de compte, dans le groupe central (le « peloton »). Il est donc déraisonnable de porter attention à toutes les décimales officiellement publiées.
I.F. 1 > 1 à 3 + de 3
Nombre de revues
3 000 1 200 300
4 problèmes généraux liés au facteur d’impact :valorisation des grands travaux théoriques
+ dévalorisation des travaux cliniques
4. Valorisation / dévalorisation en fonction de la nature des travaux
• Les articles qui rapportent des découvertes importantes - des faits entièrement nouveaux, ou des éléments impliquant une percée conceptuelle - ne sont pas nombreux ; ce sont eux que privilégient les revues généralistes
– Pourquoi ? Parce qu'ils sont susceptibles d’intéresser plusieurs communautés disciplinaires.– Pourtant… ce sont les analyses spécialisées qui, bien que de portée moins générale, permettent
de vérifier ou d'infirmer le bien-fondé des percées conceptuelles, ou d'en préparer de nouvelles
• Les articles qui exploitent et préparent les « percées conceptuelles »constituent en fait l’essentiel de la littérature – et du travail -scientifique.
Problèmes particuliers aux revues de biologie
• Les sciences de la vie ont un statut à part dans le classement des revues par facteur d'impact.
– Pourquoi ? Parce que l’ISI ne comptabilise que les revues consacrées à des mémoires originaux,
– Quelle en est la conséquence ? Que 12 des 15 journaux à facteur d'impact supérieur à 10 concernent cette discipline (les trois autres étant Science, Nature et les PNAS), tandis que le facteur d'impact des meilleurs journaux de chimie et de physique est compris entre 5 et 6.
• La valorisation des travaux de recherche fondamentale est accentuée dans cette discipline
Résultats d’une étude de 1992 : 62 journaux à facteur d'impact supérieur à 2 en biochimie et biologie moléculaire, alors qu'il n'y en a aucun dans la plupart des spécialités médicales (en dehors des grandes revues cliniques généralistes et de quelques revues de cancérologie).
• Les revues spécialisées conservent un sérieux handicap par rapport aux grandes revues généralistes : leurs résultats sont beaucoup moins cités en dehors de la communautéconcernée par leur discipline.
Problèmes particuliers aux revues de biologie
En guise de conclusion :
• Une étude réalisée par Foster (Lancet, 11 novembre 1995) auprès de 50 scientifiques des NIH (biochimistes, immunologistes, neurobiologistes, généticiens...) illustre la distorsion entre l’évaluation de l’ISI et le jugement personnel des chercheurs sur telle ou telle revue
1607BMJ
385ANN INTERN MED
97
16
49
5
111
35
67
37
3
8
10
EVALUTATION PAR L’ISI
4
3
2
1
9
8
5
4
3
2
1
JUGEMENT PAR DES SCIENTIFIQUES
REVUE
EXPERIMENTALE
SCIENCE
NATURE
CELL
PNAS
CLINIQUES
N ENG J MED
JAMA
LANCET
J CLIN INVEST
J BIO CHEM
J CELL BIO
BIOCHEMISTRY
Chapitre 5
Information scientifique sur l’Internet
&
Généralités sur la bibliographie
Quelques définitions
• Document primaire– Document original (un ou plusieurs auteurs)
• Document secondaire– … qui décrit des documents primaires (bibliographie)
• Littérature grise– … Tout ce qui n’est pas publié (qui n’a ni ISBN, ni
ISSN)
Sur l’Internet il est rare d’accéder gratuitement au document primaire
Eléments de syntaxe
• Valent pour les principaux outils de recherche sur l’Internet
* : troncature
« vache folle » : recherche une expression
+vache –folle : exclure un mot
+vache +folle : imposer un mot
Trouver une thèse sur l’internet• Statut spécial des thèses à l’université : de plus en plus
sous forme électronique, ce sont des documents validés, souvent exhaustifs et assortis d’une bibliographie importante.
• Accessibles sur le serveur des universités de soutenance : http://tel.ccsd.cnrs.fr (serveur « thèses en ligne » = 240 thèses en biologie et médecine en octobre 2005)
• Toutes les thèses électroniques ou papier sont cataloguées dans le Système Universitaire de Documentation –SUDOC : http://www.sudoc.abes.fr
Trouver un brevet
• Le dépôt est effectué auprès d’un office : – En France : l’Institut National de la Propriété
Industrielle
(INPI)
– En Europe : l’Office Européen des Brevets (OEB)
• Un site à retenir : http://ep.espacenet.com
Evaluer un site web
• Regarder :
– La 1ère partie de l’URL (Uniform ressource locator) qui donne une indication sur l’organisme
• Ex : http://univ-lyon1.fr
– La structure générale de l’URL• Ex : http://elysee.org et http://elysee.fr
– Si le site est daté (date de création, mise à jour)
Moteurs de recherches spécifiques en sciences
• SCIRUS – for scientific information
http://www.scirus.com
– Couvre 200 millions de pages– Indexe toute une série de bases
en open access– Elimine les sites non
scientifiques– Repère la littérature grise (par
ex. les fichiers pdf) invisible pour les moteurs classiques
Quelques sites web en biologie
• http://www.pasteur.fr/recherche/BNB/• http://bioview.com : offres d’emploi en sciences
de la vie / life sciencesBio Netbook : répertoire de pages web en biologie
réalisé par l’Institut Pasteur• http://www.sciencekomm.at/MedBioWorld : liens à des journaux / bases de
données en biologie et médecine• http://www.doaj.org/Liste des journaux en open access
Autres sites• http://www.ccr.jussieu.fr/urfist/ : l’URFIST
de Paris : BIOMED et CERISE, plus un tutorial (ancien) sur PUBMED
• http://urfist.univ-lyon1.fr/: notamment des outils pour chercher sur le web invisible
Les normes bibliographiques• Les normes de description sont innombrables et
dépendent du périodique (qui a ses propres editorial guidelines)
• En France (mais attention : place du français réduite) – norme AFNOR NF Z-44-005 de décembre 1987– norme NF Z-44-005-2 de février 1998 pour la
description des documents @
• Un site pour la norme française : UCO -Université catholique de l’ouest (www.uco.fr), page « ressources pédagogiques / bibliographies »
Exemples de descriptions d’un art. :
Paru dans : Nature, 335, p.120Année : 1988Titre : Radioactive protein-labeling techniquesAuteurs : Meisenhelder, J. et Hunter J.
• Description NF Z 44-005– MEISENHELDER, J. ; HUNTER, J. Radioactive
protein-labeling techniques. Nature, 1988, 335, p. 120
• Description Methods in molecular biology– Meisenhelder, J. and Hunter J. (1988) Radioactive
protein-labeling techniques. Nature, 335, 120
Les logiciels de gestion bibliographique
• Les 3 principaux logiciels sont produits par Thomson Research Soft :
– Endnote– Procite– Reference manager
Ils apportent une aide précieuse dans la gestion des références et l’écriture des articles : tris, importation de résultats, etc.