d.6. el ecosistema de la información científica: estructura y ...el ecosistema de la información...

4
Anuario ThinkEPI 2011 128 La información académica LA INFORMACIÓN ACADÉMICA o científica difunde los resultados de la investigación a través de artículos de revista, contribucio- nes a congresos, tesis, patentes, etc. Constituye un sector económico específico que dispone de una industria editorial –con Reed- Elsevier y Thomson Reuters a la cabeza– que se ha visto afectada en los últimos años por los procesos de digitalización y por la irrupción del acceso abierto. El número de contenidos generados es altí- simo 1 y explica que se hayan creado diversos productos y servicios pensados específicamente para ayudar a los científicos a localizar y consul- tar documentos de su interés. Durante muchos años –desde finales de los 60– las bases de datos bibliográficas fueron los únicos instrumentos que facilitaban a los investigadores la localización de referencias científicas. A principios de 2000 apare- cieron los motores de búsqueda académicos, que incluyen toda clase de documentos publicados en sitios web relacionados con la actividad investi- gadora (con Scirus y Google Scholar al frente); y a partir de aquí, otros productos y servicios han hecho acto de presencia. D.6. El ecosistema de la información científica: estructura y niveles de agregación Por Ernest Abadal y Lluís Codina 14 febrero 2011 Abadal, Ernest; Codina, Lluís. “El ecosistema de la información científica: estructura y niveles de agregación”. Anuario ThinkEPI, 2011, v. 5, pp. 128-131. Resumen: Se presentan los principales tipos de productos para el acceso a la información científica junto con sus ras- gos diferenciales en cuanto a los contenidos analizados, la técnica utilizada (asignación y recolección de metadatos, in- dización o búsqueda federada) y los resultados ofrecidos. Los productos considerados son los siguientes: bases de da- tos bibliográficas, portales de revistas, repositorios, moto- res de búsqueda académicos, recolectores, metabuscadores académicos y metabuscadores de biblioteca. Palabras clave: Información científica, Agregadores, Mo- tores de búsqueda académicos, Repositorios, Portales de revista, Metabuscadores académicos, Bases de datos biblio- gráficas, Metabuscadores de bibliotecas. Title: The scientific information ecosystem: structure and aggregation levels Abstract: The structure and characteristics of the main products for accessing scientific information are described. The different types of content, the technology used (assignment and harvesting of metadata, full text indexing, or federated search) and their results are analysed. The products are: bibliographic da- tabases, academic journals portals, repositories, academic search engines, academic metasearch engines, and library metasearch engines. Keywords: Scientific information, Academic search engines, Repositories, Academic journals portals, Aca- demic metasearch engines, Bibliographic databases, Libraries metasearch engines. El ecosistema de la información científica: estructura y niveles de agregación – Ernest Abadal y Lluís Codina “Durante años, las bases de datos bibliográficas fueron los únicos instrumentos que facilitaban a los investigadores la localización de referencias científicas” Nuestro objetivo es presentar una tipología del conjunto de sistemas de acceso a la información científica que actualmente forman un ecosistema con nichos bien separados, pero también con ele- mentos en competencia que se solapan.

Upload: others

Post on 12-Aug-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: D.6. El ecosistema de la información científica: estructura y ...El ecosistema de la información científica: estructura y niveles de agregación – Ernest Abadal y Lluís Codina

AnuarioThinkEPI2011

128

???????????????????????????????????????????????????????????????????

Lainformaciónacadémica

LA INFORMACIÓN ACADÉMICA o científicadifundelosresultadosdelainvestigaciónatravés de artículos de revista, contribucio-nesacongresos,tesis,patentes,etc.

Constituyeunsectoreconómicoespecíficoquedispone de una industria editorial –con Reed-Elsevier y Thomson Reuters a la cabeza– quesehavistoafectadaen losúltimosañospor losprocesosdedigitalizaciónypor la irrupcióndelaccesoabierto.

El número de contenidos generados es altí-simo1 y explica que se hayan creado diversosproductos y servicios pensados específicamenteparaayudaraloscientíficosalocalizaryconsul-tar documentos de su interés. Durante muchosaños–desdefinalesdelos60–lasbasesdedatosbibliográficasfueronlosúnicosinstrumentosquefacilitabanalosinvestigadoreslalocalizacióndereferenciascientíficas.Aprincipiosde2000apare-

cieronlosmotoresdebúsquedaacadémicos,queincluyentodaclasededocumentospublicadosensitios web relacionados con la actividad investi-gadora(conScirusyGoogleScholaralfrente);yapartirdeaquí,otrosproductosy servicioshanhechoactodepresencia.

D.6.Elecosistemadelainformacióncientífica:estructuraynivelesdeagregación

PorErnestAbadalyLluísCodina

14febrero2011

Abadal,Ernest;Codina,Lluís.“Elecosistemadelainformacióncientífica:estructuraynivelesdeagregación”.AnuarioThinkEPI,2011,v.5,pp.128-131.

Resumen:Sepresentanlosprincipalestiposdeproductosparaelaccesoalainformacióncientíficajuntoconsusras-gosdiferencialesencuantoaloscontenidosanalizados,latécnicautilizada(asignaciónyrecoleccióndemetadatos,in-dización o búsqueda federada) y los resultados ofrecidos.Losproductosconsideradossonlossiguientes:basesdeda-tos bibliográficas, portales de revistas, repositorios, moto-resdebúsquedaacadémicos,recolectores,metabuscadoresacadémicosymetabuscadoresdebiblioteca.

Palabrasclave: Informacióncientífica,Agregadores,Mo-tores de búsqueda académicos, Repositorios, Portales derevista,Metabuscadoresacadémicos,Basesdedatosbiblio-

gráficas,Metabuscadoresdebibliotecas.

Title:The scientific information ecosystem: structure and aggregation levels

Abstract:Thestructureandcharacteristicsofthemainproductsforaccessingscientificinformationaredescribed.Thedifferenttypesofcontent,thetechnologyused(assignmentandharvestingofmetadata,fulltextindexing,orfederatedsearch)andtheirresultsareanalysed.Theproductsare:bibliographicda-tabases,academicjournalsportals,repositories,academicsearchengines,academicmetasearchengines,andlibrarymetasearchengines.

Keywords:Scientificinformation,Academicsearchengines,Repositories,Academicjournalsportals,Aca-demicmetasearchengines,Bibliographicdatabases,Librariesmetasearchengines.

Elecosistemadelainformacióncientífica:estructuraynivelesdeagregación–ErnestAbadalyLluísCodina

“Duranteaños,lasbasesdedatosbibliográficasfueronlosúnicos

instrumentosquefacilitabanalosinvestigadoreslalocalizaciónde

referenciascientíficas”

Nuestroobjetivoespresentarunatipologíadelconjuntodesistemasdeaccesoalainformacióncientíficaqueactualmenteformanunecosistemaconnichosbienseparados,perotambiénconele-mentosencompetenciaquesesolapan.

Page 2: D.6. El ecosistema de la información científica: estructura y ...El ecosistema de la información científica: estructura y niveles de agregación – Ernest Abadal y Lluís Codina

AnuarioThinkEPI2011

129

??????????????????????????????????????????????????????????????????????

Tiposdeproductosparaaccederalainformacióncientífica

En la tabla 1 presentamos una propuesta decaracterizacióndelosdistintosproductosdeacce-soalainformacióncientíficaexistentes,juntoconunadescripcióndesusrasgosesenciales.

Contenidosanalizados

Una primera diferenciación de los productosde la tabla la podríamos establecer en funciónde los contenidos analizados. De esta manerase pueden distinguir dos niveles de agregación,según se almacene y se indice directamente lafuenteoriginaldelainformacióncientífica(artí-culosderevista,congresos,tesis,etc.)osellegueaellosdeformaindirecta,atravésdealgúnotro

productoagregadorcomolosportalesderevistaolosrepositorios.

Enelprimerniveldeagregaciónencontramoslossistemasderecuperaciónquesenutrendirec-tamentedelafuenteoriginaldela informacióncientífica, es decir, que toman como referencialosartículosderevista, lascontribucionesacon-gresos,lastesis,etc.,independientementedequealmacenenlostextoscompletosono.

Estosproductossonlasbasesdedatosbiblio-gráficas, losportalesderevistas (yaseancomer-cialesodeaccesoabierto),ylosrepositorios.

En el segundo nivel se encuentran aquellosserviciosquesenutrendelprimernivel,esdecir,queincluyencontenidosprocedentesdeportalesde revistas y de repositorios. Estos sistemas novan a buscar las fuentes (las revistas, las tesis olos congresos) en su lugar de origen, sino quellegan a ellas indirectamente por medio de los

Elecosistemadelainformacióncientífica:estructuraynivelesdeagregación–ErnestAbadalyLluísCodina

ProductoContenidosanalizados

Tecnología Resultados Inicios Coste EjemplosNiveldeagrega-

ción

Basesdedatosbiblio-gráficas

Fuentesprima-rias:artículosderevista,congre-sos,etc.

–Asignacióndemetada-tos(registrosbibliográficos)

Registrosbiblio-gráficos+accesoaunsistemaderesolucióndeenlaces

Finalesde1960

Comer-ciales

Scopus,ISIWoS,ChemicalAbstracts,Eric,Dialog

1

Portalesderevistas

Fuentesprima-rias:artículosderevistas

–Asignacióndemetada-tos(registrosbibliográficos)

–Indizacióndeltextocompleto

Registrosbiblio-gráficos+accesoaldocumentooriginal

Finalesde1990

Comer-cialesygratuitos

Emerald,Scielo,ScienceDirect,Recyt

1

Repositorios

Fuentesprima-rias:artículosderevista,tesis,congresos,etc.

–Asignacióndemetada-tos(registrosbibliográficos)

–Indizacióndeltextocompleto

Registrosbiblio-gráficos+accesoaldocumentooriginal

Finalesde1990

Gratuitos

E-LIS,DDD(UAB),MITDSpace,Repositorium

1

Motoresdebúsquedaacadémicos

–Portalesderevistas

–Repositorios–Sedesweb

académicas

Indizacióndeltextocompleto

Listadeenlaces 2000 GratuitosGoogleScholar,Scirus

2

Recolectores–Portalesde

revistas–Repositorios

–Recoleccióndemetadatos

Registrosbiblio-gráficos+accesoaldocumentooriginal

Media-dosde2000

Gratuitos

OAIster,Recolecta,Hispana,Arrow

2

Metabus-cadoresacadémicos

–Portalesderevistas

–Repositorios–Motoresde

búsquedaaca-démicos

–Búsquedafederada

ListadeenlacesPrinci-piosde2000

Gratuitosycomer-ciales

ScienceResearch,Biznar

2

Metabusca-doresdebibliotecas

–Repositorios–Portalesdere-

vistassuscritas–Catálogodela

biblioteca

–Búsquedafederada

Registrosbiblio-gráficos+accesoaldocumentooriginal

Princi-piosde2000

Comer-ciales

MetaLib,Encore

2

Tabla1.Productosprincipalesparaelaccesoalainformacióncientífica

Page 3: D.6. El ecosistema de la información científica: estructura y ...El ecosistema de la información científica: estructura y niveles de agregación – Ernest Abadal y Lluís Codina

AnuarioThinkEPI2011

130

???????????????????????????????????????????????????????????????????

agregadores de primer nivel. De esta forma lesbastaconacudiraunospocosmilesdesedeswebparahacerseconmillonesdecontenidos.

Aquíestánlosmotoresdebúsquedaacadémi-cos, los recolectores, los metabuscadores acadé-micosylosmetabuscadoresdebiblioteca.

– Búsqueda federada:consiste en enviar la mis-ma consulta a cientos defuentes (agregadores deprimer nivel que indizanlas fuentes primarias), enlugar de volverlas a indi-zardirectamente.Comoenel casoanterior,elusuariotambién recibe una listaúnicaderesultados.

Listaderesultados

Laspáginasderesultadosdeestosproductospuedenserdetrestipos:

a) Registros bibliográficos + acceso al docu-mentooriginal (portalesderevista,repositorios,recolectores).

b) Registros bibliográficos + acceso a un sis-tema de resolución de enlaces (bases de datosbibliográficas).

c) Listadeenlaces(motoresacadémicos,meta-buscadores).

Enelprimercaso(a),elusuariotienesolucio-nadosiempredeformadirectaelpasosiguientea cualquier búsqueda: la obtención del docu-mento.

Enelsegundocaso(b),lotienesolucionadodeformaparcial,esdecir,enocasioneselsistemaderesolucióndeenlacesloconduciráaldocumentocompleto, pero a veces no, y además deberáhacerloenvariospasos.

En el tercer caso (c), se ofrece una lista deenlacesaotrossitioswebdemodoqueelaccesoenprincipioesdirecto,pero llenode casuística:enlaces rotos, servidores que requieren suscrip-ción,etc.

Elecosistemadelainformacióncientífica:estructuraynivelesdeagregación–ErnestAbadalyLluísCodina

“Elmayornúmerodeconsultasalosrepositoriosprocededeagregadores

desegundonivelynotantodeconsultasdirectas”

http://www.scienceresearch.com

Tecnología

Los fundamentos técnicos utilizados por losproductosanalizadossoncuatro:

– Asignación de metadatos (catalogación eindización): proceso intelectual (no automático)queconsisteenelaborarunregistrobibliográficoparacadaunade las fuentesoriginalesanaliza-das.Puedeserrealizadoporelmismoautorquecrea los contenidos (artículos de revista, etc.) opor el analista de la base de datos, portal derevistasorepositorio.

– Indizaciónautomáticadel texto completo: con-siste en extraer (todos) lostérminosdeloscontenidosseleccionados,quepuedenestar más o menos disper-sos en servidores, y gene-rar un índice global comoresultado.

– Recolección de meta-datos: se crea un índicecomún recolectando (sólo)metadatosde los reposito-riosquecumplenunproto-colo de etiquetado común(OAI-PMH).Elusuario reci-beunalistaúnicaderesul-tados. http://www.emeraldinsight.com

Page 4: D.6. El ecosistema de la información científica: estructura y ...El ecosistema de la información científica: estructura y niveles de agregación – Ernest Abadal y Lluís Codina

AnuarioThinkEPI2011

131

??????????????????????????????????????????????????????????????????????

Consideracionesfinales

Delaestructuraynivelesdeagregaciónantesdescritos se desprenden diversos comentariospara algunos de los principales agentes de lacomunicacióncientífica:

Paraloscientíficoscomousuariosdeinfor-mación

Esfrecuentequelosinvestigadoresesténsus-critos a las alertas de las revistas de su máximointerés. De todas formas, para las búsquedassistemáticasyexhaustivasacostumbranautilizarmayoritariamente,ydeformaintensiva,losrecur-sosdesegundonivel(especialmentelosmotoresde búsqueda académicos) y también las basesdedatos,quelesaseguranelaccesoaunmayornúmero de fuentes primarias. Esto es lógico yaque no es práctico tener que ir recorriendo loscentenares de portales de revistas o de reposi-torios.

Paraloseditoresdelasrevistas

Dado que los científicos consultan funda-mentalmente agregadores de segundo nivel, esimportante para una revista estar presente enportalesderevistasoenrepositorios,yaquesonelpasoesenciale imprescindibleparapoderserincluidasenmotoresdebúsquedaymetabusca-dores.Esmuydifícilestarenelsegundonivelsinpasarporelprimero.

Paralosrepositorios

Los contenidos inclui-dos en repositorios tienenasegurada la presencia enel segundo nivel. Esto esmuy importante para loscontenidosqueestándepo-sitados en ellos. El mayornúmero de consultas a losrepositorios procede deagregadores de segundonivelynotantodeconsul-tasdirectas.

Para los científicos entantoqueautores

Si quieren asegurarunamáximadifusióna susobras tienen que publicarenrevistasincluidasenpor-talesy,sinosondeaccesoabierto, depositar sus tex-tosenrepositorios.Deesta

formatienenaseguradasuinclusiónenmotoresdebúsquedaymetabuscadoresacadémicosyunafácillocalizaciónporpartedesuscolegas.

Notas

1.Paratenerunareferencia:tansólolasrevis-tas académicas activas son unas 78.000 (segúnUlrich’s).

Comentario

Laclasificaciónpresentadaenesteartículosehahechoatendiendoalanálisisdeloscontenidos.Ademásexistenempresasquenoindizannireco-pilanmetadatos,sólosondistribuidores:

– Debasesdedatos(hosts).Recibenlasbasesde datos bibliográficas de los productores y lascarganen suordenador juntoaotras,ofrecién-dolasalpúblicoconunmismosoftwaredecon-sultaparatodas.Ejemplos:Dialog,Questel-Orbit,EbscoHost.

– De portales de revistas. Muchas editorialesnoquiereninstalarequiposinformáticospropiosparadistribuirsusrevistas,ysubcontratanelser-vicioaesasempresas.Losdistribuidoresalojanlospdfsylosofrecenatravésdewebs(portales)conla imagen y logotipos de la editorial. Ejemplos:MetaPress,HighWirePress,IngentaConnect.

– Agentes de suscripciones. Actúan comoagregadores de portales de revistas. Ejemplo:Swets(SwetsWise).

Elecosistemadelainformacióncientífica:estructuraynivelesdeagregación–ErnestAbadalyLluísCodina

http://biznar.com