recuperación retrospectiva de un archivo policíaco: el...

46
Recuperación retrospectiva de un archivo policíaco: el “Casellario Politico Centrale”. Alessandro CHIARETTI Centro Maas srl, Roma, Italia Municipalidad de San Bernardo, Chile 10-13 abril de 2012

Upload: phamcong

Post on 05-Nov-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Recuperación retrospectiva

de un archivo policíaco:

el “Casellario Politico Centrale”.

Alessandro CHIARETTI

Centro Maas srl, Roma, Italia

Municipalidad de San Bernardo, Chile

10-13 abril de 2012

IV Coindear - Alessandro CHIARETTI 210-13 abr. 2012

Problema

� La utilización siempre más difundida de las tecnologías de la información amplía las posibilidades de comunicación y distribución de la información, pero también crea nuevos y frecuentes problemas de compatibilidad entre las distintas configuraciones de hardware y software, poniendo así limitaciones a las posibilidades de intercambiar y compartir las informaciones.

IV Coindear - Alessandro CHIARETTI 310-13 abr. 2012

Objetivos

� Mostrar estrategias de utilización de estándares de descripción y tecnologías avanzadas, que están en la base de las metodologías de recuperación retrospectiva de instrumentos de descripción archivística, experimentadas para superar las problemáticas asociadas a comunicar y compartir los recursos

IV Coindear - Alessandro CHIARETTI 410-13 abr. 2012

La recuperación retrospectiva

� Transposición de informaciones de cualquier soporte de origen a un soporte distinto;

� garantizar la integridad de los datos, su conservación en el tiempo y su reusabilidad, y atribuir a los mismos datos un valor adjuntopotencial, constituido por su inserción en un nuevo contexto de informaciones.

IV Coindear - Alessandro CHIARETTI 510-13 abr. 2012

Metodología de la recuperación retrospectiva

recuperación retrospectivaSoporte de origen Soporte distinto

Integridad de losdatos

Conservación en el tiempoy reusabilidad de los datos

Valor adjunto: inserción de losdatos en un nuevo contexto

de informaciones

IV Coindear - Alessandro CHIARETTI 610-13 abr. 2012

Recuperación retrospectiva y lenguajes formales (I)

� Informaciones transportadas tanto directa como indirectamente por los datos (o sea deducibles de su contexto de informaciones originario);

� para que la transposición de datos se produzca sin perder informaciones, es necesario someterlos a una correcta operación de codificación descriptiva.

IV Coindear - Alessandro CHIARETTI 710-13 abr. 2012

Recuperación retrospectiva y lenguajes formales (II)

� Codificación descriptiva: reconocer y describir todos los elementos significativos que conforman la estructura y el contenido de un “documento”, a través de la introducción de códigos que sirven para identificar y circunscribir las estructuras de información que lo componen, señalando al mismo tiempo su naturaleza de manera explícita.

IV Coindear - Alessandro CHIARETTI 810-13 abr. 2012

Recuperación retrospectiva y lenguajes formales (III)

� Lenguajes de marcado: permiten explicitar, en base a criterios formales adecuados, o sea comprensibles para el computador, todas esas informaciones transportadas a través de elementos distintos de los caracteres alfanuméricos.

IV Coindear - Alessandro CHIARETTI 910-13 abr. 2012

Recuperación retrospectiva y lenguajes formales: XML� Xml (eXtensible markup language):

� lenguaje de codificación no propietario, atento al perfil de la platform indipendence;

� permite describir objetos estructurados jerárquicamente y crear una gramática formal (Dtd o Xml Schema), es decir una estructura lógica que refleja los componentes del documento y sus relaciones, la cual constituye la regla en base a la cual se analiza y valida cualquier instancia de documento asociada a ella.

IV Coindear - Alessandro CHIARETTI 1010-13 abr. 2012

Recuperación retrospectiva: XML y modelos estándares

� El soporte de las nuevas tecnologías (Xml), garantiza la integridad, la conservación a largo plazo y la reusabilidad de los datos;

� otro aspecto fundamental es el recurrir a un modelo estándar, al que hay que reconducir las clases de documentos para garantizar el acceso compartido y la interoperabilidadentre los distintos recursos digitalizados.

IV Coindear - Alessandro CHIARETTI 1110-13 abr. 2012

Principales estándares del ámbito archivístico

� Codificados en Xml:

� Ead: descripción del archivo (ISAD);� Eac-Cpf: descripción de sujetos (ISAAR).

IV Coindear - Alessandro CHIARETTI 1210-13 abr. 2012

Casellario Politico Centrale (I)

� Oficina dependiente del Ministerio del interior italiano, tenía la tarea de administrar el fichero de los opositores políticos;

� serie con más de 150.000 expedientes personales;

� documentación comprendida entre 1894 y 1945;� conservado en el Archivio Centrale dello Stato

de Roma.

IV Coindear - Alessandro CHIARETTI 1310-13 abr. 2012

Casellario Politico Centrale (II)

� Fichas con:� datos identificativos del expediente y

descripción sumaria de los documentos;� datos relativos a la persona

(informaciones de estado civil y domicilio, informaciones biográficas).

IV Coindear - Alessandro CHIARETTI 1410-13 abr. 2012

TIMELINE

IV Coindear - Alessandro CHIARETTI 1510-13 abr. 2012

Recuperación: fase I, 2004-2005

� Formato inicial Formato finalMSAccess Xml-Ead

IV Coindear - Alessandro CHIARETTI 1610-13 abr. 2012

Recuperar los datos (I)

� Particular historia de la base de datos, creada anteriormente a través de la utilización de otro software, y después transpuesta en ACCESS;

� esta última ha sido objeto de la recuperación.

IV Coindear - Alessandro CHIARETTI 1710-13 abr. 2012

Recuperar los datos (II)

� Por causa de límites estructurales del software originario el DB estaba organizado en dos tablas distintas, sin una clave unívoca de unión.

IV Coindear - Alessandro CHIARETTI 1810-13 abr. 2012

Recuperar los datos (III)

� Principales límites del software originario: largueza limitada de los campos y campos no repetibles en la fila;

� por eso informaciones distintas para el mismo campo (cambio de residencia, de trabajo, etc.), eran colocadas en filas distintas.

IV Coindear - Alessandro CHIARETTI 1910-13 abr. 2012

Recuperar los datos (IV)

� Modelo Xml resultado de la unión de las dos tablas de Access;

� sucesivamente reconducido a la estructura Ead.

IV Coindear - Alessandro CHIARETTI 2010-13 abr. 2012

Crear la aplicación

� Aplicación web que permite el acceso a las informaciones a través de las tradicionales funciones de búsqueda textual;

� Componentes tecnologicos:

�ExtraWay XML Engine;

�Microsoft. NET;

� www.maas.ccr.it/cpc

IV Coindear - Alessandro CHIARETTI 2110-13 abr. 2012

RESULTADOS

HISTORIAL DE BUSQUEDASBUSQUEDAS

IV Coindear - Alessandro CHIARETTI 2210-13 abr. 2012

IV Coindear - Alessandro CHIARETTI 2310-13 abr. 2012

IV Coindear - Alessandro CHIARETTI 2410-13 abr. 2012

TIMELINE

IV Coindear - Alessandro CHIARETTI 2510-13 abr. 2012

Evolución de la web, 2005-2010

� Comparación continua con la evolución de las tecnologías utilizadas en la web:

� creciente sensibilidad por los aspectos de usabilidad de los sitios web;

� interés relativo a la utilización de los sistemas de organización del conocimiento (KOS).

IV Coindear - Alessandro CHIARETTI 2610-13 abr. 2012

Usabilidad

� La estructura general de un sitio web reviste cierta importancia en favorecer el proceso de formación de un modelo mental del sistemapor parte del usuario;

� a través de un diseño apropiado, es posible ofrecer al usuario la oportunidad de prever con facilidad los resultados de una acción y facilitar la transformación de la información en conocimiento real.

IV Coindear - Alessandro CHIARETTI 2710-13 abr. 2012

Sistemas de organización del conocimientoKnowledge organization systems (KOS)

� Clásicos sistemas de organización e indización semántica del ámbito bibliotecario:

� vocabularios controlados;

� tesauros;� esquemas de clasificación;

� ontologías.

IV Coindear - Alessandro CHIARETTI 2810-13 abr. 2012

Clasificación analítico-sintética (o facetada)� El objeto es descrito a través de un sistema de

atributos mutuamente excluyentes, que representan cada uno un aspecto o una propiedad persistente del objeto;

� reconocida como herramienta de categorización capaz de ofrecer búsquedas más certeras e intuitivas, particularmente eficaces en ambiente digital.

IV Coindear - Alessandro CHIARETTI 2910-13 abr. 2012

TIMELINE

IV Coindear - Alessandro CHIARETTI 3010-13 abr. 2012

Recuperación: fase II, 2011

� Objetivos:

�valorizar la importante cantidad de imágenes digitales adquiridas en el curso de los años;

� inserir los datos en un nuevo entorno de aplicaciones, caracterizado por la utilización de sistemas de búsqueda semánticos;

� incrementar la usabilidad del sistema.

IV Coindear - Alessandro CHIARETTI 3110-13 abr. 2012

Recuperar los datos

� Se consideró todavía válida la elección hecha anteriormente, optando por la codificación Xml-Ead, que garantiza los requisitos de conservación en el tiempo y de interoperabilidad con otros sistemas informatizados.

IV Coindear - Alessandro CHIARETTI 3210-13 abr. 2012

Crear la aplicación (I)

� Abandonar el viejo entorno (componentes propietarios);

� nuevos componentes tecnologicos (open source):

�Apache Lucene;

�Apache Solr.

IV Coindear - Alessandro CHIARETTI 3310-13 abr. 2012

Crear la aplicación (II)

� Resultados:

�búsquedas a través de progresivas selecciones sobre las facetas, con posibilidad de búsqueda textual;

�visualización de los resultados a través de innovativos y variados puntos de vista: modalidad de tabla, temporal y geográfica.

� www.maas.ccr.it:8080/CPC

IV Coindear - Alessandro CHIARETTI 3410-13 abr. 2012

BÚSQUEDAS

RESULTADOS

IV Coindear - Alessandro CHIARETTI 3510-13 abr. 2012

IV Coindear - Alessandro CHIARETTI 3610-13 abr. 2012

IV Coindear - Alessandro CHIARETTI 3710-13 abr. 2012

IV Coindear - Alessandro CHIARETTI 3810-13 abr. 2012

IV Coindear - Alessandro CHIARETTI 3910-13 abr. 2012

IV Coindear - Alessandro CHIARETTI 4010-13 abr. 2012

IV Coindear - Alessandro CHIARETTI 4110-13 abr. 2012

Conclusiones

� A partir de la codificación Xml aplicada a los datos en la primera intervención de recuperación, ha sido posible realizar, con tiempos y modalidades distintas, una serie de productos informáticos capaces de adaptarse a distintas exigencias y, por tanto, a distintos niveles de difusión y de fruición.

� La misma metodología de trabajo, aplicada a distintos casos, ha confirmado el carácter central de la elección del formado Xml-Ead para la codificación de los datos, en cuanto constituye un paso fundamental para garantizar la platform indipendence y la facilidad de reutilización de las informaciones en los sucesivos, e inevitables, procesos de recuperación.

IV Coindear - Alessandro CHIARETTI 4210-13 abr. 2012

TIMELINE

IV Coindear - Alessandro CHIARETTI 4310-13 abr. 2012

Posibles evoluciones

� Web semántica y Linked Open Data

� Convertir los datos en recursos visibles y reusables en la web, también fuera del contexto original de utilización y de creación;

� permitir nuevas conexiones entre sujetos, personas, organizaciones y lugares, con la finalidad de promover la investigación interdisciplinaria y enriquecer el conocimiento histórico.

IV Coindear - Alessandro CHIARETTI 4410-13 abr. 2012

Referencias bibliográficas (I)

� BERNERS-LEE, T. Semantic Web Road map. 1998. [en línea] Disponible en: http://www.w3.org/DesignIssues/Semantic.html

� BERNERS-LEE, T. Design Issues: Linked Data, 2006. [en línea] Disponible en: http://www.w3.org/DesignIssues/LinkedData.html

� CHIARETTI, A. Organización del conocimiento: la clasificación facetada como acceso a los contenidos archivísticos. Aplicación a un archivo fotográfico de empresa, 2011. En IX Congreso de archivología del Mercosur, San Lorenzo, Paraguay, 16-18 nov. 2011. [en linea] Disponible en: http://hdl.handle.net/10760/16394

� EUROPEAN COMMISSION, Emerging Technologies for the Cultural and Scientific Heritage Sector, DigiCULT Technology Watch Report 2, 2004, 216 p., ISBN 92-894-5276-5. [en línea] Disponible en: http://www.digicult.info/downloads/twr_2_2004_final_low.pdf

� HASSAN MONTERO, Y. Introducción a la Usabilidad. No Solo Usabilidad, 2002, n. 1, ISSN 1886-8592. [en línea] Disponible en: http://www.nosolousabilidad.com/articulos/introduccion_usabilidad.htm

� Library Linked Data Incubator Group Final Report. W3C Incubator Group Report 25 October 2011, 2011. [en línea] Disponible en: http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/

� MAZZO UTURRIAGA, R. Linked Open Data: qué es y ejemplos en el mundo, 20 octubre 2010. [en línea] Disponible en: http://www.bcn.cl/de-que-se-habla/open-data-link-data

IV Coindear - Alessandro CHIARETTI 4510-13 abr. 2012

Referencias bibliográficas (II)

� MICHETTI, G. Il linguaggio Sgml per la descrizione archivistica. Archivi & Computer, 2000, n. 1, 7-33 p.

� MONTERO, Y.H. y MARTÍN RODRÍGUEZ, F.J. y MARTÍN RODRÍGUEZ, O. Clasificaciones facetadas y metadatos (I): Conceptos basicos, 2003. [en línea] Disponible en: http://www.nosolousabilidad.com/articulos/clas_facetadas1.htm

� MURRAY, P. Faceted classification of information. [en línea] Disponible en: http://web.archive.org/web/20041204095504/http://www.kmconnection.com/DOC100100.htm

� ORLANDI, T. Informatica testuale. Teoria e prassi, Bari: Laterza, 2010. 190 p. ISBN 978-88-420-9379-4

� RENDINA, E. Strumenti di ricerca e trattamento informatico: la Guida generale degli Archivi di Stato italiani in formato XML. Archivi & Computer, 2003, n. 3, 85-96 p.

� ROSATI, L. La classificazione a faccette fra Knowledge Management e Information Architecture(parte I), 2003. [en línea] Disponible en: http://www.itconsult.it/knowledge/articoli/pdf/itc_rosati_faccette_e_KM.pdf

� SACCO, G.M. Dynamic taxonomies and guided searches. Journal of the American Society for Information Science and Technology, 2006, vol. 57, n. 6, 792-796 p. Disponible en: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.97.1510&rep=rep1&type=pdf

Gracias por su atención

Alessandro CHIARETTI

[email protected]

Centro Maas srl, Roma, Italia

www.maas.ccr.it

Santiago, Chile