congresos.adeituv.es · web viewlos datos obtenidos de archivos históricos suelen estar...

15
USO DE GRAFOS INTERACTIVOS PARA LA EXPLORACIÓN Y ANÁLISIS DE LA INFORMACIÓN TOPOLÓGICA CONTENIDA EN UN CABREVE DEL S. XVIII P. Giménez-Font 1 , B. Zaragozí 2 , J. T. Navarro Carrión 3 , A. Belda- Antolí 4 , A. Ramón Morte 5 1 Dpto. de Análisis Geogr. Regional y Gª Física. Universidad de Alicante. [email protected] 2 Dept. de Geografía, Universitat Rovira i Virgili. [email protected] 3 Instituto Interuniversitario de Geografía, Universidad de Alicante. [email protected] 4 Dpto. Ciencias de la Tierra y Medio Ambiente, Universidad de Alicante. [email protected] 5 Instituto Interuniversitario de Geografía, Universidad de Alicante. [email protected] RESUMEN El Libro Cabreve (en cat. Capbreu) es un documento notarial muy abundante en Cataluña y Valencia, donde hubo una implantación masiva y continuada (ss. XIII al XIX) de la enfiteusis, una fórmula jurídica que ha trascendido hasta la actualidad repercutiendo en la estructura de la propiedad y el paisaje agrario. Esta fuente precatastral consta de una descripción de los bienes afectados, con datos de ubicación, superficie y límites, especificando los lindes de cada uno ellos, el tipo de cultivo y las obligaciones tributarias. Una rica información que, sin embargo, se encuentra semiestructurada y carece de referencias cartográficas. El Cabreve se trata de una fuente documental fundamental, desde hace décadas, en los estudios de historia y geografía histórica centrados en la evolución de la propiedad, el tamaño del parcelario, tipo y evolución de los cultivos o el inventario de toponimia. No obstante, todavía no se ha logrado proponer una metodología que facilite la extracción y el análisis de la información geográfica contenida en los cabreves, ampliando las posibilidades de extracción de datos espaciales de esta fuente textual. Este trabajo propone una solución tecnológica que permite el análisis de dicha información mediante la teoría de grafos, partiendo de ficheros de texto semiestructurados (YAML) en los que los investigadores transcriben toda la información de interés. El resultado principal de esta investigación es un conjunto de scripts de R que crean grafos interactivos, en los que los investigadores puedan explorar las relaciones topológicas contenidas en los Cabreves. Esta metodología se ha aplicado a un valle de la sierra de Aitana correspondiente a Sella (Alicante), extrayendo numerosas relaciones topológicas que ayudan a entender la estructura del paisaje de esta zona a principios del s. XVIII.

Upload: others

Post on 02-Apr-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: congresos.adeituv.es · Web viewLos datos obtenidos de archivos históricos suelen estar relacionados con lugares geográficos que pueden ser encontrados en un mapa. En este sentido,

USO DE GRAFOS INTERACTIVOS PARA LA EXPLORACIÓN Y ANÁLISIS DE LA INFORMACIÓN TOPOLÓGICA CONTENIDA EN UN CABREVE DEL S. XVIII

P. Giménez-Font1, B. Zaragozí2, J. T. Navarro Carrión3, A. Belda-Antolí4, A. Ramón Morte5

1Dpto. de Análisis Geogr. Regional y Gª Física. Universidad de Alicante. [email protected]. de Geografía, Universitat Rovira i Virgili. [email protected] Interuniversitario de Geografía, Universidad de Alicante. [email protected]. Ciencias de la Tierra y Medio Ambiente, Universidad de Alicante. [email protected] 5 Instituto Interuniversitario de Geografía, Universidad de Alicante. [email protected]

RESUMEN

El Libro Cabreve (en cat. Capbreu) es un documento notarial muy abundante en Cataluña y Valencia, donde hubo una implantación masiva y continuada (ss. XIII al XIX) de la enfiteusis, una fórmula jurídica que ha trascendido hasta la actualidad repercutiendo en la estructura de la propiedad y el paisaje agrario. Esta fuente precatastral consta de una descripción de los bienes afectados, con datos de ubicación, superficie y límites, especificando los lindes de cada uno ellos, el tipo de cultivo y las obligaciones tributarias. Una rica información que, sin embargo, se encuentra semiestructurada y carece de referencias cartográficas. El Cabreve se trata de una fuente documental fundamental, desde hace décadas, en los estudios de historia y geografía histórica centrados en la evolución de la propiedad, el tamaño del parcelario, tipo y evolución de los cultivos o el inventario de toponimia. No obstante, todavía no se ha logrado proponer una metodología que facilite la extracción y el análisis de la información geográfica contenida en los cabreves, ampliando las posibilidades de extracción de datos espaciales de esta fuente textual. Este trabajo propone una solución tecnológica que permite el análisis de dicha información mediante la teoría de grafos, partiendo de ficheros de texto semiestructurados (YAML) en los que los investigadores transcriben toda la información de interés. El resultado principal de esta investigación es un conjunto de scripts de R que crean grafos interactivos, en los que los investigadores puedan explorar las relaciones topológicas contenidas en los Cabreves. Esta metodología se ha aplicado a un valle de la sierra de Aitana correspondiente a Sella (Alicante), extrayendo numerosas relaciones topológicas que ayudan a entender la estructura del paisaje de esta zona a principios del s. XVIII.

Palabras clave: cabreve, geografía histórica, grafo topológico, estructura de la propiedad

ABSTRACT

The Cabreve Book is a very abundant notarial document from Catalonia and Valencia regions, where it was widely used over time (s., XIII to XIX), related to the emphyteusis, a legal formula that transcends until now in property structure and the agrarian landscape. This pre-cadastral source consists of a description of the affected goods, with location, surface and boundaries, types of crops and the tax obligations. It is a rich information source but semi-structured and lacking cartographic references. The Cabreve is a fundamental documentary source in History and historical geography studies focused on the evolution of the property, the size of the plot, type and evolution of the crops or the toponymical inventory. However, it has not yet been possible to propose a methodology that facilitates the extraction and analysis of the geographic information contained in the cabreves, expanding the possibilities of extracting spatial data from this textual source. This work proposes a technological solution that allows the analysis of this information through graph theory, starting from semi-structured text files (YAML) in which the researchers transcribe all the information of interest. The main result of this research is a set of R scripts for creating interactive graphs, in which researchers can explore the topological relationships contained in cabreves. This methodology was applied to a valley of the Sierra de Aitana (Sella, Alicante, Spain), finding topological relationships that help to understand the structure of the landscape of this area in the early s. XVIII.

Page 2: congresos.adeituv.es · Web viewLos datos obtenidos de archivos históricos suelen estar relacionados con lugares geográficos que pueden ser encontrados en un mapa. En este sentido,

Keywords: cabreve, geografía histórica, grafo topológico, estructura de la propiedad

1. INTRODUCCIÓN

Los datos obtenidos de archivos históricos suelen estar relacionados con lugares geográficos que pueden ser encontrados en un mapa. En este sentido, un Sistema de Información Geográfica (SIG) puede ser una herramienta útil para cumplir con distintos objetivos en una investigación de geografía histórica que implique documentos de esta índole (Carrion et al., 2016).

En los últimos 20 años, los Sistemas de Información Geográfica Históricos (SIGH, en inglés HGIS) han recibido una mayor atención por parte de geógrafos e historiadores. Los SIGH pueden ser utilizados en distintos contextos, como la georeferenciación de mapas antiguos, la reconstrucción de límites administrativos, la comprensión de procesos naturales o para poder comparar las estadísticas históricas con las actuales (Gregory y Healey, 2007). Otro tipo de aplicación sería la georeferenciación de microdatos históricos. Por ejemplo, Hin et al. (2016) utilizan SIGH para distinguir individuos que aparecen en más de un censo o registro egipcio en tiempos del Imperio Romano, lo cual permite un avance en la interpretación de determinados documentos históricos de la época.

Existen proyectos de SIGH muy distintos en cuanto a la amplitud de los objetivos, la aproximación tecnológica o el tipo de archivo estudiado. Schlichting (2008) describe casos de estudio como el SIG histórico de China (CHGIS) que abarca dos mil años de historia china, el estudio del Dust Bowl en los Estados Unidos de Norte América y hasta existen proyectos más concretos como un SIGH sobre la Batalla de Gettysburg. En España también existen experiencias y resultados muy interesantes como, por ejemplo, el estudio del Catastro del Marqués de la Ensenada desarrollado en el proyecto SIGECAH (García-Juan et al. 2012), con la automatización en la integración de texto e información geográfica, para ofrecer cartografía histórica del parcelario catastral.

Las aplicaciones de los SIGH se basan en la premisa de que en los documentos históricos existan datos como direcciones postales, cartografía de referencia o topónimos reconocibles. Sin embargo, con el tiempo, los entramados urbanos pueden haber cambiado o los topónimos haberse perdido. Este problema es mucho más complejo en zonas históricamente menos pobladas, en las cuales las referencias pueden ser mínimas o bien meras conjeturas. En estos casos es necesario reconstruir el patrón espacial a partir de la información disponible, lo cual consume tiempo y recursos (Schlichting, 2008). Este es uno de los motivos por el que los distintos autores prefieren emplear métodos semiautomáticos para la compilación de datos en los SIGH, dado que los métodos manuales resultan muy trabajosos, mientras que los métodos completamente automáticos pueden generar falsas relaciones (Hin et al., 2016).

En este trabajo se valora la posibilidad de reconstruir la estructura de la propiedad a partir de un documento histórico de gran valor: el Libro Cabreve. Los cabreves o capbreus eran un procedimiento de control de la producción económica del territorio. Se trataba de una fuente de información de carácter local, cuyo uso estuvo muy extendido en la Corona de Aragón entre los siglos XIII y XIX (Gil-Olcina, 2012).

Los cabreves contienen información muy detallada y rigurosa, como consecuencia de los intereses económicos asociados al control de los bienes, principalmente asociados a señoríos (Gil-Olcina, 2012). Se trata de un inventario exhaustivo sobre el dominio de los enfiteutas y la rentabilidad productiva de los predios, por lo que lleva asociados una serie de datos complementarios que tienen un gran valor desde el punto de vista espacial o de reconstrucción del paisaje (Benítez, 1984). Entre otros datos, los cabreves contienen nombres

Page 3: congresos.adeituv.es · Web viewLos datos obtenidos de archivos históricos suelen estar relacionados con lugares geográficos que pueden ser encontrados en un mapa. En este sentido,

de lugar, tipos de cultivo, extensión de las propiedades y cánones asociados, todo ello unido a los nombres y a las familias de enfiteutas que detentaban el dominio útil de las tierras.

El objetivo principal de este trabajo es proponer una metodología para extraer y analizar la información geográfica contenida en los cabreves, como paso previo a su integración en un SIGH. Se trata de determinar qué aspectos del proceso pueden automatizarse fácilmente y cuáles requieren la mediación de un experto que lidie con la incertidumbre asociada a este tipo de información y sus ambigüedades.

2. METODOLOGÍA2.1 Caso de estudio: Cabreve del Valle de Tagarina (1726)

Esta metodología consiste en flujos de trabajo y herramientas que han sido aplicadas, en un primer momento, sobre una única partida del Cabreve realizado sobre la baronía de Sella en 1726. Los motivos por los que se ha escogido esta zona de estudio son diversos. En primer lugar, la disponibilidad de una copia del documento original y también de su transcripción en ficheros de texto. Esta información está disponible para toda la baronía de Sella, pero resulta preferible empezar a trabajar en un espacio más pequeño y con características comunes, en el que resulte más fácil validar la metodología y el funcionamiento del software desarrollado.

Limitado por el norte y por el sur por elevados relieves, el valle es un espacio acotado y bien prospectado en lo que se refiere a la toponimia, infraestructuras viarias, agrarias y ganaderas históricas, documentación de archivo y memoria oral (Giménez y Marco, 2017).

Figura 1. Localización del valle de Tagarina en la provincia de Alicante.

El valle de Tagarina es una depresión intramontana localizada entre el bloque culminante de la Sierra de Aitana (1.558 msnm) y la Penya de Sella (1160 msnm), de aproximadamente 1000 ha de superficie, que encauza un pequeño curso fluvial alimentado principalmente por pequeñas surgencias cársticas (ver Figura 1). El aprovechamiento del suelo se ha realizado históricamente sobre el fondo del valle para ir ascendiendo por las laderas mediante terrazas de cultivo. Hasta el siglo XVII fue ocupado por moriscos, que cultivaban el fondo de valle con

Page 4: congresos.adeituv.es · Web viewLos datos obtenidos de archivos históricos suelen estar relacionados con lugares geográficos que pueden ser encontrados en un mapa. En este sentido,

pequeñas terrazas de regadío y dedicaban las laderas a la ganadería y diversos aprovechamientos forestales. Después de la expulsión de 1609 se tardó varias décadas en volver a ocupar este territorio con nuevos colonos cristianos (enfiteutas) que se regían entonces por un nuevo acuerdo con el barón. El crecimiento demográfico y las exigencias feudales obligaron, fundamentalmente durante el siglo XVIII y XIX, a roturar las laderas y transformar en campos de cultivo la máxima extensión posible de terreno. Las tierras no cultivadas, cada vez más reducidas, se siguieron dedicando a la explotación de madera y a la obtención de pastos. A finales del siglo XIX se alcanzó el máximo de expansión agraria y a mediados del siglo XX comenzó un abandono masivo de tierras y la consecuente regeneración natural de bosques de pinos y carrascas (Giménez y Marco, 2017). En la actualidad predomina el bosque sobre el paisaje agrario y el valle contiene un alto valor ambiental. Está catalogado como Lugar de Interés Comunitario por la Directiva Hábitats de la UE.

2.2 Desarrollo de software

Este trabajo se ha desarrollado en varios equipos con distintas características de hardware pero siempre sobre GNU/Linux Ubuntu 16.04. Este sistema operativo cuenta con versiones preinstaladas de Make (GNU Make 4.1; x86_64-pc-linux-gnu) y Git (version 2.7.4).

Make es una herramienta de gestión de dependencias muy utilizada en el desarrollo de software. Básicamente se ocupa de interpretar cómo y en qué orden deben compilarse un conjunto de ficheros. No obstante, Make puede utilizarse en muchos otros escenarios en los que sea necesario actualizar uno o más ficheros a partir de otro conjunto. Make puede ejecutar los programas que sea necesario para lograr sus objetivos y compilar los resultados, pero es necesario que los programas estén disponibles en el sistema. Por otra parte, Git es un software de control de versiones que ayuda a mantener un registro de los cambios en archivos de un proyecto y a coordinar el trabajo de las personas que colaboran en un proyecto de código.

Excepto Make y Git, todo el software necesario para reproducir este trabajo ha sido contenerizado y ejecutado utilizando la plataforma Docker, que es un software que automatiza el despliegue de aplicaciones dentro de contenedores de software. Se trata de una tecnología similar a la de las máquinas virtuales, pero que compartimenta mejor el uso de recursos. Así pues, se ha instalado una versión de Docker adecuada para Ubuntu 16.04 (17.05.0-ce, build 89658be) desde dónde lanzar instancias del software que se necesite en cada momento. Esto significa que no es necesario instalar software adicional ni preocuparse por sus versiones, configuraciones y/o características. Únicamente se utiliza Make para definir un flujo de trabajo que ejecuta Dockers y produce los ficheros de resultados. Finalmente, Git es usado para gestionar el desarrollo del código fuente y subirlo a una plataforma en la Nube.

Sobre estas plataformas de desarrollo (Make, Git y Docker) se han programado una serie de scripts en R, que es un lenguaje y entorno de programación para análisis estadístico y gráfico muy popular en áreas como Estadística o Minería de Datos. R se distribuye bajo la licencia GNU GPL por lo que es software libre, pero también es multiplataforma y está disponible para Sistemas Operativos Windows, Macintosh, Unix y Linux/GNU.

Los scripts desarrollados utilizan una serie de librerías que facilitan las tareas de importación de datos (yaml, readr), preprocesamiento y análisis (dplyr, reshape2, tidyr, igraph) o la generación de salidas gráficas a partir de dichos datos (ggplot2, visNetwork, DiagrammeR). Por ejemplo, la librería o package yaml de R es útil para la importación de datos semiestructurados desde ficheros de texto editables por todos los investigadores. Esta librería importa y exporta datos en formato YAML (del acrónimo inglés recursivo ‘YAML Ain’t Markup Language).

Page 5: congresos.adeituv.es · Web viewLos datos obtenidos de archivos históricos suelen estar relacionados con lugares geográficos que pueden ser encontrados en un mapa. En este sentido,

Según la especificación pública de la versión 1.2. (http://yaml.org/spec/1.2/spec.html), YAML es un lenguaje de serialización de datos que, a diferencia de los lenguajes de marcado (e.g. JSON, XML), sustituye los caracteres estructurales o marcas de ámbito por niveles de indentación de texto, en línea con lenguajes de programación tales como Python. De este modo, se pueden representar jerarquías con cualquier nivel de anidamiento y preservar la legibilidad, puesto que la primera prioridad de este lenguaje es la confección de documentos fácilmente interpretables por el ser humano aun cuando suponga un aumento del tiempo de proceso por parte de una computadora. Por otra parte, en lo referente a su faceta computacional, YAML se fundamenta en las tres primitivas básicas a partir de las que se puede conformar cualquier estructura de datos, a saber, tipos escalares (cadenas de caracteres y números), secuencias y diccionarios. Esto facilita la serialización de documentos YAML con prácticamente cualquier lenguaje de programación de propósito general y uso común (p.ej. Python, Ruby, Javascript o R).

2.3 Flujo de trabajo

La extracción de la información geográfica contenida en los cabreves podría realizarse de forma manual, pero resultaría enormemente trabajoso. Por este motivo, se plantea un flujo de trabajo semi-automático que conduce al investigador a través de una serie de fases en las que principalmente se tiene que preocupar de la toma de decisiones al transcribir, codificar el cabreve y decidir si, a partir de una interpretación realizada, se puede lograr un grafo válido de la estructura de la propiedad. Este flujo de trabajo se divide entre las tareas manuales y/o aquellas que han sido automatizadas con la ayuda de las plataformas tecnológicas anteriormente descritas (Make, Docker y R). En la Figura 2 se describe esté flujo de trabajo con mayor detalle.

Figura 2. Diagrama de flujo para el análisis del Cabreve. El comando make indica aquellas tareas que pueden realizarse automáticamente. La llamada a las reglas por defecto del Makefile (círculo) indican la ejecución de varios Rscripts y la generación de múltiples ficheros intermedios necesarios para la creación de un grafo interactivo. El resto de tareas son manuales e implican la toma de decisiones por parte de un experto.

La primera fase de trabajo consiste en transcribir e interpretar la información geográfica del cabreve. En principio, se pueden extraer datos que identifican a los propietarios de las parcelas, distintos niveles de agregación espacial (p. ej. partidas, heredades o parcelas), los lindes de cada parcela (p. ej. vecinos, elementos del relieve, hidrografía, términos municipales, etc), así como otros datos que hacen referencia a la productividad de cada parcela (jornales, etc). En la figura 3.A se puede apreciar esta labor de trascripción.

Page 6: congresos.adeituv.es · Web viewLos datos obtenidos de archivos históricos suelen estar relacionados con lugares geográficos que pueden ser encontrados en un mapa. En este sentido,

Figura 3. Ejemplo de codificación de la información geográfica del Cabreve en lenguaje de marcado (YAML). A) Extractos del Cabreve y su transcripción con la información geográfica resaltada. B) Estructura y marcado de la información en YAML.

En segundo lugar, los datos identificados se codifican en formato YAML siguiendo un modelo semiestructurado en el que quedan reflejadas las relaciones jerárquicas que se hallan de forma explícita en el cabreve. Por ejemplo, el enunciado “un enfiteuta posee 5 parcelas”, se transcribe como 5 relaciones de tenencia. De un modo similar, cuando se listan los 6 vecinos de una parcela, se entendería como que hay 6 relaciones de vecindad. En la Figura 3.B se puede ver un ejemplo de codificación de una parcela y toda la información relacionada con ésta.

Figura 4. Diagrama de flujo del trabajo automatizado con Make, Dockers y Rscripts. Este diagrama describe de un modo general el trabajo las tareas automáticas orquestadas con Make. Una conjetura es una estructura de carpetas donde se guarda una copia del YAML actual, los ficheros intermedios y los grafos resultantes de la interpretación hecha del cabreve.

Page 7: congresos.adeituv.es · Web viewLos datos obtenidos de archivos históricos suelen estar relacionados con lugares geográficos que pueden ser encontrados en un mapa. En este sentido,

En tercer lugar, el fichero YAML es analizado automáticamente mediante una serie de scripts de R ejecutados desde un Makefile. En la Figura 2 se distingue un conector (forma de círculo) que se refiere a esta tercera fase. El procedimiento consiste en extraer primero los elementos del cabreve que pudieran constituirse como nodos de un grafo y todas sus características, pero distinguiendo aquella información que aparece explícitamente frente a la que se halla a través de algún tipo de proceso. Así pues, se distinguen tres tipos de nodos:

Explícitos (p. ej. parcelas, hidrografía, relieve, etc.).

Agregados de métricas en los que, por el momento, se calculan sumatorios de superficie (p.ej. enfiteutas, partidas, heredades, etc.). Los nodos de agregación son también explícitos, pero contienen más información geográfica que puede ayudar a contextualizar los nodos en el territorio.

Implícitos, para aquellos vecinos que no aparecen como enfiteutas (p.ej. puede que sean propietarios o aparecer en otros documentos del cabreve todavía no consultados).

Una vez compilados los nodos, make se ocupa extraer todas las relaciones de interés entre estos nodos. En un primer momento, solo se han distinguido dos tipos de relaciones (implícitas y explícitas), ya que las relaciones de agregación no tendrían tanto interés para la reconstrucción de la estructura del paisaje, sino que podrían ser más interesantes para estudiar el poblamiento y otras cuestiones relacionadas con la enfiteusis. Por ejemplo, podrían ser relaciones de agregación aquellas en las que se sumen el número de veces en las que se repite una relación de vecindad o cuando los dos vecinos comparten apellido, entre otros tipos.

Las relaciones explícitas pueden ser leídas linealmente dentro del YAML y las hay de distintos tipos, solamente limitadas por el detalle de la información extraída del cabreve (landholder-plot, landholder-level2, landholder-level1, landholder-neighbour, etc). En cambio, las relaciones implícitas son las que revisten mayor interés, porque resultan más trabajosas de compilar a mano. Finalmente, ha sido posible distinguir tres tipos de relaciones explícitas entre parcelas dependiendo de si son relaciones entre:

Parcelas de distintas partidas del cabreve (plots-l3-l3).

Parcelas de la misma partida, pero distinta heredad (plots-l2-l2).

Parcelas dentro de una misma heredad (plots-l1-l1).

A partir de las relaciones entre parcelas también ha sido posible establecer relaciones entre heredades o entre partidas.

Continuando con el diagrama de flujo de la Figura 4, al finalizar la extracción de los distintos tipos de nodos y relaciones, se pueden aprovechar varias librerías de R para la generación de grafos y su visualización. En este caso se ha optado por generar grafos interactivos con la librería visNetwork (http://datastorm-open.github.io/visNetwork/) que permite que el investigador explore cada conjetura de un modo bastante intuitivo. En estos widgets se trabaja con componentes Web (HTML, JS y CSS) que permiten superponer el grafo sobre una imagen o mapa de referencia (ver Figura 5). Los elementos del grafo son interactivos y permiten al investigador arrastrar los nodos y que las relaciones topológicas no se desvirtúen. Por ejemplo, en la Figura 5 se ven resaltadas las relaciones de una heredad con distintos nodos del territorio (otras heredades, barrancos, monte y con el límite con el Marquesado de Guadalest). En este caso, puesto que se conoce que Guadalest se encuentra al norte de Tagarina, se hace evidente que dicha heredad debería encontrarse al norte del barranco. Seguramente, una vez se reposiciona dicha heredad habrá otras relaciones topológicas que revisar. Finalmente, es posible que alguna relación haga que el grafo no tenga sentido territorialmente, por lo que el

Page 8: congresos.adeituv.es · Web viewLos datos obtenidos de archivos históricos suelen estar relacionados con lugares geográficos que pueden ser encontrados en un mapa. En este sentido,

investigador deberá valorar la información obtenida o revisar la interpretación en el YAML para ajustar su conjetura. Según el diagrama de la Figura 2, el investigador puede utilizar Make para guardar una versión de la conjetura actual como falsa, prueba, indecidible o hipótesis.

Figura 5. Análisis visual de las relaciones topológicas entre heredades de la partida de Tagarina. Las heredades se representan con círculos de color naranja, graduados según la superficie en jornales (1 jornal equivale a 0.48 ha). El resto de los símbolos se refiere a elementos administrativos o de los que se desconoce su extensión. En esta figura se ve un grafo parcialmente ordenado por un investigador. Por ejemplo, los topónimos sobre hidrografía se han identificado con los barrancos principales (elipses azules), lo cual obliga a reordenar a mano el resto del grafo, minimizando así las relaciones poco probables (p. ej. heredades vecinas que estén muy alejadas en el valle).

3. RESULTADOS Y DISCUSIÓN

Esta metodología podría ser aplicada al resto de cabreves existentes y a otros documentos históricos similares. Por este motivo se ha apostado por desarrollar las herramientas necesarias con software libre y abierto, sobre plataformas y entornos que potencien la reproducibilidad. Estos aspectos de la investigación no son novedosos, ya que la reproducibilidad de la investigación científica es una preocupación para muchos investigadores (Singleton et al, 2016; Munfalo et al., 2017; Zaragozí et al., 2017). Se trata de un esfuerzo adicional y pocas veces valorado que permite que cualquier otro experto reproduzca los resultados de este trabajo y pueda valorar la metodología con un esfuerzo mínimo por su parte. La reproducción de todo este trabajo implica únicamente la instalación de tres softwares de licencia libre (Make, Docker y R) y la ejecución de un único comando (make) en el terminal.

La elección de YAML como formato de entrada de datos en el software es un acierto. Existen otros lenguajes de marcado con los que se podría lograr un resultado similar. Sin embargo, YAML resulta más fácil de escribir a mano y menos verboso para los investigadores, por lo que les resulta más sencillo adaptarse a trabajar con este tipo de lenguajes.

El software desarrollado junto con los datos de esta primera experiencia de análisis del cabreve han sido publicados en su propio repositorio dentro de la plataforma Github (https://github.com/benizar/capbreu-builder), desde donde es posible descargar todo el proyecto o trabajar colaborativamente con git (git clone). Todo el código ha sido liberado bajo General Public License 3 (GPL3), lo cual garantiza que cualquier investigador puede usar, estudiar, compartir (copiar) y modificar el software. El funcionamiento del software queda mejor explicado en la documentación disponible en este repositorio.

El código incluye más de treinta scripts de R que reproducen el flujo de trabajo automatizado descrito en la Figura 2 y varios ficheros Makefile que dirigen el flujo de trabajo propuesto. El desarrollo de este código se ha planteado de este modo por motivos de escalabilidad y

Page 9: congresos.adeituv.es · Web viewLos datos obtenidos de archivos históricos suelen estar relacionados con lugares geográficos que pueden ser encontrados en un mapa. En este sentido,

reusabilidad. Más adelante se plantea la posibilidad de migrar las funciones desarrolladas a una aplicación web desarrollada con R Shiny (https://shiny.rstudio.com/), que es un servidor de aplicaciones desarrollado por la empresa RStudio. En dicha aplicación, el flujo de trabajo estará completamente disponible a través de una página web, por lo que será aún más transparente y se podrá trabajar de un modo más intuitivo y visual.

El grafo obtenido en la Figura 5 es fruto de una conjetura de ejemplo para la que se tomaron un par de decisiones para desambiguar ciertos topónimos y nombres de enfiteutas. Sería el caso, por ejemplo, de “viuda de Francisco Soler” y “herederos de Francisco Soler Bautista” considerado finalmente como el mismo enfiteuta tras localizarlo indistintamente como enfiteuta y lindante de propiedad; o el concepto de “río” y “barranco enmedio” considerado como el cauce principal del valle (Riu de Tagarina) que actúa como bisectriz de este espacio, entre otros casos de desambiguación que han resultado exitosos una vez visualizado en grafo. En la Tabla 1 se resumen los resultados obtenidos en esta particular conjetura. Como se ha mencionado anteriormente, los elementos implícitos son los que más hubiera costado identificar manualmente. Estos recuentos pueden variar según la conjetura realizada por los investigadores para desambiguar nombres o para responder alguna pregunta concreta.

Tabla 1. Nodos y ejes obtenidos a partir de una conjetura de ejemplo. Como se puede ver, por el momento solamente se calculan las relaciones necesarias para obtener un grafo de heredades, por lo que hay numerosas

relaciones que aún no están explotadas.

La metodología y el software desarrollados facilitan la elaboración de conjeturas, a modo de hipótesis, sobre la estructura de la propiedad en épocas pasadas. El caso desarrollado en este trabajo es un buen ejemplo de ello, pero también sería posible aplicar este tipo de ayudas en el estudio de otro tipo de documentos históricos, o más recientes, que contienen información geográfica estructurada de un modo similar al visto en el Cabreve de Sella de 1726. Sería el caso de los establiments derivados de Cartas Puebla de los siglos XIII-XIV y XVII o documentación más reciente como los Amillaramientos del siglo XIX o el registro de la propiedad, así como en otro tipo de archivos disponibles en otras regiones.

En este trabajo se ha analizado la información topológica y geográfica contenida en una parte de un cabreve, lo cual no deja de ser el primer paso para crear un SIGH de periodos de los que no existe una descripción cartográfica del territorio. Según Gregory y Healey (2007), el coste en tiempo y recursos que supone la construcción de una base de datos SIGH, es uno de los principales problemas para aplicar TIG en estudios históricos. Cuando se comienza a poder analizar la información y obtener resultados, el esfuerzo previo ya ha sido muy grande. En este sentido, se ha desarrollado un método semiautomático para facilitar la estructuración de la

Page 10: congresos.adeituv.es · Web viewLos datos obtenidos de archivos históricos suelen estar relacionados con lugares geográficos que pueden ser encontrados en un mapa. En este sentido,

información del cabreve, y se ha definido un flujo de trabajo indicando claramente las fases en las que intervienen los investigadores. De este modo se consigue aumentar la viabilidad de analizar los cabreves y combinar la información que contienen con otras bases de datos SIG.

Este trabajo es una primera prueba de concepto, por lo que hay varios aspectos que deben ser ampliados en estudios posteriores. En primer lugar, sería necesario ampliar la zona de estudio más allá del valle de Tagarina. La metodología propuesta es flexible y permite trabajar con nuevos tipos de relaciones que aparecerán seguro con un análisis más exhaustivo del cabreve. En cuanto a los aspectos técnicos hay dos cuestiones fundamentales que deberían ser resueltas para que los resultados del análisis sean analizables en un entorno SIG. Por el momento, los grafos resultantes no tienen carácter espacial, es decir, los nodos no tienen coordenadas geográficas asignadas. Así pues, trabajar sobre una ortofotografía es, meramente, un apoyo visual. A pesar de ello, esta metodología permite responder a preguntas de investigación y crear nuevas hipótesis de trabajo. Finalmente, cabe plantearse si es posible automatizar otros aspectos propios de la investigación en Geografía Histórica. Por ejemplo, dada la dependencia de que haya topónimos reconocibles en la zona, sería aplicable una estrategia de Geoparsing para extraer automáticamente topónimos y geolocalizarlos a partir de bases de datos al uso (Clifford et al., 2016).

4. REFERENCIAS

Carrion, D., Migliaccio, F., Minini, G., & Zambrano, C. (2016): From historical documents to GIS: A spatial database for medieval fiscal data in Southern Italy. Historical Methods, 49(1), 1–10. https://doi.org/10.1080/01615440.2015.1023877

Clifford, J., Alex, B., Coates, C. M., Klein, E., & Watson, A. (2016): Geoparsing history: Locating commodities in ten million pages of nineteenth-century sources. Historical Methods, 49(3), 115–131. https://doi.org/10.1080/01615440.2015.1116419

García Juan, L., Álvarez Miguel, A. J., Camarero Bullón, C., Escalona Monge, J. (2012): Generación de una metodología para la gestión y recreación cartográfica a partir de información del Catastro de Ensenada. Revista Internacional de Ciencia Y Tecnología de La Información Geográfica, (12), 268–302. Retrieved from http://www.geofocus.org/index.php/geofocus/article/view/246

Gil Olcina, A (2012): Singularidades del régimen señorial valenciano: Expansión, declive y extinción de la señoría directa. Universidad de Alicante, Servicio de Publicaciones. ISBN 978-84-9717-235-6

Giménez-Font, P. y Marco Molina, J.A. (2017): La dinámica del paisaje en la Serra d’Aitana (Alacant, España): síntesis de transformaciones históricas en una montaña mediterránea (1600-2010). Estudios Geográficos, 282: 105-133.

Gregory, I. N., & Healey, R. G. (2007): Historical GIS: Structuring, mapping and analysing geographies of the past. Progress in Human Geography, 31(5), 638–653. https://doi.org/10.1177/0309132507081495

Hin, S., Conde, D. A., & Lenart, A. (2016): New light on Roman census papyri through semi-automated record linkage. Historical Methods, 49(1), 50–65. https://doi.org/10.1080/01615440.2015.1071226

Munafò, M. R., Nosek, B. A., Bishop, D. V. M., Button, K. S., Chambers, C. D., Percie du Sert, N., … Ioannidis, J. P. A. (2017): A manifesto for reproducible science. Nature Human Behaviour, 1(1), 21. https://doi.org/10.1038/s41562-016-0021

Schlichting, K. (2008): Historical GIS: New Ways of Doing History. Historical Methods, 41(4), 191–196. https://doi.org/10.3200/HTMS.41.4.191-196

Page 11: congresos.adeituv.es · Web viewLos datos obtenidos de archivos históricos suelen estar relacionados con lugares geográficos que pueden ser encontrados en un mapa. En este sentido,

Singleton, A. D., Spielman, S., & Brunsdon, C. (2016): Establishing a framework for Open Geographic Information science. International Journal of Geographical Information Science, 8816(February), 1–15. https://doi.org/10.1080/13658816.2015.1137579

Zaragozí, B. M., Navarro-Carrión, J. T., Torres-Prieto, J., Belda-Antolí, A., & Ramón-Morte, A. (2017): Investigación reproducible en ciencias de la información geográfica: una propuesta metodológica. In XXV Congreso de la AGE (pp. 2659–2668). Madrid: Asociación de Geógrafos Españoles (AGE).