mÓdulo 4 - consejoderedaccion.orgconsejoderedaccion.org/.../2/...por-computador.pdf · por otra...

14
MÓDULO 4 PERIODISMO ASISTIDO POR COMPUTADOR UTILIDAD Y HERRAMIENTAS El programa Tras la pista de los dineros públicos es una iniciativa de Consejo de Redacción, La Silla Vacía y el Proyecto Fortalecimiento Democrático, iniciativa conjunta de PNUD, IDEA Internacional y el Instituto Holandés para la Democracia Multipartidaria (NIMD), realizada entre diciembre de 2013 y marzo de 2014 para periodistas colombianos, principalmente de regiones.

Upload: buithu

Post on 10-Oct-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

MÓDULO 4

PERIODISMO ASISTIDO POR COMPUTADOR

UTILIDAD Y HERRAMIENTAS

El programa Tras la pista de los dineros públicos es una iniciativa de Consejo de Redacción, La Silla Vacía y el

Proyecto Fortalecimiento Democrático, iniciativa conjunta de PNUD, IDEA Internacional y el Instituto Holandés

para la Democracia Multipartidaria (NIMD), realizada entre diciembre de 2013 y marzo de 2014 para periodistas

colombianos, principalmente de regiones.

1

¿Qué es el Periodismo Asistido por Computador (PAC) y

para qué sirve?

El texto “Periodismo y Democracia” del primer módulo de este curso analizó algunas de las

transformaciones que ha generado la era digital en el periodismo, especialmente las que

representan nuevos retos de agilidad al tiempo que profundidad en la información. Uno de

los cambios que observamos es la aparición de nuevas herramientas que facilitan el ejercicio

de este oficio; cuando dichas herramientas están encaminadas a la consecución y análisis

de información para investigaciones periodísticas, hablamos de Periodismo Asistido por

Computador.

Algunas definiciones:

“El uso de computadores y métodos de las ciencias sociales para adquirir y analizar

información y hacer historias que de otro modo serían difíciles o imposibles”. Steve Doig, de

IRE -Investigative Jorunalism and Editors- y Arizona State University.

“Reportería asistida por datos: reportería que usa datos en lugar de, o al igual que,

documentos”. Glen McGregor, periodista del diario Ottawa Citizen.

“El concepto tiene que ver con adaptar las herramientas [digitales], desde las más básicas

hasta las más complejas, al ejercicio periodístico”. Giannina Segnini.

“El reportaje asistido por ordenador consiste en la utilización de instrumentos

tecnológicos con el objetivo de aproximar lo máximo posible al periodista a la

información primaria, proporcionándole las condiciones más adecuadas para que

interprete la realidad”. Felipe Pena de Oliveira, profesor de la Universidad Federal

Fluminense, de Río de Janeiro, Brasil.

De las concepciones anteriores se deriva que lo importante del PAC –más allá de utilizar

una serie de programas y sitios web sólo por la novedad o porque están de moda- es que le

da un valor agregado al periodismo, ya que a través de sus herramientas se pueden

alcanzar hallazgos que de otra manera sería imposible o muy difícil. Entre las ventajas que

resalta Giannina Segnini, están “el fácil y rápido acceso a la información a través de

Internet, la agilización de procesos matemáticos o estadísticos que solían ser tediosos y

ajenos al periodista y la posibilidad de obtener y almacenar voluminosa información en poco

espacio”.

Otro aspecto positivo de estas técnicas es que abren un espectro grande de nuevas ideas que

permiten ampliar la agenda periodística y hacer que los temas trabajados por determinado

medio marquen la diferencia y disminuyan su dependencia de fuentes oficiales, filtraciones

y lugares comunes.

2

Los siguientes ejemplos dan fe de la utilidad que tiene el Periodismo Asistido por

Computador. Escogimos casos que puedan mostrar una diversidad de técnicas y

herramientas y que traten temas similares a los relacionados con este curso:

156 candidatos a alcaldías tienen morosidad, sanciones o condenas

www.nacion.com/2010-11-24/ElPais/NotaPrincipal/ElPais2585950.aspx

Técnica: Cruce de bases de datos

En diciembre de 2010, antes de las elecciones regionales, los periodistas de La Nación

(Costa Rica) cruzaron la base de datos de todos los candidatos con registros criminales,

personas con prohibición para ocupar cargos públicos y deudores morosos de seguridad

social. Encontraron cinco candidatos con condenas, 27 inhabilitados y muchos deudores

morosos del Estado. Luego de verificar manualmente los resultados y solicitar la versión

de los candidatos, publicaron un mapa interactivo con los hallazgos de la investigación.

Secrecy for Sale: Inside the Global Offshore Money Maze

http://www.icij.org/offshore

Técnica: Creación y cruce de bases de datos

A partir de una filtración de 100.000 empresas registradas en paraísos fiscales, ICIJ

creó una base de datos que permite explorar las relaciones entre clientes, entidades

offshore, abogados, contadores, bancos y otros intermediarios que ayudan a mantener

los acuerdos secretos. Los datos fueron analizados por 112 periodistas en 58 países,

quienes encontraron beneficiarios como una empresa que suministra software de

vigilancia a regímenes represivos, el gurú de la mayor cadena de cirugía estética en el

Reino Unido, multimillonarios ex soviéticos, uno de ellos solicitado en extradición por

Lituania, así como funcionarios de gobierno y sus familiares y socios en Azerbaiyán,

Rusia, Canadá, Pakistán, Filipinas, Tailandia y Mongolia.

'Paras' versión 2.0

http://www.verdadabierta.com/victimarios/3012-paras-version-20

Técnica: Consulta de bases de datos en línea

Con la pregunta “¿Qué hay detrás de un sitio web?” en mente, los periodistas del portal

Verdad Abierta.com se sumergieron en Archive.org, un servicio en línea que permite ver

el historial de millones de sitios en Internet, incluso si estos han desaparecido. Esta

labor les permitió, no sólo encontrar 12 páginas web que tuvieron diversos bloques

paramilitares entre 1998 y 2008, sino también explorarlas para describir el tipo de

información que publicaban, la estrategia que aplicaron en ellas y destacar algunos de

los principales mensajes que transmitieron.

Los contraticos de la Cámara

http://www.elespectador.com/impreso/temadeldia/articulo-363617-los-contraticos-de-

camara

Técnica: Búsqueda de documentos en línea y análisis de datos

El Espectador solicitó y analizó los datos de la contratación de personal en la Cámara de

Representantes. Encontró que entre octubre y junio de 2012 se firmaron 754 contratos

de personal de apoyo, 585 de ellos por menos de $10 millones y muchos para funciones

3

que ya realizan los empleados de planta o para labores tan absurdas como un abogado

que oprime “rec” en la sección de grabación.

Las fichas para la reelección del Procurador

http://www.lasillavacia.com/historia/las-fichas-para-la-reeleccion-del-procurador-36860

Técnica: Cruce de datos y crowdsourcing

La Silla Vacía solicitó datos sobre los cargos de libre nombramiento de la Procuraduría y

construyó una base de datos con dicha información más otra recolectada a través de

reportería, de revisión documental y de aportes de los lectores. El análisis le permitió

detectar entre las personas nombradas por el Procurador a amigos o familiares de 31

senadores -encargados de elegirlo-, así como 22 amigos y familiares de magistrados de

las altas cortes -quienes lo nominan-.

En Cali, los contratos de obras civiles tienen sus “dueños”

http://www.elpais.com.co/elpais/cali/noticias/en-cali-contratos-obras-civiles-tienen-sus-

duenos

Técnica: Análisis de bases de datos

El diario El País, de Cali, publicó un ranking de las empresas o personas que acaparan

los recursos destinados a obras civiles por parte de la Alcaldía de Cali y la

Administración Departamental del Valle del Cauca. Con el análisis comparativo de las

listas, solicitadas mediante derechos de petición a las dos administraciones, los

periodistas Ricardo Pérez Vargas y Fabio Posada Rivera lograron establecer que Cali

contrató casi cuatro veces más obras civiles que el Valle con sus propios recursos; y que

existe una concentración en el manejo de fondos para obras civiles en la región.

Principales herramientas

Las posibilidades son incontables, tanto en lo que tiene que ver con herramientas web como

en los programas de informática que se pueden aprovechar en el Periodismo Asistido por

Computador. En el corto tiempo que tenemos esta semana, exploraremos a grandes rasgos

tres categorías de herramientas: las búsquedas de documentos en Internet, los sistemas que

permiten consultar bases de datos en línea y el principal software para análisis de datos –

Excel-.

1. Búsquedas web

Cada vez son más los documentos de gran utilidad (informes oficiales, actas, presupuestos,

tablas de nómina, hojas de vida, contratos, estudios, presentaciones, bases de datos etc.)

que se pueden conseguir en Internet; sin embargo, en algunas ocasiones, pretender hallar

un documento en la Web puede parecerse a la hazaña de buscar una aguja en un pajar. A

veces los buscadores parecieran no entender nuestro idioma, pues nos muestran siempre las

mismas respuestas o nos llevan a información poco relevante.

4

Por otra parte, cuando se trata de este gran pajar que es la Internet, existe una ventaja que

debemos aprovechar: las agujas escondidas –páginas o documentos- tienen unas

características muy particulares que las diferencian de todo lo que hay a su alrededor. Así,

podemos indicarle a los motores de búsqueda en la web cuáles son esas particularidades y

ellos nos acercarán cada vez más a la información que queremos alcanzar.

Los siguientes videos les enseñarán cómo aprovechar la búsqueda avanzada de Google,

que se encuentra aquí http://www.google.es/advanced_search. Verán tips muy importantes

para eliminar los resultados inútiles en ese buscador y llegar rápidamente a todo tipo de

documentos.

Video 1: ’Cómo aprovechar las búsquedas avanzadas’

http://www.youtube.com/watch?v=4Wr3Xg0c2gU#t=38

Video 2: ‘Combinación de criterios para encontrar documentos’

http://www.youtube.com/watch?v=EyAXAZuvh48#t=100

2. Bases de datos para consultar en línea

Al investigar a contratistas y funcionarios públicos es bueno rastrearlos en diversos sitios

web que ofrecen la posibilidad de hacer consultas en línea, con los que se obtienen datos

relevantes que ayudan a conformar un perfil más completo de la persona y a responder

preguntas puntuales sobre ellos.

Por ejemplo, si tenemos las siguientes preguntas: ¿realmente el senador Eduardo Merlano

obtuvo los 50 mil votos de los que alardeó?, ¿cuándo obtuvo su licencia de conducción? y

¿actualmente tiene multas de tránsito?, las podemos resolver consultando algunas bases de

datos en Internet:

a. Un dato muy relevante a la hora de consultar bases de datos es el número de

identificación; cuando tenemos este dato el rastreo de una persona o empresa en la

web resulta más productivo.

Por eso, vamos a tratar de obtener la cédula de Merlano. Podríamos empezar por

Google, pero un ejercicio un poco más rápido es indagar el Registro Nacional de

Abogados, ya que muchos funcionarios públicos son abogados.

El enlace es:

http://gacetadelforo.ramajudicial.gov.co/gaceta_del_foro/consulta_tramites_consulta.

aspx?opcion=6 Allí ingresamos únicamente el apellido para poder buscar; luego en la

lista de resultados hacemos clic en el título de la columna ‘Nombres’ para que quede

ordenada alfabéticamente; de este modo llegamos al siguiente dato: Eduardo Carlos

Merlano Morales, cedula de ciudadanía 92527310

b. Con la cédula ya podemos buscar información en la base de datos de licencias de

conducción, que administra el RUNT, para obtener información sobre su licencia.

5

El enlace es: http://www.runt.com.co/portel/libreria/php/01.030517.html Al hacer la

consulta encontramos que la licencia de Merlano fue expedida el 16 de mayo de

2012, días después del incidente en el que fue encontrado conduciendo en estado de

embriaguez. Además, se puede ver que el trámite de expedición aparece como

‘rechazado’ tres veces antes de ser finalmente aceptado.

c. Con la misma cédula podemos ir a la base de datos de multas de tránsito

vigentes, del Sistema Integrado de Información Sobre Multas y Sanciones por

Infracciones de Tránsito.

El enlace es: https://consulta.simit.org.co/Simit/index.html Allí encontramos que el

ex senador sigue teniendo conductas inapropiadas al manejar, ya que acumula tres

multas en 2013 que suman 884.250 pesos.

d. Finalmente, nos dirigimos al Historial de resultados electorales en Colombia,

sistema de consulta de la Registraduría, para confirmar si fueron ciertos los 50 mil

votos de los que alardeó el ex senador cuando no se dejó imponer la multa de

tránsito.

El enlace es: http://www.registraduria.gov.co/Informacion/elec_2011_histo.htm En él

encontramos una tabla con las fechas en que ha habido elecciones desde 1998 hasta

2012. Ingresamos por la opción 2010 - Votación Candidatos Senado. El documento

que se abre nos permite ver que Eduardo Carlos Merlano Morales sólo obtuvo 37.195

votos y fue el último en adquirir una curul de la lista del Partido de la U.

Como en el ejemplo anterior, a través del rastreo de información en las bases de datos que

permiten ser consultadas en Internet se pueden hacer muchas cosas, obtener muchos datos,

confirmar o rebatir hipótesis. Para tener un acceso directo a las cuatro opciones que vimos y

conocer muchísimas más, vamos a usar la base de datos ZoomOnline, que desarrolló y

administra Consejo de Redacción.

Los pasos para entrar son:

- Ingresar a la dirección www.zoomonline.info

- Hacer clic en el botón ‘Ingresar a la base de datos’

- En la nueva ventana que se abre, digitar los siguientes datos de acceso, que son los

de la sección pública de la base de datos (tener en cuenta las mayúsculas):

Account Name: ZoomOnline

Password: CdR

- Hacer clic en donde dice: ZoomOnline

- Seleccionar el botón ‘Conocer bases de datos externas’

Allí verán una lista de 140 enlaces que llevan a bases de datos localizadas en sitios web de

Colombia y de otros países. La idea de este servicio que presta Zoom Online es ofrecer a los

periodistas acceso fácil a sistemas de consulta en línea donde se pueden obtener datos útiles

para investigaciones periodísticas, logrando que todos estén reunidos en un mismo lugar…

una especie de directorio de bases de datos en línea.

6

El listado está organizado en orden alfabético, así que el ejercicio para este curso es revisar

la lista y explorar las bases de datos que resulten más interesantes. Para el rastreo de

funcionarios públicos y contratistas, recomendamos específicamente los siguientes:

- Empresas, comerciantes, ONGs y contratistas estatales registrados en Cámaras de

Comercio del país: permite buscar por nombre y conocer así su NIT, representante

legal, actividad principal, sucursales registradas, etc.

- Registro Único de Proponentes: aquí pueden saber si una empresa o persona está

inscrita para contratar con el Estado. Ofrece datos básicos como el NIT, fecha de

inscripción como proponente, actividad económica, estado de la matrícula y de la

inscripción y, en algunos casos, los últimos contratos adquiridos.

- Sociedades colombianas vigiladas por la Superintendencia: la Superintendencia de

Sociedades permite consultar en línea los datos básicos de las entidades que vigila…

direcciones, estado actual y representante legal, la junta directiva, el contador,

revisor fiscal, etc.

- Estados financieros de las sociedades que los han reportado desde 1995.

- Operaciones de comercio internacional desde Colombia, con datos individuales por

empresa o consolidados por años sobre importaciones y exportaciones.

- Aspirantes a ocupar cargos en el Gobierno, con sus hojas de vida.

- Antecedentes disciplinarios, penales, fiscales y de pérdida de investidura.

- Antecedentes disciplinarios de abogados y funcionarios judiciales.

- Casos disciplinarios vigentes en la Procuraduría.

- Intervenciones por captación indebida de dineros.

- Sociedades y comerciantes en liquidación obligatoria.

- Empresas que cotizan en la Bolsa de Valores de Colombia.

- Procesos judiciales actuales y de personas que fueron condenadas.

- Deudores morosos del estado.

- Registro Nacional de Abogados.

- Historial de resultados electorales en Colombia.

- Financiación de campañas - Elecciones territoriales 2011.

- Financiación de campañas - Elecciones parlamentarias 2010.

- Contratación pública en Colombia - Buscador de procesos contractuales.

- Contratación pública en Colombia - Buscador de documentos.

- Registro Único de Panamá (propiedades, sociedades, fideicomisos, aeronaves y

fundaciones).

- Empresas en Panamá - Búsqueda por directivos.

- Propiedades en Miami.

- Empresas registradas ante el gobierno de Estados Unidos.

- Empresas en Florida.

- Negocios en Hawaii.

- Empresas en Canadá.

- ONG en Estados Unidos.

- Lista Clinton.

- Casos judiciales en Estados Unidos.

7

Cuatro recomendaciones de cierre:

- La mayoría de bases de datos está en sistemas que son en inglés, así que al realizar

una búsqueda es mejor no usar tildes ni la letra ‘ñ’.

- No se den por vencidos en la primera búsqueda. Recuerden que quienes diseñan y

administran las bases de datos son seres humanos que pueden cometer errores y que

pueden escribir las cosas de manera distinta a como nosotros lo hacemos; así que

vale la pena hacer varios intentos de búsqueda: con tilde y sin tilde, en mayúscula y

en minúscula, con puntos y sin puntos, con un apellido y con dos, con ‘z’, con ‘s’, con

‘c’, con ‘h’ y sin ella, etc…

- Muchas bases de datos contienen guías de uso o de ayuda… búsquenlas y úsenlas.

Como la complejidad de cada sistema de consulta varía según la entidad, el tema y el

ingeniero que lo desarrolló, es importante dedicarles el tiempo necesario para

explorarlas y aprender a usarlas correctamente, tal vez, mediante ejercicios de

ensayo-error.

- Manténganse conectados a CdR y revisen constantemente la base de datos Zoom

Online; permanentemente estamos actualizando la sección de enlaces externos para

que cada día los periodistas tengamos acceso a más y más recursos de consulta en

línea ;)

3. Análisis de datos en Excel

Como vimos en los ejemplos presentados al comienzo de este documento, muchos trabajos

de Periodismo Asistido por Computador han recurrido al análisis de datos como técnica

principal en sus investigaciones. Para empezar a aprovechar esta técnica no es necesario

ser un analista experto ni estudiar ingeniería de sistemas; un curso sencillo de las

principales herramientas de Excel será suficiente para sacar importantes hallazgos de una

tabla de datos.

Muchos de esos cursos y tutoriales se consiguen en Internet o se pueden tomar en cualquier

momento, así que vamos a concentrarnos en el criterio periodístico que es importante tener

en cuenta al trabajar con tablas de datos; lo haremos mediante algunas recomendaciones

para crear una base de datos y para interpretarla.

DISEÑO DE LA BASE DE DATOS

Aprender a diseñar bases de datos requiere, ante todo, experiencias propias: al practicar

creando una y otra tabla de datos, cada persona descubre las características que más le

convienen y le facilitan el trabajo.

8

Sin embargo, estas son algunas recomendaciones generales para empezar:

- Casi siempre la información que queremos recabar es bastante amplia, por eso, en

algunas ocasiones, conviene dividirla en tablas diferentes. Lo importante es que

dichas tablas tengan un dato en común que sea exactamente igual para permitir los

cruces. Por ejemplo, si la idea es mantener un registro sobre títulos mineros en

determinado departamento, por el volumen de la información, será mejor mantener

en una tabla los datos de las empresas (NIT, actividad económica, propietarios

actuales y anteriores, datos de contacto, antecedentes disciplinarios, etc.) y en otra

los datos de todos los procesos de titulación en los que quede muy claro el NIT de la

empresa correspondiente.

- Luego será necesario analizar cuántos campos debe tener cada tabla. Esto depende

básicamente de la cantidad de datos que se quieran reunir sobre cada registro; habrá

que analizar en cada caso si tiene utilidad incluir todos los datos sobre las personas

(nombres, identificación, teléfono, dirección, edad, género, ocupación, profesión, etc),

sobre las empresas (NIT, actividad económica, teléfono, propietarios, fecha de

creación, ventas por año, ingresos, deudas, etc), sobre los sucesos (fecha,

protagonistas, testigos, lugar, circunstancias, antecedentes, etc).

- En la definición de los campos también se debe evaluar qué tanto se divide la

información. Por ejemplo en el campo de dirección: si es una lista de empresas no

será necesario separar la parte numérica del barrio, basta dejar todo en un mismo

campo; pero si se trata de una tabla de muertes violentas, vale la pena manejar el

barrio como un campo independiente de la dirección para poder analizar luego cuáles

son los barrios más peligrosos y su evolución.

- Finalmente, los campos deben tener un estilo claro. Se debe establecer cuáles serán

numéricos, cuáles de texto, cuáles porcentuales, etc., así como las limitaciones que

tendrán. Este aspecto es fundamental para poder hacer los futuros análisis.

Supongamos que vamos a crear una base de datos sobre incautaciones relacionadas con

narcotráfico. Veamos cuáles serían los pasos para definir la estructura…

A. El archivo

a. Si vamos a dividir la información en tablas diferentes, éstas pueden ir en las

diversas hojas que contiene un libro de Excel, especificando bien los nombres de cada

una.

b. No es bueno llenar las primeras filas con información de contexto sobre la tabla.

9

Lo mejor es que este tipo de información esté en una hoja aparte llamada

“metadatos”. Recuerden que éstos consisten en información ‘acerca de los datos’.

B. Los campos

a. Campos de texto: La mayoría de campos que usamos son de texto. Con estos hay

dos cosas importantes por definir…

Hay que establecer si se van a usar tildes y caracteres especiales como la ‘ñ’. Esto

depende básicamente de si se planea compartir la base de datos, es decir, si

posteriormente ésta se va exportar a otros programas, pues es en esos intercambios

cuando los caracteres especiales causan problemas.

Lo que se decida debe ser aplicado por igual a TODOS los registros de la base de

datos. No conviene tener un ‘López Suárez’ y luego un ‘Lopez Suarez’.

El otro aspecto es la fragmentación de la información. Como ya explicamos, esto

depende del tipo de análisis que se quiera hacer. En el caso del nombre y apellido,

por ejemplo, casi siempre conviene dividirlos. Así se podrá organizar la tabla

10

alfabéticamente por apellido y se podrán encontrar registros de una misma familia

por sus apellidos.

Finalmente, es muy importante que NUNCA haya espacios al comienzo o al final de

un campo de texto.

b. Campos numéricos: En estos registros lo importante es que NO se digiten los

números con caracteres adicionales ( ’ . – “ ” ). De este modo se facilitan las

operaciones, análisis y exportación de datos.

Tampoco conviene incluir los símbolos numéricos en cada registro: ($, Kg, Mts, USD,

€, %, #). Es preferible especificar la unidad de medida en el encabezado o en otro

campo.

c. Campos que establecen categorías: Algunos campos -de texto o numéricos- se

convierten en categorías de datos, pues existen sólo unas pocas opciones para

llenarlos y la información se repite varias veces entre un registro y otro. Son aquellos

que indican “tipos” de datos o que resuelven preguntas de sí/no.

Ejemplo de esos campos son: tipo de fuente (personal - institucional - documental -

digital), género (femenino - masculino), moneda (peso - dólar - euro), capturado (sí -

no), ciudad (cuando el territorio que cubre la información no incluye muchas

ciudades).

Estos campos son muy útiles para analizar la información, ya que permiten agrupar

los datos, hacer conteos, comparar, etc. Por eso, es indispensable que mantengan

siempre el mismo criterio, que las categorías se escriban siempre exactamente igual.

11

No puede haber un registro que diga ‘dolar’ y otro ‘dólar’, ni pueden dejarse espacios

al final o inicio de la palabra.

Cuando se comenten ese tipo de errores, los cruces y análisis de datos no funcionan

bien:

Nota: Excel tiene una función de autocompletar que sirve mucho para evitar errores

en los campos de categorías, donde la información se repite.

Basta observar si la opción de autocompletar se activa cuando se está digitando un

registro:

d. Campos importantes: Los campos que contiene una tabla varían según el tipo

de información que sea. Sin embargo, hay tres que son recomendables para todas las

bases de datos:

- Fecha del registro: es diferente a una fecha de nacimiento, fecha de un suceso,

etc. Se trata de la fecha en la que se agregó el registro a la base de datos.

- Fuente: indicar cómo se obtuvo la información. Si hay información en línea

conviene poner allí la URL.

- Observaciones: para agregar cualquier dato adicional.

e. Estilo de los campos: Que las celdas de la tabla tengan color, bordes, negrilla,

alineación derecha o izquierda, sombra, etc., no es relevante para el análisis de

12

datos. Sin embargo, hay un aspecto de la presentación que sí se debe tener en

cuenta: no combinar celdas.

Es preferible ser redundantes en los nombres de los encabezados, que usar la

combinación de celdas, pues ésta no facilita la organización y agrupación de datos.

C. Recomendaciones finales

a. Al terminar de definir la estructura de una base de datos, es bueno hacer varios

ejercicios llenándola con información real o ficticia para encontrar posibles vacíos,

fallas, etc., en el diseño.

b. Es importante mantener unas copias como “back up” de todos los archivos de

bases de datos que tengamos. En CDs o computadores independientes.

SOBRE EL ANÁLISIS DE LOS DATOS

Como periodistas, generalmente no somos expertos en Excel y otros programas para

analizar o cruzar bases de datos; por eso casi siempre la primera preocupación es “¿cómo

voy a hacer el análisis?”, pero deberíamos preguntarnos primero “¿qué voy a analizar?”.

Para resolver eso existe una técnica muy sencilla pero que requiere práctica: consiste en

hacernos múltiples preguntas frente a la tabla de datos como si fuera una fuente a la que

estamos entrevistando; por eso, es importante tratar de sacarle toda la información

relevante posible para no tener que lamentarnos más delante de una pregunta que no

hicimos.

Como ejemplo, pensemos en una tabla de contratación pública de un municipio. Podríamos

hacernos preguntas como: ¿cuál es el contratista con más contratos?, ¿cuál el que acumula

el valor más alto en contratos?, ¿a qué área se están destinando las mayores cantidades,

13

tanto en valor como en porcentaje?, ¿se repiten algunas direcciones o teléfonos incluso con

nombres diferentes?, ¿cuáles son los dueños y socios de las empresas con más contratos?,

¿qué casos llamativos hay?, etc.

Lógicamente, las preguntas y respuestas que obtengamos dependerán de la cantidad y

calidad de la información que contenga la tabla analizada.