universidad de guayaquil facultad de ...repositorio.ug.edu.ec/bitstream/redug/47016/1/tesis...1.4.3...
TRANSCRIPT
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE INGENIERÍA INDUSTRIAL CARRERA DE LICENCIATURA EN SISTEMAS DE
INFORMACIÓN
TRABAJO DE TITULACIÓN
PREVIO A LA OBTENCIÓN DEL TÍTULO DE
LICENCIADO EN SISTEMAS DE INFORMACIÓN
ÁREA
DESARROLLO DE SOFTWARE
TEMA
“IMPLEMENTACIÓN DE UN ALMACÉN DE IMÁGENES
DIGITALES UTILIZANDO UNA BASE DE DATOS NOSQL
QUE PERMITA A LA EMPRESA GENERALI ECUADOR
CIA. DE SEGURO S.A. GUARDAR DOCUMENTOS DE SUS
CLIENTES”
AUTOR
CELLERI GAVILÁNEZ PETER OMAR
DIRECTOR DEL TRABAJO
LSI. LINO CASTILLO KATTY NANCY, MSI
GUAYAQUIL, OCTUBRE 2019
ii
iii
iv
Dedicatoria
Dedico mi trabajo de titulación a mi hija principalmente, que a pesar de todos los
obstáculos que se han presentado siempre ha estado alentándome a seguir adelante, que
junto a mis padres son mi principal fuente motivación.
A todos los docentes que he tenido a lo largo de mi vida que gracias a ellos he podido
llegar hasta este día.
v
Agradecimiento
En primer lugar y sobre todo agradezco a Dios quien ha sido el que me ha dado la
sabiduría y perseverancia para poder llegar hasta este punto de mi vida, mi familia quien
siempre ha estado junto a mí en todo momento, docentes de la facultad y autoridades de la
universidad de Guayaquil.
vi
Índice general
No Descripción Pág
PRÓLOGO 1
INTRODUCCIÓN 2
CAPÍTULO I
MARCO TEÓRICO
No Descripción Pág
1.1 La importancia de la información de los clientes en las empresas de seguro. 10
1.1.1 Las compañías de seguros y el lavado de activos. 11
1.2 La digitalización de documentos como alternativa de almacenamiento. 14
1.2.1 Almacenamiento de información en archivos 14
1.2.2 La Digitalización de documentos 16
1.2.3 Sistemas informáticos documentales 17
1.3 Almacenamiento centralizado de documentos digitales en las empresas. 19
1.3.1 Las TIC en la centralización de información 20
1.3.2 Caso: Implementación de una base de datos de imágenes de facturas 22
1.4 Las alternativas de bases de datos NoSQL como solución viable. 22
1.4.1 Problemas de las bases de datos relacionales 22
1.4.2 Tecnologías emergentes 23
1.4.3 Sistemas de bases de datos distribuidas 23
1.4.4 Sistemas de almacenamiento Not Only SQL 24
1.4.5 Base de datos clave-valor 26
1.4.6 Base de datos orientada a documentos 27
1.4.7 Base de datos NoSQL couchDB 29
1.4.8 Caso: Sistema de gestión de expedientes de los estudiantes de la carrera de
ingeniería de sistemas computacionales 30
1.4.9 ¿Migrar o complementar? 31
1.5 Marco Conceptual 32
1.5.1 Base de datos 32
1.5.2 Datos 33
1.5.3 Rendimiento de las bases de datos 33
vii
1.5.4 Sistema Administrador de Base de Datos 33
1.5.5 Usuarios de un sistema de base de datos 34
1.5.6 Las transacciones 34
1.5.7 Propiedades ACID 34
1.5.8 Bases de datos estructuradas o relacionales 35
1.5.9 Modelo Jerárquico 35
1.5.10 Modelo de red 35
1.5.11 Modelo relacional 35
1.5.12 Orientadas a objetos 36
1.5.13 Teorema CAP 36
1.5.13.1 Consistencia 38
1.5.13.2 Disponibilidad 38
1.5.13.3 Tolerancia a particiones 39
1.5.14 Propiedades BASE 39
1.5.15 Google File System y MapReduce 40
1.5.16 Protocolo TCP/IP 41
1.5.17 Protocolo HTTP 41
1.5.18 Servidor Web 41
1.5.19 PHP (Hypertext Preprocessor) 42
1.5.20 JSON (JavaScript Object Notation) 42
1.5.21 CURL 42
1.5.22 Servicio web REST (Representational State Transfer) 43
1.5.23 SoapUI 43
1.5.24 Proyecto fauxton 43
1.5.25 Diagramas 43
1.5.25.1 Diagrama de caso de uso 44
1.5.25.2 Diagrama de flujo de datos de contexto 44
1.5.25.3 Diagrama de despliegue 44
1.5.26 Metodología de desarrollo de software 45
1.5.26.1 Metodologías Tradicionales 45
1.5.26.2 Metodologías ágiles 46
1.5.26.3 SCRUM 47
1.5.26.4 RAD 48
viii
1.5.26.5 Fases de RAD 48
1.5.26.6 Metodologías de desarrollo en implementación de bases de datos 49
1.5.27 Prueba de software 49
1.5.27.1 Tipos de pruebas 50
1.5.27.2 Método de Caja Negra 50
CAPÍTULO II
METODOLOGÍA
No Descripción Pág
2.1 Tipo de investigación 51
2.2 Alcance de la investigación 52
2.3 Técnicas de recolección de datos 53
2.3.1 Técnica de observación 54
2.3.1.1 Aplicación de la observación 54
2.3.2 Técnica de la entrevista 55
2.3.2.1 Aplicación de entrevistas 55
2.3.2.2 Resumen de las entrevistas para especificaciones funcionales 56
2.3.2.3 Matriz de resumen de entrevistas 57
2.3.3 Recopilación documental 59
2.3.3.1 Búsqueda de cliente. 59
2.3.3.2 Grupo de documentos 60
2.3.3.3 Pantalla de ingreso de documentos 61
2.3.3.4 Pantalla de eliminación y descarga de documentos 62
2.3.3.5 Formato de registro de novedades de respaldo de base de datos 64
2.3.3.6 Reporte estadístico elaborado en Excel 64
2.3.3.7 Notificación sobre problemas en el proceso de respaldos 65
2.3.3.8 Análisis documental 66
2.4 Arquitectura 66
2.5 Metodología de desarrollo 67
2.6 Identificación del problema 67
2.7 Especificaciones funcionales 69
2.7.1 Requerimientos funcionales 69
2.7.2 Requerimientos no funcionales 69
ix
2.8 Casos de uso 69
2.8.1 Definición de actores de casos de uso y listado de roles 70
2.8.2 Diagramas de casos de uso 70
2.8.2.1 Diagramas de casos de uso de mantenimiento de documentos 70
2.8.2.2 Descripción de casos de uso 71
2.8.2.3 Descripciones de casos de uso de insertar documento 71
2.8.2.4 Descripciones de casos de uso de descargar documento 72
2.8.2.5 Descripciones de casos de uso de eliminar documentos 73
2.9 Diagrama de flujo de datos de contexto 73
2.10 Diagrama de despliegue 74
CAPÍTULO III
PROPUESTA
No Descripción Pág
3.1 Introducción 75
3.1.1 Tema 75
3.1.2 Objetivo 75
3.1.3 Entorno de software 75
3.2 Fase de diseño 75
3.2.1 Modelo entidad – relación 75
3.2.2 Diagrama de actividades 77
3.2.3 Diccionario de la base de datos – MySql 80
3.2.3.1 Diccionario de la tabla de documentos 80
3.2.3.2 Diccionario de la tabla de cliente 82
3.2.3.3 Diccionario de la tabla grupo de documentos del cliente 84
3.2.3.4 Diccionario de la tabla imágenes del documento 86
3.2.4 Diccionario de la base de datos – CouchDB 88
3.2.4.1 Diccionario de documento JSON documentos 88
3.3 Pruebas 90
3.3.1 Casos de prueba 91
3.3.1.1 Caso de prueba conexión a la base de datos mediante servicio web REST 91
3.3.1.2 Caso de prueba de insertar documento 92
3.3.1.3 Caso de prueba de descargar documento 93
x
3.3.1.4 Caso de prueba de eliminar documento 94
3.3.2 Pruebas con SoapUI 95
3.3.3 Prueba de integración con el sistema SIDD 97
3.3.3.1 Ingreso de archivo 97
3.3.3.2 Descargar archivo desde el sistema SIDD 99
3.3.3.3 Eliminar documentos desde el sistema SIDD 101
3.4 Conclusión y recomendación 102
3.4.1 Conclusiones 102
3.4.2 Recomendaciones 103
ANEXOS 105
BIBLIOGRAFÍA 109
xi
Índice de tablas
No Descripción Pág
1 Resumen de problemas detectados en el personal de cumplimiento 68
2 Resumen de problemas detectados en el departamento de IT 68
3 Requerimientos funcionales 69
4 Requerimientos no funcionales 69
5 Lista de roles 70
xii
Índice de figuras
No Descripción Pág
1 Ubicación geográfica de la empresa Generali Ecuador Cía. De Seguros S.A 4
2 Fotografía del servidor de Generali Ecuador 6
3 Beneficios de los sistemas de gestión documental 18
4 Almacenamiento clave-valor 27
5 Almacenamiento de colección de documento 28
6 Comparación de base de datos NoSQL 29
8 Imagen de un sistema de base de datos 32
9 Representación de una tabla en el modelo relacional 36
10 Representación gráfica del teorema CAP 38
11 Representación gráfica del proceso mapreduce 41
12 Representación de una estructura JSON 42
13 Uso de librería curl con lenguaje de programación PHP 43
14 Ejemplo de diagrama de despliegue 44
15 Clasificación de metodologías de desarrollo 45
16 Comparación de metodologías ágiles y tradicionales 46
17 Representación de las fases de la metodología SCRUM 47
18 Fases de la metodología RAD 48
19 Formulario de búsqueda de cliente 60
20 Formulario de grupo de documentos 61
21 Formulario de ingreso de nuevos documentos 62
22 Formulario de consulta de documentos 63
23 Descarga o eliminación de documentos 63
24 Formato de registro de ejecución de respaldos 64
25 Reporte estadístico del proceso de respaldos 64
26 Notificación de problemas en la base de datos de MySql. 65
27 Arquitectura de couchDB 66
28 Etapas del presente proyecto basado en la metodología RAD 67
29 Diagrama de casos de uso de interacción con el sistema 70
30 Diagrama de flujo de datos de contexto 74
31 Diagrama de despliegue, se presenta gráficamente la estructura y la distribución
de los componentes entre los diferentes componentes que integran el proceso. 74
xiii
32 Diagrama de modelo de datos MySql 76
33 Diagrama de actividad de descarga de documento 77
34 Diagrama de actividad de ingresar documentos 78
35 Diagrama de actividad de eliminar documento 79
36 Diccionario de la tabla de documentos 80
37 Diccionario de la tabla de clientes 82
38 Diccionario de la tabla grupo de documentos del cliente 84
39 Diccionario de la tabla imágenes del documento 86
40 Estructura de documento JSON documentos 88
41 Conexión a la base de datos mediante servicio web REST 95
42 Insertar datos mediante servicio web REST 95
43 Consultar datos mediante servicio web REST 96
44 Eliminar datos mediante servicio web REST 96
45 Contenido de documento JSON 98
46 Descarga de archivo desde el sistema SIDD 100
47 Eliminar documento desde el sistema SIDD 102
xiv
Índice de anexos
No Descripción Pág
1 ENTREVISTAS 106
xv
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE INGENIERÍA INDUSTRIAL
CARRERA LICENCIATURA EN SISTEMAS DE INFORMACIÓN
UNIDAD DE TITULACIÓN
“IMPLEMENTACIÓN DE UN ALMACÉN DE IMÁGENES
DIGITALES UTILIZANDO UNA BASE DE DATOS NOSQL QUE
PERMITA A LA EMPRESA GENERALI ECUADOR CIA. DE
SEGURO S.A. GUARDAR DOCUMENTOS DE SUS CLIENTES”
Author: Peter Celleri Gavilánez
Tutor: Eng. Kattty Lino Castillo, Msig.
Resumen
La finalidad del presente proyecto se implementó un almacén de documentos digitalizados
de los clientes de la empresa Generali Ecuador Cía. de Seguros S.A., mediante el uso de
base de datos NoSQL las cual también permitió centralizar dicha información. Que
mediante un análisis se determinó que la actual base de datos no soportar la carga operativa
que representa almacenar los archivos digitalizados. Así como también se observó que
algunas de estos documentos se encontraban disperso en otros sistemas de la compañía.
Con esta nueva base de datos lograremos mejorar la búsqueda de los documentos de
clientes, así como también mejoraremos los procesos administrativos relacionado con la
base de datos.
Palabras claves: Implementar, Almacenar, Centralizar, Base de datos, NoSQL,
documentos digitalizados.
xvi
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE INGENIERÍA INDUSTRIAL
CARRERA LICENCIATURA EN SISTEMAS DE INFORMACIÓN
UNIDAD DE TITULACIÓN
“IMPLEMENTATION OF A STORE OF DIGITAL IMAGES USING
A NOSQL DATABASE THAT ALLOWS THE COMPANY
GENERALI ECUADOR CIA. DE SEGURO S.A. TO SAVE
DOCUMENTS FROM ITS CUSTOMERS”
Author: Peter Celleri Gavilánez
Tutor: Eng. Kattty Lino Castillo, Msig.
Abstract
The proposal of the present project is to implement a store of digitized documents for the
clients of the company Generali Ecuador Cía. de Seguros S.A., through the use of the
NoSQL database, which can also centralize this information. And through an analysis it
was determined that the currently database does not support the operational load
represented by the scanned files. And also it was observed that some of these documents
were dispersed in other systems of the company. With this new database, it will be able to
improve the search for customer documents, as to well as to improve the administrative
processes related to the database.
Key words: implement, centralization, Storage, Data base, NoSQL, Digital documents.
PRÓLOGO
El objetivo del presente trabajo de titulación inicialmente fue pensando para adquirir un
mayor conocimiento sobre las bases de datos no estructuradas y que el presente documento
sirva como guía para personas que no tienen los conocimientos necesarios para
implementar un proyecto con este tipo de bases de datos.
Este proyecto está estructurado en 3 capítulos, los cuales están detallados a
continuación:
Capítulo 1: Elaboración del marco teórico, se investiga, compara y analiza las bases de
datos que se implementará dentro del presente trabajo de titulación.
Capítulo 2: Descripción de la metodología, se realiza el levantamiento de información
de acuerdo a las técnicas utilizadas para la investigación, elaboración de caso de uso y
diagramas.
Capítulo 3: La propuesta de la investigación en la cual se detalla el proceso de la
solución propuesta, complementando con las conclusiones y recomendaciones del estudio
realizado.
INTRODUCCIÓN
Tema
Implementación de un almacén de imágenes digitales utilizando una base de datos
NoSQL que permita a la empresa Generali Ecuador Cía. de Seguro S.A. guardar
documentos de sus clientes.
Introducción
Objeto de estudio
El presente proyecto tendrá como objeto de investigación el proceso de almacenamiento
y centralización de documentos digitalizados de los clientes de la empresa Generali
Ecuador Cía. De Seguros S.A.
Antecedentes
Generali Ecuador Cía. de Seguros S.A. es una empresa del sector asegurador
domiciliada en Ecuador, pero que es propiedad de un Holding internacional conocido
como GRUPO GENERALI; Generali Ecuador cuenta con una participación de 4,2% del
mercado de seguros dentro del país.
Por la política interna “Conozca a su cliente” de la normativa vigente del GRUPO
GENERALI para Generali Ecuador es de gran importancia almacenar copia digitalizada de
los documentos legales de sus clientes, inspecciones riesgos asegurados o siniestros
incurridos. El no cumplimiento de esta normativa puede llevar a sanciones económicas por
parte del GRUPO GENERALI e incluso la separación del cargo a las personas que la
incumplan.
Actualmente la empresa cuenta con un sistema denominado SIDD (Sistema Integrado
de Digitalización de Documentos), que mediante una interfaz web permite seleccionar un
archivo electrónico y almacenarlo en una base de datos.
El sistema SIDD es una aplicación informática que se utiliza para guardar algunos de
los documentos de los clientes tales como: copia de cédula, papeleta de votación, planilla
de servicios básicos, entre otros documentos.
El sistema SIDD no se usa para almacenar toda la documentación de los clientes ya que
existen documentos que son generados por otros sistemas de la empresa tales como las
facturas electrónicas, pólizas electrónicas, informes de inspección, informes de siniestros,
formularios de vinculación de clientes, entre otros documentos.
Introducción 3
Alcance
El alcance del presente proyecto de titulación busca mejorar el proceso de
almacenamiento de documentos digitales implementando una base de datos NoSQL que
permita centralizar los documentos del cliente, minimizando el impacto por las
modificaciones realizadas en los actuales sistemas de la empresa Generali Ecuador Cía. De
Seguros.
Para este proyecto se plantea un piloto en donde la nueva base de datos documental se
integre con el actual proceso de almacenamiento de documentos, almacenando la
información desde el momento de la implementación del mismo. En el presente proyecto
no se considera una migración de datos de la base de datos MySql a la base de datos
couchDB.
Fundamento de la investigación
El presente proyecto de tesis con el apoyo tecnológico permitirá solucionar los
problemas que suscitan en la empresa Generali Ecuador Compañía de Seguros S.A. con
relación al almacenamiento disperso de los documentos digitales de sus clientes.
Por qué del tema
Se seleccionó este tema por el interés que representa conocer las prestaciones que
brindan las bases de datos no estructuradas frente a este tipo de proyectos y por medio de
este trabajo de tesis compartir la solución propuesta.
Por otra parte, en el ámbito profesional como analista programador, la implementación
de este proyecto aportará en gran medida para adquirir conocimientos de mucho valor
relacionados al uso de base de datos no estructuradas.
Orígenes teóricos
En el marco de la teoría informática, el presente tema se desarrolló mediante una serie
de entrevistas realizadas a varios usuarios de los diferentes procesos relacionados con la
generación y almacenamiento documentos digitalizados de los clientes de la empresa
Generali Ecuador Cía. de Seguros S.A.
Las entrevistas se realizaron a usuarios claves dentro del proceso de registro de
documentación digitalizada de los clientes, estos usuarios son quienes utilizan o
Introducción 4
administran los sistemas informáticos de la empresa y se ven afectado directamente por la
ausencia de una base de datos que permita la óptima manipulación de dichos documentos.
Objeto de la investigación
Delimitación espacial
El presente proyecto se realizará en la empresa Generali Ecuador Cía. de Seguros S.A la
cual ofrece sus servicios a nivel nacional, pero cuya agencia principal se encuentra
domiciliada en el cantón Guayaquil de la provincia del Guayas del Ecuador.
Figura 1. Ubicación geográfica de la empresa Generali Ecuador Cía. De Seguros S.A., información
adaptada de https://www.google.com/maps (2019)
Delimitación del tema
Este proyecto plantea determinar la situación actual de cómo se lleva a cabo el proceso
de almacenamiento de la información digitalizada de los clientes en la empresa Generali
Ecuador Cía. de Seguros S.A., ayudando a agilizar los procesos relacionados al
almacenamiento de esta información.
Introducción 5
Para el desarrollo de esta propuesta, se implementará una base de datos no estructurada
para el registro y consulta de documentos digitalizados.
El proyecto concibe desarrollar un modelo que respalde la autonomía del almacén de
datos y la integridad de las mismas mediante la implementación de servicios web como
capa de acceso a datos. Esto es posible debido a que couchDB tiene integrado un API
REST el cual se utiliza para interactuar con la base de datos mediante peticiones HTTP
usando los métodos GET, POST, PUT y DELETE.
Este proyecto no pretende desarrollar un programa que permita automatizar la
digitalización de documentos, sino crear un base de datos documental que permita
almacenar los documentos digitalizados de clientes.
Delimitación semántica
Un documento digital por así decirlo hace referencia a una fotocopia electrónica de un
documento físico, el cual se puede almacenar en una computadora. Estos documentos
digitales tienen muchas ventajas frente a los documentos físicos, entre las cuales podemos
señalar que los documentos digitales son prácticamente indestructibles, son fácilmente
duplicables y que no ocupan un espacio físico como archivadores, etc.
Por otra parte, la centralización de documentos se podría explicar como el lograr ubicar
en un mismo lugar documentos que provienen desde diferentes orígenes. Esto supone una
gran mejora en la administración de los documentos al reducir los lugares de búsqueda y el
tiempo que se ocupa en dicha tarea.
Determinación de recursos
La empresa Generali Ecuador Cía. de Seguros S.A. cuenta con el departamento de
sistemas el cual administra los recursos de informáticos de la empresa, así mismo cuenta
con el departamento de cumplimiento el cual controla la ejecución de las políticas del
GRUPO GENERALI. Ambos departamentos facilitaron los siguientes recursos:
Recursos humano
Rodrigo Pazos Ortiz, Ingeniero de sistemas, Administrador del centro de cómputo.
John Navarrete Zuñiga, Tecnólogo de sistemas, Desarrollador.
Johan Beltran, Ejecutivo de cumplimiento.
Introducción 6
Recursos tecnológicos
Recursos de software
Apache couchDB, base de datos NoSQL, versión 2.3.1
MySql, base de datos relacional, versión 5.5.16
Servidor web apache, versión 2.0
PHP, lenguaje de programación web, versión 5.5.6
Sublime text, editor de texto para código fuente, versión 3.2.1
Recursos de Hardware
Ordenador de escritorio Lenovo thinkcentre con procesador Intel core i5 2.90 GHz,
8GB de memoria RAM y disco duro SSD de 500GB
Servidor IBM x3650 M4 con procesador Intel Xeon E5-2600 v2 de 12 núcleos, 32GB
de memoria RAM, 1TB de disco duro SAS en RAID 5
Figura 2. Fotografía del servidor de Generali Ecuador, Servidor IBM X3650 M4, por el autor (2019)
Planteamiento del problema
Debido al crecimiento de Generali en el mercado de seguros del país, el número de
clientes está aumentando significativamente lo que implica que cada vez es mayor el
volumen de documentos electrónicos que se tiene que almacenar.
Muchos de estos documentos se encuentran almacenados en diferentes servidores por el
motivo que son archivos generados por varias aplicaciones que tiene la empresa para
manejar su operación diaria, lo que ocasiona que los usuarios deban buscar los documentos
del cliente en diferentes lugares.
Introducción 7
Aunque la empresa cuenta con un Sistema Integrado de Digitalización de Documentos
(SIDD) este sistema se utiliza únicamente para guardar copia de los documentos legales de
los clientes como copia de cédula, papeleta de votación, etc. documentos que por
normativa de la empresa tienen que ser actualizados anualmente.
Esta condición ha generado alto consumo de los recursos del servidor en donde se
encuentra alojado el sistema SIDD, como efecto de la carga operacional que recibe
actualmente el motor de base de datos los discos duros han sufrido daños por el uso
excesivo a causa de la lectura y escritura de información.
Cada vez son más frecuentes las quejas de los usuarios que operan el sistema SIDD
debido a la considerable disminución del rendimiento de las operaciones de consultas,
inserción y actualización de documentos, proceso que cada vez toma más tiempo
completar. También cabe mencionar el aumento de la complejidad en las tareas
administrativas de la base de datos del sistema SIDD como son la ejecución de respaldos y
la restauración de los mismos; sacar una copia de la base de datos tarda aproximadamente
8 horas y 13 horas restaurar un respaldo, tiempo que aumenta progresivamente con el pasar
de los días, causando problemas al administrador de la base de datos al no contar con el
tiempo para realizar dichas tareas.
Justificación de la investigación
Implementar una base de datos que tenga mejores prestaciones ayudará a soportar la
carga operacional que implica almacenar los documentos digitalizados de los clientes de la
empresa.
También permitirá aumentar el rendimiento del Sistema Integrado de Digitalización de
Documentos (SIDD) haciendo que los usuarios se sientan más satisfechos al momento de
utilizarlo en sus labores diarias.
El sistema SIDD también tendrá la posibilidad almacenar archivos con otros formatos
como PDF, ZIP, documentos de Word, Excel, etc. y no únicamente imágenes como
actualmente lo hace.
Para minimizar el impacto de modificación en el sistema SIDD de la empresa, se
implementarán servicios web REST como interfaz de acceso a datos a la base de datos;
eliminando las colas de conexión desde el aplicativo, permitiendo mayor fluidez en la
ejecución de sentencias de lectura y escritura de datos.
Introducción 8
Relevancia social
Este proyecto impactará a dos grupos de usuarios dentro de la empresa, los cuales
describimos a continuación:
Los ejecutivos de cumplimientos, que son los usuarios encargados de velar que
la documentación de los clientes se encuentre actualizada. Al mantener la
información en solo lugar se les hará más fácil realizar sus tareas.
Los administradores de base de datos, que son los encargados de administrar y
mantener en funcionamiento las bases de datos de la empresa, que podrán
realizar tareas administrativas de manera más ágil y oportuna.
Pertinencia
La implementación de este proyecto permitirá que los ejecutivos de cumplimientos
puedan desarrollar sus labores de una manera más eficiente al ejecutar la política “Conozca
a su cliente” del GRUPO GENERALI. Debido a que en la actualidad los ejecutivos de
cumplimiento para indagar sobre un cliente en particular tienen que buscar la
documentación en diferentes sistemas.
Introducción 9
Objetivos
Objetivo General
Implementar una base de datos NoSQL que almacene y centralice los documentos
digitalizados de los clientes de la empresa Generali Ecuador Cía. de Seguros S.A., que
permita al departamento de cumplimiento realizar sus labores de manera más eficiente.
Objetivos Específicos
1. Recopilar información necesaria para determinar la problemática relacionada con los
procesos de la gestión de documental de los clientes.
2. Analizar la información recabada.
3. Diseñar la estructura de la base de datos y las operaciones de lectura y escritura de los
datos.
4. Implementar servicios web como interfaz de acceso a la base de datos, que
reemplazaran la capa de acceso a datos del Sistema Integrado de Digitalización de
Documentos (SIDD).
5. Gestionar procesos de pruebas funcionales que permitan evidenciar el correcto
funcionamiento de la base de datos. y su integración con el sistema SIDD
CAPÍTULO I
MARCO TEÓRICO
1.1 La importancia de la información de los clientes en las empresas de seguro.
(Cevallos, J. R. M., & Holguín, B. L. D., 2018) dice que:
La creciente globalización, el proceso de internacionalización de la
empresa, el incremento de la competencia en los mercados de bienes y
servicios, la rapidez en el desarrollo de las tecnologías de información, el
aumento de la incertidumbre en el entorno y la reducción de los ciclos de
vida de los productos originan que la información se convierta en un
elemento clave para la gestión, así como para la supervivencia y
crecimiento de la organización empresarial. (Cevallos, J. R. M., &
Holguín, B. L. D., 2018)
Este concepto describe el vertiginoso camino que actualmente recorren las empresas,
indiferente del tipo que esta sea. El mercado al que apuntan cada vez es más competitivo,
más fraccionado (como es el caso de las empresas nacionales que tiene que competir con
las grandes empresas transnacionales), Para contrarrestar estos eventos las empresas deben
usar la información de la mejor manera posible para evolucionar táctica y
tecnológicamente con el objetivo de alcanzar un mejor nivel competitivo que les permita
aumentar sus ganancias. La optimización de procesos es una parte fundamental de la
transformación empresarial en especial de los procesos que tienen un impacto directo al
cliente.
(Sánchez, A., 2007) dice que:
Para una empresa es clave del éxito el conocer y dirigirse a los “Grupos
Claves” de clientes para satisfacerlos a través de los procesos adecuados
que contribuyan a tal fin, adaptando a los mismos los recursos y toda la
organización. Por ello, toda empresa debe de empezar por diferenciar a
sus clientes (y a los clientes de la competencia a los que quiera dirigirse),
distinguiendo a aquellos que son “claves” para el modelo de negocio que
haya definido. Además, deberá de agrupar a los clientes en función de
criterios que le permita tratarlos con diferentes estrategias, adecuándose
Marco teórico 11
mejor a sus necesidades para así poder ofrecérselas. Esto le podrá crear
una ventaja competitiva frente a la competencia. (Sánchez, A., 2007)
Según lo descrito por Sanchez A. se puede entender que las empresas deben centrar sus
esfuerzos en los clientes, obtener información de ellos, conocer sus preferencias. Contando
con esta información y un análisis minucioso de la misma, las empresas podrán crear
productos y servicios adaptados a las necesidades de los clientes. Todo este proceso
permitirá a las empresas tener la oportunidad de mantenerse pionero del mercado y lograr
los objetivos comerciales.
1.1.1 Las compañías de seguros y el lavado de activos.
Antes de hablar de las compañías de seguros, primero se debe de conocer el concepto de
“riesgo”, el cual es un concepto fundamental para este tipo de compañías.
(Legislación sobre contrato del seguro, 1963, Art. 4) dice que:
Denominase riesgo el suceso incierto que no depende exclusivamente
de la voluntad del solicitante, asegurado o beneficiario, ni de la del
asegurador y cuyo acaecimiento hace exigible la obligación del
asegurador. Los hechos ciertos, salvo la muerte, y los físicamente
imposibles no constituyen riesgo y son, por tanto, extraños al
contrato de seguro. (Legislación sobre contrato del seguro, 1963)
Por lo que se puede entender un riesgo es un peligro, es la posibilidad de que un evento
suceda y se cause un perjuicio para la persona dueña del objeto en riesgo. Este objeto
puede ser un bien material como son las casas, carros, etc. o puede también ser intangible
como la salud o la vida. Cuando un riego es materializado se denomina siniestro.
Otro concepto de riesgo es que él que publica una de las grandes aseguradoras
internacionales en su portal de educación financiera y de seguros.
(Fundación Mapfre, 2019) dice que:
Desde un punto de vista general, puede también entenderse como
una «actividad económica-financiera que presta el servicio de
transformación de los riesgos de diversa naturaleza a que están
sometidos los patrimonios, en un gasto periódico presupuestable, que
Marco teórico 12
puede ser soportado fácilmente por cada unidad patrimonial».
(Fundación Mapfre, 2019)
El concepto anterior amplía un poco más el conocimiento sobre los riesgos y su relación
con las empresas de seguros, con lo cual se entiende que, si una persona u organización
contrata los servicios de una empresa de seguros, en palabras generales lo que está
haciendo es intercambiar un riesgo por un gasto.
(Larrea Ayala, L., 2003) dice que:
Uno de los mecanismos que la inteligencia humana encontró para
minimizar el impacto económico que la ocurrencia de los hechos y
actos referidos anteriormente ocasionan, fue la transferencia del
riesgo, la misma que dio origen a lo que ahora conocemos como
“Institución del Seguro” y cuya aplicación ha permitido que las
sociedades puedan mantener vigentes sus objetivos superiores.
(Larrea Ayala, L., 2003)
Los riesgos son la razón de la existencia de las empresas de seguros, el giro del negocio
de una aseguradora es vender contratos de seguros o pólizas de seguros, las cuales son
utilizadas por los clientes para mitigar las pérdidas económicas en consecuencia de un
siniestro. Es decir, si un cliente compra una póliza de seguros, en el momento que ocurra
un siniestro la empresa de seguros tendrá cubrir con los gastos de la reposición de dicha
pérdida
La UAFE dice que: “El lavado de activos es el proceso a través del cual los bienes de
origen delictivo se integran al sistema económico financiero legal aparentando haber
sido obtenidos de forma lícita”. UAFE (2019)
Las fuentes más comunes de bienes ilícitos son el tráfico de drogas, personas y armas, el
secuestro, fraude fiscal, peculado, enriquecimiento ilícito, etc.
Estos bienes al no tener una procedencia legal pueden ser embargado o retenidos por los
entes de control y es por esta razón que las organizaciones delictivas “lavan” los bienes
para luego hacer uso de los mismos como en comprar: casas, carros, viajar o forman
empresas legalmente constituida o simplemente depositar el dinero en bancos.
Marco teórico 13
(Andrade, J., 2009) dice que:
En algunas ocasiones, con la posible complicidad del agente de
seguros, el lavador asegura los bienes por un valor superior al real
(supraseguro); igualmente, asegura bienes inexistentes; o asegura
bienes existentes, pero, de alguna manera, relacionados con
actividades ilícitas, que luego son siniestrados… El delincuente
recibe por parte de la aseguradora dinero lícito, en algunos casos por
devolución y en otros por compensación, al mismo tiempo logra
deshacerse de bienes obtenidos en actividades criminales. De esta
manera tratara de justificar el origen de su dinero en el pago de
pólizas de seguros. (Andrade, J., 2009)
Las compañías de seguros desde hace mucho tiempo han sido objetivos de mafias
organizadas dedicadas al lavado de dinero. Que mediante compra de pólizas de seguros
intenta ocultar bienes de origen ilícito. Para minimizar este riesgo el GRUPO GENERALI
ha implementado una política denominada “conozca a su cliente” la cual guarda en
archivos electrónicos copia de los documentos legales de los clientes previo a la venta de
un seguro, la documentación posteriormente será sometida a análisis por los ejecutivos de
la compañía.
(Generali Ecuador Cía. de Seguros, 2019) dice que:
La identificación del cliente implica el conocimiento y revisión de los
datos proporcionados por el cliente, persona natural o jurídica, al
momento de la vinculación, durante el transcurso de la relación y al
momento de la renovación de la relación contractual, ya sea en la
suscripción de pólizas, al realizar pagos relacionados con el contrato
del seguro o reaseguro o al proporcionar cualquier otro servicio.
(Generali Ecuador Cía. de Seguros, 2019)
Para las compañías de seguros no solo es necesario tener un simple registro de clientes,
sino que es imprescindible contar con un registro ampliado de clientes, es decir la empresa
debe saber el estado financiero del cliente, el origen de sus ingresos e incluso su estado de
salud. Además de tener que solicitar copia de documentos legales como cédula de
identidad, actas de constitución en caso de ser una empresa, planilla de servicios básicos,
Marco teórico 14
etc. Esta información tendrá una vigencia y deberá ser pedida al momento de renovar el
contrato de seguros o cuando se realicen pago a causas de siniestros.
(Casares, I. S. A. B. E. L., 2013) dice que:
Las empresas deberían contar con una infraestructura adecuada
para soportar el sistema de evaluación y gestión de riesgos, en
función de las características, tamaño y complejidad de las
operaciones de la empresa, por lo que se debería dotar de recursos
humanos y tecnológicos que sean necesarios para la administración
de los riesgos. (Casares, I. S. A. B. E. L., 2013)
El párrafo anterior explica que existe mucha información de los clientes que las
empresas de seguros deben almacenar. Por lo cual Casares indica que es imprescindible
contar con un proceso archivístico que permita albergar toda esta información, para que
posteriormente pueda ser consultada y ser sometida a procesos de evaluación y
clasificación de riesgos. Esto es importante debido a que la información del cliente siempre
estará disponible y será sometida a escrutinio cuando sea necesario, como es el caso de
revisiones periódicas por renovación de contratos o auditorías internas y externas. Pero
sobre todo el análisis de estos documentos con técnicas previamente establecidas por la
compañía permite detectar índices de fraude o lavado de activos. De esta manera se mitiga
los riesgos y se evitan perjuicios económicos para la empresa de seguro o sanciones
judiciales como la suspensión de las actividades comerciales.
1.2 La digitalización de documentos como alternativa de almacenamiento.
1.2.1 Almacenamiento de información en archivos
(Fugueras, R. A., 2003) dice que:
Los archivos también son las instituciones responsables de velar por
esta documentación, así como el espacio físico donde se conserva
adecuadamente para garantizar su accesibilidad, preservación y uso.
(Fugueras, R. A., 2003)
El archivo como tal es una entidad que puede ser física o abstracta cuyo objetivo
principal es la conservación de la información plasmada en los documentos y que se
Marco teórico 15
encarga de organización y almacenamiento de los mismos, para que de tal manera puedan
ser asequibles para ser consultados.
Antes de los sistemas de información, contar con un archivo era una buena opción para
almacenar los documentos de los clientes, pues con el archivo se soluciona el problema de
guardar y consultar la copia de los documentos de los clientes. Pero también conlleva otros
problemas propios de este método de almacenamiento como son: Ocupación de un espacio
físico para el alojamiento de los documentos, acceso limitado a los documentos, desgaste y
fragilidad de los documentos, gastos de mantención, etc.
(Urbina, G. B., 2016) dice que:
Hoy día, la información no se protege y preserva sólo para que no
sea dañada, sino por la importancia y el uso que ésta tiene en todos
los ámbitos de la vida. El comercio internacional, las instituciones
bancarias y todo tipo de empresas mantienen sus operaciones gracias
a que la información fluye a través de todos sus departamentos y
áreas. La información se utiliza en cualquier empresa para realizar
cuatro tipos de operaciones: planeación, dirección, organización y
control. (Urbina, G. B., 2016)
Las organizaciones deben velar por la seguridad de cada documento que ingresa a sus
librerías y asegurar su permanencia durante el tiempo que sean requeridos, es por eso que
las empresas constantemente deben implementar nuevos métodos de almacenamiento de
documentos que permitan incrementar tanto el almacenamiento como la seguridad de la
información de forma eficiente en vías de mejorar la calidad del contenido.
(Sánchez, A. E., 2014) dice que:
Las innovaciones de proceso incluyen también las nuevas o
mejoradas técnicas, equipos y programas informáticos utilizados en
las actividades auxiliares de apoyo. (Sánchez, A. E., 2014)
Para lograr un mayor índice de competitividad en el actual mercado las empresas deben
mejorar sus procesos, a todo nivel desde los procesos misionales o mandatorios hasta los
procesos de apoyo, en especial aquellos procesos que generan conocimiento, los que
permiten tomar decisiones de forma más ágil y oportuna.
Marco teórico 16
1.2.2 La Digitalización de documentos
(Mesa, E. G., 2006), dice que:
La digitalización es la captura de una imagen física, mediante
escáner o cámara digital, que una vez convertida en imagen
electrónica puede ser almacenada y procesada por una
computadora. (Mesa, E. G., 2006)
De acuerdo al enunciado anterior la digitalización de documentos es el proceso
informático que se emplea para crear una réplica electrónica de un documento físico. El
producto final de este proceso es un archivo electrónico el cual seguramente será guardado
dentro de los discos duros en los servidores de la compañía para luego ser consultado por
los empleados de la misma. Núñez Quiroz, J. J. en el 2019 indica que existen algunas
razones por las que una empresa puede iniciar un proyecto de digitalización documental,
las cuales son:
Incrementar el acceso: Un proyecto de digitalización permite incrementar el acceso a
los documentos por parte de los usuarios, es decir los documentos podrán ser
consultados o compartidos por varios usuarios al mismo tiempo y de igual manera un
mismo usuario podrá acceder a varios documentos en un periodo muy corto de tiempo
lo que le permitirá rápidamente obtener nuevos conocimientos que le servirán para
tomar decisiones.
Mejorar los servicios: Este punto guarda una estrecha relación con el punto anterior,
debido a que incrementar el acceso a los documentos proporciona una mejora en la
calidad de los servicios ofrecidos a los usuarios al reducir el tiempo de espera por parte
del usuario que solicita un documento.
Reducir la manipulación: Con la digitalización se evita la manipulación de papeles,
carpetas, archivadores, etc. Además, se reduce el desgaste de los documentos originales
y se evita sacar fotocopias de los mismos.
(Mesa, E. G., 2015), dice que:
La digitalización no sólo es un método económico, dinámico y fiel en
la preservación y/o conservación de la información y sus
documentos, sino también es una herramienta que bien utilizada
permite la restauración y reconstrucción de la información
contenida, adquiriendo de esta forma un valor agregado y
Marco teórico 17
propiciando un sistema de gestión documental mediante el cual la
información se estructurará de forma fácil, rápida y cómoda para el
usuario o cliente. (Mesa, E. G., 2015)
Como se puede observar, Mesa aporta otro beneficio de la digitalización de
documentos, el cual consiste en que tener la información digitalizada nos permite crear
nuevo conocimiento de manera más rápida, esto es debido a que se puede relacionar los
documentos y su contenido de forma ágil. Pero así mismo Mesa indica que para ello se
necesita un sistema informático con interfaz de usuario que permita gestionar los
documentos de manera amigable y eficiente de acuerdo a las necesidades de la empresa y
el usuario, estos sistemas se denominan “Sistemas de Gestión Documental”.
(García-Canal, E., Rialp-Criado, A., & Rialp-Criado, J., 2015) dice que:
“a través de la disponibilidad de una mayor y mejor información,
obtenida de forma más rápida y económica, permite aumentar la
eficiencia administrativa tanto de los procesos internos como la
gestión de las relaciones con clientes y proveedores” (García-Canal,
E., Rialp-Criado, A., & Rialp-Criado, J., 2015)
Mejorar el proceso de almacenamiento de la documentación de los clientes con un
esquema de digitalización de documentos es una opción viable, especialmente cuando los
documentos son el origen de información que resulta valiosa para la organización, como es
el caso de los documentos de los clientes de las empresas de seguros. En la práctica, el
poder acceder a los documentos de manera más fluida permitirá a los ejecutivos de la
compañía ejecutar de manera más eficiente el proceso de revisión periódica de dichos
documentos.
1.2.3 Sistemas informáticos documentales
Tic. Portal (2016) dice que: “Beneficios de los sistemas documentales, reducción de
costes gracias a información estructurada, mejor porcentaje en documentos y aumento de
la velocidad de creación de contenidos”. Tic. Portal (2016)
Implementar un sistema documental posee muchos beneficios con relación a los
métodos de archivos convencionales, entre los cuales se puede nombrar la reducción de
Marco teórico 18
espacio físico que se utiliza para guardar los documentos, reducción de costos de
mantenimiento de dicho espacio físico, entro otros.
Figura 3. Beneficios de los sistemas de gestión documental, información tomada de https://www.ticportal.es/
(2016)
También se aumenta considerablemente la capacidad almacenamiento ya que los
documentos se guardan en ficheros electrónicos. Adicionalmente los sistemas
documentales permiten procesar simultáneamente diferentes documentos de varias fuentes,
lo que se traduce en un aumento del rendimiento en la gestión de documentos.
(Sánchez-Vignau, B. S., & Valdés-López, Y., 2008) dice que:
En un Sistema de Información Documental, por tanto, la recuperación de
información esta relacionada con la representación del conocimiento registrado
en documentos, con la representación de las necesidades de información de los
usuarios del sistema y con el desarrollo de una función capaz de comparar
ambas, así como seleccionar los documentos más relevantes para solucionar la
necesidad de información. (Sánchez-Vignau, B. S., & Valdés-López, Y., 2008)
Almacenar, conservar y distribuir información son las funciones principales de los
sistemas informáticos documentales, la información contendía en los documentos se
relaciona entre sí para generar nuevo conocimiento, el cual tiene como finalidad ser
utilizado para resolver problemas de la organización.
(Ley General de Seguros, 2014, Art. 29) dice que:
Las empresas de seguros están obligadas a conservar los duplicados de las
pólizas expedidas y sus anexos, por lo menos hasta tres años después de la fecha
de su vencimiento, excepto las pólizas de seguro marítimo que se conservarán
por lo menos seis años. (Ley General de Seguros, 2014)
Marco teórico 19
El artículo 29 de la ley general de seguros obliga que durante un periodo no menor a
tres años las aseguradoras deben mantener en sus archivos la documentación vinculada a la
emisión de las pólizas de seguro. Este periodo inicia luego del fin de la vigencia de la
póliza, es decir las empresas de seguros en promedio deberán tener a la mano los
documentos de los clientes durante cuatro años.
La viabilidad de implementar la digitalización como método de almacenamiento de
documentos es un compendio de características, beneficios y necesidades que se
interrelacionan para en base a la tecnología informática solucionar determinados problemas
del mercado.
1.3 Almacenamiento centralizado de documentos digitales en las empresas.
(Solleiro, 2017) dice que:
La gestión tecnológica es, en resumen, un campo interdisciplinario
en que se mezclan conocimientos de ingeniería, ciencia y
administración con el fin de realizar la planeación, el desarrollo y la
implementación de soluciones tecnológicas que contribuyan al logro
los objetivos estratégicos y tácticas de una organización. (Solleiro,
2017)
En la actualidad las empresas consideran a la tecnología no solo como una herramienta
que puedes utilizar para alcanzar sus objetivos, sino más bien, como uno de los pilares
estratégicos en que se basan dichos objetivos. Debido a que la tecnología resuelve muchos
de los problemas operativos que tienen las empresas.
Así mismo la gestión informática permite detectar degradación en los procesos de las
diferentes funciones administrativas, cuando se identifica una función que afecte de forma
negativa a la operación de la empresa, es importante rediseñar los procesos tal como se
describe a continuación.
(PERUGACHI, P., & PAÚL, S., 2017) dice que:
Al hablar de reingeniería, se relaciona con la innovación de procesos.
Así, dichos procesos se modernizan y permiten a la empresa ser más
eficiente, por lo cual la reingeniería busca repensar las estructuras
administrativas para organizarlas en procesos o unidades de
Marco teórico 20
negocios, así, se reemplaza la segmentación de funciones.
(PERUGACHI, P., & PAÚL, S., 2017)
La reingeniería permite que las empresas puedan optimizar recursos mediante el
mejoramiento de sus procesos, además se puede lograr una reestructuración empresarial en
donde los esfuerzos de la organización se encuentren encaminados a lograr los objetivos de
la empresa. La reingeniería también tiene que ver con la innovación organizacional
mediante la implementación de tecnologías que logren la sistematización de los procesos
para que ayuden a una mejor administración de la información y por consiguiente una
mejor toma de decisiones.
(Silva, Berrú, Jhenino Felipe, and Pablo Andrés Chicaiza Ayala., 2006) dice que:
Mediante la consolidación del almacenamiento, se consigue una
utilización del almacenamiento bastante alta, generalmente el
incremento es de 10 a 20 % comparado al modelo de conexión
directa, lo cual implica un ahorro de varios cientos de GB (Giga
Bytes) de almacenamiento. (Silva, Berrú, Jhenino Felipe, and Pablo
Andrés Chicaiza Ayala., 2006)
La referencia anterior menciona que aplicar una centralización en el almacenamiento de
la información permite optimizar los recursos en lo que a hardware se refiere, en este caso
se explica que reduce el uso de espacio en disco hasta un 20%. El ahorro de recursos
permite extender la vida útil de los discos duros y por consiguiente reduce los costos de
mantenimiento.
1.3.1 Las TIC en la centralización de información
(García-Canal, E., Rialp-Criado, A., & Rialp-Criado, J., 2015) dice que:
La inversión en TIC ha permitido pasar de un sistema de información
originalmente muy descentralizado, donde cada planta disponía de un
sistema de información local, a un sistema más centralizado que
permite reducir el coste de mantenimiento de las aplicaciones y
Marco teórico 21
aprovechar soluciones identificadas localmente. (García-Canal, E.,
Rialp-Criado, A., & Rialp-Criado, J., 2015)
En el contexto documental, la aplicación de las TIC también permite reducir costos al
pasar de un sistema de almacenamiento de archivos descentralizado a uno centralizado. El
tener varios sistemas de almacenamiento de archivo implica que se debe adecuar esos
sistemas para cumplir dicha tarea, esto representa un costo adicional cuando se podría tener
un solo sistema que almacene todos los archivos de los diferentes sistemas. La cual que se
reduce considerablemente el tiempo de búsqueda de un archivo al tener que buscar en un
solo sistema.
Chaverra, J. A. H., & Arias, A. V., 2017) aporta su concepto sobre las TIC en los
procesos documentales:
Estas extienden los procesos de memoria de la compañía, entendidos
como la consolidación de bases de datos con información histórica,
información actualizada y no duplicada, con lo que además ayudan a
optimizar costos de mantenimiento de información y capacidad de
archivo. (Chaverra, J. A. H., & Arias, A. V., 2017)
La implementación de las TIC en los procesos documentales de las organizaciones
incrementa en gran medida la capacidad de almacenar información con un alto estándar de
calidad, evitando información duplicada o desactualizada, las TIC fomentan la distribución
de información fiable por todas las áreas de la organización ayudando que estas se alineen
con los objetivos de la empresa.
(Tic. Portal, 2016) dice que:
La cantidad de canales a través de los que la información llega a las
empresas es amplia. A consecuencia de esto, grandes volúmenes de
información quedan desestructurados y repartidos entre los distintos
sistemas de una compañía. Un sistema de gestión documental
almacena y organiza toda la información proveniente del trabajo
diario de la empresa en una ubicación central. (Tic. Portal, 2016)
Marco teórico 22
Implantar un repositorio centralizado de documentos digitalizados en las
organizaciones, según las TIC, permitirá buscar más rápidamente los documentos
relacionados a un cliente, debido a que toda esta información reposa en un solo sitio.
1.3.2 Caso: Implementación de una base de datos de imágenes de facturas
Lodisal S.A. es una empresa ecuatoriana dedicada a la operación logística de producto
de consumo masivo, la cual en el 2006 implementó un repositorio centralizado de
imágenes digitalizadas de las facturas emitidas y guías de despacho de sus clientes. Este
proyecto se ejecutó con la finalidad de tener un soporte permanente y de fácil acceso a los
documentos para las conciliaciones del inventario, lo facturado y las auditorías por parte de
sus clientes. Cabe mencionar que el proyecto que se implementó de manera satisfactoria
logrando los resultados deseados, reduciendo costos de almacenamiento de documentos y
sobre todo la satisfacción por parte de los usuarios que ya no tenía que ir a las bodegas a
buscar las cajas con los documentos físicos.
Tic. Portal (2016) dice que: “Esta centralización de la información supone terminar con
la búsqueda infinita de documentos por las redes de carpetas de la organización agilizando,
de esta forma, el ritmo de trabajo”. Tic. Portal (2016)
Con la centralización se facilitarán otras tareas adicionales, tales como el control de
versiones de los documentos, respaldos de la información y gestión de contenido.
1.4 Las alternativas de bases de datos NoSQL como solución viable.
1.4.1 Problemas de las bases de datos relacionales
(Grolinger, Higashino, Tiwari, & Capretz, 2013) dice que:
Los sistemas de gestión de bases de datos relacionales fueron
diseñados en una era en la que el hardware disponible, al igual que
los requerimientos de almacenamiento y procesamiento eran muy
diferentes a los presentados en la actualidad. Por lo tanto, estas
soluciones han tenido bastantes retos en cuanto a los requerimientos
de rendimiento y escalamiento necesarios para Big Data. (Grolinger,
Higashino, Tiwari, & Capretz, 2013)
Como se indica en esta referencia las bases de datos relacionales fueron creadas para un
esquema de datos estructurados, datos relacionados unos con otros, esto es muy importarte
Marco teórico 23
para guardar la integridad referencial de los datos y las transacciones que se realizan con
ellos, pero este mismo principio transaccionalmente es muy costoso, haciendo que las
bases de datos relacionales no posean las características necesarias para manejar grandes
volúmenes de datos o por lo menos no sin tener que invertir en equipos especializados que
a la final terminan siendo muy caros y que además para implementarlos requieren mano de
obra especializada.
1.4.2 Tecnologías emergentes
(Almenara, 2007), explica que:
“… la implantación en la sociedad de las denominadas “nuevas
tecnologías” de la comunicación e información, esta produciendo
cambios insospechados respecto a los originados en su momento por
otras tecnologías, como fueron en su momento la imprenta, y la
electrónica.” (Almenara, 2007)
Las tecnologías emergentes son tecnologías que se han venido desarrollando con el fin
de reemplazar o complementar a las tecnologías tradicionales que actualmente son
plenamente aceptadas. Esto debido a la aparición de nuevas necesidades tecnológicas que
estas últimas no ha logrado cubrir.
Una de estas necesidades es el aumento del poder de cómputo que ha surgido con las
nuevas tendencias de almacenamiento de datos. Una tecnología que permite de
contrarrestar esta necesidad a un costo accesible para las empresas o personas es mediante
la implementación de sistemas de bases de datos distribuidas.
1.4.3 Sistemas de bases de datos distribuidas
(Date, C. J., 2001) dice que:
Un sistema de bases de datos distribuida consiste en una colección de
sitios, conectados por algún tipo de red, en el cual cada sitio es un
sistema de base de datos completo por derecho propio, pero los sitios
han acordado trabajar juntos, a fin de que un usuario de cualquier
sitio pueda acceder a los datos desde cualquier lugar de la red. (Date,
C. J., 2001)
Marco teórico 24
Entonces se puede entender que, en una base de datos distribuida los datos que se
depositen en ella se encuentran diseminados en diferentes nodos (cada nodo puede ser una
computadora o un servidor) de una misma red que se comunican internamente entre ellos,
de manera totalmente transparente para los usuarios ya que los datos pertenecen
lógicamente a un sistema único.
Entre las ventajas que se presentan al tener un sistema de base de datos distribuida se
puede describir las siguientes:
Alta disponibilidad, si un nodo deja de funcionar, es solo una parte de la red la que verá
afectada, mientras que el resto de nodos seguirá operando, es decir la base de datos
continuará procesando solicitudes.
La modularidad que tienen estas bases de datos permite adicionar o quitar nodos sin
afectar con las operaciones.
Mejor rendimiento debido a que las peticiones se distribuyen entre todos los nodos (a
esto se le denomina balanceo de carga), además los datos con mayor concurrencia se
almacenan más cerca del nodo que la solicita para mejorar los tiempos respuesta.
Reducción de costos ya que implementar una red de nodos con computadoras
ordinarias es más económico que tener un solo servidor muy poderoso.
Entre las desventajas de un sistema de base de datos distribuida podemos citar:
La implementación debe estar bien documentada debido a que cada nodo puede
presentar problemas únicos. De lo contrario existirá falta de estándares
La seguridad de la red de nodos es más compleja que cuando se trabaja con un solo
servidor.
Es diseño y el mantenimiento de la base de datos distribuida es más complejo que las
demás bases de datos que trabajan en un solo servidor.
1.4.4 Sistemas de almacenamiento Not Only SQL
NoSQL (No sólo SQL) este nombre hace referencia a aquellos sistemas de gestión de
bases de datos que, por lo general, no utiliza el lenguaje SQL para acceder, almacenar y
gestionar los datos.
(Martin, R., Manuel, H., & Ariza Quiroga, D. A., 2016) dice que:
Debido a la gran cantidad y al crecimiento acelerado de la
información de diversos tipos, estructurada, semi-estructurada y sin
Marco teórico 25
estructura, alrededor del mundo, fenómeno al cual se le conoce como
Big Data. Dada esta situación se presenta la necesidad de sistemas de
almacenamiento que puedan proveer un modelo fácilmente
programable y además que sean altamente escalables, con el fin de
poder soportar, procesar y almacenar de forma eficiente dicha
información. (Martin, R., Manuel, H., & Ariza Quiroga, D. A., 2016)
Las bases de datos NoSQL se caracterizan por no manejar una estructura de datos en
particular, es decir manejan un esquema de datos más flexible, a diferencia de las bases de
datos relacionales que imponen el uso de tablas y relaciones entre tablas, esto las hace que
las bases de datos NoSQL sean ideales para manejar grandes cantidades de datos. Además,
estas bases de datos pueden fácilmente aplicar computación distribuida lo que las hace
altamente escalable.
(Bases de Datos NoSQL en Cloud Computing, 2013) dice que:
Las bases NoSQL son adecuadas para una escalabilidad realmente
enorme, y tienden a utilizar modelos de consistencia relajados, no
garantizando la consistencia de los datos, con el fin de lograr una
mayor performance y disponibilidad. (Bases de Datos NoSQL en
Cloud Computing, 2013)
Las bases de datos NoSQL al igual que cualquier otro sistema de base de datos tienen
sus ventajas y desventajas, estas cualidades tienen que ser evaluadas de acuerdo al uso y
necesidad de cada proyecto. Como bien indica en texto anterior las bases NoSQL su uso
principal se aplicará cuando en un proyecto requiera trabajar con grandes volúmenes de
datos y que al mismo tiempo sea necesario mantener un óptimo rendimiento, pero que no
sea imprescindible la consistencia de los datos en el momento de un fallo.
Existen varios tipos de bases de datos NoSQL, están las se pueden instalar en un
servidor interno de la empresa como son: mongoDB, couchDB, Casandra, etc. y también
existes base de datos NoSQL que se pueden alquilar a manera de servicio como son:
DynamoDB y SimpleDB de amazon, BigTable de google o Cloudant de IBM la cual es un
servicio basado en una implementación de couchDB.
Marco teórico 26
(Couchbase, 2019) dice que:
La creación y ejecución de estas aplicaciones masivamente
interactivas ha creado un nuevo conjunto de requisitos tecnológicos.
La nueva arquitectura de tecnología empresarial debe ser mucho
más ágil que nunca y requiere un enfoque de gestión de datos en
tiempo real que pueda adaptarse a niveles sin precedentes de escala,
velocidad y variabilidad de datos. Las bases de datos relacionales no
pueden cumplir con estos nuevos requisitos y, por lo tanto, las
empresas están recurriendo a la tecnología de base de datos NoSQL.
(Couchbase, 2019)
Este tipo de base de datos es una tecnología emergente que busca una alternativa a las
bases de datos convencionales y poco a poco ha logrado ganarse espacio dentro de mundo
informático, en especial en la computación en la nube ya que en ellas priman conceptos
como: sistemas distribuidos, manejo de grandes volúmenes de datos, velocidad y alta
disponibilidad. Estos gracias a que dentro del concepto NoSQL convergen múltiples
tecnologías que son aplicadas para lograr un objetivo particular el cual dependerá de las
prestaciones que se requieran de la base de datos.
1.4.5 Base de datos clave-valor
(Moyano González, 2019) dice que:
Los sistemas de clave-valor prometen un rendimiento excelente para
volúmenes de datos muy grandes, a cambio de ser muy simples y
renunciar a funcionalidades que tenemos en otros sistemas como la
verificación intrínseca de la integridad de datos, llaves extranjeras y
disparadores. Las validaciones de los datos se delegan
completamente en la aplicación cliente, siendo la base de datos,
simplemente el lugar donde se guardan los datos. (Moyano González,
2019)
Las bases de datos clave-valor tiene características que permiten reemplazar a las bases
de datos relacionales en tareas donde se manipulan grandes volúmenes de datos, debido a
su muy superior desempeño de procesamiento, aunque para lograrlo han tenido que
Marco teórico 27
sacrificar otras características como la integridad referencial. Pero las ventajas y
desventajas que obtenidas por estas características dependerá expresamente del tipo de
proyecto al cual se las quiere implementar.
(Zhingri, V., & Augusto, C., 2016) dice que:
Este tipo de base de datos tiene el modelo de base de datos más
simple entre las base de datos NoSQL, por que los datos se
almacenan como un par clave-valor; la clave es asociada con un solo
elemento en la base de datos, lo cual permite la recuperación de la
información de forma muy rápida. (Zhingri, V., & Augusto, C., 2016)
Las bases de datos clave-valor guardan los datos en una colección de campos en donde
el título del campo es la clave y del otro lado está el dato almacenado que viene a ser el
valor. Las claves son únicas en la colección es decir no se pueden repetir dentro de una
misma colección. Entre la base de datos clave-valor más conocidas se encuentran: Riak,
Dynamo, Redis y Voldemort.
Figura 4. Almacenamiento clave-valor, información tomada de Bases de Datos NoSQL: Escalabilidad y alta
disponibilidad a través de patrones de diseño, por Antiñanco (2013)
1.4.6 Base de datos orientada a documentos
(Antaño, A. C. M., Castro, J. M. M., & Valencia, R. E. C., 2014) dice que:
Almacenan a información como si fueran documentos. Por lo general
utilizan formato JSON o XML. El funcionamiento es muy similar a
las clave-valor, sólo que en este caso el atributo clave es el nombre
que se le pone al fichero. (Antaño, A. C. M., Castro, J. M. M., &
Valencia, R. E. C., 2014)
Marco teórico 28
Las bases de datos documentales son la evolución natural de las bases de datos clave-
valor y fueron inspiradas en lotus notes, estas bases de datos fueron ideadas para manipular
y almacenar documentos, estos documentos son codificados en un formato estándar de
intercambio de datos como XML, JSON o BSON.
Figura 5. Almacenamiento de colección de documento, información tomada de Análisis de rendimiento entre
la base de datos relacional: MySQL y una base de datos no relacional: MongoDB, por Zhingri, V., &
Augusto, C., (2016)
Entre las bases de datos documentales más conocidas se puede nombrar a: simpleDB,
mongoDB y couchDB.
(Tran, M. C., & Nakamura, Y, 2016) dice que:
A excepción de algunas, estas bases de datos generalmente
proporcionan sus datos a través de HTTP, almacenan los datos como
documentos con la notación de objetos de JavaScript (JSON) y
ofrecen diferentes API para varios lenguajes. Los intereses generales
son la sencillez, velocidad y escalabilidad. (Tran, M. C., & Nakamura,
Y, 2016)
En el mercado existen bases de datos NoSQL que no permiten un acceso directo a los
datos por parte de los programas informáticos, para efecto de esto estas bases de datos
integran un servidor web que publica servicios web REST para transferir los datos vía
protocolo HTTP. La información viaja contenida en documento JSON el cual es un
formato liviano para transportar información. Esto permite en los aplicativos suprimir la
capa de acceso a datos y en su lugar se consume los servicios web publicado por la base de
datos.
Marco teórico 29
Figura 6. Comparación de base de datos NoSQL, información adaptada de Bases de datos NoSQL en cloud
computing, por Martín, A. E., Chávez, S. B., Rodríguez, N. R., Valenzuela, A., & Murazzo, M. A. (2013)
1.4.7 Base de datos NoSQL couchDB
(Apache Org., 2019) dice que:
Hace uso del omnipresente protocolo HTTP y el formato de datos
JSON y es compatible con cualquier software que los soporte,
CouchDB también funciona muy bien con herramientas externas
como servidores proxy HTTP, equilibradores de carga. (Apache Org.,
2019)
CouchDB es un servidor de base de datos NoSQL de código abierto provista por
Apache Org. Esta base de datos es compatible con cualquier lenguaje de programación que
permita generar aplicativos de informático que puedan consumir servicios web REST e
interpretar notación JSON, lo que la convierte en un base de datos muy potente en cuanto a
versatilidad se refiere.
(Apache Org., 2019) dice que:
Esta base de datos permite el almacenamiento multi-versión, lo que
ayuda a optimizar el almacenamiento y acceso, a través de la
Marco teórico 30
escritura contigua en secciones de disco y, por lo tanto, cuando se
actualiza, el documento completo puede ser reescrito más que bits o
piezas mantenidas en una estructura de base de datos no contigua
linkeada. (Apache Org., 2019)
Las bases de datos couchDB almacenan varias versiones de un mismo documento
JSON, lo cual ayuda cuando existen inconsistencias en los registros debido a un fallo en la
actualización de los datos, permitiendo solucionar eficientemente estos conflictos
recuperando la versión anterior del documento.
Otra funcionalidad que ofrece couchDB es que los documentos JSON pueden tener
archivos adjuntos tal como si de un correo electrónico de tratará, estos archivos pueden ser
de cualquier formato (audio, video, imagen, texto, etc.) los cuales al ser cargados a la base
de datos son transformado en archivos con extensión “couch” y depositados en el
directorio “data” que se encuentra dentro de la instalación de couchDB. Los adjuntos están
estrictamente ligados a su documento JSON principal, por lo que si se elimina el registro
también se borran los adjuntos, aunque para mejorar las consultas de datos couchDB
permite acceder a los documentos JSON y los archivos adjuntos por separado.
1.4.8 Caso: Sistema de gestión de expedientes de los estudiantes de la carrera de
ingeniería de sistemas computacionales
(Zuleta Sevilla, N. E., 2018) dice que:
Se recomienda implementar el sistema gestión de expedientes a la
nueva carrera de Ingeniería de Software y a todas las carreras de la
facultad; en el futuro a las facultades de la UTN debido a que
posibilitará el ahorro en tiempo y recursos al disponer en forma
inmediata y con precisión la información de los estudiantes. (Zuleta
Sevilla, N. E., 2018)
En la carrera de ingeniería en sistemas computacionales de la UNIVERSIDAD
TÉCNICA DEL NORTE, ubicada en la ciudad de Ibarra – Ecuador, se implementó un
sistema para gestionar los expedientes de los estudiantes, para este proyecto se usó la base
de datos CouchDB. En la recomendación de su proyecto nos indica que una base de datos
NoSQL es una opción viable para implementar sistemas documentales.
Marco teórico 31
Figura 7. Características de couchDB, información tomada de Estudio de la integración del lenguaje de
programación PHP con la base de datos NOSQL apache COUCHDB Sistema de gestión de expedientes de
los estudiantes de la carrera de Ingeniería en Sistemas Computacionales, por Zuleta Sevilla, N. E., (2018)
Por lo expuesto anteriormente este tipo de base de datos, en especial CouchDB ofrece
muchas características para este tipo de proyectos como es la capacidad de agregar
recursos según se requiera, tomando en cuenta que la función principal de la aplicación es
almacenar documentos digitalizados lo cual demanda gran cantidad de espacio de
almacenamiento y agilidad en procesamiento.
1.4.9 ¿Migrar o complementar?
Como define (Antaño, A. C. M., Castro, J. M. M., & Valencia, R. E. C., 2014) “La
propuesta de bases de datos NoSQL no es excluyente de las SQL, por el contrario, podrían
incluso utilizarse como complemento una de la otra.” Si bien es cierto las bases de datos
NoSQL son utilizadas para cubrir una brecha tecnológica dejada por las bases de datos
relacionales, pero esto no necesariamente quiere decir que son su reemplazo.
Por lo expuesto en la cita anterior se puede considerar tomar lo mejor de ambos mundos
y materializarlo en una misma solución tecnológica que permite cubrir las necesidades de
la organización.
Es por tal motivo que implementar una base de datos NoSQL para el almacenamiento y
centralización de las imágenes de los clientes de una empresa, no está ligado a migrar toda
la información de los clientes de una base de datos a otra, poder complementar las
Marco teórico 32
características de dos o más bases de datos permite migrar únicamente los datos
estrictamente necesarios para cubrir los objetivos planteados.
Existe otro beneficio que se deriva de esta premisa como que se reducen
considerablemente los costos y el tiempo que se dedicarían al proyecto o a posibles
cambios en los sistemas informáticos que accedan a dichos datos.
1.5 Marco Conceptual
1.5.1 Base de datos
(Date, C. J., 2001) dice que:
Un sistema de bases de datos es básicamente un sistema de
computadoras que se usa para llevar registros. Es posible considerar
a la propia base de datos como una especie de armario electrónico
para archivar; es decir, es un depósito o contenedor de una colección
de archivos de datos computarizados. (Date, C. J., 2001)
Figura 8. Imagen de un sistema de base de datos, información tomada de Introducción a los sistemas de
bases de datos, por Date C. J (2001).
Tener la información almacenada en una base de datos trae grandes ventajas para los
procesos cotidianos de una empresa entre las cuales podemos mencionar:
Compactación: No es necesario tener grandes archivadores metálicos llenos de papel.
Marco teórico 33
Velocidad: Los DBMS pueden buscar mucho más rápido la información en una base de
datos, que una persona encontrar un documento dentro de un archivero, y de la misma
manera actualizar dicha información.
Menos trabajo rutinario; Las tareas mecánicas y repetitivas siempre son mejor hechas
por una máquina que por un humano, por esto se puede eliminar gran parte del trabajo
de llevar los archivos manualmente.
Disponibilidad: En el momento que la necesitemos, tendremos a nuestra disposición
información precisa y actualizada.
1.5.2 Datos
Un dato es una representación simbólica de un atributo que puede ser de carácter
cuantitativo o cualitativo. Técnicamente hablando, los datos se representan como pulsos
eléctricos que pueden ser almacenados en los discos duros de los dispositivos informáticos.
La información es el resultado de la unión y procesamiento de varios datos. La
información tiene muchas aplicaciones, entre los cuales está la toma de decisiones.
1.5.3 Rendimiento de las bases de datos
El rendimiento de una base de datos está relacionada directamente al poder de
procesamiento del dispositivo en donde se ejecuta. Podemos encontrar una base de datos
en pequeños dispositivos como son los teléfonos celulares hasta en los servidores más
grandes conocidos como mainframes.
1.5.4 Sistema Administrador de Base de Datos
Los datos se almacenan físicamente en los discos duros, pero para administrar estos
datos es necesario un programa informático llamado DBMS (Data Base Management
System) que en español significa “Sistema Administrador de Base de Datos”, este sistema
permite manejar las conexiones y peticiones de los usuarios a la base de datos, además de
ocultar la complejidad del manejo de los datos, del mismo modo en que el lenguaje de
programación oculta al programador la complejidad de la comunicación con el hardware.
Marco teórico 34
1.5.5 Usuarios de un sistema de base de datos
Se denominan usuarios a las personas que de alguna manera utilizan las bases de datos y
se clasifican en tres grupos:
El Programador o desarrollador de programas que se dedica crear aplicaciones
informáticas y que acceden a los datos de la base de datos a través de consulta SQL.
El usuario final que interactúan indirectamente con la base de datos mediante las
aplicaciones desarrolladas por los programadores.
El administrador de base de datos o DBA, es la persona encargada de mantener en
funcionamiento la base de datos.
1.5.6 Las transacciones
Las transacciones son una herramienta que las bases de datos emplean para asegurar la
calidad de los datos almacenados. Esto se consigue aplicando una serie de reglas que
permiten que un conjunto de operaciones hechas sobre un dato sea considerado como una
sola tarea, es decir si un dato está siendo modificado por un proceso y este llegara a fallar
en alguna parte, entonces el dato tiene que volver a su estado original. Al conjunto de
tareas hechas sobre un dato se le denomina transacción.
1.5.7 Propiedades ACID
ACID (Atomicity Consistency Isolation Durability) que en español se traduce en
Atomicidad, Consistencia, Aislamiento y Durabilidad. Y hace referencia a las propiedades
que una base de datos debe tener para ser calificada como transaccional.
Atomicidad: Toda la transacción tiene que ser completada satisfactoriamente, de lo
contrario no se aplicará ningún cambio a los datos.
Consistencia: El dato deberá estar en un estado válido al inicio y al final de la
transacción, a esto también se le denomina integridad de los datos.
Aislamiento: Las transacciones se deben ejecutar de manera aislada, sin afectar o ser
afectadas por la ejecución de otras transacciones concurrentes.
Durabilidad: Una vez finalizada la transacción, ésta persistirá en la base de datos y no
se podrá deshacer, aunque falle el sistema.
Marco teórico 35
1.5.8 Bases de datos estructuradas o relacionales
Date, C. J., (2001) dice que: “Los principios de las bases de datos relacionales se
basan en la lógica y en las matemáticas. Campos de la ciencia que son muy confiables,
logrando heredar esa confianza para lograr sus objetivos”. Date, C. J., (2001)
Como su nombre lo indica son bases de datos cuya forma de almacenar los datos se
basan en una estructura y los datos están relacionados unos con los otros, las bases de datos
relacionales desde su creación han mantenido una hegemonía en el mercado de base de
datos. Siendo para estas el mayor presupuesto en investigaciones.
Según C. J. Date las bases de datos estructuradas se clasifican según su modelo de
datos, entre las cuales son: modelo jerárquico, modelo de red, Orientada a objeto y modelo
relacional.
1.5.9 Modelo Jerárquico
En ellas se organiza la información con una jerarquía en la que la relación entre las
entidades de este modelo siempre es del tipo padre-hijo. De esta forma hay una serie de
nodos que contendrán atributos y que se relacionarán con nodos hijos de forma que puede
haber más de un hijo para el mismo padre, pero un hijo sólo tiene un padre. Y el tipo de
relaciones entre nodos es de uno a varios.
Las entidades de este modelo se llaman segmentos y los atributos se denominan
campos. La forma visual de este modelo es de árbol en donde en la parte superior se
encuentran los nodos padres y en la parte inferior a sus hijos. Un uso práctico de este
modelo es el que podemos observar al trabajar con el sistema operativo Microsoft
Windows el cual almacena las carpetas con información en la parte superior y en la parte
inferior los archivos.
1.5.10 Modelo de red
Estas bases de datos también se las llaman bases de datos puntero y son semejantes a las
jerárquicas, pero un nodo hijo puede tener varios nodos padres, por lo que el tipo de
relación de los nodos es de varios a varios.
1.5.11 Modelo relacional
Las bases de datos relacionales se basan en el uso de tablas. Las tablas se representan
gráficamente como una estructura rectangular formada por filas y columnas, similar a una
Marco teórico 36
hoja de Excel. Cada columna almacena información sobre una propiedad de la información
que se almacena en la tabla (nombre, apellidos, edad, cédula, etc.) Cada fila posee un
ejemplar de la instancia o relación representada por la tabla (a las filas también se las llama
tuplas).
Figura 9. Representación de una tabla en el modelo relacional, información tomada de Introducción a los
sistemas de bases de datos, por Date C. J (2001).
1.5.12 Orientadas a objetos
Con la llegada de la programación orientada a objeto se comenzó a concebir la idea de
crear bases de datos que se adapten a estos lenguajes. Permitiendo guardar los datos junto a
los procesos tal como lo hacen estos lenguajes, en donde un objeto está conformado por
propiedades o atributos y métodos o procedimientos.
Además, las bases de datos orientadas a objetos también buscan implementar otros
conceptos de la programación orientada objetos tales como: la herencia, tipos de datos
definidos por el usuario, disparadores almacenados en la base de datos, soporte a tipo de
datos complejos.
Logrando superar las limitaciones del base de datos relacionales. (Introducción a los
sistemas de bases de datos, 2001).
1.5.13 Teorema CAP
El teorema CAP fue formulado por Eric Brewer y en el cual indica que las bases de
datos distribuidas normalmente basan sus funcionalidades principales en un teorema
conocido como CAP o también llamado teorema de Brewer’s. Este teorema
resumidamente afirma que todo sistema gestor de base de datos debe cumplir con tres
características propias de las aplicaciones web distribuidas, las cuales son: Consistencia,
Disponibilidad y Tolerancia a particiones.
Marco teórico 37
(Bancos de Dados NoSQL, 2012) dice que:
Así mismo Brewer expresa que en caso de que ocurra un error estas
bases de datos únicamente podrán garantizar el funcionamiento de
dos de estas características. Es decir, se debe renunciar a una de ellas
para lograr mantener las otras dos de manera simultánea. Y por este
motivo las bases de datos NoSQL para poder ser escalables y
distribuidas aplican distintos métodos ya que únicamente pueden
elegir, como máximo, dos de las tres características del teorema.
(Bancos de Dados NoSQL, 2012)
Dicho esto, las bases de datos que apliquen las características del teorema CAP deben
elegir implementar entre las propiedades ACID (Atomicidad, Consistencia, Aislamiento y
Durabilidad) y las BASE (Básicamente disponible, Estado flexible y Eventualmente
consistente).
Para poder decidir porque funcionalidades se deben considerar al momento de
seleccionar una base de datos, Eric Brewer nos propone lo siguiente:
Si el sistema o parte del sistema debe ser consistente y tolerante a fallos, entonces se
requiere optar por las propiedades ACID.
Si se puede permitir inconsistencias en los datos con el fin de favorecer la
disponibilidad y tolerancia a particiones, entonces bien pueden aplicarse las
propiedades BASE. Por ejemplo: Dynamo de Amazon.
Una tercera alternativa consiste en no optar entre propiedades ACID, ni BASE, sino en
mantener la consistencia y disponibilidad a costas de no ser completamente operativos
en presencia de fallos en la red, como es aplicado por Google en su base de datos
BigTable.
En la siguiente ilustración se describe gráficamente las características del teorema CAP
junto a las bases de datos NoSQL cuyas propiedades cumplan dichos puntos.
Marco teórico 38
Figura 10. Representación gráfica del teorema CAP, información tomada de Bancos de Dados NoSQL, por
Vieira, M. R., FIGUEIREDO, J. M. D., Liberatti, G., & Viebrantz, A. F. M. (2012)
1.5.13.1 Consistencia
La Consistencia se refiere a un contrato entre un almacenamiento de datos y los
procesos, en el cual el almacenamiento de datos específica precisamente cuales son los
resultados de las operaciones de lectura y escritura ante la presencia de concurrencia. Se
garantiza que, a partir de un cambio en el estado de un sistema, todo cliente que accediera
posteriormente obtendrá el nuevo valor del estado: “Cada petición recibe la respuesta
correcta”.
Es decir, el gestor de base de datos se debe de asegurar que siempre se obtenga la
misma información al consultar o grabar los datos, independientemente del nodo o servidor
que atienda la petición.
1.5.13.2 Disponibilidad
Esta característica permite que los clientes puedan leer o grabar información, aunque
uno o varios nodos estén fuera de servicio, además de reaccionar y adaptarse al
crecimiento continuo de trabajo de manera fluida sin perder calidad en los servicios
ofrecidos.
La Disponibilidad es la cualidad de un sistema para mantenerse operativo
principalmente ante contingencias: “Cada petición eventualmente recibe una respuesta”. La
Marco teórico 39
Alta Disponibilidad (HA) desde la visión de Eric Brewer implica mantener el servicio
funcionando ante la ocurrencia de fallos como los son:
Caídas y Fallas de discos
Actualizaciones de Bases de datos
Actualizaciones de Software
Actualizaciones de Sistema Operativo
Cortes de energía
Cortes en la red
Movimiento físico del equipo
1.5.13.3 Tolerancia a particiones
Tolerancia a particiones o tolerancia a fallos es la característica cuyo concepto dice que
los sistemas deben que seguir operables, aunque existan fallos o caídas parciales de la red.
Esto se refiere a que un sistema debe continuar en funcionamiento a pesar de la pérdida de
los mensajes entre uno y otro nodo ya sea porque uno de estos se separó de la red por falta
de conectividad.
1.5.14 Propiedades BASE
Por otra parte, los modelos de consistencia eventual contemplan máxima disponibilidad
y tolerancia al particionado, pero sacrifican la consistencia estricta en favor de estas dos
características. En los sistemas que implementan el modelo de consistencia eventual
conocida también como BASE (Basically Available Soft-state Consistency) es posible
que luego de una operación las distintas réplicas queden inconsistentes durante el periodo
de tiempo necesario para que la actualización de los datos se propague a todos los nodos.
Cuando se completa este proceso el sistema vuelve a un estado consistente. La
restauración de la consistencia se logra mediante el uso de transacciones de compensación
para el manejo de fallas.
La compensación de transacciones permite reemplazar una operación que fue ejecutada,
pero que falló por algún motivo. La operación que sustituye a la inicial puede proveer
capacidades similares a la original, o en su defecto, deshacer los resultados de la operación
original.
Marco teórico 40
1.5.15 Google File System y MapReduce
Google File System o GFS es un sistema de archivo creado por Google Inc. En donde
cada archivo es particionado en bloques que se distribuyen en cada servidor del clúster.
Los metadatos con la información referente al tamaño y ubicación de cada uno de los
bloques y sus respectivas réplicas son conservados por el Name Node.
(Eduardo Fabián Cajas Malavé, 2014) dice que:
MapReduce es un modelo de programación para computación
distribuida desarrollado por Google. Las Aplicaciones que se
escriben dentro del framework MapReduce pueden ser
automáticamente distribuidas en varios equipos sin la necesidad de
que el desarrollador escriba código personalizado para la
sincronización y paralelización. Puede ser utilizado para realizar
tareas sobre grandes conjuntos de datos, lo que sería demasiado
grande para manejarlo en una sola máquina. (Eduardo Fabián Cajas
Malavé, 2014)
La arquitectura MapReduce es la propuesta de Google para solucionar el problema que
acarrea trabajar con grandes cantidades de datos como son los procesos analíticos en línea
(OLAP), la cual se basa en dos funciones principales:
Map: El nodo principal mapea los datos creando segmentos de conjunto independiente
de datos, estos segmentos son asignados a nodos de trabajo para luego procesar
problemas más pequeños para al final devolver el resultado al nodo principal.
Reduce: Luego de la función map el nodo principal recibe los segmentos y los reúne
de tal forma que se obtiene el producto final.
Marco teórico 41
Figura 11. Representación gráfica del proceso mapreduce, información tomada de Una primera
aproximación al descubrimiento de subgrupos bajo el paradigma MapReduce, por Pulgar-Rubio, F.,
Carmona, C. J., Rivera-Rivas, A. J., González, P., & del Jesus, M. J., (2015)
1.5.16 Protocolo TCP/IP
Se denomina TCP/IP a la unión de dos protocolos, primero está el protocolo de control
de transferencia (TCP) que se encarga de controlar el flujo de los datos y asegurar que los
datos emitidos por el cliente lleguen sin errores o variaciones al servidor. Por el otro lado
está el protocolo de internet (IP) el cual se encarga de crear un direccionamiento en la red
de comunicación, proveyendo un encaminamiento de los datos desde el nodo emisor al
destino y viceversa. Este protocolo es en el que se basa el internet, permitiendo navegar en
la red mediante la dirección IP.
1.5.17 Protocolo HTTP
El protocolo HTTP son las iniciales por su nombre en inglés HyperText Transfer
Protocol (Protocolo de Transferencia de Hipertexto) el cual permite el intercambio de
datos entres dos equipos informáticos, generalmente uno es denominado servidor y el otro
cliente. La estructura de los datos que se transmitirán de un equipo a otro es definida por el
protocolo HTTP.
1.5.18 Servidor Web
Un servidor web es básicamente un equipo informático con determinadas características
de hardware y de software que permite publicar contenido electrónico en una red
Marco teórico 42
informática, sea está internet o una extranet o intranet de alguna empresa. Para lo cual se
utiliza el protocolo HTTP.
1.5.19 PHP (Hypertext Preprocessor)
PHP es un lenguaje de programación de código abierto orientado a ser un código script
que se ejecuta del lado del servidor. Este lenguaje de programación se puede mezclar
fácilmente con código HTML y es considerado un lenguaje de programación fácil de
aprender y el más utilizado a nivel mundial para programación web.
1.5.20 JSON (JavaScript Object Notation)
Es un formato de intercambio de datos ligero, usado actualmente por la mayoría de los
sistemas de información para transmitir los datos de un sistema a otro, la mayoría del
lenguaje de programación soportan la notación JSON y también es ampliamente utilizado
por las bases de datos NoSQL para manipular los datos en especial las de tipo clave-valor y
las orientada a documentos.
Figura 12. Representación de una estructura JSON, información tomada de Serialización/deserialización de
objetos y transmisión de datos con JSON, por Mora-Castillo, J. A., (2016)
1.5.21 CURL
Es un conjunto de librerías que conforman una herramienta en línea de comando o
script que permiten trasladar datos mediante diferentes protocolos de red, incluido el
HTTP. Esta herramienta trabaja de tal manera que simula ser un navegador web para
realizar las peticiones de datos a los servidores web.
CURL también está soportado por dientes lenguajes de programación como es el caso
de PHP que empaqueta a CURL en la Librería libcurl.
Marco teórico 43
Figura 13. Uso de librería CURL con lenguaje de programación PHP, información tomada de
https://www.php.net/manual/es/curl.examples.php
1.5.22 Servicio web REST (Representational State Transfer)
También llamado API REST, es un conjunto de tecnologías que permiten a diferentes
sistemas interoperar en la web, incluso si se encuentran en lugares distantes. En donde un
sistema publica sus servicios en calidad de procesos remotos y el otro sistema consume
dichos servicios, a esta tecnología se la denomina “procedimiento a través de la web”.
Esta tecnología se basa en los estándares de la web, siendo HTTP el protocolo de
transferencia de datos, los servicios web REST publicado son solicitados mediante un
identificador de recursos único o URI; la clave del éxito de este modelo de transferencia de
datos es su simplicidad en la utilización de los recursos de la web y en rapidez de su
implementación.
1.5.23 SoapUI
Es un programa de escritorio de tipo interfaz cliente, elaborado para realizar pruebas
funcionales de servicios web SOAP y REST.
1.5.24 Proyecto fauxton
Es una aplicación web nativa, que se encuentra integrada en la instalación de couchDB,
proporciona acceso a todas las funcionalidades de la base de datos. Es decir, Fauxton es la
interfaz gráfica de la base de datos couchDB para administrar tanto los datos que se
almacenan en ella como para administrar su configuración.
1.5.25 Diagramas
Los diagramas se pueden considerar como la representación gráfica de una acción y
relación que tiene varias partes. Los diagramas se pueden usar para describir fenómenos
conocidos.
Marco teórico 44
1.5.25.1 Diagrama de caso de uso
García-Holgado en 2018 indica que el diagrama de casos de uso es una técnica para
capturar información de cómo un sistema o negocio trabaja, o de cómo se desea que
trabaje.
El diagrama de caso de uso sirve para representar gráficamente los requisitos
funcionales del sistema basándose en las acciones ordenadas secuencialmente, inclusive se
debe describir las variantes que cualquier entidad pueda efectuar interactuando con el
actor. En ella se incluye los actores, las relaciones, el ámbito de la secuencia.
1.5.25.2 Diagrama de flujo de datos de contexto
El diagrama de flujo de contexto o también llamado modelo de entorno permite
esquematizar gráficamente el flujo de la información que entran y salen entre los
componentes o procesos básicos de un sistema, permitiendo una visión general de la
manera que operan los componentes de dicho sistema.
1.5.25.3 Diagrama de despliegue
Sirve para modelar la arquitectura de un programa informático en tiempo de ejecución,
permite diseñar la relación existente entre software y hardware y la distribución de
procesos, componentes y la comunicación existen ente entre ellos.
Figura 14. Ejemplo de diagrama de despliegue, información tomada de Desarrollo de Software Orientado a
Objeto usando UML, por Torres, P. L., (2004)
Marco teórico 45
1.5.26 Metodología de desarrollo de software
Gamboa, J. Z. en el 2018 indica que al menos en proyectos de desarrollo de software.
Podemos afirmar que el éxito de los proyectos de software depende en gran medida de que
tengan un buen inicio. La selección adecuada del modelo de implementación es un factor
decisivo para un buen inicio del proyecto. Para lo cual se debe considerar las necesidades y
características del mismo. La correcta selección de la metodología permitirá incrementar la
calidad del producto final y reducir el tiempo de entrega.
Actualmente hay una gran variedad de metodologías de desarrollo de software, existe
tantas que se torna un poco complicado elegir una al momento de iniciar un nuevo
proyecto.
La mayoría de las metodologías se encasillan en dos grandes grupos. Las cuales se
definen como las metodologías tradicionales y las metodologías ágiles.
Figura 15. Clasificación de metodologías de desarrollo, información tomada de Taxonomía de los modelos y
metodologías de desarrollo de software más utilizados, por Ojeda, J. C., & Fuentes, M. D. C. G., (2012)
1.5.26.1 Metodologías Tradicionales
Como se puede observar en la figura N° 15, las metodologías tradicionales son también
llamadas metodologías rígidas, esto debido a que los cambios o modificaciones al sistema
Marco teórico 46
no son bien aceptados durante el desarrollo del mismo, existen normas y políticas que
controlan en gran manera los procesos de desarrollo de software. Cabe mencionar que estas
metodologías están ideadas para ser aplicadas en medianos y grandes proyectos.
1.5.26.2 Metodologías ágiles
Las metodologías ágiles abarcan un conjunto de principios y valores que los
desarrolladores o equipos de desarrollo deben apegarse para poder responder rápida y
eficientemente a los cambios que surgen durante la vida de un proyecto, sin menoscabar la
calidad del trabajo que se realiza o del producto final. Todo esto se debe a que el desarrollo
de proyectos es un área que está en constante cambio en especial en el ámbito técnico, esto
debido a que cada día aparecen nuevas o mejoradas tecnologías.
Las metodologías ágiles nacen como alternativas a las tradicionales metodologías de
desarrollo de proyectos, las cuales se caracterizan seguir fielmente la documentación que
se genera durante antes del inicio del proyecto, sin posibilidad de cambios durante su
ejecución, por lo que son consideradas metodologías rígidas.
Figura 16. Comparación de metodologías ágiles y tradicionales, información tomada de Metodologías
ágiles para el desarrollo de software: eXtreme Programming (XP), por Letelier, P., (2012)
Marco teórico 47
1.5.26.3 SCRUM
Durante la última década SCRUM ha sido la metodología de gestión de proyecto más
utilizada por los equipos de desarrollo debido a que marca un camino que permite cambios
de requerimientos durante la realización del proyecto.
Figura 17. Representación de las fases de la metodología SCRUM, información tomada de Metodología
SCRUM, por Gallego, M. T. (2012)
La metodología SCRUM tiene algunas ventajas cuando es aplicada correctamente en la
gestión de proyectos, entre las cuales podemos señalar las siguientes:
La satisfacción de los clientes: SCRUM logra que el cliente sea parte del equipo de
trabajo, haciendo que el cliente se comprometa con el desarrollo del proyecto y esté
enterado en todo momento de los resultados de cada proceso.
Simplicidad: Las interacciones en SCRUM están debidamente identificadas, así como
los participantes de cada una de ellas, lo cual ayuda de gran manera con la aceptación
de la metodología por parte de los integrantes de cada equipo.
Inspección: SCRUM contempla tres procesos dedicados a la inspección: el sprint
diario, la revisión del sprint y la retrospectiva del sprint. Esto ayuda a la organización a
identificar qué procesos o eventos tiene que ser mejorados.
Adaptación: Esta metodología acepta cambios el cualquier momento, esté es el punto
diferenciador con el resto de las metodologías. Adicionalmente esté punto incrementa
la satisfacción del cliente.
Trabajo en equipo: SCRUM reconoce a cada integrante del equipo como una pieza
fundamental del proyecto, permite sinergia que fluye entre los integrantes incluido el
cliente, lo que hace que ellos se integren, se relaciones y mejores en conjunto.
A continuación, se describirá algunas de las desventajas que se pueden encontrar en la
aplicación la metodología SCRUM como marco referencial para la gestión de proyectos:
Marco teórico 48
Excesiva delegación de responsabilidades a los equipos.
Es una metodología tan flexible que de ser necesario se permite fallar.
El paradigma de desarrollo es ampliamente disímil al resto de metodologías, tanto que
origina cierta resistencia en su asimilación por parte de los nuevos integrantes.
1.5.26.4 RAD
El nombre de RAD proviene de su acrónimo en inglés (Rapid Application
Development) y es una metodología de desarrollo se sistemas informáticos en el cual sus
propiedades bases giran alrededor de la implementación de software de manera rápida,
práctica, a muy bajo costo y sin hacer de lado la calidad del producto final. El tiempo
estimado de vida de un proyecto elaborado con metodología RAD es de entre 60 y 90 días.
1.5.26.5 Fases de RAD
Las fases planteadas por RAD para el desarrollo proyecto de sistemas informáticos son
las siguientes:
Modelado de Gestión.
Modelado de datos.
Modelado de procesos.
Generación de aplicación.
Pruebas de entrega.
Figura 18. Fases de la metodología RAD, información tomada de Sistema de información bibliotecario para
la Biblioteca Manuela Beltrán, por: Caballero Narvaez, S., & Devia Palacio, D. S., (2018)
Marco teórico 49
1.5.26.6 Metodologías de desarrollo en implementación de bases de datos
Las metodologías de desarrollo de software no son exclusivas de la programación de
sistemas informáticos, puesto que su aplicación puede abordar proyectos de otras
características. Como lo es el proyecto “Diseño e implementación de una base de datos
para recogida y análisis de datos de actividad física provenientes de dispositivos
wearables” (López Ramírez, M. C., 2015) en el cual aplica la metodología de desarrollo de
en cascada; cual es considerada una metodología tradicional.
Gamboa, J. Z. en el 2018 indica que en el desarrollo del proyecto se emplea la
metodología ciclo de vida en cascada, que consiste en ejecutar actividades de manera
secuencial agrupadas en las fases; pre-análisis, análisis, diseño, implementación, pruebas y
documentación y que éste modelo está dirigido por los casos de uso y se centra en la
arquitectura del desarrollo.
El proyecto anteriormente mencionando marca una pauta muy importante para el
desarrollo de proyectos de similares características, debido a que dota mayor número de
herramientas con las que se pruebe trabajar.
1.5.27 Prueba de software
(Cárdenas Ospina, L. A., & Rodríguez Beltrán, J. A., 2016) dice que:
La etapa de pruebas consiste en realizar una prueba integral del
sistema, teniendo en cuenta la iteración entre los diferentes módulos
funcionales que lo componen. En esta actividad se realizará la
prueba del sistema como un conjunto de elementos que están
interrelacionados. (Cárdenas Ospina, L. A., & Rodríguez Beltrán, J. A.,
2016)
La prueba de software es una parte dentro del ciclo de desarrollo de software, en donde
se pone bajo análisis el comportamiento del sistema luego de su integración y la sinergia
existente entre los diferentes elementos que lo componen. Las pruebas de software se
realizan con la finalidad de demostrar que el sistema informático alcanza los niveles de
calidad acordados.
Marco teórico 50
1.5.27.1 Tipos de pruebas
Existen diversos enfoques dentro de la prueba de software, los cuales también son
llamados tipos de pruebas, éstos determinan qué características del software se probarán.
Existen diferentes tipos de pruebas de software que pueden ser usados para comprobar
el adecuado comportamiento del sistema luego de su implementación final. La selección y
utilización del tipo de prueba se basará netamente en las características del sistema que se
quieran evaluar; una de estas características es la funcionalidad de software.
(Jerez Mayorga, D. S., 2017) dice que:
La funcionalidad reúne un conjunto de atributos que permiten
calificar si un producto de software maneja en forma adecuada el
conjunto de funciones que satisfagan las necesidades para las cuales
fue diseñado. (Jerez Mayorga, D. S., 2017)
Probar la funcionalidad del software comprende las pruebas en donde se evalúa un
fragmento o la totalidad del programa informático para verificar que cumplan plenamente
con los requisitos del usuario.
1.5.27.2 Método de Caja Negra
(Jerez Mayorga, D. S., 2017) dice que:
Las pruebas de caja negra se centran en lo que se espera de un
módulo, es decir, intentan encontrar casos en que el módulo no se
ajusta a su especificación. Por ello se denominan pruebas
funcionales, el tester se limita a ingresar datos como entradas y
estudiar las salidas, sin preocuparse de lo que pueda estar haciendo
el módulo por dentro. (Jerez Mayorga, D. S., 2017)
El método de la caja negra centra los esfuerzos de las pruebas en validar únicamente
que las funcionalidades del sistema se encuentren alineados a las características
funcionales declaradas al inicio del proyecto. Aplicar esta prueba luego de la
implementación del software permite conseguir el visto bueno por parte de los usuarios
finales y por consiguiente la aceptación final del cliente.
CAPÍTULO II
METODOLOGÍA
2.1 Tipo de investigación
(Cervo y Bervian. 1989), dice que:
Se define la investigación como una actividad encaminada a la
solución de problemas. Su objetivo consiste en hallar respuesta a
preguntas mediante el empleo de procesos científicos. (Cervo y
Bervian. 1989)
Con la finalidad de implementar una base de datos NoSQL que permite almacenar y
centralizar los documentos digitalizados de los clientes de la empresa Generali Ecuador
Cía. de Seguros S.A. Se efectuó un proceso investigativo con el objetivo de encontrar
respuestas a los problemas suscitados en dicha empresa.
(Rivero, D., 2013) dice que:
Estudios descriptivos: Sirven para analizar cómo es y cómo se
manifiesta un fenómeno y sus componentes. Permiten detallar el
fenómeno estudiado básicamente a través de la medición de uno o
más de sus atributos. (Rivero, D., 2013)
Para el presente proyecto se constituye una investigación de carácter descriptiva, la cual
permite obtener detalladamente las características de los fenómenos bajo su estudio, para
determinar cómo se manifiestan y sus consecuencias.
(Danhke, 1989), dice que:
Los estudios descriptivos buscan especificar las propiedades, las
características y los perfiles de personas, grupos, comunidades,
procesos, objetos o cualquier otro fenómeno que se someta a un
análisis. (Danhke, 1989)
Indagar y estudiar los procesos relacionados con el actual método de almacenamiento
de la documentación de los clientes de la empresa Generali Ecuador Cía. de Seguros,
permitirá desarrollar conclusiones sobre los problemas existentes y de la misma manera
Metodología 52
estas conclusiones servirán de guía para encontrar soluciones que logren alcanzar los
resultados deseados, tal como lo indica Sánchez.
(Sánchez, 2012) dice que:
Consiste en basarse en enunciados singulares, tales como
descripciones de los resultados de observaciones o experiencias para
plantear enunciados universales, tales como hipótesis o teorías.
(Sánchez, 2012)
2.2 Alcance de la investigación
La investigación en desarrollo tiene un corte cualitativo, con la cual se logrará acceder a
los resultados arrojados por el actual proceso de almacenamiento de documentos digitales
de los clientes de la empresa Generali Ecuador Cía. de Seguros S.A.
(Flores, García, & Rodríguez, 1996) dice que:
estudian la realidad en su contexto natural, tal y como sucede,
intentando sacar sentido de o interpretar los fenómenos de acuerdo a
los significados que tienen para las personas implicadas. La
investigación cualitativa implica la utilización y recogida de una gran
variedad de materiales, entrevistas, experiencia personal, etc., que
describen la rutina, las situaciones problemáticas y los significados
en la vida de las personas. (Flores, García, & Rodríguez, 1996)
El método cualitativo nos proveerá del conocimiento requerido para el desarrollo de los
procesos necesarios para la obtención de datos relacionados a la problemática de la
empresa. También se logra disipar las presentes dudas debido a la apertura de las
relaciones de diálogo con los entrevistados .
Aplicar los diferentes conceptos expuestos anteriormente aportará al desarrollo de la
investigación permitiendo captar y analizar los sucesos efectuados de manera aisladas, lo
que servirá para poder construir una hipótesis que favorezca con la búsqueda de la solución
al problema planteado.
Para recolectar los datos aplicando una investigación cualitativa es necesario realizar
diferentes técnicas de investigación al personal de la compañía involucrado en los procesos
de almacenamiento y centralización de los documentos digitales de los clientes, lo cual
Metodología 53
permite tener una perspectiva más clara del problema y despejar las dudas presentes sobre
los actuales procesos.
2.3 Técnicas de recolección de datos
Para el desarrollo del presente proyecto se planteó la aplicación de técnicas y
herramientas investigativas necesarias para la obtención de los datos más relevantes, lo
cual se puso en ejecución de manera crítica y sistemática permitiendo acceder hasta la
información requerida.
La recolección de datos y el posterior análisis de los datos se realizarán como etapas por
las cuales pasará esta investigación.
(Rivero, D., 2013) dice que:
La recolección de datos se refiere al uso de una gran diversidad de
técnicas y herramientas que pueden ser utilizadas por el analista
para desarrollar los sistemas de información, los cuales pueden ser la
entrevistas, la encuesta, el cuestionario, la observación, el diagrama
de flujo y el diccionario de datos. (Rivero, D., 2013)
Antes de iniciar la primera etapa es importante conocer previamente de qué forma se
van a clasificar los datos recolectados. Esto permitirá organizar correctamente dichos datos
con la finalidad de que, al llegar a la segunda etapa, se pueda analizar de forma adecuada la
información recopilada.
Según (Hernández, 2003) existen tres actividades que se deben tomar en cuenta al
momento de recolectar información e indica que estas actividades se encuentran
estrechamente vinculadas entre sí, las cuales son:
Seleccionar un instrumento o método de recolección de los datos.
Aplicar ese instrumento o método para recolectar datos.
Preparar observaciones, registros y mediciones obtenidas.
Por lo tanto, se puede decir que es de gran importancia conocer anticipadamente las
herramientas que se utilizaran para la recolección de datos; lo que permite darle mayor
soporte a la obtención de datos y por consiguiente la investigación se desarrollara de
manera eficiente.
Metodología 54
Para el desarrollo de este proyecto se considera la entrevista y la observación activa
como los métodos o técnica de recolección de datos, permitiendo construir bases sólidas en
la cual se sostiene la investigación y sus conclusiones.
2.3.1 Técnica de observación
Se considera la observación como técnica de recolección de datos porque por medio de
ella se podrá observar detenidamente las acciones y situaciones que se lleven a cabo en el
sistema, con la finalidad de obtener información del mismo y lograr armar una idea más
clara de los problemas y sus consecuencias.
(Arias, F. G., 1999) dice que:
La observación es una técnica que consiste en visualizar o captar
mediante la vista, en forma sistemática, cualquier hecho, fenómeno o
situación que se produzca en la naturaleza o en la sociedad, en
función de unos objetivos de investigación preestablecidos. (Arias, F.
G., 1999)
El campo de acción, la aplicación de la observación y el análisis se realizará en el
servicio prestado por el sistema web SIDD (Sistema de Digitalización de Documentos),
que contiene la base de datos en donde se almacena las imágenes de los documentos
legales de los clientes, se observará y tomará apuntes detalladamente del comportamiento
del sistema mientras es utilizado por los usuarios y también se observará detenidamente la
realización de los procesos administrativos sobre la actual base de datos.
2.3.1.1 Aplicación de la observación
Los lugares considerados para la aplicación de la observación son:
El departamento comercial de la empresa Generali Ecuador Cía. de Seguros S.A., que
es en donde los ejecutivos de cumplimiento ingresan, revisan y validan los documentos
de los clientes.
El departamento de sistemas de la empresa Generali Ecuador Cía. de Seguros S.A.,
específicamente en el cuarto de servidores. Se examinó la instalación del servidor web
del sistema SIDD y así mismo sus componentes de hardware y los aplicativos
instalados tal como es el actual gestor de base de datos que es MySql. Además, se
Metodología 55
prestó mucha atención en los procesos administrativos relacionados con la base de
datos de imágenes tales como respaldos y mantenimientos.
2.3.2 Técnica de la entrevista
Se consideró la aplicación de la entrevista como medio formal de recolección de datos,
la entrevista y el entrevistador son elementos fundamentales para la obtención de
información. Siendo esta una fuente primaria de información que ayudará a construir la
realidad de las necesidades de la empresa con relación al almacenamiento centralizado de
documentos de los clientes.
(Arias, F. G., 1999) dice que:
La entrevista, más que un simple interrogatorio, es una técnica
basada en un dialogo o conversación “cara a cara”, entre el
entrevistador y el entrevistado acerca de un tema previamente
determinado, de tal manera que el entrevistador pueda obtener la
información requerida. (Arias, F. G., 1999)
La entrevista es un instrumento eficaz y de gran precisión en la medida que la
investigación se fundamenta en la interrelación humana.
2.3.2.1 Aplicación de entrevistas
El perfil del personal entrevistado fue seleccionado basado en las funciones de la
empresa, las mismas que se encuentren estrechamente ligadas al entorno tratado en el
presente proyecto dentro de la empresa Generali Ecuador Cía. de Seguros S.A.:
Perfil de Entrevista # 1
Profesión: Administrador de base de datos
Nombre: Ing. Rodrigo Pazos
Lugar de Trabajo: Departamento de IT
Aporte cualitativo: La función primaria es ejecutar e implementar procesos
administrativos en las bases de datos de acuerdo a las necesidades del área, maneja
estadísticas de la base de datos, corrige anomalías de la base de datos, ejecuta sobre la base
Metodología 56
de datos las sentencias SQL a petición del equipo de programadores. Permitirá obtener
información sobre el estado actual de la base de datos de imágenes y su rendimiento.
Perfil de Entrevista # 2
Profesión: Gerente de IT y Gerente de emisiones
Nombre: Ing. Carlos Silva
Lugar de Trabajo: Departamento de IT
Aporte cualitativo: Permitirá obtener información relacionada con las estrategias
tecnológicas de la empresa con relación los servicios prestados a los clientes, así mismo
del plan de acción para mejorar los servicios a los clientes internos de la empresa.
Perfil de Entrevista #3:
Cargo: Analista de cumplimiento
Nombre: Sr. Johan Beltrán
Lugar de Trabajo: Departamento Comercial
Aporte cualitativo: La función desempeñada es de ingresar los documentos
digitalizados de los clientes al sistema SIDD, así mismo mantener dicha información
actualizada, permitirá recopilar datos sobre el rendimiento del sistema en la actualidad y su
impacto en la satisfacción del usuario.
2.3.2.2 Resumen de las entrevistas para especificaciones funcionales
El resumen de las entrevistas realizadas brinda la información requerida para la
implementación de una base de datos NoSQL para almacenar los documentos digitalizados
de los clientes de Generali Ecuador, implementando servicios web como capa de acceso a
datos, en el que servirá para realizar los procesos y la elaboración de la documentación, así
también como para el diseño de la base de datos.
En los anexos se puede revisar las preguntas y las respuestas de los entrevistados en las
respectivas entrevistas.
Metodología 57
2.3.2.3 Matriz de resumen de entrevistas
Entrevista para obtención de requerimientos para el análisis y diseño de la base
de datos para la empresa Generali ecuador
Fecha: 08/07/2019 Cargo: Analista de cumplimiento
Nombre
Entrevistador: Peter Celleri
Nombre
Entrevistado: Sr. Johan Beltrán
RESUMEN DE ENTREVISTA
Ingresar la documentación de los clientes es de gran importancia por el giro de negocio
de la compañía
Para ingresar los documentos de los clientes se utiliza una página web llamada SIDD
(Sistema de digitalización de documentos)
Los documentos de los clientes tiene una validez de 1 año, luego de esos hay que
volver a pedirlo y cargarlos al sistema SIDD.
Con el tiempo que pasa el sistema se torna más lento, incluso hay veces que la pagina
está fuera de servicio.
Cada vez la empresa tiene más y más clientes por lo que ingresar todos los
documentos se torna complicado y toma mucho tiempo, por lo lento que está el
sistema
Ayudará a mejorar el tiempo de repuesta del aplicativo al poder ingresar más clientes
en menor tiempo.
Toda la información del cliente es confidencial por lo tanto no se divulga y es de uso
exclusivo de Generali Ecuador.
Figura 19. Matriz del resumen de la entrevista, Investigación directa, por el autor (2019)
Metodología 58
Entrevista para obtención de requerimientos para el análisis y diseño de
procedimientos administrativos de la base de datos actual
Fecha: 09/07/2019 Cargo:
Administrador de la base de
datos
Nombre
Entrevistador: Peter Celleri
Nombre
Entrevistado: Ing. Rodrigo Pazos
RESUMEN DE ENTREVISTA
La base de datos del sistema SIDD esta implementada en Mysql
Las base de datos del SIDD actualmente tiene un peso de 120GB, con un incremento
anual del 20%
Se sacan respaldos diariamente de los datos, dicho proceso actualmente toma 8 horas y
con cada día que pasa el tiempo se incrementa.
Para sacar los respaldos se tiene que descargar algunos servicios del servidor. En
ciertas ocasiones, el respaldo falla y por lo tanto el servidor no restablece los servicios,
quedando el servidor fuera de línea.
Cambiar la base de datos por una base de datos más robusta y veloz permitirá
optimizar el tiempo de respuesta del servidor en peticiones de lectura y escritura.
Implementar replicación como método de contingencia permitirá reducir el tiempo que
se dedica a este proceso.
Figura 20. Matriz del resumen de la entrevista, Investigación directa, por el autor (2019)
Metodología 59
Entrevista para obtención de requerimientos para el análisis y diseño de la base
de datos para la empresa Generali ecuador
Fecha: 08/07/2019 Cargo: Gerente de TI
Nombre
Entrevistador: Peter Celleri
Nombre
Entrevistado: Ing. Carlos Silva
RESUMEN DE ENTREVISTA
Que el sistema de digitalización de documentos que sea ágil ayudara con las tareas
cotidianas del departamento de cumplimiento.
Tener una base de datos con mejores prestaciones permitirá mantener la información
siempre disponible.
Acceder a los datos mediante servicios web permitirá abstraer la capa de acceso a
datos del sistema SIDD, además de poder compartir el servicio de almacenamiento
con otros sistemas de la compañía.
Figura 21. Matriz del resumen de la entrevista, Investigación directa, por el autor (2019)
2.3.3 Recopilación documental
2.3.3.1 Búsqueda de cliente.
Para realizar la búsqueda de un cliente el usuario debe seleccionar la opción servicios
que se encuentra dentro del menú documentos. Los parámetros para la búsqueda pueden
ser: Cédula o RUC, apellido y nombre o código interno del cliente que es asignado por el
ERP de la compañía al momento de emitir una póliza al cliente.
Metodología 60
Figura 22. Formulario de búsqueda de cliente, información tomada del Sistema Integrado de Digitalización
de Documentos de la empresa Generali Ecuador Cía. de Seguros S.A., por el autor (2019)
2.3.3.2 Grupo de documentos
Los documentos de los clientes están divididos en grupos, cada grupo representa un tipo
específico de documento emitido o regulado por las entidades de control del estado, tales
como: Cédula de identidad, Planilla de servicios básicos, Acta de constitución de la
empresa, etc. Existen documentos opcionales y documentos obligatorios, Los documento
que son obligatorios el sistema los identifica marcándose con un asterisco “*”.
También existen indicadores gráficos que se utilizan para visualizar el estado actual del
grupo documentos; el color verde indica que el grupo tiene los documentos actualizados, el
color naranja que el grupo no tiene los documentos actualizados y el color rojo indica que
el grupo no tiene ni un documento ingresado.
Metodología 61
Figura 23. Formulario de grupo de documentos, información tomada del Sistema Integrado de
Digitalización de Documentos de la empresa Generali Ecuador Cía. de Seguros S.A., por el autor (2019)
2.3.3.3 Pantalla de ingreso de documentos
En éste proceso se puede ingresar nuevos documentos para el cliente previamente
seleccionado, para este fin se tiene que seleccionar el grupo de documentos al cual se le va
a cargar el nuevo documento, luego seleccionar el archivo desde el directorio del sistema
operativo y presionar el botón grabar.
Metodología 62
Figura 24. Formulario de ingreso de nuevos documentos, información tomada del Sistema Integrado de
Digitalización de Documentos de la empresa Generali Ecuador Cía. de Seguros S.A., por el autor (2019)
2.3.3.4 Pantalla de eliminación y descarga de documentos
En este proceso se puede eliminar o descargar un documento del cliente, para este fin se
tiene que seleccionar el grupo de documentos y luego seleccionar la imagen de
previsualización del documento que se quiere eliminar o descargar, luego se presentará el
documento en pantalla completa.
Metodología 63
Figura 25. Formulario de consulta de documentos, información tomada del Sistema Integrado de
Digitalización de Documentos de la empresa Generali Ecuador Cía. de Seguros S.A., por el autor (2019)
Figura 26. Descarga o eliminación de documentos, información tomada del Sistema Integrado de
Digitalización de Documentos de la empresa Generali Ecuador Cía. de Seguros S.A., por el autor (2019)
Metodología 64
2.3.3.5 Formato de registro de novedades de respaldo de base de datos
En este proceso el administrador de base de datos ejecuta un archivo de tipo “bat” que
inicia el proceso de respaldo de la base de datos y verifica las novedades que se han
presentado para realizar los reportes. Este proceso se lo realiza diariamente.
Figura 27. Formato de registro de ejecución de respaldos, información tomada de los registros de la
empresa Generali Ecuador Cía. de Seguros S.A., por el administrador de la base de datos (2019)
2.3.3.6 Reporte estadístico elaborado en Excel
Mensualmente se genera un reporte estadístico en base a la bitácora del proceso de
respaldo de la base de datos del sistema SIDD, la información obtenida de la bitácora es
cuantificable y es en gran medida necesaria para la toma de decisiones con respecto a la
necesidad de cambiar de base de datos.
Figura 28. Reporte estadístico del proceso de respaldos, información tomada de los registros de la empresa
Generali Ecuador Cía. de Seguros S.A., por el administrador de la base de datos (2019)
Metodología 65
2.3.3.7 Notificación sobre problemas en el proceso de respaldos
Se presenta la siguiente prueba en donde se notifica al Gerente IT sobre la existencia de
inquietudes con relación al proceso de respaldo de la base de datos del sistema SIDD, en la
cual se indica que para realizar un respaldo se tiene que copiar la carpeta en donde se
encuentra instalada la base de datos.
Adicionalmente se informa el tiempo aproximado en restaurar dicha base de datos desde
una copia de seguridad es de 8 hora.
Figura 29. Notificación de problemas en la base de datos de MySql, información tomada de los registros de
la empresa Generali Ecuador Cía. de Seguros S.A., por autor (2019)
Metodología 66
2.3.3.8 Análisis documental
Las entrevistas y las observaciones permitieron recabar datos que posteriormente fueron
sometidos a diferentes análisis y cuestionamientos, que luego de ser cotejados con otros
conocimientos dieron como resultados información que sirvió de aporte útil para la
realización de la solución planteada, la cual consiste en implementar un base de datos no
estructura que permitirá almacenar y centralizar la información de los clientes de la
empresa Generali Ecuador Cía. De Seguros S.A.
Con respecto a las entrevistas, se logró obtener información veraz y oportuna de las
personas que se benefician de los servicios ofrecidos por el sistema SIDD y también las
personas que ejecutan los procesos administrativos de la base de datos.
Finalmente, con la observación se pudo examinar los procesos y a las personas que
intervienen en la realización de los mismos. Dando como resultado lo necesario que sería
contar con otra base de datos con mejores prestaciones que la actual.
2.4 Arquitectura
Se acogió la base de datos NoSQL couchDB debido a que presenta una arquitectura de
acceso a datos HTTP client, la cual permite manipular los datos mediante servicios web
REST, lo que permite que se pueda implementar como una nube (cloud) en la intranet de la
compañía y que todos los sistemas informáticos de puedan consumir sus servicios.
CouchDB integra una arquitectura de replicación (online/offline) que puede ser activada
programáticamente o manualmente mediante una petición HTTP.
Figura 30. Arquitectura de couchDB, información tomada de Estudio de la integración del lenguaje de
programación PHP con la base de datos NOSQL apache COUCHDB Sistema de gestión de expedientes de
los estudiantes de la carrera de Ingeniería en Sistemas Computacionales, por Zuleta Sevilla, N. E., (2018)
Metodología 67
2.5 Metodología de desarrollo
Teniendo la premisa que el tiempo es un factor limitante en el desarrollo de proyectos se
planteó una metodología de desarrollo que optimice dicho recurso.
Además, con la determinación de completar el cronograma de actividades y mejorar los
actuales procesos de almacenamiento y centralización de documentos digitales de la
empresa Generali Ecuador Cía. de Seguros S.A., se realizó un análisis de las metodologías
de desarrollo de software que se acoplen a los requerimientos funcionales del presente
proyecto y que además se adapte a la implementación de una base de datos NoSQL.
Para lograr lo mencionado en los párrafos anteriores se propone adoptar “RAD” como
metodología de desarrollo, esta metodología propone un desarrollo veloz de los proyectos
informáticos. Por lo tanto, basado en las fases propuestas por RAD se propone las
siguientes etapas en la presente implementación.
Figura 31. Etapas del presente proyecto basado en la metodología RAD, por el autor (2019)
2.6 Identificación del problema
En la siguiente Tabla se puede observar los diferentes tipos de problemas que presenta
actualmente la base de datos en dónde se almacena las imágenes de los clientes de la
compañía.
Metodología 68
Tabla 1. Resumen de problemas detectados en el personal de cumplimiento
PERSONAL DE CUMPLIMIENTO
Problemas Causas Efectos
El sistema SIDD se
tarda en consultar o
grabar los documentos
de un cliente
- No es posible manejar
este tipo de datos
(Imágenes).
- Debido al tamaño
actual de la base de
datos.
- Retraso en los procesos de
cumplimiento.
- Malestar en los usuarios.
Pérdida de
información.
- Tablas corruptas en la
base de datos de
imágenes.
- Volver a registrar la
documentación de los clientes
ingresada el último día.
- Reportar el evento al
departamento de riesgos.
Nota. Fuente: Investigación directa, por el autor (2019)
Tabla 2. Resumen de problemas detectados en el departamento de IT
ADMINISTRADOR DEL CENTRO DE COMPUTO
Problemas Causas Efectos
Pérdida de tiempo en
procesos
administrativos de la
base de datos
- Base de datos muy
pesada (gran cantidad
de información).
- Demora en la ejecución de
respaldo de la base de datos de
imágenes
Tablas corruptas.
- Base de datos no apta
para manejar grandes
volúmenes de datos.
- Pérdida de información.
- Pérdida de tiempo en
restauraciones de respaldo
Usuarios internos
insatisfechos por
retardo en el sistema.
- Servidor con recursos
limitados.
- Los recursos de sistemas como
procesador y memoria
principal se agotan cuando se
trabaja con múltiples
instancias del sistema.
Nota. Fuente: Investigación directa, por el autor (2019)
Metodología 69
2.7 Especificaciones funcionales
2.7.1 Requerimientos funcionales
Tabla 3. Requerimientos funcionales
Código Requerimiento Usuario
RQ000 Conexión a la base de datos mediante
servicios web REST Personal de TI
RQ001 Inserción de documentos digitalizados Personal de
cumplimiento
RQ002 Descarga de documentos digitalizados Personal de
cumplimiento
RQ003 Eliminación de documentos
digitalizados
Personal de
cumplimiento
RQ004 Replicación del servidor Personal de TI
Nota. Fuente: Investigación directa, por el autor (2019)
2.7.2 Requerimientos no funcionales
A continuación, se procede a detallar los requerimientos no funcionales para la
implementación de la base de datos NoSQL.
Tabla 4. Requerimientos no funcionales
Código Requerimiento
RN000 Base de datos debe ser implementada basándose en la
infraestructura existente en el centro de cómputo de la compañía
RN001 Interface entre la aplicación de alto nivel SIDD y la base de datos
couchDB
RN002 Interface de red: Protocolo TCP/IP
Nota. Fuente: Investigación directa, por el autor (2019)
2.8 Casos de uso
Un caso de uso es una manera de utilizar el sistema o de interactuar con él. Los casos de
uso proporcionan una definición de las necesidades a cubrir por un proyecto desde el punto
de vista del usuario. Por lo tanto, es una técnica utilizada para ayudar al cliente a
determinar sus necesidades y requisitos. (Areba, 2001)
Metodología 70
Se detalla los procesos y sus relaciones mediante el diagrama de casos de uso; esto
permitirá detallar gráficamente todos los procesos del sistema de acuerdo a las necesidades
presentadas en el proyecto.
2.8.1 Definición de actores de casos de uso y listado de roles
Se especifica a continuación los actores que intervienen en la colaboración de
recopilación de la información:
Tabla 5. Lista de roles
Nota. Fuente: Investigación directa, por el autor (2019)
2.8.2 Diagramas de casos de uso
El diagrama de caso de uso que se mostrará a continuación permitirá explicar
gráficamente los requerimientos funcionales que contempla el presente proyecto.
2.8.2.1 Diagramas de casos de uso de mantenimiento de documentos
Figura 32. Diagrama de casos de uso de interacción con el sistema, Describe la comunicación entre el
usuario y el sistema SIDD, por el autor (2019)
Nombre Descripción
Oficial de cumplimiento Personal que ingresa o registra la documentación
de los clientes en el sistema SIDD.
Administrador de base de datos
Es la persona que va a administrar la base de datos
de las imágenes.
Metodología 71
2.8.2.2 Descripción de casos de uso
Se procede a describir detalladamente el comportamiento entre la base de datos
couchDB y el usuario (ejecutivo de cumplimiento) mediante el Sistema de Digitalización
de Documentos (SIDD) según lo graficado en el diagrama de casos de uso.
2.8.2.3 Descripciones de casos de uso de insertar documento
Código: RQ001 Nombre: Ingresar imagen
Actor: Ejecutivo de cumplimiento Fecha: 08/07/2019
Precondición:
El archivo de imagen debe existir en la computadora del usuario.
Flujo de Eventos
Acción Actor
1.- Seleccionará la opción de consulta de
clientes que está dentro del menú
consultas.
3.- El ejecutivo ingresa los datos
requeridos y selecciona el botón consultar
los datos del cliente.
5.- El ejecutivo selecciona un grupo de
imagen.
7.- El ejecutivo selecciona el botón
agregar nueva imagen.
9.- El ejecutivo selecciona el archivo de
tipo imagen que desea cargar y selecciona
el botón aceptar.
Sistema
2.- Se visualizará la pantalla de búsqueda.
4.- Se visualizará los datos del cliente y los
grupos de imágenes.
6.- Se visualizará la pantalla de carga de
documentos.
8.- Se visualizará la ventana de búsqueda de
archivos del sistema operativo.
10.- Se guarda la imagen en la base y se
visualizará un mensaje de carga exitosa.
Flujo Alterno: Error archivo no se cargó
Postcondición: Imagen guardada en la base de datos.
Figura 33. Formulario de descripción de caso de uso insertar documentos, Investigación directa, por el
autor (2019)
Metodología 72
2.8.2.4 Descripciones de casos de uso de descargar documento
Código: RQ002 Nombre: Descargar imagen
Actor: Ejecutivo de cumplimiento Fecha: 08/07/2019
Precondición: La imagen tiene que existir en la base de datos
Flujo de Eventos
Acción Actor
1.-Seleccionará la opción de consulta de
clientes que está dentro del menú
consultas.
3.- El ejecutivo ingresa los datos
requeridos y selecciona el botón consultar
los datos del cliente.
5.- El ejecutivo selecciona un grupo de
imagen.
7.- El ejecutivo selecciona la imagen que
desea descargar.
9.- El ejecutivo selecciona el botón
descargar.
Sistema
2.- Visualizará la pantalla de búsqueda.
4.- Se visualizará los datos del cliente y los
grupos de imágenes.
6.- Se muestra lista de las imágenes del
cliente.
8.- Se presenta la imagen en pantalla
completa.
Flujo alterno:
El cliente no existe, el cliente no tiene imágenes cargadas, imagen no existe
Postcondición: Archivo descargado en la computadora
Figura 34. Formulario de descripción de caso de uso descargar documentos, Investigación directa, por el
autor (2019)
Metodología 73
2.8.2.5 Descripciones de casos de uso de eliminar documentos
Código: RQ003 Nombre: Eliminar imágenes
Actor: Ejecutivo de cumplimiento Fecha: 08/07/2019
Precondición: La imagen debe existir en la base de datos.
Flujo de Eventos
Acción Actor
1.-Seleccionará la opción de consulta de
clientes que está dentro del menú
consultas.
3.- El ejecutivo ingresa los datos
requerido y selecciona el botón consultar
los datos del cliente.
5.- El ejecutivo selecciona un grupo de
imagen.
7.- El ejecutivo selecciona la imagen que
desea eliminar.
9.- El ejecutivo selecciona el botón
eliminar.
Sistema
2.- Visualizará la pantalla de búsqueda.
4.- Se visualizará los datos del cliente y los
grupos de imágenes.
6.- Se muestra lista de las imágenes del
cliente.
8.- Se presenta la imagen en pantalla
completa.
10.- Se elimina la imagen de la base de
datos y se muestra un mensaje de
eliminación exitosa.
Flujo alterno: Error no se eliminó el registro, imagen no existe.
Postcondición: Registro eliminado de la base de datos
Figura 35. Formulario de descripción de caso de uso eliminar documento, Investigación directa, por el
autor (2019)
2.9 Diagrama de flujo de datos de contexto
El DFD de contexto contiene únicamente un proceso que describe este sistema, la base
de datos planteada en el proyecto, las entidades externas que interactúan con el sistema y
los flujos de datos.
Metodología 74
Figura 36. Diagrama de flujo de datos de contexto, Se demuestra gráficamente el flujo de los datos entre los
procesos que lo componen, por el autor (2019)
En el diagrama de flujo se puede observar como el oficial de cumplimiento
proporcionan datos a la base de datos mediante el ingreso y eliminación de documentos
digitalizados y, a cambio recibe información obtenida de las consultas de los documentos
digitalizados. Por otra parte, el administrador del centro de cómputo obtiene información
de la base de datos para realizar tareas administrativas.
2.10 Diagrama de despliegue
Figura 37. Diagrama de despliegue, se presenta gráficamente la estructura y la distribución de los
componentes entre los diferentes componentes que integran el proceso. Por el autor (2019)
CAPÍTULO III
PROPUESTA
3.1 Introducción
3.1.1 Tema
Implementación de un almacén de imágenes digitales utilizando una base de datos
NoSQL que permita a la empresa Generali Ecuador Cía. de Seguro S.A. guardar
documentos de sus clientes.
3.1.2 Objetivo
Implementar un repositorio de datos que cumpla con la necesidad de la gestión del
departamento de cumplimiento de Generali Ecuador, para mejorar y controlar las
actividades que se efectúan en la misma, de esta manera lograr tener una óptima toma de
decisiones.
3.1.3 Entorno de software
Para el Análisis y diseño de la base de datos se contempla la arquitectura y prestaciones
de la base de datos CouchDB. Para que se ejecuten las funciones de almacenamiento de
datos y la implementación de servicios web REST en reemplazo de la capa de accesos a
datos.
3.2 Fase de diseño
3.2.1 Modelo entidad – relación
Para mayor información del proyecto se mostrará el modelo entidad-relación del
sistema SIDD, la parte que se encuentra sobre una base de datos MYSQL. Mientras que la
base de datos que se encuentra en couchDB no puede ser diagramado por ser una base de
datos no estructurada.
Propuesta 76
Figura 38. Diagrama de modelo de datos MySql, Representación gráfica de las estructuras de las tablas de
la base de datos MySql del sistema SIDD, por el autor (2019)
Propuesta 77
3.2.2 Diagrama de actividades
Los siguientes diagramas expresan gráficamente los requerimientos levantando en el
presente proyecto.
DIAGRAMA DE ACTIVIDAD - DESCARGA DE IMAGEN
Usuaio SIDD couchDB
Iniciar
Presentar lista de documentos
Consultar cliente
Seleccionar grupo de documentos
Presentar grupos de documentos
Seleccionar documento
Presentar documento
Solicitar documento
Seleccionar botón descargar
Procesar solicitud
Terminar
Figura 39. Diagrama de actividad de descarga de documento, Se describe en flujo de las actividades de la
operación entre la base de datos, el sistema SIDD y la base de datos NoSQL, por el autor (2019)
Propuesta 78
DIAGRAMA DE ACTIVIDAD - INGRESAR DOCUMENTO
Usuaio SIDD CouchDB
Iniciar
Presentar lista de documentos
Consultar cliente
Seleccionar grupo de documentos
Presentar grupos de documentos
Presionar botón Seleccionar
archivo
Presionar botón Grabar
Insertar registro JSON
Terminar
Solicitar inserción
Figura 40. Diagrama de actividad de ingresar documentos, Se describe en flujo de las actividades de la
operación entre la base de datos, el sistema SIDD y la base de datos NoSQL, por el autor (2019)
Propuesta 79
DIAGRAMA DE ACTIVIDAD - ELIMINAR DOCUMENTO
Usuaio SIDD couchDB
Iniciar
Presentar lista de documentos
Consultar cliente
Seleccionar grupo de documentos
Presentar grupos de documentos
Seleccionar documento
Presentar documento
Solicitar documento
Seleccionar botón eliminar
Procesar solicitud
Terminar
Solicitar eliminación
Eliminar registro JSON
Figura 41. Diagrama de actividad de eliminar documento, Se describe en flujo de las actividades de la
operación entre la base de datos, el sistema SIDD y la base de datos NoSQL, por el autor (2019)
Propuesta 80
3.2.3 Diccionario de la base de datos – MySql
3.2.3.1 Diccionario de la tabla de documentos
Figura 42. Diccionario de la tabla de documentos, información tomada de la base de datos del Sistema
Integrado de Digitalización de documentos, por el autor (2019)
Propuesta 81
Figura 43. Formulario de descripción de la tabla documentos, Investigación directa, por el autor (2019)
Universidad de Guayaquil Licenciatura en Sistemas de Información
DICCIONARIO DE DATOS
Página 1 de 5
Fecha de elaboración: 31/07/2019
PROYECTO: SIDD INTEGRANTES: Celleri Gavilanez Peter Omar
MODULO DE: Versión 1.0
TABLA: DOCUMENTOS TIPO TABLA: MAESTRA
DESCRIPCIÓN: Contiene el listado de los tipos de documentos del sistema informático SIDD.
Descripción del registro
No. Nombre del campo Definición Tipo Sec Formato Long Null
1 docu_secuencia Valor incremental PK A I 11 No
2 docu_nombre Nombre del grupo de documento
E M VC 50 Si
3 docu_obligatorio Indica si el grupo de documentos es obligatorio
E M S 4 Si
4 docu_condicion Contiene la condición para identificar si es obligatorio
E M VC 255 Si
5 docu_orden Orden en que se presentará en la pantalla
E M S 4 Si
OBSERVACIÓN:
Tipo PK Clave Primaria FK Clave Foránea E Elemento de dato
Secuencia A Automática M Manual
Formato numérico I Integer S Small Integer DC Decimal M Money
Formato caracter C Char VC Varchar
Formato fecha D Date DT DateTime
Propuesta 82
3.2.3.2 Diccionario de la tabla de cliente
La tabla “cliente” contiene las referencias de los registros del cliente en el sistema SIDD
con los datos sistema ERP de la compañía.
Figura 44. Diccionario de la tabla de clientes, información tomada de la base de datos del Sistema
Integrado de Digitalización de documentos, por el autor (2019)
Propuesta 83
Figura 45. Formulario de descripción de la tabla cliente, Investigación directa, por el autor (2019)
Universidad de Guayaquil Licenciatura en Sistemas de Información
DICCIONARIO DE DATOS
Página 2 de 5
Fecha de elaboración: 31/07/2019
PROYECTO: SIDD INTEGRANTES: Celleri Gavilanez Peter Omar
MODULO DE: Versión 1.0
TABLA: CLIENTE TIPO TABLA: MAESTRA
DESCRIPCIÓN: Contiene el listado de las relación de la tabla de clientes del sistema SIDD con el ERP de la compañía.
Descripción del registro
No. Nombre del
campo Definición Tipo Sec Formato Long Null
1 cliente_clave Valor incremental PK A I 11 No
2 clave Código del cliente en el
ERP de la compañía
E M C 8 No
OBSERVACIÓN:
Tipo PK Clave Primaria FK Clave Foránea E Elemento de dato
Secuencia A Automática M Manual
Formato numérico I Integer S Small Integer DC Decimal M Money
Formato caracter C Char VC Varchar
Formato fecha D Date DT DateTime
Propuesta 84
3.2.3.3 Diccionario de la tabla grupo de documentos del cliente
Figura 46. Diccionario de la tabla grupo de documentos del cliente, información tomada de la base de datos
del Sistema Integrado de Digitalización de documentos, por el autor (2019)
Propuesta 85
Figura 47. Formulario de descripción de la tabla clientesdocumentos, Investigación directa, por el autor
(2019)
Universidad de Guayaquil Licenciatura en Sistemas de Información
DICCIONARIO DE DATOS
Página 3 de 5
Fecha de elaboración: 31/07/2019
PROYECTO: SIDD INTEGRANTES: Celleri Gavilanez Peter Omar
MODULO DE: Versión 1.0
TABLA: CLIENTESDOCUMENTOS TIPO TABLA: TRANSACCION
DESCRIPCIÓN: Contiene el registro de las actividades que se realizan en los grupos de documentos.
Descripción del registro
No. Nombre del campo Definición Tipo Sec Formato Long Null
1 clave Valor incremental PK A I 11 No
2 clientes_clave Clave del cliente FK M I 11 No
3 documento Nombre documento FK M VC 50 No
4 ruta Campo obsoleto, ya no se usa
E M VC 255 No
5 contador Cantidad de documentos
E M I 11 Si
6 fecha_captura Fecha de ingreso E M D 1 No
7 fecha_expiracion Fecha de caducidad de la imagen
E M D 1 No
OBSERVACIÓN:
Tipo PK Clave Primaria FK Clave Foránea E Elemento de dato
Secuencia A Automatica M Manual
Formato numérico I Integer S Small Integer DC Decimal M Money
Formato caracter C Char VC Varchar
Formato fecha D Date DT DateTime
Propuesta 86
3.2.3.4 Diccionario de la tabla imágenes del documento
Figura 48. Diccionario de la tabla imágenes del documento, información tomada de la base de datos del
Sistema Integrado de Digitalización de documentos, por el autor (2019)
Propuesta 87
Figura 49. Formulario de descripción de la tabla clientesdocumentosimagenes, Investigación directa, por el
autor (2019)
Universidad de Guayaquil Licenciatura en Sistemas de Información
DICCIONARIO DE DATOS
Página 4 de 5
Fecha de elaboración: 31/07/2019
PROYECTO: SIDD INTEGRANTES: Celleri Gavilanez Peter Omar
MODULO DE: Versión 1.0
TABLA: CLIENTESDOCUMENTOSIMAGENES TIPO TABLA: TRANSACCIÓN
DESCRIPCIÓN: Contiene el registro de las actividades de la carga de imágenes a un grupo de documentos
Descripción del registro
No. Nombre del campo Definición Tipo Sec Formato Long Null
1 clave Valor incremental PK A I 11 No
2 clavedocumento Clave documento FK M I 11 No
3 tipo Tipo de archivo E M C 50 No
4 nombre Nombre del archivo E M VC 255 No
5 Id_revision Identificado único de revisión de couchDB
E M VC 255 No
OBSERVACIÓN:
Tipo PK Clave Primaria FK Clave Foránea E Elemento de dato
Secuencia A Automática M Manual
Formato numérico I Integer S Small Integer DC Decimal M Money
Formato caracter C Char VC Varchar
Formato fecha D Date DT DateTime
Propuesta 88
3.2.4 Diccionario de la base de datos – CouchDB
A continuación, se ilustrará la estructura de la base de datos en couchDB para el
repositorio de documentos digitalizados, cabe mencionar su representación se hará en
notación JSON por ser una base de datos NoSQL orientada a documentos.
3.2.4.1 Diccionario de documento JSON documentos
Figura 50. Estructura de documento JSON documentos, por el autor (2019)
Propuesta 89
Figura 51. Formulario de descripción de documento JSON imágenes, Investigación directa, por el autor
(2019)
Universidad de Guayaquil Licenciatura en Sistemas de Información
DICCIONARIO DE DATOS
Página 5 de 5
Fecha de elaboración: 31/07/2019
PROYECTO: SIDD INTEGRANTES: Celleri Gavilanez Peter Omar
MODULO DE: Versión 1.0
TABLA: TIPO TABLA: TRANSACCIÓN
DESCRIPCIÓN: Representación de documento JSON que almacenan los datos de los archivos digitalizados cargados a couchDB
Descripción del registro
No. Nombre del
campo Definición Tipo Sec Formato Long Null
1 _id Id del archivo en el sistema SIDD PK M I 11 No
2 _rev Id. De revisión PK A VC 50 No
3 sistema Nombre del sistema de la compañía que ingresa el registro
E M VC 255 Si
4 tipo_documento Nombre del grupo de documento
E M VC 255 Si
5 codigo_cliente Clave del cliente del ERP de la compañía
E M S 8 Si
6 _attachments Registro del archivo adjunto E A VC 255 No
7 content_type Tipo de contenido del archivo E A VC 255 No
8 revpos Número de modificación E A I 11 No
9 digest Cadena de comprobación MD5 E A VC 255 No
10 length Tamaño de archivo adjunto E A I 11 No
11 stub Indica si e adjunto se conserva en caso de actualizar el documento JSON
E A B 1 No
OBSERVACIÓN:
Tipo PK Clave Primaria FK Clave Foránea E Elemento de dato
Secuencia A Automática M Manual
Formato numérico I Integer S Small Integer DC Decimal M Money
Formato caracter C Char VC Varchar
Formato fecha D Date DT DateTime
Fortmato logico B Boolean
Propuesta 90
3.3 Pruebas
Como se mencionó anteriormente el sistema de base de datos couchDB no permite el
acceso o la manipulación directa de los datos. En su lugar provee una serie de servicios
web REST que son los encargados de realizar las operaciones de escritura y lectura de los
datos.
También cabe mencionar que se realizaron modificaciones al sistema web SIDD
(Sistema Integrado de Digitalización de Documentos) para que pueda almacenar los
archivos de los clientes en la base de datos de couchDB.
Luego de finalizar la implementación de la base de datos, se dio inicio al proceso de
pruebas funcionales. Dicho proceso tiene como objetivo principal los siguientes puntos:
Probar el adecuado funcionamiento del servidor de base de datos.
Comprobar la disponibilidad y la operatividad de los servicios web
REST provisto por la base de datos.
Probar la integración del sistema SIDD de la compañía con la nueva
base de datos.
Para lograr esto objetivos se dispuso utilizar el programa SoapUI que permitió testear
los servicios web REST y obtener la respuesta enviadas por el servidor y por otra parte se
utilizó fauxton que es la interfaz gráfica de couchDB y que permitió corroborar los
resultados de las operaciones realizadas por el sistema SIDD.
Las pruebas operativas se realizaron en base a los requerimientos funcionales; por
consiguiente, se muestran las plantillas con la información de los casos de prueba.
Propuesta 91
3.3.1 Casos de prueba
3.3.1.1 Caso de prueba conexión a la base de datos mediante servicio web REST
Figura 52. Formulario de caso de prueba conexión a la base de datos mediante servicio web REST,
Investigación directa, por el autor (2019)
Propuesta 92
3.3.1.2 Caso de prueba de insertar documento
Figura 53. Formulario de caso de prueba de insertar datos mediante servicio web REST, Investigación
directa, por el autor (2019)
Propuesta 93
3.3.1.3 Caso de prueba de descargar documento
Figura 54. Formulario de caso de prueba consultar datos mediante servicio web REST, Investigación
directa, por el autor (2019)
Propuesta 94
3.3.1.4 Caso de prueba de eliminar documento
Figura 55. Formulario de caso de prueba eliminar datos mediante servicio web REST, Investigación directa,
por el autor (2019)
Propuesta 95
3.3.2 Pruebas con SoapUI
Figura 56. Conexión a la base de datos mediante servicio web REST, captura de pantalla del sistema
SoapUI, por el autor (2019)
Figura 57. Insertar datos mediante servicio web REST, captura de pantalla del sistema SoapUI, por el autor
(2019)
Propuesta 96
Figura 58. Consultar datos mediante servicio web REST, captura de pantalla del sistema SoapUI, por el
autor (2019)
Figura 59. Eliminar datos mediante servicio web REST, captura de pantalla del sistema SoapUI, por el
autor (2019)
Propuesta 97
3.3.3 Prueba de integración con el sistema SIDD
3.3.3.1 Ingreso de archivo
Figura 60. Formulario de caso de prueba ingreso de archivo desde sistema SIDD, Investigación directa, por
el autor (2019)
Propuesta 98
Figura 61. Contenido de documento JSON, información tomada del aplicativo fauxton, por el autor, (2019)
En la figura 61 se puede observar el contenido del documento JSON creado desde el
sistema SIDD, en el cual se puede observar que la información registrada efectivamente
hace referencia a los datos del caso de prueba insertar documentos.
Cabe indicar que el sistema fauxton también permite descargar los archivos adjuntos de
los registros, tal como se puede observar en la figura 61.
Propuesta 99
3.3.3.2 Descargar archivo desde el sistema SIDD
Figura 62. Formulario de caso de prueba descarga de archivo desde sistema SIDD, Investigación directa,
por el autor (2019)
Propuesta 100
Figura 63. Descarga de archivo desde el sistema SIDD, información tomada del Sistema de Digitalización
de Documentos, por el autor (2019)
Propuesta 101
3.3.3.3 Eliminar documentos desde el sistema SIDD
Figura 64. Formulario de caso de prueba eliminar documento desde el sistema SIDD, Investigación directa,
por el autor (2019)
Propuesta 102
Figura 65. Eliminar documento desde el sistema SIDD, Información tomada del aplicativo fauxton, por el
autor (2019)
Como se evidenciar en las imágenes de pruebas, se corrobora que luego de la ejecución
de cada operación, en los documentos dentro de la base de datos couchDB hubo un cambio
relacionado con los datos enviados en el evento que originó la modificación.
Por lo anteriormente expuesto en cada una de las pruebas, queda demostrado que la base
de datos SIDD en couchDB permite de manera totalmente efectiva insertar, descargar y
eliminar los documentos digitalizados de los clientes de la empresa Generali Ecuador Cía.
de Seguros S.A. Y de la misma manera mediante la integración con el sistema SIDD queda
confirmado que la base de datos anteriormente nombrada se puede integrar con los demás
sistemas de la compañía, por medio del consumo de los servicios web REST que en ella se
integran de forma nativa.
3.4 Conclusión y recomendación
3.4.1 Conclusiones
Luego de implementar el sistema de base de datos NoSQL como medio para el
almacenamiento y centralización de documentos digitales, se puede concluir que estas
bases de datos son muy complejas de manejar, debido a que carecen de un lenguaje
Propuesta 103
estructurado de consulta claramente definido y que además no existe un estándar en la
manipulación de los datos, es decir en el manejo de los datos cada sistema NoSQL es
diferente uno de otro.
Haber elegido couchDB fue una decisión muy acertada debido a que:
Permite cargar los archivos digitales como adjuntos de los documentos JSON de la
base de datos, esta es una característica presente solamente esta base de datos y que
resulta de gran ayuda para proyectos con características similares al presente trabajo.
El acceso y operaciones a los datos se realiza mediante servicios web REST, los cuales
puede ser consumidos mediante la librería CURL, que es bastante difundida y
soportada en el ambiente informático, lo que facilitó en gran medida a la
implementación de este proyecto.
Se puede alcanzar un gran poder de cómputo, distribuyendo los procesos en diferentes
computadoras.
También se puede concluir que la información converge en un solo punto, lo cual
significa un gran avance en la organización documental, gracias a esto es más fácil
encontrar una información requerida, en lugar de buscar entre ciento de carpetas
distribuida por varios servidores.
Otro punto a considerar es la utilización de RAD como metodología de desarrollo de
proyectos relacionados a la implementación de base de datos, pues no cabe la menor duda
que es una excelente herramienta que debido a su flexibilidad permite concentrar todos sus
componentes para gestionar un proyecto de tales características.
3.4.2 Recomendaciones
Se recomienda el uso de la base de datos couchDB en el desarrollo de sistemas
informáticos para la gestión de documentos digitales. Debido su fácil instalación y
configuración, no requieren que grandes máquinas para ofrecer un excelente rendimiento,
además contar con una excelente documentación online y de tener el soporte de Apache
Org.
Propuesta 104
También se recomienda ampliamente implementar sistemas documentales que permitan
centralizar el almacenamiento documental de las empresas y que agilicen la gestión de los
mismos.
Se recomienda el uso de RAD como metodología o marco de trabajo en proyectos de
diseño o implementación de base de datos, por el motivo que facilita en gran medida
brinda sustento técnico a proyecto similar o a proyectos que no necesariamente requieren
de programación.
ANEXOS
Anexos 106
ANEXOS Nº 1
ENTREVISTAS
Entrevista # 1
Nombre del Encuestado
Ing. Rodrigo Pazos Fecha de la entrevista
04/07/2019
Cargo que desempeña:
Administrador del centro de computo
1. ¿Qué base de datos se utiliza para almacenar la información del sistema SIDD? Para guardar los datos se utiliza sistema de base de datos de MySql.
2. ¿Con que periodicidad se realizan respaldos de los datos? Todos los días se respaldan los datos de todos los sistemas, incluido el SIDD.
3. ¿Cuáles son los pasos a realizar en la elaboración del proceso de respaldo? Para respaldar los datos del SIDD se hace un proceso diferente al resto de sistemas ya que son datos de tipo binario. Lo que se hace es respaldar el directorio en donde MySql guarda los datos. Para el resto de sistemas se ejecuta el comando mysqldump.
4. ¿Qué tiempo se toma realizar el proceso de respaldo del SIDD? Actualmente toma un tiempo aproximado de 8 horas.
5. ¿Actualmente cuánto pesa la base de datos SIDD? Actualmente pesa un poco más 83 Gigas, pero 82 GB están concentrados en una sola tabla que es la que almacena las imágenes.
6. ¿Quiénes son los responsables de realizar los respaldos del SIDD? Únicamente yo soy el responsable de realizarlo.
7. ¿Considera usted necesario cambiar la base de datos del SIDD y por qué? Sí, porque MySql no es una base de datos robusta como para gestionar grandes volúmenes de datos. Ni gestionar adecuadamente los datos de tipo binarios y una muestra de ello es que no se puede respaldar los datos con el comando mysqldump.
8. ¿Qué características considera que debería tener la nueva base de datos del SIDD? Nativamente debería contener lo siguiente: Manejar grandes volúmenes de datos. Orientada al manejo de archivos. Permitir replicación. Permitir escalabilidad horizontal
Anexos 107
Entrevista # 2
Nombre del Encuestado
Ing. Carlos Silva Fecha de la entrevista
04/07/2019
Cargo que desempeña:
Subgerente de TI
1. ¿Administrativamente considera viable mantener la actual base de datos? No, por el motivo que consume mucho tiempo administrar esa base de datos, tiempo que puede ser utilizado en otras tareas más prioritarias.
2. ¿Alguna vez ha tenido problema con la base de dato del SIDD? Si, en dos ocasiones una misma tabla genero error “tabla corrupta” teniendo que recuperar los datos de un respaldo y volviendo a reingresar las imágenes del último día.
3. ¿Qué tanto se está considerando cambiar la base de datos del SIDD? En la actualidad es una prioridad realizar ese cambio, por el motivo que es complicado administrar esa base de datos y por el peso que tiene la base de datos. Lo que está volviendo lento el sistema SIDD. Cambiar la base de datos por una base de datos más robusta y con mejores prestaciones me permitirá estar más tranquilo. Porque sabré que los datos estarán a buen recaudo.
4. ¿Qué características considera que debería tener la nueva base de datos del SIDD? La nueva base de deber tener las características de las bases de datos modernas como la alta disponibilidad, replicación y sobre todo manejar el concepto de big-data.
Anexos 108
Entrevista # 3
Nombre del Encuestado
Sr. Johan Beltrán Fecha de la entrevista
05/07/2019
Cargo que desempeña:
Ejecutiva de cumplimiento
1. ¿Con que periodicidad utiliza el sistema SIDD? Utilizó el sistema SIDD todos los días para registrar la documentación de los clientes.
2. ¿Aproximadamente cuantas imágenes registra diariamente? Según los registros, se ingresan un promedio de 45 imágenes al día.
3. ¿En la siguiente escala indique que tan fácil considera que es usar el sistema SIDD? a: Fácil b: No tan fácil c: Complicado Es fácil.
4. ¿Si pudiera cambiar algo del sistema, que sería? Cambiaría la velocidad del sistema, al principio el sistema funcionaba muy bien era rápido, pero actualmente se tarda mucho al consultar grabar o eliminar las imágenes.
5. ¿Considera usted necesario cambiar la base de datos del SIDD y por qué? Sí y por qué MySql no es una base de datos robusta como para gestionar grandes volúmenes de datos. Ni gestionar adecuadamente los datos de tipo binarios y una muestra de ello es que no se puede respaldar los datos con el comando mysqldump.
6. ¿Qué características considera que debería tener la nueva base de datos del SIDD? Nativamente debería contener lo siguiente: Manejar grandes volúmenes de datos. Orientada al manejo de archivos. Permitir replicación. Permitir escalabilidad horizontal
Bibliografía 109
BIBLIOGRAFÍA
Generali Ecuador Cía. de Seguros S.A. (2012). Manual de prevención de lavado de activos
y financiamiento del terrorismo y otros delitos. Obtenido de
http://generali.com.ec/archivos/pres_27.pdf
Decreto Supremo N° 1147. Legislación sobre contratos de seguros. Registro Oficial de la
República del Ecuador, Quito, 07 de diciembre de 1963
Ley General de Seguros. Registro Oficial de la república de Ecuador, Quito, 12 de
septiembre del 2014
Fundación Mapfre. (2012). Diccionario Mapfre de seguros. Obtenido de
https://www.fundacionmapfre.org/fundacion/es_es/publicaciones/diccionario-
mapfre-seguros/s/seguro.jsp
Unidad de Análisis Financiero y Económico. (2012). Infórmate sobre el lavado de activos.
Obtenido de https://www.uafe.gob.ec/informate-sobre-el-lavado-de-activos/
Martin, R., Manuel, H., & Ariza Quiroga, D. A. (2016). Implementación de Prototipo de
Software de Gestión de Información y Procesos para Oficina Asesora de Seguros
Basada en Tecnologías CLOUD.
Zhingri, V., & Augusto, C. (2016). Análisis de rendimiento entre la base de datos
relacional: MySQL y una base de datos no relacional: MongoDB (Bachelor's
thesis, Universidad del Azuay).
Antaño, A. C. M., Castro, J. M. M., & Valencia, R. E. C. (2014). Migración de Bases de
Datos SQL a NoSQL. Revista Tlamati, Especial, 3, 144-148.
Vieira, M. R., FIGUEIREDO, J. M. D., Liberatti, G., & Viebrantz, A. F. M. (2012).
Bancos de Dados NoSQL: conceitos, ferramentas, linguagens e estudos de casos no
contexto de Big Data. Simpósio Brasileiro de Bancos de Dados.
Zuleta Sevilla, N. E. (2018). Estudio de la integración del lenguaje de programación PHP
con la base de datos NOSQL apache COUCHDB Sistema de gestión de expedientes
de los estudiantes de la carrera de Ingeniería en Sistemas
Computacionales (Bachelor's thesis).
Silva, B., Felipe, J., & Chicaiza Ayala, P. A. (2006). Diseño de una solución SAN para la
centralización de la información de la Escuela Politécnica Nacional (Bachelor's
thesis, QUITO/EPN/2006).
Cevallos, J. R. M., & Holguín, B. L. D. (2018). Sistemas de información empresarial: la
información como recurso estratégico. Dominio de las Ciencias.
Sánchez-Vignau, B. S., & Valdés-López, Y. (2008). Diseño de sistemas de información
documental. Consideraciones teóricas. Ciencias de la Información.
Núñez Quiroz, J. J. (2019). Adquisición e implementación de un sistema de digitalización
de documentos y gestión documental.
Bibliografía 110
Martín, A. E., Chávez, S. B., Rodríguez, N. R., Valenzuela, A., & Murazzo, M. A. (2013,
June). Bases de datos NoSQL en cloud computing. In XV Workshop de
Investigadores en Ciencias de la Computación.
Sánchez, A. E. (2014). La gestión de documentos como estrategia de innovación
empresarial. Enl@ce: Revista Venezolana de Información, Tecnología y
Conocimiento, 11(2), 25-50.
Mesa, E. G. (2015). La digitalización de documentos, ¿amiga o enemiga?. Bibliotecas.
Anales de Investigación, (2), 150-154.
Couchbase. (2019). Why NoSQL? Couchbase, Recuperado el 20 de Julio de 2019, de
https://www.couchbase.com/resources/why-nosql
Antiñanco, M. J. (2014). Bases de Datos NoSQL: Escalabilidad y alta disponibilidad a
través de patrones de diseño (Doctoral dissertation, Facultad de Informática).
Moyano González, A. D. (2019). Sistema de transferencia de datos de origen múltiple a
Oracle para la empresa Solinfo (Bachelor's thesis, Universidad Técnica de
Ambato. Facultad de Ingeniería en Sistemas, Electrónica e Industrial. Carrera de
Ingeniería en Sistemas Computacionales e Informáticos).
Tran, M. C., & Nakamura, Y. (2016, January). Classification of HTTP automated software
communication behaviour using NoSql database. In 2016 International Conference
on Electronics, Information, and Communications (ICEIC) (pp. 1-4). IEEE.
tic. Portal. (2016). Sistema de Gestión Documental. Obtenido de
https://www.ticportal.es/temas/sistema-gestion-documental/que-es-sistema-gestion-
documental
Sánchez, A. (2007). El valor del cliente como herramienta estratégica de gestión en un
mercado industrial. Málaga: Universidad de Málaga.
Pulgar-Rubio, F., Carmona, C. J., Rivera-Rivas, A. J., González, P., & del Jesus, M. J.
(2015). Una primera aproximación al descubrimiento de subgrupos bajo el
paradigma MapReduce. In 1er Workshop en Big Data y Análisis de Datos
Escalable (pp. 991-1000).
Eduardo Fabián Cajas Malavé, (2014) Estudio Sobre Las Bases De Datos Nosql Orientado
A Los Servicios Web 2.0.
Montoya, C. E. G., Uribe, C. A. C., & Rodríguez, L. E. S. (2014). Seguridad en la
configuración del servidor web Apache. Inge Cuc, 9(2), 31-38.
Romano, J. M. G. (2015). Desarrollo de sitios web con PHP y MySQL. Obtenido de
http://www. lsi. us. es/cursos/cursophp/apuntes/tema1. pdf.
Bibliografía 111
Mora-Castillo, J. A. (2016). Serialización/deserialización de objetos y transmisión de datos
con JSON: una revisión de la literatura. Revista Tecnología en Marcha, 29(1), ág-
18.
Página oficial de CURL, Obtenido el 30 de julio de 2019, de https://curl.haxx.se
Página oficial de PHP, Obtenido el 30 de julio de 2019, de
https://www.php.net/manual/es/curl.examples.php
Página oficial de couchDB, Obtenido el 30 de julio de 2019, de http://couchdb.apache.org
Letelier, P., & Penadés, M. C. (2012). Metodologías ágiles para el desarrollo de software:
eXtreme Programming (XP).
PERUGACHI, P., & PAÚL, S. (2017). PLAN DE MEJORA DE LA CUSTODIA Y
ADMINISTRACIÓN CENTRALIZADA DE DOCUMENTOS SENSIBLES EN
LA COOPERATIVA DE AHORRO Y CRÉDITO CONSTRUCCIÓN,
COMERCIO Y PRODUCCIÓN (Bachelor's thesis, Quito).
López Ramírez, M. C. (2015). Diseño e implementación de una base de datos para
recogida y análisis de datos de actividad física provenientes de dispositivos
wearables.
Puerta González, J. M. (2015). Desarrollo de una API para la descripción y gestión de
Servicios Web REST.
Cárdenas Ospina, L. A., & Rodríguez Beltrán, J. A. (2016). Sistema de gestión de pruebas
para productos de software.
Jerez Mayorga, D. S. (2017). Análisis de métodos, técnicas y herramientas de Verificación
y validación de software, aplicados en la Dirección de Tecnología de Información y
Comunicación de La Universidad Técnica de Ambato (Bachelor's thesis).
Urbina, G. B. (2016). Introducción a la seguridad informática. Grupo editorial PATRIA.
García-Canal, E., Rialp-Criado, A., & Rialp-Criado, J. (2015). Tecnologías de la
información y comunicación (TIC) y crecimiento de la empresa. ICE, Revista de
Economía, (838).
Chaverra, J. A. H., & Arias, A. V. (2017). El papel de las TIC en el entorno organizacional
de las pymes. Trilogía Ciencia Tecnología Sociedad, 4(7), 105-122.
Sánchez, J. C. (2012). Los métodos de investigación. Ediciones Díaz de Santos.
Date, C. J. (2001). Introducción a los sistemas de bases de datos. Pearson Educación.
Rivero, D. (2013). Metodología de la investigación.
Hernández Sampieri, R., Fernández Collado, C., & Baptista Lucio, P. (2003). Metodología
de la investigación (Vol. 707). México: McGraw-Hill.
Bibliografía 112
Arias, F. G. (1999). El proyecto de investigación. Fidias G. Arias Odón.
Gamboa, J. Z. (2018). Evolución de las Metodologías y Modelos utilizados en el
Desarrollo de Software. INNOVA Research Journal, 3(10), 20-33.
Ojeda, J. C., & Fuentes, M. D. C. G. (2012). Taxonomía de los modelos y metodologías de
desarrollo de software más utilizados. Universidades, (52), 37-47.
Gallego, M. T. (2012). Metodología Scrum. Universitat Oberta de Catalunya.
Caballero Narvaez, S., & Devia Palacio, D. S. (2018). Sistema de información
bibliotecario para la Biblioteca Manuela Beltrán.
Torres, P. L. (2004). Desarrollo de Software Orientado a Objeto usando UML. Universidad
Politecnica de Valencia (UPV)–España.
García-Holgado, A., García, M., & García-Peñalvo, F. J. (2018). UML. Unified Modeling
Language.
Danhke, L. (1989). Metodología y técnicas de la investigación.
Flores, J., García, E., & Rodríguez, G. (1996). Metodología de la investigación cualitativa.
Málaga: Editorial Aljibe