application and advantages of the connector and possibly...

8
51 Application and advantages of the connector "and possibly" in bipolar queries on Gefred model Aplicación y ventajas del conector "y posiblemente" en búsquedas bipolares sobre el modelo Gefred Fabián Castiblanco R., Yigliana Álvarez M., Roxana Jaramillo C. Universidad Distrital Francisco José de Caldas. Bogotá, Colombia. facastiblancor(AT)udistrital.edu.co; yalvarezm(AT)correo.udistrital.edu.co; rajaramilloc(AT)correo.udistrital.edu.co INFORMACIÓN DEL ARTÍCULO Artículo de Investigación Recibido: 19-04-2016 Correcciones: 14-06-2016 Aceptado: 20-06-2016 Keywords Bipolar queries, fuzzy databases, fuzzy operator, membership function. Palabras clave Búsquedas bipolares, bases de datos difusas, operadores difusos, funciones de pertenencia. ABSTRACT Fuzzy databases have been implemented in corporate and organizational level as an efficient and effective tool to carry out searches with values that can be vague, unknown, incomplete or null. In the same way, developments about bipolarity have allowed user to raise more flexible queries in terms of their proximity to natural language. The aim of this paper is to implement the fuzzy operator “and possibly” proposed by the theory of bipolar queries, in the Generalized Model of Fuzzy Relational Databases (Gefred). With this aim in mind, in the first part it is addressed the theoretical aspects about bipolarity and the Gefred model that allow to think about an integration between both theories. Then, through an application, it is proposed the needed procedures and the emerging advantages of use of fuzzy operator. RESUMEN Las bases de datos difusas han sido implementadas a nivel empresarial y organizacional como una herramienta eficiente y eficaz para realizar consultas con valores que pueden ser vagos, desconocidos, incompletos o nulos. De igual forma, los desarrollos sobre bipolaridad han permitido al usuario plantear consultas más flexibles en términos de su proximidad al lenguaje natural. El propósito del presente documento es implementar el operador difuso y posiblemente, planteado en la teoría de las búsquedas bipolares, en Generalized Model of Fuzzy Relational Databases (Gefred). Para tal fin, en la primera parte se abordan los aspectos teóricos sobre bipolaridad y el modelo Gefred que permiten pensar en una integración de las dos teorías. Posteriormente, a través de una aplicación se plantean los procedimientos necesarios y las ventajas que emergen del uso del operador difuso. © 2016 IAI. All rights reserved. 1. Introducción En la actualidad, Generalized Model of Fuzzy Relational Databases (Gefred) tiene amplia aplicabilidad debido a las ventajas que presenta, en comparación con las bases de datos tradicionales: especialidad para el tratamiento de datos difusos (vagos, desconocidos, incompletos, nulos) [1] y la capacidad de flexibilización que brinda al usuario para realizar consultas con condiciones y/o atributos de tipo difuso, lo cual permite un acercamiento al trabajo computacional con el lenguaje natural. Debido a esto, en la última década se ha incrementado el uso de bases de datos relacionales difusas en grandes industrias. También se ha mejorado la eficiencia en la solución de problemas relacionados, por ejemplo, con el comercio electrónico y la medicina, en los que se ha obtenido resultados de búsquedas con costos, en tiempo y dinero, iguales a las bases de datos tradicionales [2]. Con el fin de optimizar los resultados obtenidos, se hace relevante y oportuno incorporar y estudiar en el modelo Gefred, consultas que permitan el tratamiento de preferencias planteadas por el usuario desde un marco bipolar, es decir, aquellas que establecen condiciones positivas y negativas al mismo tiempo. Este estudio permite ampliar y mejorar el tratamiento computacional del lenguaje natural y, aportar a la discusión y continuación de los trabajos desarrollados hasta la fecha. Desde la revisión de la literatura se plantea el tratamiento de consultas bipolares sobre atributos difusos en el marco de bases de datos nítidas, o el uso de un orden lexicográfico y la tripleta de Morgan ( ,∨ ,¬) sobre bases de datos difusas [3]. En este artículo se trabaja con el operador difuso “y posiblemente”, desde la teoría de las búsquedas bipolares, y se aplica bajo el modelo Gefred, de tal forma que se puedan determinar sus ventajas y beneficios. El documento se organiza de la siguiente manera: en la sección de revisión se describe de forma general la estructura, los componentes y el funcionamiento de Gefred, junto con la teoría general sobre búsquedas bipolares. En los aspectos metodológicos se presenta el operador “y posiblemente”, con algunas propiedades relevantes, lo cual establece el procedimiento para la construcción de las consultas. Finalmente, se realiza una Revista Antioqueña de las Ciencias Computacionales y la Ingeniería de Software ISSN: 2248-7441 www.fundacioniai.org/raccis raccis(AT)fundacioniai.org (2016). RACCIS 6(1), pp. 51-58

Upload: buicong

Post on 14-Feb-2018

219 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Application and advantages of the connector and possibly ...fundacioniai.org/raccis/v6n1/n10a6.pdf · Búsquedas bipolares, bases de datos difusas, operadores difusos, ... desconocidos,

51

Application and advantages of the connector "and possibly" in bipolar queries on Gefred model

Aplicación y ventajas del conector "y posiblemente" en búsquedas bipolares sobre el modelo Gefred

Fabián Castiblanco R., Yigliana Álvarez M., Roxana Jaramillo C. Universidad Distrital Francisco José de Caldas. Bogotá, Colombia. facastiblancor(AT)udistrital.edu.co; yalvarezm(AT)correo.udistrital.edu.co; rajaramilloc(AT)correo.udistrital.edu.co INFORMACIÓN DEL ARTÍCULO Artículo de Investigación Recibido: 19-04-2016 Correcciones: 14-06-2016 Aceptado: 20-06-2016 Keywords Bipolar queries, fuzzy databases, fuzzy operator, membership function. Palabras clave Búsquedas bipolares, bases de datos difusas, operadores difusos, funciones de pertenencia.

ABSTRACT Fuzzy databases have been implemented in corporate and organizational level as an efficient and effective tool to carry out searches with values that can be vague, unknown, incomplete or null. In the same way, developments about bipolarity have allowed user to raise more flexible queries in terms of their proximity to natural language. The aim of this paper is to implement the fuzzy operator “and possibly” proposed by the theory of bipolar queries, in the Generalized Model of Fuzzy Relational Databases (Gefred). With this aim in mind, in the first part it is addressed the theoretical aspects about bipolarity and the Gefred model that allow to think about an integration between both theories. Then, through an application, it is proposed the needed procedures and the emerging advantages of use of fuzzy operator. RESUMEN Las bases de datos difusas han sido implementadas a nivel empresarial y organizacional como una herramienta eficiente y eficaz para realizar consultas con valores que pueden ser vagos, desconocidos, incompletos o nulos. De igual forma, los desarrollos sobre bipolaridad han permitido al usuario plantear consultas más flexibles en términos de su proximidad al lenguaje natural. El propósito del presente documento es implementar el operador difuso y posiblemente, planteado en la teoría de las búsquedas bipolares, en Generalized Model of Fuzzy Relational Databases (Gefred). Para tal fin, en la primera parte se abordan los aspectos teóricos sobre bipolaridad y el modelo Gefred que permiten pensar en una integración de las dos teorías. Posteriormente, a través de una aplicación se plantean los procedimientos necesarios y las ventajas que emergen del uso del operador difuso.

© 2016 IAI. All rights reserved.

1. Introducción En la actualidad, Generalized Model of Fuzzy Relational Databases (Gefred) tiene amplia aplicabilidad debido a las ventajas que presenta, en comparación con las bases de datos tradicionales: especialidad para el tratamiento de datos difusos (vagos, desconocidos, incompletos, nulos) [1] y la capacidad de flexibilización que brinda al usuario para realizar consultas con condiciones y/o atributos de tipo difuso, lo cual permite un acercamiento al trabajo computacional con el lenguaje natural.

Debido a esto, en la última década se ha incrementado el uso de bases de datos relacionales difusas en grandes industrias. También se ha mejorado la eficiencia en la solución de problemas relacionados, por ejemplo, con el comercio electrónico y la medicina, en los que se ha obtenido resultados de búsquedas con costos, en tiempo y dinero, iguales a las bases de datos tradicionales [2].

Con el fin de optimizar los resultados obtenidos, se hace relevante y oportuno incorporar y estudiar en el modelo Gefred, consultas que permitan el tratamiento de preferencias planteadas por el usuario desde un marco

bipolar, es decir, aquellas que establecen condiciones positivas y negativas al mismo tiempo. Este estudio permite ampliar y mejorar el tratamiento computacional del lenguaje natural y, aportar a la discusión y continuación de los trabajos desarrollados hasta la fecha.

Desde la revisión de la literatura se plantea el tratamiento de consultas bipolares sobre atributos difusos en el marco de bases de datos nítidas, o el uso de un orden lexicográfico y la tripleta de Morgan (∧𝑚𝑖𝑛 ,∨𝑚𝑎𝑥 ,¬) sobre bases de datos difusas [3]. En este artículo se trabaja con el operador difuso “y posiblemente”, desde la teoría de las búsquedas bipolares, y se aplica bajo el modelo Gefred, de tal forma que se puedan determinar sus ventajas y beneficios.

El documento se organiza de la siguiente manera: en la sección de revisión se describe de forma general la estructura, los componentes y el funcionamiento de Gefred, junto con la teoría general sobre búsquedas bipolares. En los aspectos metodológicos se presenta el operador “y posiblemente”, con algunas propiedades relevantes, lo cual establece el procedimiento para la construcción de las consultas. Finalmente, se realiza una

Revista Antioqueña de las Ciencias Computacionales y la Ingeniería de Software

ISSN: 2248-7441

www.fundacioniai.org/raccis raccis(AT)fundacioniai.org

(2016). RACCIS 6(1), pp. 51-58

Page 2: Application and advantages of the connector and possibly ...fundacioniai.org/raccis/v6n1/n10a6.pdf · Búsquedas bipolares, bases de datos difusas, operadores difusos, ... desconocidos,

52

aplicación basada en el modelo y búsquedas bipolares, empleando los operadores lógicos básicos y el operador seleccionado. Además, se hace una comparación de los resultados con el conector “y”, estableciendo diferencias, aportes y ventajas.

1. Revisión de la literatura

1.1 Descripción del modelo Gefred El modelo propuesto por Medina y Vila [1] es una integración de los modelos de Prade y Testemale [4], Umano y Fukami [5], Buckles y Petry [6] y Zemankova y Kandel [7]. Gefred permite la representación y tratamiento de datos difusos mediante bases de datos relacionales difusas.

El modelo propuesto en este artículo establece dos aspectos básicos: la estructura de datos y la manipulación de datos. En el primero se definen los conceptos de dominio difuso generalizado (𝐷𝐺) y relación difusa generalizada (R). En la manipulación de datos se definen los comparadores difusos, que permiten el manejo de datos con álgebra relacional. También se usan operaciones clásicas, tales como unión, intersección, diferencia, producto cartesiano, proyección, join y selección.

De igual forma, en [1] se presentan y detallan otros elementos propios del modelo: la clave primaria generalizada y los operadores del algebra relacional difuso generalizado, sin embargo, para los propósitos de este documento solamente se abordan los componentes presentados en la Figura 1.

Figura 1. Componentes principales modelo Gefred

Dominio Difuso Generalizado (𝑫𝑮). Dado un dominio de discurso D, referido a los datos que componen la base de datos, se considera �̃�(𝐷) como el conjunto de todas las distribuciones de posibilidad definidas sobre D, que incluyen los valores: unknown, undefined y null, como se describen en la Tabla 1 [1].

Tabla 1. Valores Modelo Gefred [1, 9]

Valores modelo Gefred 1. Un escalar simple (Ej. Aptitud=buena). 2. Un número simple (Ej. Edad=28).

3. Un conjunto de posibles asignaciones excluyentes de escalares (Ej. Aptitud= {mala, buena}).

4. Un conjunto de posibles asignaciones excluyente de números (Ej. Edad= {20,21}).

5. Una distribución de posibilidad en el dominio de escalares (Ej. Aptitud= {0.6/mala,0.7/regular}).

6. Una distribución de posibilidad en el dominio de los números (Ej. Edad= {0.4/23,1.0/24,0.8/25} números difusos, etiquetas lingüísticas).

7. Un número real ∈ [0,1] representando grados de cumplimiento (Ej. Calidad=0.9).

8. Un valor desconocido Unknown dado por la distribución de posibilidad Unknown = {1/𝑢 ∶ 𝑢 ∈ 𝑈} sobre el dominio considerado.

9. Un valor indefinido Undefined dado por la distribución de posibilidad Undefined = {0/𝑢 ∶ 𝑢 ∈ 𝑈} sobre el dominio considerado.

10. Un valor nulo NULL dado por 𝑁𝑈𝐿𝐿 = {1/𝑈𝑛𝑘𝑛𝑜𝑤𝑛 ,1/𝑈𝑛𝑑𝑒𝑓𝑖𝑛𝑒𝑑}

Estos valores se trabajan de la misma manera que se presentan en el modelo de Umano y Fukami [8]. Por tanto, el dominio difuso generalizado 𝐷𝐺 abarca el conjunto de todas distribuciones de posibilidad con la unión del valor null:

𝐷𝐺 ⊆ �̃�(𝐷) ∪ 𝑁𝑈𝐿𝐿 (1)

De acuerdo con estos datos, es importante tener claridad sobre los tipos de datos difusos que permite representar el modelo Gefred y que se clasifican en tres tipos, de acuerdo con la presencia de referenciales ordenados y/o no-ordenados, según lo expuesto en [10]:

Atributos difusos Tipo 1. Estos atributos se utilizan para representar valores precisos o nítidos. El dominio D asociado puede estar definido por valores numéricos y escalares simples, en ambos casos, el grado de cumplimiento es 1, es decir, con función de pertenencia 𝜇𝐴(𝑢) = 1.

Atributos difusos Tipo 2. Se utilizan para representar valores imprecisos sobre referencial ordenado. El dominio D asociado puede estar definido básicamente por ocho valores: numéricos, escalares simples (en ambos casos con grado de cumplimiento o función de pertenencia 𝜇𝐴(𝑢) = 1), etiquetas lingüísticas, parcialmente desconocidos entre dos valores precisos, parcialmente desconocidos entre un valor preciso (en esos tres casos, con grado de cumplimiento entre 0 y 1, es decir, con 𝜇𝐴(𝑢) ∈ [0,1]), desconocidos, nulos (ambos valores con grado de cumplimiento 1) y valores inaplicables con grado de cumplimiento.

Atributos difusos Tipo 3. Se utilizan para representar valores imprecisos sobre referencial no ordenado. El dominio D asociado puede estar definido básicamente por cinco valores: excluyentes de números o escalares (con grado de cumplimiento 1, es decir, con 𝜇𝐴(𝑢) = 1), relaciones de similitud (con grado de cumplimiento entre 0 y 1, es decir, con 𝜇𝐴(𝑢) ∈ [0,1] ), desconocidos (con grado de cumplimiento 1), inaplicables (con grado de cumplimiento 0) y nulos (con grado de cumplimiento 1).

Relación Difusa Generalizada (R). A partir de la representación dada a las relaciones básicas en el modelo relacional clásico de Codd [11], una relación difusa recibe el mismo tratamiento, pero el grado de cumplimiento se considera como campo adicional. En la Figura 2 se plantean los atributos que hacen parte de una relación difusa generalizada, algunos son de carácter opcional.

Una relación difusa generalizada está conformada por dos conjuntos: cabecera (𝐻) y cuerpo (𝐵). La cabecera se compone de los atributos de la tabla definida por el usuario, los respectivos dominios difusos

Page 3: Application and advantages of the connector and possibly ...fundacioniai.org/raccis/v6n1/n10a6.pdf · Búsquedas bipolares, bases de datos difusas, operadores difusos, ... desconocidos,

53

generalizados para cada uno de los atributos y, opcionalmente, un grado de compatibilidad. Por lo tanto, el cuerpo es el conjunto de datos de todas las tuplas o registros de la tabla [8], que se componen de atributos, valores y, opcionalmente, de un grado de pertenencia. En la Figura 2 se resumen los componentes de una relación difusa generalizada.

Figura 2. Relación Difusa Generalizada

Operadores de Comparación Difusa. Para realizar comparaciones entre los valores que existan en el dominio difuso generalizado, se emplea el concepto de comparadores del algebra relacional: =,≠,>,≥,<,≤. En Gefred se redefinen los operadores de comparación difusa comparador extendido y comparador difuso generalizado, donde el último es extendido a partir del primero. A continuación, se describe brevemente cada comparador.

Comparador Extendido (𝜽𝒆). Dado un dominio de discurso D, se define un operador 𝜃𝑒 sobre 𝐷 que pueda ser expresado de la forma:

𝜃𝑒 = 𝐷 × 𝐷 → [0,1] (2) 𝜃𝑒 = (𝑑𝑖 , 𝑑𝑗) → [0,1] (3)

𝑑𝑖 , 𝑑𝑗 𝜖 𝐷

Definido de esta manera, el comparador extendido (𝜃𝑒) permitirá modelar comparadores clásicos del álgebra relacional y difusos como: “𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒 𝑚𝑒𝑛𝑜𝑟”, “𝑛𝑒𝑐𝑒𝑠𝑎𝑟𝑖𝑎𝑚𝑒𝑛𝑡𝑒 𝑖𝑔𝑢𝑎𝑙” o “𝑎𝑝𝑟𝑜𝑥𝑖𝑚𝑎𝑑𝑎𝑚𝑒𝑛𝑡𝑒 𝑖𝑔𝑢𝑎𝑙”, definidos a partir de funciones de pertenencia, operadores de similitud y comparadores, con base en una propiedad [1].

Comparador difuso generalizado (𝜽𝑮𝜽𝒆).

Considerando el dominio difuso generalizado 𝐷𝐺 , construido sobre el dominio de discurso 𝐷, y un comparador extendido 𝜃𝑒 , se considera la función

𝜃𝐺𝜃𝑒 definida por:

𝜃𝐺𝜃𝑒: 𝐷𝐺 × 𝐷𝐺 → [0,1] (4)

𝜃𝐺𝜃𝑒(�̃�1, �̃�2) ∈ [0,1] (5)

Que será un comparador difuso generalizado sobre 𝐷𝐺 inducido por el comparador extendido 𝜃𝑒 , si cumple:

𝜃𝐺𝜃𝑒(�̃�1, �̃�2) = 𝜃𝑒(𝑑1, 𝑑2) ∀𝑑1, 𝑑2 ∈ 𝐷 (6)

Donde �̃�1, �̃�2 representan las distribuciones de posibilidad 1/𝑑1, 1/𝑑2, inducidas respectivamente por los valores 𝑑1, 𝑑2 [1].

Dado lo anterior, se definen entre otras, la unión difusa generalizada, la intersección difusa generalizada, la diferencia difusa generalizada y el producto cartesiano difuso generalizado. Con estos elementos básicos es posible representar y tratar flexiblemente la información difusa. En esencia, el modelo Gefred plantea búsquedas difusas sobre bases de datos difusas.

1.2 Búsquedas bipolares Con el fin de permitir una mejor flexibilidad en las consultas realizadas por el usuario, se proponen consultas que se puedan expresar de manera muy cercana al lenguaje natural. Se establece una búsqueda bipolar, compuesta por dos condiciones independientes, donde una de ellas representa una condición obligatoria y la otra una condición satisfactoria definida como "deseo" [12]. También se define como un conjunto de preferencias que refieren a condiciones contradictorias y combinadas, de tal manera que, al satisfacer la primera condición, rechaza a la segunda y viceversa [13].

Según Dubois y Prade [14] y Zadrozny [15], estas condiciones se agrupan en dos conjuntos: el primero se denomina “conjunto requerido”, se denota como 𝐶 y se centra en estudiar las condiciones de interés del usuario. Además, tiene un grado importancia superior o total de para el desarrollo satisfactorio de la consulta frente al conjunto preferido. El “conjunto preferido”, denotado como 𝑊, estudia las condiciones difusas que pasan a ser de importancia secundaria, comúnmente nombradas después de operadores difusos como “𝑦”, “𝑠𝑖 𝑒𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒”, “𝑝𝑟𝑒𝑓𝑒𝑟𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒”, “𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒”, “𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒”, “𝑜 𝑠𝑖𝑛𝑜”, entre otros, que expresan una condición deseada.

La división de la consulta tiene como fin priorizar las condiciones enunciadas por el usuario, considerando el “conjunto requerido” como principal y obligatorio; agrupando así todas las tuplas que cumplen esta parte de la consulta con sus respectivos grados de cumplimiento [16, 17]. Por lo tanto, se excluyen todas las opciones que no satisfacen dicho conjunto. El “conjunto preferido” se evalúa dentro de las opciones seleccionadas por el conjunto requerido, teniendo en cuenta el grado de cumplimiento total o parcial de la tupla.

En el caso que existan dos o más opciones que se acerquen a la consulta ingresada, se ordenará de manera lexicográfica con el fin de obtener el mejor resultado. La ecuación (7) describe cómo ordenar las tuplas resultantes en una consulta, según el grado de cumplimiento de cada parte de la consulta [15]:

𝜇𝑐(𝑡1) > 𝜇𝑐(𝑡2) 𝑜𝑟 ((𝜇𝑐(𝑡1) = 𝜇𝑐(𝑡2)) ⋀ (𝜇𝑤(𝑡1) > 𝜇𝑤(𝑡2)) (7)

Donde µ𝑐(𝑡1) denota el grado de cumplimiento de la tupla 1 (𝑡1) en el conjunto requerido C de la consulta y µ𝑤(𝑡1) el grado de cumplimiento de la tupla 1 en el conjunto preferido W. Caso análogo para la tupla 2 (𝑡2). Siguiendo el ordenamiento, después de aplicar la ecuación (7) se tiene:

(𝜇𝑐(𝑡1), 𝜇𝑤(𝑡1)) ≻ (𝜇𝑐(𝑡2), 𝜇𝑤(𝑡2)) (8)

(𝜇𝑐(𝑡1), 𝜇𝑤(𝑡1)) ≽ (𝜇𝑐(𝑡2), 𝜇𝑤(𝑡2)) (9)

(𝜇𝑐(𝑡1), (𝑡1)) ≻ (𝜇𝑐(𝑡2), 𝜇𝑤(𝑡2))𝑜𝑟(𝜇𝑐(𝑡1), 𝜇𝑤(𝑡1)) =

(𝜇𝑐(𝑡2), 𝜇𝑤(𝑡2)) (10)

Page 4: Application and advantages of the connector and possibly ...fundacioniai.org/raccis/v6n1/n10a6.pdf · Búsquedas bipolares, bases de datos difusas, operadores difusos, ... desconocidos,

54

En la ecuación (8), ≻ expresa el acercamiento existente

entre (𝜇𝑐(𝑡1), 𝜇𝑤(𝑡1)) y (𝜇𝑐(𝑡2), 𝜇𝑤(𝑡2)); en (9), ≽ evalúa el

acercamiento o igualdad de (𝜇𝑐(𝑡1), 𝜇𝑤(𝑡1)) con respecto a

(𝜇𝑐(𝑡2), 𝜇𝑤(𝑡2)). Aplicando (8) y (9) se obtiene en (10) la

consulta de mayor satisfacción.

Para ver el ordenamiento de las tuplas resultantes sobre una consulta bipolar, los autores del presente trabajo exponen el siguiente seudocódigo que permite ampliar la comprensión:

Inicio_Consulta 1. Recibir consulta del usuario 2. Consulta del usuario = (condicion1) y (condicion2), donde

condicion1 ∈ conjunto requerido y condicion2 ∈ conjunto preferido.

3. Inicializar variable C = 1, que se encargara de almacenar en el vector las respuestas de conjunto requerido con grado de cumplimiento ≠ 0 , en caso de que exista más de una que satisfaga la consulta.

4. Para 𝑐𝑜𝑛𝑡𝑎𝑑𝑜𝑟 = 1; hasta 𝑐𝑜𝑛𝑡𝑎𝑑𝑜𝑟 =𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑡𝑢𝑝𝑙𝑎𝑠 𝑝𝑜𝑟 𝑎𝑛𝑎𝑙𝑖𝑧𝑎𝑟; hacer: 4.1. Tomar tupla y realizar consulta correspondiente 4.2. Si 𝑡𝑢𝑝𝑙𝑎 es ≠ 0 entonces:

4.2.1. 𝑅𝑒𝑠𝑝𝑢𝑒𝑠𝑡𝑎_𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜_𝑟𝑒𝑞𝑢𝑒𝑟𝑖𝑑𝑜[𝐶] = grado de cumplimiento tupla

4.2.2. C=C+1; 4.3. Si no, entonces:

4.3.1. Descartar tupla consultada 4.4. Volver al 4 hasta que contador sea igual que el número

de tuplas a consultar. 5. Si C=1 entonces:

5.1. Mostrar respuesta a la consulta realizada 6. Sino, entonces: 7. Inicializar variable W = 1 que se encargara de almacenar en

el vector las respuestas de conjunto preferido. 7.1. Para contador=1; hasta contador = C (tuplas que

satisfacen conjunto requerido); hacer: 7.2. Tomar tupla y evaluar grado de cumplimiento: 7.3. 𝑅𝑒𝑠𝑝𝑢𝑒𝑠𝑡𝑎_𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜_𝑝𝑟𝑒𝑓𝑒𝑟𝑖𝑑𝑜[𝑊] = grado

cumplimiento tupla 7.4. Volver al 7.1. hasta que contador sea igual a C.

8. Organizar lexicográficamente por grados de cumplimiento de 𝑅𝑒𝑠𝑝𝑢𝑒𝑠𝑡𝑎_𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜_𝑟𝑒𝑞𝑢𝑒𝑟𝑖𝑑𝑜[𝐶] conservando la relación con 𝑅𝑒𝑠𝑝𝑢𝑒𝑠𝑡𝑎_𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜_𝑝𝑟𝑒𝑓𝑒𝑟𝑖𝑑𝑜[𝑊] , en orden descendente

9. Mostrar respuesta con mayor grado de cumplimiento (C,W) Fin Consulta

En general, la consulta bipolar se estructura de la siguiente manera:

Consulta definida por el usuario = Conjunto requerido + operador difuso + Conjunto preferido

2. Aspectos metodológicos

Tabla 2. Tripleta de Morgan[19]

t-norms

𝑥 ∧𝑚𝑖𝑛 𝑦 = min (𝑥, 𝑦) Mínimo

t-conorms

𝑥 ∨𝑚𝑎𝑥 𝑦 = max (𝑥, 𝑦) Máximo

Operador de negación

¬(𝑥 ∨ 𝑦) = ¬ 𝑥 ∧ ¬ 𝑦 Negación

Con el fin de perfeccionar las consultas bipolares, se sugiere el trabajo desarrollado por Ronald Yager [18], en

el que propone un enfoque del operador “𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒”, que surge en estrecha relación con el operador y o ∧min, que se define dentro de la tripleta de Morgan [19], como se muestra en la Tabla 2.

Una consulta de la forma 𝐶 𝑦 𝑊 es menos flexible que una del tipo 𝐶 𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒 𝑊. Es decir, con el operador “𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒” no se descarta la tupla que cumple parcialmente la parte deseada 𝑊. Por ejemplo, sea t una tupla con (µ1, µ2) que denota los grados de cumplimiento para el conjunto requerido 𝐶 y preferido W respectivamente, entonces se presentan los siguientes casos de interés:

1. Si la tupla arroja (1,1), el resultado será un 1 como cumplimiento total de la consulta.

2. Si la tupla arroja (0,1) o (0,0), el resultado será un 0 como total incumplimiento de la consulta. Nótese que esto ya se ha afirmado con anterioridad, debido a que cuando el conjunto requerido no satisface la consulta, es decir, su grado de cumplimiento es igual a 0, la tupla debe ser descartada sin tomar en cuenta el grado de cumplimiento para el conjunto preferido.

Sin embargo, la diferencia sustancial entre el operador “𝑦” y "𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒" se observa en los siguientes casos:

3. Si la tupla arroja (1,0), la búsqueda no se reduce solamente a 𝐶, como en el caso del operador “𝑦”; por el contrario, se selecciona un p como peso de valor para 𝑊 y se incluye en la consulta con el grado de importancia que el usuario determine.

4. Si la tupla arroja (µ1, µ2), donde µ1, µ2 ≠ 0, el usuario determina un p dependiendo de la importancia que desee asignar a la parte preferida.

Por lo tanto, al emplear los operadores “𝑦” e “𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒”, se evidencia que la parte 𝐶 tiene la misma importancia como cabeza de consulta, sin embargo, con el operador "𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒" se flexibiliza permitiendo incluir o asignar mayor relevancia al conjunto preferido 𝑊 mediante un peso de importancia p, que el usuario determina según sus necesidades.

La ecuación (11) define el uso del operador “𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒” presentado en [20], definiendo previamente el peso p para 𝑊, donde 𝑝 ∈ [0,1].

𝐶 𝑦 posiblemente W = min(µ1, 𝑝µ1 + (1 − 𝑝)µ2) (11)

Donde µ1 denota el cumplimiento de C y µ2 el de W.

Según Zadrozny y Kacprzyk [19], para representar adecuadamente el operador “𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒” es necesario analizar las propiedades y grados de bipolaridad, que para este operador se define de tres formas diferentes. En esta investigación solamente se tiene en cuenta la primera:

1. Realizando una fusión directa entre el conector "𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒", propuesto en [15] y [21], acerca de las consultas por preferencias:

𝐶(𝑡) 𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒 𝑊(𝑡) = 𝐶(𝑡) ⋀ (∃𝑠 (𝐶(𝑠)⋀𝑊(𝑠))

⟹ 𝑊(𝑡)) (12)

Page 5: Application and advantages of the connector and possibly ...fundacioniai.org/raccis/v6n1/n10a6.pdf · Búsquedas bipolares, bases de datos difusas, operadores difusos, ... desconocidos,

55

Donde 𝐶(𝑡) y 𝑊(𝑡) denotan los predicados 𝐶 y 𝑊 con su grado de cumplimiento.

2. Fusión directa entre el operador "𝑤𝑖𝑛𝑛𝑜𝑤", propuesto en [19], y el operador "𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒" para obtener una relación especifica de preferencia en la búsqueda bipolar:

𝐶(𝑡) 𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒 𝑊(𝑡) ≡ 𝐶(𝑡) ∧

∽ ∃𝑠 ((𝐶(𝑠) ∧ 𝑊(𝑠) ∧∼ 𝑊(𝑡))) (13)

3. Por último, se propone realizar el uso del operador "𝑤𝑖𝑛𝑛𝑜𝑤" en su versión difusa con la aplicación del anterior ítem.

𝐶(𝑡) 𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒 𝑊(𝑡) ≡

𝐶(𝑡) ∧ ∀𝑠 (𝐶(𝑠) ⟹ (∽ 𝑊(𝑠)⋁𝑊(𝑡))) (14)

Aunque se expresan diferente, las ecuaciones (12), (13) y (14) son equivalentes y poseen seis propiedades principales [19]. Para los fines del presente documento se exponen cuatro de ellas:

1. El producto de una suma equivale a la suma de los productos de cada sumando, teniendo en cuenta que los operadores lógicos ∧ y ∨ actúan como suma y multiplicación según el caso.

𝑥 ∧ (𝑦 ∨ 𝑧) = (𝑥 ∧ 𝑦) ∨ (𝑥 ∧ 𝑧) (15)

2. Si existe una tupla t, tal que C (t) = W(t) = 1, entonces la consulta "𝐶 𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒 𝑊" se reduce a la conjunción de 𝐶 𝑦 𝑊.

(𝐶(𝑡) = 𝑊(𝑡) = 1) → ∧𝑊 (16)

3. Si para una tupla el valor de 𝑊(𝑡) es igual a 1, entonces una consulta "𝐶 𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒 𝑊" se convierte en 𝐶.

𝑊(𝑡) = 1 → 𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒 𝑊 ↔ 𝐶. (17)

4. Una tupla t no satisface plenamente la condición si 𝑊(𝑡) es igual a 1 y 𝐶(𝑡) no lo es.

(𝑊(𝑡) = 1 ∧ 𝐶(𝑡) = 0) = 0 (18)

Caracterizado el operador “𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒”, a continuación, se busca emplearlo en consultas de tipo bipolar en una base de datos bajo el modelo Gefred. Se implementará igualmente el operador “𝑦”, definido en la Tabla 2, con fines comparativos para destacar la mejora sustancial en cuanto a tratamiento del lenguaje natural.

3. Aplicación

Tabla 3. Pacientes de la base de datos difusa

Nombre Edad A1C Peso (kg)

Estatura (cm)

Cigarrillos por

semana

Horas de actividad

física

Sofía (0.6,14),

(1,15) 195 69 151 0 10

Michael 32 140 65 169 30 {16,18}

Alex Maduro 250 115 180 #20 17

Isabela 28 155 58 163 Moderado 13

Samuel Joven Diabético

Controlado 60 168 Ocasional 14

Stella (0.8,43),

(1,44) 95 70 176 #6 20

Alice Mayor 260 80 158 25 8

Eliot 38 170 90 182 Moderado {20,24} Antonio 28 148 78 180 #19 {2,3}

La siguiente aplicación considera una base de datos empleada en un estudio sobre de personas diabéticas. Se

establecen los tipos de datos presentados en la Tabla 1, siendo de principal interés aquellos de naturaleza difusa bajo la forma de representación del modelo Gefred. En la Tabla 3 se presenta la base de datos empleada, en la que se distinguen como atributos: nombre, edad, A1C (una prueba que refleja el promedio de azúcar en la sangre), peso, estatura, cantidad de cigarrillos fumados por semana y horas de actividad física semanal.

Con los datos de las columnas peso y estatura, se genera la Tabla 4, con valores calculados para el IMC (Índice de masa corporal). A partir de ellos se establecen las etiquetas lingüísticas que se presentan en la Figura 3.

Tabla 4. Tabla temporal IMC

Nombre IMC

Sofía 30.26

Michael 22.76

Alex 35.49

Isabela 21.83

Samuel 21.26

Stella 22.6

Alice 32.05

Eliot 27.17

Antonio 24.07

Figura 3. Etiquetas Lingüísticas definidas sobre dominio IMC.

El atributo edad admite valores nítidos, escalares simples y distribución de posibilidad, por lo tanto, se definen las etiquetas lingüísticas de la Figura 4 con sus respectivas funciones de pertenencia.

Figura 4. Etiquetas Lingüísticas definidas sobre dominio edad

µ𝐽𝑜𝑣𝑒𝑛 {

𝑥

5 𝑠𝑖 𝑥 ≤ 5

1 𝑠𝑖 5 ≤ 𝑥 ≤ 15−𝑥+30

15 𝑠𝑖 15 ≤ 𝑥 ≤ 30

} (19)

µ𝑀𝑎𝑑𝑢𝑟𝑜

{

𝑥 − 22

10 𝑠𝑖 22 ≤ 𝑥 ≤ 32

1 𝑠𝑖 32 ≤ 𝑥 ≤ 40−𝑥 + 50

10 𝑠𝑖 40 ≤ 𝑥 ≤ 50

}

(20)

µ𝑀𝑎𝑦𝑜𝑟 {𝑥 − 40

13 𝑠𝑖 40 ≤ 𝑥 ≤ 53

1 𝑠𝑖 𝑥 ≥ 53

} (21)

Page 6: Application and advantages of the connector and possibly ...fundacioniai.org/raccis/v6n1/n10a6.pdf · Búsquedas bipolares, bases de datos difusas, operadores difusos, ... desconocidos,

56

µ𝑁𝑜𝐷𝑖𝑎𝑏𝑒𝑡𝑖𝑐𝑜 { 1 𝑠𝑖 𝑥 ≤ 90

−𝑥 + 130

40 𝑠𝑖 90 ≤ 𝑥 ≤ 130

} (22)

µ𝐶𝑜𝑛𝑡𝑟𝑜𝑙𝑎𝑑𝑜

{

𝑥 − 110

25 𝑠𝑖 110 ≤ 𝑥 ≤ 135

1 𝑠𝑖 135 ≤ 𝑥 ≤ 150−𝑥 + 170

20 𝑠𝑖 150 ≤ 𝑥 ≤ 170

}

(23)

µ𝐼𝑛𝑡𝑒𝑟𝑚𝑒𝑑𝑖𝑜

{

𝑥 − 155

30 𝑠𝑖 155 ≤ 𝑥 ≤ 185

1 𝑠𝑖 185 ≤ 𝑥 ≤ 195−𝑥 + 215

20 𝑠𝑖 195 ≤ 𝑥 ≤ 215}

(24)

µ𝑀𝑎𝑦𝑜𝑟 { 𝑥 − 200

30 𝑠𝑖 200 ≤ 𝑥 ≤ 230

1 𝑠𝑖 𝑥 ≥ 230} (25)

A1C permite valores exactos y escalares simples, para los cuales se proponen las etiquetas lingüísticas de la Figura 5, planteando la función de similitud en la Tabla 5 para las etiquetas respectivas.

Figura 5. Etiquetas lingüísticas definidas sobre dominio A1C

Tabla 5. Relación de similitud sobre dominio A1C

Sr No

diabético Diabético

controlado Diabético

intermedio Diabético riesgoso

No diabético

1 0.7 0.3 0

Diabético controlado

1 0.7 0.3

Diabético intermedio

1 0.7

Diabético riesgoso

1

Para los atributos horas de actividad física semanal y número de cigarrillos por semana, se proponen las etiquetas lingüísticas presentadas en las Figuras 6 y 7 respectivamente. Para este último atributo se define, a través de la Figura 8, la etiqueta “aproximadamente”, que se representa en la Tabla 3 por el símbolo #; por lo tanto, se realiza la relación de similitud correspondiente.

Figura 6. Etiquetas lingüísticas definidas sobre dominio

actividad física

Figura 7. Etiquetas lingüísticas definidas para nivel de fumador

Figura 8. Etiquetas “Aproximadamente” sobre el dominio

cigarrillos fumados

Analizados los tipos de datos presentes en la base de datos bajo el modelo Gefred, se plantean tres consultas diferentes: 1) con el conector lógico básico “𝑦”, 2) se incluye un elemento con preferencia determinado por la expresión “𝑎𝑙𝑟𝑒𝑑𝑒𝑑𝑜𝑟 𝑑𝑒”, y 3) se introduce el operador “𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒”.

Consulta 1 (𝑸𝟏): Pacientes de edad madura (en grado>0.5) 𝑦 con nivel A1C diabético intermedio. Para esta consulta el paciente que satisface totalmente la consulta planteada es Eliot, con un grado de cumplimiento de 0.83.

𝐸𝑙𝑖𝑜𝑡 = ((1,𝑀𝑎𝑑𝑢𝑟𝑜), (0.83, 𝐷𝑖𝑎𝑏𝑒𝑡𝑖𝑐𝑜 𝑖𝑛𝑡𝑒𝑟𝑚𝑒𝑑𝑖𝑜))

Consulta 2 (𝑸𝟐): Pacientes fumadores excesivos, 𝑝𝑟𝑒𝑓𝑒𝑟𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒 con consumo 𝑎𝑙𝑟𝑒𝑑𝑒𝑑𝑜𝑟 𝑑𝑒 18 cigarrillos semanales. Para el rango deseado, la etiqueta “𝑎𝑙𝑟𝑒𝑑𝑒𝑑𝑜𝑟 𝑑𝑒” se define como (15, 18, 21).

Donde:

𝑅𝑎𝑛𝑔𝑜 𝑝𝑟𝑒𝑓𝑒𝑟𝑖𝑑𝑜 (𝑅𝑝) = (15, 18, 21 ) 𝑅𝑎𝑛𝑔𝑜 𝑅𝑒𝑞𝑢𝑒𝑟𝑖𝑑𝑜 − 𝑓𝑢𝑚𝑎𝑑𝑜𝑟 𝑒𝑥𝑐𝑒𝑠𝑖𝑣𝑜 (𝑅𝑟) = (12, 14,∞) 𝐴𝑙𝑒𝑥 (𝐴) = (15, 20, 25) 𝐴𝑛𝑡𝑜𝑛𝑖𝑜 (𝐴𝑛) = (14, 19, 24)

A continuación, se desarrolla la consulta en los pacientes:

𝐴. 𝑟𝑒𝑞𝑢𝑒𝑟𝑖𝑑𝑜 = 𝑚𝑎𝑥𝑥∈𝑅(min(𝐴. 𝐹𝑢𝑚𝑎𝑑𝑜𝑟𝐸𝑥𝑐𝑒𝑠𝑖𝑣𝑜(𝑥), 𝑅𝑟(𝑥))) = 1

𝐴𝑛. 𝑟𝑒𝑞𝑢𝑒𝑟𝑖𝑑𝑜 = 𝑚𝑎𝑥𝑥∈𝑅(min(𝐴𝑛. 𝐹𝑢𝑚𝑎𝑑𝑜𝑟𝐸𝑥𝑐𝑒𝑠𝑖𝑣𝑜(𝑥), 𝑅𝑟(𝑥))) = 1

𝐴. 𝑝𝑟𝑒𝑓𝑒𝑟𝑖𝑑𝑜 = 𝑚𝑎𝑥𝑥∈𝑅(min(𝐴. 𝐹𝑢𝑚𝑎𝑑𝑜𝑟𝐸𝑥𝑐𝑒𝑠𝑖𝑣𝑜(𝑥), 𝑅𝑝(𝑥))) = 0.7

𝐴𝑛. 𝑝𝑟𝑒𝑓𝑒𝑟𝑖𝑑𝑜 = 𝑚𝑎𝑥𝑥∈𝑅(min(𝐴𝑛. 𝐹𝑢𝑚𝑎𝑑𝑜𝑟𝐸𝑥𝑐𝑒𝑠𝑖𝑣𝑜(𝑥),𝑅𝑝(𝑥))) = 0.9

El paciente fumador excesivo que más se acerca al consumo de alrededor 18 cigarros semanales es Antonio (𝐴𝑛). (Ver Figura 9).

Con el fin de comparar los operadores “𝑦” e “𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒”, se realizan las consultas 𝑄3 y 𝑄4 con los siguientes predicados: 1) requerido 𝐶: Pacientes con sobrepeso ó fumador moderado y, 2) preferido 𝑊: Activos físicamente.

Page 7: Application and advantages of the connector and possibly ...fundacioniai.org/raccis/v6n1/n10a6.pdf · Búsquedas bipolares, bases de datos difusas, operadores difusos, ... desconocidos,

57

Figura 9. Conjunto requerido y preferido con opcionados de Q2

Consulta 3 (𝑸𝟑): Pacientes con sobrepeso ó fumador moderado 𝒚 activos físicamente. En la Tabla 6 se pueden ver los resultados para la consulta 𝑄3.

Tabla 6. Resultados Q3 con operador “y”

Nombre IMC #CF HAF µ(S) µ(FM) µ(AF) µ(Q3)

Sofía 30.26 0 10 0.71 0 0 0

Michael 22.76 30 {16, 18}

0 0 (0.66,16)

, (1,18) 0

Alex 35.49 #20 17 1 0 0.83 0.83

Isabela 21.83 Mode. 13 0 1 0.16 0.16

Samuel 21.26 Ocasi. 14 0 0.5 0.33 0.33

Stella 22.6 #6 20 0 1 1 1

Alice 32.05 25 8 1 0 0 0

Eliot 27.17 Mode. {20, 24}

0.195 1 1 1

Antonio 24.07 #19 {2,3} 0 (0.5,14) 0 0

Donde:

#CF = Numero de cigarrillos fumados HAF = Horas de actividad física semanal µ(𝑆)= grado cumplimiento pacientes con sobrepeso µ(𝐹𝑀)= grado cumplimiento fumadores moderados µ(𝐴𝐹)= grado cumplimiento personas activas físicamente µ(𝑄3)= grado cumplimiento Q3

Consulta 4 (𝑸𝟒): Pacientes con sobrepeso o fumador moderado 𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒 activos físicamente. Para esta consulta se establece un 𝑝 = 0.5, que al aplicarlo a la definición formal de “𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒”, ecuación (11), se reduce a:

C y posiblemente W = min (µ1,µ1 + µ22

) (25)

En la Tabla 7 se muestran los pacientes que satisfacen la consulta Q4 según los predicados 𝐶 y 𝑊, donde µ hace referencia al grado de cumplimiento respectivo de cada columna.

Tabla 7. Resultados Q4 con operador “y posiblemente”

Nombre µ C µ W µ (Q4)

Sofía 0.71 0 0.355 Michael 0 (0.66,16), (1,18) 0

Alex 1 0.83 0.915 Isabela 1 0.16 0.58 Samuel 0.5 0.33 0.415 Stella 1 1 1 Alice 1 0 0.5 Eliot 1 1 1

Antonio (0.5,14) 0 0.25

En la Tabla 8 se muestran los resultados de la comparación de los dos operadores “𝑦” e “𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒”.

Tabla 8. Comparación de resultados Q3 y Q4 con operador “y” e “y posiblemente” respectivamente

Nombre Q3 = C "y" W Q4 = C "y posiblemente" W

Sofía 0 0.355

Michael 0 0

Alex 0.83 0.915 Isabela 0.16 0.58 Samuel 0.33 0.415

Stella 1 1

Alice 0 0.5

Eliot 1 1

Antonio 0 0.25

Los resultados de las búsquedas son:

𝑸𝟑 = ((1, 𝐸𝑙𝑙𝑖𝑜𝑡), (1, 𝑆𝑡𝑒𝑙𝑙𝑎), (0.83, 𝐴𝑙𝑒𝑥), (0.33, 𝑆𝑎𝑚𝑢𝑒𝑙),

(0.16, 𝐼𝑠𝑎𝑏𝑒𝑙𝑎))

𝑸𝟒 = ((1, 𝐸𝑙𝑖𝑜𝑡), (1, 𝑆𝑡𝑒𝑙𝑙𝑎), (0.915, 𝐴𝑙𝑒𝑥), (0.58, 𝐼𝑠𝑎𝑏𝑒𝑙𝑎),

(0.5, 𝐴𝑙𝑖𝑐𝑒), (0.415, 𝑆𝑎𝑚𝑢𝑒𝑙), (0.355, 𝑆𝑜𝑓𝑖𝑎), (0.25, 𝐴𝑛𝑡𝑜𝑛𝑖𝑜))

4. Análisis de resultados

1. El paciente Alex pertenece a la consulta 𝑄3 en grado 0.83 y para la consulta 𝑄4 presenta grado de 0.915, por lo tanto, se evidencia un refinamiento en la consulta gracias al peso de importancia asignado a 𝑊 por el operador “𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒”.

2. En 𝑄3 Samuel ocupa el cuarto lugar en los resultados ordenados por grado de cumplimiento, mientras que en 𝑄4 Isabela y Alice obtienen un mayor grado. Con lo cual, el cambio de operador, que es en esencia un cambio semántico más cercano a las exigencias y necesidades del usuario, muestra una modificación significativa en los resultados de la búsqueda.

3. En 𝑄3 se descartan a Alicia, Sofía y Antonio para la consulta, mientras que en 𝑄4 son consideradas, lo cual evidencia la amplitud y las mejoras en el uso del operador "𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒" sobre el operador “𝑦”, en situaciones que así lo requieran. Una búsqueda con “𝑦” donde se requiera un "𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒" se hace tanto inapropiada como limitante.

4. Por último, tanto para 𝑄3 y 𝑄4 queda totalmente descartado Michael, ya el grado de cumplimiento de la parte requerida es nula, una condición obligatoria de una búsqueda bipolar para ambos operadores.

5. Conclusiones y trabajos futuros En este trabajo se presenta una descripción del modelo Gefred, brindando una explicación explicita de sus componentes básicos: 1) estructura de datos, que abarca el dominio difuso generalizado (𝐷𝐺) y relación difusa generalizada (R), y 2) manipulación de datos que refiere al manejo de comparadores difusos. De igual manera, se realiza la descripción de búsquedas bipolares como acercamiento al estudio de consultas semejantes al lenguaje natural. Se estudiaron las propiedades y el funcionamiento de los conectores "𝑦" e "𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒", que se comparan a través de su aplicación en consultas de tipo bipolar, en una base de datos bajo el modelo Gefred.

Con la integración del modelo Gefred y la teoría de las búsquedas bipolares, se amplían y enriquecen las posibilidades para el usuario en términos de poder

Page 8: Application and advantages of the connector and possibly ...fundacioniai.org/raccis/v6n1/n10a6.pdf · Búsquedas bipolares, bases de datos difusas, operadores difusos, ... desconocidos,

58

expresar consultas basadas en sus preferencias, con la separación de los aspectos requeridos y preferidos que, por lo general, plantean situaciones opuestas. Lo anterior implica una ganancia potencial en el trabajo computacional del lenguaje natural.

La teoría de las búsquedas bipolares permite plantear operadores difusos en su estructura, tales como: “𝑦”, “𝑜”, “𝑠𝑖 𝑒𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒”, “𝑝𝑟𝑒𝑓𝑒𝑟𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒”, “𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒”, “𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒”, “𝑜 𝑠𝑖𝑛𝑜”, entre otros, que según su definición buscan aproximarse a casos específicos de las expresiones lingüísticas del usuario. En este caso particular, una comparación entre el operador “𝑦” y el operador “𝑦 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒” empleado para búsquedas en bases de datos bajo el modelo Gefred, permitió establecer dos ventajas: 1) Se amplia y mejora el tratamiento de datos difusos, en tanto se construyen predicados con información difusa y operadores que permiten un amplio tratamiento semántico con un espectro y volumen de datos aún mayor.

No siempre es deseable y oportuno tratar información de carácter incierto con operadores de índole nítida. 2) La posibilidad de establecer pesos de importancia a los predicados de las búsquedas permite la manipulación total por parte del usuario, adaptándola a sus necesidades. Se distinguen dos casos bajo los cuales aporta significativamente la propuesta desarrollada: los usuarios pueden estar más orientados a la satisfacción de las condiciones deseadas y, por lo tanto, estar dispuestos a aceptar en diversos grados las condiciones requeridas, que es el caso de mayor flexibilidad [13]. En el caso en que los usuarios se inclinen a satisfacer las condiciones requeridas, el operador difuso utilizado permite descartar totalmente las búsquedas cuyo grado sea nulo para dicho predicado.

Se evidencia el amplio campo en el que se pueden emplear las bases de datos difusas y la posibilidad que brindan al usuario en la elección del operador más apropiado, según los intereses y necesidades. En trabajos futuros se pretende estudiar el predicado “ó” y “or else”, definidos en [3] y [20], aplicados al modelo Gefred.

Referencias

[1] Medina, J., Vila, M. & Pons, O. (1994). GEFRED - A Generalized Model of Fuzzy Relational Data. Information Sciences, Informatics and Computer Science 76(1-2), pp. 87-109.

[2] Sajedul, A. et al. (2008). Performance comparison of fuzzy queries on fuzzy database and classical database. Proceedings 5th International Conference on Electrical and Computer Engineering (pp. 654-658). Dhaka, Bangladesh.

[3] Delgado, M. et al. (2015). Bipolar queries on fuzzy univalued and multivalued attributes in object databases. Fuzzy Sets and Systems 292(1), pp. 175-192.

[4] Prade, H. & Testemale, C. (1987). Fuzzy relational databases: Representational issues and reduction using similarity

measures. Journal of the American Society of Informational Sciences 38(2), pp. 118-126.

[5] Fukami, S. & Umano, M. (1994). Fuzzy relational algebra for possibility-distribution-fuzzy-relation model of fuzzy data. Journal of Intelligent Information Systems 3(1), pp. 7-27.

[6] Buckles, B. & Petry, F. (1985). Uncertainty models in information and database systems. Journal of Information Science 11(2), pp. 77-87.

[7] Zemankova, M. & Kandel, A. (1985). Implementing imprecision in information systems. Information Sciences 37(1-3), pp. 107-141.

[8] Galindo, J., Urrutia, A. & Piattini, M. (2005). Fuzzy Databases: Modeling, Design and Implementation. USA: Idea Group.

[9] Martínez, C. (2008). Sistema de Gestión de Bases de Datos Relacionales Difusas Multipropósito. Una Ontología para la Representación del Conocimiento Difuso. Tesis Doctoral, Universidad de Granada.

[10] Jiménez, L. et al. (2005). Implementación de una Base de Datos Relacional Difusa. Un Caso en la Industria del Cartón. Revista Colombiana de Computación 6(2), pp. 48-58.

[11] Nevado, M. (2010). Introducción a Las Bases de Datos Relacionales. Madrid: Visión Libros.

[12] Tamani, N., Lietard, L. & Rocacher, D. (2011). Bipolarity in Flexible Querying of Information Systems Dedicated to Multimodal Transport Networks. Proceedings 10th International Symposium on Programming and Systems (pp. 108-115). Algiers, Algeria.

[13] Zadrozny, S., Tré, D. & Kacprzyk, J. (2010). Remarks on various aspects of bipolarity in database querying. Workshops on Database and Expert Systems Applications.

[14] Dubois, D. & Prade, H. (1996). Using fuzzy sets in flexible querying: why and how? Workshop on Flexible Query-Answering Systems. Roskilde, Denmark.

[15] Zadrozny, S. & Kacprzyk, J. (2006). Bipolar Queries and Queries with Preferences. 17th International Workshop on Database and Expert Systems Applications. Krakow, Poland.

[16] Liétard, L., Rocacher, D. & Tamani, N. (2015). A Relational Algebra for Generalized Fuzzy conditions. Studies in Computational Intelligence 497, pp. 45-69.

[17] Matthé, T. et al. (2015). Constraint-Wish and Satisfied-Dissatisfied: An Overview of Two Approaches for Dealing with Bipolar Querying. Studies in Computational Intelligence 497, pp. 21-44.

[18] Yager, R. (1992). Fuzzy sets and approximate reasoning in decision and control. Proceedings International Conference on Fuzzy Systems (pp. 415-428). San Diego, USA.

[19] Zadrozny, S. & Kacprzyk, J. (2012). Bipolar queries: An aggregation operator focused perspective. Fuzzy Sets and Systems 196, pp. 69-81.

[20] Bosc, P. & Pivert, O. (2012). On four noncommutative fuzzy connectives and their axiomatization. Fuzzy Sets and Systems 202, pp. 42-60.

[21] Lacroix, M. & Lavency, P. (1987). Preferences - Putting more knowledge into queries. Proceedings 13th International Conference on Very Large Databases (pp. 217-225). Brighton, England.

[22] Zadeh, L. (1978). Fuzzy sets as a basis for a theory of possibility. Fuzzy Sets and Systems 100, pp. 3-28.